본문 바로가기
728x90

데이터2기2

[TIL]본캠프 4일차 LAG함수, LEAD함수 두 함수 모두 2개의 행간의 차이를 구할 때 사용됨 LAG 함수: 현재 행 이전의 행을 가져올 때 사용 LEAD 함수: 현재 행 이후의 행을 가져올 때 사용 #사용 예시 SELECT LAG(Column1) OVER(PARTITION BY Column1 ORDER BY Column1) FROM table1 이상값(Outlier) 의도치 않게 잘못 입력된 값 or 분석 목적에 부합되지 않아 제거해야 하는 경우 or 의도하지 않았지만 분석에 포함해야하는 경우 이상값을 꼭 제거해야하는 것은 아니기에 분석의 목적이나 종류에 따라 적절한 판단 필요 이상값 사용 분야: 사기 탐지, 의료, 네트워크 침입탑지 등 부정 사용 방지 이상값 판단 방법 ESD(Extreme Studentized Dev.. 2024. 4. 18.
[TIL]본캠프 3일차 MySQL 문자열 길이 출력 함수 length(): byte길이를 가져오는 함수 char_length(): byte 수를 계산하지 않고 단순히 몇 개의 문자가 있는지 가져오는 함수 Python 숫자 판별 str.isdigit('판단하고자 하는 문자열') 혹은 '판단하고자 하는 문자열'.isdigit() 판단하고자 하는 문자열이 모두 숫자면 True, 아니라면 False를 반환 음수와 소수점을 판단하지 못하기 때문에 포함되면 False를 반환 데이터 마트 데이터 웨어하우스로부터 특정 사용자가 관심을 갖는 데이터들을 주제별, 부서별로 추출하여 모은 비교적 작은 규모의 데이터 웨어하우스 시간 및 공간적인 효율성 증대 데이터 전처리 데이터 정제(결측치 및 이상치 제거)+분석 변수 처리(변수 선택, 파생변수 생성.. 2024. 4. 17.
728x90