728x90 데이터분석가155 [TIL]본캠프 27일차(기초 프로젝트 6일차) RFM 분석사용자들의 분포를 확인하거나 사용자 그룹을 나누어 분류하는 분석 기법Recency: 얼마나 최근에 구매했는가Frequency: 얼마나 자주 구매했는가Monetary: 얼마나 많은 금액을 지출했는가파레토의 법칙80:20 법칙으로도 불림80%의 결과가 20%의 원인에 의해 발생한다는 것기초 프로젝트 피드백시각화 자료를 보여줄 때, 시각화가 담고있는 메시지를 같이 보여주는 것이 좋음당연한 내용을 분석하고 보여준다면 회사 입장에서 새로운 느낌을 받지 않을 것(과감한 분석을 진행할 것)목표를 우선 세우고 그것을 검증하고 인사이트를 추출하는 프로세스로 진행할 것기초 프로젝트 마무리하고 발표꽤나 어려웠고 주제도 난해해서 걱정했는데역시나 매콤한 피드백이 돌아왔다...추후에 프로젝트를 진행할 때 피드백 받은 .. 2024. 5. 24. [TIL]본캠프 26일차(기초 프로젝트 5일차) 이동평균전체 데이터 집합 중에서 하위 집합에 대한 평균을 만들어 데이터 요소를 분석전체의 추세를 알 수 있음SQL을 이용한 이동평균WINDOW FUNCTION을 사용하여 이동평균을 구할 수 있음AVG() OVER(ORDER BY [COLUMN1] BETWEEN ROWS BETWEEN lower_bound(A) AND upper_bound(B)): A와 B 사이의 이동평균UNBOUNDED PRECEDING, UNBOUNDED FOLLOWING: 이전이나 이후 모든 범위를 포함하여 계산#7일 구매량 이동평균SELECT date_columns ,SUM(amount_of_purchase) ,AVG(SUM(amount_of_purchase)) OVER(ORDER BY date_columns ROWS .. 2024. 5. 23. [TIL]본캠프 25일차(기초 프로젝트 4일차) 회귀분석관찰된 연속형 변수들에 대해 두 변수 사이의 모형을 구한뒤 적합도를 측정해내는 분석 방법하나의 종속변수와 하나의 독립변수 사이의 관계를 분석할 경우 단순회귀분석하나의 종속변수와 여러 독립변수 사이의 관계를 규명하고자 할 경우 다중회귀분석유의확률(p-value)귀무가설이 옳다고 가정했을 때, 통계치가 관측될 확률가설이 맞고 틀림을 나타내는 지표가 아니라 확률을 표시하는 지표유의수준 값과 유의확률 값을 비교하여 통계적 유의성을 검정해야함계속 기초프로젝트를 진행하다보니TIL에 쓸만한 내용이 많지 않은 느낌...프로젝트를 하더라도 복습하는 시간을 조금씩 가져야겠다 2024. 5. 22. [TIL]본캠프 24일차(기초 프로젝트 3일차) Window Function행과 행 간의 관계를 정의하기 위해 사용순위, 합계, 평균, 행 위치 등을 조작할 수 있음집계의 경우를 제외하고 GROUP BY와 병행하여 사용하지는 않음집계를 제외하고 결과 건수가 줄어들지 않기 때문에 행을 모두 살리고 싶을 때 사용row_number() over중복순위 없이 순서대로 숫자를 부여해줌무조건 줄 세우기1,2,3,4.....dense_rank() over중복순위가 존재하며 동점자 이후에도 바로 다음 순위를 부여(1등이 두명이라도 뒤에 바로 2등으로 부여)rank() over중복순위가 존재하며 동점자 이후에는 중간 순위를 비운 값이 출력(1등이 두명이라면 뒤에는 3등 부여)FIRST_VALUE()와 LAST_VALUE()파티션 별로 가장 먼저 나온 값과 가장 마지막.. 2024. 5. 21. 이전 1 ··· 15 16 17 18 19 20 21 ··· 39 다음 728x90