본문 바로가기
728x90

데이터분석가155

[TIL]본캠프 32일차 리텐션(Retention)방문 후 재방문, 구매 후 재구매, 구매 후 로그인 등등고객의 어떤 행동을 리텐션으로 삼을 것인지는 서비스마다 차이가 존재리텐션을 정의할 때 그 행동이 비즈니스에서 중요하게 생각하는 고객의 핵심 행동인지 고려할 것!!리텐션의 종류클래식 리텐션, N-day 리텐션: 고객이 A 행동을 하고 N일차에 다시 A 행동을 했는지범위(Bracket/Range/Bounded) 리텐션: 기간을 기준으로 설정하여 리텐션을 정의(기간 내에 한번이라도 하면 리텐션으로)롤링(Rolling/On or After/Unbounded) 리텐션: 기준일 이후에 한 번이라도 A행동을 했다면 리텐션으로코호트 분석코호트: 공통적인 특성을 가진 사람들의 집단코호트 분석: 동질 집단이 시간에 따라 어떻게 변화하는가!!코.. 2024. 5. 31.
[TIL]본캠프 31일차 귀무가설기존의 통념으로 기각할 것을 목적으로 하는 가설(기본값에 가까움)대립가설새롭게 입증, 주장하고자 하는 것귀무가설일 틀렸을 데이터로 증명하려는 가설가설의 검정가설을 검정할 수 있는 통계량을 생성(상품 구매량 평균 등)통계량이 따르는 분포 확인(정규분포 등)검정을 위한 하나의 검정 통계량(Test Statistics) 생성(x_diff:두 집단의 평균의 차이/표준편차 등)귀무가설로 x_diff가 0임을 가정이 때의 검정 통계량이 귀무가설에서 가정한 것보다 지나치게 크거나 작을 경우(p-value로 판단) 귀무가설을 기각p-value귀무가설이 정확하다는 가정 하에서 관찰된 결과만큼 극단적인 검정 결과를 얻을 확률일반적으로 p-value가 연구를 시작할 때 세운 수치보다 작으면 귀무가설이 틀렸다고 생각통.. 2024. 5. 30.
[TIL]본캠프 30일차 확률분포실제로 볼 수 있는 일부 확률의 케이스들을 체계적으로 정리한 것베르누이 분포, 이항 분포, 정규 분포(가우스 분포) 등각 분포는 명확한 수식으로 정의됨중심 극한 정리독립적이고 동일한 분포를 갖는 확률 변수의 경우 표본 평군의 분포가 정규 분포를 따르는 경향이 존재표본의 분포가 아닌 표본 평균의 분포임을 기억할 것!!정규 분포를 이용하면 원래의 분포와 상관 없이 평균에 대한 통계 모델을 만들 수 있음t-test검정 통계량이 정규 분포를 따르며 분포와 관련된 변수값들이 알려졌을 때 사용두 데이터 집단의 평균이 서로 유의하게 다른지 여부를 판별할 수 있음이는 낮은 p-value(0.05이하)로 확인할 수 있음 2024. 5. 29.
[TIL]본캠프 29일차 퍼널 분석(Funnel Analysis)소비자의 행동을 기업 관점에서 재구성고객이 유입되어 전환에 이르는 단계를 수치로 확인하고 분석서비스, 분석 도메인에 따라 퍼널은 다양하게 이루어질 수 있음어떻게 퍼널의 각 단계를 정의하고 최적화할 수 있는지를 아는 것이 중요퍼널 단계 세우기서비스의 BM(Business Model)을 파악: 수익을 어떻게 극대화? 서비스가 매출을 어떻게 내는데? 수익 vs 지출?BM을 고려해 핵심 지표와 퍼널 스텝을 설계이탈률이 큰 단계를 중심으로 퍼널 재설계 가능퍼널별 전환율을 체크하고 최적화: 진입률을 높일까? 전환율을 높일까?확률고전적 확률: 어떤 사건이 발생할 경우의 수/전체 경우의 수(모든 경우의 수가 동일한 확률을 가진다는 가정)통계적 확률: 어떤 시행을 N번 반복할 때,.. 2024. 5. 28.
728x90