본문 바로가기
728x90

DA교육145

[TIL]본캠프 76일차 신규 구매자들의 클러스터링 진행(최종 프로젝트)클러스터링을 위해 한 고객 당 특성으로 이루어진 테이블로 전처리전처리를 통해 생성된 테이블로 클러스터링 진행클러스터 수 : 4개, 주성분 수 : 2개#2023년 기준으로 고객별 특성 테이블 생성customer_clustering = new_2023.copy()customer_clustering['return_status'] = customer_clustering['return_status'].fillna(0)customer_clustering['return_status'] = np.where(customer_clustering['return_status'] == 0,0,1)customer_clustering['order_date'] = customer_clu.. 2024. 8. 2.
[TIL]본캠프 75일차 Ad-Hoc 분석필요에 따라 임시로 데이터를 분석하는 것비구조적: 데이터를 미리 정의할 필요없이 활용 가능즉각적인 요구: 긴급 문제 해결 및 특별 질문에 활용유연성: 유연한 데이터 접근과 빠른 분석일회성: 대부분 결과물을 재사용하지 않는 일회성 작업Carrying Capacity(한계 수용력)프로덕트가 최종적으로 달성할 수 있는 유저 수이를 통해 현재 상황에서 성장의 한계점을 유추할 수 있음새로운 프로덕트 및 서비스를 통해 CC를 늘려나갈 필요가 있음Paid Marketing을 통해 CC에 도달하는 성장 속도를 빠르게 만들 수 있음첫 방문 유저수/이탈율(%)과 같은 식을 통해 계산할 수 있음EX) 첫 방문 수가 10,000명이고, 이탈률이 1%일 경우 한계 수용력은 100만으로 확인최종 프로젝 문제 정의.. 2024. 8. 1.
[TIL]본캠프 74일차 최종 프로젝트 최근 5년 테이블 작성#2023년 테이블order_2023 = main_order.query('order_year == 2023')order_2023['new_or_exist'] = np.where(order_2023['created_year']==2023,'new','exist')order_2023 = order_2023.groupby(['order_year','new_or_exist']).agg(customer_count=('customer_id','nunique'),total_revenue=('total_price','sum'),order_count=('order_id','count')).reset_index()#2022년 테이블order_2022 = main_order.query('.. 2024. 7. 31.
[TIL]본캠프 72일차&73일차 인구 통계학적 세그멘테이션사용기기, 연령, 성별, 소득과 같은 공통된 간단한 특성을 바탕으로 여러 그룹으로 나누는 방법빠르게 세그멘테이션을 진행할 수 있으며, 가장 널리 알려진 간단한 방법제한적인 데이터를 활용해야할 상황에 사용 가능위치적 세그멘테이션고객을 국가, 지역, 도시와 같은 위치 및 장소에 따라 여러 그룹으로 나누는 방법모빌리티, 배달 산업과 같은 GIS 기반 위치가 중요한 산업에서 활용심리적 세그멘테이션고객을 라이프스타일, 관심사, 가치 및 태도에 따라 여러 그룹으로 분할이커머스 산업에서 많이 활용고객 행동 세그멘테이션고객의 행동 데이터 기반으로 분할하는 방법다양한 사용 패턴, 브랜드 충성도, 마케팅 채널에 대한 반응률 등과 같은 기준으로 분할 가능최종 프로젝트 코호트 분석코호트 기준: 해당 .. 2024. 7. 30.
728x90