728x90 분류 전체보기163 [TIL]본캠프 48일차(심화 프로젝트 발표) 프로젝트 피드백분석 실험을 가정하고 시작한 부분 좋음EDA, 코호트 분석 및 리텐션 분석은 거의 모든 프로젝트에서 진행하기 때문에 파이썬으로도 해볼 것오래된 데이터는 트렌드에 약할 수 있음(프로젝트 데이터: 2018년 데이터)주성분의 수가 컬럼 수와 가까울수록 정확도는 높아지지만 의미가 없을 수 있음한 군집에 대한 인사이트도 좋지만 다른 군집들에 대한 인사이트도 있었다면 좋았을 것프로젝트 마무리 및 발표 DAYTIL도 간단하게...! 2024. 6. 25. [TIL]본캠프 47일차 판다스 시계열 데이터 다루기datetime now현재 시간을 출력할 때 사용timedelda현재 시간으로부터 지정한 만큼이 지난 시각을 출력timedelta(지정해주는 값;days,hours 등등)strftime시계열 데이터의 형식 설정%Y-%m-%d와 같은 형식 지정(시간이 포함되는 경우도 가능_%H:%M:%S)#현재 시간 출력from datetime import datetimenow = datetime.now()print(now)#하루 뒤의 시각 출력from datetime import datetimefrom datetime import timedeltanow = datetime.now()tomorrow = now + timedelta(days=1)print(tomorrow)#하루 전의 시각 출력fr.. 2024. 6. 24. [WIL]본캠프 10주차 일주일 동안 뭐했지?심화 프로젝트 진행FEELINGS🧐 클러스터링 진짜 너무 어렵다....튜터님의 가이드가 확실해서 주제를 선택한 이유도 있었는데 가이드가 그만큼 확실하지 않으면 시작도 못할 것 같아서 였다고....😭그래도 어찌저찌 한 주가 또 흘러갔다.....주제가 어렵다보니 집중력이 낮아진 것 같아서 다음주엔 다시 또 가다듬고 시작해야겠다.FINDINGS🔎 클러스터링을 진행할 때, 클러스터를 설명하려는 변수(컬럼)의 수가 클러스터의 갯수의 두 배 이상으로 설정해줄 것. 3개의 변수로 3개의 군집으로 나누는 것은 그냥 GROUPBY 하는 것이랑 다를게 없다...!또 실루엣 계수가 0.5정도면 대부분 타당한 것으로 인정되며 0.7이면 군집화가 아주 잘 이루어진 것이라고 할 수 있지만, 후자는 조작된.. 2024. 6. 21. [TIL]본캠프 46일차(심화 프로젝트 5일차) 군집별 특성 분석#클러스터별 고객수sns.barplot(data = clustered_data.groupby('cluster',as_index=False).agg(customer_count=('customer_id','nunique')), x = 'cluster' , y = 'customer_count', color = 'gray');#배송에 걸리는 기간 추가 clustered_data['purchase_to_delivered'] = clustered_data['order_delivered_timestamp'] - clustered_data['order_purchase_timestamp']#구매 요일 추가clustered_data['purchase_weekday'] = clustered_data['ord.. 2024. 6. 21. 이전 1 ··· 8 9 10 11 12 13 14 ··· 41 다음 728x90