본문 바로가기
728x90

데이터분석가155

[성동1기 전Z전능 데이터 분석가] Day 41 데이터 시각화로 어떻게 설득할 수 있을까 기본적으로 지표에 대한 비교를 보여주어야함 필요하다면 지표에 평가 기준을 부여 + 액션을 유도하는 의미를 부여 전달하고자 하는 메시지에서 출발해 비교와 평가로 액션을 유도하는 방향으로 설득 그래프를 그려보고 나서 인사이트를 도출하려해서는 안된다→논리적이지 못한 결론을 도출할 수 있음 시각화의 시작은 목적 who: 이걸 보는 사람은 누구인가 why: 그 사람들은 이걸 왜 봐야 하는가 what: 이를 위해 무슨 지표가 필요한가 how: 그래서 어떻게 대응할 수 있을 것인가 when: 이게 언제 필요한가 who: 이걸 보는 사람은 누구인가 유저의 사용 목적에 맞는 지표 구성과 대시보드 설계(관리자용 vs 실무자용) why: 그 사람들은 이걸 왜 봐야 하는가 조직에 의미.. 2023. 12. 12.
[성동1기 전Z전능 데이터 분석가] Day 38~40 파이썬 프로젝트 마무리 및 발표DAY 귀무가설: 출퇴근 시간대의 대여량과 반납량은 차이가 없을 것이다. 대립가설: 출퇴근 시간대의 대여량과 반납량은 차이가 있을 것이다. 출퇴근 시간 대여 반납량 분석 rent_detail['return_date']=pd.to_datetime(rent_detail['return_date']) rent_detail['rent_hour']=rent_detail['rent_date_detail'].dt.hour rent_detail['return_hour']=rent_detail['return_date'].dt.hour rent_detail['day']=rent_detail['rent_date_detail'].dt.day rent_detail_weekday=rent_detail.. 2023. 12. 11.
[성동1기 전Z전능 데이터 분석가] Day 37 통계 분석 기술 통계 분석: 데이터를 요약해 설명하는 통계분석 기법 추론 통계 분석: 단순히 숫자를 요약하는 것을 넘어 어떤 값이 발생할 확률을 계산 통계적 가설 검정: 유의확률을 이용해 가설을 검정하는 방법(일반적으로 유의확률 5%를 판단 기준으로 삼는다.) 유의확률(P-Value): 실제로는 집단 간 차이가 없는데 우연히 차이가 있는 데이터가 추출될 확률 유의확률이 5%보다 클 경우 →집단 간 차이가 통계적으로 유의하지 않다. →실제로 차이가 없더라도, 우연에 의해 이런 정도의 차이가 관찰될 가능성이 크다. 유의활률이 5%보다 작을 경우 →집단 간 차이가 통계적으로 유의하다. →실제로 차이가 없는데 우연에 의해 이런 정도의 차이가 관찰될 가능성이 적다.(우연이라고 보기 힘들다.) T-검정(T-Test.. 2023. 12. 5.
[성동1기 전Z전능 데이터 분석가] Day 36 SQL 프로젝트를 Python으로 다시 해보기 SQL 프로젝트와 똑같이 기술 담당자로 프로젝트 진행 서울시 공공자전거(따릉이) 데이터를 이용 CSV 파일 불러오기 import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt plt.rcParams.update({'font.family':'Malgun Gothic', 'figure.dpi':'150', 'figure.figsize':[8,6], 'font.size':'10'}) place_list=pd.read_csv("공공자전거 대여소 정보(23.06월 기준).csv", encoding='cp949') trouble_list=pd.read_csv("서.. 2023. 12. 4.
728x90