본문 바로가기
728x90

직무교육123

[TIL]본캠프 50일차 태블로 텍스트 테이블데이터 프레임과 비슷하게 행과 열로 이루어짐wide format table: 옆으로 넓은 형태로 데이터가 쌓임(하나의 열에 여러 개의 데이터를 나란히 나열)→데이터 분석에 많이 사용되며 표를 비교하거나 그래프 시각화를 하기에 용이long format table: 아래로 길게 데이터가 쌓임(한 개의 특성을 나타내는 열을 가진 여러 개의 행)→시간 변화에 따른 카테고리간 비교를 시각화하기에 용이태블로의 필터별 작동 원리추출 필터: 데이터 소스에서 추출된 데이터 필터링(데이터 연결이 추출인 경우)데이터 원본 필터: 데이터 원본 소스에서 일부 데이터 필터링컨택스트 필터: 특정값에 대한 데이터 필터링차원 필터: 차원을 기준으로 데이터 필터링측정값 필터: 측정값을 기준으로 데이터 필터링테이블 계.. 2024. 6. 27.
[TIL]본캠프 49일차 데이터 인프라데이터 레이크 → 데이터 웨어하우스 → 데이터 마트 → BI 툴데이터 레이크: 모든 Raw data(정형 데이터, 로그 데이터, 테이블 등)를 저장할 수 있는 스토리지데이터 웨어하우스(DW): 데이터를 장기적인 보존용으로 통합, 정제, 분석하여 정리한 저장소→ AWS Redshift, Snowflake, Google Bigquery데이터 마트(DM): 부서별, 목적별 분석용으로 만든 데이터 웨어하우스의 데이터 일부분라인 그래프간단하고 사용하기 쉬움시계열 데이터를 시각화할 경우, 변화량과 트렌드를 한 눈에 살펴보기 용이함연속형 데이터에 사용하기 적합함막대 그래프범주 간의 차이나 분포를 시각적으로 이해하기 쉬움범주형 데이터에 사용하기 적합맵 차트지도를 활용하여 지리적 위치를 살펴볼 수 있음각 지.. 2024. 6. 26.
[TIL]본캠프 48일차(심화 프로젝트 발표) 프로젝트 피드백분석 실험을 가정하고 시작한 부분 좋음EDA, 코호트 분석 및 리텐션 분석은 거의 모든 프로젝트에서 진행하기 때문에 파이썬으로도 해볼 것오래된 데이터는 트렌드에 약할 수 있음(프로젝트 데이터: 2018년 데이터)주성분의 수가 컬럼 수와 가까울수록 정확도는 높아지지만 의미가 없을 수 있음한 군집에 대한 인사이트도 좋지만 다른 군집들에 대한 인사이트도 있었다면 좋았을 것프로젝트 마무리 및 발표 DAYTIL도 간단하게...! 2024. 6. 25.
[TIL]본캠프 47일차 판다스 시계열 데이터 다루기datetime now현재 시간을 출력할 때 사용timedelda현재 시간으로부터 지정한 만큼이 지난 시각을 출력timedelta(지정해주는 값;days,hours 등등)strftime시계열 데이터의 형식 설정%Y-%m-%d와 같은 형식 지정(시간이 포함되는 경우도 가능_%H:%M:%S)#현재 시간 출력from datetime import datetimenow = datetime.now()print(now)#하루 뒤의 시각 출력from datetime import datetimefrom datetime import timedeltanow = datetime.now()tomorrow = now + timedelta(days=1)print(tomorrow)#하루 전의 시각 출력fr.. 2024. 6. 24.
728x90