본문 바로가기
728x90

분류 전체보기163

[TIL]본캠프 38일차 지도 학습과 비지도 학습지도 학습: 정답이 있는 데이터(Labelled data)를 활용해 훈련 및 학습-결과에 대한 예측비지도 학습: 정답이 없는 데이터(Unlabelled data)를 활용해 훈련 및 학습-패턴 분석 및 그룹화지도 학습과 비지도 학습 이외에 강화 학습 또한 존재지도 학습과 비지도 학습 모두 '데이터 분석가의 주관' 개입이 필요데이터의 구조나 사용 분야에 맞게 적합한 방식을 선택하는 것이 중요지도학습분류와 회귀로 나뉘며, 회귀 모델은 연속형 값을 예측값으로 출력하며 분류 모델은 이산형 값을 출력선형회귀, 로지스틱 회귀, K-최근접 이웃, 랜덤 포레스트 등이 많이 사용됨비지도 학습군집화와 차원 축소로 나뉘지만, 현업에서 두가지가 연결되어 진행됨기간 선정→K값, 초키 컬럼 선정 →이상치 기.. 2024. 6. 11.
[TIL]본캠프 37일차 선형회귀분석독립변수(원인이 되는 변수)와 종속변수(예측하려는 변수,결과)가 모두 연속형선형방정식에 의한 함수식 표현으로 분석: 추세선을 통한 예측단순 회귀: 독립변수와 종속변수가 모두 1개인 경우다중 회귀: 2개 이상의 독립변수와 1개의 종속변수로지스틱 회귀분석독립변수: 연속형, 범주형 / 종속변수: 이진형, 다항예측 뿐만 아니라 분류에도 사용연결함수를 이용한 함수식 표현으로 분석이진 로지스틱 회귀: 종속변수가 두 가지 중 한 개의 값을 가지는 경우다중 로지스틱 회귀: 종속변수가 순서가 없는 3개 이상일 경우선형회귀분석의 결과 해석결정계수(R_squared): 회귀모델이 얼마나 설명을 잘 하는가? 전체 오류 중 회귀를 통해 얼마나 개선되었는가?→0과 1 사이의 값으로 1에 가까울수록 모델의 성능이 좋음F.. 2024. 6. 10.
[WIL]본캠프 8주차 일주일 동안 뭐했지?머신러닝 강의 수강SQL 코드카타 진행부스트 클래스 마무리SQL 챌린지 세션 복습통계학 추가 세션 복습FEELINGS🧐 머신러닝 강의가 새롭게 시작된 주차!!!갑자기 난이도가 올라가는 느낌이라 조금 멍하게 지나간 한 주인 것 같다...😭복습을 여러 번 더 해야할 듯...!!소현 튜터님의 통계학 세션도 아주 많은 도움이 되는 중!!!FINDINGS🔎 SQL 챌린지 세션으로 퍼널 분석, 코호트 분석, Z차트, YOY 등 SQL로 쿼리 짜는 법에 대해 어느 정도 감이 생겼다. PostgreSQL이 MySQL이랑 조금 다른 부분이 있어서 당황했는데 일단 MySQL 기준으로 공부하고 나중에 채워갸아할 듯!!!그리고 지난주에 ANOVA 배웠는데 잘 안쓴다고 하신다🙌 FUTURE✨다음 주에.. 2024. 6. 7.
[TIL]본캠프 36일차 Z차트월별 매출, 매출 누계, 이동 합계를 한 차트에 표현한 것계절의 영향을 배제하고 트렌드를 분석하기 위해 사용하는 차트매출 누계: 해당 월까지의 매출을 모두 합한 값이동 합계: 해당 월의 매출과 과거 11개월의 매출을 합한 값#이탈리아의 제품별 Z차트 구하기SELECT ProductName ,DATE_FORMAT(STR_TO_DATE(Date,'%m/%d/%Y'),'%Y-%m') AS dt_month ,SUM(Price*Quantity) as monthly_sales #월별 매출 ,ROUND( SUM(SUM(Price*Quantity)) OVER(PARTITION BY ProductName ORDER BY D.. 2024. 6. 7.
728x90