- 지도 학습과 비지도 학습
- 지도 학습: 정답이 있는 데이터(Labelled data)를 활용해 훈련 및 학습-결과에 대한 예측
- 비지도 학습: 정답이 없는 데이터(Unlabelled data)를 활용해 훈련 및 학습-패턴 분석 및 그룹화
- 지도 학습과 비지도 학습 이외에 강화 학습 또한 존재
- 지도 학습과 비지도 학습 모두 '데이터 분석가의 주관' 개입이 필요
- 데이터의 구조나 사용 분야에 맞게 적합한 방식을 선택하는 것이 중요
- 지도학습
- 분류와 회귀로 나뉘며, 회귀 모델은 연속형 값을 예측값으로 출력하며 분류 모델은 이산형 값을 출력
- 선형회귀, 로지스틱 회귀, K-최근접 이웃, 랜덤 포레스트 등이 많이 사용됨
- 비지도 학습
- 군집화와 차원 축소로 나뉘지만, 현업에서 두가지가 연결되어 진행됨
- 기간 선정→K값, 초키 컬럼 선정 →이상치 기준 선정 및 제외 →표준화 →차원 축소 →PCA PLOT 확인 →앞 과정을 반복하면 최적의 결과를 도출 →모델링 →데이터 적재 및 자동화 설정
- 군집, K-means 클러스터링, 주성분 분석(PCA) 등이 사용
통계....머신러닝....
하루만에 다시 어렵다...
'Data > [스파르타 내일배움캠프]' 카테고리의 다른 글
[TIL]본캠프 40일차 (1) | 2024.06.13 |
---|---|
[TIL]본캠프 39일차 (1) | 2024.06.12 |
[TIL]본캠프 37일차 (2) | 2024.06.10 |
[WIL]본캠프 8주차 (2) | 2024.06.07 |
[TIL]본캠프 36일차 (2) | 2024.06.07 |