본문 바로가기
Data/[스파르타 내일배움캠프]

[TIL]본캠프 38일차

by MIN_JOON 2024. 6. 11.
  • 지도 학습과 비지도 학습
    • 지도 학습: 정답이 있는 데이터(Labelled data)를 활용해 훈련 및 학습-결과에 대한 예측
    • 비지도 학습: 정답이 없는 데이터(Unlabelled data)를 활용해 훈련 및 학습-패턴 분석 및 그룹화
    • 지도 학습과 비지도 학습 이외에 강화 학습 또한 존재
    • 지도 학습과 비지도 학습 모두 '데이터 분석가의 주관' 개입이 필요
    • 데이터의 구조나 사용 분야에 맞게 적합한 방식을 선택하는 것이 중요
  • 지도학습
    • 분류와 회귀로 나뉘며, 회귀 모델은 연속형 값을 예측값으로 출력하며 분류 모델은 이산형 값을 출력
    • 선형회귀, 로지스틱 회귀, K-최근접 이웃, 랜덤 포레스트 등이 많이 사용됨
  • 비지도 학습
    • 군집화와 차원 축소로 나뉘지만, 현업에서 두가지가 연결되어 진행됨
    • 기간 선정→K값, 초키 컬럼 선정 →이상치 기준 선정 및 제외 →표준화 →차원 축소 →PCA PLOT 확인 →앞 과정을 반복하면 최적의 결과를 도출 →모델링 →데이터 적재 및 자동화 설정
    • 군집, K-means 클러스터링, 주성분 분석(PCA) 등이 사용

통계....머신러닝....

하루만에 다시 어렵다...

'Data > [스파르타 내일배움캠프]' 카테고리의 다른 글

[TIL]본캠프 40일차  (1) 2024.06.13
[TIL]본캠프 39일차  (1) 2024.06.12
[TIL]본캠프 37일차  (2) 2024.06.10
[WIL]본캠프 8주차  (2) 2024.06.07
[TIL]본캠프 36일차  (2) 2024.06.07