본문 바로가기
Data/[스파르타 내일배움캠프]

[TIL]본캠프 18일차

by MIN_JOON 2024. 5. 10.
  • K-fold 교차검증
    • 데이터를 k개의 집단으로 나누어 모델을 여러 번 훈련하고 평가하는 과정
    • k-1개를 훈련용 데이터로, 나머지 1개를 평가용 데이터로 사용하여 구축된 k개의 모델을 종합하여 최종 모델 구축
    • 모델 정확도 향상 및 과소적합 방지 가능, but 모델 훈련에 많은 시간이 필요
  • 부트스트랩
    • 리샘플링 방법 중 하나로, 기존의 데이터 집단에서 복원추출을 통해 여러 개의 샘플을 생성하고 이를 이용해 모집단의 특성 추정
    • 표본을 다시 추출하는 경우: 모델의 신뢰도를 높여 성능을 개선하고자 할 때
    • 랜덤하게 반복 추출하여 머신러닝 모델의 성능 향상을 꾀할 수 있음
    • 데이터셋 분포가 고르지 않은 경우에 사용 가능하며 과적합을 줄일 수 있음
  • 계층별 K-겹 교차검증(Stratified K-fold cross validation)
    • 불균형 데이터를 분류하는 문제에서 사용
    • 작동 방식은 k-fold 교차검증과 동일

또 일주일이 후다닥 지나갔다😭

다음주부터는 시간을 좀 더 알차게 써야겠다...

'Data > [스파르타 내일배움캠프]' 카테고리의 다른 글

[TIL]본캠프 19일차  (1) 2024.05.13
[WIL]본캠프 4주차  (1) 2024.05.10
[TIL]본캠프 17일차  (1) 2024.05.09
[TIL]본캠프 16일차  (2) 2024.05.07
[WIL]본캠프 3주차  (2) 2024.05.03