Data/[스파르타 내일배움캠프]

[TIL]본캠프 18일차

MIN_JOON 2024. 5. 10. 20:20
  • K-fold 교차검증
    • 데이터를 k개의 집단으로 나누어 모델을 여러 번 훈련하고 평가하는 과정
    • k-1개를 훈련용 데이터로, 나머지 1개를 평가용 데이터로 사용하여 구축된 k개의 모델을 종합하여 최종 모델 구축
    • 모델 정확도 향상 및 과소적합 방지 가능, but 모델 훈련에 많은 시간이 필요
  • 부트스트랩
    • 리샘플링 방법 중 하나로, 기존의 데이터 집단에서 복원추출을 통해 여러 개의 샘플을 생성하고 이를 이용해 모집단의 특성 추정
    • 표본을 다시 추출하는 경우: 모델의 신뢰도를 높여 성능을 개선하고자 할 때
    • 랜덤하게 반복 추출하여 머신러닝 모델의 성능 향상을 꾀할 수 있음
    • 데이터셋 분포가 고르지 않은 경우에 사용 가능하며 과적합을 줄일 수 있음
  • 계층별 K-겹 교차검증(Stratified K-fold cross validation)
    • 불균형 데이터를 분류하는 문제에서 사용
    • 작동 방식은 k-fold 교차검증과 동일

또 일주일이 후다닥 지나갔다😭

다음주부터는 시간을 좀 더 알차게 써야겠다...