- K-fold 교차검증
- 데이터를 k개의 집단으로 나누어 모델을 여러 번 훈련하고 평가하는 과정
- k-1개를 훈련용 데이터로, 나머지 1개를 평가용 데이터로 사용하여 구축된 k개의 모델을 종합하여 최종 모델 구축
- 모델 정확도 향상 및 과소적합 방지 가능, but 모델 훈련에 많은 시간이 필요
- 부트스트랩
- 리샘플링 방법 중 하나로, 기존의 데이터 집단에서 복원추출을 통해 여러 개의 샘플을 생성하고 이를 이용해 모집단의 특성 추정
- 표본을 다시 추출하는 경우: 모델의 신뢰도를 높여 성능을 개선하고자 할 때
- 랜덤하게 반복 추출하여 머신러닝 모델의 성능 향상을 꾀할 수 있음
- 데이터셋 분포가 고르지 않은 경우에 사용 가능하며 과적합을 줄일 수 있음
- 계층별 K-겹 교차검증(Stratified K-fold cross validation)
- 불균형 데이터를 분류하는 문제에서 사용
- 작동 방식은 k-fold 교차검증과 동일
또 일주일이 후다닥 지나갔다😭
다음주부터는 시간을 좀 더 알차게 써야겠다...
'Data > [스파르타 내일배움캠프]' 카테고리의 다른 글
[TIL]본캠프 19일차 (1) | 2024.05.13 |
---|---|
[WIL]본캠프 4주차 (1) | 2024.05.10 |
[TIL]본캠프 17일차 (1) | 2024.05.09 |
[TIL]본캠프 16일차 (2) | 2024.05.07 |
[WIL]본캠프 3주차 (2) | 2024.05.03 |