Data/[스파르타 내일배움캠프]

[TIL]본캠프 83일차

MIN_JOON 2024. 8. 13. 20:54
  • 회귀분석 용어정리
    • 제곱근평균제곱오차(RMSE): 회귀모형을 평가하는데 가장 널리 사용되는 측정지표
    • 잔차 표준오차(RSE): 평균제곱오차와 동일하지만 자유도에 따라 보정된 값
    • R-squared: 0에서 1까지 모델에 의해 설명된 분산의 비율
    • t 통계량: 계수의 표준오차로 나눈 예측변수의 계수, 모델에서 변수의 중요도를 비교하는 기준
    • 가변수: 요인 데이터를 사용하기 위해 0과 1의 이진변수로 부호화한 변수
    • 다중공선성: 예측변수들이 완벽하거나 거의 완벽에 가까운 상관성을 갖는다고 할 때, 회귀는 불안정
    • 교란변수: 중요한 예측변수이지만 회귀방정식에 누락되어 결과를 잘못되게 이끄는 변수
  • 회귀모형의 주의점
    • 데이터의 범위를 초과하면서까지 외삽하는데 사용해서는 안됨
    • 시계열 예측을 위해 회귀를 고려하지 않을 것
    • 충분한 데이터 값이 있는 예측변수에 대해서만 유효