본문 바로가기
Data/[스파르타 내일배움캠프]

[TIL]본캠프 37일차

by MIN_JOON 2024. 6. 10.
  • 선형회귀분석
    • 독립변수(원인이 되는 변수)와 종속변수(예측하려는 변수,결과)가 모두 연속형
    • 선형방정식에 의한 함수식 표현으로 분석: 추세선을 통한 예측
    • 단순 회귀: 독립변수와 종속변수가 모두 1개인 경우
    • 다중 회귀: 2개 이상의 독립변수와 1개의 종속변수
  • 로지스틱 회귀분석
    • 독립변수: 연속형, 범주형 / 종속변수: 이진형, 다항
    • 예측 뿐만 아니라 분류에도 사용
    • 연결함수를 이용한 함수식 표현으로 분석
    • 이진 로지스틱 회귀: 종속변수가 두 가지 중 한 개의 값을 가지는 경우
    • 다중 로지스틱 회귀: 종속변수가 순서가 없는 3개 이상일 경우
  • 선형회귀분석의 결과 해석
    • 결정계수(R_squared): 회귀모델이 얼마나 설명을 잘 하는가? 전체 오류 중 회귀를 통해 얼마나 개선되었는가?
      →0과 1 사이의 값으로 1에 가까울수록 모델의 성능이 좋음
    • F-통계량(F-statistic): 회귀모델이 통계적으로 유의한가?
      →p-value로 유의성을 판단하며 0.05보다 작다면 통계적으로 타당한 것으로 확인
    • 회귀식의 기울기에 대한 t-검정: 독립변수와 종속변수 간의 선형관계가 존재하는가?
      →p-value로 유의성을 판단
  • OLS(Ordinary Least Squares) 해석하기
    • OLS는 선형회귀모델의 결과를 나타내는 결과표
    • t-statistic(t-통계량): 회귀 계수에 대한 t-통계량
    • P>|t| : 각 계수에 대한 p-value
    • R-squared(결정계수): 회귀모델의 설명력
    • F-statistic(F-통계량): 모델 전체의 통계적 유의성을 나타내며 높을수록 통계적으로 유의미
    • Prob(F-statistic): F-통계량에 대한 p-value
      OLS

통계랑 머신러닝 같이 하니까

그래도 조금 더 잘 알아듣는 것 같다..!

조금 재밌는 느낌🙃

'Data > [스파르타 내일배움캠프]' 카테고리의 다른 글

[TIL]본캠프 39일차  (1) 2024.06.12
[TIL]본캠프 38일차  (1) 2024.06.11
[WIL]본캠프 8주차  (2) 2024.06.07
[TIL]본캠프 36일차  (2) 2024.06.07
[TIL]본캠프 35일차  (3) 2024.06.05