- 선형회귀분석
- 독립변수(원인이 되는 변수)와 종속변수(예측하려는 변수,결과)가 모두 연속형
- 선형방정식에 의한 함수식 표현으로 분석: 추세선을 통한 예측
- 단순 회귀: 독립변수와 종속변수가 모두 1개인 경우
- 다중 회귀: 2개 이상의 독립변수와 1개의 종속변수
- 로지스틱 회귀분석
- 독립변수: 연속형, 범주형 / 종속변수: 이진형, 다항
- 예측 뿐만 아니라 분류에도 사용
- 연결함수를 이용한 함수식 표현으로 분석
- 이진 로지스틱 회귀: 종속변수가 두 가지 중 한 개의 값을 가지는 경우
- 다중 로지스틱 회귀: 종속변수가 순서가 없는 3개 이상일 경우
- 선형회귀분석의 결과 해석
- 결정계수(R_squared): 회귀모델이 얼마나 설명을 잘 하는가? 전체 오류 중 회귀를 통해 얼마나 개선되었는가?
→0과 1 사이의 값으로 1에 가까울수록 모델의 성능이 좋음 - F-통계량(F-statistic): 회귀모델이 통계적으로 유의한가?
→p-value로 유의성을 판단하며 0.05보다 작다면 통계적으로 타당한 것으로 확인 - 회귀식의 기울기에 대한 t-검정: 독립변수와 종속변수 간의 선형관계가 존재하는가?
→p-value로 유의성을 판단
- 결정계수(R_squared): 회귀모델이 얼마나 설명을 잘 하는가? 전체 오류 중 회귀를 통해 얼마나 개선되었는가?
- OLS(Ordinary Least Squares) 해석하기
- OLS는 선형회귀모델의 결과를 나타내는 결과표
- t-statistic(t-통계량): 회귀 계수에 대한 t-통계량
- P>|t| : 각 계수에 대한 p-value
- R-squared(결정계수): 회귀모델의 설명력
- F-statistic(F-통계량): 모델 전체의 통계적 유의성을 나타내며 높을수록 통계적으로 유의미
- Prob(F-statistic): F-통계량에 대한 p-value
통계랑 머신러닝 같이 하니까
그래도 조금 더 잘 알아듣는 것 같다..!
조금 재밌는 느낌🙃
'Data > [스파르타 내일배움캠프]' 카테고리의 다른 글
[TIL]본캠프 39일차 (1) | 2024.06.12 |
---|---|
[TIL]본캠프 38일차 (1) | 2024.06.11 |
[WIL]본캠프 8주차 (2) | 2024.06.07 |
[TIL]본캠프 36일차 (2) | 2024.06.07 |
[TIL]본캠프 35일차 (3) | 2024.06.05 |