- 기술통계(Descriptive Statistics)
- 지표의 특성을 표, 그림, 통계량 등을 사용하여 쉽게 파악할 수 있도록 정리 및 요약하는 것
- 데이터의 대략적인 통계적 수치를 계산할 수 있음
- 히스토그램
- 주어진 데이터를 구간으로 나누고 각 구간에 속하는 데이터의 빈도를 막대로 표현한 그래프
- 주로 데이터의 분포나 모양 및 특성을 파악하는데 사용
- 연속형으로 표시된 데이터(키, 몸무게, 성적 등)를 표현하여 임의로 순서를 변경할 수 없고 막대 사이의 간격이 없음
- 데이터의 수를 활용하여 계급 수와 간격을 계산하여 도수분포표를 그리고 히스토그램을 생성
- 계급의 수: 2^k ≥ n을 만족하는 최소의 정수(k = 계급수, n=데이터 수)
- cf)막대그래프: 범주형 데이터를 표현하며 범주의 순서를 의도적으로 바꿀 수 있음
- 줄기-잎 그림(Stem-and Leaf Plot)
- 데이터를 줄기와 잎 모양으로 그린 것
- 상자그림(Box Plot)
- 최솟값, Q1, Q2, Q3, 최댓값의 요약을 통해 그림으로 표현한 것
- 보통 이상점(Mild Outlier): 안쪽 울타리와 바깥 울타리 사이에 있는 자료
- 극단 이상점(Extreme Outlier): 바깥 울타리 밖의 자료
- 종속변수 와 독립변수
- 종속변수(반응변수, y): 다른 변수의 영향을 받는 변수로, 실험이나 조사에서 결과로 나타나는 변수
- 독립변수(설명변수, x): 다른 변수에 영향을 주는 변수로, 값을 설명하거나 예측하는데 사용
- 산점도(Scatter Plot)
- 두 변수 간의 관계를 시각적으로 나타내는 그래픽 표현 방법
- 각 점은 두 변수의 값을 나타내며, 점들의 분포를 통해 두 변수 간의 관계를 시각적으로 확인
- 확인해야 할 것
→두 변수 사이에 선형관계가 존재하는가?
→두 변수 사이에 함수관계가 성립하는가?
→이상값이 존재하는가?
→몇 개의 집단으로 구분되는가?
- t-검정
- 두 집단 간 평균의 차이가 유의미한지 검정하는 방법
다음 주 ADsP 시험...!
이제부턴 열공모드로 들어간다!!!!!!!!!
'Data > [스파르타 내일배움캠프]' 카테고리의 다른 글
[TIL]본캠프 13일차 (2) | 2024.05.01 |
---|---|
[TIL]본캠프 12일차 (0) | 2024.04.30 |
[WIL]본캠프 2주차 (4) | 2024.04.26 |
[TIL]본캠프 10일차 (2) | 2024.04.26 |
[TIL]본캠프 9일차 (1) | 2024.04.25 |