본문 바로가기
Data/[스파르타 내일배움캠프]

[TIL]본캠프 11일차

by MIN_JOON 2024. 4. 29.
  • 기술통계(Descriptive Statistics)
    • 지표의 특성을 표, 그림, 통계량 등을 사용하여 쉽게 파악할 수 있도록 정리 및 요약하는 것
    • 데이터의 대략적인 통계적 수치를 계산할 수 있음
  • 히스토그램
    • 주어진 데이터를 구간으로 나누고 각 구간에 속하는 데이터의 빈도를 막대로 표현한 그래프
    • 주로 데이터의 분포나 모양 및 특성을 파악하는데 사용
    • 연속형으로 표시된 데이터(키, 몸무게, 성적 등)를 표현하여 임의로 순서를 변경할 수 없고 막대 사이의 간격이 없음
    • 데이터의 수를 활용하여 계급 수와 간격을 계산하여 도수분포표를 그리고 히스토그램을 생성
    • 계급의 수: 2^k ≥ n을 만족하는 최소의 정수(k = 계급수, n=데이터 수)
    • cf)막대그래프: 범주형 데이터를 표현하며 범주의 순서를 의도적으로 바꿀 수 있음
  • 줄기-잎 그림(Stem-and Leaf Plot)
    • 데이터를 줄기와 잎 모양으로 그린 것
  • 상자그림(Box Plot)
    • 최솟값, Q1, Q2, Q3, 최댓값의 요약을 통해 그림으로 표현한 것
    • 보통 이상점(Mild Outlier): 안쪽 울타리와 바깥 울타리 사이에 있는 자료
    • 극단 이상점(Extreme Outlier): 바깥 울타리 밖의 자료
  • 종속변수 와 독립변수
    • 종속변수(반응변수, y): 다른 변수의 영향을 받는 변수로, 실험이나 조사에서 결과로 나타나는 변수
    • 독립변수(설명변수, x): 다른 변수에 영향을 주는 변수로, 값을 설명하거나 예측하는데 사용
  • 산점도(Scatter Plot)
    • 두 변수 간의 관계를 시각적으로 나타내는 그래픽 표현 방법
    • 각 점은 두 변수의 값을 나타내며, 점들의 분포를 통해 두 변수 간의 관계를 시각적으로 확인
    • 확인해야 할 것
      →두 변수 사이에 선형관계가 존재하는가?
      →두 변수 사이에 함수관계가 성립하는가?
      →이상값이 존재하는가?
      →몇 개의 집단으로 구분되는가?
  • t-검정
    • 두 집단 간 평균의 차이가 유의미한지 검정하는 방법

다음 주 ADsP 시험...!

이제부턴 열공모드로 들어간다!!!!!!!!!

'Data > [스파르타 내일배움캠프]' 카테고리의 다른 글

[TIL]본캠프 13일차  (2) 2024.05.01
[TIL]본캠프 12일차  (0) 2024.04.30
[WIL]본캠프 2주차  (4) 2024.04.26
[TIL]본캠프 10일차  (2) 2024.04.26
[TIL]본캠프 9일차  (1) 2024.04.25