본문 바로가기
Data/[스파르타 내일배움캠프]

[TIL]본캠프 7일차

by MIN_JOON 2024. 4. 23.
  • 기초 통계 용어
    • 평균: 일반적인 평균은 산술 평균을 의미, 데이터를 요약할 때 가장 대표적으로 사용
    • 중앙값: 평균이 치우쳐있는지를 확인할 수 있음, 순서대로 나열했을 때 가운데 위치한 값
    • 최빈값: 가장 빈번하게 등장하는 값
    • 분산: 데이터의 흩어진 정도를 나타냄
    • 표준편차: 데이터의 흩어진 정도를 나타냄, 분산의 양의 제곱근
    • 백분위수: 순서대로 정렬했을 때 특정 백분율 위치에 있는 데이터 값
    • 첨도: 자료가 얼마나 밀집해 있는지를 나타냄
    • 왜도: 확률분포의 비대칭도를 측정하는 지표(양수인 경우 왼쪽으로 밀집, 음수인 경우 오른쪽으로 밀집)
    • 상관분석: 두 변수가 함께 움직이는 방향과 그 크기에 대한 분석(두 변수가 같이 증가하면 양의 상관, 한 변수가 증가할 때 나머지 하나가 감소하면 음의 상관)
    • 공분산: 두 변수 간의 상관관계를 나타내는 통계적인 지표(양수면 양의 상관관계, 음수면 음의 상관관계)
    • 상관계수: 두 변수간의 상관 정도를 -1에서 1까지 숫자로 표현해서 측정
  • 확률
    • 특정 사건이 일어날 가능성의 척도
    • 조건부 확률: 특정사건 A가 발생했다는 것이 사실이라는 전제하에 사건 B가 발생할 확률(0과 1 사이의 값을 가짐)
    • 독립사건: 두 사건이 서로 영향을 미치지 않고, 한 사건의 발생 여부가 다른 사건에 아무런 정보를 제공하지 않음
    • 배반사건: 두 사건 A와 B가 동시에 발생할 수 없는 경우
  • 확률변수와 확률분포
    • 확률변수: 어떤 확률 실험이나 상황에서 발생할 수 있는 각각의 결과를 수치적으로 표현하는 변수
    • 확률분포: 확률변수가 특정값들을 가질 확률을 나타내는 함수 또는 규칙
  • 이산확률분포
    • 이산형 확률변수: 사건의 확률이 그 사건들이 속한 점들의 확률합으로 표현할 수 있는 확률변수
    • 베르누이 분포: 확률 변수가 0 또는 1 두개의 결과만 갖는 분포
    • 이항분포: N번의 베르누이 시행에서 K번 성공할 확률의 분포
    • 기하분포: 성공확률이 p인 베르누이 시행에서 첫 성공이 있기까지 k번 실패할 확률
    • 포아송 분포: 시간과 공간 내에서 발생하는 사건의 발생 횟수에 대한 확률 분포
  • 연속확률분포
    • 연속형 확률변수: 가능한 값이 실수의 어느 특정구간 전체에 해당하는 확률변수
    • 균일분포: 모든 확률변수 X가 균일한 확률을 가지는 분포
    • 정규분포: 평균과 표준편차에 의해서 모양이 결정
    • t-분포: 표본으로부터 모집단의 평균에 대한 추정을 할 때 사용(0을 중심으로 좌우가 동일)
    • 카이제곱 분포: 표준정규분포를 따르는 확률변수들의 제곱을 합한 분포
    • F분포: 두 집단간 분산의 동일성 검정에 사용되는 검정 통계량의 분포(확률변수는 항상 양의 값)

할게 너무 많은 느낌...

부스트 클래스 듣고 ADsP하다가 

하루가 끝났다....

'Data > [스파르타 내일배움캠프]' 카테고리의 다른 글

[TIL]본캠프 9일차  (1) 2024.04.25
[TIL]본캠프 8일차  (2) 2024.04.24
[TIL]본캠프 6일차  (2) 2024.04.22
[WIL]본캠프 1주차  (3) 2024.04.19
[TIL]본캠프 5일차  (4) 2024.04.19