- 기초 통계 용어
- 평균: 일반적인 평균은 산술 평균을 의미, 데이터를 요약할 때 가장 대표적으로 사용
- 중앙값: 평균이 치우쳐있는지를 확인할 수 있음, 순서대로 나열했을 때 가운데 위치한 값
- 최빈값: 가장 빈번하게 등장하는 값
- 분산: 데이터의 흩어진 정도를 나타냄
- 표준편차: 데이터의 흩어진 정도를 나타냄, 분산의 양의 제곱근
- 백분위수: 순서대로 정렬했을 때 특정 백분율 위치에 있는 데이터 값
- 첨도: 자료가 얼마나 밀집해 있는지를 나타냄
- 왜도: 확률분포의 비대칭도를 측정하는 지표(양수인 경우 왼쪽으로 밀집, 음수인 경우 오른쪽으로 밀집)
- 상관분석: 두 변수가 함께 움직이는 방향과 그 크기에 대한 분석(두 변수가 같이 증가하면 양의 상관, 한 변수가 증가할 때 나머지 하나가 감소하면 음의 상관)
- 공분산: 두 변수 간의 상관관계를 나타내는 통계적인 지표(양수면 양의 상관관계, 음수면 음의 상관관계)
- 상관계수: 두 변수간의 상관 정도를 -1에서 1까지 숫자로 표현해서 측정
- 확률
- 특정 사건이 일어날 가능성의 척도
- 조건부 확률: 특정사건 A가 발생했다는 것이 사실이라는 전제하에 사건 B가 발생할 확률(0과 1 사이의 값을 가짐)
- 독립사건: 두 사건이 서로 영향을 미치지 않고, 한 사건의 발생 여부가 다른 사건에 아무런 정보를 제공하지 않음
- 배반사건: 두 사건 A와 B가 동시에 발생할 수 없는 경우
- 확률변수와 확률분포
- 확률변수: 어떤 확률 실험이나 상황에서 발생할 수 있는 각각의 결과를 수치적으로 표현하는 변수
- 확률분포: 확률변수가 특정값들을 가질 확률을 나타내는 함수 또는 규칙
- 이산확률분포
- 이산형 확률변수: 사건의 확률이 그 사건들이 속한 점들의 확률합으로 표현할 수 있는 확률변수
- 베르누이 분포: 확률 변수가 0 또는 1 두개의 결과만 갖는 분포
- 이항분포: N번의 베르누이 시행에서 K번 성공할 확률의 분포
- 기하분포: 성공확률이 p인 베르누이 시행에서 첫 성공이 있기까지 k번 실패할 확률
- 포아송 분포: 시간과 공간 내에서 발생하는 사건의 발생 횟수에 대한 확률 분포
- 연속확률분포
- 연속형 확률변수: 가능한 값이 실수의 어느 특정구간 전체에 해당하는 확률변수
- 균일분포: 모든 확률변수 X가 균일한 확률을 가지는 분포
- 정규분포: 평균과 표준편차에 의해서 모양이 결정
- t-분포: 표본으로부터 모집단의 평균에 대한 추정을 할 때 사용(0을 중심으로 좌우가 동일)
- 카이제곱 분포: 표준정규분포를 따르는 확률변수들의 제곱을 합한 분포
- F분포: 두 집단간 분산의 동일성 검정에 사용되는 검정 통계량의 분포(확률변수는 항상 양의 값)
할게 너무 많은 느낌...
부스트 클래스 듣고 ADsP하다가
하루가 끝났다....
'Data > [스파르타 내일배움캠프]' 카테고리의 다른 글
[TIL]본캠프 9일차 (1) | 2024.04.25 |
---|---|
[TIL]본캠프 8일차 (2) | 2024.04.24 |
[TIL]본캠프 6일차 (2) | 2024.04.22 |
[WIL]본캠프 1주차 (3) | 2024.04.19 |
[TIL]본캠프 5일차 (4) | 2024.04.19 |