본문 바로가기
728x90

Data/[스파르타 내일배움캠프]112

[TIL]본캠프 31일차 귀무가설기존의 통념으로 기각할 것을 목적으로 하는 가설(기본값에 가까움)대립가설새롭게 입증, 주장하고자 하는 것귀무가설일 틀렸을 데이터로 증명하려는 가설가설의 검정가설을 검정할 수 있는 통계량을 생성(상품 구매량 평균 등)통계량이 따르는 분포 확인(정규분포 등)검정을 위한 하나의 검정 통계량(Test Statistics) 생성(x_diff:두 집단의 평균의 차이/표준편차 등)귀무가설로 x_diff가 0임을 가정이 때의 검정 통계량이 귀무가설에서 가정한 것보다 지나치게 크거나 작을 경우(p-value로 판단) 귀무가설을 기각p-value귀무가설이 정확하다는 가정 하에서 관찰된 결과만큼 극단적인 검정 결과를 얻을 확률일반적으로 p-value가 연구를 시작할 때 세운 수치보다 작으면 귀무가설이 틀렸다고 생각통.. 2024. 5. 30.
[TIL]본캠프 30일차 확률분포실제로 볼 수 있는 일부 확률의 케이스들을 체계적으로 정리한 것베르누이 분포, 이항 분포, 정규 분포(가우스 분포) 등각 분포는 명확한 수식으로 정의됨중심 극한 정리독립적이고 동일한 분포를 갖는 확률 변수의 경우 표본 평군의 분포가 정규 분포를 따르는 경향이 존재표본의 분포가 아닌 표본 평균의 분포임을 기억할 것!!정규 분포를 이용하면 원래의 분포와 상관 없이 평균에 대한 통계 모델을 만들 수 있음t-test검정 통계량이 정규 분포를 따르며 분포와 관련된 변수값들이 알려졌을 때 사용두 데이터 집단의 평균이 서로 유의하게 다른지 여부를 판별할 수 있음이는 낮은 p-value(0.05이하)로 확인할 수 있음 2024. 5. 29.
[TIL]본캠프 29일차 퍼널 분석(Funnel Analysis)소비자의 행동을 기업 관점에서 재구성고객이 유입되어 전환에 이르는 단계를 수치로 확인하고 분석서비스, 분석 도메인에 따라 퍼널은 다양하게 이루어질 수 있음어떻게 퍼널의 각 단계를 정의하고 최적화할 수 있는지를 아는 것이 중요퍼널 단계 세우기서비스의 BM(Business Model)을 파악: 수익을 어떻게 극대화? 서비스가 매출을 어떻게 내는데? 수익 vs 지출?BM을 고려해 핵심 지표와 퍼널 스텝을 설계이탈률이 큰 단계를 중심으로 퍼널 재설계 가능퍼널별 전환율을 체크하고 최적화: 진입률을 높일까? 전환율을 높일까?확률고전적 확률: 어떤 사건이 발생할 경우의 수/전체 경우의 수(모든 경우의 수가 동일한 확률을 가진다는 가정)통계적 확률: 어떤 시행을 N번 반복할 때,.. 2024. 5. 28.
[TIL]본캠프 28일차 벡터숫자를 원소로 가지는 리스트 또는 배열공간에서 한 점을 의미(원점으로부터 상대적 위치)같은 형태를 가지는 경우 덧셈, 뺄셈, 성분곱 가능숫자를 곱해줄 경우 길이만 변함(스칼라곱)노름(Norm)벡터의 원점으로부터의 기하학적 거리L1: 변화량의 절댓값L2: 유클리드 거리(피타고라스의 법칙 이용)L2 노름을 이용해 벡터 사이의 각도를 계산할 수 있음행렬벡터를 원소로 가지는 2차원 배열행과 열이라는 인덱스를 가짐특정행을 고정할 경우 행벡터, 특정열을 고정할 경우 열벡터벡터가 한 점이라면 행렬은 공간에 존재하는 여러 점들을 의미모양이 같은 경우 덧셈,뺄셈이 가능행렬곱을 이용해 벡터를 다른 차원의 공간으로 보내는 것이 가능역행렬어떤 행렬의 연산을 거꾸로 되돌리는 행렬행과 열 숫자가 같고 행렬식(determina.. 2024. 5. 27.
728x90