본문 바로가기

Data/[스파르타 내일배움캠프]

[TIL]본캠프 15일차

by MIN_JOON 2024. 5. 3.

데이터 마이닝
- 거대한 양의 데이터 속에서 유용한 정보를 찾아내는 과정
- 숨겨진 규칙, 패턴 등을 찾아내어 예측하거나 의사결정에 활용
- 통계분석과 달리 굳이 가설과 검정을 하지 않아도 됨,
- 궁극적으로 인사이트를 얻어 이를 활용하는 것이 목적
지도학습
- 알고리즘에게 입력 데이터와 그에 대한 정답을 제공하여 모델을 훈련시키는 것
- 손글씨 이미지를 입력하고 새로운 사진을 통해 어떤 숫자인지 판별하는 경우

분류(범주형)	의사결정나무(분류트리모형)
	인공신경망(Artificial Neural Network,ANN)
	로지스틱 회귀분석
	앙상블 모형
	SVM(Support Vector Machine)
	나이브 베이즈 분류
	K-NN(K-Nearest Neighborhood)
회귀(연속형)	의사결정나무(회귀트리모형)
	인공신경망(Artificial Neural Network,ANN)
	선형회귀분석
	SVR(Support Vector Regression)
	릿지(Ridge)
	라쏘(Lasso)

비지도 학습
- 지도학습과 달리 정답을 제공하지 않고 학습하는 방식
- 정답 레이블이 없는 데이터에서 패턴이나 구조를 찾는 머신러닝 방법
- 정확한 정답은 정의할 수 없지만 비슷한 특징끼리 군집화를 실시

군집	군집분석(K-Means Clustering)
	SOM(Self Organizing Map)
	DBSCAN(밀도 기반 군집)
	병합 군집
	계층 군집
연관	Apriori
차원축소	PCA(주성분 분석)
	LDA(선형판별분석)
	SVD(특이값 분해)
	MDS(다차원 척도법)

데이터 마이닝의 기능
- 분류(Classification): 가장 많이 사용되는 작업으로 대표적인 지도학습, 새롭게 나타난 현상을 기존의 집합에 배정
- 추정(Estimation): 연속된 변수의 값을 추정하는데 사용
- 예측(Prediction): 미래의 양상을 예측하거나 추정한다는 것을 제외하면 분류, 추정과 동일
- 연관분석(Association Analysis): 데이터의 연관성을 파악
- 군집(Clustering): 이질적인 모집단을 동질성을 지닌 그룹별로 세분화하는 것
- 기술(Description): 데이터가 가진 의미를 기술, 설명이 가능해야 하며 답을 찾을 수 있어야 함

이번 주 마무리~~~

연휴에 조금만 쉬고

또 할거 열심히 해야겠다

'Data > [스파르타 내일배움캠프]' 카테고리의 다른 글

[TIL]본캠프 16일차 (2)	2024.05.07
[WIL]본캠프 3주차 (2)	2024.05.03
[TIL]본캠프 14일차 (3)	2024.05.02
[TIL]본캠프 13일차 (2)	2024.05.01
[TIL]본캠프 12일차 (0)	2024.04.30

티스토리툴바