728x90 Data/[스파르타 내일배움캠프]112 [TIL]본캠프 41일차 #딥러닝을 이용한 MNIST 데이터를 분류import tensorflow as tffrom tensorflow.keras.datasets import mnistfrom tensorflow.keras.models import Sequentialfrom tensorflow.keras.layers import Dense, Flattenfrom tensorflow.keras.optimizers import Adamfrom tensorflow.keras.utils import to_categorical# 데이터 로드 및 전처리(X_train, y_train), (X_test, y_test) = mnist.load_data()X_train, X_test = X_train / 255.0, X_test / 255.0y.. 2024. 6. 14. [TIL]본캠프 40일차 경사하강법특성이 많고 데이터 갯수가 많을 때 적합한 방법기울기를 이용해서 파라미터를 학습하며 사이킷런에 내장되어있음오차를 최소화하는 방향으로 학습learning rate(step size): 학습 시 step의 사이즈로 적당한 값을 가지는게 중요(처음엔 크게, 나중엔 작게)오차의 종류들: MSE(이상치에 민감), MAE, RMSE(R-squared는 추가적인 지표가 필요할 때 사용)경사하강법의 종류Batch: 학습 데이터 전부 다 기울기를 구하는 것SGD: 랜덤으로 1개만 골라서 기울기를 구하는 것(불안정)Mini-Batch: 학습 데이터 일부에 대해서 묶어 기울기를 구하는 것앙상블기법여러 모델의 예측을 결합하여 보다 정확한 예측을 도출하는 기법배깅(Bagging): 훈련 데이터에서 무작위로 뽑아서(중복.. 2024. 6. 13. [TIL]본캠프 39일차 머신러닝 모델의 성능 평가머신러닝 모델을 평가하고 선택하는 기준을 정하는 것은 중요다양한 평가지표와 방법이 존재분류모델: 정확도, 정밀도, 리콜, F1점수 등회귀모델: 평균 제곱 오차, R-제곱 등한 데이터 세트의 성능이 높다고 다른 데이터 세트의 성능도 높은 것이 아님→교차검증 필요모델의 해석 가능성, 복잡성 및 계산 비용 등 다른 요소도 고려해야 함교차 검증(Cross Validation)데이터를 학습 세트와 테스트 세트로 나눔학습 세트를 이용해 모델을 학습테스트 세트를 이용해 모델을 평가위 과정은 여러 번 반복 가능하며, 모든 반복에 걸친 모델의 평균 성능을 전체 성능의 척도로 사용KNN(K-Nearest Neighbors)주변의 K개의 가장 가까운 데이터들의 범주를 기반으로 예측(다수결로 분류를 .. 2024. 6. 12. [TIL]본캠프 38일차 지도 학습과 비지도 학습지도 학습: 정답이 있는 데이터(Labelled data)를 활용해 훈련 및 학습-결과에 대한 예측비지도 학습: 정답이 없는 데이터(Unlabelled data)를 활용해 훈련 및 학습-패턴 분석 및 그룹화지도 학습과 비지도 학습 이외에 강화 학습 또한 존재지도 학습과 비지도 학습 모두 '데이터 분석가의 주관' 개입이 필요데이터의 구조나 사용 분야에 맞게 적합한 방식을 선택하는 것이 중요지도학습분류와 회귀로 나뉘며, 회귀 모델은 연속형 값을 예측값으로 출력하며 분류 모델은 이산형 값을 출력선형회귀, 로지스틱 회귀, K-최근접 이웃, 랜덤 포레스트 등이 많이 사용됨비지도 학습군집화와 차원 축소로 나뉘지만, 현업에서 두가지가 연결되어 진행됨기간 선정→K값, 초키 컬럼 선정 →이상치 기.. 2024. 6. 11. 이전 1 ··· 10 11 12 13 14 15 16 ··· 28 다음 728x90