본문 바로가기
728x90

분류 전체보기163

[TIL]본캠프 15일차 데이터 마이닝거대한 양의 데이터 속에서 유용한 정보를 찾아내는 과정숨겨진 규칙, 패턴 등을 찾아내어 예측하거나 의사결정에 활용통계분석과 달리 굳이 가설과 검정을 하지 않아도 됨,궁극적으로 인사이트를 얻어 이를 활용하는 것이 목적지도학습알고리즘에게 입력 데이터와 그에 대한 정답을 제공하여 모델을 훈련시키는 것손글씨 이미지를 입력하고 새로운 사진을 통해 어떤 숫자인지 판별하는 경우분류(범주형)의사결정나무(분류트리모형)인공신경망(Artificial Neural Network,ANN)로지스틱 회귀분석앙상블 모형SVM(Support Vector Machine)나이브 베이즈 분류K-NN(K-Nearest Neighborhood)회귀(연속형)의사결정나무(회귀트리모형) 인공신경망(Artificial Neural Net.. 2024. 5. 3.
[TIL]본캠프 14일차 기본 매개변수(Parameter default value)함수를 선언할 때부터 매개변수의 기본값을 설정해줄 수 있음인자값의 일부만 설정하는 것도 가능#기본값 설정 예시def sum(a,b): #기본값 설정X result=a+b return result def sum(a=2,b=3): #a,b 모두 기본값 설정(입력이 없다면 5 출력) result=a+b return result def sum(a=3,b): #일부만 기본값 설정(a에 입력값이 없다면 3으로 입력) result=a+b return result회귀분석한 변수와 하나 이상의 다른 변수 간의 관계를 모델링하고 설명하는 통계적 기법변수들이 일정한 경향성을 띤다는 것은 일정한 인과관계를.. 2024. 5. 2.
[TIL]본캠프 13일차 apply() 메서드객체의 열 또는 행에 대해 함수를 적용하게 해주는 메서드적용 방식: result=df.apply(func,axis=0,raw=False,result_type=None,*args=(),**kwds)func: 적용할 함수를 입력axis: 함수를 적용할 축을 지정(0이나 index=열에 따라 적용, 1이나 column: 행에 따라 적용,기본값:0)raw: False가 기본값이며 각 행이나 열을 함수로 적용하기 전에 Series로 바꿈, True인 경우 ndarray 객체로 입력result_type: reduce, broadcast, expand의 세가지 타입을 가지며 출력되는 데이터 타입을 조절*args: 함수에 입력되는 위치 입력변수(iterable한 자료형-리스트, 튜플 등)**kwds.. 2024. 5. 1.
[TIL]본캠프 12일차 그룹별 통계량 계산groupby 메서드를 이용해 데이터를 그룹화하여 연산할 수 있음df.groupby('그룹화할 칼럼명')과 같은 방식으로 사용.agg()를 이용하여 다중 통계량 계산 또한 가능 #예시(타이타닉 데이터 사용)#groupby 메서드 미사용df['Age'].mean().round(2) #테이블 내 평균 나이 계산(round 이용 가능)df['Sex'].value_counts() #성별에 따른 탑승객 수#groupby 메서드 사용df.groupby('Pclass',as_index=False).agg(Pclass_count=('Pclass','count')) #선실등급별 이용객 수딕셔너리 복습파이썬 딕셔너리는 키-값 쌍의 데이터를 저장, 중괄호{}로 둘러싸여 .. 2024. 4. 30.
728x90