본문 바로가기
728x90

분류 전체보기163

[TIL]본캠프 10일차 리스트 컴프리헨션리스트를 간결하게 생성하는 방법보통 반복문과 조건문을 사용하여 리스트를 생성코드를 간결하고 가독성 있게 만들어줌#리스트 컴프리헨션의 기본 구조[표현식 for 항목 in iterable if 조건문]lambda익명 함수로 이름없이 정의되는 간단한 함수이며 주로 한줄로 표현이름이 없기 때문에 임시로 필요한 경우에 사용함수가 짧고 명확한 경우에 유용#lambda 함수 예시square = lambda x: x**2print(square(5)) #출력:25glob파일 시스템에서 파일을 찾을 때 사용되는 유용한 도구파일 이름의 패턴 매칭을 통해 파일을 검색하고, 일치하는 파일들의 리스트 반환import glob#특정 확장자를 가진 파일 찾기file_list = glob.glob('sample_da.. 2024. 4. 26.
[1주차]4차시 Underfitting & OverfittingUnderfitting: 모델이 데이터를 설명하지 못함(학습 부족, 적은 데이터양 등)Overfitting: 모델이 Train set에서는 좋은 성능을 내지만 Validation set에서 낮은 성능을 내는 경우일반적으로 우리가 사용하는 데이터셋은 전체의 아주 작은 일부분(Sample dataset)Underfitting 방지더 많은 데이터로 더 오래 훈련피쳐를 더 많이 반영Variance가 높은 머신러닝 모델 사용Overfitting 제어Early stopping: 검증 데이터셋에 대한 오차가 증가하는 시점에서 학습을 조기종료(모델의 성능을 보장하지는 않음)Parameter norm penalty: 파라미터 값에 제약을 주어 모델의 복잡도를 낮추는 방법Da.. 2024. 4. 25.
[TIL]본캠프 9일차 input함수사용자로부터 키보드 입력을 받는 함수로 사용자와 상호작용하여 프로그램을 만들 수 있음#예시1: 이름 입력name = input("이름을 입력하세요: ")print("안녕하세요,", name, "님!")#예시2: 덧셈num1=int(input("첫 번째 숫자를 입력하세요: "))num2=int(input("두 번째 숫자를 입력하세요: "))sum=num1+num2print("두 숫자의 합은", sum, "입니다.")리스트 복습리스트: 대괄호를 사용하여 만들며 여러 항목들을 담을 수 있는 가변 시퀀스리스트 슬라이싱 구조: list[start:end:step] →주의할 점:파이썬은 인덱스가 0부터 시작, 슬라이싱 할 때 끝에 입력할 인덱스는 +1할 것(12번째까지라면 13 입력)my_list=[1.. 2024. 4. 25.
[1주차]3차시 데이터 전처리연속형- Scaling: 데이터의 단위 혹은 분포를 변경→선형기반의 모델(선형회귀, 딥러닝 등)인 경우 변수들 간의 스케일을 맞추는 것이 필수적→수치형 변수의 크기가 변수마다 다르다면 종속 변수에 미치는 영향력이 달라질 수 있음- Min-Max Scaling: 변수의 범위를 바꿔주는 정규화 스케일링이며 이상값 존재에 민감(회귀모델에 적합)- Standard Scaling: 데이터를 표준 정규 분포화시키는 z-score 정규화이며 이상값 존재에 민감(분류모델에 적합)- Binning: 연속형 변수를 범주형 변수로 바꾸는 것, Overfitting 방지범주형(일반적으로 문자형이기 때문에 수치형으로 인코딩)-One hot encoding: 1이나 0으로 인코딩(존재 or 존재하지 않음)-L.. 2024. 4. 24.
728x90