본문 바로가기
728x90

Data/[스파르타 내일배움캠프]112

[TIL]본캠프 21일차 MySQL의 POW 함수POW(A,B)A를 B만큼 제곱한 값을 반환POW(2,4) = 16read_csv함수의 headerread_csv 함수는 첫 행을 header(열이름)로 지정해서 불러옴 header를 통해 첫 행을 열 이름으로 지정할 것인지 설정'infer'가 기본값'None'이나 0으로 설정할 경우 열 이름으로 지정하지 않음Pandas의 rangeindex0부터 시작해서 순서대로 index가 설정되는 경우range함수처럼 시작값과 끝값, 간격을 설정해줄 수 있음pd.RangeIndex(start=10, end=20, step=2)데이터프레임에 많은 데이터가 담길 경우, 숫자가 커질 수 있기 때문에 호출 시 출력enumerate 함수인덱스와 원소로 이루어진 튜플을 생성해주는 함수for 반복문을 사.. 2024. 5. 16.
[TIL]본캠프 20일차 isna()데이터 프레임 내의 결측값 판단 메서드결측값이면 True, 결측값이 아니라면 False를 반환notna()의 경우, 결측값이면 False, 결측값이 아니라면 True를 반환isna().sum()을 통해 결측값의 갯수 확인dropna()결측값 제거 함수dropna(how=' ', axis=' ')how: any_하나라도 결측치가 존재하면 제거, all_행이 모두 결측치여야 제거axis: 0(행), 1(열), 0이 기본값fillna()결측값을 채워주는 함수#결측치 제거iris_dropna=iris_with_nan.dropna(subset='Sepal Width')#결측치를 평균값으로 대체iris_fillna=iris_with_nan.fillna(iris['Sepal Width'].mean())#결.. 2024. 5. 14.
[TIL]본캠프 19일차 isin()데이터 프레임 객체의 각 요소가 values값과 일치하는지 여부를 불리언 형식으로 반환df.isin(values)values에 시리즈나 데이터 프레임 등 다양한 형식이 올 수 있음→시리즈인 경우: Index가 일치해야함→데이터 프레임인 경우: Index와 열 레이블이 일치해야함→딕셔너리인 경우: key값이 열 레이블Matplotlibplot(): 2차원 데이터를 시각화하기 위해 사용color, linestyle, marker 등의 파라미터를 사용 가능lifestyle: '-' 실선, '--' 대시선, ':' 점선, '-.' 점-대시 선 등으로 지정marker: '원', '^' 삼각형, 's' 사각형, '+' 플러스, 'x' 엑스 legend(): 그래프의 범례를 추가set_xlabel(): x.. 2024. 5. 13.
[WIL]본캠프 4주차 일주일 동안 뭐했지?데이터 전처리 및 시각화 수강네이버 부스트클래스 코드리뷰 1차 제출SQL 코드카타 진행ADsP 복습FEELINGS🧐 휴일이 있기도 했고 ADsP 공부 때문에 이것저것 집중을 못한 느낌이다. 근데 정작 ADsP는 공부를 많이 못한 것 같아서 아쉽고 시험도 자신이 없는 느낌...그래도 일단 잘 마무리 해보는 걸로!!!!FINDINGS🔎 이전에는 seaborn 패키지를 통해 시각화하는 것에 더 익숙했는데 matplotlib을 배우게 되면서 다양한 방식으로 시각화가 가능해진 것 같다. 더불어 부스트클래스 복습을 통해 머신러닝에 계속 익숙해지는 중:)FUTURE✨ ADsP 마무리하고 다음주부터는 집중을 더 할 수 있도록 해야겠다.....그리고 다음주 금요일부터는 기초 프로젝트 시작!!! 2024. 5. 10.
728x90