본문 바로가기
728x90

데이터분석가155

[TIL]본캠프 23일차(기초 프로젝트 2일차) FLOOR함수,CEIL 함수FLOOR 함수: 소숫점 아래를 무조건 버리는 함수floor(5.3) = 5CEIL 함수: 소숫점 아래에서 무조건 올리는 함수CEIL(99.2) = 100이상치 처리특정 범위 혹은 이상치를 Null값으로 처리해당 Null 값을 평균값, 최빈값들로 대치하여 처리np.where를 통해 조건에 맞는 값들을 Null로 바꿀 수 있음#특정값 Null 처리 예시#0과 28 사이를 제외하고 모든 값을 Null로 처리bank['Num_of_Delayed_Payment']=np.where(bank['Num_of_Delayed_Payment'] > 28, 0, np.where(bank['Num_of_Delayed_Payment']fillna()를 통한 결측치 처리해당 함수를 통해 결측치를 특정값.. 2024. 5. 20.
[WIL]본캠프 5주차 일주일 동안 뭐했지?데이터 전처리 및 시각화 과제기초 프로젝트 시작SQL 코드카타 진행부스트 클래스 정리FEELINGS🧐 학습주간 마무리하고 이제 기초 프로젝트 시작하는 주간..!은행 고객데이터 분석을 주제로 선정했는데 익숙치 않은 도메인이라 어려운 느낌이다....ㅠ그래도 힘을 내서 잘 해보는 걸로...!아 그리고 ADsP 대실패FINDINGS🔎 데이터 전처리는 꽤나 오랜 시간을 들여야하고 가장 고된 분석 과정!!!!!!어떻게 처리할지 계속 고민해보고 다른 좋은 방법이 있는지도 고민해볼 것.FUTURE✨다음주 금요일까지 기초 프로젝트 마무리하고 피드백 정리!!!!!!!!!부스트 클래스 2차 코드리뷰도 진행!!!!!할거 짱 많다!!!!!!!!!! 2024. 5. 17.
[TIL]본캠프 22일차(기초 프로젝트 1일차) 파이썬 replace 함수대상 문자열에서 검색 문자를 지정하여 일치하는 문자가 있으면 원하는 문자로 교체replace('검색 문자열','치환 문자열')검색하는 문자열이 완전히 일치해야 치환일부만 일치해도 바꾸고 싶다면 str.replace()함수를 사용inplace옵션이 True일 경우 원본 데이터도 변경데이터프레임['컬럼명'].str.replace('검색 문자열','대체 문자열)#예시bank['Age'].str.replace('_','') #언더바 삭제판다스를 이용한 최빈값 구하기mode: 대상 행/열의 최빈값을 구하는 메서드df.mode(axis=0, numeric_only=False , dropna=True)axis: 최빈값을 구할 축numeric_only: True일 경우 숫자, 소수, 부울값.. 2024. 5. 17.
[TIL]본캠프 21일차 MySQL의 POW 함수POW(A,B)A를 B만큼 제곱한 값을 반환POW(2,4) = 16read_csv함수의 headerread_csv 함수는 첫 행을 header(열이름)로 지정해서 불러옴 header를 통해 첫 행을 열 이름으로 지정할 것인지 설정'infer'가 기본값'None'이나 0으로 설정할 경우 열 이름으로 지정하지 않음Pandas의 rangeindex0부터 시작해서 순서대로 index가 설정되는 경우range함수처럼 시작값과 끝값, 간격을 설정해줄 수 있음pd.RangeIndex(start=10, end=20, step=2)데이터프레임에 많은 데이터가 담길 경우, 숫자가 커질 수 있기 때문에 호출 시 출력enumerate 함수인덱스와 원소로 이루어진 튜플을 생성해주는 함수for 반복문을 사.. 2024. 5. 16.
728x90