728x90 내일배움캠프111 [TIL]본캠프 24일차(기초 프로젝트 3일차) Window Function행과 행 간의 관계를 정의하기 위해 사용순위, 합계, 평균, 행 위치 등을 조작할 수 있음집계의 경우를 제외하고 GROUP BY와 병행하여 사용하지는 않음집계를 제외하고 결과 건수가 줄어들지 않기 때문에 행을 모두 살리고 싶을 때 사용row_number() over중복순위 없이 순서대로 숫자를 부여해줌무조건 줄 세우기1,2,3,4.....dense_rank() over중복순위가 존재하며 동점자 이후에도 바로 다음 순위를 부여(1등이 두명이라도 뒤에 바로 2등으로 부여)rank() over중복순위가 존재하며 동점자 이후에는 중간 순위를 비운 값이 출력(1등이 두명이라면 뒤에는 3등 부여)FIRST_VALUE()와 LAST_VALUE()파티션 별로 가장 먼저 나온 값과 가장 마지막.. 2024. 5. 21. [TIL]본캠프 23일차(기초 프로젝트 2일차) FLOOR함수,CEIL 함수FLOOR 함수: 소숫점 아래를 무조건 버리는 함수floor(5.3) = 5CEIL 함수: 소숫점 아래에서 무조건 올리는 함수CEIL(99.2) = 100이상치 처리특정 범위 혹은 이상치를 Null값으로 처리해당 Null 값을 평균값, 최빈값들로 대치하여 처리np.where를 통해 조건에 맞는 값들을 Null로 바꿀 수 있음#특정값 Null 처리 예시#0과 28 사이를 제외하고 모든 값을 Null로 처리bank['Num_of_Delayed_Payment']=np.where(bank['Num_of_Delayed_Payment'] > 28, 0, np.where(bank['Num_of_Delayed_Payment']fillna()를 통한 결측치 처리해당 함수를 통해 결측치를 특정값.. 2024. 5. 20. [WIL]본캠프 5주차 일주일 동안 뭐했지?데이터 전처리 및 시각화 과제기초 프로젝트 시작SQL 코드카타 진행부스트 클래스 정리FEELINGS🧐 학습주간 마무리하고 이제 기초 프로젝트 시작하는 주간..!은행 고객데이터 분석을 주제로 선정했는데 익숙치 않은 도메인이라 어려운 느낌이다....ㅠ그래도 힘을 내서 잘 해보는 걸로...!아 그리고 ADsP 대실패FINDINGS🔎 데이터 전처리는 꽤나 오랜 시간을 들여야하고 가장 고된 분석 과정!!!!!!어떻게 처리할지 계속 고민해보고 다른 좋은 방법이 있는지도 고민해볼 것.FUTURE✨다음주 금요일까지 기초 프로젝트 마무리하고 피드백 정리!!!!!!!!!부스트 클래스 2차 코드리뷰도 진행!!!!!할거 짱 많다!!!!!!!!!! 2024. 5. 17. [TIL]본캠프 22일차(기초 프로젝트 1일차) 파이썬 replace 함수대상 문자열에서 검색 문자를 지정하여 일치하는 문자가 있으면 원하는 문자로 교체replace('검색 문자열','치환 문자열')검색하는 문자열이 완전히 일치해야 치환일부만 일치해도 바꾸고 싶다면 str.replace()함수를 사용inplace옵션이 True일 경우 원본 데이터도 변경데이터프레임['컬럼명'].str.replace('검색 문자열','대체 문자열)#예시bank['Age'].str.replace('_','') #언더바 삭제판다스를 이용한 최빈값 구하기mode: 대상 행/열의 최빈값을 구하는 메서드df.mode(axis=0, numeric_only=False , dropna=True)axis: 최빈값을 구할 축numeric_only: True일 경우 숫자, 소수, 부울값.. 2024. 5. 17. 이전 1 ··· 15 16 17 18 19 20 21 ··· 28 다음 728x90