- FLOOR함수,CEIL 함수
- FLOOR 함수: 소숫점 아래를 무조건 버리는 함수
- floor(5.3) = 5
- CEIL 함수: 소숫점 아래에서 무조건 올리는 함수
- CEIL(99.2) = 100
- 이상치 처리
- 특정 범위 혹은 이상치를 Null값으로 처리
- 해당 Null 값을 평균값, 최빈값들로 대치하여 처리
- np.where를 통해 조건에 맞는 값들을 Null로 바꿀 수 있음
#특정값 Null 처리 예시
#0과 28 사이를 제외하고 모든 값을 Null로 처리
bank['Num_of_Delayed_Payment']=np.where(bank['Num_of_Delayed_Payment'] > 28, 0, np.where(bank['Num_of_Delayed_Payment']<0,0,bank['Num_of_Delayed_Payment']))
- fillna()를 통한 결측치 처리
- 해당 함수를 통해 결측치를 특정값으로 채워 넣을 수 있음
- 또한 method를 통해 바로 뒤에 오는 행이나 앞에 오는 행의 값으로 채워 넣을 수 있음
#fillna() 예시
df.fillna(df.mean()) #결측치를 각 열의 평균값으로 대체
df.fillna(0) #결측치를 0으로 대체
df.fillna(method='bfill') #결측치를 다음 행의 값으로 대체(bfill 대신 backfill도 가능)
df.bfill() #method='bfill'과 동일(.backfill()도 동일)
df.fillna(method='pad') #결측치를 앞 행의 값으로 대체('ffill'도 동일)
df.ffill() #method='ffill'과 동일(.pad()도 가능)
기초 프로젝트 2일차
전처리가 얼추 마무리!!!
전처리는 할 때마다 빡센 느낌...😭😭
'Data > [스파르타 내일배움캠프]' 카테고리의 다른 글
[TIL]본캠프 25일차(기초 프로젝트 4일차) (1) | 2024.05.22 |
---|---|
[TIL]본캠프 24일차(기초 프로젝트 3일차) (1) | 2024.05.21 |
[WIL]본캠프 5주차 (1) | 2024.05.17 |
[TIL]본캠프 22일차(기초 프로젝트 1일차) (1) | 2024.05.17 |
[TIL]본캠프 21일차 (1) | 2024.05.16 |