본문 바로가기
Data/[스파르타 내일배움캠프]

[TIL]본캠프 23일차(기초 프로젝트 2일차)

by MIN_JOON 2024. 5. 20.
  • FLOOR함수,CEIL 함수
    • FLOOR 함수: 소숫점 아래를 무조건 버리는 함수
    • floor(5.3) = 5
    • CEIL 함수: 소숫점 아래에서 무조건 올리는 함수
    • CEIL(99.2) = 100
  • 이상치 처리
    • 특정 범위 혹은 이상치를 Null값으로 처리
    • 해당 Null 값을 평균값, 최빈값들로 대치하여 처리
    • np.where를 통해 조건에 맞는 값들을 Null로 바꿀 수 있음
#특정값 Null 처리 예시
#0과 28 사이를 제외하고 모든 값을 Null로 처리

bank['Num_of_Delayed_Payment']=np.where(bank['Num_of_Delayed_Payment'] > 28, 0, np.where(bank['Num_of_Delayed_Payment']<0,0,bank['Num_of_Delayed_Payment']))
  • fillna()를 통한 결측치 처리
    • 해당 함수를 통해 결측치를 특정값으로 채워 넣을 수 있음
    • 또한 method를 통해 바로 뒤에 오는 행이나 앞에 오는 행의 값으로 채워 넣을 수 있음
#fillna() 예시

df.fillna(df.mean())       #결측치를 각 열의 평균값으로 대체
df.fillna(0)               #결측치를 0으로 대체
df.fillna(method='bfill')  #결측치를 다음 행의 값으로 대체(bfill 대신 backfill도 가능)
df.bfill()                 #method='bfill'과 동일(.backfill()도 동일)
df.fillna(method='pad')    #결측치를 앞 행의 값으로 대체('ffill'도 동일)
df.ffill()                 #method='ffill'과 동일(.pad()도 가능)

기초 프로젝트 2일차

전처리가 얼추 마무리!!!

전처리는 할 때마다 빡센 느낌...😭😭