본문 바로가기
Data/[스파르타 내일배움캠프]

[TIL]본캠프 17일차

by MIN_JOON 2024. 5. 9.
  • iloc
    • 행 번호 및 열 번호를 통해 특정 행과 열 데이터를 선택할 수 있음
    • data.iloc[행 번호, 열 번호]
import pandas as pd

# 샘플 데이터프레임 생성
data = {
    'A': [1, 2, 3, 4, 5],
    'B': [10, 20, 30, 40, 50],
    'C': [100, 200, 300, 400, 500]
}
df = pd.DataFrame(data)

# iloc을 사용하여 특정 행과 열 선택
selected_data = df.iloc[1:4, 0:2]  # 인덱스 1부터 3까지의 행과 0부터 1까지의 열 선택
print(selected_data)
  • loc
    • 번호가 아닌 이름으로 선택하는 경우(인덱스가 특정 문자일 경우)
    • data.loc['행 이름','열 이름']
    • 리스트 슬라이싱을 활용해서 선택 가능
    • 여러 컬럼을 선택할 때, 컬럼 순서 변경 가능
import pandas as pd

# 샘플 데이터프레임 생성
data = {
    'A': [1, 2, 3, 4, 5],
    'B': [10, 20, 30, 40, 50],
    'C': [100, 200, 300, 400, 500]
}
df = pd.DataFrame(data, index=['a', 'b', 'c', 'd', 'e'])

# loc을 사용하여 특정 행과 열 선택
selected_data = df.loc['b':'d', 'A':'B']  # 레이블 'b'부터 'd'까지의 행과 'A'부터 'B'까지의 열 선택
print(selected_data)
  • 불리언 인덱싱
    • 조건을 이용하여 특정 조건을 만족하는 행을 선택하는 방법
    • 조건식에 따라 각 행이 True 또는 False로 평가되며 이를 바탕으로 데이터 프레임을 필터링
#나이가 30세 이상인 행 필터링
df[df['age']>=30]

#여러 조건을 조합한 복합적인 필터링(30세 이상 남자 필터링)
df[(df['age']>=30)&(df['gender']=='male')]

#조건에 만족하는 특정 열만 선택(30세 이상의 이름)
df.loc[df['age']>=30, 'name']

#isin()활용(성별이 'male' 또는 'female'인 경우)
df[df['gender'].isin(['male','female'])]

판다스를 이용한 전처리:)

그래도 이전에 조금 해본거라 

이 부분은 할만한 느낌이다.그래도 계속 복습해야할 듯!!!

'Data > [스파르타 내일배움캠프]' 카테고리의 다른 글

[WIL]본캠프 4주차  (1) 2024.05.10
[TIL]본캠프 18일차  (1) 2024.05.10
[TIL]본캠프 16일차  (2) 2024.05.07
[WIL]본캠프 3주차  (2) 2024.05.03
[TIL]본캠프 15일차  (2) 2024.05.03