- iloc
- 행 번호 및 열 번호를 통해 특정 행과 열 데이터를 선택할 수 있음
- data.iloc[행 번호, 열 번호]
import pandas as pd
# 샘플 데이터프레임 생성
data = {
'A': [1, 2, 3, 4, 5],
'B': [10, 20, 30, 40, 50],
'C': [100, 200, 300, 400, 500]
}
df = pd.DataFrame(data)
# iloc을 사용하여 특정 행과 열 선택
selected_data = df.iloc[1:4, 0:2] # 인덱스 1부터 3까지의 행과 0부터 1까지의 열 선택
print(selected_data)
- loc
- 번호가 아닌 이름으로 선택하는 경우(인덱스가 특정 문자일 경우)
- data.loc['행 이름','열 이름']
- 리스트 슬라이싱을 활용해서 선택 가능
- 여러 컬럼을 선택할 때, 컬럼 순서 변경 가능
import pandas as pd
# 샘플 데이터프레임 생성
data = {
'A': [1, 2, 3, 4, 5],
'B': [10, 20, 30, 40, 50],
'C': [100, 200, 300, 400, 500]
}
df = pd.DataFrame(data, index=['a', 'b', 'c', 'd', 'e'])
# loc을 사용하여 특정 행과 열 선택
selected_data = df.loc['b':'d', 'A':'B'] # 레이블 'b'부터 'd'까지의 행과 'A'부터 'B'까지의 열 선택
print(selected_data)
- 불리언 인덱싱
- 조건을 이용하여 특정 조건을 만족하는 행을 선택하는 방법
- 조건식에 따라 각 행이 True 또는 False로 평가되며 이를 바탕으로 데이터 프레임을 필터링
#나이가 30세 이상인 행 필터링
df[df['age']>=30]
#여러 조건을 조합한 복합적인 필터링(30세 이상 남자 필터링)
df[(df['age']>=30)&(df['gender']=='male')]
#조건에 만족하는 특정 열만 선택(30세 이상의 이름)
df.loc[df['age']>=30, 'name']
#isin()활용(성별이 'male' 또는 'female'인 경우)
df[df['gender'].isin(['male','female'])]
판다스를 이용한 전처리:)
그래도 이전에 조금 해본거라
이 부분은 할만한 느낌이다.그래도 계속 복습해야할 듯!!!
'Data > [스파르타 내일배움캠프]' 카테고리의 다른 글
[WIL]본캠프 4주차 (1) | 2024.05.10 |
---|---|
[TIL]본캠프 18일차 (1) | 2024.05.10 |
[TIL]본캠프 16일차 (2) | 2024.05.07 |
[WIL]본캠프 3주차 (2) | 2024.05.03 |
[TIL]본캠프 15일차 (2) | 2024.05.03 |