데이터 프레임으로 데이터 분석을 할 때, 특정 조건을 만족하는 행을 추출하거나, 조건을 만족하는 행의 인덱스 번호를 반환시킬 수 있는데요, 아래 코드를 보면서 설명하도록 하겠습니다.
1. 특정 조건 만족하는 행 추출하기
먼저, 아래와 같이 음료와 관련한 데이터프레임이 있다고 가정해보겠습니다.
temp item count price rating
0 hot coffee 1 3000 4.5
1 ice juice 5 4000 3.0
2 ice ade 2 5000 4.0
3 hot milk 1 3000 2.5
4 hot tea 3 4000 3.0
5 ice water 2 1000 4.5
만약 이 데이터 프레임에서 'price' 칼럼의 데이터가 4000 이상인 행만 추출해서 보고 싶다면 다음과 같이 코드를 입력하면 됩니다.
df[df['price'] >= 4000]
temp item count price rating
1 ice juice 5 4000 3.0
2 ice ade 2 5000 4.0
4 hot tea 3 4000 3.0
그 결과, price 데이터가 4000 이상인 행만 잘 출력되었음을 볼 수 있습니다.
2. 특정 조건 만족하는 행의 인덱스 반환하기
한편, index 모듈을 사용하면 특정 조건에 만족하는 행의 인덱스 번호를 반환할 수 있는데요, 위 코드에서 뒤에 index만 추가로 입력하면 됩니다.
df[df['price'] >= 4000].index
Int64Index([1, 2, 4], dtype='int64')
실행 결과, 조건을 만족했던 행의 인덱스 번호가 맞게 잘 반환되었음을 알 수 있습니다.
'BLOG > 데이터분석' 카테고리의 다른 글
[데이터분석] 데이터 프레임 - 새로운 행 추가하기 - loc[ ] (0) | 2021.03.11 |
---|---|
[데이터분석] 데이터프레임 : 특정 조건 만족하는 행 삭제하기 - drop() (0) | 2021.03.11 |
[데이터분석] 데이터프레입 : 중복된 행 삭제 - drop_duplicates (0) | 2021.03.11 |
[데이터분석] 데이터프레임 : 중복된 행 찾기 & 개수 - duplicated(), sum() (0) | 2021.03.11 |
[데이터분석] 데이터프레임 : 결측치 있는지 확인하기 & 칼럼별 개수 세기 - isnull(), isnull().sum() (0) | 2021.03.11 |