본문 바로가기

BLOG/데이터분석

[데이터분석] 데이터프레임 : 특정 조건 만족하는 행 추출 & 해당 인덱스 반환

 

데이터 프레임으로 데이터 분석을 할 때, 특정 조건을 만족하는 행을 추출하거나, 조건을 만족하는 행의 인덱스 번호를 반환시킬 수 있는데요, 아래 코드를 보면서 설명하도록 하겠습니다.

 

 

1. 특정 조건 만족하는 행 추출하기

먼저, 아래와 같이 음료와 관련한 데이터프레임이 있다고 가정해보겠습니다.

 

	temp	item	count	price	rating
0	hot	coffee	1	3000	4.5
1	ice	juice	5	4000	3.0
2	ice	ade	2	5000	4.0
3	hot	milk	1	3000	2.5
4	hot	tea	3	4000	3.0
5	ice	water	2	1000	4.5

 

만약 이 데이터 프레임에서 'price' 칼럼의 데이터가 4000 이상인 행만 추출해서 보고 싶다면 다음과 같이 코드를 입력하면 됩니다.

 

df[df['price'] >= 4000]

 

	temp	item	count	price	rating
1	ice	juice	5	4000	3.0
2	ice	ade	2	5000	4.0
4	hot	tea	3	4000	3.0

 

그 결과, price 데이터가 4000 이상인 행만 잘 출력되었음을 볼 수 있습니다.

 

 

2. 특정 조건 만족하는 행의 인덱스 반환하기

한편, index 모듈을 사용하면 특정 조건에 만족하는 행의 인덱스 번호를 반환할 수 있는데요, 위 코드에서 뒤에 index만 추가로 입력하면 됩니다.

 

df[df['price'] >= 4000].index

 

Int64Index([1, 2, 4], dtype='int64')

 

실행 결과, 조건을 만족했던 행의 인덱스 번호가 맞게 잘 반환되었음을 알 수 있습니다.