본문 바로가기

BLOG/데이터분석

[데이터분석] 데이터프레임 : 한 칼럼(열)에 특정한 값 있는지 조회하는 방법

 

데이터프레임에서 한 칼럼에 특정한 데이터가 있는지 확인할 수 있는데요,

먼저 아래와 같은 데이터프레임(df)이 있다고 가정해보겠습니다.

 

	item	count	price	rating
0	coffee	1	3000	4.5
1	juice	5	4000	3.0
2	ade	2	5000	4.0
3	milk	1	3000	2.5
4	tea	3	4000	3.0
5	water	2	1000	4.5

 

위 데이터프레임은 데이터의 양이 많지 않아서 한눈에 다 들어오지만 모른다 가정할 때,

'item' 칼럼에 'milk' 라는 데이터가 있는지 확인하는 코드는 다음과 같습니다.

 

df['item'] == 'milk'

 

df['칼럼명'] == '찾을 데이터' 와 같이 입력하면 아래와 같이 출력되는데요, 해당하는 값이 있으면 True, 없으면 False를 반환합니다.

 

0    False
1    False
2    False
3     True
4    False
5    False
Name: item, dtype: bool

 

 

한편, 데이터가 너무 많다면 일일이 True가 어디에 있는지 확인해야 하는데요, 아래 코드처럼 sum() 함수를 이용하여 개수만 나타낼 수 있답니다.

 

is_milk = df['item'] == 'milk'
print(is_milk.sum())

 

달라진 코드가 있다면 True/False 여부를 'is_milk' 라는 변수에 저장했고, 이를 sum() 함수를 통해 True가 몇 개 있는지 나타내도록 하였습니다. 이러한 방법을 사용하면 데이터가 많은 데이터프레임에서도 쉽게 해당 값을 조회할 수 있답니다.