본문 바로가기

BLOG/데이터분석

[데이터분석] 데이터프레임 : 특정 문자열 또는 데이터가 있는 행 출력하기 - contains()

 

데이터프레임에서 특정 문자열이나 다른 데이터가 있는 행만 따로 출력되어서 보이도록 하려면 어떻게 해야 할까요?

바로, 이를 도와주는 함수가 contains() 이라는 함수인데요, contains() 함수를 이용해서 특정 텍스트 또는 텍스트열이 있는 행만 출력할 수 있답니다. 

 

아래의 코드를 보면서 자세히 설명하도록 하겠습니다.

 

 

- contains() : 특정 문자 또는 문자열이 포함된 데이터 찾기

먼저, 아래와 같은 데이터프레임이 있다고 가정해보겠습니다.

 

# <df>
	item		price	count
0	ice water	1000	1
1	milk		2000	5
2	ice coffee	3000	2
3	ade		4000	1
4	latte		5000	3
5	ice tea		6000	2

 

만약 이 데이터프레임의 'item' 칼럼에서 'ice'라는 문자열이 포함되어 있는 데이터를 찾고, 그 데이터가 있는 행을 출력하고 싶다면 다음과 같이 코드를 입력하면 됩니다.

 

df[df['item'].str.contains('ice')]

 

# output :

	item		price	count
0	ice water	1000	1
2	ice coffee	3000	2
5	ice tea		6000	2	

 

코드 실행 결과, 'ice'가 들어간 데이터가 포함된 행만 출력되었음을 확인할 수 있답니다.