본문 바로가기

BLOG/데이터분석

[데이터분석] 데이터프레임 : 특정 칼럼만 조회하기

 

데이터프레임으로 데이터분석을 할 때, 칼럼이 너무 많다면 필요 없는 칼럼은 없애거나 필요한 칼럼만 조회해서 사용하는 것이 더 효율적일 수 있는데요, 원하는 특정 칼럼만 조회하는 방법은 매우 간단하답니다.

 

먼저, 아래와 같은 데이터프레임이 있다고 가정해보겠습니다.

 

import pandas as pd
df = pd.DataFrame(
    {'name': ['coffee', 'tea', 'juice','milk', 'ade'],
     'price': [3000, 4000, 5000, 2000, 5000],
     'rating': [4, 3.5, 3.7, 3, 2],
     'category': [1,2,3,4,4]})

 

	name	price	rating	category
0	coffee	3000	4.0	1
1	tea	4000	3.5	2
2	juice	5000	3.7	3
3	milk	2000	3.0	4
4	ade	5000	2.0	4

 

위 데이터프레임에서 만약 'name' 칼럼만 불러와 보고 싶다면 df['name'] 이라고 입력하면 됩니다.

 

df['name']

 

	name
0	coffee
1	tea
2	juice
3	milk
4	ade

 

반면, 2개 이상의 칼럼을 조회하고 싶다면 칼럼 이름들을 나란히 입력하면 되는데요, 이때 여러 개의 칼럼을 조회할 땐 df[['name', 'price']] 처럼 대괄호를 두 번씩 입력해주어야 합니다. 마치 df[ ] 안에 칼럼 이름들이 들어간 리스트가 입력된 것이라고 생각하면 기억하기 쉽습니다. 

아래 코드는 'name', 'price' 칼럼만 조회하는 코드입니다.

 

df[['name', 'price']]

# 위 결과와 동일
# list1 = ['name', 'price']
# df[list1]

 

	name	price
0	coffee	3000
1	tea	4000
2	juice	5000
3	milk	2000
4	ade	5000

 

출력된 결과를 보면 'name' 칼럼과 'price' 칼럼만 잘 조회되었음을 살펴볼 수 있습니다.

 

 

한편, 더 나아가 이를 응용하면 칼럼의 순서를 변경할 수도 있는데요, 만약 칼럼의 순서를 'category', 'name', 'rating', 'price' 순으로 변경하고 싶다면 다음과 같이 코드를 입력하면 된답니다.

 

new_df = df[['category','name','rating','price']]
display(new_df)

 

	category	name	rating	price
0	1	coffee	4.0	3000
1	2	tea	3.5	4000
2	3	juice	3.7	5000
3	4	milk	3.0	2000
4	4	ade	2.0	5000