BLOG/데이터분석
[데이터분석] 데이터프레임 : 특정 칼럼만 조회하기
알디노
2021. 3. 10. 10:40
데이터프레임으로 데이터분석을 할 때, 칼럼이 너무 많다면 필요 없는 칼럼은 없애거나 필요한 칼럼만 조회해서 사용하는 것이 더 효율적일 수 있는데요, 원하는 특정 칼럼만 조회하는 방법은 매우 간단하답니다.
먼저, 아래와 같은 데이터프레임이 있다고 가정해보겠습니다.
import pandas as pd
df = pd.DataFrame(
{'name': ['coffee', 'tea', 'juice','milk', 'ade'],
'price': [3000, 4000, 5000, 2000, 5000],
'rating': [4, 3.5, 3.7, 3, 2],
'category': [1,2,3,4,4]})
name price rating category
0 coffee 3000 4.0 1
1 tea 4000 3.5 2
2 juice 5000 3.7 3
3 milk 2000 3.0 4
4 ade 5000 2.0 4
위 데이터프레임에서 만약 'name' 칼럼만 불러와 보고 싶다면 df['name'] 이라고 입력하면 됩니다.
df['name']
name
0 coffee
1 tea
2 juice
3 milk
4 ade
반면, 2개 이상의 칼럼을 조회하고 싶다면 칼럼 이름들을 나란히 입력하면 되는데요, 이때 여러 개의 칼럼을 조회할 땐 df[['name', 'price']] 처럼 대괄호를 두 번씩 입력해주어야 합니다. 마치 df[ ] 안에 칼럼 이름들이 들어간 리스트가 입력된 것이라고 생각하면 기억하기 쉽습니다.
아래 코드는 'name', 'price' 칼럼만 조회하는 코드입니다.
df[['name', 'price']]
# 위 결과와 동일
# list1 = ['name', 'price']
# df[list1]
name price
0 coffee 3000
1 tea 4000
2 juice 5000
3 milk 2000
4 ade 5000
출력된 결과를 보면 'name' 칼럼과 'price' 칼럼만 잘 조회되었음을 살펴볼 수 있습니다.
한편, 더 나아가 이를 응용하면 칼럼의 순서를 변경할 수도 있는데요, 만약 칼럼의 순서를 'category', 'name', 'rating', 'price' 순으로 변경하고 싶다면 다음과 같이 코드를 입력하면 된답니다.
new_df = df[['category','name','rating','price']]
display(new_df)
category name rating price
0 1 coffee 4.0 3000
1 2 tea 3.5 4000
2 3 juice 3.7 5000
3 4 milk 3.0 2000
4 4 ade 2.0 5000