본문 바로가기

BLOG/데이터분석

[데이터분석] 엑셀 파일, 원하는 칼럼(열) 선택적으로 불러와서 dataframe으로 나타내기 - usecols

이전 포스팅에서는 skipfooter를 이용하여 엑셀 파일에서 맨 마지막 행, 또는 하단 행을 제외한 행만 불러오거나,

skiprows를 이용하여 선택적으로 특정 행만 불러서 가져오는 방법에 대해 살펴보았는데요,

이번에는 usecols를 사용하여 원하는 칼럼(열)만 선택해서 이를 dataframe으로 나타내는 방법에 대해 살펴보도록 하겠습니다.

 

 

- usecols : 원하는 칼럼(열)만 불러오기

먼저, 아래와 같이 데이터가 있는 'sample.xlsx' 파일이 있다고 가정해보겠습니다.

 

 

위 파일을 보면, 1행에는 칼럼 이름이 있고, 2행부터 8행까진 항목들이 나열되어 있는 것을 볼 수 있습니다.

이제 이 엑셀 파일을 데이터프레임으로 나타내 보도록 하겠습니다.

 

import pandas as pd

file = r"C:\Users\Dinolabs\Desktop\데이터분석\sample.xlsx"  #해당 경로
df = pd.read_excel(file, sheet_name="Sheet1")

display(df)

 

	item	count	price	rating
0	coffee	1	3000	4.5
1	juice	5	4000	3.0
2	ade	2	5000	4.0
3	milk	4	2000	2.5
4	tea	3	4000	3.0
5	water	2	1000	4.5
6	coke	4	2000	4.0

 

출력된 결과를 보면 모든 데이터가 데이터프레임으로 잘 출력됨을 확인할 수 있습니다.

 

하지만, 이때 만약 'tiem' 칼럼과 'price' 칼럼만 불러오고 싶다면 usecols 를 사용하면 되는데요,

read_excel() 함수 안에 해당 열 번호인 2와 3을 usecols = [2, 3] 의 형식으로 인자를 넣어주면 됩니다.

 

df1 = pd.read_excel(file, sheet_name="Sheet1", usecols=[2, 3])
display(df1)

 

	price	rating
0	3000	4.5
1	4000	3.0
2	5000	4.0
3	2000	2.5
4	4000	3.0
5	1000	4.5
6	2000	4.0

 

결과를 보면, 엑셀 상에서 2, 3번 열에 있는 데이터만 불러와졌음을 확인할 수 있습니다.

 

이렇게 usecols 모듈을 사용한다면 원하는 칼럼만 불러올 수 있답니다.