본문 바로가기

BLOG/데이터분석

[데이터분석] 엑셀 파일, 원하는 행 선택적으로 불러와서 dataframe으로 나타내기 - skiprows

 

이전 포스팅에서는 skipfooter 를 이용하여 엑셀파일에서 맨 마지막 행, 또는 하단 행을 제외한 행만 불러와 dataframe으로 나타내는 방법에 대해 살펴보았는데요, 이번에는 skiprows를 사용하여 원하는 행만 선택적으로 골라서 이를 dataframe으로 나타내보도록 하겠습니다.

 

 

- skiprows : 특정 행 제외하고 불러오기 = 원하는 행만 불러오기

먼저, 아래와 같이 데이터가 있는 'sample.xlsx' 파일이 있다고 가정해보겠습니다.

 

 

위 파일을 보면, 1행에는 칼럼 이름이 있고, 2행부터 8행까진 항목들이 나열되어 있는 것을 볼 수 있습니다.

이제 이 엑셀 파일을 데이터프레임으로 나타내 보도록 하겠습니다.

 

import pandas as pd

file = r"C:\Users\Dinolabs\Desktop\데이터분석\sample.xlsx"  #해당 경로
df = pd.read_excel(file, sheet_name="Sheet1")

display(df)

 

	item	count	price	rating
0	coffee	1	3000	4.5
1	juice	5	4000	3.0
2	ade	2	5000	4.0
3	milk	4	2000	2.5
4	tea	3	4000	3.0
5	water	2	1000	4.5
6	coke	4	2000	4.0

 

출력된 결과를 보면 모든 데이터가 데이터프레임으로 잘 출력됨을 확인할 수 있습니다.

 

하지만, 이때 만약 특정 행을 제외하고 불러오거나, 선택적으로 불러오고 싶다면 skiprows 를 사용하면 됩니다.

바로 read_excel() 함수 안에 skiprows = [1, 2, 4] 의 형식으로 인자를 입력하면 되는데요, 예를 들어, 2, 4, 6번 행을 제외하고 불러오도록 하겠습니다.

 

df1 = pd.read_excel(file, sheet_name="Sheet1", skiprows=[2, 4, 6])
display(df1)

 

	item	count	price	rating
0	coffee	1	3000	4.5
1	ade	2	5000	4.0
2	tea	3	4000	3.0
3	coke	4	2000	4.0

 

결과를 보면, 엑셀 상에서 2, 4, 6번 행을 제외하고 불러와졌음을 확인할 수 있습니다.

 

skiprows 모듈은 선택적으로 행을 불러오기보단, 특정 행을 제외하고 불러온다는 개념에 더 가까운데요, 이를 적절히 활용하여 사용하시기 바랍니다!