BLOG/데이터분석
[데이터분석] 엑셀 파일, 원하는 행 선택적으로 불러와서 dataframe으로 나타내기 - skiprows
알디노
2021. 3. 10. 17:45
이전 포스팅에서는 skipfooter 를 이용하여 엑셀파일에서 맨 마지막 행, 또는 하단 행을 제외한 행만 불러와 dataframe으로 나타내는 방법에 대해 살펴보았는데요, 이번에는 skiprows를 사용하여 원하는 행만 선택적으로 골라서 이를 dataframe으로 나타내보도록 하겠습니다.
- skiprows : 특정 행 제외하고 불러오기 = 원하는 행만 불러오기
먼저, 아래와 같이 데이터가 있는 'sample.xlsx' 파일이 있다고 가정해보겠습니다.
위 파일을 보면, 1행에는 칼럼 이름이 있고, 2행부터 8행까진 항목들이 나열되어 있는 것을 볼 수 있습니다.
이제 이 엑셀 파일을 데이터프레임으로 나타내 보도록 하겠습니다.
import pandas as pd
file = r"C:\Users\Dinolabs\Desktop\데이터분석\sample.xlsx" #해당 경로
df = pd.read_excel(file, sheet_name="Sheet1")
display(df)
item count price rating
0 coffee 1 3000 4.5
1 juice 5 4000 3.0
2 ade 2 5000 4.0
3 milk 4 2000 2.5
4 tea 3 4000 3.0
5 water 2 1000 4.5
6 coke 4 2000 4.0
출력된 결과를 보면 모든 데이터가 데이터프레임으로 잘 출력됨을 확인할 수 있습니다.
하지만, 이때 만약 특정 행을 제외하고 불러오거나, 선택적으로 불러오고 싶다면 skiprows 를 사용하면 됩니다.
바로 read_excel() 함수 안에 skiprows = [1, 2, 4] 의 형식으로 인자를 입력하면 되는데요, 예를 들어, 2, 4, 6번 행을 제외하고 불러오도록 하겠습니다.
df1 = pd.read_excel(file, sheet_name="Sheet1", skiprows=[2, 4, 6])
display(df1)
item count price rating
0 coffee 1 3000 4.5
1 ade 2 5000 4.0
2 tea 3 4000 3.0
3 coke 4 2000 4.0
결과를 보면, 엑셀 상에서 2, 4, 6번 행을 제외하고 불러와졌음을 확인할 수 있습니다.
skiprows 모듈은 선택적으로 행을 불러오기보단, 특정 행을 제외하고 불러온다는 개념에 더 가까운데요, 이를 적절히 활용하여 사용하시기 바랍니다!