이전 포스팅에서는 skipfooter 를 이용하여 엑셀파일에서 맨 마지막 행, 또는 하단 행을 제외한 행만 불러와 dataframe으로 나타내는 방법에 대해 살펴보았는데요, 이번에는 skiprows를 사용하여 원하는 행만 선택적으로 골라서 이를 dataframe으로 나타내보도록 하겠습니다.
- skiprows : 특정 행 제외하고 불러오기 = 원하는 행만 불러오기
먼저, 아래와 같이 데이터가 있는 'sample.xlsx' 파일이 있다고 가정해보겠습니다.
위 파일을 보면, 1행에는 칼럼 이름이 있고, 2행부터 8행까진 항목들이 나열되어 있는 것을 볼 수 있습니다.
이제 이 엑셀 파일을 데이터프레임으로 나타내 보도록 하겠습니다.
import pandas as pd
file = r"C:\Users\Dinolabs\Desktop\데이터분석\sample.xlsx" #해당 경로
df = pd.read_excel(file, sheet_name="Sheet1")
display(df)
item count price rating
0 coffee 1 3000 4.5
1 juice 5 4000 3.0
2 ade 2 5000 4.0
3 milk 4 2000 2.5
4 tea 3 4000 3.0
5 water 2 1000 4.5
6 coke 4 2000 4.0
출력된 결과를 보면 모든 데이터가 데이터프레임으로 잘 출력됨을 확인할 수 있습니다.
하지만, 이때 만약 특정 행을 제외하고 불러오거나, 선택적으로 불러오고 싶다면 skiprows 를 사용하면 됩니다.
바로 read_excel() 함수 안에 skiprows = [1, 2, 4] 의 형식으로 인자를 입력하면 되는데요, 예를 들어, 2, 4, 6번 행을 제외하고 불러오도록 하겠습니다.
df1 = pd.read_excel(file, sheet_name="Sheet1", skiprows=[2, 4, 6])
display(df1)
item count price rating
0 coffee 1 3000 4.5
1 ade 2 5000 4.0
2 tea 3 4000 3.0
3 coke 4 2000 4.0
결과를 보면, 엑셀 상에서 2, 4, 6번 행을 제외하고 불러와졌음을 확인할 수 있습니다.
skiprows 모듈은 선택적으로 행을 불러오기보단, 특정 행을 제외하고 불러온다는 개념에 더 가까운데요, 이를 적절히 활용하여 사용하시기 바랍니다!
'BLOG > 데이터분석' 카테고리의 다른 글
[데이터 분석] 데이터 프레임 : 결측값(NaN) 있는 행/열 삭제하기 - dropna() (0) | 2021.03.11 |
---|---|
[데이터분석] 엑셀 파일, 원하는 칼럼(열) 선택적으로 불러와서 dataframe으로 나타내기 - usecols (0) | 2021.03.10 |
[데이터분석] 엑셀 파일, 마지막 행 제외하고 데이터 프레임으로 불러오기 - skipfooter (0) | 2021.03.10 |
[데이터분석] 엑셀을 데이터 프레임으로 불러올 때 Sheet 설정하는 방법 - sheet_name (0) | 2021.03.10 |
[데이터분석] 엑셀(excel) 파일 dataframe으로 불러오기 - pd.read_excel() (0) | 2021.03.10 |