[데이터분석] 엑셀 파일, 원하는 행 선택적으로 불러와서 dataframe으로 나타내기

이전 포스팅에서는 skipfooter 를 이용하여 엑셀파일에서 맨 마지막 행, 또는 하단 행을 제외한 행만 불러와 dataframe으로 나타내는 방법에 대해 살펴보았는데요, 이번에는 skiprows를 사용하여 원하는 행만 선택적으로 골라서 이를 dataframe으로 나타내보도록 하겠습니다.

- skiprows : 특정 행 제외하고 불러오기 = 원하는 행만 불러오기

먼저, 아래와 같이 데이터가 있는 'sample.xlsx' 파일이 있다고 가정해보겠습니다.

위 파일을 보면, 1행에는 칼럼 이름이 있고, 2행부터 8행까진 항목들이 나열되어 있는 것을 볼 수 있습니다.

이제 이 엑셀 파일을 데이터프레임으로 나타내 보도록 하겠습니다.

import pandas as pd

file = r"C:\Users\Dinolabs\Desktop\데이터분석\sample.xlsx"  #해당 경로
df = pd.read_excel(file, sheet_name="Sheet1")

display(df)

	item	count	price	rating
0	coffee	1	3000	4.5
1	juice	5	4000	3.0
2	ade	2	5000	4.0
3	milk	4	2000	2.5
4	tea	3	4000	3.0
5	water	2	1000	4.5
6	coke	4	2000	4.0

출력된 결과를 보면 모든 데이터가 데이터프레임으로 잘 출력됨을 확인할 수 있습니다.

하지만, 이때 만약 특정 행을 제외하고 불러오거나, 선택적으로 불러오고 싶다면 skiprows 를 사용하면 됩니다.

바로 read_excel() 함수 안에 skiprows = [1, 2, 4] 의 형식으로 인자를 입력하면 되는데요, 예를 들어, 2, 4, 6번 행을 제외하고 불러오도록 하겠습니다.

df1 = pd.read_excel(file, sheet_name="Sheet1", skiprows=[2, 4, 6])
display(df1)

	item	count	price	rating
0	coffee	1	3000	4.5
1	ade	2	5000	4.0
2	tea	3	4000	3.0
3	coke	4	2000	4.0

결과를 보면, 엑셀 상에서 2, 4, 6번 행을 제외하고 불러와졌음을 확인할 수 있습니다.

skiprows 모듈은 선택적으로 행을 불러오기보단, 특정 행을 제외하고 불러온다는 개념에 더 가까운데요, 이를 적절히 활용하여 사용하시기 바랍니다!

'BLOG > 데이터분석' 카테고리의 다른 글

[데이터 분석] 데이터 프레임 : 결측값(NaN) 있는 행/열 삭제하기 - dropna() (0)	2021.03.11
[데이터분석] 엑셀 파일, 원하는 칼럼(열) 선택적으로 불러와서 dataframe으로 나타내기 - usecols (0)	2021.03.10
[데이터분석] 엑셀 파일, 마지막 행 제외하고 데이터 프레임으로 불러오기 - skipfooter (0)	2021.03.10
[데이터분석] 엑셀을 데이터 프레임으로 불러올 때 Sheet 설정하는 방법 - sheet_name (0)	2021.03.10
[데이터분석] 엑셀(excel) 파일 dataframe으로 불러오기 - pd.read_excel() (0)	2021.03.10

디노랩스

[데이터분석] 엑셀 파일, 원하는 행 선택적으로 불러와서 dataframe으로 나타내기 - skiprows

- skiprows : 특정 행 제외하고 불러오기 = 원하는 행만 불러오기

'BLOG > 데이터분석' 카테고리의 다른 글

티스토리툴바

[데이터분석] 엑셀 파일, 원하는 행 선택적으로 불러와서 dataframe으로 나타내기 - skiprows

- skiprows : 특정 행 제외하고 불러오기 = 원하는 행만 불러오기

'BLOG > 데이터분석' 카테고리의 다른 글

'BLOG/데이터분석' Related Articles

티스토리툴바