본문 바로가기

BLOG/데이터분석

[데이터분석] 데이터프레임 : 다중 인덱스 설정하는 방법 - set_index()

 

데이터프레임에서는 인덱스를 하나만 설정하는 것 말고도 여러 개의 칼럼으로 인덱스를 설정할 수 있는데요,

아래 코드를 보면서 다중 인덱스를 설정하는 방법에 대해 살펴보도록 하겠습니다.

 

 

- set_index() : 다중 인덱스 설정하기

먼저, 아래와 같은 데이터프레임(df)이 있다고 가정해보겠습니다.

 

	class	num	math	eng
0	A	1	97	98
1	A	2	67	76
2	A	3	89	97
3	B	1	76	67
4	B	2	79	89
5	B	3	68	77
6	C	1	98	98
7	C	2	58	87
8	C	3	97	67

 

데이터프레임을 보면 'class' 칼럼에 A, B, C 에 해당하는 데이터가 있고,

'num' 칼럼에는 1, 2, 3이라는 데이터가 있으며, 'math'와 'eng' 칼럼에는 점수에 해당하는 값들이 입력되어 있습니다.

 

만약 위 데이터프레임에서 'class'와 'num' 칼럼을 다중 인덱스로 설정하고 싶다면 다음과 같이 set_index() 함수를 사용하여 코드를 입력하면 됩니다.

 

df.set_index(['class', 'num']) 

 

		math	eng
class	num		
A	1	97	98
	2	67	76
	3	89	97
B	1	76	67
	2	79	89
	3	68	77
C	1	98	98
	2	58	87
	3	97	67

 

다중인덱스 설정 결과, 'class' 칼럼과 'num' 칼럼이 다중 인덱스로 설정되었음을 확인할 수 있습니다.