BLOG/데이터분석
[데이터분석] 데이터프레임 : 다중 인덱스 설정하는 방법 - set_index()
알디노
2021. 3. 15. 16:02
데이터프레임에서는 인덱스를 하나만 설정하는 것 말고도 여러 개의 칼럼으로 인덱스를 설정할 수 있는데요,
아래 코드를 보면서 다중 인덱스를 설정하는 방법에 대해 살펴보도록 하겠습니다.
- set_index() : 다중 인덱스 설정하기
먼저, 아래와 같은 데이터프레임(df)이 있다고 가정해보겠습니다.
class num math eng
0 A 1 97 98
1 A 2 67 76
2 A 3 89 97
3 B 1 76 67
4 B 2 79 89
5 B 3 68 77
6 C 1 98 98
7 C 2 58 87
8 C 3 97 67
데이터프레임을 보면 'class' 칼럼에 A, B, C 에 해당하는 데이터가 있고,
'num' 칼럼에는 1, 2, 3이라는 데이터가 있으며, 'math'와 'eng' 칼럼에는 점수에 해당하는 값들이 입력되어 있습니다.
만약 위 데이터프레임에서 'class'와 'num' 칼럼을 다중 인덱스로 설정하고 싶다면 다음과 같이 set_index() 함수를 사용하여 코드를 입력하면 됩니다.
df.set_index(['class', 'num'])
math eng
class num
A 1 97 98
2 67 76
3 89 97
B 1 76 67
2 79 89
3 68 77
C 1 98 98
2 58 87
3 97 67
다중인덱스 설정 결과, 'class' 칼럼과 'num' 칼럼이 다중 인덱스로 설정되었음을 확인할 수 있습니다.