본문 바로가기

BLOG/데이터분석

[데이터분석] 데이터프레임 : 위/아래, 좌/우로 합치기 - concat()

 

데이터프레임은 concat() 함수를 이용하여 두 개의 데이터프레임을 위/아래 또는 좌/우로 합칠 수 있는데요,

코드를 보면서 살펴보도록 하겠습니다.

 

 

1. 위 아래로 데이터프레임 합치기

먼저 아래와 같은 두 개의 데이터프레임(df1, df2)이 있다고 가정해보겠습니다.

 

	temp	item	count	price	rating
0	hot	coffee	1	3000	4.5
1	ice	juice	5	4000	3.0
2	ice	ade	2	5000	4.0
	index	temp	item	count	price	rating
0	3	hot	milk	4	2000	2.5
1	4	hot	tea	3	4000	3.0
2	5	ice	water	2	1000	4.5

 

이제 이 두 데이터프레임을 합치려고 하는데요, concat() 함수 안에 합칠 데이터프레임을 다음과 같이 입력하면 됩니다.

 

pd.concat([df1, df2])

 

	temp	item	count	price	rating	index
0	hot	coffee	1	3000	4.5	NaN
1	ice	juice	5	4000	3.0	NaN
2	ice	ade	2	5000	4.0	NaN
0	hot	milk	4	2000	2.5	3.0
1	hot	tea	3	4000	3.0	4.0
2	ice	water	2	1000	4.5	5.0

 

출력 결과, 두 데이터프레임이 잘 합쳐졌음을 볼 수 있는데요, 인덱스 부분을 살펴보면 0,1,2,0,1,2로 인덱스가 정리가 안 된 것을 볼 수 있는데요, 이 부분에 대해서는 concat() 함수 안에 'ignore_index=True' 라는 인자를 넣어주면 됩니다.

코드를 수정해서 실행해보겠습니다.

 

pd.concat([df1,df2], ignore_index=True)

 

	temp	item	count	price	rating	index
0	hot	coffee	1	3000	4.5	NaN
1	ice	juice	5	4000	3.0	NaN
2	ice	ade	2	5000	4.0	NaN
3	hot	milk	4	2000	2.5	3.0
4	hot	tea	3	4000	3.0	4.0
5	ice	water	2	1000	4.5	5.0

 

그 결과, 인덱스가 잘 정리되었음을 살펴볼 수 있습니다.

 

 

2. 좌우로 데이터프레임 합치기

concat() 함수의 기본 값은 위 아래(행방향)로 데이터프레임을 합치는 것인데요, 만약 좌우로 데이터프레임을 합치고 싶다면 다음과 같이 코드를 입력하면 됩니다.

 

pd.concat([df1,df2],axis=1) 

 

	temp	item	count	price	rating	index	temp	item	count	price	rating
0	hot	coffee	1	3000	4.5	3	hot	milk	4	2000	2.5
1	ice	juice	5	4000	3.0	4	hot	tea	3	4000	3.0
2	ice	ade	2	5000	4.0	5	ice	water	2	1000	4.5

 

axis을 axis = 1로 설정하니, 위와 같이 인덱스 포함 모든 열이 좌우로 합쳐졌음을 볼 수 있습니다.