본문 바로가기

BLOG/데이터분석

[데이터분석] 데이터프레임 : 칼럼(열) 간단하게 추가하는 방법

 

데이터프레임에서 새로운 행이나 칼럼(열)을 추가하는 방법은 다양한데요, 이번에는 간단하게 칼럼(열)을 추가하는 방법에 대해서 설명하도록 하겠습니다.

 

 

- 동일한 값이 들어있는 새로운 칼럼 추가하기

새로운 칼럼을 만들고, 그 칼럼에 모두 동일한 값을 넣어야 하는 경우가 있는데요, 우선 아래와 같은 데이터프레임이 있다고 가정해보겠습니다.

 

	item	count	price	rating
0	coffee	1	3000	4.5
1	juice	5	4000	3.0
2	ade	2	5000	4.0
3	milk	1	3000	2.5
4	tea	3	4000	3.0
5	water	2	1000	4.5

 

여기에 새로운 칼럼 'category'를 만들고 싶고, 데이터가 모두 'drink' 인 칼럼을 만들고 싶다면 아래와 같이 코드를 간단하게 입력하면 됩니다.

 

df['category'] = 'drink'
display(df)

 

	item	count	price	rating	category
0	coffee	1	3000	4.5	drink
1	juice	5	4000	3.0	drink
2	ade	2	5000	4.0	drink
3	milk	1	3000	2.5	drink
4	tea	3	4000	3.0	drink
5	water	2	1000	4.5	drink

 

출력된 결과를 보면, 모두 동일한 'drink' 데이터가 들어간 'category' 칼럼이 생성된 것을 확인할 수 있습니다.

 

 

 

- 다른 값이 들어있는 새로운 칼럼 추가하기

한편, 동일한 값이 아닌 각각 다른 값을 넣어주기 위한 방법으로는 array 또는 list를 이용하여 추가하는 방법인데요, 아래와 같은 array와 list가 있다고 가정해보겠습니다.

 

arr1 = np.array([1,2,3,4,5,6])
list1 = [50,45,40,35,30,25]

 

그리고 앞에서 동일한 데이터를 추가한 방법처럼 다음과 같이 코드를 작성하면 됩니다.

 

df['rank'] = arr1
df['score'] = list1

 

위와 같이 df['새 칼럼명'] = list/array 처럼 입력하면, 아래와 같은 결과가 출력됩니다.

 

	item	count	price	rating	category  rank	score
0	coffee	1	3000	4.5	drink	 1	50
1	juice	5	4000	3.0	drink	 2	45
2	ade	2	5000	4.0	drink	 3	40
3	milk	1	3000	2.5	drink	 4	35
4	tea	3	4000	3.0	drink	 5	30
5	water	2	1000	4.5	drink	 6	25

 

이때 주의할 점이 있는데요, 바로 list와 array의 길이가 기존 데이터프레임의 행의 개수와 같아야 한다는 것 입니다. 만약 데이터의 길이가 동일하지 않은데 추가를 하면 에러가 나게 됩니다.