본문 바로가기

칼럼

[데이터분석] 데이터프레임 : 특정 칼럼(열)을 리스트로 바꾸는 방법 데이터프레임에서 특정 칼럼(열)에 있는 데이터를 리스트의 형식으로 만들고 싶을 수 있는데요, 이러한 경우 간단하게 for문을 이용해서 리스트로 만들 수 있답니다. 먼저, 아래와 같은 데이터프레임(df1)이 있다고 가정해보겠습니다. # itempricecount 0water10001 1milk20005 2coffee30002 3ade40001 4juice50003 5tea60002 이 데이터프레임에서 만약 'item' 칼럼에 있는 데이터들을 리스트로 만들고 싶다면 아래와 같이 for문을 사용해서 코드를 입력하면 됩니다. item_list = [] for i in df1['item'] : item_list.append(i) 먼저 비어있는 리스트를 만들고, for문에서 df의 'item' 칼럼에서 데이터를 하.. 더보기
[데이터분석] 데이터프레임 : 특정 칼럼(열)에 있는 데이터 출력하기 for문을 이용하면 데이터프레임에서 특정 칼럼(열)에 있는 데이터를 하나씩 출력할 수 있는데요, 먼저, 아래와 같은 데이터프레임(df1)이 있다고 가정해보겠습니다. # itempricecount 0water10001 1milk20005 2coffee30002 3ade40001 4juice50003 5tea60002 이 데이터프레임에서 만약 'item' 칼럼에 있는 데이터를 출력하고 싶다면 다음과 같이 코드를 작성하면 됩니다. for i in df1['item'] : print(i) water milk coffee ade juice tea 출력된 결과, 'item'에 있는 데이터가 모두 잘 출력되었음을 확인할 수 있습니다. 추가로, 만약 'item' 칼럼에 있는 데이터들을 하나의 리스트로 만들고 싶다면 아.. 더보기
[데이터분석] 데이터프레임 : 칼럼이 일치하는 데이터프레임에 다른 칼럼 붙여 넣기 - merge 만약 두 데이터프레임 df1, df2가 있을 때, 두 데이터프레임에서 특정 칼럼이 동일하고, 그 칼람에 들어있는 데이터가 일치한다면, df1에는 없고 df2에는 있는 칼럼을 df1에 붙여넣으려면 어떻게 해야 할까요? 바로, merge() 함수를 이용해서 변경이 가능한데요, 아래 코드를 보면서 설명하도록 하겠습니다. - merge() : 칼럼 비교 후 붙여 넣기 먼저, 아래와 같은 데이터프레임 df1과 df2가 있다고 가정해보겠습니다. # itempricecount 0water10001 1milk20005 2coffee30002 3ade40001 4juice50003 5tea60002 # itempricerating 0water10004.5 1milk20003.4 2americano 35005.3 3ade.. 더보기
[데이터분석] 데이터프레임 : 특정 열(칼럼)에 있는 데이터를 연산해서 결측치(NaN) 채우기 - fillna() 만약 아래와 같은 데이터프레임이 있다고 가정할 때, itemcountpricetotal 0coffee130003000.0 1juice5400020000.0 2ade25000NaN 3milk120002000.0 4tea34000NaN 5water210002000.0 'count' 칼럼과 'price' 칼럼에 있는 데이터의 곱이 'total' 칼럼의 데이터에 해당되는 것을 살펴볼 수 있는데요, total 칼럼에 2번째 행과 4번째 행을 보면 결측값(NaN)으로 비워져 있는 것을 볼 수 있습니다. 일일이 비어있는 데이터에 값을 넣어줘도 되지만 데이터의 양이 매우 많으면 많은 시간이 소요될 수 있습니다. 따라서 fillna() 라는 함수를 사용하면 한 번에 연산해서 결측값을 채울 수 있는데요, 만약 'total.. 더보기
[데이터분석] 데이터프레임 : 다중 인덱스 설정하는 방법 - set_index() 데이터프레임에서는 인덱스를 하나만 설정하는 것 말고도 여러 개의 칼럼으로 인덱스를 설정할 수 있는데요, 아래 코드를 보면서 다중 인덱스를 설정하는 방법에 대해 살펴보도록 하겠습니다. - set_index() : 다중 인덱스 설정하기 먼저, 아래와 같은 데이터프레임(df)이 있다고 가정해보겠습니다. classnummatheng 0A19798 1A26776 2A38997 3B17667 4B27989 5B36877 6C19898 7C25887 8C39767 데이터프레임을 보면 'class' 칼럼에 A, B, C 에 해당하는 데이터가 있고, 'num' 칼럼에는 1, 2, 3이라는 데이터가 있으며, 'math'와 'eng' 칼럼에는 점수에 해당하는 값들이 입력되어 있습니다. 만약 위 데이터프레임에서 'class'.. 더보기
[데이터분석] 데이터프레임 : 한 칼럼(열)에서 특정 값과 일치하는 행 필터링 하기 데이터프레임에서 한 칼럼(열)에 특정 데이터와 일치하는 행을 찾고, 일치하는 행들만 따로 데이터프레임으로 나타내고 싶다면 어떻게 해야 할까요? 아래 코드를 보면서 살펴보도록 하겠습니다. - 한 칼럼(열)에서 특정 값과 일치하는 행 필터링 하기 먼저, 아래와 같은 데이터프레임이 있다고 가정해보겠습니다. itemcountpricerating 0coffee130004.5 1juice540003.0 2ade250004.0 3milk130002.5 4tea340003.0 5water230004.5 위 데이터를 살펴보면 항목(item)마다 'count', 'price', 'rating'에 대한 데이터가 있는데요, 만약 'price'칼럼에서 데이터가 '3000'인 행만 필터링해서 새로운 데이터프레임으로 만들고 싶다면.. 더보기
[데이터분석] 데이터프레임 : 한 칼럼(열)에 특정한 값 있는지 조회하는 방법 데이터프레임에서 한 칼럼에 특정한 데이터가 있는지 확인할 수 있는데요, 먼저 아래와 같은 데이터프레임(df)이 있다고 가정해보겠습니다. itemcountpricerating 0coffee130004.5 1juice540003.0 2ade250004.0 3milk130002.5 4tea340003.0 5water210004.5 위 데이터프레임은 데이터의 양이 많지 않아서 한눈에 다 들어오지만 모른다 가정할 때, 'item' 칼럼에 'milk' 라는 데이터가 있는지 확인하는 코드는 다음과 같습니다. df['item'] == 'milk' df['칼럼명'] == '찾을 데이터' 와 같이 입력하면 아래와 같이 출력되는데요, 해당하는 값이 있으면 True, 없으면 False를 반환합니다. 0 False 1 Fals.. 더보기
[데이터분석] plotly : 데이터프레임 3개 칼럼으로 그래프 나타내기 plotly 라이브러리를 이용하여 데이터프레임을 가지고 그래프를 다양하게 나타낼 수 있는데요, 가장 기본적인 형태가 2개의 칼럼을 이용하여 x축 데이터와 y축 데이터의 관계를 나타내는 그래프입니다. 하지만 좀 더 변형해서, 3개의 칼럼으로 그래프를 나타내고 싶을 수 있는데요, 예를 들어, 연도별로 항목에 따른 가격 변화를 나타내는 그래프가 3가지의 요소를 보여주는 그래프라고 할 수 있습니다. 따라서 한 번 코드를 보면서 3개의 칼럼에 해당되는 데이터를 어떻게 그래프로 나타낼 수 있는지 살펴보도록 하겠습니다. - plotly() : 3개의 요소를 나타내는 그래프 만들기 먼저, 다음과 같이 항목, 연도, 가격 칼럼이 있는 데이터프레임이 있고, 그 아래와 같이 항목에 따른 가격을 나타내는 연도별 그래프를 만들.. 더보기
[데이터분석] 데이터프레임 : assign() 으로 새로운 칼럼(열) 추가하기 이전 글에서는 df['칼렴명'] = "입력할 값" 또는 df['칼럼명'] = list(or array) 로 데이터프레임에 새로운 칼럼을 추가하는 방법에 대해 살펴보았는데요, 이번 글에서는 assign() 함수로 새로운 칼럼을 추가하는 방법에 대해서 설명하도록 하겠습니다. - assign() : 데이터프레임에 새로운 칼럼 추가하기 assign() 함수는 데이터프레임에 새로운 열을 추가해주는 함수인데요, 먼저, 아래와 같은 데이터프레임(df)이 있다고 가정해보겠습니다. itemcountpricerating 0coffee130004.5 1juice540003.0 2ade250004.0 3milk130002.5 4tea340003.0 5water210004.5 1) 동일한 값 추가하기 assign() 함수는 a.. 더보기
[데이터분석] 데이터프레임 : 칼럼(열) 간단하게 추가하는 방법 데이터프레임에서 새로운 행이나 칼럼(열)을 추가하는 방법은 다양한데요, 이번에는 간단하게 칼럼(열)을 추가하는 방법에 대해서 설명하도록 하겠습니다. - 동일한 값이 들어있는 새로운 칼럼 추가하기 새로운 칼럼을 만들고, 그 칼럼에 모두 동일한 값을 넣어야 하는 경우가 있는데요, 우선 아래와 같은 데이터프레임이 있다고 가정해보겠습니다. itemcountpricerating 0coffee130004.5 1juice540003.0 2ade250004.0 3milk130002.5 4tea340003.0 5water210004.5 여기에 새로운 칼럼 'category'를 만들고 싶고, 데이터가 모두 'drink' 인 칼럼을 만들고 싶다면 아래와 같이 코드를 간단하게 입력하면 됩니다. df['category'] = .. 더보기