본문 바로가기

파이썬

[데이터분석] matplotlib : 파이차트(pie chart) 간단하게 만들기 이전 글에서는 막대그래프와 수평 막대그래프를 그리는 방법에 대해서 알아보았는데요, 이번에는 도넛 모양 그래프라고도 하는 파이차트(pie chart)를 간단하게 만들어보도록 하겠습니다. 먼저, 파이차트를 만드는 코드와 출력된 그래프를 살펴보도록 하겠습니다. import matplotlib.pyplot as plt ratio = [30, 40, 10, 20] labels = ['coffee', 'tea', 'ade', 'milk'] plt.pie(ratio, labels=labels, autopct='%.1f%%') plt.show() 보시다시피, 코드가 매우 간단한데요, 한 줄 한 줄 살펴보도록 하겠습니다. import matplotlib.pyplot as plt 그래프를 그리기 위해선 matplotlib.. 더보기
[데이터분석] matplotlib : 수평 막대그래프 간단하게 만들기 이전 포스팅에서는 matplotlib을 이용해서 막대그래프를 그리는 방법에 대해 살펴보았는데요, 이번에는 수평 막대그래프를 그리는 방법에 대해서 살펴보도록 하겠습니다. 수평 막대그래프를 그리는 방법은 수직 막대그래프와 코드 몇 줄 빼고 거의 동일한데요, 아래 코드와 출력된 그래프를 한 번 보도록 하겠습니다. import matplotlib.pyplot as plt import numpy as np y = np.arange(3) item = ['coffee', 'tea', 'ade'] values = [2000, 4000, 5000] plt.barh(y, values) plt.yticks(y, item) plt.grid(True) plt.show() 수직 막대그래프를 그리는 방법과 다른 점이 있다면 plt.. 더보기
[데이터분석] matplotlib : 막대그래프 간단하게 만들기 matplotlib 라이브러리를 이용하면 그래프를 쉽고 간단하게 만들 수 있는데요, 가장 많이 사용하는 막대그래프를 그리는 기본적인 방법에 대해서 설명하도록 하겠습니다. 1. 막대그래프(bar chart) 먼저, 막대그래프를 그리는 코드와 출력된 그래프를 먼저 보고 설명하도록 하겠습니다. import matplotlib.pyplot as plt import numpy as np x = np.arange(3) item = ['coffee', 'tea', 'ade'] values = [2000, 4000, 5000] plt.bar(x, values) plt.xticks(x, item) plt.grid(True) plt.show() import matplotlib.pyplot as plt import nump.. 더보기
[데이터분석] matplotlib : grid 설정 / 해제하기 (가로 방향 / 세로 방향) 파이썬에서는 matplitlib 라이브러리를 이용하여 그래프를 쉽게 만들 수 있는데요, grid를 설정하는 방법에 대해 알아보도록 하겠습니다. 먼저, 아래와 같은 그래프가 있다고 가정하겠습니다. import matplotlib.pyplot as plt import numpy as np x = np.arange(3) item = ['coffee', 'tea', 'ade'] values = [2000, 4000, 5000] plt.bar(x, values) plt.xticks(x, item) plt.show() 출력된 그래프를 보면, grid가 설정되어 있는데요, grid에 대한 설정은 plt.grid(True) 또는 plt.grid(False) 코드를 통해 설정할 수 있습니다. 위 그래프에는 grid가 설.. 더보기
[파이썬] 주피터 노트북(jupyter notebook) - warning message 안 보이게 하는 방법 (+다시 켜는 방법) 주피터 노트북에서 코딩을 하다 보면, 빨간색으로 warning 창이 나오는 것을 볼 수 있습니다. 에러는 아니어서 문제가 되는 부분은 없지만, warning message가 길게 나오거나 크기를 차지하면 보는 데에 있어 신경 쓰일 수 있습니다. 이러한 warning message는 warnings 라이브러리에서 제공하는 모듈로 없앨 수 있는데요, 다음과 같이 코드를 작성하면 됩니다. import warnings warnings.filterwarnings(action='ignore') 위와 같이 코드를 실행하고, warning message가 나왔던 코드를 실행해보면 warning message가 나오지 않는 것을 확인하실 수 있습니다. 한편, warning message를 안 보이게 설정을 해놨는데, 필.. 더보기
[데이터분석] 데이터프레임 : 특정 칼럼의 데이터 종류별로 평균 / 합 구하는 방법 - groupby() 데이터프레임으로 데이터분석을 하다 보면, 특정 칼럼(열) 데이터 종류별로 평균이나 합을 구해야 하는 경우가 있을 수 있는데요, 이러한 경우 groupby() 함수를 사용하여 구할 수 있습니다. groupby() 함수는 말 그대로 그룹을 지어주는 함수로, 평균을 구하는 함수 mean()과 전체 합을 구하는 함수 sum() 을 함께 사용함으로써 그룹별 평균과 합을 구할 수 있습니다. 1. 특정 칼럼, 데이터 종류별로 합 구하기 코드를 보면서 살펴볼텐데요, 먼저 아래와 같은 데이터프레임이 있다고 가정해보겠습니다. import pandas as pd df = pd.DataFrame( {'name': ['coffee', 'tea', 'juice','milk', 'ade'], 'price': [3000, 4000,.. 더보기
[데이터분석] 데이터프레임 : 칼럼(열) 이름 변경하는 방법 - rename() 데이터프레임으로 데이터분석을 할 때, 전처리 과정으로 칼럼의 이름을 알아보기 쉽게 변경하는 경우가 있는데요, 칼럼의 이름을 어떻게 변경하는지 알아보도록 하겠습니다. - rename() : 칼럼(열) 이름 변경하기 rename() 함수는 칼럼의 이름을 변경하는 함수인데요, df.rename(columns = {'old_name' : 'new_name'), inplace=True) 와 같이 코드를 입력해서 사용하면 됩니다. 아래와 같은 데이터프레임이 있다고 가정해보겠습니다. import pandas as pd df = pd.DataFrame( {'name': ['coffee', 'tea', 'juice','milk', 'ade'], 'price': [3000, 4000, 5000, 2000, 5000], '.. 더보기
[데이터분석] 데이터프레임 : inplace = True 뜻 데이터프레임을 다루는 코드를 구글링 하다 보면, 해당 함수 안에 inplace = True 라는 코드가 입력되어 있는 것을 많이 볼 수 있는데요, inplace = True 란 무엇을 의미하는 걸까요? 먼저, 다음과 같은 데이터프레임이 있다고 가정해보겠습니다. import pandas as pd df = pd.DataFrame( {'name': ['coffee', 'tea', 'juice','milk', 'ade'], 'price': [3000, 4000, 5000, 2000, 5000], 'rating': [4, 3.5, 3.7, 3, 2], 'category': [1,2,3,4,4]}) display(df) namepriceratingcategory 0coffee30004.01 1tea40003.52.. 더보기
[데이터분석] 데이터프레임 : 특정 칼럼(열) 삭제하기 - drop() 데이터프레임으로 데이터 분석을 할 때, 필요 없는 칼럼은 삭제하는 게 좋은데요, drop() 함수를 사용하면 쉽게 칼럼을 삭제할 수 있습니다. 먼저, 아래와 같은 데이터프레임이 있다고 가정해보겠습니다. import pandas as pd df = pd.DataFrame( {'name': ['coffee', 'tea', 'juice','milk', 'ade'], 'price': [3000, 4000, 5000, 2000, 5000], 'rating': [4, 3.5, 3.7, 3, 2], 'category': [1,2,3,4,4]}) display(df) namepriceratingcategory 0coffee30004.01 1tea40003.52 2juice50003.73 3milk20003.04 4ad.. 더보기
[데이터분석] 데이터프레임 : 특정 칼럼(열) 기준으로 오름차순/내림차순 정렬하기 - sort_values() 데이터프레임으로 데이터 분석을 할 때, 필요 없는 칼럼은 제거하거나 특정 칼럼을 기준으로 정렬하는 등 데이터 전처리 과정을 거치게 되는데요, 이때 특정 칼럼(열) 기준으로 정렬을 하려면 어떻게 해야 할까요? 데이터프레임에는 sort_values() 라는 함수를 이용하여 정렬을 할 수 있는데요, 아래 코드를 보면서 설명드리도록 하겠습니다. - sort_values : 특정 칼럼 기준으로 정렬 먼저 다음과 같은 데이터프레임이 있다고 가정해보겠습니다. import pandas as pd df = pd.DataFrame( {'name': ['coffee', 'tea', 'juice','milk', 'ade'], 'price': [3000, 4000, 5000, 2000, 5000], 'rating': [4, 3.. 더보기