본문 바로가기

방법

[데이터분석] plotly : 데이터프레임을 이용하여 데이터 간의 변화를 비교하는 그래프 만들기 이전 글에서는 plotly 라이브러리로 리스트 또는 데이터프레임에 있는 데이터를 사용하여 간단하게 그래프를 그려보는 방법에 대해서 설명드렸는데요, 이번 글에서는 데이터프레임을 이용하여 다른 두 데이터 간의 변화를 비교하는 그래프를 그리는 방법에 대해서 설명드리겠습니다. - plotly() : 데이터프레임 이용하여 두 데이터 간의 변화 비교하기 우선, 아래와 같은 데이터프레임(df)이 있다고 가정해보겠습니다. yearitemprice 02018coffee2500 12018tea4000 22019coffee2500 32019tea4000 42020coffee3000 52020tea5000 62021coffee3500 72021tea5500 위 데이터를 보면 'year' 칼럼에 연도별로, 'item' 칼럼에서.. 더보기
[데이터분석] plotly : 막대 그래프 간단하게 만드는 방법 matplotlib은 그래프를 쉽고 간단하게 그려주는 라이브러리로 유명한데요, plotly 라이브러리 역시 그래프를 쉽고 간단하게 그래프를 그려주고, 특히 깔끔하고 예쁘게 그래프를 그릴 수 있다는 점으로 많이 사용되는 라이브러리입니다. 이번 글에서는 plotly 를 이용하여 가장 기본적인 막대 그래프를 간단하게 만드는 방법에 대해서 살펴보도록 하겠습니다. 1. 리스트 데이터를 이용해서 그래프 그리기 plotly로 그래프를 그릴 때, 필요한 데이터는 리스트 또는 데이터프레임의 형식으로 입력할 수 있는데요, 먼저 리스트를 이용해서 그래프를 그리는 방법에 대해서 설명하겠습니다. 먼저 예를 들어, 연도별 가격의 변화를 그래프로 나타내기 위해, 다음과 같은 리스트가 있다고 가정해보겠습니다. year = [2017.. 더보기
[데이터 분석] 빈 데이터 프레임(dataframe) 만드는 방법 pandas 라이브러리로 데이터프레임을 만들 수 있는데요, 기존의 데이터를 이용하여 데이터프레임으로 나타내는 방법과, 처음부터 빈 데이터프레임을 만들어서 데이터를 추가하는 방식으로 만들 수 있습니다. 이번 글에서는 빈 데이터프레임을 만드는 방법에 대해서 살펴보도록 하겠습니다. 1. 빈 데이터프레임 만들기 데이터 프레임을 만드는 방법은 간단한데요, pd.DataFrame() 함수 안에 인덱스 설정과 칼럼의 이름을 지정해주면 됩니다. 예를 들어, 10개의 행과 'A', 'B', 'C' 라는 칼럼을 가진 데이터프레임 'df' 를 만들어보도록 하겠습니다. import pandas as pd df = pd.DataFrame(index=range(0,10),columns=['A','B','C']) 위와 같이 ind.. 더보기
[데이터분석] 데이터 프레임 : 행과 열 바꾸기 - transpose() pandas 라이브러리를 이용하면 데이터프레임으로 데이터 분석을 쉽게 할 수 있는데요, 특히 다양한 형태로 쉽게 변경할 수 있기 때문에 많이 사용됩니다. 한편, 데이터프레임으로 데이터를 분석할 때, 행과 열을 바꿔서 나타내고 싶을 수 있는데요, 이러한 경우 transpose() 함수를 사용하여 행과 열을 바꿀 수 있습니다. 먼저, 아래와 같은 데이터프레임이 있다고 가정해보겠습니다. tempcountpricerating item coffeehot130004.5 juiceice540003.0 adeice250004.0 milkhot420002.5 teahot340003.0 waterice210004.5 위 데이터프레임은 'item' 칼럼이 인덱스로 설정된 데이터프레임입니다. 이제 이 데이터프레임에서 tran.. 더보기
[데이터분석] matplotlib : 그래프 눈금 간격 지정 방법 matplotlib 라이브러리는 그래프를 쉽게 그리도록 도와주는 라이브러리인데요, 기본적으로 그래프를 그리면 눈금이 자동으로 지정되어서 출력됩니다. 하지만 눈금이 원하는 그래프와 적절하지 않다면 이를 조정해야 하는데요, 눈금 간격을 지정하는 방법에 대해서 알아보도록 하겠습니다. - 그래프 눈금 간격 설정하기 먼저, matplotlib 라이브러리와 numpy 배열을 이용하여 간단한 그래프를 만들어보도록 하겠습니다. import numpy as np import matplotlib.pyplot as plt a = np.arange(0,10,1) #0,2,4,6,8 plt.plot(a,a,'bo') 출력된 결과를 보면, x축과 y축의 눈금 모두 2로 설정이 되어 있는데요, 눈금 간격을 설정하는 방법은 xtic.. 더보기
[데이터분석] 데이터 프레임 : 원하는 행 인덱싱 하기 - iloc 데이터 프레임을 다루다보면, 원하는 행만 추출하는 등 인덱싱을 해야 하는 경우가 있는데요, 인덱싱은 iloc 라는 모듈을 이용해서 할 수 있습니다. - iloc[ ] : 원하는 행 인덱싱 먼저, 아래와 같은 데이터프레임(df)이 있다고 가정해보겠습니다. tempitemcountpricerating 0hotcoffee130004.5 1icejuice540003.0 2iceade250004.0 3hotmilk420002.5 4hottea340003.0 5icewater210004.5 위 데이터프레임에서 왼쪽을 보면 알 수 있듯이, 첫 번째 행의 인덱스가 0부터 시작합니다. 이제 여기서 인덱싱을 하려면 iloc[인덱스번호] 처럼 코드를 입력하면 되는데요, 첫 번째 행을 인덱싱 해보도록 하겠습니다. df.ilo.. 더보기
[데이터분석] matplotlib : 파이차트(pie chart) 간단하게 만들기 이전 글에서는 막대그래프와 수평 막대그래프를 그리는 방법에 대해서 알아보았는데요, 이번에는 도넛 모양 그래프라고도 하는 파이차트(pie chart)를 간단하게 만들어보도록 하겠습니다. 먼저, 파이차트를 만드는 코드와 출력된 그래프를 살펴보도록 하겠습니다. import matplotlib.pyplot as plt ratio = [30, 40, 10, 20] labels = ['coffee', 'tea', 'ade', 'milk'] plt.pie(ratio, labels=labels, autopct='%.1f%%') plt.show() 보시다시피, 코드가 매우 간단한데요, 한 줄 한 줄 살펴보도록 하겠습니다. import matplotlib.pyplot as plt 그래프를 그리기 위해선 matplotlib.. 더보기
[데이터분석] matplotlib : 막대그래프 간단하게 만들기 matplotlib 라이브러리를 이용하면 그래프를 쉽고 간단하게 만들 수 있는데요, 가장 많이 사용하는 막대그래프를 그리는 기본적인 방법에 대해서 설명하도록 하겠습니다. 1. 막대그래프(bar chart) 먼저, 막대그래프를 그리는 코드와 출력된 그래프를 먼저 보고 설명하도록 하겠습니다. import matplotlib.pyplot as plt import numpy as np x = np.arange(3) item = ['coffee', 'tea', 'ade'] values = [2000, 4000, 5000] plt.bar(x, values) plt.xticks(x, item) plt.grid(True) plt.show() import matplotlib.pyplot as plt import nump.. 더보기
[파이썬] 리스트 인덱싱 기초 : list[-1] 이란? 리스트 안에 있는 데이터를 인덱싱 하는 것은 매우 간단하면서도 기초적인 것인데요, 간단하게 인덱싱 하는 방법에 대해 살펴보도록 하겠습니다. - 리스트(List) 인덱싱 하기 우선 다음과 같은 리스트 'list1'이 있다고 가정해보겠습니다. list1 = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9 ,10] 리스트에서 인덱스는 0부터 시작하는데요, 만약 두 번째 데이터를 갖고 오고 싶다면 인덱스가 1인 데이터를 찾아와야 합니다. 한편, 인덱싱 하는 방법은 리스트명[인덱스번호] 처럼 코드를 입력하면 됩니다. # 첫 번째 데이터 인덱싱 list1[0] # 두 번째 데이터 인덱싱 list1[1] 그렇다면, 리스트에 데이터가 몇 개 인지 모를 정도로 매우 많은데, 마지막에 있는 데이터를 인덱싱 하려면 어.. 더보기
[파이썬] 인덱스 반환 함수 - enumerate() 란? enumerate() 함수는 주로 반복문에서 사용되는데요, 몇 번째 반복되고 있는지 인덱스를 확인할 때 사용합니다. enumerate 함수를 어떻게 사용하는지 다음 코드를 보면서 살펴보도록 하겠습니다. - enumerate() 먼저, 아래와 같은 리스트 'list1'이 있고, list1에 있는 데이터를 하나씩 출력할 때 보통 다음과 같이 코드를 작성합니다. list1 = [50,100,150,200,250,300] for i in range(len(list1)) : print(i, "번째 데이터 :", list1[i]) 0 번째 데이터 : 50 1 번째 데이터 : 100 2 번째 데이터 : 150 3 번째 데이터 : 200 4 번째 데이터 : 250 5 번째 데이터 : 300 여기서 반복하는 것을 ran.. 더보기