본문 바로가기

python

[데이터분석] matplotlib : 타이틀(제목) 위치 설정하는 방법 - title matplotlib 라이브러리는 그래프를 쉽고 간단하게 그릴 수 있도록 기능을 제공하는 라이브러리인데요, 이번 글에서는 그래프에서 타이틀을 설정하고, 위치를 설정하는 방법에 대해서 살펴보도록 하겠습니다. 1. 타이틀 설정하기 우선, 그래프를 그려보도록 하겠습니다. import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y = [1, 4, 9, 16, 25] plt.plot(x,y) plt.show() 위 그래프는 타이틀이 설정되어 있지 않은 상태인데요, title() 함수를 추가해서 제목을 지정해보겠습니다. import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y = [1, 4, 9, 16, 25] plt.plot(x,y) pl.. 더보기
[데이터분석] matplotlib : 원형 마커로 그래프 나타내기 matplotlib 라이브러리로 그래프를 그릴 때, 특정한 설정이 없다면 선 그래프로 그려지는데요, 그래프를 원형 마커가 표시된 그래프로 나타낼 수 있답니다. 한번 아래 코드를 보면서 살펴보도록 하겠습니다. 먼저, 아래와 같이 기본적인 그래프를 그려보도록 하겠습니다. import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y = [1, 4, 9, 16, 25] plt.plot(x,y) plt.show() 그래프를 그리는 함수로 plot(x, y) 함수를 사용했는데요, 기본적으로 선 그래프로 나오는 것을 확인할 수 있습니다. 만약, 원형 마커로 찍힌 그래프로 그리고 싶다면 아래 코드처럼 plot() 함수를 plot(x, y, 'bo') 로 변경해서 입력하면 됩니다. i.. 더보기
[데이터분석] matplotlib : 사용 가능한 색깔, 선 종류, 마커 종류 표시 형식 알아보기 matplotlib 라이브러리는 그래프를 쉽고 간단하게 그릴 수 있게 도와주는 라이브러리로, 다양한 색깔과 선 종류, 그리고 여러 마커 종류를 사용하여 그래프를 그릴 수 있습니다. 하지만 사용 가능한 색깔이나 선 종류 또는 마커 종류를 모르면 그만큼 그래프를 다양하게 그릴 수 없습니다. 따라서 어떠한 색깔이 있고, 어떠한 선 종류와 마커 종류가 있는지 알아두는 게 많은 도움이 될 수 있습니다. 1. Colors 먼저 사용가능한 색깔은 다음과 같습니다. 표시 형식 color 'b' blue 'g' green 'r' red 'c' cyan 'm' magenta 'y' yellow 'k' black 'w' white 2. Line 그다음으로, 사용 가능한 선 종류는 다음과 같습니다. 표시 형식 설명 '-' s.. 더보기
[데이터분석] matplotlib : 축 범위 지정하는 방법 - axis() matplotlib 라이브러리를 이용하면 그래프를 쉽고 간단하게 그릴 수 있는데요, matplotlib 라이브러리에서는 x축과 y축의 범위를 지정하는 axis() 함수를 제공합니다. 그렇다면 axis() 함수로 어떻게 축 범위를 지정하는지 살펴보도록 하겠습니다. - axis() : 축 범위 지정하기 먼저, 간단한 그래프를 그려보도록 하겠습니다. import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y = [1, 8, 27, 64, 125] plt.plot(x,y) plt.show() 이 그래프를 보면, x축은 1에서 5까지, y축은 0에서 120까지로 범위가 지정되어 있는데요, 축 범위를 x축은 0에서 6까지, y축은 0에서 150까지로 axis() 함수를 이용해서.. 더보기
[데이터분석] matplotlib : 두 선 그래프 사이에 특정 영역 색칠하기 - fill_between 지난 글에서는 fill_between() 함수를 사용해서 선 그래프의 특정 구간을 색깔로 채우는 방법에 대해서 살펴보았는데요, 이번에는 두 선 그래프가 있을 때 그 사이 특정 영역에 색칠하는 방법에 대해서 살펴보도록 하겠습니다. - fill_between() : 두 선 그래프 사이에 특정 영역 색칠하기 먼저, matplotlib 라이브러리를 이용하여 두 개의 선 그래프를 그려보도록 하겠습니다. import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y1 = [1, 8, 27, 64, 125] y2 = [1, 16, 54, 128, 250] plt.xticks(np.arange(0,6,1)) plt.plot(x, y1) plt.plot(x, y2) plt.show() .. 더보기
[데이터분석] matplotlib : 그래프 특정 구간 색칠하기 - fill_between() matplotlib 라이브러리를 이용하여 그래프를 쉽고 간단하게 그릴 수 있는데요, matplotlib 라이브러리에서는 선그래프에서 특정 구간을 색칠해서 나타내는 함수 fill_between()을 제공합니다. 한 번 코드를 보면서 살펴보도록 하겠습니다. - fill_between() : 그래프 특정 구간 채우기 먼저, 그래프를 하나 만들어 보도록 하겠습니다. import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y = [1, 8, 27, 64, 125] plt.xticks(np.arange(0,6,1)) plt.plot(x,y) plt.show() 만약 이 그래프에서 x축의 2와 3 사이의 영역을 색칠하고 싶다면 fill_between() 함수를 사용하면 되는데요,.. 더보기
[데이터분석] 데이터프레임 : 특정 셀 배경색 설정하는 방법 - style, applymap 데이터프레임에서는 셀의 배경색, 폰트 사이즈, 폰트 색깔 등을 지정할 수 있는데요, 이번 글에서는 배경색을 설정하는 방법에 대해서 설명하도록 하겠습니다. - style.applymap() : 데이터프레임 셀 배경색 설정 style.applymap() 함수를 사용하여 셀 배경색을 쉽게 설정할 수 있는데요, 먼저 아래와 같은 데이터프레임이 있다고 가정해보겠습니다. 이 데이터프레임에서 만약 1번째 행 'price' 칼럼에 있는 데이터 '2000'의 배경색을 빨간색으로 지정하고 싶다면 아래와 같이 코드를 입력하면 됩니다. def color_cell(x,color): color = f'background-color:{color}' return color df.style.applymap(color_cell,colo.. 더보기
[데이터분석] 데이터프레임 : 랜덤으로 행 복제하는 방법 - sample 이전 글에서는 sample() 함수를 이용하여 원하는 개수 또는 원하는 비율만큼 랜덤으로 행을 추출하는 것에 대해서 알아보았는데요, 이번에는 원하는 비율만큼 랜덤으로 행을 복제해서 나타내는 방법에 대해서 살펴보도록 하겠습니다. - sample(frac= ) : 랜덤으로 행 복제하기 sample(frac= ) 함수는 데이터프레임에서 원하는 비율만큼 랜덤으로 행을 추출하는 함수로, 예를 들어 df라는 이름의 데이터프레임에서 25%만 랜덤으로 추출해서 보고 싶으면 다음과 같이 입력하면 됩니다. df.sample(frac=0.25) 즉, 50%는 df.sample(frac = 0.5), 75%는 df.sample(frac = 0.75) 라고 입력하면 되는데요, 그렇다면 frac의 값이 1을 넘어가게 되면 어떻게.. 더보기
[데이터분석] 데이터프레임 : 랜덤으로 행 출력하기 (원하는 비율) - sample 데이터프레임을 다양하게 변경할 때, 변경되었는지 확인하기 위해 head() 함수 또는 tail() 함수를 주로 사용합니다. 하지만 head() 함수와 tail() 함수는 상단 또는 하단에 있는 행만 보이기 때문에 중간에 데이터가 어떠한지 모를 수 있습니다. 따라서 데이터를 무작위로 추출하려면 sample() 함수를 사용하는 것이 적절한데요, 아래 코드를 보면서 설명드리도록 하겠습니다. 1. sample(n = 개수) : '개수'만큼 무작위로 행 추출하기 만약 df라는 데이터프레임이 있을 때, 10개의 행만 랜덤으로 추출해서 보고 싶다면, 다음과 같이 코드를 입력하면 됩니다. df.sample(n=10) 2. sample(frac = 비율) : '비율'만큼 무작위로 행 추출하기 반면, 개수를 지정하는 것 .. 더보기
[데이터분석] 데이터프레임 : 특정 문자열 또는 데이터가 있는 행 출력하기 - contains() 데이터프레임에서 특정 문자열이나 다른 데이터가 있는 행만 따로 출력되어서 보이도록 하려면 어떻게 해야 할까요? 바로, 이를 도와주는 함수가 contains() 이라는 함수인데요, contains() 함수를 이용해서 특정 텍스트 또는 텍스트열이 있는 행만 출력할 수 있답니다. 아래의 코드를 보면서 자세히 설명하도록 하겠습니다. - contains() : 특정 문자 또는 문자열이 포함된 데이터 찾기 먼저, 아래와 같은 데이터프레임이 있다고 가정해보겠습니다. # itempricecount 0ice water10001 1milk20005 2ice coffee30002 3ade40001 4latte50003 5ice tea60002 만약 이 데이터프레임의 'item' 칼럼에서 'ice'라는 문자열이 포함되어 있는.. 더보기