본문 바로가기

데이터프레임

[데이터분석] 데이터프레임 - 칼럼(열) 순서 바꾸기 데이터프레임은 칼럼(열)이 있는데요, 이 칼럼의 순서를 바꾸고 싶을 수 있습니다. 칼럼을 바꾸는 방법은 매우 쉬운데요, 우선, 다음과 같은 데이터프레임이 있다고 가정해보겠습니다. df = pd.DataFrame( {'name': ['coffee', 'tea', 'juice','milk', 'a.breeze'], 'price': [3000, 4000, 5000, 2000, 2000], 'rating': [4, 3.5, 3.7, 3, 2], 'category': [1,2,3,4,4]}) display(df) namepriceratingcategory 0coffee30004.01 1tea40003.52 2juice50003.73 3milk20003.04 4a.breeze 20002.04 위 데이터프레임을 보면.. 더보기
[데이터분석] csv 파일 dataframe으로 불러오기 - pd.read_csv() 데이터 분석을 할 때, 데이터가 외부 파일인 csv 파일이라면 이를 불러와야 하는데요, 이때 csv 파일에 있는 데이터를 데이터프레임으로 전환해서 분석을 하려고 한다면 csv 파일을 불러오는 코드보다 바로 데이터프레임 형식으로 불러오는 방법이 좋은데요, 아래 코드를 보면서 설명드리도록 하겠습니다. - pd.read_csv() : csv 파일 dataframe 형식으로 불러오기 pandas 라이브러리에서 제공하는 pd.read_csv() 함수는 csv 파일을 바로 dataframe 형식으로 불러오는 함수입니다. 괄호 안에 파일 이름과 인코딩 정보를 입력하면 되는데요, 아래와 같이 코드를 작성하면 됩니다. import pandas as pd import csv df = pd.read_csv("test1.cs.. 더보기
[파이썬] 데이터프레임 : 열(컬럼) 오름차순/내림차순으로 정렬 - sort_values() 데이터프레임에서 특정 열을 오름차순 또는 내림차순으로 정렬하고 싶다면, sort_values() 함수를 사용하면 되는데요, 아래 코드를 보며 설명드리도록 하겠습니다. - sort_values : 데이터프레임 컬럼 정렬하기 먼저, 다음과 같은 데이터프레임이 있다고 가정해보겠습니다. import pandas dict_list1 = [{'item' : 'coffee', 'price' : 3000}, {'item' : 'juice', 'price' : 5000}, {'item' : 'tea', 'price' : 4000}] list1 = pd.DataFrame(dict_list1) display(list1) itemprice 0coffee3000 1juice5000 2tea4000 그다음, 위 데이터프레임에서 .. 더보기
[파이썬] 데이터 프레임(dataframe), csv 또는 엑셀 파일로 저장하기 데이터프레임을 통해 데이터를 다룬 뒤, 이를 저장하기 위해선 csv 파일 또는 엑셀(excel, xls) 파일로 저장해야 하는데요, 'to_csv', 'to_excel' 이라는 모듈을 이용하여 데이터프레임을 각 csv 파일, 엑셀 파일로 저장할 수 있습니다. 1. to_csv : csv 파일로 저장하기 데이터프레임을 csv 파일로 저장해주는 'to_csv' 는 데이터프레임.to_csv("저장할 경로+파일명.csv") 와 같이 입력하면 되는데요, 만약 'subject' 라는 이름의 데이터프레임이 있을 때, 이 데이터프레임을 test 폴더에 "dataframe1" 이라는 이름의 csv 파일로 저장하려면 다음과 같이 코드를 입력하면 됩니다. subject.to_csv("c:\\test\\dataframe1.c.. 더보기
[파이썬] 데이터프레임(dataframe) 지정된 행 삭제하기 - drop() 데이터프레임을 이용하여 데이터를 다룰 때, 특정 행을 지워야 할 수 있는데요, 이때 사용하는 함수가 바로 drop() 입니다. drop() 함수는 .drop([행번호]) 와 같이 사용할 수 있습니다. 예를 들어, 아래와 같은 데이터프레임이 있다고 가정해보겠습니다. import pandas as pd info = pd.DataFrame({'item' : ['coffee', 'tea', 'juice' ], 'price' : [3000, 4000, 5000], 'rating' : [4.0, 3.5, 3.7]}) info itempricerating 0coffee30004.0 1tea40003.5 2juice50003.7 위 데이터프레임에서 만약 인덱스가 1인 'tea'-'4000'-'3.5' 행을 지우고 싶다.. 더보기
[파이썬] 데이터프레임(dataframe) 특정 조건을 만족하는 행 삭제하기 - drop() 데이터프레임으로 데이터를 가공할 때, 필요에 맞게 특정 조건을 만족하는 행을 삭제해야 하는 경우가 있습니다. 이때 drop() 함수를 사용하면 되는데요, 아래 예를 들면서 설명하도록 하겠습니다. 먼저, 아래와 같은 데이터프레임이 있다고 가정해보겠습니다. import pandas as pd info = pd.DataFrame({'item' : ['coffee', 'tea', 'juice', 'ade' ], 'price' : [3000, 4000, 5000, 6000], 'rating' : [4.0, 3.5, 3.7, 4.2]}) info itempricerating 0coffee30004.0 1tea40003.5 2juice50003.7 3ade60004.2 이때, 이 데이터프레임에서 만약 'price'가.. 더보기