본문 바로가기

python

[파이썬] 데이터 프레임(dataframe), csv 또는 엑셀 파일로 저장하기 데이터프레임을 통해 데이터를 다룬 뒤, 이를 저장하기 위해선 csv 파일 또는 엑셀(excel, xls) 파일로 저장해야 하는데요, 'to_csv', 'to_excel' 이라는 모듈을 이용하여 데이터프레임을 각 csv 파일, 엑셀 파일로 저장할 수 있습니다. 1. to_csv : csv 파일로 저장하기 데이터프레임을 csv 파일로 저장해주는 'to_csv' 는 데이터프레임.to_csv("저장할 경로+파일명.csv") 와 같이 입력하면 되는데요, 만약 'subject' 라는 이름의 데이터프레임이 있을 때, 이 데이터프레임을 test 폴더에 "dataframe1" 이라는 이름의 csv 파일로 저장하려면 다음과 같이 코드를 입력하면 됩니다. subject.to_csv("c:\\test\\dataframe1.c.. 더보기
[파이썬] jupyter notebook에서 폴더 삭제하기 - rmdir, removedirs 폴더를 삭제해야 할 때, 폴더를 열어서 들어가는 것 보다 쥬피터 노트북에서 rmdir(), removedirs() 함수를 통해 쉽게 폴더를 삭제할 수 있습니다. 각 함수의 사용방법과 차이는 아래 코드를 보며 설명하도록 하겠습니다. 1. rmdir() rmdir() 함수는 os 라이브러리에서 제공하는 함수로, os.rmdir("삭제할 폴더의 경로") 와 같이 입력하여 사용합니다. 이때 삭제할 폴더 경로의 제일 마지막에 있는 폴더를 지워주게 됩니다. 예를 들어, 만약 c드라이브에서 'test1' 폴더에 있는 'test2' 폴더를 지우고 싶다면 아래와 같이 코드를 입력하면 됩니다. import os os.rmdir("c:\\test1\\test2") 위와 같이 입력하면, 제일 하위 폴더인 'test2' 폴더가.. 더보기
[파이썬] jupyter notebook에서 폴더 생성하기 - mkdir, makedirs 쥬피터 노트북에서 파일을 저장할 때, 폴더를 새로 생성하고 저장해야될 때가 있는데요, 폴더를 만들어주는 함수가 바로 OS 라이브러리의 mkdir(), makedirs() 함수입니다. 각 함수의 사용방법과 차이는 아래 코드를 보면서 살펴보도록 하겠습니다. 1. mkdir() mkdir() 함수는 폴더를 생성해주는 함수로, os.mkdir("경로+새폴더명") 의 형식으로 입력을 해주면 되는데요, 예를 들어 현재 c드라이브에 'test1'이라는 폴더가 있는데, 여기에 'test2' 라는 폴더를 생성하고 싶을 때 다음과 같이 입력하면 됩니다. import os os.mkdir("c:\\test1\\test2") 위와 같이 입력하고 실행하면, test1 폴더에 test2 폴더가 생성되었음을 확인할 수 있습니다. .. 더보기
[파이썬] 현재 위치 또는 특정 폴더의 목록(파일 이름) 리스트를 보고 싶다면? 파이썬에서 파일을 열 때, 그 파일의 이름과 파일 형식을 맞게 입력해야 하는데요, 파일의 이름을 모른다면 직접 폴더를 열어서 이름을 확인하는 과정을 거쳐야 합니다. 하지만 OS 라이브러리에서는 현재 위치 또는 특정 경로 폴더에 있는 파일의 이름을 출력해주는 함수를 제공하는데요, 바로 listdir() 라는 함수입니다. # os.listdir() listdir 함수를 사용하려면 먼저 os 라이브러리를 import 해주어야 합니다. 그다음, 현재 파이썬이 실행되고 있는 폴더의 파일 리스트를 보고 싶다면 다음과 같이 코드를 입력하면 됩니다. import os os.listdir() 위와 같이 입력하면, 현재 폴더에 있는 파일 명이 출력됩니다. 반면, 현재 폴더가 아닌, 다른 폴더에 있는 파일 리스트를 보고 싶.. 더보기
[파이썬] 문자 연산 : 한 번에 문자 여러 번 출력하기 ==================================================== ++++++++++++++++++++++++++++++++++++++++++++++++++++ ---------------------------------------------------------------------------------------- ********************************************************************** 문자를 위와 같이 여러 번 나태내고 싶을 때, print("==================")라고 입력해야 하나 싶지만, 문자를 여러 번 출력할 때 연산하듯 코드를 입력해서 출력할 수 있습니다. 아래 코드를 보면서 설명드리도록 하겠습니.. 더보기
[파이썬] 현재 폴더 경로/위치 찾는 방법 & 경로 바꾸는 방법 - getcwd(), chdir() 파이썬 쥬피터 노트북에서 특정 파일을 열어야 할 때, 현재 폴더 경로는 해당 파일이 있는 경로로 바꿔줘야 합니다. 그렇다면 현재 경로가 어디에 있는지, 또 경로는 어떻게 바꿔야 할지 알아야 하는데요, 'os' 라이브러리에 있는 getcwd(), chdir() 함수를 통해 알 수 있습니다. 1. getcwd() : 현재 경로 찾기 우선, getcwd() 함수를 이용하여 현재 경로를 알 수 있는데요, 먼저 os 라이브러리를 import 해야 합니다. 그리고나서 os.getcwd() 를 입력하면 현잭 폴더 경로가 출력됩니다. import os os.getcwd() 'C:\\Users\\dinolabs\\파이썬기초' 만약 열고 싶은 파일이 현재 폴더에 있다면 따로 경로변경 없이 파일을 여는 코드를 작성하면 됩니.. 더보기
[파이썬] 데이터프레임(dataframe) 지정된 행 삭제하기 - drop() 데이터프레임을 이용하여 데이터를 다룰 때, 특정 행을 지워야 할 수 있는데요, 이때 사용하는 함수가 바로 drop() 입니다. drop() 함수는 .drop([행번호]) 와 같이 사용할 수 있습니다. 예를 들어, 아래와 같은 데이터프레임이 있다고 가정해보겠습니다. import pandas as pd info = pd.DataFrame({'item' : ['coffee', 'tea', 'juice' ], 'price' : [3000, 4000, 5000], 'rating' : [4.0, 3.5, 3.7]}) info itempricerating 0coffee30004.0 1tea40003.5 2juice50003.7 위 데이터프레임에서 만약 인덱스가 1인 'tea'-'4000'-'3.5' 행을 지우고 싶다.. 더보기
[파이썬] 데이터프레임(dataframe) 특정 조건을 만족하는 행 삭제하기 - drop() 데이터프레임으로 데이터를 가공할 때, 필요에 맞게 특정 조건을 만족하는 행을 삭제해야 하는 경우가 있습니다. 이때 drop() 함수를 사용하면 되는데요, 아래 예를 들면서 설명하도록 하겠습니다. 먼저, 아래와 같은 데이터프레임이 있다고 가정해보겠습니다. import pandas as pd info = pd.DataFrame({'item' : ['coffee', 'tea', 'juice', 'ade' ], 'price' : [3000, 4000, 5000, 6000], 'rating' : [4.0, 3.5, 3.7, 4.2]}) info itempricerating 0coffee30004.0 1tea40003.5 2juice50003.7 3ade60004.2 이때, 이 데이터프레임에서 만약 'price'가.. 더보기
[파이썬] 데이터프레임(dataframe) 인덱스 설정 / 해제 - set_index, reset_index 데이터프레임을 다룰 때, 인덱스를 설정하는 일이 참 많은데요, 인덱스를 설정하려면 set_index, 해제하려면 reset_index 라고 입력하면 됩니다. 아래의 코드를 보며 살펴보도록 하겠습니다. 1. set_index : 인덱스 설정하기 set_index() 함수를 이용하여 인덱스를 설정할 수 있는데요, 인덱스로 설정할 칼럼 이름을 괄호 안에 입력해주면 된답니다. import pandas as pd info = pd.DataFrame({'item' : ['coffee', 'tea', 'juice' ], 'price' : [3000, 4000, 5000], 'rating' : [4.0, 3.5, 3.7]}) info itempricerating 0coffee30004.0 1tea40003.5 2jui.. 더보기
[파이썬] 평균 구하는 함수는? 숫자형 데이터를 연산하거나 처리할 때, 평균을 구해야 하는 경우가 종종 있습니다. 총합을 구하는 sum() 함수처럼, 평균을 구하는 함수 avg()도 있을 것 같지만 파이썬에는 평균을 구하는 함수가 없습니다. 그렇기 때문에 직접 평균을 구해야 합니다. 평균을 구하는 방법은 '데이터의 총합 / 데이터 개수'인데요, 이때 데이터의 총합은 sum() 함수를 이용하고, 데이터 갯수는 len() 함수를 이용하면 됩니다. 예를 들어, score = [50, 60, 70, 80]이라는 데이터가 있고, score의 평균을 구하고 싶다면 아래와 같이 코드를 작성하면 됩니다. score = [50, 60, 70, 80] avg = sum(score)/len(score) print(avg) 65.0 만약, 평균을 구해야 하.. 더보기