본문 바로가기

BLOG/데이터분석

[데이터분석] csv 파일 dataframe으로 불러오기 - pd.read_csv()

 

데이터 분석을 할 때, 데이터가 외부 파일인 csv 파일이라면 이를 불러와야 하는데요, 이때 csv 파일에 있는 데이터를 데이터프레임으로 전환해서 분석을 하려고 한다면 csv 파일을 불러오는 코드보다 바로 데이터프레임 형식으로 불러오는 방법이 좋은데요, 아래 코드를 보면서 설명드리도록 하겠습니다.

 

 

- pd.read_csv() : csv 파일 dataframe 형식으로 불러오기

pandas 라이브러리에서 제공하는 pd.read_csv() 함수는 csv 파일을 바로 dataframe 형식으로 불러오는 함수입니다.

괄호 안에 파일 이름과 인코딩 정보를 입력하면 되는데요, 아래와 같이 코드를 작성하면 됩니다.

 

import pandas as pd
import csv

df = pd.read_csv("test1.csv', encoding='utf-8')

 

위와 같이 입력하면, 현재 있는 폴더에서 'test1.csv' 파일을 'df' 라는 이름으로 데이터프레임 형식으로 저장하게 됩니다.

 

이때 만약 csv 파일이 현재 폴더가 아닌 다른 폴더에 있다면 os 라이브러리를 통해 현재 폴더 위치를 바꿔준 다음에 위 코드를 입력하면 되는데요, 아래와 같이 코드를 입력하면 됩니다.

 

import os
import csv
import pandas as pd

os.chdir(r"C:\\Users\\DATA")

df = pd.read_csv("test1.csv", encoding=utf-8")

 

 

이렇게 csv 파일을 데이터프레임 형식으로 한 번에 불러오는 방법에 대해 살펴보았는데요, 실제 csv 파일을 불러와서 이를 데이터프레임으로 바꾸는 것보다 한 번에 데이터프레임으로 불러오는 것이 효율적이기 때문에 잘 기억하고 사용하시기 바랍니다!