본문 바로가기

python

[데이터분석] 데이터프레임 : inplace = True 뜻 데이터프레임을 다루는 코드를 구글링 하다 보면, 해당 함수 안에 inplace = True 라는 코드가 입력되어 있는 것을 많이 볼 수 있는데요, inplace = True 란 무엇을 의미하는 걸까요? 먼저, 다음과 같은 데이터프레임이 있다고 가정해보겠습니다. import pandas as pd df = pd.DataFrame( {'name': ['coffee', 'tea', 'juice','milk', 'ade'], 'price': [3000, 4000, 5000, 2000, 5000], 'rating': [4, 3.5, 3.7, 3, 2], 'category': [1,2,3,4,4]}) display(df) namepriceratingcategory 0coffee30004.01 1tea40003.52.. 더보기
[데이터분석] 데이터프레임 : 특정 칼럼(열) 삭제하기 - drop() 데이터프레임으로 데이터 분석을 할 때, 필요 없는 칼럼은 삭제하는 게 좋은데요, drop() 함수를 사용하면 쉽게 칼럼을 삭제할 수 있습니다. 먼저, 아래와 같은 데이터프레임이 있다고 가정해보겠습니다. import pandas as pd df = pd.DataFrame( {'name': ['coffee', 'tea', 'juice','milk', 'ade'], 'price': [3000, 4000, 5000, 2000, 5000], 'rating': [4, 3.5, 3.7, 3, 2], 'category': [1,2,3,4,4]}) display(df) namepriceratingcategory 0coffee30004.01 1tea40003.52 2juice50003.73 3milk20003.04 4ad.. 더보기
[데이터분석] 데이터프레임 : 특정 칼럼(열) 기준으로 오름차순/내림차순 정렬하기 - sort_values() 데이터프레임으로 데이터 분석을 할 때, 필요 없는 칼럼은 제거하거나 특정 칼럼을 기준으로 정렬하는 등 데이터 전처리 과정을 거치게 되는데요, 이때 특정 칼럼(열) 기준으로 정렬을 하려면 어떻게 해야 할까요? 데이터프레임에는 sort_values() 라는 함수를 이용하여 정렬을 할 수 있는데요, 아래 코드를 보면서 설명드리도록 하겠습니다. - sort_values : 특정 칼럼 기준으로 정렬 먼저 다음과 같은 데이터프레임이 있다고 가정해보겠습니다. import pandas as pd df = pd.DataFrame( {'name': ['coffee', 'tea', 'juice','milk', 'ade'], 'price': [3000, 4000, 5000, 2000, 5000], 'rating': [4, 3.. 더보기
[데이터분석] 데이터프레임 : 특정 칼럼만 조회하기 데이터프레임으로 데이터분석을 할 때, 칼럼이 너무 많다면 필요 없는 칼럼은 없애거나 필요한 칼럼만 조회해서 사용하는 것이 더 효율적일 수 있는데요, 원하는 특정 칼럼만 조회하는 방법은 매우 간단하답니다. 먼저, 아래와 같은 데이터프레임이 있다고 가정해보겠습니다. import pandas as pd df = pd.DataFrame( {'name': ['coffee', 'tea', 'juice','milk', 'ade'], 'price': [3000, 4000, 5000, 2000, 5000], 'rating': [4, 3.5, 3.7, 3, 2], 'category': [1,2,3,4,4]}) namepriceratingcategory 0coffee30004.01 1tea40003.52 2juice5000.. 더보기
[데이터분석] 데이터프레임 - 칼럼(열) 순서 바꾸기 데이터프레임은 칼럼(열)이 있는데요, 이 칼럼의 순서를 바꾸고 싶을 수 있습니다. 칼럼을 바꾸는 방법은 매우 쉬운데요, 우선, 다음과 같은 데이터프레임이 있다고 가정해보겠습니다. df = pd.DataFrame( {'name': ['coffee', 'tea', 'juice','milk', 'a.breeze'], 'price': [3000, 4000, 5000, 2000, 2000], 'rating': [4, 3.5, 3.7, 3, 2], 'category': [1,2,3,4,4]}) display(df) namepriceratingcategory 0coffee30004.01 1tea40003.52 2juice50003.73 3milk20003.04 4a.breeze 20002.04 위 데이터프레임을 보면.. 더보기
[데이터분석] csv 파일 dataframe으로 불러오기 - pd.read_csv() 데이터 분석을 할 때, 데이터가 외부 파일인 csv 파일이라면 이를 불러와야 하는데요, 이때 csv 파일에 있는 데이터를 데이터프레임으로 전환해서 분석을 하려고 한다면 csv 파일을 불러오는 코드보다 바로 데이터프레임 형식으로 불러오는 방법이 좋은데요, 아래 코드를 보면서 설명드리도록 하겠습니다. - pd.read_csv() : csv 파일 dataframe 형식으로 불러오기 pandas 라이브러리에서 제공하는 pd.read_csv() 함수는 csv 파일을 바로 dataframe 형식으로 불러오는 함수입니다. 괄호 안에 파일 이름과 인코딩 정보를 입력하면 되는데요, 아래와 같이 코드를 작성하면 됩니다. import pandas as pd import csv df = pd.read_csv("test1.cs.. 더보기
[파이썬] 'cp949' codec can't decode byte 0xec in position 0: illegal multibyte sequence 에러, 해결 방법은? csv 파일을 열 때, 'cp949' codec can't decode byte 0xec in position 0: illegal multibyte sequence 와 같은 에러가 뜨는 경우가 있는데요, 이러한 경우는 인코딩에서 문제가 발생했다는 뜻입니다. 따라서 만약 csv 파일을 불러왔을 때 인코딩 설정 없이 다음과 같이 코드를 작성했었다면, import csv f = open(r"C\test\sample.csv") f_csv = csv.reader(f) 아래와 같이 코드를 수정해보시기 바랍니다. import csv f = open(r"C\test\sample.csv", encoding="utf-8") # encoding="utf-8" 추가하기 f_csv = csv.reader(f) 더보기
[파이썬] 주피터 노트북에서 csv, 엑셀 파일 열기 - open(), reader() 데이터프레임 등으로 데이터 분석을 할 때, 주로 csv 파일 또는 엑셀 형식의 파일을 불러와 데이터 분석을 하게 되는데요, 이때 csv 파일과 엑셀 파일을 어떻게 불러오는지 알아보도록 하겠습니다. 1. csv 파일 열기 먼저, csv 파일을 불러오려면 csv 라이브러리를 import 해야 합니다. open() 함수를 이용하여 파일을 열고 'f' 라는 변수에 저장하도록 하겠습니다. import csv f = open(r"C\test\sample.csv", encoding="utf-8") #파일이 있는 경로+파일이름.csv 그리고나서 csv.reader() 함수를 이용하여 csv 파일을 읽도록 합니다. f_csv = csv.reader(f) 이렇게 코드를 입력하면 f_csv 에는 csv 파일에 있는 데이터가.. 더보기
[파이썬] 리스트 인덱싱 기초 : list[-1] 이란? 리스트 안에 있는 데이터를 인덱싱 하는 것은 매우 간단하면서도 기초적인 것인데요, 간단하게 인덱싱 하는 방법에 대해 살펴보도록 하겠습니다. - 리스트(List) 인덱싱 하기 우선 다음과 같은 리스트 'list1'이 있다고 가정해보겠습니다. list1 = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9 ,10] 리스트에서 인덱스는 0부터 시작하는데요, 만약 두 번째 데이터를 갖고 오고 싶다면 인덱스가 1인 데이터를 찾아와야 합니다. 한편, 인덱싱 하는 방법은 리스트명[인덱스번호] 처럼 코드를 입력하면 됩니다. # 첫 번째 데이터 인덱싱 list1[0] # 두 번째 데이터 인덱싱 list1[1] 그렇다면, 리스트에 데이터가 몇 개 인지 모를 정도로 매우 많은데, 마지막에 있는 데이터를 인덱싱 하려면 어.. 더보기
[파이썬] 텍스트 파일 / 메모장 - 줄 바꿈('\n') 제거하고 읽기 이전 글에서는 텍스트 파일을 불러와 읽는 방법에 대해 살펴보았는데요, 여러 줄의 데이터가 있는 텍스트 파일을 불러와 읽으면 다음과 같이 '\n' 라는 문자도 함께 출력이 됩니다. file = open("c:\\Users\\Dinolabs\\Desktop\\test1.txt", 'rt') lines = file.readlines() print(lines) ['안녕하세요!\n', '디노랩스 블로그입니다\n', '언제든지 방문하세요!\n'] 한편, for문을 이용해서 출력을 해보겠습니다. for line in lines : print(line) 안녕하세요! 디노랩스 블로그입니다. 언제든지 방문하세요! for문을 이용해서 한 줄 씩 출력한 결과, '\n' 라는 문자가 마치 줄 바꿈으로 인식되어서 한 줄씩 띄어져.. 더보기