[파이썬] 데이터프레임(dataframe) 지정된 행 삭제하기 - drop()
데이터프레임을 이용하여 데이터를 다룰 때, 특정 행을 지워야 할 수 있는데요, 이때 사용하는 함수가 바로 drop() 입니다. drop() 함수는 .drop([행번호]) 와 같이 사용할 수 있습니다. 예를 들어, 아래와 같은 데이터프레임이 있다고 가정해보겠습니다. import pandas as pd info = pd.DataFrame({'item' : ['coffee', 'tea', 'juice' ], 'price' : [3000, 4000, 5000], 'rating' : [4.0, 3.5, 3.7]}) info itempricerating 0coffee30004.0 1tea40003.5 2juice50003.7 위 데이터프레임에서 만약 인덱스가 1인 'tea'-'4000'-'3.5' 행을 지우고 싶다..
더보기
[파이썬] 데이터프레임(dataframe) 특정 조건을 만족하는 행 삭제하기 - drop()
데이터프레임으로 데이터를 가공할 때, 필요에 맞게 특정 조건을 만족하는 행을 삭제해야 하는 경우가 있습니다. 이때 drop() 함수를 사용하면 되는데요, 아래 예를 들면서 설명하도록 하겠습니다. 먼저, 아래와 같은 데이터프레임이 있다고 가정해보겠습니다. import pandas as pd info = pd.DataFrame({'item' : ['coffee', 'tea', 'juice', 'ade' ], 'price' : [3000, 4000, 5000, 6000], 'rating' : [4.0, 3.5, 3.7, 4.2]}) info itempricerating 0coffee30004.0 1tea40003.5 2juice50003.7 3ade60004.2 이때, 이 데이터프레임에서 만약 'price'가..
더보기
[파이썬] 데이터프레임(dataframe) 인덱스 설정 / 해제 - set_index, reset_index
데이터프레임을 다룰 때, 인덱스를 설정하는 일이 참 많은데요, 인덱스를 설정하려면 set_index, 해제하려면 reset_index 라고 입력하면 됩니다. 아래의 코드를 보며 살펴보도록 하겠습니다. 1. set_index : 인덱스 설정하기 set_index() 함수를 이용하여 인덱스를 설정할 수 있는데요, 인덱스로 설정할 칼럼 이름을 괄호 안에 입력해주면 된답니다. import pandas as pd info = pd.DataFrame({'item' : ['coffee', 'tea', 'juice' ], 'price' : [3000, 4000, 5000], 'rating' : [4.0, 3.5, 3.7]}) info itempricerating 0coffee30004.0 1tea40003.5 2jui..
더보기
[파이썬] 평균 구하는 함수는?
숫자형 데이터를 연산하거나 처리할 때, 평균을 구해야 하는 경우가 종종 있습니다. 총합을 구하는 sum() 함수처럼, 평균을 구하는 함수 avg()도 있을 것 같지만 파이썬에는 평균을 구하는 함수가 없습니다. 그렇기 때문에 직접 평균을 구해야 합니다. 평균을 구하는 방법은 '데이터의 총합 / 데이터 개수'인데요, 이때 데이터의 총합은 sum() 함수를 이용하고, 데이터 갯수는 len() 함수를 이용하면 됩니다. 예를 들어, score = [50, 60, 70, 80]이라는 데이터가 있고, score의 평균을 구하고 싶다면 아래와 같이 코드를 작성하면 됩니다. score = [50, 60, 70, 80] avg = sum(score)/len(score) print(avg) 65.0 만약, 평균을 구해야 하..
더보기
[파이썬] 딕셔너리에 value로 있는 리스트 데이터, 오름차순 정렬 하려면?
딕셔너리에는 value 값으로 리스트가 들어갈 수 있는데요, 만약 value로 있는 리스트 데이터를 오름차순 정렬하려면 어떻게 해야 할까요? 바로, 리스트 데이터가 있는 value 값을 선택하고 sort() 함수를 이용하여 정렬하면 되는데요, 아래 코드를 보면서 설명드리도록 하겠습니다. student = {'class' : 'A', 'score' : [80, 30,50, 60, 20, 70, 40]} 만약 위와 같은 'student'라는 데이터 프레임이 있을 때, 'score'에 해당하는 value값(리스트)을 정렬하고 싶다면 아래와 같이 코드를 작성하면 됩니다. student['score'].sort() student {'class': 'A', 'score': [20, 30, 40, 50, 60, 70..
더보기
[파이썬] 딕셔너리를 요소로 갖는 리스트, 동일한 key를 기준으로 정렬하려면? - sort()
딕셔너리 형태의 데이터를 다룰 때 참 다양한 형태들이 있는데요, 그중 딕셔너리를 요소로 갖는 리스트를 정렬하는 방법을 살펴보도록 하겠습니다. 보통 딕셔너리라고 하면 dictionary1 = {'A' : 100, 'B' : 50, 'C' : 90} 이런 형태인데요, 이번 포스팅에서 설명하는 데이터 형태는 다음과 같습니다. list1 = [{'A' : 100, 'B' : 70}, {'A' : 60, 'B' : 90}, {'A' : 50, 'B' : 70}] 이러한 형태는 주로 전화번호부, 학급별 점수 등에서 볼 수 있는데요, 이때 특정 key를 기준으로 딕셔너리들을 정렬해야 하는 경우가 있습니다. 이러한 경우 정렬을 해주는 sort() 함수를 이용하면 되는데요, list.sort(key=lambda x:x[..
더보기