[데이터분석] 데이터프레임 : 특정 칼럼(열) 삭제하기 - drop()
데이터프레임으로 데이터 분석을 할 때, 필요 없는 칼럼은 삭제하는 게 좋은데요, drop() 함수를 사용하면 쉽게 칼럼을 삭제할 수 있습니다. 먼저, 아래와 같은 데이터프레임이 있다고 가정해보겠습니다. import pandas as pd df = pd.DataFrame( {'name': ['coffee', 'tea', 'juice','milk', 'ade'], 'price': [3000, 4000, 5000, 2000, 5000], 'rating': [4, 3.5, 3.7, 3, 2], 'category': [1,2,3,4,4]}) display(df) namepriceratingcategory 0coffee30004.01 1tea40003.52 2juice50003.73 3milk20003.04 4ad..
더보기
[데이터분석] 데이터프레임 : 특정 칼럼만 조회하기
데이터프레임으로 데이터분석을 할 때, 칼럼이 너무 많다면 필요 없는 칼럼은 없애거나 필요한 칼럼만 조회해서 사용하는 것이 더 효율적일 수 있는데요, 원하는 특정 칼럼만 조회하는 방법은 매우 간단하답니다. 먼저, 아래와 같은 데이터프레임이 있다고 가정해보겠습니다. import pandas as pd df = pd.DataFrame( {'name': ['coffee', 'tea', 'juice','milk', 'ade'], 'price': [3000, 4000, 5000, 2000, 5000], 'rating': [4, 3.5, 3.7, 3, 2], 'category': [1,2,3,4,4]}) namepriceratingcategory 0coffee30004.01 1tea40003.52 2juice5000..
더보기
[데이터분석] 데이터프레임 - 칼럼(열) 순서 바꾸기
데이터프레임은 칼럼(열)이 있는데요, 이 칼럼의 순서를 바꾸고 싶을 수 있습니다. 칼럼을 바꾸는 방법은 매우 쉬운데요, 우선, 다음과 같은 데이터프레임이 있다고 가정해보겠습니다. df = pd.DataFrame( {'name': ['coffee', 'tea', 'juice','milk', 'a.breeze'], 'price': [3000, 4000, 5000, 2000, 2000], 'rating': [4, 3.5, 3.7, 3, 2], 'category': [1,2,3,4,4]}) display(df) namepriceratingcategory 0coffee30004.01 1tea40003.52 2juice50003.73 3milk20003.04 4a.breeze 20002.04 위 데이터프레임을 보면..
더보기
[파이썬] 데이터프레임(dataframe) 지정된 행 삭제하기 - drop()
데이터프레임을 이용하여 데이터를 다룰 때, 특정 행을 지워야 할 수 있는데요, 이때 사용하는 함수가 바로 drop() 입니다. drop() 함수는 .drop([행번호]) 와 같이 사용할 수 있습니다. 예를 들어, 아래와 같은 데이터프레임이 있다고 가정해보겠습니다. import pandas as pd info = pd.DataFrame({'item' : ['coffee', 'tea', 'juice' ], 'price' : [3000, 4000, 5000], 'rating' : [4.0, 3.5, 3.7]}) info itempricerating 0coffee30004.0 1tea40003.5 2juice50003.7 위 데이터프레임에서 만약 인덱스가 1인 'tea'-'4000'-'3.5' 행을 지우고 싶다..
더보기
[파이썬] 데이터프레임(dataframe) 특정 조건을 만족하는 행 삭제하기 - drop()
데이터프레임으로 데이터를 가공할 때, 필요에 맞게 특정 조건을 만족하는 행을 삭제해야 하는 경우가 있습니다. 이때 drop() 함수를 사용하면 되는데요, 아래 예를 들면서 설명하도록 하겠습니다. 먼저, 아래와 같은 데이터프레임이 있다고 가정해보겠습니다. import pandas as pd info = pd.DataFrame({'item' : ['coffee', 'tea', 'juice', 'ade' ], 'price' : [3000, 4000, 5000, 6000], 'rating' : [4.0, 3.5, 3.7, 4.2]}) info itempricerating 0coffee30004.0 1tea40003.5 2juice50003.7 3ade60004.2 이때, 이 데이터프레임에서 만약 'price'가..
더보기