본문 바로가기

데이터

[데이터분석] 데이터프레임 : 한 칼럼(열)에 특정한 값 있는지 조회하는 방법 데이터프레임에서 한 칼럼에 특정한 데이터가 있는지 확인할 수 있는데요, 먼저 아래와 같은 데이터프레임(df)이 있다고 가정해보겠습니다. itemcountpricerating 0coffee130004.5 1juice540003.0 2ade250004.0 3milk130002.5 4tea340003.0 5water210004.5 위 데이터프레임은 데이터의 양이 많지 않아서 한눈에 다 들어오지만 모른다 가정할 때, 'item' 칼럼에 'milk' 라는 데이터가 있는지 확인하는 코드는 다음과 같습니다. df['item'] == 'milk' df['칼럼명'] == '찾을 데이터' 와 같이 입력하면 아래와 같이 출력되는데요, 해당하는 값이 있으면 True, 없으면 False를 반환합니다. 0 False 1 Fals.. 더보기
[데이터분석] 데이터 프레임 : 두 개의 칼럼(열) 합치기 (문자열 데이터) - map() 데이터 프레임에서 문자열 데이터(텍스트)가 있는 두 열이 있을 때, 이 두 열을 합치고 싶다면 어떻게 해야 할까요? 바로, map() 함수를 사용하면 쉽게 열을 합칠 수 있는데요, 아래 코드를 보면서 설명드리도록 하겠습니다. 1. 두 개의 칼럼 합치기 먼저, 아래와 같이 'df' 라는 이름의 데이터 프레임이 있다고 가정해보겠습니다. tempitemcountpricerating 0hotcoffee130004.5 1icejuice540003.0 2iceade250004.0 3hotmilk420002.5 4hottea340003.0 5icewater210004.5 위 데이터프레임을 보면, 'temp' 칼럼과 'item' 칼럼에 문자열 데이터가 있음을 확인할 수 있습니다. 여기서 텍스트 데이터로 이루어진 열을 .. 더보기
[파이썬] 리스트 안에 있는 데이터 빈도 수 구하기 - Counter() 리스트에 중복된 데이터가 있는 경우, 데이터의 빈도수를 구하고 싶다면 어떡해야 할까요? 바로, Counter 라는 라이브러리를 사용하면 되는데요, 아래 코드를 보면서 설명드리도록 하겠습니다. - Counter() : 리스트 데이터 빈도수 구하기 Counter 라이브러리는 리스트 안에 있는 데이터의 빈도수를 구한 뒤 딕셔너리 형태로 반환해주는 함수를 제공하는데요, 아래와 같은 중복된 데이터가 있는 리스트가 있다고 가정해보겠습니다. a = ['커피', '쿠키', '차', '케잌', '커피', '차', '케잌', '쥬스', '커피', '쥬스', '차'] 이제 'a' 리스트에 있는 데이터의 빈도 수를 구하기 위해 Counter() 함수를 사용해보겠습니다. 이때 Counter() 함수를 사용하기 위해 Counte.. 더보기
[파이썬] 문자열 길이 & 리스트 안 데이터 개수 구하기 - len() 문자열 길이나 리스트 안에 있는 데이터의 개수 및 크기를 구할 땐 len() 함수를 사용하면 되는데요, 아래 코드를 보면서 설명드리도록 하겠습니다. 1. 문자열 길이 구하기 먼저, 아래와 같은 텍스트가 있다고 가정하겠습니다. text1 = "안녕하세요! 디노랩스 블로그입니다." 이제 이 텍스트의 문자열 길이를 구하고 싶다면 len() 함수를 이용하여 아래와 같이 입력하면 됩니다. num = len(text1) print(num) 19 출력된 값을 보면 19로, 알맞게 문자열의 길이를 잘 구한 것을 확인할 수 있습니다. 이때 띄어쓰기도 한 글자로 포함이 된답니다. 2. 리스트 안에 있는 데이터 개수 구하기 반면, 리스트 안에 데이터가 몇 개 있는지도 len() 함수를 이용하여 구할 수 있는데요, 다음과 같.. 더보기
[파이썬] 평균 구하는 함수는? 숫자형 데이터를 연산하거나 처리할 때, 평균을 구해야 하는 경우가 종종 있습니다. 총합을 구하는 sum() 함수처럼, 평균을 구하는 함수 avg()도 있을 것 같지만 파이썬에는 평균을 구하는 함수가 없습니다. 그렇기 때문에 직접 평균을 구해야 합니다. 평균을 구하는 방법은 '데이터의 총합 / 데이터 개수'인데요, 이때 데이터의 총합은 sum() 함수를 이용하고, 데이터 갯수는 len() 함수를 이용하면 됩니다. 예를 들어, score = [50, 60, 70, 80]이라는 데이터가 있고, score의 평균을 구하고 싶다면 아래와 같이 코드를 작성하면 됩니다. score = [50, 60, 70, 80] avg = sum(score)/len(score) print(avg) 65.0 만약, 평균을 구해야 하.. 더보기
[파이썬] 딕셔너리 : 데이터 삭제하기 - del - 딕셔너리 : del을 사용하여 데이터 삭제하기 딕셔너리 형태의 데이터를 다루다 보면 데이터를 삭제해야 할 일도 생기곤 하는데요, 딕셔너리 안에 있는 데이터를 지우고 싶다면 del 함수를 이용하여 지울 수 있습니다. del 함수는 del['key이름'] 을 통해 데이터를 지울 수 있는데요, 아래의 코드를 통해 살펴보도록 하겠습니다. price = {'coffee' : 3000, 'tea' : 4000, 'juice' : 5000} 만약 위와 같은 딕셔너리 데이터가 있고, 여기서 'tea'라는 데이터를 지우고 싶다면 아래와 같이 코드를 작성하면 됩니다. del(price['tea']) 위와 같이 입력한 뒤, 다시 price 딕셔너리를 확인해보면 'tea' 항목이 삭제된 것을 확인할 수 있습니다. 더보기
[파이썬] 리스트 길이만큼 for문 반복하기 코딩을 하다 보면, 리스트에 있는 데이터의 수만큼 for문을 반복하는 경우가 많은데요, 데이터 항목의 길이를 구하는 len() 함수를 이용하면 쉽게 표현할 수 있습니다 list1 = [15, 34, 64, 37, 83, 25, 62, 98, 46] 먼저, 위와 같이 9개의 숫자 데이터를 담고 있는 list1 가 있고, 이 리스트 안에 있는 값을 차례로 출력하고 싶다면 for문을 사용하면 되는데요, 이때 for문에는 반복할 범위(range)를 지정해주어야 합니다. 9번을 반복하면 되기 때문에 아래와 같이 코드를 작성해도 되지만, 데이터가 너무 많아 그 길이를 알 수 없을 수 있습니다. for i in range(9) : print(list1[i]) 따라서 len() 함수를 이용하면 되는데요, len() 함.. 더보기
[파이썬] sort 로 리스트 정렬하기 (+ reverse) sort() 함수를 사용하면 리스트 안에 있는 숫자, 알파벳, 한글 데이터를 쉽게 정렬할 수 있는데요, 코드를 통해 어떻게 사용하는지 살펴보도록 하겠습니다. sort() 1. 숫자 데이터 정렬 list1 = [ 2, 6, 5, 1, 7, 3, 8, 9, 4 ] 만약 위와 같이 리스트 안에 숫자 데이터가 무작위로 나열되어 있는 것을 오름차순(1,2,3,,,)으로 정렬하고 싶다면 다음과 같이 코드를 작성하면 됩니다. list1.sort() print(list1) [1, 2, 3, 4, 5, 6, 7, 8, 9] 한편, 리스트를 내림차순(9,8,7,,,) 으로 정렬하고 싶으면 sort() 함수 안에 reverse=True 를 작성하여 넣어주면 됩니다. list1.sort(reverse=True) print(l.. 더보기
[파이썬] remove와 del의 차이는? / 리스트 데이터 삭제하기 remove() 와 del() 함수는 리스트에 있는 데이터를 삭제할 때 사용되는 함수입니다. remove()는 리스트에 있는 특정 데이터의 항목명으로 삭제할 때 사용하고, del()은 특정 데이터의 항목 번호로 삭제하는 함수인데요, 각 함수의 사용 방법을 살펴보면서 차이를 알아보도록 하겠습니다. 1. remove() remove() 함수는 list.remove('항목명') 로 사용되며, 리스트 안에 있는 데이터의 이름을 알고 있고, 그 데이터를 삭제할 때 사용됩니다. 아래 코드를 보며 설명하도록 하겠습니다. list1 = ['바나나', '오렌지', '사과', '수박' ] list1.remove('사과') print(list1) ['바나나', '오렌지', '수박'] 위 코드처럼 '사과' 라는 항목을 지우고.. 더보기
[파이썬] append와 insert의 차이는? / 리스트에 항목 추가하기 append()와 insert() 함수는 리스트에 항목을 추가할 때 사용됩니다. append()는 list 또는 array 가장 마지막에 원소를 하나 추가해주는 반면, insert()는 원하는 위치에 원소를 추가해주는데요, 각 함수의 사용 방법을 살펴보면서 차이를 알아보도록 하겠습니다. 1. append() append() 함수는 리스트 가장 마지막에 항목을 하나 추가해주는 함수로 list.append('항목') 처럼 작성하면 됩니다. 예를들어 설명해보겠습니다. list1 = ['바나나', '오렌지', '사과' ] list1.append('수박') print(list1) ['바나나', '오렌지', '사과', '수박'] 위 코드처럼 list1.append('수박')을 하면 리스트 list1의 마지막 항목으.. 더보기