본문 바로가기

BLOG/데이터 리뷰기

[데이터 리뷰] 농식품 빅데이터 거래소(3) - 외식 소비패턴 데이터

데이터 리뷰 : 데이터 대신 읽어드립니다!
#18 농식품 빅데이터 거래소(3) - 외식 소비패턴 데이터

 

 

 

 

 농림축산식품부는 2021년 외식 경향 트렌드의 키워드로 '홀로 만찬', '진화하는 그린슈머', '취향 소비', '안심 푸드테크', '동네 상권의 재발견'을 선정하였습니다. 이러한 키워드는 외식문화, 소비성향, 영업전략 등과 관련된 1,423개의 단어를 수집하고 그중 문헌조사와 전문가 설문조사 및 빅데이터 분석에 이어 소비자 설문 조사를 거쳐 최종 선정이 되었다고 합니다. 이렇게 소비자의 소비 분석과 외식 소비패턴을 분석하고 예측하는 것은 하나의 중요한 지표가 될 수 있습니다.

 

이와 관련해서 <농식품 빅데이터 거래소>에서는 '외식 소비패턴' 데이터를 제공하고 있는데요, 이 데이터를 읽어보고 어떻게 분석 및 활용하면 좋을지 생각해보도록 하겠습니다~!

 

 

 

 

 

외식 소비 패턴 데이터

 

(1) 데이터 정보

 

 '외식 소비 패턴' 데이터는 POS 데이터 중 큰 비중을 차지하고 있는 요식업 POS 가맹점에 대해 이용객의 소비 패턴을 파악하기 위해서 맛집 블로그 내용에 대한 수집을 시행한 데이터로, 음식 블로그 데이터 내에서 메뉴에 대한 언급 횟수를 수치화한 데이터입니다. 이렇게 수집된 데이터는 맛집 블로그의 내용을 크롤링하여 수집되었고, 텍스트 데이터에 대한 전처리와 개인정보 제거가 적용된 데이터라고 합니다!

 

한편, 위에 다운로드 링크로 들어가면 로그인 없이 무료로 해당 데이터를 다운받을 수 있는데요, 한번 2021년의 데이터를 다운받아 살펴보도록 하겠습니다!

 

 

(2) 데이터 리뷰

아래 이미지는 2021년 5월 데이터를 다운로드 받은 데이터의 일부분을 캡쳐한 것인데요, 한번 살펴볼까요~?

 

 

상단 쪽을 보면 칼럼명이 영어로 되어 있는데요, 데이터 다운로드 페이지에 있는 칼럼 설명을 참고하여 변경해보도록 하겠습니다.

 

 

변경한 후의 데이터 모습인데요, 훨씬 더 알아보기 쉬워졌습니다.

그렇다면 데이터를 자세히 살펴볼까요~?

 

먼저, 기준연월 칼럼은 POS 가맹점이 영업을 실시한 년월인데요, 2021년 5월 데이터를 다운받았기 때문에 2021년 5월의 데이터만 있는 것을 확인할 수 있습니다. 

 

두 번째로 메뉴코드는 메뉴명에 대한 분류코드로, 동일한 메뉴에 대해선 동일한 메뉴코드를 가지고, 갈비탕과 감자탕의 코드번호가 1자리만 다른 걸로 보아, 비슷한 결의 메뉴는 코드번호가 유사하다는 것을 발견할 수 있습니다.

 

세 번째로 메뉴명은 POS 기기에서 판매된 상품을 표준화된 메뉴로 분류한 칼럼인데요, 데이터에 이 메뉴명의 오름차순으로 데이터가 정렬되어 있답니다!

 

네 번째로 게시물 수 칼럼은 기준년월에 수집한 맛집 관련 블로그 게시글의 개수로 5월에는 611,631개의 게시글을 대상으로 데이터를 수집해서 그런지 모두 같은 값을 갖고 있네요~

 

마지막 칼럼은 게시물당 평균 언급 수 칼럼인데요, 이는 한 게시글에 메뉴가 언급된 평균 수로, 한 게시글 당 한 개의 메뉴 개수를 체크를 하며 계산된 데이터라고 합니다! 따라서 이 칼럼에서 수치가 높을수록 그 음식은 해당 기간 동안 맛집 블로그에 많이 작성된 것이라고 볼 수 있겠죠~? 그렇다면 이 칼럼을 기준으로 정렬을 다시 해볼까요~?

 

 

위 데이터는 게시물당 평균 언급 수 칼럼을 기준으로 내림차순 정렬했을 때 상위 20개의 데이터인데요, 데이터를 확인해보면 가장 많이 언급된 메뉴는 슈크림, 브라우니, 달콤한 빵이며, 그다음으론 국수, 칼국수, 수제비, 세 번째 순위는 샐러드인 것을 확인할 수 있습니다. 수치를 확인해보면 10개 중 1개가 해당 메뉴인 것 또한 알 수 있습니다.

 

 

(3) 데이터 활용

그렇다면 '외식 소비패턴 데이터'를 이용하여 어떻게 분석 및 활용할 수 있을까요?

 

먼저, 이 데이터로만 분석을 하고자 한다면, 날짜 칼럼, 품목명, 언급수 칼럼을 이용하여 분석을 할 수 있을 것인데요, 2020년부터 월별로 제공되는 데이터를 모두 이용하여, 어떤 메뉴의 소비가 증가하는지 또는 감소하는지를 분석할 수 있습니다. 꾸준히 상위에 있는 메뉴를 찾거나, 떠오르는 메뉴를 분석함으로써 소비자의 외식 패턴을 분석할 수 있지 않을까 싶습니다.

 

또는 추가로 데이터를 수집하여 결합해도 좋은 분석 결과가 나올 것 같은데요, 예를 들어 메뉴의 상위 카테고리(ex.분식류, 카페류, 탕류, 제과류)를 만들어 어떠한 카테고리가 요즘 트렌드인지, 트렌드의 변화가 어떠한지를 분석하여 앞으로 어떠한 카테고리가 뜰지 예측할 수 있는 근거자료가 될 수 있습니다. 또는 해당 메뉴의 평균 가격 데이터를 조사하여 소비 가격의 패턴이 어떻게 변화하는지, 가격이 영향을 미치는지도 분석하는 것도 좋은 결과를 도출할 수 있지 않을까 싶습니다!

 

 

 

 

 

# 농식품 빅데이터 거래소

 

https://kadx.co.kr/service/aboutus

 

이번 데이터 리뷰기에서 소개한 '외식 소비패턴 데이터'는 <농식품 빅데이터 거래소>에서 다운받은 데이터인데요, 농식품 빅데이터 거래소는 농식품 데이터를 온라인으로 판매하거나 구매할 수 있는 플랫폼으로 서비스 개발, 데이터 분석 등 사업에 필요한 데이터를 쉽게 사고팔 수 있는 플랫폼이라고 합니다!

 

 

농식품 빅데이터 거래소는 올해 생성된 플랫폼으로 현재 날짜 기준 약 200여 건의 데이터를 무료 또는 유료로 제공하고 있는데요, 다양한 농식품 분야에서의 데이터를 제공하고 있답니다!

 

이렇게 오늘 데이터 리뷰기에서는 농식품 빅데이터 거래소에서의 '외식 소비패턴 데이터'를 리뷰해보았는데요, 외식, 소비와 관련하여 다양한 데이터도 있으니 또 다른 데이터가 필요하신 분들은 해당 데이터 플랫폼에서 찾아보시기 바랍니다!

 

한편, 이전 데이터 리뷰기에는 소방, 사회범죄, 해양수산, 헬스케어 등 여러 플랫폼에서 제공하는 데이터의 리뷰기가 있으니, 관심 있으신 분들은 참조하시기 바랍니다!