본문 바로가기

BLOG/데이터 리뷰기

[데이터 리뷰] 서울특별시 빅데이터 캠퍼스(2) - 서울시 라이프 스타일 지수 데이터

 

데이터 리뷰 : 데이터 대신 읽어드립니다!
#58 서울특별시 빅데이터 캠퍼스(2) - 서울시 라이프 스타일 지수 데이터

 

 

 

 

 문화 활동이라고 하면 영화보기, 전시회가기 등이 있는데요, 요즘에에는 여러 맛집, 디저트 가게들을 방문하는 것도 하나의 문화 활동으로 여겨진다고 합니다. 특히 SNS나 각종 방송에서 맛집에 대한 정보가 흘러넘치면서 해당 맛집의 방문량이 증가하고 있으며, 맛집 방문을 SNS상에 인증하는 것이 하나의 트렌드가 되어가고 있습니다.

 

이와 관련하여 서울특별시 빅데이터 캠퍼스에서는 '서울시 라이프 스타일 지수' 데이터를 제공하고 있는데요, 서울시민들의 각 라이프 타입(혼자서 영화보기, 혼자서 전시 관람하기, 디저트를 위해 다른 농네 이동, 미식을 위해 다른 동네로 이동)에 대해 라이프 스타일 지수를 구축한 데이터셋입니다. 그럼 이번 데이터 리뷰기에서는 이 데이터가 어떻게 이루어져 있는지 살펴보고, 어떻게 분석 및 활용하면 좋을지 생각해보도록 하겠습니다!

 

 

 

 

 

서울시 라이프 스타일 지수 데이터

 

(1) 데이터 정보

  • 제공기관 : 다음소프트/신한카드
  • 데이터 종류 : 나홀로 영화 지수, 나홀로 전시 지수, 디저트 탐방 지수, 미식 탐방 지수, 견인요소, 매력도, 최종지표, 객단가 등
  • 데이터 형식 : csv
  • 데이터 칼럼 : 날짜, 주차, 행정구, 건수, 이동평균, SNS버즈량, 최종지표 등 
  • 다운로드 : https://bigdata.seoul.go.kr/data/selectSampleData.do?r_id=P213&sample_data_seq=51&tab_type=&file_id=&sch_text=&sch_order=H&currentPage=1

 

'서울시 라이프 스타일 지수' 데이터는 서울시에서 4가지 라이프 타입별 행정구 단위의 활성화 정도를 주차별 소비 건수, sns버즈량 등으로부터 산출한 지수를 구축한 데이터입니다. 각 라이프 타입으로는 혼자서 영화보기, 혼자서 전시 관람하기, 디저트를 위해 다른 동네로 이동하기, 미식을 위해 다른 동네로 이동하기의 4가지 상황으로 각 상황마다의 데이터 파일로 이루어져 있습니다. 한편, 지수화에 활용되는 데이터는 서울시민 라이프 타입별 sns언급량(다음소프트), 서울시 나홀로 소비한 신한카드 데이터(신한카드)이며, 서울시 3개 소업종의 품목별 구매 데이터와 공공 데이터를 보조적인 데이터로 활용하여 구축되었다고 합니다!

 

한편, 다운로드 링크로 들어가면 해당 데이터에 대한 페이지가 나오는데요, 서울특별시 빅데이터 캠퍼스에 있는 데이터는 모두 빅데이터 캠퍼스 방문 후 캠퍼스에서 제공하는 원본 데이터셋을 접속하여 이용하실 수 있습니다. 하지만 샘플 데이터를 미리 다운로드해서 데이터를 살펴볼 수 있는데요, 해당 데이터의 샘플 데이터를 다운로드하여 리뷰해보도록 하겠습니다!

 

 

(2) 데이터 리뷰

 데이터는 각 라이프 타입별(영화/전시/디저트/미식)로 파일이 이루어져 있는데요, 이번 리뷰기에서는 대표적으로 나홀로 영화 지수 데이터를 살펴보겠습니다.

 

 

#나홀로 영화 지수 데이터

 

 

위 데이터는 나홀로 영화 지수 데이터의 일부를 캡쳐한 것인데요, 첫 행 첫 열에 있는 날짜 칼럼부터 마지막 객단가 칼럼까지 총 33개의 칼럼으로 이루어져 있습니다. 라이프 스타일 지수의 활성화 정도가 주차별 소비 건수, sns버즈량 등으로 산출되었기 때문에 해당 주차, SNS버즈량 칼럼 수치를 확인할 수 있습니다. 한편 견인요소A, B, C 등은 지수화에 활용된 sns언급량(다음소프트), 신한카드 데이터, 롯데멤버스에 제공한 품목별 구매 데이터와 공공 데이터 등에 대한 요소를 의미합니다. 뒷 부분 칼럼으로는 최종지표, 최종지표_이동평균, 객단가 수치가 있는 것을 확인할 수 있습니다.

 

한편 최종지표가 모든 요소들을 포함하여 나타낸 수치로, 그 값이 크면 서울시민들이 많이 이용했음을 뜻하는데요, 최종지표를 기준으로 가장 높은 순대로 정렬을 해보겠습니다.

 

 

위에 이미지에서 첫 번째 이미지는 상위 최종지표 5개, 그 아래 이미지는 하위 최종지표 5개 입니다. 최종지표 수치를 보면 1 이상의 차이가 나는 것을 확인할 수 있는데요, 각 칼럼에 있는 요소들도 서로 큰 차이를 보이는 것을 확인할 수 있습니다. 특히 sns버즈량, 이동평균, 견인요소에서 큰 차이를 보이는 반면, 주차 요소와 객단가 요소는 크게 상관관계가 없는 것 같습니다. 하지만 전체적인 데이터가 아니라 일부 데이터만으로 정렬한 것이라 정확한 판단은 전체 데이터를 두고 각 요소들 간의 상관관계를 분석해야 할 것 같습니다 :D

 

 

(3) 데이터 활용

 그렇다면 '서울시 라이프 스타일 지수' 데이터를 이용하여 어떻게 분석 및 활용할 수 있을까요?

우선 해당 데이터는 영화, 전시, 디저트 및 미식 탐방과 같은 라이프 타입에 대해 각 관련 요소들을 종합하여 라이프 스타일 지수를 수치화한 데이터로, 각 날짜 및 행정구에 따른 라이프 스타일 지수를 알 수 있습니다. 이러한 정보를 토대로 다양한 분석을 도출해낼 수 있는데요, 예를 들어 특정 행정구에서 시간의 흐름에 따른 라이프 스타일 지수 변화, 동일 특정 날짜에 행정구별 라이프 스타일 지수 분포도 등을 분석할 수 있습니다. 

 

또한 각 요소의 수치들이 최종지표에 어떠한 영향을 미치는지 분석을 통해, 라이프 스타일 지수가 낮은 곳을 활성화시킬 수 있는 보완책을 마련하거나, 라이프 스타일 지수가 높은 곳을 더 활성화시킬 수 있는 방안을 마련할 수 있지 않을까 싶습니다! 마지막으로는 각 영화/전시/디저트/미식 데이터를 모두 이용하여 각 라이프스타일의 수치 변화를 분석하여 서울시민들의 라이프 트렌드를 분석 및 예측할 수 있지 않을까 싶습니다~

 

 

 

 

 

# 서울특별시 빅데이터 캠퍼스

 

 

 오늘 리뷰한 '서울시 라이프 스타일 지수' 데이터는 <서울특별시 빅데이터 캠퍼스>에서 다운로드 받은 데이터로, 서울특별시 빅데이터 캠퍼스는 서울특별시와 관련된 데이터를 수집하여 개방 및 공유하는 플랫폼입니다. 데이터 종류로는 캠퍼스 내 폐쇄 정보통신망에서 데이터 열람이 가능하도록 원천 기관의 동의를 취득한 공공 데이터와, 제3권리자의 동의를 취득한 민간 데이터로 이루어져 있습니다.

 

 

 한편 서울특별시 빅데이터 캠퍼스에는 수집된 데이터를 체계적으로 관리하고 제공하기 위해 빅데이터캠퍼스에서 제공하고 있는 분석 환경과 데이터는 이용 신청 후 방문 시 이용이 가능하답니다. 또한 빅데이터 캠퍼스 방문 후 캠퍼스에서 제공하는 원본 데이터셋을 접속 및 이용하는 방법은 원본파일서버, 원본DB서버, 하둡파일시스템(DB) 등의 3가지 방법이 있으며, 캠퍼스 내에서 제한 없이 사용할 수 있답니다. 그밖에도 아래와 같이 카테고리 및 제공 형식 검색을 통해 원하는 데이터를 쉽게 찾을 수 있답니다.

 

 

이렇게 오늘 데이터 리뷰기에서는 서울특별시 빅데이터 캠퍼스의 '서울시 라이프 스타일 지수' 데이터를 리뷰해보았는데요, 다음 리뷰기에서는 서울특별시 빅데이터 캠퍼스에 있는 다른 데이터에 대해 리뷰하도록 하겠습니다. 이전 데이터 리뷰기에서는 AIHUB, 소방, 사회 범죄, 해양수산, 헬스케어, 농수산물 등 여러 플랫폼에서 제공하는 데이터 리뷰기가 있으니, 관심이 있으신 분들은 참조하시기 바랍니다! 그럼 다음 리뷰기에서 만나요! :D