본문 바로가기

BLOG/데이터 리뷰기

[데이터 리뷰] 스마트 치안 분야 공공 데이터 (3)몰래카메라 촬영 융합데이터

데이터 리뷰 : 데이터 대신 체험해드립니다!
#3 스마트 치안 빅데이터 플랫폼_몰래카메라 촬영 융합데이터

 

 

요즘 카메라를 이용 및 설치하여 몰래 촬영을 하고, 해당 영상을 인터넷에 업로드하는 등, 몰카 관련 범죄에 따른 피해가 계속 발생되고 있는데요, 피해를 막고, 사전 범죄 예방을 위해선 범죄 발생과 관련한 영향요소 분석이 중요할 수 있습니다.

 

따라서 이번 데이터 리뷰기에서는 '스마트 치안 빅데이터 플랫폼'에서 제공하는 카메라 이용 촬영 범죄와 관련된 통계 데이터 2건을 읽어보고, 몰카 범죄 발생과 영향 요소 간의 상관관계를 찾는 데이터 분석 방안을 함께 생각해보도록 하겠습니다!

 

 

 

 

카메라 이용 촬영 범죄 데이터

 

 이번 데이터 리뷰기에서 읽을 데이터는 총 2개로,

2019년 1월 1일부터 12월 31일까지 전국에서 발생한 카메라 이용 촬영 범죄 통계자료와,

2019년 12월 1일부터 12월 31일까지 경찰관서별 몰래카메라 범죄가 발생한 영향요소 융합데이터입니다.

 

 

(1) 상세통계자료(카메라등이용촬영)

 

 먼저 첫 번째로 읽을 데이터는 전국에서 발생한 카메라 등 이용촬영 범죄 통계데이터로, 성폭력 등 심각 성범죄의 예방 및 초기 진압을 위한 통계자료 제공 목적으로 경찰청 경찰대학에서 제공된 데이터입니다. 링크를 타고 들어가면, 스마트치안플랫폼에서 해당 데이터를 다운로드할 수 있는데요, 다운로드하여보도록 하겠습니다.

 

데이터를 다운로드하면 아래와 같이 csv 파일이 열립니다.

 

 

첫 번째 칼럼과 두 번째 칼럼은 발생년월, 경찰서명을 나타낸다는 것을 유추할 수 있지만 그 외 다른 컬럼은 무슨 정보를 의미하는지 알 수 없는데요, 이러한 경우엔 보통 데이터를 다운로드한 사이트에 설명이 되어있답니다.

 

아래 컬럼정의서는 데이터를 다운로드 받은 페이지에 있는 컬럼정의서랍니다!

 

 

그러면 이제 csv파일에 첫 번째 행에 각 컬럼명을 작성해보도록 하겠습니다.

 

 

이렇게 정리하면 훨씬 데이터를 쉽게 파악할 수 있겠죠~?

컬럼정의서와 데이터를 살펴본 결과, 데이터를 1)발생요일, 2)발생시간대, 3)수사단서정보로 나누어 살펴보도록 하겠습니다.

 

 

1) 발생건수, 발생요일

 

(일부분만을 캡쳐한 이미지입니다)

 

먼저, 카메라 이용촬영 범죄 발생건에 대해서 전체 건수와 발생요일에 따라 데이터가 정리되어 있는데요, 데이터를 전체적으로 확인해보면, 주로 서울, 수도권, 광역시에서 많이 발생되었음을 확인할 수 있습니다. 한편, 발생요일을 눈으로 확인해보면, 어느 요일에 주로 발생했는지 특정할 수는 없는데요, 이 부분에 대해서는 데이터 분석을 해보아야 할 것 같습니다!

 

 

 

2) 발생시간대

 

 

두 번째로 발생시간대 부분을 보면, 시간별로 정리되어 있는 것을 확인할 수 있는데요, 발생시간대 역시 다양하게 분포되어 있는 것을 보면, 상관관계를 찾기 위해선 더 구체적인 분석기법이 필요할 것 같아 보이네요.

 

 

 

3) 수사단서정보

 

 

마지막으로 수사단서정보에 대한 데이터도 있는데요, 피해자신고, 여죄, 현행범, 고소, 탐문정보, 타인신고, 불심건문, 진정, 기타별로 분류되어 있습니다. 데이터를 보면 피해자신고로 접수된 건이 가장 많고, 불심건문으로 접수된 건이 가장 적네요!

 

 

 

(2) 몰래카메라 영향요소 융합데이터

 

 그다음으로 읽을 데이터는 몰래카메라 영향요소 융합데이터로, 경찰관서별, 몰래카메라가 발생한 요일, 시간대, 관할지역 소득수준, 상주인구 데이터를 담고 있는 데이터입니다.

 

마찬가지로 데이터를 다운로드하면 아래와 같이 csv 파일이 열립니다. 첫 번째 데이터와 같이 칼럼정의서를 비교하여 첫 번째 행에 추가로 입력해봤습니다.

 

 

컬럼을 확인한 결과, 마찬가지로 크게 발생경찰서별 발생건수, 발생요일, 발생시간대, 그리고 월 평균 소득 금액 및 총 상주인구 수로 나눠서 살펴볼 수 있을 것 같네요!

 

 

1) 발생건수, 발생요일

 

 

먼저, 발생건수를 보면 아무래도 2019년 12월에만 한정된 데이터다 보니 수치가 낮아 분석이 쉽지는 않아 보입니다. 크게 구역을 나눠서 수치를 비교해봐야 할 것 같습니다.

 

 

 

2) 발생시간대

 

 

해당 데이터 역시 시간별로 나누어져 데이터가 정리되어 있습니다. 마찬가지로 데이터 건수가 적어서 분석이 쉬워 보이진 않습니다.

 

 

 

3) 월 평균 소득 금액, 총 상주인구 수

 

 

마지막으로 살펴볼 컬럼은 월 평균 소득 금액과 총 상주인구 수인데요, 데이터 수가 작은 데이터임에도 이 두개의 컬럼 때문에 데이터를 가져온 이유가 바로 이 두 컬럼 때문입니다. 월 평균 소득 금액과 총 상주인구 수가 왜 몰래카메라 범죄의 영향요소가 되는지 의아해 하실 수 있는데요, 한 연구에 따르면, 그 지역의 월 평균 소득 금액과 상주인구 수, 이동 인구 수 등이 범죄율과도 많은 상관관계가 있다고 합니다. 

 

하지만 데이터를 보면 많이 비어있는데요, 분석을 위해 사용한다면 이 부분에 대해서는 지역별 월 평균 소득 금액, 상주인구 수 정보가 담겨있는 데이터를 추가로 확보해 추합 시켜야 할 것 같습니다.

 

.

.

이렇게 총 2개의 데이터 (1)상세통계자료(카메라등이용촬영), (2)몰래카메라 영향요소 융합데이터를 읽어보았는데요, 첫 번째 데이터인 (1)상세통계자료 데이터는 2019년도에 발생한 카메라 이용촬영 범죄에 대한 데이터로, 2019년 자료만 읽었지만 실제 사이트에 들어가면 2015년부터의 자료가 있답니다. 따라서 이 데이터를 추합시켜 데이터의 양을 늘려 분석한다면 특정 요인과 범죄 발생의 상관관계를 분석할 수 있지 않을까 싶습니다.

 

또한 두 번째로 읽은 데이터 (2)몰래카메라 영향요소 융합데이터의 경우 데이터 양이 매우 적지만, 월 평균 소득 금액, 총 상주인구 수 컬럼을 채워 첫 번째에 읽었던 데이터와 추합 하여 분석한다면 범죄 발생과 관련하여 의미 있는 상관관계를 도출해낼 수 있지 않을까 싶습니다! :D

 

 

 

# 스마트 치안 빅데이터 플랫폼

https://www.bigdata-policing.kr/policy/main/index.do

 

 이번 리뷰기에서 소개한 데이터는  '스마트 치안 빅데이터 플랫폼'에 있는 데이터인데요, 현재 한국 과학기술정보통신부에서 이 플랫폼을 이용하여 치안 및 범죄를 방지하기 위한 데이터 사업을 구축하고 있답니다. 이러한 스마트 치안 빅데이터 플랫폼에서는 각종 치안 데이터, 지역 환경 공공 데이터 등을 개방하고 있으며, 이러한 데이터를 통해 사회 안전을 위한 인공지능 서비스 개발을 장려하고 있습니다.

 

스마트 치안 빅데이터 플랫폼 사이트(https://www.bigdata-policing.kr/policy/main/index.do)를 들어가면 위와 같은 화면이 나오는데요, 약 168건의 데이터가 있으며 대부분이 무료입니다. 가격 미정인 데이터에 대해서 당분간은 무료로 개방한다고 합니다!

 

 

 위와 같이 데이터 검색으로 들어가면 데이터를 원하는 카테고리, 제공기관, 기간검색, 데이터유형 등을 세부적으로 지정해 데이터를 검색할 수 있습니다. 총 168건의 데이터가 있는데요, 확인해보니 대부분의 데이터들이 최신 데이터로 업데이트되고 있습니다~ 한번 들어가셔서 어떠한 데이터가 있는지 확인해보시는 것도 추천드립니다!

 

지난 2개의 리뷰기에 이어 이번 리뷰기에서도 스마트 치안 빅데이터 플랫폼에 있는 데이터를 소개해드렸는데요, 다음 리뷰기에서 다른 주제로 다른 플랫폼에 있는 데이터를 소개해드리도록 하겠습니다. 스마트 치안 플랫폼에서의 데이터 리뷰기가 궁금하시다면 지난 리뷰기를 참조하시기 바랍니다!

 

혹시나 특정 분야나 요러한 데이터가 있는지 궁금하다고 댓글로 남겨주시면 유익한 데이터를 찾아와 대신 읽어드리도록 하겠습니다! 감사합니다 :D