본문 바로가기

BLOG/데이터 리뷰기

[데이터 리뷰] 스마트 치안 분야 공공 데이터 (2)가정폭력 영향요소 융합데이터

데이터 리뷰 : 데이터 대신 읽어드립니다!
#2 스마트 치안 빅데이터 플랫폼_가정폭력 영향요소 융합데이터

 

 

지난 데이터 리뷰기에서는 '스마트 치안 빅데이터 플랫폼'에서 제공하는 "사건사고가 발생한 지역에 대한 상권규모, 유동인구, 활동인구, 거주인구, 날씨정보 데이터"를 읽어보고, 사회 안전 및 스마트 치안과 관련된 인공지능 서비스와 데이터 분석에 활용할 수 있는 방안까지 생각해보았습니다.

 

이번 데이터 리뷰기에서도 스마트 치안 빅데이터 플랫폼에서 다른 데이터를 읽어보고자 하는데요, 특히 '가정폭력'에 영향을 미치는 요소가 담긴 데이터를 읽어보려고 합니다. 어떠한 요소들이 가정폭력 사건이 발생하는 데에 영향을 미치는지 데이터를 읽어보고, 해당 데이터를 분석하여 어떻게 활용하면 좋을지도 생각해 보도록 하겠습니다!

 

 

 

 

 

가정폭력 영향요소 융합데이터

 

이번 데이터 리뷰기에서 읽을 데이터는 2018년 12월 1일 ~ 12월 31일에 112로 접수된

가정폭력 사건 데이터를 관할경찰서별, 신고성별, 가정폭력 재발여부, 발생요일별로

집계하여 제공된 데이터입니다. (데이터 다운로드 페이지 링크)

 

 

- 데이터 정보

 

  • 데이터 개수 : 266개
  • 데이터 형식 : text/csv
  • 제공기관 : 경찰청
  • 컬럼 : 접수년월 / 경찰서명 / 신고 건수(전체) / 신고 성별(남자, 여자, 불상, 기타) 건수 / 접수긴급유형(긴급, 중요, 일반, 민원 ,기타) 건수 / 가정폭력재발여부(Y, N, 기타) 건수 / 발생요일(일, 월, 화, 수, 목, 금, 토) 건수 / 월 평균 소득 금액 / 총 상주인구 수

 

이제 데이터를 읽어보려고 하는데요, 스마트 치안 빅데이터 플랫폼에서 로그인한 뒤, 해당 데이터 파일을 다운로드 받으면 아래와 같이 데이터가 담긴 csv파일을 확인할 수 있습니다.

 

 

위 데이터를 보면 알 수 있듯이, 컬럼이 여러 개인데요, 데이터 다운로드 웹페이지에 아래와 같이 컬럼 정의서가 있습니다. 컬럼정의서를 봐야 해당 컬럼이 무슨 정보를 담고 있는지 알 수 있답니다!

 

그렇다면 데이터를 좀 더 수월하게 읽기 위해, 위 컬럼 정의서에 따라 csv파일에 해당 컬럼을 추가해주도록 하겠습니다.

 

 

각 데이터가 어떠한 컬럼에 대한 데이터인지 쉽게 확인할 수 있게 되었네요. 컬럼명이 추가된 파일은 다음과 같이 공유해드리도록 하겠습니다. 

 

(파일)

 

 

이제 데이터를 자세히 들여보자면, 데이터는 크게 아래와 같이 분류되어 있음을 살펴볼 수 있습니다.

 

1) 접수년월, 경찰서명

2) 신고건수(전체)

3) 신고성별(남자/여자/불상/기타)

4) 접수긴급유형(긴급/중요/일반/민원/기타) 건수

5) 가정폭력재발여부(Y/N/기타) 건수

6) 발생요일(일/월/화/수/목/금/토) 건수

7) 월 평균 소득 금액

8) 총 상주인구 수

 

여기서 만약 가정폭력 사건 발생과 상관관계가 있는 요소를 찾고자 한다면,  5)가정폭력재발여부, 6)발생요일, 7)월 평균 소득 금액,  8)총 상주인구 수 컬럼을 주목할 필요가 있을 것 같습니다.

 

 

가정폭력재발여부(Yes/No/기타)

 

먼저, 각 가정폭력 재발 여부 건수를 보면, 가정폭력이 다시 재발 되어 신고되는 비율이 최대 약 60%까지 차지하는 것을 볼 수 있는데요, 재발되지 않는 건수도 비교해봐야겠지만, 상당히 재발되는 건수가 많음을 어느정도 가늠할 수 있습니다.

 

 

 

발생요일(일/월/화/수/목/금/토) 건수

 

한편, 요일에 따른 발생 건수를 보면, 어느 요일에 발생 건수가 가장 많다고 할 수는 없겠는데요, 이에 대해 데이터 분석 시, 한 경찰서에서의 여러 기간 동안의 요일별 발생 건수 데이터 등이 추가로 주어져야 의미있는 상관관계를 분석할 수 있지 않을까 싶습니다.

 

 

 

월 평균 소득금액 / 총 상주인구 수

 

마지막으로, 왜 가정폭력 영향요소 데이터에 월 평균 소득금액과 총 상주인구 수에 대한 데이터가 있는지 의아해 할 수 있는데요, 특정 지역의 상주인구 수, 월 평균 소득금액, 카드 사용내역 등이 실제 범죄 사건 발생률과 상관관계가 있다는 연구가 있기도 하답니다. 하지만 데이터를 보면 위와 같이 비어있는 데이터가 많은데요, 월 평균 소득금액과 총 상주인구 수로 가정폭력 발생률과 상관관계를 분석하려면, 추가로 데이터가 확보되어야 할 것 같습니다.

 

 

 

이렇게 가정폭력 영향요소 융합 데이터를 읽어보았는데요, 24개의 요소가 있는 컬럼 간 다양하게 상관관계 분석을 할 수 있지만, 특정 컬럼에 데이터가 많이 비어있고, 2018년도 자료라는 점에서 약간의 아쉬운 점이 있는 데이터인 것 같습니다. 그래도 해당 데이터 간의 다양한 분석을 통해 가정폭력 사건 발생과 의미있는 상관관계를 도출해낸다면, 가정폭력 사건의 발생 및 재발을 방지할 수 있는 결과가 도출될 수 있지 않을까 싶습니다!

 

 

 

# 스마트 치안 빅데이터 플랫폼

https://www.bigdata-policing.kr/policy/main/index.do

 

 이번 리뷰기에서 소개한 데이터는  '스마트 치안 빅데이터 플랫폼'에 있는 데이터인데요, 현재 한국 과학기술정보통신부에서 이 플랫폼을 이용하여 치안 및 범죄를 방지하기 위한 데이터 사업을 구축하고 있답니다. 이러한 스마트 치안 빅데이터 플랫폼에서는 각종 치안 데이터, 지역 환경 공공 데이터 등을 개방하고 있으며, 이러한 데이터를 통해 사회 안전을 위한 인공지능 서비스 개발을 장려하고 있습니다.

 

스마트 치안 빅데이터 플랫폼 사이트(https://www.bigdata-policing.kr/policy/main/index.do)를 들어가면 위와 같은 화면이 나오는데요, 약 168건의 데이터가 있으며 대부분이 무료입니다. 가격 미정인 데이터에 대해서 당분간은 무료로 개방한다고 합니다!

 

 

 위와 같이 데이터 검색으로 들어가면 데이터를 원하는 카테고리, 제공기관, 기간검색, 데이터유형 등을 세부적으로 지정해 데이터를 검색할 수 있습니다. 총 168건의 데이터가 있는데요, 확인해보니 대부분의 데이터들이 최신 데이터로 업데이트 되고 있습니다~ 한번 들어가셔서 어떠한 데이터가 있는지 확인해보시는 것도 추천드립니다!

 

지난 리뷰기에 이어 이번 리뷰기에서도 스마트 치안 빅데이터 플랫폼에 있는 데이터를 소개해드렸는데요, 다음 리뷰기에서 마지막 데이터를 소개해드리도록 하겠습니다!

 

혹시나 특정 분야나 요러한 데이터가 있는지 궁금하다고 댓글로 남겨주시면 유익한 데이터를 찾아와 대신 읽어드리도록 하겠습니다!