본문 바로가기

BLOG/데이터 리뷰기

[데이터 리뷰] 스마트 치안 분야 공공 데이터 (1)사건사고지역

데이터 리뷰 : 데이터 대신 읽어드립니다!
#1 스마트 치안 인공지능 서비스 개발 및 데이터분석을 위한 데이터_"스마트 치안 빅데이터 플랫폼"

 

 

 요즘 뉴스를 보면, 사회에선  각종 범죄가 발생하고, 상상을 초월한 범죄 수단과 형태를 보며, 과연 우리가 앞으로 안전을 보장받을 수 있을까 라는 생각이 들게 하는데요, 이에 대해 범죄를 예방하고 범죄율을 줄이기 위한 데이터 분석 및 인공지능을 결합한 안전 프로그램 개발이 중요시되고 있습니다.

하지만 관련 데이터나 의미가 있는 데이터가 없다면 서비스 개발 및 데이터 분석이 어려울 수 있는데요, 이번 데이터 리뷰기에서는 치안 등 안전과 관련된 서비스 프로그램 개발 및 데이터 분석에 활용할 만한 데이터로 어떤 게 있는지 살펴보고자 합니다. 또한 해당 데이터가 어떻게 이루어져 있는지 읽어보고, 활용방안까지 생각해보고자 하는데요, 첫 번째 데이터 리뷰기로, 치안 관련 데이터 중 사건사고가 발생한 지역에 대한 상권규모, 유동인구, 활동인구, 거주인구, 날씨정보가 담긴 데이터를 읽어보도록 하겠습니다!

 

 

사건사고지역

: 시간대별 상권규모(매출액/결제건수) · 유동인구 · 활동인구 · 거주인구 · 날씨정보

 

 이번 데이터 리뷰기에서 읽을 데이터는 바로, 2021년 1월 1일부터 사건사고가 발생한 지역에 대한

시간대별 상권규모(매출액, 결제건수), 유동인구, 활동인구, 날씨정보, 분기별 거주인구에 대한 6개의 데이터입니다. 

 

 

(1) 사건사고지역_시간대별_상권규모(매출액)

  • 데이터 개수 : 307개
  • 데이터 형식 : csv
  • 컬럼 : 시퀀스(사건번호), 일시, 행정구역, 행정구역코드, 행정구역별시간대별매출액

웹사이트 screenshot

 해당 데이터 웹페이지에 들어가면, 위와 같이 컬럼정의서가 있는데요, 데이터를 다운받아 비교해보았습니다.

다운로드 받은 데이터 (csv)

csv 파일에 307개의 데이터가 있는데요, 컬럼정의서를 봐야 해당 컬럼이 무슨 정보를 담고 있는지 알 수 있답니다! 컬럼정의서와 데이터를 비교해보면, 첫 번째 A컬럼은 시퀀스(사건번호), 두 번째 컬럼은 사건사고가 발생한 일시, 세 번째 컬럼은 사건사고가 발생한 행정구역, 네 번째 컬럼은 행정구역 코드, 마지막 컬럼은 사건사고가 발생한 행정구역의 해당 시간대의 매출액을 나타냅니다.  

 

이 데이터만으로는 의미 있는 정보를 도출하거나 안전 서비스 프로그램을 만들 순 없겠죠~? 같은 사건사고지역에 대한 다른 데이터를 보도록 하겠습니다.

 

 

(2) 사건사고지역_시간대별_상권규모(결제건수)

  • 데이터 개수 : 307개
  • 데이터 형식 : csv
  • 컬럼 : 시퀀스(사건번호), 일시, 행정구역, 행정구역코드, 행정구역별시간대별결제건수

(첫번째 행을 추가해 컬럼명을 입력해주었습니다)

 

(3) 사건사고지역_시간대별_유동인구

  • 데이터 개수 : 307개
  • 데이터 형식 : csv
  • 컬럼 : 시퀀스(사건번호), 일시, 행정구역, 행정구역코드, 행정구역별시간대별유동인구

 

 

(4) 사건사고지역_시간대별_활동인구

  • 데이터 개수 : 307개
  • 데이터 형식 : csv
  • 컬럼 : 시퀀스(사건번호), 일시, 행정구역, 행정구역코드, 행정구역별시간대별활동인구

 

 

(5) 사건사고지역_시간대별_날씨정보

  • 데이터 개수 : 307개
  • 데이터 형식 : csv
  • 컬럼 : 시퀀스(사건번호), 일시, 행정구역, 행정구역코드, 온도, 풍속, 강수량, 습도

 

 

(6) 사건사고지역_분기별_거주인구

  • 데이터 개수 : 307개
  • 데이터 형식 : csv
  • 컬럼 : 시퀀스(사건번호), 일시, 행정구역, 행정구역코드, 행정구역별분기별거주인구

 

 

 

- 데이터 활용하기

 

 총 6개의 데이터를 통해 특정 사건사고에 대해 시간대/분기별 상권규모(매출액, 결제건수), 유동인구, 활동인구, 날씨정보, 거주인구에 대해 알아보았는데요, 각각의 데이터를 동일한 사건(시퀀스)을 기준으로 데이터를 합쳐보겠습니다. 

 

사건사고발생데이터_307datas_13cols.csv
0.03MB

 

그러면 위와 같이 총 13개의 컬럼으로 이루어진 데이터가 됩니다! (위 파일은 해당 데이터 파일입니다.)

이 데이터를 이용하여, 사건 또는 사고가 발생한 행정구역과 일시, 그리고 그 행정구역에 따른 상권규모, 유동인구, 활동인구, 거주인구, 그리고 날씨정보까지 모든 데이터를 분석하여 특정 컬럼과 사건발생과의 상관관계를 찾는다면, 분명 의미 있는 정보를 도출해낼 수 있지 않을까 싶습니다!

 

또한 의미있는 정보를 도출해 내는데에 그치지 말고, 앞으로 특정 행정구역의 상권규모, 인구수 등이 사건사고가 많이 발생했을 때의 상권규모, 인구수 등과 비슷해진다면, 안전 주의 또는 위험 알림 등을 미리 알려줄 수 있는 서비스를 구현한다면 어떨까 싶습니다. 또는 위험 지수를 매겨서 위험한 지역에는 경찰 등 안전보호 시설을 늘려야 하는 주장을 뒷받침 해줄 수 있는 데이터가 될 수도 있겠고요~  이러한 방식으로 데이터를 여러가지로 활용할 수 있을 것 같습니다.

 

 

 

# 스마트 치안 빅데이터 플랫폼

https://www.bigdata-policing.kr/policy/main/index.do

 

 이번 리뷰기에서 소개한 데이터는 모두 '스마트 치안 빅데이터 플랫폼'에 있는 데이터인데요, 현재 한국 과학기술정보통신부에서 이 플랫폼을 이용하여 치안 및 범죄를 방지하기 위한 데이터 사업을 구축하고 있답니다. 이러한 스마트 치안 빅데이터 플랫폼에서는 각종 치안 데이터, 지역 환경 공공 데이터 등을 개방하고 있으며, 이러한 데이터를 통해 사회 안전을 위한 인공지능 서비스 개발을 장려하고 있습니다.

 

스마트 치안 빅데이터 플랫폼 사이트(https://www.bigdata-policing.kr/policy/main/index.do)를 들어가면 위와 같은 화면이 나오는데요, 약 168건의 데이터가 있으며 대부분이 무료입니다. 가격 미정인 데이터에 대해서 당분간은 무료로 개방한다고 합니다!

 

 

 위와 같이 데이터 검색으로 들어가면 데이터를 원하는 카테고리, 제공기관, 기간검색, 데이터유형 등을 세부적으로 지정해 데이터를 검색할 수 있습니다. 총 168건의 데이터가 있는데요, 확인해보니 대부분의 데이터들이 최신 데이터로 업데이트 되고 있더라고요~ 한번 들어가셔서 어떠한 데이터가 있는지 확인해보시는 것도 추천드립니다!

 

약 170개의 데이터를 훑어보면서, 소개해드리고 싶은 데이터가 많았는데요, 다음 리뷰기에서도 사회 안전과 관련하여 인공지능 서비스 개발 및 데이터 분석에 활용할 수 있는 적절한 데이터를 가져와 소개해드리도록 하겠습니다!

 

혹시나 특정 분야나 요러한 데이터가 있는지 궁금하다고 댓글로 남겨주시면 유익한 데이터를 찾아와 대신 읽어드리도록 하겠습니다! :D