본문 바로가기

BLOG/데이터 리뷰기

[데이터 리뷰] 소방안전 빅데이터 플랫폼 (1) 화재 신고 데이터

데이터 리뷰 : 데이러 대신 읽어드립니다!
#4 소방안전 빅데이터 플랫폼 (1) 화재 신고 데이터

 

 

 

 

종종 화재 또는 재난으로 집과 재산을 잃어 피해를 입는 경우가 있는데요, 만약 사전에 화재 및 재난으로부터 위험한 건물을 관리하고 보수한다면 큰 피해를 막을 수 있습니다. 따라서 기존의 화재 사례, 화재 신고를 형태를 분석한다면 어느 건물이 위험한지 추측할 수 있는데요, 분석을 위해선 화재 사건과 관련된 데이터가 필요하답니다.

화재와 관련된 데이터는 '소방안전 빅데이터 플랫폼'이라는 사이트에서 찾을 수 있는데요,  이번 데이터 리뷰기에서는  '소방안전 빅데이터 플랫폼'에서 제공하는 화재 신고 및 화재 사례 데이터를 읽어보고, 데이터 분석 방안을 함께 생각해보도록 하겠습니다. 추가로 뒤에는 소방안전 빅데이터 플랫폼에 대해서도 설명하도록 하겠습니다!

 

 

 

 

화재 종별 신고 및 화재사례 상세정보 데이터

 

이번 데이터 리뷰기에서 읽을 데이터는 총 2개인데요,
(1) 2005년부터 2020년까지 울산에서 발생한 화재 사건 데이터
(2) 화재사례에 대한 상세정보 자료 데이터입니다.

 

 

(1) 화재 종별 신고, 재난 데이터

 

  • 제공기관 : 울산소방본부
  • 데이터 개수 : 27,996건
  • 데이터 형식 : csv
  • 칼럼 : 일련번호, 접수경로명, 접수일시, 신고자명, 신고자전화번호, 타시도신고여부, 긴급구조, 우편번호, 긴급구조, 시도명, 긴급구조, 구군명, 긴급구조, 동명, 긴급구조, 리명, 긴급구조 번지, 긴급구조 상세주소, 긴급구조 종별명, 긴급구조 분류명, 긴급구조 규모명, 상황종료일시, 관할서명, 서센터명, 도로명, 읍면동, 일련번호, 지하여부, 건물 본번, 건물 부번 도로명, 기타주소, 공동대응여부, 고속도로사고여부, 화학사고여부, 타시도출동여부
  • https://www.bigdata-119.kr/goods/goodsInfo?goods_id=202101000003

 

 첫 번째로 읽을 데이터는 2005년 7월부터 2020년 12월가지 울산에서 발생한 화재 종별 신고 데이터인데요, 위 링크를 통해 소방안전 빅데이터 플랫폼에 들어가게 되면 해당 데이터를 다운로드 받을 수 있답니다. 

데이터를 다운로드하면 아래와 같이 csv 파일이 열리고 데이터를 볼 수 있습니다.

 

 

데이터를 보면, 문자열 데이터와 숫자열 데이터로 이루어져있는데요, 우선 각 칼럼이 어떠한 데이터를 담고 있는지 알아야 한답니다. 각 칼럼에 대한 정보는 데이터를 다운로드 받은 웹페이지에 있는데요, 아래와 같이 데이터 컬럼 정보를 통해 각 컬럼이 무슨 데이터를 담고 있는지 알 수 있습니다. 

 

 

그러면 컬럼 정보에 맞게 데이터의 첫 행을 수정해보도록 하겠습니다.

 

 

이렇게 수정한 결과, 어떠한 칼럼인지 쉽게 파악할 수 있게 되었습니다. 이제 좀더 데이터를 살펴보도록 하겠습니다.

먼저, 데이터는 총 27,996건으로 상당히 수가 많은데요, 아무래도 2005년부터 수집된 자료다보니 한 지역에 대한 데이터여도 그 수가 많은 것 같습니다. 다만 가장 오래된 2005년도 데이터와 가장 최신 데이터는 2020년 데이터를 비교해보면 채워져있는 칼럼이 확연히 차이가 나는데요, 아무래도 시간이 지날수록 데이터 구축의 필요성이 커졌다보니 오래된 데이터에 대해서는 데이터의 정보가 잘 구축되지 않았던 것 같습니다.

 

 

한편, 칼럼을 보면 총 32개의 칼럼이 있는데요, 중요한 칼럼으로는 크게 사건 접수 일시, 주소/지하여부, 화재 분류, 화재 규모, 공동대응/고속도로사고/화학사고/타시도출동여부 인 것 같습니다. 

 

 

특히 긴급구조 분류명 칼럼에 있는 데이터를 보면 '일반화재', '고층건물', '기타화재', '특수화재', '대형화재' 등 상세하게 분류가 되어 있는 것을 확인할 수 있습니다.

따라서 어떠한 화재가 어느 지역에서 주로 발생했는지를 함께 분석한다면 앞으로 화재가 발생할 만한 곳을 예측할 수 있지 않을까 싶습니다.

 

 

 

(2) 화재사례 상세정보 자료

 

 

 두 번째로 읽을 데이터는 화재사례에 대해 상세한 정보를 담은 데이터인데요, 마찬가지로 데이터를 다운받아 열어보도록 하겠습니다.

 

 

마찬가지로 아래 칼럼 정보를 통해 칼럼명을 바꿔주도록 하겠습니다.

 

 

데이터를 보면, 수치로 가득한 일반 데이터와는 다르게 상세한 내용이 설명되어져 있는 것을 볼 수 있는데요, 각 화재 사건에 대한 발화지점, 화재확산, 화재시 상황, 피해정보, 목격자 진술 등에 대한 내용이 상세하게 설명되어 있습니다.

 

 

위와 같은 데이터의 경우는 화재가 점화된 곳과 시간별로 화재로 인해 발생된 상황, 파견된 소방차량, 살수 상황, 병원이송 등에 대해 상세하게 설명되어 있습니다. 

이렇게 글로 설명되어 있는 데이터다 보니 하나의 칼럼으로 정리가 되어 있는데요, 아무래도 화재사건이 참 다양하게 발생하기 때문에 특정 칼럼으로 분류하지 않고 이렇게 데이터가 구축되어 있는 것 같습니다.

하지만 이러한 데이터도 데이터분석을 통해 의미있는 내용을 도출해낼 수 있는데요, 자연어처리 알고리즘 등을 이용하여 빈도가 높은 단어, 문장 등을 찾거나, 텍스트 요약 알고리즘을 이용하여 빈도가 높은 핵심 문장을 찾을 수 있습니다. 이러한 방식으로 화재사건과 많이 관련되었던 단어와 문장들을 분석해 의미있는 키워드를 도출한다면 의미있는 데이터가 되지 않을까 싶습니다.

 

 

 

 

#소방안전 빅데이터 플랫폼

 

 

이번 데이터 리뷰기에서 소개한 데이터를 다운로드 받은 '소방안전 빅데이터 플랫폼'은 한국소방안전원에서 구축한 플랫폼인데요, 국민의 안전과 소방산업의 혁신을 지원하는 데이터를 개방/공유/유통/거래 기반 플랫폼으로 소방 안전 정보 빅데이터 허브를 구축하여 소방산업 업체, 종사자, 관·연·학계 및 대국민에게 양질의 특화된 소방안전 및 소방산업분야 빅데이터 서비스를 제공하는 목적으로 구축된 플랫폼입니다.

 

 

소방안전 빅데이터 플랫폼에는 소방안전정보부터 국민 생활안전정보, 재난예방 대응정보, 연구분석정보에 대한 데이터를 오픈하고 있는데요, 총 734건의 데이터를 다운로드 받아서 데이터분석에 사용할 수 있습니다.

 

 

또한 아래와 같이 카테고리별 검색을 통해 필요한 데이터를 쉽게 찾을 수 있답니다.

 

 

 

이렇게 오늘은 소방안전 빅데이터 플랫폼에 대한 소개와 화재 사건과 관련된 2개의 데이터를 읽어보고, 데이터 활용 방안까지 생각해보았는데요, 다음 리뷰기에서도 소방안전 빅데이터 플랫폼에서 좋은 데이터를 가져와 리뷰하도록 하겠습니다.

이전 글에서는 다른 플랫폼에서 가져온 데이터 리뷰기들이 있으니 궁금하시면 참조하시기 바랍니다! 혹시나 특정 분야나 궁금한 데이터가 있다면 댓글로 남겨주시면 참조해 데이터 리뷰를 하도록 하겠습니다! 감사합니다 :D