본문 바로가기

BLOG/데이터 리뷰기

[데이터 리뷰] AIHUB(안전) - 화재 발생 예측 영상 데이터

데이터 리뷰 : 데이터 대신 읽어드립니다!
#42 AIHUB(안전) - 화재 발생 예측 영상 데이터

 

 

 

 

 화재가 발생하면 재산피해는 물론이고 삶의 터를 잃을 수 있으며, 문화재 또는 산불 화재로 이어지면 다시는 돌이킬 수 없게 됩니다. 이처럼 화재는 사전에 방지하는 것이 아주 중요한데요, 산업시설, 일반가정, 자연환경 등 연기발생을 감지하고 화재 신호를 빠르게 알리는 등 화재 발생을 예측하여 미리 조심한다면 큰 피해를 막을 수 있지 않을까 싶습니다.

 

이와 관련하여 AIHUB 플랫폼에서는 '화재 발생 예측 영상' 데이터를 제공하고 있는데요, 화재가 발생하기 전에 발생되는 연기를 촬영한 영상 데이터로 구축되어 있습니다. 그렇다면, 오늘 데이터 리뷰기에서는 이 데이터가 어떻게 이루어져 있는지 살펴보고, 어떻게 분석 및 활용하면 좋을지 생각해보도록 하겠습니다!

 

 

 

 

 

화재 발생 예측 영상 데이터

 

(1) 데이터 정보

  • 제공기관 : (주)미디어그룹사람과숲
  • 데이터 개수 : 173만
  • 데이터 형식 : jpg, json
  • 데이터 구성 : 화재 발생 영상(화재씬, 유사씬, 무관씬), 이미지, Instance, Bounding Box, Polygon
  • 다운로드 : https://aihub.or.kr/aidata/34121

 

'화재 발생 예측 영상' 데이터는 화재가 발생하기 전 연기가 나는 상황을 촬영한 데이터로, 화재씬, 유사씬, 무관씬으로 각각 15분짜리 영상이 500개 이상씩 구축되어 있습니다. 각 영상에 연기, 화재, 진화(start-end)에 대한 키프레임이 기록되어 있으며, 메타데이터인 json 데이터에는 영상 데이터에 대한 촬영정보, Bounding Box, Polygon 데이터가 포함되어 있답니다.

 

위에 다운로드 링크로 들어가면 회원가입 또는 로그인 후 데이터를 다운받을 수 있는데요, 그렇다면 데이터를 다운받아서 한번 데이터가 어떻게 이루어져 있는지 살펴보도록 하겠습니다~

 

 

(2) 데이터 리뷰

 데이터를 다운로드 받으면 크게 원천 데이터와 라벨링 데이터로 이루어져 있는데요, 원천 데이터는 화재 영상 데이터가 있고 라벨링 데이터에는 각 영상 데이터에 대한 메타 데이터가 json 파일 형식으로 구축되어 있습니다. 

 

그럼 원천 데이터부터 살펴보도록 하겠습니다~

 

 

# 원천 데이터

 

원천 데이터에는 영상 데이터가 '화재씬', '유사씬', '무관씬'으로 이루어져 있는데요, 화재씬은 말 그대로 연기가 발생하는 모습을 담은 영상이고, 유사씬은 연기발생과 유사한 상황의 영상, 무관씬은 화재 연기와 무관한 영상 데이터입니다. 유사씬과 무사씬 데이터가 왜 함께 있는지 궁금하실 수 있는데요, 화재 발생 예측 모델을 학습시킬 때 화재 영상 데이터 말고도 화재가 발생하지 않는 데이터를 함께 학습시킴으로써 화재 여부를 구분하는 학습을 시키기 위해선 필요한 학습 데이터이기 때문입니다. 그럼 각 씬에 대해 구축된 데이터를 살펴보겠습니다.

 

- 화재씬

위에 화재씬 데이터를 보면, 공장 비슷한 산업시설에서 불이나 연기가 발생된 모습을 확인할 수 있습니다.

 

- 유사씬

유사씬 데이터를 확인해보면 구름 사진이나 들판, 햇빛이 비추는 모습의 데이터가 많은데요, 아무래도 구름 등이 연기와 비슷해 보일 수 있기 때문에 유사씬 데이터로 구축되지 않았나 싶습니다.

 

- 무관씬

무관씬 데이터는 말 그대로 화재발생과 무관한 데이터로, 일상 환경 속에서 볼 수 있는 모습의 데이터로 구축되어 있습니다.

 

 

# 라벨링 데이터

 

한편, 라벨링 데이터는 위에서 살펴본 각 영상 데이터에 대한 정보가 들어가 있는 json 파일 형식의 텍스트 데이터로 이루어져 있는데요, 위에 원천데이터 유사씬에서 살펴본 첫 번째 영상 데이터에 대한 라벨링 데이터는 아래와 같습니다.

 

{
  "image": {
    "date": "20201015",
    "path": "S3-N0401MF00047",
    "filename": "S3-N0401MF00665.jpg",
    "copyrighter": "미디어그룹사람과숲(컨)",
    "location": "04",
    "H_DPI": 96,
    "V_DPI": 96,
    "bit": 24,
    "resolution": [
      1920,
      1080
    ]
  },
  "annotations": [
    {
      "data ID": "S3",
      "middle classification": "01",
      "box": [
        742,
        405,
        1068,
        671
      ],
      "class": "01",
      "flags": "not occluded,not truncated"
    }  ] }

 

위 데이터를 확인해보면, 크게 image 데이터와 annotations 데이터로 나눌 수 있는데요, image 데이터에서는 해당 영상 데이터에 대한 파일 정보, 해상도값, 촬영장소 코드, 비트 수준 등의 촬영 정보를 알 수 있습니다. 반면 annotations 데이터에는 이미지 분류 정보, 겹침 및 잘림 여부(flags) 등에 대해 알 수 있습니다. 또한 'box' 라는 태그가 있는데요, box는 Bounding Box 좌표로, 연기 또는 불이 있는 영역을 가리키는 좌표입니다. 

 

이처럼 라벨링 데이터를 통해 각 영상 데이터에 대해 촬영 정보, 화재 발생 종류, 화재 발생 영역 등에 대한 정보를 얻을 수 있습니다. 

 

 

(3) 데이터 활용

 그럼 이 '화재 발생 예측 영상' 데이터를 이용하여 어떻게 활용할 수 있을까요?

우선 화재가 발생하기 전에 발생되는 연기를 촬영한 영상 데이터로, 데이터 구축 목적답게 화재 발생을 사전에 예측하여 알림을 보내는 AI 모델의 학습용 데이터로 사용할 수 있습니다. 화재씬 데이터와 유사씬, 무관씬 데이터, 그리고 라벨링 데이터를 함께 학습으로써 해당 영상이 화재가 발생된 사진인지, 화재와는 무관한 사진인지 구분하는 학습을 시킬 수 있습니다.

 

또한 이러한 화재 예측 학습 모델을 기반으로 다양한 서비스를 구현할 수 있지 않을까 싶은데요, cctv나 라이브캠 등에 해당 기술을 구현시켜 연기가 감지된다면 cctv 담당 관리실이나 지역 소방서 등으로 알림이 가도록 하는 서비스를 구축할 수 있지 않을까 싶습니다. 또한 연기 및 화재의 발생 단계(크기, 규모, 면적 등)를 정하여 큰 화재의 경우 신속하게 유관기관 및 소방기관에 자동 신고를 하는 시스템을 구축할 수 있지 않을까 싶네요-! 이처럼 화재 발생 예측 영상 데이터를 활용하해 큰 화재 피해를 방지할 수 있는 기술이 구현될 수 있기를 기대합니다~

 

 

 

 

 

# AIHUB

 

https://aihub.or.kr/

 

 오늘 리뷰한 '화재 발생 예측 영상' 데이터는 <AIHUB(AI 허브)>에서 다운로드 받은 '안전' 카테고리의 데이터로, AI 허브는 AI 기술 및 제품, 서비스 개발에 필요한 AI 인프라(AI데이터, AISWAPI, 컴퓨팅 자원)를 지원함으로써 누구나 활용하고 참여하는 AI통합 플랫폼입니다! 따라서 사용자를 위해 개발 및 활용을 위한 인프라 서비스와 AI 활성화를 위한 서비스를 제공하고 있는 것인데요, 현재 위와 같이 음성/자연어, 비전, 헬스케어, 자율주행 등 다양한 카테고리에 걸친 데이터들을 제공하고 있답니다.

 

 

한편, 오늘 살펴본 데이터는 '안전' 카테고리에 있는 데이터였는데요, 안전 카테고리는 화재, 교통안전문제, 위급상황, 이상행동 등과 관련된 데이터를 제공하는 카테고리입니다. 특히 다른 빅데이터 플랫폼에서는 찾아보기 힘든 데이터들이 제공되고 있고, 실제 우리나라에 있는 지역과 한국인, 한국어 음성 등으로 구축된 데이터들로 이루어져 있기 때문에 우리나라에서 상용화하기 위한 서비스 개발에 활용하기에 매우 적합한 데이터이기도 하답니다. 

 

 

또한 각 데이터 다운로드 페이지에 들어가면 위와 같이 데이터의 구축내용과 필요성, 데이터 구조, 활용예시 등의 정보를 파악할 수 있기 때문에 데이터를 다운로드하기 전에 어떠한 형태로 이루어져 있는지, 데이터를 어떻게 활용하면 좋을지 살펴볼 수 있답니다.

 

 

이렇게 오늘 데이터 리뷰기에서는 AIHUB의 '화재 발생 예측 영상' 데이터를 리뷰해보았는데요, 다음 리뷰기에서도 동일한 카테고리의 다른 데이터를 리뷰해보도록 하겠습니다. 이전 데이터 리뷰기에서는 소방, 사회 범죄, 해양수산, 헬스케어, 농수산물 등 여러 플랫폼에서 제공하는 데이터 리뷰기가 있으니, 관심이 있으신 분들은 참조하시기 바랍니다! 그럼 다음 리뷰기에서 만나요! :D