본문 바로가기

BLOG/데이터 리뷰기

[데이터 리뷰] AIHUB(안전) - 공사현장 안전장비 인식 이미지 데이터

데이터 리뷰 : 데이터 대신 읽어드립니다!
#40 AIHUB(안전) - 공사현장 안전장비 인식 이미지 데이터

 

 

 

 

 공사현장에서 안전장비 문제로 발생하는 사고가 끊임없이 발생하고 있는데요, 안전의무를 준수하지 않은 공사장에서 사고로 인명피해가 발생하지 않게 하기 위해선 더 특별한 조치나 시스템 등이 필요할 수 있습니다. 그 예로 인공지능 기술을 결합하여 안전사고를 예방하는 서비스를 만드는 것도 한 방법이 될 수 있는데요, 이를 위해서는 다양한 이미지를 확보하여 AI 학습용 데이터가 구축되어야 한답니다.

 

이와 관련하여 AIHUB 플랫폼에서는 '공사현장 안전장비 인식 이미지' 데이터를 제공하고 있는데요, 이 데이터는 건설공사와 관련한 안전사고 예방을 위해 공사현장에서 필수로 착용해야 하는 안전장구류의 영상, 이미지를 확보하여 데이터로 구축한 데이터셋입니다. 그렇다면, 이번 데이터 리뷰기에서는 이 데이터가 어떻게 이루어져 있는지 살펴보고, 어떻게 분석 및 활용하면 좋을지 생각해보도록 하겠습니다!

 

 

 

 

공사현장 안전장비 인식 이미지 데이터

 

(1) 데이터 정보

  • 제공기관 : (주)미디어그룹사람과숲
  • 데이터 개수 : 203만 개
  • 데이터 형식 : jpg, json
  • 데이터 구성 : 촬영일자, 파일이름, 수평해상도값, 촬영장소, 이미지해상도, 분류 정보, Bounding box 좌표, Class 정보 등
  • 다운로드 : https://aihub.or.kr/aidata/33921

 

'공사현장 안전장비 인식 이미지' 데이터는 안전모, 안전화 등의 안전장비 객체 인식과 작업자의 안전장비 착용 여부를 나타내는 데이터로, 200만 장 이상의 데이터로 구축되어 있습니다. 그뿐만 아니라 이미지에 대해 Instance, Bounding Box, Polygon, Keypoint 데이터 또한 알 수 있게 구축되어 있답니다!

 

한편, 위에 다운로드 링크로 들어가면 회원가입 또는 로그인 후 데이터를 다운받을 수 있는데요, 그렇다면 데이터를 다운받아서 한번 데이터가 어떻게 이루어져 있는지 살펴보도록 하겠습니다~

 

 

(2) 데이터 리뷰

 데이터를 다운로드하면, 크게 원천 데이터와 라벨링 데이터로 나누어져 있는데요, 원천 데이터부터 살펴보도록 하겠습니다.

 

 

#원천데이터

 

원천 데이터는 안전장비, 기계류에 대한 이미지 데이터로 구성되어 있는데요, 크게 또 [공동주택/공연장/공장/공항시설/물류센터/상업시설/오피스/주차장]으로 분류되어 있습니다. 그럼 이 중에서 [공항시설]의 [인천공항 제2여객터미널 증축공사(동측)] 데이터의 이미지를 살펴보도록 하겠습니다.

 

 

데이터를 살펴보면, 인천공항의 공사현장에서 안전모, 안전장비 등 안전보호구를 착용한 사람의 모습을 확인할 수 있습니다.

 

또 다른 장소에서의 데이터를 살펴볼까요?

 

- [물류센터]-[반도체 장비 클러스터 신축공사] 데이터

 

- [상업시설]-[송도동]

 

- [공연장]-[부산 오페라 하우스 신축공사]

 

이처럼 각 시설 및 장소와 명칭에 따라 데이터가 분류되어 있는데요, 이미지 데이터를 보면 알 수 있듯이 안전보호구를 착용한 사람 말고도 안전 장비 및 시설 등 공사현장의 모습을 확인할 수 있습니다.

 

 

#라벨링데이터

 

반면 라벨링 데이터에는 각 이미지에 대한 어노테이션 정보가 담겨 있는데요, 각 이미지당 한 개씩 json 파일 형식으로 이루어져 있습니다. 

 

{
  "image": {
    "date": "20201007",
    "path": "S2-N0002M00076",
    "filename": "S2-N0203M00928.jpg",
    "copyrighter": "미디어그룹사람과숲(컨)",
    "location": "02",
    "H_DPI": 96,
    "V_DPI": 96,
    "bit": 24,
    "resolution": [
      1920,
      1080
    ]  },
  "annotations": [
    { "data ID": "S2",
      "middle classification": "01",
      "polygon": [[ 818, 673 ], [ 809, 652 ], [ 809, 632 ], [ 813, 615 ], [ 819, 604 ], [ 830, 594 ], [ 845, 594], [ 852, 609 ], [ 846, 620 ], [ 843, 640 ], [ 839, 653 ], [ 838, 675 ], [ 840, 691 ], [ 841, 705 ], [ 843, 718 ], [ 843, 730 ], [ 844, 749 ], [ 844, 763 ], [ 851, 774 ], [ 864, 763 ], [ 866, 749 ], [ 869, 733 ], [ 869, 712 ], [ 859, 695 ], [ 862, 670 ], [ 873, 666 ], [ 886, 679 ], [ 889, 696 ], [ 883, 707 ], [ 884, 718 ], [ 881, 732 ], [ 879, 745 ], [ 876, 760 ], [ 874, 774 ], [ 862, 783 ], [ 842, 784 ], [ 830, 749 ], [ 830, 731 ], [ 830, 716 ], [ 826, 703 ], [ 825, 691 ] ], "class": "03", "flags": "occluded,not truncated" },
{ "data ID": "S2", "middle classification": "01",
  "box": [ 713, 433, 869, 692 ],
...
(생략)
...
"class": "01", "flags": "not occluded,truncated" }, { "data ID": "S2", "middle classification": "06", "box": [ 1, 557, 1584, 1080 ], "class": "30", "flags": "not occluded,truncated" } ]

 

위 텍스트 데이터가 바로 앞에서 살펴본 인천공항 첫 번째 이미지에 대한 라벨링 데이터인데요, 라벨링 데이터를 통해 이미지로만 보고서는 알 수 없는 촬영정보들을 얻을 수 있습니다.

 

또한 크게 image 영역과 annotations 영역으로 나눠서 보자면, image 영역에서는 파일 정보, 수평/수직 해상도값, 이미지 해상도, 촬영 장소에 대해 알 수 있습니다. 반면 annotations 영역에는 대분류/중분류 정보를 코드명에 따라 알 수 있고, 주목할 부분이 바로 하단에 polygon과 box 태그입니다. polygon과 box 데이터는 이미지 속 안전장비/안전보호구 객체의 외각을 나타낸 좌표값으로, 이 데이터를 이용하여 이미지에 나타내면 아래와 같이 안전장비 또는 안전보호구 객체를 검출할 수 있답니다.

 

bounding box & polygon segmentation

 

 

(3) 데이터 활용

 그렇다면 약 200만 장의 '공사현장 안전장비 인식 이미지' 데이터를 어떻게 활용할 수 있을까요? 우선, 건설현장에서 안전모, 안전고리 착용여부 등의 관리가 필요하다는 점을 고려할 때, 공사 현장에서 필수로 착용해야 하는 안전장구류 객체 인식 및 검출 AI 알고리즘을 구현하는 것이 좋은 활용방안이 될 것 같습니다. 따라서 해당 이미지 데이터를 학습시킨 뒤, 실시간으로 모니터링할 수 있는 라이브 캠에 해당 알고리즘을 구동시킨다면 실시간으로 안전장구류 착용 여부와 작업인원의 위치 등을 파악할 수 있지 않을까 싶습니다. 그리고 안전장비를 착용하지 않았을 시 공사 본부 또는 현장에 알림을 보내는 등 다양한 안전 서비스를 구현할 수 있지 않을까 싶네요-! 

 

이밖에도 다양한 공사현장과 작업환경에 대한 이미지 데이터 학습을 통해 모니터링 시스템, 자동 통보 시스템 등 지능형 공사 현장 안전관리를 위한 여러 AI 응용 서비스 개발이 가능하지 않을까 싶습니다 :D

 

 

 

 

 

 

# AIHUB

 

https://aihub.or.kr/

 

 오늘 리뷰한 '공사현장 안전장비 인식 이미지' 데이터는 <AIHUB(AI 허브)>에서 다운로드 받은 '안전' 카테고리의 데이터로, AI 허브는 AI 기술 및 제품, 서비스 개발에 필요한 AI 인프라(AI데이터, AISWAPI, 컴퓨팅 자원)를 지원함으로써 누구나 활용하고 참여하는 AI통합 플랫폼입니다! 따라서 사용자를 위해 개발 및 활용을 위한 인프라 서비스와 AI 활성화를 위한 서비스를 제공하고 있는 것인데요, 현재 위와 같이 음성/자연어, 비전, 헬스케어, 자율주행 등 다양한 카테고리에 걸친 데이터들을 제공하고 있답니다.

 

 

한편, 오늘 살펴본 데이터는 '안전' 카테고리에 있는 데이터였는데요, 안전 카테고리는 화재, 교통안전문제, 위급상황, 이상행동 등과 관련된 데이터를 제공하는 카테고리입니다. 특히 다른 빅데이터 플랫폼에서는 찾아보기 힘든 데이터들이 제공되고 있고, 실제 우리나라에 있는 지역과 한국인, 한국어 음성 등으로 구축된 데이터들로 이루어져 있기 때문에 우리나라에서 상용화하기 위한 서비스 개발에 활용하기에 매우 적합한 데이터이기도 하답니다. 

 

 

또한 각 데이터 다운로드 페이지에 들어가면 위와 같이 데이터의 구축내용과 필요성, 데이터 구조, 활용예시 등의 정보를 파악할 수 있기 때문에 데이터를 다운로드하기 전에 어떠한 형태로 이루어져 있는지, 데이터를 어떻게 활용하면 좋을지 살펴볼 수 있답니다.

 

 

이렇게 오늘 데이터 리뷰기에서는 AIHUB의 '공사현장 안전장비 인식 이미지' 데이터를 리뷰해보았는데요, 다음 리뷰기에서도 동일한 카테고리의 다른 데이터를 리뷰해보도록 하겠습니다. 이전 데이터 리뷰기에서는 소방, 사회 범죄, 해양수산, 헬스케어, 농수산물 등 여러 플랫폼에서 제공하는 데이터 리뷰기가 있으니, 관심이 있으신 분들은 참조하시기 바랍니다! 그럼 다음 리뷰기에서 만나요! :D