본문 바로가기

BLOG/데이터 리뷰기

[데이터 리뷰] AIHUB(국토환경) - 생활 폐기물 이미지 데이터

데이터 리뷰 : 데이터 대신 읽어드립니다!
#30 AIHUB(국토환경) - 생활 폐기물 이미지 데이터

 

 

 

 

 환경오염으로 지구 온난화가 발생하고, 각종 지역에서 예상치 못한 기후 변화와 자연재해 등이 발생하는 사례들을 볼 수 있는데요, 환경오염의 주범 중 하나는 바로 생활 폐기물입니다. 생활 속에서 발생되는 다양한 폐기물을 환경 친화적으로 처리하기 위한 방법 중 하나는 바로 분리수거를 하는 것인데요, 개인이 분리수거만 잘해도 30~40%의 폐기물을 재활용할 수 있다고 합니다.

 

하지만 많은 분들이 각종 생활폐기물에 대해 분리수거 기준을 잘 몰라 잘못 분리수거 하는 일도 있곤 하는데요, 이와 관련해서 AIHUB에서는 폐기물 자원 관리와 효율화를 위해 인공지능 기반 생활 폐기물 탐지 및 분류를 위한 '생활 폐기물 이미지' 데이터를 구축하여 제공하고 있습니다. 따라서 이번 데이터 리뷰기에서는 이 데이터가 어떻게 이루어져 있는지 살펴보고, 어떻게 분석 및 활용하면 좋을지 생각해보도록 하겠습니다!

 

 

 

 

 

 

생활 폐기물 이미지 데이터

 

(1) 데이터 정보

  • 제공기관 : 주식회사 데일리블록체인
  • 데이터 개수 : 15만 개
  • 데이터 형식 : json, jpg
  • 데이터 구성 : 파일명, 폐기물구분, 주/야, 촬영장소, 촬영자, 촬영일시, 해상도 등 31개 항목
  • 다운로드 : https://aihub.or.kr/aidata/27708

 

'생활 폐기물 이미지' 데이터는 각종 생활폐기물 15종(가구, 고철류, 나무, 도기, 비닐, 스티로폼, 유리병, 의류, 자전거, 전자제품, 종이, 캔류, 페트병, 플라스틱, 형광등)에 대한 카테고리별 이미지 데이터를 1만건 이상, 총 15만 건 이상의 AI 학습용 데이터로 구축되어 있습니다. 

 

해당 데이터는 설계, 수집, 가공, 검증단계별 사업수행을 통한 폐기물 산업, 자치단체, 공공기관 등 분야에서 활용 가능한 범용성 높은학습용 데이터 구축을 목적으로 구축되었다고 합니다!

 

위에 다운로드 링크로 들어가면 회원가입 또는 로그인 후 데이터를 다운받을 수 있는데요, 그렇다면 데이터를 다운받아서 한번 데이터가 어떻게 이루어져 있는지 살펴보도록 하겠습니다~

 

 

(2) 데이터 리뷰

 데이터를 다운받으면 앞서 설명한 생활폐기물 15종에 해당하는 이미지 폴더를 확인할 수 있는데요, 그중 [종이류]-[신문지]에 해당하는 이미지를 확인해보겠습니다.

 

 

신문지 이미지 폴더에도 22개의 종류가 있는데요, 위 이미지들은 그중 한 폴더에 있는 이미지 데이터들입니다!

한 폴더당 동일한 폐기물에 대해 5장씩 다른 구도와 다른 각도에 촬영된 것을 확인할 수 있습니다.

 

그럼 다른 카테고리인 [비닐] 폐기물 폴더에 있는 이미지도 확인해볼까요~?

     

 

마찬가지로 비닐 폐기물 쓰레기에 대해서 다양한 각도로 촬영된 이미지를 확인할 수 있습니다.

 

한편, '생활 폐기물 이미지' 데이터에는 이미지뿐만 아니라 해당 이미지 데이터에 대한 정보를 담은 데이터도 있는데요, 그 데이터의 구조는 아래와 같습니다.

 

 

위에 보시는 것 같이 해당 데이터는 json 파일 형식으로 이루어져 있는데요, 촬영형태, 촬영장소, 촬영자, 촬영일시, 촬영위치, 해상도, 카메라 모델명 등 다양한 정보와 폐기물의 종류, 상세 정보, 훼손정도, 불투명정도, 색상, 모양, 질감, 크기 등에 대해 구체적인 정보를 담고 있습니다. 또한 마지막 쪽에는 바운딩박스 좌표가 있는데요, 해당 이미지에서 폐기물 쓰레기가 있는 위치를 나타내 줌으로써 이미지에서 어느 부분이 폐기물인지 인식할 수 있기 쉽게 되어 있답니다.

 

 

(3) 데이터 활용

 기존의 생활폐기물 데이터는 임의의 설정을 통해 만들어진 데이터로 실제 공공기관, 지방자치단체, 폐기물 처리업체 등의 현실을 잘 반영하고 있지 못했다고 합니다. 하지만 각각 5만 건의 이미지를 갖고 있는 15종의 생활 폐기물 이미지는 설계, 수집, 가공, 검증단계별 사업수행읕 통해 생활 폐기물 산업,자치단체, 공공기관등 분야에서 활용 가능한 범용성 높은 학습용 데이터로 구축되었다고 합니다. 그렇다면 이렇게 전략적으로 수집된 '생활 폐기물 이미지' 데이터를 어떻게 활용할 수 있을까요?

 

활용방안으로는 다양한 방법이 있을 수 있는데요, 첫 번째로 해당 이미지를 학습시켜서 생활폐기물 탐지 서비스를 만들 수 있지 않을까 싶습니다. 75만 건의 이미지를 종류별로 학습시킨 후, 자동 탐지 및 분류 기술이 접목된 라이브 캠을 설치하면, 실시간으로 생활폐기물이 버려져 있는 장소와 어떠한 종류의 생활폐기물인지 알려주는 알림을 보내는 서비스를 구현할 수 있지 않을까 싶습니다. 또한 폐기물 처리 시설에서도 생활폐기물 자동 분류 시스템을 구축하면 좀 더 정확하게 폐기물을 분류하여 처리하는 데에 도움이 되지 않을까 싶네요! 이러한 다양한 방법으로 폐기물 자원 관리를 효율화시킬 수 있는 인공지능 기능을 구현시킨다면 향후 지능형 로봇개발에도 활용 가능하며, 폐기물 처리에 큰 영향을 끼칠 수 있는 기술이 되지 않을까 싶습니다!

 

 

 

 

 

# AIHUB

 

 

 오늘 리뷰한 '생활 폐기물 이미지' 데이터는 <AIHUB(AI 허브)>에서 다운로드 받은 '국토환경' 카테고리의 데이터로, AI 허브는 AI 기술 및 제품, 서비스 개발에 필요한 AI 인프라(AI데이터, AISWAPI, 컴퓨팅 자원)를 지원함으로써 누구나 활용하고 참여하는 AI통합 플랫폼입니다! 따라서 사용자를 위해 개발 및 활용을 위한 인프라 서비스와 AI 활성화를 위한 서비스를 제공하고 있는 것인데요, 현재 위와 같이 음성/자연어, 비전, 헬스케어, 자율주행 등 다양한 카테고리에 걸친 데이터들을 제공하고 있답니다.

 

 

한편, 오늘 살펴본 데이터는 '국토환경' 카테고리에 있는 데이터였는데요, 국토환경 카테고리는 관광, 산림, 환경, 토지 등과 관련된 데이터를 제공하는 카테고리입니다. 특히 다른 빅데이터 플랫폼에서는 찾아보기 힘든 데이터들이 제공되고 있고, 우리나라에 환경에서 구축된 데이터들로 이루어져 있기 때문에 우리나라에서 상용화하기 위한 서비스 개발에 활용하기에 매우 적합한 데이터이기도 하답니다. 

 

 

또한 각 데이터 다운로드 페이지에 들어가면 위와 같이 데이터의 구축내용과 필요성, 데이터 구조, 활용예시 등의 정보를 파악할 수 있기 때문에 데이터를 다운로드하기 전에 어떠한 형태로 이루어져 있는지, 데이터를 어떻게 활용하면 좋을지 살펴볼 수 있답니다.

 

이렇게 오늘 데이터 리뷰기에서는 AIHUB의 '생활 폐기물 이미지' 데이터를 리뷰해보았는데요, 다음 리뷰기에서도 동일한 '국토환경' 카테고리의 다른 데이터를 리뷰해보도록 하겠습니다. 이전 데이터 리뷰기에서는 소방, 사회 범죄, 해양수산, 헬스케어, 농수산물 등 여러 플랫폼에서 제공하는 데이터 리뷰기가 있으니, 관심이 있으신 분들은 참조하시기 바랍니다! 그럼 다음 리뷰기에서 만나요! :D