본문 바로가기

BLOG/데이터 리뷰기

[데이터 리뷰] AIHUB(비전) - 위해물품 엑스레이 이미지 데이터

데이터 리뷰 : 데이터 대신 읽어드립니다!
#19 AIHUB(비전) - 위해물품 엑스레이 이미지 데이터

 

 

 

 

 공항이나 연구소, 대기업 등에서 보안 또는 범죄 예방을 위해서 X-Ray를 통해 물품을 검사하는데요, 이때 보안 요원이 직접 눈으로 판단해 위험 물품을 검출한다고 합니다. 하지만 직접 육안으로 감시를 하기 때문에 정확성이 떨어질 수 있으며, 보안 요안마다 그 기준이 객관화되기 어렵다는 점이 있습니다. 또한 전 세계적으로 테러의 발생률이 증가함으로써 보안 검색이 중요해짐에 따라, 자동으로 X-Ray 이미지를 보고 문제가 되는 물품을 검출하도록 하는 연구가 활발하게 진행 및 개발되고 있다고 한답니다.

 

이와 관련해서 인공지능 빅데이터 플랫폼인 <AIHUB>에서는 '위해물품 엑스레이 이미지' 데이터를 제공하고 있는데요, 이번 데이터 리뷰기에서는 이 데이터가 어떻게 구성되어 있는지 리뷰해보고, 어떻게 분석 및 활용하면 좋을지 생각해보도록 하겠습니다!

 

 

 

 

 

 

위해물품 엑스레이 이미지 데이터

 

(1) 데이터 정보

 

위해물품 엑스레이 이미지 데이터는 34개의 품목에 대해 약 48만 개의 이미지를 제공하는 데이터인데요, AI 기반의 위해 물품 데이터 셋을 구축하여 자동 검출을 위한 알고리즘 개발과 응용 어플리케이션 개발을 위해 구축된 데이터셋이라고 합니다.

 

한편, 위에 다운로드 링크로 들어가면 회원가입 또는 로그인 후 데이터를 다운받을 수 있는데요, 데이터의 일부분인 샘플 데이터를 다운받아서 한번 데이터가 어떻게 이루어져 있는지 살펴보도록 하겠습니다~

 

 

(2) 데이터 리뷰

 

 

먼저, 위해물품 엑스레이 이미지 데이터를 다운받으면, 총 34개의 품목에 대한 폴더가 나오는데요, 이 중에서 Knife 폴더에 들어가 보도록 하겠습니다.

 

 

한 품목의 폴더에 들어가면 이렇게 4개의 폴더가 나오는데요, 각각 복합품목, 복합비품목, 단일기본, 단일비품목 폴더로 이루어져 있답니다. 그럼 각각 폴더의 데이터를 살펴볼까요~?

 

- Multiple_Categories

 

먼저, 복합 품목은 해당 품목의 샘플 복수 수량과 다른 위해 물품과 동시에 넣고 생성한 이미지로, 여러 위해물품 중 칼이 포함되어 있는 것을 살펴볼 수 있습니다.

 

 

- Multiple_Other

 

한편, 복합비품목은 해당 품목의 샘플 복수 수량과 다른 위해 물품 없이 일반 품목을 동시에 넣고 생성된 이미지로 위해 물품은 칼 뿐인 것을 확인할 수 있습니다.

 

 

- Single Default

 

세 번째로 단일 기본 이미지는 해당 품목의 샘플 1개에 해당 물품 이외 어떠한 물품을 넣지 않고 생성된 이미지로, 가방 속에 칼만 있는 것을 확인할 수 있습니다.

 

 

- Single Other

 

마지막으로 단일 비품목 이미지는 해당 품목의 샘플 1개와 다른 위해 물품 없이 일반 품목을 동시에 넣고 생성된 이미지로, 여러 물품 중 딱 1개의 위해물품인 칼이 있는 것을 위 이미지에서 확인할 수 있습니다.

 

 

(3) 데이터 활용

이러한 데이터가 34개의 품목에서 한 품목당 약 2,000~25,000장의 이미지가 있다는 것인데요, 매우 세부적으로 구축된 빅데이터라고 볼 수 있습니다. 그렇다면 이 데이터를 어떻게 이용하여 활용할 수 있을까요?

 

아마, 데이터의 구축 목적에 맞게 위해물품 자동 인식이 아무래도 적절한 활용 방안이 될 수 있는데요, 해당 품목마다 이미지를 적절히 학습시킨다면 새로운 이미지가 주어졌을 때 어떠한 위해물품이 몇 개나 있는지 예측할 수 있지 않을까 싶습니다. 데이터를 다운로드 받으면 알겠지만, 처음에 폴더가 먼저 training(학습용), validation(검증용)으로 잘 나누어져 있기 때문에 이를 이용해서 학습/검증을 해도 좋을 것 같습니다. 그렇게 해서 새로운 엑스레이 이미지에 대해서도 정확도가 높은 예측 모델이 나온다면 데이터 구축 목적에 부합한 결과이지 않을까 싶습니다.

 

한편, 이미지를 학습시키는 데에는 참 다양한 알고리즘이 있는데요, 현재 블로그에 이미지 분석과 관련된 글과 프로젝트가 있으니 관심이 있으신 분들은 참고하시기 바랍니다!

 

 

 

 

 

 

# AIHUB

 

https://aihub.or.kr

 

 오늘 리뷰한 '위해물품 엑스레이 이미지' 데이터는 <AIHUB(AI 허브)>에서 다운로드 받은 '비전' 카테고리의 데이터로, AI 허브는 AI 기술 및 제품, 서비스 개발에 필요한 AI 인프라(AI데이터, AISWAPI, 컴퓨팅 자원)를 지원함으로써 누구나 활용하고 참여하는 AI통합 플랫폼입니다! 따라서 사용자를 위해 개발 및 활용을 위한 인프라 서비스와 AI 활성화를 위한 서비스를 제공하고 있는 것인데요, 현재 위와 같이 음성/자연어, 비전, 헬스케어, 자율주행 등 다양한 카테고리에 걸친 데이터들을 제공하고 있답니다.

 

 

한편, 오늘 살펴본 데이터는 '비전' 카테고리에 있는 데이터였는데요, 비전 카테고리는 말 그대로 시각적인 요소가 포함되어 있는 이미지, 비디오 데이터 등을 제공하는 카테고리입니다. 특히 다른 빅데이터 플랫폼에서는 찾아보기 힘든 데이터들이 제공되고 있고, 한국어, 한국인, 한국건물, 한국음식 등 서양보다는 우리나라에 맞춰져 있는 데이터들이 있기 때문에 상당히 활용하기에 적합한 데이터이기도 합니다. 

 

이렇게 오늘 데이터 리뷰기에서는 AIHUB의 '위해물품 엑스레이 이미지' 데이터를 리뷰해보았는데요, 다음 리뷰기에서도 동일한 '비전' 카테고리의 다른 데이터를 리뷰해보도록 하겠습니다. 이전 데이터 리뷰기에서는 소방, 사회 범죄, 해양수산, 헬스케어, 농수산물 등 여러 플랫폼에서 제공하는 데이터 리뷰기가 있으니, 관심이 있으신 분들은 참조하시기 바랍니다! 그럼 다음 리뷰기에서 만나요! :D