본문 바로가기

BLOG/데이터 리뷰기

[데이터 리뷰] AIHUB(자율주행) - 자율주행버스 개발 노선 주행 이미지 데이터

데이터 리뷰 : 데이터 대신 읽어드립니다!
#45 AIHUB(자율주행) - 자율주행버스 개발 노선 주행 이미지 데이터

 

 

 

 자율 주행 자동차에 대한 기술 연구나 개발 등은 현재 활발하게 진행되고 있고, 시행되고 있는 나라도 있는데요, 우리나라에서도 최신에 출시된 자동차에 자율 주행 기능이 탑재되어 있는 것을 볼 수 있습니다. 하지만 대중 교통 버스에 대한 자율 주행 사례는 찾아보기 어려운데요, 아무래도 관련 데이터가 부족하기 때문일 수 있습니다. 또한 일반 도로가 아닌 고정된 노선에서 운행되기 때문에 해당 노선에서 구축된 영상 데이터가 있어야 한답니다.

 

이와 관련하여 AIHUB 플랫폼에서는 '자율주행버스 개발 노선 주행 이미지' 데이터를 제공하고 있는데요, 대중 교통 서비스에 대한 자율주행 수요 증대와 운수종사자의 근로환경 개선을 위한 자율주행버스 개발의 필요성에 따라 구축된 데이터라고 합니다. 그렇다면, 오늘 데이터 리뷰기에서는 이 데이터가 어떻게 이루어져 있는지 살펴보고, 어떻게 분석 및 활용하면 좋을지 생각해보도록 하겠습니다!

 

 

 

 

 

자율주행버스 개발 노선 주행 이미지 데이터

 

(1) 데이터 정보

  • 제공기관 : 건국대학교 산학협력단
  • 데이터 개수 : 100만
  • 데이터 형식 : jpg, json
  • 데이터 구성 : 300시간 이상 다양한 환경에서의 버스 노선 주행 영상, 객체 바운딩 박스 데이터, 객체 폴리곤 데이터
  • 다운로드 : https://aihub.or.kr/aidata/34113

 

'자율주행버스 개발 노선 주행 이미지' 데이터는 300시간 이상 다양한 환경(버스 정류장, 버스전용차로, 주행가능 영역)에서의 버스 노선 주행 영상을 학습 데이터 100만 장으로 구축한 데이터입니다. 또한 차, 트럭, 버스, 보행자, 교통표지판, 도로 영역에 대한 객체에 대한 바운딩박스, 폴리곤 데이터가 포함되어 있습니다.

 

한편, 위에 다운로드 링크로 들어가면 회원가입 또는 로그인 후 데이터를 다운받을 수 있는데요, 그렇다면 데이터를 다운받아서 한번 데이터가 어떻게 이루어져 있는지 살펴보도록 하겠습니다~

 

 

(2) 데이터 리뷰

 데이터를 다운로드하면, 크게 원천데이터와 라벨링 데이터로 이루어져 있는데요, 원천 데이터는 이미지 데이터로 구축되어 있고, 라벨링 데이터는 각 이미지에 대한 객체 정보가 담긴 텍스트 데이터로 구축되어 있습니다. 그럼 먼저 원천 데이터부터 살펴보겠습니다.

 

 

#원천 데이터

 

원천 데이터에는 위와 같이 버스 정류장, 신호등, 도로, 버스전용차로, 전용차로 외 주행가능 영역 등 다양한 환경에서 촬영한 버스 노선 주행 영상 데이터입니다. 이미지를 보면 버스정류장, 도로, 사람, 표지판 등의 객체가 있는 것을 확인할 수 있습니다.

 

 

#라벨링 데이터

 

반면 라벨링 데이터에는 각 이미지마다 아래와 같이 json 파일 형식으로 데이터가 이루어져 있습니다.

{
"info": {
          "description": "201215_E_1115-6_CCW_out_D_B_009_00815_BBOX JSON file",
          "url": "",
          "version": "1.0",
          "year": 2021,
          "contributor": "Konkuk_university",
          "date_created": "2021/05/21"
          },
"images": {
          "file_name": "201215_E_1115-6_CCW_out_D_B_009_00815.png",
          "height": 1080,
          "width": 1920,
          "id": 1
          },
"annotations": ["segmentation": [ [ 535.3982685865924, 534.1453865228173, 577.9962587549485, 523.2870753034324, 628.946796015139, 511.593509374864, 680.732587984513, 501.9880802192544, 717.9014225431765, 493.2179057728281, 769.6872145125506, 483.6124766172184, 812.2852046809065, 476.09518423456734, 846.9482751120198, 473.589420107017, 859.4770957497716, 474.4246748162005, 861.982859877322, 478.183321007526, 854.8831948492626, 479.4362030713012, 837.7604733110019, 481.52433984425977, 825.2316526732501, 483.6124766172184, 821.8906338365163, 486.9534954539522, 820.2201244181493, 501.1528255100709, 818.5496149997824, 521.6165658850655, 815.6262235176404, 530.3867403314918, 808.9441858441728, 534.1453865228173, 795.9977378518292, 537.0687780049593, 788.8980728237699, 537.0687780049593, 785.1394266324444, 527.8809762039414, 785.5570539870362, 512.8463914386392, 786.3923086962196, 504.076216992213, 783.4689172140775, 496.97655196415366, 772.6106059946926, 495.30604254578674, 756.7407665202071, 495.30604254578674, 746.7177100100056, 498.2294340279289, 739.6180449819464, 505.32909905598814, 735.0241440814373, 518.6931744029234, 738.3651629181711, 526.2104667855745, 742.1238091094967, 535.8158959411842 ] ], "image_id": 1, "polyline": [], "bbox": [], "category_id": 2, "area": 7701.5, "is_crowd": 0, "id": 1
],
"categories": [{ "id": 1, "name": "Pedestrian" }, { "id": 2, "name": "Traffic Signs" }, { "id": 3, "name":                     "Traffic Light" }, { "id": 4, "name": "Bus Stop(roof type)" }, { "id": 5, "name": "Bus Stop(sign type)" }, {                     "id": 6, "name": "Car" }, { "id": 7, "name": "Truck" }, { "id": 8, "name": "Bus" }, { "id": 9, "name":                               "Motorcycle &           Bicycle" }, { "id": 10, "name": "Other Vehicle" } ] }

 

데이터를 살펴보면 크게 info, images, annotations, categories 영역으로 나눌 수 있는데요, info에서는 해당 이미지 파일의 상세설명, 담당기관, 생성일자에 대해 알 수 있으며, images 영역에서는 해당 이미지의 너비, 높이 등에 대한 정보를 얻을 수 있습니다. 반면 annotations에는 어노테이션에 대한 메타데이터를 알 수 있는데요, 해당 객체의 세그멘테이션 정보, 바운딩박스에 대한 데이터를 얻을 수 있습니다. 따라서 해당 데이터를 이용하면 아래와 같이 객체 검출 또는 이미지 시멘틱 세그멘테이션이 가능합니다.

 

 

 

(3) 데이터 활용

 그럼 이렇게 구축된 '자율주행버스 개발 노선 주행 이미지' 데이터를 이용하여 어떻게 활용할 수 있을까요? 우선 해당 데이터를 통해 사람, 정류장, 도로 등의 객체 검출 학습을 시킬 수 있는데요, 이를 이용하여 주변 환경을 인지하며 정해진 노선을 자율적으로 주행하는 대중교통 서비스를 개발할 수 있지 않을까 싶습니다.

 

정류장에 사람이 인지되면 버스장에 서고, 사람이 없으면 정류장을 지나가도록 하거나, 도로 영역 인지를 통해 전방과 후방의 거리를 유지시키며, 과격한 운전을 하는 버스기사의 운행을 제지시키는 자율 주행 기술을 구현시킴으로써 안전 운행 자율주행버스를 구현시킬 수 있지 않을까 싶습니다. 이처럼  안전 운행을 하는 자율 주행 기술을 구현시킨다면 교통환경의 개선과 운수종사자의 근로환경을 개선시키는 데에 일조할 수 있지 않을까 싶습니다-!

 

 

 

 

# AIHUB

 

https://aihub.or.kr/

 

 오늘 리뷰한 '자율주행버스 개발 노선 주행 이미지' 데이터는 <AIHUB(AI 허브)>에서 다운로드 받은 '자율주행' 카테고리의 데이터로, AI 허브는 AI 기술 및 제품, 서비스 개발에 필요한 AI 인프라(AI데이터, AISWAPI, 컴퓨팅 자원)를 지원함으로써 누구나 활용하고 참여하는 AI통합 플랫폼입니다! 따라서 사용자를 위해 개발 및 활용을 위한 인프라 서비스와 AI 활성화를 위한 서비스를 제공하고 있는 것인데요, 현재 위와 같이 음성/자연어, 비전, 헬스케어, 자율주행 등 다양한 카테고리에 걸친 데이터들을 제공하고 있답니다.

 

 

한편, 오늘 살펴본 데이터는 '자율주행' 카테고리에 있는 데이터였는데요, 자율주행 카테고리는 도로, 교통, 건물, 인도 보행 등 자율주행과 관련된 데이터를 제공하는 카테고리입니다. 특히 개인이 구축하기엔 어려운 데이터들이 많고, 다른 빅데이터 플랫폼에서는 찾아보기 힘든 데이터들이 제공되고 있습니다. 또한 실제 우리나라에 있는 지역, 환경 등에서 구축된 데이터들로 이루어져 있기 때문에 우리나라에서 상용화하기 위한 서비스 개발에 활용하기에 매우 적합한 데이터이기도 하답니다. 

 

 

또한 각 데이터 다운로드 페이지에 들어가면 위와 같이 데이터의 구축내용과 필요성, 데이터 구조, 활용예시 등의 정보를 파악할 수 있기 때문에 데이터를 다운로드하기 전에 어떠한 형태로 이루어져 있는지, 데이터를 어떻게 활용하면 좋을지 살펴볼 수 있답니다.

 

 

이렇게 오늘 데이터 리뷰기에서는 AIHUB의 '자율주행버스 개발 노선 주행 이미지' 데이터를 리뷰해보았는데요, 다음 리뷰기에서도 동일한 카테고리의 다른 데이터를 리뷰해보도록 하겠습니다. 이전 데이터 리뷰기에서는 소방, 사회 범죄, 해양수산, 헬스케어, 농수산물 등 여러 플랫폼에서 제공하는 데이터 리뷰기가 있으니, 관심이 있으신 분들은 참조하시기 바랍니다! 그럼 다음 리뷰기에서 만나요! :D