본문 바로가기

BLOG/데이터 리뷰기

[데이터 리뷰] AIHUB(농축수산) - 가축 행동 영상 데이터

데이터 리뷰 : 데이터 대신 읽어드립니다!
#36 AIHUB(농축수산) - 가축 행동 영상 데이터

 

 

 

 

 전 세계적으로 육류 소비량이 증가함에 따라 축산업 또한 활발하게 진행되고 있는데요, 한편으론 축산업이 증가하면서 축가농가에서 발생되는 문제들도 있다고 합니다. 예를 들어, 가축 질병의 유형이 빠르게 변이하고 새로운 바이러스 등이 발견됨으로써 백신과 항생제만으로는 가축 질병과 전염성의 통제가 어렵다고 합니다. 또한 이러한 가축 질병이 발생하면 육류 소비량이 거의 반으로 줄어들어 축산농가에 큰 타격을 준다고 하는데요, 이처럼 축산업의 증가에 따른 적절한 가축 사육 시스템 구축이 필요하다고 볼 수 있습니다.

 

이와 관련해서 AIHUB에서는 가축 관리 시스템을 구축하기 위해  '가축 행동 영상' 데이터를 제공하고 있는데요, 이 데이터는 축산 동물(축우, 양돈, 양계 등)의 행동 분석, 개체 추척 등을 위한 AI 개발용 영상 데이터로 구축되어 있습니다. 그렇다면, 이번 데이터 리뷰기에서 이 데이터가 어떻게 구성되어 있는지 살펴보고, 어떻게 분석 및 활용하면 좋을지 생각해보도록 하겠습니다!

 

 

 

 

 

 

가축 행동 영상 데이터

 

(1) 데이터 정보

  • 제공기관 : 한국축산데이터㈜ 농업회사법인
  • 데이터 개수 : 21만 개
  • 데이터 형식 : json, jpg
  • 데이터 구성 : 파일 이름, 이미지 크기, 축사명, 메타데이터, 데이터 취득 시간, 가축 위치 정보, 크기 정보, 가축 부위 위치 정보와 가림 유무
  • 다운로드 : https://aihub.or.kr/aidata/30734

 

'가축 행동 영상' 데이터는 소, 돼지, 닭(육계, 토종닭)의 행동 분석을 위한 축산 AI 개발용 영상 데이터셋으로, 소, 돼지, 닭 각각 7만 건의 가공이미지로 구축되어 있는데요, 소, 돼지의 특정 부위별, 특정 행동별로 촬영되어 있습니다. 특정 행동으로는 서 있는 자세, 가슴 대고 누워있는 자세, 또는 옆으로 누워있는 자세를 말한답니다. 반면 닭의 경우 그룹 밀집도 분포 분류를 위한 개체 검출 이미지로 구성되어 있습니다.

 

한편, 위에 다운로드 링크로 들어가면 회원가입 또는 로그인 후 데이터를 다운받을 수 있는데요, 데이터를 다운받아서 한번 데이터가 어떻게 이루어져 있는지 살펴보도록 하겠습니다~

 

 

(2) 데이터 리뷰

 데이터를 다운로드하면, 크게 라벨링 데이터와 원천 데이터로 나누어져 있는데요, 원천 데이터는 이미지 데이터가, 라벨링 데이터는 이미지 데이터에 대한 메타 정보가 들어있는 json 형식의 데이터입니다. 그렇다면 원천 데이터부터 살펴보겠습니다.

 

 

#원천 데이터

 

원천 데이터에는 소, 돼지, 닭으로 또 데이터가 분류되어 있으며, 소, 돼지 데이터에는 bbox, keypoints 데이터로, 닭 데이터는 points 데이터로 나누어져 있습니다. 그럼 소 데이터부터 확인해보겠습니다.

 

- 소 : bbox

 

 

- 소 : keypoints

 

 

위에 이미지를 확인해보면 알 수 있듯이, bbox 영상 데이터는 여러 소들이 있는 축사 전체의 영상이, keypoints는 소 한 마리에 대한 이미지로 이루어져 있습니다. 따라서 bbox 데이터에서는 소들의 그룹 밀집도를, keypoints 데이터에서는 소의 구체적인 모습, 행동 및 자세 등을 알 수 있습니다.

 

그럼 돼지 데이터도 확인해볼까요~?

 

- 돼지 : bbox & keypoints

 

 

돼지 영상 데이터의 bbox, keypoints 데이터를 확인해보면 마찬가지로 bbox 데이터는 축사의 모습, keypoints 데이터는 한 마리에 대한 영상 데이터임을 알 수 있습니다.

 

마지막으로 points 데이터만 있는 닭 데이터를 살펴보겠습니다.

 

- 닭 : points

 

 

닭 데이터는 위와 같이 계사의 모습만 담긴 영상 데이터로 이루어져 있는데요, 해당 이미지를 통해 닭의 그룹 밀집도 분포를 대략 알 수 있습니다.

 

 

#라벨링 데이터

 

 한편, 라벨링 데이터에는 위에서 살펴본 이미지 데이터에 대해서 이미지로만 파악할 수 없는 정보들을 담은 데이터로 이루어져 있는데요, 아래 이미지에 대한 json 데이터는 다음과 같습니다.

 

{"label_info": 
     {"image": {"file_name": "livestock_cow_keypoints_000016.jpg", 
                  "width": 261, 
                  "height": 314, 
                  "farm_name": "yangpyeong", 
                  "farm_env": "open", 
                  "time": "daytime"}, 
     "annotations": [{"bbox": [0, 0, 261, 314], 
                    "keypoints": [43, 10, 2, 80, 23, 2, 113, 23, 2, 147, 157, 1, 150, 195, 1, 155, 236, 2, 83, 151, 2, 105, 199, 2, 110, 242, 2, 193, 55, 2, 241, 190, 2, 227, 250, 1, 233, 303, 2, 172, 188, 2, 198, 249, 2, 187, 293, 2, 218, 83, 2], 
                    "category_id": 1}], 
     "categories": [{"supercategory": "livestock_cow", 
                       "id": 1, 
                       "name": "cattle", 
                       "keypoints_name": ["fore_head", "neck", "fore_spine", "fore_right_shoulder", "fore_right_knee", "fore_right_foot", "fore_left_shoulder", "fore_left_knee", "fore_left_foot", "rear_spine", "rear_right_shoulder", "rear_right_knee", "rear_right_foot", "rear_left_shoulder", "rear_left_knee", "rear_left_foot", "hip"], 
                       "skeleton": [[1, 2], [2, 3], [3, 4], [3, 7], [3, 10], [4, 5], [5, 6], [7, 8], [8, 9], [10, 11], [10, 14], [11, 12], [12, 13], [14, 15], [15, 16], [10, 17]]}, 
...(생략)

 

위 라벨링 데이터를 확인해보면, 크게 image, annotations, categories로 이루어져 있는 것을 살펴볼 수 있는데요, image 정보에서는 해당 파일 이름(file_name), 이미지 사이즈(width, height), 축사명(farm_name), 축사 개방형(farm_env), 영상 취득 시간(time)에 대한 정보를 얻을 수 있습니다.

 

한편 anootations 영역에서는 가축의 위치 정보와 부위 정보 등을 알 수 있는데요, bbox는 해당 가축의 위치 정보와 크기 정보를, keypoints는 가축 부위의 위치 정보와 가림 유무를 뜻합니다.

 

마지막으로 categories는 상위 카테고리(supercategory), 가축 이름(name), 부위별 키포인트 이름(keypoints_name), 부위별 연결(ex. 코-왼쪽 귀, 오른쪽 귀)  정보를 알 수 있답니다.

 

이러한 정보들과 bbox, keypoints 좌표 값을 통해 아래와 같이 가축에 대해 키포인트 탐지 및 자세 분류, 개체 탐지를 할 수 있답니다.

 

 

 

 

(3) 데이터 활용

 그렇다면 '가축 행동 영상' 데이터를 어떻게 활용할 수 있을까요? 먼저 각 가축마다 7만 장의 영상 데이터가 구축되어 있다는 점, 각 가축의 특정 부위 좌표, 행동 keypoints가 분류되어 있다는 점을 이용하여 해당 데이터를 학습시키면 가축에 대한 행동 분석 모델을 만들 수 있지 않을까 싶습니다. 행동 분석 모델을 만든다면 가축의 행동이나 자세를 분석하여 가축의 상태를 알 수 있을 겁니다. 또한 행동 분석뿐만 아니라 축사, 계사의 영상 데이터를 통해 개체 추적 시스템을 구현하여 라이브 캠에 결합시키면 실시간으로 가축의 행동 분석, 개체 추적 등의 시스템을 구축할 수 있지 않을까 싶어요-!

 

또한 이러한 시스템을 이용하여 또 다른 AI 영상 데이터셋을 구축하여 가축 관리 시스템 개발에 기본이 되는 데이터를 구축하고, 농가상태 맞춤 관리, 사육 및 질병 관리 등의 서비스를 제공하는 축산업 기술을 개발할 수 있지 않을까 싶습니다!

 

 

 

 

 

# AIHUB

 

https://aihub.or.kr/

 

 오늘 리뷰한 '가축 행동 영상' 데이터는 <AIHUB(AI 허브)>에서 다운로드 받은 '농축수산' 카테고리의 데이터로, AI 허브는 AI 기술 및 제품, 서비스 개발에 필요한 AI 인프라(AI데이터, AISWAPI, 컴퓨팅 자원)를 지원함으로써 누구나 활용하고 참여하는 AI통합 플랫폼입니다! 따라서 사용자를 위해 개발 및 활용을 위한 인프라 서비스와 AI 활성화를 위한 서비스를 제공하고 있는 것인데요, 현재 위와 같이 음성/자연어, 비전, 헬스케어, 자율주행 등 다양한 카테고리에 걸친 데이터들을 제공하고 있답니다.

 

 

한편, 오늘 살펴본 데이터는 '농축수산' 카테고리에 있는 데이터였는데요, 농축수산 카테고리는 농업, 축업, 수산 등과 관련된 데이터를 제공하는 카테고리입니다. 특히 다른 빅데이터 플랫폼에서는 찾아보기 힘든 농축수산 데이터들이 제공되고 있고, 실제 우리나라 지리에서 하고 있는 농축수산업에서 구축된 데이터들로 이루어져 있기 때문에 우리나라에서 상용화하기 위한 서비스 개발에 활용하기에 매우 적합한 데이터이기도 하답니다. 

 

 

또한 각 데이터 다운로드 페이지에 들어가면 위와 같이 데이터의 구축내용과 필요성, 데이터 구조, 활용예시 등의 정보를 파악할 수 있기 때문에 데이터를 다운로드하기 전에 어떠한 형태로 이루어져 있는지, 데이터를 어떻게 활용하면 좋을지 살펴볼 수 있답니다.

 

이렇게 오늘 데이터 리뷰기에서는 AIHUB의 '가축 행동 영상' 데이터를 리뷰해보았는데요, 다음 리뷰기에서도 동일한 '농축수산' 카테고리의 다른 데이터를 리뷰해보도록 하겠습니다. 이전 데이터 리뷰기에서는 소방, 사회 범죄, 해양수산, 헬스케어, 농수산물 등 여러 플랫폼에서 제공하는 데이터 리뷰기가 있으니, 관심이 있으신 분들은 참조하시기 바랍니다! 그럼 다음 리뷰기에서 만나요! :D