본문 바로가기

BLOG/데이터 리뷰기

[데이터 리뷰] AIHUB(농축수산) - 과수화상병 촬영 이미지 데이터

데이터 리뷰 : 데이터 대신 읽어드립니다!
#35 AIHUB(농축수산) - 과수화상병 촬영 이미지 데이터

 

 

 

 

 '과수화상병'이란 사과 또는 배에 생기는 세균성 병해의 일종으로, 과수화상병이 발생하면 1년 안에 나무는 고사하게 됩니다. 또한 과수화상병은 다른 나무로 전염이 쉽게 되기 때문에 초기에 발생했을 때 빠른 대응이 필요한데요, 현재 국내에서는 과수화상병 피해가 극심해지고 있다고 합니다. 한편, 4차 산업혁명이 도래함으로써 스마트팜 기술들이 많이 발전되고 있는데요, 이에 따른 과수화상병 데이터와 추가적인 질병 정보 등을 수집하고 과수화상병에 대한 선제적인 예찰 및 대응 기술들이 개발될 필요가 있습니다.

 

이와 관련해서 AIHUB에서는 과수화상병을 진단하고 처방하기 위한 목적으로 구축한 '과수화상병 촬영 이미지' 데이터를 제공하고 있는데요, 이 데이터는 주요 과수(사과, 배)의 화상병 및 유사 병종의 이미지 데이터로 구축되어 있습니다. 그렇다면, 이번 데이터 리뷰기에서는 이 데이터가 어떻게 구축되어 있는지 살펴보고, 어떻게 활용하면 좋을지 생각해보도록 하겠습니다!

 

 

 

 

 

 

과수화상병 촬영 이미지 데이터

 

(1) 데이터 정보

  • 제공기관 : 라온피플㈜
  • 데이터 개수 : 19.4만 개
  • 데이터 형식 : json, jpg
  • 데이터 구성 : 병해에 대한 진전도 별 이미지(정상, 초기, 중기, 말기 구분별 이미지), 촬영 환경(위치, 시간 등) 및
    질병코드 분류(대상작물, 병해) 등 메타정보 포함
  • 다운로드 : https://aihub.or.kr/aidata/30732

 

'과수화상병 촬영 이미지' 데이터는 실제 촬영본 11만 건(정상 9.5만 건, 질병 1.5만 건)을 활용하여, 각각 정상 작물 이미지 4만 건, 질병 원본 이미지 1.4만 건, 질병 증강 이미지 14만 건을 포함하여 작물 2종에 대해 총 19.4만 건의 과수화상병 학습 데이터로 구축되어 있습니다. 

 

위에 다운로드 링크로 들어가면 회원가입 또는 로그인 후 데이터를 다운받을 수 있는데요, 그렇다면 데이터를 다운받아서 한번 데이터가 어떻게 이루어져 있는지 살펴보도록 하겠습니다~

 

 

(2) 데이터 리뷰

 데이터를 다운로드 하면, 크게 원천 데이터, 라벨링 데이터 폴더로 이루어져 있는데요, 원천 데이터에는 이미지 데이터가, 라벨링 데이터에는 이미지 데이터에 대한 메타 정보가 포함되어 있습니다. 그렇다면 원천 데이터 폴더에 있는 이미지부터 살펴볼까요~?

 

 

#원천데이터

 

원천 데이터 폴더에는 정상적인 작물의 잎, 또는 열매 이미지와 과수화상병이나 기타 질병에 걸린 작물의 이미지 데이터로 구성되어 있는데요, 다음과 같습니다.

 

- 정상 작물 이미지

 

 

 

 

 

 

- 감염 작물 이미지

 

 

 

정상 작물 이미지와 감염 작물 이미지를 확인해봤는데요, 동일한 작물에서 두 가지 모습을 볼 수 없지만 대략적으로 상태가 좋은지, 좋지 않은지 가늠을 할 수 있습니다.

 

 

#라벨링 데이터

 

반면, 라벨링 데이터는 이미지 데이터에 대한 정보를 더 구체적으로 알려주는 메타 데이터로 이루어져 있는데요, 각 이미지 데이터마다 동일한 파일명의 json 파일로 이루어져 있습니다. 그렇다면 동일한 이미지에 대한 메타 데이터를 살펴볼까요?

 

 

위 이미지는 정상적인 작물(배)의 열매 이미지인데요, 오른쪽은 해당 이미지에 대한 json 데이터입니다.

 

위 json 데이터를 잘 살펴보면 이미지 데이터로만 알 수 없는 정보들이 있는데요, 크게 이미지 정보(촬영 일자, 촬영 지역, 이미지 사이즈, 질병 유형), 학습용 정보(질병/해충 코드, 작물 코드, 촬영 부위, 작물 생육단계, 질병 피해 정도, 주목 객체의 bbox 좌표)를 알 수 있답니다.

 

{
    "description": {
        "image": "V006_80_0_00_01_01_25_0_b06_20201005_0000_S01_1.jpg",
        "date": "2020/10/05",
        "worker": "",
        "height": 2196,
        "width": 4640,
        "task": 80,
        "type": 0,
        "region": null
    },
    "annotations": {
        "disease": 0,
        "crop": 1,
        "area": 1,
        "grow": 25,
        "risk": 0,
        "points": [
            {
                "xtl": 1330,
                "ytl": 76,
                "xbr": 3426,
                "ybr": 2141
            }]}}

 

데이터 다운로드 페이지에 있는 어노테이션 포맷을 살펴봄으로써 메타 정보를 구체적으로 확인할 수 있는데요, 메타 정보를 통해 위 이미지에 대해 설명하자면, 해당 이미지는 2020년 10월 5일에 촬영된 이미지로, 정상 작물(type:0)에 대한 이미지인 것을 알 수 있습니다. 따라서 질병/해충 코드는 없으며(disease:0), 작물 생육 단계는 과실기(grow:25)인 것을 알 수 있습니다.

 

한편, 마지막 쪽에 있는 데이터를 보면 xtl, ytl, xbr, ybr의 값이 있는데요, 이 값은 이미지마다 주목 객체의 box 좌표로, 이 좌표를 이용하면 아래와 같이 나타낼 수 있답니다.

 

 

 

(3) 데이터 활용

 그렇다면 이 '과수화상병 촬영 이미지' 데이터를 이용하여 어떻게 활용할 수 있을까요?

우선, 해당 데이터는 국내 피해 사례에 기반하여 배와 사과에 대한 과수화상병 진단을 우선순위로 두어 접근성과 활용도를 목표로 하였고, 재사용에 제한이 없도록 저작권 문제를 완전히 해결한 데이터만을 취급하여 구축했다고 합니다. 따라서 국내에 있는 과수원 등에 적용하기 매우 적합한 데이터임을 알 수 있는데요, AI 기반 스마트 병해충을 진단하고 예찰을 위한 AI 비전 기술 개발에 활용할 수 있지 않을까 싶습니다. 즉, 해당 데이터를 학습하여 국내 과수원에서 발생하는 과수화상병을 자동으로 진단하는 시스템을 개발하여 과수화상병의 전염을 방지할 수 있는 시스템을 개발할 수 있기 않을까 싶습니다.

 

또한 이미지 데이터와 질병 유무에 대한 정보뿐만 아니라, 촬영 부위, 발병된 질병 명칭, 피해 정도, 발병 부위 및 위치 정보가 함께 들어있는 데이터라는 점에서 작물 질병에 대한 다방면의 연구와 더욱 구도화 된 상용화 서비스를 개발할 수 있지 않을까 싶은데요, 이처럼 배, 사과의 질병 정보를 데이터를 구축하여 체계적으로 관리하고 제공됨으로써 앞으로 과수화상병 연구에 많이 활용될 수 있지 않을까 싶습니다-!

 

 

 

 

 

# AIHUB

 

https://aihub.or.kr/

 

 오늘 리뷰한 '과수화상병 촬영 이미지' 데이터는 <AIHUB(AI 허브)>에서 다운로드 받은 '농축수산' 카테고리의 데이터로, AI 허브는 AI 기술 및 제품, 서비스 개발에 필요한 AI 인프라(AI데이터, AISWAPI, 컴퓨팅 자원)를 지원함으로써 누구나 활용하고 참여하는 AI통합 플랫폼입니다! 따라서 사용자를 위해 개발 및 활용을 위한 인프라 서비스와 AI 활성화를 위한 서비스를 제공하고 있는 것인데요, 현재 위와 같이 음성/자연어, 비전, 헬스케어, 자율주행 등 다양한 카테고리에 걸친 데이터들을 제공하고 있답니다.

 

 

한편, 오늘 살펴본 데이터는 '농축수산' 카테고리에 있는 데이터였는데요, 농축수산 카테고리는 농업, 축업, 수산 등과 관련된 데이터를 제공하는 카테고리입니다. 특히 다른 빅데이터 플랫폼에서는 찾아보기 힘든 농축수산 데이터들이 제공되고 있고, 실제 우리나라 지리에서 하고 있는 농축수산업에서 구축된 데이터들로 이루어져 있기 때문에 우리나라에서 상용화하기 위한 서비스 개발에 활용하기에 매우 적합한 데이터이기도 하답니다. 

 

 

또한 각 데이터 다운로드 페이지에 들어가면 위와 같이 데이터의 구축내용과 필요성, 데이터 구조, 활용예시 등의 정보를 파악할 수 있기 때문에 데이터를 다운로드하기 전에 어떠한 형태로 이루어져 있는지, 데이터를 어떻게 활용하면 좋을지 살펴볼 수 있답니다.

 

이렇게 오늘 데이터 리뷰기에서는 AIHUB의 '과수화상병 촬영 이미지' 데이터를 리뷰해보았는데요, 다음 리뷰기에서도 동일한 '농축수산' 카테고리의 다른 데이터를 리뷰해보도록 하겠습니다. 이전 데이터 리뷰기에서는 소방, 사회 범죄, 해양수산, 헬스케어, 농수산물 등 여러 플랫폼에서 제공하는 데이터 리뷰기가 있으니, 관심이 있으신 분들은 참조하시기 바랍니다! 그럼 다음 리뷰기에서 만나요! :D