본문 바로가기

BLOG/데이터 리뷰기

[데이터 리뷰] AIHUB(헬스케어) - 건강관리를 위한 음식 이미지 데이터

데이터 리뷰 : 데이터 대신 읽어드립니다!
#53 AIHUB(헬스케어) - 건강관리를 위한 음식 이미지 데이터

 

 

 

 

 다양한 음식에 대한 소비문화가 증가하면서 음식 관련의 인공지능의 학습용 데이터로 활용하기 위한 음식 이미지 데이터베이스는 점차 증가하고 있고, 해외에선 활용 가능한 다양한 음식 이미지 데이터셋이 구축되어 있다고 합니다. 하지만 한국음식의 경우 다양한 양념을 사양하고, 여러 조리법을 활용한 음식이 주를 이루고 있기 때문에 음식 인식과 음식 분류가 어렵다고 합니다. 따라서 인공지능 학습데이터로 활용 가능한 다양한 음식 이미지가 필요하며, 인공지능 기술의 활성화를 위해선 무엇보다 다양한 패턴의 고품질 이미지 데이터 확보가 중요하다고 합니다.

 

이와 관련하여 AIHUB 플랫폼에서는 '건강관리를 위한 음식 이미지' 데이터를 제공하고 있는데요, 당뇨병 환자의 식단 관리를 위한 주재료 및 칼로리 정보가 포함된 음식 이미지 데이터셋입니다. 그렇다면, 이번 데이터 리뷰기에서는 이 데이터가 어떻게 이루어져 있는지 살펴보고, 어떻게 분석 및 활용하면 좋을지 생각해보도록 하겠습니다!

 

 

 

 

 

건강관리를 위한 음식 이미지 데이터

 

(1) 데이터 정보

  • 제공기관 : 호서대학교산학협력단
  • 데이터 개수 : 300만
  • 데이터 형식 : jpeg, png, json
  • 데이터 구성 : 500여 종의 음식 이미지 300만 장, 어노테이션 데이터
  • 다운로드 : https://aihub.or.kr/aidata/27674

 

'건강관리를 위한 음식 이미지' 데이터는 시각지능 기술 및 서비스 개발을 위해 필요한 각종 음식 이미지 데이터로 구축되어 있고, 음식명, 음식 건강정보 등에 대한 정보가 라벨링 되어 있습니다. 특히, 음식 인식성능의 강화를 위해 카테고리 500여 개의 음식(한식, 중식, 일식, 수산물, 분식, 정통양식, 패스트푸드, 제과제빵케익 ,커피 등) 데이터를 확보하고 있다고 합니다.

 

한편, 위에 다운로드 링크로 들어가면 회원가입 또는 로그인 후 데이터를 다운받을 수 있는데요, 데이터를 다운받아서 한번 데이터가 어떻게 이루어져 있는지 살펴보도록 하겠습니다~

 

 

(2) 데이터 리뷰

 데이터를 다운로드하면, 각 기준마다 분류된 약 500여 개의 음식 폴더가 있고, 각 음식 폴더에는 여러 이미지 데이터와 각 이미지 데이터에 대한 정보가 담겨 있는 json 파일로 구성되어 있습니다.

 

그럼 먼저 이미지 데이터부터 확인해볼까요~?

 

 

- 이미지 데이터

 

# 베이글샌드위치

 

#보쌈

 

#비빔밥

 

이미지 데이터는 한 음식 종류마다 약 100개 가량의 이미지로 구축되어 있는데요, 참 다양한 음식 이미지들이 있는 것을 확인할 수 있습니다.

 

 

- json 데이터

 

반면, json 파일 형식으로 이루어진 데이터에는 각 음식 이미지에 대한 정보가 담겨 있는데요, 위에 비빔밥 이미지에서 첫 번째 이미지에 대한 json 파일은 다음과 같습니다.

 

[
  {
    "Code Name": "B010316XX_02327.jpg",
    "Name": "bibimbap",
    "W": "0.873459",
    "H": "0.901239",
    "File Format": "jpg",
    "Cat 1": "01",
    "Cat 2": "03",
    "Cat 3": "16",
    "Cat 4": "xx",
    "Annotation Type": "binding",
    "Point(x,y)": "0.555041,0.466358",
    "Label": "0",
    "Serving Size": "xx",
    "Camera Angle": "xx",
    "Cardinal Angle": "xx",
    "Color of Container": "xx",
    "Material of Container": "xx",
    "Illuminance": "xx"
  }
]

 

위 데이터를 확인해보면 이미지 데이터만으로는 알 수 없는 정보들을 담고 있는데요, 위에서부터 파일 이름과 해당 음식 이름을 알 수 있고, 이미지의 사이즈(너비:W, 높이:J), 파일 포맷을 알 수 있습니다. 그 밑으로 Cat은 대분류, 중분류, 소분류, 미소분류를 나타내는데요, 각 코드가 나타내는 분류명은 데이터 다운로드 페이지의 데이터 설명서에서 확인하실 수 있습니다. 그 밑으로 Annotation Type은 annotation 유형을, Point는 라벨링 영역을 의미한답니다. Label은 class 정보를 가리키고, 마지막으로 "xx"로 기록된 부분들은 각각 정량, 촬영각도, 방위각도, 용기색상, 용기재질, 조도를 나타내는데요, 해당부분은 데이터가 구축되지 않은 것을 알 수 있습니다.

 

한편, 아래와 같은 데이터도 구축되어 있는데요, 해당 데이터는 카테고리별로 사용된 레시피 자료와 식품별 100g 메타정보를 활용하여 1인 1회분량에 대한 메타 정보(에너지, 탄수화물, 단백질, 지방)를 계산하여 구축된 데이터라고 합니다. 따라서 아래 데이터를 이용하여 식품에 대한 에너지, 탄수화물 등의 정보를 계산하여 얻을 수 있답니다.

 

 

 

(3) 데이터 활용

 그렇다면 이 '건강관리를 위한 음식 이미지' 데이터를 이용하여 어떻게 활용할 수 있을까요? 우선 해당 데이터는 한국인이 많이 섭취하는 다빈도 및 다소비 식품을 중심으로 카테고리가 구축되었고 수집된 이미지에 매칭 되는 코드 표준화가 이루어져 있습니다. 또한 해당 음식에 대한 기본 영양정보가 데이터로 구축되어 있다는 점을 이용하여 음식 인식 모델의 학습 데이터로 사용하여, 당뇨환자나 비만 환자의 식단을 분석 및 관리할 수 있는 시스템을 구현할 수 있지 않을까 싶습니다. 예를 들어, 식단을 촬영하여 이미지를 입력하면 해당 식단의 영양정보, 칼로리 등을 계산하여 알려주는 식단 관리 서비스와 같이, 건강 관리와 관련된 정보 서비스 상용화 및 다양한 헬스케어 분야에 활용될 수 있지 않을까 싶습니다! 뿐만 아니라 한국음식 이미지 데이터를 통해 건강관리, 병원 및 헬스케어 센터의 건강관리 정보 제공 서비스 등 다양한 분야에 활용될 수 있지 않을까 싶습니다 :D

 

 

 

# AIHUB

 

 

 오늘 리뷰한 '건강관리를 위한 음식 이미지' 데이터는 <AIHUB(AI 허브)>에서 다운로드 받은 '헬스케어' 카테고리의 데이터로, AI 허브는 AI 기술 및 제품, 서비스 개발에 필요한 AI 인프라(AI데이터, AISWAPI, 컴퓨팅 자원)를 지원함으로써 누구나 활용하고 참여하는 AI통합 플랫폼입니다! 따라서 사용자를 위해 개발 및 활용을 위한 인프라 서비스와 AI 활성화를 위한 서비스를 제공하고 있는 것인데요, 현재 위와 같이 음성/자연어, 비전, 헬스케어, 자율주행 등 다양한 카테고리에 걸친 데이터들을 제공하고 있답니다.

 

 

한편, 오늘 살펴본 데이터는 '헬스케어' 카테고리에 있는 데이터였는데요, 헬스케어 카테고리는 질환 및 질병 진단 의료 영상, 인체 자세, 신체 정보 등에 관련된 데이터를 제공하는 카테고리입니다. 특히 개인이 구축하기엔 어려운 의료 데이터들이 많고, 다른 빅데이터 플랫폼에서는 찾아보기 힘든 데이터들이 제공되고 있습니다. 또한 실제 우리나라 사람들로부터 구축된 데이터들로 이루어져 있기 때문에 우리나라에서 상용화하기 위한 서비스 개발에 활용하기에 매우 적합한 데이터이기도 하답니다. 

 

 

또한 각 데이터 다운로드 페이지에 들어가면 위와 같이 데이터의 구축내용과 필요성, 데이터 구조, 활용예시 등의 정보를 파악할 수 있기 때문에 데이터를 다운로드하기 전에 어떠한 형태로 이루어져 있는지, 데이터를 어떻게 활용하면 좋을지 살펴볼 수 있답니다.

 

 

이렇게 오늘 데이터 리뷰기에서는 AIHUB의 '건강관리를 위한 음식 이미지' 데이터를 리뷰해보았는데요, 다음 리뷰기에서는 AIHUB가 아닌 다른 플랫폼에 있는 다른 데이터를 리뷰해보도록 하겠습니다. 이전 데이터 리뷰기에서는 소방, 사회 범죄, 해양수산, 헬스케어, 농수산물 등 여러 플랫폼에서 제공하는 데이터 리뷰기가 있으니, 관심이 있으신 분들은 참조하시기 바랍니다! 그럼 다음 리뷰기에서 만나요! :D