본문 바로가기

BLOG/데이터 리뷰기

[데이터 리뷰] AIHUB(비전) - 한국인 감정인식을 위한 복합 영상 데이터

데이터 리뷰 : 데이터 대신 읽어드립니다!
#22 AIHUB(비전) - 한국인 감정인식을 위한 복합 영상 데이터

 

 

 

 

 사람의 얼굴이나 얼굴 표정을 통해 그 사람의 성별, 연령, 감정 등을 예측할 수 있는데요, 만약 인공지능이 자동으로 그 사람의 정보나 감정 등을 예측하여 판단할 수 있다면 어떨까요? 누군가의 감정을 빠르게 포착하는 것은 하나의 서비스로도 이어질 수 있는데요, 예를 들어 그 사람의 만족도를 측정할 수 있거나 감정이나 기분 등을 파악해 멘탈적인 헬스 케어 서비스로 이어질 수 있습니다.

 

이와 관련해서 인공지능 빅데이터 플랫폼인 <AIHUB>에서는 한국인의 얼굴 표정과 장소 맥락을 고려하여 인공지능이 사람의 감정을 이해할 수 있는 학습 모델 개발을 장려하기 위해 '한국인 감정인식을 위한 복합 영상' 데이터를 제공하고 있습니다. 그렇다면 이번 데이터 리뷰기에서는 이 데이터가 어떻게 구성되어 있는지 리뷰해보고, 어떻게 분석 및 활용하면 좋을지 생각해보도록 하겠습니다!

 

 

 

 

 

 

한국인 감정인식을 위한 복합 영상 데이터

 

(1) 데이터 정보

 

'한국인 감정인식을 위한 복합 영상' 데이터는 성별, 연령, 장소 등의 다양한 상황 속에서 인공감성지능 학습모델을 구현하고, 각종 문화예술 산업에 활용될 수 있는 감정인식 서비스를 개발하고자 구축된 데이터입니다. 

 

위에 다운로드 링크로 들어가면 회원가입 또는 로그인 후 데이터를 다운받을 수 있는데요, 데이터의 일부분인 샘플 데이터를 다운받아서 한번 데이터가 어떻게 이루어져 있는지 살펴보도록 하겠습니다~

 

 

(2) 데이터 리뷰

먼저 데이터를 다운로드하면, 크게 '원천 데이터' 폴더와 '라벨링 데이터' 폴더로 나누어져 있는데요, 원천 데이터에는 사람의 대표적인 감정인 기쁨, 당황, 분노, 불안, 상처, 슬픔, 중립을 표현한 약 50만 건의 이미지로 이루어져 있습니다. 반면 라벨링 데이터에는 json 파일들이 있는데요, 해당 데이터에는 안면 이미지에 대한 바운딩박스 작업, 감정 판별, 장소 판별에 대한 데이터가 구축되어 있답니다. 판별은 수치로 되어 있는데요, 감정의 참값을 이미지 게시자와 어노테이터의 보고된 감정상태를 활용할 수 있도록 데이터가 설계되었다고 합니다.

 

그렇다면 7가지의 감정인 기쁨, 당황, 분노, 불안, 상처, 슬픔, 중립 데이터 중 대표적으로 기쁨, 당황, 슬픔 데이터를 살펴보겠습니다!

 

1. 기쁨

 

 

 

2. 당황

 

 

 

3. 슬픔

 

 

기쁨, 당황, 슬픔 데이터를 살펴보았는데요, 그 감정이 느껴지시나요~?

이 데이터들은 감정표현이 능숙한 전문 배우와 일반인을 통해 촬영된 이미지로 총 50만 장의 달하는 데이터입니다. 또한 데이터를 확인해보면 동일인이 같은 표정으로 여러 장소, 공간에서 촬영을 찍은 것을 확인할 수 있답니다.

 

라벨링 데이터 도면

 

이러한 정보에 대해서는 json 데이터를 통해 확인할 수 있는데요, 해당 데이터를 통해 특정 이미지에 나오는 인물의 성별, 나이대, 감정 정보, 배경 정보, 직업을 알 수 있도록 데이터가 구축되어 있다고 합니다.

 

 

(3) 데이터 활용

 그렇다면 '한국인 감정인식을 위한 복합 영상' 데이터를 어떻게 활용할 수 있을까요?

우선 이 데이터는 한국인의 감정 인식을 담았다는 큰 특징을 갖고 있는데요, 지금까지 상용화된 감정인식 안면 데이터는 서구인을 중심으로 수집되었기 때문에 아무리 인공지능을 학습시켜도 한국인에 특화된 감정 인식 구별은 어려웠습니다. 따라서 이러한 점을 이용하여 감정 예측 모델을 만든다면 실제 우리나라에서 상용화될 수 있는 서비스가 이루어질 수 있지 않을까 싶습니다.

 

또한 각 이미지에는 인물의 감정뿐만 아니라 동일인이 동일한 감정으로 다양한 장소에서 촬영을 했고, 라벨링 데이터에도 해당 장소에 대한 정보가 나와있는데요, AI의 감정 인식은 얼굴 표정뿐만 아니라 장소 정보가 포함되어 있어 더욱 다양한 감정 정보를 학습하기 적합하다고 합니다.

 

따라서 이러한 정보들을 모두 이용해 데이터를 활용하자면, 감성분석을 통한 소비자의 만족도 측정 서비스가 개발될 수 있으며, 감정기록을 이용하여 우울증 방지, 청소년 상담 등 멘탈 헬스케어 서비스를 구축할 수 있지 않을까 싶습니다!

 

 

 

 

 

 

# AIHUB

 

https://aihub.or.kr


 오늘 리뷰한 '한국인 감정인식을 위한 복합 영상' 데이터는 <AIHUB(AI 허브)>에서 다운로드 받은 '비전' 카테고리의 데이터로, AI 허브는 AI 기술 및 제품, 서비스 개발에 필요한 AI 인프라(AI데이터, AISWAPI, 컴퓨팅 자원)를 지원함으로써 누구나 활용하고 참여하는 AI통합 플랫폼입니다! 따라서 사용자를 위해 개발 및 활용을 위한 인프라 서비스와 AI 활성화를 위한 서비스를 제공하고 있는 것인데요, 현재 위와 같이 음성/자연어, 비전, 헬스케어, 자율주행 등 다양한 카테고리에 걸친 데이터들을 제공하고 있답니다.

 

 

한편, 오늘 살펴본 데이터는 '비전' 카테고리에 있는 데이터였는데요, 비전 카테고리는 말 그대로 시각적인 요소가 포함되어 있는 이미지, 비디오 데이터 등을 제공하는 카테고리입니다. 특히 다른 빅데이터 플랫폼에서는 찾아보기 힘든 데이터들이 제공되고 있고, 한국어, 한국인, 한국건물, 한국음식 등 서양보다는 우리나라에 맞춰져 있는 데이터들이 있기 때문에 상당히 활용하기에 적합한 데이터이기도 합니다. 

 

이렇게 오늘 데이터 리뷰기에서는 AIHUB의 '한국인 감정인식을 위한 복합 영상' 데이터를 리뷰해보았는데요, 다음 리뷰기에서도 동일한 '비전' 카테고리의 다른 데이터를 리뷰해보도록 하겠습니다. 이전 데이터 리뷰기에서는 소방, 사회 범죄, 해양수산, 헬스케어, 농수산물 등 여러 플랫폼에서 제공하는 데이터 리뷰기가 있으니, 관심이 있으신 분들은 참조하시기 바랍니다! 그럼 다음 리뷰기에서 만나요! :D