본문 바로가기

BLOG/데이터 리뷰기

[데이터 리뷰] AIHUB(비전) - 패션 상품 및 착용 이미지 데이터

데이터 리뷰 : 데이터 대신 읽어드립니다!
#21 AIHUB(비전) - 패션 상품 및 착용 이미지 데이터

 

 

 

 

 코로나19로 언택트 시대가 되면서 온라인 쇼핑몰은 점점 그 규모가 커지고 있는데요, 패션 시장도 온라인에서 크게 성장하고 있습니다. 하지만 오프라인 쇼핑몰이나 의류 관련 소상공인들은 점점 수익이 감소하고 있다고 하는데요, 옷의 질 등이 좋아도 대형 스튜디오나 모델을 이용한 홍보 등이 불가능해 경쟁력이 떨어진다고 합니다.

 

이와 관련해서 인공지능 빅데이터 플랫폼인 <AIHUB>에서는 AI 데이터 및 기술로 많은 패션 관련 소상공인들에게 기회를 부여하고자 '패션 상품 및 착용 이미지' 데이터를 제공하고 있는데요, 이번 데이터 리뷰기에서는 이 데이터가 어떻게 구성되어 있는지 리뷰해보고, 어떻게 분석 및 활용하면 좋을지 생각해보도록 하겠습니다!

 

 

 

 

 

 

패션 상품 및 착용 이미지 데이터

 

(1) 데이터 정보

 

패션 상품 및 착용 이미지 데이터는 한국 패션 시장에 존재하는 다양한 형태의 패션 상품을 수집하고 촬영한 뒤, 이를 모델에 실제 착용시켜 사진을 수집한 데이터세트로, 패션상품 착용 영상을 생성하는 기술(VITON)에 활용할 뿐만 아니라, 다양한 패션 관련 기술들에 활용하기 위해 구축된 데이터 세트입니다.

 

위에 다운로드 링크로 들어가면 회원가입 또는 로그인 후 데이터를 다운받을 수 있는데요, 데이터의 일부분인 샘플 데이터를 다운받아서 한번 데이터가 어떻게 이루어져 있는지 살펴보도록 하겠습니다~

 

 

(2) 데이터 리뷰

어떠한 데이터가 있는지 살펴보기 앞서, 데이터의 구축 내용 및 제공 데이터량을 먼저 알아보도록 하겠습니다.

데이터의 종류로는 스튜디오 패션 영상(모델 사진), 모델의 자세 키포인트, 모델 semantic 영역, 그리고 패션제품 대표 사진, 제품의 자세 키포인트, 제품의 semantic 영역이 있고, 각각 674만장, 12만장, 12만장, 4만장, 4만장, 4만장씩 있다고 합니다.

 

그럼 첫 번째로 스튜디오 패션 영상(모델 사진)의 이미지부터 살펴볼까요~?

 

 

위 이미지들은 데이터를 다운받았을 때의 스튜디오 패션영상으로 모델이 의류를 실제 착용하고 있는 모습을 촬영한 데이터입니다.

 

 

반면, 패션상품 대표 사진은 위와 같이 해당 의류를 촬영한 데이터로, 실제 스튜디오 패션영상 데이터에서 모델이 입었던 옷으로 앞뒤 별 이미지 한 장씩으로 구성되어 있답니다.

 

마지막으로 모델 키포인트, 모델영역, 상품 키포인트, 상품영역의 데이터는 다음과 같습니다.

 

 

위를 보면, 이미지 데이터가 있는 것처럼 보이지만 사실 이미지 데이터가 아니라 라벨링 값으로 이루어진 json 형식으로 데이터가 이루어져 있습니다. 모델 키포인트 데이터의 경우 모델의 신체 부위마다 좌표 영역이 적혀 있고, 모델 영역은 신체 영역 별로 구간의 좌표 값이 있습니다. 세 번째로 상품 키포인트도 의류의 부위에 따른 좌표 영역이 적혀 있으며, 상품 영역에도 마찬가지로 영역 별로 박스 좌표 데이터가 있습니다. 따라서 이를 이용하여 레이블링을 구성하면 위와 같은 모습으로 데이터가 출력된답니다.

 

 

(3) 데이터 활용

 그렇다면 약 670만 개의 이미지 데이터와 약 30만 개의 레이블링 데이터를 이용하여 어떻게 활용할 수 있을까요?  

앞에서도 언급했듯이, 다양한 형태의 패션 상품을 촬영하고, 이를 실제 모델에 착용시켜 사진을 촬영한 데이터셋으로, 패션상품 착용 영상을 생성시키는 기술(VITON_Virtual Try-On)에 활용할 수 있습니다. VITON 기술은 자신의 신체 이미지가 있을 때 의류를 가상으로 착용시켜 볼 수 있게 해주는 기술로, 실제 로레알 등 여러 브랜드 기업에서 선보이고 있는 기술이기도 하답니다.

 

뿐만 아니라 의류 상품에 대해서 가장 비슷한 이미지를 찾아 모델 착용 사진을 생성시키는 기술을 개발하거나, GAN 알고리즘을 통해 상품 디자인을 자동으로 생성하는 기술을 만들 수 있지 않을까 싶습니다. 또한 이미지 데이터의 라벨링 데이터에는 해당 상품의 종류(상의, 안경, 신발 등)가 구축되어 있기 때문에 이를 이용하여 상품 자동 구별 분류 서비스를 만들 수 있지 않을까 싶네요-!

 

 

 

 

 

# AIHUB

 

https://aihub.or.kr

 

 오늘 리뷰한 '패션 상품 및 착용 이미지' 데이터는 <AIHUB(AI 허브)>에서 다운로드 받은 '비전' 카테고리의 데이터로, AI 허브는 AI 기술 및 제품, 서비스 개발에 필요한 AI 인프라(AI데이터, AISWAPI, 컴퓨팅 자원)를 지원함으로써 누구나 활용하고 참여하는 AI통합 플랫폼입니다! 따라서 사용자를 위해 개발 및 활용을 위한 인프라 서비스와 AI 활성화를 위한 서비스를 제공하고 있는 것인데요, 현재 위와 같이 음성/자연어, 비전, 헬스케어, 자율주행 등 다양한 카테고리에 걸친 데이터들을 제공하고 있답니다.

 

 

한편, 오늘 살펴본 데이터는 '비전' 카테고리에 있는 데이터였는데요, 비전 카테고리는 말 그대로 시각적인 요소가 포함되어 있는 이미지, 비디오 데이터 등을 제공하는 카테고리입니다. 특히 다른 빅데이터 플랫폼에서는 찾아보기 힘든 데이터들이 제공되고 있고, 한국어, 한국인, 한국건물, 한국음식 등 서양보다는 우리나라에 맞춰져 있는 데이터들이 있기 때문에 상당히 활용하기에 적합한 데이터이기도 합니다. 

 

이렇게 오늘 데이터 리뷰기에서는 AIHUB의 '패션 상품 및 착용 이미지' 데이터를 리뷰해보았는데요, 다음 리뷰기에서도 동일한 '비전' 카테고리의 다른 데이터를 리뷰해보도록 하겠습니다. 이전 데이터 리뷰기에서는 소방, 사회 범죄, 해양수산, 헬스케어, 농수산물 등 여러 플랫폼에서 제공하는 데이터 리뷰기가 있으니, 관심이 있으신 분들은 참조하시기 바랍니다! 그럼 다음 리뷰기에서 만나요! :D