본문 바로가기

데이터리뷰기

[데이터 리뷰] AIHUB(국토환경) - 한국형 사물 이미지 데이터 데이터 리뷰 : 데이터 대신 읽어드립니다! #31 AIHUB(국토환경) - 한국형 사물 이미지 데이터 4차 산업 혁명 시대가 도래함으로써 인공지능 사물 이미지 인식 기술은 점점 업그레이드되고 있는데요, 이러한 기술은 자율주행, 스마트시티 및 제조 등 다양한 산업분야에서 활용 가능한 기술입니다. 하지만 이러한 기술을 만들려면 학습 데이터가 많이 필요한데요, 대부분의 데이터가 해외에서 구축된 데이터이기 때문에 아무리 학습을 시켜도 한국에서 상용화가 어려울 수밖에 없습니다. 따라서 한국에서 활용할 수 있는 사물 이미지 인식 기술을 발전시키기 위해서는 국내 특성에 맞는 AI 학습 데이터가 필요합니다. 이와 관련해서 AIHUB에서는 국내 장소와 상품에 대한 인공지능 기반의 시각지능 기술 개발 및 서비스 강화 목적.. 더보기
[데이터 리뷰] AIHUB(국토환경) - 생활 폐기물 이미지 데이터 데이터 리뷰 : 데이터 대신 읽어드립니다! #30 AIHUB(국토환경) - 생활 폐기물 이미지 데이터 환경오염으로 지구 온난화가 발생하고, 각종 지역에서 예상치 못한 기후 변화와 자연재해 등이 발생하는 사례들을 볼 수 있는데요, 환경오염의 주범 중 하나는 바로 생활 폐기물입니다. 생활 속에서 발생되는 다양한 폐기물을 환경 친화적으로 처리하기 위한 방법 중 하나는 바로 분리수거를 하는 것인데요, 개인이 분리수거만 잘해도 30~40%의 폐기물을 재활용할 수 있다고 합니다. 하지만 많은 분들이 각종 생활폐기물에 대해 분리수거 기준을 잘 몰라 잘못 분리수거 하는 일도 있곤 하는데요, 이와 관련해서 AIHUB에서는 폐기물 자원 관리와 효율화를 위해 인공지능 기반 생활 폐기물 탐지 및 분류를 위한 '생활 폐기물 이.. 더보기
[데이터 리뷰] AIHUB(국토환경) - 관광 지식베이스 데이터 데이터 리뷰 : 데이터 대신 읽어드립니다! #29 AIHUB(음성/자연어) - 관광 지식베이스 데이터 4차 산업혁명 시대 속에서 각 국가 및 기업들은 인공지능 기술개발을 위한 기계학습 데이터 구축 등 관련 인프라 구축을 활발하게 진행 중인데요, 특히 많은 이미지 학습데이터를 기반으로 한 이미지 인식 기술을 지속적으로 연구 및 개발하고 있다고 합니다. 이러한 흐름에 발맞춰, 국내에서도 기계학습에 필요한 다양한 패턴의 고품질 이미지 데이터 확보를 위해 다양한 영역에서의 이미지 데이터를 구축하고 있다고 합니다. 이와 관련해서 AIHUB에서는 '관광산업'과 관련하여 국내 관광 및 인공지능 산업의 글로벌 경재력 강화를 위해 '관광 지식베이스' 데이터를 제공하고 있습니다. 이 데이터는 식당 주변 전경(간판, 입간판.. 더보기
[데이터 리뷰] AIHUB(음성/자연어) - 공공행정문서 OCR 데이터 데이터 리뷰 : 데이터 대신 읽어드립니다! #28 AIHUB(음성/자연어) - 공공행정문서 OCR 데이터 대부분의 공공기관이나 공기업 등에서는 1년에 몇 만 건의 공공행정문서를 처리하는데요, 눈으로 일일이 보고 처리하는 데에 많은 시간과 불필요한 인력이 낭비되고 있습니다. 따라서, 이러한 공공행정문서들을 자동으로 인식하여 처리할 수 있는 기술 및 시스템은 필요시 되고 있답니다. 하지만 공공행정문서마다 그 형태나 포맷이 제각각이고, 인쇄체뿐만 아니라 손으로 작성된 문서도 있으며, 스캔된 문서 이미지를 이용한다는 점에서 해상도도 제각각일 수 있어서 특화된 기술, 높은 정확도의 기술이 요구됩니다. 이에 대해 이를 만족시킬 수 있는 기술 중 하나는 바로 OCR이라는 것인데요, OCR(Optical Charact.. 더보기
[데이터 리뷰] AIHUB(음성/자연어) - 한국어 SNS 대화 데이터 데이터 리뷰 : 데이터 대신 읽어드립니다! #27 AIHUB(음성/자연어) - 한국어 SNS 대화 데이터 코로나19의 영향으로 언택트 시대가 되면서 점점 온라인상의 대화가 증가하고, 비대면 회의, 상담, 업무 등이 증가하게 되었습니다. 이렇게 의사소통이 대화 음성이나 텍스트로 이루어짐에 따라 관련 대화 데이터도 급속도로 증가하게 되었는데요, 이러한 데이터의 활용성을 높이기 위해 적절한 대화 처리 기술의 도입이 요구되고 있다고 합니다. 이와 관련해서 AIHUB에서는 한국어 구어체 텍스트 기반의 자연어처리 AI 기술 개발을 목적으로 한국인의 일상 대화 메신저 채팅 데이터를 구축한 '한국어 SNS 대화' 데이터를 제공하고 있습니다. 따라서 이번 데이터 리뷰기에서는 이 데이터가 어떻게 이루어져 있는지 살펴보고,.. 더보기
[데이터 리뷰] AIHUB(음성/자연어) - 논문자료 요약 데이터 데이터 리뷰 : 데이터 대신 읽어드립니다! #26 AIHUB(음성/자연어) - 논문자료 요약 데이터 한 번쯤 논문을 찾아서 읽어본 경험이 있다면 공감하시겠지만, 논문에 이미지보다 글씨가 빽빽하게 있고, 수준 높은 어려운 내용들이 들어가 있다 보니 조금은 어렵고 딱딱하게 느껴질 수 있습니다. 거기에다 또, 만약 읽어야 할 논문이 많다면 논문 읽는 것에 대해 부담이 될 수도 있습니다. 하지만 만약 논문의 핵심내용을 뽑아 요약을 해주는 인공지능이 있다면 어떠할까요? 분명 많은 시간이 절약될 수 있고, 핵심적인 요약 내용을 먼저 읽고 논문을 읽으면 한층 이해하기 쉬워질 수 있습니다. 이와 관련해서 AIHUB에서는 다양한 주제의 한국어로 이루어진 학술논문이나 특허명세서에서 요약문을 도출해낼 수 있는 인공지능을 훈.. 더보기
[데이터 리뷰] AIHUB(음성/자연어) - 한국어 대화 요약 데이터 데이터 리뷰 : 데이터 대신 읽어드립니다! #25 AIHUB(음성/자연어) - 한국어 대화 요약 데이터 코로나19의 장기화로 언택트 시대가 됨으로써, 인터넷 또는 sns 메신저를 통해 비대면 의사소통의 수요가 매우 증가했는데요, 이로 인해 온라인 상에 축적되는 의사소통 관련 텍스트 데이터가 엄청난 솓도와 규모로 축적되고 있다고 합니다. 하지만 이렇게 많은 텍스트 데이터를 본문 그대로 사용하여 활용하자면 그 양이 많기 때문에 대화 데이터의 활용성을 높이기 위해서는 대화 요약 기술의 도입이 요구된다고 합니다. 이와 관련해서 AIHUB에서는 뉴스, 기사 등의 문어체에 비해 생략이나 변형이 많고, 대화의 문맥을 고려해야 할 특수성이 있는 대화 요약 기술 개발을 위한 학습 데이터 구축을 목적으로 한 '한국어 대화.. 더보기
[데이터 리뷰] AIHUB(음성/자연어) - 기계독해 데이터(질의응답 데이터셋) 데이터 리뷰 : 데이터 대신 읽어드립니다! #24 AIHUB(음성/자연어) - 기계독해 데이터(질의응답 데이터셋) 만약 인공지능에게 한 뉴스 기사를 읽게 하고, 육하원칙과 같은 질문을 한다면 인공지능은 올바르게 대답을 할 수 있을까요~? 올바른 대답을 하기 위해선 한 문장에 대해 주어, 목적어, 동사가 어느 부분인지 미리 학습되어야 할 것인데요, 만약 주어진 지문이 몇 문장에 걸친 지문이라면 더욱더 그 정확도가 떨어질 수 있습니다. 이와 관련해서 AIHUB에서는 기계독해 개발에 활용될 수 있는 뉴스 본문 기반 학습 데이터셋을 구축한 '기계독해 데이터'를 제공하고 있는데요, 기계독해(Machine Reading Comprehension)이란 제시된 본문 안에서 질의에 대한 정답을 추론하는 딥러닝 기반 기술.. 더보기
[데이터 리뷰] AIHUB(비전) - 한국인 감정인식을 위한 복합 영상 데이터 데이터 리뷰 : 데이터 대신 읽어드립니다! #22 AIHUB(비전) - 한국인 감정인식을 위한 복합 영상 데이터 사람의 얼굴이나 얼굴 표정을 통해 그 사람의 성별, 연령, 감정 등을 예측할 수 있는데요, 만약 인공지능이 자동으로 그 사람의 정보나 감정 등을 예측하여 판단할 수 있다면 어떨까요? 누군가의 감정을 빠르게 포착하는 것은 하나의 서비스로도 이어질 수 있는데요, 예를 들어 그 사람의 만족도를 측정할 수 있거나 감정이나 기분 등을 파악해 멘탈적인 헬스 케어 서비스로 이어질 수 있습니다. 이와 관련해서 인공지능 빅데이터 플랫폼인 에서는 한국인의 얼굴 표정과 장소 맥락을 고려하여 인공지능이 사람의 감정을 이해할 수 있는 학습 모델 개발을 장려하기 위해 '한국인 감정인식을 위한 복합 영상' 데이터를 제공.. 더보기
[데이터 리뷰] AIHUB(비전) - 패션 상품 및 착용 이미지 데이터 데이터 리뷰 : 데이터 대신 읽어드립니다! #21 AIHUB(비전) - 패션 상품 및 착용 이미지 데이터 코로나19로 언택트 시대가 되면서 온라인 쇼핑몰은 점점 그 규모가 커지고 있는데요, 패션 시장도 온라인에서 크게 성장하고 있습니다. 하지만 오프라인 쇼핑몰이나 의류 관련 소상공인들은 점점 수익이 감소하고 있다고 하는데요, 옷의 질 등이 좋아도 대형 스튜디오나 모델을 이용한 홍보 등이 불가능해 경쟁력이 떨어진다고 합니다. 이와 관련해서 인공지능 빅데이터 플랫폼인 에서는 AI 데이터 및 기술로 많은 패션 관련 소상공인들에게 기회를 부여하고자 '패션 상품 및 착용 이미지' 데이터를 제공하고 있는데요, 이번 데이터 리뷰기에서는 이 데이터가 어떻게 구성되어 있는지 리뷰해보고, 어떻게 분석 및 활용하면 좋을지 .. 더보기