본문 바로가기

BLOG/데이터 리뷰기

[데이터 리뷰] AIHUB(헬스케어) - 비대면 진료를 위한 의료진 및 환자 음성 데이터

데이터 리뷰 : 데이터 대신 읽어드립니다!
#52 AIHUB(헬스케어) - 비대면 진료를 위한 의료진 및 환자 음성 데이터

 

 

 

 

 코로나19의 영향으로 언택트 시대가 도래함으로써 비대면 진료에 대한 관심이 증가하게 되었는데요, 비대면 진료를 상용화시키려는 많은 노력과 시스템 개발 등이 이루어지고 있습니다. 하지만 전화상담 등 비대면 진료를 하면 의사가 환자와의 의사소통이 원활하게 이루어지지 않을 수 있으며, 환자에 대한 상담 내용을 기록하기 어려울 수 있습니다. 만약 음성 녹음을 하더라도 추후 정리를 해야 하는 일이 동반되겠죠. 따라서 자동 음성인식 기술을 접목시키려는 시도가 이루어지고 있는데요, 일반 상황에서의 음성 데이터보다는 진료 상황에서 발생되는 대화 데이터셋이 있어야 할 것입니다.

 

따라서 이와 관련하여 AIHUB 플랫폼에서는 '비대면 진료를 위한 의료진 및 환자 음성' 데이터를 제공하고 있는데요, 진료할 때 발생되는 비대면 진료를 위한 의사, 간호사, 환자의 대화 음성을 녹음하여 구축한 데이터셋입니다. 그렇다면, 이번 데이터 리뷰기에서는 이 데이터가 어떻게 이루어져 있는지 살펴보고, 어떻게 분석 및 활용하면 좋을지 생각해보도록 하겠습니다!

 

 

 

 

 

비대면 진료를 위한 의료진 및 환자 음성 데이터

 

(1) 데이터 정보

  • 제공기관 : 미디어젠
  • 데이터 개수 : 187.2만
  • 데이터 형식 : wave, json
  • 데이터 구성 : 의료진 음성 700시간 및 33,000 문장 코퍼스, 환자 45만 문장(약 600시간 분량) 음성 및 15만 문장 코퍼스 구축
  • 다운로드 : https://aihub.or.kr/aidata/27769

 

'비대면 진료를 위한 의료진 및 환자 음성' 데이터는 의료 현장의 음성 및 텍스트 데이터 수집을 통해 비대면 진료를 위한 음성인식 AI서비스 제공을 목적으로 구축된 데이터입니다. 또한 의료진과 환자의 음성 발화를 수집한 데이터로, 직군별, 직능별 의료진의 음성 발화를 수집하고, 연령, 성별, 증상별 환자의 음성 발화를 수집함으로써 다양한 종류의 음성 및 문장 데이터를 수집하여 구축된 데이터셋이라고 합니다.

 

한편, 위에 다운로드 링크로 들어가면 회원가입 또는 로그인 후 데이터를 다운받을 수 있는데요, 그렇다면 데이터를 다운받아서 한번 데이터가 어떻게 이루어져 있는지 살펴보도록 하겠습니다~

 

 

(2) 데이터 리뷰

 데이터를 다운로드하면, 크게 의사, 간호사, 환자 데이터로 나누어져 있는데요, 의료진(의사, 간호사) 음성 700시간 및 33,000 문장 코퍼스가 구축되어 있고, 약 600시간 분량에 달하는 환자의 45만 문장 음성 및 15만 문장 코퍼스로 구축되어 있답니다.

 

한편 각 데이터에는 음성 녹음 파일인 wave 파일(48kHz, 16bit, mono)과 각 녹음 파일에 대한 정보가 담겨 있는 Json 파일, 녹음된 텍스트가 들어있는 txt 파일로 구성되어 있는데요, 먼저 의료진_의사의 녹음파일을 들어보도록 하겠습니다.

 

- 의료진_의사 / wave 데이터

 

 

위 음성 데이터를 들어보면 진료 중에 의사가 '머리가 핑도는 느낌이 있으신가요?'라고 말한 음성이 녹음되어 있는 것을 확인할 수 있습니다. 

 

그럼 의료진_의사의 또 다른 음성 데이터를 들어볼까요?

 

 

이번에도 의사가 환자에게 '심장이 두근거리시나요?'라고 말한 음성이 녹음된 것을 확인할 수 있습니다.

 

이밖에도 다른 음성 데이터를 들어보면, 의사, 간호사, 환자의 음성이 짧은 문장으로 녹음되어 있는 것을 확인할 수 있습니다. 그렇다면 첫 번째로 들어본 음성 데이터에 대한 Json 파일을 확인해볼까요~?

 

 

- 의료진_의사 / Json 데이터

 

{
 "기본정보":{
                "Language":"KOR",
                "Version":"N/A",
                "ApplicationCategory":"N/A",
                "NumberOfSpeaker":"N/A",
                "NumberOfUtterance":"N/A",
                "DataCategory":"mariaDB",
                "RecordingDate":"2021-01-23 11:02:36",
                "FillingDate":"N/A","
                RevisionHistory":"N/A"
                ,"Distributor":"Mediazen"},
"음성정보":{
                "SamplingRate":"48000",
                "ByteOrder":"N/A",
                "EncodingLaw":"SignedIntegerPCM",
                "NumberOfBit":"16",
                "NumberOfChannel":"1",
                "SignalToNoiseRatio":"N/A"},
"전사정보":{
                "LabelText":"머리가 핑도는 느낌이 있으신가요?"},
"화자정보":{
                "Gender":"Male",
                "Age":"20~29",
                "Region":"서울/인천/경기",
                "Dialect":"경기/서울"},
"환경정보":{
                "RecordingEnviron":"병원",
                "NoiseEnviron":"병원",
                "RecordingDevice":"휴대폰"},
"파일정보":{
                "FileCategory":"Audio",
                "FileName":"HB_0004-100-01-01-M-04-A.wav",
                "DirectoryPath":"/nia/HB/data/HB_0004",
                "HeaderSize":"44",
                "FileLength":"2.76",
                "FileFormat":"PCM",
                "NumberOfRepeat":"1",
                "TimeInterval":"0",
                "Distance":"30"},
"기타정보":{
                "QualityStatus":"Good"}}

 

위에 json 파일 형식의 텍스트 데이터는 음성 녹음 데이터에 대한 구체적인 정보를 담고 있는 어노테이션 데이터인데요, 위에 보면 아시다시피 크게 '기본정보', '음성정보', '전사정보', '화자정보', '환경정보', '파일정보', '기타정보'로 나누어져 있습니다.

 

기본 정보와 음성 정보에서는 사용언어, 데이터 종류, 음성속도 등에 대해 알 수 있고, 전사 정보에는 어떠한 음성이 녹음되었는지 정확한 텍스트를 알 수 있습니다. 또한 화자 정보에는 음성을 녹음한 화자의 성별, 나이, 직군 등에 대해 알 수 있습니다. 환경 정보에서는 음성을 녹음한 환경에 대한 정보에 대해 알 수 있고, 파일 정보에는 해당 파일의 종류, 이름, 형식 등에 대한 정보를 얻을 수 있습니다. 마지막으로 기타 정보에서는 녹음된 음질의 상태를 나타내며 녹음 상태의 정도를 알 수 있습니다.

 

따라서 위 json 파일을 통해 해당 음성 데이터는 2021년 1월 23일, 병원에서 '머리가 핑도는 느낌이 있으신가요?'를 녹음한 20대의 남성 의사의 음성 데이터인 것을 확인할 수 있습니다.

 

 

(3) 데이터 활용

 그럼 이 '비대면 진료를 위한 의료진 및 환자 음성' 데이터를 이용하여 어떻게 활용하면 좋을까요?

아무래도 의료 현장의 음성 및 텍스트를 수집한 데이터를 통해 진료 전문의 음성인식 모델의 학습데이터로 사용할 수 있겠는데요, 의료진의 음성 발화와 환자의 음성 발화 데이터를 구축하여 언택트 진료를 위한 음성인식 AI 서비스 개발에 활용할 수 있습니다. 따라서 이러한 음성인식 및 음성 자동 기록 기술이 구현된다면, 언택트 진료 시 의사가 환자의 진찰에 집중할 수 있으며, 상담내용을 문서기록으로 남길 수 있어 의료서비스의 질을 높일 수 있지 않을까 싶습니다.

 

또한 음성인식 기술을 통한 진료뿐만 아니라, EMR 자동 음성 입력이나, 환자 정보 데이터베이스 자동 구축, 장애인을 위한 비대면 진료 서비스 등 이 데이터를 이용하여 다양한 응용 의료 서비스 활용을 할 수 있지 않을까 싶습니다. 전화상담 진료가 활발하게 이루어지고 있는 몇몇 나라는 음성인식 기술이 헬스케어 분야에 가장 활발히 접목되어 발전되고 있다고 하는데요, 우리나라도 이러한 의료 음성인식 AI 서비스 기술이 많이 발전되어 의료서비스의 질을 높일 수 있는 시대가 도래했으면 좋겠습니다 :D

 

 

 

 

 

# AIHUB

 

 

 오늘 리뷰한 '비대면 진료를 위한 의료진 및 환자 음성' 데이터는 <AIHUB(AI 허브)>에서 다운로드 받은 '헬스케어' 카테고리의 데이터로, AI 허브는 AI 기술 및 제품, 서비스 개발에 필요한 AI 인프라(AI데이터, AISWAPI, 컴퓨팅 자원)를 지원함으로써 누구나 활용하고 참여하는 AI통합 플랫폼입니다! 따라서 사용자를 위해 개발 및 활용을 위한 인프라 서비스와 AI 활성화를 위한 서비스를 제공하고 있는 것인데요, 현재 위와 같이 음성/자연어, 비전, 헬스케어, 자율주행 등 다양한 카테고리에 걸친 데이터들을 제공하고 있답니다.

 

 

한편, 오늘 살펴본 데이터는 '헬스케어' 카테고리에 있는 데이터였는데요, 헬스케어 카테고리는 질환 및 질병 진단 의료 영상, 인체 자세, 신체 정보 등에 관련된 데이터를 제공하는 카테고리입니다. 특히 개인이 구축하기엔 어려운 의료 데이터들이 많고, 다른 빅데이터 플랫폼에서는 찾아보기 힘든 데이터들이 제공되고 있습니다. 또한 실제 우리나라 사람들로부터 구축된 데이터들로 이루어져 있기 때문에 우리나라에서 상용화하기 위한 서비스 개발에 활용하기에 매우 적합한 데이터이기도 하답니다. 

 

 

또한 각 데이터 다운로드 페이지에 들어가면 위와 같이 데이터의 구축내용과 필요성, 데이터 구조, 활용예시 등의 정보를 파악할 수 있기 때문에 데이터를 다운로드하기 전에 어떠한 형태로 이루어져 있는지, 데이터를 어떻게 활용하면 좋을지 살펴볼 수 있답니다.

 

 

이렇게 오늘 데이터 리뷰기에서는 AIHUB의 '비대면 진료를 위한 의료진 및 환자 음성' 데이터를 리뷰해보았는데요, 다음 리뷰기에서도 동일한 카테고리의 다른 데이터를 리뷰해보도록 하겠습니다. 이전 데이터 리뷰기에서는 소방, 사회 범죄, 해양수산, 헬스케어, 농수산물 등 여러 플랫폼에서 제공하는 데이터 리뷰기가 있으니, 관심이 있으신 분들은 참조하시기 바랍니다! 그럼 다음 리뷰기에서 만나요! :D