본문 바로가기

BLOG/데이터 리뷰기

[데이터 리뷰] AIHUB(헬스케어) - 치매 고위험군 웨어러블 라이프로그 데이터

데이터 리뷰 : 데이터 대신 읽어드립니다!
#50 AIHUB(헬스케어) - 치매 고위험군 웨어러블 라이프로그 데이터

 

 

 

 

 OECD 통계에 따르면, 1970년~2018년 사이의 우리나라 고령화 비율 연평균 증가율은 3.3%로 OECD 37개국 중 가장 빨랐다고 합니다. 또한 이처럼 우리나라가 고령화 사회로 접어들음으로써 치매 발병률 또한 증가했다고 하는데요, 의료비 부담 증가로 인한 치매 환자의 조기 진단과 치료가 중요한 과제로 부상하였다고 합니다.

 

이와 관련하여 AIHUB 플랫폼에서는 '치매 고위험군 웨어러블 라이프로그 데이터' 데이터를 제공하고 있는데요, 치매조기진단 예측 및 발명의 예방과 선제적인 관리를 위한 AI 기술개발을 위하여 구축된 데이터입니다. 그럼 이번 데이터 리뷰기에서는 이 데이터가 어떻게 이루어져 있는지 살펴보고, 어떻게 분석 및 활용하면 좋을지 생각해보도록 하겠습니다!

 

 

 

 

 

치매 고위험군 웨어러블 라이프로그 데이터

 

(1) 데이터 정보

  • 제공기관 : 에코인사이트글로벌
  • 데이터 개수 : 5.7만
  • 데이터 형식 : csv
  • 데이터 구성 : 수면정보 라이프로그, 걸음거리 정보 라이프로그, 인지기능(MMSE), 고위험군 라벨링
  • 다운로드 : https://aihub.or.kr/aidata/30749

 

'치매 고위험군 웨어러블 라이프로그' 데이터는 헬스케어 웨어러블 디바이스를 통한 원천 데이터로부터 정제 과정과 라벨링 과정을 통하여 치매 진행 단계별 라이프로그 빅데이터를 구축하고, 인공지능 치매 조기 예측모델을 활용하여 치매 걸릴 확률정보를 담은 데이터셋입니다.

 

https://aihub.or.kr/aidata/30749

 

 

한편, 위에 다운로드 링크로 들어가면 회원가입 또는 로그인 후 데이터를 다운받을 수 있는데요, 그렇다면 데이터를 다운받아서 한번 데이터가 어떻게 이루어져 있는지 살펴보도록 하겠습니다~

 

 

(2) 데이터 리뷰

 데이터를 다운받으면, 크게 원천 데이터와 라벨링 데이터로 이루어져 있는데요, 먼저 원천 데이터에 대해  살펴보도록 하겠습니다.

 

 

#원천 데이터

 

원천 데이터는 헬스케어 웨어러블 디바이스로부터 수집된 데이터로, '걸음거리', '수면', '인지기능'에 대한 데이터로 나누어져 있습니다. 아래 이미지는 '걸음거리' 데이터에 대해 csv 형식으로 구성된 데이터의 일부분입니다.

 

 

주어진 데이터를 보면 첫 행 칼럼에 대한 정보가 영문명 코드로 나와있는데요, 보기 쉽게 한글명으로 바꾸어보도록 하겠습니다(다운로드 페이지 참고). 

 

 

칼럼 이름을 한글명으로 바꾸어 보았는데요, 어떠한 데이터에 대한 내용인지 보기 쉬워졌습니다. 한편, 데이터를 확인해보면 헬스케어 웨어러블의 착용시간, 하루 사용 칼로리, 움직인 거리, 활동 및 운동에 대한 정보를 알 수 있습니다.

 

다음으로 아래 이미지는 '수면' 데이터로 구축된 데이터의 일부분입니다. 

 

 

마찬가지로 영문명을 한글명으로 바꾸어주었습니다. 데이터를 보면 수면의 시작/종료 시간, 분당 심박동 수, 수면상태로그, 위 이미지에 다 나와있지 않지만 램수면 시간, 뒤척임 비율, 심박동 변동 평균, 수면 시기 점수, 수면 방해 점수, 피부 온도 편차 등 34개의 정보에 대한 데이터가 구축되어 있답니다.

 

마지막으로 '인지기능'에 대한 데이터는 아래와 같이 이루어져 있습니다.

 

 

인지기능 데이터는 앞에서 살펴봤던 데이터와는 다르게 치매환자를 대상으로 한 19개의 질문에 대한 답변 적절도로 구축되어 있습니다. 각 질문은 데이터 다운로드 페이지 하단에서 살펴볼 수 있는데요, 그 질문의 종류는 아래와 같습니다.

 

 

 

#라벨링 데이터

 

한편, 위와 같은 원천 데이터마다 라벨링 데이터가 있는데요, 아래와 같이 해당 데이터의 환자가 치매환자(DEM)인지, 경도인지 장애 환자(MCI) 또는 정상인인지 알 수 있습니다.

 

 

 

(3) 데이터 활용

 이렇게 '치매 고위험군 웨어러블 라이프로그' 데이터에 대해 살펴보았는데요, 이 데이터를 이용하여 어떻게 활용할 수 있을까요? 이 데이터는 헬스케어 웨어러블 기반의 치매 고위험군 병리진단으로 정의된 치매진행 단계별 라이프로그 학습용 데이터로, 치매확률을 예측하거나 치매를 관리할 수 있는 AI 시스템 개발에 활용될 수 있습니다. 구체적으로 '걸음거리' 데이터를 이용하여 소비칼로리 및 활동량 분석을 통한 치매 진행단계 분석, '수면시간' 데이터를 이용하여 환자의 수면패턴과 치매진행 단계의 연관성을 분석할 수 있지 않을까 싶습니다. 따라서 이러한 시스템을 이용하여 치매의 진행 단계를 늦추고 치매를 관리할 수 있는 시스템을 구현할 수 있지 않을까 싶네요~

 

또한 치매 관리뿐만 아니라 치매 조기 예측 모델을 구현하여 치매환자가 아닌 사람에게도 치매가 걸릴 확률정보를 제공하고, 위험도가 높은 사람에게 치매를 방지할 수 있는 예방 프로그램 및 시스템을 구현함으로써 해당 데이터를 활용할 수 있지 않을까 싶습니다!

 

 

 

 

 

# AIHUB

 

 

 오늘 리뷰한 '치매 고위험군 웨어러블 라이프로그' 데이터는 <AIHUB(AI 허브)>에서 다운로드 받은 '헬스케어' 카테고리의 데이터로, AI 허브는 AI 기술 및 제품, 서비스 개발에 필요한 AI 인프라(AI데이터, AISWAPI, 컴퓨팅 자원)를 지원함으로써 누구나 활용하고 참여하는 AI통합 플랫폼입니다! 따라서 사용자를 위해 개발 및 활용을 위한 인프라 서비스와 AI 활성화를 위한 서비스를 제공하고 있는 것인데요, 현재 위와 같이 음성/자연어, 비전, 헬스케어, 자율주행 등 다양한 카테고리에 걸친 데이터들을 제공하고 있답니다.

 

 

한편, 오늘 살펴본 데이터는 '헬스케어' 카테고리에 있는 데이터였는데요, 헬스케어 카테고리는 질환 및 질병 진단 의료 영상, 인체 자세, 신체 정보 등에 관련된 데이터를 제공하는 카테고리입니다. 특히 개인이 구축하기엔 어려운 의료 데이터들이 많고, 다른 빅데이터 플랫폼에서는 찾아보기 힘든 데이터들이 제공되고 있습니다. 또한 실제 우리나라 사람들로부터 구축된 데이터들로 이루어져 있기 때문에 우리나라에서 상용화하기 위한 서비스 개발에 활용하기에 매우 적합한 데이터이기도 하답니다. 

 

 

또한 각 데이터 다운로드 페이지에 들어가면 위와 같이 데이터의 구축내용과 필요성, 데이터 구조, 활용예시 등의 정보를 파악할 수 있기 때문에 데이터를 다운로드하기 전에 어떠한 형태로 이루어져 있는지, 데이터를 어떻게 활용하면 좋을지 살펴볼 수 있답니다.

 

 

이렇게 오늘 데이터 리뷰기에서는 AIHUB의 '치매 고위험군 웨어러블 라이프로그' 데이터를 리뷰해보았는데요, 다음 리뷰기에서도 동일한 카테고리의 다른 데이터를 리뷰해보도록 하겠습니다. 이전 데이터 리뷰기에서는 소방, 사회 범죄, 해양수산, 헬스케어, 농수산물 등 여러 플랫폼에서 제공하는 데이터 리뷰기가 있으니, 관심이 있으신 분들은 참조하시기 바랍니다! 그럼 다음 리뷰기에서 만나요! :D