본문 바로가기

빅데이터

[데이터 리뷰] 경상북도 공공데이터(1) - 경상북도 일반건축물 시가표준액 데이터 데이터 리뷰 : 데이터 대신 읽어드립니다! #63 경상북도 공공데이터(1) - 경상북도 일반건축물 시가표준액 데이터 토지 및 주택에 적용되는 '시가표준액'이란 취득세, 재산세, 등록세 등 각종 지방세를 책정하기 위해 정부에서 설정한 금액을 말하는데요, 즉 지방세 부과를 위해 일반건축물의 거래가격을 기준으로 종류·구조·용도·경과연수 등을 고려하여 평가한 금액을 말합니다. 일반적으로 일반건축물의 시가표준액은 실제 거래되는 시세보다 저렴하게 책정되지만, 시가표준액을 통해 납부해야 하는 세금을 미리 계산해볼 수 있다는 점에서 의미가 있다고 합니다. 한편 이와 관련하여 경상북도 공공 데이터 플랫폼에서는 '경상북도 일반건축물 시가표준액' 데이터를 제공하고 있는데요, 일반건축물에 대한 지방세 부과기준인 시가표준액을 .. 더보기
[데이터 리뷰] 경기 지역 경제 포털(1) - 경기도 연령별 지역화폐 사용 현황 데이터 데이터 리뷰 : 데이터 대신 읽어드립니다! #54 경기 지역 경제 포털(1) - 경기도 연령별 지역화폐 사용 빈도 현황 각 지역마다 지역화폐가 있는데요, 지역화폐를 발행하여 생활 지원금을 지원하고, 해당 지역의 소상공인들을 도와주는 목적으로 시행된 제도입니다. 또한 코로나19로 인한 생활비 지원금과 청년수당, 취업수당 등을 지역화폐로 제공함으로써 요즘 그 사용 빈도가 늘어나고 있다고 합니다. 이와 관련하여 경기 지역 경제 포털에서는 '연령별 지역화폐 사용 빈도 현황' 데이터를 제공하고 있습니다. 그렇다면, 이번 데이터 리뷰기에서는 이 데이터가 어떻게 이루어져 있는지 살펴보고, 어떻게 분석 및 활용하면 좋을지 생각해보도록 하겠습니다! 연령별 지역화폐 사용 빈도 현황 데이터 (1) 데이터 정보 제공기관 : .. 더보기
[데이터 리뷰] AIHUB(헬스케어) - 치매 고위험군 웨어러블 라이프로그 데이터 데이터 리뷰 : 데이터 대신 읽어드립니다! #50 AIHUB(헬스케어) - 치매 고위험군 웨어러블 라이프로그 데이터 OECD 통계에 따르면, 1970년~2018년 사이의 우리나라 고령화 비율 연평균 증가율은 3.3%로 OECD 37개국 중 가장 빨랐다고 합니다. 또한 이처럼 우리나라가 고령화 사회로 접어들음으로써 치매 발병률 또한 증가했다고 하는데요, 의료비 부담 증가로 인한 치매 환자의 조기 진단과 치료가 중요한 과제로 부상하였다고 합니다. 이와 관련하여 AIHUB 플랫폼에서는 '치매 고위험군 웨어러블 라이프로그 데이터' 데이터를 제공하고 있는데요, 치매조기진단 예측 및 발명의 예방과 선제적인 관리를 위한 AI 기술개발을 위하여 구축된 데이터입니다. 그럼 이번 데이터 리뷰기에서는 이 데이터가 어떻게 이.. 더보기
[데이터 리뷰] AIHUB(안전) - 화재 발생 예측 영상 데이터 데이터 리뷰 : 데이터 대신 읽어드립니다! #42 AIHUB(안전) - 화재 발생 예측 영상 데이터 화재가 발생하면 재산피해는 물론이고 삶의 터를 잃을 수 있으며, 문화재 또는 산불 화재로 이어지면 다시는 돌이킬 수 없게 됩니다. 이처럼 화재는 사전에 방지하는 것이 아주 중요한데요, 산업시설, 일반가정, 자연환경 등 연기발생을 감지하고 화재 신호를 빠르게 알리는 등 화재 발생을 예측하여 미리 조심한다면 큰 피해를 막을 수 있지 않을까 싶습니다. 이와 관련하여 AIHUB 플랫폼에서는 '화재 발생 예측 영상' 데이터를 제공하고 있는데요, 화재가 발생하기 전에 발생되는 연기를 촬영한 영상 데이터로 구축되어 있습니다. 그렇다면, 오늘 데이터 리뷰기에서는 이 데이터가 어떻게 이루어져 있는지 살펴보고, 어떻게 분석.. 더보기
[데이터 리뷰] AIHUB(안전) - 이상행동 CCTV 영상 데이터 데이터 리뷰 : 데이터 대신 읽어드립니다! #41 AIHUB(안전) - 이상행동 CCTV 영상 데이터 CCTV 영상 데이터는 개인정보보호법이나 CCTV 설치 기관의 운영 규정 등의 문제로 규제가 심한 부문 중 하나인데요, 이렇게 공개가 가능한 CCTV 영상이 부족하다 보니 사실상 민간기업의 AI 기술 발전에 큰 제약이 된다고 합니다. 하지만 현재 미국, 유럽 등의 AI 선도국에서는 정부와 민간인의 협업을 통해 대규모 데이터를 구축하여 공개하여 다양한 영역에서의 AI 발전을 도모하고 있다고 합니다. 하지만 그렇다고 해외에 공개된 CCTV 영상은 한국의 환경이나 인종 등 요소가 다르기 때문에 학습을 시킨다 해도 우리나라에 상용화시키기 어려울 수 있습니다. 이와 관련하여 AIHUB 플랫폼에서는 '이상행동 CC.. 더보기
[데이터 리뷰] AIHUB(농축수산) - 시설 작물 개체 이미지 데이터 데이터 리뷰 : 데이터 대신 읽어드립니다! #38 AIHUB(농축수산) - 시설 작물 개체 이미지 데이터 '시설 작물'이란 말 그대로 시설 재배 방식으로 재배되는 작물을 말하는데요, 우리가 자주 먹는 방울토마토, 고추, 딸기, 부추, 오이, 가지 모두 다 시설 작물입니다. 한편, 4차 산업 혁명이 도래함으로써 농업분야에도 인공지능 관련 기술이 많이 연구되고 있는데요, 더욱더 발전된 기술 개발을 위해선 이러한 시설 작물과 같은 농산물에 대한 방대한 학습용 데이터가 필요로 해질 수 있습니다. 이와 관련해서 AIHUB에서는 시설작물 개체의 이미지를 분류 및 판단하기 위한 학습용 데이터 구축을 위해 '시설 작물 개체 이미지' 데이터를 제공하고 있는데요, 이 데이터는 시설 작물의 개체 식별과 생육 단계를 구별한 .. 더보기
[데이터 리뷰] AIHUB(농축수산) - 가축 행동 영상 데이터 데이터 리뷰 : 데이터 대신 읽어드립니다! #36 AIHUB(농축수산) - 가축 행동 영상 데이터 전 세계적으로 육류 소비량이 증가함에 따라 축산업 또한 활발하게 진행되고 있는데요, 한편으론 축산업이 증가하면서 축가농가에서 발생되는 문제들도 있다고 합니다. 예를 들어, 가축 질병의 유형이 빠르게 변이하고 새로운 바이러스 등이 발견됨으로써 백신과 항생제만으로는 가축 질병과 전염성의 통제가 어렵다고 합니다. 또한 이러한 가축 질병이 발생하면 육류 소비량이 거의 반으로 줄어들어 축산농가에 큰 타격을 준다고 하는데요, 이처럼 축산업의 증가에 따른 적절한 가축 사육 시스템 구축이 필요하다고 볼 수 있습니다. 이와 관련해서 AIHUB에서는 가축 관리 시스템을 구축하기 위해 '가축 행동 영상' 데이터를 제공하고 있는.. 더보기
[데이터 리뷰] AIHUB(국토환경) - 토지 피복지도 항공위성 이미지 데이터 데이터 리뷰 : 데이터 대신 읽어드립니다! #32 AIHUB(국토환경) - 토지 피복지도 항공위성 이미지 데이터 토지 피복지도란 아래와 같이 특정한 지리 특성만을 선택적으로 표현한 지도(주제도)로, 지구표면 지형지물의 형태를 일정한 과학적 기준에 따라 분류해 동질의 특성을 지닌 구역을 같은 색으로 나타낸 지도를 말합니다. 토지 피복지도와 관련해서 AIHUB에서는 항공사진과 위성영상으로부터 토지피복을 분석할 수 있는 AI학습데이터셋을 구축하고자 '토지 피복지도 항공위성 이미지 데이터(강원, 충청, 수도권)'를 제공하고 있습니다. 지금 현재 오픈소스 기반의 딥러닝 기술들이 개발됨으로써 하드웨어 인프라와 알고리즘이 급속도로 발전하고 있는데요, 이에 반해 토지피복 분류 관련 데이터는 매우 부족하다고 합니다. 따.. 더보기
[데이터 리뷰] AIHUB(음성/자연어) - 논문자료 요약 데이터 데이터 리뷰 : 데이터 대신 읽어드립니다! #26 AIHUB(음성/자연어) - 논문자료 요약 데이터 한 번쯤 논문을 찾아서 읽어본 경험이 있다면 공감하시겠지만, 논문에 이미지보다 글씨가 빽빽하게 있고, 수준 높은 어려운 내용들이 들어가 있다 보니 조금은 어렵고 딱딱하게 느껴질 수 있습니다. 거기에다 또, 만약 읽어야 할 논문이 많다면 논문 읽는 것에 대해 부담이 될 수도 있습니다. 하지만 만약 논문의 핵심내용을 뽑아 요약을 해주는 인공지능이 있다면 어떠할까요? 분명 많은 시간이 절약될 수 있고, 핵심적인 요약 내용을 먼저 읽고 논문을 읽으면 한층 이해하기 쉬워질 수 있습니다. 이와 관련해서 AIHUB에서는 다양한 주제의 한국어로 이루어진 학술논문이나 특허명세서에서 요약문을 도출해낼 수 있는 인공지능을 훈.. 더보기
[데이터 리뷰] AIHUB(음성/자연어) - 한국어 대화 요약 데이터 데이터 리뷰 : 데이터 대신 읽어드립니다! #25 AIHUB(음성/자연어) - 한국어 대화 요약 데이터 코로나19의 장기화로 언택트 시대가 됨으로써, 인터넷 또는 sns 메신저를 통해 비대면 의사소통의 수요가 매우 증가했는데요, 이로 인해 온라인 상에 축적되는 의사소통 관련 텍스트 데이터가 엄청난 솓도와 규모로 축적되고 있다고 합니다. 하지만 이렇게 많은 텍스트 데이터를 본문 그대로 사용하여 활용하자면 그 양이 많기 때문에 대화 데이터의 활용성을 높이기 위해서는 대화 요약 기술의 도입이 요구된다고 합니다. 이와 관련해서 AIHUB에서는 뉴스, 기사 등의 문어체에 비해 생략이나 변형이 많고, 대화의 문맥을 고려해야 할 특수성이 있는 대화 요약 기술 개발을 위한 학습 데이터 구축을 목적으로 한 '한국어 대화.. 더보기