본문 바로가기

분석

[데이터 리뷰] 해양수산 플랫폼(3) - 전세계 표층수온 연평균 아노말리 데이터 셋 데이터 리뷰 : 데이터 대신 읽어드립니다! #12 해양수산 플랫폼(3) - 전세계 표층수온 연평균 아노말리 데이터 셋 '표층수온'은 해수면의 온도로, 위도와 계절에 따라 달라지는데요, 이러한 표층수온은 지구온난화의 지표가 되기도 한답니다. 반면 '아노말리'란 특정 지역에서 특정 요소의 평균값으로 변화하는 차이값을 말하는데요, 표층수온의 아노말리란 장기간의 표층수온 평균값으로부터 변화하는 차이값을 말합니다! 이러한 아노말리 값은 여러 지역들 간의 원격효과에서 매우 중요한 요소이기도 하답니다. 이와 관련해서 에서는 '전세계 표층수온 연평균 아노말리 데이터 셋'을 제공하고 있는데요, 이번 데이터 리뷰기에서 이 데이터를 함께 읽어보고, 어떻게 분석하고 활용할 수 있을지 생각해보도록 하겠습니다! 전세계 표층수온 .. 더보기
[데이터 리뷰] 해양수산 플랫폼(2) - 어업별 어선 조업 위치, 어획량, 조업 정보 데이터 데이터 리뷰 : 데이터 대신 읽어드립니다! #11 해양수산 플랫폼(2) - 어업별 어선 조업 위치, 어획량, 조업 정보 데이터 우리나라 동해, 서해, 남해에서는 참 많은 어업 활동이 이루어지고 있고, 다양한 어선 조업 등을 통해 어획 및 생산활동이 이루어지고 있습니다. 이와 관련해서 에서는 어업과 관련한 데이터를 제공하고 있는데요, 그중에서도 어업별 어선 조업의 위치, 어획량 정보, 조업 정보에 대한 데이터가 있답니다. 따라서 이번 데이터 리뷰기에서는 해양수산 플랫폼의 '어업별 어선 조업 위치', '어업별 어획량 정보', '어업별 조업 정보' 데이터를 함께 읽어보고, 어떻게 분석하고 활용할 수 있을지 생각해보도록 하겠습니다~! 1. 어업별 어선 조업 위치 데이터 (1) 데이터 정보 제공기관 : 전자어구빅.. 더보기
[데이터 리뷰] 해양수산 플랫폼(1) - 수산물 수입평균단가 데이터 (+판매유통 데이터) 데이터 리뷰 : 데이터 대신 읽어드립니다! #10 해양수산 플랫폼(1) - 수산물 수입평균단가 데이터 (+판매유통 데이터) 현재 우리나라에서는 여러 나라로부터 많은 수산물을 수입하고 있는데요, 우리가 먹는 수산물의 상당량이 수입산에 해당된답니다. 이에 대해 에서는 수산물과 관련하여 다양한 데이터를 제공하는데요, 그중 "수산물 수입평균단가 데이터"가 있습니다. 수산물 수입 평균단가 데이터는 2016년~2020년까지 수입된 수산물의 종류, 수입국, 가격 등의 정보가 담긴 데이터를 제공하고 있답니다. 따라서 이번 데이터 리뷰기에서는 이 수산물 수입 평균단가 데이터와 추가로 판매유통 데이터를 함께 읽어보고, 어떻게 분석 및 활용할 수 있을지 생각해보도록 하겠습니다! 수산물 수입 평균단가 데이터 (1) 데이터 정.. 더보기
[데이터 리뷰] 디지털산업혁신 플랫폼(3) - M&A 인수/매도 기업 데이터 데이터 리뷰 : 데이터 대신 읽어드립니다! #9 디지털산업혁신 플랫폼(3) - M&A 인수/매도 기업 데이터 M&A란 둘 이상의 여러 기업이 통합된다는 뜻의 'Merger'와 기업이나 개인이 다른 기업이나 자산, 지분 등을 인수하여 지배권을 취득한다는 'Acquisition'이 결합된 용어인데요, 이는 인수기업이 매도기업의 경영권을 얻기 위해 진행되는 인수합병 거래를 말합니다. 기업은 이러한 M&A를 통해 사업을 확장시켜 경영/경제적으로 효율성을 높인다고 합니다. 따라서 이러한 M&A가 진행되는 기업들 또는 사례를 분석하는 것도 큰 의미가 있을 수 있는데요, 이번 데이터 리뷰기에서는 에서 제공하는 M&A 인수 기업 데이터와 매도 기업 데이터를 읽어보고, 어떻게 활용하면 좋을지 생각해보도록 하겠습니다~ M.. 더보기
[데이터 리뷰] 디지털산업혁신 플랫폼(2) - 유저 인터넷 키워드 정보 데이터 (쿠팡, 네이버 등) 데이터 리뷰 : 데이터 대신 읽어드립니다! #8 디지털산업혁신 플랫폼(2) - 유저 인터넷 키워드 정보 데이터 (쿠팡, 지마켓, 11번가, 옥션 등) 작년, 발병한 코로나19에 대해서 미리 이를 예측한 곳이 있었는데요, 스마트 체온계 기기를 판매하는 의료기기업체 '킨사 헬스'였습니다. 판매하는 스마트 체온계 기기는 인터넷과 연동되는 기기였는데요, 스마트 체온계로 발혈 환자가 급증한 지역을 실시간으로 찾았고, 그곳은 코로나 바이러스 확진 환자가 발생한 지역이었다고 합니다. 실제로도 킨사의 발열 환자 분포도는 우한 코로나 환자 발생지와 일치했다고 합니다. 이처럼 이 사건은 개개인이 이용한 인터넷 정보들이 모여 하나의 큰 흐름을 발견한 사례인데요, 그만큼 각 유저들의 인터넷 정보는 하나의 중요한 데이터가 될 .. 더보기
[데이터 리뷰] 디지털산업혁신 플랫폼(1) - 에너지/정보통신/바이오/화학 기술 동향 데이터 데이터 리뷰 : 데이터 대신 읽어드립니다! #7 디지털산업혁신 플랫폼(1) - 에너지/정보통신/바이오/화학 기술 동향 데이터 점점 빠르게 변화하는 시대에서 기술의 발전 또한 빠르게 진행되고 있는데요, 이러한 흐름에 발맞추기 위해선 어떠한 기술이 떠오르는지, 어떠한 기술에 연구를 많이 하고 있는지 아는 것이 중요합니다. 이와 관련해서 에서는 산업혁신과 관련된 다양한 데이터를 제공하는데요, 그중에서 에너지/정보통신/바이오/화학 기술 동향 데이터를 제공하고 있습니다. 따라서 이번 데이터 리뷰기에서는 에너지/정보통신/바이오/화학 기술 동향 데이터 중에서 '바이오 기술 동향 데이터'를 읽어보고, 분석할 수 있는 방안이나 어떻게 활용하면 좋을지 생각해보도록 하겠습니다! 바이오 기술 동향 데이터 (1) 데이터 정보 .. 더보기
[데이터 리뷰] 스마트 치안 분야 공공 데이터 (3)몰래카메라 촬영 융합데이터 데이터 리뷰 : 데이터 대신 체험해드립니다! #3 스마트 치안 빅데이터 플랫폼_몰래카메라 촬영 융합데이터 요즘 카메라를 이용 및 설치하여 몰래 촬영을 하고, 해당 영상을 인터넷에 업로드하는 등, 몰카 관련 범죄에 따른 피해가 계속 발생되고 있는데요, 피해를 막고, 사전 범죄 예방을 위해선 범죄 발생과 관련한 영향요소 분석이 중요할 수 있습니다. 따라서 이번 데이터 리뷰기에서는 '스마트 치안 빅데이터 플랫폼'에서 제공하는 카메라 이용 촬영 범죄와 관련된 통계 데이터 2건을 읽어보고, 몰카 범죄 발생과 영향 요소 간의 상관관계를 찾는 데이터 분석 방안을 함께 생각해보도록 하겠습니다! 카메라 이용 촬영 범죄 데이터 이번 데이터 리뷰기에서 읽을 데이터는 총 2개로, 2019년 1월 1일부터 12월 31일까지 전.. 더보기
예제로 다시 한번 이해하는 RNN 구조 【5】RNN 기본 다지기 / 순환 신경망의 출현 예제로 다시 한번 이해하는 RNN 구조 RNN을 실습해보자 import numpy as np from matplotlib import pyplot as plt from tensorflow.keras import datasets, layers, models 실습에 사용되는 패키지들이다. 텐서플로우 2.0은 선언하는 것은 생략하고 넘파이, 맷플롯립, 케라스 이렇게 사용된다. 이번에는 데이터셋을 호출하지 않고 만들어서 사용한다. data = np.sin( np.pi * np.arange(0, 100)* 2.025 ) + np.random.random(100) x = np.array([data[i+j] for i in range(len(data)-10) for j.. 더보기
순환 신경망의 출현 : 시계열 데이터 분석의 이해 【5】RNN 기본 다지기 / 순환 신경망의 출현 순환 신경망의 출현 : 시계열 데이터 분석의 이해 지금까지 다뤘던 인공신경망은 사실 독립적인 데이터를 다루기에 적합하다. 그러나 순서가 있는 데이터를 독립적으로 본다면 어떻게 될까? 데이터 속의 관계성이 깨질것이며 이는 곧 정보의 손실을 의미한다. 이러한 문제를 해결하기 위해 등장한 것이 바로 순환신경망(Recurrent Neural Network, RNN)이다. 간단히 말하면 연속된 데이터를 다루는데 적합한 신경망이다. 이번 장에서는 RNN에 대해서 알아볼 차례이다. 그 전에 연속된 데이터가 무엇인지 먼저 설명하겠다. 이는 RNN의 재료가 될 뿐만 아니라 RNN의 구조를 이해하는데 도움이 될 것이다. "시계열 데이터 분석의 이해" 순서가 있는 데이터를 일.. 더보기