본문 바로가기

BLOG/데이터 리뷰기

[데이터 리뷰] 강원 공공데이터(2) - 도시 대기 측정망 측정 결과 데이터

데이터 리뷰 : 데이터 대신 읽어드립니다!
#67 강원 공공데이터(2) - 도시 대기 측정망 측정 결과 데이터

 

 

 

 

 우리나라에서 공기가 좋을 것 같은 지역을 뽑자면 아무래도 강원도가 그중에 해당되지 않을까 싶은데요, 강원도는 다른 지역보다 상대적으로 산림이 풍부하기 때문에 공기가 좋지 않을까 싶습니다. 하지만 강원도의 대기는 항상 맑을까요~?

 

이에 대해 강원 공공데이터 플랫폼에서는 강원도의 '도시 대기 측정망 측정 결과' 데이터를 제공하고 있는데요, 각 지역별로 측정한 CAI, PM10 CAI, O3 CAI, NO2 CAI 등의 정보가 구축되어 있는 데이터입니다. 그렇다면 이번 데이터 리뷰기에서는 해당 데이터가 어떻게 이루어져 있는지 살펴보고, 어떻게 분석 및 활용하면 좋을지 생각해보도록 하겠습니다!

 

 

 

 

 

도시 대기 측정망 측정 결과 데이터

 

(1) 데이터 정보

  • 제공기관 : 강원도보건환경연구원/환경연구부
  • 데이터 형식 : csv
  • 데이터 개수 : 378,153개
  • 데이터 칼럼 : 측정소코드, 측정소명, 측정일시, CAI지수값, PM10 CAI지수값, O3 CAI지수값, NO2 CAI지수값, SO2 CAI지수값, CO CAI지수값, PM25 CAI지수값
  • 다운로드 : https://data.gwd.go.kr/dataset/view?infId=OA-10189&viewType=sheet#

 

 '도시 대기 측정망 측정 결과' 데이터는 2019년 1월 1일부터 2021년 1월 9일까지 한시간마다 측정한 대기환경지수(CAI)에 대한 정보들을 수집한 데이터셋으로, 각 시간대에 지역별로 데이터가 수집되어 있답니다.

 

한편, 위 다운로드 링크에 들어가면 해당 데이터를 다운로드할 수 있는데요, 한번 데이터를 다운받아서 데이터가 어떻게 이루어져 있는지 리뷰해보도록 하겠습니다~

 

 

(2) 데이터 리뷰

 데이터를 다운로드 하면, 아래와 같이 csv 파일 형태로 데이터가 이루어져 있습니다.

 

 

위 데이터는 전체 데이터의 일부를 캡쳐한 것인데요, 데이터를 살펴보면, 첫 행에는 칼럼 이름이, 그 밑으로는 데이터가 나열되어 있는 것을 확인할 수 있습니다. 칼럼은 총 10개로, 먼저 측정소코드, 측정소명, 측정일시 칼럼이 있습니다. 측정소명은 강원도의 각 측정소이름으로 23곳에 대해 데이터가 수집되어 있고, 측정일시는 2019년 1월 1일 오전 1시부터 1시간 단위로 2021년 1월 9일 오전 7시까지 23곳에서 측정된 대기 정보가 수집되어 있습니다. 

 

그 옆으로는 CAI지수값, PM10 CAI지수값, O3 CAI지수값, NO2 CAI지수값, SO2 CAI지수값, CO CAI지수값, PM25 CAI지수값 칼럼이 있는데요, CAI는 통합대기환경지수로, 대기오염도 측정치를 국민이 쉽게 알 수 있게 하기 위함과 대기오염으로부터 피해를 예방하기 위한 행동지침을 국민에게 제시하기 위해 대기오염도에 따른 인체 영향 및 체감오염도를 고려하여 개발된 대기오염도 표현방식이라고 합니다. 따라서 CAI지수값은 통합대기환경지수, PM10 CAI지수값은 미세먼지 지수, O3은 오존, NO2는 이산화질소, SO2는 아황산가스, CO는 일산화탄소, PM25는 초미세먼지 지수를 뜻합니다.

 

한편, CAI 지수값을 봐서는 대기의 상태가 좋은지 안좋은지 가늠이 안될 수 있는데요, 아래 표에 따라 대기상태가 정해진다고 합니다~

자료출처_한국환경공단

즉, CAI 지수가 50 이하면 좋음, 100 이하면 보통, 250 이하는 나쁨, 250을 초과하면 대기가 매우 나쁘다는 것입니다. 

따라서 이 표를 보고 위 데이터를 다시 보면, 대체로 수치가 50 이하인 것을 살펴볼 수 있는데요, 대기상태가 좋다고 판단할 수 있습니다.

 

그렇다면 데이터에서 CAI 지수가 높을 때의 데이터를 찾아볼까요~?

 

 

위 데이터는 CAI지수값이 높은 상위 10개의 데이터인데요, 앞에서 살펴본 데이터와는 너무나도 다르게 CIA지수값이 매우 높은 것을 확인할 수 있습니다. 또한 CIA지수값이 높을 때 PM10 CAI 지수와 PM25 CAI 지수값도 함께 높은 것을 확인할 수 있는데요, 미세먼지와 초미세먼지가 통합대기환경지수에 많은 영향을 주는 것 같습니다. 또한 위 데이터들은 모두 2019년 1월이나 3월에 측정된 데이터로, 황사철의 영향도 받았을 것이라 예상할 수 있습니다.

 

 

(3) 데이터 활용

 그렇다면 '도시 대기 측정망 측정 결과' 데이터를 이용하여 어떻게 활용할 수 있을까요? 우선 해당 데이터에는 23곳 측정소에서 1시간마다 측정된 대기환경지수 데이터들이 있는데요, 이러한 점을 이용하여 다양한 분석을 할 수 있지 않을까 싶습니다. 예를 들어, 한 측정소에서 시간의 흐름에 따라 통합대기환경지수와 여러 대기 지수가 어떻게 변화하는지, 또는 날짜의 흐름에 따라 CIA지수가 높거나 변화의 폭이 큰 지역은 어디인지 분석할 수 있지 않을까 싶습니다. 또한 미세먼지, 오존, 이산화질소 지수 등 각 지역별로, 또는 일시별로 어떠한 변화를 나타내고 있는지, 감소세인지 증가세인지 분석하여 그 시기나 지역 환경과 상관관계가 있는지도 분석해도 좋을 것 같습니다.

 

이렇게 다양한 분석을 통해 의미있는 결과가 도출된다면 특정 시기나 특정 지역의 통합대기환경지수 예측 서비스를 구현할 수 있지 않을까 싶은데요, 이러한 시스템을 통해 심각한 대기환경일 때는 미리 대비할 수 있도록 하는 방안을 마련할 수 있지 않을까 싶습니다!

 

 

 

 

 

 

# 강원 공공데이터

 

 오늘 리뷰한 '도시 대기 측정망 측정 결과' 데이터는 <강원 공공데이터> 포털에서 다운로드 받은 데이터로, 강원 공공데이터 포털은 강원도가 보유한 공공데이터를 체계화하고 통합 및 개방하여 도민과 공유하고 민간의 활용 촉진을 위해 개발자 맞춤형 서비스를 제공하기 위해 구축된 공공데이터 개방 포털입니다.

 

 

 한편, 강원 공공데이터 포털에서는 '자체발굴 데이터', '표준 데이터', '인허가 데이터', '시각화 서비스'를 제공하고 있으며, 아래와 같이 행정구역, 분류체계, 서비스형태에 따른 데이터를 설정하여 원하는 데이터를 찾을 수 있답니다. 현재 제공되는 데이터는 약 500개로, 무료로 다운받으실 수 있습니다! 

 

 

 이렇게 오늘 데이터 리뷰기에서는 강원 공공데이터 포털의 '도시 대기 측정망 측정 결과' 데이터를 리뷰해보았는데요, 다음 리뷰기에서는 강원 공공데이터 플랫폼에 있는 다른 데이터에 대해 리뷰하도록 하겠습니다. 이전 데이터 리뷰기에서는 AIHUB, 소방, 사회 범죄, 해양수산, 헬스케어, 농수산물, 경기, 서울시, 제주시 데이터 플랫폼 등 여러 플랫폼에서 제공하는 데이터 리뷰기가 있으니, 관심이 있으신 분들은 참조하시기 바랍니다! 그럼 다음 리뷰기에서 만나요! :D