교통과 지역의 특성에 따른 대설의 실시간 피해 위험도 분석 연구

1. 연구의 필요성

최근 이상 기후로 인해 자연재해의 피해가 증가하고 있다. 자연재해 중 대설의 피해도 지속적으로 증가하고 있는데, 2020년도 재해연보에 따르면 대설은 풍수해 다음으로 피해가 큰 재난이며, 겨울철 대표적인 재난으로 손꼽혔다.

대설의 피해는 크게 적설에 의한 직접 피해와 교통과 관련된 간접피해로 구분할 수 있다. 직접 피해는 눈이 많이 쌓여서 일어나는 적설피해와 쌓인 눈의 압력으로 일어나는 설압피해, 경사면을 미끄러지면서 일어나는 눈사태와 성전선이나 가설물에 부착되어 발생하는 착설 등의 피해를 의미하고, 간접피해는 결빙 등으로 인한 도로 마비 및 교통 혼잡도로 인해 발생하는 피해를 의미한다.

대설의 경우 지역의 특성에 따라 적설에 의한 직접피해와 교통에 의한 간접피해의 위험정도가 달라 고려할 사항이 많지만 현재 관심∙주의∙경계∙심각 4단계의 위기 경보 기준으로 대설의 피해를 나타내기엔 정량적으로 모호하다. 따라서, 본 연구에서는 대설피해와 관련된 재해연보를 분석하고, 피해를 유발시키는 적설량을 기준으로 영향요소를 선정하고, 지역의 특성을 이해하여 대설피해에 영향이 큰 요소들을 선정한 후 시∙군∙구의 특성에 맞게 위험도를 1부터 10까지의 수준으로 정량화 했다.

2. 연구 방법

본 연구에서는 지역적 특성에 의해 피해 정도를 수치화한 위험도의 도출이 목적이므로 지역민감도, 교통민감도가 반영된 대설민감도와 기상 데이터(적설, 습도, 기온)를 독립변수로 설정하고 두 독립변수를 이용하여 산출된 위험도를 종속변수로 선정했다.

대설과 관련이 있는 지역의 특성을 대설 민감도라고 정의했다. 민감도의 사전적 의미는 임의의 수준 자극(또는 변수 변화)에 따라 반응(또는 응답 결과)하는 컴포넌트, 모델 또는 시뮬레이션의 능력을 뜻한다. 그러므로 본 연구에서 직접 피해의 분석으로 도출한 민감도를 지역 민감도로, 간접 피해의 분석으로 도출한 민감도를 교통민감도라고 정의하여 대설 민감도에 활용했다.

두 가지의 민감도를 더해 0과 1사이의 범위로 조정(Scaling) 한 값을 대설 민감도라고 제안하며 229개의 시∙군∙구에 대해 대설피해에 취약한 정도에 대해 수치적으로 표현했다.

교통과 지역의 특성에 다른 대설의 실시간 피해 위험도 분석 연구’ 파이프라인

민감도의 경우 피해규모와 영향변수들 사이의 상관관계 분석을 통해 지역민감도와 교통민감도를 도출했다. 지역민감도의 피해규모는 2015년도부터 2020년 까지의 재해 연보를 기반으로 대설로 인한 피해액으로 선정하고, 교통민감도의 경우 교통사고분석 시스템(TAAS)의 눈에 의한 교통사고 사망자 수와 부상자 수의 데이터, 그리고 도로교통공단의 ‘도로교통 사고 비용 추계와 평가’에서 교통사고 사망자 1인당 순 평균 비용과 부상자 1인당 순 평균 비용을 사용했다. 또한, 국가교통 데이터 오픈 마켓을 통해 2018년도 각 시∙군∙구의 교통혼잡비용도 더해 사용하였다. 교통 민감도 피해액의 경우 교통사고 사망자 또는 부상자 수에 각 1인당 순 평균 비용을 곱한 뒤 교통혼잡비용을 더해 피해액을 산정했다. (e.q(1))

교통민감도 피해액 수식: TDC = AD*DAC + AI*IAC + TC …………………………………… e.q (1)
독립변수내용의미
TDCTraffic Damage Costs교통 피해액
ADTraffic Accidental Death교통사고 사망자
DACDeath-toll Average Costs교통사고 사망자 1인당 순 평균 비용
TITraffic Injured교통사고 부상자
IACInjured Average Costs교통사고 부상자 1인당 순 평균 비용
TCTraffic-Congestion Costs교통혼잡 비용

지역민감도는 선행 문헌을 기반으로 건설환경요인, 지리적요인, 사회경제적 요인으로 구분 짓고, 교통민감도는 선행 문헌과 행정안전부의 결빙 취약 구간 배점표의 항목들로 영향변수를 선정했다.

(민감도 산출을 위한 상관분석) 수집한 영향변수들을 독립 변수로 선정하기 위해 다중회귀식의 변수 선택법과 상관분석을 수행했다. 변수 선택법은 최적의 회귀방정식 선택에 도움을 주는 방법으로 다중공산성으로 인해 과적합이 발생하지 않기 위해 사용했다. 변수선택법으로 선정된 변수들을 대상으로 상관분석을 진행했다. 선택된 영향변수를 Python에서 제공하는 sklearn 라이브러리의 minmax 함수를 이용해 조정한 뒤 0과 1 사이의 범위로 scaling을 진행한 뒤에 Pearson 함수를 이용해 상관분석을 진행하고 상관성이 가장 높은 10개의 영향변수 데이터에 상관계수를 곱해 민감도를 도출했다.

(지역민감도 분석) 지역민감도는 농가 가구 수, 산림면적, 목장 용지, 빈 다세대주택, 인삼재배 면적, 논 이용량, 비닐하우스 수, 과수원 면적, 밭 면적을 양의 상관 계수로, GRDP를 음의 상관계수로 상위 10개를 선정했다. 그 결과, 제주특별자치도 서귀포시가 가장 높은 민감도를 보이며, 그 다음은 제주시가 높고 전라북도 고창군의 경우가 3위를 차지했으며 서울특별시가 가장 낮은 수치를 보였다. (e.q(2))

지역민감도 도출 식: RS = FP*0.3 + FA*0.39 + EH*0.43 + GH*0.44 + RP*0.4 + RL*0.39 + OC*0.61 + VG*0.46 + FD*0.58 – GRDP*0.11 ……………..e.q (2)
독립변수내용의미
RSRegion Sensitivity지역민감도
FPForest Area산림면적
EHEmpty House빈 집
GHGinseng Houses인삼재배면적
RPRice Paddy논 면적
RLRanch Land목장용지
OHOrchard과수원
VGVinyl Greenhouse비닐하우스 수
FDField밭 면적
GRDPGross Regional Domestic Product지역 내 총생산

(교통민감도 분석) 교통민감도는 시내버스 이용자 수, 버스회사 종사자 수, 화물회사 종사자 수, 자동차 등록 대수, 버스 추정 교통량, 승용차 추정 교통량, 교량 수, 지하차도 수가 상관관계가 높은 상위 8개의 결과로 도출되었다. 교통민감도의 경우 수도권 지역들이 민감도 지수가 높게 도출되어 경기도 수원시의 교통민감도가 가장 높았으며, 경기도 성남시, 경상남도 창원시, 경기도 화성시, 고양시의 등의 순으로 유동인구와 인구밀도가 높은 지역의 민감도가 높게 도출되었다. 또한, 수도권이더라도 인구밀도가 낮거나 다른 지역에 비해 도시화가 이루어지지 않은 인천광역시 옹진군, 경상북도 울릉군, 전라남도 진도군, 충청북도 증평군, 전라남도 신안군의 순으로 가장 낮은 수치를 보였다. (e.q(3))

교통민감도 도출 식: TS = CU*0.29 + BW*0.55 + FW*0.3 + NC*0.61 + EB*0.46 + EC*0.33 + BG*0.26 + UP*0.38…………… e.q(3)
독립변수내용의미
TSTraffic Sensitivity교통민감도
CUCity Bus User시내버스 이용자 수
BWBus Worker버스회사 종사자 수
FWFreight Worker화물회사 종사자 수
NCThe Number of Cars Registered자동차 등록 대수
EBEstimated Bus-Traffic버스 추정 교통량
ECEstimated Car-Traffic승용차 추정 교통량
BGBridge교량 수
UPUnderpass지하차도 수

지역 민감도 시각화

교통 민감도 시각화

이 두 결과를 바탕으로 지역민감도와 교통민감도를 더해 MinMaxScaler를 통해 0과 1 사이의 범위로 대설민감도를 도출했다. 2015년도부터 2020년도 사이의 적설에 의한 피해액과 눈에 의한 교통사고 관련 피해액을 비교했을 때 두 피해액 사이의 비율이 1:1로 비슷한 수준을 나타내 대설민감도에 적설과 교통의 가중치를 1:1의 비율로 적용해 대설민감도를 도출했으며, 대설 민감도는 지역 민감도와 교통민감도 두 민감도의 특성을 다 담고 있어 적설과 교통에 모두 취약한 지역이 잘 나타난다.

대설민감도의 결과를 보면 제주특별자치도의 제주시, 서귀포시, 경상남도 창원시, 경기도 수원시, 충청북도 청주시 등의 순으로 높게 도출되었고 경상북도 울릉군, 충청북도 계룡시, 인천광역시 옹진군, 동구, 충청북도 증평군의 순으로 낮게 도출되었다.

대설민감도 시각화

제주시와 서귀포시의 경우 관광객으로 인해 교통량도 많고 한라산이 있어 산림면적이 넓으며 호남지방통계청 2020년 호남∙제주 농림어업총조사 현황 및 분석 결과에 따르면 전국에서 시∙군∙구 기준 농가 가구수가 가장 많은 지역은 제주시라는 결과가 있다.

(기상데이터 선정 및 수집) 기상데이터의 경우 선행 문헌에 따르면 신적설이 높더라도 기온에 따라, 습도에 따라 적설량이 달라지기 때문에 본 연구에서는 적설을 기상데이터로 선정하고 습기를 머금을수록 무거운 함박눈 형태가 발생하는데 기온 영하 5°C 이상에서 나타난다. 이 결과를 기반으로 대설 피해를 유발하는 기상 요소로 적설, 기온, 습도 자료로 선정하였으며 기상 데이터의 경우 기상청의 종관기상관측(ASOS, Automated Synoptic Observing System) 데이터를 이용하였고, 91개의 지점을 방재성능 목표에 따라 2015년부터 2020년까지의 대설 피해 기간의 기상데이터를 229개의 시∙군∙구에 맞추어 수집했다.

(기상 데이터 관계 확인) 수집한 데이터를 독립변수로 선정하고 위험도를 종속변수로 설정해 위험도를 도출하기 위해 대설민감도와 기상 데이터의 점수화를 진행했다. 2018년도 기준 합천군의 피해액과 적설량 비교 결과 적설량이 5.3cm일 때 피해액이 약 9억 9천만원이었으며, 적설량이 5.5cm일 때 피해액이 약 10억원이었다. 또한, 거창군의 적설량과 피해액의 비교 결과, 적설량이 1.07cm일 때 피해액이 약 7천만원이었으며, 적설량이 9.3cm일 때 피해액이 약 6억 4천만원으로 적설량이 약 9배 증가하면 피해액도 9배 증가하는 것을 확인해 이 관계를 토대로 대설민감도와 기상데이터의 비율을 1:1로 산정하여 데이터 세트를 산출했다.

(학습 데이터 세트 구성) 학습 데이터 세트는 2015년도부터 2020년까지 재해연보를 바탕으로 대설 피해기간의 기상 데이터를 수집해 총 60만 로우(Row)로 구성하였다. 충분한 데이터의 양으로 전체데이터의 90%인 54만 개의 데이터를 훈련데이터로 사용하고, XGBoost 모델 성능 향상 및 모델 예측 검증 데이터(Validation Data)로 전체 데이터의 5%인 3만개, 최종 결과 모델 평가를 위한 평가 데이터로 전체 데이터의 나머지 5%인 3만개를 사용하여 종속변수인 위험도에 대하여 Stratify를 진행하여 학습, 검증, 테스트 진행 시 데이터의 편향이 이루어져 모델의 신뢰성이 떨어지지 않도록 진행했다.

(학습 데이터 세트(레이블링)) 점수화를 진행하기 위해 선행 문헌을 기반으로 기온이 영상과 영하일때를 구분하여 이전 대설 민감도와 기상 데이터의 피해 비율 1:1 관계 중 비율적 계산의 용이성을 위해 총 100점을 기준으로 대설민감도 50점, 기상 데이터 50점으로 나누었고 습도가 높은 습설의 경우 건설에 비해 7배 중량이 크다는 연구 결과를 활용해 습도 또한 위험도를 산정하는 기준으로 기상데이터의 50점을 1:7의 비율로 나누어 반올림할 시에 약 6:44의 비율로 나누어지는 값을 5단위로 스케일링을 진행하여 최종적으로 적설 45점, 습도 5점으로 레이블링을 진행했다. 적설량에 따라 민감도와 습도의 점수를 조정하였고 그에 따라 위험도를 산정했다.

(머신러닝 선정) 머신러닝은 잔여 오차(Residual Error)에 학습시키는 XGBoost(Extreme Gradient Boosting) 알고리즘을 사용해 학습을 진행했다. XGBoost란 다양한 파라미터를 조정해 최적화된 모델을 만들 수 있는 머신러닝으로 약한 예측 모형들의 학습에서 오차에 가중치를 두고 순차적으로 다음 학습 모델에 반영하여 강한 예측이나 분류 모델을 만드는 앙상블 기법에서 부스팅(Boosting)에 해당하는 알고리즘이다. 병렬처리로 학습이나 분류 속도가 빠르고 조기 종료, 규제화의 적용으로 과적합이 발생할 가능성이 낮은 특징이 있어 XGBoost의 분류기능인 Classification기능을 사용했다

(XGBoost를 활용한 모델 학습) XGBoost는 파라미터를 조절하면서 예측과 분류 성능이 좋은 최적의 모델을 개발할 수 있는 장점이 있다. 모델의 파라미터 중 booster는 gbtree를 사용해 트리를 기반으로 모델 학습을 진행했다. 모델의 정확성을 위해 과적합(Overfitting)이 발생하지 않도록 Grid Search 기법을 사용해 주요 하이퍼 파라미터의 최적값을 도출했다. 특히 Grid Search를 적용 시 학습 진행에 따라 최적의 값을 결정하기 위한 국소 지점에 도달하지 못하는 경우를 방지하기 위해 Gradient Boosting 방식의 모델에서는 Learning Rate를 조절하여 최적의 학습 Step을 결정하는데 모델 학습의 속도를 고려한 Grid Search로 확인 결과 Learning Rate의 최적값을 0.300000012로 도출하여 모델 손실을 최소화하는 국소 지점 도달이 가능하고 가장 최단 시간 학습이 가능하도록 모델에 적용했다.

최적의 하이퍼 파라미터를 모델에 적용한 후 평가 데이터 세트를 활용해 모델을 평가하여 정밀도는 0.999, 재현율은 0.997, 정확도는 0.999의 높은 모델의 성능 지표를 확인했다.

3. 연구 결과

학습데이터에 사용하지 않은 기간의 데이터를 이용해서 모델 실증과 시각화를 진행했다. 2015년 11월 26일의 위험도를 분석한 결과 충청도는 해당 기간동안 많은 적설량으로 인해 대설 주의보가 발령되었으며 아산시의 경우 적설량이 17.5cm를 기록했으며, 천안시는 16.05cm, 서천군은 20.34cm를 기록했다. 천안시의 경우 세 지역중 가장 적설량이 제일 낮지만 대설 민감도가 가장 높아 위험도가 6으로 도출되었으며 재해 연보상의 해당 피해 기간 피해액도 제일 높은 것으로 확인하였다. 또한, 아산시의 경우 서천군과 비교했을 때 대설 민감도가 높아 적설량이 낮아도 피해액이 더 높게 발생했다. 이 분석을 통해 본 연구에서 대설 민감도가 실제 피해와 밀접한 연관성이 있음을 알 수 있으며, 경제적인 피해액과 위험도가 유의미함을 확인했다.

2015년 11월 26일 위험도 시각화

2016년 1월 25일 위험도를 분석 결과 시베리아 고기압의 남하가 한반도 기후에 영향을 끼쳐 광주광역시, 전라남도, 제주특별자치도에 기록적인 폭설이 내렸다. 전라북도 고창군과 정읍시의 대설민감도가 전라북도 내에서 가장 높고 위험도 또한 8과 7로 높은 결과를 보였다. 또한 울릉군의 경우 대설 민감도가 가장 낮음에도 불구하고 적설량이 93.8cm로 위험도가 9로 매우 높게 나타났다. 언론 매체에 따르면 실제 울릉군은 주요 도로가 막혀 곳곳이 고립상태가 되었고 산간마을 주민들은 며칠째 집안에 갇혀 있었으며, 볼일을 보러 나갔던 주민 200명 이상이 울릉군에 돌아오지 못했으며 포항시와 울릉군 사이의 여객선 운항이 8일째 결항되어 생필품을 공급받지 못했다. 울릉군의 경우 대설민감도가 229개 시∙군∙구 중 가장 낮은 수치이며 눈이 자주 오는 지역으로 대처가 빠르지만, 적설량이 많아 민감도와 상관없이 기상 상태에 맞게 위험도가 9의 결과가 나타났다. 또한, 재해연보에 따르면 해당 대설 기간 동안 전라북도는 약 65억원, 전라남도는 약 50억원, 경상북도는 약 5억원 상당의 피해가 발생하며 피해 규모가 크다는 것을 알 수 있는데 본 연구에서 위험도도 8과 7의 높은 수준으로 도출되었다.

2016년 1월 25일 위험도 시각화

2018년 11월 24일 위험도를 시각화한 결과 서울특별시의 적설량이 8.8cm로 가장 높게 도출되었으며, 위험도가 4의 결과를 보였다. 서울특별시의 경우 1990년 이후로 기록적인 폭설이었으며 적설에 의한 피해는 없었지만 출퇴근 시간인 오전에 55번 중앙고속도로 부산 방향 신림 부근에서 교통사고가 발생으로 도로 통행 전면 차단되어 차량 이동이 불가능한 상황이 발생했었다. 그러나 경기도 이천시의 경우 적설량이 서울특별시와 크게 차이 나지 않았지만 위험도 결과가 2의 수준으로 도출되고 피해 기사를 검색했을 때 교통이나 적설에 의한 피해가 있었다는 내용은 없었다. 본 연구의 취지에 맞게 ‘지역 단위의 특성에 따라 그리고 일부 지역에만 발생하는 재난의 특징을 잘 반영했다.’라고 판단되며 적설량이 비슷한 인접 지역이었지만 지역의 특성에 맞게 피해 유형과 정도가 다르다는 것을 알 수 있다.


 2018년 11월 24일 위험도 시각화

서울특별시 위험도 시각화

4. 결론

본 연구는 대설에 의한 재해 연보 자료의 직접 피해 또는 교통에 의한 지역경제에 발생하는 간접피해에만 국한되어 진행된 선행연구에서 대설에 의한 피해를 229개 시∙군∙구 지역별 대설 직접 피해로 세분화하여 도출한 지역 민감도와 대설과 교통에 의하여 발생하는 간접피해로 도출한 교통민감도를 구하여 대설 민감도라는 새로운 개념을 제안하였다는 것에 차별성을 지니고 있다. 따라서, 대설에 의한 직접 및 간접의 통합된 피해로 지역별 특성에 따른 위험을 예측하는데 의의가 있으며, 대설민감도와 적설량, 습도, 기온을 독립변수로, 독립변수에 따라 도출된 위험도를 종속변수로 선정하고 머신러닝을 생성했다. 본 연구의 타당성을 위해 3차례의 실증도 진행하였으며, 해당 기간의 재해 연보와 언론 보도를 통해 위험도를 분석해 연구의 타당성을 확인했다.

대설의 경우 전국에 걸쳐 발생하는 재난이 아닌, 제한적 지역에서 발생하는 만큼 위험도가 전국 발령이 아닌 시∙군∙구의 특성과 기상 상황에 따라 발령된다면 더욱 정확한 위기 발령으로 사전에 피해를 예방할 수 있으며, 기상청의 예보데이터를 이용한다면 위험도를 예측할 수 있으며 선제 대응이 가능해져 피해를 최소화할 수 있다.

5. 감사의 글

본 연구는 ㈜씨에스리의 AI엔지니어링사업부 하광림 이사님을 필두로 정용철 책임, 유진영 사원, 이준희 사원의 노력 끝에 성공적으로 마무리할 수 있었습니다. 뿐만 아니라 같은 사업부의 팀원분들이 노력해주신 덕분에 연구에 몰두할 수 있었기에 성공적인 모델 결과와 논문을 비롯한 특허까지 출원할 수 있었습니다. 이 자리를 빌려 다시한번 AI엔지니어링사업부 분들께 감사의 말씀을 전하고 싶습니다.

  • 논문은 한국산업정보학회 제27권 6호(12월호)에 개제되었습니다. 원문은 한국산업정보학회 홈페이지(https://ksiis.jams.or.kr )에서 열람 가능합니다.


**해당 콘텐츠는 저작권법에 의해 보호받는 저작물입니다.
**해당 콘텐츠는 사전 동의없이 2차 가공 및 영리적인 이용을 금하고 있습니다.