楊雪雪, 劉 強
基于KPCA-RBF模型的風暴潮災害經濟損失預測
楊雪雪, 劉 強
(中國海洋大學, 山東 青島 266100)
作為破壞性最強的海洋災害, 風暴潮災害每年都給我國沿海地區(qū)造成了巨大的經濟損失, 運用科學的方法模型合理預測風暴潮災害經濟損失對指導沿海地區(qū)的防災減災工作意義深遠。本文基于風暴潮災害的成災特點建立了風暴潮災害直接經濟損失預評估指標體系, 由于評估指標數(shù)據(jù)高度非線性, 采用核主成分分析(KPCA)對高維非線性數(shù)據(jù)進行降維優(yōu)化, 并利用徑向基函數(shù)(RBF)神經網絡對降維后的數(shù)據(jù)進行訓練, 從而實現(xiàn)對風暴潮災害直接經濟損失的預測。選取廣東省1996—2018年的32個風暴潮災害損失樣本對模型進行仿真測試, 結果表明, KPCA-RBF預測模型集成了核主成分分析和徑向基函數(shù)神經網絡的優(yōu)勢, 預測結果精度高, 學習收斂速度快, 對風暴潮災害數(shù)據(jù)序列有較好的非線性擬合能力。
風暴潮; 經濟損失預測; 核主成分分析(KPCA); RBF神經網絡
風暴潮災害是迄今為止最具破壞性的海洋災害, 世界上大多數(shù)重大沿海災害都是由風暴潮造成的[1-2]。在我國的海洋災害影響清單中, 風暴潮災害一直占據(jù)著主導地位, 幾乎每年都會給沿海地區(qū)造成巨大的經濟損失。為減輕風暴潮災害對沿海地區(qū)經濟社會發(fā)展的影響, 運用科學的手段提高災害損失預測的能力, 對于指導沿海地區(qū)的防災減災工作十分重要。
近年來, 國內外學者在風暴潮災害損失預測方面做了大量研究工作。Wood等[3]利用巨災損失模型對英格蘭東部沿海平原的潛在風暴潮洪水事件進行了概率量化, 根據(jù)洪水深度和洪水流速與財產損失量之間的脆弱性函數(shù)來預測風暴潮洪水損失; Jin等[4]提出了一種經濟計量模型組方法來精化風暴潮損失的評估, 并利用支持向量機模型驗證了模型組方程能較詳細地反映風暴潮災害與其他相關變量的關系; Yang等[5-6]采用擴展卡爾曼濾波和極限理論來預測風暴潮災害經濟損失和傷亡人口; 潘艷艷等[7]基于時間序列預測法, 運用傅里葉級數(shù)擴展模型模擬了風暴潮災害直接經濟損失的時間路徑; 殷克東等[8]以近年來東南沿海風暴潮災害損失的歷史數(shù)據(jù)為基礎, 利用主成分分析法對樣本風暴潮進行了聚類分析并證明了其在風暴潮災害損失評估中的有效性, 上述研究為科學預測風暴潮災害損失提供了理論指導。由于風暴潮災害損失預測是較復雜的系統(tǒng)[9-10], 為提高預測精度并豐富現(xiàn)有風暴潮災害損失預測方法, 本文采用核主成分分析對風暴潮災害數(shù)據(jù)進行降維優(yōu)化, 在此基礎上, 利用徑向基函數(shù)神經網絡對優(yōu)化后的數(shù)據(jù)進行訓練, 結果表明該方法具有較好的非線性擬合能力, 可實現(xiàn)對風暴潮災害直接經濟損失的預測。
本文以廣東省風暴潮災害為研究對象, 收集了廣東省1996—2018年間記錄相對完整的32個風暴潮災害的相關數(shù)據(jù)進行分析研究, 數(shù)據(jù)主要來源于《中國海洋災害公報》[11]《廣東省海洋災害公報》[12]《廣東統(tǒng)計年鑒》[13]等。
廣東省位于我國南部沿海, 是我國受風暴潮影響最嚴重的省份之一。由于廣東沿海地區(qū)人口稠密、經濟發(fā)達, 臺風風暴潮每年造成的直接經濟損失十分巨大[14]。近10 a來, 全國因風暴潮災害造成的直接經濟損失中, 廣東省累計占比接近50%, 如圖1所示。隨著海洋經濟的快速發(fā)展, 廣東沿海地區(qū)的風暴潮災害風險日益突出, 防災減災形勢也愈發(fā)嚴峻, 因此, 采取科學的手段對風暴潮災害損失進行合理預測對廣東省經濟社會的可持續(xù)發(fā)展具有重要意義。
圖1 風暴潮災害直接經濟損失值
為了對風暴潮災害直接經濟損失進行科學準確的預測, 我們需要建立相對完善的評估指標體系[9-10]。風暴潮災害損失的大小取決于自身的危險性程度以及當?shù)氐慕洕鐣l(fā)展狀況[15], 本文基于自然災害風險分析理論, 結合風暴潮的成災特點以及指標數(shù)據(jù)的易取性和全面性, 建立了風暴潮災害直接經濟損失評估指標體系, 包括致災因子危險性、承載體易損性、孕災環(huán)境三個方面, 如圖2所示。
(1) 致災因子危險性。風暴潮的致災能力主要體現(xiàn)在臺風引起的風暴增水方面, 臺風強度越大, 中心氣壓越低, 則風暴增水越大, 造成的損失往往越嚴重[15]。本文選取臺風登陸時的最大風速、中心氣壓、最大增水和超警戒潮位4個指標來描述風暴潮致災因子危險性。
(2) 承載體易損性。承災體是風暴潮災害的直接作用物, 主要包括風暴潮過境地域的社會經濟因素, 如人口、農業(yè)、堤防設施等。風暴潮災害承載體的易損性可用致災因子對承載體造成的可能損失大小表示, 本文選取受災人口、房屋損毀、農業(yè)受災面積、堤防損毀等6個指標來反映承載體的易損性。
(3)孕災環(huán)境。這里主要指當?shù)氐慕洕鐣l(fā)展狀況及應災水平。本文從經濟社會發(fā)展現(xiàn)狀、社會防災能力、監(jiān)測預警能力[15-16]等多個方面綜合選取了人口密度、農業(yè)種植面積、人均GDP、地方財政收入、醫(yī)療衛(wèi)生機構數(shù)、海洋環(huán)境監(jiān)測站個數(shù)等9個指標作為孕災環(huán)境影響因子。
圖2 風暴潮災害直接經濟損失評估指標體系
核主成分分析(kernel principle component analysis, KPCA)是Schokopf 等[17]提出的一種將核函數(shù)引入到主成分分析(principle component analysis, PCA)的方法。PCA是一種常用的特征提取和降維的線性方法, 在實際處理數(shù)據(jù)中, 由于數(shù)據(jù)之間存在復雜的非線性關系, 使得它難以準確獲得數(shù)據(jù)的高階特征, 處理高維非線性數(shù)據(jù)的能力有限。由于風暴潮災害直接經濟損失評估指標數(shù)據(jù)非線性程度高且指標間存在信息重疊, 為提高運算效率, 本文首先利用KPCA對原始數(shù)據(jù)進行降維處理。KPCA實現(xiàn)了對PCA的改進, 它可對輸入變量進行非線性特征提取, 提取速度快且能夠充分保留所有輸入變量的非線性信息[18]。
高維空間中的協(xié)方差矩陣可表示為:
對上述協(xié)方差矩陣進行特征矢量分析, 設其特征值為, 特征向量為, 則
.(3)
定義×維的核矩陣:
將式(6)代入式(5)并將結果寫成矩陣形式:
對式(7)進行求解可得高維空間中的特征值及特征向量, 原始輸入樣本在特征向量1方向的投影為:
徑向基函數(shù)(radial basis function, RBF)神經網絡是一種高效的神經網絡形式, 它具有良好的非線性函數(shù)擬合和泛化能力, 而且結構簡單、學習收斂速度快, 可以保證全局收斂[19], 因此本文采用徑向基函數(shù)神經網絡建立風暴潮災害直接經濟損失預測模型。RBF網絡結構如圖3所示, 其中隱含層節(jié)點的激活函數(shù)采用徑向基函數(shù)對輸入變量進行處理, 再線性映射到輸出層。
圖3 RBF神經網絡結構
其中,為隱含層節(jié)點數(shù),為高斯徑向基函數(shù), 則h可表示為:
式中,= [1,2, …, c]T為隱含層節(jié)點的中心參數(shù),= [1,2, …, b]T為徑向基函數(shù)的寬度參數(shù),= [1,2, …, w]T為隱含層到輸出層的網絡權值參數(shù), 則時刻RBF網絡的輸出可表示為:
本文模型建立的過程如下:
(1) 采用KPCA對風暴潮災害直接經濟損失評估指標數(shù)據(jù)進行降維處理, 從而減少RBF神經網絡的輸入向量數(shù)。KPCA的具體步驟如下:
(a) 對初始指標數(shù)據(jù)進行標準化處理(本文采用標準差歸一化法), 計算核矩陣;
(b) 由于本文收集的風暴潮數(shù)據(jù)是非中心化的, 需對其進行中心化處理, 中心化的核矩陣表示為:
式中,為元素全為1的維向量;
(c) 計算矩陣的特征值與特征向量;
(d) 將特征向量規(guī)范化, 即:
(e) 計算特征值1,2, …,λ的累計貢獻率1,2, …,B,根據(jù)已設定的主成分累計貢獻率, 當k≥, 則選取個主成分及對應的主分量1,2, …,α;
(f) 計算原始樣本在1,2, …,α上的投影,=*·,即為原始輸入數(shù)據(jù)經過KPCA降維后的結果。
(2) 將原始數(shù)據(jù)劃分成訓練樣本和測試樣本。
(3) 將訓練樣本作為RBF網絡輸入向量, 輸出為風暴潮災害直接經濟損失預測值, 對RBF網絡進行訓練。
(4) 將測試樣本輸入模型進行獨立樣本檢驗。
本文以MATLAB 2014b為平臺, 采用MATLAB自帶的神經網絡工具箱newrb函數(shù)[20-21]建立RBF網絡, 其語法為:
net = newrb (,, goal, spread, MN, DF)
式中,為輸入矩陣;為輸出矩陣; goal為均方誤差的目標, 取goal = 0.001; spread表示徑向基函數(shù)的擴散速度[22], 取spread = 20; MN指隱含節(jié)點的最大個數(shù), 取MN = 200; DF指兩次顯示之間所添加的神經元數(shù)目, 取DF = 1。
綜上所述, 可建立KPCA-RBF預測模型, 如圖4所示。
圖4 KPCA-RBF預測模型流程圖
本文首先將風暴潮災害直接經濟損失評估指標數(shù)據(jù)進行KPCA降維處理, 其主成分累計貢獻率如圖5所示。
圖5 KPCA主成分累計貢獻率
本文設定的主成分累計貢獻率= 90%, 由圖5可知, 前6個主成分的累計貢獻率達到了91.83%, 可以認為前6個主成分包含了全部指標的絕大部分信息, 計算原始數(shù)據(jù)在1,2, …,6上的投影, 從而得到RBF網絡的輸入向量。
對所收集的廣東省32個風暴潮災害樣本進行隨機劃分, 選取其中29個作為訓練樣本, 其余3個為測試樣本。將訓練樣本輸入RBF網絡中, 輸出值為風暴潮災害直接經濟損失預測值, 預測結果如圖6所示, 從圖中可以看出, 大部分訓練樣本的預測值逼近實際值, 模型的擬合精度較高。
圖6 KPCA-RBF神經網絡訓練集擬合結果
現(xiàn)有的BAS-BP模型[9]、SVM-BP模型[10]為科學預測風暴潮災害損失提供了方法指導, 但仍存在不足, 如: BAS-BP、SVM-BP所采用的降維方法均是通過刪除部分評估指標來實現(xiàn)降維, 無法充分保留所有指標的非線性信息; 兩者均是對BP神經網絡的改進, 較傳統(tǒng)BP神經網絡有性能方面的提高, 但BP網絡隱含層神經元個數(shù)的選取尚無理論上的指導, 而是根據(jù)經驗公式確定, 這使得網絡具有較大的冗余性, 無形中增加了學習時間。為客觀比較KPCA- RBF模型與現(xiàn)有模型的性能, 本文將KPCA-RBF與BAS-BP、SVM-BP進行對比實驗, 分別計算它們的平均相對誤差(MRE)、均方誤差(MSE)和CPU運行時間, 結果如表1所示。可以看出, 在處理相同樣本時, KPCA-RBF模型的綜合表現(xiàn)最好, 訓練時間明顯少于其他兩個模型, 學習收斂速度快, 預測精度較高。這是因為KPCA-RBF在一定程度上克服了現(xiàn)有模型的不足: KPCA可充分考慮每項評估指標包含的信息, 使得神經網絡的輸入數(shù)據(jù)比較全面準確, 而且RBF網絡的隱含層可以自動增加神經元直到滿足精度要求為止, 簡化了網絡結構, 有效提高學習收斂速度。
表1 KPCA-RBF模型與現(xiàn)有模型的性能對比
為進一步證明KPCA-RBF模型的有效性, 本文基于上述樣本劃分方法, 將風暴潮災害樣本隨機劃分成多組訓練樣本和測試樣本進行試驗。選取普通RBF網絡模型、KPCA-RBF模型以及PCA-RBF模型對各組訓練樣本進行處理, 由于三種模型的CPU運行時間均在2 s以內, 學習速度差別不大, 因此本文主要以訓練精度作為評價各模型性能優(yōu)劣的依據(jù), 分別計算每組訓練樣本在不同模型中的MRE和MSE, 結果如表2所示, 可以看出基于不同的樣本劃分情況, RBF和PCA-RBF的兩種誤差平均值均較大, PCA-RBF略優(yōu)于RBF, 而KPCA-RBF兩種誤差均最小, 對訓練樣本的擬合效果最好, 這表明KPCA-RBF在處理高維非線性數(shù)據(jù)時具有一定的優(yōu)越性, 擬合結果精度較高。
表2 不同模型性能對比
本文將上述多組測試樣本作為獨立樣本來檢驗三種模型在預測精度上的差異, 分別計算三種模型的誤差, 結果如表3所示, 從表3可以看出, 與RBF和PCA-RBF相比, KPCA-RBF的測試誤差值相對更小, 具有更好的預測效果, 這主要是KPCA-RBF模型集成了 KPCA和RBF神經網絡在處理非線性數(shù)據(jù)方面的優(yōu)勢, KPCA利用核映射對原始非線性序列進行降維, 用低維數(shù)據(jù)表示原始數(shù)據(jù)的信息, 彌補了PCA處理高維非線性數(shù)據(jù)時存在的不足, 而且RBF神經網絡可有效實現(xiàn)對非線性數(shù)據(jù)序列的擬合和預測。由此可知, KPCA- RBF模型具有較好的非線性擬合能力, 預測結果具有更高的精度, 可有效地用于風暴潮災害直接經濟損失預測。
表3 不同模型測試樣本誤差
本文基于風暴潮災害的成災特點建立了風暴潮災害直接經濟損失預評估指標體系, 提出基于KPCA-RBF網絡的風暴潮災害直接經濟損失預測模型, 利用KPCA對高度非線性的評估指標數(shù)據(jù)進行降維優(yōu)化, 降維后的數(shù)據(jù)可最大程度保留原始數(shù)據(jù)信息, 再利用RBF神經網絡輸出預測值。針對風暴潮災害數(shù)據(jù)具有很強的非線性特點, 該模型表現(xiàn)出良好的適用性, 對非線性數(shù)據(jù)序列有較好的預測效果, 為海洋災害損失預測提供了模型參考。
[1] BERZ G.Windstorm and storm surges in Europe: loss trends and possible counter-actions from the viewpoint of an international reinsurer[J].Philosophical Transactions Mathematical Physical & Engineering Sciences, 2005, 363(1831): 1431-1440.
[2] LE K T.An Analysis of the recent severe storm surge disaster events in China[J].Natural Hazards, 2000, 21(2): 215-223.
[3] WOOD R M, DRAYTON M, BERGER A, et al.Catastrophe loss modelling of storm-surge flood risk in eas-tern England[J].Philosophical Transactions of The Royal Society A Mathematical Physical and Engineering Sciences, 2005, 363(1831): 1407-1422.
[4] JIN X, SHI X, GAO J, et al.Evaluation of loss due to storm surge disasters in China based on econometric model groups[J].International Journal of Environmental Research and Public Health, 2018, 15(4): 604.
[5] YANG S, LIU X, LIU Q.A storm surge projection and disaster risk assessment model for China coastal areas[J].Natural Hazards, 2016, 84(1): 649-667.
[6] YANG S, LIU X, LIU Q, et al.A study of storm surge disasters based on extreme value distribution theory[J].Journal of Coastal Research, 2017, 33(6): 1423-1435.
[7] 潘艷艷, 王濤, 趙昕.風暴潮災害損失時間路徑模擬與預測[J].統(tǒng)計與決策, 2016, 5: 87-89.
PAN Yanyan, WANG Tao, ZHAO Xin.Time path simu--lation and prediction of storm surge disaster loss[J].Statistics & Decision, 2016, 5: 87-89.
[8] 殷克東, 王輝.風暴潮災害損失評估的主成分模型研究[J].統(tǒng)計與決策, 2010, 19: 63-64.
YIN Kedong, WANG Hui.Study on the principal component model of storm surge disaster loss assessment[J].Statistics & Decision, 2010, 19: 63-64.
[9] 王甜甜, 劉強.基于BAS-BP模型的風暴潮災害損失預測[J].海洋環(huán)境科學, 2018, 37(3): 457-463.
WANG Tiantian, LIU Qiang.The assessment of storm surge disaster loss based on BAS-BP model[J].Marine Environmental Science, 2018, 37(3): 457-463.
[10] 馮倩, 劉強.基于SVM-BP神經網絡的風暴潮災害損失預評估[J].海洋環(huán)境科學, 2017, 36(4): 615-621.
FENG Qian, LIU Qiang.Pre-assessment for the loss caused by storm surge based on the SVM-BP neural network[J].Marine Environmental Science, 2017, 36(4): 615-621.
[11] 中華人民共和國自然資源部.1996—2018年中國海洋災害公報[EB/OL].http://www.mnr.gov.cn/sj/sjfw/hy/gbgg/ zghyzhgb/.
Ministry of natural resources of the people’s Republic of China.1996-2018 China marine disaster bulletin[EB/OL].http://www.mnr.gov.cn/sj/sjfw/hy/gbgg/zghyzhgb/.
[12] 廣東省自然資源廳.2018年廣東省海洋災害公報[EB/OL].http://nr.gd.gov.cn/gdlr_notice/2/content/post_ 2644380.html.
Department of natural resources of Guangdong Provin-ce.Guangdong marine disaster bulletin in 2018[EB/OL].http://nr.gd.gov.cn/gdlr_notice/2/content/post_2644380.html.
[13] 廣東省統(tǒng)計局.廣東統(tǒng)計年鑒.http://stats.gd.gov.cn/gdtjnj/.
Guangdong provincial bureau of statistics.Guangdong statistical yearbook.http://stats.gd.gov.cn/gdtjnj/.
[14] 余東華, 吳超羽, 呂炳全, 等.廣東沿海地區(qū)風暴潮災害及其防御[J].浙江海洋學院學報(自然科學版), 2009, 28(4): 440-444.
YU Donghua, WU Chaoyu, LV Bingquan, et al.Disaster of storm surge and the countermeasures in Guangdong coastal areas[J].Journal of Zhejiang Ocean University (Natural Science), 2009, 28(4): 440-444.
[15] 趙昕, 王保頌, 鄭慧.基于RS-SVM模型的風暴潮災害損失測度[J].海洋環(huán)境科學, 2015, 34(4): 596-600.
ZHAO Xin, WANG Baosong, ZHENG Hui.The assess-ment of storm surge disaster loss based on RS-SVM mo-del[J].Marine Environmental Science, 2015, 34(4): 596- 600.
[16] 李莉, 沈瓊.風暴潮災害防災減災能力評價——以山東省沿海城市為例[J].中國漁業(yè)經濟, 2011, 6: 102- 110.
LI Li, SHEN Qiong.The evaluation of storm surge prevention and mitigation capability: case of costal cities in Shandong Province[J].Chinese Fisheries Economics, 2011, 6: 102-110.
[17] SCHOLKOPF B, SMOLA A J, MULLER K R.Non-linear component analysis as a kernel eigenvalue problem[J].Neural Confutation, 1998, 10: 1299-1319.
[18] 彭志蘭, 孫海, 高惠瑛, 等.基于KPCA和GA- LSSVR的惠州磚混建筑物震害易損性研究[J].地震工程與工程振動, 2018, 38(2): 176-183.
PENG Zhilan, SUN Hai, GAO Huiying, et al.Study on seismic damage vulnerability of Huizhou brick maso-n-ry building based on KPCA and GA-LSSVR model[J].Earthquake Engineering and Engineering Dynamics, 2018, 38(2): 176-183.
[19] 劉登峰, 王棟, 丁昊, 等.城市水災害風險等級的RBF-C評估方法[J].人民黃河, 2014, 36(1): 8-10, 14.
LIU Dengfeng, WANG Dong, DING Hao, et al.A risk assessment method based on RBF artificial neural network-Cloud model for urban water disaster[J].Yellow River, 2014, 36(1): 8-10, 14.
[20] 李德根, 劉曉亮, 宋勝偉, 等.熵權法徑向基神經網絡的截割粉塵濃度模型與預測[J].煤炭技術, 2018, 37(6): 177-179.
LI Degen, LIU Xiaoliang, SONG Shengwei, et al.Prediction and model of cutting dust concentration of radial basis neural network with entropy weight[J].Coal Technology, 2018, 37(6): 177-179.
[21] 聞新, 李新, 張興旺, 等.應用MATLAB實現(xiàn)神經網絡[M].北京: 國防工業(yè)出版社, 2015.
WEN Xin, LI Xin, ZHANG Xingwang, et al.Using MATLAB to Realize Neural Network[M].Beijing: National Defense Industry Press, 2015.
Economic loss assessment of storm-surge disasters based on the KPCA-RBF model
YANGXue-xue, LIUQiang
(Engineering College, Ocean University of China, Qingdao 266100, China)
storm surge disaster; economic loss assessment; kernel principal component analysis; RBF neural network
As the most harmful marine disaster, storm-surge disasters cause serious economic losses to the coastal areas of China every year.It is crucial to reasonably assess the economic losses because of storm-surge disasters using scientific methods to guide the disaster prevention and mitigation work in coastal areas.Herein, based on the characteristics of storm-surge disasters, theassessment index system of the direct economic loss from a storm surge disaster is established.Owing to the storm=surge disaster, data loss is highly nonlinear; this study uses the Kernel Principal Component Analysis (KPCA) for nonlinear data dimension reduction optimization and the Radial Basis Function (RBF) neural network to train the dimension-reduced data to realize the assessment of direct economic loss owing to storm-surge disasters.This study collected data of 32 storm-surge disasters from 1996 to 2018 in the Guangdong Province to test the model.Results showed that the KPCA–RBF prediction model integrates the advantages of KPCA and the RBF neural network, which has high prediction accuracy, fast learning convergence speed, and good nonlinear fitting ability for storm-surge disaster data series.
Mar.22, 2020
[The National Natural Science Foundation of China, No.41371496; The National Science and Technology Support Program, No.2013BAK05B04]
X43
A
1000-3096(2021)10-0032-08
10.11759/hykx20200322001
2020-03-22;
2020-06-27
國家自然科學基金(41371496); 國家科技支撐計劃項目(2013BAK05B04)
楊雪雪(1995—), 女, 山東濰坊人, 碩士研究生, 主要從事海洋災害風險管理研究, 電話: 17685821560, E-mail: yxlhpdr@163.com; 劉強(1961—), 通信作者, 教授, 主要從事海洋災害風險管理研究, E-mail: liuqiang@ouc.edu.cn
(本文編輯: 康亦兼)