賈丙宏 楊 帥 冉 姝
(1. 山東科技大學 測繪與空間信息學院, 山東 青島 266590; 2. 濟南市勘察測繪研究院, 山東 濟南 250000; 3. 山東省巨野縣委宣傳部, 山東 菏澤 274900)
風暴潮是由熱帶氣旋或溫帶氣旋等氣象條件在海洋表面的切向風應力推動海水淹沒陸地的過程[1]。我國東南沿海是世界上風暴潮災害最嚴重的地區(qū)之一,全球約三分之一的臺風來源于西北太平洋,我國東南沿海位于西北太平洋臺風的主要移動路徑上[2]。因此,一定的地理因素導致我國東南沿海長期遭受臺風風暴潮。其中,浙江省是我國損失最嚴重的省份之一。據(jù)《中國海洋公報》統(tǒng)計,2019年各類海洋災害中,最嚴重的為風暴潮災害,占總直接經(jīng)濟損失的99%。其中,最嚴重的省是浙江省,達到了87.35億元。中央財經(jīng)委第三次會議上,習近平總書記對海洋防災減災工作作出重要指示,明確提出要“提升抵御臺風、風暴潮等海洋災害能力”[3]。積極響應國家戰(zhàn)略,及時、準確地評估風暴潮災害造成的直接經(jīng)濟損失,對減災政策的制定具有指導意義,根據(jù)損失的程度和大小確定災后補償和重建的力度,能為災后的救助工作提供強有力的理論依據(jù)和數(shù)據(jù)支持。
近年來,風暴潮災害損失評估越來越受到重視,相關的科學研究也越來越多,投入產(chǎn)出模型、灰色模型(Gray Model,GM)[4]以及神經(jīng)網(wǎng)絡等方法被廣泛利用。但這些評估方法精度較差,有待優(yōu)化,并且結構單一,一個模型只能反映整個風暴潮系統(tǒng)特征的部分信息,組合模型的研究較少[1]。鑒于此,本文提出了基于麻雀搜索算法優(yōu)化的SVR和GRNN組合模型,對風暴潮災害造成的直接經(jīng)濟損失進行評估。
本文選取1990—2020年浙江省記錄完整的29個風暴潮歷史災情數(shù)據(jù)作為數(shù)據(jù)集。風暴潮災害資料主要統(tǒng)計于《中國海洋災害公報》[5]、《中國風暴潮災害史料集》[6]、國家減災中心統(tǒng)計數(shù)據(jù)和浙江省統(tǒng)計年鑒[7]。
本文充分考慮風暴潮災害的形成機理、災害系統(tǒng)理論和風險管理理論,從致災因素、孕災背景、承災體脆弱性和防潮減災能力4個方面選取指標建立風暴潮災害損失評估指標體系,如圖1所示。
圖1 風暴潮災害損失評估指標體系
1.2.1致災因素
風暴潮災害是由嚴重大氣擾動引起的海水異常升降淹沒陸地的現(xiàn)象[1],最大增水量和潮位變化是最直接的標志。于是,選取相關性較強的中心最大風速Z1、登陸中心氣壓Z2、最大風暴增水Z3、最大超警戒潮位Z4作為致災因子。
1.2.2孕災背景
受災地區(qū)的地形地貌等因素與風暴潮造成的損失有較強的相關性,并且人口密度等指標也與損失程度息息相關。根據(jù)指標的可量化性,選擇了農(nóng)業(yè)產(chǎn)值Z5、漁業(yè)產(chǎn)值Z6以及人口密度Z7指標。
1.2.3承災體脆弱性
該類指標反映了受災體的抗損失能力。在風暴潮災害的承災體中,受影響的農(nóng)田、人口以及海洋工程的破壞是比較直觀的。因此,本文以農(nóng)田受災面積Z8、受災人口Z9、房屋倒塌Z10、水產(chǎn)養(yǎng)殖受災面積Z11、防護工程損毀Z12以及船只損毀Z13作為評估指標。
1.2.4防潮減災能力
以往的研究中經(jīng)常忽視防災減災這一維度的指標,實際上,近年來國家很重視風暴潮的防御以及防護工程的建設。防災能力可以減少經(jīng)濟損失,幫助災后的生產(chǎn)恢復。鑒于這一維度的覆蓋面極廣,選取每千人配比床位數(shù)Z14、醫(yī)藥衛(wèi)生單位數(shù)Z15、人均國內(nèi)生產(chǎn)總值(Gross Domestic Product,GDP)Z16、人均儲蓄存款Z17、城鎮(zhèn)人均可支配收入Z18、農(nóng)村人均可支配收入Z19以及財政總收入Z20作為指標因子。
從4個維度選取的20個指標因子間存在相關性,易出現(xiàn)信息冗余,需要進行科學篩選。本文利用熵權法[8]對指標因子進行處理,熵權法是根據(jù)各因子的變異程度,計算出熵值,確定各個指標間的離散程度。具體步驟如下:
(1)通過歸一化處理,消除掉單位不統(tǒng)計問題,并使得不同量級的指標亦能進行衡量。
(1)
式中,xij為第i個樣本的第j個指標的原始數(shù)值;yij為第i個樣本的第j個指標標準化后的數(shù)值(i=1,2,…,n,j=1,2,…,m)。
(2)計算第i樣本在第j項指標中的占比
(2)
(3)計算熵值
(3)
(4)計算信息熵冗余度
(4)
(5)計算權重值并排序
(5)
根據(jù)以上步驟,將計算得到的各指標權重值由大到小進行排序,如表1所示。從中篩選出權重值累計貢獻率85%的指標,最終將{Z4,Z5,Z6,Z8,Z9,Z11,…,Z20}作為評估模型的指標輸入量,在表1中用方框標出。
表1 指標權重值排序結果
支持向量機(Support Vector Machine,SVM)是基于統(tǒng)計學習理論構建的一種新型機器學習方法,根據(jù)應用方面不同分為:支持向量分類(Support Vector Classification,SVC)和支持向量回歸(Support Vector Regression,SVR)?;诮徊骝炞C(Vapnik-Chervonenkis,VC)維數(shù)理論和統(tǒng)計學習理論中的結構風險最小化原理,支持向量機最終轉化為二次優(yōu)化問題[9]。SVR的優(yōu)點是用于小樣本預測問題具有較好的效果,本文利用支持向量機解決回歸問題,其基本思想是尋找某個最優(yōu)分類面使得樣本距離該分類面的誤差最小[10],如圖2所示。原理是將原始空間樣本數(shù)據(jù)投影到高維特征空間中,核函數(shù)進行非線性轉換和映射。核函數(shù)選擇徑向基(Radial Basis Function,RBF)核函數(shù):
圖2 SVR基本思想示意圖
(6)
式中,x表示輸入空間的樣本;xi表示第i個樣本;σ為均方差,RBF核函數(shù)能夠通過調(diào)節(jié)σ值調(diào)整核函數(shù),具有較高的靈活性。
圖2中,ε表示能夠容忍的模型輸出值與真實值的最大偏差;δ為偏差絕對值大于ε時產(chǎn)生的損失。
2.1.2GRNN
神經(jīng)網(wǎng)絡具有強大的非線性擬合能力,廣義回歸神經(jīng)網(wǎng)絡(Generalized Regression Neural Network,GRNN)[11]是由Specht教授于1991年提出基于非線性回歸理論的人工神經(jīng)網(wǎng)絡模型,具有良好的非線性逼近性能,一般由4層網(wǎng)絡結構組成,分別為輸入層、模式層、求和層和輸出層,如圖3所示。圖3中,GRNN結構的模式層和輸出層用不同的樣式符號進行區(qū)分。GRNN的優(yōu)勢在于其方便的網(wǎng)絡參數(shù)設置功能,只需調(diào)節(jié)一個平滑參數(shù)Spread即可建立預測模型,增加人為可控性。Spread的大小直接影響了整個網(wǎng)絡模型的評估性能,Spread越大,函數(shù)逼近越平滑;Spread越小,函數(shù)擬合性能越好?;跀M合能力以及樣本數(shù)量的考慮,本文采用四折交叉驗證的方法來確定最佳Spread值。
圖3 GRNN結構示意圖
神經(jīng)網(wǎng)絡算法通過構建更廣泛、更復雜的學習網(wǎng)絡來擬合多維變量之間的復雜非線性關系,可以提高損失評估的精度。然而,樣本數(shù)據(jù)少,收斂速度慢等問題也造成了風暴潮災害研究效率和精度上的障礙。研究表明,采用優(yōu)化算法對初始參數(shù)進行優(yōu)化后再對網(wǎng)絡進行訓練能在很大程度上提升網(wǎng)絡性能,避免網(wǎng)絡擬合缺陷[12]。
SSA[13]是基于麻雀的群體智慧、覓食行為以及反獵食行為建立的群搜索算法。其生物原理為:麻雀群為尋找食物分為發(fā)現(xiàn)者與加入者兩類,發(fā)現(xiàn)者負責標記食物方向,加入者追隨發(fā)現(xiàn)者的食物信號,一旦麻雀中的警惕者覺察到危險,會立即變化位置。依據(jù)這一原理,麻雀能夠獲取食物并躲避攻擊。
SVR進行建模時,懲罰參數(shù)(C)與核參數(shù)(g)對模型的性能有著重要的影響。利用麻雀搜索算法對該參數(shù)進行尋優(yōu)計算,可以提高SVR的網(wǎng)絡性能,減少評估誤差。具體優(yōu)化流程如圖4所示。
圖4 SSA-SVR評估模型流程圖
2.3.2SSA-GRNN
根據(jù)GRNN網(wǎng)絡模型的原理,只需要調(diào)節(jié)一個平滑參數(shù)Spread就可以影響整個網(wǎng)絡的性能。本文利用麻雀搜索算法主要對GRNN的Spread參數(shù)進行優(yōu)化,設計適應度函數(shù)。優(yōu)化評估模型結構如圖5所示。
圖5 SSA-GRNN評估模型流程圖
(7)
式中,n為風暴潮樣本的個數(shù);m為評估模型的個數(shù);eij為第i個評估模型中第j個樣本的誤差值;∑wi=1,wi≥0。
本文收集整理了浙江省記錄完整的29個風暴潮災害樣本,依次利用其中的28個樣本訓練預測剩余的一個樣本的直接經(jīng)濟損失值,以此來提高小樣本評估測試的說服力。15個篩選指標作為輸入因子,直接經(jīng)濟損失為輸出因子。以MATLAB 2018b為平臺進行實驗,決定系數(shù)R2、均方根誤差(Root Mean Square Error,RMSE)以及希爾不等系數(shù)Theil IC檢驗評估模型的性能,公式如下:
鑒于文本樣本數(shù)量29個,輸入因子維度為15,模型搜索過程不太復雜,麻雀搜索算法的初始規(guī)模設置為30、最大迭代次數(shù)30,其他設置如下:發(fā)現(xiàn)者的數(shù)量占比0.7、感應危險的麻雀數(shù)量占比0.2、安全值為0.6。實驗結果如下:SSA-SVR模型R2值為0.847 3,擬合結果如圖6所示;SSA-GRNN模型R2值為0.882 8,擬合結果如圖7所示。
圖6 SSA-SVR模型擬合圖
圖7 SSA-GRNN模型擬合圖
對比圖6和圖7可以看出,SSA-SVR中第11和28號樣本的直接經(jīng)濟損失評估出現(xiàn)較大的偏差,SSA-GRNN模型的評估穩(wěn)定性要優(yōu)于SSA-SVR,但SSA-SVR在其他點的精度上要優(yōu)于SSA-GRNN。于是可以根據(jù)優(yōu)勢互補將兩個模型建立組合評估。
利用最小二乘法將SSA-SVR與SSA-GRNN模型進行最優(yōu)加權組合,計算所得權重系數(shù)w1、w2分別為0.39、0.61,則組合評估模型的表達式可以寫作:
(11)
然后將組合模型進行實驗擬合,R2值為0.919 0,擬合結果如圖8所示。并利用ERMS、CI指標進行精度對比如表2所示。
圖8 組合評估模型擬合圖
表2 不同模型精度對比
對比單一模型與組合模型的擬合圖以及精度評價指標,可以看出,經(jīng)過最優(yōu)組合后的評估模型在精度上有所提高,同時也證明組合評估模型在風暴潮災害損失評估中的適用性。
為了更好地評估風暴潮災害,本文從致災因素、孕災背景、承災體脆弱性以及防潮減災能力4個維度建立全面系統(tǒng)的風暴潮災害損失評估指標體系,使用熵權法來進行指標篩選預處理,篩選出涵蓋信息多、權重高、相關性大的10個指標。利用麻雀搜索算法對SVR和GRNN兩種評估模型進行優(yōu)化改進,并將優(yōu)化后的模型基于最小二乘法建立最優(yōu)加權組合,將組合評估模型與單一模型進行了實驗對比,結果顯示:SSA-SVR、SSA-GRNN、組合評估模型的R2值分別為0.847 3、0.882 8、0.919 0;ERMS分別為6.461 3、5.660 4、4.990 2;CI分別為0.139 8、0.127 4、0.111 2。表明組合模型可以有效地從多個模型中收集有用的信息。因此,其評估精度、評估穩(wěn)定性和對動態(tài)系統(tǒng)變化的適應能力遠高于單一模型。
風暴潮是非常嚴重的海洋災害,危機人民的生命和財產(chǎn)安全。因此,全面研究風暴潮對盡可能減少災害損失具有重要意義,然而,有限的歷史災情數(shù)據(jù)可能對風暴潮災害評估提出了挑戰(zhàn)。未來,采用新的評估指標(例如登陸城市的地形要素等),利用新的分析工具(例如地理信息系統(tǒng)、遙感等)可能會在這項研究中發(fā)揮重要作用。