賈家超,胡浩,趙相斌,蔣先榮,劉振男
(貴州理工學(xué)院 土木工程學(xué)院,貴州 貴陽 550003)
干旱問題一直受到世界各國及組織的高度關(guān)注,由于其成災(zāi)原因復(fù)雜多變且歷時較長,進而對社會經(jīng)濟造成了嚴重的危害。 因此,如何有效的對干旱進行預(yù)測顯得格外重要,國內(nèi)外學(xué)者針對干旱預(yù)測進行了大量的研究,并取得了豐碩的成果。 灰色系統(tǒng)GM(1,1)模型被成功應(yīng)用到短期干旱預(yù)測當中,并取得了良好的結(jié)果[1];吳晶等[2]將森林隨機模型(Random Forest,RF)應(yīng)用于淮河流域的干旱預(yù)測當中,結(jié)果的準確率達到73 %;劉洪蘭等[3]將人工神經(jīng)神經(jīng)網(wǎng)絡(luò)模型(Artificial Neural Network,ANN)應(yīng)用于河西走廊伏旱預(yù)測當中,準確率高達84.6 %;白致威等[4]應(yīng)用ARIMA 模型對云南的干旱進行了預(yù)測,結(jié)果表明云南干旱在未來一段時間內(nèi)仍將持續(xù);林潔等[5]基于馬爾科夫鏈模型對湖北省的干旱進行了預(yù)測,證實了馬爾科夫鏈模型在干旱預(yù)測方面具備一定的預(yù)測能力;遲道才等[6]應(yīng)用支持向量機對遼寧省的干旱進行了預(yù)測,結(jié)果表明該模型能夠成功應(yīng)用于干旱預(yù)測,同時能為決策部門提供有力的技術(shù)支撐;Bacanli 等[7]應(yīng)用了自適應(yīng)模糊推理系統(tǒng)(ANFIS)分別對土耳其的干旱進行了預(yù)測,結(jié)果表明ANFIS 在預(yù)測精度上由于ANN;Mishra 等[8]應(yīng)用隨機過程模型對干旱進行了預(yù)測;Deo 等[9]應(yīng)用極限學(xué)習(xí)機對澳大利亞的干旱進行了預(yù)測,并且取得了較好的效果。 回聲狀態(tài)網(wǎng)絡(luò)作為一種新型的動態(tài)神經(jīng)網(wǎng)絡(luò),因為其隱含層較傳統(tǒng)的動態(tài)神經(jīng)網(wǎng)絡(luò)有所不同,其采用儲備池代替?zhèn)鹘y(tǒng)的隱含層結(jié)構(gòu),具有更明顯的非線性特征,從而被成功應(yīng)用于半自磨機功率[10]、短期風(fēng)速[11]、網(wǎng)絡(luò)流量[12]、短期股價[13]及光伏功率[14]預(yù)測當中,而在干旱預(yù)測方面還鮮有嘗試,因此,本文選用標準化降水指數(shù)(Standardized precipitation index,SPI)作為干旱預(yù)測指數(shù),同時應(yīng)用回聲狀態(tài)網(wǎng)絡(luò)對貴州省貴陽市的干旱進行預(yù)測,以便驗證回聲狀態(tài)網(wǎng)絡(luò)在干旱預(yù)測方面的適用性,為當?shù)氐目购禍p災(zāi)工作提供參考,進一步豐富干旱預(yù)測的研究成果。
回聲狀態(tài)網(wǎng)絡(luò)(Echo State Network,ESN)是由Jaeger 于2001 年提出的一種新型動態(tài)神經(jīng)網(wǎng)絡(luò)算法[15]。 ESN 的網(wǎng)絡(luò)結(jié)構(gòu)與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)相同,均由三層結(jié)構(gòu)組成(如圖1 所示),不同的是ESN 采用儲備池(dynamic reservoir,DR)代替了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的隱含層,即輸入層、儲備池以及輸出層。 顯然,ESN 的儲備池的作用等同于傳統(tǒng)網(wǎng)絡(luò)的隱含層ESN 的儲備池是由大量的稀疏矩陣構(gòu)成,具體作用可以歸納為以下兩點:(1)可以將輸入變量進行高維非線性擴展處理;(2)可以對輸入變量進行短暫記憶。
圖1 ESN 網(wǎng)絡(luò)結(jié)構(gòu)圖
假 設(shè){xi}(i= 1,2,…,K) 為 輸 入 變 量,{uj}(j=1,2,…,N) 為 儲 備 池 內(nèi) 的 神 經(jīng) 元,{yk}(k=1,2,…,L) 為輸出變量。 儲備池內(nèi)部是由神經(jīng)元構(gòu)成的循環(huán)網(wǎng)絡(luò)結(jié)構(gòu),其中,神經(jīng)元之間的連接權(quán)值矩陣W采用稀疏矩陣的形式,為了使儲備池具有短暫記憶能力,該稀疏矩陣的連接度在5 %到10 %,譜半徑一般不大于1。 ESN 的學(xué)習(xí)步驟可以總結(jié)如下:
(I)儲備池形成記憶信息階段。 訓(xùn)練集通過輸入權(quán)值Win導(dǎo)入到儲備池中,使儲備池形成記憶信息。 記憶信息形成階段公式如下:
其中,f與fout分布為儲備池內(nèi)部神經(jīng)元與輸出層神經(jīng)元的激活函數(shù)。
(II)計算輸出權(quán)值矩陣階段。 通過應(yīng)用最小誤差計算輸出權(quán)值Wout。 輸出權(quán)值計算公式如下:
其中,M是輸入變量構(gòu)成的矩陣,而T是輸出變量構(gòu)成的矩陣。
綜上可知,ESN 的預(yù)測效果與儲備池的關(guān)系密切,而儲備池的優(yōu)劣取決于以下4 個參數(shù)。
1)為了保證網(wǎng)絡(luò)的穩(wěn)定性,儲備池內(nèi)的連接權(quán)譜半徑SR(記為λmax),其值要求小于1。
2)儲備池的規(guī)模N,即儲備池內(nèi)神經(jīng)元的個數(shù)。 該參數(shù)對于網(wǎng)絡(luò)性能影響異常敏感,如何選取適當?shù)闹等允且粋€有待解決的問題。
3)輸入單元尺度IS,該參數(shù)主要是對輸入變量進行一個縮放處理。
4)稀疏程度SD,由于儲備池內(nèi)部的神經(jīng)元連接是稀疏的,因此,SD 反映的是相連神經(jīng)元與全部神經(jīng)元的比值,SD 越大,該模型的非線性逼近能力越強,運算也就越復(fù)雜。
本文的研究區(qū)為貴州省貴陽市,原因如下:一是因為近年來貴州省的干旱發(fā)生頻繁、損失嚴重,特別是2010 年以來,貴州省發(fā)生了歷史罕見的大旱,對當?shù)厣鐣?jīng)濟造成了巨大損失;二是經(jīng)查閱文獻發(fā)現(xiàn),貴州省干旱預(yù)測研究基礎(chǔ)薄弱、成果較少,對省會城市貴陽的干旱進行預(yù)測研究具有一定的代表性。 為了計算貴陽市的干旱指數(shù)SPI,本文選用中國氣象數(shù)據(jù)網(wǎng)中1971 年至2016 年貴陽市的逐月降水數(shù)據(jù)。
模型預(yù)測的精度不但與模型自身結(jié)構(gòu)參數(shù)有關(guān),還取決于模型預(yù)測因子選取是否合理。 貴州省的干旱主要為春旱和秋旱,春旱發(fā)生在3 月份至5 月份,而秋旱則發(fā)生在9 月份至11 月份,因為春秋兩季的歷時均為3 個月,因此,累積降水3 個月的SPI 指數(shù)能夠較好的反映貴州省貴陽市的干旱情況,本文選用SPI-3 描述研究區(qū)域的干旱情況,其中,SPI-3 代表該時長的SPI 指數(shù)。由于貴州省干旱物理成因關(guān)系復(fù)雜,目前研究還不夠深入,因此本文借鑒文獻[7]的預(yù)測因子選取方法,利用自相關(guān)性與偏相關(guān)性對SPI 進行分析(如圖2、3),進而確定模型的預(yù)測因子。
圖2 SPI-3 自相關(guān)圖
圖3 SPI-3 偏相關(guān)圖
由圖2 與圖3 可知,SPI-3 的值與前期1、2、5、6 月的SPI-3 的值關(guān)系密切,因此,模型預(yù)測因子選用SPI-3(t-1)、SPI-3(t-2)、SPI-3(t-5)與SPI-3(t-6)。 據(jù)此,建立了以下3 個模型,如表1所示。
表1 模型結(jié)構(gòu)表
本文將處理過的數(shù)據(jù)集分為兩部分,訓(xùn)練集選擇1971 年至2011 年,測試集選擇2012 年至2016 年。 同時,選用均方根誤差(Root Mean Squared Error,RMSE)、效能系數(shù)(Efficiency,E)及相關(guān)系數(shù)(Correlation coefficient,CORR)對預(yù)測結(jié)果進行評價。 RMSE 越接近于0,同時E 與CORR 越接近于1,代表模型的精度越高。 具體公式如下:
其中,xi,yi分別表示實測值與預(yù)測值。
根據(jù)ESN 的基本原理,借助MATLAB 軟件對其編程。 模型預(yù)測的關(guān)鍵還在于模型參數(shù)的選取,而ESN 的關(guān)鍵參數(shù)是儲備池的規(guī)模N,該參數(shù)的最佳規(guī)模個數(shù)是通過反復(fù)實驗所得(如表2),為了清晰的反映實驗的過程,表3 給出一部分M3 不同儲備池規(guī)模的預(yù)測性能結(jié)果。 其他參數(shù)設(shè)置如下:因為樣本總數(shù)量為550,訓(xùn)練集樣本數(shù)量為490,測試集樣本數(shù)量為60,故初始化儲備池的樣本數(shù)量設(shè)置為150,SD 為10%,W 譜半徑為0.8,IS 為0.3,激勵函數(shù)均選取‘tanh’。
表2 儲備池最優(yōu)規(guī)模參數(shù)表
表3 模型3 不同儲備池規(guī)模預(yù)測性能對比表
為了比較ESN 在干旱預(yù)測方面的性能,本文同時采用BP 神經(jīng)網(wǎng)絡(luò)對上述模型進行了預(yù)測,其中BP 神經(jīng)網(wǎng)絡(luò)的參數(shù)設(shè)置如下:隱含層節(jié)點數(shù)的設(shè)置借鑒經(jīng)驗公式l=n+m+a,其中,n為輸入層神經(jīng)元個數(shù),m為輸出層神經(jīng)元個數(shù),a為[ 1,10]之間的常數(shù),故3 個模型的隱含層節(jié)點數(shù)均設(shè)置為23;迭代次數(shù)設(shè)置為3 000;學(xué) 習(xí) 率 設(shè) 置 為0. 01, 激 勵 函 數(shù) 選 取‘tansig’。 表4 分別給出了ESN 與BP 神經(jīng)網(wǎng)絡(luò)對3 個模型的預(yù)測結(jié)果。 通過比較模型性能評價指標RMSE、E 和CORR 可知,ESN 對研究區(qū)干旱的預(yù)測性能均高于BP 神經(jīng)網(wǎng)絡(luò)。 而從運行時間來看,由于ESN 儲備池內(nèi)部調(diào)整可以簡化為回歸計算,因此運行時間較BP 神經(jīng)網(wǎng)絡(luò)大幅度減少。 單從ESN 預(yù)測的性能而言,RMSE的值從小到大排序為模M3、M2 和M1;E 的值從大到小的排序為M3、M2 和M1;CORR 的值從大到小的排序為M3、M1 和M2。 綜合三個指標來看,預(yù)測精度最高的是M3,其次是M2,最后是M1。 原因在于M3 的輸入因子有4 個,M2有3 個,而M1 只有2 個,據(jù)此可知,ESN 預(yù)測的精度與模型輸入因子的個數(shù)有一定的關(guān)系,即有效的輸入因子個數(shù)越多,模型預(yù)測精度越高。為了直觀的比較ESN 應(yīng)用于3 個模型的預(yù)測精度,最佳預(yù)測結(jié)果如圖4 所示。
表4 模型預(yù)測結(jié)果
圖4 ESN 應(yīng)用于3 個模型預(yù)測對比圖
(1)采用SPI-3 對貴陽市的干旱情況進行描述,能夠合理的反映當?shù)馗珊档膶嶋H情況。
(2)通過模型性能比較指標RMSE、E 和CORR 知,ESN 應(yīng)用于研究區(qū)干旱預(yù)測的性能優(yōu)于BP 神經(jīng)網(wǎng)絡(luò),較BP 神經(jīng)網(wǎng)絡(luò)擁有更好的泛化能力,大大減少了預(yù)測運行的時間。
(3)通過比較3 個模型的預(yù)測結(jié)果知,ESN的預(yù)測性能與模型的輸入因子有關(guān),即有效的輸入因子維數(shù)越大,精度越高。
(4)研究區(qū)屬我國經(jīng)濟較為落后的省份,干旱預(yù)測相關(guān)研究成果與其他省份相比較少,應(yīng)用ESN 對研究區(qū)干旱進行預(yù)測,對當?shù)氐姆篮禍p災(zāi)工作具有一定的參考價值。