摘 要:文章針對傳統(tǒng)時間序列模型因考慮特征維度不足而導致模型精度差和魯棒性不佳的問題,提出基于多維特征融合與循環(huán)神經(jīng)網(wǎng)絡的MF-GRU河流水位預測模型。該模型從航道水位數(shù)據(jù)的時域、頻域和經(jīng)驗模式分解等多個維度共提取了19個特征,并訓練GRU循環(huán)神經(jīng)網(wǎng)絡模型實現(xiàn)了水位的精準預測。同時,以大藤峽上下游航道水域水位數(shù)據(jù)為實驗對象,驗證了MF-GRU模型的預測精度和泛化性能,獲得了比經(jīng)典GRU模型更優(yōu)的水位預測精度。
關鍵詞:水位預測;智慧航道;循環(huán)神經(jīng)網(wǎng)絡;多維特征融合
中圖分類號:U612.2A612123
0 引言
對航道水位的精準預測,對保障航道通航安全、航道航標管理和洪水災害風險預警具有重要意義[1],也是廣西智慧航道建設完善航道測量設施和監(jiān)測感知網(wǎng)絡的重要內(nèi)容。目前,水位預測主要有水文模型法[2]、統(tǒng)計分析法[3]和人工神經(jīng)網(wǎng)絡[4]三類。循環(huán)神經(jīng)網(wǎng)絡在處理類似水位信息這種時間序列數(shù)據(jù)時具有明顯區(qū)別于其他方法的優(yōu)勢,能夠很好地揭示水位信息數(shù)據(jù)中的趨勢性、周期性和波動性等規(guī)律,通過循環(huán)神經(jīng)網(wǎng)絡構(gòu)建水位預測模型已成為當前研究熱點[5]。
因此,本文以大藤峽上下游航道水域的水位數(shù)據(jù)作為研究對象,提出了多維特征融合建模+GRU循環(huán)神經(jīng)網(wǎng)絡的水位預測模型,并通過計算機試驗驗證了該模型的有效性。
1 MF-GRU模型框架
本文提出的MF-GRU水位預測模型采用目前流行的編碼器和解碼器結(jié)構(gòu)(Encoder-Decoder)。編碼器由特征提取和PCA特征融合組成;解碼器由GRU網(wǎng)絡模型和水位預測組成,如圖1所示。特征提取模塊負責對原始水位數(shù)據(jù)進行預處理并提取相應的時域、頻域和EMD域信息;特征融合模塊利用PCA技術對多維特征進行降維和融合;GRU網(wǎng)絡以融合后的特征向量空間作為輸入,訓練獲得水位預測模型的權值參數(shù);預測模塊使用訓練好的GRU模型進行水位預測并評估模型精度和魯棒性。
2 多維特征提取與融合
2.1 特征提取
航道的水位數(shù)據(jù)屬于非平穩(wěn)隨機序列,可能同時含有趨勢性、周期性和波動性等多種特性,采用單一特征難以表征數(shù)據(jù)的變化規(guī)律,最終導致模型精度不高、魯棒性差。目前,對時間序列的特征提取方法主要有時域分析、傅里葉變化(FFT)、小波變換、經(jīng)驗模式分解(EMD)等。本文采用時域、頻域和EMD域三種技術對水位特征進行提取,并利用主成分分析(PCA)進一步提取對水位觀測值敏感度較高的多維特征,構(gòu)成用于表征水位變化規(guī)律的多維特征向量空間,實現(xiàn)多維特征的融合。
從每日監(jiān)測的水位數(shù)據(jù)中提取了共19維水位特征,詳細特征計算公式見表1。時域特征包括近五日觀測值、均值、均方根、方差和表征數(shù)據(jù)分布情況的偏度、峰度,以及表征數(shù)據(jù)波動情況的脈沖因子、峰值因子和波形因子。頻域特征通過傅里葉變化獲得水位數(shù)據(jù)的幅頻譜,并計算幅頻譜的振幅和一階主振頻率。EMD域通過對水位數(shù)據(jù)進行經(jīng)驗模式分解,獲取與水位數(shù)據(jù)特征最接近的一階模式分量,并計算該一階分量的均值、方差和極差作為EMD域的特征。
2.2 特征融合
不同維度的特征特別是同一域中可能呈現(xiàn)出很強的線性相關性,這一類特征反映的水位信息是重復的,存在特征冗余現(xiàn)象,而且將所有的特征直接輸入到模型中進行訓練必將導致模型參數(shù)的規(guī)模呈指數(shù)增長,增加計算量使模型不收斂。因此通過PCA計算特征與水位的協(xié)方差矩陣進行特征主要分量的提取,實現(xiàn)特征降維與特征融合的目的。設有n個d維特征向量,其PCA具體步驟如下:
(1)用此n個d維特征向量構(gòu)造n行d列矩陣X。
(2)對特征向量進行零均值化,即對每一行xi←xi-1d∑di=1xi,其中i∈1,2...d。
(3)計算樣本的協(xié)方差矩陣C=1nXXT。
(4)對協(xié)方差矩陣進行特征值分解。
(5)取特征值最大的前k個特征分量對應的單位向量m1、m2...mk,其中特征值個數(shù)k為超參數(shù),需要根據(jù)模型精度確定。
3 GRU水位預測模型
3.1 模型計算
GRU網(wǎng)絡模型是循環(huán)神經(jīng)網(wǎng)絡的一種變體,如圖2所示,圖2(a)為常規(guī)循環(huán)神經(jīng)網(wǎng)絡結(jié)構(gòu)圖,與其他神經(jīng)網(wǎng)絡的區(qū)別是模型的輸入包含了歷史狀態(tài)信息,隱狀態(tài)Ht∈n×h用式(1)計算,模型的輸出Ot∈n×q用式(2)計算:
Ht=(XtWxh+Ht-1Whh+bh)(1)
Ot=HtWhq+bq(2)
式中: """""Ht——t時刻的隱狀態(tài);
φ——隱狀態(tài)的激活函數(shù);
Wxh∈d×h和Whh∈h×h——權值矩陣;
bh∈1×h、bq∈1×q——偏置矩陣。
相比其他神經(jīng)網(wǎng)絡的輸入,循環(huán)神經(jīng)網(wǎng)絡多了Ht-1Whh一項。
GRU網(wǎng)絡與其他循環(huán)神經(jīng)網(wǎng)絡的不同在于隱狀態(tài)的更新,如圖2(b)所示,其由重置門Rt∈n×h和更新門Zt∈n×h構(gòu)成,計算公式見式(3):
Rt=σ(XtWxr+Ht-1Whr+br)Zt=σ(XtWxz+Ht-1Whz+bz)(3)
式中:Wxr,Wxz∈d×h和Whr,Whz∈h×h——權值矩陣;
br,bz∈1×h——偏置矩陣。
隱狀態(tài)Ht通過式(4)確定,式(4)中⊙是Hadamard積運算符。通過更新門Zt的輸出(0或1)決定Ht是采用t-1時刻的隱狀態(tài)Ht-1還是采用經(jīng)過重置門Rt重置后的候選隱狀態(tài)H~t∈n×h,候選隱狀態(tài)H~t通過式(5)計算:
Ht=Zt⊙Ht-1+(1-Zt)⊙H~t(4)
H~t=tanh(XtWxh+(Rt⊙Ht-1)Whh+bh)(5)
3.2 模型實現(xiàn)與訓練
本文利用Python的第三方深度學習庫Pytorch實現(xiàn)了所提出的MF-GRU水位預測模型。訓練樣本為大藤峽上游的運江、象州、石龍大橋、武宣、勒馬以及下游的桂平共六個水位觀測點2020—2023年間水位觀測數(shù)據(jù)。訓練集和測試集數(shù)據(jù)量的比例為4∶1,即80%的數(shù)據(jù)用于模型訓練,20%的數(shù)據(jù)用于評估模型的好壞。訓練共迭代1 000次,學習率設置為0.000 5,用均方誤差評估模型的精度,并記錄對測試集均方誤差最小的模型參數(shù)。
4 試驗及結(jié)果分析
為驗證MF-GRU水位預測模型的有效性,試驗從模型預測精度驗證,多特征融合方法效果驗證,以及與其他時間序列預測模型對比三個方面評估MF-GRU模型的有效性。試驗所采用的數(shù)據(jù)為大藤峽上下游運江、象州、石龍大橋、武宣、勒馬、桂平共六個水位觀測點2023年1~9月的水位數(shù)據(jù)。
4.1 模型預測精度驗證
利用訓練好的MF-GRU模型對大藤峽上下游運江、象州、石龍大橋、武宣、勒馬、桂平共六個水位觀測點進行水位預測,預測結(jié)果如圖3所示,水位觀測值和水位預測值僅在水位發(fā)生突變的地方存在較大誤差。此外,同一航道的不同地方,特別是水利樞紐工程上下游兩側(cè)附近,水位變化規(guī)律差異很大。但從圖3結(jié)果顯示,本文所提出的水位預測模型能夠?qū)Σ煌兓?guī)律的航道水位進行準確預測,模型泛化能力強。
4.2 多特征融合驗證及與經(jīng)典GRU對比
為驗證本文提出的多特征融合建模技術對模型預測精度的作用,與經(jīng)典GRU神經(jīng)網(wǎng)絡模型進行對比,其中經(jīng)典GRU以水位的時間序列作為輸入,僅考慮數(shù)據(jù)的時域特征。以大藤峽上游水位極差最大的石龍大橋和下游桂平為例,結(jié)果如圖4所示。由圖4可知,雖然兩種模型都能很好地反映水位的實際曲線變化趨勢,但是MF-GRU更接近實測值,說明本文提出的MF-GRU模型比經(jīng)典GRU模型具有更高的預測精度,同時也證明了多維特征融合建模更能揭示非平穩(wěn)時間序列的深層規(guī)律。
圖4 MF-GRU與經(jīng)典GRU神經(jīng)網(wǎng)絡模型對比曲線圖
5 結(jié)語
本文以大藤峽上下游共六個水位觀測點為研究對象,針對水位數(shù)據(jù)這類非平穩(wěn)時間序列,提出了多維特征融合+GRU循環(huán)神經(jīng)網(wǎng)絡的水位預測模型。從時域、頻域和EMD域中共提取了19維特征,利用PCA方法進行特征的降維和多維特征的融合,通過GRU循環(huán)神經(jīng)網(wǎng)絡訓練獲得了具有較高精度的水位預測模型。該模型將助力航道水位監(jiān)測、流量監(jiān)測、水位預警、標志拋設等航道航標工作邁向智慧航道時代。
參考文獻:
[1]倪漢杰,蔣仲廉,初秀民,等.基于DWT-LSTM的航道水位智能預測模型研究[J].中國航海,2021,44(2):97-102.
[2]李亞平,陳友媛,胡廣鑫,等.基于分布式水文模型的徒駭河河流生態(tài)需水量預測研究[J].環(huán)境科學學報,2013,33(9):2 619-2 625.
[3]何金文,孫鈞鍵,程 軍,等.三峽壩前水位過程線特征參數(shù)的標定與統(tǒng)計特性[J].長江科學院院報, 2022,39(5):54-62.
[4]紀國良,周 曼,劉 濤,等.基于循環(huán)神經(jīng)網(wǎng)絡的水庫水位預測方法[J].長江科學院院報,2022,39(3):80-85.
[5]劉亞新,樊啟祥,尚毅梓,等.基于LSTM神經(jīng)網(wǎng)絡的水電站短期水位預測方法[J].水利水電科技進展,2019,39(2):56-60,78.20240426