国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于邊界修正和二次分解的改進月降水LSTM 預測方法

2023-09-22 01:07:06閆加寧
中國農(nóng)村水利水電 2023年9期
關(guān)鍵詞:端點分量邊界

任 碩,閆加寧,羅 嘉,韓 瑩,3

(1. 南京信息工程大學自動化學院,江蘇 南京 210044; 2. 湖北省公眾氣象服務(wù)中心,湖北 武漢 430074;3. 南京信息工程大學 江蘇省大氣環(huán)境與裝備技術(shù)協(xié)同創(chuàng)新中心,江蘇 南京 210044)

0 引 言

對于極端降水事件的處理、洪水災害風險等級分析、區(qū)域水資源管理以及建立完備的防洪減災預警系統(tǒng)而言,降水預測的研究具有重要意義[1]。目前,根據(jù)現(xiàn)有資料結(jié)合數(shù)理統(tǒng)計方法的統(tǒng)計模型是降水預測的一種主要途徑,黃鶴等人[2]將統(tǒng)計模型中的馬爾可夫模型運用于原州區(qū)的降水預測,根據(jù)已有數(shù)據(jù)驗證了預測結(jié)果的有效性。由于降水受地理位置,大氣環(huán)流和地形等因素的影響,降水序列呈現(xiàn)出高度的非線性和復雜的變化趨勢,統(tǒng)計模型對其進行處理時存在一定的困難性,模型的預測精度也無法得到進一步質(zhì)的提升[3]。

隨著人工智能領(lǐng)域的飛速發(fā)展,更多研究人員將人工智能技術(shù)與機器學習的方法應(yīng)用于對連續(xù)時間的降水預測,彌補統(tǒng)計模型難以處理非線性序列的不足之處[4]?;跈C器學習的深度學習模型,采用多個不同類型的隱藏層作為訓練模型的構(gòu)建[5]。長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory Networks,LSTM)是降水預測中常用的一種深度學習模型,由于其可以有效的學習時間序列中的長期依賴關(guān)系,使得模型的預測效果得到顯著改善[6]。劉新等人[7]采用LSTM 模型對青藏高原地區(qū)的月降水量進行預測,結(jié)果顯示在不同預測步長下LSTM 模型的預測精度都優(yōu)于傳統(tǒng)模型。然而僅依靠單一預測模型容易忽略訓練樣本中的隱藏規(guī)律,因此研究人員利用信號分解算法如變分模態(tài)分解(Variational Mode Decomposition, VMD)、極點對稱 模 態(tài) 分 解(Extreme-point Symmetric Mode Decomposition,ESMD)與神經(jīng)網(wǎng)絡(luò)結(jié)合,采用分解-預測-重組的形式進行模型構(gòu)建[8]。徐冬梅等人[2]在月降水預測的研究中,融入了具有處理非線性序列優(yōu)勢的VMD算法,取得了良好的預測效果。李繼清等人[9]考慮到ESMD 算法可以自適應(yīng)地提取時間序列的不同尺度信息,利用ESMD 算法將非平穩(wěn)的徑流序列分解為幾個相對平穩(wěn)的子序列后,對各個子序列分別建模預測,重構(gòu)結(jié)果后顯示該模型提高了徑流預測的準確率,開辟了一種優(yōu)于單一預測模型的新思路。由于“端點效應(yīng)”會干擾序列的分解效果[10],影響信號分解算法提取時間序列的趨勢特性,熊濤證明了“端點效應(yīng)”對基于分解算法的混合建??蚣艿念A測性能有較大的負面影響[11]。為此,XU 等人[12]創(chuàng)新性的在序列分解時考慮了邊界修正(Boundary Correction, BC)的方法,以此減少端點效應(yīng)問題對整體預測模型的不利因素。

基于上述內(nèi)容,本文提出一種基于邊界修正模塊和二次分解模塊的LSTM 組合月降水預測模型。首先采用動態(tài)時間彎曲算法(Dynamic Time Warping, DTW)匹配相似子波后擴展原始月降水序列的左右邊界;之后選用ESMD 算法提取擴展序列的不同尺度信息,產(chǎn)生頻率依次降低的幾個模態(tài)分量以及一個趨勢分量;切割各個分量中對內(nèi)部數(shù)據(jù)“污染”最嚴重的擴展部分;接著運用VMD 算法對高頻分量進行平穩(wěn)化處理;最后基于分解的子序列分別建立LSTM 模型進行預測,將所有分量的預測結(jié)果重構(gòu)后得到最終月降水預測結(jié)果;構(gòu)建一個考慮邊界修正的ESMD-VMD-LSTM(BC)組合月降水預測模型。本文將此模型應(yīng)用于湖北省巴東縣的月降水預測,采用4 種不同的誤差評價指標來評估模型的優(yōu)劣。通過7 種模型對比分析,探究抑制“端點效應(yīng)”對采用ESMD 算法的組合模型預測性能的影響,以及分解算法對模型預測精度的提升效果。

1 方法及模型構(gòu)建

1.1 基于ESMD算法的邊界修正

ESMD 算法采用極值點對稱法來替換經(jīng)驗模態(tài)分解(Empirical Mode Decomposition ,EMD)所采用的外部包絡(luò)線擬合對稱法[13],有效緩解EMD 存在的模態(tài)混疊問題[14]。分解中的關(guān)鍵步驟是確定最佳篩選次數(shù)K0的值,詳細計算步驟見文獻[14]。

ESMD 分解序列時, 3 次樣條插值法為端點處插值擬合失去約束從而產(chǎn)生端點處漂移,并逐漸污染內(nèi)部信號數(shù)據(jù)[15]。為了抑制“端點效應(yīng)”,采用波形特征匹配延拓法對原始序列進行邊界擴展,該方法依靠搜尋與邊界處子波擁有最高相似度的內(nèi)部子波完成擴展。選定DTW 算法計算兩段不同長度序列之間的相似度,如選取兩段長度分別為m和n的序列A={α1,α2,α3,…,αm}和B={β1,β2,β3,…,βn},構(gòu)建一個m×n的空間距離矩陣Z。Z(i,j)中的元素d(αi,βi)=(αi-βi)2表示兩點的歐氏距離,之后動態(tài)規(guī)劃搜尋Z(1,1)到Z(m,n)的最短路徑,最短路徑越小,代表兩段序列的相似度越高。最短路徑S(m,n)的計算如式(1)示:

以右端邊界修正為例,步驟如下:

步驟1:PO 為原始序列,紫色子波N M O為選定的研究對象,包含極大值M和極小值N,見圖1。

圖1 邊界擴展示意圖Fig.1 Boundary extension diagram

步驟2:從PO 的左側(cè)開始,依次截取包含極大值和極小值的子波。通過DTW 算法將截取的子波分別與研究對象匹配計算相似度。選定出具有最高相似度的紫色子波N1M1O1。

步驟3:從O1點向右截取一定長度的序列(紅色實線),將截取序列延長至右邊界O點的右端(紅色虛線)。

步驟4:將邊界擴展后的序列進行ESMD 分解,根據(jù)PO 序列所占擴展序列的位置以及自身長度信息,將對應(yīng)的子序列進行切割完成邊界修正。

1.2 VMD算法

VMD 算法實質(zhì)是通過將約束變分問題轉(zhuǎn)化為非約束變分問題并求解,使原始信號分解為中心頻率不同的K個子模態(tài)[16]。約束變分問題如式(2)示:

式中:f為給定的原始信號;uk為第k個模態(tài)分量;K為序列分解數(shù)量;wk為uk的中心頻率;δ(t)為狄拉克分布;?t代表對時間變量t求偏導運算;?為卷積運算;j為虛數(shù)符號;為范數(shù)。

通過引入二次懲罰項和拉格朗日乘數(shù)轉(zhuǎn)化為非約束變分問題,如式(3)示:

式中:α為懲罰系數(shù);λ為拉格朗日乘數(shù);為兩向量的內(nèi)積計算。

得到一個非約束模型,并采用交替方向乘子法搜尋迭代計算最優(yōu){wk}、{uk}和λ的結(jié)果。迭代計算如式(4)~(6)示:

1.3 LSTM 模型

LSTM內(nèi)部結(jié)構(gòu)主要包含4個部分:輸入門、遺忘門、記憶模塊和輸出門[17],見圖2。輸入門限(it)決定了當前細胞狀態(tài)的更新程度,并且控制選擇信息的存入;遺忘門限(ft)控制過去信息的丟棄或保留;候選細胞狀態(tài)存儲之前迭代訓練中所學到的信息,并且對當前輸出的細胞狀態(tài)(Ct)產(chǎn)生影響;輸出門限(ot)控制選擇Ct中的信息輸出[18]。LSTM 的數(shù)學計算如式(7)~(12)示:

圖2 LSTM 結(jié)構(gòu)示意圖Fig.2 Diagram of the LSTM structure

式中:Wi、Wf、Wo、Wc分別為輸入單元、遺忘單元、輸出單元、候選細胞狀態(tài)對應(yīng)的權(quán)重值矩陣;bi、bf、bo、bc分別為其對應(yīng)的偏差向量;?代表向量元素逐位相乘;σ代表sigmoid 激活函數(shù);tanh 代表雙曲正切函數(shù);xt代表輸入向量;ht-1代表上一時刻的輸出。

1.4 ESMD-VMD-LSTM(BC)模型構(gòu)建

本文提出一種基于邊界修正模塊和二次分解模塊的LSTM組合預測模型,整體模型由“修正、分解、預測和重構(gòu)”4 個重要部分構(gòu)建,見圖3。步驟如下。

圖3 ESMD-VMD-LSTM(BC)組合模型框架圖Fig.3 Framework diagram of ESMD-VMD-LSTM(BC) composite model

步驟1:邊界擴展。采用波形特征匹配延拓法擴展原始月降水序列的左右邊界。

步驟2:一次分解。ESMD算法對邊界擴展后的月降水序列進行分解。

步驟3:數(shù)據(jù)切割。根據(jù)原始月降水序列所占擴展序列的位置以及自身長度信息,將對應(yīng)子序列的擴展數(shù)據(jù)切割后,得到有限個數(shù)模態(tài)分量(E1,E2,E3,…)及殘余分量(R)完成邊界修正。

步驟4:二次分解。VMD 算法對高頻分量E1進行分解,得到有限個數(shù)模態(tài)(V0,V1,…,Vk)。

步驟5:數(shù)據(jù)處理。將除E1外的各分量(E2,E3,…,R,V0,V1,…,Vk)進行歸一化處理后,分別劃分訓練數(shù)據(jù)集和測試數(shù)據(jù)集。

步驟6:訓練預測?;诟鞣至?E2,E3,…,R,V0,V1,…,Vk)分別建立LSTM 預測模型,采用滑動窗口作為模型的輸入方式,將各分量的預測結(jié)果反歸一化處理后輸出。

步驟7:重構(gòu)結(jié)果。將各分量的輸出結(jié)果重構(gòu),得到原始月降水的預測結(jié)果。

1.5 模型評價方法

為了對模型的預測效果進行全面評價,并與其余模型更好地進行量化比較。本文選取4 種不同的評價指標:均方根誤差(Root Mean Square Error,RMSE)、平均絕對誤差(Mean Absolute Error,MAE)、平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE)和納什效率系數(shù)(Nash-Sutcliffe Efficiency coefficient,NSE)。計算如式(13)~(16)示:

式中:m為采樣點數(shù)量;S(t)為t時刻實測值;為t時刻預測值;為樣本平均值。

根據(jù)《水文情報預報規(guī)范》(GB/T 22482-2008)相關(guān)規(guī)定:當0.90 ≤NSE時,預測精度等級為甲級;0.70 ≤NSE<0.90 時,預測精度等級為乙級;0.50 ≤NSE<0.70時,預測精度等級為丙級;NSE<0.50時,預測結(jié)果不可信。

2 實例分析

2.1 研究數(shù)據(jù)選取

巴東縣位于中國湖北省的西南部,身處長江三峽的中段地區(qū),東經(jīng)110°04′~110°32′,北緯30°28′~31°28′之間,屬于亞熱帶季風氣候,濕熱多雨。從表1 可以看出,巴東縣近45 年的年平均降水量在1 020~1 130 mm 之間,因此精準的月降水預測對該地區(qū)的水資源管理以及經(jīng)濟可持續(xù)發(fā)展具有重要意義。選取巴東縣1975 年1 月-2020 年10 月的逐月實測降水量作為實驗樣本點,共計550個,其逐月實測降水的連續(xù)變化曲線見圖4。

表1 巴東縣近45年的年代平均降水量 mmTab.1 Annual average precipitation in Badong County in the past 45 years

圖4 原始月降水序列Fig.4 Original monthly precipitation sequence

2.2 數(shù)據(jù)預處理

(1)邊界擴展。為了遏制“端點效應(yīng)”對內(nèi)部數(shù)據(jù)的“污染”,提升ESMD 算法的特征提取效果,采用波形特征匹配延拓法擴展原始月降水序列的左右邊界,擴展后的月降水序列S(t)見圖5,紅色曲線為擴展數(shù)據(jù)。

圖5 擴展后的月降水序列Fig.5 Extended monthly precipitation sequence

(2)ESMD 算法提取不同尺度信息。原始月降水序列的最大值和最小值相差463.3 mm,序列的變化幅度大。采用ESMD算法對擴展后的降水序列S(t)進行分解,確定最佳篩選次數(shù)K0為8,得到頻率依次減少的7 個模態(tài)分量E1~E7和一個殘余分量R,見圖6。

(3)數(shù)據(jù)切割。根據(jù)原始月降水序列所占擴展序列的位置以及自身長度信息,截去“污染”程度較高的擴展數(shù)據(jù),見圖7。

圖7 數(shù)據(jù)切割結(jié)果Fig.7 Data cutting results

從圖7可知,R為最佳自適應(yīng)全局均線,代表S(t)的整體變化趨勢:呈現(xiàn)“較快下降-緩慢下降-較快上升”的變化規(guī)律[19]。ESMD 算法充分挖掘序列的趨勢特性,較好地提取S(t)的不同尺度信息,每個模態(tài)分量都對應(yīng)其獨自的主要波動特征,為下一步的降水預測奠定基礎(chǔ)。

(4)VMD 算法處理高頻分量。VMD 模塊對高頻分量E1進行平穩(wěn)化處理,根據(jù)經(jīng)驗值將分解數(shù)量K設(shè)置成2~6,在K取不同值的情況下確保每個模態(tài)的中心頻率相差不能過小,為此本文采用中心頻率對比法[20]確定最佳分解數(shù)目為5,分解結(jié)果V0~V4見圖8。

由圖8 可知,V0~V3分量的數(shù)值近似對稱分布在零值線的上下區(qū)域,較E1擁有更強的穩(wěn)定性。即使V4分量依舊包含復雜的頻率信息,但是該分量的絕大部分數(shù)據(jù)的波動范圍較小,從而減少了此分量的預測結(jié)果對整體模型預測精度的影響[8]。VMD 分解模塊充分降低高頻分量的非平穩(wěn)性,便于之后的LSTM神經(jīng)網(wǎng)絡(luò)學習。

(5)模型設(shè)定。將分量E2~E7,R,V0~V4根據(jù)式(17)進行歸一化處理,分別按照9∶1 劃分訓練集和測試集?;贚STM分別建立各分量的預測模型,其中LSTM 的優(yōu)化函數(shù)使用Adma函數(shù),損失函數(shù)的目標為均方誤差,激活函數(shù)使用tanh 函數(shù),每個模型采用兩層LSTM,為了防止過擬合,將每層LSTM 后添加取值為0.2 的Dropout 層。根據(jù)多次實驗確定LSTM 的超參數(shù),其中時間步長為6,批量大小為12,隱藏單元數(shù)為64,學習率為0.004,訓練次數(shù)為100。采用滑動窗口作為模型的輸入方式,本文選用固定大小窗口模式,當窗口輸入的數(shù)據(jù)進入LSTM 模型完成預測后,通過實測值的移入和窗口數(shù)據(jù)的移出完成滑動窗口的更新。多次實驗對比,最終設(shè)定滑動窗口的大小為6,模型第一次訓練 時將訓練集前6 個數(shù)據(jù)點xt-5,xt-4,xt-3,xt-2,xt-1,xt作為輸入,預測t+ 1時刻的數(shù)據(jù)點xt+1,通過滑動窗口的更新完成對模型的多次訓練。將預測結(jié)果反歸一化處理后重構(gòu)輸出,得到最終的月降水預測結(jié)果。

式中:x?為歸一化處理后的數(shù)值;x為原始數(shù)值;xmin和xmax為序列中最小數(shù)值和最大數(shù)值。

2.3 結(jié)果分析

選取單一SVM 和LSTM 模型、未進行邊界修正的ESMDLSTM、VMD-LSTM 和ESMD-VMD-LSTM 模型、以及采用邊界修正的ESMD-LSTM(BC)模型與本文提出的ESMD-VMDLSTM(BC)模型對比。各模型預測結(jié)果見表2。

表2 各模型預測結(jié)果Tab.2 Predicted results of each model

由表2 信息可知:在7 種模型中,本文提出的ESMD-VMDLSTM(BC)模型的預測結(jié)果與實測數(shù)據(jù)相差最少,預測精度最優(yōu),其中RMSE和MAE分別為15.515 6 和12.405 1,MAPE為23.987 5%,且NSE達到了0.960 0,可信度達到甲級;單一SVM和LSTM 模型的預測結(jié)果相近且較差,其中SVM 模型的RMSE和MAE分別為67.510 4 和56.253 6,MAPE為77.344 5%,NSE低至0.243 3,預測結(jié)果不可信,其原因是由于訓練集的數(shù)據(jù)量較少,僅依靠單一模型無法處理非線性的月降水序列;融入信號分解算法的ESMD-LSTM、VMD-LSTM 和ESMD-LSTM(BC)模型,將非平穩(wěn)的降水序列趨于平穩(wěn)化,減少復雜變化趨勢的月降水序列直接饋送至模型造成的誤差影響,預測精度較單一SVM 和LSTM 模型得到一定的提升;對比ESMD-LSTM 和VMDLSTM 模型的預測結(jié)果可知,VMD 算法較ESMD 算法在月降水序列分解中具有更優(yōu)的分解性能;ESMD-LSTM(BC)和ESMDVMD-LSTM(BC)模型的預測精度均略微優(yōu)于其各自未考慮邊界修正的模型,表明“端點效應(yīng)”會影響月降水序列的預測結(jié)果;觀察發(fā)現(xiàn)ESMD-VMD-LSTM 和ESMD-VMD-LSTM(BC)模型的預測精度顯著優(yōu)于ESMD-LSTM 和ESMD-LSTM(BC)模型,證明VMD 分解模塊對模型的構(gòu)建具有重要性和有效性,進一步將ESMD-LSTM 和ESMD-LSTM(BC)模型的高頻分量E1的測試集擬合結(jié)果可視化,見圖9,可知一次分解模型存在含有復雜頻率分量預測結(jié)果較差的情況。

圖9 E1的測試集結(jié)果散點圖Fig.9 Scatter plot of test set results for E1

從指標變化的角度分析:由于二次分解算法VMD模塊的引入,較好的避免了高頻分量預測效果較差的情況,其中ESMDVMD-LSTM 較ESMD-LSTM 模型的RMSE和MAE降 低 了63.96% 和64.40%,MAPE的指標變化較小,但NSE提升了0.302 8;ESMD-VMD-LSTM(BC)較ESMD-LSTM(BC)模型的RMSE、MAE和MAPE分別降低了62.60%、62.06%和29.20%,NSE提升了0.245 8。針對序列分解的“端點效應(yīng)”問題,從而將邊界修正的方法融入到模型中,使得模型的預測效果得到改善,其中ESMD-LSTM(BC)較ESMD-LSTM 模型的RMSE、MAE和MAPE分別降低了9.37%、10.62%和14.48%,NSE增加了0.062 2;ESMD-VMD-LSTM(BC)模型的RMSE、MAE和MAPE較ESMD-VMD-LSTM 分別降低了5.95%、4.75%和39.07%,NSE僅提升了0.005 2,然而對于小樣本數(shù)據(jù)的月降水預測研究同樣具有意義。

為了清晰的觀察7種模型的預測結(jié)果與實測數(shù)據(jù)的擬合效果,將其可視化處理,見圖10。

圖10 各模型預測結(jié)果擬合圖Fig.10 Model fit plots for predicted results of each model

由圖10 可知,SVM 和LSTM 模型無法精準預測實測逐月降水量,只能擬合基本的周期變化趨勢。ESMD-LSTM 與ESMDLSTM(BC)模型較SVM 和LSTM 模型預測結(jié)果更加逼近實測數(shù)據(jù)點,可以擬合基本周期變化趨勢的同時精準預測少數(shù)實測值;VMD-LSTM 模型的擬合效果提升顯著,在非數(shù)據(jù)極值點上達到了較好的擬合,然而對于部分數(shù)據(jù)極值點的擬合效果依舊不理想;見圖10 中的局部放大圖,本文提出的ESMD-VMDLSTM(BC)模型較其余6種模型擁有更強的極值擬合能力,進一步提升模型預測性能的同時增強了模型在實際應(yīng)用中的適用性。

3 結(jié) 論

針對月降水數(shù)據(jù)的小樣本特點和特征變量之間的復雜性和高冗余性,以及分解算法存在的“端點效應(yīng)”問題,本文結(jié)合ESMD 算法可以自適應(yīng)提取時間序列不同尺度信息的優(yōu)點,VMD 算法處理非線性序列的優(yōu)勢,提出一個考慮邊界修正的ESMD-VMD-LSTM(BC)組合月降水預測模型。將該模型應(yīng)用于湖北省巴東縣的月降水預測,通過7種模型對比分析,得出如下結(jié)論。

(1)本文模型的預測精度和擬合效果在7種模型中最佳,在巴東縣的月降水預測中取得良好表現(xiàn)。未來可將本文提出的預測方法應(yīng)用于其他地區(qū)的月降水預測,嘗試性的應(yīng)用于日降水的預測研究,探究模型是否具有較強的泛化能力。

(2)VMD-LSTM 模型的擬合效果良好,然而其對數(shù)據(jù)極值點的擬合效果較差,本文模型擁有更強的極值擬合能力,在實際應(yīng)用中更具適用性。

(3)缺少VMD 模塊的一次分解模型,存在高頻分量預測精度較差的情況,從而影響整體模型預測的準確性。

(4)“端點效應(yīng)”會對采用ESMD 算法的組合模型的預測性能產(chǎn)生一定的負面影響,降低模型的預測精度以及影響模型的擬合效果。

(5)由于高頻分量的預測效果是決定模型預測精度高低的關(guān)鍵因素,因此通過加入優(yōu)化算法,對高頻分量建立更優(yōu)的參數(shù)模型,使得ESMD-VMD-LSTM(BC)模型的預測精度仍然可以進一步提升,這也是后續(xù)需要進一步研究的工作之一。

猜你喜歡
端點分量邊界
非特征端點條件下PM函數(shù)的迭代根
拓展閱讀的邊界
帽子的分量
一物千斤
智族GQ(2019年9期)2019-10-28 08:16:21
不等式求解過程中端點的確定
論中立的幫助行為之可罰邊界
論《哈姆雷特》中良心的分量
分量
參數(shù)型Marcinkiewicz積分算子及其交換子的加權(quán)端點估計
基丁能雖匹配延拓法LMD端點效應(yīng)處理
革吉县| 拜城县| 峨眉山市| 澄城县| 清水县| 景谷| 崇州市| 岳池县| 浦城县| 和林格尔县| 克拉玛依市| 夏邑县| 宜兰县| 长岛县| 恭城| 融水| 潜江市| 八宿县| 迁安市| 大庆市| 古丈县| 贵港市| 樟树市| 秦皇岛市| 随州市| 宝应县| 新绛县| 哈尔滨市| 桃园县| 衡东县| 常熟市| 湘西| 惠安县| 拉萨市| 泊头市| 五河县| 普兰县| 深水埗区| 白朗县| 遂宁市| 大埔县|