国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于VMD-PSO-LSTM水質預測模型的應用研究

2021-09-17 01:16顧乾暉涂振宇
南昌工程學院學報 2021年4期
關鍵詞:高錳酸鹽分量模態(tài)

顧乾暉,曾 斌,涂振宇

(1.南昌工程學院 信息工程學院,江西 南昌 330099;2.江西省防汛信息中心,江西 南昌 330096)

水質預測工作是根據采集到的歷史水質監(jiān)測數據,通過建模等手段來預測水質的變化趨勢,來達到掌握水質現(xiàn)狀以及發(fā)展趨勢的目的[1]。水質預測精度的提高對于水環(huán)境質量的評價、水資源管理制度的制定,以及水污染監(jiān)測與控制系統(tǒng)的規(guī)劃具有重大意義[2]。

目前,水質預測的方法主要有模糊綜合分析法[3]、支持向量機法[4]、灰色預測法[5]和人工神經網絡法[6]等。模糊綜合評價法需要對各種因子進行模糊化加權賦值處理,計算精度高但過程復雜,運行時間長?;疑A測法存在只適合水質短期預測不適合長期預測的缺點[7],并且灰色預測法對復雜數據的預測效果較差[8]。近年來,隨著人工智能的迅速發(fā)展,越來越多的學者把神經網絡和機器學習運用到水質預測和評價模型當中。劉紅梅[9]等運用最小二乘向量回歸模型去預測水質,實驗結果表明,大大降低了算法的計算復雜度并提高了水質預測的精確度。然而SVM對參數選取具有盲目性,有時候求出的模型并不是最優(yōu)解[10]。張青等[11]建立了BP神經網絡水質預測模型對水質相關指標進行預測,取得了良好的效果。何鈺[12]等把BP神經網絡應用于水質評價和水質預測之中,并與其他模型對比。結果表明,BP神經網絡能降低計算復雜度,結果更加客觀。BP神經網絡雖然在水質預測方面取得了一定的成果,但是BP神經網絡存在易陷入局部最優(yōu)和收斂速度慢的問題[13],并且BP神經網絡在時間序列的數據分析上還存在著欠缺[14]。

水質數據是以多元時間序列形式存在的數據集。在進行水質預測時,應該考慮時間序列問題。在處理時序問題上,由于LSTM神經網絡獨特的網絡結構,相對于其他傳統(tǒng)的神經網絡,LSTM神經網絡更易快速收斂,更能得到最優(yōu)模型。2017年,Wang[15]首次將 LSTM 引入水質預測領域,并證明了其在水質預測領域的可行性。李彥杰[16]等提出了基于 LSTM 模型的海洋水質預測,通過將SVR和LSTM 兩種算法做了對比發(fā)現(xiàn)LSTM算法表現(xiàn)出了較好的擬合效果。但是在實際生產情況下,影響水質的因素過多,水質數據往往會呈現(xiàn)出不平穩(wěn)、波動性強、噪聲大等現(xiàn)象,這使得傳統(tǒng)神經網絡模型不能取得理想效果。

變分模態(tài)分解(VMD,Variational Mode Decomposition)模型能將復雜的、非線性、不平穩(wěn)的序列數據分解為多個相對平穩(wěn)、頻率逐級變化的本征模態(tài)函數(BLIMF,Band-Limited Intrinsic ModeFunctions),適用于處理不平穩(wěn)數據[17]。

因此本文提出一種利用VMD分解水質數據中的高錳酸鹽數據,并通過粒子群(PSO)優(yōu)化LSTM神經網絡模型的水質高錳酸鹽預測方法,通過利用多種模型對河南南陽站點的水質數據進行仿真對比實驗,以驗證本文提出的VMD-PSO-LSTM模型的有效性和合理性。

1 LSTM神經網絡

LSTM神經網絡是從RNN神經網絡基礎上改進而來。LSTM神經網絡中的門控單元(輸入門、輸出門、遺忘門)使得模型具有較長時間的“記憶功能”,因此LSTM神經網絡適用于長時間非線性序列預測問題,LSTM結構如圖1所示。

圖1 LSTM結構圖

模型的輸入數據分別為t時刻的輸入數據xt,t-1時刻的記憶值ct-1和t-1時刻的LSTM的輸出值ht-1,輸出數據分別為t時刻的記憶值ct-1和LSTM輸出值ht。

“遺忘門”通過ft保留和丟棄上一時刻的記憶單元的信息來影響當前時刻的細胞狀態(tài)。ft如式(1)所示。

ft=σ(wf.[ht-1.xt]+bf),

(1)

式中σ為sigmoid激活函數;bf為偏置頂;wf為權重矩陣。

“輸入門”通過激活函數sigmoid將變量控制在[0,1]之間,并輸出it,如式(2)所示:

it=σ(wf.[ht-1.xt]+bf).

(2)

“遺忘門”和“輸入門”的變化決定了細胞狀態(tài)ct的變化,如式(3)~(4)所示:

gt=tanh(wc.[ht-1.xt]+bc),

(3)

ct=ftct-1+itgt.

(4)

“輸出門”用來控制當時時刻細胞狀態(tài)值的輸出,如式(5)~(6)所示

Qt=σ(wQ.[ht-1.xt]+bQ),

(5)

ht=Qt×tanh(ct).

(6)

2 變分模態(tài)分解

VMD模型是Dragomiretskiy和Zosso于2014年提出的一種自適應、完全非遞歸的模態(tài)變分和信號處理的方法,它根據預設的模態(tài)數將信號分解為具有不同中心頻率的有限帶寬,采用交替方向乘子法,不斷更新各模態(tài)及其中心頻率,逐步將各模態(tài)解調到相應的基頻帶,并將各個模態(tài)及其相應的中心頻率提取出來,最終得到了具有不同中心頻率的各個分量[18]。

VMD的本質是VMD模型的構建和求解變分問題,其具體過程如下[19]:

(1)通過希爾伯特變換計算每個模態(tài)uk(t)的分析信號以獲取單邊頻譜;

(2)對于每個模態(tài)解析到的分析信號,通過與對應的中心頻率指數項e-jwkt進行混疊,將各模態(tài)的頻譜移位到基帶上;

(3)根據梯度平方準則和高斯平滑度計算分析信號的梯度平方L2范數,來估計出每個模態(tài)的寬帶,其變分約束模型為

(7)

(8)

(4)為將上述約束變分公式變成無約束問題,這里引入二次罰函數c和Lagrange乘子λ:

(9)

VMD運用交替方向乘子法更新各模態(tài)變量uk(t)和對應的中心頻率ωk來求解出式(7)中的最優(yōu)解,其中模態(tài)變量更新方法如式(10)所示:

(10)

中心頻率更新公式如下:

(11)

3 VMD-PSO-LSTM預測模型

本文提出的VMD-PSO-LSTM模型流程圖具體如圖2所示:

Step1:缺失值處理。在水質監(jiān)測中,由于設備失靈或者人為原因會導致采集數據缺失,因此需要提前對樣本數據進行預處理。處理樣本缺失值一般是剔除樣本和填補缺失值,但是在時序序列樣本中,采用剔除缺失值的方法會導致時序中斷,不利于訓練和預測。所以本文采用一般線性插值法來填充缺失數據。

Step2:為了提高模型的收斂速度和計算精度,需要對水質中高錳酸鹽樣本數據進行最大最小值歸一化處理。

Step3:將歸一化后的高錳酸鹽數據通過VMD進行模態(tài)分量分解為k個分量。

Step4:將每個高錳酸鹽模態(tài)分量數據作為對應的LSTM神經網絡模型的輸入數據,輸入數據表達式見式(12):

(12)

式中x分別表示高錳酸鹽數據;i為(1~6);xi表示為第i個高錳酸鹽模態(tài)分量。

Step5:利用粒子群(PSO)優(yōu)化LSTM模型。選取均方誤差MSE作為評價標準和各粒子的適應度值,得出各個分量對應最優(yōu)LSTM模型的神經元個數m和學習率lr。

Step6:將各個分量最優(yōu)LSTM模型進行水質中的高錳酸鹽預測,得出各個分量對應的高錳酸鉀鹽預測值Dn。

Step7:把每個分量對應的高錳酸鉀鹽預測值Dn代入式(13),得到最終高錳酸鉀鹽預測值D。

D=D1+D2+…+Dn.

(13)

圖2 模型流程圖

4 仿真分析

4.1 實驗環(huán)境平臺

實驗所使用計算機配置如下:處理器為(英特爾)Intel(R)Core(TM)i5-8400 CPU @ 2.80GHz,顯卡為 NVIDIA GeForce GTX 1050 Ti,內存為16 GB,操作系統(tǒng)為windows10;程序設計語言為Python3.7;集成開發(fā)環(huán)境為Anaconda和Visual Code;程序中TensorFlow由2.1.0版本實現(xiàn),scikit-learn由0.2.0版本實現(xiàn)。

4.2 數據選擇

所用的數據是國家環(huán)境監(jiān)測總局的河南南陽站2020年5月至2020年10月的水質數據,水質數據每4 h更新一次,一天共6組數據。按照GB3838—2002《地表水環(huán)境質量標準》中的水質評價標準,選取前7個時間段內高錳酸鹽數據(1組數據,每組7個數據)作為水質預測模型的輸入數據,同時輸出下個時間段的高錳酸鹽數據,模型輸入輸出示意圖如圖3。同時將訓練集與測試集分別劃分為90%與10%。

圖3 模型輸入輸出示意圖

4.3 數據預處理

本文采用一般線性插值法來填充缺失數據。即:

(14)

式中xk和xk+j分別是k和k+j時刻的數值,xk+i為k+i時刻的缺失值的取值。

由于水文數據類型不同,為了提高模型的收斂速度和計算精度,需要對水質樣本數據進行歸一化處理。本文采用最大值最小值歸一化。即:

(15)

式中ximax表示變量i的最大值;ximin表示變量i的最小值。

4.4 VMD分解

為了使LSTM水質模型能更好的識別水質中高錳酸鹽的變化規(guī)律,降低預測的難度,對水質數據中的高錳酸鉀鹽數據進行VMD分解。VMD算法的參數包括:模態(tài)數k、懲罰因子α、保真度系數τ及收斂停止條件ε,其中模態(tài)數k對VMD分解的結果影響較大,模態(tài)數k過大會引起模態(tài)混疊現(xiàn)象,反之模態(tài)數k過小會出現(xiàn)模態(tài)分量欠分解[20]。

k值通過中心頻率的方法來確定,當不同模態(tài)個數k的最后一層IMF分量中心頻率保持相對穩(wěn)定時,可認為此時k取得最佳值[21]。本文分別設置模態(tài)數k=3、4、5、6、7、8得到各個模態(tài)分量的中心頻率如表1所示。從表1中可以看出,在k>5后各個模態(tài)分量的最后一層IMF的中心頻率保持穩(wěn)定,因此本文選取模態(tài)數k=6,通過VMD處理得到的8個不同頻率的尺度的平穩(wěn)模態(tài)分量如圖4所示。

表1 各個模態(tài)分量的中心頻率

圖4 VMD處理獲得的模態(tài)分量

4.5 PSO優(yōu)化LSTM

將VMD變分分解的5個高錳酸鹽模態(tài)分量分別作為LSTM模型的輸入,同時輸出高錳酸鹽數據。在傳統(tǒng)LSTM神經網絡中初始參數設定需要依靠人為的經驗來主觀設定初始參數,而不同的參數也會導致模型的訓練速度、誤差、擬合效果差異較大。

粒子群優(yōu)化算法(PSO:Particle swarm optimization)是一種群智能優(yōu)化算法,粒子群的優(yōu)化是將種群中的個體當成多維搜索空間的粒子,每個粒子都有一個由目標函數決定的適應度值,在每一次迭代中,每一個粒子通過尋找個體最優(yōu)位置和全局最優(yōu)位置來不斷更新自己的位置和速度,直至到達尋優(yōu)條件[22]。因此本文通過粒子群優(yōu)化(PSO)算法自動迭代尋優(yōu)LSTM模型兩個重要參數:神經元個數(m)和學習率(lr),并把預測結果的均方誤差(MSE)作為目標函數,MSE如式(16)所示:

(16)

式中yt是真實數據,pt是預測值。

PSO參數設置如下:基本PSO中慣性權重w=0.8,學習因子c1=2,c2=2,迭代次數為100次,種群數量pop=30,神經元個數m取值范圍為[1,50],學習率lr取值范圍為[0.0001,0.01]。PSO-LSTM中LSTM模型部分由輸入層、單隱藏層和輸出層組成,經過PSO對LSTM模型以均方誤差(MSE)為目標函數進行尋優(yōu)。

4.6 各模型對比分析

為了驗證本文提出的VMD-PSO-LSTM預測模型的有效性,選取LSTM,PSO-SVR,PSO-LSTM,PSO-BP,VMD-PSO-SVR,VMD-PSO-LSTM等預測模型進行對比實驗。各個對比模型均在相同的實驗平臺和環(huán)境下進行實驗,各對比模型參數選擇如表2所示,其中LSTM,BP模型參數選擇依據經驗式(17)選擇。

表2 對比模型參數設置

(17)

式中p和q分別是輸出層和輸入層的節(jié)點數,a為[0,10]之中的一個數。

為了更加直觀的看出VMD-PSO-LSTM模型在預測精度上的提高,分為畫出這幾對比種模型在測試集上的預測數值,并且與真實數值進行對比,繪出圖5~7。圖5~6中可以看出,LSTM,PSO-LSTM,PSO-SVR,PSO-BP這幾種模型與真實數據擬合度較差、效果不好。圖7中可以看出,VMD-PSO-LSTM模型更能夠擬合真實數據,有著很好的效果。

為了更加精確體現(xiàn)4種模型之間的性能對比,根據真實數據與預測數據繪制出這幾種模型在的均方誤差(MSE),均方根誤差(RMSE),平均絕對誤差(MAE)和相關系數(R2)性能對比表,結果如表3所示??梢詮谋碇锌闯?,在MSE指標上VMD-PSO-LSTM的均方誤差最低,比VMD-PSO-BP下降24%左右。在R2指標上,VMD-PSO-LSTM的決定系數最高,比VMD-PSO-BP提高6%。在RMSE指標上,VMD-PSO-LSTM的均方根誤差最低,比VMD-PSO-BP降低22%。在MAE指標上,VMD-PSO-LSTM的平均絕對誤差最低,比VMD-PSO-BP降低20%。

圖5 LSTM與PSO-LSTM模型圖 圖6 PSO優(yōu)化各個模型對比圖 圖7 VMD各模型預測數據圖

表3 各模型的預測結果對比

5 結束語

本文首先將地表水的水質數據中高錳酸鹽指數數據通過均值平滑法填補缺失值。為減少數據的波動,把填補后的數據通過最大最小值歸一化方法進行預處理。然后將水位數據通過VMD進行模態(tài)分解成6種分模態(tài),將這6種模態(tài)對應的高錳酸鹽數據分別為LSTM模型的輸入,經過PSO優(yōu)化和訓練后得到6種預測值。再將這6種預測值進行相加,得到最終高錳酸鹽預測值。實驗結果表明本文提出的VMD-PSO-LSTM預測模型的誤差最小,與真實數據更加吻合,預測模型的性能比PSO-LSTM,PSO-SVR,PSO-BP,VMD-PSO-SVR,VMD-PSO-BP等預測模型更加準確、取得更好的預測效果,為水環(huán)境的監(jiān)測和監(jiān)管提供更有力的參考依據。后續(xù)工作主要是嘗試用多層隱藏層去預測。

猜你喜歡
高錳酸鹽分量模態(tài)
基于BERT-VGG16的多模態(tài)情感分析模型
西涼湖、黃蓋湖和陸水水庫高錳酸鹽指數與化學需氧量的相關性分析
多模態(tài)超聲監(jiān)測DBD移植腎的臨床應用
跨模態(tài)通信理論及關鍵技術初探
水環(huán)境中加熱條件對高錳酸鹽指數測定的影響分析
畫里有話
一斤生漆的“分量”——“漆農”劉照元的平常生活
一物千斤
高錳酸鉀和高錳酸鹽對原水預氧化效果的比較
論《哈姆雷特》中良心的分量
洪泽县| 宁陕县| 德兴市| 南康市| 阿荣旗| 玛曲县| 温州市| 嘉义县| 信宜市| 深水埗区| 永兴县| 马关县| 高邑县| 即墨市| 南平市| 中阳县| 赤峰市| 科技| 浑源县| 大化| 迁西县| 湾仔区| 洞口县| 清徐县| 眉山市| 拜泉县| 江津市| 文成县| 南岸区| 长乐市| 宜州市| 喀什市| 邳州市| 祁阳县| 梁河县| 霍城县| 固安县| 化隆| 永德县| 莱西市| 吉水县|