国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于CNN-LSTM模型的黃河水質預測研究

2021-07-08 23:27:26王軍高梓勛朱永明
人民黃河 2021年5期
關鍵詞:卷積神經網絡黃河

王軍 高梓勛 朱永明

摘?要:水質預測是水資源管理和水污染防治的基礎性、前提性工作,但黃河流域水質預測研究相對滯后。為了改善LSTM水質預測模型的性能、提高其泛化能力,根據水質變化具有周期性和非線性的特征,以黃河小浪底水庫溶解氧含量為研究對象,構建了一種卷積神經網絡CNN和長短時記憶網絡LSTM結合的CNN-LSTM預測模型,經試驗驗證,該模型可以高效地提取水質特征信息并進行時間序列預測,預測誤差比LSTM模型的更低,其預測值的平均絕對誤差和均方根誤差分別比LSTM模型的低19.72%和10.44%,對較大值和較小值的預測更為準確,且具有較好的泛化性能。

關鍵詞:水質預測;長短時記憶網絡;卷積神經網絡;CNN-LSTM模型;小浪底水庫;黃河

中圖分類號:X832;TV882.1?文獻標志碼:A

doi:10.3969/j.issn.1000-1379.2021.05.018

Abstract: Water quality prediction is the basic and prerequisite work for the management of water resources and prevention and control of water pollution, but the research on water quality prediction in the Yellow River basin is relatively lagged behind. In order to improve the performance of the LSTM water quality prediction model and increase its generalization ability, according to the periodic and non-linear characteristics of water quality changes, taking the dissolved oxygen concentration of the Xiaolangdi Reservoir on the Yellow River as the research object, a combination of convolutional neural network CNN and length was constructed. The CNN-LSTM prediction model of the time memory network LSTM had been verified by experiments. The model can efficiently extract water quality feature information and perform time series prediction. The prediction error is lower than that of the LSTM model. The average absolute error of the predicted value and the root mean square error are 19.72% and 10.44% lower than that of the LSTM model respectively. The prediction of larger and smaller values is more accurate and it has better generalization performance.

Key words: water quality prediction; long and short-term memory network; convolutional neural network; CNN-LSTM model; Xiaolangdi Reservoir; Yellow River

黃河是我國第二長河、西北和華北地區(qū)的重要水源之一[1],在我國經濟發(fā)展、社會安定和生態(tài)環(huán)境保護等方面處于舉足輕重的位置[2]。然而,隨著生產工業(yè)化和人口城鎮(zhèn)化速度加快等,黃河水質污染愈發(fā)嚴重[3]。水質預測是水資源管理和水污染防治的基礎性和前提性工作,隨著新一代信息技術的發(fā)展,越來越多的學者采用智能算法構建水質預測模型[4],如李娜等[5]提出了一種灰色系統(tǒng)(GM)和新陳代謝原理結合的水質預測模型、Ju等[6]建立了預測水中氨氮含量的最小二乘支持向量機模型、劉潔等[7]將遺傳算法和BP神經網絡算法結合用于水質實時預測。由于水質預測涉及多種因素的非線性關系、需要的數據量大,傳統(tǒng)智能算法在精度、收斂速度和適用性等方面有或多或少的局限性[8],因此Wang等[9]將長短時記憶網絡(LSTM)應用于水質預測,建立基于LSTM的水質預測模型,克服了傳統(tǒng)神經網絡難以用于時間序列預測的難題,獲得了比傳統(tǒng)算法更好的結果。但單個LSTM網絡模型的預測性能有限,為了改善LSTM水質預測模型的性能、提高其泛化能力,有關學者繼續(xù)對LSTM的融合模型進行探索,如Jia等[10]將BP神經網絡和LSTM結合構建了LSTM-BP組合模型。綜上所述,LSTM在水質預測上的應用還有很大的研究空間。目前,對于黃河水質預測的研究還停留在BP神經網絡的應用[11],不能滿足黃河流域生態(tài)保護和高質量發(fā)展的需求,為此,筆者提出了一種將一維卷積神經網絡(CNN)與堆疊長短時記憶網絡(LSTM)結合的水質預測模型CNN-LSTM,用于黃河小浪底水庫水質(溶解氧含量)預測,結果表明其比LSTM有更好的預測性能和泛化性能。

1?理論基礎與模型構建

1.1?長短時記憶網絡

基礎的循環(huán)神經網絡(RNN)擁有普通神經網絡所沒有的自連接隱藏層結構,可以用前一時刻的隱藏層狀態(tài)更新當前時刻的隱藏層狀態(tài),這使得RNN適合處理時間序列數據。但隨著時間序列長度增加,RNN會因“忘記”早期的時序信息而變得難以訓練,出現(xiàn)梯度消失或梯度爆炸。LSTM的提出,在一定程度上解決了RNN無法記住早期時間序列信息的問題[12-13]。LSTM的隱藏層依然是自連接形式,但LSTM可以從前一時刻獲取細胞狀態(tài)和隱藏層狀態(tài)兩種信息,并使用“遺忘門”“輸入門”和“輸出門”3種“門”的閾值結構來控制細胞狀態(tài)信息和隱藏層狀態(tài)信息的傳輸與更新。LSTM隱藏層結構如圖1所示,其中:Ct-1、Ct分別為t-1時刻和t時刻的細胞狀態(tài)信息,t為t時刻的候選更新信息,ht-1和ht分別為t-1時刻和t時刻的隱藏層狀態(tài)信息,Xt為t時刻的輸入值,σ為Sigmoid函數,ft、it、ot分別為“遺忘門”“輸入門”和“輸出門”的控制系數。

“遺忘門”是依據ft來決定t-1時刻的細胞狀態(tài)信息Ct-1有多少能夠被保留的結構。ft是一個由Xt和ht-1作為輸入計算出來的處于0和1之間的數值,ft越接近0則Ct-1中被剔除的信息越多,ft越接近1則Ct-1中被保留的信息越多;控制系數it、ot的作用與ft類似?!拜斎腴T”的作用是確定哪些信息會被加入到Ct中,與“遺忘門”一同作用,決定Ct的更新情況?!拜敵鲩T”用于控制t時刻隱藏層狀態(tài)信息的輸出ht。長短時記憶網絡LSTM的公式表達形式如下:

1.2?卷積神經網絡

卷積神經網絡CNN作為深度學習領域的算法之一,具有局部連接、權值共享和池化下采樣的特點,可以高效地提取圖像數據中的特征信息并進行分類,有極強的圖像識別性能。受其啟發(fā),學者們探索了CNN在時間序列預測中的應用,發(fā)現(xiàn)CNN通過卷積運算進行特征提取的功能同樣可以應用于時間序列數據分析,在時間序列預測上的噪聲容忍度十分優(yōu)秀[14-15]。時間序列預測使用的是一維CNN,可以把卷積核視為一個窗口,在時間序列數據上進行窗口平移,提取局部序列段并與權重進行點乘,持續(xù)不斷輸出計算得到的序列特征,進而進行池化下采樣,進一步過濾數據中對于預測無益的噪聲信息,使得預測性能得到優(yōu)化。

1.3?模型構建

水質信息隨時間的變化有一定的周期性,同時受諸多因素的影響而有非線性趨勢,因此預測水質變化情況有一定的難度,單獨使用LSTM模型會引入與水質預測毫無關系的噪聲,還會受到時間序列數據中較大值和較小值的影響,導致預測效果不佳。而單獨使用CNN模型,雖然可以對每一段時間序列進行卷積運算,很好地提取水質信息中的局部特征,但CNN對水質信息的時間順序并不敏感,不能很好地單獨完成預測任務。因此,將CNN與LSTM融合(稱為CNN-LSTM模型),充分利用CNN的特征信息提取能力和LSTM對時間序列數據的敏感性,提高對水質預測的效果。

如圖2所示,CNN-LSTM模型的第一部分是卷積層和最大值池化層組成的CNN部分,該部分設置了2個卷積層和2個最大值池化層,卷積層會遍歷輸入的黃河水質信息,用卷積內核權重與水質信息局部序列段進行卷積運算,得到一個初步的特征矩陣,該特征矩陣的表達能力強于原始水質信息時間序列(矩陣);最大池化層把上一卷積層計算得到的特征矩陣作為輸入,用池化窗口在該矩陣(序列)上滑動,每滑動一次取窗口的最大值進行池化,輸出更具表現(xiàn)力的特征矩陣。一維CNN的運行如圖3所示,可把整個CNN部分看作一個特殊的數據預處理結構,水質信息被CNN部分提煉成對時間序列信息更具敏感性的LSTM部分的輸入。堆疊LSTM部分則采用2個LSTM網絡的堆疊進行時序數據建模,通過Dense層輸出水質預測結果。

選取平均絕對誤差(MAE)和均方根誤差(RMSE)作為評價模型預測效果的指標[16],MAE和RMSE的計算公式如下:

式中:yi為實測值;yi′為模型輸出的預測值;i為樣本編號;N為樣本數量。

CNN-LSTM把MAE和RMSE作為模型損失值,通過反向傳播誤差信息進行迭代權重更新,讓卷積內核中的權重、LSTM的參數信息及Dense層中的參數不斷優(yōu)化直至收斂,完成模型的訓練。

CNN-LSTM模型的超參數設置在一定程度上影響其對黃河水質預測性能,經過反復試驗,確定了相對較優(yōu)的超參數(見表1)和激活函數。

2?預測效果分析

2.1?模型測試數據處理

本研究以中國環(huán)境監(jiān)測總站提供的全國主要流域重點斷面水質自動監(jiān)測周報作為數據源,數據處理過程如下。

(1)獲取數據。從自動監(jiān)測周報中選取2008年1月1日至2014年12月28日黃河小浪底水庫出庫周測水質數據作為本研究的模型測試數據,包括水體pH值、氨氮濃度、高錳酸鹽指數、溶解氧(DO)4個水質指標。

(2)選取研究對象。獲取的水質數據與《地表水環(huán)境質量標準》進行對比,發(fā)現(xiàn)小浪底水庫的溶解氧含量對其水質類別影響最大,故把溶解氧含量作為評價小浪底水庫水質的主要研究對象,其在研究時段的變化情況見圖4。

(3)歸一化處理。為了避免某些異常值使模型難以收斂,同時讓CNN-LSTM模型收斂更快更穩(wěn)定,對溶解氧數據進行歸一化處理,使CNN-LSTM的輸入值介于[0,1]之間。歸一化處理公式為

式中:X為原始數據;Xnorm為歸一化處理后的數據;Xmax為原始數據中的最大值;Xmin為原始數據中的最小值。

(4)對樣本數據進行訓練集和驗證集劃分。以9∶1的比例劃分訓練集和驗證集,即前90%的樣本數據用來訓練模型,后10%的樣本數據用來驗證模型性能。

(5)數據還原。在訓練結束后進行模型評估時,采用式(10)對歸一化后的數據進行還原(逆歸一化)處理,以便評估模型預測值的誤差。

2.2?預測試驗

采用python程序語言環(huán)境下的深度學習庫keras編寫代碼,實現(xiàn)了用CNN-LSTM和用LSTM對黃河水質的預測試驗,兩者均在訓練集上使用Adam優(yōu)化器和0.001的學習率進行模型訓練。為了在卷積運算和池化下采樣的過程中最大限度地保留時間序列信息,在卷積運算和最大值池化時使用“same”的填充方式,完成100個epoch(1個epoch表示遍歷一次訓練集中的所有樣本)的迭代后得到了最后的試驗結果。

2.3?訓練集擬合結果分析

CNN-LSTM模型和LSTM模型的評價指標MAE、RMSE見表2。由表2可知,兩個模型對訓練集擬合(預測)的誤差都處于較低水平,CNN-LSTM的預測性能總體優(yōu)于LSTM的,其RMSE比LSTM的低10.44%、MAE比LSTM的低19.72%。

為了更清晰地對比兩個模型對水質預測的性能差異,圖5和圖6分別展示了兩個模型對訓練集對應時段的溶解氧含量預測(擬合)值與實測值對比情況,可以看出:LSTM雖然可以較好地對水質的周期性變化進行預測,但是對較大值和較小值的預測結果與實測值相差較大,而CNN-LSTM較好地解決了LSTM對較大值和較小值預測不準確的問題,表明CNN-LSTM具有更強的預測性能。

2.4?驗證集預測結果分析

CNN-LSTM對驗證集對應時段溶解氧含量的預測結果與實測值對比見圖7,可以看出,CNN-LSTM對溶解氧濃度的預測表現(xiàn)出較好的性能,與其在訓練集的預測(擬合)性能差別不大,說明CNN-LSTM具有較強的泛化性能。

3?結?論

基于CNN結構和堆疊LSTM結構融合的CNN-LSTM模型,用CNN來提取溶解氧含量特征信息并作為LSTM的輸入,既解決了CNN難以記憶早期時間序列信息的問題,又解決了LSTM預測水質信息精度不足的缺陷,可以比較準確地預測小浪底水庫溶解氧含量,準確性明顯優(yōu)于LSTM模型,在較大值和較小值預測方面也更為準確,且具有較強的泛化性能,其預測值的平均絕對誤差(MAE)和均方根誤差(RMSE)分別比LSTM模型的低19.72%和10.44%。

參考文獻:

[1]?嵇曉燕,孫宗光,聶學軍,等.黃河流域近10 a地表水質變化趨勢研究[J].人民黃河,2016,38(12):99-102.

[2]?賈紹鳳,梁媛.新形勢下黃河流域水資源配置戰(zhàn)略調整研究[J].資源科學,2020,42(1):29-36.

[3]?鄭洪領,王龍,耿玉秀.黃河水質現(xiàn)狀分析及提高水質對策建議[J].中國農村水利水電,2010(5):21-24.

[4]?HAMEED M, SHARQI S S, YASEEN Z M, et al. Application of Artificial Intelligence (AI) Techniques in Water Quality Index Prediction: a Case Study in Tropical Region, Malaysia[J]. Neural Computing and Applications, 2016,28(S1):893-905.

[5]?李娜,王臘春,謝剛,等.山東省轄淮河流域河流水質趨勢的灰色預測[J].環(huán)境科學與技術,2012,35(2):201-205.

[6]?JU J, WANG L. Analysis of Ammonia Nitrogen Content in Water Based on Weighted Least Squares Support Vector Machine (WLSSVM) Algorithm[J]. Journal of Software Engineering and Applications,2016,9(2):45-51.

[7]?劉潔,祝榕婕,姜德迅,等.基于遺傳-神經網絡的實時水質預測模型[J].南水北調與水利科技(中英文),2020,18(6):93-100.

[8]?KABIR S, PATIDAR S, PENDER S. Investigating Capabilities of Machinelearning Techniques in Forecasting Stream Flow[J].Proceedings of Theinstitution of Civil Engineers-Water Management, 2020,173(2):69-86.

[9]?WANG Y, ZHOU J, CHEN K, et al. Water Quality Prediction Method Based on LSTM Neural Network[C]//2017 12th International Conference on Intelligent Systems and Knowledge Engineering (ISKE). Washington: IEEE Computer Society, 2017: 1-5.

[10]?JIA H,ZHOU X. Water Quality Prediction Method Based on LSTM-BP[C]// 2020 12th International Conference on Intelligent Human-Machine Systems and Cybernetics (IHMSC).Hangzhou: IEEE Computer Society, 2020:27-30.

[11]?琚振闖,王曉,弓艷霞.基于BP神經網絡的黃河水質預測研究[J].青海大學學報(自然科學版),2017,35(3):88-92.

[12]?LI Y, ZHU Z, KONG D, et al. EA-LSTM: Evolutionary Attention-Based LSTM for Time Series Prediction[J]. Knowledge-Based Systems, 2019,181(1):104785.1-104785.8.

[13]?HOCHREITER S, SCHMIDHUBER J. Long Short-Term Memory[J]. Neural Computation, 1997,9(8):1735-1780.

[14]?ZHAO B, LU H, CHEN S, et al. Convolutional Neural Networks for Time Series Classification[J]. Journal of Systems Engineering and Electronics, 2017,28(1): 162-169.

[15]?ZHENG Y, LIU Q, CHEN E, et al. Time Series Classification Using Multi-Channels Deep Convolutional Neural Networks[C]//Proc of the 15th International Conference on Web-Age InformatioManagement. Macau: [s.n.], 2014: 298-310.

[16]?LIVIERIS I E, PINTELAS E, PINTELAS P. A CNN-LSTM Model for Gold Price Time-Series Forecasting[J]. Neural Computing and Applications, 2020,32(23):17351-17360.

【責任編輯?張智民】

猜你喜歡
卷積神經網絡黃河
多彩黃河
金橋(2020年11期)2020-12-14 07:52:46
黃河寧,天下平
金橋(2020年11期)2020-12-14 07:52:42
『黃河』
當代陜西(2019年21期)2019-12-09 08:36:12
黃河知道我愛誰
當代音樂(2019年2期)2019-06-11 21:17:05
基于深度卷積神經網絡的物體識別算法
深度學習算法應用于巖石圖像處理的可行性研究
軟件導刊(2016年9期)2016-11-07 22:20:49
基于深度卷積網絡的人臉年齡分析算法與實現(xiàn)
軟件工程(2016年8期)2016-10-25 15:47:34
基于卷積神經網絡的樹葉識別的算法的研究
进贤县| 运城市| 八宿县| 宁蒗| 麻阳| 新晃| 潼南县| 莱阳市| 开鲁县| 河东区| 大新县| 于都县| 延长县| 图们市| 通海县| 格尔木市| 广昌县| 中江县| 米脂县| 聂拉木县| 乌鲁木齐市| 剑川县| 黔西| 芦山县| 祁东县| 吴江市| 泰顺县| 白沙| 酒泉市| 呈贡县| 万宁市| 鄱阳县| 凌海市| 曲水县| 溧阳市| 稻城县| 科技| 信阳市| 宣汉县| 临泽县| 孟村|