国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于機(jī)器學(xué)習(xí)的水庫溶解氧預(yù)測(cè)模型比較研究

2025-02-28 00:00:00張鵬梅書浩石成春卓越李佳昊宋剛福
關(guān)鍵詞:相關(guān)性分析BP神經(jīng)網(wǎng)絡(luò)

摘要:快速精準(zhǔn)預(yù)測(cè)低氧發(fā)生對(duì)維持水生生態(tài)系統(tǒng)的健康有著重要意義,利用皮爾遜相關(guān)性分析和最大信息系數(shù)兩種方法,依據(jù)閩江上游水口水庫典型漁業(yè)養(yǎng)殖區(qū)G1、G2和Z1點(diǎn)位2021年3月至2022年3月的數(shù)據(jù),從多個(gè)水質(zhì)、氣象和水文參數(shù)中篩選出影響溶解氧的關(guān)鍵驅(qū)動(dòng)因子?;跈C(jī)器學(xué)習(xí)算法,構(gòu)建了獨(dú)立BP、皮爾遜相關(guān)性-BP、MIC-BP和MIC-SVR等溶解氧預(yù)測(cè)模型,對(duì)比分析了各模型的預(yù)測(cè)結(jié)果。結(jié)果表明:電導(dǎo)率、水溫、pH、葉綠素a和水位是影響溶解氧的5個(gè)主要因素;經(jīng)過相關(guān)性分析篩選后,構(gòu)建的預(yù)測(cè)模型性能得到提升,其中最大信息系數(shù)(MIC)法的篩選效率優(yōu)于皮爾遜相關(guān)性法的;MIC-SVR模型是最優(yōu)的溶解氧預(yù)測(cè)模型,其R2均大于0.98,RMSE均小于0.56,MAE均小于0.28,可以將溶解氧的預(yù)測(cè)誤差控制在±0.30 mg/L以內(nèi)。該研究成果可為湖庫低氧預(yù)測(cè)預(yù)警提供借鑒。

關(guān)鍵詞:水庫溶解氧;相關(guān)性分析;最大信息系數(shù);BP神經(jīng)網(wǎng)絡(luò);支持向量回歸

中圖分類號(hào):X524文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):2096-6792(2025)01-0087-09

溶解氧(Dissolved Oxygen,DO)對(duì)于維持水生態(tài)系統(tǒng)健康至關(guān)重要[1-5]。當(dāng)DO含量低于4 mg/L時(shí),水產(chǎn)養(yǎng)殖業(yè)會(huì)受到損害[6-7],當(dāng)出現(xiàn)缺氧現(xiàn)象(DOlt;2 mg/L)且長時(shí)間持續(xù)時(shí),水生態(tài)系統(tǒng)中的魚類、浮游和底棲生物等會(huì)受到致命的危害[8-11],導(dǎo)致水質(zhì)惡化和水生態(tài)系統(tǒng)功能喪失。近些年來,全球范圍內(nèi)很多河口地區(qū)水環(huán)境出現(xiàn)惡化,水生態(tài)遭到破壞[12-14],其中低氧、缺氧問題已逐漸成為全球水環(huán)境問題研究的一個(gè)熱點(diǎn)[15]。水體缺氧現(xiàn)象是物理、生物、化學(xué)等眾多復(fù)雜因素相互作用的結(jié)果[16],已有學(xué)者對(duì)水庫底層缺氧的形成機(jī)理進(jìn)行了深入的研究[17],發(fā)現(xiàn)水體DO由氣象、水文、水質(zhì)及富營養(yǎng)化等因素控制,且包含人類活動(dòng)的復(fù)雜生化過程[18-19],這對(duì)DO的模擬和預(yù)測(cè)研究造成極大挑戰(zhàn),因此,迫切需要開發(fā)更快速、穩(wěn)定、精準(zhǔn)的DO預(yù)測(cè)模型。

近年來,機(jī)器學(xué)習(xí)算法作為一種數(shù)據(jù)驅(qū)動(dòng)的智能模型,在各領(lǐng)域都取得了廣泛的應(yīng)用和突出的效果。在水環(huán)境領(lǐng)域,機(jī)器學(xué)習(xí)算法被廣泛用于水質(zhì)參數(shù)的預(yù)測(cè)、評(píng)價(jià)和優(yōu)化[20-21]研究中,但缺乏對(duì)于關(guān)鍵驅(qū)動(dòng)因子的篩選,這增加機(jī)器學(xué)習(xí)的難度和預(yù)測(cè)誤差;有些成果針對(duì)DO的機(jī)器學(xué)習(xí)研究考慮的因素種類不足,如只考慮了水質(zhì)因素而忽略了氣象和水文等因素。近年來,很多承擔(dān)漁業(yè)養(yǎng)殖及水源供水的水庫突發(fā)性低氧和缺氧事件對(duì)經(jīng)濟(jì)損失和供水安全造成威脅[22-23],構(gòu)建融合關(guān)鍵驅(qū)動(dòng)因子識(shí)別和機(jī)器學(xué)習(xí)算法穩(wěn)定的DO預(yù)測(cè)模型至關(guān)重要。

本文以福建省內(nèi)陸重點(diǎn)水產(chǎn)水口水庫養(yǎng)殖水域?yàn)檠芯繉?duì)象,利用2021年3月至2022年3月漁業(yè)養(yǎng)殖區(qū)典型監(jiān)測(cè)點(diǎn)G1、G2、Z1的逐小時(shí)監(jiān)測(cè)數(shù)據(jù)(水質(zhì)、氣象、水文數(shù)據(jù)),構(gòu)建了獨(dú)立BP、皮爾遜相關(guān)性-BP、MIC-BP和MIC-SVR等混合機(jī)器學(xué)習(xí)預(yù)測(cè)模型,對(duì)典型監(jiān)測(cè)點(diǎn)G1、G2、Z1的DO進(jìn)行了預(yù)測(cè),并利用決定系數(shù)(R2)、平均絕對(duì)誤差(MAE)、均方根誤差(RMSE)和納什系數(shù)(NSE)4個(gè)指標(biāo)對(duì)比了同類型的DO預(yù)測(cè)模型橫向和不同類型的DO預(yù)測(cè)模型縱向的預(yù)測(cè)結(jié)果。該研究可為湖庫水體DO的快速預(yù)測(cè)提供了新的思路和方法,也可以為水體缺氧現(xiàn)象的監(jiān)測(cè)、預(yù)警和治理提供科學(xué)依據(jù)。

1研究區(qū)域及數(shù)據(jù)

1.1區(qū)域概況

研究區(qū)位于福建省內(nèi)陸重點(diǎn)水產(chǎn)養(yǎng)殖水域——水口水庫(118°03′~118°81′E、26°30′~26°57′N),如圖1所示。水口水庫是以發(fā)電為主,兼顧防洪、航運(yùn)的大(一)型水庫,屬河道型水庫,上游沙溪、富屯溪和建溪三大支流匯入閩江干流后進(jìn)入庫區(qū),三大支流在南平市附近匯集,匯集區(qū)面積約4.2×104 km2,后流經(jīng)寧德和福州市,沿途有吉溪、尤溪和古田溪等小支流匯入,在調(diào)節(jié)閩江徑流、維護(hù)生態(tài)平衡和發(fā)展區(qū)域經(jīng)濟(jì)等方面發(fā)揮著重要作用。近年來,水庫多次發(fā)生突發(fā)性缺氧死魚事件,直接威脅閩江供水水質(zhì)和生態(tài)安全,對(duì)庫區(qū)經(jīng)濟(jì)社會(huì)發(fā)展和生態(tài)環(huán)境產(chǎn)生較大影響,因此本文選擇養(yǎng)殖區(qū)內(nèi)中上游樟湖養(yǎng)殖區(qū)G1、壩前雄江養(yǎng)殖區(qū)G2和古田支流養(yǎng)殖區(qū)Z1 3個(gè)典型監(jiān)測(cè)點(diǎn)位作為研究區(qū)域。

1.2數(shù)據(jù)選取與處理

水質(zhì)數(shù)據(jù)來源于閩江上游水口水庫典型漁業(yè)養(yǎng)殖區(qū)G1、G2和Z1點(diǎn)位自動(dòng)監(jiān)測(cè)數(shù)據(jù)(圖1),水文數(shù)據(jù)來源于浙閩片區(qū)水文信息服務(wù)系統(tǒng),氣象數(shù)據(jù)來源于中國氣象網(wǎng)。數(shù)據(jù)集的時(shí)間跨度為2021年3月至2022年3月,記錄頻率為每小時(shí)1次,水質(zhì)數(shù)據(jù)包括水溫、pH、葉綠素和電導(dǎo)率等9個(gè)因子,氣象數(shù)據(jù)包括濕度、風(fēng)速、風(fēng)向角度和氣壓等6個(gè)因子,水文數(shù)據(jù)主要考慮了各監(jiān)測(cè)點(diǎn)位的水位和上游流量。

為了提高結(jié)果的精度,首先對(duì)數(shù)據(jù)集進(jìn)行預(yù)處理,去除數(shù)據(jù)中的異常值,并利用三次樣條插值方法得到完整的逐小時(shí)數(shù)據(jù)集。若將全部候選因子作為模型輸入因子,其中部分與DO相關(guān)性較弱的因子會(huì)導(dǎo)致計(jì)算維度高、計(jì)算難度大、計(jì)算精度一定程度降低,不利于模型的構(gòu)建。相關(guān)性分析法和最大信息系數(shù)(Maximal Information Coefficient,MIC)法是常被用來計(jì)算不同變量間相互關(guān)系的兩種方法,可以對(duì)所有候選因子進(jìn)行識(shí)別和篩選,篩選與DO相關(guān)性較強(qiáng)的因子,有利于提高模型的計(jì)算效率和預(yù)測(cè)精度。

2研究方法

2.1皮爾遜相關(guān)性分析

皮爾遜相關(guān)系數(shù),又稱積差相關(guān)系數(shù),是表達(dá)兩變量線性相關(guān)程度及方向的統(tǒng)計(jì)指標(biāo),其計(jì)算公式為:

rxy=∑ni=1(xi-x-)(yi-y-)∑ni=1(xi-x-)2∑ni=1(yi-y-)2。 ""(1)

式中:x-、y-分別為變量x、y的均值;xi、yi分別為變量x、y的第i個(gè)觀測(cè)值;n為觀測(cè)值個(gè)數(shù)。

2.2最大信息系數(shù)

最大信息系數(shù)(MIC)是由RESHEF D等[24]提出的常用于機(jī)器學(xué)習(xí)的特征選擇方法,主要思想為:如果兩變量之間存在一定的相關(guān)性,那么對(duì)這兩個(gè)變量構(gòu)成的散點(diǎn)圖進(jìn)行i列j行網(wǎng)格化,求出最大的互信息值,對(duì)最大的互信息值進(jìn)行歸一化,最后選擇不同尺度下互信息的最大值作為MIC值,具體過程如下。

假設(shè)有n個(gè)數(shù)據(jù)點(diǎn),每個(gè)數(shù)據(jù)點(diǎn)有2個(gè)屬性X和Y,那么MIC的計(jì)算公式可以表示為:

MIC(X,Y)=maxatimesb<B(n)fracI(X;Ya,b)·lb(min(a,b))。(2)

式中:a和b分別為網(wǎng)格劃分的行數(shù)和列數(shù);B(n)為限制條件,一般取n0.6;I(X;Ya,b)為在給定網(wǎng)格劃分下的互信息,定義為:

I(X;Ya,b)=sumax=1sumby=1p(x,y)·lb(frac(p(x,y)p(x)p(y)))。(3)

式中:p(x,y)為落在(x,y)格子中的數(shù)據(jù)點(diǎn)的頻率;p(x)和p(y)分別為落在第x行和第y列的數(shù)據(jù)點(diǎn)的頻率。

MIC可以衡量兩個(gè)變量之間的線性或非線性關(guān)系的強(qiáng)度,MIC的取值范圍為0~1,MIC值越大表示關(guān)系越強(qiáng)。

2.3BP神經(jīng)網(wǎng)絡(luò)

BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)是1986年由RUMELHART D E等[25]科學(xué)家小組提出的一種能夠模擬生物神經(jīng)網(wǎng)絡(luò)特征進(jìn)而達(dá)到信息處理的多層前饋神經(jīng)網(wǎng)絡(luò),其主要特點(diǎn)是信號(hào)前向傳遞和誤差反向傳播。前向傳遞過程中,輸入層發(fā)出輸入信號(hào)到隱含層,經(jīng)隱含層逐層處理后發(fā)送到輸出層[26]。若輸出層的結(jié)果沒有達(dá)到預(yù)期,則進(jìn)行反向傳播,根據(jù)預(yù)測(cè)誤差重新調(diào)整神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值,反復(fù)訓(xùn)練,從而使預(yù)測(cè)輸出向期望輸出逼近,BP神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)如圖2所示。

BP神經(jīng)網(wǎng)絡(luò)算法主要是將輸入層的訓(xùn)練樣本數(shù)據(jù)經(jīng)過隱含層傳到輸出層并進(jìn)行多次尋優(yōu)計(jì)算得到輸出值,將輸出值與期望值進(jìn)行對(duì)比,若未達(dá)到終止條件,誤差將經(jīng)由神經(jīng)網(wǎng)絡(luò)反向傳播,反復(fù)計(jì)算,對(duì)各層之間的權(quán)值和閾值進(jìn)行逐層修改,最終達(dá)到縮小誤差、優(yōu)化輸出值的目的。重復(fù)以上步驟,直到輸出結(jié)果滿足終止條件。BP神經(jīng)網(wǎng)絡(luò)算法訓(xùn)練過程如圖3所示。

2.4支持向量回歸

支持向量機(jī)(Support Vector Machines,SVM)最早是由VAPNIK V N等[27]在1963年提出的一種分類模型。支持向量回歸(Support Vector Regression,SVR)是在SVM的基礎(chǔ)上延伸出的解決回歸分析問題的方法。SVR的基本原理是將低維的線性不可分?jǐn)?shù)據(jù)通過核函數(shù)映射到高維空間,使原本數(shù)據(jù)集可分,進(jìn)而得到最優(yōu)分類面,使所有樣本數(shù)到分類面的平均誤差最?。?8]。

SVR模型函數(shù)為:

f(x)=ωTφ(x)+b。 """""""""""(4)

式中x、 φ(x)、ω、 b分別為輸入數(shù)據(jù)、非線性映射函數(shù)、權(quán)重向量和截距。

經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原則公式可以表示為:

minω,b12ω2+c∑mi=1(ζi+ζ*i);

s.t.yi-ωφ(x)-b≤ε+ζi,

-yi+ωφ(x)+b≤ε+ζ*i,

ζi≥0,ζ*i≥0。

(5)

式中:ω為復(fù)雜性相關(guān)項(xiàng);ε(εgt;0)為回歸的最大允許誤差;c為懲罰因子;ζi和ζ*i為松弛變量;樣本序號(hào)i=1、2、…、n。

根據(jù)經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原則,引入拉格朗日乘子,將此優(yōu)化問題轉(zhuǎn)化為二次優(yōu)化問題,即:

L[f(xt),yt,ε]=0,yt-f(xt)≤ε;yt-f(xt)-ε,yt-f(xt)gt;ε。 ""(6)

式中:f(xt)為目標(biāo)函數(shù),表示SVR模型的預(yù)測(cè)輸出; yt為實(shí)際觀測(cè)值; t為樣本組號(hào)。

對(duì)ω、b、ξi和ξ*i分別求偏導(dǎo),令結(jié)果等于0,將最優(yōu)化問題轉(zhuǎn)化為對(duì)偶問題,引入核函數(shù),則非線性的候選因子和DO預(yù)測(cè)問題可以表示為:

f(x)=∑mi=1(αi-α*i)K(xi,xj)+b。 ""(7)

式中:K(xi,xj)為徑向基函數(shù)(Radial Basis Function,RBF),在實(shí)現(xiàn)非線性映射方面有較好的性能;數(shù)據(jù)點(diǎn)序號(hào)j=1、2、…、n;

αi、α* i為拉格朗日乘數(shù),分別對(duì)應(yīng)違反誤差限的不同方向,前者是預(yù)測(cè)值大于實(shí)測(cè)值的情況,后者是預(yù)測(cè)值小于實(shí)測(cè)值的情況。

輸入因子數(shù)據(jù)經(jīng)過核函數(shù)計(jì)算后,可在高維空間中解決線性問題,等價(jià)于在低維空間中解決非線性問題,即:

K(xi,xj)=exp[-(xi-xj)2/2σ2]。 ""(8)

式中σ為高斯核函數(shù)的寬度。

SVR分析算法建模時(shí)對(duì)訓(xùn)練數(shù)據(jù)集使用網(wǎng)格搜索(Grid Search)法,對(duì)核函數(shù)、正則化系數(shù)c和間隔帶寬度ε等多個(gè)超參數(shù)進(jìn)行多次尋優(yōu)。網(wǎng)格搜索在大區(qū)間給c、ε多組預(yù)定值,使用交叉驗(yàn)證(Cross-Validation)的方式對(duì)不同的組合進(jìn)行自動(dòng)尋優(yōu),得到最優(yōu)解,SVR分析算法訓(xùn)練過程如圖4所示。

2.5模型評(píng)價(jià)指標(biāo)

本次評(píng)價(jià)指標(biāo)主要包括決定系數(shù)(R2)、平均絕對(duì)誤差(Mean Absolute Error,MAE)和均方根誤差(Root Mean Squared Error,RMSE)。

決定系數(shù)(R2)是指期望值和預(yù)測(cè)值的擬合程度。擬合優(yōu)度的統(tǒng)計(jì)量是決定系數(shù)(R2),R2的取值范圍為[0,1]。R2越接近1,說明期望值和預(yù)測(cè)值的擬合程度越好;反之則說明期望值和預(yù)測(cè)值的擬合程度越差。

R2=∑ni=1(yi-y-i)(y^i-y^i)∑ni=1(yi-y-i)2∑ni=1(y^i-y^i)22 。(9)

式中:y^i和yi分別為預(yù)測(cè)值和實(shí)測(cè)值;n為樣本數(shù)量;y^i和y-i分別為預(yù)測(cè)值y^i和實(shí)測(cè)值yi的均值。

平均絕對(duì)誤差(MAE)是所有單個(gè)期望值和預(yù)測(cè)值誤差絕對(duì)值的平均。平均絕對(duì)誤差可以避免誤差相互抵消的問題,因而可以準(zhǔn)確反映實(shí)際預(yù)測(cè)誤差的大小。

MAE=1n∑ni=1y^i-yi。(10)

均方根誤差(RMSE)為期望值和預(yù)測(cè)值偏差的平方與觀察次數(shù)比值的平方根,用來衡量期望值與預(yù)測(cè)值之間的偏差程度。

RMSE=1n∑mi=1ωi(yi-y^i)2。(11)

式中:ωi為第i個(gè)數(shù)據(jù)的權(quán)重;m為數(shù)據(jù)點(diǎn)個(gè)數(shù)。

納什系數(shù)(Nash-Sutcliffe Efficient,NSE)是一種常用的水文模型評(píng)估指標(biāo),用于評(píng)估模型對(duì)于水文變量的預(yù)測(cè)能力。

NSE=1-∑Tt=1(yi-y^i)2∑Tt=1(yi-y-i)2 "。(12)

式中,T為變量個(gè)數(shù)。

3結(jié)果分析

3.1關(guān)鍵驅(qū)動(dòng)因子的識(shí)別結(jié)果

利用皮爾遜相關(guān)性分析法和MIC技術(shù)對(duì)DO與水質(zhì)、氣象和水文等因子的相關(guān)程度進(jìn)行分析,篩選出影響DO的關(guān)鍵驅(qū)動(dòng)因子。G1、G2和Z1典型浮標(biāo)站的水質(zhì)、氣象和水文方面的17個(gè)候選因子與DO的皮爾遜相關(guān)性熱力值如圖5所示,候選因子與DO的相關(guān)系數(shù)大于0.2,認(rèn)為其與DO有相關(guān)性。由圖5可知:監(jiān)測(cè)點(diǎn)G1候選因子中水溫、pH、葉綠素a、電導(dǎo)率和平均總云量與DO的相關(guān)系數(shù)均大于0.2,確定其為關(guān)鍵驅(qū)動(dòng)因子;監(jiān)測(cè)點(diǎn)G2的水溫、葉綠素、pH、電導(dǎo)率、氣壓和平均總云量與DO的相關(guān)系數(shù)均大于0.2,確定其為關(guān)鍵驅(qū)動(dòng)因子;監(jiān)測(cè)點(diǎn)Z1候選因子中水溫、pH和葉綠素a與目標(biāo)變量DO的相關(guān)系數(shù)大于0.2,確定其為關(guān)鍵驅(qū)動(dòng)因子。

G1、G2和Z1典型浮標(biāo)站的水質(zhì)、氣象和水文方面的17個(gè)候選因子與DO的MIC值如圖6所示,圖中候選因子與DO的MIC值大于0.2,認(rèn)為其與DO的相關(guān)性較強(qiáng)。由圖6可知:監(jiān)測(cè)點(diǎn)G1的候選因子中電導(dǎo)率、pH、G1水位、水溫、上游流量和葉綠素a的MIC值大于0.2,確定其為關(guān)鍵驅(qū)動(dòng)因子;監(jiān)測(cè)點(diǎn)G2的候選因子中電導(dǎo)率、水溫、G2水位和pH的MIC值大于0.2,確定其為關(guān)鍵驅(qū)動(dòng)因子;監(jiān)測(cè)點(diǎn)Z1的候選因子中電導(dǎo)率、pH、水溫、葉綠素a、Z1水位和氨氮的MIC值大于0.2,確定其為關(guān)鍵驅(qū)動(dòng)因子。

上述結(jié)果表明,經(jīng)過皮爾遜相關(guān)性分析法和MIC技術(shù)識(shí)別與篩選后發(fā)現(xiàn),DO與電導(dǎo)率、pH、葉綠素a、水溫和水位5個(gè)因子的相關(guān)性較大。這是因?yàn)檫@些因子都直接或間接地影響了水體中的溶解氧含量和需氧量。其中,電導(dǎo)率與DO的相關(guān)性較強(qiáng),電導(dǎo)率反映了水體的污染程度,而污染物中的有機(jī)顆粒和腐殖質(zhì)會(huì)降低水體中的溶解氧含量;pH與DO的相關(guān)性較強(qiáng),pH受微生物的光合作用和有機(jī)物的分解影響,這些過程消耗或產(chǎn)生DO;溫度與DO的相關(guān)性較強(qiáng),溫度升高降低了水體的溶解氧飽和度,加速了水生生物的代謝;葉綠素a與DO的相關(guān)性較強(qiáng),葉綠素a反映了藻類的光合作用能力,但藻類的呼吸作用和死亡分解同時(shí)會(huì)對(duì)DO產(chǎn)生消耗;水位反映了水體的深度和流速,水位越高,水體越深,流速越慢,溶解氧的擴(kuò)散和輸送越困難,故水位與DO具有較大的相關(guān)性。

3.2DO預(yù)測(cè)模型優(yōu)化研究

為了比較不同的變量選擇方法和機(jī)器學(xué)習(xí)算法對(duì)DO預(yù)測(cè)模型精度的影響,采用皮爾遜相關(guān)性分析和MIC方法分別篩選出與DO相關(guān)性較高的變量,然后利用BP算法和支持SVR算法分別構(gòu)建獨(dú)立BP、皮爾遜相關(guān)性-BP、MIC-BP和MIC-SVR四個(gè)混合機(jī)器學(xué)習(xí)預(yù)測(cè)模型。

3個(gè)監(jiān)測(cè)點(diǎn)位獨(dú)立BP、皮爾遜相關(guān)性-BP、MIC-BP的DO預(yù)測(cè)模型誤差結(jié)果對(duì)比見表1和分別如圖7—9所示。由表1和圖7—9可知:G1、G2、Z1點(diǎn)位的DO預(yù)測(cè)模型擬合效果

較一致,獨(dú)立BP模型的擬合效果最差,皮爾遜相關(guān)性-BP模型和MIC-BP模型較獨(dú)立BP模型的擬合效果有所提升,MIC-SVR模型的擬合效果最好。G1、G2、Z1點(diǎn)位的MIC-SVR預(yù)測(cè)模型對(duì)R2、MAE、RMSE和NSE的擬合結(jié)果(表1)明顯優(yōu)于MIC-BP模型、皮爾遜相關(guān)性-BP模型和獨(dú)立BP模型的,表現(xiàn)在:①3個(gè)點(diǎn)位MIC-SVR模型對(duì)R2和NSE的擬合結(jié)果相較于前3個(gè)模型的均得到了提升,說明MIC-BP模型的擬合效果最好;②3個(gè)點(diǎn)位MIC-SVR模型對(duì)MAE的擬合結(jié)果較前3個(gè)模型的分別平均降低了約79%、74%和63%,對(duì)RMSE的擬合結(jié)果較前3個(gè)模型的分別平均降低了約43%、33%和10%。

3.3結(jié)果討論

MIC的篩選效率明顯高于皮爾遜相關(guān)性分析法的,這是因?yàn)橛绊慏O的候選因子和DO不一定僅呈線性關(guān)系,而可能存在正弦性、周期性等非線性關(guān)系。皮爾遜相關(guān)性分析法是用于度量兩個(gè)變量X和Y之間的線性相關(guān)程度的,不能識(shí)別候選因子與DO的非線性相關(guān)關(guān)系。MIC不僅可以衡量兩個(gè)變量之間是否存在線性關(guān)系,還可以觀測(cè)變量間是否具有正弦性、周期性等非線性關(guān)系,且MIC對(duì)于含有噪聲的樣本具有較好的魯棒性,因此MIC的篩選效率顯著優(yōu)于皮爾遜相關(guān)性分析法的。

MIC-SVR模型的擬合效果和預(yù)測(cè)誤差明顯優(yōu)于MIC-BP模型的。這是因?yàn)镾VR是基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則的統(tǒng)計(jì)學(xué)習(xí)方法,它通過核函數(shù)映射將非線性問題轉(zhuǎn)化為線性問題,然后通過凸二次規(guī)劃求解最大間隔分類器,最終由支持向量確定回歸函數(shù)或分類超平面。這些優(yōu)勢(shì)使得SVR在非線性回歸問題上具有較高的精度、穩(wěn)定性和泛化能力,可以更好地捕捉數(shù)據(jù)之間的非線性關(guān)系;而BP算法是基于經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原則的神經(jīng)網(wǎng)絡(luò)方法,它對(duì)訓(xùn)練數(shù)據(jù)的擬合程度過于敏感,導(dǎo)致模型參數(shù)選擇復(fù)雜、優(yōu)化困難、泛化能力差和穩(wěn)定性低。

從福建省水口水庫養(yǎng)殖水域的現(xiàn)場(chǎng)試驗(yàn)結(jié)果來看,SVR與MIC技術(shù)的混合方法能夠?yàn)榇笠?guī)模湖庫水產(chǎn)養(yǎng)殖的DO預(yù)測(cè)提供可靠的數(shù)據(jù),對(duì)分析解決類似水庫水體突發(fā)性缺氧問題具有重要意義。

4結(jié)論

1)通過皮爾遜相關(guān)性分析法和MIC技術(shù)篩選后,發(fā)現(xiàn)電導(dǎo)率、水溫、pH、葉綠素a和水位5個(gè)因子對(duì)DO的變化影響比較大,構(gòu)建DO預(yù)測(cè)模型需要重點(diǎn)監(jiān)測(cè)電導(dǎo)率、水溫、pH、葉綠素a和水位等5個(gè)關(guān)鍵驅(qū)動(dòng)因子。

2)4種DO預(yù)測(cè)模型精度從高到低排序?yàn)椋篗IC-SVR模型>MIC-BP模型>皮爾遜相關(guān)性-BP模型>獨(dú)立BP模型。MIC-SVR為最優(yōu)DO預(yù)測(cè)模型。候選因子經(jīng)過皮爾遜相關(guān)性分析法篩選后,可以提高模型預(yù)測(cè)的性能,且MIC技術(shù)對(duì)關(guān)鍵驅(qū)動(dòng)因子的篩選效率高于皮爾遜相關(guān)性法的。

3)基于MIC-SVR構(gòu)建的DO預(yù)測(cè)方法可將DO的預(yù)測(cè)誤差控制在±0.28 mg/L以內(nèi),實(shí)現(xiàn)了水口水庫DO的快速精準(zhǔn)預(yù)測(cè),為湖庫DO預(yù)測(cè)提供相關(guān)借鑒。

4)基于MIC-SVR的DO預(yù)測(cè)模型能夠在突發(fā)性缺氧時(shí)期保持較好的性能,表明該模型具有低氧預(yù)警的能力,為湖庫低氧預(yù)警平臺(tái)的建設(shè)提供了理論支持。

參考文獻(xiàn)

[1]陳仲晗,徐海升,劉翔,等.南方某水庫底層溶解氧分布特征及低氧成因分析[J].水資源保護(hù),2016,32(1):108-114.

[2]ZHANG H Y,WEI H,ZHAO L,et al.Seasonal evolution and controlling factors of bottom oxygen depletion in the Bohai Sea[J].Marine Pollution Bulletin,2022,174:113199.

[3]CAO X K,LIU Y R,WANG J P,et al.Prediction of dissolved oxygen in pond culture water based on K-means clustering and gated recurrent unit neural network[J].Aquacultural Engineering,2020,91:102122.

[4]BANERJEE A,CHAKRABARTY M,RAKSHIT N,et al.Environmental factors as indicators of dissolved oxygen concentration and zooplankton abundance:deep learning versus traditional regression approach[J].Ecological Indicators,2019,100:99-117.

[5]遲殿委,黃琪,劉麗貞,等.基于PCA-MIC-LSTM的碟形湖溶解氧含量預(yù)測(cè)模型研究[J].人民長江,2022,53(6):54-60.

[6]YANG B,GAO X L,ZHAO J M,et al.The influence of summer hypoxia on sedimentary phosphorus biogeochemistry in a coastal scallop farming area,North Yellow Sea[J].Science of The Total Environment,2021,759:143486.

[7]ZHU N Y,XIA Q,TAN J L,et al.Model-based prediction of dissolved oxygen content in fish production[J].Transactions of the ASABE,2019,62(6):1417-1425.

[8]王壽兵,程力日見,劉興國.大口黑鱸養(yǎng)殖池塘溶解氧適宜性評(píng)價(jià)[J].淡水漁業(yè),2022,52(5):83-89.

[9]REN Q,ZHANG L,WEI Y G,et al.A method for predicting dissolved oxygen in aquaculture water in an aquaponics system[J].Computers and Electronics in Agriculture,2018,151:384-391.

[10]GUO J J,DONG J Q,ZHOU B,et al.A hybrid model for the prediction of dissolved oxygen in seabass farming[J].Computers and Electronics in Agriculture,2022,198:106971.

[11]GUO J Q,YUAN H M,SONG J M,et al.Hypoxia,acidification and nutrient accumulation in the Yellow Sea Cold Water of the South Yellow Sea[J].

Science of The Total Environment,2020,745:141050.

[12]魏懷斌,李卓藝,劉靜,等.湖庫型飲用水水源地安全評(píng)估指標(biāo)體系研究[J].華北水利水電大學(xué)學(xué)報(bào)(自然科學(xué)版),2024,45(6):57-64.

[13]AHMED A A M,JUI S J J,CHOWDHURY M A I,et al.The development of dissolved oxygen forecast model using hybrid machine learning algorithm with hydro-meteorological variables[J].Environmental Science and Pollution Research,2023,30(3):7851-7873.

[14]朱全亮,劉亮,李亞俊.城中受污染湖泊水環(huán)境綜合治理探討[J].華北水利水電大學(xué)學(xué)報(bào)(自然科學(xué)版),2019,40(5):41-47.

[15]ROMAN M R,BRANDT S B,HOUDE E D,et al.Interactive effects of hypoxia and temperature on coastal pelagic zooplankton and fish[J].Frontiers in Marine Science,2019,6:139.

[16]ZHANG P,PANG Y,SHI C C,et al.Analysis and numerical simulation of natural and human-caused low dissolved oxygen in the Minjiang River Estuary[J].Water Science and Technology,2016,73(10):2475-2485.

[17]LI D S,WANG X Y,SUN J J,et al.AI-HydSu:an advanced hybrid approach using support vector regression and particle swarm optimization for dissolved oxygen forecasting[J].Mathematical Biosciences and Engineering,2021,18(4):3646-3666.

[18]LIU S Y,XU L Q,JIANG Y,et al.A hybrid WA-CPSO-LSSVR model for dissolved oxygen content prediction in crab culture[J].Engineering Applications of Artificial Intelligence,2014,29:114-124.

[19]LIU Y Q,ZHANG Q,SONG L H,et al.Attention-based recurrent neural networks for accurate short-term and long-term dissolved oxygen prediction[J].Computers and Electronics in Agriculture,2019,165:104964.

[20]ZIYAD SAMI B F,LATIF S D,AHMED A N,et al.Machine learning algorithm as a sustainable tool for dissolved oxygen prediction:a case study of Feitsui Reservoir,Taiwan[J].Scientific Reports,2022,12:3649.

[21]AZMA A,LIU Y K,AZMA M,et al.Hybrid machine learning models for prediction of daily dissolved oxygen[J].Journal of Water Process Engineering,2023,54:103957.

[22]楊明悅,毛獻(xiàn)忠.基于變量重要性評(píng)分-隨機(jī)森林的溶解氧預(yù)測(cè)模型:以深圳灣為例[J].中國環(huán)境科學(xué),2022,42(8):3876-3881.

[23]劉暢,劉曉波,周懷東,等.大流量調(diào)度過程對(duì)水庫缺氧區(qū)抑制閾值條件研究[J].水利學(xué)報(bào),2021,52(10):1217-1228.

[24]RESHEF D N,RESHEF Y A,F(xiàn)INUCANE H K,et al.Detecting novel associations in large data sets[J].Science,2011,334(6062):1518-1524.

[25]RUMELHART D E,MCCLELLAND J L.Parallel distributed processing:explorations in the microstructure of cognition[M].Cambridge,Mass:MIT Press,1986.

[26]王文川,杜玉瑾,和吉,等.基于CEEMDAN-VMD-BP模型的月徑流量預(yù)測(cè)研究[J].華北水利水電大學(xué)學(xué)報(bào)(自然科學(xué)版),2023,44(1):32-40,48.

[27]VAPNIK V N.Pattern recognition using generalized portrait method[J].Automation and Remote Control,1963,24:774-780.

[28]崔東文,郭榮.HTS算法與GRNN、SVM耦合模型在徑流預(yù)測(cè)中的應(yīng)用[J].華北水利水電大學(xué)學(xué)報(bào)(自然科學(xué)版),2018,39(5):73-81.

Comparative Study of Dissolved Oxygen Prediction Models for Reservoirs Based on Machine Learning

ZHANG Peng1, MEI Shuhao1, SHI Chengchun2, ZHUO Yue1, LI Jiahao1, SONG Gangfu1

(1.School of Environmental and Municipal Engineering, North China University of Water Resources and Electric Power, Zhengzhou 450046, China; 2.Fujian Academy of Environmental Sciences, Fuzhou 350013, China)

Abstract:

Rapid and accurate prediction of hypoxia occurrence is of great significance for maintaining the health of aquatic ecosystems. Based on the data of G1, G2 and Z1 points in the typical fishery culture area of Shuikou Reservoir in the upper reaches of Minjiang River from March 2021 to March 2022, Pearson correlation analysis and Maximum Information Coefficient(MIC) were used to screen out the key driving factors affecting dissolved oxygen from multiple water quality, meteorological and hydrological parameters. Based on the machine learning algorithm, four dissolved oxygen prediction models of independent BP, Pearson correlation-BP, MIC-BP and MIC-SVR were constructed, and the prediction results were compared and analyzed. The results showed that conductivity, water temperature, pH, chlorophyll a and water level are the five main factors affecting dissolved oxygen. After screening through correlation analysis, the performance of the constructed prediction model is improved, and the screening efficiency of MIC technology is better than that of Pearson correlation method. The MIC-SVR model is the optimal dissolved oxygen prediction model, and "R2 is greater than 0.98, RMSE is less than 0.56, and MAE is less than 0.28, which can control the prediction error of dissolved oxygen within ±0.30 mg/L. The research results can provide references for the prediction and early warning of low oxygen in lakes and reservoirs.

Keywords:

dissolved oxygen in reservoirs; correlation analysis; Maximum Information Coefficient; BP neural network; Support Vector Regression

(編輯:杜明俠)

收稿日期:2023-06-27

基金項(xiàng)目:河南省科技攻關(guān)項(xiàng)目(222102320023);2022年科技協(xié)同創(chuàng)新專項(xiàng)(61352);華北水利水電大學(xué)高層次人才科研啟動(dòng)項(xiàng)目(40768)。

第一作者:

張鵬(1988—),男,講師,博士,從事水環(huán)境數(shù)學(xué)模型方面的研究。E-mail:zhangpeng2019@ncwu.edu.cn。

猜你喜歡
相關(guān)性分析BP神經(jīng)網(wǎng)絡(luò)
濱州市城區(qū)苔蘚植物主要重金屬含量的調(diào)查與分析
就bp神經(jīng)網(wǎng)絡(luò)銀行選址模型的相關(guān)研究
人民幣匯率變動(dòng)與中國入境旅游相關(guān)性分析(2002—2016)
上市公司財(cái)務(wù)指標(biāo)與股票價(jià)格的相關(guān)性實(shí)證分析
淘寶星店成長中的粉絲力量
中國城市化與經(jīng)濟(jì)發(fā)展水平關(guān)系研究
商(2016年33期)2016-11-24 22:04:19
基于DEA—GA—BP的建設(shè)工程評(píng)標(biāo)方法研究
基于BP神經(jīng)網(wǎng)絡(luò)的旅行社發(fā)展方向研究
商情(2016年39期)2016-11-21 09:30:36
復(fù)雜背景下的手勢(shì)識(shí)別方法
BP神經(jīng)網(wǎng)絡(luò)在軟件質(zhì)量評(píng)價(jià)中的應(yīng)用研究 
车致| 石柱| 延吉市| 上蔡县| 东阿县| 吉首市| 南通市| 白玉县| 额敏县| 赤水市| 定安县| 民和| 松溪县| 电白县| 韩城市| 娱乐| 土默特右旗| 凯里市| 威信县| 涞源县| 合作市| 承德县| 鄯善县| 郓城县| 封丘县| 忻州市| 北京市| 太和县| 阿拉尔市| 济源市| 策勒县| 罗甸县| 沁源县| 泸定县| 巴彦淖尔市| 施秉县| 南木林县| 禄劝| 同德县| 那曲县| 兴山县|