国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于GWO-ELM算法模型的水體含沙量預(yù)測(cè)

2022-02-24 12:48:34何洋李麗敏溫宗周魏雄偉張明岳
科學(xué)技術(shù)與工程 2022年3期
關(guān)鍵詞:泥沙預(yù)處理神經(jīng)元

何洋, 李麗敏, 溫宗周, 魏雄偉, 張明岳

(西安工程大學(xué)電子信息學(xué)院, 西安 710600)

水土流失是水體中泥沙的根本來(lái)源,由于自然災(zāi)害以及不合理的開發(fā)利用水土資源,導(dǎo)致中國(guó)水土流失情況愈發(fā)嚴(yán)峻,且呈現(xiàn)出分布廣、面積大、侵蝕類型多的特點(diǎn),目前中國(guó)是水土流失最嚴(yán)重的國(guó)家之一[1-3]。據(jù)水利部公開資料顯示,中國(guó)每年流失的土壤總量達(dá)5×109t,造成大量泥沙進(jìn)入江河。每年進(jìn)入長(zhǎng)江流域的泥沙多達(dá)2.4×109t,其中中上游地區(qū)達(dá)1.56×109t[4-5]。泥沙導(dǎo)致河道、水庫(kù)、塘堰淤塞已嚴(yán)重影響生態(tài)系統(tǒng)的平衡及國(guó)民經(jīng)濟(jì)的持續(xù)發(fā)展,河流泥沙問(wèn)題越來(lái)越受到國(guó)家重視。實(shí)現(xiàn)水中泥沙含量的高精度預(yù)測(cè)不僅可為泥沙治理以及合理利用水土資源減小下游地區(qū)的洪澇災(zāi)害提供理論依據(jù),促進(jìn)流域生態(tài)系統(tǒng)的恢復(fù);而且對(duì)土壤侵蝕研究起至關(guān)重要的作用,對(duì)航運(yùn)和河道治理具有重要的應(yīng)用價(jià)值[6]。

該領(lǐng)域研究學(xué)者們針對(duì)水中泥沙含量演變的特點(diǎn)展開了系統(tǒng)的研究,隨著智能算法的發(fā)展,各種數(shù)學(xué)模型開始在這一研究領(lǐng)域中得以廣泛應(yīng)用,并提出了多種預(yù)測(cè)泥沙含量的方法。方馨蕊等[7]依據(jù)中分辨率成像光譜儀(medium-resolution imaging spectrometer,MODIS)衛(wèi)星遙感反射率數(shù)據(jù)針對(duì)泥沙濃度構(gòu)建了隨機(jī)森林回歸預(yù)測(cè)模型并且進(jìn)行了實(shí)驗(yàn)驗(yàn)證,然而這一方法雖然效果較好,但由于所需數(shù)據(jù)的獲取需要借助衛(wèi)星遙感,因此不具有普適性;姬厚德等[8]基于聲學(xué)原理使用多普勒剖面儀(acoustic doppler current profilers,ADCP)現(xiàn)場(chǎng)測(cè)得的回波強(qiáng)度,利用回歸公式反演泥沙含量與水體平均體積散射強(qiáng)度的關(guān)系進(jìn)行了泥沙含量的預(yù)測(cè),然而未深入考慮其他相關(guān)影響因素僅將回波強(qiáng)度作為判定標(biāo)準(zhǔn),在一定程度上會(huì)對(duì)預(yù)測(cè)精度產(chǎn)生影響,誤差較大;王帥[9]提出了使用灰色馬爾柯夫模型對(duì)水中泥沙含量進(jìn)行預(yù)測(cè),并將灰色預(yù)測(cè)模型與馬爾柯夫模型相結(jié)合,經(jīng)實(shí)驗(yàn)驗(yàn)證,雖然較好地解決了預(yù)測(cè)精度問(wèn)題,但并未對(duì)多種影響因子進(jìn)行相關(guān)性分析,易導(dǎo)致輸入數(shù)據(jù)出現(xiàn)維數(shù)災(zāi)難問(wèn)題;楊加璐等[10]使用人工蜂群算法優(yōu)化BP(back propagation)神經(jīng)網(wǎng)絡(luò)建立了年均含沙量預(yù)測(cè)模型,對(duì)黃河流域潼關(guān)站的輸沙量進(jìn)行了預(yù)測(cè),但僅將氣候要素作為預(yù)測(cè)因子,預(yù)測(cè)結(jié)果具有很大的偶然性,因此該方法精度不高;張向東等[11]采用模糊觀測(cè)數(shù)據(jù)和模糊狀態(tài)劃分的Markov模型實(shí)現(xiàn)了對(duì)遼河流域含沙量變化趨勢(shì)的預(yù)測(cè),這種方法雖然精度得到了保證但模型建立過(guò)程復(fù)雜,計(jì)算量較大;曹愛武等[12]提出了使用小波神經(jīng)網(wǎng)絡(luò)模型進(jìn)行泥沙含量的預(yù)測(cè),并且使用梯度修正法對(duì)模型的權(quán)值及小波基函數(shù)進(jìn)行了尋優(yōu),但模型所訓(xùn)練的樣本在多維輸入的情況下呈指數(shù)增長(zhǎng),增加了模型的計(jì)算復(fù)雜度,使得網(wǎng)絡(luò)收斂速度較慢。

針對(duì)以上預(yù)測(cè)方法中存在的數(shù)據(jù)維度過(guò)大導(dǎo)致計(jì)算復(fù)雜、模型學(xué)習(xí)速度慢且精度低的問(wèn)題,提出結(jié)合主成分分析(principal component analysis,PCA)算法、灰狼優(yōu)化(grey wolf optimizer,GWO)算法和極限學(xué)習(xí)機(jī)(extreme learning machine,ELM)算法模型的水體泥沙含量預(yù)測(cè)方法。利用PCA算法對(duì)原始多維數(shù)據(jù)進(jìn)行數(shù)據(jù)降維,提取出與泥沙含量演變相關(guān)性最高的主成分因子,其目的是為了避免出現(xiàn)維度災(zāi)難問(wèn)題;采用ELM算法模型對(duì)水體中的泥沙含量進(jìn)行預(yù)測(cè),改善傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型的學(xué)習(xí)速度慢、泛化性能差的缺陷;利用GWO算法對(duì)ELM模型進(jìn)行優(yōu)化,目的是為了得到ELM算法模型的最優(yōu)輸入權(quán)值矩陣和隱含層偏差,進(jìn)一步提高預(yù)測(cè)模型精度。最后通過(guò)實(shí)驗(yàn)驗(yàn)證該方法在泥沙含量預(yù)測(cè)中的預(yù)測(cè)性能,為水體中泥沙含量的高精度預(yù)測(cè)提供新的思路。

1 研究方法介紹

1.1 主成分分析算法(PCA)

PCA是常用的高維數(shù)據(jù)降維方法之一,旨在降維的過(guò)程中分離提取出幾個(gè)互相正交、可完全反映原各組數(shù)據(jù)差異性的幾個(gè)特征變量,從而達(dá)到最大化原數(shù)據(jù)方差的作用,在減少需要分析的指標(biāo)同時(shí),盡量減少原指標(biāo)包含信息的損失[13-15]。

PCA進(jìn)行數(shù)據(jù)降維的原理是將原始N維特征映射到K維上,映射后得到的K維特征即提取出的主成分變量,是在原始N維特征的數(shù)據(jù)基礎(chǔ)上按照主成分因子表達(dá)式重新構(gòu)造出來(lái)的全新特征。設(shè)向量X=[x1,x2,…,xm]T為m個(gè)影響因子構(gòu)成的m維向量,λ=λ1,λ2,…,λm(λ1≥λ2≥…≥λm)為X的協(xié)方差矩陣特征值,L=[L1i,L2i,…,Lmi]T(i=1,2,…,m)為特征值λ的正交特征向量,F(xiàn)=[F1,F2,…,Fm]T為新構(gòu)建的綜合向量,則向量F可由向量X表示,具體表達(dá)式為

Fi=L1ix1+L2ix2+…+Lmixm

(1)

式(1)中:為保留大部分原數(shù)據(jù)特征,通常取方差最大的前n個(gè)主成分因子,且定義前n個(gè)主成分因子的累計(jì)貢獻(xiàn)率大于等于85%為篩選出來(lái)的n(n

1.2 極限學(xué)習(xí)機(jī)算法(ELM)

ELM是一種全新的單隱含層前饋神經(jīng)網(wǎng)絡(luò)算法[16]。其相比于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)算法的最大優(yōu)勢(shì)在于輸入層和隱含層的連接權(quán)值、隱含層的閾值在模型訓(xùn)練過(guò)程中隨機(jī)產(chǎn)生,且設(shè)定完成后不需要進(jìn)行再次調(diào)整;隱含層和輸出層之間的連接權(quán)值β是通過(guò)解方程組的方式確定出來(lái)的唯一解,不需要對(duì)其進(jìn)行迭代調(diào)整[17]。因此ELM算法模型具有結(jié)構(gòu)簡(jiǎn)單以及泛化性能較好的特點(diǎn),在確保學(xué)習(xí)精度的同時(shí)運(yùn)算速率比傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)算法更快。其算法模型結(jié)構(gòu)如圖1所示。

xj為網(wǎng)絡(luò)的輸入;n為輸入層的輸入因子個(gè)數(shù);l為隱含層的神經(jīng)元個(gè)數(shù);bi為第i個(gè)隱層單元的偏置,βl為輸出權(quán)重,oj為網(wǎng)絡(luò)的輸出

對(duì)于有l(wèi)個(gè)隱含層神經(jīng)元個(gè)數(shù)和激活函數(shù)為g(x)的單隱層神經(jīng)網(wǎng)絡(luò),當(dāng)樣本為(xi,ti)∈Rn×Rm時(shí),其數(shù)學(xué)模型可以表示為

(2)

式(2)中:wi=[wi1,wi2,…,win]T為連接第i個(gè)隱含層神經(jīng)元節(jié)點(diǎn)和輸入節(jié)點(diǎn)的輸入權(quán)重;βi=[βi1,βi2,…,βim]為輸出節(jié)點(diǎn)的輸出權(quán)重。

由于ELM隱含層與輸出層之間的權(quán)重矩陣是偽逆矩陣,因此可將式(2)簡(jiǎn)寫為

Hβ=T

(3)

H=

(4)

(5)

(6)

式中:H為隱含層節(jié)點(diǎn)輸出矩陣;β為輸出權(quán)重;T為訓(xùn)練集目標(biāo)矩陣。在ELM算法中,當(dāng)激活函數(shù)g(x)無(wú)限可微時(shí),輸入權(quán)重wi和偏置bi可以被隨機(jī)確定。此時(shí)ELM的優(yōu)化模型為

(7)

(8)

1.3 GWO-ELM算法模型

GWO算法是受灰狼捕獵啟發(fā)提出的一種智能仿生優(yōu)化算法,該算法以系統(tǒng)化、遞進(jìn)化、層次化思想為框架,因其具有較強(qiáng)的收斂性能以及參數(shù)較少的特點(diǎn),因此優(yōu)化性能較其他仿生算法相比效果更好[18]。

GWO優(yōu)化過(guò)程包含灰狼的狩獵、圍捕、攻擊等步驟。狩獵時(shí)第一步是包圍獵物,數(shù)學(xué)模型為

H=|MXP(t)-X(t)|

(9)

X(t+1)=XP(t)-NH

(10)

式中:t為當(dāng)前迭代次數(shù);M和N為系數(shù);XP為獵物的位置向量;X(t)為灰狼的當(dāng)前位置向量;M和N運(yùn)用動(dòng)態(tài)搜索進(jìn)行更新,計(jì)算方式為

M=2r2

(11)

N=2ar1-a

(12)

在整個(gè)迭代過(guò)程中,a由2降至0,r1和r2是[0,1]的隨機(jī)數(shù)。

灰狼包圍獵物后便開始捕獵活動(dòng),該步驟灰狼分為α、β、δ、ω4個(gè)等級(jí)進(jìn)行圍獵。ω根據(jù)α、β、δ的位置信息進(jìn)行更新,α、β、δ3個(gè)等級(jí)對(duì)應(yīng)的搜索單位圍捕方式為

Rλ=|MλXλ|

(13)

Xi=Xλ-Nλ(Rλ)

(14)

(15)

式中:搜索單位λ=α、β、δ;X(t+1)為更新后的潛在最優(yōu)解向量。

最后便是攻擊獵物,即搜索到GWO優(yōu)化得到的最優(yōu)解,該步驟通過(guò)a的線性下降完成。

ELM算法模型在訓(xùn)練學(xué)習(xí)過(guò)程中可以隨機(jī)確定輸入層與隱含層間的連接權(quán)值及隱含層神經(jīng)元閾值,只需要確定出模型的最優(yōu)隱含層神經(jīng)元節(jié)點(diǎn)數(shù),便可得到模型的全局最優(yōu)解[19]。與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)算法相比,雖然ELM模型運(yùn)算速率快、泛化性能好,但和傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)一樣容易陷入局部最優(yōu),對(duì)預(yù)測(cè)精度產(chǎn)生一定的影響。因此引入GWO算法對(duì)ELM算法模型進(jìn)行優(yōu)化組合,結(jié)合ELM的多層算法深度學(xué)習(xí)特性以及GWO較強(qiáng)的收斂性能,通過(guò)ELM模型的誤差反饋更新灰狼位置信息,達(dá)到全局最優(yōu)解的效果。其算法流程如圖2所示。

圖2 GWO-ELM算法流程圖

2 研究區(qū)概況

研究區(qū)位于長(zhǎng)江口北槽,長(zhǎng)江口水域全長(zhǎng)約232 km,平面呈上窄下寬型,江面寬度逐漸變寬,最寬處寬度達(dá)到了90 km,窄口處寬度不足6 km,黃浦江、練祁河、瀏河等是匯入長(zhǎng)江口水域的較大水系,江口主要由北港、南港、南槽、北槽等構(gòu)成[20]。

北槽長(zhǎng)江口處于九段沙與銅沙灘之間,N31°05′~31°18′,E121°48′~122°17′,全長(zhǎng)68 km,槽寬250 m,是長(zhǎng)江流域水沙入海的主要通道,同時(shí)也是深水航道所在河段,是萬(wàn)噸級(jí)船只進(jìn)出長(zhǎng)江口的主要航道[21]。在人類活動(dòng)的干擾下,1979—2019年的40年期間,北槽河段的泥沙來(lái)源以河槽侵蝕為主,總體上呈現(xiàn)出主槽侵蝕,兩岸淤積和深水航道泥沙回淤嚴(yán)重的特征。凈沖刷的泥沙體積達(dá)3.6×107m3,平均每年沖刷9×105m3,造成了大量泥沙在江口的沉積,逐漸抬高河床,對(duì)航運(yùn)和江口治理造成了很大的影響[22]。

水體中泥沙含量演變呈現(xiàn)出復(fù)雜的非線性特征,具有運(yùn)動(dòng)形式復(fù)雜、監(jiān)測(cè)建模較難等特點(diǎn)。只有對(duì)流域自然地理特征及與泥沙演變相關(guān)的特征數(shù)據(jù)進(jìn)行整理、分析、研究,打下良好的數(shù)據(jù)基礎(chǔ),選取合適的影響因子,并建立泥沙含量預(yù)測(cè)模型,才能更有效地為泥沙測(cè)驗(yàn)項(xiàng)目提供科學(xué)依據(jù),為相關(guān)部門開展流域治理工作以及修建大型水利設(shè)施奠定理論基礎(chǔ)。

3 建模過(guò)程和結(jié)果分析

3.1 確定影響因子及數(shù)據(jù)來(lái)源

根據(jù)《河流懸移質(zhì)泥沙測(cè)驗(yàn)規(guī)范》(GB/T 50159—2015),參考相關(guān)文獻(xiàn)以及相關(guān)監(jiān)測(cè)站點(diǎn)和部門的資料,通過(guò)對(duì)研究區(qū)泥沙含量演變的地理特征和泥沙來(lái)源情況的分析,本文中選取2001年4月長(zhǎng)江口北槽國(guó)家重點(diǎn)水文監(jiān)測(cè)項(xiàng)目監(jiān)測(cè)站的歷史數(shù)據(jù)作為數(shù)據(jù)集,數(shù)據(jù)摘自《中國(guó)河流泥沙公報(bào)》,收集得到8種初始影響因子的原始數(shù)據(jù)共76組樣本(表1),類型分別為懸移質(zhì)顆粒級(jí)配A1(mm)、徑流量A2(m3/s)、降水量A3(mm)、蒸發(fā)量A4(mm)、植被覆蓋率A5(%)、平均水深A(yù)6(m)、平均流速A7(m/s)、平均流向A8(°)。將數(shù)據(jù)集中前60組樣本數(shù)據(jù)作為訓(xùn)練集進(jìn)行網(wǎng)絡(luò)模型訓(xùn)練,后16組樣本作為測(cè)試集數(shù)據(jù)用于預(yù)測(cè)及驗(yàn)證,利用PCA算法對(duì)8種初始影響因子進(jìn)行數(shù)據(jù)降維,設(shè)定累計(jì)貢獻(xiàn)率大于85%為主成分,將提取出來(lái)的主成分因子數(shù)據(jù)輸入到GWO-ELM模型中進(jìn)行訓(xùn)練學(xué)習(xí)并驗(yàn)證,最后輸出預(yù)測(cè)結(jié)果。經(jīng)多次實(shí)驗(yàn)與仿真分析,最終選擇出了4種影響因子,其提取后的變量如圖3所示。

表1 影響因子列表

由圖3中PCA主成分提取變量結(jié)果可得,前4個(gè)成分的累計(jì)貢獻(xiàn)率為39.914%、66.272%、78.429%、88.807%,且到第4個(gè)成分時(shí)的累計(jì)貢獻(xiàn)率達(dá)到了88.807%大于定義主成分臨界值85%。因此利用PCA主成分分析法時(shí)前4個(gè)成分較為全面的反映出原始指標(biāo)體系,能夠?qū)⒊跏嫉?維變量數(shù)據(jù)降至4維,由4個(gè)公因子表征出來(lái),降低了模型數(shù)據(jù)結(jié)構(gòu)復(fù)雜度且消除了數(shù)據(jù)之間的相關(guān)冗余度,同時(shí)又保證了數(shù)據(jù)在實(shí)際應(yīng)用中的相對(duì)合理性。所得到的主成分系數(shù)矩陣如表2所示。

圖3 PCA主成分提取變量

表2 主成分系數(shù)矩陣

根據(jù)表2中主成分系數(shù)矩陣可得,重構(gòu)的4個(gè)主成分因子表達(dá)式為

Z1=0.573A1-0.72A2+0.57A3+0.796A4-

0.403A5+0.516A6+0.69A7+0.866A8

(16)

Z2=0.758A1-0.113A2+0.684A3+0.16A4+

0.269A5-0.69A6-0.488A7-0.266A8

(17)

Z3=-0.091A1-0.093A2+0.614A3+0.589A4-

0.066A5-0.011A6-0.265A7+0.057A8

(18)

Z4=-0.038A1+0.12A2+0.01A3+0.075A4+

0.025A5+0.253A6-0.238A7+0.952A8

(19)

將原始8維影響因子數(shù)據(jù)A1~A8按照式(16)~式(19)進(jìn)行計(jì)算,得到重構(gòu)的4維主成分變量Z1~Z4,取代初始影響因子作為GWO-ELM預(yù)測(cè)模型的輸入。

3.2 數(shù)據(jù)預(yù)處理

由于研究區(qū)情況復(fù)雜,在惡劣環(huán)境下用于監(jiān)測(cè)特征數(shù)據(jù)的傳感器會(huì)不可避免地受到環(huán)境因素的影響,因此需要對(duì)整理得到的數(shù)據(jù)進(jìn)行預(yù)處理。

(1)加權(quán)平滑處理。為了避免偶然數(shù)據(jù)對(duì)模型預(yù)測(cè)精度的影響,對(duì)所有的樣本數(shù)據(jù)進(jìn)行加權(quán)平滑降噪處理,均衡樣本數(shù)據(jù)。

(2)缺失值處理。對(duì)遺漏的傳感器數(shù)據(jù)按屬性對(duì)其進(jìn)行整理,得到累計(jì)缺失率q,若q≥90%,則可將該部分?jǐn)?shù)據(jù)全部去除;若40%≤q<90%,則采用相鄰屬性加權(quán)對(duì)其進(jìn)行填充;若20%≤q<40%,使用均值作為填充值補(bǔ)全數(shù)據(jù);若q<20%,采用眾數(shù)對(duì)數(shù)據(jù)進(jìn)行填充。

(3)歸一化。由于不同種類的數(shù)據(jù)量綱不同,數(shù)據(jù)的多樣化會(huì)增加模型的計(jì)算復(fù)雜度,對(duì)模型的預(yù)測(cè)準(zhǔn)確率會(huì)產(chǎn)生很大的干擾,所以對(duì)得到的原始數(shù)據(jù)進(jìn)行歸一化處理是不可或缺的一個(gè)環(huán)節(jié),將所有數(shù)據(jù)歸一化至[0,1]區(qū)間。歸一化處理公式為

(20)

式(20)中:R′為進(jìn)行了歸一化處理后的數(shù)據(jù);R為原始數(shù)據(jù);Rmax和Rmin為原始數(shù)據(jù)中的最大值和最小值。分別對(duì)預(yù)處理之前和預(yù)處理之后的數(shù)據(jù),在相同實(shí)驗(yàn)條件下分別輸入GWO-ELM預(yù)測(cè)模型進(jìn)行實(shí)驗(yàn),經(jīng)多次實(shí)驗(yàn)驗(yàn)證,得到的數(shù)據(jù)預(yù)處理前后的結(jié)果對(duì)比如圖4和表3所示。

圖4 數(shù)據(jù)預(yù)處理前后GWO-ELM模型預(yù)測(cè)結(jié)果對(duì)比

表3 數(shù)據(jù)預(yù)處理前后GWO-ELM模型預(yù)測(cè)結(jié)果對(duì)比

從圖4和表3可以看出,對(duì)于未經(jīng)過(guò)預(yù)處理的數(shù)據(jù),由于數(shù)據(jù)存在遺漏、缺失等現(xiàn)象,因此預(yù)測(cè)準(zhǔn)確率僅有75.52%,平均誤差為11.438%,數(shù)據(jù)未進(jìn)行歸一化處理,各類數(shù)據(jù)量綱不同,不僅影響到了測(cè)試集預(yù)測(cè)準(zhǔn)確率,且增加了模型對(duì)數(shù)據(jù)的訓(xùn)練難度和時(shí)間,訓(xùn)練時(shí)間為2.508 s。然而,對(duì)于經(jīng)過(guò)預(yù)處理的數(shù)據(jù),輸入模型之后,其預(yù)測(cè)準(zhǔn)確率達(dá)到了91.26%,訓(xùn)練時(shí)間為0.905 s,平均誤差僅為3.137%。仿真結(jié)果表明,對(duì)數(shù)據(jù)進(jìn)行預(yù)處理是及其具有必要的,不僅可以減小模型的平均誤差和縮短訓(xùn)練時(shí)間,而且該數(shù)據(jù)預(yù)處理方式可以有效提升模型的預(yù)測(cè)準(zhǔn)確率。

3.3 仿真驗(yàn)證及結(jié)果分析

3.3.1 隱含層神經(jīng)元節(jié)點(diǎn)數(shù)的確定

在ELM算法中,隱含層神經(jīng)元節(jié)點(diǎn)數(shù)對(duì)算法模型的計(jì)算速率和預(yù)測(cè)準(zhǔn)確率會(huì)產(chǎn)生很大影響,節(jié)點(diǎn)數(shù)過(guò)少會(huì)使模型出現(xiàn)“欠擬合”,過(guò)多則會(huì)導(dǎo)致“過(guò)擬合”,因此確定模型的最優(yōu)隱含層節(jié)點(diǎn)數(shù)是預(yù)測(cè)模型建立前的重點(diǎn)工作。為了確定模型的最優(yōu)隱含層神經(jīng)元節(jié)點(diǎn)數(shù),分別以PCA算法分析后重構(gòu)的Z1~Z44組數(shù)據(jù)、原始A1~A88組數(shù)據(jù)以及經(jīng)過(guò)PCA分析但未進(jìn)行重構(gòu)的A1~A44組原始數(shù)據(jù)分別作為ELM算法模型的輸入,進(jìn)行了3組在相同實(shí)驗(yàn)條件下的預(yù)測(cè)實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如圖5所示。每組實(shí)驗(yàn)中分別設(shè)置了隱含層神經(jīng)元節(jié)點(diǎn)數(shù)為0~100的獨(dú)立實(shí)驗(yàn),對(duì)每組實(shí)驗(yàn)分別重復(fù)進(jìn)行10次,消除偶然性和隨機(jī)性對(duì)實(shí)驗(yàn)結(jié)果產(chǎn)生的影響。

圖5 隱含層神經(jīng)元節(jié)點(diǎn)數(shù)與測(cè)試集準(zhǔn)確率對(duì)比

由圖5可知隨著隱含層神經(jīng)元節(jié)點(diǎn)數(shù)的增加,ELM模型的測(cè)試集準(zhǔn)確率在逐步增長(zhǎng)。在進(jìn)行了PCA分析后重構(gòu)的數(shù)據(jù)中,當(dāng)隱含層神經(jīng)元節(jié)點(diǎn)數(shù)為23時(shí)模型的預(yù)測(cè)準(zhǔn)確率逐漸趨于穩(wěn)定。而原始8組變量數(shù)據(jù)和經(jīng)過(guò)PCA分析但未進(jìn)行重構(gòu)的4組原始數(shù)據(jù)當(dāng)隱含層神經(jīng)元節(jié)點(diǎn)數(shù)分別為30和36時(shí)模型的預(yù)測(cè)準(zhǔn)確率才逐漸穩(wěn)定。并且在隱含層神經(jīng)元節(jié)點(diǎn)數(shù)相同的情況下,經(jīng)過(guò)PCA分析的測(cè)試集預(yù)測(cè)準(zhǔn)確率最高,說(shuō)明PCA不僅可以數(shù)據(jù)降維,減小模型的運(yùn)算復(fù)雜度,而且能減少模型所需的隱含層神經(jīng)元節(jié)點(diǎn)數(shù),簡(jiǎn)化了模型網(wǎng)絡(luò)結(jié)構(gòu),可在相同的實(shí)驗(yàn)條件下提高模型預(yù)測(cè)精度。

3.3.2 GWO-ELM模型的泥沙含量預(yù)測(cè)

將76組樣本通過(guò)PCA主成分因子表達(dá)式重構(gòu)的數(shù)據(jù)作為模型的輸入。設(shè)定組號(hào)1~60的樣本為訓(xùn)練集,用來(lái)訓(xùn)練模型;設(shè)定組號(hào)61~76的16組樣本為測(cè)試集,用來(lái)模型預(yù)測(cè)及驗(yàn)證。使用GWO對(duì)ELM進(jìn)行參數(shù)優(yōu)化,尋找ELM模型最優(yōu)的輸入權(quán)值和隱含層偏置,最大程度上提高模型預(yù)測(cè)精度。考慮到算法的運(yùn)算復(fù)雜度及最優(yōu)解精度等問(wèn)題,經(jīng)過(guò)多次反復(fù)實(shí)驗(yàn),GWO算法的相關(guān)參數(shù)設(shè)置如下:狼群大小40,最大遺傳代數(shù)100,狼所在位置對(duì)獵物影響的權(quán)重為[0,2]。

由上述分析可知當(dāng)隱含層神經(jīng)元節(jié)點(diǎn)數(shù)為23時(shí)ELM模型測(cè)試集準(zhǔn)確率逐漸趨于穩(wěn)定,考慮到預(yù)測(cè)模型的復(fù)雜度和計(jì)算速率問(wèn)題,因此將GWO-ELM模型的隱含層神經(jīng)元節(jié)點(diǎn)數(shù)同樣設(shè)置為23。將ELM算法隨機(jī)產(chǎn)生的輸入權(quán)值矩陣和隱含層偏置矩陣作為GWO的初始種群,然后創(chuàng)建GWO-ELM網(wǎng)絡(luò),以經(jīng)過(guò)PCA分析后重構(gòu)的數(shù)據(jù)進(jìn)行訓(xùn)練測(cè)試,計(jì)算得到預(yù)測(cè)準(zhǔn)確率。將預(yù)測(cè)準(zhǔn)確率的倒數(shù)作為個(gè)體適應(yīng)度函數(shù),以最小適應(yīng)度函數(shù)為標(biāo)準(zhǔn)選擇最優(yōu)解,然后對(duì)初始種群進(jìn)行圍捕、識(shí)別、攻擊獵物等操作,重復(fù)以上步驟使模型迭代至最大遺傳代數(shù),最后得到最優(yōu)權(quán)值矩陣和偏置矩陣。

為了驗(yàn)證本文所提方法的預(yù)測(cè)效果,在同等實(shí)驗(yàn)條件下將ELM預(yù)測(cè)模型、灰色馬爾科夫預(yù)測(cè)模型和BP算法預(yù)測(cè)模型與GWO-ELM模型進(jìn)行多次實(shí)驗(yàn)分析對(duì)比,對(duì)比結(jié)果如圖6所示。

圖6 實(shí)際泥沙含量值與4種預(yù)測(cè)模型結(jié)果對(duì)比

從圖6預(yù)測(cè)曲線可得,本文所提方法的預(yù)測(cè)結(jié)果較其他3種算法更接近實(shí)際泥沙含量,有較好的預(yù)測(cè)性能。

為了進(jìn)一步對(duì)比本文所提方法的預(yù)測(cè)效果,引入了以下3種性能評(píng)價(jià)指標(biāo)進(jìn)行驗(yàn)證。

(1)均方根誤差(root mean square error,RMSE):

(21)

(2)平均絕對(duì)誤差(mean absolute error,MAE):

(22)

(3)判定系數(shù)R2:

(23)

表4為本文方法與其他3種方法的預(yù)測(cè)性能指標(biāo)對(duì)比結(jié)果。

表4 模型性能評(píng)價(jià)結(jié)果

從表4模型性能評(píng)比結(jié)果可得出,本文方法預(yù)測(cè)精度優(yōu)于其他3種預(yù)測(cè)模型,在RMSE與MAE評(píng)價(jià)指標(biāo)中,得到的均方根誤差與平均絕對(duì)誤差分別為0.229和0.183,相比于其他3種模型更接近實(shí)際泥沙含量值且誤差最小,判定系數(shù)R2=0.938,高于其他3種模型,表明預(yù)測(cè)值與實(shí)際值擬合效果最好,精度最高,預(yù)測(cè)結(jié)果具有相對(duì)可靠性。

4 結(jié)論

以水體中泥沙含量為研究對(duì)象,基于預(yù)測(cè)中影響因子維數(shù)災(zāi)難問(wèn)題與傳統(tǒng)極限學(xué)習(xí)機(jī)預(yù)測(cè)性能部分缺陷的問(wèn)題,提出了PCA數(shù)據(jù)降維和GWO-ELM預(yù)測(cè)模型算法,采用長(zhǎng)江口北槽研究區(qū)監(jiān)測(cè)點(diǎn)數(shù)據(jù)進(jìn)行實(shí)驗(yàn)驗(yàn)證。同時(shí)將本文方法與未進(jìn)行參數(shù)優(yōu)化的ELM預(yù)測(cè)模型、灰色馬爾科夫預(yù)測(cè)模型、BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的預(yù)測(cè)輸出結(jié)果進(jìn)行了對(duì)比。

(1)由于考慮到研究區(qū)影響泥沙含量演變的因素較多且各影響因素權(quán)重分布不均,因此提出利用PCA進(jìn)行數(shù)據(jù)降維,將原始8維影響因子降維至4維,根據(jù)主成分矩陣賦予各類原始影響因子合理權(quán)重,減小了模型的計(jì)算復(fù)雜度,縮短了運(yùn)算時(shí)間,同時(shí)又保證了數(shù)據(jù)在應(yīng)用中的相對(duì)合理性,而且在相同隱含層神經(jīng)元節(jié)點(diǎn)數(shù)的情況下預(yù)測(cè)準(zhǔn)確率得到了顯著的提高。

(2)由于研究區(qū)環(huán)境復(fù)雜,傳感器采集到的數(shù)據(jù)存在缺失、設(shè)備損耗等現(xiàn)象,對(duì)預(yù)測(cè)結(jié)果會(huì)產(chǎn)生一定程度的影響,因此對(duì)數(shù)據(jù)進(jìn)行了預(yù)處理,將預(yù)處理前和預(yù)處理后的數(shù)據(jù)分別輸入到所提出的模型中,經(jīng)過(guò)結(jié)果對(duì)比驗(yàn)證了數(shù)據(jù)預(yù)處理的必要性,數(shù)據(jù)處理后模型的準(zhǔn)確率得到了很大的提高,達(dá)到了91.26%,同時(shí)模型的訓(xùn)練時(shí)間以及平均誤差均得到了改善。

(3)將GWO-ELM模型應(yīng)用于區(qū)域泥沙含量預(yù)測(cè)中,以GWO優(yōu)化ELM的最優(yōu)權(quán)值矩陣和偏置矩陣參數(shù),平衡模型的學(xué)習(xí)速率與泛化能力,提高了模型的預(yù)測(cè)準(zhǔn)確率。同時(shí)與其他3種預(yù)測(cè)模型在相同實(shí)驗(yàn)條件下進(jìn)行了多次實(shí)驗(yàn)對(duì)比,對(duì)比結(jié)果表明本文方法效果更好,預(yù)測(cè)值與實(shí)際值擬合效果最好且誤差最小。因此將該方法用于對(duì)水體中泥沙含量進(jìn)行預(yù)測(cè)是可行的,為泥沙測(cè)驗(yàn)項(xiàng)目的高精度預(yù)測(cè)提供了新的思路和理論依據(jù)。

⑷由于泥沙的演變形成與自然環(huán)境和地區(qū)有較大的聯(lián)系,因此,本文方法在后期研究中還需要做出進(jìn)一步的優(yōu)化和完善,使之能應(yīng)用于其他流域地區(qū)。

猜你喜歡
泥沙預(yù)處理神經(jīng)元
泥沙做的父親
《從光子到神經(jīng)元》書評(píng)
自然雜志(2021年6期)2021-12-23 08:24:46
新疆多泥沙河流水庫(kù)泥沙處理措施
土壤團(tuán)聚體對(duì)泥沙沉降速度的影響
躍動(dòng)的神經(jīng)元——波蘭Brain Embassy聯(lián)合辦公
基于預(yù)處理MUSIC算法的分布式陣列DOA估計(jì)
淺談PLC在預(yù)處理生產(chǎn)線自動(dòng)化改造中的應(yīng)用
絡(luò)合萃取法預(yù)處理H酸廢水
基于二次型單神經(jīng)元PID的MPPT控制
泥沙滅火
兒童繪本(2015年2期)2015-05-25 18:10:15
大同县| 临汾市| 赣榆县| 雅江县| 康保县| 中山市| 黔江区| 大化| 古蔺县| 来宾市| 郸城县| 深泽县| 扎囊县| 五河县| 越西县| 罗城| 陈巴尔虎旗| 长寿区| 紫金县| 沙田区| 建平县| 吉林省| 安图县| 沈阳市| 延长县| 吉安市| 固镇县| 博客| 从江县| 海林市| 武乡县| 青川县| 棋牌| 鄂伦春自治旗| 江孜县| 丰台区| 巴林右旗| 安仁县| 平凉市| 邢台县| 达拉特旗|