覃 苗,張明峰,洪 頤,蘇玉萍,4*,陳楊鋒,李赫龍,陳宇昕
(1.福建師范大學(xué)環(huán)境科學(xué)與工程學(xué)院,福建 福州 350007; 2.福建師范大學(xué)地理科學(xué)學(xué)院,福建 福州 350007; 3.法國巴黎高科路橋大學(xué)城市與水環(huán)境實(shí)驗(yàn)室,法國 巴黎 77455; 4.福建師范大學(xué),福建省污染控制與資源循環(huán)重點(diǎn)實(shí)驗(yàn)室,福建 福州 350007)
社會的進(jìn)步以及工、農(nóng)業(yè)的迅速發(fā)展,給湖泊水庫的水質(zhì)帶來了污染。在陸地上貧瘠的氮、磷等元素,在水中卻過多的存在,從而引起了一種有害的自然現(xiàn)象——水華暴發(fā)。水華暴發(fā)是一種由于水體富營養(yǎng)化等多種原因綜合影響而引發(fā)的自然現(xiàn)象,當(dāng)氣候和水質(zhì)有利于藻類生長和聚集時(shí),藻類呈現(xiàn)暴發(fā)性繁殖和聚集,通常伴有水面變色[1]。水中存在的過多的氮、磷等營養(yǎng)物質(zhì)是水華產(chǎn)生的主要原因,而諸如pH、氣候等條件也會對其暴發(fā)造成一定的影響[2-3]。本文的研究對象——福清市東張水庫為飲用水地表水源保護(hù)區(qū),于2007—2017年的10年間在大壩區(qū)域多次暴發(fā)藍(lán)藻水華[4-7]。因此,通過一定的監(jiān)測預(yù)警模型,預(yù)見性地提醒相關(guān)部門及時(shí)采取相應(yīng)的防控措施,對有效防治水華的暴發(fā)就顯得尤為重要。
近年來,隨著人工智能的迅速發(fā)展,基于數(shù)理統(tǒng)計(jì)和人工神經(jīng)網(wǎng)絡(luò)的預(yù)警模型系統(tǒng)在水華預(yù)警預(yù)報(bào)研究中得到了一定的應(yīng)用。研究人員以BP模型作為手段,建立了各種水華預(yù)警模型,Maier等通過人工神經(jīng)網(wǎng)絡(luò)建立了預(yù)測模型,預(yù)測了澳大利亞River Murray流域藍(lán)藻水華的暴發(fā)[8];Lee等則以ANN預(yù)測了香港沿海流域藻類水華的發(fā)生[9];仝玉華運(yùn)用RBF/BP網(wǎng)絡(luò)藻類水華預(yù)測模型,分析運(yùn)算了其研究流域中的水華分布時(shí)空規(guī)律,針對性建立了多元線性回歸預(yù)測模型[10]。
在建立水體富營養(yǎng)化和因其所致的水華暴發(fā)預(yù)警模型時(shí),BP人工神經(jīng)網(wǎng)絡(luò)作為一個十分合適的工具,具有許多獨(dú)有的優(yōu)點(diǎn),例如方法簡單、無需建立復(fù)雜的數(shù)學(xué)計(jì)算模型、具有很強(qiáng)的適應(yīng)性和容錯性、具有較強(qiáng)的處理非線性問題的能力等。BP人工神經(jīng)智能網(wǎng)絡(luò)作為一種以數(shù)據(jù)作為驅(qū)動的模型,其最大的特點(diǎn)是具有自學(xué)習(xí)、記憶聯(lián)想和判別功能。而這種學(xué)習(xí)、判別功能需要大量的環(huán)境參數(shù)和水質(zhì)檢測數(shù)據(jù)。因此收集足夠數(shù)量的樣本數(shù)據(jù)成為BP人工神經(jīng)網(wǎng)絡(luò)模型解決水華預(yù)測成敗的關(guān)鍵。本文通過長期對東張水庫的監(jiān)測所獲取大量的數(shù)據(jù),運(yùn)用人工神經(jīng)網(wǎng)絡(luò)模型進(jìn)行運(yùn)算,探討了預(yù)測藍(lán)藻水華暴發(fā)的可能性,旨在為藍(lán)藻水華暴發(fā)的預(yù)警提供新的方法,為相關(guān)部門在藍(lán)藻水華的防控提供參考。
本研究數(shù)據(jù)來自福清市東張水庫(圖1,119°29′20″E、25°46′6″N)自動監(jiān)測站2016—2017年水體大壩斷面數(shù)據(jù),共295組有效數(shù)據(jù),包括水溫、溶解氧、電導(dǎo)率等在線水質(zhì)檢測數(shù)據(jù)(表1)。且該數(shù)據(jù)樣本包含大壩斷面水華期間的數(shù)據(jù)。
表1 主要的檢測參數(shù)和單位
為建立BP人工神經(jīng)網(wǎng)絡(luò)模型,將水質(zhì)參數(shù)做交叉對比,選出輸出結(jié)果較好的水質(zhì)輸入指標(biāo),綜合比對福清市的氣象數(shù)據(jù)(氣溫、風(fēng)速),將水質(zhì)參數(shù)與氣象數(shù)據(jù)組合作為自變量輸入模型,以葉綠素a濃度為因變量,通過BP人工神經(jīng)網(wǎng)絡(luò)模型來探究水質(zhì)與水華暴發(fā)之間的相關(guān)性,并選出輸出結(jié)果較好的輸入?yún)?shù)組合應(yīng)用于后期水庫藍(lán)藻水華的預(yù)測。
在模型的構(gòu)建過程中,采用的取樣方法是對295組樣本做隨機(jī)排序,抽取后80%的數(shù)據(jù)進(jìn)行模型訓(xùn)練,前20%作為測試數(shù)據(jù)進(jìn)行檢驗(yàn)。在模型訓(xùn)練完成后,以測試數(shù)據(jù)檢測該模型的訓(xùn)練結(jié)果,并輸出訓(xùn)練擬合結(jié)果,且獲取訓(xùn)練值與測試數(shù)據(jù)的誤差,獲得誤差比值,模型運(yùn)行結(jié)束。
1.2.1 模型的建立和演繹過程
假設(shè)在模型中的任意一個節(jié)點(diǎn)輸入信號為xi,輸出信號為yi。
j=1,2,……,l;
hj=fvj,j=1,2,……,j;
因此,如果有n層,并且第n層指且僅指輸出層級,而第一層為輸入層級。則該模型的BP算法則由以下推演而出:
首先,初始化連接權(quán)重值ω1,同時(shí)初始化激活閾值(初始化偏置)a1、b1;接著,重復(fù)以下的過程直到輸出結(jié)果收斂:
1.2.2 數(shù)據(jù)處理
采用SPSS 23.0軟件進(jìn)行Spearman相關(guān)分析。利用 MATLAB R2016b 建立東張水庫藍(lán)藻水華BP 人工神經(jīng)網(wǎng)絡(luò)模型。
對本次研究所用的295組數(shù)據(jù)進(jìn)行了相關(guān)性分析。結(jié)果如表2所示。
表2 東張水庫各指標(biāo)因子間的Spearman相關(guān)關(guān)系
注:*表示顯著相關(guān)(P<0.05,2-tailed),**表示極顯著相關(guān)(P<0.01,2-tailed)。
Notes:*indicates significant correlation(P<0.05,2-tailed),**indicates extremely significant correlation(P<0.01,2-tailed).
在淡水湖庫中,浮游植物的生長受多種環(huán)境因子的制約,而湖庫水中存在的葉綠素a則在一定程度上反映該流域內(nèi)浮游植物的生長情況[11]。根據(jù)表2的相關(guān)性分析結(jié)果,可以知道,在東張水庫水體的水質(zhì)檢測建模數(shù)據(jù)中,水溫、溶氧等在線監(jiān)測指標(biāo)數(shù)據(jù)與葉綠素a之間存在較好的相關(guān)性(P<0.05)。并且氣溫、風(fēng)速等氣象指標(biāo)對藻類的生長也存在著協(xié)同效應(yīng)。因此葉綠素a數(shù)值會伴隨著各個相關(guān)數(shù)值的改變而變化。因此選取相關(guān)性結(jié)果較好的因子進(jìn)行模型演算是合適的。
選取了可以在線監(jiān)測、數(shù)值準(zhǔn)確的水質(zhì)指標(biāo),以不同的數(shù)據(jù)組合作為輸入?yún)?shù),經(jīng)大量的重復(fù)試驗(yàn)運(yùn)算,不同的數(shù)據(jù)組獲得的輸出結(jié)果如表3所示。從中篩選出最優(yōu)的參數(shù)組合。從表3各參數(shù)組合指標(biāo)輸出結(jié)果的誤差及擬合度的結(jié)果可以看出,以水溫和溶解氧(組合2)作為輸入?yún)?shù),其輸出結(jié)果葉綠素a的預(yù)測值的均方根誤差(RMSE)為0.10 μg/L,均方根與實(shí)測值標(biāo)準(zhǔn)偏差比(RSR)為0.84,R2=0.34;而增加了電導(dǎo)率作為輸入?yún)?shù)(組合3),其輸出結(jié)果有了較大提升,均方根誤差(RMSE)為0.09 μg/L,均方根與實(shí)測值標(biāo)準(zhǔn)偏差比(RSR)為0.56,R2=0.74。但當(dāng)再加入濁度作為輸入?yún)?shù)(組合4)時(shí),輸出結(jié)果葉綠素a的預(yù)測值的均方根誤差(RMSE)為0.11 μg/L,均方根與實(shí)測值標(biāo)準(zhǔn)偏差比(RSR)為0.59,R2=0.68,誤差反而變大,擬合更低。因此選擇了指標(biāo)數(shù)量較少且結(jié)果較好的水溫、溶解氧和電導(dǎo)率作為模型水質(zhì)輸入?yún)?shù)(組合3)。由于在一般性認(rèn)知中,認(rèn)為藍(lán)藻水華的暴發(fā)與一定條件的氮、磷含量等水體理化性質(zhì)、溫度和光照等氣象條件、水文條件和生態(tài)環(huán)境有關(guān),是水體環(huán)境因素(如總氮、總磷、pH、溶解氧)和氣象因素(如氣溫、光照、風(fēng)向、風(fēng)速等)綜合作用的結(jié)果[12-13]。因此本研究將濁度、pH、氣溫和風(fēng)速等因子逐步作為輸入?yún)?shù)加入模型,分別得出了組合4、5、6和7的數(shù)據(jù)結(jié)果??梢钥闯?,模型的最優(yōu)參數(shù)輸入組合為水溫、溶解氧、電導(dǎo)率、氣溫即組合6,該組合的輸出結(jié)果葉綠素a的預(yù)測值的均方根誤差(RMSE)為0.08 μg/L,均方根與實(shí)測值標(biāo)準(zhǔn)偏差比(RSR)為0.43,R2=0.83。
表3 各水質(zhì)指標(biāo)輸入?yún)?shù)組合的模型運(yùn)算輸出結(jié)果的RMSE、RSR、R2
對各組合的結(jié)果中較有代表性的組合3、組合6和組合7做進(jìn)一步分析,結(jié)果如圖3、圖4、圖5所示。
可以看出在三組葉綠素a的模擬結(jié)果中,預(yù)測值和實(shí)測值在數(shù)據(jù)的各個峰值與數(shù)據(jù)的趨向性上都具有一定的相似性。但組合6的擬合結(jié)果(圖4)是最好的,該組合的模擬結(jié)果不僅在各個峰值涵蓋了實(shí)際數(shù)據(jù),并且在整體數(shù)據(jù)的相似度上與其他組合相比,數(shù)據(jù)更為接近。因此可以認(rèn)為BP人工神經(jīng)網(wǎng)絡(luò)模型在以東張水庫的水溫、溶解氧、電導(dǎo)率和氣溫這4個指標(biāo)作為輸入?yún)?shù)時(shí),模型的學(xué)習(xí)訓(xùn)練結(jié)果可以提取有效的學(xué)習(xí)經(jīng)驗(yàn),并做出具有針對性的預(yù)測。模型訓(xùn)練的運(yùn)行結(jié)果符合試驗(yàn)訓(xùn)練預(yù)期。
從經(jīng)過模型的模擬預(yù)算結(jié)果可以看出,輸入端因子經(jīng)優(yōu)化組合后輸出端的結(jié)果更好,并且結(jié)合氣象數(shù)據(jù)作為輸入因子后模型輸出結(jié)果的精度明顯高于僅以水質(zhì)作為輸入因子的模型預(yù)測結(jié)果。但是所有組合的模型輸出結(jié)果均與傳統(tǒng)意義上較好的擬合度(R=0.999)存在著一定的差距,這可能是由于人工神經(jīng)網(wǎng)絡(luò)模型的數(shù)據(jù)訓(xùn)練量不足以及參數(shù)過多所致,并且許多參數(shù)并沒有絕對公認(rèn)的最佳取值,僅僅只有相對最優(yōu)值。在建模過程中,僅靠建模者的經(jīng)驗(yàn)和主觀判斷,在試驗(yàn)的時(shí)候需要不斷地調(diào)整與試驗(yàn)才能取得相對較為理想的結(jié)果。
從圖3、4、5可以看出,在三組模型輸出的數(shù)據(jù)結(jié)果中,有些點(diǎn)位呈現(xiàn)跳躍式增長,這是由于在2016—2017年水質(zhì)檢測數(shù)據(jù)中,部分月份水華暴發(fā),導(dǎo)致各個指標(biāo)都呈現(xiàn)明顯的變化,尤其是總磷、總氮的數(shù)值增長更明顯,這種迅猛增長在其他月份是不存在的。由于本次模型的訓(xùn)練樣本的有限性,對于模型的識別和預(yù)測造成了一定的局限。并且水華暴發(fā)時(shí)期一般為夏、秋季,庫區(qū)不同區(qū)域水深的水溫存在較大差異。此外,降雨等因素也對水體水質(zhì)造成一定的影響。因此在后續(xù)的改進(jìn)模型中,應(yīng)著重對于輸入?yún)?shù)進(jìn)行分類,將數(shù)據(jù)波動較大的數(shù)據(jù)與波動較為不明顯的數(shù)據(jù)分開,以增加模型預(yù)測的準(zhǔn)確性。
不同氣象因子的輸入也對預(yù)測結(jié)果的擬合度有不同的影響,可能的原因是氣象數(shù)據(jù)不足,本次研究僅采用氣溫、風(fēng)速這兩個參數(shù),還缺風(fēng)向、光照強(qiáng)度、日照時(shí)間、降雨量等對于水華有影響的氣象因子作為輸入數(shù)據(jù)供篩選。因此,在今后的模型改進(jìn)中,應(yīng)該盡量多地考慮其他氣象因子和環(huán)境影響因子,以減少模型運(yùn)算誤差。
本研究建立了一種可以應(yīng)用于湖庫水華暴發(fā)的BP人工神經(jīng)網(wǎng)絡(luò)預(yù)警模型。利用BP人工神經(jīng)網(wǎng)絡(luò)理論,以福清市東張水庫為例,得到了以水溫、溶解氧、電導(dǎo)率和氣溫為輸入?yún)?shù)的指標(biāo)組合,使得以葉綠素a為輸出指標(biāo)的預(yù)測結(jié)果擬合度達(dá)到0.83,得到了較好的結(jié)果,符合試驗(yàn)預(yù)期。