郭正強,嚴平川,向宣好,鮑仲濤
(1:長江大學(xué)資源與環(huán)境學(xué)院,油氣地球化學(xué)與環(huán)境湖北省重點實驗室,武漢 430100)(2:湖北省荊州市水文水資源勘測局,荊州 434000)
近年來湖泊的水體富營養(yǎng)化和藻類快速生長現(xiàn)象較為嚴重和普遍,許多學(xué)者對湖泊的生物組成[1]、水質(zhì)變化[2]、湖泊富營養(yǎng)化[3]、藻類化學(xué)分類[4]、藻類長時序變化及其驅(qū)動因子[5]等方面進行研究.藻類是水生態(tài)系統(tǒng)的重要成分,其生長狀況如藻類結(jié)構(gòu)、細胞數(shù)量等指標(biāo)受到生長區(qū)域水體內(nèi)各項水質(zhì)指標(biāo)的影響,也直接反映了水體富營養(yǎng)化的程度.張蓉[6]就不同類型的湖泊水環(huán)境從透明度、氮磷營養(yǎng)水平、水溫、水深以及CODMn污染等方面研究了藻類不同生長時期對水環(huán)境影響程度,劉巧紅等[7]采用結(jié)構(gòu)方程模型并結(jié)合其他方法對葉綠素a進行預(yù)測,通過引入物理環(huán)境、CODMn、營養(yǎng)鹽和浮游植物4個潛變量以及預(yù)先篩選的5個影響因子建立復(fù)雜關(guān)系,以揭示葉綠素a與富營養(yǎng)指標(biāo)因子的關(guān)系,盧碧林等[8]探究了洪湖在2009-2010年間的富營養(yǎng)化程度以及利用DPS等軟件分析了藻種生物量與其環(huán)境因子之間的響應(yīng)關(guān)系,并對優(yōu)勢藻類進行了分類.李玉照等[9]結(jié)合絕對主成分多元線性回歸分析、結(jié)構(gòu)方程模型以及人工神經(jīng)網(wǎng)絡(luò)模型對葉綠素a和相關(guān)因子進行定量相關(guān)分析,并對湖泊面積及水動力方面對葉綠素a的影響進行探討.神經(jīng)網(wǎng)絡(luò)的發(fā)展讓藻類生長預(yù)測方法更加多元化,已經(jīng)應(yīng)用于藻華暴發(fā)預(yù)測[10]、生長狀態(tài)軟測量[11]、富營養(yǎng)化氣象驅(qū)動因子分析[12]以及水庫藻類時序數(shù)據(jù)預(yù)測[13]等方面,并取得了階段性研究進展.神經(jīng)網(wǎng)絡(luò)能在非線性函數(shù)逼近方面有很大優(yōu)勢,能夠更好地近似變量間的復(fù)雜關(guān)系,本文細化不同水量不同營養(yǎng)程度,運用神經(jīng)網(wǎng)絡(luò)和傳統(tǒng)數(shù)理統(tǒng)計方法進行藻種生物量的預(yù)測.
河湖健康評價是河湖管理的重要內(nèi)容,是檢驗河長制湖長制“有名”“有實”的重要手段.湖北省也已制定省級河湖健康評估標(biāo)準,洪湖作為長江中游典型湖泊也是湖北省重要湖泊之一,其健康程度的監(jiān)測以及防控至關(guān)重要.選擇適合的藻類生長預(yù)測模型能對洪湖的營養(yǎng)狀態(tài)以及浮游植物動態(tài)的研究有所幫助,有利于后期河湖健康評估工作的開展.
于2014-2019年逐月上旬在湖心及出入口布置5個站點采集水樣,采樣點如圖1所示.
圖1 洪湖采樣點分布
采用25#浮游生物網(wǎng)在水面及水深0.5 m 處作“∞”字形來回采集水樣,湖泊、水庫采樣500 mL,采樣量視浮游植物分布量而定,若浮游植物數(shù)量較少,也可采樣1000 mL.所獲樣品加魯哥氏液固定,將水樣放置在低溫避光處,沉淀濃縮后在顯微鏡下分門類計算藻種生物量.采樣現(xiàn)場測水溫(T)和溶解氧(DO)濃度,用透明度盤測定透明度(SD),帶回實驗室的水樣低溫保存并加相應(yīng)試劑固定,采用堿性過硫酸鉀消解紫外分光光度法(GB 11894-1989)測定總氮(TN)濃度,采用鉬酸銨分光光度法(GB 11893-1989)測定總磷(TP)濃度,依據(jù)(GB 11892-1989)測定高錳酸鹽指數(shù)(CODMn).使用分光光度法(SL88-1994)測定葉綠素a(Chl.a)濃度.
采樣點藍田是四湖總干渠進入洪湖的主要區(qū)域,其中包括上游片區(qū)的生活、工業(yè)、農(nóng)業(yè)等污水; 官墩湖濱存在濕地; 施墩河口為洪湖水體進入長江的出口,其水體經(jīng)過了湖泊自凈,受污染情況較輕.
根據(jù)實測水質(zhì)數(shù)據(jù)采用綜合營養(yǎng)狀態(tài)指數(shù)法[14]進行湖泊營養(yǎng)狀態(tài)評價,計算公式如下:
(1)
式中,TLI(∑)為綜合營養(yǎng)狀態(tài)指數(shù);TLI(j)為第j種參數(shù)的營養(yǎng)狀態(tài)指數(shù);Wj為第j種參數(shù)的營養(yǎng)狀態(tài)指數(shù)的相關(guān)權(quán)重.
以Chl.a作為基準參數(shù),則第j種參數(shù)的歸一化的相關(guān)權(quán)重計算公式為:
(2)
式中,rij為第j種參數(shù)與基準參數(shù)Chl.a的相關(guān)系數(shù);m為評價參數(shù)的個數(shù).
26個主要湖泊調(diào)查數(shù)據(jù)的計算結(jié)果. 中國湖泊(水庫)的Chl.a與其它參數(shù)之間的相關(guān)關(guān)系rij及rij2見表1.
表1 Chl.a與其它參數(shù)的相關(guān)關(guān)系*
回歸分析可以判斷影響因變量的主要因子.本文根據(jù)不同的富營養(yǎng)化程度不同的水量時期將藻種生物量作為y值,將T、DO、TP、TN、CODMn以及SD等作為自變量進行逐步回歸分析,得到回歸方程,依據(jù)方程來判斷影響藻種生物量的主要因素.
逐步回歸分析可以找出對因變量影響顯著的因子,在建立回歸方程中,每步只挑選一個能使殘差平方和下降最多的因子,還要通過給定信度的F檢驗,重復(fù)該步驟直至待引入因子中不含有對因變量作用顯著的因子,并且將一些由于新引入的因子導(dǎo)致其顯著性變小或不顯著的因子從分析中剔除.進而得到對因變量影響最為明顯的線性回歸方程.
對于F檢驗,假設(shè)H0:回歸參數(shù)均為0;H1:至少一個回歸參數(shù)不為0.
檢驗使用統(tǒng)計量:
(3)
式中,SSR為回歸平方和,SSE為殘差平方和,n為樣本個數(shù),p為自變量個數(shù).若F≥Fα(p,n-p-1)則認為模型的總體回歸效果顯著.
自2013年第一個現(xiàn)代深度學(xué)習(xí)網(wǎng)絡(luò)AlexNet的產(chǎn)生,深度學(xué)習(xí)網(wǎng)絡(luò)得到重大發(fā)展,在各個行業(yè)逐步運用.BP神經(jīng)網(wǎng)絡(luò)作為目前應(yīng)用最為廣泛的神經(jīng)網(wǎng)絡(luò)之一,其采用誤差的反向傳播算法進行訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò),優(yōu)點在于有很強的非線性映射能力,隱藏層的個數(shù)可以根據(jù)實際情況自行擬定.通過對自變量的數(shù)值矩陣和目標(biāo)數(shù)值矩陣訓(xùn)練使得網(wǎng)絡(luò)逼近于一個函數(shù),以此得到近似的因變量與自變量的映射關(guān)系,從而實現(xiàn)對未知目標(biāo)的預(yù)測.
Shannon指數(shù)(H′)用來描述種的個體出現(xiàn)的紊亂和不確定性,不確定性越高,多樣性也就越高,該指數(shù)能夠描述兩方面的信息:種類豐富度和種類中個體分配上的均勻性.其公式如下[16]:
(4)
式中,S為群落中所有物種數(shù)目,N為群落中所有個體數(shù)量,ni為群落中第i個種的個體數(shù)量.
對洪湖5個實測站點2014-2019年12個月的水質(zhì)數(shù)據(jù)分豐(5-9月)、平(3、4、10-11月)、枯(12-2月)3個水期進行富營養(yǎng)化評價,得出各水期的富營養(yǎng)化程度,分析不同水期各站點不同富營養(yǎng)程度占比(圖2).
圖2 富營養(yǎng)化程度占比
從時間上看,全年內(nèi),洪湖營養(yǎng)狀態(tài)多數(shù)處于中營養(yǎng)和輕度富營養(yǎng),極少數(shù)出現(xiàn)中度富營養(yǎng).豐水期,茶壇島和官墩中營養(yǎng)程度占比分別為50%和65%,大口、藍田和施墩河口輕度富營養(yǎng)化程度占比分別為63%、67%和60%.平水期,茶壇島、官墩中營養(yǎng)程度占比分別為59%和70%,大口、藍田和施墩河口輕度富營養(yǎng)化程度占比分別為67%、55%和62%.枯水期,大口中營養(yǎng)化程度占比最大,為55%,其余4地中營養(yǎng)程度占比均小于50%.從空間上看:藍田為四湖總干渠與洪湖連接處,受上游污水匯入影響,水體富營養(yǎng)化程度最高,靠近湖泊2個出口的大口和施墩河口站也受附近居民生活影響,水體富營養(yǎng)化程度高于官墩和茶壇島,但湖泊自凈能力使得施墩河口的富營養(yǎng)化狀況略好于藍田.由于存在湖濱濕地且離入湖口較遠的原因,官墩的營養(yǎng)水平最低,多數(shù)時間處于中營養(yǎng)狀態(tài).
根據(jù)2014-2019年藻類藻種統(tǒng)計數(shù)據(jù)對洪湖各采樣點采用Shannon指數(shù)(e為底)進行生物多樣性分析,如圖3.
圖3 各采樣點Shannon指數(shù)
對各采樣點2014-2019年豐、平、枯時期進行生物多樣性分析發(fā)現(xiàn)Shannon指數(shù)總體處于2.10~2.45之間,各地各時期生物多樣性差別不大,其中5個采樣點的平水期生物多樣性要略優(yōu)于枯水期,但豐水期采樣點之間差異較為明顯,官墩的Shannon指數(shù)最小,施墩河口最大.從整體上分析,藍田、施墩河口的生物多樣性指數(shù)高于其余3個樣點.
對洪湖水體的5個站點2014-2019年12個月的藻類相對生物量按照豐、平、枯3個不同水期統(tǒng)計分析,發(fā)現(xiàn)豐水期、平水期優(yōu)勢種為藍藻,藻類相對生物量為70%~80%,枯水期茶壇島、藍田優(yōu)勢種為硅藻,其余3個站點為藍藻.5個站點豐、平、枯3個時期不同門類藻類相對生物量見圖4.
圖4 洪湖不同時期藻類相對生物量
從總體上看,2014-2019年洪湖5個站點豐水期和平水期的藻類相對生物量相近,其中官墩的藍藻相對生物量最高,枯水期官墩藍藻相對生物量分別高出茶壇島和藍田20%和25%.這是因為官墩站水質(zhì)較好,總藻密度較低,檢出的藻類細胞中藍藻出現(xiàn)比例高于其他門類,成為優(yōu)勢門類,使得藍藻在官墩站的相對生物量遠高于其他站點.
與豐水期相比,平水期處于洪湖出入口的大口、藍田和施墩河口受輸入營養(yǎng)物質(zhì)的減少和水溫的降低,藍藻生長速度降低,導(dǎo)致藍藻相對生物量下降10%以上.茶壇島和官墩受外源營養(yǎng)物質(zhì)輸入的影響不大,故藍藻門類下降不明顯.
枯水期5個站點中茶壇島和藍田硅藻門類增加最為明顯.這是因為當(dāng)水溫高于25℃時,硅藻生長受到抑制[7].而低水溫環(huán)境抑制了藍、綠藻生長,更利于硅藻生長.
除施墩河口外,其余4個站點的綠藻相對生物量均為枯水期>平水期>豐水期,原因在于隨著水量的減少,水體TN、TP濃度增加,而TN、TP濃度偏高的水體對綠藻生長的促進作用最大,從而引起綠藻密度的小幅上漲.
根據(jù)3.1分析,2014-2019年洪湖水質(zhì)處于中營養(yǎng)和輕度富營養(yǎng)狀態(tài).為了進一步分析不同水量、2種富營養(yǎng)化程度下的藻種生物量y與T、DO、TN等8項指標(biāo)關(guān)系,將分為全年、全年+中營養(yǎng)化時期、全年+輕度富營養(yǎng)化時期、豐水期+中營養(yǎng)化、豐水期+輕度富營養(yǎng)化、平水期+中營養(yǎng)化、平水期+輕度富營養(yǎng)化、枯水期+中營養(yǎng)化和枯水期+輕度富營養(yǎng)化9種不同時期討論.建立了相關(guān)系數(shù)矩陣,具體見表2.
(2)選用自制的“護理職業(yè)性別刻板印象”問卷,通過查閱文獻及專家咨詢形成初稿,然后采用德爾菲法對量表內(nèi)容效度進行評價,檢驗問卷信度,并進行必要的修改形成終稿。調(diào)查內(nèi)容包括個人基本資料和護理職業(yè)性別刻板印象量表,量表共2個條目:條目1表示認為男性適合護理職業(yè)的情況,條目2表示認為性別對護理職業(yè)的重要程度。條目采用1~3級正向計分,量表總分等于各條目分之和,被試者分值越高,表明其對護理職業(yè)的刻板印象越深。量表經(jīng)3位護理學(xué)專家和2位教育學(xué)專家的審閱及修改,具有良好的內(nèi)容效度,該量表重測信度為0.85,具有良好的信度。
據(jù)表2分析,全年與藻種生物量顯著相關(guān)的因子有透明度、CODMn、水溫和溶解氧,自相關(guān)系數(shù)分別為-0.147、0.427、0.520和-0.207;全年+中營養(yǎng)化時期、全年+輕度富營養(yǎng)化時期和平水期+輕度富營養(yǎng)化與藻種生物量顯著相關(guān)的因子有CODMn、水溫和溶解氧,自相關(guān)系數(shù)分別為0.302、0.484和-0.188,0.464、0.527和-0.308以及0.575、0.452和-0.491;豐水期+中營養(yǎng)化與藻種生物量顯著相關(guān)的因子有水溫,自相關(guān)系數(shù)為0.519;豐水期+輕度富營養(yǎng)化與藻種生物量顯著相關(guān)的因子有CODMn和水溫,自相關(guān)系數(shù)分別為0.257和0.540;平水期+中營養(yǎng)化與藻種生物量顯著相關(guān)的因子有CODMn,自相關(guān)系數(shù)為0.463;枯水期+中營養(yǎng)化與藻種生物量顯著相關(guān)的因子有總磷,自相關(guān)系數(shù)為-0.378;枯水期+輕度富營養(yǎng)化與藻種生物量顯著相關(guān)的因子有CODMn,自相關(guān)系數(shù)為0.328.故水溫和CODMn在藻細胞生長過程中影響最為關(guān)鍵,其水溫僅在平水期+中營養(yǎng)化、枯水期+中營養(yǎng)化和枯水期+輕度富營養(yǎng)化時期不顯著,CODMn僅在豐水期+中營養(yǎng)化和枯水期+中營養(yǎng)化時期不顯著.
表2 各時期藻種生物量與影響因子相關(guān)系數(shù)
選擇對藻種生物量影響顯著的因子進行逐步回歸分析與神經(jīng)網(wǎng)絡(luò)訓(xùn)練,使用2014-2018年的數(shù)據(jù)進行訓(xùn)練和驗證,2019年的數(shù)據(jù)進行預(yù)測,對比2種預(yù)測方式在不同時間尺度上的準確性.使用均方根誤差(RMSE)進行比較.
3.3.1 逐步回歸 由表3可知,影響藻類生長的因子主要有水溫、CODMn、總氮、總磷、溶解氧和透明度,并且在不同時期影響程度不同.全年、豐水期+中營養(yǎng)、豐水期+輕度富營養(yǎng)、全年+輕度富營養(yǎng)和全年+中營養(yǎng)藻種生物量與CODMn、溫度、總磷、總氮有關(guān),可通過減少營養(yǎng)物質(zhì)的輸入來抑制藻種生物量的增長,枯水期+中營養(yǎng)和平水期+輕度富營養(yǎng)化還應(yīng)該注重湖泊溶解氧的改善.除枯水期外,其他7個時期的回歸方程相關(guān)系數(shù)都達到了0.5以上,說明回歸方程能在一定程度上解釋所選環(huán)境因子對藻種生物量的影響.此外,顯著性檢驗均小于0.05,說明逐步回歸法顯著性良好,可作為藻種生物量變化預(yù)測的一種方法.
表3 各時期標(biāo)準化藻種生物量的逐步回歸方程
3.3.2 BP神經(jīng)網(wǎng)絡(luò) 使用Matlab對各個時期分別訓(xùn)練和預(yù)測得到相應(yīng)的擬合效果和誤差分布,計算逐步回歸法和神經(jīng)網(wǎng)絡(luò)預(yù)測誤差的RMSE并進行比較,限于篇幅,僅列出全年擬合效果圖,見圖5、圖6.
圖5 全年訓(xùn)練集、驗證集、測試集和總體擬合效果
圖6 全年訓(xùn)練集、驗證集、測試集和總體誤差范圍分布
從圖5分析得出,全年訓(xùn)練集、驗證集和測試集的擬合效果很好,沒有出現(xiàn)欠擬合和過擬合現(xiàn)象.全年、全年中營養(yǎng)化時期、全年輕度富營養(yǎng)、豐水期+中營養(yǎng)化、豐水期+輕度富營養(yǎng)化、平水期+中營養(yǎng)化、平水期+輕度富營養(yǎng)化、枯水期+中營養(yǎng)化和枯水期+輕度富營養(yǎng)化的訓(xùn)練集模擬值與目標(biāo)值比值R分別為0.95、0.90、0.85、0.94、0.96、0.89、0.82、0.67和0.64,驗證集的模擬值與目標(biāo)值比值R分別為0.94、0.86、0.88、0.91、0.81、0.77、0.83、0.93和0.68,測試集模擬值與目標(biāo)值比值R分別為0.94、0.85、0.82、0.94、0.82、0.81、0.75、0.89和0.70.說明神經(jīng)網(wǎng)絡(luò)訓(xùn)練較好,能夠用于預(yù)測藻種生物量變化情況.
圖6說明,全年模型在訓(xùn)練集、驗證集和測試集中訓(xùn)練或預(yù)測所得結(jié)果的誤差多數(shù)位于±3500內(nèi),誤差集中,模型訓(xùn)練和預(yù)測效果穩(wěn)定,能夠較好地反映出藻類生長規(guī)律.對于全年+中營養(yǎng)化時期、全年+輕度富營養(yǎng)化時期、豐水期+中營養(yǎng)化、豐水期+輕度富營養(yǎng)化、平水期+中營養(yǎng)化、平水期+輕度富營養(yǎng)化、枯水期+中營養(yǎng)化和枯水期+輕度富營養(yǎng)化超過75%數(shù)據(jù)的誤差范圍分別為:±3700、±4023、±3505、±2489、±2330、±6335、±993和±3395.誤差范圍隨時期的細化略有擴大,使得模型預(yù)測結(jié)果波動性較大,但誤差數(shù)值的范圍依舊保持較好的集中程度.
3.3.3 兩種方法比較 BP神經(jīng)網(wǎng)絡(luò)與逐步回歸分析預(yù)測的均方根誤差見表4.
表4 預(yù)測數(shù)據(jù)RMSE比較
通過對洪湖水體營養(yǎng)狀態(tài)分析及回歸分析,找到影響藻類生長的顯著影響因素,并預(yù)測藻類生長變化,主要結(jié)論如下:
1)2014-2019年洪湖水體富營養(yǎng)化程度基本處于中營養(yǎng)和輕度富營養(yǎng)之間,豐水期和枯水期的營養(yǎng)程度低于平水期.
2)洪湖5個站點豐水期和平水期的藻類比例相近,其中官墩的藍藻比例最高.與豐水期相比,平水期處于洪湖出入口的大口、藍田和施墩河口藍藻占比下降10%以上.茶壇島和官墩受外源營養(yǎng)物質(zhì)輸入的影響不大,故藍藻占比下降不明顯.枯水期5個站點中茶壇島和藍田硅藻比例增加最為明顯.適當(dāng)?shù)臓I養(yǎng)鹽和低溫環(huán)境也有助于硅藻生長.除施墩河口外,其余4個站點的綠藻占比均為枯水期>平水期>豐水期.
3)不同時期控制顯著變量可以達到防治水華污染的效果.豐水期+中營養(yǎng)化時期可通過控制水體CODMn濃度,豐水期+輕度富營養(yǎng)化控制總磷濃度來抑制藻類生長過快的狀況,平水期+中營養(yǎng)化、平水期+輕度富營養(yǎng)化、枯水期+中營養(yǎng)化和枯水期+輕度富營養(yǎng)化時期可通過控制CODMn與總氮、總磷濃度來降低水華發(fā)生概率.
4)不同情形采用不同方法預(yù)測藻類生長規(guī)律.對于全年、全年+中營養(yǎng)化時期、全年+輕度富營養(yǎng)化和豐水期神經(jīng)網(wǎng)絡(luò)相對于常規(guī)的逐步回歸預(yù)測體現(xiàn)出巨大優(yōu)勢,誤差的RMSE要明顯小于逐步回歸法,平水期兩種方法相當(dāng),均有一定誤差.枯水期逐步回歸的預(yù)測結(jié)果要優(yōu)于神經(jīng)網(wǎng)絡(luò).
1)藻類的生長受到多方面影響,是一個非線性問題.先前的研究者已經(jīng)在藻華暴發(fā)預(yù)測,生長狀態(tài)軟測量,富營養(yǎng)化氣象驅(qū)動因子分析以及水庫藻類時序數(shù)據(jù)預(yù)測等方面取得較好成果,隨著近些年快速發(fā)展,神經(jīng)網(wǎng)絡(luò)已經(jīng)能很好的對非線性問題進行函數(shù)逼近并進行預(yù)測,神經(jīng)網(wǎng)絡(luò)用于藻類數(shù)量變化的預(yù)測具有科學(xué)性和合理性.
2)BP神經(jīng)網(wǎng)絡(luò)還存在以下局限性:當(dāng)數(shù)據(jù)量較少時,網(wǎng)絡(luò)難以訓(xùn)練成型,會極大降低網(wǎng)絡(luò)效率;當(dāng)數(shù)據(jù)量過大時,網(wǎng)絡(luò)的訓(xùn)練容易產(chǎn)生過擬合現(xiàn)象,導(dǎo)致網(wǎng)絡(luò)的泛化能力降低,預(yù)測結(jié)果會產(chǎn)生較大偏差,為了避免出現(xiàn)上述情況,應(yīng)當(dāng)在網(wǎng)絡(luò)訓(xùn)練時適度進行人為干預(yù).
3)影響藻種生物量的因素除了常見的水質(zhì)指標(biāo)還與多種氣象因子有關(guān),例如氣溫顯著影響藻類的生物量和季節(jié)變化,風(fēng)是藻類生物量空間分布差異的主要原因,降雨是重要的輔助因素.溫度處于15~20℃時藻類的生長情況會受到強風(fēng)和頻繁降雨的抑制,當(dāng)溫度處于20~30℃時,由風(fēng)產(chǎn)生的水力擾動會更加明顯,不同風(fēng)速的擾動也會使葉綠素濃度發(fā)生變化[17].這些氣象因素的改變也會影響模型的精準度.
4)藻類是水生生物中的一大類群,其生長情況除了與外界環(huán)境有關(guān),還與生物的內(nèi)在特性有聯(lián)系,建立適宜的生態(tài)動力學(xué)模型有利于藻類生長預(yù)報.通過結(jié)合遺傳算法與BP神經(jīng)網(wǎng)絡(luò)的結(jié)合能夠使模型預(yù)測的精準度提高.在之后的研究中將采用多方式的耦合模型進行探討,進一步探索影響藻類生長的內(nèi)在聯(lián)系.