陳振宙,楊 旭,楊鵬輝,許文博,張 弛
(1.黑龍江大學水利電力學院,黑龍江 哈爾濱 150080;2.哈爾濱市磨盤山水庫管護中心,黑龍江 哈爾濱150080)
水是生命之源,在人類的生產(chǎn)、生活中起著重要作用。隨著人民生活水平不斷提高以及思想的不斷進步,對水的開發(fā)、利用以及保護的重視程度也顯著提高,因此水質(zhì)評價變得尤為重要。對水庫的水質(zhì)進行評價分析可以了解水庫整體的水體質(zhì)量狀況,并為水庫水資源開發(fā)、利用和保護提供技術支撐。
對水質(zhì)評價的方法大體上有單因子評價法、綜合指數(shù)評價法,模糊綜合評價法,主成分分析法,神經(jīng)網(wǎng)絡評價法等。徐春霞[1]等人用單因子法和綜合法對秦皇島地下水質(zhì)量進行了評價。梅學彬[2]對以往的模糊綜合評價法中權(quán)重確定方法進行了改進,并用實例分析其可行性。馬虹[3]用污染指數(shù)法和模糊數(shù)學法對哈爾濱醫(yī)藥集團公司地面水進行了評價。杜俊鵬[4]應用主成分分析法對長春市經(jīng)濟開發(fā)區(qū)河流水質(zhì)進行了評價。郭新強[5]運用主成分分析法和綜合水質(zhì)標識指數(shù)法對福建某濱海地水質(zhì)進行評價。張怡[6]等人利用BP神經(jīng)網(wǎng)絡模型對大慶市紅旗泡水庫進行水質(zhì)的富營養(yǎng)化評價。許燕穎[7]利用BP神經(jīng)網(wǎng)絡和WPI評價法評價了桃江水質(zhì)。本文以主成分分析法以及RBF神經(jīng)網(wǎng)絡法對磨盤山水庫水質(zhì)進行評價。
磨盤山水庫位于五常市境內(nèi)松花江一級支流,距離哈爾濱市約180 km,水源流域面積為1151 km2,多年平均徑流量為5.75×108m3,是一座以城鎮(zhèn)供水,農(nóng)田灌溉為主,兼顧防洪,發(fā)電的綜合利用水利樞紐工程[8]。
本文以2022年12個月的磨盤山水庫監(jiān)測數(shù)據(jù)為依據(jù),選取溶解氧(DO),氨氮(NH3-N),化學需氧量(COD),總磷(TP),總氮(TN)的5個指標,按照地表水環(huán)境質(zhì)量標準(GB 3838-2002)[9]中的對應標準限值,對水質(zhì)進行評價。
由于水質(zhì)指標有不同量綱以及數(shù)量級,故在評價前先進行數(shù)據(jù)的無量綱化處理。
式中:tij為第i個評價對象的第j個指標;、Cj分別是第j個指標的樣本均值和樣本標準差,i=1,2,…,5, j=1,2,…12。
處理結(jié)果見表1。
由表2可知,氨氮與COD,總氮之間存在正相關,COD與總氮存在正相關,本文大多數(shù)指標存在較強的相關性,適合應用主成分分析法進行水質(zhì)評價。
表2 水質(zhì)指標間的pearson相關分析
從表3可知,KMO=0.618>0.6,Sig.=0.000<0.05,各水質(zhì)指標間存在較強的相關性,運用主成分分析進行水質(zhì)評價可以得到較為理想的結(jié)果。
表3 KMO與巴特利特校驗
將方差解釋中特征值大于1且累計方差貢獻率大于85%為標準確定為主成分。
建立主成分得分表達式,見式(2)。其中,表示主成分中各變量的權(quán)重,可以基于式(3)建立得分系數(shù)矩陣。
式中:F為綜合得分;Cj為第i個主成分的方差貢獻率。
由表4可知成分1和成分2的特征值分別為3.383和1.054,對應的方差平方和分別為67.656%,19.071%。成分1和成分2的特征值均大于1,而且累計方差平方和高達86.728%,表明前兩個成分可以解釋數(shù)據(jù)的86.728%的信息,因此,可以選擇成分1、成分2作為主成分進行水質(zhì)評價。
表5為成分矩陣,主要反映各個水質(zhì)指標在主成分1和主成分2上荷載的分布情況,由表4和表5綜合分析可得,主成分1的貢獻率為67.656%,COD、氨氮、總氮、總磷在主成分1中占有較高的載荷,表明主成分1對水質(zhì)狀況的影響較大,且主要反映水庫受有機物污染。
表5 成分矩陣
由表6可得出主成分1和主成分2的表達式分別為:
表6 得分系數(shù)矩陣
基于式 (4)(5)(6),計算出磨盤山水庫1月~12月與地表水環(huán)境質(zhì)量標準中規(guī)定的五類水質(zhì)的綜合得分,并基于地表水環(huán)境質(zhì)量標準中五類水質(zhì)的綜合得分判定水庫各月份的水體質(zhì)量狀況。從表7中可以看出,基于主成分分析法清晰的反映出水庫各月份的水體質(zhì)量狀況:水質(zhì)達到Ⅰ類水標準有1月、2月、3月、4月、6月,共5個月;5月、7月、8月、9月、10月、11月、12月水質(zhì)狀況均為Ⅱ類。
表7 主成分分析水質(zhì)評價結(jié)果匯總
RBF神經(jīng)網(wǎng)絡的核心是函數(shù)逼近理論,是一種具有較強全局能力的前饋式神經(jīng)網(wǎng)絡。RBF神經(jīng)網(wǎng)絡主要由輸入層(input),輸出層(output)以及隱含層(implicit layer)三部分組成。結(jié)構(gòu)見圖1。
圖1 RBF神經(jīng)網(wǎng)絡示意圖
以RBF網(wǎng)絡建立水質(zhì)評價模型,網(wǎng)絡的輸入x為某水樣中參與評價的種水質(zhì)指標實測值的集合,輸出為該水樣的水質(zhì)級別。同其它所有利用RBF網(wǎng)絡解決問題一樣,問題的關鍵集中在網(wǎng)絡結(jié)構(gòu)的選擇、可調(diào)參數(shù)的優(yōu)化方法、學習樣本的代表性上。
典型的RBF網(wǎng)絡中有3個可調(diào)參數(shù):隱含層基函數(shù)中心t、方差σ,以及輸出單元的權(quán)值ω。
本文用聚類方法選擇基函數(shù),可以各聚類中心作為基函數(shù)中心,而以各類樣本的方差的某一函數(shù)作為各個基函數(shù)的寬度參數(shù)。隱含層到輸出層的權(quán)值用最小二乘法求得,分級聚類可以看成是將N個樣本劃分成c個類的劃分序列。第一個劃分是把樣本分成N個類,每類包含一個樣本;第二個劃分是把樣本分成N-1個類,依此類推,直到第N個劃分時把樣本僅分成一個類。如果類數(shù)c=N-K+1,則稱這個劃分處于K水平。這種劃分序列具有如下性質(zhì):只要在K水平時樣本被歸入同一類后,在進行更高水平的劃分時,它們也永遠屬于同一類。這種分類方法較穩(wěn)定,只要確定了類數(shù),分類結(jié)果就是唯一的[10,11]。
訓練樣本一般為實測的或通過計算得到的一系列一一對應的(x,y), x為輸入,y為輸出。然而對于水質(zhì)評價,目的就是根據(jù)一定的水質(zhì)判別標準建立一種評價方法,從而對水質(zhì)的優(yōu)劣做出合理的評價。這樣就不能通過前述兩種方法獲取訓練樣本,因為實測數(shù)據(jù)只有水質(zhì)指標的數(shù)值,沒有對應的水質(zhì)級別;如果通過某種方法計算得到一系列輸入x對應的輸出y值,經(jīng)過神經(jīng)網(wǎng)絡學習后得到的網(wǎng)絡結(jié)構(gòu)就變成對這種方法的模仿,那就失去了應用神經(jīng)網(wǎng)絡進行評價的意義。所以對于水質(zhì)評價訓練樣本數(shù)據(jù)只能從水質(zhì)標準中獲取[10]。
以地面水環(huán)境質(zhì)量標準為例,首先隨機產(chǎn)生一個1~5之間的整數(shù),1代表水質(zhì)類別為Ⅰ類,2代表水質(zhì)類別為Ⅱ類,依此類推,5代表水質(zhì)指標為Ⅴ類水標準。然后根據(jù)水環(huán)境質(zhì)量標準在該水質(zhì)類別的范圍為各水質(zhì)指標隨機產(chǎn)生數(shù)值。
3.3.1 數(shù)據(jù)標準化處理
使用MATLAB的zscore函數(shù)對訓練數(shù)據(jù)進行標準化處理,以便每個特征的均值為0,方差為1。z-score 標準化(正太標準化)是基于原始數(shù)據(jù)的均值(mean)和標準差(standard deviation)進行數(shù)據(jù)的標準化。將原始值x使用z-score標準化到x'。
3.3.2 建立訓練模型及預測
本文使用MATLAB的newrb函數(shù)訓練了一個RBF神經(jīng)網(wǎng)絡,訓練輸出為trainY。我們對trainY進行了四舍五入操作,以便將其轉(zhuǎn)換為整數(shù)類型的標簽trainPred。然后,我們計算了訓練準確率trainAcc、平均絕對誤差trainMae、均方根誤差trainRmse和F1分數(shù)trainF1。
最后,使用訓練好的RBF神經(jīng)網(wǎng)絡對測試數(shù)據(jù)進行預測,得到測試輸出testY。我們對testY進行了四舍五入操作,以便將其轉(zhuǎn)換為整數(shù)類型的標簽testPred。然后計算測試準確率testAcc、平均絕對誤差testMae、均方根誤差testRmse和F1分數(shù)testF1。
3.3.3 評價結(jié)果
利用上述模型進行評價,結(jié)果見表8。從表8中可以看出,基于主成分分析法清晰的反映出水庫各月份的水體質(zhì)量狀況:水質(zhì)達到Ⅰ類水標準有1月、3月、4月、6月、7月共5個月;2月、5月、8月、9月、10月、11月、12月水質(zhì)狀況均為Ⅱ類。
表8 RBF神經(jīng)網(wǎng)絡水質(zhì)評價結(jié)果匯總
由表7和表8分析可知,兩種方法在2月份以及7月份出現(xiàn)差異,造成此差異的原因在于兩者在評價過程中側(cè)重點不太一致。主成分分析法可以真實客觀地分析當?shù)厮畮焖|(zhì),為水庫改進完善提供一定參考。RBF神經(jīng)網(wǎng)絡只需要按照水質(zhì)的各個分級標準傳造出所需的訓練樣本,用訓練完善的計算模型進行水質(zhì)評價比較容易。該方法簡單,具有很好的實用性。兩種方法評價結(jié)果與實際結(jié)果相差不大,此研究可用作其他地區(qū)參考。
本文應用兩種評價方法對磨盤山水庫進行了水質(zhì)評價并對結(jié)果進行了比較,結(jié)果表明:
(1)主成分分析法相比于RBF神經(jīng)網(wǎng)絡評價法可以直觀地反映水庫水質(zhì)問題,為水庫改善提供一定參考。
(2)RBF神經(jīng)網(wǎng)絡創(chuàng)建訓練樣本較為簡單,用訓練完善的樣本進行評價,結(jié)果更為準確,實用性也更好。
(3)水環(huán)境情況比較復雜多變,其評價方法種類豐富,因而評價結(jié)果也不盡相同。故需按照自身需求,結(jié)合當?shù)厍闆r,有針對性地選擇方法對水質(zhì)進行評價。