陳廣銀, 蔡灝兢, 朱 奕, 夏 飛
(昆山市環(huán)境監(jiān)測站,江蘇 昆山 215300)
科學評價水質(zhì)狀況是環(huán)境管理的基礎(chǔ)。一些學者嘗試運用新的方法評價水體,如灰色評價法、模糊數(shù)學法、主成分分析法、多元統(tǒng)計法、色聚類法等[1-8],但這些方法多數(shù)需要設計各評價指標對各級標準的隸屬函數(shù)及各指標的權(quán)重,評價結(jié)果受主觀因素影響較大,限制了評價方法的通用性,也影響了結(jié)果的可靠性[9]。神經(jīng)網(wǎng)絡是20世紀 40年代產(chǎn)生、80年代發(fā)展起來的模擬人腦生物過程的人工智能技術(shù),特別適用于對因果關(guān)系復雜的非確定性推理、判斷、識別和分類等問題的處理,并被應用在水質(zhì)評價中,如BP網(wǎng)絡模型、模糊神經(jīng)網(wǎng)絡模型,但這些模型學習速度慢,受初始值、權(quán)值等多種因素影響,易陷入局部最優(yōu)、重復性較差[10-13]。本文嘗試用廣義回歸神經(jīng)網(wǎng)絡評價水體水質(zhì),并和其它評價方法對比說明其可行性。
廣義回歸神經(jīng)網(wǎng)絡(GRNN)是美國學者DonaldF·Specht在1991年提出的,是徑向基函數(shù)神經(jīng)網(wǎng)絡的一種特殊形式,用密度函數(shù)來預測輸出[14]。GRNN建立在非參數(shù)核回歸基礎(chǔ)上,樣本數(shù)據(jù)作為后驗概率驗證條件執(zhí)行Parzen非參數(shù)估計,從樣本中計算自變量和因變量之間的聯(lián)合概率密度函數(shù),算出因變量對自變量的回歸值[15]。
假設x,y是兩個隨機變量,其聯(lián)合概率密度為f(x,y)。若已知x0,y相對于x的回歸為
(1)
對于未知的概率密度函數(shù)f(x,y),則可根據(jù)x和y的觀測樣本通過Parzen非參數(shù)估計得:
(2)
d(x0,xi)=(x0-xi)T(x0-xi)/2σ2
(3)
d(y0,yi)=(y0-yi)2/2σ2
(4)
將公式(2)、(3)、(4)代入式(1),交換積分與求和的順序得到式(5):
(5)
由于
(6)
化簡上式可得:
(7)
式中:n為樣本容量;m為隨機變量x的維數(shù);σ為光滑因子,其為高斯函數(shù)的標準差。GRNN 神經(jīng)網(wǎng)絡的輸出數(shù)據(jù)和訓練樣本的誤差主要由平滑因子決定的,只需調(diào)整平滑因子就可以獲得較好的全局性收斂模型[16]。
BP網(wǎng)絡分為輸入層、隱藏層和輸出層。輸入信號通過權(quán)值鏈接作用于隱藏層,隱藏層通過激活函數(shù)的非線性變換后計算得到輸出層,產(chǎn)生輸出信號。如果沒有得到期望輸出,則根據(jù)實際輸出與期望輸出的誤差偏差調(diào)整輸入層節(jié)點與隱藏層節(jié)點、隱藏層節(jié)點與輸出層節(jié)點之間的聯(lián)接權(quán)值及閾值,使誤差沿梯度下降方向,經(jīng)過反復迭代,當實際輸出和期望輸出達到設定誤差時訓練即告完成[12]。
訓練數(shù)據(jù)來源于《地表水環(huán)境質(zhì)量標準》(GB 3838—2002),見表1,并用matlab R2013a中的linspace線性內(nèi)插法生成500組數(shù)據(jù)。待評價數(shù)據(jù)來源于Ⅲ類功能水體的某湖泊采樣點,采樣時間為2016年每月4日,連續(xù)12個月,監(jiān)測項目見表2。為了消除因變量及自變量量綱及濃度不同所帶來的影響,將原始數(shù)據(jù)進行歸一化處理后作為網(wǎng)絡輸入和輸出,并將網(wǎng)絡評價結(jié)果進行反歸一化得到實際評價結(jié)果。
表1 地表水環(huán)境質(zhì)量標準值Table 1 Surface water environment quality standard
表2 待評價水體水質(zhì)參數(shù)Table 2 Waterquality parameters for evaluation
通過MATLAB R2013a中的廣義回歸神經(jīng)網(wǎng)絡命令net=newgrnn(P,T,SPREAD)建立模型,其中SPREAD為光滑因子,訓練時將光滑因子分別取值為0.4、0.6、0.8,并將Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ類水體標準值代入訓練好的網(wǎng)絡模型進行評價,評價誤差如圖1。從圖中可以看出,當光滑因子為0.8時,模型評價誤差為2.1%~36%;當光滑因子為0.4時,5種水體的評價誤差在0.5%~4.7%,因此本文采用光滑因子為0.4時的模型。
圖1 光滑因子對評價結(jié)果的影響Fig.1 Smooth factor’s influence on the evaluation results
為了說明本文所提出的廣義回歸神經(jīng)網(wǎng)絡的可行性,將其評價結(jié)果與比較成熟的BP神經(jīng)網(wǎng)絡的評價結(jié)果進行比較,結(jié)果如圖2。
圖2 水質(zhì)評價結(jié)果Fig.2 The results of water quality evaluation
從圖2中發(fā)現(xiàn)GRNN與BP神經(jīng)網(wǎng)絡的水質(zhì)評價結(jié)果基本一致,GRNN和BP評價結(jié)果誤差為-0.4%~18.6%。兩種評價方法都表明一年中2、3月份的水質(zhì)最差,夏季的水質(zhì)評價較好,其中8月份最好。通過分析原始數(shù)據(jù)發(fā)現(xiàn)影響水質(zhì)的主要因素是TN,分析夏季水質(zhì)較好的原因可能為:8月份雨水較充沛,在一定程度上稀釋了水體;高溫天氣,企業(yè)停產(chǎn)停工較多,也在客觀上減少了水體TN的排入;水體溫度高,硝化、厭氧硝化較為活躍,加速水體中TN的去除。2、3月份水質(zhì)最差的原因一方面2、3月份溫度低,硝化、反硝化弱,導致水質(zhì)自凈能力差;另一方面,春節(jié)期間可能違法行為較多,污染物偷排量大。
單因子評價法是選取評價時段內(nèi)水質(zhì)最差的類別為評價結(jié)果,是水質(zhì)評價使用最多的方法,能夠確定影響水質(zhì)類別的關(guān)鍵因素[17]。本例中主要污染因子是TN,從而有利于提出針對性的水環(huán)境治理措施,但其評價結(jié)果過于悲觀。盡管其它污染指標濃度很低,基本處于Ⅱ類水標準,但由于TN較高,導致所評價水體全部是Ⅴ類或劣Ⅴ類,無法評價水質(zhì)的綜合狀況。
GRNN和BP通過對環(huán)境標準的學習,自動計算因子間的權(quán)重系數(shù),消除主觀誤差,兩者評價結(jié)果平均相對誤差為8.8%,說明將廣義回歸神經(jīng)網(wǎng)絡用于水質(zhì)評價是可行的。GRNN及BP評價結(jié)果顯示,2、3月份水質(zhì)污染最嚴重,均超過水體功能區(qū)Ⅲ類水的標準,其余月份都符合Ⅲ類功能。BP網(wǎng)絡訓練時需要大量的數(shù)據(jù),模型參數(shù)多,易陷入局部最優(yōu),而GRNN只需調(diào)整模型平滑因子,為全局收斂。
GRNN與BP神經(jīng)網(wǎng)絡的水質(zhì)評價結(jié)果基本一致,其評價結(jié)果相對誤差-0.4%~18.6%,說明了GRNN評價水質(zhì)的可行性。水質(zhì)評價結(jié)果表明,待評價水體水質(zhì)不容樂觀,剛好達到或者已經(jīng)超過功能區(qū)標準。一年中污染最重的是2、3月份,污染最輕的是8月份。應該加大水體治理力度,特別是春節(jié)期間的 2、3月份,嚴查企業(yè)偷排行為,減少水體污染物的輸入。GRNN用于水質(zhì)評價時模型參數(shù)少、操作簡單,通過對標準方法的學習,自動計算因子間的權(quán)重系數(shù),評價結(jié)果能夠綜合反映水質(zhì)狀況,有助于管理人員通過大量的監(jiān)測數(shù)據(jù)快速掌握不同水體的污染程度,為水資源管理提供重要的技術(shù)支持。