楊誠
摘要:針對水質評價問題,通過在各類水質污染指標濃度區(qū)間內生成隨機分布樣本的方法,并組成足夠多的訓練、檢驗和測試用的樣本,提出一類新的結構優(yōu)化算法CG-OBS,CG-OBS過程將最優(yōu)腦外科(OBS)的結構評價作為目標函數的懲罰項,采用權值衰減的手段實現(xiàn)結構調整,建立了遼河水質綜合評價的網絡模型;給出了區(qū)分不同類別水質的模型分界值樣本和模型輸出分界值。
關鍵詞:共軛梯度算法;水質;綜合評價;樣本
1.引言
有效利用江河湖泊水體,是實現(xiàn)可持續(xù)發(fā)展的重要內容之一。為更有效地利用和保護自然水體,首先必須對水體水質進行合理的綜合評價與預測。針對遼河水體水質評價與預測的主要任務是,根據水體中反映污染程度的主要物質(據調研主要有溶解氧、BOD5、揮發(fā)酚、氨氮、亞硝酸鹽氮、硝酸鹽氮和高錳酸等)和石油類等物質的濃度和國家水質評價標準,分析、評價和預測水質的類別及其發(fā)展趨勢,為水體管理提供科學的依據。目前水質評價方法主要是多因素的綜合評價法,如灰色關聯(lián)分析、模糊聚類分析法、物元模型法、灰色局勢決策法和綜合指數評價法等。由于影響水質的因素很多,并且因素與水質類別之間通常存在復雜的非線性關系。神經網絡具有很強的自學習性、自適應性和容錯性,是處理非線性問題的較好選擇。
神經網絡預測模型的優(yōu)劣,最重要的指標是網絡的學習精度和泛化能力。前者保證模型的準確性;后者保證模型的推廣性,是預測模型得以真正實用的關鍵因素。網絡泛化能力與初始狀態(tài)、網絡結構、學習算法等因素均有密切關系,文獻指出,神經網絡若需達到給定的泛化能力,必須使結構與樣本相匹配,或者增加訓練樣本,或者減少網絡規(guī)模。當訓練樣本一定時,較小結構的神經網絡具有更好的泛化能力。目前,表現(xiàn)較好的結構優(yōu)化算法之一為最優(yōu)腦外科(OBS)過程,利用誤差函數的二次導數信息,解析預測權值擾動對函數的影響程度,以自頂向下的方式削弱或消除某些連接權,實現(xiàn)結構優(yōu)化。事實上,OBS算法優(yōu)良的權值衰減率以其計算復雜度為代價,高達O(nP)(n為網絡權值數目,p為訓練樣本數目)網絡修剪過程耗時長,并存在二次訓練等系列問題,因而損害了算法的實用性。
本文繼承了OBS的良好結構調整性,將OBS結構評價作為目標函數的懲罰項,采用約束形式的權值衰減策略,實現(xiàn)權值與結構的同時學習。為避免OBS評價所需二次導數的復雜計算,利用共軛梯度(Conjugate Gradient;CG)法間接得到Hessian逆信息,推導出一類新的結構優(yōu)化算法CG-OBS。該算法有效克服了OBS的計算復雜性,又可保持高效的結構優(yōu)化性能。
2.最優(yōu)腦外科(OBS)過程
OBS過程要求在網絡學習結束后方可進行,因此目標函數ζ(W)在W附近的Taylor展開可近似為:
4.1.3足夠多樣本的生成
由于5個水質評價標準(由各污染指標濃度上或下限組成)是區(qū)分各類水質的分界樣本,輸入變量(評價指標)又有6個,因此不可能用水質標準作為訓練樣本。為了正確和可靠地應用BP網絡評價水質,生成足夠多符合水質評價標準的訓練樣本和檢驗樣本是關鍵。
由水質分類原理知,各類水質由各污染指標濃度的上(下)限決定。因此,各項污染指標值都在Ⅲ類水質規(guī)定的污染指標濃度區(qū)間內時,即前述各項污染指標值為≥5-6mg/L、≤4-3mg/L、≤0. 05-0. 01mg/L、≤0. 005-0. 002mg/L、≤0. 5-0 .1mg/L和≤8-4mg/L時,該水體水質肯定屬于Ⅲ類。這樣,在上述污染指標區(qū)間內進行隨機(或均勻)取值,就能生成足夠多屬于Ⅲ類水質的樣本。同理可生成其他各類水質的樣本。本文共生成1200個樣本,各隨機抽取100個樣本(約10%)為檢驗樣本和測試樣本。利用上述算法對水質水體進行BP網絡的預測。
4.1.4網絡模型的訓練
本研究采用Statsoft公司出品的Statistical Neural Networks軟件。將CG-OBS應用于上述的BP網絡預測模型,取學習參數為:學習率α=0. 1,沖量η=0. 5(系統(tǒng)缺省值);結束學習的條件是訓練樣本的均方根誤差(RMSE)小于0.1或趨于穩(wěn)定或訓練次數達到2000次。隱層和輸出層均采用Sigmoid轉換函數。根據前述建立BP網絡模型的,隱層節(jié)點數為2和1時的網絡訓練誤差(檢驗誤差和測試誤差相似)分別為0.1320和0.2187,隱層節(jié)點數為3-15時,誤差都在0.13左右。因此,綜合考慮網絡誤差大小與結構復雜程度,合理網絡結構的隱層節(jié)點數為2,經過2000次學習,訓練樣本、檢驗樣本和測試樣本的均方根誤差(RMSE)分別為0.1320、0.1365和0.1325,平均絕對誤差(AAE)分別為0.09948、0.10200和0.09647,相關系數分別為0.9972、0.9967、0.9972。這些指標表明,經訓練得到的網絡模型對訓練樣本與對檢驗樣本和測試樣本具有相同的擬合(或表征)能力,即該網絡模型的泛化能力很強,能較好地用于評價未知樣本。
4.1.5分界樣本的模型輸出值
將分界值樣本的各項污染指標值輸入訓練好的網絡模型,對應的網絡模型輸出值分別為:1. 51、2. 48、3. 49、4. 47和5. 51。這樣對應于Ⅰ—Ⅴ類和超Ⅴ類水質,其網絡模型輸出值的范圍分別為:(0,1. 51)、(1. 51,2. 48)、(2 .48,3. 49)、(3. 49,4. 47)、(4. 47,5. 51)和>5 .51。
4.1.6遼河新民段水體水質類別的判定
將遼河新民段水體1994—1999年水體各污染指標的監(jiān)測數據(表1所示)輸入到訓練好的網絡模型,模型輸出值分別為:3.65、3. 84、3. 62、3. 74、3 .72和3. 99,對照Ⅰ-Ⅴ類和超Ⅴ類水質模型輸出值的范圍,上述水體的水質均為Ⅳ類偏好,而且1994和1996年水質較好,1999年水質最差。
5分析與討論
(1)本文提出的在各類水質污染指標濃度上下限范圍內生成足夠多隨機分布的訓練樣本、檢驗樣本和測試樣本的方法,解決了建立水質評價BP網絡模型時訓練樣本太少和沒有檢驗樣本的難題。通過采用分界樣本的辦法給出了區(qū)分各類水質的網絡模型輸出值,使得實際樣本的水質類別的判定變得非常方便。另外,網絡輸出的結果用連續(xù)函數表示,不僅便于分析水質的不同類別,還可以分析同一類水質水體的污染程度,為分析和預測水質的變化趨勢、開展環(huán)境規(guī)劃及管理提供科學的依據。(2)BP網絡是一種高度非線性關系的映射,具有很強的輸入/輸出映射能力。在沒有任何已知的數學知識描述輸入/輸出關系的情況下,網絡可以通過對大量訓練樣本的自學習、自適應建立這種映射關系,能較好地反映系統(tǒng)內部的本質特征,揭示系統(tǒng)的內部機理,對未知樣本做出的評價更具有客觀性。
參考文獻
[1]國家環(huán)境保護總局監(jiān)督管理司.中國環(huán)境影響評價.北京:化學工業(yè)出版社,2000.217—243
[2]吳文業(yè),戈建民,黃奕龍.應用灰色關聯(lián)分析進行城市地表水環(huán)境質量評價[J].世界地質,2000,19(1):53—56,65
[3]朱繼業(yè),竇貽儉,方紅松.動態(tài)系統(tǒng)物元模型在綜合水質預報中的研究和應用[J].城市環(huán)境與城市生態(tài),1999,12(1):51—53
[4]Koiran P.,Sontag? E.D. Neural networks with quadratic VC-dimension[J],Advances in Neural Info.Processing Systems&,Cambridge,MA:MIT Press,1996.197-203
[5]Hassibi B.,Stork D.G.,Wolff G.J.Optimal brain surgeon and general network pruning[J].IEEE
International Conf.on Neural Networks,1992,(1):293-299
[6]Stahlberger A.,Riedmiller M. Fast Network Pruning and Feature Extraction by Removing Complate Units[J]. Advances in Neural Information Processing Systems 9,Cambridge,MAMIT Press,1997
[7]閻平凡,張長水.人工神經網絡與模擬進化計算[M].北京:清華大學出版社,2000
[8]Harkin S.著,葉世偉,史忠植譯.神經網絡原理[M].北京:機械工業(yè)出版社,2004.154-159
[9]戴虹,袁亞湘.非線性共軛梯度法[M].上海:上??茖W技術出版社,2000
[10]楊鳳江,徐文豐.遼河新民段水質污染狀況調查與分析[J].環(huán)境保護科學,2000,26(6):30—32
[11]趙林明,胡浩之,魏德華,等.多層前向人工神經網絡[M].鄭州:黃河水利出版社,1999
[12]董聰.多層前向網絡的逼近與泛化機制.控制與決策[J],1998,13(增刊):413—417