胡 星 孔 舒 趙曉旭 李曉霜 李 偉
加權(quán)優(yōu)序法和BP神經(jīng)網(wǎng)絡(luò)在水質(zhì)評價中的應(yīng)用比較
胡 星 孔 舒 趙曉旭 李曉霜 李 偉
1.加權(quán)優(yōu)序法的基本原理
加權(quán)優(yōu)序法是將有限個可行解按照加權(quán)優(yōu)序數(shù)進行排序,根據(jù)加權(quán)優(yōu)序數(shù)的大小順序選擇滿意方案的多目標決策方法。
在使用加權(quán)優(yōu)序法進行水質(zhì)評價時,將水質(zhì)標準、評價樣本作為一個整體,計算出各評價指標的優(yōu)序數(shù),然后計算出各樣本的加權(quán)優(yōu)序數(shù)(各指標的權(quán)重系數(shù)可以根據(jù)專家評分、層次分析法等方法確定),根據(jù)優(yōu)序數(shù)的大小順序確定水質(zhì)的相對優(yōu)劣,根據(jù)評價樣本和水質(zhì)標準之間優(yōu)序數(shù)的相對大小確定評價樣本的水質(zhì)的等級。
2.加權(quán)優(yōu)序法的步驟
(1)構(gòu)造多目標決策模型
根據(jù)實際問題,設(shè)有方案Xi(i=1,2,3,……,n),每個方案對應(yīng)k個目標(k=1,2,3,……,m),由此構(gòu)造多目標決策模型。
(2)確定各方案的優(yōu)序關(guān)系
對于兩個方案Xi,Xj,定義其優(yōu)序關(guān)系為:
方案Xi與Xj相比時的優(yōu)序數(shù)aijk(即Xi的第k個目標優(yōu)于其他方案的個數(shù),函數(shù)值相同時按0.5計算)為:
(3)計算加權(quán)優(yōu)序數(shù)
考慮到各個目標存在重要性差異,往往需要對各個目標賦予不同的權(quán)重ωk,并假設(shè),則加權(quán)優(yōu)序數(shù)可按下式計算:
(4)將加權(quán)優(yōu)序數(shù)排序
按從大到小的順序?qū)⒓訖?quán)優(yōu)序數(shù)排序,根據(jù)加權(quán)優(yōu)序數(shù)的大小順序可以選擇出滿意的方案。其計算過程如表1所示。
1.人工神經(jīng)網(wǎng)絡(luò)介紹
人工神經(jīng)網(wǎng)絡(luò)的研究始于20世紀40年代,它是人工智能研究的一個重要領(lǐng)域。ANN是模擬人腦神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)與功能特征的一種非線性信息并行處理系統(tǒng),是由大量的處理單元(人工神經(jīng)元)相互連接而成的網(wǎng)絡(luò)。它不需要任何先驗公式,就能從已有數(shù)據(jù)中自動地歸納規(guī)則,獲得這些數(shù)據(jù)的內(nèi)在規(guī)律,具有自學(xué)習(xí)性、自組織性、自適應(yīng)性和很強的非線性映射能力,特別適合于因果關(guān)系復(fù)雜的非確定性推理、判斷、識別和分類等問題。
在眾多人工神經(jīng)網(wǎng)絡(luò)模型中,應(yīng)用最廣泛的是基于誤差反向傳播算法的前饋型網(wǎng)絡(luò)——BP網(wǎng)絡(luò)。
2.BP神經(jīng)網(wǎng)絡(luò)原理
BP網(wǎng)絡(luò)是一種基于誤差反向傳播算法的前饋網(wǎng)絡(luò),是最常用的ANN模型之一。BP網(wǎng)絡(luò)一般由輸入層、1個或多個隱含層、輸出層組成(本文以只有1個隱含層的BP網(wǎng)絡(luò)為例),每層有若干神經(jīng)元(節(jié)點),各層之間的神經(jīng)元采用全連接的方式,通過權(quán)重(ωij)和闕值(θj)連接,同層的神經(jīng)元之間沒有連接。
BP網(wǎng)絡(luò)的訓(xùn)練過程由信息的正向傳播過程和誤差的反向傳播過程構(gòu)成(圖1)。信息進入輸入層,傳遞到隱含層,經(jīng)過處理到達輸出層,再由輸出層處理之后產(chǎn)生輸出結(jié)果,此為信息的正向傳播過程。而實際輸出結(jié)果與期望輸出結(jié)果之間必然存在誤差,因此將轉(zhuǎn)入誤差的反向傳播過程,將誤差值由輸出層向輸入層逐層反向傳播,沿途不斷修正各層的連接權(quán)值和各層神經(jīng)元的闕值,如此反復(fù),使誤差最小化。
圖1 BP網(wǎng)絡(luò)示意圖
3.BP網(wǎng)絡(luò)的實現(xiàn)步驟
(1)數(shù)據(jù)預(yù)處理(歸一化)。網(wǎng)絡(luò)的輸入具有不同的量綱,取值量級可能存在較大的差別,同時受激活函數(shù)值域的限制,網(wǎng)絡(luò)輸出需要限定在某一范圍內(nèi)。因此就需要在網(wǎng)絡(luò)訓(xùn)練前對輸入、輸出數(shù)據(jù)進行預(yù)處理,也稱為歸一化處理。歸一化處理的公式很多,直到現(xiàn)在還沒有一個非常切實可行的統(tǒng)一的方法。常用的有最值法,和值法等。谷曉平等提出了改進的歸一化公式,式中α和 β為歸一化系數(shù)。
表1 加權(quán)優(yōu)序法計算表
(2)隨機給定初始權(quán)重和闕值。網(wǎng)絡(luò)的初始權(quán)重一般在[-1,1]之間隨機產(chǎn)生。
(3)訓(xùn)練樣本。訓(xùn)練樣本的信息由輸入層傳遞到隱含層,經(jīng)過處理再傳遞到輸出層,有輸出層產(chǎn)生實際輸出結(jié)果。
(4)計算誤差并調(diào)整權(quán)重和闕值。BP神經(jīng)網(wǎng)絡(luò)的實際輸出和期望輸出存在著誤差,網(wǎng)絡(luò)訓(xùn)練的目標是使訓(xùn)練樣本的誤差最小,將產(chǎn)生的誤差由輸出層向輸入層逐層反向傳播,沿途不斷修正權(quán)值和闕值,如此反復(fù),使誤差達到最小化。
(5)將訓(xùn)練所得的權(quán)值和閾值保存起來,以便對預(yù)測樣本的輸入進行處理,從而計算出預(yù)測樣本的網(wǎng)絡(luò)輸出。
在泰安市渿河的龍?zhí)端畮?、普照橋、泰山大橋、東岳大街四個斷面和上游龍?zhí)端畮旄浇氖瘝{谷取得水樣評價樣本,選取氨氮、總氮、總磷、高錳酸鉀指數(shù)4個指標,分別利用加權(quán)優(yōu)序法和BP神經(jīng)網(wǎng)絡(luò)對其進行水質(zhì)評價。
1.加權(quán)優(yōu)序法的應(yīng)用
表2是國家地表水質(zhì)量標準和龍?zhí)端畮?、普照橋、泰山大橋、東岳大街、石峽谷的評價樣本指標。
表2 國家地表水質(zhì)量標準及評價樣本指標表
在利用加權(quán)優(yōu)序法進行水質(zhì)評價時,首先要確定權(quán)重,一般認為某一指標的污染程度越高,其相應(yīng)的權(quán)重越大,因此可以根據(jù)評價樣本各指標平均值所對應(yīng)的等級來確定權(quán)重。考慮下列兩種確定權(quán)重的方法:
(1)比值權(quán)重。將平均值為I級的水質(zhì)指標的初始權(quán)重設(shè)定為1,水質(zhì)等級高1級,權(quán)重按等比例增加。如水質(zhì)標準共有m級,則第i級的初始權(quán)重為ai(i=1,2,…,m),a>1為比例因子,一般取2。由評價樣本各指標平均值的等級來確定其初始權(quán)重,然后歸一化得到比值權(quán)重。
對于表2的數(shù)據(jù),各指標的初始權(quán)重為:4,32,4,4。歸一化后得到的比值權(quán)重 W1=(0.0909,0.7273,0.0909,0.0909)。
(2)改進的層次分析法確定權(quán)重。首先按照評價樣本各指標平均值等級構(gòu)造三標度比較矩陣.平均值等級高的指標較等級低的指標重要.得到比較矩陣見表3。
表3 三標度比較矩陣表
計算得到權(quán)重向量W2=0.0996,0.7012,0.0996,0.0996)。
在水質(zhì)評價中,將每一個評價樣本與水質(zhì)標準作為一個整體,計算出其加權(quán)優(yōu)序數(shù),根據(jù)排序確定出水質(zhì)等級。以石峽谷水質(zhì)樣本為例,將5個水質(zhì)標準與石峽谷水質(zhì)樣本作為一個整體,計算出各樣本的指標的優(yōu)序數(shù),然后計算出不同權(quán)重下的加權(quán)優(yōu)序數(shù)并排序,見表4。
表4 加權(quán)優(yōu)序法計算表
用同樣的方法確定出其他四個樣本的水質(zhì)等級,見表5。
表5 加權(quán)優(yōu)序法水質(zhì)評價結(jié)果表
從結(jié)果可以看出,比值權(quán)重和AHP權(quán)重的結(jié)果一致。
2.BP神經(jīng)網(wǎng)絡(luò)的應(yīng)用
水質(zhì)標準及評價樣本見表2。使用MATLAB軟件完成下述過程。
(1)BP網(wǎng)絡(luò)模型的建立和數(shù)據(jù)預(yù)處理
根據(jù)表2的水質(zhì)標準及評價樣本可以確定,BP網(wǎng)絡(luò)模型的輸入層有4個神經(jīng)元,即4個評價指標;一個隱含層,根據(jù)“2N+1”的經(jīng)驗,確定隱含層有9個神經(jīng)元;輸出層有5個神經(jīng)元,即5個水質(zhì)等級(Ⅰ~Ⅴ)。利用MATLAB神經(jīng)網(wǎng)絡(luò)工具箱中的Newff函數(shù)生成BP神經(jīng)網(wǎng)絡(luò),用logsig和purelin函數(shù)作為各層神經(jīng)元的傳遞函數(shù),網(wǎng)絡(luò)訓(xùn)練函數(shù)選擇trainlm函數(shù)。
BP網(wǎng)絡(luò)模型建立完成之后,還需要對樣本數(shù)據(jù)進行預(yù)處理,使用MATLAB工具箱中的PREMNMX對評價樣本集做預(yù)處理。
(2)BP網(wǎng)絡(luò)模型的訓(xùn)練
網(wǎng)絡(luò)模型建立完成并對數(shù)據(jù)預(yù)處理后,利用函數(shù)train對生成的模型就行訓(xùn)練,網(wǎng)絡(luò)訓(xùn)練參數(shù)如下:
net.trainParam.show=20;
net.trainParam.lr=0.05;
net.trainParam.epochs=2000;
net.trainParam.goal=0.0001
網(wǎng)絡(luò)訓(xùn)練停止時,收斂于一穩(wěn)定值。
(3)結(jié)果輸出
將待測樣本輸入到訓(xùn)練好的網(wǎng)絡(luò)中,讓確定好的網(wǎng)絡(luò)模型對這些樣本進行識別判定,輸出結(jié)果后評價各樣本的水質(zhì)等級石峽谷水質(zhì)為Ⅳ類,龍?zhí)端畮?、普照橋、泰山大橋水質(zhì)為Ⅴ類,東岳大街水質(zhì)為劣Ⅴ類。
從加權(quán)優(yōu)序法和BP神經(jīng)網(wǎng)絡(luò)法的評價結(jié)果看,二者的評價結(jié)果基本一致。加權(quán)優(yōu)序法用于水質(zhì)評價是可行的,而且其思路簡單、清晰、明確,計算過程并不復(fù)雜,相較于其他方法在計算方面具有明顯的優(yōu)勢,其實用性較強■
(作者單位:山東省濟寧市水文局272000)