穆秀云 李林兵
水質(zhì)評(píng)價(jià)方法總的來說可分為兩大類:?jiǎn)我蜃釉u(píng)價(jià)法和綜合評(píng)價(jià)法。單因子評(píng)價(jià)法計(jì)算簡(jiǎn)單,可直觀反映哪些指標(biāo)超標(biāo),但由于是對(duì)單個(gè)水質(zhì)指標(biāo)獨(dú)立進(jìn)行評(píng)價(jià),因此得到的評(píng)價(jià)結(jié)果不能全面反映水質(zhì)量的整體狀況,可能會(huì)導(dǎo)致較大的偏差。綜合評(píng)價(jià)法可同時(shí)評(píng)價(jià)多種指標(biāo)對(duì)水質(zhì)的影響,從整體上給水質(zhì)一個(gè)客觀全面的評(píng)價(jià)。當(dāng)前研究較多的綜合評(píng)價(jià)法包括綜合指數(shù)法、灰色聚類法、灰色模式識(shí)別法、模糊綜合評(píng)判法、模糊模式識(shí)別法和人工神經(jīng)網(wǎng)絡(luò)模型等。綜合指數(shù)法通過多個(gè)指標(biāo)并賦予各指標(biāo)不同權(quán)重的綜合來判斷水質(zhì)標(biāo)準(zhǔn),它綜合考慮了各指標(biāo)對(duì)水質(zhì)的影響,卻忽略了水質(zhì)分級(jí)界線的模糊性,評(píng)價(jià)結(jié)果不能很好地反映出水質(zhì)污染的真實(shí)狀況;灰色和模糊系統(tǒng)兩大類方法也均存在一些缺陷,如都需要設(shè)計(jì)若干不同的效用函數(shù)(灰色系統(tǒng)的白化函數(shù)、模糊數(shù)學(xué)的隸屬函數(shù)等)以及人為地給定各評(píng)價(jià)指標(biāo)的權(quán)重(或權(quán)函數(shù))等。這些效用函數(shù)和指標(biāo)權(quán)重的給定往往因人而異,造成評(píng)價(jià)模式難以通用,而且增加了應(yīng)用的困難和人為主觀因素對(duì)結(jié)論的影響。事實(shí)上,在評(píng)價(jià)指標(biāo)確定后,水質(zhì)評(píng)價(jià)的過程是把這些指標(biāo)的監(jiān)測(cè)值與標(biāo)準(zhǔn)值進(jìn)行比較和分析,在此基礎(chǔ)上判斷其與哪一級(jí)分類標(biāo)準(zhǔn)更接近。因此,水質(zhì)綜合評(píng)價(jià)屬于模式識(shí)別問題。當(dāng)前,人工神經(jīng)網(wǎng)絡(luò)已在模式識(shí)別中廣泛應(yīng)用,可利用它對(duì)環(huán)境水質(zhì)進(jìn)行評(píng)價(jià),可將水質(zhì)評(píng)價(jià)中的評(píng)價(jià)標(biāo)準(zhǔn)作為樣本輸入,評(píng)價(jià)級(jí)別作為網(wǎng)絡(luò)輸出,通過網(wǎng)絡(luò)歸納出評(píng)價(jià)標(biāo)準(zhǔn)與評(píng)價(jià)級(jí)別間復(fù)雜的內(nèi)在非線性關(guān)系,從而對(duì)水質(zhì)進(jìn)行綜合評(píng)價(jià)。
BP網(wǎng)絡(luò)對(duì)水質(zhì)進(jìn)行評(píng)價(jià)時(shí),其輸出層的神經(jīng)元個(gè)數(shù)取為水質(zhì)分類的級(jí)數(shù),其輸入為評(píng)價(jià)指標(biāo)的不同指標(biāo)值。在傳統(tǒng)的BP網(wǎng)絡(luò)訓(xùn)練中,是各水質(zhì)級(jí)別的指標(biāo)值范圍內(nèi)抽取足夠的訓(xùn)練樣本,但這種做法無法考慮處于兩個(gè)相鄰水質(zhì)級(jí)別分界處的樣本,使訓(xùn)練后的網(wǎng)絡(luò)對(duì)處于兩個(gè)相鄰水質(zhì)級(jí)別分界處的水質(zhì)評(píng)價(jià)誤差很大。由于各級(jí)水質(zhì)的指標(biāo)值均處于一個(gè)給定取值區(qū)間(根據(jù)水質(zhì)評(píng)價(jià)標(biāo)準(zhǔn)選取)內(nèi),各指標(biāo)的取值是隨機(jī)的,可視為一個(gè)隨機(jī)過程,故本文引入馬爾可夫鏈蒙特卡羅方法(MCMC)來模擬各指標(biāo)的取值。這樣可生成大量的訓(xùn)練樣本,從而克服了傳統(tǒng)BP方法訓(xùn)練樣本少的弊端;由于將各指標(biāo)取值視為一個(gè)隨機(jī)過程,故各指標(biāo)值均可以一定概率出現(xiàn),克服了傳統(tǒng)方法無法考慮不同水質(zhì)級(jí)別分界線模糊性的缺點(diǎn)。
本文將改進(jìn)后的BP算法稱為基于MCMC的BP算法,即MCMC-BP。為檢驗(yàn)本文提出的MCMC-BP模型的實(shí)用性,擬在以下實(shí)例中進(jìn)行檢驗(yàn)。
某市1998年在7個(gè)樣本點(diǎn)對(duì)污染指標(biāo)進(jìn)行監(jiān)測(cè),表1列出了其中8項(xiàng)指標(biāo)的實(shí)測(cè)值。為了與其他評(píng)價(jià)方法比較,利用MCMC算法生成訓(xùn)練樣本時(shí),假定各指標(biāo)值符合正態(tài)分布,其方差為取值范圍的5%。MCMC算法隨機(jī)模擬2200組樣本,其中200組樣本做校核樣本。為削除不同量綱的影響,需對(duì)模擬樣本和實(shí)測(cè)數(shù)據(jù)進(jìn)行歸一化處理,其處理過程如下:
圖1 三層BP神經(jīng)網(wǎng)絡(luò)圖
表1 地表水水質(zhì)監(jiān)測(cè)實(shí)測(cè)值 (mg/L)
BP網(wǎng)絡(luò)采用三層,即輸入層-隱層-輸出層,隱層激活函數(shù)采用雙曲正切函數(shù)(式(2)),輸出層采用線性函數(shù)。輸入層節(jié)點(diǎn)數(shù)為監(jiān)測(cè)水質(zhì)指標(biāo)總數(shù),輸出層節(jié)點(diǎn)數(shù)為水質(zhì)級(jí)別總數(shù),隱層節(jié)點(diǎn)數(shù)根據(jù)經(jīng)驗(yàn)優(yōu)選確定,本文取為13,故網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)為8-13-5,BP訓(xùn)練1456次收斂,而傳統(tǒng)BP在相同容量的訓(xùn)練樣本條件下,收斂時(shí)訓(xùn)練次數(shù)為1162次,改進(jìn)的BP收斂速度提高了約20%。
式(2)中:f為網(wǎng)絡(luò)節(jié)點(diǎn)的輸出;n為網(wǎng)絡(luò)節(jié)點(diǎn)的輸入;b為網(wǎng)絡(luò)閾值。
圖1中,n為輸入節(jié)點(diǎn)的個(gè)數(shù);m為隱層節(jié)點(diǎn)的個(gè)數(shù);l為輸出節(jié)點(diǎn)的個(gè)數(shù)。
將歸一化以后的實(shí)測(cè)數(shù)據(jù)輸入到已訓(xùn)練好的RAGA-BP模型中,對(duì)7個(gè)樣本點(diǎn)的水質(zhì)進(jìn)行評(píng)價(jià),輸出結(jié)果見表2。從表1與《地表水環(huán)境質(zhì)量標(biāo)準(zhǔn)》對(duì)比中可以看出,測(cè)點(diǎn)3的指標(biāo)值有三項(xiàng)指標(biāo)達(dá)到Ⅱ級(jí),兩項(xiàng)達(dá)到Ⅴ級(jí),Ⅰ級(jí)、Ⅲ級(jí)、Ⅳ各一項(xiàng),因此本文模型判定為Ⅱ是比較合理的;測(cè)點(diǎn)7指標(biāo)有4項(xiàng)達(dá)到Ⅱ級(jí),故判其為Ⅱ級(jí)更準(zhǔn)確,且與《水環(huán)境質(zhì)量評(píng)價(jià)灰色模式識(shí)別模型及應(yīng)用》(史曉新,夏軍—中國(guó)環(huán)境科學(xué))中的DT法結(jié)果相同,證實(shí)了本文方法的準(zhǔn)確性。
表2 水質(zhì)評(píng)價(jià)結(jié)果
1.本文建議的基于MCMC的BP算法將各評(píng)價(jià)指標(biāo)值視為隨機(jī),利用MCMC方法獲取足夠的訓(xùn)練樣本,克服了訓(xùn)練樣本不足的問題,并考慮了水質(zhì)級(jí)別界線的模糊性,增強(qiáng)了BP網(wǎng)絡(luò)的泛化能力。
2.MCMC算法在很大程度上提高了傳統(tǒng)BP算法的收斂速度。從兩個(gè)應(yīng)用實(shí)例的BP網(wǎng)絡(luò)輸出結(jié)果來看,預(yù)報(bào)的精度有所提高,收斂速度平均提高約20%。
3.該方法可以用于地下水水質(zhì)評(píng)價(jià)或地震災(zāi)害等的評(píng)價(jià)問題中,具有較好的普適性