安宇翔
(河北省水利水電勘測(cè)設(shè)計(jì)研究院,天津 300250)
目前水質(zhì)評(píng)價(jià)的方法很多,包括概率統(tǒng)計(jì)法[1]、模糊評(píng)價(jià)法[2]、物元分析法[3]、灰色聚類評(píng)估法、綜合指數(shù)法[4]、支持向量機(jī)分類法[5]、人工神經(jīng)網(wǎng)絡(luò)分析法等。其中灰色聚類評(píng)估法應(yīng)用最為廣泛。地表水水質(zhì)受當(dāng)?shù)厮?、地質(zhì)、氣候、社會(huì)經(jīng)濟(jì)活動(dòng)等眾多因素影響,同時(shí)水質(zhì)評(píng)價(jià)是建立在有限樣本的監(jiān)測(cè)數(shù)據(jù)之上,由此可以把水質(zhì)環(huán)境系統(tǒng)當(dāng)作一灰色系統(tǒng)進(jìn)行研究。
灰色聚類是灰色理論與聚類思想的有機(jī)結(jié)合,按不同聚類指標(biāo)的屬于不同灰類的白化權(quán)函數(shù),將聚類對(duì)象歸入事先定好的不同灰類之中。
高郵湖地跨江蘇高郵市、寶應(yīng)縣、金湖縣和安徽天長(zhǎng)市,是江蘇省第三大湖,水域總面積760.67km2,是淮河入江水道的組成部分。其水域?qū)掗煟瑸闈O業(yè)養(yǎng)殖、生活生產(chǎn)用水提供了得天獨(dú)厚的自然條件。湖內(nèi)自然生長(zhǎng)近20種淡水魚類、4~5種蝦類,湖底有3~4類貝殼。由于受上游水質(zhì)影響及養(yǎng)殖業(yè)發(fā)展、漁業(yè)和農(nóng)業(yè)用藥的污染,湖水水質(zhì)有惡化的趨勢(shì)。本文選擇該湖有代表性的幾項(xiàng)指標(biāo),按照GB3838—2002《地表水環(huán)境質(zhì)量標(biāo)準(zhǔn)》水質(zhì)分級(jí)標(biāo)準(zhǔn),根據(jù)2010年實(shí)測(cè)數(shù)據(jù)序列,探討基于動(dòng)態(tài)權(quán)重的灰色聚類方法在高郵湖水質(zhì)評(píng)價(jià)中的應(yīng)用[6]。
灰色聚類綜合評(píng)價(jià)的關(guān)鍵在于白化權(quán)函數(shù)的選擇與指標(biāo)權(quán)重的選取。本文在指標(biāo)靜態(tài)權(quán)重的基礎(chǔ)上,采用基于相對(duì)均值變幅的動(dòng)態(tài)權(quán)重,并與靜態(tài)權(quán)重組合,從而得到最終的隨指標(biāo)實(shí)際取值不斷變化而變化的權(quán)重。
采用投影尋蹤法[7]計(jì)算各指標(biāo)的靜態(tài)權(quán)重,投影尋蹤方法是處理高維數(shù)據(jù)的有效方法之一。其將高維數(shù)據(jù)按投影向量投影到低維空間,排除與數(shù)據(jù)結(jié)構(gòu)及其特征無(wú)關(guān)的或關(guān)系很小的變量的干擾,并根據(jù)數(shù)據(jù)在投影空間的散布程度或局部凝聚程度來(lái)分析各評(píng)價(jià)指標(biāo)的權(quán)重。其主要步驟如下:
1.1.1 投影指標(biāo)函數(shù)的構(gòu)建
將 m 維規(guī)格化的數(shù)據(jù) {x (i,j)|i=1,2, …,n;j=1,2,…,m}綜合成以 p={p(1),p(2),…,p(m)}為投影方向的一維綜合投影值G(i):
其次,根據(jù){G(i),i=1,2,…,n}的一維數(shù)據(jù)散布圖進(jìn)行辨識(shí),要求投影值 G(i)應(yīng)盡可能使類間大地提取{x(i,j)}中的變異信息,從而盡可能多地?cái)y帶大壩基巖監(jiān)測(cè)數(shù)據(jù)的變異信息,而變異信息可以由 G(i)標(biāo)準(zhǔn)差 SG來(lái)度量;同時(shí)要求類內(nèi)密度盡可能大,因此投影指標(biāo)函數(shù)可以用式(2)表示:
其中,SG是投影值 G(i)的標(biāo)準(zhǔn)差,則
1.1.2 投影指標(biāo)函數(shù)的優(yōu)化及求解
綜上可知,投影尋蹤算法的最后結(jié)果是求解關(guān)于式(5)的最優(yōu)化問題,即
顯然,這是一個(gè)非線性尋優(yōu)問題,常規(guī)的搜索方法很難得到最優(yōu)解,可以采用實(shí)數(shù)編碼的加速遺傳算法(RAGA)來(lái)達(dá)到尋優(yōu)的目的。由上面計(jì)算得最佳投影方向p歸一化后即可得到可指標(biāo)的權(quán)重:(j=1,2,…,m)。
由于水質(zhì)是隨著各指標(biāo)數(shù)值的不斷變化而變化,因此本文嘗試運(yùn)用基于指標(biāo)變化幅度來(lái)計(jì)算指標(biāo)的動(dòng)態(tài)權(quán)重。 設(shè)實(shí)測(cè)序列為 x′(i,j),則其相對(duì)于均值的變幅程度為:
根據(jù)最小相對(duì)信息原理,將靜態(tài)權(quán)重與動(dòng)態(tài)權(quán)重進(jìn)行組合,即可得到組合動(dòng)態(tài)權(quán)重wij。
設(shè)有i個(gè)時(shí)間序列對(duì)象樣本,每個(gè)對(duì)象有j個(gè)指標(biāo),每個(gè)指標(biāo) k 個(gè)灰類。 設(shè)有實(shí)測(cè)值{x′(i,j)|i=1,2,…,n;j=1,2,…,m},第 j個(gè)指標(biāo)的第 k 個(gè)灰類的閾值為(j=1,2,…,m;k=1,2,…,s)。 由于各聚類指標(biāo)的量綱不同,數(shù)量級(jí)也不同,因此需要對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。
本文采用均值化,如式(8)。
式中 x′(i,j)為第 i個(gè)對(duì)象的第 j個(gè)指標(biāo)的實(shí)測(cè)值;x(i,j)為第 i個(gè)對(duì)象的第 j個(gè)指標(biāo)的標(biāo)準(zhǔn)化數(shù)值。
同理,對(duì)選用的水質(zhì)評(píng)價(jià)標(biāo)準(zhǔn),即第j個(gè)指標(biāo)的第k個(gè)灰類的閾值進(jìn)行標(biāo)準(zhǔn)化處理,如式(9)。
根據(jù)GB3838—2002《地表水環(huán)境質(zhì)量標(biāo)準(zhǔn)》(表2)水質(zhì)分級(jí)標(biāo)準(zhǔn),采用中心點(diǎn)線性白化權(quán)函數(shù),即根據(jù)聚類指標(biāo)各灰類的閾值將水質(zhì)分為k類。對(duì)于數(shù)值越小越好的指標(biāo) (如氰化物、總磷)。
屬于第I(j=1)級(jí)水質(zhì)的白化權(quán)函數(shù)為:
屬于第Ⅱ~Ⅳ(j=2,3,4)級(jí)水質(zhì)的白化權(quán)函數(shù)為:
屬于第Ⅴ(j=5)級(jí)水質(zhì)的白化權(quán)函數(shù)為:
對(duì)于數(shù)值越大越好的指標(biāo)(如溶氧量),其白化權(quán)函數(shù)應(yīng)相應(yīng)調(diào)整,如:
對(duì)于指標(biāo)定權(quán)聚類,設(shè)各指標(biāo)的權(quán)重為wj(j=1,2,…,m)。
各對(duì)象的聚類系數(shù)向量為:
根據(jù)聚類系數(shù)向量按最大隸屬原則可判斷對(duì)象所屬的灰類。
根據(jù)高郵湖2010年實(shí)測(cè)1~12月份各指標(biāo)數(shù)據(jù),選取有代表性的指標(biāo):營(yíng)養(yǎng)鹽及有機(jī)污染綜合指標(biāo)的溶氧量、無(wú)機(jī)陰離子指標(biāo)氰化物、一般重金屬指標(biāo)銅、重金屬指標(biāo)汞、有機(jī)污染物指標(biāo)揮發(fā)酚、生物指標(biāo)類大腸菌群6個(gè)指標(biāo),根據(jù)公式(8)將其標(biāo) 準(zhǔn) 化 處 理 得 到 標(biāo) 準(zhǔn) 化 決 策 矩 陣 (xij)12×6。 以GB3838—2002《地表水環(huán)境質(zhì)量標(biāo)準(zhǔn)》作為水質(zhì)評(píng)價(jià)的標(biāo)準(zhǔn),將水質(zhì)分為5個(gè)級(jí)別,即5個(gè)灰類,各灰類的閾值如表1。
表1 水質(zhì)評(píng)價(jià)標(biāo)準(zhǔn)
由此可以按式(10)~式(13)確定各指標(biāo)屬于不同灰類的白化權(quán)函數(shù),根據(jù)式(1)~式(5),采用MATLAB編程,調(diào)試RAGA參數(shù),可得當(dāng)種群N=300,交叉概率Pc=0.8,變異概率Pm=0.2,加速次數(shù)為20時(shí),得到指標(biāo)的靜態(tài)PP法權(quán)重為:=(0.0132,0.2383,0.2593,0.0432,0.0831,0.3629)。
根據(jù)式(6)計(jì)算得到個(gè)指標(biāo)的動(dòng)態(tài)權(quán)重,在運(yùn)用式(7)可得到最終的組合動(dòng)態(tài)權(quán)重wij,如表2。
表2 各對(duì)象指標(biāo)動(dòng)態(tài)權(quán)重
根據(jù)白化權(quán)函數(shù)及動(dòng)態(tài)權(quán)重,可以求得最終的聚類系數(shù)與評(píng)價(jià)結(jié)果,并與靜態(tài)權(quán)重計(jì)算結(jié)果比較如表3。
表3 兩種權(quán)重計(jì)算結(jié)果比較
比較表3中的結(jié)果可知,靜態(tài)權(quán)重與動(dòng)態(tài)權(quán)重的評(píng)價(jià)結(jié)果大部分是一致的,說明動(dòng)態(tài)權(quán)重用于灰色聚類綜合評(píng)價(jià)是可行的。不同之處在于2010年2月份、6月份與8月份。其中2月份動(dòng)態(tài)權(quán)重判斷的級(jí)別優(yōu)于靜態(tài)權(quán)重,觀察2月份實(shí)測(cè)值可知,該項(xiàng)各指標(biāo)均在Ⅱ級(jí)水范圍之內(nèi),且類大腸菌群實(shí)測(cè)值為12個(gè)月份中最低值,故將其作為Ⅱ級(jí)水更合理。6月份與8月份,動(dòng)態(tài)評(píng)判的結(jié)果劣于靜態(tài)評(píng)判,觀察6、8月份的實(shí)測(cè)數(shù)據(jù)可知,6、8月份的溶氧量均較小,而類大腸菌群數(shù)量則比較多,將其劃分為IV級(jí)水更符合實(shí)際。同時(shí)由表3可以看出,動(dòng)態(tài)水質(zhì)評(píng)價(jià)5~9月份水質(zhì)均為IV級(jí)水,是一個(gè)連續(xù)的過程,5~9月份是用水的高峰期,農(nóng)業(yè)生產(chǎn)在此期間對(duì)水質(zhì)的影響在該階段最為顯著,水質(zhì)級(jí)別更符合當(dāng)?shù)氐膶?shí)際情況。
在投影尋蹤算法確定指標(biāo)靜態(tài)權(quán)重的基礎(chǔ)上,采用基于均值相對(duì)變幅確定各項(xiàng)指標(biāo)的動(dòng)態(tài)權(quán)重,實(shí)現(xiàn)了權(quán)重隨時(shí)間的動(dòng)態(tài)變化,并最終將其應(yīng)用到灰色聚類綜合評(píng)判之中。實(shí)例結(jié)果表明該方法是可行的、合理的。動(dòng)態(tài)權(quán)重可以避免了靜態(tài)權(quán)重的缺點(diǎn)和不足,水質(zhì)指標(biāo)的權(quán)重可以隨著指標(biāo)實(shí)測(cè)數(shù)據(jù)的變化動(dòng)態(tài)調(diào)整,更能充分挖掘?qū)崪y(cè)數(shù)據(jù)所提供的潛在信息,使評(píng)判的結(jié)果更趨于合理。
[1]高靈財(cái),呂明明,等.“十五”期間牡丹江河流段水質(zhì)評(píng)價(jià)方法的探索與研究[J].環(huán)境科學(xué)與管理,2009,34(5):167-169.
[2]凌敏華,左其亭.水質(zhì)評(píng)價(jià)的模糊數(shù)學(xué)方法及其應(yīng)用研究[J].人民黃河,2006,28(1):34-36.
[3]樊引琴,劉婷婷,等.物元分析法在黃河水質(zhì)評(píng)價(jià)中的應(yīng)用[J].水資源與水工程學(xué)報(bào),2013,24(2):166-169.
[4]申獻(xiàn)辰,杜霞,等.水源地水質(zhì)評(píng)價(jià)指數(shù)系統(tǒng)的研究[J].水科學(xué)進(jìn)展,2000,1(3):260-265.
[5]陳琳,劉俊民,等.支持向量機(jī)在地下水水質(zhì)評(píng)價(jià)中的應(yīng)用[J].西北農(nóng)林科技大學(xué)(自然科學(xué)版),2010,38(11):221-225.
[6]陳振翔,李小路,等.高郵湖水環(huán)境污染防治對(duì)策研究[J].污染防治技術(shù),2012,25(3):70-73.
[7]張欣莉.投影尋蹤新算法在水質(zhì)評(píng)價(jià)模型中的應(yīng)用[J].中國(guó)環(huán)境科學(xué),2000,20(2):187-189.