劉姍 張南 魏振
摘要:水質評價是水環(huán)境治理和水環(huán)境保護的基礎,如何客觀地設定各水質評價指標的權重是水質評價的重點和難點。首次將改進的基于粗糙集和條件信息熵權重的確定方法應用到水質評價中,科學、有效地確定了各水質評價指標的權重,并在此基礎上進一步建立了基于粗糙集和條件信息熵的水質評價模型。利用該模型,對重慶市南川鳳嘴江的實測水質數(shù)據(jù)進行了綜合評價。應用結果表明:運用該方法得出的評價結果更加科學、合理,而且能夠對同一等級的水質開展進一步的細化分級。研究成果可為水質監(jiān)測和水質評價提供一種新的思路。
關鍵詞:水質評價; 粗糙集; 信息熵; 指標權重; 評價方法; 水環(huán)境管理
中圖法分類號:X143文獻標志碼: ADOI:10.16232/j.cnki.1001-4179.2019.02.014
1研究背景
水質綜合評價是水環(huán)境管理與水環(huán)境保護的指導性工作,亦是水環(huán)境問題研究的重點。然而,水環(huán)境極其復雜且參數(shù)眾多,因此,提取有效的評價指標,選擇合理的方法,對于各評價指標進行權重的確定,是水質評價工作的核心與難點。目前,國內外對水質評價研究的方法有很多,主要有:多元統(tǒng)計分析法(因子分析、主成分分析、聚類分析等)[1-3]、人工神經(jīng)網(wǎng)絡法[4-6]、指數(shù)評價法(單因子評價法、內梅羅污染指數(shù)法)[7-9]、模糊綜合評價法[10-12]等。各種評價方法各有其優(yōu)缺點。
(1) 人工神經(jīng)網(wǎng)絡法是近些年來受關注度較高的水質評價方法,其評價結果客觀且分辨率高。但是該方法對訓練樣本要求很高,而且實現(xiàn)過程復雜,使其實際應用受到了很大限制。
(2) 因子分析及主成分分析法能有效地篩選出水污染的主要影響因子,但是其要求的樣本量是指標量的2~3倍,這樣也就加大了計算的復雜程度[13]。
(3) 單因子評價法遵循的是一票否決的原則,其實現(xiàn)過程簡單、實際操作性強,但用最差的單項水質指標來判定水質,難以科學、客觀地反映水體功能[9]。
模糊綜合評價方法融合了模糊數(shù)學理論,綜合考慮了水環(huán)境系統(tǒng)的多項指標,缺點是各評價指標權重的確定需要依賴信息熵、層析分析等方法。采用信息熵方法賦權,只需計算一次就可以得到各指標的權重,從而避免了模糊評價方法中對多指標賦權時計算繁瑣、工作量大等缺點[14]。
粗糙集理論不需要先驗信息,而是直接對數(shù)據(jù)進行分析和挖掘,因此大大地減輕了主觀性對水質評價結果的影響。同時,粗糙集理論具有較強的可擴展性,適宜于其他成熟算法的結合運用。熵是隨機系統(tǒng)不確定性的定量表達工具。粗糙集理論將知識看作是關于論域的劃分,從信息熵的角度出發(fā),建立知識和信息之間的關系,對粗糙集理論應用進行擴展,可以解決粗糙集理論信息丟失和結果分類的問題。
本研究在闡述粗糙集和信息熵的基礎上,提出了一種基于改進粗糙集與條件信息熵的權重確定方法,并進一步建立了新的水質綜合評價模型;最后利用該模型,對重慶市南川鳳嘴江的實測水質數(shù)據(jù)進行了綜合評價。評價結果表明:將該方法用以對水質進行評價,得出的結果更加科學和合理。本文研究成果可為水質綜合評價提供一種新的、更加科學的思路和方法。
2改進的粗糙集-信息熵權重確定方法
在粗糙集理論[15]中,知識被認為是一種分類的能力,通過引入代數(shù)學中的等價關系和集合運算來定義知識,并用信息系統(tǒng)來表示。該理論不需要先驗信息,是處理不確定與不完整信息的有效工具。
(1) 定義1[16]。假設用S=(U,A,V,f)表示一個信息系統(tǒng)模型,其中,U={x1,x2,…,xn}為研究對象的非空有限集合,被稱為研究論域;A=C∪D,C∩D=φ,C為條件屬性集,反映對象的特征,D為決策屬性集,反映對象的類別;V=∪a∈AVa為屬性值的集合,Va為屬性a的取值范圍;信息函數(shù)f:U×A→V是一個映射,用于指定論域U中每個對象x的屬性值,即對于x∈U,a∈A,則有f(x,a)=Va。若決策屬性表不為空,則該信息系統(tǒng)被稱為決策表。
熵是衡量一個系統(tǒng)無序性和混亂度的指標,它能夠用確切的數(shù)值來描述知識[17]。粗糙集的代數(shù)表示直觀性較差,難以理解,因此將粗糙集理論中的知識和信息熵建立起關系,從信息的角度去表達粗糙集的概念和運算[16]。
(2) 定義2[16]。在決策表S=(U,A,V,f)中,認為U上任意屬性集合SA是定義在U上的子集組成的代數(shù)上的一個隨機變量,其概率分布可通過如下方式來確定:
[S:p]=S1S2…Stp(S1)p(S2)…p(St)(1)
其中,p(Sj)=Sj/|U|;j=1,2,…,t。
(3) 定義3[16]。在決策表S=(U,A,V,f)中,決策屬性集D(U/D={D1,D2,…,Dk})對條件屬性集C(U/C={C1,C2,…,Cm})的條件信息熵I(D|C)定義為
I(D|C)=mi=1|Ci|?2|Ui|?2kj=1|Dj∩Ci||Ci|[1-|Dj∩Ci||Ci|](2)
(4) 定義4[16]。在決策表S=(U,A,V,f)中,c∈C,則條件屬性c的重要度定義為
NewSig(c)=I(D|(C-{c}))-I(D|C)(3)
條件屬性c的權重W(c)定義為
W(c)=NewSig(a)a∈cNewSig(a)(4)
然而,上述的條件信息熵方法,可能會造成某些原為冗余屬性的指標的重要度高于原為非冗余屬性的指標。因此,在本研究中,將重要度不為0的非冗余屬性列為高級優(yōu)先級隊列,而將重要度為0的冗余屬性列為低級優(yōu)先級隊列,從而致使高級優(yōu)先級隊列中所有屬性集的重要度均高于低級優(yōu)先級隊列中的屬性集,這樣就使得原為非冗余屬性的指標權重高于原為冗余屬性的指標權重,重要度較高的屬性依然較為重要。同時,亦可以避免冗余屬性權重為0的不合理權重的定義[18]。
(5) 定義5[18]。在決策表S=(U,A,V,f)中,c∈C,則條件屬性c的優(yōu)先度定義為
μ(c)=maxa∈{x|x∈C,Sig(x)=0}NewSig(a)Sig(c)>00Sig(c)=0(5)
(6) 定義6[18]。在決策表S=(U,A,V,f)中,c∈C,則條件屬性c的權重NewW(c)定義為
NewW(c)=NewSig(C)+μ(c)a∈CNewSig(C)+μ(a)(6)
式中,NewSig(C)表示條件屬性c的重要度;μ(c)代表條件屬性c所處隊列的優(yōu)先級。
3水質綜合評價模型
設水質系統(tǒng)為S=(U,A,V,f),其中,研究論域U={x1,x2,…,xn}為水質評價斷面;A=C∪D,C∩D=φ,C為水質的指標集;D為各監(jiān)測斷面的分類集;V為水質屬性值的集合;f∶U×A→V用于指定水質評價斷面中各指標的屬性值。通過上述改進的粗糙集-條件信息熵方法來構建水質綜合評價方法,其步驟描述如下。
(1) 選取n個斷面的m個水質指標構成斷面的實測數(shù)據(jù)表,然后對數(shù)據(jù)進行標準化處理,以此去除數(shù)據(jù)的單位限制。采用系統(tǒng)聚類分析方法,對數(shù)據(jù)樣本進行分類,根據(jù)定義1,將分類結果作為決策屬性D。
(2) 根據(jù)地表水環(huán)境質量標準表(GB-3838-2002)[19],對水質指標數(shù)據(jù)進行離散處理,結合步驟(1)所得的決策屬性構成決策表。
(3) 依據(jù)條件屬性和決策屬性,分別對論域進行等價關系劃分。根據(jù)公式(2)、(3)及公式(4),計算各個條件屬性的重要度,以此來判斷各條件屬性的優(yōu)先級別,并依據(jù)公式(5)~(6)來計算各條件屬性的權重,從而得到權重矩陣。
(4) 對地表水環(huán)境質量標準表(GB-3838-2002)進行標準化處理,得到水質評價標準表,并生成標準表矩陣;與權重矩陣相乘得到加權值,同一等級加權值的和即為該級水質綜合標準的臨界值,由此形成加權后的水環(huán)境質量分類參照表。
(5) 按照上述過程對水質量化表進行加權求和,從而得到各斷面的綜合得分;再根據(jù)水環(huán)境質量分類參照表進行水質等級的判定。
水質綜合評價流程如圖1所示。
圖1水質綜合評價流程Fig.1Comprehensive water quality assessment flow chart
4實例分析
本文采用文獻[20]中給出的重慶市南川鳳嘴江10個斷面的實測水質數(shù)據(jù)作為研究對象,7項水質評價指標(c1-c7)分別為:溶解氧、五日生化需氧量、高錳酸鉀指數(shù)、糞大腸菌群、揮發(fā)酚、氟化物以及鉻(六價)。這7項指標在地表水環(huán)境質量標準表(GB-3838-2002)中的標準限值如表1所示。
依據(jù)地表水環(huán)境質量標準表(GB-3838-2002),對原始實測數(shù)據(jù)進行等級的劃分,并以阿拉伯數(shù)字1~5代替水質指標集的值域{Ⅰ類,Ⅱ類,Ⅲ類,Ⅳ類,Ⅴ類}。對原始實測數(shù)據(jù)進行標準化處理及系統(tǒng)聚類分析。根據(jù)分析結果,可以將10個斷面大致分為以下4類:
(1) 第2個斷面單獨為一類,決策屬性記為1;
(2) 第9和第10個斷面為一類,決策屬性記為2;
(3) 第3,4,8個斷面為一類,決策屬性記為3;
(4) 第1,5,6和第7個斷面為一類,決策屬性記為4。
最終,形成水質監(jiān)測數(shù)據(jù)決策表,詳見表2。
利用前文中提到的粗糙集理論,對決策表進行等價關系的劃分,并計算出各個水質指標的重要度。由此可對7個水質指標(c1-c7)進行等級分組,同時,利用改進的權重確定方法,計算各個水質指標的權重值(NewW),計算結果如下:
NewW(c1)=0.213,NewW(c2)=0.106,
NewW(c3)=0.043,NewW(c4)=0.184,
NewW(c5)=0.078,NewW(c6)=0.184,
NewW(c7)=0.191
參照前述文中提到的方法,獲得水環(huán)境質量分類參照表,即各水質等級的分界線(詳見表3);計算各斷面的綜合得分,并與各等級分界線進行比較,由此得到各斷面的水質等級(詳見圖2)。經(jīng)過比較,評價結果與文獻[20]中采用的BP模型評價法、Hopfield模型評價法、模糊綜合指數(shù)法、灰色聚類法以及劉力[21]基于信息熵方法分析的評價結果基本一致。評價結果對比如表4所示。
由圖2以及表4的結果可知,本文基于粗糙集-信息熵的水質綜合評價方法,不僅能夠給出客觀、明確的水質評價結果,并且可以根據(jù)各個斷面的綜合得分,對同一水質等級下的各個斷面的水質優(yōu)劣情況進行比較分析。比如,本例的第4,9及第10個斷面同為Ⅱ類水質,但是根據(jù)綜合得分可知,第9個斷面的水質要優(yōu)于第10個斷面的水質,也優(yōu)于第4個斷面的水質。對
于大型流域的水環(huán)境管理而言,在水質等級評定的基礎上,細化各水質等級,可為水環(huán)境治理提供依據(jù),對水環(huán)境管理和決策具有重要的參考價值。
5結 論
(1) 本文將粗糙集理論與信息熵相結合,形成了一個較完善的權重確定方法,給出了客觀、明確的水質評價結果。
(2) 該方法穩(wěn)定性高,較好地克服了傳統(tǒng)水質綜合評價中主觀性強的缺點。
(3) 能夠根據(jù)斷面綜合得分,對同一等級的評價對象進行細化考量,提高了水質評價的分辨率。
(4) 該方法概念清晰、評價出的結果科學合理,可進一步將其應用于水環(huán)境監(jiān)測的相關工作中,具有深入研究的意義和推廣應用的前景。
參考文獻:
[1]Liu P, Hoth N, Drebenstedt C, et al. Hydro-geochemical paths of multi-layer groundwater system in coal mining regions - Using multivariate statistics and geochemical modeling approaches[J]. Science of the Total Environment, 2017(1): 601-602.
[2]Fatoba J O, Sanuade O A, Hammed O S, et al. The use of multivariate statistical analysis in the assessment of groundwater hydrochemistry in some parts of southwestern Nigeria[J]. Arabian Journal of Geos-ciences, 2017, 10(15):328.
[3]王剛, 李兆富, 萬榮榮,等. 基于多元統(tǒng)計分析方法的西苕溪流域水質時空變化研究[J].農業(yè)環(huán)境科學學報, 2015, 34(9):1797-1803.
[4]Najah A, El-Shafie A, Karim O A, et al. Application of artificial neural networks for water quality prediction[J].Neural Computing & Applications, 2013, 22(1):187-201.
[5]曹建智, 張健. 人工神經(jīng)網(wǎng)絡在白洋淀水質評價中的應用[J]. 電子技術與軟件工程, 2016(8):261-262.
[6]劉麗穎, 官冬杰, 楊清偉,等. 基于人工神經(jīng)網(wǎng)絡的喀斯特地區(qū)水資源安全評價[J]. 水土保持通報, 2017, 37(2):207-214.
[7]Kong Y, Pang Z, Wu C, et al. A comparative study of single factor and multivariate statistical methods for surface water quality assessment[J]. Water Policy, 2014(16):157-167.
[8]Jie C, Qing L, Hui Q. Application of improved nemerow index method based on entropy weight for groundwater quality evaluation[J]. International Journal of Environmental Sciences, 2012, 2(3):1284-1290.
[9]羅芳, 伍國榮, 王沖,等. 內梅羅污染指數(shù)法和單因子評價法在水質評價中的應用[J]. 環(huán)境與可持續(xù)發(fā)展, 2016, 41(5):87-89.
[10]Li B, Yang G, Wan R, et al. Dynamic water quality evaluation based on fuzzy matter-element model and functional data analysis, a case study in Poyang Lake.[J]. Environmental Science & Pollution Research International, 2017(7):1-11.
[11]Li R, Zou Z, Yan A. Water quality assessment in Qu River based on fuzzy water pollution index method[J]. Journal of Environmental Science, 2016, 50(12):87-92.
[12]劉頓開, 吳以中. 改進的模糊綜合評價法及在河道水質評價中的應用研究[J]. 環(huán)境科學與管理, 2017, 42(3):190-194.
[13]安巖, 鄒志紅, 王曉靜,等. 基于粗糙集理論的水質模糊綜合評價[J]. 工業(yè)工程, 2015(1):1-5.
[14]鄒志紅, 孫靖南, 任廣平. 模糊評價因子的熵權法賦權及其在水質評價中的應用[J]. 環(huán)境科學學報, 2005, 25(4):552-556.
[15]張文修. 粗糙集理論與方法[M].北京:科學出版社, 2001.
[16]鮑新中, 張建斌, 劉澄. 基于粗糙集條件信息熵的權重確定方法[J]. 中國管理科學, 2009, 17(3):131-135.
[17]張繼國,Singh P. 信息熵:理論與應用[M].北京:中國水利水電出版社, 2012.
[18]朱紅燦, 陳能華. 粗糙集條件信息熵權重確定方法的改進[J]. 統(tǒng)計與決策, 2011(8):154-156.
[19]國家環(huán)境保護總局,國家質量監(jiān)督檢疫總局.GB38382-2002地表水環(huán)境質量標準[S].北京:中國環(huán)境科學出版社,2002.
[20]郭勁松, 龍騰銳. 四種水質綜合評價方法的比較[J]. 土木建筑與環(huán)境工程, 2000, 22(4):6-12.
[21]劉力, 周建中, 楊俊杰,等. 基于信息熵的改進模糊綜合評價方法[J]. 計算機工程, 2009, 35(18):4-6.
引用本文:劉姍,張南,魏振.基于粗糙集—信息熵的水質綜合評價方法研究[J].人民長江,2019,50(2):75-78.
Research on water quality comprehensive evaluation method based on rough set and information entropy
LIU Shan,ZHANG Nan, WEI Zhen
(China Academy of Space System Science and Engineering, Beijing 100048, China)
Abstract: Water quality assessment is the basis of water environment management and protection. Objectively setting the weights of water quality evaluation indexes is the key and difficult point of water quality assessment. The improved weight determination method based on rough sets and conditional information entropy were applied to water quality assessment for the first time. The weight of each water quality evaluation index was determined scientifically and effectively. The water quality evaluation model based on rough set and conditional information entropy were further established. The application results show that the assessment results by this method are more scientific and reasonable, and can further give a fine classification of water quality at a same level. This method provides a new idea for water quality monitoring and evaluation.
Key words:rough set; information entropy; water quality assessment indicator weight; assessment method; water environment management