周 及,關(guān)衛(wèi)省,付林濤
(1.長(zhǎng)安大學(xué)環(huán)境科學(xué)與工程學(xué)院,陜西 西安 710054; 2.長(zhǎng)安大學(xué)旱區(qū)地下水文與生態(tài)效應(yīng)教育部重點(diǎn)實(shí)驗(yàn)室,陜西 西安 710054; 3.寶雞市生態(tài)環(huán)境局鳳縣分局,陜西 寶雞 721700)
自20世紀(jì)80年代到21世紀(jì)初,西安市工業(yè)用水量和生活用水量逐年增加,水資源的儲(chǔ)備量和需求量大大失衡,水資源的管理及合理利用顯得尤為重要[1]?;诖?,越來越多的水質(zhì)監(jiān)測(cè)項(xiàng)目被應(yīng)用到實(shí)際生產(chǎn)生活中,然而水質(zhì)監(jiān)測(cè)中復(fù)雜冗長(zhǎng)的檢測(cè)指標(biāo)給數(shù)據(jù)管理及分析工作帶來很大困難。多元統(tǒng)計(jì)分析方法由于可以簡(jiǎn)化數(shù)據(jù)結(jié)構(gòu)、提取潛在信息,被廣泛應(yīng)用于水質(zhì)分析中[2-3]。Pati等[4-5]將多元統(tǒng)計(jì)技術(shù)和水質(zhì)評(píng)價(jià)指數(shù)結(jié)合,確定了研究區(qū)域飲用水及農(nóng)業(yè)用水的適宜程度;Zare等[6]通過研究建立了水質(zhì)季節(jié)質(zhì)量指數(shù)的評(píng)價(jià)模型。周豐等[7-8]提出了適用于大尺度、多斷面的水質(zhì)評(píng)價(jià)方法。蔡廣強(qiáng)等[9]通過研究發(fā)現(xiàn)了南方某水庫(kù)水質(zhì)時(shí)空變化特征。利用多元統(tǒng)計(jì)分析的方法研究西安市及周邊地區(qū)的地表河流水質(zhì),主要集中在對(duì)浐河、灞河、渭河等代表河流的水體污染特征和污染因子來源進(jìn)行分析[10-13]。但是,多元統(tǒng)計(jì)分析樣本數(shù)量越多,方法適用性越高,而相關(guān)研究受樣本數(shù)量的局限,無法精確量化河流與河流之間污染的程度對(duì)比,無法判別不同年份間污染趨勢(shì)的變化。
本文收集了西安市地表河流2009—2017年的監(jiān)測(cè)數(shù)據(jù),從多元統(tǒng)計(jì)分析的角度出發(fā),利用因子分析法識(shí)別水中主要污染物,探究污染物的逐年變化趨勢(shì),初步分析污染物主要來源,并利用主成分綜合排序?qū)Ω鱾€(gè)斷面的污染情況進(jìn)行綜合評(píng)價(jià),旨在為西安市地表水保護(hù)和治理提供科學(xué)依據(jù)和理論基礎(chǔ)。
表1 西安市地表水2009—2017年水質(zhì)指標(biāo)統(tǒng)計(jì)描述Table 1 Statistical description of water quality indicators of Xi’an surface water from 2009 to 2017
通過收集《西安市水資源公報(bào)》中實(shí)測(cè)數(shù)據(jù)和調(diào)研西安市水利局統(tǒng)計(jì)資料,得到了2009—2017年西安市地表水近40個(gè)斷面的逐月監(jiān)測(cè)數(shù)據(jù),選取CODMn、BOD、石油類、糞大腸菌群、陰離子表面活性劑、NH3-N、TN、TP等24個(gè)指標(biāo)為水質(zhì)指標(biāo)。采樣點(diǎn)覆蓋西安市主要河流,包括灞河、渭河、灃河、浐河、黑河、皂河及各個(gè)大小渠系,共1 552個(gè)檢測(cè)樣本,有效個(gè)案1 221個(gè),數(shù)據(jù)統(tǒng)計(jì)結(jié)果見表1。在進(jìn)行因子分析與聚類分析前對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,以消除量綱的影響[14]。分析采用IBM SPSS statistics 23軟件。
西安市內(nèi)主要河流有渭河、涇河、灞河、灃河、澇河、黑河、石川河,均屬于黃河流域渭河水系[15]。水資源總量多年平均為19.73億m3,2017年全市水資源總量為24.45億m3[1]。
依照GB3838—2002《地表水環(huán)境質(zhì)量標(biāo)準(zhǔn)》按功能區(qū)劃分類別對(duì)西安市境內(nèi)河流、水庫(kù)水質(zhì)進(jìn)行評(píng)價(jià),結(jié)果見表2。2014年水質(zhì)污染總體較為嚴(yán)重,2015年有所好轉(zhuǎn),但2016年綜合污染指數(shù)上升了9.8%,整體上2017年西安市河流水質(zhì)污染有所減輕,水質(zhì)綜合污染指數(shù)較上年同期下降19.9%[1]。從河流角度來說,近幾年皂河、新河、浐河、臨河污染情況最為嚴(yán)重。
1.3.1因子分析法
因子分析法是一種降低變量維數(shù)的方法,它從研究原始變量相關(guān)矩陣出發(fā),把關(guān)系復(fù)雜的變量歸結(jié)為少數(shù)幾個(gè)綜合因子。在水質(zhì)分析中,此方法主要用來提取污染因子和識(shí)別污染源[16-17]。作為識(shí)別污染源的有效工具,因子分析還可以量化出污染源的貢獻(xiàn)率[18]。因子分析的一般模型為
表2 2014—2017年西安市主要河流水質(zhì)概況Table 2 Water quality of main rivers in Xi’an from 2014 to 2017
(1)
式中:f1,f2,…,fm(m≤p)為公因子;aij為因子載荷,反映xi和fi之間的相關(guān)程度[19,20];εi為方程誤差。
1.3.2主成分分析法
主成分分析法(principal components analysis,PCA)是利用少數(shù)不相關(guān)的新變量反映原始變量,通過對(duì)新的變量進(jìn)行排序、分類,解決多變量數(shù)據(jù)最佳綜合簡(jiǎn)化的問題。利用主成分分析方法調(diào)查水質(zhì)狀況,并在此基礎(chǔ)上對(duì)水質(zhì)綜合指標(biāo)進(jìn)行量化排序[19-21],是主成分分析法在水質(zhì)評(píng)價(jià)工作中發(fā)揮的最大作用。
近年來,主成分分析法在水環(huán)境質(zhì)量評(píng)價(jià)應(yīng)用的原理是,把很多指標(biāo)參數(shù)放入同一個(gè)系統(tǒng),并對(duì)這些指標(biāo)參數(shù)進(jìn)行定量化的分析研究,最終得出的主成分綜合得分能夠反映水體的水質(zhì)狀況,得分越高,水質(zhì)污染狀況越嚴(yán)重[20-22]。主成分分析的基本步驟:①計(jì)算相關(guān)系數(shù)陣,檢驗(yàn)待分析的變量是否適合做主成分分析;②根據(jù)研究問題所選定的初變量的特征判斷求主成分的方法;③求協(xié)方差陣或相關(guān)陣的特征根及對(duì)應(yīng)標(biāo)準(zhǔn)化特征向量;④確定主成分個(gè)數(shù);⑤計(jì)算各個(gè)樣品主成分得分。
2.1.1數(shù)據(jù)標(biāo)準(zhǔn)化
由于數(shù)據(jù)量綱和數(shù)量級(jí)的不同,利用SPSS軟件分別將2009—2017年的原始數(shù)據(jù)標(biāo)準(zhǔn)化,采用Z-score法進(jìn)行標(biāo)準(zhǔn)化處理:
(2)
2.1.2因子分析的適合性和相關(guān)性檢驗(yàn)
各個(gè)年份的KMO和巴特利特檢驗(yàn)結(jié)果見表3,KMO檢驗(yàn)值均≥0.5,并且滿足P<0.05的置信區(qū)間,達(dá)到檢驗(yàn)要求,說明提取的主成分對(duì)于原始變量的解釋程度較高且該分析是客觀有效的。近似卡方、自由度和顯著性的統(tǒng)計(jì)檢驗(yàn)結(jié)果表示,即使球形假設(shè)被拒絕,也可以認(rèn)為相關(guān)系數(shù)矩陣與單位矩陣有顯著差異,即原數(shù)據(jù)適用于做因子分析。
表3 2009—2017年因子分析統(tǒng)計(jì)檢驗(yàn)結(jié)果Table 3 Statistical test results of factor analysis from 2009 to 2017
相關(guān)性矩陣中各個(gè)變量間的相關(guān)系數(shù)表明了因子間的相關(guān)度,越接近1,相關(guān)度越高。9年的相關(guān)性矩陣計(jì)算結(jié)果表明,指標(biāo)CODCr與CODMn、糞大腸菌群、NH3-N、BOD等指標(biāo)正相關(guān)性很高,均達(dá)到0.9以上;而指標(biāo)DO與NH3-N、CODCr、糞大腸菌群這些指標(biāo)呈極大的負(fù)相關(guān),其絕對(duì)值均達(dá)到0.9以上。通過各個(gè)年份的相關(guān)性矩陣可以看出因子間的相關(guān)程度很高,即適用于因子分析及降維處理。
2.1.3提取公因子
通過SPSS對(duì)各年監(jiān)測(cè)數(shù)據(jù)進(jìn)行降維處理,從原有個(gè)數(shù)較多的變量中提取少數(shù)幾個(gè)不可觀測(cè)的因子,以反映各年監(jiān)測(cè)指標(biāo)的基本信息。并且根據(jù)變量間的相關(guān)性進(jìn)行分組,從變量組內(nèi)提取少數(shù)的潛在因子來反映本組的特性,從而使這些因子能夠概括和歸納原有觀測(cè)變量的大部分信息,解釋變量的基本結(jié)構(gòu)[23]。
表4中,利用主成分分析法提取2009—2017年24個(gè)監(jiān)測(cè)指標(biāo)的主成分,2009年、2011年、2012年、2014年、2015年提取了4個(gè)主成分,2010年、2017年提取了5個(gè)主成分,2013年、2016年提取了6個(gè)主成分,每個(gè)主成分下因子得分較高的控制指標(biāo)也具有明顯的分離度。結(jié)果顯示原本的24個(gè)指標(biāo)可以由4~6個(gè)主成分因子所描述,方差累計(jì)貢獻(xiàn)率均在78%以上,說明提取的主成分因子可較好地描述原本龐大的數(shù)據(jù)。
表4 2009—2017年提取的公因子Table 4 Common factors extracted from 2009 to 2017
2.1.4因子旋轉(zhuǎn)
為更好地對(duì)公因子進(jìn)行解釋,本文對(duì)因子載荷矩陣做出正交變換,即在對(duì)應(yīng)坐標(biāo)系進(jìn)行投影,從而使旋轉(zhuǎn)后的因子載荷矩陣結(jié)構(gòu)簡(jiǎn)化。利用凱撒正態(tài)化最大方差法對(duì)因子載荷進(jìn)行旋轉(zhuǎn),將得到的結(jié)果由大到小進(jìn)行排序,得到旋轉(zhuǎn)后的成分矩陣。由于對(duì)每年的數(shù)據(jù)進(jìn)行因子分析后得到的主成分含義不同,F(xiàn)5、F6貢獻(xiàn)率數(shù)小,因此主要選取前4個(gè)主成分F1~F4來研究。
2.1.5污染源識(shí)別
從表4可得2009—2017年各個(gè)主成分表征的污染源:第一主成分(F1)中CODMn、CODCr、NH3-N具有較高的因子載荷,指示的是有機(jī)物污染源;氟化物、硫化物、Hg在F2中占有較大的因子載荷,即F2指示的是燃煤動(dòng)力和冶金工業(yè)的污染源;F3中As、Si占比較大,指示的是電子和冶煉工業(yè)的污染源;F4則指示的是化工產(chǎn)業(yè)[23-24]??傮w來說,西安市的地表河流受有機(jī)物污染最為嚴(yán)重,其次是工業(yè)生產(chǎn)中產(chǎn)生的一些對(duì)環(huán)境和人體有很大損害的有毒物質(zhì)。
初始因子載荷矩陣用于表征監(jiān)測(cè)水質(zhì)指標(biāo)與主成分的相關(guān)程度,用于解釋各個(gè)主成分變量的變異情況,其絕對(duì)值越接近1,表明相關(guān)程度越高,則該指標(biāo)可以作為評(píng)價(jià)水質(zhì)的主要控制指標(biāo)[10,24-25]。根據(jù)這一原則,并且結(jié)合指標(biāo)所要表征的全面性以及避免重復(fù),選取以下6個(gè)指標(biāo)作為西安市河流的主要控制指標(biāo):CODCr、陰離子表面活性劑、NH3-N、石油類、氟化物、硫化物,并且根據(jù)這6個(gè)指標(biāo)與其主成分的因子載荷值繪制圖1,評(píng)價(jià)這些指標(biāo)9年間對(duì)主成分因子的影響情況。
由圖1可知,2009—2017年CODCr、NH3-N、陰離子表面活性劑3個(gè)指標(biāo)均維持了較高的因子載荷。石油類污染物在2009—2015年間波動(dòng)較小,2016年顯著下降并達(dá)到最小值;氟化物基本維持較低因子載荷,在2013—2014年間波動(dòng)明顯。綜上,西安市河流水質(zhì)受有機(jī)類、NH3-N、陰離子表面活性劑污染最為嚴(yán)重,2011—2015年綜合污染情況嚴(yán)重,2016年水質(zhì)最好。
圖1 2009—2017年污染物主要控制指標(biāo)變化趨勢(shì)Fig.1 Change trend of main pollutant control indicators from 2009 to 2017
2.2.1主成分得分計(jì)算
若從原P個(gè)指標(biāo)中提取了m個(gè)主成分(式(1)),則主成分得分計(jì)算公式為
(3)
式中:Yi為第i個(gè)主成分得分;Xi為第i年原始變量值;li1,li2,…,lim為X協(xié)方差陣特征值對(duì)應(yīng)特征向量。
將每年36~40個(gè)水質(zhì)樣品的原始變量值標(biāo)準(zhǔn)化處理后代入式(3),計(jì)算得出監(jiān)測(cè)斷面的各主成分得分,給予水質(zhì)污染程度的定量化描述:各個(gè)主成分下的得分越大,說明受此主成分因子的影響越大,綜合得分越高,表明水體受污染的程度越嚴(yán)重[26-27]。
將各個(gè)主成分的特征根作權(quán)數(shù),對(duì)每個(gè)主成分進(jìn)行加權(quán)平均即得綜合得分,主成分綜合評(píng)定函數(shù)Y表示每年各斷面綜合污染情況。
(4)
式中:Yi為各個(gè)斷面在第i主成分下的得分情況;λ1,λ2,…,λn為每個(gè)主成分的特征根。
根據(jù)2009—2017年斷面主成分綜合得分計(jì)算結(jié)果,北石橋綜合得分在2009年、2011年、2014年、2015年得分最高,其中2014年與2015年得分高達(dá)8.08、9.11。其次是丈八溝,綜合得分在2017年達(dá)到最高,2009年、2014年位于第二;再次是雁秋門,綜合得分在2010年、2012年達(dá)到最高。小北門在2009年、2012年得分最低,臨河入渭在2015年、2017年得分最低,其中小北門斷面在2009年得分最低可達(dá)0.11。
2.2.2綜合評(píng)價(jià)
a. 水質(zhì)空間分布特征。各斷面的主成分綜合得分越高、排名越靠前,代表斷面污染越嚴(yán)重。2009—2017年主成分綜合得分排名前10的斷面綜合得分情況見表5。
由表5可知,北石橋除2016年、2017年斷流外,其余年份均為綜合得分最高斷面,其次,雁秋門、農(nóng)場(chǎng)西站、丈八溝,說明這些斷面綜合污染最嚴(yán)重的,其中農(nóng)場(chǎng)西站、雁秋門、丈八溝均屬于皂河水系,北石橋?qū)儆谇?。文中未列出的斷面艾蒿坪?009年主成分綜合得分最低,為-2.209,田峪口在2011年得分達(dá)到最低,為-2.191,它們均屬于黑河水系。說明西安市主要地表水系中皂河污染最嚴(yán)重,黑河污染狀況最輕。
b. 點(diǎn)源污染解析。北石橋、雁秋門、農(nóng)場(chǎng)西站和丈八溝這4個(gè)主成分綜合得分較高的斷面,分析這幾個(gè)斷面第一、第二、第三等等主成分的得分,得出水質(zhì)主要污染源如下:斷面北石橋(2016—2017年無水)在2009—2015年在第一主成分下得分均為正值,說明與F1正相關(guān),并且得分值較大,表明采樣點(diǎn)北石橋的水質(zhì)受F1表征的氨氮類、有機(jī)類污染物影響最為顯著;F2下的得分在2009—2011年為正值,在2012—2015年為負(fù)值,說明此采樣點(diǎn)與F2在前3年正相關(guān),后面幾年為負(fù)相關(guān),說明北石橋2009—2011年受氟、硫化物和石油類污染物影響較為嚴(yán)重,而后面4年有所緩解[27]。斷面雁秋門在這9年間均在F1上有較高得分,說明此采樣點(diǎn)受氨氮和有機(jī)污染物影響嚴(yán)重,而在F2、F3上得分基本上為負(fù)值,因此可以看出雁秋門受氟、硫化物、砷硒、石油類污染物的影響較弱。同理,可知斷面農(nóng)場(chǎng)西站與丈八溝這兩個(gè)采樣點(diǎn)均受有機(jī)物和NH3-N污染最為嚴(yán)重,其他污染物影響不太顯著。
a. 通過降維處理將24個(gè)水質(zhì)指標(biāo)綜合為4~6個(gè)主成分,且降維后主成分的方差累計(jì)貢獻(xiàn)率均在78%以上,能較好地反映原水質(zhì)指標(biāo)的信息,有效簡(jiǎn)化監(jiān)測(cè)數(shù)據(jù)。
b. 采用因子分析法得到了因子載荷較高的7個(gè)水質(zhì)指標(biāo)為:CODCr、CODMn、陰離子表面活性劑、NH3-N、石油類、氟化物、硫化物。通過分析7個(gè)水質(zhì)指標(biāo)的變化,發(fā)現(xiàn)西安市地表河流2011年到2015年綜合污染情況嚴(yán)重,2016年水質(zhì)最好。
c. 通過主成分分析法,得到了35~40個(gè)監(jiān)測(cè)斷面的各主成分得分,其中北石橋、農(nóng)場(chǎng)西站、雁秋門和丈八溝的綜合得分最高,艾蒿坪、田峪口綜合得分最低。表明西安市主要地表水系中皂河污染最嚴(yán)重,黑河污染程度最輕。通過分析得分最高的斷面,發(fā)現(xiàn)有機(jī)物、NH3-N對(duì)地表河流水質(zhì)影響最為顯著。