盧 飛 辜小花 陳雙扣 劉 曉
(1. 重慶科技學(xué)院 電氣工程學(xué)院/化學(xué)化工學(xué)院, 重慶 401331; 2. 重慶市環(huán)境保護信息中心, 重慶 401147)
水質(zhì)評價、污染源識別和污染源貢獻率定量計算,是水環(huán)境監(jiān)控的重要內(nèi)容。水質(zhì)評價的常用方法有單因子評價法、綜合污染指數(shù)評價法和統(tǒng)計方法等[1]。但這些方法大多計算過程復(fù)雜,對數(shù)據(jù)質(zhì)量的要求較高,不夠簡捷[2-4]。劉埮等人基于單因子評價法提出了一種更加有效的評價方法 —— 水質(zhì)污染指數(shù)法(water pollution index,WPI)[5],通過污染指數(shù)這一指標(biāo)量化水質(zhì)污染程度,使主要污染物識別、水質(zhì)類別評價和水質(zhì)定量評價的結(jié)果得以優(yōu)化。
在水質(zhì)評價過程中,擴散模型和受體模型是常用的污染源解析模型[6]。擴散模型是用于描述污染物在水體中運動規(guī)律的數(shù)學(xué)模型,其中需要輸入大量的水質(zhì)、水文、氣象參數(shù),實際應(yīng)用范圍受限。受體模型是用于分析源與受體之間關(guān)系的源解析模型。按照數(shù)據(jù)的需求度,可將受體模型分為兩種:一種是受體濃度和污染源排放成分譜均為已知的模型,如化學(xué)質(zhì)量平衡模型(CMB)[7];另一種是污染源排放成分譜為未知而受體濃度為已知的多元統(tǒng)計受體模型,如因子分析/主成分分析模型(FA/PCA)和正定矩陣因子分析模型(PMF)[8-10]。CMB模型具有原理簡單、易于實現(xiàn)的優(yōu)勢,因此廣泛應(yīng)用于大氣和水污染源解析工作中;但由于污染源排放成分譜獲取比較困難,其應(yīng)用范圍有一定的局限性。多元統(tǒng)計模型不需要具體的污染源信息,只需受體濃度數(shù)據(jù)即可完成污染源解析工作,因此應(yīng)用更加廣泛。但是,單獨的FA/PCA模型無法定量描述污染源對水質(zhì)指標(biāo)的影響程度[11],通常需要與回歸法結(jié)合起來使用[12-13]。
璧南河流域地跨璧山、永川、江津等3個行政區(qū),其水環(huán)境的質(zhì)量對于沿岸的居民生活和城市發(fā)展有著至關(guān)重要的影響。針對璧南河流域的水質(zhì)污染問題,本次研究采用了WPI法進行水質(zhì)定量評價,并通過因子分析法和聚類算法定性識別流域的污染源種類,最后采用FA-MLR(因子得分-多元線性回歸分析)模型計算各污染源的貢獻率。
根據(jù)璧南河“一河一策”方案,璧南河各水功能區(qū)的目標(biāo)水質(zhì)均設(shè)定為Ⅲ類。結(jié)合河流水質(zhì)現(xiàn)狀及治理工作安排,預(yù)計2019年各水功能區(qū)的水質(zhì)將不低于Ⅳ類,遠期逐步達到Ⅲ類。其中,兩河口斷面為國控斷面,預(yù)計2020年目標(biāo)水質(zhì)達到或優(yōu)于Ⅳ類。但時至今日,這些目標(biāo)均未實現(xiàn)。
目前,璧南河流域的水環(huán)境問題仍比較突出,少數(shù)地區(qū)的廢污水排放不達標(biāo),導(dǎo)致了水體污染逐漸加重。璧南河干流水環(huán)境質(zhì)量整體較差,化學(xué)需氧量、氨氮、總磷均超標(biāo)[14]。
本次研究所采用的水質(zhì)數(shù)據(jù),取自璧南河流域兩河口斷面和何家橋斷面2016 — 2019年共48個月的監(jiān)測數(shù)據(jù),監(jiān)測頻次為每月1次。其中,實際監(jiān)測因子有21項,監(jiān)測數(shù)據(jù)存在一定程度的異常和缺失情況。為了有效地進行分析并獲得可靠的結(jié)果,對數(shù)據(jù)進行了異常值剔除和缺失值插補等預(yù)處理,最終選定10項監(jiān)測因子用于水質(zhì)分析,其中包括pH、NH3N、氟化物(氟離子濃度)、CODMn、CODCr、揮發(fā)酚(總酚)、DO、石油類物質(zhì)(礦物油類化學(xué)物質(zhì),各種烴類的混合物)、BOD5、TP(見表1)。
表1 水質(zhì)數(shù)據(jù)
通過水質(zhì)污染指數(shù)進行水質(zhì)分級,將水質(zhì)從優(yōu)到劣依次分為Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ、劣Ⅴ類,如表2所示。當(dāng)WPI值不超過Ⅴ類水質(zhì)標(biāo)準(zhǔn)限值時,其計算過程如式(1)所示:
Cl(i)]Cl(i)
≤Ch(i) (1) 式中:I(i)為第i個水質(zhì)指標(biāo)所對應(yīng)的WPI值;Il(i)為第i個水質(zhì)指標(biāo)所在類別標(biāo)準(zhǔn)下限質(zhì)量濃度所對應(yīng)的指數(shù);Ih(i)為第i個水質(zhì)指標(biāo)所在類別標(biāo)準(zhǔn)上限質(zhì)量濃度所對應(yīng)的指數(shù);C(i)為第i個水質(zhì)指標(biāo)的監(jiān)測值;Cl(i)為第i個水質(zhì)指標(biāo)所在類別的標(biāo)準(zhǔn)下限質(zhì)量濃度;Ch(i)為第i個水質(zhì)指標(biāo)所在類別的標(biāo)準(zhǔn)上限質(zhì)量濃度。 此外,特殊情況下的計算方法參考文獻[15]和文獻[16]。 采用因子分析法對數(shù)據(jù)進行簡化,揭示各變量之間的內(nèi)部依賴關(guān)系及數(shù)據(jù)之間的基本結(jié)構(gòu),用少數(shù)獨立的不可觀測變量(因子)表示其基本結(jié)構(gòu)。這幾個因子能夠反映原變量的主要信息,原變量可以用其線性組合來表示。分析模型如式(2)所示: X=AF+E (2) 式中:X為水質(zhì)監(jiān)測因子;A為因子載荷矩陣;F為公因子,用于解釋污染源類型;E為X的特殊因子。 表2 WPI水質(zhì)分級規(guī)則 采用因子分析法提取污染因子,根據(jù)實際情況為污染因子命名,從而實現(xiàn)污染源定性識別。因子分析的主要步驟包括: (1) 對數(shù)據(jù)進行標(biāo)準(zhǔn)化處理,消除各個變量的數(shù)量級和量綱影響; (2) 判斷樣本是否適合進行因子分析; (3) 構(gòu)造因子變量; (4) 旋轉(zhuǎn)因子,使因子具有更好的可解釋性; (5) 解釋因子命名。 將因子分析得到的因子得分作為自變量,將水質(zhì)指標(biāo)實測質(zhì)量濃度作為因變量,建立因子得分與質(zhì)量濃度相關(guān)的數(shù)學(xué)模型。模型中,因變量為Y,影響因變量的k個自變量分別為X1,X2,…,Xk,假設(shè)每一個自變量Xi對因變量Y的影響都呈線性趨勢,則因子得分的多元回歸模型如式(3)所示: Y=β0+β1·X1+β2·X2+…+βk·Xk+φ (3) 式中:β為回歸系數(shù);φ為誤差項;Y為污染指標(biāo)質(zhì)量濃度監(jiān)測值;X為因子得分。 貢獻率P的計算如下: (4) 根據(jù)兩河口和何家橋斷面2016 — 2019年歷史監(jiān)測數(shù)據(jù),對其水質(zhì)進行評價,結(jié)果如表3所示。其中,兩河口斷面的水質(zhì)長期達到Ⅳ類,2016、2019年的TP指標(biāo)達到了Ⅳ類,2017、2018年的TP和CODCr指標(biāo)達到了Ⅳ類。何家橋斷面的水質(zhì)也是長期達到Ⅳ類,但其污染情況相對更為復(fù)雜,不同年份的主要污染指標(biāo)不同。其中較為嚴(yán)重的指標(biāo)是CODCr,4年間都達到了Ⅳ類;此外,TP、CODMn、BOD5和石油類物質(zhì)也曾達到Ⅳ類。綜上所述,璧南河流域的TP、CODCr、CODMn、BOD5和石油類物質(zhì)這5個指標(biāo)受到的影響較為嚴(yán)重。 表3 水質(zhì)評價結(jié)果 為了驗證本研究案例是否適用因子分析法,首先采用KMO和Bartlett球形檢驗法進行數(shù)據(jù)樣本檢驗。檢驗結(jié)果顯示,兩河口斷面和何家橋斷面數(shù)據(jù)樣本中的KMO值均大于0.5(分別為0.53、0.62),且Bartlett球形檢驗的貢獻率都小于0.05。這表明可以采用因子分析法對璧南河流域環(huán)境數(shù)據(jù)進行分析。 通過層次聚類分析獲得數(shù)據(jù)的特性,結(jié)果如圖1所示。聚集到同一類別下的污染因子可能源于同一個污染源。將兩河口數(shù)據(jù)聚類為3類:第1類是TP、高錳酸鉀指數(shù)和BOD5;第2類是氟化物、pH值和DO;第3類是揮發(fā)酚、NH3N、石油類物質(zhì)和BOD5。將何家橋數(shù)據(jù)聚類為3類:第1類是CODCr、BOD5;第2類是氟化物、DO、pH值和高錳酸鉀指數(shù);第3類是TP、NH3N、揮發(fā)酚和石油類物質(zhì)。 在Python 3.6環(huán)境下編程進行因子分析,得到兩河口、何家橋斷面的因子特征值及貢獻率,最終提取的公因子數(shù)根據(jù)Kaiser標(biāo)準(zhǔn)規(guī)則來確定[1]。 通過因子分析得知,兩河口樣本前3個因子的特征值都大于1,方差貢獻率分別為32.4%、16.6%和12.6%,方差累計貢獻率達到61.6%(見表4)。對于兩河口斷面數(shù)據(jù)樣本,提取前3個因子即可解釋其中的大部分信息,且聚類結(jié)果分為3類比較合理。同樣,何家橋數(shù)據(jù)也是如此。因此,分別提取兩河口和何家橋數(shù)據(jù)中前3個因子作為公因子。 為了突出各公因子的顯著指標(biāo)變量,需對因子荷載矩陣進行正交轉(zhuǎn)換,使旋轉(zhuǎn)后的各指標(biāo)荷載向1或0兩極化轉(zhuǎn)換。在此,采用最大方差正交法進行旋轉(zhuǎn),結(jié)果如表5、表6所示。 兩河口斷面數(shù)據(jù)中的第1個因子(F1)在CODMn、CODCr、BOD5和TP上的載荷較大,載荷值分別為0.794、0.836、0.823和0.592,因此將F1定義為城市面源因子。第2個因子(F2)在NH3N、揮發(fā)酚和石油類上有較大的載荷,其載荷值分別為0.632、0.783和0.690,NH3N在工業(yè)廢水、生活廢水和畜禽養(yǎng)殖廢水中含量較高,表征畜禽養(yǎng)殖的農(nóng)業(yè)非點源污染。但F2與揮發(fā)酚和石油類的相關(guān)度更高,揮發(fā)酚和石油類主要來源于造紙和化學(xué)等工業(yè)廢水排放,因此將F2定義為工業(yè)污染因子。第3個因子(F3)在pH值和DO上有較大載荷,其載荷值分別為0.802和0.829,因此將F3定義為生活污水因子。 何家橋斷面數(shù)據(jù)中的第1個因子(F1)在NH3N、氟化物、揮發(fā)酚、石油類物質(zhì)和TP上有較大載荷,其載荷值分別為0.630、0.645、0.902、0.855和0.660,氟化物、揮發(fā)酚和石油類物質(zhì)主要來源于造紙和化學(xué)等工業(yè)廢水排放,因此將F1定義為工業(yè)污染因子。第2個因子(F2)在CODCr和BOD5上的載荷值分別為0.863和0.905,因此將F2定義為城市面源因子。第3個因子(F3)在pH值和DO上的載荷值分別為0.654和0.841,因此將F3定義為生活污水因子。 圖1 層次聚類結(jié)果 表4 因子方差解釋 表5 旋轉(zhuǎn)之后的因子載荷矩陣 表6 旋轉(zhuǎn)之后的方差貢獻率 采用FA-MLR模型計算污染源對各個污染指標(biāo)的貢獻率?;谝蜃臃治鏊R別的污染源類型,應(yīng)用FA-MLR模型建立水質(zhì)指標(biāo)監(jiān)測濃度和污染源之間的函數(shù)關(guān)系。應(yīng)用FA-MLR模型預(yù)測各個指標(biāo)的濃度,然后選取污染較嚴(yán)重水質(zhì)指標(biāo)的實際值和預(yù)測值進行線性擬合分析。 以線性回歸決定系數(shù)R2為評價指標(biāo),R2的取值范圍為0~1.0,取值越接近1表明擬合程度越高。當(dāng)R2大于0.7時,比較的兩個對象具有良好的一致性[17]。從圖2所示擬合結(jié)果可以看出,預(yù)測質(zhì)量濃度和實測質(zhì)量濃度的R2均大于0.7,這表明兩者具有良好的一致性。應(yīng)用FA-MLR模型進行污染源定量解析,具有較好的實用性,結(jié)果可靠。通過FA-MLR計算,得到各污染源對監(jiān)測指標(biāo)的貢獻率,如表7所示。 圖2 預(yù)測質(zhì)量濃度與實測質(zhì)量濃度擬合曲線 表7 各污染源對監(jiān)測指標(biāo)的貢獻率 % 兩河口斷面水質(zhì)主要受到F1(城市面源)的影響,F(xiàn)1對各指標(biāo)的貢獻率分別為:NH3N,11.78%;CODMn,11.17 %;CODCr,16.07%;BOD5,35.71%;TP,15.46%。其次,受到F2(工業(yè)污染)的影響,F(xiàn)2對各指標(biāo)的貢獻率分別為:NH3N,25.03 %;揮發(fā)酚,41.56 %;石油類物質(zhì),31.34%。最后,受到F3(生活污水)的影響,F(xiàn)3對DO的貢獻率為14.41%。 何家橋斷面水質(zhì)主要受到F1(工業(yè)污染)的影響,F(xiàn)1對各指標(biāo)的貢獻率分別為:NH3N,24.95%;氟化物,10.71%;揮發(fā)酚,35.28%;石油類物質(zhì),31.99%;TP,15.61%。其次,受到F2(城市面源)的影響,F(xiàn)2對各指標(biāo)的貢獻率分別為:CODCr,14.03%;BOD5,22.25%。最后,受到F3(生活污水)的影響,F(xiàn)對DO的貢獻率為18.73%。 采用水污染指數(shù)法(WPI)對璧南河流域水質(zhì)污染狀況進行評價。結(jié)果表明,璧南河整體水質(zhì)長期處于Ⅳ類,水體主要的污染指標(biāo)為TP、CODCr、CODMn、BOD5和石油類物質(zhì)。 對兩河口和何家橋斷面歷史數(shù)據(jù)進行因子分析,并綜合層次聚類的結(jié)果判斷分別提取了3個因子。兩河口數(shù)據(jù)中的第1個因子(F1)在CODMn、CODCr、BOD5和TP上有較大載荷,何家橋數(shù)據(jù)中的第1個因子(F1)在NH3N、氟化物、揮發(fā)酚和石油類物質(zhì)上有較大的載荷。確認兩河口的主要污染源為城市面源污染,何家橋的主要污染源為工業(yè)污染。應(yīng)用水質(zhì)指數(shù)法確認污染嚴(yán)重的指標(biāo)為TP、CODCr、CODMn、BOD5和石油類物質(zhì)。解析結(jié)果與實際情況相吻合。 應(yīng)用FA-MLR模型計算了兩河口斷面和何家橋斷面主要污染源的貢獻率。兩河口主要污染源為城市面源,對NH3N、CODMn、CODCr、BOD5和TP的貢獻率分別為11.78%、11.17 %、16.07%、35.71%和15.46%;何家橋主要污染源為工業(yè)污染,對NH3N、氟化物、揮發(fā)酚、石油類物質(zhì)和TP的貢獻率分別為24.95%、10.71%、35.28%、31.99%和15.61%。2.2 因子分析法
2.3 FA-MLR模型
3 璧南河流域水質(zhì)評價
4 璧南河流域污染源識別
4.1 數(shù)據(jù)檢驗
4.2 層次聚類分析
4.3 因子分析
4.4 污染源識別
5 璧南河流域污染源貢獻率計算
6 結(jié) 語