王 松,吳 彤,彭 瓊
(四川省樂(lè)山生態(tài)環(huán)境監(jiān)測(cè)中心站,四川 樂(lè)山 614000)
水環(huán)境污染已引起世界各國(guó)的廣泛關(guān)注和研究[1~4]。然而,由于污染物標(biāo)準(zhǔn)的不同以及單一指標(biāo)評(píng)價(jià)方法的局限性,僅采用單因子評(píng)價(jià)法難以全面評(píng)估水質(zhì)。目前,國(guó)內(nèi)外廣泛采用的方法包括指數(shù)法、加權(quán)綜合指數(shù)法、營(yíng)養(yǎng)狀態(tài)指數(shù)法、主成分分析法和聚類(lèi)分析法等[5]。主成分分析(PCA)是一種常用的數(shù)據(jù)降維方法,通過(guò)尋找數(shù)據(jù)中變量的最大方差方向,并將數(shù)據(jù)沿該方向進(jìn)行投影,從而簡(jiǎn)化數(shù)據(jù)結(jié)構(gòu)并保留數(shù)據(jù)中最大的信息。PCA可以降低變量之間的相關(guān)性,減少數(shù)據(jù)噪聲和冗余,提高模型的準(zhǔn)確性。這種方法可視化結(jié)果直觀,有助于發(fā)現(xiàn)和理解數(shù)據(jù)中的重要變量,廣泛應(yīng)用于統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)和信號(hào)處理等領(lǐng)域。
樂(lè)山位于四川盆地東北緣地區(qū),水資源豐富,市區(qū)內(nèi)擁有四川省第二大河流岷江及其支流等多個(gè)水系,使用主成分分析方法對(duì)樂(lè)山市境內(nèi)所有斷面的水環(huán)境進(jìn)行評(píng)價(jià)較合理。本次研究旨在使用2022年樂(lè)山市范圍內(nèi)設(shè)立的國(guó)家和省級(jí)自動(dòng)水質(zhì)監(jiān)測(cè)站的月均監(jiān)測(cè)數(shù)據(jù),對(duì)樂(lè)山市2022年水環(huán)境質(zhì)量進(jìn)行評(píng)估和研究。
選取樂(lè)山市轄區(qū)所有國(guó)、省控水質(zhì)自動(dòng)監(jiān)測(cè)站(下稱(chēng)自動(dòng)站)2022年度監(jiān)測(cè)數(shù)據(jù)月均值進(jìn)行研究,點(diǎn)位信息見(jiàn)表1。自動(dòng)站監(jiān)測(cè)參數(shù)涵蓋了水溫、pH等常規(guī)水質(zhì)五參數(shù)以及高錳酸鹽指數(shù)、氨氮、總磷、總氮。自動(dòng)站能夠?qū)λ跀嗝娴乃|(zhì)進(jìn)行全天候不間斷連續(xù)監(jiān)測(cè),可以每小時(shí)獲取一次五參數(shù)數(shù)據(jù),每四小時(shí)獲取一次其余四參數(shù)的監(jiān)測(cè)數(shù)據(jù)。相較于常規(guī)手工監(jiān)測(cè),自動(dòng)監(jiān)測(cè)有其獨(dú)特的優(yōu)勢(shì)[6]:(1)實(shí)時(shí)監(jiān)測(cè):水質(zhì)自動(dòng)監(jiān)測(cè)系統(tǒng)能夠?qū)崟r(shí)反饋水質(zhì)參數(shù),提供連續(xù)并及時(shí)地?cái)?shù)據(jù),相較于手工監(jiān)測(cè)可以更快速地發(fā)現(xiàn)水質(zhì)變化,減少因數(shù)據(jù)滯后而導(dǎo)致的誤差和延誤。(2)準(zhǔn)確性高:水質(zhì)自動(dòng)監(jiān)測(cè)系統(tǒng)采用高精度的傳感器進(jìn)行數(shù)據(jù)采集,并經(jīng)過(guò)數(shù)學(xué)模型校準(zhǔn)處理數(shù)據(jù),相較于手工監(jiān)測(cè)減少了人為誤差和偏差,確保了水質(zhì)監(jiān)測(cè)數(shù)據(jù)的準(zhǔn)確性和可靠性。(3)節(jié)省人力和時(shí)間:得益于自動(dòng)監(jiān)測(cè)系統(tǒng)的高度自動(dòng)化及智能化,大大降低了手工操作和數(shù)據(jù)處理的工作量,節(jié)省了人力和時(shí)間成本。(4)可擴(kuò)展性和靈活性強(qiáng):水質(zhì)自動(dòng)監(jiān)測(cè)系統(tǒng)相較于手工監(jiān)測(cè)可以更加方便地對(duì)監(jiān)測(cè)點(diǎn)位進(jìn)行擴(kuò)展,并且可以根據(jù)不同的監(jiān)測(cè)需求進(jìn)行調(diào)整。(5)實(shí)現(xiàn)遠(yuǎn)程監(jiān)測(cè):水質(zhì)自動(dòng)監(jiān)測(cè)系統(tǒng)具有實(shí)現(xiàn)遠(yuǎn)程監(jiān)測(cè)的優(yōu)勢(shì),可以通過(guò)互聯(lián)網(wǎng)等遠(yuǎn)程技術(shù)實(shí)現(xiàn)數(shù)據(jù)的遠(yuǎn)程訪問(wèn)和共享,方便了監(jiān)測(cè)管理和數(shù)據(jù)分析??偟膩?lái)說(shuō),水質(zhì)自動(dòng)監(jiān)測(cè)系統(tǒng)能夠?qū)崿F(xiàn)自動(dòng)化和數(shù)字化監(jiān)測(cè)水質(zhì)指標(biāo),減少了人為因素和誤差,提高了監(jiān)測(cè)數(shù)據(jù)的精確度和可信度,促進(jìn)了水質(zhì)的管理和保護(hù),相較于傳統(tǒng)手工監(jiān)測(cè)具有更高的優(yōu)勢(shì)和價(jià)值。
表1 站點(diǎn)信息Tab.1 Information about stations
一般地,設(shè)有n個(gè)評(píng)價(jià)對(duì)象和m個(gè)評(píng)價(jià)指標(biāo),用評(píng)價(jià)矩陣Y=(yij)n×m表示。
將矩陣中的各指標(biāo)yij通過(guò)標(biāo)準(zhǔn)化運(yùn)算轉(zhuǎn)換成標(biāo)準(zhǔn)化指標(biāo)xij。指標(biāo)標(biāo)準(zhǔn)化計(jì)算公式為:
對(duì)標(biāo)準(zhǔn)化后的數(shù)據(jù)進(jìn)行KMO檢驗(yàn)和巴特萊特球形檢驗(yàn)(Bartlett Test of Sphercity)。KMO檢驗(yàn)是用于評(píng)估因子分析模型適合度的統(tǒng)計(jì)檢驗(yàn)工具。KMO檢驗(yàn)的目的是測(cè)試每個(gè)觀測(cè)變量與其他變量之間的相關(guān)性程度。它的檢驗(yàn)結(jié)果為KMO取樣適切性量數(shù),介于0和1之間,值越接近1表示變量之間的相關(guān)性越高,相應(yīng)的因子分析結(jié)果將更為準(zhǔn)確。通常,KMO取樣適切性量數(shù)大于0.5,則可以使用因子分析。
巴特萊特球形檢驗(yàn)(Bartlett's test of sphericity,BTS)是一種統(tǒng)計(jì)檢驗(yàn)方法,在因子分析中,我們通常需要通過(guò)將多個(gè)變量組合在一起來(lái)形成新的因子,用以解釋觀測(cè)數(shù)據(jù)的變異性。巴特萊特球形檢驗(yàn)是旨在檢驗(yàn)數(shù)據(jù)樣本中變量之間相互獨(dú)立性。其檢驗(yàn)的原理是,通過(guò)計(jì)算矩陣的特征值和其特征向量來(lái)評(píng)估該矩陣是否滿足球形模型,如果檢驗(yàn)結(jié)果表明樣本數(shù)據(jù)符合球形模型,那么就可以采用簡(jiǎn)單的因子分析模型來(lái)解釋數(shù)據(jù)變異,否則需要采用更復(fù)雜的因子分析模型來(lái)解釋數(shù)據(jù)變異。BTS檢驗(yàn)使用卡方檢驗(yàn)來(lái)確定變量之間是否存在相關(guān)性。當(dāng)p-value小于0.001時(shí),表明各個(gè)變量之間存在統(tǒng)計(jì)學(xué)上顯著的相關(guān)性,即變量之間不是獨(dú)立的,因此存在進(jìn)行因子分析的可能。
普遍認(rèn)為,當(dāng)KMO 取樣適切性量數(shù)大于0.5,BTS球形檢驗(yàn)值p-value小于0.001時(shí),進(jìn)行主成分因子分析的前提條件已經(jīng)滿足,可以進(jìn)一步進(jìn)行因子分析[7]。
在標(biāo)準(zhǔn)化矩陣的基礎(chǔ)上計(jì)算原始指標(biāo)的相關(guān)系數(shù)矩陣R,即:R=[rij]m×m(i = 1,2,…,m;j = 1,2,…,m),rij為原始變量xi與xj的相關(guān)系數(shù)。解特征方程 | λi-R | = 0并求出對(duì)應(yīng)的特征值 λi(i = 1,2,…,m),將λ從大到小排序,λ1≥λ2≥λ3…λm≥ 0,即為主成分的方差,λi大小的取值就是對(duì)應(yīng)主成分對(duì)原始樣本的累計(jì)方差貢獻(xiàn)率。求出每一個(gè)特征值 λi對(duì)應(yīng)的特征向量,通過(guò)特征向量將標(biāo)準(zhǔn)化后的指標(biāo)轉(zhuǎn)化成m個(gè)新的指標(biāo)變量,即m個(gè)新的主成分PC1,PC2,…PCm。計(jì)算特征值 λi(i=1,2,…,m)的方差共獻(xiàn)率及累計(jì)貢獻(xiàn)率。其中,主成分 PCm的方差貢獻(xiàn)率為:
一般特征值大于1的前p個(gè)主成分被選出代替原來(lái)的 m個(gè)指標(biāo)變量,從而達(dá)到降維的目的。利用前p個(gè)特征值對(duì)應(yīng)的單位特征向量寫(xiě)出主成分計(jì)算公式,計(jì)算各主成分的值 Fi(i = 1,2…,p),再以方差貢獻(xiàn)率 bi作為權(quán)重系數(shù),對(duì)提取的前 p 個(gè)主成分在每個(gè)單元內(nèi)得分進(jìn)行線性加權(quán)求和,從而得到綜合評(píng)價(jià)函數(shù)并計(jì)算出主成分綜合得分。
本次研究選取地表水環(huán)境質(zhì)量標(biāo)準(zhǔn)(GB3838-2002)中的6個(gè)評(píng)價(jià)指標(biāo)即pH、溶解氧、高錳酸鹽指數(shù)、氨氮、總磷和總氮。其中僅溶解氧為逆向指標(biāo),即溶解氧值越大,水質(zhì)越好,故本次研究將溶解氧進(jìn)行求倒數(shù)后,再參與運(yùn)算[8]。KMO和BTS檢驗(yàn)結(jié)果詳見(jiàn)表2。
表2 KMO和BTS檢驗(yàn)Tab.2 KMO test and BTS
經(jīng)檢驗(yàn),標(biāo)準(zhǔn)化數(shù)據(jù)矩陣KMO取樣適切性量數(shù)為0.775,大于0.5;BTS檢驗(yàn)顯著性p-value值為0.000。符合主成分分析的要求。
根據(jù)特征值大于1的原則,提取出2個(gè)主成分,這兩個(gè)主成分累計(jì)方差69.18%,反映了水質(zhì)評(píng)價(jià)原始數(shù)據(jù)提供的 69.18%的信息。累計(jì)方差貢獻(xiàn)率見(jiàn)表3。
表3 累計(jì)方差貢獻(xiàn)率Tab.3 Accumulative variance contribution
在PCA(主成分分析)中,每個(gè)主成分均與原始數(shù)據(jù)的特征相關(guān),并根據(jù)其方差大小進(jìn)行排序。載荷(loading)是用于衡量每個(gè)原始特征在每個(gè)主成分中的權(quán)重,載荷越大表示該原始特征在主成分所代表的新空間中的重要性越高。因此,如果發(fā)現(xiàn)某個(gè)特定的原始特征在PCA分析中的載荷相對(duì)較高,這意味著該特征在解釋方差的過(guò)程中起到了重要的作用,表明該特征在給定數(shù)據(jù)集中的變異性較大,或者它與其他重要特征之間存在較強(qiáng)的相關(guān)性[9]。主成分因子載荷結(jié)果見(jiàn)表4。
表4 主成分因子載荷Tab.4 Factor loadings in PCA
從表3、表4可知,通過(guò)PCA對(duì)樂(lè)山市的水環(huán)境監(jiān)測(cè)指標(biāo)進(jìn)行標(biāo)準(zhǔn)化處理后,成功提取出了兩個(gè)主成分。這兩個(gè)主成分共解釋了原始數(shù)據(jù)近70%的信息。其中,第一主成分(PC1)對(duì)總方差的貢獻(xiàn)率超過(guò)50%,表明其在數(shù)據(jù)變異性中扮演著重要角色,占主導(dǎo)地位。在PC1上,總磷和高錳酸鹽指數(shù)具有較高的正向載荷,這表明涉磷污染和有機(jī)污染是樂(lè)山市水環(huán)境污染的主要因素。
其次,第二主成分(PC2)對(duì)總方差的貢獻(xiàn)率約為18%左右,在PC2上,pH和溶解氧表現(xiàn)出較高的載荷。值得注意的是,pH在PC2中呈現(xiàn)正向載荷,而溶解氧則呈現(xiàn)負(fù)向載荷。這表明水體的酸堿性(pH)以及溶解氧含量對(duì)水質(zhì)有一定的影響,盡管其影響程度相較于涉磷污染和有機(jī)物污染較小。
基于以上結(jié)果,建議未來(lái)的水環(huán)境污染治理策略應(yīng)重點(diǎn)關(guān)注涉磷污染和有機(jī)物污染的控制??梢酝ㄟ^(guò)實(shí)施針對(duì)性的除磷和有機(jī)污染治理措施來(lái)實(shí)現(xiàn)。同時(shí),應(yīng)密切關(guān)注水體的理化特性,特別是pH和溶解氧的變化,以確保水質(zhì)的有效維護(hù)和改善。
對(duì)各站點(diǎn)主成分得分進(jìn)行計(jì)算,并以各主成分的方差貢獻(xiàn)率為權(quán)重計(jì)算出綜合得分。得分結(jié)果詳見(jiàn)表5。
表5 站點(diǎn)綜合得分Tab.5 Comprehensive component scores
根據(jù)綜合得分表,得分越高水質(zhì)越差。樂(lè)山轄區(qū)的13個(gè)水質(zhì)自動(dòng)站,馬邊河河口站水質(zhì)最好,茫溪大橋站水質(zhì)最差。按流域劃分,樂(lè)山境內(nèi)大渡河水質(zhì)最好,茫溪河水質(zhì)最差。除茫溪大橋外,其余站點(diǎn)水質(zhì)均達(dá)到或優(yōu)于地表水Ⅲ類(lèi)水質(zhì)標(biāo)準(zhǔn)。其中Ⅱ類(lèi)水質(zhì)占比69.2%,Ⅲ類(lèi)水質(zhì)占比23.1%。
茫溪大橋水質(zhì)明顯較其他站點(diǎn)差可能是以下幾點(diǎn)原因造成的:一是茫溪河是岷江的一個(gè)小支流,水量較小,水體流動(dòng)性差,環(huán)境容量??;二是茫溪河上游養(yǎng)殖業(yè)尾水排放及周?chē)r(nóng)業(yè)面源的污染;三是周?chē)髽I(yè)的含磷污水的排放。以上三點(diǎn)因素的疊加,使得茫溪河總磷和高錳酸鹽指數(shù)偏高,水質(zhì)較差。
利用主成分分析法分析評(píng)價(jià)了樂(lè)山13個(gè)斷面站點(diǎn)中的六項(xiàng)指標(biāo),結(jié)果表明涉磷污染和有機(jī)污染是樂(lè)山市水環(huán)境污染的主要因素。通過(guò)對(duì)各個(gè)站點(diǎn)主成分綜合得分進(jìn)行排名可知茫溪大橋水質(zhì)最差,馬邊河河口水質(zhì)最好。除茫溪大橋外,其余站點(diǎn)水質(zhì)均達(dá)到或優(yōu)于地表水Ⅲ類(lèi)標(biāo)準(zhǔn)。
茫溪河的主要污染物為總磷,其次為高錳酸鹽指數(shù),這表明茫溪河沿線有機(jī)以及涉磷污染物較重。這與茫溪河生態(tài)水流量補(bǔ)給不足及沿線存在點(diǎn)源、面源污染密不可分。
結(jié)合茫溪河流域內(nèi)污染源、水質(zhì)、污染物輸入量現(xiàn)狀等信息,提出“截污控源、生態(tài)治理、清水補(bǔ)給,強(qiáng)化監(jiān)管”的治理思路。