鄭國臣,官 滌,崔 迪,姜厚竹
(1.松遼流域水資源保護(hù)局,吉林長春130021;2.哈爾濱工程大學(xué)航建學(xué)院土木與環(huán)境工程系,黑龍江哈爾濱150001;3.哈爾濱商業(yè)大學(xué)生命科學(xué)與環(huán)境科學(xué)研究中心,黑龍江哈爾濱150076;4.東北林業(yè)大學(xué)林學(xué)院,黑龍江哈爾濱150040)
為了準(zhǔn)確認(rèn)識松花江流域省界緩沖區(qū)的水環(huán)境問題,在確定監(jiān)測指標(biāo)范圍、指標(biāo)種類、監(jiān)測指標(biāo)水質(zhì)標(biāo)準(zhǔn)時(shí),對水質(zhì)監(jiān)測工作中要求的必測指標(biāo)進(jìn)行全面長期監(jiān)測,根據(jù)相關(guān)的監(jiān)測數(shù)據(jù)對水質(zhì)監(jiān)測指標(biāo)進(jìn)行優(yōu)化?!兜乇硭h(huán)境質(zhì)量標(biāo)準(zhǔn)》(GB3838-2002)中規(guī)定的監(jiān)測水質(zhì)指標(biāo)有溫度、濁度、pH、溶解氧、高錳酸鹽指數(shù)、化學(xué)需氧量(COD)、總磷等共109項(xiàng)。若在水質(zhì)監(jiān)測時(shí)將所有的指標(biāo)都進(jìn)行測定,則會增大工作量,同時(shí)也會降低主要污染物對環(huán)境的主導(dǎo)作用。因此,有必要對標(biāo)準(zhǔn)中規(guī)定的監(jiān)測指標(biāo)進(jìn)行優(yōu)化篩選,最終確定的監(jiān)測指標(biāo)必須可以全面的、較為準(zhǔn)確的反映松花江流域省界緩沖區(qū)的水質(zhì)特征。在對指標(biāo)進(jìn)行優(yōu)化篩選時(shí)須將流域緩沖區(qū)內(nèi)的主要的污染物、超標(biāo)污染物、隨時(shí)空變化而變化較大的污染物等污染特征等因素考慮進(jìn)去:如COD、氨氮是造成水質(zhì)惡化的重要污染物,國家將這兩項(xiàng)列為國家重點(diǎn)監(jiān)控的污染物,因此,水體中COD、氨氮是水質(zhì)監(jiān)測的必測項(xiàng)目,使監(jiān)測結(jié)果滿足全面性、準(zhǔn)確性、科學(xué)性,為明確水環(huán)境質(zhì)量現(xiàn)狀和變化趨勢提供數(shù)據(jù)支持。
SPSS23.0軟件的編程步驟鍵位簡單,具有完美的圖形處理能力,運(yùn)用類似的表格方式輸入與管理數(shù)據(jù),強(qiáng)大的數(shù)據(jù)對接功能,能方便的從其他數(shù)據(jù)庫讀入數(shù)據(jù)。用二維圖和感知圖來清晰地更完整方便的分析出數(shù)據(jù)中的關(guān)系,通過類似傳統(tǒng)的回歸分析、主成份分析及典型相關(guān)分析的分析方法,處理分類數(shù)據(jù)及定序數(shù)據(jù)[1]。
考慮松花江省界緩沖區(qū)主要的污染源為生活污水、工業(yè)廢水和動植物腐爛分解后隨降雨流入水體、農(nóng)用化肥的流失及雨水徑流[2];主要污染途徑分別為生活污水、工業(yè)廢水與徑流補(bǔ)給這三類。經(jīng)過簡單的篩選后得到13項(xiàng)常規(guī)理化指標(biāo)因子,文中選用2015年松花江流域省界緩沖區(qū)51個(gè)監(jiān)測斷面的13項(xiàng)常規(guī)理化指標(biāo)因子(pH值、溶解氧、高錳酸鹽指數(shù)、化學(xué)需氧量、五日生化需氧量、氨氮、總磷、銅、鋅、氟化物、硒、砷、糞大腸菌群)的監(jiān)測數(shù)據(jù)作為元數(shù)據(jù),利用SPSS 23.0軟件對水體監(jiān)測指標(biāo)進(jìn)行主成分分析,得到維度較少的幾個(gè)因子,從而實(shí)現(xiàn)對水質(zhì)監(jiān)測指標(biāo)進(jìn)行優(yōu)化[3]。
數(shù)據(jù)的標(biāo)準(zhǔn)化處理過程是將同一指標(biāo)的監(jiān)測數(shù)據(jù)減去其均值后,所得結(jié)果除以該組監(jiān)測數(shù)據(jù)的標(biāo)準(zhǔn)差。用SPSS軟件分析后得出的原始變量的描述性結(jié)果輸出如表1所示,該表中包含原始變量的統(tǒng)計(jì)結(jié)果,包括平均值、標(biāo)準(zhǔn)差和分析樣本個(gè)數(shù)。從表1中可以看出我們所選的51個(gè)監(jiān)測斷面中pH值、溶解氧、高錳酸鹽指數(shù)等13個(gè)水質(zhì)指標(biāo)的監(jiān)測數(shù)據(jù)結(jié)果。
表1 描述統(tǒng)計(jì)量
表2 相關(guān)系數(shù)矩陣
從表2相關(guān)系數(shù)矩陣中可以看出,大部分相關(guān)系數(shù)幾乎均大于0.3,表明上述數(shù)據(jù)中各變量之間存在著的較強(qiáng)的直接相關(guān)性,這證明各指標(biāo)之間所傳達(dá)的信息具有一定的重疊,這一結(jié)果表明這些原始變量比較適合做因子分析。
在用SPSS做主成分分析時(shí),通常需要對所收集的數(shù)據(jù)做KMO檢驗(yàn)和Bartlett’s球型檢驗(yàn)來判斷元數(shù)據(jù)是否符合主成分分析條件。KMO統(tǒng)計(jì)量是通過比較各變量間簡單相關(guān)系數(shù)和偏相關(guān)系數(shù)的大小來判斷變量間的相關(guān)性,取值范圍在0和1之間。Kaiser給出了常用的KMO度量標(biāo)準(zhǔn):一般情況下,KMO越接近1,意味著變量間的相關(guān)性越強(qiáng),表明該組數(shù)據(jù)越適合做主成分分析,當(dāng)KMO<0.5時(shí),則不適合做主成分分析。
Bartlett’s球型檢驗(yàn)(巴特利球形檢驗(yàn))是用于檢驗(yàn)相關(guān)陣是否是單位陣,即各變量是否獨(dú)立,以變量的相關(guān)系數(shù)矩陣為出發(fā)點(diǎn)做出零假設(shè):相關(guān)系數(shù)矩陣是一個(gè)單位陣。如果巴特利球形檢驗(yàn)的統(tǒng)計(jì)計(jì)量數(shù)值較大,且對應(yīng)的相伴概率值小于用戶給定的顯著性水平,則應(yīng)該拒絕零假設(shè);反之,則不能拒絕零假設(shè),認(rèn)為相關(guān)系數(shù)矩陣可能是一個(gè)單位陣,不適合做因子分析。若假設(shè)不能被否定,則說明這些變量間可能各自獨(dú)立提供一些信息,缺少公因子,適合做主成分分析[4]。
表3 KMO和Bartlett的檢驗(yàn)
從表3的主成分分析結(jié)果可以看出,KMO測量值為0.660,明顯大于0.500,表明該組數(shù)據(jù)適合做因子分析。Bartlett的球形檢驗(yàn)的顯著性為0.000,小于0.050,即拒絕原假設(shè)相關(guān)系數(shù)矩陣為單位矩陣,說明變量之間存在著相關(guān)性,同樣表明該組數(shù)據(jù)適合進(jìn)行因子分析。
特征值大小表征矩陣正交化之后所對應(yīng)特征向量對于整個(gè)矩陣的貢獻(xiàn)程度,在某種程度上可以理解為主成分影響力度大小的指標(biāo),若特征值小于1,說明該主成分的解釋力度還不如直接引入原變量的平均解釋力度大,因此,一般可以用特征值大于1作為納入標(biāo)準(zhǔn)。累積貢獻(xiàn)率,即因子對原始變量的解釋程度。由表4可知,通過主成分分析法提取了四個(gè)主要成分,即m=4。其中第一主成分的貢獻(xiàn)率為27.330%,第二主成分的貢獻(xiàn)率為18.945%,第三主成分的貢獻(xiàn)率為18.944,第四主成分的貢獻(xiàn)率為11.344,第1到第4個(gè)主成分的累計(jì)方差貢獻(xiàn)率達(dá)到了76.563%,表明這4個(gè)主成分可完全代替原13項(xiàng)指標(biāo)。
表4 解釋的總方差
表5是最終的因子載荷矩陣。
表5 成份矩陣a
按照前面設(shè)定的方差極大法對因子載荷矩陣旋轉(zhuǎn)后的結(jié)果如表6所示。主成分載荷矩陣每一列載荷值都顯示了各個(gè)變量與有關(guān)主成分的相關(guān)系數(shù)相關(guān)系數(shù)的絕對值越接近1,表明該成分越具有代表主成分的性質(zhì)。未經(jīng)過旋轉(zhuǎn)的載荷矩陣中,因子變量在許多變量上都有較高的載荷。經(jīng)過旋轉(zhuǎn)之后,可以看出第一主成分上銅、硒載荷較大,即與第一主成分的相關(guān)系數(shù)高,第二主成分上只有COD在占有較高的載荷,而在第三主成分上,BOD5、氨氮和總磷三個(gè)指標(biāo)所占的載荷較高,第四主要成分同樣也只有一個(gè)指標(biāo),砷,所占的載荷較大,因此,砷同樣作為第四主成分來反映水質(zhì)情況。為了實(shí)現(xiàn)水質(zhì)監(jiān)測指標(biāo)的優(yōu)化,可以考慮用銅、硒、COD、BOD5、氨氮、TP和砷7項(xiàng)水質(zhì)監(jiān)測指標(biāo)來代表原來的13項(xiàng)水質(zhì)指標(biāo)。
表6 旋轉(zhuǎn)成份矩陣a
對2015年松花江省界緩沖區(qū)水質(zhì)監(jiān)測數(shù)據(jù)分析,將監(jiān)測指標(biāo)劃分為必測項(xiàng)目、優(yōu)化頻率必測項(xiàng)目和選測項(xiàng)目等類型,經(jīng)過簡單篩選選出13項(xiàng)常規(guī)理化指標(biāo)(pH值、溶解氧、高錳酸鹽指數(shù)、化學(xué)需氧量、五日生化需氧量、氨氮、總磷、銅、鋅、氟化物、硒、砷、糞大腸菌群),以上述指標(biāo)監(jiān)測值作為元數(shù)據(jù),利用主成分分析法,借助SPSS 23.0軟件來對水質(zhì)指標(biāo)進(jìn)行進(jìn)一步篩選,通過計(jì)算和模擬,確定松花江流域省界緩沖區(qū)的可以考慮用銅、硒、化學(xué)需氧量、五日生化需氧量、氨氮、總磷和砷等7項(xiàng)指標(biāo)來代表該流域水質(zhì)狀況,從而實(shí)現(xiàn)對松花江流域省界緩沖區(qū)水質(zhì)監(jiān)測指標(biāo)的優(yōu)化。