劉陽 王歡 唐萍 余曉美
摘要 以環(huán)巢湖主要河流2015年1月—2019年6月逐月的水質(zhì)指數(shù)(WQI)為研究對(duì)象,運(yùn)用函數(shù)型數(shù)據(jù)分析方法構(gòu)建各河流WQI變化曲線以及WQI變化速度曲線,通過K-means函數(shù)型聚類算法對(duì)WQI變化曲線及WQI變化速度進(jìn)行動(dòng)態(tài)特征分析。結(jié)果表明:環(huán)巢湖河流水質(zhì)呈現(xiàn)“兩階段”周期性,受氣象條件影響顯著;水質(zhì)區(qū)域差異顯著,易受人為因素影響;環(huán)巢湖河流水質(zhì)有所改善,各河流治理工作和實(shí)時(shí)效果不同,部分河流水質(zhì)治理效果顯著。
關(guān)鍵詞 水環(huán)境質(zhì)量;時(shí)空變化;水質(zhì)指數(shù)(WQI);函數(shù)型數(shù)據(jù)分析;K-means函數(shù)型聚類;環(huán)巢湖河流
中圖分類號(hào) X 824 ?文獻(xiàn)標(biāo)識(shí)碼 A
文章編號(hào) 0517-6611(2021)14-0072-04
Abstract Taking the monthly water quality index (WQI) of the main rivers around Chaohu Lake from January 2015 to June 2019 as the research object,the functional data analysis methods were used to construct the WQI change curve and WQI change speed curve of each river, Kmeans functional clustering algorithm was used to analyze the dynamic characteristics of WQI change curve and WQI change speed.The results showed that the water quality of river around the Chaohu Lake had the cycle of two stages,which was significantly affected by meteorological conditions.The water quality had distinct regional difference, which was easily affected by human factors.The water quality of the rivers around Chaohu Lake had been improved,the river governance work and realtime effects were different for the rivers, which was remarkable only in some rivers.
Key words Water environmental quality;Temporal and spatial changes;Water quality index (WQI);Functional data analysis;Kmeans functional clustering;Rivers around Chaohu Lake
基金項(xiàng)目
安徽高校自然科學(xué)研究項(xiàng)目(KJ2018A0424);第二次全國污染源普查工業(yè)源普查報(bào)表制度及普查數(shù)據(jù)質(zhì)量控制實(shí)施技術(shù)支持項(xiàng)目(22110399005)。
作者簡介 劉陽(1988—),男,安徽亳州人,助理工程師,碩士,從事水環(huán)境質(zhì)量綜合分析。
收稿日期 2020-11-24;修回日期 2020-12-08
巢湖是我國的五大淡水湖之一,是我國水污染防治的重點(diǎn)湖體,在供水、水量控制、生態(tài)平衡和經(jīng)濟(jì)發(fā)展等方面發(fā)揮著重要作用。巢湖主要有9條環(huán)湖河流,其中西半湖有5條入湖河流(南淝河、十五里河、派河、杭埠河和白石天河),東半湖有3條入湖河流(兆河、雙橋河和柘皋河)和1條出湖河流(裕溪河)。近幾十年來,隨著周邊城鎮(zhèn)經(jīng)濟(jì)的快速發(fā)展,工業(yè)和家庭廢水經(jīng)河流流入巢湖,引入大量有機(jī)物,巢湖現(xiàn)已成為我國污染最嚴(yán)重的湖泊之一。為了緩解巢湖的富營養(yǎng)化,在2012年合肥市政府啟動(dòng)了“引江濟(jì)巢工程”,長江水經(jīng)趙河引入巢湖,縮短湖泊水循環(huán),緩解水體富營養(yǎng)化。為更好地了解巢湖水環(huán)境質(zhì)量狀況,學(xué)者們從不同角度運(yùn)用各種傳統(tǒng)的統(tǒng)計(jì)方法對(duì)巢湖水質(zhì)的影響因素和時(shí)空變化特征進(jìn)行了研究[1-2]。環(huán)巢湖河流水環(huán)境質(zhì)量對(duì)巢湖水污染防治也有著重要影響[3-4]。
隨著信息技術(shù)和監(jiān)測手段的迅速發(fā)展,實(shí)際問題中搜集的數(shù)據(jù)越來越具有函數(shù)特點(diǎn),因此函數(shù)型數(shù)據(jù)分析方法與應(yīng)用日益受到學(xué)者們的廣泛關(guān)注,在環(huán)境科學(xué)、氣候?qū)W、計(jì)量經(jīng)濟(jì)學(xué)和醫(yī)學(xué)等領(lǐng)域應(yīng)用廣泛[5-6],使其成為統(tǒng)計(jì)學(xué)領(lǐng)域研究的熱點(diǎn)之一。筆者以環(huán)巢湖主要河流2015年1月—2019年6月逐月的水質(zhì)指數(shù)(WQI)為研究對(duì)象,運(yùn)用函數(shù)型數(shù)據(jù)分析方法構(gòu)建各河流WQI變化曲線以及WQI變化速度曲線,通過K-means函數(shù)型聚類算法對(duì)WQI變化曲線及WQI變化速度進(jìn)行動(dòng)態(tài)特征分析,以期為政府部門進(jìn)行水環(huán)境質(zhì)量管理和水污染防治政策的出臺(tái)以及綠色經(jīng)濟(jì)發(fā)展評(píng)價(jià)提供重要的技術(shù)支撐。
1 資料與方法
1.1 數(shù)據(jù)來源 該研究選取2015年1月—2019年6月環(huán)巢湖9條主要河流水質(zhì)監(jiān)測斷面月度數(shù)據(jù),根據(jù)環(huán)湖河流的水質(zhì)特點(diǎn)選取5項(xiàng)主要水質(zhì)參數(shù)(氨氮NH4+-N、總磷TP、化學(xué)需氧量COD、生化需氧量BOD5和高錳酸鹽指數(shù)CODMn),按照文獻(xiàn)[7]的方法可計(jì)算出每條河流月度WQI數(shù)據(jù)。
1.2 研究方法
1.2.1 WQI計(jì)算。WQI計(jì)算步驟如下:
(1)選擇水質(zhì)指標(biāo)。根據(jù)管理目標(biāo)和研究區(qū)環(huán)境特征,選擇一組水質(zhì)指標(biāo)來描述研究區(qū)域水質(zhì)狀況。
(2)分別計(jì)算所選指標(biāo)的指標(biāo)指數(shù)。不同單位和維度的變量被轉(zhuǎn)換成具有共同尺度的指標(biāo),通常在0~100范圍內(nèi)。對(duì)于值越小越好的指標(biāo)(如CODMn),
其中xi和yi分別為監(jiān)測數(shù)據(jù)和第i個(gè)指標(biāo)的指標(biāo)指數(shù);ci0為Ⅰ類的下限,cij是第j類的上 限,參照地表水環(huán)境質(zhì)量標(biāo)準(zhǔn)(GB 3838—2002)[8]。
(3)分配水質(zhì)評(píng)價(jià)指標(biāo)權(quán)重。在大多數(shù)文獻(xiàn)中,評(píng)價(jià)指標(biāo)的權(quán)重是根據(jù)它們對(duì)整體水質(zhì)的相對(duì)重要性來分配的[9],加權(quán)方法如下:
ωi=qiLi=1 qi ?(i=1,2,…,L),其中ωi和qi分別表示第i指標(biāo)的權(quán)重和重要性參數(shù),L為指標(biāo)總個(gè)數(shù)。qi為取值于[1,5]的整數(shù),qi值越大表示第i指標(biāo)的重要程度越高。 該研究考慮每個(gè)評(píng)價(jià)參數(shù)對(duì)水質(zhì)影響不同,根據(jù)各參數(shù)超標(biāo)情況,超標(biāo)越多權(quán)重越大原則,水質(zhì)參數(shù)NH4+-N、TP、COD、BOD5和CODMn的重要性分別取值為5、4、4、3、2。
(4)計(jì)算WQI。計(jì)算公式為 z=Li=1ωiyi,其中z 為該監(jiān)測斷面的WQI。該研究9條河流2015年1月—2019年6月逐月WQI數(shù)據(jù)見表1,其中S1~S9分別表示南淝河、十五里河、派河、兆河、杭埠河、白石天河、雙橋河、柘皋河和裕溪河水質(zhì)監(jiān)測斷面。
1.2.2 基于函數(shù)型數(shù)據(jù)WQI的動(dòng)態(tài)分析。
將環(huán)巢湖各個(gè)河流的WQI數(shù)據(jù)均看作是隨時(shí)間變化的函數(shù)曲線,則表1中的數(shù)據(jù)矩陣可看作為區(qū)間上的隨機(jī)過程 X(t):Xij=Xi(tj),i=1,2,…,n;j=1,2,…,Mi。在實(shí)際問題中利用采集或觀測到的有限離散數(shù)據(jù),通過數(shù)據(jù)函數(shù)化擬合轉(zhuǎn)化為無窮維的函數(shù)曲線X(t)。在實(shí)際問題中由于誤差存在,數(shù)據(jù)模型記為Yj=X(tj)+εj,誤差項(xiàng)εj 滿足零均值同方差獨(dú)立同分布。
該研究采取的數(shù)據(jù)是樣本個(gè)數(shù) n=9 ,每個(gè)樣本都在相同的時(shí)間點(diǎn)取值的均衡數(shù)據(jù)。根據(jù)水質(zhì)變化的周期性特征,采用傅立葉基函數(shù)法將WQI離散數(shù)據(jù)轉(zhuǎn)換為函數(shù)曲線,具體步驟參照Ramsay等[10]的研究,記 (t)=ki=1ii(t),其中1(t),2(t),…,k(t)是k個(gè)正交傅立葉基函數(shù),i表示基函數(shù)i(t) 所占的權(quán)重。針對(duì)該研究9條環(huán)巢湖河流2015年1月—2019年6月WQI數(shù)據(jù)矩陣,依據(jù)上述函數(shù)曲線的擬合方法,把表1中的數(shù)據(jù)矩陣轉(zhuǎn)化為9條連續(xù)函數(shù)曲線 X(t) ,其中每條函數(shù)曲線代表某一條河流的時(shí)間序列WQI函數(shù)曲線。由于 X(t)為連續(xù)光滑曲線,易得曲線的各階導(dǎo)函數(shù)DmX(t),因此,可以估計(jì)X(t)和DmX(t)在任意時(shí)間t上的函數(shù)值(t)和mX(t), 從而獲得各個(gè)環(huán)湖河流WQI動(dòng)態(tài)變化特征。根據(jù)WQI函數(shù)曲線 X(t) ,定義均值函數(shù) (t) 和方差函數(shù)Var X(t) 如下: (t)=n-1ni=1Xi(t), Var X(t)=(n-1)-1ni=1[Xi(t)-i(t)]2 。
通過對(duì)9條環(huán)巢湖河流的WQI函數(shù)曲線 X(t) 、均值函數(shù)曲線 (t) 、標(biāo)準(zhǔn)差函數(shù)曲線Var X(t)以及導(dǎo)數(shù)曲線DmX(t)的動(dòng) 態(tài)變化過程分析,可以得出近5年環(huán)巢湖河流水質(zhì)治理的階段性成果;揭示各個(gè)河流水質(zhì)現(xiàn)狀、變化趨勢和規(guī)律,挖掘影響各個(gè)河流水質(zhì)的因素以及水質(zhì)區(qū)域性差異的原因。
1.2.3 對(duì)環(huán)巢湖河流進(jìn)行函數(shù)型聚類分析。
對(duì)水質(zhì)進(jìn)行時(shí)空特征分析和水質(zhì)評(píng)價(jià)中,傳統(tǒng)多元統(tǒng)計(jì)方法如聚類分析(CA)、主成分分析(PCA)和判別分析(DA)已被廣泛應(yīng)用[11],為識(shí)別影響特定流域內(nèi)水質(zhì)的主要參數(shù)提供了可靠的方法。然而,在聚類分析中距離的概念很容易推廣到連續(xù)函數(shù)數(shù)據(jù)的情況。與傳統(tǒng)聚類方法對(duì)靜態(tài)數(shù)據(jù)的分析相比,函數(shù)型數(shù)據(jù)聚類方法[12]能夠從動(dòng)態(tài)的角度對(duì)環(huán)巢湖河流WQI曲線進(jìn)行分類。為進(jìn)一步研究環(huán)巢湖河流WQI動(dòng)態(tài)變化和各個(gè)河流水質(zhì)之間的關(guān)聯(lián)性,該研究采用類似多元統(tǒng)計(jì)分析聚類思想的K-means函數(shù)型聚類算法,從形狀和數(shù)值2個(gè)維度對(duì)WQI這一綜合性數(shù)量指標(biāo)進(jìn)行聚類分析。
2 結(jié)果與分析
2.1 環(huán)巢湖河流WQI動(dòng)態(tài)變化規(guī)律 該研究采用傅立葉基函數(shù)法擬合9條環(huán)巢湖河流2015年1月—2019年6月的WQI曲線如圖1所示,從圖1可以看出,①各河流WQI指數(shù)曲線呈現(xiàn)明顯的“兩階段”周期特征。按周期來看,各河流WQI指數(shù)曲線表現(xiàn)出兩階段特征,即水質(zhì)指數(shù)下降期和上升期。下降期階段在當(dāng)年10月—次年2月,上升期階段在2—9月??梢娝|(zhì)變化的周期特征與氣候因素關(guān)系顯著。各河流WQI極小值大多出現(xiàn)在1—3月,顯然冬季降雨量減少,河水流量較小,使得污染物濃度升高。②環(huán)湖河流WQI曲線呈現(xiàn)區(qū)域化差異。從河流WQI曲線的數(shù)值來看,各河流水質(zhì)差異顯著。雖然WQI曲線均呈現(xiàn)周期性變化,但各個(gè)河流WQI曲線拐點(diǎn)的發(fā)生時(shí)間有一定的差異。從圖1可以看出,水質(zhì)越差的河流其WQI曲線變化幅度越大,反之變化平緩。因此可以認(rèn)為水質(zhì)與河流所處的地理位置有關(guān)。南淝河、十五里河和派河受區(qū)域社會(huì)因素影響較大,水質(zhì)差。
因此,在對(duì)各行政區(qū)域環(huán)境治理績效評(píng)價(jià)時(shí),需要充分考慮區(qū)域因素、自然因素和社會(huì)因素等差異造成的影響,建立起公正科學(xué)的評(píng)價(jià)體系。③各環(huán)湖河流水質(zhì)總體而言有所改善。從9條環(huán)巢湖河流的WQI曲線可以看出,2015年1月—2019年6月總體上河流WQI有增加趨勢,各函數(shù)曲線的相對(duì)位置層次分明,但部分曲線也出現(xiàn)交叉。也就是說水質(zhì)好的河流保持著較好的水質(zhì),但與此同時(shí)部分河流水質(zhì)改善顯著。2017年6月以來,雙橋河、十五里河和派河水質(zhì)明顯好轉(zhuǎn)。
因此,這種水質(zhì)變化現(xiàn)象應(yīng)歸結(jié)為政府部門環(huán)境治理導(dǎo)致的結(jié)果,這種有效的環(huán)境管制方式值得總結(jié)推廣。
利用9條環(huán)巢湖河流WQI曲線,獲得均值函數(shù) (t) 和方差函數(shù)Var X(t) ,如圖2所示。從均值曲線可以看到,2015—2019年環(huán)巢湖河流平均 WQI 在55~85,水質(zhì)評(píng)估分級(jí)對(duì)應(yīng)為輕度污染至良。2018年以來環(huán)巢湖河流平均水質(zhì)的良好程度明顯提高,反映我國環(huán)境政策效果在逐漸顯現(xiàn),環(huán)境監(jiān)管取得了很好的成效。但是污染嚴(yán)重河流治理難度依然較大,并且還出現(xiàn)了反彈,例如南淝河。從標(biāo)準(zhǔn)差曲線來看,河流WQI標(biāo)準(zhǔn)差波動(dòng)范圍在18~29,2015—2017年的波動(dòng)程度呈周期性緩慢下降,2018年以來各河流的WQI差異在逐漸縮小,即各河流水質(zhì)受區(qū)域性影響變小。
環(huán)湖河流WQI函數(shù)曲線一階導(dǎo)數(shù) D′(X(t)) ,即各河流WQI的變化速度曲線,如圖3所示。從WQI的變化速度曲線來看,各河流WQI變化速度曲線受降雨等整體外部環(huán)境影響形狀相似,但是各河流變化速度大小不同,差異性仍然顯著。另外,WQI變化速度曲線整體變化平穩(wěn),正向值占大多數(shù)時(shí)間,說明水質(zhì)向好的方向變化;負(fù)向值主要出現(xiàn)秋冬季階段,水污染形勢嚴(yán)峻。因此,要探究如何分階段治理水污染問題。
2.2 環(huán)巢湖河流WQI曲線的K-means函數(shù)型聚類分析 通過K-means函數(shù)型聚類算法對(duì)9條環(huán)巢湖河流WQI曲線進(jìn)行聚類,將具有相似變化的WQI曲線聚成一類。從聚類的中心值曲線分析,分為兩大類是比較合適的,南淝河、十五里河、派河為第一類,雙橋河、兆河、杭埠河、白石天河、柘皋河、裕溪河第二類。從聚類結(jié)果來看,受合肥市人為環(huán)境影響,巢湖西半湖西北部入湖河流南淝河、十五里河、派河水質(zhì)較差,西半湖西北部入湖河流水質(zhì)明顯劣于西半湖南部和東半湖河流,呈現(xiàn)一定的區(qū)域差異性和集聚性。進(jìn)一步對(duì)9條環(huán)巢湖河流WQI變化速度曲線進(jìn)行聚類,從聚類的中心值曲線分析,分為兩大類是比較合適的,十五里河、派河、雙橋河的WQI變化速度曲線聚成第一類,其他6條河流的變化速度曲線聚成第二類。第一類的3條河流近5年的WQI指數(shù)變化幅度波動(dòng)較大,在2015年1月—2017年6月水質(zhì)總體較差,部分時(shí)間段也在改善,2017年7月以來改善程度最大;第二類中有5條河流WQI指數(shù)變化幅度平穩(wěn)和對(duì)稱,水質(zhì)改善具有持續(xù)性和連貫性。通過對(duì)比分析WQI曲線聚類結(jié)果和WQI變化速度曲線聚類結(jié)果,可以看到區(qū)域不是唯一因素,在同一區(qū)域,WQI變化速度曲線并不在同一類。因此,環(huán)巢湖河流水質(zhì)的改善需要因地制宜,找出科學(xué)治理方法。十五里河、派河、雙橋河3條河流水質(zhì)改善的效果相對(duì)較好,兆河、杭埠河、白石天河、柘皋河、裕溪河5條河流水質(zhì)保持和控制效果相對(duì)較好。因此,在環(huán)巢湖河流水質(zhì)治理上需要重點(diǎn)關(guān)注南淝河的治理和防止十五里河、派河水質(zhì)出現(xiàn)反彈。
3 結(jié)論與討論
該研究以環(huán)巢湖主要河流2015年1月—2019年6月水質(zhì)監(jiān)測數(shù)據(jù)為研究對(duì)象,運(yùn)用函數(shù)型數(shù)據(jù)分析方法構(gòu)建各河流WQI變化曲線、均值函數(shù)曲線、標(biāo)準(zhǔn)差函數(shù)曲線以及變化速度曲線,通過K-means函數(shù)型聚類算法對(duì)WQI曲線及變化速度曲線進(jìn)行動(dòng)態(tài)特征分析,具體結(jié)論如下:
(1)環(huán)巢湖河流的水質(zhì)呈現(xiàn)明顯的“兩階段”周期性,受氣象條件影響顯著,秋冬季水質(zhì)相對(duì)較差。另外,水質(zhì)與區(qū)域的地理位置和社會(huì)因素有關(guān),例如南淝河、十五里河和派河受合肥市人為因素影響,水質(zhì)較差。
(2)環(huán)巢湖河流水質(zhì)總體而言有所改善,各河流治理工作和實(shí)時(shí)效果不同,雙橋河、十五里河和派河水質(zhì)治理效果顯著,但重污染河流南淝河水質(zhì)改善緩慢,治理難度較大。
(3)環(huán)巢湖河流的WQI曲線和WQI變化速度曲線的聚類結(jié)果能夠更準(zhǔn)確地得到水環(huán)境狀況動(dòng)態(tài)發(fā)展評(píng)價(jià)。從評(píng)價(jià)結(jié)果來看河流呈現(xiàn)一定的區(qū)域差異性和集聚性,但是也可以看到區(qū)域不是唯一因素,在同一區(qū)域,WQI變化速度曲線并不在同一類。
信息技術(shù)的發(fā)展使得數(shù)據(jù)收集的手段和技術(shù)越來越豐富,在環(huán)境的監(jiān)測中可獲取高頻、多維和實(shí)時(shí)數(shù)據(jù),充分發(fā)揮函數(shù)型數(shù)據(jù)分析動(dòng)態(tài)靈活和高維數(shù)據(jù)無可比擬的優(yōu)勢,基于高頻或多維水環(huán)境指標(biāo)數(shù)據(jù)探索不同河流水質(zhì)動(dòng)態(tài)變化的精準(zhǔn)因素。
參考文獻(xiàn)
[1] 陶濤,孫世群,姜棟棟,等.模糊綜合評(píng)價(jià)在巢湖水質(zhì)評(píng)價(jià)中的應(yīng)用[J].環(huán)境科學(xué)與管理,2010,35(12):177-180.
[2] 金菊良,吳開亞,酈建強(qiáng). 巢湖水質(zhì)安全評(píng)價(jià)的對(duì)應(yīng)分析和投影尋蹤熵耦合方法[J].四川大學(xué)學(xué)報(bào)(工程科學(xué)版),2007,39(6):7-13.
[3] 儲(chǔ)茵,朱江,夏守先,等.巢湖典型支流柘皋河水質(zhì)污染時(shí)空變化特征[J].水土保持學(xué)報(bào),2011,25(4):243-248.
[4] 沈文靜,孫世群. 巢湖西半湖主要入湖河流水質(zhì)的模糊評(píng)價(jià)及結(jié)果分析[J].環(huán)境科學(xué)與管理,2011,36(11):187-190.
[5] LUN Z H,ZHOU Y C.Ranking of functional data in application to worldwide PM10 data analysis[J].Environ Ecol Stat,2017,24(4):469-484.
[6] 余曉美,沈永昌.中國環(huán)境保護(hù)重點(diǎn)城市空氣質(zhì)量的動(dòng)態(tài)特征分析[J].統(tǒng)計(jì)與決策,2019,35(11):91-94.
[7] YAN F,LIU L,LI Y F,et al. A dynamic water quality index model based on functional data analysis[J].Ecol Indic,2015,57:249-258.
[8] 國家環(huán)境保護(hù)總局,國家質(zhì)量監(jiān)督檢驗(yàn)檢疫總局.地表水環(huán)境質(zhì)量標(biāo)準(zhǔn):GB 3838—2002[S].北京:中國環(huán)境科學(xué)出版社,2002.
[9] SEMIROMI F B,HASSANI A H,TORABIAN A,et al.Evolution of a new surface water quality index for Karoon catchment in Iran[J]. Water Sci Technol,2011,64(12):2483-2491.
[10] RAMSAY J O,SILVERMAN B W.Functional data analysis[M].2nd ed.New York:SpringVerlag,2005.
[11] ZHONG M F,ZHANG H Y,SUN X W,et al.Analyzing the significant environmental factors on the spatial and temporal distribution of water quality utilizing multivariate statistical techniques:A case study in the Balihe Lake,China[J].Environ Sci Pollut Res,2018,25(29):29418-29432.
[12] HENDERSON B.Exploring between site differences in water quality trends:A functional data analysis approach[J].Environmetrics,2006,17(1):65-80.