林翔宇,張艷,封學(xué)軍,林志端,朱信源,沈金星
(1.河海大學(xué)港航物流與綠色發(fā)展研究所,江蘇 南京 210098;2.河海大學(xué)土木與交通學(xué)院,江蘇 南京 210098)
煤炭在港區(qū)的裝卸、運(yùn)輸和堆存過(guò)程中都會(huì)產(chǎn)生大量顆粒物,不僅對(duì)港口環(huán)境造成污染,而且嚴(yán)重影響附近城市空氣質(zhì)量[1]和居民身體健康[2],制約了港口的可持續(xù)發(fā)展能力。對(duì)煤炭港區(qū)顆粒物的防治已經(jīng)成為綠色港口建設(shè)面臨的重要任務(wù)。
煤炭港區(qū)大氣中的總懸浮顆粒(TSP)濃度是判斷顆粒物污染程度的重要指標(biāo)。國(guó)內(nèi)外對(duì)港區(qū)TSP的研究主要涉及起塵機(jī)理[3]、時(shí)空變化規(guī)律[4-5]和抑塵措施[6]等方面。我國(guó)針對(duì)干散貨港區(qū)粉塵領(lǐng)域的研究起步較晚,但近年來(lái)在港區(qū)粉塵時(shí)頻演變規(guī)律等方面成果豐富[7-8]??傮w看,當(dāng)前關(guān)于TSP 的時(shí)頻規(guī)律研究大多是統(tǒng)計(jì)天、月、季、年整體[9]的變化規(guī)律,針對(duì)不服從整體規(guī)律的情況缺少關(guān)注,且對(duì)于時(shí)變特征規(guī)律亦缺少深入研究。
K-means 算法作為最典型、最常見(jiàn)的一種聚類算法,在大氣污染研究中也有廣泛應(yīng)用[10]。
針對(duì)港區(qū)TSP 的時(shí)變規(guī)律研究成果很少,而K-means 聚類方法可以保證達(dá)到同一簇內(nèi)數(shù)據(jù)相似性較高的優(yōu)點(diǎn)。本文基于2020 年港口粉塵在線監(jiān)測(cè)數(shù)據(jù),對(duì)蘇州港常熟FD 港區(qū)TSP 全年數(shù)據(jù)進(jìn)行聚類分析,探究TSP 平均濃度的時(shí)變規(guī)律并結(jié)合氣象因素分析其相關(guān)性。
本文以江蘇蘇州港常熟FD 港區(qū)為研究對(duì)象,該港區(qū)位于長(zhǎng)江下游,主要運(yùn)營(yíng)貨種為煤炭。港區(qū)內(nèi)粉塵監(jiān)測(cè)點(diǎn)位布設(shè)位置如圖1 所示。
圖1 FD 港區(qū)及監(jiān)測(cè)點(diǎn)位圖Fig.1 FD port area and monitoring points
監(jiān)測(cè)點(diǎn)位中TSP 數(shù)據(jù)采集儀器采用H6 型顆粒物監(jiān)測(cè)儀,監(jiān)測(cè)點(diǎn)的檢測(cè)數(shù)據(jù)為每分鐘記錄1次,進(jìn)行24 h 連續(xù)工作。監(jiān)測(cè)中選取2020 年1月1 日—12 月31 日全年數(shù)據(jù),包括TSP 的濃度數(shù)值和實(shí)時(shí)氣象5 種參數(shù)值(風(fēng)速、風(fēng)向、溫度、濕度和氣壓)。
為了保證數(shù)據(jù)的準(zhǔn)確性和可靠性,對(duì)TSP 數(shù)據(jù)進(jìn)行清洗,主要包括空缺數(shù)據(jù)、錯(cuò)誤數(shù)據(jù)和異常數(shù)據(jù)3 種數(shù)據(jù)的處理。對(duì)于前兩種數(shù)據(jù),刪除不進(jìn)行分析;針對(duì)其余異常數(shù)據(jù),選擇3 倍標(biāo)準(zhǔn)差法對(duì)數(shù)據(jù)組進(jìn)行循環(huán)剔除異常值,采用的異常值判斷公式為:
式中:xi是每組中的第i個(gè)數(shù)據(jù);是該組數(shù)據(jù)均值;N為該組數(shù)據(jù)總個(gè)數(shù)。符合不等式(1)的xi即被作為異常值。
以整點(diǎn)時(shí)刻前后各0.5 h 數(shù)據(jù)為一組,通過(guò)公式(1)循環(huán)剔除異常值后取均值,每日可得到24個(gè)整點(diǎn)時(shí)刻數(shù)據(jù),加入日均值共25 個(gè)數(shù)據(jù)作為25 個(gè)特征值進(jìn)行聚類輸入。當(dāng)出現(xiàn)某天數(shù)據(jù)不足25 個(gè)時(shí),做刪除處理,合計(jì)36 d。
聚類算法的目的是把數(shù)據(jù)劃分為屬性類似的多個(gè)簇,便于分析其內(nèi)在性質(zhì)及規(guī)律。K-means算法的基本思想是從樣本數(shù)據(jù)集中隨機(jī)選擇k個(gè)
初始聚類中心,計(jì)算剩余數(shù)據(jù)對(duì)象與聚類中心的相似性,并分配到與其相似性最高的中心所對(duì)應(yīng)的簇中,依據(jù)新的中心進(jìn)行下一次迭代,直到中心不再變化時(shí)停止??梢?jiàn)確定聚類出的簇?cái)?shù)目k是K-means 算法的最關(guān)鍵部分。本文使用輸入特征值之間的歐氏距離作為相似性的評(píng)判依據(jù),通過(guò)“拐點(diǎn)法”和“平均輪廓系數(shù)法”相結(jié)合[11]確定k值。利用“拐點(diǎn)法”計(jì)算評(píng)價(jià)聚類質(zhì)量有效性的指標(biāo)——誤差平方和(SSE),計(jì)算方法見(jiàn)式(2)。
式中:i為聚類結(jié)果中的第i類簇;k為聚類出的簇?cái)?shù)目;Ci為第i類簇的所有數(shù)據(jù)集合;P為Ci中的任一數(shù)據(jù)元素;mi為第i類簇的數(shù)據(jù)中心。
當(dāng)SSE判斷效果不顯著時(shí),引入另一判定聚類質(zhì)量有效性的指標(biāo)——平均輪廓系數(shù)(SC),計(jì)算公式見(jiàn)式(3)和式(4)。
式中:a(i)為樣本i到同簇內(nèi)其他樣本點(diǎn)的平均距離;b(i)為樣本i到其它簇所有點(diǎn)的平均距離;S(i)為樣本i的輪廓系數(shù);m為樣本總數(shù);SC為整個(gè)樣本集的輪廓系數(shù),取值范圍為[-1,1],其值越接近1 表明聚類效果越好。
圖2為SSE和SC隨k的變化曲線。當(dāng)k<4時(shí),SSE下降趨勢(shì)明顯,在k= 2 時(shí)SC出現(xiàn)最大值,但聚為2 類不能很好展示出TSP 多樣的變化規(guī)律,隨著SSE變大聚類效果變差。綜上,取k= 6。
圖2 SSE和SC 隨不同聚類簇?cái)?shù)k 的變化曲線Fig.2 Variation curve of SSE and SC with cluster number k
計(jì)算各時(shí)刻TSP 的平均濃度,按分位數(shù)表達(dá)的結(jié)果如圖3 所示。從均值變化趨勢(shì)看,每日濃度的變化趨勢(shì)呈現(xiàn)“單峰單谷”態(tài)勢(shì),5:00—7:00達(dá)到峰值,17:00—18:00 達(dá)到谷值。上午溫度升高時(shí)顆粒物的布朗運(yùn)動(dòng)逐漸強(qiáng)烈,促使污染物向高空大氣擴(kuò)散[12],隨著港區(qū)7:00—8:00 左右配合白天作業(yè)開(kāi)啟噴淋等人工降塵措施,TSP 濃度進(jìn)一步降低,至18:00 左右出現(xiàn)谷值;夜間雖然港區(qū)作業(yè)強(qiáng)度變低,但部分人工降塵措施關(guān)閉,且溫度降低布朗運(yùn)動(dòng)變?nèi)酰琓SP 濃度回升。
圖3 TSP 質(zhì)量濃度日變化情況Fig.3 TSP mass concentration changes in intraday
圖3中下四分位數(shù)和上四分位數(shù)之間的數(shù)據(jù)間隔較寬,表明不同時(shí)刻濃度值的差異性較大,有必要通過(guò)聚類進(jìn)一步分析。為了方便描述,TSP聚類得到的6 類簇分別用T0—T5 表示。
3.2.1TSP 總體情況分析
表1展示了T0—T5 在各月份的分布情況,圖4 表示T0—T5 的TSP 質(zhì)量濃度日變化情況。
圖4 TSP 各簇日內(nèi)變化情況Fig.4 TSP clusters changes in intraday
T3 和T5 出現(xiàn)在夏季(6—8 月)概率達(dá)68%,且曲線波動(dòng)較大,其中T3 波動(dòng)范圍為17~526 μg/m3,表現(xiàn)為0:00—10:00 的高污染;T5 的波動(dòng)范圍為50~832 μg/m3,表現(xiàn)為10:00—23:00 的高污染。T2 出現(xiàn)在冬季(12 月、1 月、2 月)概率達(dá)50%,呈現(xiàn)出整日持續(xù)遞減的變化,但日內(nèi)TSP 最低質(zhì)量濃度(204 μg/m3)仍高于GB 3095—2012《環(huán)境空氣質(zhì)量標(biāo)準(zhǔn)》年均值二級(jí)標(biāo)準(zhǔn)(200 μg/m3)??梢?jiàn)該港區(qū)在夏、冬季節(jié)更易出現(xiàn)粉塵污染情況,其中夏季尤為突出,與?IBERT 等[4]基于Koper 港發(fā)現(xiàn)的冬、春季污染更易出現(xiàn)波動(dòng)有所不同,可能原因在于氣候、裝卸貨物的差異和新冠疫情對(duì)港區(qū)作業(yè)量大幅影響有關(guān)。T0 呈現(xiàn)出整日持續(xù)遞增的變化;T1 變化趨勢(shì)與圖3 全年日平均變化相同為“單峰單谷”型;T4 日內(nèi)質(zhì)量濃度變化不超過(guò)16 μg/m3,且整日濃度均符合GB 3095—2012《環(huán)境空氣質(zhì)量標(biāo)準(zhǔn)》年均值一級(jí)標(biāo)準(zhǔn)(80 μg/m3),粉塵防治效果顯著。
3.2.2TSP 各類簇變化原因
進(jìn)一步分析TSP 濃度變化原因,計(jì)算全年TSP 濃度與各氣象條件之間的皮爾遜相關(guān)性系數(shù)見(jiàn)表2,可見(jiàn)TSP 與濕度呈正相關(guān),與風(fēng)速呈負(fù)相關(guān)。溫度和氣壓的皮爾遜系數(shù)過(guò)小,風(fēng)向?yàn)槭噶浚嚓P(guān)性計(jì)算存在誤差,均不做考慮。進(jìn)一步計(jì)算各簇TSP 與風(fēng)速和濕度的皮爾遜系數(shù),見(jiàn)表3。T5 對(duì)應(yīng)數(shù)據(jù)只有5 d,相關(guān)性計(jì)算結(jié)果不做考慮。
表2 全年TSP 濃度與氣象條件間的相關(guān)性Table 2 Correlation between TSP concentration and meteorological conditions annually
表3 各簇TSP 濃度與風(fēng)速和濕度的相關(guān)性Table 3 Correlation of TSP concentration with wind speed and humidity for each cluster
在濕度上,本文基于數(shù)據(jù)計(jì)算得出的TSP 濃度與濕度整體呈正相關(guān)不代表高濕度一定會(huì)增大污染。相反,濕度足夠大時(shí)更利于降塵。當(dāng)濕度相對(duì)較大時(shí),一方面濕度阻礙了TSP 等顆粒物的擴(kuò)散[13],水汽更容易以顆粒物為凝結(jié)核凝結(jié),使污染物聚集,導(dǎo)致TSP 濃度增加,這也是T3 在0:00—10:00 高污染的原因;另一方面濕度足夠大時(shí)污染物凝聚成的大顆粒物重力過(guò)大發(fā)生沉降,顆粒物濃度反而降低[14],導(dǎo)致T0 與濕度呈負(fù)相關(guān)的現(xiàn)象。對(duì)于港口這類需要嚴(yán)格控制空氣質(zhì)量的區(qū)域,TSP 高濃度時(shí)人為進(jìn)行的大量噴淋會(huì)增大兩者的正相關(guān)程度。
在風(fēng)速上,T0—T4 均呈現(xiàn)負(fù)相關(guān)性。觀察數(shù)據(jù),T1 和T2 對(duì)應(yīng)濃度變化與風(fēng)速變化趨勢(shì)明顯相反,表明該2 種變化情況受風(fēng)速影響更大??赡艿脑?yàn)轱L(fēng)速增大易使TSP 等顆粒物向大氣擴(kuò)散而減少地表濃度,與張一等[15]通過(guò)回歸模型得出結(jié)論一致。
除濕度和風(fēng)速影響外,2020 年2 月和3 月新冠疫情爆發(fā),港區(qū)作業(yè)量驟減,導(dǎo)致T4 各時(shí)刻濃度較低且較穩(wěn)定,說(shuō)明港區(qū)作業(yè)情況變化[16]也是影響TSP 濃度變化的重要因素。T5 只有5 d,變化趨勢(shì)均與其它各簇呈現(xiàn)極大的差異,可視為特殊簇。觀察數(shù)據(jù)得知,T5 對(duì)應(yīng)的濕度和風(fēng)速與其它各簇差異明顯,濕度在9:00 后明顯高于其它各簇,風(fēng)速雜亂且偏高??紤]T5 變化為港區(qū)內(nèi)裝卸作業(yè)量達(dá)到峰值和特殊的氣候變化所致。
本文通過(guò)對(duì)2020 年蘇州港常熟FD 港區(qū)的TSP 在線監(jiān)測(cè)數(shù)據(jù)進(jìn)行聚類,并結(jié)合實(shí)時(shí)濕度、風(fēng)速等數(shù)據(jù)進(jìn)行分析,主要結(jié)論如下:
1)以煤炭為主要作業(yè)貨種的FD 港區(qū)TSP 年均日內(nèi)變化情況可以描述為:TSP 的年均質(zhì)量濃度在日內(nèi)呈現(xiàn)“單峰單谷”的形式,峰、谷值分別在每日5:00—7:00 和17:00—18:00 出現(xiàn),主要受氣溫和抑塵措施的影響;從季節(jié)表現(xiàn)看,TSP 濃度值容易在夏、冬季出現(xiàn)異常波動(dòng)情況,且夏季表現(xiàn)最為劇烈。
2)基于K-means 聚類法,通過(guò)“拐點(diǎn)法”和“平均輪廓系數(shù)法”相結(jié)合確定采用6 類簇?cái)?shù),對(duì)港區(qū)TSP 日內(nèi)變化情況分析顯示:T3 和T5 曲線變化(波動(dòng))激烈,剩余各簇曲線變化較為平穩(wěn),其中T3 表現(xiàn)為0:00—10:00 高污染,相對(duì)濕度為該簇主要影響因素;T5 表現(xiàn)為10:00—23:00的高污染,由各種氣象因素和港口活動(dòng)的綜合作用導(dǎo)致;T4 在1 d 內(nèi)濃度變化不超過(guò)16 μg/m3,顆粒物防治效果顯著;T2 呈現(xiàn)出持續(xù)遞減的變化,但TSP 質(zhì)量濃度仍然高于標(biāo)準(zhǔn)值,需要重點(diǎn)防治,風(fēng)速為該簇主要影響因素。
3)總體看,TSP 質(zhì)量濃度與大氣濕度呈正相關(guān)關(guān)系,與風(fēng)速呈負(fù)相關(guān)關(guān)系,且港區(qū)作業(yè)強(qiáng)度對(duì)TSP 的質(zhì)量濃度也具有一定影響;但在不同簇中,濕度和風(fēng)速對(duì)TSP 質(zhì)量濃度的影響程度具有較大的差異性。