賈 冊, 陳 臻, 韓 梅
(1.中國人民大學環(huán)境學院,北京 100872;2.中國科學院科技戰(zhàn)略咨詢研究院,北京 100190;3.中國科學院大學公共政策與管理學院,北京 100049;4.陜西省環(huán)境調(diào)查評估中心,陜西 西安 710054)
《2020中國生態(tài)環(huán)境狀況公報》顯示,2020年全國337個城市累計發(fā)生大氣環(huán)境嚴重污染345 d,重度污染1152 d,可見當前中國大氣環(huán)境污染形勢仍然很嚴峻。這些重污染天氣的出現(xiàn)不僅影響居民身心健康,還對社會經(jīng)濟發(fā)展造成了很大的損失[1-5]。重污染天氣出現(xiàn)的核心原因是由于氣象條件的變化,使得大氣環(huán)境中的污染物不能被及時清除而累積形成。相關(guān)研究表明,在重污染天氣期間進行預警能有效降低人的出行,減少移動源等污染物的排放從而達到減緩重污染的程度[6-10]。當前國內(nèi)應對重污染天氣的過程中也采取了預警的方式來應對。根據(jù)空氣質(zhì)量情況,地方政府適時啟動紅色、橙色、黃色級別的重污染天氣應急預警,要求工業(yè)源、移動源等污染排放在一定時間內(nèi)做出不同的污染物減排,實現(xiàn)空氣質(zhì)量的改善[11-12]。國內(nèi)外進行污染預警的過程均是通過模型進行預測未來24 h、48 h甚至一周的空氣質(zhì)量變化情況來隨時調(diào)整預警的級別。這種不確定預警時間和預警時長的方式嚴重干擾了企業(yè)的正常生產(chǎn),據(jù)統(tǒng)計咸陽市2019年1—3月和11—12月期間共預警76 d,占到總天數(shù)的一半。當前污染預警管控的過程中是以地級市政府為主體發(fā)布預警,要求轄區(qū)內(nèi)企業(yè)進行相應的污染物減排,而部分地級市存在行政區(qū)過大,同一時間內(nèi)的PM2.5可能存在兩極分化的情況。
由于重污染天氣發(fā)生一般是區(qū)域性的[13],重污染區(qū)域內(nèi)應該統(tǒng)一進行管控,并有效識別需要進行管控的時間段。對于確定的區(qū)域而言,短時間內(nèi)對其大氣污染物環(huán)境容量影響最大的是氣象因素的變化[14-17],高爽等[18]提出基于氣象分型的大氣環(huán)境容量測算,但該研究是通過人工對氣象進行分類識別,該方式存在劃分依據(jù)受人為主觀影響的問題,現(xiàn)有研究氣象和排放對環(huán)境中PM2.5濃度變化的相關(guān)文獻,基本沒有突破行政區(qū)劃來體現(xiàn)污染區(qū)域,也沒有深入挖掘所分類氣象條件下的污染物變化規(guī)律,無法有效指導在不利氣象條件下污染排放管控[19-20]。故需要相關(guān)研究來對PM2.5的管控時空進行識別,從而實現(xiàn)精確管控和預警,使工業(yè)企業(yè)提前做好應對,減少經(jīng)濟損失?;诖耍疚幕跊Q策樹模型提出了一種簡易的區(qū)域PM2.5污染管控時間段識別方法,以期有效指導重污染天氣期間PM2.5污染管控。
PM2.5污染現(xiàn)象主要出現(xiàn)在冬防期(11月至次年3月)[21],本文基于冬防期PM2.5的濃度數(shù)據(jù)并結(jié)合地形等數(shù)據(jù)對所研究區(qū)域在時間緯度上進行空間聚類,識別不同的PM2.5污染區(qū)域;基于PM2.5濃度數(shù)據(jù)對不同區(qū)域的氣象數(shù)據(jù)分別構(gòu)建決策樹模型,識別不同區(qū)域影響PM2.5濃度最不利擴散的氣象條件,對最不利擴散氣象條件下的PM2.5變化情況進行模型構(gòu)建,確定不同研究區(qū)域的PM2.5管控時間段(圖1)。
圖1 研究思路Fig.1 Research idea
受地形、經(jīng)濟發(fā)展、產(chǎn)業(yè)布局和氣象條件等因素的影響,污染區(qū)域分布往往與行政區(qū)劃不一致,進行區(qū)域污染聯(lián)防聯(lián)控尤為重要。本文所研究的關(guān)中地區(qū)(西安市、咸陽市、渭南市、銅川市、寶雞市、韓城市及楊凌區(qū))具有相對獨立的地理環(huán)境,包括關(guān)中平原和圍繞著關(guān)中平原的北山山系、秦嶺以及崤山等山脈,具有相對獨立的地形氣候[22-23]?;诖?,本文在進行污染區(qū)域的識別和劃定過程中,綜合考慮時空緯度,識別不同氣象條件下需要協(xié)同管控的污染區(qū)域。
首先是對所研究區(qū)域每日空氣質(zhì)量監(jiān)測站點的PM2.5濃度進行空間聚類,將每日聚類的分區(qū)結(jié)果進行相關(guān)性聚類分析,識別在研究時間段內(nèi)應該集中進行管控的區(qū)域。對于所識別的區(qū)域,在排除外來傳輸污染的情況下,工業(yè)源、移動源、無組織面源等的污染減排,都將會降低該區(qū)域的PM2.5濃度。在進行聚類過程中先由監(jiān)測點生成泰森多邊形,對生成的泰森多邊形進行聚類分析,以保證所識別污染區(qū)域的連續(xù)性。
分類算法中比較常見的有決策樹(分類樹)、隨機森林、支持向量機、神經(jīng)網(wǎng)絡分類等算法,其中決策樹算法能夠直觀地給出詳細的分類過程,其他模型更偏向于黑箱模型預測。決策樹算法由Leo Breiman 等學者在1984 年提出[24],并發(fā)展出C4.5、C5.0等算法模型。決策樹的表現(xiàn)形式為二叉樹,在進行模型構(gòu)建的過程中可分為生長和剪枝2個過程。生長的過程中主要是對輸入的眾多變量中選取最佳變量以及對所選取的最佳變量尋找最佳分割點。剪枝的過程是找到最佳變量和分割點后將其他影響模型精度的樹枝減掉。其中,最佳的分組變量和分割點是被分類變量異質(zhì)性下降最快的對應參數(shù)。該模型能夠從繁雜的數(shù)據(jù)指標中有效識別最有利于劃分PM2.5濃度的氣象指標因子及相關(guān)指標閾值。
研究時段為2016—2019年間的冬防期,每年11月1日至次年3月31日。所使用的PM2.5監(jiān)測數(shù)據(jù)來自關(guān)中五市的國控點及省控點環(huán)境空氣質(zhì)量監(jiān)測站,共87 個有效監(jiān)測點,空氣質(zhì)量數(shù)據(jù)來源于陜西省空氣質(zhì)量實時發(fā)布系統(tǒng)。氣象數(shù)據(jù)來源于中國氣象數(shù)據(jù)網(wǎng)(http://data.cma.cn),中國地面氣候資料日值數(shù)據(jù)集(V 3.0)包括平均風速、最大風速、平均本站氣壓、日最高本站氣壓、日最低本站氣壓、平均氣溫、日最高氣溫、日最低氣溫、平均地表氣溫、日最高地表氣溫、日最低地表氣溫、平均相對濕度、是否降水、累計降水量、小型蒸發(fā)量、日照時數(shù)等指標。
關(guān)中區(qū)域在研究時間段有87 個空氣質(zhì)量監(jiān)測點,基本上保證了關(guān)中各區(qū)縣有1 個空氣質(zhì)量監(jiān)測點,通過對所有監(jiān)測點的2016 年11 月至2019 年3月的1—3 月、11—12 月期間每日的PM2.5濃度值進行空間聚類,共生成453 個聚類結(jié)果。聚類過程中采用R語言的rgeoda包K均值聚類方法進行空間聚類。在對關(guān)中地區(qū)進行聚類的過程中,通過選擇不同的聚類系數(shù)并結(jié)合F-Stat、地形等因素后,發(fā)現(xiàn)關(guān)中地區(qū)在進行PM2.5濃度空間聚類的過程被分成兩類最優(yōu)的聚類。對453個聚類的結(jié)果求相關(guān)性系數(shù)識別需要集中管控的區(qū)域,相關(guān)性系數(shù)結(jié)果見圖2。將相關(guān)性系數(shù)進行聚類可將87個空氣質(zhì)量監(jiān)測點劃分為兩類(圖2 中黑色方框所包含的區(qū)域),這些點在整個研究時間段內(nèi)會呈現(xiàn)高度一致性,可在地理上劃分在一個區(qū)域中進行集中管控。在條件允許下,可進一步細化分區(qū)管控區(qū)域,本文將關(guān)中地區(qū)分為兩類進行研究。將圖2分區(qū)后的監(jiān)測點生成泰森多邊形,整體區(qū)域邊界采用函數(shù)將邊緣進行光滑處理在行政區(qū)地圖中進行體現(xiàn)(圖3a),區(qū)域一(白色區(qū)域)對應空氣質(zhì)量監(jiān)測點有37個點,氣象觀測點有7個點,PM2.5濃度平均值為116.55 μg·m-3,超過24 h PM2.5標準值的天數(shù)為192 d,占總天數(shù)的42.38%。區(qū)域二(灰色區(qū)域)對應空氣質(zhì)量監(jiān)測點有50 個點,對應的氣象觀測點有4 個點;PM2.5濃度平均值為112.05 μg·m-3,超過24 h PM2.5標準值的天數(shù)為294 d,占總天數(shù)的64.90%。
圖2 關(guān)中地區(qū)空氣質(zhì)量監(jiān)測點PM2.5濃度聚類結(jié)果相關(guān)性Fig.2 Correlation of concentration clustering results at PM2.5 in Guanzhong area
將分區(qū)結(jié)果投影至關(guān)中地區(qū)的高程圖,由圖3b可以看出,區(qū)域二劃定的范圍基本與關(guān)中平原所在位置重疊,可見關(guān)中地區(qū)處于低海拔區(qū)域的地方有非常強的區(qū)域性[25],同時也說明了PM2.5濃度變化與地形有較大的關(guān)系,這與張波等[26]的研究基本一致,有效證明了當前分區(qū)的合理性。
圖3 關(guān)中地區(qū)PM2.5濃度地區(qū)聚類分布Fig.3 Regional cluster distribution of PM2.5 concentration in Guanzhong area
綜上所述,關(guān)中地區(qū)的PM2.5濃度變化與地形有很大的關(guān)系,將研究時段內(nèi)各環(huán)境空氣質(zhì)量監(jiān)測點的PM2.5濃度平均值采用反距離權(quán)重(IDW)方法進行空間差值,按照投影到東西、南北和高程3 個維度,進行趨勢分析(圖4)。結(jié)果表明,從東到西PM2.5濃度呈先增加后下降并逐步趨于平穩(wěn),在經(jīng)度109°左右達到了最高點(圖4a)。從南到北而言,PM2.5濃度呈先上升后下降再上升的變換趨勢,在緯度34.3°左右達到了最高點(圖4b)。從海拔來看,PM2.5濃度從低海拔地區(qū)隨著海拔上升的過程中先下降,當海拔達到100 m左右之后,PM2.5濃度基本趨于穩(wěn)定,在85 μg·m-3(圖4c)。結(jié)合圖3a 可以看出,關(guān)中地區(qū)PM2.5濃度最高的區(qū)域集中在西安市城區(qū),PM2.5濃度從西安市城區(qū)向四周的西咸新區(qū)、咸陽市、渭南市、銅川市的平原(低海拔)地區(qū)逐步過渡,形成較強區(qū)域性的污染區(qū)域。隨著四周海拔的不斷上升,PM2.5濃度又開始出現(xiàn)下降的情況,當海拔達到一定高度后,海拔將不在是影響PM2.5濃度變化的因素,更多是地區(qū)污染排放在影響其變化。
圖4 PM2.5濃度分布與地形關(guān)系分布Fig.4 Relationship between PM2.5 concentration distribution and topography
由于地形和污染企業(yè)數(shù)量在一定時間范圍內(nèi)是不會發(fā)生特別大的變化,而氣象條件隨時在變化,主要研究氣象對PM2.5濃度變化的影響。由于PM2.5濃度的變化是污染排放和多項氣象因子綜合作用的結(jié)果,人工對氣象因子進行判斷和劃定相關(guān)閾值會導致較大的主觀不確定性。為了規(guī)避人為主觀因素的影響,采用較為成熟的決策樹模型來識別不同區(qū)域影響PM2.5濃度的關(guān)鍵氣象因子[27]。決策樹模型可以通過氣象因子對PM2.5濃度變化情況進行分割,在分割過程中充分考慮PM2.5濃度和氣象因子之間的關(guān)系,并將具有共線性的氣象因子進行剔除,有效減少干擾因子。同時該方法能夠通過圖形表達,更直觀地對分類過程給出依據(jù),相較于其他黑箱決策樹模型有更好地解釋性。
故采用決策樹模型來識別影響PM2.5濃度的關(guān)鍵氣象因子和分類閾值。在識別過程中以PM2.5濃度為y,所有氣象因子為x,采用rpart函數(shù)進行分類,初始分類結(jié)果結(jié)合復雜度參數(shù)最佳cp值進行剪枝,結(jié)果見圖5。其中,區(qū)域一在模型構(gòu)建的時候選取日照時數(shù)、最大風速、日最低地表氣溫、平均本站氣壓4 項指標對氣象進行分類,針對PM2.5濃度的變化情況將氣象分為6類。區(qū)域二在模型構(gòu)建的時候選取小型蒸發(fā)量、平均相對濕度、日照時數(shù)、累積降水量、平均風速5項指標進行分類,針對PM2.5濃度的變化情況將氣象分為6 類。區(qū)域一、二的氣象分類結(jié)果見表1,區(qū)域一、二中均識別出日照時數(shù)的變化主要是由于PM2.5污染造成的。風速對于PM2.5的去除有非常大的效果,也被模型所識別,其中日最大風速和日平均風速是高度相關(guān)可替代的因子。除日照時數(shù)和風速因子外,區(qū)域一處于海拔相對較高地區(qū),還識別了日最低地表氣溫、平均本站氣壓作為關(guān)鍵變量,而區(qū)域二處于低海拔平原地區(qū),并且PM2.5濃度嚴重程度遠高于區(qū)域一,在不考慮排放的情況下主要是由濕度、降水的變化而導致的波動。通過對所有參與模型的氣象因子重要程度進行分析(圖6),可以看出,區(qū)域一二所選擇的模型有效涵蓋了相關(guān)重要因子,所識別的關(guān)鍵氣象因子在胡琳等[28]的研究中也得到了有效支持。
圖5 PM2.5濃度氣象決策樹Fig.5 PM2.5 concentration meteorological classification tree
圖6 氣象因子重要度分析Fig.6 Importance analysis of meteorological factors
表1 決策樹模型識別氣象分類結(jié)果Tab.1 Classification for regional meteorological
為了有效驗證所構(gòu)建分類模型的可信度。以區(qū)域一為例,對基于PM2.5分類后的氣象類別再次采用決策樹預測模型進行驗證分類結(jié)果的準確性。通過選取70%的訓練集和30%的測試集對分類結(jié)果進行驗證,測試集預測結(jié)果的準確率達到了81.2%,有效證明了該方法的可行性。
將上述的氣象分類與PM2.5的濃度相結(jié)合繪制時間序列圖7。由圖7 可以看出,對于區(qū)域一而言,PM2.5的濃度呈由氣象條件驅(qū)動下的周期性變化。在氣象Ⅰ-2、Ⅰ-5、Ⅰ-7條件下,PM2.5基本處于低濃度狀態(tài);在1 月中旬至3 月期間PM2.5的濃度周期性波動主要是Ⅰ-8類氣象條件所導致,在Ⅰ-8類氣象條件下,區(qū)域一PM2.5總體呈下降趨勢,在清除PM2.5污染。在12 月至2 月中旬主要是Ⅰ-10 和Ⅰ-11 類氣象條件驅(qū)動的PM2.5濃度變化,這兩類氣象條件所驅(qū)動的PM2.5濃度峰值會高于在Ⅰ-8 類氣象條件下的峰值。對于區(qū)域二而言,在Ⅱ-3、Ⅱ-5、Ⅱ-7氣象條件下,PM2.5基本處于低濃度狀態(tài)。在Ⅱ-9類氣象條件下,區(qū)域二PM2.5總體呈下降趨勢,在清除PM2.5污染。在11 月至12 月中旬和2 月中旬至3 月期間主要是由Ⅱ-10 類氣象條件所驅(qū)動,12 月中旬至2月中旬主要是由Ⅱ-11類氣象條件所驅(qū)動導致PM2.5濃度周期性變化。由Ⅱ-11 類氣象條件所驅(qū)動的PM2.5濃度周期性變化峰值會高于由Ⅱ-10類氣象條件所驅(qū)動的峰值。
圖7 PM2.5濃度與氣象類型時序Fig.7 PM2.5 concentration and meteorological type sequence diagram
綜上所述,區(qū)域一PM2.5高濃度主要發(fā)生在Ⅰ-10 和Ⅰ-11 氣象條件下;區(qū)域二的PM2.5高濃度主要發(fā)生在Ⅱ-10 和Ⅱ-11 類氣象條件。將此類氣象條件標記為不利氣象條件,在這些氣象條件下,PM2.5環(huán)境容量會達到區(qū)域最小值。故需要對此單獨進行研究。
由于區(qū)域一中Ⅰ-10 和Ⅰ-11 兩類氣象條件比較相近,將區(qū)域一中Ⅰ-10和Ⅰ-11兩類氣象條件合并。選取區(qū)域一和區(qū)域二由Ⅰ-10、Ⅰ-11和Ⅱ-10、Ⅱ-11開始的氣象條件,連續(xù)3 d及以上時間PM2.5濃度持續(xù)上漲;其中為了保證選取時間段的連續(xù)性,有個別時間段有1 d的其他氣象類型或濃度下降的情況。最終區(qū)域一有13個時間段滿足條件,初始平均濃度為90.02 μg·m-3,每段平均持續(xù)4.92 d;區(qū)域二Ⅱ-10 有11 個時間段滿足條件,初始平均濃度為108.26 μg·m-3,每段平均持續(xù)4.22 d。區(qū)域二Ⅱ-11有7 個時間段滿足條件,初始平均濃度為182.71 μg·m-3,每段平均持續(xù)5.14 d。
對區(qū)域一和區(qū)域二所選取的每一段進行回歸構(gòu)建最不利天氣下PM2.5濃度的增長模型(圖8)。圖中標注了PM2.5濃度累積最快和最緩的回歸直線方程。根據(jù)以上信息,得出區(qū)域一在Ⅰ-10、Ⅰ-11 最不利氣象條件下,PM2.5濃度的平均變化方程為:y=21.693x+90.02(圖8a);區(qū)域二在Ⅱ-10 最不利氣象條件下,PM2.5濃度的平均變化方程為:y=18.746x+108.26(圖8b)。區(qū)域二在Ⅱ-11 最不利氣象條件下,PM2.5濃度的平均變化方程為:y=27.658x+182.71(圖8c)。
圖8 區(qū)域一、二最不利氣象條件下PM2.5回歸模型Fig.8 PM2.5 regression model under the most unfavorable meteorological conditions in region Ⅰand Ⅱ
由表1可知,區(qū)域一在Ⅰ-2、Ⅰ-5、Ⅰ-7氣象類型,區(qū)域二Ⅱ-3、Ⅱ-5、Ⅱ-7 氣象類型下,PM2.5平均濃度基本滿足環(huán)境空氣質(zhì)量標準(GB3095-2012)中規(guī)定的PM2.5日均值濃度75 μg·m-3二級標準。而區(qū)域一Ⅰ-10、Ⅰ-11 類和區(qū)域二Ⅱ-9、Ⅱ-10 類最不利氣象條件下,區(qū)域一、二PM2.5濃度遠超二級標準。
回歸結(jié)果顯示,在區(qū)域一Ⅰ-10、Ⅰ-11 類和區(qū)域二Ⅱ-9、Ⅱ-10類最不利氣象條件下,PM2.5最高濃度分別超GB3095-2012中24 h平均PM2.5(標準數(shù)值75 μg·m-3)二級標準的2.62 倍,2.50 倍和4.33 倍??梢钥闯觯嚓P(guān)區(qū)域出現(xiàn)所識別的最不利氣象條件以及初始濃度達到一定程度時,相關(guān)主管部門應按不同的控制程度對企業(yè)污染排放設定時間段。由于PM2.5濃度與污染排放之間呈現(xiàn)的是非線性關(guān)系[29-30],且不同的工業(yè)源、移動源、農(nóng)業(yè)面源、居民源等排放在不同的氣象條件和不同區(qū)域下對PM2.5濃度的貢獻不同[31-33]。
(1)關(guān)中地區(qū)根據(jù)冬防期日尺度PM2.5濃度均值結(jié)合地形數(shù)據(jù),對空間聚類結(jié)果進行相關(guān)系數(shù)計算聚類后可劃分為2 個污染區(qū)域:關(guān)中平原等低海拔地形區(qū)域和海拔相對較高的山脈區(qū)域。關(guān)中地區(qū)冬防期PM2.5平均濃度隨著海拔的升高而降低,當海拔升至100 m 左右后,PM2.5日均濃度值逐漸趨于穩(wěn)定。
(2)對于分區(qū)后的地區(qū)分別采用決策樹對其氣象類型基于PM2.5濃度進行分類,其中高海拔地區(qū)在模型構(gòu)建的時候選取了日照時數(shù)、最大風速、日最低地表氣溫、平均本站氣壓4 項指標將氣象分為6類。低海拔地區(qū)在模型構(gòu)建的時候選取小型蒸發(fā)量、平均相對濕度、日照時數(shù)、累積降水量、平均風速5 項指標將氣象分為6 類。高海拔區(qū)域在Ⅰ-10和Ⅰ-11 兩類氣象條件的PM2.5濃度較高;低海拔區(qū)域在Ⅱ-10 和Ⅱ-11 兩類氣象條件的PM2.5濃度較高;高海拔和低海拔區(qū)域分別在Ⅰ-8 類、Ⅰ-9 類氣象條件下的PM2.5濃度呈下降趨勢。
(3)回歸分析顯示,高海拔區(qū)域在Ⅰ-10、Ⅰ-11類和低海拔區(qū)域二Ⅱ-10、Ⅱ-11類最不利氣象條件下,PM2.5濃度平均會持續(xù)上升4.76 d,到達最高濃度。最高濃度分別超GB3095-2012 中24 h 平均PM2.5二級標準的2.62倍,2.50倍和4.33倍。
(4)建議在某一區(qū)域發(fā)生所識別的不利氣象條件時,應對該區(qū)域內(nèi)城市同時發(fā)布重污染天氣預警要求。為有效減少社會經(jīng)濟損失和對居民身體健康的傷害等,發(fā)布預警時應包含可能污染持續(xù)時長及可能的嚴重程度等信息,從而促使居民提前安排出行,污染企業(yè)提前做好生產(chǎn)任務安排。