楊明亮,朱宗玖
(安徽理工大學(xué)電氣與信息工程學(xué)院,安徽 淮南 232001)
隨著我國(guó)經(jīng)濟(jì)快速發(fā)展,大氣顆粒物中空氣動(dòng)力學(xué)直徑≤2.5μm的細(xì)顆粒物(PM2.5)已成為我國(guó)大氣的首要污染物[1]。PM2.5不僅會(huì)造成霧霾影響城市道路交通,也會(huì)對(duì)人體的呼吸道以及肺部器官造成嚴(yán)重危害[2]。因此,對(duì)PM2.5進(jìn)行監(jiān)測(cè)分析具有重要意義。
目前國(guó)內(nèi)外對(duì)PM2.5監(jiān)測(cè)的手段是以傳統(tǒng)地面監(jiān)測(cè)站點(diǎn)為主,但是監(jiān)測(cè)站的建設(shè)成本過高,且大多分布在城市地區(qū),不能有效覆蓋更廣泛的區(qū)域[3]。采用無人機(jī)和車載移動(dòng)監(jiān)測(cè)也是一種重要的方式,但存在無法長(zhǎng)時(shí)間監(jiān)測(cè)PM2.5濃度的問題[4]。國(guó)內(nèi)外學(xué)者開始利用有限的監(jiān)測(cè)站數(shù)據(jù)并通過神經(jīng)網(wǎng)絡(luò)、大氣數(shù)值模擬、擴(kuò)散模型、土地利用回歸模型(LUR)等方法進(jìn)行研究區(qū)內(nèi)PM2.5濃度的空間分布模擬[5]。其中LUR模型最早由Briggs等[6]提出,是一種利用監(jiān)測(cè)站點(diǎn)數(shù)據(jù)及周邊相關(guān)影響因素結(jié)合ArcGIS平臺(tái)預(yù)測(cè)研究區(qū)域PM2.5濃度空間分布的方法。LUR模型不僅考慮到影響PM2.5的因素,而且得到的模擬值和空間分辨率也較高,已成為大氣污染物濃度模擬的最有效方法之一[7]。
當(dāng)前,國(guó)際上已廣泛運(yùn)用LUR模型對(duì)PM2.5和NOX污染物濃度的空間分布模擬,且模擬效果較好[8,9]。我國(guó)由于對(duì)大氣污染防治的起步較晚,國(guó)內(nèi)只有李杰[10]、陽海鷗等[11]及王佳佳等[12]利用LUR模型成功地模擬了不同城市的PM2.5濃度空間分布。但是,與城市尺度下PM2.5濃度空間分布模擬相比,區(qū)域尺度下PM2.5濃度空間分布模擬易受到不同地區(qū)之間自然環(huán)境、社會(huì)經(jīng)濟(jì)、污染排放等因素影響,模擬難度較大。目前,國(guó)內(nèi)只有少量學(xué)者提出了對(duì)區(qū)域尺度PM2.5濃度的模擬[13]。因此,本文將LUR模型應(yīng)用到安徽省污染較重的皖北地區(qū),研究LUR模型在區(qū)域尺度下的適用性,并進(jìn)一步分析PM2.5濃度在不同季節(jié)下空間分布特征。
皖北地區(qū)位于長(zhǎng)江三角洲,由安徽省北部的宿州、淮北、亳州、阜陽、蚌埠、淮南六市組成。地形以平原為主,氣候適宜,擁有豐富煤、鐵、銅等礦產(chǎn)資源。近年來皖北抓住“一帶一路”的發(fā)展機(jī)遇,經(jīng)濟(jì)發(fā)展迅速。伴隨經(jīng)濟(jì)發(fā)展,其環(huán)境問題日漸嚴(yán)重,空氣質(zhì)量惡化,給當(dāng)?shù)鼐用竦纳瞽h(huán)境造成嚴(yán)重影響。因此,本研究選擇安徽省污染較重的皖北地區(qū),通過分析每個(gè)季節(jié)以及年均PM2.5濃度,建立LUR模型模擬皖北地區(qū)PM2.5濃度,為皖北地區(qū)大氣污染治理提供科學(xué)依據(jù)。
1.2.1 PM2.5濃度及氣象數(shù)據(jù)
安徽省皖北地區(qū)共有23個(gè)國(guó)控空氣質(zhì)量監(jiān)測(cè)站點(diǎn)和20個(gè)省控空氣質(zhì)量監(jiān)測(cè)站點(diǎn),研究區(qū)及站點(diǎn)分布如圖1所示。其中蚌埠田家炳中學(xué)和宿州遠(yuǎn)航博物館的國(guó)控站點(diǎn)由于改建,導(dǎo)致2018年數(shù)據(jù)缺失,故本研究采用剩余21個(gè)國(guó)控站點(diǎn)和20個(gè)省控站點(diǎn)2018年1–12月的空氣質(zhì)量數(shù)據(jù)(數(shù)據(jù)來自安徽省生態(tài)環(huán)境廳http://sthjt.ah.gov.cn/index.html)。通過對(duì)數(shù)據(jù)匯總統(tǒng)計(jì),得到41個(gè)監(jiān)測(cè)站點(diǎn)的四季和年均PM2.5濃度數(shù)據(jù)。氣象數(shù)據(jù)來源于國(guó)家氣象科學(xué)數(shù)據(jù)中心(http://data.cma.cn/),采集皖北地區(qū)23個(gè)氣象站點(diǎn)2018年1–12月觀測(cè)數(shù)據(jù),包括氣壓、風(fēng)速、氣溫、相對(duì)濕度、降水量共5類,通過對(duì)數(shù)據(jù)計(jì)算統(tǒng)計(jì)得到氣象數(shù)據(jù)的四季和年均值。
圖1 研究區(qū)域以及站點(diǎn)分布Fig.1 Distribution of study area and stations
1.2.2 土地利用類型
采用清華大學(xué)宮鵬等[14]結(jié)合10 m分辨率Sentinel-2影像開發(fā)出的2017全球10 m分辨率土地利用數(shù)據(jù),參考皖北地區(qū)土地利用的具體情況,利用Arcgis10.6將皖北地區(qū)的土地利用類型分成農(nóng)田、森林、草地、灌木、濕地、水體、不透水面、裸地8類,如圖2所示。
圖2 皖北地區(qū)土地利用分布Fig.2 Distribution of land use in Northern Anhui
1.2.3 道路數(shù)據(jù)
道路數(shù)據(jù)來自于OpenStreetMap的矢量路網(wǎng),通過對(duì)矢量路網(wǎng)進(jìn)行裁剪、拼接得到了研究區(qū)的路網(wǎng)數(shù)據(jù)。選取其中的高速公路、干道、一級(jí)公路、二級(jí)公路和三級(jí)公路5類數(shù)據(jù)。
1.2.4 其他數(shù)據(jù)
高程數(shù)據(jù)通過數(shù)字高程模型DEM獲取,采用來自Earth Data的中國(guó)陸域范圍30 m分辨率的數(shù)據(jù),數(shù)據(jù)源是NASADEM。人口數(shù)據(jù)來自于由美國(guó)能源部橡樹嶺國(guó)家實(shí)驗(yàn)室(ORNL)開發(fā)的Land Scan人口密度數(shù)據(jù)集。污染源數(shù)據(jù)來自于安徽省環(huán)保廳印發(fā)的2017年國(guó)家重點(diǎn)監(jiān)控企業(yè)名單,通過高德地圖定位經(jīng)緯度,選擇研究區(qū)內(nèi)的38家國(guó)家重點(diǎn)廢氣污染企業(yè)。
1.2.5 緩沖區(qū)半徑及影響因子
參考目前區(qū)域尺度緩沖區(qū)半徑的設(shè)置[15],選取0.5、1、1.5、2、3、4、5 km作為緩沖區(qū)半徑。利用Arcgis10.6以監(jiān)測(cè)站點(diǎn)為中心,分別生成土地利用、道路、污染源的緩沖區(qū),統(tǒng)計(jì)緩沖區(qū)土地利用類型的面積作為土地利用因子,道路分類的長(zhǎng)度作為道路因子,廢氣污染企業(yè)個(gè)數(shù)作為污染源因子。氣象因子通過Kriging插值法對(duì)氣象站點(diǎn)的四季和年均值進(jìn)行插值模擬,監(jiān)測(cè)站所在位置的數(shù)據(jù)即為氣象因子。高程因子和人口因子直接提取監(jiān)測(cè)站點(diǎn)所在位置的高程及人口數(shù),最終得到土地利用、道路、污染源、氣象、高程及人口這6類影響因子。
1.3.1 LUR模型構(gòu)建
采用的LUR模型基于ArcGIS與SPSS平臺(tái)構(gòu)建,該多元回歸模型監(jiān)測(cè)的PM2.5濃度為因變量,道路、氣象、DEM高程、人口和污染源等對(duì)PM2.5濃度可能產(chǎn)生影響的因素為自變量。LUR模型的基本形式為
式中y為因變量,即監(jiān)測(cè)到的PM2.5四季和年均值;x1,x2,...,xn為自變量,即各類影響因子;α1,α2,...,αn為待定系數(shù);β為隨機(jī)變量。構(gòu)建LUR模型一般有兩類算法,一種是前向算法[16],一種是后向算法[17,18]。為了降低模型出現(xiàn)同一變量不同緩沖區(qū)(如1.5 km和2 km草地面積)共線性的可能性,也為了提高模型的精確性,最終采用廣泛使用的后向算法構(gòu)建模型,步驟如下:
1)在SPSS中對(duì)土地利用因子、道路因子、污染源因子98(14×7)個(gè),加上氣象因子、人口因子及高程因子7(5+1+1)個(gè),共105個(gè)自變量進(jìn)行雙變量相關(guān)性分析;2)去除與假定相關(guān)性質(zhì)(表1)不同以及相關(guān)性異常的自變量;3)在剩余的自變量中找出每類影響因子同PM2.5濃度相關(guān)性最高的變量(如2 km二級(jí)公路長(zhǎng)度);4)去除同類影響因子中同PM2.5濃度相關(guān)性最高的變量皮爾森系數(shù)大于0.6的變量(如3 km二級(jí)公路長(zhǎng)度);5)把剩余的變量與PM2.5濃度在SPSS中進(jìn)行逐步線性回歸,即可得到LUR模型。
表1 模型中自變量描述Table 1 Description of the independent variables in the model
1.3.2 模型驗(yàn)證
目前國(guó)內(nèi)外學(xué)者關(guān)于驗(yàn)證LUR模型的方法主要有以下五種。第一種是留一檢測(cè)誤差法[19],即只保留一個(gè)站點(diǎn)的數(shù)據(jù),用其他站點(diǎn)的數(shù)據(jù)構(gòu)建回歸方程,對(duì)比保留站點(diǎn)的模擬值與實(shí)際值來驗(yàn)證模型的精度。這種方法簡(jiǎn)單易操作,但檢測(cè)樣本過于單一,結(jié)果不具有普遍性,簡(jiǎn)單來說就是一個(gè)站點(diǎn)的檢測(cè)不足以驗(yàn)證模型精度的問題。第二種方法是留一交叉互驗(yàn)[20],即在上述留一檢測(cè)誤差的基礎(chǔ)上,把每個(gè)監(jiān)測(cè)站點(diǎn)都重復(fù)一遍。這種方法雖然繁瑣,但可以有效驗(yàn)證模型精度,適用于少量監(jiān)測(cè)站點(diǎn)的研究。第三種方法是直接用各站點(diǎn)的數(shù)據(jù)構(gòu)建回歸方程,對(duì)比模擬值和實(shí)際值[21]。這種對(duì)比方法簡(jiǎn)單明了,但是由于使用所有監(jiān)測(cè)站點(diǎn)數(shù)據(jù)構(gòu)建模型,模型的精度可能會(huì)受到影響。第四種方法是K折交叉驗(yàn)證[22,23],將監(jiān)測(cè)站點(diǎn)分成k組,交叉驗(yàn)證k次,這種方法適用于監(jiān)測(cè)站點(diǎn)過多、工作量過大的研究。第五種方法是留出驗(yàn)證法[24],即隨機(jī)選取部分站點(diǎn)的數(shù)據(jù)作為驗(yàn)證數(shù)據(jù),剩余站點(diǎn)數(shù)據(jù)進(jìn)行訓(xùn)練。因?yàn)橛糜谘芯康恼军c(diǎn)數(shù)不多,故本研究采用留一交叉互驗(yàn)的方法,并通過調(diào)整R2、均方根誤差(RMSE)、模擬精度R2這3項(xiàng)指標(biāo)驗(yàn)證模型。
1.3.3 PM2.5濃度模擬
在ArcGIS中將皖北地區(qū)劃分成5 km×5 km規(guī)則格網(wǎng)點(diǎn),通過回歸方程計(jì)算出PM2.5模擬濃度值給每個(gè)格網(wǎng)點(diǎn)賦值,再利用Kriging插值法就可以得到研究區(qū)的PM2.5濃度空間分布。
根據(jù)41個(gè)監(jiān)測(cè)站2018年1–12月PM2.5的日均濃度數(shù)據(jù)計(jì)算出PM2.5月均濃度,結(jié)合我國(guó)PM2.5空氣質(zhì)量二級(jí)標(biāo)準(zhǔn)值(35μg·m?3)及世衛(wèi)組織制定的第三階段PM2.5年均濃度指導(dǎo)值(15μg·m?3),可以得到研究區(qū)PM2.5整體的變化趨勢(shì)。由圖3可知,皖北地區(qū)的PM2.5濃度整體偏高,41個(gè)監(jiān)測(cè)站點(diǎn)的年均值為55μg·m?3,全年多數(shù)時(shí)間都超出國(guó)家空氣質(zhì)量二級(jí)標(biāo)準(zhǔn)濃度限值,更是大幅超出了世衛(wèi)組織制定的第三階段指導(dǎo)值,皖北地區(qū)空氣質(zhì)量問題不容樂觀。
圖3 PM2.5月均濃度變化Fig.3 Changing trend of monthly PM2.5concentration
在SPSS中將PM2.5濃度與各影響因子進(jìn)行雙變量相關(guān)性分析,得到相關(guān)系數(shù)。由于變量過多,這里只列出進(jìn)行多元線性回歸的變量。如表2所示,不透水面、二級(jí)公路、三級(jí)公路、氣壓、人口、廢氣污染企業(yè)與PM2.5濃度呈正相關(guān)性;草地、濕地、水體、風(fēng)速、相對(duì)濕度、降水量與PM2.5濃度呈負(fù)相關(guān)性,這與之前的假定相關(guān)性質(zhì)(表1)基本一致。而與一些學(xué)者研究結(jié)果不同的是[25],研究區(qū)內(nèi)森林、灌木及DEM高程卻呈現(xiàn)與PM2.5濃度相關(guān)性不高的現(xiàn)象。分析其原因發(fā)現(xiàn),這與皖北地區(qū)的地形有關(guān),皖北地區(qū)以平原為主,地勢(shì)平坦,森林及灌木覆蓋面積較少,所以會(huì)呈現(xiàn)相關(guān)性不高的現(xiàn)象。
表2 PM2.5濃度與影響因子雙變量相關(guān)分析結(jié)果Table 2 Result of bivariate correlation analysis between PM2.5concentration and impact factors
建立LUR模型的過程中,考慮到PM2.5濃度受季節(jié)影響較大,因此采用春、夏、秋、冬及年均PM2.5濃度與相應(yīng)的剩余變量建立了四季和年均LUR模型。模型的回歸結(jié)果如表3所示,表中回歸結(jié)果的各項(xiàng)參數(shù)介紹如下:1)B表示回歸系數(shù),是各個(gè)自變量在回歸方程中的回歸系數(shù),正負(fù)值表示自變量對(duì)因變量有顯著的正負(fù)向影響,但基于B并不能反映各個(gè)自變量對(duì)因變量影響程度的大小,需借助標(biāo)準(zhǔn)回歸系數(shù)Beta,此時(shí)數(shù)值越大表示對(duì)自變量的影響更大;2)Standard Error是標(biāo)準(zhǔn)誤差;3)t是T檢驗(yàn)的值,用來計(jì)算P值;4)P即T檢驗(yàn)的顯著性檢驗(yàn)P值,小于0.05則說明自變量對(duì)因變量具有顯著影響;5)VIF是方差膨脹因子,用于共線性診斷,當(dāng)0 通過表3中標(biāo)準(zhǔn)回歸系數(shù)Beta可以看出各項(xiàng)進(jìn)入LUR模型的自變量對(duì)回歸結(jié)果的貢獻(xiàn)率。春季LUR模型自變量貢獻(xiàn)率從高到低分別為:降水量、人口數(shù)量、相對(duì)濕度、2 km緩沖區(qū)內(nèi)二級(jí)公路長(zhǎng)度;夏季LUR模型自變量貢獻(xiàn)率從高到低分別為:2 km緩沖區(qū)內(nèi)草地面積、1 km緩沖區(qū)內(nèi)濕地面積、5 km緩沖區(qū)內(nèi)廢氣污染企業(yè)個(gè)數(shù);秋季LUR模型自變量貢獻(xiàn)率從高到低分別為:氣壓、風(fēng)速、0.5 km緩沖區(qū)內(nèi)二級(jí)公路長(zhǎng)度;冬季LUR模型自變量貢獻(xiàn)率從高到低分別為:氣壓、風(fēng)速;年均LUR模型自變量貢獻(xiàn)率從高到低分別為:1.5 km緩沖區(qū)內(nèi)草地面積、2 km緩沖區(qū)內(nèi)廢氣污染企業(yè)個(gè)數(shù)、相對(duì)濕度、1.5 km緩沖區(qū)內(nèi)三級(jí)公路長(zhǎng)度、2 km緩沖區(qū)內(nèi)濕地面積。其中道路因子參與春、秋、年均LUR模型的構(gòu)建,且對(duì)研究區(qū)PM2.5濃度有加劇作用,原因是機(jī)動(dòng)車排放的尾氣及駕駛中產(chǎn)生的揚(yáng)塵是PM2.5污染的重要來源[27];氣象因子參與春、秋、冬及年均LUR模型的構(gòu)建,其中降水量、相對(duì)濕度、風(fēng)速對(duì)研究區(qū)PM2.5濃度具有抑制作用,原因是相對(duì)濕度增大會(huì)使大氣顆粒物吸濕生長(zhǎng)、變大,當(dāng)相對(duì)濕度進(jìn)一步增大,會(huì)加速顆粒物沉降[28,29];降水對(duì)大氣顆粒物具有清除作用,導(dǎo)致了PM2.5濃度降低[30];風(fēng)速大,對(duì)流旺盛,PM2.5不容易堆積,也可以降低PM2.5的濃度[31]。土地利用因子中的草地、濕地參與夏、年均LUR模型的構(gòu)建,尤其是草地和濕地在夏季對(duì)PM2.5濃度影響很大,這與夏季濕地草木生長(zhǎng)旺盛有很大關(guān)系。人口和廢氣污染企業(yè)對(duì)PM2.5濃度也具有加劇作用,這與廢氣污染企業(yè)超標(biāo)排放有關(guān),也與廢氣污染企業(yè)和人口密集區(qū)一般都處于城市地區(qū)(城市土地利用以建設(shè)用地為主,草地與濕地的覆蓋面積較少)的情況有關(guān)[32]。 表3 PM2.5多元線性回歸結(jié)果Table 3 The results of PM2.5stepwise multiple linear regression 模型最終回歸結(jié)果的調(diào)整R2分別為 0.828(春)、0.731(夏)、0.831(秋)、0.775(冬)、0.892(年均),夏、冬LUR模型的影響因子整體可以解釋70%以上PM2.5濃度的變化,春、秋、年均LUR模型的影響因子可以解釋80%以上PM2.5濃度的變化,說明模型整體擬合程度較高,解釋能力很強(qiáng)。 由于皖北地區(qū)監(jiān)測(cè)站點(diǎn)數(shù)目不多,故模型驗(yàn)證的方法采用留一交叉互驗(yàn)的方法,將41個(gè)監(jiān)測(cè)站點(diǎn)分成訓(xùn)練集(40個(gè))和驗(yàn)證集(1個(gè)),用訓(xùn)練集構(gòu)建模型,然后利用模型計(jì)算出驗(yàn)證集站點(diǎn)的PM2.5預(yù)測(cè)值,對(duì)比驗(yàn)證集的預(yù)測(cè)值與真實(shí)值,重復(fù)41次得到均方根誤差(RMSE)與模擬精度R2。均方根誤差RMSE分別為6.34 μg·m?3(春)、7.01 μg·m?3(夏)、6.28 μg·m?3(秋)、6.71 μg·m?3(冬)、5.33 μg·m?3(年均),模型驗(yàn)證散點(diǎn)圖如圖4所示。從圖4可以看出,四季及年均LUR模型的模擬精度R2分別為0.825(春)、0.730(夏)、0.834(秋)、0.772(冬)、0.897(年均),年均LUR模型模擬精度最高,春、秋兩季模擬精度其次,夏、冬兩季最低。 圖4 PM2.5監(jiān)測(cè)值-預(yù)測(cè)值散點(diǎn)圖。(a)春季;(b)夏季;(c)秋季;(d)冬季;(e)年均Fig.4 Scatter plots of observed versus predicted PM2.5concentration.(a)Spring;(b)summer;(c)autumn;(d)winter;(e)annual average 參考目前LUR模型研究結(jié)果,如許剛等[13]基于土地利用回歸模型模擬京津冀PM2.5濃度空間分布的調(diào)整R2為0.805,均方根誤差RMSE為14.2μg·m?3,模擬精度R2為0.79;宋萬營(yíng)等[25]基于LUR模型的大氣PM2.5濃度分布模擬與人口暴露研究:以湖北省為例的調(diào)整R2為0.604,標(biāo)準(zhǔn)誤差為5.97;與上述結(jié)果相比,本研究模型的調(diào)整R2解釋性強(qiáng),均方根誤差RMSE誤差小,模擬精度R2高,模型的精度可以得到保障。 為進(jìn)一步分析皖北地區(qū)四季及年均PM2.5濃度的空間分布,在ArcGIS中將皖北地區(qū)劃分成5 km×5 km規(guī)則格網(wǎng)點(diǎn),采用回歸方程計(jì)算出PM2.5模擬濃度值并給每個(gè)格網(wǎng)點(diǎn)進(jìn)行賦值,再利用Kriging插值法得到皖北地區(qū)的PM2.5濃度空間分布。從圖5(a)-(d)可以看出,不同季節(jié)下皖北地區(qū)PM2.5濃度呈現(xiàn)明顯不同的空間分布特征,春、冬兩季PM2.5污染主要集中在北部區(qū)域的亳州、淮北、宿州3市,這是因?yàn)楸辈繀^(qū)域地勢(shì)平坦,來自北方的大量污染顆粒物在風(fēng)力的匯聚作用下,導(dǎo)致了PM2.5濃度升高[33]。夏季PM2.5污染最嚴(yán)重區(qū)域是擁有大量煤礦的淮南市,其PM2.5濃度高的原因與煤礦開采中產(chǎn)生的揚(yáng)塵有關(guān)[34]。秋季PM2.5污染主要集中在以農(nóng)業(yè)生產(chǎn)為主的阜陽市,其原因是秋耕秸稈的大量燃燒使得PM2.5濃度升高[35]。 為驗(yàn)證模型模擬空間分布的準(zhǔn)確性,將LUR模型計(jì)算得出的年均PM2.5預(yù)測(cè)值與監(jiān)測(cè)站點(diǎn)監(jiān)測(cè)的年均PM2.5真實(shí)值進(jìn)行插值,得到如圖5(e)所示的年均PM2.5預(yù)測(cè)值空間分布圖和如圖5(f)所示的年均PM2.5真實(shí)值空間分布圖。通過對(duì)比插值后的濃度空間分布圖,可以看出年均PM2.5預(yù)測(cè)值分布和年均PM2.5真實(shí)值分布基本保持一致,整體呈現(xiàn)北高、南低的現(xiàn)象。 該研究的局限性在于皖北地區(qū)監(jiān)測(cè)站點(diǎn)數(shù)量不多,一定程度限制了模型的精度。而且通過研究對(duì)比5個(gè)LUR模型的模擬精度可以看出,春、秋及年均模擬精度較高,夏、冬兩季相對(duì)較差,這可能與周邊區(qū)域的污染遷移有一定聯(lián)系[36]。夏冬兩季周邊一些經(jīng)濟(jì)發(fā)達(dá)的地區(qū)燃煤量大幅上升,風(fēng)向帶動(dòng)大量污染顆粒物進(jìn)入研究區(qū),導(dǎo)致局部區(qū)域PM2.5濃度大幅上升,進(jìn)而影響了研究區(qū)的模擬精度。因此在區(qū)域尺度LUR模型建模時(shí),不僅要考慮到研究區(qū)內(nèi)的影響因素,還要考慮周邊區(qū)域以及風(fēng)向因子的影響,進(jìn)一步解析PM2.5污染產(chǎn)生的源頭。同時(shí)本研究構(gòu)建LUR模型時(shí)采用的是線性回歸的方法,線性回歸不能完全解釋PM2.5濃度與影響因子之間的聯(lián)系,可以考慮使用非線性回歸的方法構(gòu)建模型,或者通過結(jié)合機(jī)器學(xué)習(xí)的算法改進(jìn)LUR模型,也可以進(jìn)一步擴(kuò)展影響因子的類別以及突出時(shí)空分異來提升模型的解釋性。 圖5 皖北地區(qū)PM2.5濃度空間分布模擬與驗(yàn)證。(a)春季;(b)夏季;(c)秋季;(d)冬季;(e)年均預(yù)測(cè);(f)年均真實(shí)Fig.5 Simulation and verification of spatial distribution of PM2.5concentration in Northern Anhui.(a)Spring;(b)summer;(c)autumn;(d)winter;(e)annual average forecast;(f)annual average real value 1)研究區(qū)PM2.5年平均濃度為55μg·m?3,超出國(guó)家年平均濃度標(biāo)準(zhǔn)35μg·m?3,更遠(yuǎn)超于世衛(wèi)組織年平均濃度的10μg·m?3,研究區(qū)空氣質(zhì)量問題不容樂觀。 2)在雙變量相關(guān)性分析中,不透水面、二級(jí)公路、三級(jí)公路、氣壓、人口、廢氣污染企業(yè)與PM2.5濃度呈正相關(guān)性;草地、濕地、水體、風(fēng)速、相對(duì)濕度、降水量與PM2.5濃度呈負(fù)相關(guān)性。研究區(qū)內(nèi)森林、灌木及DEM高程與PM2.5濃度相關(guān)性不高,分析原因發(fā)現(xiàn),與皖北地區(qū)的地形地貌有關(guān)。 3)建立的 LUR 模型調(diào)整R2分別為 0.828(春)、0.731(夏)、0.831(秋)、0.775(冬)、0.892(年均);均方根誤差 RMSE 分別為 6.34 μg·m?3(春)、7.01 μg·m?3(夏)、6.28 μg·m?3(秋)、6.71 μg·m?3(冬)、5.33 μg·m?3(年均);模擬精度R2分別為 0.825(春)、0.730(夏)、0.834(秋)、0.772(冬)、0.897(年均),模型表現(xiàn)較好,具有較強(qiáng)的解釋力。 4)模擬的PM2.5濃度整體呈現(xiàn)北高、南低的特點(diǎn)。此外,不同季節(jié)下呈現(xiàn)明顯不同的空間分布特征,這與來自北方的大量污染顆粒物、當(dāng)?shù)氐拿旱V開采、秋耕秸稈燃燒等潛在污染源有關(guān)。2.4 模型驗(yàn)證
2.5 四季及年均PM2.5模擬
3 討論
4 結(jié)論