徐發(fā)昭,李 凈,褚馨德,滿元偉
基于MODIS數(shù)據(jù)與多機(jī)器學(xué)習(xí)法的日PM2.5模擬研究
徐發(fā)昭,李 凈*,褚馨德,滿元偉
(西北師范大學(xué)地理與環(huán)境科學(xué)學(xué)院,甘肅 蘭州 730070)
為了深入了解地面PM2.5的空間分布,以山東省為研究區(qū),利用2019年的PM2.5站點(diǎn)實(shí)測(cè)數(shù)據(jù),結(jié)合中分辨率成像光譜儀(MODIS)的L3級(jí)別的MCD19A2氣溶膠光學(xué)厚度產(chǎn)品,充分考慮人口、地形、氣象等因素,使用RF、SVR、BPNN、DNN等4種機(jī)器學(xué)習(xí)算法對(duì)山東省2019年逐日PM2.5進(jìn)行了模擬.結(jié)果表明:隨機(jī)森林模型(RF)的RMSE和MAE的值分別為12.67和6.62,優(yōu)于BPNN、SVR和DNN模型.隨機(jī)森林模型(RF)最適合山東省的日PM2.5模擬.
遙感;PM2.5;AOD;機(jī)器學(xué)習(xí)
PM2.5作為大氣污染的主要來(lái)源,與人類健康關(guān)系密切[1-2].由于空氣質(zhì)量監(jiān)測(cè)站點(diǎn)分布的極不均勻,大多數(shù)地方站點(diǎn)稀少,因此,對(duì)PM2.5實(shí)測(cè)站點(diǎn)較少的區(qū)域進(jìn)行PM2.5的估算是一項(xiàng)非常有意義的研究工作.隨著遙感技術(shù)的飛速發(fā)展,影像的空間分辨率不斷更新提高,借助衛(wèi)星遙感數(shù)據(jù)解決這一問(wèn)題成為現(xiàn)在主要的手段[3-5].
目前,PM2.5的空間分布模擬包括基于站點(diǎn)實(shí)測(cè)數(shù)據(jù)和基于衛(wèi)星遙感數(shù)據(jù)這兩種主要的方法.早期工作主要是基于站點(diǎn)數(shù)據(jù)的PM2.5空間模擬,其利用地理學(xué)第一定律在空間上進(jìn)行插值,主要包括克里金插值、反距離插值與樣條函數(shù)插值等[6-7],基于站點(diǎn)數(shù)據(jù)的插值只適用于站點(diǎn)稠密的城市區(qū)域,而且極容易引入誤差,普適性差.基于衛(wèi)星遙感數(shù)據(jù)的PM2.5估算模擬主要有單變量回歸模型、化學(xué)傳輸模型、基于經(jīng)驗(yàn)的物理方法模型、統(tǒng)計(jì)模型與機(jī)器學(xué)習(xí)模型.Wang等[8]首先提出了PM2.5站點(diǎn)數(shù)據(jù)與氣溶膠光學(xué)厚度(AOD)具有一定的相關(guān)性,并利用AOD與PM2.5的簡(jiǎn)單線性關(guān)系計(jì)算PM2.5的分布,雖然計(jì)算效率較高,簡(jiǎn)單易用,但會(huì)產(chǎn)生誤差,導(dǎo)致預(yù)測(cè)精度較差.化學(xué)傳輸模型[9-10]模擬PM2.5需要具有較強(qiáng)的理化基礎(chǔ),且模型的精度高度依賴于排放清單,計(jì)算成本高,不具有普適性.基于經(jīng)驗(yàn)的物理方法模型[11-12]PM2.5模擬需要準(zhǔn)確的氣溶膠特征參數(shù),特征參數(shù)的求解需要經(jīng)驗(yàn)統(tǒng)計(jì)關(guān)系來(lái)進(jìn)行擬合,該模型的精度高度依賴于輸入?yún)?shù),極易導(dǎo)致誤差傳播.目前,使用較多的是統(tǒng)計(jì)模型與機(jī)器學(xué)習(xí)模型.景悅等[13]利用AOD數(shù)據(jù)構(gòu)建的混合效應(yīng)模型對(duì)基于時(shí)間與空間的PM2.5進(jìn)行了模擬,表明該模型對(duì)PM2.5的模擬具有較好的效果.由于考慮到PM2.5受到多種因素的影響,僅僅利用AOD數(shù)據(jù)無(wú)法很好地模擬出PM2.5的空間分布特征.孫成等[14]構(gòu)建的混合效應(yīng)模型中加入溫度、相對(duì)濕度、風(fēng)速等氣象要素,這些要素加入明顯提高了PM2.5的模擬精度.這表明氣象條件在PM2.5模擬中起著非常重要的作用.冷湘梓等[15]對(duì)比分析了非線性模型與多元線性回歸模型在PM2.5中重金屬的模擬,結(jié)果表明非線性模型在PM2.5中重金屬模擬的效果好于多元線性回歸模型.由于考慮到PM2.5在時(shí)間與空間上的異質(zhì)性,越來(lái)越多的學(xué)者開(kāi)始研究時(shí)間和空間對(duì)空氣質(zhì)量的影響,許多學(xué)者把地理加權(quán)回歸模型(GWR)與時(shí)間地理加權(quán)回歸模型(GTWR)引入到PM2.5模擬研究中[16-18].Guo等[19]利用時(shí)空地理加權(quán)回歸模型、陳輝等[20]利用地理加權(quán)回歸模型對(duì)PM2.5進(jìn)行了模擬,得到比傳統(tǒng)統(tǒng)計(jì)模型更好的結(jié)果.因它不能客觀地反映PM2.5和其他變量之間的非線性關(guān)系,所以不具有通用性.
現(xiàn)階段,越來(lái)越多的學(xué)者使用機(jī)器學(xué)習(xí)算法來(lái)刻畫(huà)這種非線性關(guān)系,并取得了較好的效果.夏曉圣等[21]利用隨機(jī)森林模型對(duì)影響PM2.5的因素進(jìn)行了分析,發(fā)現(xiàn)AOD對(duì)PM2.5反演的貢獻(xiàn)率最大,達(dá)37.96%.劉林鈺等[22]則利用深度神經(jīng)網(wǎng)絡(luò)模型對(duì)PM2.5進(jìn)行了反演研究,得到的結(jié)果比線性模型與非線性模型都要好.耿冰等[23]則提出了一種端到端的深度學(xué)習(xí)模型對(duì)PM2.5進(jìn)行了模擬,相比于混合效應(yīng)模型等傳統(tǒng)統(tǒng)計(jì)模型的模擬效果,該模型的模擬精度有很大的提升.不同于數(shù)學(xué)統(tǒng)計(jì)模型,機(jī)器學(xué)習(xí)以數(shù)據(jù)為驅(qū)動(dòng),并把非線性關(guān)系進(jìn)行了充分的刻畫(huà),因此,機(jī)器學(xué)習(xí)模型被廣泛用于PM2.5的模擬研究[24-27].
在PM2.5模擬研究中,除了氣溶膠光學(xué)厚度這一主要的影響因素,陳優(yōu)良等[28]以長(zhǎng)江三角洲為研究區(qū),利用GIS空間分析、數(shù)理統(tǒng)計(jì)等方法,對(duì)PM2.5與氣象要素的關(guān)系進(jìn)行了研究,結(jié)果顯示出PM2.5與氣象因素中的風(fēng)速、氣壓相關(guān)性明顯.孫成、Beans、潘晨等[14,29-30]的研究同樣表明氣象因素在PM2.5的模擬中起著非常關(guān)鍵的作用.臧振峰等[31]采用克里格插值與統(tǒng)計(jì)學(xué)方法,對(duì)我國(guó)糧產(chǎn)區(qū)河南省的PM2.5和PM10的影響因素進(jìn)行研究,發(fā)現(xiàn)年降水量、NDVI和人口密度對(duì)PM2.5與PM10的影響最大.因此,本文除了選擇氣溶膠光學(xué)厚度這一主要變量外,不僅考慮了氣溫、風(fēng)速、邊界層高度、氣壓、相對(duì)濕度等氣象因素,還考慮了人口密度和高程以及空間位置特征(緯度).
目前,在PM2.5的區(qū)域尺度模擬研究中,前人研究的時(shí)間尺度多為月尺度與年尺度,對(duì)于日尺度上的研究較少,且利用多機(jī)器學(xué)習(xí)法結(jié)合遙感數(shù)據(jù)估算PM2.5的研究也較少.前人在變量選取上考慮氣象變量較多,本文借助MODIS遙感數(shù)據(jù),不僅考慮了氣象數(shù)據(jù),還加入了人口、地形和空間位置等數(shù)據(jù).本研究在前人的基礎(chǔ)上利用多機(jī)器學(xué)習(xí)法結(jié)合遙感數(shù)據(jù)以山東省為例來(lái)模擬日PM2.5的時(shí)空變化特征,以便為山東省的大氣污染治理提供一定的數(shù)據(jù)支撐.
圖1 研究區(qū)位置
本研究以山東省為研究區(qū),圖1.本文的數(shù)據(jù)主要包括氣溶膠光學(xué)厚度(AOD)、氣象、高程、人口密度與PM2.5站點(diǎn)實(shí)測(cè)數(shù)據(jù).其中,AOD在PM2.5模擬中起著最為重要的作用.AOD數(shù)據(jù)來(lái)源于美國(guó)國(guó)家航空航天局(NASA)的MCD19A2數(shù)據(jù)(https: //ladsweb.modaps.eosdis.nasa.gov/).氣象數(shù)據(jù)(氣溫(TEM,K)、風(fēng)速(西風(fēng)()和南風(fēng)(),m/s)邊界層高度(BLH,m)、氣壓(SP,hPa)、濕度(RH,%))來(lái)自歐洲中期天氣預(yù)報(bào)中心的ERA5陸地小時(shí)數(shù)據(jù)的合成(https://cds.climate.copernicus.eu/#!/home).人口密度(MPD)數(shù)據(jù)來(lái)自WorldPop(https://www.worldpop. org/).高程(DEM,m)數(shù)據(jù)來(lái)自資源環(huán)境科學(xué)與數(shù)據(jù)中心(https://www.resdc.cn/).PM2.5站點(diǎn)實(shí)測(cè)數(shù)據(jù)來(lái)自中國(guó)環(huán)境監(jiān)測(cè)中心(http://www.cnemc.cn/).
由于原始柵格數(shù)據(jù)的時(shí)間分辨率和空間分辨率不統(tǒng)一,本文對(duì)原始柵格數(shù)據(jù)進(jìn)行了重采樣、投影轉(zhuǎn)換、數(shù)據(jù)提取和整合,得到統(tǒng)一空間分辨率為1km的數(shù)據(jù)集,并對(duì)空缺值與異常值進(jìn)行剔除.氣溶膠光學(xué)厚度數(shù)據(jù)受云的影響較為嚴(yán)重,云層會(huì)導(dǎo)致波段信號(hào)無(wú)效,因此導(dǎo)致部分區(qū)域的氣溶膠光學(xué)厚度為空值.目前還沒(méi)有一項(xiàng)很好的技術(shù)可以把云對(duì)氣溶膠光學(xué)厚度的影響計(jì)算清楚,因此遇到有云的天氣時(shí),直接把受到各種云層影響的區(qū)域清除掉.
1.2.1 隨機(jī)森林(RF) 隨機(jī)森林(Random Forest)[32]的實(shí)現(xiàn)借助編程工具python 3.7,將影響PM2.5的因變量逐一輸入到模型中,擬合得到最優(yōu)的PM2.5模擬模型.在模型模擬時(shí),隨機(jī)選取所有累計(jì)數(shù)據(jù)的80%作為訓(xùn)練數(shù)據(jù),剩余的20%作為測(cè)試數(shù)據(jù),一遍遍地訓(xùn)練1000次,選取皮爾遜相關(guān)系數(shù)最大的一次研究模型作為PM2.5的模擬模型.本模型所設(shè)置的參數(shù)如下:葉子的數(shù)量為100,葉子節(jié)點(diǎn)的最小樣本數(shù)為2,最大深度為10,bootstrap為True.
1.2.2 BP神經(jīng)網(wǎng)絡(luò)(BPNN) BP神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network)[33]是一種廣泛用于地理學(xué)中分類與回歸的多層前饋神經(jīng)網(wǎng)路.BP神經(jīng)網(wǎng)絡(luò)的編程工具、數(shù)據(jù)選取與最佳模型選擇和隨機(jī)森林模型的相同,參數(shù)設(shè)置為:激活函數(shù)選擇ReLU,傳遞函數(shù)設(shè)置為purelin,隱藏層設(shè)為8.
1.2.3 支持向量回歸(SVR) 支持向量回歸模型(Support Vector Regression)[34]在回歸問(wèn)題中廣泛使用.支持向量回歸的編程工具、數(shù)據(jù)選取與最佳模型選擇和隨機(jī)森林模型的相同.支持向量回歸模型的參數(shù):核函數(shù)kernel為RBF,懲罰系數(shù)為35,誤差閾值gamma為0.2.
1.2.4 深度神經(jīng)網(wǎng)絡(luò)(DNN) 2006年Hinton等[35]研究機(jī)器學(xué)習(xí)算法時(shí)提出了一個(gè)新的研究領(lǐng)域“深度學(xué)習(xí)”,基礎(chǔ)為深度神經(jīng)網(wǎng)絡(luò)(DNN),其對(duì)地理學(xué)的分類與回歸問(wèn)題起到了重要的推動(dòng)作用.深度神經(jīng)網(wǎng)絡(luò)的編程工具、數(shù)據(jù)選取與最佳模型選擇和隨機(jī)森林模型的相同.深度神經(jīng)網(wǎng)絡(luò)的參數(shù)設(shè)置:數(shù)學(xué)模型設(shè)置為Adagrad,激活函數(shù)設(shè)置為ELU,傳遞函數(shù)設(shè)置為L(zhǎng)ambda,隱藏層為32.
本文使用3個(gè)指標(biāo)(相關(guān)系數(shù)2、均方根誤差RMSE、平均絕對(duì)誤差MAE)評(píng)估4種機(jī)器學(xué)習(xí)模型的性能,各指標(biāo)計(jì)算公式如下:
本文將影響PM2.5濃度的11個(gè)變量與站點(diǎn)實(shí)測(cè)PM2.5進(jìn)行相關(guān)性分析,結(jié)果如表1所示.PM2.5與TEM、、BLH、DEM、、SP呈現(xiàn)明顯的負(fù)相關(guān);PM2.5與RH、AOD、MPD呈明顯的正相關(guān).PM2.5與植被類型(NDVI)、土地利用類型(LUCC)的相關(guān)性相對(duì)較弱.因土地利用類型和植被類型與PM2.5的相關(guān)性較弱,本研究選擇除了LUCC和NDVI的其他9個(gè)變量,并加入緯度(POINT_Y)共10個(gè)變量(由于經(jīng)度產(chǎn)生分塊效果,故不作為變量進(jìn)行輸入)對(duì)山東省日PM2.5進(jìn)行了模擬.由于AOD受到多種因素的影響,導(dǎo)致缺失數(shù)據(jù)較多.本文一共獲得2019年的309天數(shù)據(jù),獲取的時(shí)間有效率為84.65%,AOD有效率為55.98%.
表1 PM2.5與其影響因素的相關(guān)性
4種機(jī)器學(xué)習(xí)法計(jì)算結(jié)果如表2所示,2介于0.36到0.76之間,RMSE介于12到33 μg/m3之間,MAE位于6.6到15μg/m3之間.通過(guò)比較這4種機(jī)器學(xué)習(xí)模型,發(fā)現(xiàn)RF與DNN的相關(guān)系數(shù)均大于0.67,均方根誤差小于15μg/m3,相對(duì)絕對(duì)誤差均小于7μg/m3;SVR和BPNN的相關(guān)系數(shù)在0.4左右,均方根誤差大于24μg/m3,相對(duì)絕對(duì)誤差大于10μg/m3.支持向量回歸模型與BP神經(jīng)網(wǎng)絡(luò)模型的效果較為接近,2較低,誤差較大.深度神經(jīng)網(wǎng)絡(luò)模型的相關(guān)性較高,平均絕對(duì)誤差也相對(duì)較低,但相較于隨機(jī)森林模型,其效果略顯不足.所以,在這4種模型中,隨機(jī)森林的表現(xiàn)效果最好,深度神經(jīng)網(wǎng)絡(luò)效果次之,支持向量回歸和BP神經(jīng)網(wǎng)絡(luò)的效果較差.故選擇隨機(jī)森林模型對(duì)山東省每日PM2.5進(jìn)行模擬研究.且本研究利用隨機(jī)森林模型反演PM2.5的效果好于陳輝、Guo等[17,20]利用多元線性回歸模型(2=0.56,RMSE= 37.03μg/m3)、地理加權(quán)回歸模型(2=0.7,RMSE= 26.2μg/m3)和時(shí)空地理加權(quán)回歸模型(2=0.58, RMSE=30.51μg/m3)得到的效果.相較于線性回歸模型、多元線性回歸模型、地理加權(quán)回歸模型的模擬,使用機(jī)器學(xué)習(xí)算法結(jié)合遙感數(shù)據(jù)進(jìn)行PM2.5模擬的效果更好,誤差更低.這在一定程度上也表明,利用遙感數(shù)據(jù)結(jié)合機(jī)器學(xué)習(xí)法進(jìn)行PM2.5的模擬具有一定的可行性.
表2 機(jī)器學(xué)習(xí)算法對(duì)比
利用隨機(jī)森林模型模擬得到山東省2019年每日的PM2.5,在每個(gè)季節(jié)隨機(jī)選擇2d,結(jié)果如圖2所示.春季PM2.5濃度處在較高的水平,由于風(fēng)力較大,導(dǎo)致空氣中粉塵數(shù)量較多;夏季PM2.5的濃度下降到一年中較低的水平;秋季PM2.5的濃度開(kāi)始有明顯的增高,其中濃度最高的地方大部分分布在山東的東南部、西南部、西北部,其中菏澤和聊城境內(nèi)污染最為嚴(yán)重.氣溫下降、密集的人類活動(dòng)以及化石燃料的燃燒是導(dǎo)致PM2.5升高的主要原因.在山東的東部和膠州灣附近,由于靠近海洋,風(fēng)速較大,風(fēng)速有利于PM2.5的擴(kuò)散,導(dǎo)致PM2.5的濃度處于較低的水平.但是由于受到海洋性氣溶膠的影響,估算的PM2.5的值比較大.在冬季,PM2.5的濃度達(dá)到一年中的最高.在每日的PM2.5的反演中,大部分呈現(xiàn)西南高、東北低的趨勢(shì).在某些地方,由于沒(méi)有氣溶膠光學(xué)厚度數(shù)據(jù),所以在圖中顯示為空白.
山東省2019年季節(jié)PM2.5濃度時(shí)空分布如圖3所示,季節(jié)的PM2.5濃度為每日模擬的平均值,其中空白處為AOD數(shù)據(jù)缺失區(qū)域.夏季平均濃度最低為28.605μg/m3,夏季雨水比較充沛,降水過(guò)程可以清洗掉空氣中的雜質(zhì),起到凈化空氣的作用;溫度較高也有利于PM2.5的擴(kuò)散.春季和秋季平均濃度較為相近分別為44.974μg/m3、45.75μg/m3,春季風(fēng)速較大,易發(fā)生揚(yáng)塵的情況,導(dǎo)致PM2.5的濃度處于較高的水平.秋季天氣逐漸變冷,溫度下降不利于PM2.5的擴(kuò)散,在山東西南部、東南部、西北部,開(kāi)始燃燒植被作物進(jìn)行取暖,導(dǎo)致空氣中的PM2.5濃度上升.冬季平均濃度最高為79.909μg/m3,由于大量化石燃料燃燒、氣溫較低等原因,使得山東省的PM2.5濃度處于一年中最高的水平,尤其在棗莊市、菏澤市、聊城市、德州市PM2.5濃度升高尤為明顯,整體處于85μg/m3以上,這已經(jīng)到達(dá)了輕度污染的水平,對(duì)身體健康已經(jīng)產(chǎn)生影響,因此對(duì)冬季的治理仍要繼續(xù).
2019年全年的PM2.5結(jié)果如圖4所示,PM2.5平均濃度為50.295μg/m3,比國(guó)家頒布的GB 3095—2012二級(jí)標(biāo)準(zhǔn)的PM2.5濃度35μg/m3高43.7%.其中空白處為AOD數(shù)據(jù)缺失區(qū)域.將本文PM2.5的模擬結(jié)果與加拿大達(dá)爾豪斯大學(xué)大氣成分分析小組[36](Atmospheric Composition Analysis Group)模擬的2013年(71.117μg/m3)、2015年(66.714μg/m3)、2017年(51.82μg/m3)的PM2.5結(jié)果進(jìn)行對(duì)比,可以看出山東省的整體PM2.5濃度較前幾年顯著下降,但還沒(méi)達(dá)到國(guó)家頒布的二級(jí)標(biāo)準(zhǔn),還需要進(jìn)一步采取措施進(jìn)行治理.就2019年來(lái)說(shuō),污染嚴(yán)重的區(qū)域集中在山東的西南部、南部與西北部,包括棗莊、菏澤、聊城和德州等地區(qū),總體呈現(xiàn)西南高、東北低的趨勢(shì).
圖2 日PM2.5濃度空間分布
a、b位于春季,c、d位于夏季,d、e位于秋季,f、g位于冬季
圖3 各季節(jié)PM2.5平均濃度空間分布
圖4 2019年P(guān)M2.5平均濃度空間分布
本文利用多機(jī)器學(xué)習(xí)法結(jié)合遙感數(shù)據(jù)來(lái)估算山東省PM2.5的濃度,該方法對(duì)其他區(qū)域的相關(guān)研究具有一定的參考價(jià)值.本文對(duì)于PM2.5的來(lái)源、軌跡以及形成過(guò)程涉及較少,接下來(lái)可在PM2.5的形成過(guò)程和傳播路徑進(jìn)行研究.
3.1 在四種機(jī)器學(xué)習(xí)方法中,隨機(jī)森林模型(RF)模擬效果表現(xiàn)最好,其次是深度神經(jīng)網(wǎng)絡(luò)模型(DNN),支持向量回歸模型(SVR)和BP神經(jīng)網(wǎng)絡(luò)模型(BPNN)模擬的表現(xiàn)效果較差.
3.2 2019年山東省的PM2.5空間分布基本呈現(xiàn)西南高、東北低的格局,時(shí)間分布為冬季>秋季>春季>夏季,全省污染最為嚴(yán)重的是冬季,尤其在1月和12月.
3.3 將影響PM2.5濃度的變量與PM2.5的實(shí)測(cè)數(shù)據(jù)進(jìn)行相關(guān)分析,結(jié)果發(fā)現(xiàn),PM2.5與溫度、風(fēng)速、邊界層高度、氣壓和高程呈顯著負(fù)相關(guān),與濕度、人口密度和氣溶膠光學(xué)厚度呈顯著正相關(guān),氣溶膠光學(xué)厚度、風(fēng)速和邊界層高度在PM2.5模擬中起著最重要的作用.
[1] Zhao C, Wang Y, Su Z, et al. Respiratory exposure to PM2.5soluble extractdisrupts mucosal barrier function and promotes the development of experimental asthma [J]. Science of The Total Environment, 2020,730:139145.
[2] 曾賢剛,阮芳芳.中國(guó)PM2.5污染健康效應(yīng)的國(guó)民經(jīng)濟(jì)影響分析 [J]. 中國(guó)環(huán)境科學(xué), 2020,40(7):3228-3238.
Zeng X G, Ruan F F. Analysis on the national economic impact of PM2.5induced health effects in China [J]. China Environmental Science, 2020,40(7):3228-3238.
[3] Man Y, Huang Y, Shen H, et al. Effects of urban form on haze pollution in China: Spatial regression analysis based on PM2.5remote sensing data [J]. Applied Geography, 2018,98:215-223.
[4] Guan Y, Xiao Y, Wang Y, et al. Assessing the health impacts attributable to PM2.5and ozone pollution in 338 Chinese cities from 2015 to 2020 [J]. Environmental Pollution, 2021,287(9):117623.
[5] Zhang Y, Li Z. Remote sensing of atmospheric fine particulate matter (PM2.5) mass concentration near the ground from satellite observation [J]. Remote Sensing of Environment, 2015,160:252-262.
[6] 梅 楊,黨麗娜,楊 勇,等.基于時(shí)空克里格的PM2.5時(shí)空預(yù)測(cè)及分析 [J]. 環(huán)境科學(xué)與技術(shù), 2016,39(7):157-163.
Mei Y, Dang L N, Yang Y, et al. Spatiotemporal prediction and analysis of PM2.5based on spatiotemporal kriging [J]. Environmental Science and Technology, 2016,39(7):157-163.
[7] 李 杰,翟 亮,桑會(huì)勇,等.PM2.5濃度插值中不同空間插值方法對(duì)比 [J]. 測(cè)繪科學(xué), 2016,41(4):50-54+101.
Li J, Zhai L, Sang H Y, et al. Comparison of different spatial interpolation methods for PM2.5[J]. Science of Surveying and Mapping, 2016,41(4): 50-54+101.
[8] Wang J, Christopher S A. Intercomparison between satellite-derived aerosol optical thickness and PM2.5mass: Implications for air quality studies [J]. Geophysical Research Letters, 2003,30(21):2095.
[9] Geng G, Zhang Q, Martin R V, et al. Estimating long-term PM2.5concentrations in China using satellite-based aerosol optical depth and a chemical transport model [J]. Remote Sensing of Environment, 2015,166:262-270.
[10] Liu Y, Rokjin, et al. Mapping annual mean ground-level PM2.5concentrations using multiangle imaging spectroradiometer aerosol optical thickness over the contiguous United States [J]. Journal of Geophysical Research: Atmospheres, 2004,109(D22).
[11] Li Z Q, et al. Remote sensing of atmospheric particulate mass of dry PM2.5near the ground: Method validation using ground-based measurements [J]. Remote Sensing of Environment, 2016,173:59-68.
[12] Lin C, Li Y, Yuan Z, et al. Using satellite remote sensing data to estimate the high-resolution distribution of ground-level PM2.5[J]. Remote Sensing of Environment, 2015,156:117-128.
[13] 景 悅,孫艷玲,徐 昊,等.基于混合效應(yīng)模型的京津冀地區(qū)PM2.5日濃度估算 [J]. 中國(guó)環(huán)境科學(xué), 2018,38(8):2890-2897.
Jing Y, Sun Y L, Xu H, et al. Daily estimation of PM2.5concentrations based on mixed effects model in Beijing-Tianjin-Hebei region [J]. China Environmental Science, 2018,38(8):2890-2897.
[14] 孫 成,王 衛(wèi),劉方田,等.基于線性混合效應(yīng)模型的河北省PM2.5濃度時(shí)空變化模型研究[J]. 環(huán)境科學(xué)研究, 2019,32(9):1500-1509.
Sun C, Wang W, Liu F T, et al. Spatial-Temporal Simulation of PM2.5Concentration in Hebei Province based on Linear Mixed Effects Model [J]. Research of Environmental Sciences, 2019,32(9):1500- 1509.
[15] 冷湘梓,王勤耕,錢 新,等.基于非線性數(shù)學(xué)方法的PM2.5中重金屬濃度模擬[J]. 中國(guó)環(huán)境科學(xué), 2017,37(3):821-828.
Leng X Z, Wang Q G, Qian X, et al. Simulation of heavy metal concentrations in PM2.5based on nonlinear mathematics methods [J]. China Environmental Science, 2017,37(3):821-828.
[16] He Q, Huang B. Satellite-based high-resolution PM2.5estimation over the Beijing-Tianjin-Hebei region of China using an improved geographically and temporally weighted regression model [J]. Environmental Pollution, 2018,236(MAY):1027-1037.
[17] Guo Y X, Tang Q H, Gong D Y, et al. Estimating ground-level PM2.5concentrations in Beijing using a satellite-based geographically and temporally weighted regression model [J]. Remote Sensing of Environment, 2017,198:140-149.
[18] Liu N, Zou B, Li S, et al. Prediction of PM2.5concentrations at unsampled points using multiscale geographically and temporally weighted regression [J]. Environmental Pollution, 2021,284:117116.
[19] Guo B, Wang X, Pei L, et al. Identifying the spatiotemporal dynamic of PM2.5concentrations at multiple scales using geographically and temporally weighted regression model across China during 2015~2018 [J]. Science of The Total Environment, 2020,751:141765.
[20] 陳 輝,厲 青,張玉環(huán),等.基于地理加權(quán)模型的我國(guó)冬季PM2.5遙感估算方法研究[J]. 環(huán)境科學(xué)學(xué)報(bào), 2016,36(6):2142-2151.
Chen H, Li Q, Zhang Y H, et al. Estimations of PM2.5concentrations based on the method of geographically weighted regression [J]. Acta Scientiae Circumstantiate, 2016,36(6):2142-2151.
[21] 夏曉圣,陳菁菁,王佳佳,等.基于隨機(jī)森林模型的中國(guó)PM2.5濃度影響因素分析[J]. 環(huán)境科學(xué), 2020,41(5):2057-2065.
Xia X S, Chen J J, Wang J J, et al. PM2.5Concentration influencing factors in China based on the random forest model [J]. Environmental Science, 2020,41(5):2057-2065.
[22] 劉林鈺,張永軍,李彥勝,等.基于深度學(xué)習(xí)的華東地區(qū)PM2.5濃度遙感反演[J]. 環(huán)境科學(xué), 2020,41(4):1513-1519.
Liu L Y, Zhang Y J, Li Y S, et al. PM2.5inversion using remote sensing data in Eastern China based on deep learning [J]. Environmental Science, 2020,41(4):1513-1519.
[23] 耿 冰,孫義博,曾巧林,等.基于深度學(xué)習(xí)方法的PM2.5精細(xì)化時(shí)空估算模型 [J]. 中國(guó)環(huán)境科學(xué), 2021,41(8):3502-3510.
Geng B, Sun Y B, Zeng Q L, et al. Refined spatiotemporal estimation model of PM2.5based on deep learning method [J]. China Environmental Science, 2021,41(8):3502-3510.
[24] 康俊鋒,黃烈星,張春艷,等.多機(jī)器學(xué)習(xí)模型下逐小時(shí)PM2.5預(yù)測(cè)及對(duì)比分析 [J]. 中國(guó)環(huán)境科學(xué), 2020,40(5):1895-1905.
Kang J F, Huang L X, Zhang C Y, et al. Hourly PM2.5prediction and its comparative analysis under multi-machine learning model [J]. China Environmental Science, 2020,40(5):1895-1905.
[25] Li J, Garshick E, Hart J E, et al. Estimation of ambient PM2.5in Iraq and Kuwait from 2001 to 2018 using machine learning and remote sensing [J]. Environment International, 2021,151(151):106445.
[26] Mg A, Yc A, As A, et al. Estimating daily high-resolution PM2.5concentrations over Texas: Machine learning approach [J]. Atmospheric Environment, 2021,247:118209.
[27] Chen W, Ran H, Cao X, et al. Estimating PM2.5with high-resolution 1-km AOD data and an improved machine learning model over Shenzhen, China [J]. Science of the Total Environment, 2020,746: 141093.
[28] 陳優(yōu)良,李亞倩.長(zhǎng)三角PM2.5和O3變化特征及與氣象要素的關(guān)系[J]. 長(zhǎng)江流域資源與環(huán)境, 2021,30(2):382-396.
Chen Y L, Li Y Q. Characteristics of O3and PM2.5and its relationship with meteorological factors in Yangtze River Delta [J]. Resourcesand Environmentin the Yangtze Basin, 2021,30(2):382-396.
[29] 史旭榮,逯世澤,易愛(ài)華,等.全國(guó)2018~2019年秋冬季氣象條件變化對(duì)PM2.5影響研究 [J]. 中國(guó)環(huán)境科學(xué), 2020,40(7):2785-2793.
Shi X R, Lu S Z, Yi A H, et al. Impact of meteorological conditions on PM2.5in autumn and winter of 2018~2019 in key areas [J]. China Environmental Science, 2020,40(7):2785-2793.
[30] 潘 晨,康志明.2001~2019年氣象條件對(duì)江蘇省PM2.5分布的影響[J]. 環(huán)境科學(xué), 2022,43(2):649-662.
Pan C, Kang Z M. Impact of meteorological conditions on PM2.5in Jiangsu Province from 2001 to 2019 [J]. Environmental Science, 2022,43(2):649-662.
[31] 臧振峰,張鳳英,李永華,等.我國(guó)主要糧產(chǎn)區(qū)PM2.5、PM10時(shí)空分布特征及影響因素——以河南省為例[J]. 自然資源學(xué)報(bào), 2021,36(5): 1163-1175.
Zang Z F, Zhang F Y, Li Y H, et al. Spatiotemporal distribution and affecting factors of PM2.5and PM10in major grain producing areas in China: A case study of Henan province [J]. Journal of Natural Resources, 2021,36(5):1163-1175.
[32] Breiman. Random forests [J]. Mach Learn, 2001,2001,45(1)(-):5-32.
[33] DE Rumelhart, Hinton G E, Williams R J. Learning representations by backpropagating errors [J]. Nature, 1986,323(6088):533-536.
[34] Cortes C. Support-vector networks [J]. Machine Learning, 1995,20 (3):273-297.
[35] Hinton G E, Osindero S, Teh Y W. A fast learning algorithm for deep belief nets [J]. Neural Computation, 2014,18(7):1527-1554.
[36] Donkelaar A V, Martin R V, Li C, et al. Regional estimates of chemical composition of fine particulate matter using a combined geoscience-statistical method with information from satellites, models, and monitors [J]. Environmental Science and Technology, 2019,53(5): 2595-2611.
Simulation of daily PM2.5based on MODIS data and multi-machine learning method.
XU Fa-zhao, LI Jing*, CHU Xin-de, MAN Yuan-wei
(College of Geography and Environmental Science, Northwest Normal University, Lanzhou 730070, China)., 2022,42(6):2523~2529
In order to further understand the spatial distribution of PM2.5on the ground,based on the PM2.5measured data in 2019, MCD19A2 aerosol optical depth product of the Moderate Resolution Imaging Spectroradiometer (MODIS) at the L3 level, taking Shandong Province as the study area, and fully considering the factors including population, terrain, and weather. The daily PM2.5in 2019 was simulated by using the four machine learning algorithms of Random Forest (RF), Support Vector Regression (SVR), Back Propagation Neural Network (BPNN), and Deep Neural Networks (DNN). The result shows the RMSE and MAE values of the RF are 12.67 and 6.62, respectively, which are better than BPNN, SVR and DNN models. RF is most suitable for the daily PM2.5simulation in Shandong Province.
remote sensing;PM2.5;AOD;machine learning
X513
A
1000-6923(2022)06-2523-07
徐發(fā)昭(1998-),山東德州人,西北師范大學(xué)碩士研究生,主要從事生態(tài)環(huán)境與GIS應(yīng)用的研究.
2021-11-24
國(guó)家自然科學(xué)基金資助項(xiàng)目(41861013,42071089,41801052)
* 責(zé)任作者, 副教授, li_jinger@163.com