李富富,陳東湘,王院民,顏道浩,吳紹華
基于隨機(jī)森林與地統(tǒng)計(jì)預(yù)測(cè)城市土壤PAHs分布
李富富1,陳東湘3,王院民1,顏道浩1,吳紹華2,4*
(1.南京大學(xué)地理與海洋科學(xué)學(xué)院,江蘇 南京 210046;2.浙江財(cái)經(jīng)大學(xué)土地與城鄉(xiāng)發(fā)展研究院,浙江 杭州 310018;3.浙江財(cái)經(jīng)大學(xué)東方學(xué)院,浙江 杭州 314408;4.國(guó)土資源部城市土地資源監(jiān)測(cè)與仿真重點(diǎn)實(shí)驗(yàn)室,廣東 深圳 518034)
收集南京城區(qū)采樣點(diǎn)位置信息和環(huán)境變量等數(shù)據(jù),應(yīng)用地統(tǒng)計(jì)和隨機(jī)森林方法,以及兩種方法相結(jié)合分別預(yù)測(cè)土壤多環(huán)芳烴(polycyclic aromatic hydrocarbons, PAHs)含量,并比較不同方法預(yù)測(cè)精度.結(jié)果表明:隨機(jī)森林與地統(tǒng)計(jì)方法結(jié)合能大幅度提高城市土壤污染物制圖精度,整合克里金與隨機(jī)森林預(yù)測(cè)殘差模型擬合優(yōu)度2相比克里金插值法提高74.8%.PAHs空間制圖結(jié)果能夠較好擬合污染物的變化范圍,識(shí)別污染高值區(qū)與低值區(qū)的空間分布.隨機(jī)森林輸出特征重要性發(fā)現(xiàn)影響南京城區(qū)土壤PAHs分布的主控因子為土壤碳和土壤粒度以及工廠密度.本研究可為城市污染物高分辨率和高精度制圖以及污染防控治理提供參考.
城市土壤;多環(huán)芳烴;空間分布;地統(tǒng)計(jì);隨機(jī)森林
城市土壤作為污染物的源與匯,對(duì)城市生態(tài)環(huán)境質(zhì)量和人類健康具有重要影響[1].多環(huán)芳烴(PAHs)是一種土壤中常見(jiàn)的持久性有機(jī)污染物,具有三致毒性,在城鎮(zhèn)化進(jìn)程中城市土壤PAHs污染愈加嚴(yán)重[2].為了有效防控PAHs對(duì)人體和生態(tài)環(huán)境的危害,需要對(duì)PAHs含量和空間分布進(jìn)行研究.由于城市土壤的空間高度異質(zhì)性和污染來(lái)源的復(fù)雜多樣性[3-4],開(kāi)展土壤污染物空間分布高精度制圖有利于研究污染物排放、遷移以及累積特性,為制定污染物防控政策提供支持.
當(dāng)前對(duì)PAHs污染空間分布研究主要采用地統(tǒng)計(jì)方法和數(shù)理統(tǒng)計(jì)法.應(yīng)用地統(tǒng)計(jì)方法能直觀地觀察污染熱點(diǎn)區(qū)域.鄭一等[5]利用克里金插值法評(píng)價(jià)了天津表土多環(huán)芳烴含量,克里金法計(jì)算半變異函數(shù),描述了污染物在空間分布上的結(jié)構(gòu)性.由于城市中人類活動(dòng)強(qiáng)烈,污染物分布在局部變異也會(huì)很大,導(dǎo)致克里金插值結(jié)果精度并不高.而數(shù)理統(tǒng)計(jì)方法更多是用來(lái)提取PAHs主要成分譜信息,結(jié)合源指紋特征推斷PAHs來(lái)源,只能粗略對(duì)污染物高低值樣點(diǎn)進(jìn)行分類[6].傳統(tǒng)的空間制圖方法難以精細(xì)化表征城市土壤污染空間分布,因此需要在前人基礎(chǔ)上提出新的方法研究土壤PAHs空間分布.
研究表明土壤PAHs累積受到眾多源匯因子的影響.例如工廠廢棄物排放[7]、生物質(zhì)燃燒[8]、冶煉、煤炭加工[9]、城市交通排放[10]等源因子,以及大氣干濕沉降速率[11-12]、土壤有機(jī)碳和黑碳含量[13-14]、土壤粒度[15-16]等匯因子.同時(shí)有研究報(bào)道土壤pH值會(huì)影響土壤微生物活性和有機(jī)物吸附PAHs親和力進(jìn)而間接影響土壤PAHs累積[17],城市植被也會(huì)對(duì)PAHs累積過(guò)程產(chǎn)生直接或間接影響[18-21].利用這些環(huán)境因子或可更精確地預(yù)測(cè)土壤PAHs空間分布.隨機(jī)森林模型可以很好地處理非線性問(wèn)題[22],已經(jīng)應(yīng)用在地學(xué)領(lǐng)域,如土地利用分類[23]、土壤有機(jī)質(zhì)含量預(yù)測(cè)[24-25]、土壤氮元素預(yù)測(cè)[26].可利用隨機(jī)森林模型揭示環(huán)境因子與PAHs累積的非線性信息,而克里金法可以描述PAHs含量與空間位置關(guān)系,因此機(jī)器學(xué)習(xí)方法與地統(tǒng)計(jì)方法組合或可對(duì)PAHs空間分布做出高精度的預(yù)測(cè)[27].
本研究選擇南京市作為研究區(qū),采集土壤污染數(shù)據(jù)與環(huán)境變量數(shù)據(jù),驗(yàn)證隨機(jī)森林模型與地統(tǒng)計(jì)方法結(jié)合對(duì)土壤PAHs制圖精度,提出高空間變異的城市土壤PAHs制圖方法,識(shí)別環(huán)境因子對(duì)PAHs累積影響的重要性,為制定污染防控措施和進(jìn)一步研究PAHs累積過(guò)程提供理論參考.
圖1 研究區(qū)位置以及采樣點(diǎn)分布
本研究選取南京主城區(qū)作為研究區(qū)(31°56'~ 32°10'N,118°40'~118°58'E)(圖1).南京屬丘陵地區(qū),氣候類型為北亞熱帶濕潤(rùn)氣候,年均氣溫15.4℃,年均降水量為1106mm.全市森林覆蓋率為27.3%,綠化覆蓋率為44.2%.南京地區(qū)的土壤在北、中部廣大地區(qū)為黃棕壤,南部有小面積的紅壤.南京市重工業(yè)產(chǎn)值比重較大,電子設(shè)備制造業(yè)、化工制造業(yè)、汽車制造業(yè)、石油加工、煉焦業(yè)實(shí)現(xiàn)的工業(yè)總產(chǎn)值均超過(guò)億元.南京市主城區(qū)人為活動(dòng)劇烈,人口密度大,交通密集,是PAHs重要排放源.
采用網(wǎng)格布點(diǎn)法采集樣品,在研究區(qū)用五點(diǎn)法采集表層(0~5cm)土壤樣品 111個(gè),樣點(diǎn)分布如圖1.樣品在常溫條件下干燥,過(guò)20,60,100目篩保存于棕色玻璃瓶中,置于-4℃環(huán)境中待檢測(cè).
提取與凈化:將5g土樣與5g無(wú)水硫酸鈉混合均勻,用濾筒包裹后置于索式抽取器的抽濾筒中,在平底燒瓶中依次加入100mL的二氯甲烷和正己烷混合液(=1:1),2g活化的銅片,連續(xù)索式提取24個(gè)小時(shí);提取液在旋轉(zhuǎn)蒸發(fā)儀上濃縮至約2mL后,加入10ml正己烷,繼續(xù)濃縮至1~2mL.將濃縮后的提取液加入硅膠層析柱進(jìn)行分離凈化.采用正己烷濕法裝柱,依次裝入棉花,5g硅膠以及2cm的無(wú)水硫酸鈉;濃縮液上柱后,分別用15mL正己烷和50mL的二氯甲烷和正己烷混合液(=2:3)進(jìn)行淋洗,正己烷淋洗正構(gòu)烷烴后不收集,混合溶劑淋洗多環(huán)芳烴后收集處理.收集后的溶液用正己烷轉(zhuǎn)換溶劑后,用高純氮吹至1mL,裝入GC瓶,上機(jī)待測(cè).
儀器分析:用氣相色譜-質(zhì)譜聯(lián)用儀(Shimadzu QP2010Ultra)對(duì)濃縮液中的多環(huán)芳烴進(jìn)行定量分析.色譜柱為Rtx-5MS(長(zhǎng)度30m,內(nèi)徑0.5mm,涂層0.25mm),載氣為氦氣.采用不分流進(jìn)樣,進(jìn)樣量設(shè)定為1mL.接口和離子源的溫度分別設(shè)置成280,230℃.離子源采用EI模式,數(shù)據(jù)采集則選擇SIM模式.
質(zhì)量控制:樣品處理過(guò)程中,每6個(gè)樣品增加一個(gè)空白和基質(zhì)空白實(shí)驗(yàn);每12個(gè)樣品做一次重復(fù)實(shí)驗(yàn),如果偏差超過(guò)15%則重新測(cè)試.16種多環(huán)芳烴采用外標(biāo)法測(cè)定,標(biāo)準(zhǔn)曲線的溶液濃度依次為4,10, 50,100,400,800mg/L.通過(guò)添加標(biāo)樣的方法做回收率實(shí)驗(yàn),萘的平均回收率為73.8%,其他15種化合物平均回收率為84.5%~104.2%,符合環(huán)境樣品分析要求.
1.2.2 土壤其他指標(biāo)分析 土壤總碳采用重鉻酸鉀-硫酸消化法測(cè)定;酸處理去除碳酸鈣、硅酸鹽,氧化處理去除有機(jī)碳,干燥后用元素分析儀(CHN- O-Rapid)測(cè)定黑碳含量.土壤粒度(SOT)和pH值:土壤粒度采用英國(guó)馬爾文土壤顆粒激光粒度儀測(cè)定;土壤pH值采用電位法測(cè)定.
土壤PAHs排放、遷移、降解和累積受到多種因素的共同影響.本文將土壤總碳(TOC)、土壤黑炭(BC)、土壤粒度(SOT)、土壤pH值、非滲透系數(shù)(IMP)、葉面積指數(shù)(LAI)、工廠密度(PLA)作為環(huán)境變量,通過(guò)建立模型來(lái)預(yù)測(cè)土壤PAHs最終累積含量的空間分布.由百度地圖上抓取的南京市工廠點(diǎn)位數(shù)據(jù)進(jìn)行密度計(jì)算得到工廠密度.非滲透系數(shù)、葉面積指數(shù)通過(guò)遙感解譯獲得[28].所有環(huán)境變量進(jìn)行500m×500m空間參數(shù)化,為建模提供基礎(chǔ)數(shù)據(jù).
1.4.1 克里金法 空間制圖克里金法是基于區(qū)域化變量理論進(jìn)行空間插值的方法.克里金法基于采樣數(shù)據(jù)計(jì)算半方差函數(shù)來(lái)反映區(qū)域化變量結(jié)構(gòu)信息,根據(jù)待估計(jì)點(diǎn)有限鄰域內(nèi)采樣數(shù)據(jù),考慮待估計(jì)點(diǎn)與采樣點(diǎn)的空間關(guān)系,滿足二階平穩(wěn)假設(shè)條件下對(duì)待估計(jì)點(diǎn)進(jìn)行無(wú)偏最優(yōu)估計(jì).本研究利用普通克里金法繪制土壤PAHs空間分布圖.
1.4.2 隨機(jī)森林空間制圖 隨機(jī)森林是一種以bagging方法集成CART決策樹(shù)進(jìn)行分類或回歸的機(jī)器學(xué)習(xí)集成算法.本研究應(yīng)用Python中scikit- learn庫(kù)建立隨機(jī)森林模型,參數(shù)n_estimators=500, max_features=0.33.本研究PAHs含量變異較大,不符合正態(tài)分布,因此采用分層隨機(jī)抽樣將數(shù)據(jù)集分為訓(xùn)練數(shù)據(jù)集與驗(yàn)證數(shù)據(jù)集.模型建立后將參數(shù)化環(huán)境變量數(shù)據(jù)輸入模型繪制土壤PAHs空間分布圖.
1.4.3 整合隨機(jī)森林與克里金法 克里金法考慮了PAHs含量空間位置的關(guān)系.隨機(jī)森林模型考慮了PAHs在環(huán)境中累積與環(huán)境因子的關(guān)系.整合克里金法與隨機(jī)森林法或可更好地預(yù)測(cè)城市土壤中多環(huán)芳烴含量.本研究采用模型平均與殘差補(bǔ)償來(lái)整合兩種模型.模型平均即將兩種方法預(yù)測(cè)的結(jié)果進(jìn)行簡(jiǎn)單平均作為最終結(jié)果.殘差補(bǔ)償即先應(yīng)用克里金插值預(yù)測(cè),然后將預(yù)測(cè)結(jié)果的殘差作為因變量,環(huán)境變量為自變量建立隨機(jī)森林模型,最后將隨機(jī)森林預(yù)測(cè)結(jié)果與克里金插值結(jié)果進(jìn)行相加得到最終預(yù)測(cè)結(jié)果.將參數(shù)化環(huán)境變量數(shù)據(jù)分別輸入整合模型繪制土壤PAHs空間分布圖.
1.4.4 精度評(píng)價(jià) 將驗(yàn)證集數(shù)據(jù)應(yīng)用于4種模型來(lái)評(píng)估模型精度,即克里金插值模型(K),隨機(jī)森林模型(RF),兩種模型的均值模型(K-RFaverage),殘差補(bǔ)償模型(RFerr+K).計(jì)算每種模型預(yù)測(cè)的平均誤差(ME)、平均絕對(duì)誤差(MAE)、均方根誤差(RMSE)和決定系數(shù)(),ME越接近0表明估計(jì)越無(wú)偏.MAE和RMSE越小表明預(yù)測(cè)誤差越小;越接近于1表明模型擬合優(yōu)度越高.
隨機(jī)森林模型特征重要性函數(shù)可以用來(lái)識(shí)別影響區(qū)域內(nèi)PAHs累積的主控因子.特征重要性函數(shù)通過(guò)計(jì)算環(huán)境變量對(duì)樣本集進(jìn)行分割后降低預(yù)測(cè)目標(biāo)的不確定性大小,用Gini index減小值表示,Gini index減少值越大,則因子重要性越大[29].因子重要性實(shí)質(zhì)上是對(duì)PAHs分布預(yù)測(cè)結(jié)果貢獻(xiàn)大小的統(tǒng)計(jì).比如土壤碳、粒度和工廠密度等因子對(duì)預(yù)測(cè)結(jié)果貢獻(xiàn)大,說(shuō)明PAHs的累積與這些因子有關(guān),通過(guò)前人研究結(jié)果可知工廠排放是PAHs累積的源因子[30],土壤碳、粒度是匯因子[16,31].
表1 研究區(qū)采樣點(diǎn)土壤PAHs含量描述性統(tǒng)計(jì)
研究區(qū)內(nèi)采樣點(diǎn)總計(jì)111個(gè),分層隨機(jī)抽樣86個(gè)為訓(xùn)練樣本,25個(gè)為測(cè)試樣本(圖1).利用SPSS進(jìn)行數(shù)據(jù)描述性統(tǒng)計(jì)分析.由表1可以看出,訓(xùn)練集與驗(yàn)證集極大值、極小值、平均值較為統(tǒng)一.訓(xùn)練集和驗(yàn)證集的變異系數(shù)分別為131%和155%,說(shuō)明土壤多環(huán)芳烴含量變異很大.根據(jù)偏度值和峰度值可以判斷,訓(xùn)練集和驗(yàn)證集均為非正態(tài)分布.克里金插值雖然不嚴(yán)格要求數(shù)據(jù)呈正態(tài)分布,但當(dāng)數(shù)據(jù)偏離正態(tài)分布太遠(yuǎn)可能插值效果不理想.隨機(jī)森林則對(duì)數(shù)據(jù)分布特征沒(méi)有要求.分層隨機(jī)抽樣保證了訓(xùn)練集和驗(yàn)證集數(shù)據(jù)分布的基本一致,因此模型建立與評(píng)價(jià)可靠性高.
2.2.1 克里金模型插值分析 使用ArcMap地統(tǒng)計(jì)模塊選擇普通克里金法插值分析.計(jì)算得半方差函數(shù)幾乎為一條水平直線,塊金值為0.19,基臺(tái)值為0.20,塊金值與基臺(tái)值的比值大于0.95,表明其空間自相關(guān)性較弱,插值的準(zhǔn)確性較低.
2.2.2 隨機(jī)森林訓(xùn)練集結(jié)果分析 使用Python3.6中scikit-learn庫(kù)建立隨機(jī)森林模型.第一個(gè)隨機(jī)森林模型為完全隨機(jī)森林模型(RF),以城市土壤PAHs為因變量.第二個(gè)模型為殘差隨機(jī)森林模型(RFerr),克里金插值預(yù)測(cè)值與實(shí)測(cè)值的殘差為因變量.在訓(xùn)練集上隨機(jī)森林顯示出很好的擬合優(yōu)度,決定系數(shù)為0.949,對(duì)于克里金插值殘差的訓(xùn)練集,決定系數(shù)達(dá)到了0.957(圖2).
2.2.3 模型精度評(píng)價(jià) 觀察模型評(píng)價(jià)的4個(gè)指標(biāo)(表2),從ME和2數(shù)值上看隨機(jī)森林模型顯示出最好的預(yù)測(cè)精度;而MAE和RMSE在數(shù)值上顯示RFerr+K模型是最好的預(yù)測(cè)模型.ME表示預(yù)測(cè)結(jié)果隨機(jī)誤差的平均值,由于隨機(jī)森林模型在預(yù)測(cè)低值區(qū)和高值區(qū)時(shí)存在系統(tǒng)性偏差,即存在低值區(qū)被高估和高值區(qū)被低估的現(xiàn)象.對(duì)于南京地區(qū)來(lái)說(shuō)當(dāng)土壤多環(huán)芳烴均值為750mg/kg[32],環(huán)境變量對(duì)其無(wú)法進(jìn)一步精確區(qū)分;當(dāng)高值大于4800mg/kg時(shí),受樣點(diǎn)數(shù)影響,機(jī)器學(xué)習(xí)效果較差(圖4b).因此ME不能說(shuō)明隨機(jī)森林模型比RFerr+K模型精度更高.2是預(yù)測(cè)值回歸平方和與總離差平方和之比,反映了自變量對(duì)因變量的解釋程度,2接近于1,觀察點(diǎn)在回歸直線附近越密集.由于隨機(jī)森林模型在PAHs含量中值區(qū)預(yù)測(cè)效果很好,因此2較高.但是隨機(jī)森林在低值區(qū)和高值區(qū)預(yù)測(cè)存在偏向相反的系統(tǒng)性誤差,雖然整體上2顯示回歸擬合較好,但是不能認(rèn)定其精度更高,還需要結(jié)合樣點(diǎn)總體空間分布預(yù)測(cè)精度進(jìn)行判斷.
a為隨機(jī)森林模型在PAHs含量訓(xùn)練集上預(yù)測(cè)結(jié)果;b為隨機(jī)森林模型在克里金殘差訓(xùn)練集上預(yù)測(cè)結(jié)果
RFerr+K模型評(píng)估結(jié)果顯示其絕對(duì)誤差(MAE)和均方根誤差(RMSE)最小,模型精度最高.2較高也表明了其整體上可以較好地解釋因變量的變異,但是僅依靠這些統(tǒng)計(jì)指標(biāo)無(wú)法反映模型在污染高值區(qū)與低值區(qū)空間分布預(yù)測(cè)精度.因此結(jié)合圖3、圖4對(duì)樣點(diǎn)總體空間分布的模型精度進(jìn)行比較.由圖3可以看出隨機(jī)森林模型在中值區(qū)2.8~3.5擬合很好,而高值區(qū)低值區(qū)有較大偏差;RFerr+K模型在1.7~4.0高低值區(qū)整體上有較好的預(yù)測(cè)精度.圖4中隨機(jī)森林模型最低值預(yù)測(cè)結(jié)果為750mg/kg,而最高值僅為4800mg/kg,與實(shí)測(cè)值24,17043mg/kg有較大差距;而RFerr+K模型最低值預(yù)測(cè)結(jié)果為0mg/kg,而最高值為8325mg/kg,在空間分布預(yù)測(cè)上準(zhǔn)確度和精細(xì)度都有很大提升.
因此RFerr+K模型可以整合環(huán)境變量以及空間結(jié)構(gòu)信息,為0.687相比克里金插值法提高74.8%,同時(shí)對(duì)PAHs高值區(qū)和低值區(qū)有較好的識(shí)別以及提升整體上預(yù)測(cè)精度.機(jī)器學(xué)習(xí)算法可以處理土壤PAHs含量與影響因子之間的非線性關(guān)系,結(jié)合地統(tǒng)計(jì)方法可提高制圖精度.
表2 模型精度評(píng)價(jià)
圖3 各模型驗(yàn)證集擬合優(yōu)度
a為克里金插值模型驗(yàn)證集擬合優(yōu)度;b為隨機(jī)森林模型驗(yàn)證集擬合優(yōu)度;c為RFerr+K模型驗(yàn)證集擬合優(yōu)度;d為K-RF average模型驗(yàn)證集擬合優(yōu)度,陰影部分表示預(yù)測(cè)精度置信水平為95%的置信區(qū)間
各模型建立完成后輸入相關(guān)參數(shù)進(jìn)行模型制圖,結(jié)果如下(圖4).從整體上看4種模型制圖具有一定一致性,土壤PAHs含量高值區(qū)均位于研究區(qū)西南部.克里金模型和隨機(jī)森林模型由于考慮的影響因素不同,最終在預(yù)測(cè)圖中體現(xiàn)出差異.克里金模型通過(guò)半變異函數(shù)定量化PAHs分布的空間結(jié)構(gòu),預(yù)測(cè)高低值分布范圍較廣.隨機(jī)森林模型通過(guò)環(huán)境變量與PAHs含量的非線性關(guān)系預(yù)測(cè)中值區(qū)精細(xì)度較高.對(duì)PAHs高值區(qū)和低值區(qū)空間分布識(shí)別以及整體精度上RFerr+K模型顯示了良好的預(yù)測(cè)效果.如圖5所示,隨機(jī)森林輸出因子重要性前5位分別為土壤總碳(TOC)、土壤黑碳(BC)、土壤粒度(SOT)、工廠密度(PLA)、土壤pH值,說(shuō)明隨機(jī)森林模型綜合了這些環(huán)境變量信息比較精細(xì)地預(yù)測(cè)PAHs含量.而葉面積指數(shù)(LAI)和非滲透系數(shù)(IMP)難以精細(xì)表征出植被和降雨徑流、入滲對(duì)PAHs積累的關(guān)系.需要更合適的指標(biāo).
圖4 不同模型土壤PAHs空間分布預(yù)測(cè)
a為克里金插值模型預(yù)測(cè)圖;b為隨機(jī)森林模型預(yù)測(cè)圖;c為K-RF average模型預(yù)測(cè)圖;d為RFerr+K模型預(yù)測(cè)圖
圖5 因子重要性評(píng)價(jià)
隨機(jī)森林特征重要性函數(shù)表示該環(huán)境變量對(duì)預(yù)測(cè)結(jié)果的相對(duì)貢獻(xiàn)值,隨機(jī)森林對(duì)因子重要性評(píng)價(jià)可以識(shí)別PAHs分布主控因子.結(jié)合前人研究確定PAHs源與匯,以便于更深入地研究該種因素影響過(guò)程、機(jī)理.輸出因子重要性結(jié)果如圖5,土壤總碳(TOC)、黑碳(BC)、土壤粒度(SOT)、工廠密度(PLA)排在前列,說(shuō)明這些因子是PAHs累積的主控因子.
研究表明土壤碳對(duì)PAHs的物理化學(xué)行為、生物過(guò)程有顯著的影響,如有機(jī)質(zhì)吸附限制了土壤中PAHs的降解是其富集的主要影響因子[14,31];黑碳具有高度芳香化結(jié)構(gòu),生物化學(xué)和熱穩(wěn)定性好,具有較大的表面積,能使極性或非極性有機(jī)化合物線性吸附發(fā)生偏離[33].土壤粉粒對(duì)PAHs吸附有很大影響;粗粉砂中有機(jī)質(zhì)對(duì)PAHs富集能力很強(qiáng)[34].工業(yè)企業(yè)點(diǎn)位與PAHs排放量密切相關(guān),一些焦化企業(yè)是土壤PAHs主要排放源[35].本研究區(qū)企業(yè)密度高值區(qū)與污染高值區(qū)分布趨于一致.土壤pH值對(duì)PAHs預(yù)測(cè)也有相當(dāng)影響,土壤pH值可能影響腐殖質(zhì)的極性,從而影響腐殖質(zhì)對(duì)PAHs親和力.葉面積指數(shù)和非滲透系數(shù)2個(gè)指標(biāo)對(duì)PAHs分布預(yù)測(cè)貢獻(xiàn)較小,可能由于其難以表征植被與降雨徑流、入滲對(duì)PAHs累積過(guò)程的影響.隨機(jī)森林因子重要性排序結(jié)果與前人研究揭示影響PAHs排放源、吸附、遷移、降解等過(guò)程的環(huán)境變量基本相符,表明利用隨機(jī)森林特征重要性函數(shù)可以識(shí)別環(huán)境因子對(duì)土壤多環(huán)芳烴富集影響的重要程度.
3.1 以南京市作為研究區(qū),建立各預(yù)測(cè)模型.通過(guò)精度驗(yàn)證發(fā)現(xiàn)RFerr+K模型能夠有效整合環(huán)境變量以及空間結(jié)構(gòu)信息,對(duì)PAHs污染高值區(qū)和低值區(qū)有較好的識(shí)別以及提升整體預(yù)測(cè)精度.
3.2 因子重要性評(píng)價(jià)結(jié)果表明土壤總碳、黑碳和土壤粒度是影響PAHs累積的匯因子,工廠排放是PAHs累積的源因子.
[1] Paterson E, Sanka M, Clark L. Urban soils as pollutant sinks — a case study from aberdeen, Scotland [J]. Applied Geochemistry, 1996,11(1): 129-131.
[2] 姚 宏,張士超,劉明麗,等.基于城鎮(zhèn)化進(jìn)程表層土壤多環(huán)芳烴來(lái)源解析及風(fēng)險(xiǎn)評(píng)價(jià)[J]. 環(huán)境科學(xué), 2018,39(2):889-898. Yao H, Zhang S C, Liu M L, et al. Sources and risk assessment of polycyclic aromatic hydrocarbons from the urbanization process of topsoil [J]. Environmental Science, 2018,39(2):889-898.
[3] Yunker, Mark B, Macdonald, et al. PAHs in the fraser river basin: A critical appraisal of pah ratios as indicators of pah source and composition [J]. Organic Geochemistry, 2002,33(4):489-515.
[4] 倪進(jìn)治,駱永明,魏 然,等.長(zhǎng)江三角洲地區(qū)土壤環(huán)境質(zhì)量與修復(fù)研究V.典型地區(qū)農(nóng)業(yè)土壤中多環(huán)芳烴的污染狀況及其源解析[J]. 土壤學(xué)報(bào), 2008,45(2):234-239. Ni J Z, Luo Y M, Wei R, et al. Soil environmental quality and remediation in yangtze river delta region V. pollution status and sources of polycyclic aromatic hydrocarbons in agricultural soils of typical districts [J]. Acta Pedologica Sinica, 2008,45(2):234-239.
[5] 鄭 一,王學(xué)軍,劉瑞民,等.天津地區(qū)土壤多環(huán)芳烴的克里格插值與污染評(píng)價(jià)[J]. 中國(guó)環(huán)境科學(xué), 2003,23(2):113-116. Zheng Y, Wang X J, Liu R M, et al. Kriging interpolation and pollution assessment of pahs in soil in tianjin area [J]. China Environmental Science, 2003,23(2):113-116.
[6] 劉 庚,畢如田,王世杰,等.某焦化場(chǎng)地土壤多環(huán)芳烴污染數(shù)據(jù)的統(tǒng)計(jì)特征[J]. 應(yīng)用生態(tài)學(xué)報(bào), 2013,24(6):1722-1728. Liu G, Bi R T, Wang S J, et al. Statistical characteristic analysis of soil PAHs in a coking contaminated site of China [J]. Chinese Journal of Applied Ecology, 2013,24(6):1722-1728.
[7] 朱崗輝,孫 璐,廖曉勇,等.郴州工業(yè)場(chǎng)地重金屬和PAHs復(fù)合污染特征及風(fēng)險(xiǎn)評(píng)價(jià)[J]. 地理研究, 2012,31(5):831-839. Zhu G H, Sun L, Liao X Y, et al. Combined pollution of heavy metals and PAHs and its risk assessment in industrial sites of Chenzhou city [J]. Geographical Research, 2012,31(5):831-839.
[8] Cao H, Chao S, Qiao L, et al. Urbanization-related changes in soil pahs and potential health risks of emission sources in a township in southern jiangsu, China [J]. Science of the Total Environment, 2016, 575:692.
[9] 薛荔棟,郎印海,劉愛(ài)霞,等.黃海近岸表層沉積物中多環(huán)芳烴來(lái)源解析[J]. 生態(tài)環(huán)境學(xué)報(bào), 2008,17(4):1369-1375. Xue L D, Lang Y H, Liu A X, et al. Source analysis of polycyclic aromatic hydrocarbons in coastal surface sediments of the yellow sea [J]. Acta ecologica sinica, 2008,17(4):1369-1375.
[10] Reis A P M, Shepherd T, Nowell G, et al. Source and pathway analysis of lead and polycyclic aromatic hydrocarbons in lisbon urban soils [J]. Science of the Total Environment, 2016,573:324-336.
[11] Maisto G, Nicola D E, Lovien Pet al. Pahs and trace elements in volcanic urban and natural soils [J]. Geoderma, 2006,136(1):20-27.
[12] Wilcke W. Global patterns of polycyclic aromatic hydrocarbons (pahs) in soil [J]. Geoderma, 2007,141(3/4):0-166.
[13] Liu S D, Xia X H, Zhai Y W, et al. Black carbon (bc) in urban and surrounding rural soils of Beijing, china: Spatial distribution and relationship with polycyclic aromatic hydrocarbons (pahs) [J]. Chemosphere, 2011,82(2):223-228.
[14] Yang Y, Tao S, Zhang N, et al. The effect of soil organic matter on fate of polycyclic aromatic hydrocarbons in soil: A microcosm study [J]. Environmental Pollution, 2010,158(5):1768-1774.
[15] Li H, Chen J, Wei W, et al. Distribution of polycyclic aromatic hydrocarbons in different size fractions of soil from a coke oven plant and its relationship to organic carbon content [J]. Journal of Hazardous Materials, 2010,176(1):729-734.
[16] Liao X, Ma D, Yan X, et al. Distribution pattern of polycyclic aromatic hydrocarbons in particle-size fractions of coking plant soils from different depth [J]. Environmental Geochemistry & Health, 2013, 35(3):271-282.
[17] Pietri J C A, Brookes P C. Relationships between soil ph and microbial properties in a uk arable soil [J]. Soil Biology & Biochemistry, 2008, 40(7):1856-1861.
[18] Kiss M, Takács á, Pogácsás R, et al. The role of ecosystem services in climate and air quality in urban areas: Evaluating carbon sequestration and air pollution removal by street and park trees in szeged (hungary) [J]. Moravian Geographical Reports, 2015,23(3):36.
[19] Komprdová K, Komprda J, Men?ík L, et al. The influence of tree species composition on the storage and mobility of semivolatile organic compounds in forest soils [J]. Science of the Total Environment, 2016,553:532-540.
[20] Selmi W, Weber C, Rivière E, et al. Air pollution removal by trees in public green spaces in strasbourg city, france [J]. Urban Forestry & Urban Greening, 2016,17:192-201.
[21] Simonich S L, Hites R A. Vegetation-atmosphere partitioning of polycyclic aromatic hydrocarbons [J]. Environmental Science & Technology, 1994,28(5):939.
[22] 方匡南,吳見(jiàn)彬,朱建平,等.隨機(jī)森林方法研究綜述[J]. 統(tǒng)計(jì)與信息論壇, 2011,26(3):32-38. Fang Q N, Wu J B, Zhu J P, et al. Review of random forest methods [J]. Statistics and information BBS, 2011,26(3):32-38.
[23] 郭玉寶,池天河,彭 玲,等.利用隨機(jī)森林的高分一號(hào)遙感數(shù)據(jù)進(jìn)行城市用地分類[J]. 測(cè)繪通報(bào), 2016,(5):73-76. Guo Y B, ChiT H, PengL, et al. Classification of urban land using gaofen remote sensing data from random forest [J]. Bulletin of surveying and mapping, 2016,(5):73-76.
[24] 任 麗,楊聯(lián)安,王 輝,等.基于隨機(jī)森林的蘋果區(qū)土壤有機(jī)質(zhì)空間預(yù)測(cè)[J]. 干旱區(qū)資源與環(huán)境, 2018,32(8):144-149. Ren L, Yang L A, Wang H, et al. Spatial prediction of soil organic matter in apple region based on random forest [J]. Resources and environment in arid region, 2018,32(8):144-149.
[25] 王茵茵,齊雁冰,陳 洋,等.基于多分辨率遙感數(shù)據(jù)與隨機(jī)森林算法的土壤有機(jī)質(zhì)預(yù)測(cè)研究[J]. 土壤學(xué)報(bào), 2016,53(2):342-354. Wang Y Y, Qi Y B, Chen Y, et al. Prediction of soil organic matter based on multi-resolution remote sensing data and random forest algorithm [J]. Acta agronomica sinica, 2016,53(2):342-354.
[26] 郭澎濤,李茂芬,羅 微,等.基于多源環(huán)境變量和隨機(jī)森林的橡膠園土壤全氮含量預(yù)測(cè)[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2015,31(5):194-202. Guo P T, Li M F, Luo W, et al. Prediction of soil total nitrogen content in rubber plantations based on multi-source environmental variables and random forests [J]. Acta agriculturae sinica, 2015,31(5):194-202.
[27] Li J, Heap A D, Potter A, et al. Application of machine learning methods to spatial interpolation of environmental variables [J]. Environmental Modelling & Software, 2011,26(12):1647-1659.
[28] 李 靜,柳欽火,尹高飛,等.中國(guó)-東盟1km分辨率葉面積指數(shù)數(shù)據(jù)集(2013) [DB/OL]. 全球變化科學(xué)研究數(shù)據(jù)出版系統(tǒng), 2015. Li J, Liu Q H, Yin G F, et al. China - asean leaf area index data set with 1km resolution (2013) [DB/OL]. Global change science research data publishing system, 2015.
[29] 李 航.統(tǒng)計(jì)學(xué)習(xí)方法[M]. 北京:清華大學(xué)出版社, 2012:69-72. Li H. Methods of statistical learning [M]. Beijing: TsinghuaUniversity Press, 2012:69-72.
[30] Li B, Zhou S, Wang T, et al. An improved gridded polycyclic aromatic hydrocarbon emission inventory for the lower reaches of the yangtze river delta region from 2001 to 2015 using satellite data. Journal of Hazardous Materials, 2018,360:329-339.
[31] Nam J J, Thomas G O, Jaward F M, et al. Pahs in background soils from western europe: Influence of atmospheric deposition and soil organic matter[J]. Chemosphere, 2008,9(70):1596-1602.
[32] 張俊葉,俞 菲,俞元春.中國(guó)主要地區(qū)表層土壤多環(huán)芳烴含量及來(lái)源解析[J]. 生態(tài)環(huán)境學(xué)報(bào), 2017,26(6):1059-1067. Zhang J Y, Yu F, Yu Y C. analysis of polycyclic aromatic hydrocarbons (pahs) content and source in surface soil of major regions in China [J]. Acta ecologica sinica, 2017,26(6):1059-1067.
[33] Yang Y, Zhang N, Xue M, et al. Impact of soil organic matter on the distribution of polycyclic aromatic hydrocarbons (pahs) in soils [J]. Environmental Pollution, 2010,158(6):2170-2174.
[34] Ni J Z, Luo Y M, Wei R, et al. Distribution of polycyclic aromatic hydrocarbons in particle-size separates and density fractions of typical agricultural soils in the yangtze river delta, east china [J]. European Journal of Soil Science, 2008,59(6):1020-1026.
[35] Li B, Wang J, Wu S, et al. New method for improving spatial allocation accuracy of industrial energy consumption and implications for polycyclic aromatic hydrocarbon emissions in china [J]. Environmental Science & Technology, 2019,53(8):4326-4334.
Distribution prediction of soil PAHs based on random forest and geostatistics methods in urban area.
LI Fu-fu1, CHEN Dong-xiang3, WANG Yuan-min1, YAN Dao-hao1, WU Shao-hua2,4*
(1.School of Geography and Ocean science, Nanjing university, Nanjing 210046, China;2.Institute of land and urban-rural development, Zhejiang university of Finance & Economics;Hangzhou 310018, China;3.School of Dongfang, Zhejiang university of Finance & Economics, Hangzhou 314408;4.The Key Laboratory of Urban Land Resources Monitoring and Simulation, Ministry of Land and Resources, Shenzhen 518034, China)., 2019,39(12):5240~5247
Based on the locational and environmental vairables collected at sampling points in Nanjing city, the Geostatistics and Random forest models were combined to predict the distribution of soil PAHs. Results showed that combination of these two could improve the prediction accuracy of PAHs in the research area. The model fitness achieved by the combined model was 74.8% higher than that from the traditional Kriging method. The generated map also characterized the spatial variation pattern better, and identified the high and low polluted areas. The importance of environmental variables in the output from the random forest model showed that soil carbon, soil texture and plant density were the main controlling factors for PAHS distribution. This study could provide a methodology framework for high-resolution and high-precision mapping of urban pollutants, such as PAHs.(部分單詞間缺少空格)
urban soil;PAHs;spatial distribution;geostatistics;random forest
X53
A
1000-6923(2019)12-5240-08
李富富(1996-),男,河南信陽(yáng)人,南京大學(xué)碩士研究生,主要從事城市土壤與環(huán)境研究.
2019-05-07
國(guó)家自然科學(xué)基金資助項(xiàng)目(41671085);國(guó)土資源部城市土地資源監(jiān)測(cè)與仿真重點(diǎn)實(shí)驗(yàn)室開(kāi)放基金資助課題(KF201803064)
* 責(zé)任作者, 教授, shaohua@zufe.edu.cn