高 博,陳 響,單仔赫,韓喜越,單延龍,尹賽男,于 渤
(北華大學(xué) 北華大學(xué)森林草原防滅火科技創(chuàng)新中心,吉林 吉林 132013)
林火(森林火災(zāi))是1種突發(fā)性強、發(fā)生面廣、危害性大的自然災(zāi)害,能夠嚴(yán)重破壞森林生態(tài)系統(tǒng)[1]。目前,大面積森林火災(zāi)已被聯(lián)合國列入世界8大自然災(zāi)害之中[2]。對于林火控制,預(yù)防大于撲救[3],林火預(yù)測一直是相關(guān)科研人員和森林防火工作者關(guān)注重點。林火預(yù)測可分為:火險天氣預(yù)測、林火發(fā)生預(yù)測和林火行為預(yù)測,其中林火發(fā)生預(yù)測可以預(yù)測某時間段、地區(qū)內(nèi)林火發(fā)生的次數(shù)和概率。相比于火險天氣預(yù)測,林火發(fā)生預(yù)測除了受氣象因素影響外,還受可燃物、地形、人類活動等因素影響。相關(guān)森林防火部門可根據(jù)影響林火發(fā)生的驅(qū)動因子等參數(shù)變化規(guī)律,準(zhǔn)確評估林火發(fā)生的概率和風(fēng)險,制定相應(yīng)預(yù)防措施,該方法對林火預(yù)防具有重要指導(dǎo)意義[4]。
林火發(fā)生預(yù)測多通過數(shù)學(xué)和統(tǒng)計學(xué)方法,建立林火驅(qū)動因子與林火發(fā)生概率之間關(guān)系的預(yù)測模型,從而預(yù)測林火發(fā)生[5-6]。近年,國內(nèi)外學(xué)者對林火發(fā)生預(yù)測模型展開一系列研究,由于不同地區(qū)氣象、地形、植被、人類活動等條件不同,馬文苑等[6]、Tomaz等[7]、Vilar等[8]、蔡奇均等[9],基于Logistic回歸模型、地理加權(quán)回歸模型、隨機森林算法等分別建立區(qū)域林火發(fā)生預(yù)測模型,同時指出地形、植被、氣象、人為等因子是影響林火發(fā)生的主要驅(qū)動因子。此外,Lahaye等[10]、潘登等[11]將加拿大森林火險天氣指數(shù)系統(tǒng)與林火發(fā)生預(yù)測相結(jié)合,利用該系統(tǒng)相關(guān)指標(biāo)對林火發(fā)生概率進行預(yù)測,研究發(fā)現(xiàn)FFMC、DMC、DC均可作為林火發(fā)生預(yù)測的主要影響因子。
大興安嶺地區(qū)是我國北方林火多發(fā)區(qū)。近年,該地區(qū)氣候條件復(fù)雜,林相退化、林分質(zhì)量下降,農(nóng)耕、旅游等人員流動增大,森林防火工作形勢日趨嚴(yán)峻[12]。目前我國對林火預(yù)測的研究大多基于火險氣象指數(shù)開展,但林火發(fā)生過程較為復(fù)雜,受多種條件影響,尤其在大空間尺度條件上,所以使用多種類型數(shù)據(jù),綜合分析不同驅(qū)動因子對林火發(fā)生的影響,有助于提高預(yù)測精度和普適性。由于長時間跨度的火災(zāi)數(shù)據(jù)獲取存在一定困難,所以衛(wèi)星遙感熱點數(shù)據(jù)代替火點數(shù)據(jù)被應(yīng)用在預(yù)測模型建立中[6,11,13],但經(jīng)處理后的熱點數(shù)據(jù)與實際記錄的火點數(shù)據(jù)相比仍存在一定差異,這將直接影響預(yù)測模型準(zhǔn)確性[13]。本文根據(jù)大興安嶺地區(qū)歷史森林火災(zāi)資料,結(jié)合地形因子、氣象因子和人為因子,基于Logistic回歸模型建立大興安嶺地區(qū)林火發(fā)生概率預(yù)測模型,繪制不同季節(jié)林火發(fā)生概率分布圖并對該地區(qū)森林火險等級進行劃分,研究結(jié)果可為該地區(qū)林火預(yù)測提供相關(guān)參考方法。
大興安嶺林區(qū)位于我國北部,是面積最大的原始林區(qū)[14]。本研究區(qū)域位于黑龍江省大興安嶺地區(qū),該地區(qū)南北向距離超過東西向,且北寬南窄,地理坐標(biāo)介于東經(jīng)121°12′~127°0′之間,北緯50°10′~53°33′之間,北面與俄羅斯隔江相望,東南與黑龍江省黑河市嫩江縣接壤,西南與內(nèi)蒙古自治區(qū)鄂倫春族自治旗毗鄰,西北與內(nèi)蒙古自治區(qū)額爾古納左旗為界。該地區(qū)屬寒溫帶大陸性季風(fēng)氣候,最低溫度-52.3 ℃,年降水量428.6~526.8 mm,全年無霜期80~110 d[15],森林覆蓋率約64.59%。該地區(qū)典型林型包括:草類落葉松林、興安杜鵑落葉松林、偃松落葉松林、杜香落葉松林、白樺林、山楊林等。主要樹種有:興安落葉松、柞樹、白樺、山楊等[16]。
本文火點數(shù)據(jù)源于大興安嶺地區(qū)1997—2017年歷史火災(zāi)資料(由黑龍江省森林草原防滅火指揮部辦公室提供),剔除經(jīng)緯度錯誤火點和部分氣象數(shù)據(jù)缺失火點后,共745個火點用于建模。在火點周圍建立半徑為500 m圓形緩沖區(qū),在去除緩沖區(qū)的大興安嶺地區(qū)矢量地圖范圍后,按火點數(shù)1.5倍創(chuàng)建隨機點[17-18],共1 097個非火點用于建模。
氣象數(shù)據(jù)來自中國氣象數(shù)據(jù)共享網(wǎng)[19],整理并統(tǒng)計1997—2017年大興安嶺地區(qū)逐日氣象數(shù)據(jù),并對每個火點和非火點進行氣象數(shù)據(jù)賦值。
地形數(shù)據(jù)來源于地理空間數(shù)據(jù)云[20],空間分辨率為30 m。使用ArcGIS軟件,基于DEM數(shù)據(jù)生成“坡度”和“坡向”圖層后,使用“提取分析”工具提取火點、非火點對應(yīng)海拔、坡度和坡向。
人為因子數(shù)據(jù)來源于全國地理信息資源目錄服務(wù)系統(tǒng)的1∶100萬全國基礎(chǔ)地理數(shù)據(jù)庫[21]。使用ArcGIS軟件“鄰域分析”計算每個火點、非火點到居民點、鐵路和公路的距離后,使用“提取分析”工具為火點和非火點進行賦值。
選用地形數(shù)據(jù)、人為因子數(shù)據(jù)和氣象數(shù)據(jù),共19個自變量作為林火發(fā)生的初始驅(qū)動因子,為消除各因子間不同量綱對最終結(jié)果的影響,建模前對數(shù)據(jù)進行標(biāo)準(zhǔn)化處理,然后使用方差膨脹因子(Variance Inflation Factor,VIF)對初始因子進行多重共線性診斷,剔除存在多重共線性變量(VIF>10)以提高模型精度,篩選出主要林火驅(qū)動因子,建立林火發(fā)生預(yù)測模型。
利用Logistic回歸模型對大興安嶺地區(qū)林火發(fā)生概率預(yù)測進行研究。Logistic回歸模型因變量取值不連續(xù),可以是2項或多項分類,其自變量可以是連續(xù)變量,也可以是分類變量。
假設(shè)林火發(fā)生概率為P,林火不發(fā)生概率為(1-P),模型關(guān)系如式(1)所示:
(1)
式中:β0為常量;自變量xn為篩選出的各林火驅(qū)動因子;βn為各自變量系數(shù)。
將剔除多重共線性后篩選出的主要林火驅(qū)動因子引入Logistic回歸模型,并將林火數(shù)據(jù)劃分為60%的建模樣本和40%的驗證樣本,使用建模樣本建立大興安嶺地區(qū)林火發(fā)生概率預(yù)測模型,使用驗證樣本驗證預(yù)測模型準(zhǔn)確性。
使用受試者工作特征曲線(receiver operating characteristic,ROC)進行模型精度評價及閾值確定。ROC曲線下面積值(area under the curve,AUC)取值范圍0.5~1,AUC值越大,模型敏感度和特異性越好,擬合程度也越好。利用模型敏感度和特異性計算約登指數(shù)(約登指數(shù)=敏感度+特異性-1),通過約登指數(shù)最大值確定模型最佳臨界值,將最佳臨界值用于模型準(zhǔn)確率、誤報率和漏報率計算。
使用SPSS軟件對19個初始自變量進行多重共線性檢驗,在剔除存在共線性變量后,距公路距離、距居民點距離、距鐵路距離、坡度、坡向、海拔、日降水量、平均氣壓、平均2分鐘風(fēng)速、平均氣溫、平均水氣壓、平均相對濕度、日照時數(shù)、最大風(fēng)速、最小相對濕度,15個自變量通過多重共線性診斷(方差膨脹因子VIF<10),進入模型擬合階段,如表1所示。
表1 林火驅(qū)動因子通過多重共線性后診斷結(jié)果Table 1 Diagnosis results of forest fire driving factors through multicollinearity
對通過了多重共線性檢驗的15個變量與林火發(fā)生概率進行Logistic回歸擬合,逐步回歸方法選擇向前法,建立大興安嶺地區(qū)林火發(fā)生概率預(yù)測模型。表2為Logistic回歸模型擬合結(jié)果,經(jīng)自變量篩選,距公路距離、距鐵路距離、距居民點距離、坡向、日降水量、平均2分鐘風(fēng)速、平均水氣壓、日照時數(shù)和最大風(fēng)速9個自變量與林火發(fā)生概率之間不存在顯著關(guān)系(P>0.05)被剔除,坡度、海拔、平均氣壓、平均氣溫、平均相對濕度和最小相對濕度6個自變量均通過顯著性檢驗(P<0.05)進入Logistic回歸模型,作為林火驅(qū)動因子對大興安嶺地區(qū)林火發(fā)生概率進行預(yù)測。
表2 Logistic回歸模型擬合結(jié)果Table 2 Fitting results of Logistic regression model
大興安嶺地區(qū)林火發(fā)生概率預(yù)測模型如式(2)所示,6個自變量中,坡度、海拔、平均氣壓、平均氣溫與林火發(fā)生概率呈正相關(guān),平均相對濕度和最小相對濕度與林火發(fā)生概率呈負(fù)相關(guān)。
(2)
式中:P為林火發(fā)生概率,x1為坡度,(°);x2為海拔,m;x3為平均氣壓,hPa;x4為平均氣溫,℃;x5為平均相對濕度;x6為最小相對濕度;e為自然常數(shù)。
如圖1所示為林火發(fā)生概率預(yù)測模型ROC曲線,曲線下面積值(AUC)為0.91,接近于1,模型擬合良好;通過計算得出該模型的約登指數(shù)最大值為0.667,最佳臨界值為0.425,基于最佳臨界值計算林火發(fā)生概率預(yù)測模型準(zhǔn)確率。如表3所示,建模樣本總體準(zhǔn)確率達82.4%,驗證樣本總體準(zhǔn)確率達80.5%。
圖1 林火發(fā)生概率預(yù)測模型ROC曲線Fig.1 ROC curve of prediction model on occurrence probability of forest fire
基于Logistics回歸建立大興安嶺地區(qū)林火發(fā)生概率預(yù)測模型,根據(jù)氣象因子、地形因子等對火點和非火點的林火發(fā)生概率進行預(yù)測,使用克里金插值法繪制大興安嶺地區(qū)林火發(fā)生概率空間分布圖。由圖2(a)可知,春季(3~5月)該地區(qū)南部林火發(fā)生概率高于北部;夏季(6~8月),隨氣溫回升該地區(qū)林火發(fā)生概率整體偏高,尤其是西部和東南部;秋季(9~11月)該地區(qū)氣溫下降快、降雪早,大部分地區(qū)林火發(fā)生概率較低,但東南部仍保持著較高水平;該地區(qū)冬季(12月~次年2月)基本無林火發(fā)生。
表3 模型準(zhǔn)確率評價Table 3 Model accuracy evaluation
圖2 大興安嶺地區(qū)林火發(fā)生概率分布及火險區(qū)劃分Fig.2 Probability distribution and risk zones division of forest fire in the Daxing`an Mountains area
將林火發(fā)生概率以0.2為中斷值,由低到高,將大興安嶺地區(qū)劃分為Ⅰ~Ⅴ級火險區(qū)[6],如圖2(b)所示。春季,該地區(qū)大部分為林火發(fā)生概率相對較低的I級、Ⅱ級和Ⅲ級火險區(qū),林火發(fā)生概率較高的Ⅳ級和Ⅴ級風(fēng)險區(qū)主要集中在該地區(qū)南部和中東部;夏季,該地區(qū)大部分為林火發(fā)生概率較高的Ⅳ級和Ⅴ級風(fēng)險區(qū),林火發(fā)生概率相對較低的Ⅰ級、Ⅱ級和Ⅲ級火險區(qū)主要集中在中部、東北部和南部;秋季,該地區(qū)絕大部分為林火發(fā)生概率相對較低的Ⅰ級、Ⅱ級和Ⅲ級火險區(qū),Ⅳ級火險區(qū)僅在東南部零星分布,無Ⅴ級火險區(qū)。
1)大興安嶺地區(qū)坡度、海拔2種地形因子和平均氣壓、平均氣溫、平均相對濕度、最小相對濕度4種氣象因子是該地區(qū)林火發(fā)生主要驅(qū)動因子。其中,坡度、海拔、平均氣壓、平均氣溫與林火發(fā)生概率呈正相關(guān),平均相對濕度和最小相對濕度與林火發(fā)生概率呈負(fù)相關(guān)。
2)基于Logistic回歸模型建立的大興安嶺地區(qū)林火發(fā)生概率預(yù)測模型,建模樣本總體準(zhǔn)確率達82.4%,驗證樣本總體準(zhǔn)確率達80.5%,ROC曲線下面積值(AUC)約為0.91,接近于1,模型擬合效果較好,預(yù)測精度較高,可以較為準(zhǔn)確地對該地區(qū)林火發(fā)生進行預(yù)測、預(yù)報。
3)大興安嶺地區(qū)夏季林火發(fā)生概率明顯高于春、秋季,林火發(fā)生概率較高的Ⅳ級和Ⅴ級風(fēng)險區(qū)主要集中在夏季該地區(qū)東南部和西部以及春、秋季該地區(qū)東南部。