艾 鵬,劉義祥,金 靜,許 潔,賈 南
(武警學院,河北 廊坊 065000)
●消防理論研究
基于Logistic曲線擬合的全國電氣火災數(shù)據(jù)分析
艾 鵬,劉義祥,金 靜,許 潔,賈 南
(武警學院,河北 廊坊 065000)
我國電氣火災發(fā)展形勢日益迅猛,給人民生產(chǎn)生活帶來巨大損失,因此研究電氣火災的發(fā)展規(guī)律具有現(xiàn)實意義。采用2004—2012年全國電氣火災數(shù)據(jù),利用SPSS軟件比較不同曲線的擬合情況,最終確定Logistic邏輯增長模型,通過x2檢驗,判斷出曲線擬合優(yōu)度,得出電氣火災預測公式,并粗略預測出2016年電氣火災發(fā)生比例。此模型的建立,可為消防部門了解電氣火災發(fā)展規(guī)律提供參考。
電氣火災;Logistic曲線;x2檢驗;擬合優(yōu)度
隨著我國經(jīng)濟建設的大力發(fā)展,電能廣泛應用于人們生活生產(chǎn)活動中,然而電在造福人類的同時,由于電氣安全管理體系和法規(guī)建設的不完善,電氣操作和使用不當?shù)戎T多原因,導致電氣火災隱患及其發(fā)生率不斷增加,給國民經(jīng)濟和人民生活造成巨大損失。據(jù)統(tǒng)計,我國電氣火災年均發(fā)生率達26%,年損失約占總損失的36%,而根據(jù)一些發(fā)達國家的資料顯示,英國每年電氣火災占總數(shù)的17%以下,而美國和日本更是低于10%。為降低電氣火災發(fā)生率,有必要著眼于火災數(shù)據(jù)分析和預測,為消防部門認識火災發(fā)展規(guī)律、判斷火災形勢、制定火災風險防范和控制計劃等提供重要依據(jù)[1]。
在我國,利用數(shù)據(jù)分析預測已經(jīng)普遍應用于各行各業(yè),其中利用數(shù)學模型預測火災發(fā)展也取得了許多成績,楚志勇[2]通過回歸分析的方法利用天津市歷年火災發(fā)生率數(shù)據(jù)建立回歸模型對未來的火災發(fā)生率進行了預測,鄭雙忠[3]通過等維灰色遞補GM(1,1)動態(tài)預測模型得出某市不同時段(共3個時段)火災發(fā)生率預測值,徐曉楠[4]以及陳俊達[5]等分別采用ARIMA法和指數(shù)平滑法兩種時間序列方法對火災發(fā)生率進行預測分析,預測結果與實際情況相比都較為精確。Logistic曲線是一種邏輯增長曲線,能較好地反映案例中的增長規(guī)律,在消防領域,Logistic主要用于火災風險評估及火險區(qū)域劃分等[6],其大多是基于Logistic二項或多項回歸,構建概率模型,得出火災發(fā)生的可能性,但是Logistic曲線本身就具有邏輯增長的特點,可以通過曲線擬合預測火災起數(shù),不過由于火災數(shù)據(jù)具有不完備性、隨機性等特點,通過Logistic曲線對火災數(shù)據(jù)進行擬合預測并不能應用于長時間段,其適合研究短時間段的火災發(fā)展規(guī)律。采用近10年全國電氣火災數(shù)據(jù),比較各種預測模型,預測電氣火災的發(fā)展趨勢,希望能為今后的消防工作提供參考。
Logistic曲線方程是生物數(shù)學家P.F.Verhulst于1938年為了研究人口增長過程而導出的,其特點是在一定程度上穩(wěn)定環(huán)境因素條件下,開始增長緩慢,而在以后的某一范圍內(nèi)迅速增長,達到某限度后,增長又緩慢下來。曲線略呈拉長的“S”型[7]。其模型公式為:
Logistic曲線有3個關鍵點,用于研究曲線所代表的現(xiàn)實意義。求Logistic曲線方程的一階導數(shù),可以得到Logistic增長或生長過程的速度函數(shù):
求Logistic生長速度函數(shù)的二階導數(shù),令其等于0,得:
2.1 數(shù)據(jù)預處理
數(shù)據(jù)來自中國消防年鑒(2004—2012年),為消除屬性的量綱影響,進行去量綱化處理,求得每年的火災總數(shù)與電氣火災總數(shù)的比值作為處理后的數(shù)據(jù)進行統(tǒng)計分析,如表1所示。
表1 全國電氣火災數(shù)據(jù)統(tǒng)計情況
2.2 比較不同曲線的擬合情況
為了找出最佳的擬合曲線,選定可決系數(shù)R2作為評價參數(shù)比較Logistic曲線與其他曲線,可決系數(shù)能夠反映曲線對樣本觀測值的擬合程度。通過SPSS中的曲線估計,得到一次、二次、三次、衰減指數(shù)擬合曲線的可決系數(shù)R2,如表2所示。
表2 不同擬合曲線的擬合優(yōu)度
以全國電氣火災所占百分比為縱坐標,為了使數(shù)據(jù)簡單,便于計算,取橫坐標數(shù)值=當時年份-2000年,通過SPSS中的曲線估計得到圖1。根據(jù)可決系數(shù)值以及圖1所示,除直線外,其余曲線擬合都具有較高的精確度,但還需結合Logistic曲線的擬合情況進行比較。
圖1 對全國電氣火災發(fā)生率擬合的曲線
2.3 Logistic曲線擬合
2.3.1 參數(shù)初始值估計
為了能夠使曲線的擬合效果更佳,決定探尋Logistic的擬合優(yōu)度,主要采用SPSS軟件中的非線性擬合方法。首先應確定參數(shù)的初始值,以保證其后的迭代計算正常、迅速收斂,同時應避免參數(shù)初始值過小,計算時無法再收斂精確。由于Logistic曲線不可化為簡單的線性表達式,所以初始值的求解分為以下步驟進行:第一步求參數(shù)K,K值一般用三點法估計,公式[9]為:
式中,(t1,N1)、(t2,N2)、(t3,N3)分別表示實測數(shù)據(jù)序列的始點、中點、終點。其中K值采用三點法對其進行初始值的確定,這樣選取的點為2004、2008、2012年所對應的點,并將所對應的數(shù)據(jù)代入式(3),解得K=32.80。
第二步估計參數(shù)a和b,由于式(1)具有非線性,利用其構造的模型為非線性模型,需轉(zhuǎn)化為線性模型后通過最小二乘法求解,式(1)經(jīng)線性變化為:
z與t為線性回歸關系,利用Excel,由最小二乘法估計出參數(shù)a=e1.17,b=0.40[10]。
2.3.2 非線性擬合
非線性擬合的方法是不斷地將“參數(shù)估計值(參數(shù)的初始估計值)”代入“損失函數(shù)”求解,而“損失函數(shù)”采用的是“殘差平方和”最小,在迭代m次后,殘差平方和達到最小值,此時找到最優(yōu)解,迭代終止。具體操作步驟:在SPSS中進入分析-回歸-非曲線擬合[11],導入因變量電氣火災所占百分比,導入模型表達式K/(1+EXP(r-b*t)),其中r=lna,導入計算后的參數(shù)估計值K=32.80,b=0.40,r=1.17,保存預測值、殘差,選項中估計方法選擇序列二次編程,經(jīng)過迭代計算后得出如表3所示的結果。由表中數(shù)據(jù)可知經(jīng)過7次迭代計算后數(shù)據(jù)保持不變,最后的參數(shù)值K=33.049,r=1.099,b=0.374。同時通過SPSS得到Logistic的擬合曲線如圖2所示。
從圖2可以看出,Logistic模型對表1的電氣火災統(tǒng)計數(shù)據(jù)具有較好的擬合效果,根據(jù)SPSS得到的輸出結果,可決系數(shù)R2=0.939,具有非常高的擬合度,與圖1相比更能反映數(shù)據(jù)的邏輯增長特征;與表2中各個曲線的可決系數(shù)進行對比發(fā)現(xiàn)Logistic的數(shù)值更能接近1,因此Logistic曲線更能反映出數(shù)據(jù)特征,最后的曲線表達式為:
表3 迭代歷史記錄
圖2 用Logistic對全國電氣火災 發(fā)生率擬合的曲線
式(6)反映了全國電氣火災2004—2012年的邏輯增長情況,K值為33.049,代表電氣火災發(fā)生率所能達到的理論最高值,也是當前環(huán)境因素條件下的理論飽和值,當電氣火災發(fā)生率達到理論最高值時,之后的發(fā)展會因環(huán)境因素(社會經(jīng)濟狀況、群眾防火安全意識等)的改變而出現(xiàn)明顯的改變。根據(jù)公式可以對未來的全國電氣火災發(fā)生率進行預測,經(jīng)計算可以得出2013、2014、2015、2016年的電氣火災起數(shù)所占百分比預測值為32.29%、32.52%、32.68%、32.80%。
2.3.3 求取關鍵點
為研究實例的邏輯增長規(guī)律,分析曲線不同時段的增長特性,探求電氣火災發(fā)生率的現(xiàn)實情況,根據(jù)Logistic曲線的特點,求取式(6)的3個關鍵點,由式(2)可得Logistic曲線的3個關鍵點的橫坐標為t1=-0.59,t2=2.75,t3=6.53。因為文中數(shù)據(jù)是取自2004—2012年的,是基于某一時段的數(shù)據(jù)分析,時間作為因變量,且數(shù)據(jù)自變量包含的時間范圍較短,所以Logistic曲線會在x軸上有偏移,出現(xiàn)t值為負的情況,表示1999年之前的情況,這里不做分析。根據(jù)計算出的3個關鍵點可知,全國電氣火災發(fā)生率快增期為2004—2007年,緩增期為2007年—∞。
2.3.4x2檢驗
由于Logistic曲線回歸方程除含有回歸參數(shù)a和b,還含有常量K,為了更精準地驗證曲線的擬合優(yōu)度,利用實際值和預測值,運用x2測驗,確定曲線的擬合優(yōu)度,以驗證公式的合理性[8]。
表4 全國電氣火災所占比例的實際值與預測值
通過R2值的比較與x2檢驗發(fā)現(xiàn)Logistic曲線的擬合效果更好,因此針對實例確定最終的推導公式(6),并對2013、2014、2015、2016年的火災進行預測,得出結果為2013、2014、2015作為檢驗年份預測值為32.29%、32.52%、32.68%,與實際值29.7%、27.4%、30.2%基本相符,2016的電氣火災發(fā)生比率預測值為32.80%。分析我國電氣火災發(fā)生率的增長規(guī)律發(fā)現(xiàn)我國電氣火災仍處于持續(xù)高發(fā)狀態(tài),2004—2007年是我國電氣火災的高速增長期,特點為電氣火災發(fā)生基數(shù)不大,但發(fā)生比率在逐年高速增長。2007年開始是我國電氣火災的緩增期,特點為電氣火災發(fā)生比率仍逐年增加,但增加的速度明顯減小,電氣火災的發(fā)展逐漸進入穩(wěn)定期。
[1] 蘭麗娜.我國電氣火災發(fā)展的特點分析及其綜合防治對策研究[J].科技風,2011(8):251-252.
[2] 楚志勇.基于回歸分析方法的城市火災預測:以天津市為例[J].安全與環(huán)境工程,2011,18(3):90-92.
[3] 鄭雙忠.基于灰色系統(tǒng)理論的城市火災預測分析[J].數(shù)學的實踐與認識,2005,35(1):72-76.
[4] 徐曉楠,張曉珺,施照成.基于北京市火災統(tǒng)計數(shù)據(jù)的時間序列分析[J].安全與環(huán)境學報,2014,14(1):73-77.
[5] 陳俊達,李曉宏,李佳樂,等.基于時間序列分析的火災分析與預測[J].科學之友,2011(11):42-43.
[6] 王衛(wèi)國,潘竟虎,李俊峰.基于空間Logistic的山西省火災風險評價與火險區(qū)劃[J].草業(yè)科學,2016,33(4):635-644.
[7] 胡喜生,范海蘭,宋萍,等.改進Logistic模型在城市人口預測中的應用[J].北華大學學報(自然),2008,9(4):370-373.
[8] 崔黨群.Logistic曲線方程的解析與擬合優(yōu)度測驗[J].數(shù)理統(tǒng)計與管理,2005,24(1):112-115.
[9] 殷祚云.Logistic曲線擬合方法研究[J].數(shù)理統(tǒng)計與管理,2002,21(1):41-46.
[10] 張潤蓮,蘇國強,楊建華,等.基于Logistic模型的火災損失研究文獻分析[J].內(nèi)江科技,2013,34(11):107-108.
[11] 董江水.應用SPSS軟件擬合Logistic曲線研究[J].金陵科技學院學報,2007,23(1):21-24.
(責任編輯馬龍)
AnalysisofNationalElectricFireDataBasedonLogisticCurveFitting
AI Peng, LIU Yixiang, JIN Jing, XU Jie, JIA Nan
(TheArmedPoliceAcademy,Langfang,HebeiProvince065000,China)
The number of China’s electrical fire is increasing rapidly, bringing great losses to people’s production and life, so to study the law of electrical fire occurrence is of great significance. In this paper, the SPSS software is used to compare the fitting of different curves based on the data of national electrical fires from 2004 to 2012. Finally, a Logistic logic growth model is determined. The goodness of curve fitting is obtained by Chi-square test, and a prediction formula of electrical fires is obtained, which can roughly forecast the proportion of electrical fires in 2016. This model provides a reference for the fire department to understand the law of electrical fire occurrence.
electrical fire; Logistic curve; Chi-square test; goodness of fitting
2017-04-10
河北省統(tǒng)計科學研究計劃項目“大數(shù)據(jù)背景下城市火災預測與可視化研究”(2016HY11)階段性成果; 河北省科技計劃項目“面向大數(shù)據(jù)的城市火災預測關鍵技術研究”(16215416)階段性成果
艾鵬(1993— ),男,遼寧錦州人,武警學院在讀碩士研究生; 劉義祥(1970— ),男,河北南皮人,教授; 金靜(1986— ),女,安徽蕭縣人,講師,博士; 許潔(1983— ),女,河北廊坊人,講師; 賈南(1987— ),男,河北廊坊人,講師。
D631.6
A
1008-2077(2017)10-0005-04