国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于PLS的道路交通事故經(jīng)濟(jì)損失預(yù)測(cè)模型的構(gòu)建

2017-03-30 07:21:56
關(guān)鍵詞:保有量因變量經(jīng)濟(jì)損失

高 波

(遼寧警察學(xué)院 治安管理系, 遼寧 大連 116036)

基于PLS的道路交通事故經(jīng)濟(jì)損失預(yù)測(cè)模型的構(gòu)建

高 波

(遼寧警察學(xué)院 治安管理系, 遼寧 大連 116036)

有效預(yù)測(cè)道路交通事故造成的經(jīng)濟(jì)損失的相關(guān)因素、并確定相關(guān)影響程度,由此得出影響道路交通事故經(jīng)濟(jì)損失的關(guān)鍵環(huán)節(jié)。借助偏最小二乘回歸方法(PLS)構(gòu)建道路交通事故經(jīng)濟(jì)損失預(yù)測(cè)模型,對(duì)道路交通造成的經(jīng)濟(jì)損失與GDP、人口數(shù)、公路總里程、機(jī)動(dòng)車保有量四項(xiàng)影響因素進(jìn)行相關(guān)性分析,確定最相關(guān)的影響因素及其相關(guān)性。該模型的相對(duì)誤差為0.18%~8.48%。

道路交通;經(jīng)濟(jì)損失;偏最小二乘;回歸建模;分析預(yù)測(cè)

隨著社會(huì)的快速發(fā)展、機(jī)動(dòng)車保有量的急速增長(zhǎng),道路交通事故頻發(fā),隨之帶來(lái)的是道路交通發(fā)生起數(shù)的劇增及經(jīng)濟(jì)財(cái)產(chǎn)的巨大損失,據(jù)統(tǒng)計(jì),平均每年直接經(jīng)濟(jì)損失達(dá)數(shù)十億元,雖然這是我們國(guó)家在發(fā)展過(guò)程中必然經(jīng)歷的階段,但若能及早進(jìn)行統(tǒng)計(jì)分析,總結(jié)事情發(fā)生的規(guī)律,分析原因,有針對(duì)性地提出解決對(duì)策、減少損失,是目前臨亟需解決的課題[1]。

圖1 2005—2014年全國(guó)道路交通事故直接財(cái)產(chǎn)損失統(tǒng)計(jì)圖

每次發(fā)生道路交通事故都面臨不可避免的或多或少的經(jīng)濟(jì)損失(如圖1),對(duì)我們正在大力發(fā)展經(jīng)濟(jì)建設(shè)的發(fā)展中國(guó)家來(lái)說(shuō),研究道路交通事故發(fā)生的規(guī)律,總結(jié)經(jīng)驗(yàn)教訓(xùn),減少經(jīng)濟(jì)損失,是能夠最大限度地發(fā)揮科學(xué)生產(chǎn)力,維護(hù)國(guó)家可持續(xù)發(fā)展的另一貢獻(xiàn),因此有必要對(duì)道路交通事故帶來(lái)的經(jīng)濟(jì)損失進(jìn)行預(yù)測(cè)研究,為提高道路交通的科學(xué)管理和交通安全風(fēng)險(xiǎn)評(píng)估提供科學(xué)依據(jù)。[1]

一、PLS預(yù)測(cè)模型算法

預(yù)測(cè)是運(yùn)用科學(xué)的判斷方法或計(jì)量分析法,對(duì)事物未來(lái)可能演變的態(tài)勢(shì)提前做出估測(cè)。其實(shí)質(zhì)是探求和把握事物發(fā)展規(guī)律,預(yù)估事物未來(lái)發(fā)展?fàn)顩r,為各種決策提供科學(xué)的參考依據(jù)。

目前各種領(lǐng)域的預(yù)測(cè)方法真正在實(shí)際中廣泛應(yīng)用的有多元回歸分析法、灰色系統(tǒng)預(yù)測(cè)、指數(shù)平滑法、趨勢(shì)外推法、計(jì)量經(jīng)濟(jì)法等。偏最小二乘回歸(PLS)是一種比較新型的多元統(tǒng)計(jì)分析方法,它具備了多元線性回歸分析、主成分分析以及典型相關(guān)分析的基本功能。它首先應(yīng)用在化工領(lǐng)域,隨后又在市場(chǎng)分析、資源分析、工程建模以及金融等領(lǐng)域得到廣泛的應(yīng)用[2]。PLS解決了模型自變量存在多重共線性的問(wèn)題,更優(yōu)異的表現(xiàn)是當(dāng)因變量的個(gè)數(shù)大于樣本量時(shí),該回歸模型依然是成立的,同時(shí)保持較好的擬合優(yōu)度。其基本思想如下:

設(shè)有q個(gè)因變量組成的因變量集合Y和p個(gè)自變量組成的自變量集合X。為了研究因變量和自變量的統(tǒng)計(jì)關(guān)系,偏最小二乘回歸在建模過(guò)程中采用信息綜合和篩選技術(shù),先不考慮因變量集合對(duì)自變量集合的回歸模型,而是分別在X和Y中提取出主成分t與u(即t是自變量X提取的主成分,u是因變量Y提取的主成分),在提取這兩個(gè)成分時(shí),需滿足下列兩個(gè)要求[3]:(1)t與u應(yīng)盡量攜帶上各自的數(shù)據(jù)矩陣中所含包變異的信息;(2)t與u的相關(guān)程性應(yīng)是最大的。這表明,t與u應(yīng)盡量代表數(shù)據(jù)矩陣X和Y,同時(shí)自變量的成分t對(duì)因變量u的成分又具備最強(qiáng)的解釋能力。

當(dāng)?shù)谝粋€(gè)成分t1與u1被提取后,偏最小二乘回歸算法分別進(jìn)行X對(duì)t1的回歸和Y對(duì)u1的回歸;若回歸方程已達(dá)到令人滿意的精度,則算法會(huì)終止;否則,算法分別利用X被解釋后殘余的信息以及Y被解釋后殘余的信息進(jìn)行第二輪的主成分(t2與u2)提取…;依次進(jìn)行下去…,直到可以達(dá)到滿意的精度才能停止。最后利用偏最小二乘回歸方法建立Y對(duì)主成分t的回歸,然后再還原為Y關(guān)于原變量X的回歸。

二、構(gòu)建道路交通事故經(jīng)濟(jì)損失回歸模型

道路交通事故預(yù)測(cè)是提高道路交通安全管理水平的重要內(nèi)容,道路交通事故的發(fā)生受到多個(gè)因素的影響,選擇道路交通經(jīng)濟(jì)損失這一指標(biāo)進(jìn)行回歸分析,根據(jù)常用的分析道路交通事故的四大影響因素:GDP、人口數(shù)、公路總里程和機(jī)動(dòng)車保有量作為自變量來(lái)進(jìn)行統(tǒng)計(jì)分析,為合理有效地進(jìn)行道路交通事故分析和預(yù)測(cè)提供了科學(xué)依據(jù)。

表1 遼寧省道路交通經(jīng)濟(jì)損失及四項(xiàng)影響因素統(tǒng)計(jì)數(shù)據(jù)

(一)構(gòu)建回歸模型

以遼寧省2006~2013年道路交通事故經(jīng)濟(jì)損失①作為因變量,與同期該省的GDP、人口數(shù)、汽車保有量、公路總里程長(zhǎng)度四項(xiàng)影響因素(數(shù)據(jù)如表1)作為自變量進(jìn)行相關(guān)分析,建立回歸模型,其中:y—道路交通死亡人數(shù)(人);(億元);x2—人口數(shù)(萬(wàn)人);x3—公路總里程(公里);x4—汽車保有量(萬(wàn)輛)。根據(jù)遼寧省統(tǒng)計(jì)局資料,得到相關(guān)數(shù)據(jù)如表1。

對(duì)原始數(shù)據(jù)利用PLS思想進(jìn)行統(tǒng)計(jì)分析并建模,其根據(jù)交叉有效性選擇最佳主成分2個(gè)[3],運(yùn)行計(jì)算后結(jié)果如圖1:

圖示說(shuō)明目前模型建立良好,擬合比例很接近于1,根據(jù)計(jì)算提取主成分的具體數(shù)據(jù)可得出:提取1個(gè)PLS成分對(duì)y的交叉有效性是0.815,第二個(gè)、第三個(gè)主成分對(duì)Y的交叉有效性成分分別是:0.337和-0.416,根據(jù):所以停止運(yùn)算,取m=2個(gè)主成分建立模型。由圖可以看出,模型對(duì)Y的解釋能力為91.3%,達(dá)到了較高精度,說(shuō)明模型的吻合度很高。根據(jù)提取2個(gè)主成分,求得到原始變量y對(duì)的回歸方程:

圖1 模型擬合結(jié)果顯示圖

(二)模型的有效性與合理性分析[3]

1.通過(guò)繪制t1-u1圖(見(jiàn)圖2),可看出全部樣本在圖中近似一條直線排列,說(shuō)明t1-u1的線性關(guān)系較強(qiáng),而偏最小二乘回歸的提取的主成分t1及u1的相關(guān)關(guān)系能直接反應(yīng)出自變量與因變量之間的關(guān)系,因此,運(yùn)用偏最小二乘法建立回歸模型是合理的。

圖2 t1-u1平面圖

2.精化模型(檢查樣本特異點(diǎn)并排除)。T2橢圓圖用于在t1-t2圖上觀察樣本點(diǎn)的分布情況,如果所有樣本點(diǎn)都落在橢圓內(nèi),則認(rèn)為所有的樣本點(diǎn)的分布是均勻的,若有樣本點(diǎn)落在橢圓外,則可以認(rèn)為這些點(diǎn)是特異點(diǎn),它們的取值遠(yuǎn)離所有樣本點(diǎn)的平均水平,通過(guò)畫(huà)T2橢圓圖(圖3)可以看出,在橢圓區(qū)域代表95%的置信區(qū)間內(nèi),得到了非常好的t1-t2關(guān)系圖,并且沒(méi)有異常點(diǎn)。

圖3 t1-t2成分橢圓圖

3.模型的擬合優(yōu)度。建立模型后,需要對(duì)其擬合優(yōu)度進(jìn)行論證,利用建立的模型計(jì)算預(yù)測(cè)值,并與實(shí)際觀測(cè)值進(jìn)行比較(表3),根據(jù)實(shí)測(cè)值與預(yù)測(cè)值數(shù)據(jù),畫(huà)出散點(diǎn)圖(圖4),可以看出,預(yù)測(cè)值YPredPS(y)與實(shí)際觀測(cè)值YVarPS(y)差異很小,模型的擬合優(yōu)度較高。

圖4 實(shí)際值與預(yù)測(cè)值比較圖

4.基于PLS輔助分析技術(shù)進(jìn)行模型評(píng)價(jià)。根據(jù)PLS輔助分析技術(shù),自變量對(duì)因變量的解釋能力用變量投影重要指標(biāo)VIP來(lái)解釋,對(duì)X和Y相關(guān)的重要性進(jìn)行分析(見(jiàn)圖5),觀察到VIP值大于1的變量有x4、x2、x1,自變量對(duì)因變量的影響因素按顯著程度排序?yàn)?汽車保有量;人口數(shù);GDP,說(shuō)明在模型中,變量x4對(duì)道路交通事故經(jīng)濟(jì)損失的影響作用是最強(qiáng)的。

圖5 VIP值排序圖

三、結(jié) 論

(一)模型分析

為了觀測(cè)自變量對(duì)道路交通事故經(jīng)濟(jì)損失的正負(fù)向作用,繪制回歸系數(shù)圖,如圖6。由圖6看出,GDP、人口數(shù)、公路總里程和機(jī)動(dòng)車保有量對(duì)道路交通事故經(jīng)濟(jì)損失都起負(fù)向作用,說(shuō)明增大它們的數(shù)值反而對(duì)道路交通事故經(jīng)濟(jì)損失的增長(zhǎng)起抑制作用,這與我們實(shí)際生活常識(shí)恰恰相反,但仔細(xì)觀測(cè)統(tǒng)計(jì)數(shù)據(jù)可以看出,雖然這些年交通事故總數(shù)及各自變量總數(shù)逐年上升,但根據(jù)統(tǒng)計(jì),道路交通事故造成經(jīng)濟(jì)損失卻逐年下降,并且下降幅度還很大,說(shuō)明雖然統(tǒng)計(jì)模型的結(jié)果與常識(shí)相違背,卻與官方公布的統(tǒng)計(jì)數(shù)據(jù)相吻合,排除統(tǒng)計(jì)數(shù)據(jù)存在誤差的可能性,則數(shù)據(jù)說(shuō)明了全省交通管理部門取之不易的成績(jī):根據(jù)統(tǒng)計(jì)數(shù)據(jù)可看出全省交通事故經(jīng)濟(jì)損失自2006年起連續(xù)8年下降,在全省機(jī)動(dòng)車保有量、機(jī)動(dòng)車駕駛?cè)藬?shù)據(jù)快速增長(zhǎng)的情況下,全省發(fā)生道路交通事故起數(shù)、死亡人數(shù)卻能實(shí)現(xiàn)連續(xù)下降,而且下降幅度還很大,能取得這來(lái)之不易的成績(jī),說(shuō)明在近些年駕駛?cè)怂刭|(zhì)得到了提高,全省交管工作成績(jī)顯著,從統(tǒng)計(jì)分析結(jié)論上看所建立的模型是符合實(shí)際數(shù)據(jù)的,是嚴(yán)謹(jǐn)?shù)摹?/p>

(二)誤差分析

根據(jù)偏最小二乘法建立的模型對(duì)道路交通事故經(jīng)濟(jì)損失進(jìn)行預(yù)測(cè),將預(yù)測(cè)值與實(shí)測(cè)值進(jìn)行精度比較(見(jiàn)表3)可知,偏最小二乘法回歸模型預(yù)測(cè)相對(duì)誤差最大為8.48%,最小為0.18%,相對(duì)誤差均值為2.93%,說(shuō)明在建模樣本量只有8個(gè),而自變量有4個(gè)的情況下,卻能很好地在低樣本情況下建立精度較高的模型,說(shuō)明用偏最小二乘回歸方法具有很高的預(yù)測(cè)能力,所建立的預(yù)測(cè)模型分析的精度較高,建模較準(zhǔn)確。

圖6 回歸系數(shù)圖

表3 預(yù)測(cè)值與實(shí)際值精度比較

注 釋:

①見(jiàn)遼寧省統(tǒng)計(jì)局編《遼寧省統(tǒng)計(jì)年鑒》。

[1]房曰榮,沈斐敏.道路交通事故發(fā)展趨勢(shì)分析與預(yù)測(cè)[J].中國(guó)安全生產(chǎn)科學(xué)技術(shù),2012,8(3):144-145.

[2]董玉波.道路交通事故多元線性回歸模型及檢驗(yàn)方法[J].中國(guó)人民公安大學(xué)學(xué)報(bào)(自然科學(xué)版), 2013(2):73-75.

[3]王惠文.偏最小二乘回歸方法及其應(yīng)用[M].北京:國(guó)防工業(yè)科技圖書(shū)出版社,1999:201-206.

(責(zé)任編輯:李 剛)

Construction of the Predictive Model of Traffic Accidents Based on PLS

GAO Bo
(Public Order Administration Department, Liaoning Police College, Dalian Liaoning 116036, China)

in this paper, the relative factors of economic losses owing to traffic accident are predicted effectively and the level of relativity is confirmed. Consequently, the key procedures effecting on the economic losses of traffic accident can be concluded. The mode of predicting the economic losses is constructed using the partial least-square regression-method, which analyses the economic losses dependence on the GDP, the population, the road traffic mileage and the vehicle parc. The most relative factor is found. The relative error of the mode is 0.18%~8.48%.

road traffic; economic losses; partial least squares; regression model; analysis prediction

D631.5

A

2096-0727(2017)02 -0059-05

2016-09-21

高 波(1975-),男,漢,山東臨沂人,講師,碩士。研究方向:道路交通管理。

猜你喜歡
保有量因變量經(jīng)濟(jì)損失
交通運(yùn)輸部關(guān)于海上交通事故等級(jí)劃分的直接經(jīng)濟(jì)損失標(biāo)準(zhǔn)的公告
美國(guó)供水與清潔基礎(chǔ)設(shè)施不足造成每年85.8億美元經(jīng)濟(jì)損失
全國(guó)機(jī)動(dòng)車保有量突破4億輛,新能源汽車占比2.90%
潤(rùn)滑油(2022年3期)2022-11-15 20:07:38
全國(guó)機(jī)動(dòng)車保有量突破4億輛
調(diào)整有限因變量混合模型在藥物經(jīng)濟(jì)學(xué)健康效用量表映射中的運(yùn)用
適應(yīng)性回歸分析(Ⅳ)
——與非適應(yīng)性回歸分析的比較
對(duì)我國(guó)私家車保有量影響因素的統(tǒng)計(jì)分析
偏最小二乘回歸方法
燒傷創(chuàng)面感染直接經(jīng)濟(jì)損失病例對(duì)照研究
全國(guó)機(jī)動(dòng)車保有量
——《2013年中國(guó)機(jī)動(dòng)車污染防治年報(bào)》(第Ⅰ部分)
岫岩| 新竹县| 宁化县| 长兴县| 吴忠市| 凤冈县| 抚松县| 葵青区| 苍南县| 凤翔县| 五寨县| 分宜县| 永德县| 游戏| 河东区| 兴安盟| 扎鲁特旗| 肥东县| 儋州市| 武隆县| 芒康县| 峨眉山市| 荆门市| 台安县| 花莲县| 句容市| 明星| 奉新县| 遂宁市| 鄄城县| 奈曼旗| 娄底市| 通渭县| 永吉县| 增城市| 禄丰县| 泗水县| 肇庆市| 子长县| 甘孜县| 岳池县|