国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

城市軌道交通正線列車故障發(fā)生概率預(yù)測模型

2021-01-08 08:53:44王鎮(zhèn)波葉霞飛施董燕
關(guān)鍵詞:泊松正線編組

王鎮(zhèn)波,葉霞飛,沈 堅(jiān),施董燕

(1.同濟(jì)大學(xué)道路與交通工程教育部重點(diǎn)實(shí)驗(yàn)室,上海201804;2.同濟(jì)大學(xué)上海市軌道交通結(jié)構(gòu)耐久與系統(tǒng)安全重點(diǎn)實(shí)驗(yàn)室,上海201804;3.上海申通地鐵集團(tuán)有限公司技術(shù)中心,上海201103)

城市軌道交通列車故障是造成正線運(yùn)營延誤甚至中斷的主要原因之一[1-2],不僅影響乘客正常出行,還埋下許多安全隱患。為此,《地鐵設(shè)計(jì)規(guī)范》[3]規(guī)定正線上每隔5~6座車站或8~10 km設(shè)置停車線,以確保列車在正線任何位置發(fā)生故障后,將其處理下線的救援時間控制在30 min以內(nèi)。但是整個城市軌道交通生命周期內(nèi)因停車線起作用而降低故障列車對正線運(yùn)營影響程度所帶來的效益是否高于額外修建停車線所產(chǎn)生的土建及維護(hù)成本一直是個值得關(guān)注的問題。其中,列車故障發(fā)生概率的高低對正線運(yùn)營的影響程度差異很大,應(yīng)是設(shè)置停車線時除了救援時間之外需要考慮的一個重要參數(shù)。因此,深化列車故障發(fā)生概率的合理預(yù)測方法意義重大,可為停車線設(shè)置方法的進(jìn)一步完善提供列車故障發(fā)生概率參數(shù)取值的依據(jù)。

在理論上,一起列車故障就是一次貝努利試驗(yàn)的結(jié)果,每一列車在開行某個班次時,它如果順利完成即成功,如果發(fā)生列車故障即失敗。而城市軌道交通列車每日發(fā)生故障一般屬于小概率事件,這使得出現(xiàn)一次失敗所需的貝努利試驗(yàn)次數(shù)十分巨大。針對這一特點(diǎn),很多學(xué)者往往采用離散型分布中的泊松分布[4]或負(fù)二項(xiàng)分布[5-6]構(gòu)建模型,其中泊松分布要求均值等于方差,負(fù)二項(xiàng)分布則適用于方差明顯大于均值的情況。隨著研究與應(yīng)用的進(jìn)一步深入,出現(xiàn)了有零過多現(xiàn)象的數(shù)據(jù),如每列車短時期內(nèi)發(fā)生故障的次數(shù),這種數(shù)據(jù)中0的個數(shù)要明顯多于由泊松分布與負(fù)二項(xiàng)分布隨機(jī)產(chǎn)生的個數(shù),因而采用零膨脹泊松分布[7-8]、零膨脹負(fù)二項(xiàng)分布[9]的研究逐漸興起。

考慮到在停車場等非正線上發(fā)生的列車故障不影響列車正常運(yùn)營,本文選擇城市軌道交通列車在正線上發(fā)生故障的概率作為重點(diǎn)研究對象(以下提及的列車故障發(fā)生概率若無特別說明,均指城市軌道交通列車在正線上發(fā)生故障的概率)。首先定性分析列車故障發(fā)生概率的主要影響因素,之后基于實(shí)際數(shù)據(jù)生成包含這些影響因素的離散型數(shù)據(jù)集,在此基礎(chǔ)上從泊松分布、負(fù)二項(xiàng)分布、零膨脹泊松分布、零膨脹負(fù)二項(xiàng)分布中選擇合適的分布及可能的函數(shù)形式構(gòu)建備選模型并標(biāo)定,最后通過模型比選確定最終的城市軌道交通正線列車故障發(fā)生概率預(yù)測模型。

1 列車故障發(fā)生概率主要影響因素

從產(chǎn)品構(gòu)成的角度來看,城市軌道交通列車由多節(jié)車廂串聯(lián)而成,任一車廂的部件出現(xiàn)損壞時,均視作該列車的一起故障,而編組越多的列車擁有的部件會越多,出現(xiàn)故障的可能性也就越高。因此城市軌道交通列車的編組數(shù)應(yīng)對其故障發(fā)生概率產(chǎn)生顯著影響,且列車故障發(fā)生概率會因列車編組數(shù)增加而變高。

從產(chǎn)品使用的角度來看,城市軌道交通列車具有系統(tǒng)集成度高、設(shè)備種類多、設(shè)備工況復(fù)雜等特點(diǎn),剛投入使用的列車需要經(jīng)歷一段部件磨合期才能達(dá)到最佳使用狀態(tài)[10],所以整列車的故障發(fā)生概率在使用初期往往會比較高。在部件磨合期結(jié)束后,整列車的故障發(fā)生概率應(yīng)處于相對較低的階段,之后隨著列車走行公里的累計(jì),部件老化及磨損的問題則可能會使整列車的故障發(fā)生概率有所回升。由此可見,城市軌道交通列車自投入運(yùn)營開始的累計(jì)走行公里應(yīng)對其故障發(fā)生概率產(chǎn)生顯著影響,且列車故障發(fā)生概率會因累計(jì)走行公里增加而呈現(xiàn)先高后低再高的特點(diǎn)。

需要注意的是,城市軌道交通列車在整個壽命周期中會經(jīng)歷各種類型的維修,目前計(jì)劃修是國內(nèi)外城市采用的主流列車維修方式[11-13],即只要設(shè)備到了規(guī)定時期就需進(jìn)行維修與替換。在國內(nèi)計(jì)劃修的維護(hù)規(guī)程中,架修和大修均需要對車輛解體并更換一系列設(shè)備重新組裝,架修涉及車輛的大部分部件,而大修則是全面性深層修理[10]。經(jīng)過架修或大修后的列車幾乎接近新車,所有因累計(jì)走行公里產(chǎn)生的部件損耗及老化將全部消除,應(yīng)對其故障發(fā)生概率產(chǎn)生顯著影響。

考慮到城市軌道交通列車每日發(fā)生故障一般屬于小概率事件,需要在一定的走行公里范圍內(nèi)對其進(jìn)行觀察。根據(jù)《地鐵設(shè)計(jì)規(guī)范》[3],新建地鐵工程的車輛架修和大修周期分別應(yīng)為60萬km、120萬km,在無法得到詳細(xì)行車資料的情況下可分別采用5年、10年的時間間隔,則走行公里與時間間隔之間的關(guān)系可依此推算為12萬km對應(yīng)1年。為此,本文在生成離散型數(shù)據(jù)集時選擇以12萬km為間隔劃分每列車的累計(jì)走行公里,觀測其在每個12萬km內(nèi)發(fā)生故障的次數(shù)。在這個觀測范圍下,可以減小季節(jié)氣候、列車擁擠度[8,14]等因素對列車故障發(fā)生概率預(yù)測精度的影響程度。

綜上所述,最終通過定性分析得到的列車故障發(fā)生概率的主要影響因素為列車編組數(shù)、累計(jì)走行公里、架修或大修經(jīng)歷。下面將基于實(shí)際數(shù)據(jù)生成包含上述影響因素的離散型數(shù)據(jù)集。

2 數(shù)據(jù)來源及處理

2.1 數(shù)據(jù)來源

本文數(shù)據(jù)由某城市軌道交通公司提供,具體包括全網(wǎng)各線列車的首次正式投入使用日期、2011至2019年間架修和大修記錄、2017至2019年間故障記錄(含故障發(fā)生的時間、地點(diǎn)及原因)、編組情況以及全網(wǎng)各線2011至2019每年總列車運(yùn)營里程。

經(jīng)過初步數(shù)據(jù)整理,共有910列對象列車、600起在正線上發(fā)生的列車故障記錄。首先,剔除了其中投入運(yùn)營時間不明(35列)、列車編組有變更(2列)、架修和大修記錄缺失(76列)的對象列車。其次,考慮到因偶然因素造成的列車故障隨機(jī)性太強(qiáng),為了避免各類偶然因素對主要影響因素的干擾,剔除了因異物卡阻(30起)、乘客沖門(15起)、其余偶然因素(56起)造成的列車故障記錄。最終保留了797列對象列車、499起列車故障記錄作為后續(xù)研究的基礎(chǔ)數(shù)據(jù)。

2.2 數(shù)據(jù)處理

基礎(chǔ)數(shù)據(jù)未直接給出列車的累計(jì)走行公里,需要通過列車的累計(jì)運(yùn)營時間乘以日均走行公里進(jìn)行推算。

列車的累計(jì)運(yùn)營時間可根據(jù)列車的首次正式投入使用日期、架修和大修記錄確定。首先用列車首次正式投入使用日期作為累計(jì)運(yùn)營時間的起始日期,之后查詢列車是否有過架修或大修經(jīng)歷,如果有,則累計(jì)運(yùn)營時間的起始日期需更換為列車完成最近一次架修或大修后正式投入使用的日期,以重置其累計(jì)運(yùn)營時間。至于是否應(yīng)對架修后的列車和大修后的列車進(jìn)行區(qū)分,考慮到架修和大修的本質(zhì)都是對列車部件進(jìn)行更新,只是大修更全面徹底,所以如果造成列車故障的部件均在架修和大修時涉及檢修和更換,則無需對兩者進(jìn)行區(qū)分。為此,對列車故障成因進(jìn)行統(tǒng)計(jì),如圖1所示?;谖墨I(xiàn)[15]并結(jié)合圖1可知,除“其他”以外的列車故障成因所涉及的部件均會在架修和大修中進(jìn)行檢修和更換,故本文不再對兩者進(jìn)行區(qū)分。

圖1 列車故障成因統(tǒng)計(jì)Fig.1 Statistics of train fault cause

日均走行公里通常由年總列車運(yùn)營里程除以年總列車數(shù)再除以365d得到,但其忽略了該年新上線列車實(shí)際開行天數(shù)不到365d的問題,從而導(dǎo)致日均走行公里偏小。本文在計(jì)算日均走行公里時對此做了改進(jìn),即

式中:ld,I為列車在第I年日均走行公里,km·d-1;LI為第I年總列車運(yùn)營里程,km;NI為第I年總列車擁有數(shù),列;Di,I為第i列列車在第I年實(shí)際開行天數(shù)。

在實(shí)現(xiàn)列車?yán)塾?jì)走行公里的可推算后,以12萬km為間隔將其依次劃分出多個累計(jì)走行公里階段并確定每個階段的起止日期。由于列車故障記錄的時間范圍為2017至2019年,因此只能將起止日期均在2017至2019年內(nèi)的累計(jì)走行公里階段作為統(tǒng)計(jì)對象,對列車在該階段發(fā)生故障的次數(shù)進(jìn)行計(jì)數(shù),具體步驟如圖2所示。

圖2 單列車在各累計(jì)走行公里階段故障發(fā)生次數(shù)的數(shù)據(jù)生成Fig.2 Data generation of fault occurrence number for single train in each cumulative running kilometer period

在基礎(chǔ)數(shù)據(jù)的797列對象列車中,有130列因正式投入運(yùn)營時間較晚未在2017至2019年完成第1個12萬km階段,未被計(jì)入數(shù)據(jù)集。在剩余的對象列車中,分別有271、325、71列在2017至2019年完成了1、2、3個12萬km階段,在數(shù)據(jù)集中相應(yīng)地被計(jì)入1、2、3次。在基礎(chǔ)數(shù)據(jù)的499起列車故障記錄中,有254起的發(fā)生日期未在其關(guān)聯(lián)的對象列車于2017至2019年完成任一12萬km階段的起止日期范圍內(nèi),未被計(jì)入數(shù)據(jù)集。因此,最終生成的數(shù)據(jù)集中共有1134列對象列車(重復(fù)的對象列車因所處累計(jì)走行公里階段不同而具有獨(dú)立性,故視作一列新的對象列車),245起列車故障記錄。各累計(jì)走行公里階段的統(tǒng)計(jì)情況如表1所示。

表1 各累計(jì)走行公里階段統(tǒng)計(jì)情況Tab.1 Statistics of each cumulative running kilometer period

圖3 列車故障發(fā)生頻率隨累計(jì)走行公里階段變化的趨勢Fig.3 Trend of train fault frequency with cumulative running kilometer period

從表1可知,隨著累計(jì)走行公里階段的推移,列車故障發(fā)生頻率基本符合先減少再回升的規(guī)律,二次拋物線形式較適合描述該影響規(guī)律,如圖3所示。8節(jié)編組的列車故障發(fā)生頻率最高,但整體來看不同列車編組數(shù)的列車故障發(fā)生頻率之間沒有明顯的遞變規(guī)律,這可能是由于4、7節(jié)編組的總對象列車數(shù)較少導(dǎo)致其頻率有一定的異常和不穩(wěn)定性,從而干擾了變化規(guī)律的直觀判斷。為此采用專門描述定序分類變量間相關(guān)程度的Kendall相關(guān)系數(shù)[16]分析列車編組數(shù)與列車故障發(fā)生次數(shù)之間的影響規(guī)律,結(jié)果兩者的Kendall相關(guān)系數(shù)為0.13,p值為5.65×10-6小于0.05,由此可認(rèn)為列車編組數(shù)與列車故障發(fā)生次數(shù)正相關(guān),一定程度上印證了之前關(guān)于列車編組數(shù)對列車故障發(fā)生概率影響的定性分析。

3 列車故障發(fā)生概率預(yù)測模型

3.1 備選模型

為了從泊松分布、負(fù)二項(xiàng)分布、零膨脹泊松分布、零膨脹負(fù)二項(xiàng)分布中選擇合適的分布構(gòu)建模型,需觀測離散型數(shù)據(jù)集內(nèi)不同列車故障發(fā)生次數(shù)的出現(xiàn)頻數(shù),并計(jì)算列車故障發(fā)生次數(shù)總體均值及方差,結(jié)果如圖4所示。從中可知,列車故障發(fā)生次數(shù)總體均值與方差十分接近,這符合泊松分布的要求,而列車故障發(fā)生0次的數(shù)據(jù)占比達(dá)到81.2%,不能忽視可能存在的零過多現(xiàn)象,故零膨脹泊松分布也值得嘗試。因此,選擇泊松分布與零膨脹泊松分布構(gòu)建相應(yīng)的備選模型。

泊松分布在離散數(shù)據(jù)分析中相當(dāng)常用。假定隨機(jī)變量Y服從泊松分布,則其概率函數(shù)如下:

式中:λ為泊松參數(shù),一旦確定即可計(jì)算隨機(jī)變量Y取不同值的概率;y為列車走行一個12萬km期間在正線上發(fā)生故障的次數(shù)。

圖4 列車故障發(fā)生次數(shù)的觀測頻數(shù)Fig.4 Observation frequencies for different train fault occurrence numbers

只要建立泊松參數(shù)與列車編組數(shù)、列車當(dāng)前所處累計(jì)走行公里階段的序號之間的回歸方程,即可實(shí)現(xiàn)考慮各主要影響因素情況下列車故障發(fā)生概率的預(yù)測。泊松參數(shù)與自變量之間的回歸通常采用對數(shù)線性模型[17],且累計(jì)走行公里階段推移對列車故障發(fā)生概率的影響規(guī)律較適合用二次拋物線描述,由此得到模型一如下:

式中:T為列車當(dāng)前所處累計(jì)走行公里階段的序號,取值為1,2,…,對應(yīng)第1,2,…個12萬km階段,在架修或大修后需重新累計(jì);C為列車編組數(shù),根據(jù)國內(nèi)常 用 的 編組 形式 ,取 值 一 般 為 4,5,6,7,8;β0,β1,β2,β3為待估系數(shù)。

零膨脹泊松分布是在泊松分布的基礎(chǔ)上考慮數(shù)據(jù)集存在零過多現(xiàn)象而提出的分布。假定隨機(jī)變量Y服從零膨脹泊松分布,則其概率函數(shù)如下:

式中:φ為零膨脹參數(shù),表示取值為0的非泊松數(shù)據(jù)所占的比例。當(dāng)0<φ<1時,數(shù)據(jù)集存在零過多現(xiàn)象,若φ=0,則式(4)將退化為式(2)。當(dāng)泊松參數(shù)與零膨脹參數(shù)都確定后,才可計(jì)算隨機(jī)變量Y取不同值的概率。

泊松參數(shù)與零膨脹參數(shù)應(yīng)彼此獨(dú)立并均與主要影響因素有所關(guān)聯(lián),為此需對泊松參數(shù)、零膨脹泊松參數(shù)與列車編組數(shù)、列車當(dāng)前所處累計(jì)走行公里階段的序號進(jìn)行兩兩組合來建立回歸方程,共有2種可能的組合方案。泊松參數(shù)與自變量之間的回歸依舊采用對數(shù)線性模型,零膨脹參數(shù)與自變量之間的回歸通常采用logistic回歸模型[17],且累計(jì)走行公里階段推移對列車故障發(fā)生概率的影響規(guī)律仍用二次拋物線描述,由此得到模型二、模型三,分別如下:

式中:α0,α1,α2為待估系數(shù)。

3.2 系數(shù)標(biāo)定

三個備選模型中待估系數(shù)的標(biāo)定基于極大似然估計(jì),通過Gauss-Newton迭代法獲得數(shù)值解[17],顯著性水平取0.05,具體計(jì)算過程由Stata數(shù)據(jù)分析軟件完成。

各備選模型的估計(jì)結(jié)果如表2所示,各模型中變量C的系數(shù)均反映了列車編組數(shù)的增加會提高列車故障發(fā)生概率,變量T和T2的系數(shù)均反映了累計(jì)走行公里的增加會使列車故障發(fā)生概率先降低后回升。其中,模型一中所有變量均通過顯著性檢驗(yàn),模型成立;模型二中泊松參數(shù)與零膨脹參數(shù)的常數(shù)項(xiàng)未通過顯著性檢驗(yàn),在經(jīng)過各種可能的嘗試后,發(fā)現(xiàn)剔除泊松參數(shù)的常數(shù)項(xiàng)可使剩余變量均通過顯著性檢驗(yàn),由此得到改進(jìn)后的模型二;模型三中零膨脹參數(shù)的變量均未通過顯著性檢驗(yàn),在經(jīng)過各種可能的嘗試后,發(fā)現(xiàn)模型三始終無法成立,故在后續(xù)模型比選時不再考慮。

表2 模型估計(jì)結(jié)果Tab.2 Estimated results of alternative models

3.3 模型比選

針對模型一和模型二,從兩方面定量比較兩者的優(yōu)劣。首先,比較兩個模型所預(yù)測的不同累計(jì)走行公里階段總列車故障記錄數(shù)與實(shí)際值的平均差異程度δ,計(jì)算方法見式(7)。該數(shù)值越低說明模型預(yù)測效果越好,具體結(jié)果見表3。

表3 各累計(jì)走行公里階段總列車故障記錄數(shù)的預(yù)測結(jié)果Tab.3 Predicted results of total train fault records in each cumulative running kilometer period

式中:f0,k為第k個階段實(shí)際的總列車故障記錄數(shù);fe,k為第k個階段預(yù)測的總列車故障記錄數(shù);N為階段個數(shù)。

其次,繪制ROC曲線比較兩個模型的泛化能力,ROC曲線下包含的面積越大,模型泛化性能越好[8]。需要注意的是,ROC曲線的適用范圍是二分類問題,而兩個模型中列車故障發(fā)生次數(shù)存在0、1、2、3起的類別,屬于多分類問題,所以需要進(jìn)行二分類的轉(zhuǎn)化:列車未發(fā)生故障(0起)、列車發(fā)生了故障(1起以上)。繪制得到的ROC曲線如圖5所示。

從比較結(jié)果來看,模型一無論是預(yù)測效果還是泛化能力均優(yōu)于模型二。因此,最終的城市軌道交通正線列車故障發(fā)生概率預(yù)測模型如下:

圖5 各備選模型的ROC曲線Fig.5 ROC curves for each alternative model

確定泊松參數(shù)后,便可通過1-P(Y=0)得到列車故障發(fā)生概率。不同列車編組數(shù)、累計(jì)走行公里階段組合下的列車故障發(fā)生概率如表4所示。通過比較列車故障發(fā)生概率在橫向、縱向的增長情況可知,在城市軌道交通列車處于第6個12萬km階段之前,相比于累計(jì)走行公里階段的推移,列車編組數(shù)的增加對列車故障發(fā)生概率的影響更大。這可能是因?yàn)檎熊嚳梢暈橛啥喙?jié)車廂組成的串聯(lián)系統(tǒng),車廂數(shù)越多整列車的可靠性越低,而每節(jié)車廂的可靠性只有在達(dá)到一定使用程度后才會發(fā)生大的變化,從而導(dǎo)致了很長一段時間內(nèi)整列車的故障發(fā)生概率更容易受列車編組數(shù)的影響。

表4 不同影響因素組合下的列車故障發(fā)生概率Tab.4 Train fault probabilities corresponding to different combinations of influencing factors

4 結(jié)論

以城市軌道交通列車為研究主體,綜合考慮多方因素,提出了基于泊松分布的城市軌道交通正線列車故障發(fā)生概率預(yù)測模型。主要研究工作總結(jié)如下:

(1)通過定性分析得到列車編組數(shù)、累計(jì)走行公里、架修或大修經(jīng)歷為列車故障發(fā)生概率的主要影響因素。當(dāng)列車經(jīng)歷架修或大修后,需重新累計(jì)其走行公里。

(2)探究了各影響因素對列車故障發(fā)生概率的影響規(guī)律:列車編組數(shù)的增加會提高列車故障發(fā)生概率;累計(jì)走行公里的增加會使列車故障發(fā)生概率先降低后回升。

(3)以每12萬km為觀測范圍生成單列車在一定走行公里內(nèi)故障發(fā)生次數(shù)的離散數(shù)據(jù)集,基于數(shù)據(jù)呈現(xiàn)的分布特征選擇泊松分布、零膨脹泊松分布構(gòu)建了3個備選模型。之后根據(jù)顯著性檢驗(yàn)、預(yù)測值與實(shí)際值的平均差異程度以及ROC曲線進(jìn)行模型比選,結(jié)果顯示基于泊松分布的模型最優(yōu)。由此提出了基于泊松分布的城市軌道交通正線列車故障發(fā)生概率預(yù)測模型。

(4)根據(jù)模型結(jié)果可推斷:在列車編組數(shù)固定的情況下,列車故障發(fā)生概率會在列車投入運(yùn)營后的第4個12萬km階段達(dá)到最低值,在第7個12萬km階段超過初始值。

猜你喜歡
泊松正線編組
基于泊松對相關(guān)的偽隨機(jī)數(shù)發(fā)生器的統(tǒng)計(jì)測試方法
帶有雙臨界項(xiàng)的薛定諤-泊松系統(tǒng)非平凡解的存在性
基于靈活編組的互聯(lián)互通車載電子地圖設(shè)計(jì)及動態(tài)加載
城市有軌電車正線道岔控制系統(tǒng)研究與設(shè)計(jì)
地鐵正線聯(lián)鎖表自動設(shè)計(jì)的研究
表觀對稱的輪廓編組算法
京九線站內(nèi)正線股道分割電碼化機(jī)車無碼問題分析及處理
滬蓉線站內(nèi)正線道岔區(qū)段信號突變的改進(jìn)措施
泊松著色代數(shù)
1<γ<6/5時歐拉-泊松方程組平衡解的存在性
拉孜县| 正宁县| 尚义县| 乐山市| 新闻| 会宁县| 岳池县| 枣庄市| 镇原县| 神农架林区| 资中县| 尖扎县| 陈巴尔虎旗| 泾川县| 台中市| 奉贤区| 万源市| 神木县| 鄂托克旗| 靖安县| 绥芬河市| 冷水江市| 河源市| 绥化市| 东宁县| 郧西县| 广平县| 临沭县| 宜春市| 肃宁县| 都江堰市| 田林县| 元江| 昌邑市| 抚松县| 丹江口市| 灯塔市| 孟州市| 石台县| 紫金县| 南郑县|