譚力天,陳 昕,李澎東
(湖南中車時(shí)代通信信號(hào)有限公司,湖南 長(zhǎng)沙 410005)
基于通信的列車運(yùn)行控制系統(tǒng)(communication based train control, CBTC)主要包括列車自動(dòng)駕駛(automatic train operation, ATO)、列車自動(dòng)防護(hù)(automatic train protection, ATP)、區(qū)域控制器(zone controller, ZC)、聯(lián)鎖(computer interlocking, CI)、列車自動(dòng)監(jiān)控(automatic train supervision, ATS)及數(shù)據(jù)通信系統(tǒng)(data communication system, DCS)等子系統(tǒng)[1-2]。在系統(tǒng)運(yùn)行過(guò)程中,各子系統(tǒng)間數(shù)據(jù)實(shí)時(shí)交互,會(huì)產(chǎn)生大量的日志數(shù)據(jù)。由于子系統(tǒng)記錄日志數(shù)據(jù)具有專業(yè)性,使得數(shù)據(jù)分析成為一項(xiàng)繁重、復(fù)雜的專業(yè)工作。目前對(duì)運(yùn)行數(shù)據(jù)的分析與CBTC 系統(tǒng)故障定位不僅嚴(yán)重依賴工作人員專業(yè)技能,同時(shí)只能被動(dòng)地等待問(wèn)題出現(xiàn)后以時(shí)間點(diǎn)去定位故障位置,處理問(wèn)題效率低但對(duì)工作人員專業(yè)技能要求高。
目前,在故障診斷方面,故障診斷專家系統(tǒng)應(yīng)用人類專家的知識(shí)和解決問(wèn)題的方法,通過(guò)建立知識(shí)庫(kù)與推理機(jī),實(shí)現(xiàn)確定性故障診斷[3],其被應(yīng)用到ZPW2000A型無(wú)絕緣移頻閉塞設(shè)備的故障診斷,通過(guò)歸納常見故障類型及特征,實(shí)現(xiàn)專家系統(tǒng)功能模塊的構(gòu)建[4];小波分析和深度信念網(wǎng)絡(luò)概念被引入到列車牽引系統(tǒng)故障診斷之中,在離線機(jī)車記錄分析中發(fā)揮了作用[5];模糊Petri網(wǎng)絡(luò)模型與神經(jīng)網(wǎng)絡(luò)算法的結(jié)合應(yīng)用,實(shí)現(xiàn)了故障診斷算法的動(dòng)態(tài)自適應(yīng),提高了故障診斷的準(zhǔn)確度[6];而統(tǒng)計(jì)學(xué)方法適用于大數(shù)據(jù)系統(tǒng),其基于多向保局投影[7]進(jìn)行過(guò)程監(jiān)控故障診斷,利用統(tǒng)計(jì)學(xué)特性將過(guò)程監(jiān)控的故障數(shù)據(jù)投影到統(tǒng)計(jì)模型中,從而獲得故障特征[8]?;诮y(tǒng)計(jì)學(xué)的模型故障診斷方法主要包括貢獻(xiàn)圖法、結(jié)構(gòu)化殘差法、信號(hào)重構(gòu)法和模式分類法[9],其中模式分類法是通過(guò)統(tǒng)計(jì)方法獲得故障的表征模式,由于不同的故障在特性上通常具有相似性,通過(guò)建立故障信息庫(kù),可以采用模式分類方法對(duì)故障進(jìn)行分類。統(tǒng)計(jì)學(xué)馬爾可夫模型是以簡(jiǎn)單的表述解決復(fù)雜的問(wèn)題,自20 世紀(jì)80 年代開始被陸續(xù)成功地應(yīng)用于語(yǔ)音識(shí)別、機(jī)器翻譯、拼寫糾錯(cuò)、圖像處理和基因序列分析等多個(gè)領(lǐng)域[10-11]。文獻(xiàn)[3-4]中故障診斷專家系統(tǒng)需要搭建知識(shí)庫(kù)與推理機(jī)進(jìn)行故障診斷,較統(tǒng)計(jì)學(xué)方法復(fù)雜;文獻(xiàn)[5-6]在實(shí)時(shí)故障診斷方面應(yīng)用較統(tǒng)計(jì)學(xué)方法還不成熟;而統(tǒng)計(jì)學(xué)方法應(yīng)用成熟可靠,其大數(shù)據(jù)特性適用范圍廣,并已經(jīng)在城市軌道交通領(lǐng)域列車自動(dòng)監(jiān)控方面取得應(yīng)用。為此,本文提出一種基于統(tǒng)計(jì)學(xué)模型的故障診斷方法,以實(shí)現(xiàn)對(duì)城軌CBTC 信號(hào)系統(tǒng)故障的快速、準(zhǔn)確定位。
針對(duì)CBTC 系統(tǒng)故障,相應(yīng)系統(tǒng)的運(yùn)營(yíng)或售后服務(wù)人員憑借自身的經(jīng)驗(yàn)和知識(shí),通過(guò)分析故障時(shí)間段內(nèi)日志數(shù)據(jù)來(lái)進(jìn)行維護(hù)和故障分析。在實(shí)際維護(hù)過(guò)程中,各子系統(tǒng)間的配合和運(yùn)營(yíng)或售后人員的技術(shù)水平直接影響故障分析的效率和準(zhǔn)確性,在很多情況下需要研發(fā)人員介入分析。運(yùn)營(yíng)或售后人員及研發(fā)人員需依靠培訓(xùn)或?qū)W習(xí)來(lái)提高技術(shù)水平,易受到人員流動(dòng)或成長(zhǎng)周期等因素影響,成本較高、成效較慢。
CBTC 系統(tǒng)是地鐵運(yùn)營(yíng)中的“大腦”,需各子系統(tǒng)密切聯(lián)系、相互協(xié)作,使得故障現(xiàn)象表征子系統(tǒng)和實(shí)際故障子系統(tǒng)可能不一致,單獨(dú)分析子系統(tǒng)不能及時(shí)定位故障,需要多個(gè)子系統(tǒng)專業(yè)人員的相互配合,效率低,通用性不強(qiáng)。
在CBTC 系統(tǒng)運(yùn)行過(guò)程中產(chǎn)生的大量日志數(shù)據(jù)只有在系統(tǒng)故障時(shí)才會(huì)用來(lái)進(jìn)行分析,系統(tǒng)正常運(yùn)行過(guò)程中大量數(shù)據(jù)被保存但未被充分利用,造成數(shù)據(jù)的“浪費(fèi)”,而采用統(tǒng)計(jì)學(xué)模型對(duì)日常數(shù)據(jù)進(jìn)行分析處理,利用數(shù)據(jù)特性建立對(duì)應(yīng)模型,通用性較強(qiáng),適用范圍較廣,不僅可以快速定位系統(tǒng)故障,還可以提供一定的故障預(yù)警。
CBTC 系統(tǒng)是由多個(gè)子系統(tǒng)構(gòu)成的復(fù)雜系統(tǒng),子系統(tǒng)間相互協(xié)作,保障列車正常運(yùn)行。CBTC 系統(tǒng)故障的原因較為復(fù)雜和多樣,各子系統(tǒng)都具有相應(yīng)的日志記錄作為故障分析的基礎(chǔ)。CBTC 系統(tǒng)各子系統(tǒng)關(guān)聯(lián)關(guān)系如圖1 所示。
圖1 CBTC 子系統(tǒng)間關(guān)聯(lián)關(guān)系Fig. 1 Subsystem association of the CBTC system
DCS 提供圖1 中各子系統(tǒng)設(shè)備間安全、可靠的數(shù)據(jù)交互。列車運(yùn)行速度控制級(jí)別由低到高分別為聯(lián)鎖控制級(jí)別(IXLC)、點(diǎn)式列車控制級(jí)別(ITC)和連續(xù)列車控制級(jí)別(CTC),其中CTC 級(jí)別下列車運(yùn)行效率最高,是正常運(yùn)營(yíng)過(guò)程中最常用的級(jí)別。ZC 是在CTC級(jí)別下的核心設(shè)備,本文以ZC 為例進(jìn)行故障分類分析。
為快速定位故障原因,對(duì)所有涉及ZC 并在ZC 中有異?,F(xiàn)象的故障進(jìn)行分類,并利用統(tǒng)計(jì)學(xué)進(jìn)行建模?;诂F(xiàn)場(chǎng),涉及ZC 的關(guān)聯(lián)故障主要有:(1)列車與ZC 通信故障,ZC 表現(xiàn)為將該車置為安全態(tài);(2)CI與ZC 通信故障,ZC 表現(xiàn)為將該CI 涉及軌旁設(shè)備置為安全態(tài);(3)相鄰ZC 與ZC 通信故障,ZC 表現(xiàn)為將該相鄰ZC 涉及并與本ZC 相關(guān)聯(lián)的軌旁設(shè)備置為安全態(tài);(4)軌旁設(shè)備故障,ZC 表現(xiàn)為將該軌旁設(shè)備涉及移動(dòng)授權(quán)計(jì)算按安全態(tài)處理;(5)列車升級(jí)CTC相關(guān)設(shè)備故障,ZC 表現(xiàn)為該列車始終無(wú)法升級(jí)為CTC級(jí)別;(6)列車運(yùn)行異常,ZC 表現(xiàn)為將該列車置為安全態(tài);(7)ZC 軟件故障,ZC 表現(xiàn)為涉及范圍內(nèi)的列車非正常置為安全態(tài);(8)ZC 硬件故障,ZC 表現(xiàn)為設(shè)備狀態(tài)置為安全態(tài)。
統(tǒng)計(jì)學(xué)模型依賴于所采用的樣本數(shù)據(jù),樣本數(shù)據(jù)越全面、充分,對(duì)應(yīng)的模型越準(zhǔn)確。針對(duì)地鐵運(yùn)營(yíng)的特性,隨著其運(yùn)營(yíng)里程的增長(zhǎng),設(shè)備故障數(shù)據(jù)樣本逐漸增多,其可用性和全面性也越佳,則越有利于提高統(tǒng)計(jì)學(xué)模型的性能。
假定某一故障出現(xiàn)的概率為一條件概率值P(S),認(rèn)為該故障受w1, w2, …, wn共n 個(gè)不同事件共同影響,則該故障出現(xiàn)的概率P(w1, w2,…, wn)按照條件概率公式展開后為
其中,P(w1)表示第一個(gè)事件發(fā)生的概率;P(w2|w1) 表示在已知第一個(gè)事件發(fā)生的條件下,第二個(gè)事件發(fā)生的概率;以此類推,P(wn|w1, w2,…, wn-1)表示在已知前n-1 個(gè)事件的發(fā)生條件下,第n 個(gè)事件發(fā)生的概率。
實(shí)際應(yīng)用時(shí),到第三個(gè)事件,其條件概率P(w3|w1, w2)的計(jì)算就已較為復(fù)雜并且會(huì)花費(fèi)較多資源。為了解決這種不利局面,馬爾可夫提出了相應(yīng)的簡(jiǎn)化模型,即針對(duì)復(fù)雜的條件概率問(wèn)題,假設(shè)任意事件wi(i=1, 2, …, n)的條件概率只同其前一個(gè)事件wi-1有關(guān),于是P(S)可以表示為
式(2)為統(tǒng)計(jì)學(xué)二元模型??紤]到時(shí)間和空間的資源消耗與模型精確性間的平衡,本文采用二元模型。
在ZC 關(guān)聯(lián)故障分析中,只考慮當(dāng)故障前提條件發(fā)生時(shí)故障概率的統(tǒng)計(jì),即ZC 關(guān)聯(lián)故障分類與實(shí)際故障原因之間的概率統(tǒng)計(jì)關(guān)系。
根據(jù)大數(shù)定理,以采樣數(shù)據(jù)觀察結(jié)果作為統(tǒng)計(jì)學(xué)概率計(jì)算基礎(chǔ)。由于統(tǒng)計(jì)觀察結(jié)果存在局限性,那么有這樣一種可能性,即在觀察結(jié)果中雖未出現(xiàn)某一故障,但是從概率角度不能認(rèn)為這種情況不會(huì)發(fā)生。首先,采用古德-圖靈方法對(duì)出現(xiàn)次數(shù)非常少(少于經(jīng)驗(yàn)閾值)的條件事件減小條件概率,經(jīng)過(guò)上述處理后的概率稱之為相對(duì)頻度;其次,為了保證所有條件概率之和為1,同時(shí)為了避免在統(tǒng)計(jì)過(guò)程中出現(xiàn)未發(fā)生故障的概率為0 的情況,需保證訓(xùn)練用數(shù)據(jù)樣本的全面性和充分性,并為統(tǒng)計(jì)沒有出現(xiàn)的事件進(jìn)行條件概率分配,即補(bǔ)償相對(duì)頻度。卡茨退避法是一種概率平滑方法,模型訓(xùn)練時(shí)采用該方法處理零概率問(wèn)題,并采用概率擬合的方式對(duì)統(tǒng)計(jì)學(xué)概率進(jìn)行連續(xù)平滑,具體處理表示為
式中:wi-1——故障原因;wi——故障現(xiàn)象;f()——統(tǒng)計(jì)學(xué)相對(duì)頻度;fg()——統(tǒng)計(jì)學(xué)采用古德-圖靈估計(jì)后的相對(duì)頻度;Q(wi-1)——估計(jì)補(bǔ)償相對(duì)頻度;N——統(tǒng)計(jì)學(xué)頻次;T—相應(yīng)閾值,統(tǒng)計(jì)頻次不小于閾值,則認(rèn)為概率估計(jì)與相對(duì)頻度一致。
訓(xùn)練過(guò)程如下:
(1)數(shù)據(jù)預(yù)處理。首先明確選用數(shù)據(jù)的可靠性和有效性,而后以隨機(jī)抽樣的方法選擇數(shù)據(jù)樣本。
(2)訓(xùn)練參數(shù)調(diào)整。為保證訓(xùn)練結(jié)果符合上文概率要求,適當(dāng)選擇式(3)中的T 值(經(jīng)驗(yàn)值一般在8~10 之間,可根據(jù)實(shí)際情況做調(diào)整),保證概率估計(jì)曲線平滑。
本文以ZC 關(guān)聯(lián)故障為例建立故障診斷統(tǒng)計(jì)學(xué)模型,以故障時(shí)刻前后1 h 數(shù)據(jù)作為故障數(shù)據(jù)樣本,通過(guò)確定故障分類,構(gòu)建故障診斷系統(tǒng)的測(cè)試集,測(cè)試所有故障分類。對(duì)應(yīng)ZC 關(guān)聯(lián)故障總結(jié):(1)w11為列車-ZC 通信故障,w12為列車安全態(tài);(2)w21為CI-ZC 通信故障,w22為該CI 涉及軌旁設(shè)備置為安全態(tài);(3)w31為相鄰ZC-ZC 通信故障,w32為該相鄰ZC 涉及與本ZC相關(guān)聯(lián)的軌旁設(shè)備置為安全態(tài);(4)w41為軌旁設(shè)備故障,w42為將該軌旁設(shè)備涉及移動(dòng)授權(quán)計(jì)算按安全態(tài)處理;(5)w51為列車升級(jí)CTC 相關(guān)設(shè)備故障,w52為該列車無(wú)法升級(jí)為CTC 級(jí)別;(6)w61為列車運(yùn)行異常,w62為將該列車置為安全態(tài);(7)w71為ZC 軟件故障,w72為涉及ZC 范圍內(nèi)的列車非正常置為安全態(tài);(8)w81為ZC 硬件故障,w82為設(shè)備狀態(tài)置為安全態(tài)。
本文采集數(shù)據(jù)樣本隨機(jī)選取調(diào)試運(yùn)行階段ZC 系統(tǒng)一個(gè)月內(nèi)的運(yùn)行數(shù)據(jù),在所有樣本中隨機(jī)選擇800 組作為訓(xùn)練數(shù)據(jù)樣本,隨機(jī)選擇其中的75%為訓(xùn)練數(shù)據(jù),25%為測(cè)試樣本驗(yàn)證訓(xùn)練結(jié)果,盡可能完整地包括了本文所定義的所有ZC 關(guān)聯(lián)故障類型。用古德-圖靈方法對(duì)ZC 硬件故障統(tǒng)計(jì)概率為0 的事件進(jìn)行了處理,利用卡茨退避法獲得ZC 關(guān)聯(lián)故障的數(shù)據(jù)統(tǒng)計(jì)概率(圖2)。圖中通過(guò)概率平滑處理曲線擬合,縱坐標(biāo)為相對(duì)頻次,表示故障統(tǒng)計(jì)的概率擬合;橫坐標(biāo)為故障分類。
圖2 故障概率分布擬合曲線Fig. 2 Fitting curve of fault probability distribution
在長(zhǎng)沙軌道交通4 號(hào)線調(diào)試運(yùn)行階段對(duì)本文方法進(jìn)行驗(yàn)證應(yīng)用,通過(guò)對(duì)8 類ZC 關(guān)聯(lián)故障進(jìn)行測(cè)試,201 組故障診斷測(cè)試結(jié)果如表1 所示。通過(guò)驗(yàn)證,可以看到其中列車-ZC 通信故障、CI-ZC 通信故障、相鄰ZC-ZC 通信故障和ZC 硬件故障的分類診斷準(zhǔn)確率均為100%,統(tǒng)計(jì)學(xué)方法模型對(duì)通信類故障、硬件類故障識(shí)別率最高;而對(duì)列車運(yùn)行異常和ZC 軟件故障的分類診斷準(zhǔn)確率較低,其中ZC 軟件故障診斷準(zhǔn)確率最低只有84.21%,由于ZC 軟件故障在故障總體分布中所占比例較低,導(dǎo)致部分該類故障易被誤判,本驗(yàn)證應(yīng)用給調(diào)試運(yùn)行提供了有效數(shù)據(jù)支撐和判斷依據(jù)??梢娀诮y(tǒng)計(jì)學(xué)的故障診斷模型可以較好地定位故障,有利于提高調(diào)試或維護(hù)人員的工作效率。
表1 ZC 關(guān)聯(lián)故障分類測(cè)試結(jié)果Tab. 1 Test results of ZC associated fault classification
本文提出了一種基于統(tǒng)計(jì)學(xué)模型的故障診斷方法,并以ZC 關(guān)聯(lián)故障為例,通過(guò)統(tǒng)計(jì)學(xué)方法提取故障樣本數(shù)據(jù),建立并訓(xùn)練故障診斷模型。在長(zhǎng)沙軌道交通4 號(hào)線調(diào)試運(yùn)行階段的驗(yàn)證應(yīng)用表明,該故障診斷模型可以用于CBTC 系統(tǒng)故障診斷快速定位。在智慧城市建設(shè)中,城市軌道交通的智能化運(yùn)維是一種趨勢(shì)。在提高故障診斷的準(zhǔn)確性、快速性、實(shí)時(shí)性和適用范圍,實(shí)現(xiàn)系統(tǒng)高度集成、大數(shù)據(jù)分析、調(diào)度綜合統(tǒng)籌等方面,統(tǒng)計(jì)學(xué)方法是未來(lái)維護(hù)智能化的有效手段。同時(shí),對(duì)于在統(tǒng)計(jì)學(xué)中分布概率值在總體分布中占比較低的分類,其故障診斷正確率較低的問(wèn)題,下一步可以在本文所提方法的基礎(chǔ)上應(yīng)用模式識(shí)別法來(lái)提高故障診斷正確率。