摘 要:隨著信息技術(shù)發(fā)展,鐵路信號系統(tǒng)的復(fù)雜性和外界環(huán)境的不確定性使故障發(fā)生的概率越來越高。為了優(yōu)化故障預(yù)警系統(tǒng),更好地應(yīng)用預(yù)防維護(hù)技術(shù),本文提出了基于局部加權(quán)回歸(Locally Weighted Regression,LOESS)和經(jīng)驗(yàn)?zāi)B(tài)分解(Ensemble Empirical Mode Decomposition,EEMD)的數(shù)據(jù)預(yù)處理系統(tǒng),利用主成分分析(Principal Component Analysis,PCA)和自動編碼器提取并優(yōu)化數(shù)據(jù)特征,構(gòu)建基于門控循環(huán)單元(Glavnoe Razvedivatelnoe Upravlenie, GRU)的故障預(yù)測模型以及基于長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)的預(yù)測性維護(hù)模型。研究結(jié)果表明,本文提出的模型能夠提高故障預(yù)警的準(zhǔn)確性,為鐵路信號系統(tǒng)的穩(wěn)定運(yùn)行提供技術(shù)支持,保障鐵路交通的安全性,提升了運(yùn)行效率。
關(guān)鍵詞:鐵路信號系統(tǒng);故障預(yù)警;預(yù)防維護(hù)
中圖分類號:U 284 " " " " 文獻(xiàn)標(biāo)志碼:A
鐵路交通是現(xiàn)代交通體系的重要組成部分,其安全性和可靠性受到廣泛關(guān)注。由于鐵路信號系統(tǒng)具有復(fù)雜性,因此故障發(fā)生的概率較高,一旦出現(xiàn)故障,就可能導(dǎo)致列車晚點(diǎn)、停運(yùn),甚至發(fā)生重大安全事故。因此,本文研究鐵路信號系統(tǒng)故障預(yù)警技術(shù),優(yōu)化數(shù)據(jù)預(yù)處理、提取特征、構(gòu)建故障預(yù)測模型以及設(shè)計預(yù)防維護(hù)策略等環(huán)節(jié),提高鐵路信號系統(tǒng)的故障診斷準(zhǔn)確率和維護(hù)效率,保障鐵路交通安全。
1 數(shù)據(jù)預(yù)處理與特征提取技術(shù)
1.1 數(shù)據(jù)預(yù)處理與特征提取
采用數(shù)據(jù)預(yù)處理與特征提取技術(shù)進(jìn)行故障檢測。LOESS能夠探索信號數(shù)據(jù)中的局部結(jié)構(gòu),以提高故障檢測的準(zhǔn)確性。LOESS的核心思想是在給定數(shù)據(jù)點(diǎn)附近擬合一個簡單模型。對每個預(yù)測點(diǎn)Xi來說,LOESS對第i個數(shù)據(jù)點(diǎn)Yi進(jìn)行局部擬合,如公式(1)所示。
Yi=β0+β1Xi+εi (1)
式中:εi為誤差項(xiàng);β0、β1為模型的參數(shù),分別為截距和自變量X的系數(shù)。
EEMD是一種處理非線性和非平穩(wěn)時間序列數(shù)據(jù)的有效方法,它利用添加白噪聲系列來解決模式混疊問題,在數(shù)據(jù)中識別固有的振蕩模式[1]。利用希爾伯特黃變換從原始信號中提取EEMD,須滿足2個條件:數(shù)據(jù)極值點(diǎn)的數(shù)目和通過數(shù)據(jù)零點(diǎn)的數(shù)目必須相等或者相差最多1個;在任何點(diǎn),局部對稱軸的平均值為0。在完成數(shù)據(jù)預(yù)處理后,采用主成分分析(Principal Component Analysis,PCA)和自動編碼器提取并選擇特征。
PCA利用線性變換將數(shù)據(jù)轉(zhuǎn)換至新的坐標(biāo)系中,計算過程如公式(2)所示。
W=argmax|WTXTXW| (2)
式中:W為映射矩陣,包括主成分的方向信息;X為原始數(shù)據(jù)矩陣,其中,每行代表1個樣本,每列代表1個特征。解決該優(yōu)化問題,PCA能夠識別最能代表數(shù)據(jù)集變化的特征向量。
自動編碼器是一種無監(jiān)督的神經(jīng)網(wǎng)絡(luò),用于學(xué)習(xí)數(shù)據(jù)的有效編碼[2],其目標(biāo)是最小化輸入和輸出之間的差異。訓(xùn)練之后,自動編碼器能夠生成數(shù)據(jù)的簡化版本,可以作為特征輸入后續(xù)的故障預(yù)測模型中。
LOESS和EEMD的數(shù)據(jù)預(yù)處理可以降低數(shù)據(jù)噪聲,突出趨勢,采用PCA和自動編碼器提取并選擇特征不僅可以減少數(shù)據(jù)維度,還能保留最具信息量的特征,為鐵路信號系統(tǒng)的故障預(yù)警提供了可靠的數(shù)據(jù)基礎(chǔ)。
1.2 基于GRU的故障預(yù)測模型
在鐵路信號系統(tǒng)故障預(yù)警技術(shù)領(lǐng)域,構(gòu)建高效的故障預(yù)測模型是提高系統(tǒng)可靠性和安全性的關(guān)鍵。由于在處理時間序列數(shù)據(jù)方面性能優(yōu)異,因此GRU網(wǎng)絡(luò)廣泛應(yīng)用于構(gòu)建故障預(yù)測模型[3]。GRU的核心為更新門Rt和重置門Zt這2個門控結(jié)構(gòu),GRU門控結(jié)構(gòu)如圖1所示。更新門決定保留哪些前一個時刻的信號狀態(tài)信息,以更好地預(yù)測未來可能發(fā)生的故障;重置門決定忽略哪些過去的信息,使模型更專注于當(dāng)前的重要信號,提高預(yù)警準(zhǔn)確性。
更新門Zt的計算過程如公式(3)所示。
Zt=σ(Wz·[ht-1,xt]+bz) (3)
重置門Rt的計算過程公式(4)所示。
Rt=σ(Wr·[ht-1,xt]+br) (4)
式中:xt為在時間的輸入;ht-1為前一時間步的隱藏狀態(tài);σ為Sigmoid激活函數(shù),用戶將輸入值映射至0~1;bz和br分別為用戶更新門和重置門的偏置向量;Wz和Wr分別為用戶更新門和重置門的權(quán)重矩陣。
基于預(yù)處理后的列車歷史故障數(shù)據(jù)集中的運(yùn)行數(shù)據(jù)將其劃分為訓(xùn)練集和測試集。本文采用GRU網(wǎng)絡(luò),該結(jié)構(gòu)由輸入層、數(shù)個GRU隱藏層以及輸出層組成。其中,輸入層的維度與所選特征的數(shù)量有統(tǒng)計學(xué)意義,輸出層的維度對應(yīng)可能出現(xiàn)的故障類型數(shù)目。本文精選了10個關(guān)鍵特征進(jìn)行故障預(yù)測,設(shè)定輸出為5種主要的故障類型,具體數(shù)據(jù)見表1。
輸入層采用鐵路信號系統(tǒng)中關(guān)鍵的運(yùn)行參數(shù)和環(huán)境因素,以浮點(diǎn)數(shù)形式表示,保證數(shù)據(jù)的連續(xù)性和多樣性,為GRU網(wǎng)絡(luò)提供全面的特征信息。輸出層根據(jù)系統(tǒng)中常見的故障類型設(shè)計,以每種故障類型的概率作為輸出,為故障預(yù)警提供了明確目標(biāo)。
1.3 故障等級劃分與預(yù)警機(jī)制
在鐵路信號系統(tǒng)中,劃分故障等級、采用預(yù)警機(jī)制可以提高系統(tǒng)的可靠性。該過程包括精準(zhǔn)地識別故障特征并對其進(jìn)行適當(dāng)分類,以便及時采取響應(yīng)措施。動態(tài)時間規(guī)整(Dynamic Time Warping,DTW)和時間序列聚類是該過程中2種關(guān)鍵的算法[4]。
DTW是一種經(jīng)典算法,可以比較2段時間序列。DTW利用彈性地拉伸或壓縮時間序列來找到2個序列之間的最佳匹配。時間序列聚類是一種將時間序列數(shù)據(jù)進(jìn)行分組,計算時間序列之間的距離的方法,利用K-Means聚類算法將時間序列劃分為不同的類別或簇,使同一組的時間序列相似度高,不同組之間的時間序列相似度低。
本文利用DTW和時間序列聚類對故障信號進(jìn)行等級劃分。利用DTW計算不同故障信號時間序列之間的相似度,以識別并區(qū)分類型不同、嚴(yán)重程度不等的故障模式。采用時間序列聚類算法將特征相似的故障信號進(jìn)行分組,每個組代表一定等級的故障類型。
建立預(yù)警機(jī)制的關(guān)鍵是將故障等級與相應(yīng)的響應(yīng)措施進(jìn)行匹配。對每個故障等級來說,可以設(shè)定特定的預(yù)警閾值,并根據(jù)實(shí)時監(jiān)測的故障信號特征和所屬的故障等級來觸發(fā)相應(yīng)預(yù)警[5]。例如,對輕微故障來說,只需進(jìn)行日常維護(hù);對嚴(yán)重故障來說,需要立即采取緊急措施以避免潛在的安全風(fēng)險。及早發(fā)現(xiàn)并處理故障,能夠顯著提升鐵路信號系統(tǒng)的運(yùn)行安全性和可靠性。
2 鐵路信號系統(tǒng)預(yù)防維護(hù)技術(shù)
2.1 基于LSTM的預(yù)測性維護(hù)模型
在鐵路信號系統(tǒng)中,采取有效的預(yù)防維護(hù)策略是提升系統(tǒng)穩(wěn)定性和降低故障率的關(guān)鍵。LSTM在處理時間序列數(shù)據(jù)方面能力優(yōu)越,廣泛應(yīng)用于構(gòu)建預(yù)測性維護(hù)模型。LSTM特有的門控機(jī)制能夠有效解決傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)在長序列數(shù)據(jù)處理過程中遇到的梯度消失問題,使RNN能夠捕獲時間序列數(shù)據(jù)中的長期依賴關(guān)系。
LSTM單元由遺忘門、輸入門和輸出門3個主要門控結(jié)構(gòu)組成 。遺忘門決定哪些信息應(yīng)從單元狀態(tài)中丟棄,輸入門決定哪些新信息應(yīng)添加至單元狀態(tài),輸出門決定下一個隱藏狀態(tài)的值。LSTM的門控單元結(jié)構(gòu)如圖2所示?;阼F路信號系統(tǒng)的實(shí)際運(yùn)行數(shù)據(jù)收集的輸入數(shù)據(jù)維度見表2。
在網(wǎng)絡(luò)架構(gòu)設(shè)計階段,構(gòu)建1個具有2個LSTM層和1個全連接層的網(wǎng)絡(luò)。每個LSTM層包括128個單元,采用ReLu激活函數(shù)來提高網(wǎng)絡(luò)的非線性處理能力。作為網(wǎng)絡(luò)輸出層,全連接層生成最終的維護(hù)需求預(yù)測,采用Sigmoid激活函數(shù)輸出預(yù)測的維護(hù)需求概率。
在訓(xùn)練過程中,由于預(yù)測性維護(hù)問題可以看作回歸問題,因此采用均方誤差(Mean Square Error,MSE)作為損失函數(shù)。因?yàn)锳dam優(yōu)化器能夠自適應(yīng)調(diào)整學(xué)習(xí)率,適合處理大規(guī)模且參數(shù)敏感的數(shù)據(jù)集,所以選擇其作為優(yōu)化器。為防止過擬合,模型還加入了Dropout網(wǎng)絡(luò)層,當(dāng)在驗(yàn)證集中的損失不再下降時停止訓(xùn)練。
2.2 維護(hù)決策支持系統(tǒng)
在鐵路信號系統(tǒng)中,采取有效的預(yù)防維護(hù)措施十分重要。維護(hù)決策支持系統(tǒng)結(jié)合決策樹和貝葉斯網(wǎng)絡(luò),提供了一種系統(tǒng)化的解決方案,以優(yōu)化維護(hù)策略并預(yù)測潛在故障。系統(tǒng)基于歷史數(shù)據(jù)和實(shí)時監(jiān)測數(shù)據(jù)為維護(hù)團(tuán)隊(duì)提供決策支持,降低系統(tǒng)故障率,提高運(yùn)行效率。
決策樹廣泛應(yīng)用于分類和回歸任務(wù),其核心思想利用多次迭代將數(shù)據(jù)集劃分為2個或多個同質(zhì)子集,直至達(dá)到預(yù)設(shè)的最大深度或節(jié)點(diǎn)內(nèi)數(shù)據(jù)點(diǎn)數(shù)量低于某個閾值。當(dāng)選擇最佳分裂屬性時,本文采用信息增益來衡量數(shù)據(jù)集在特定屬性上分裂前后信息含量的變化,如公式(5)所示。
(5)
式中:Gain(D,a)為信息增益,為原始數(shù)據(jù)集的熵與加權(quán)子集熵總和的差值,差值越大,屬性a在降低數(shù)據(jù)集不確定性方面越有效,這是決策樹等算法選擇分割屬性的重要依據(jù);|D|為數(shù)據(jù)集D中樣本的數(shù)量,i為數(shù)據(jù)點(diǎn)個數(shù);|Di|為子集Di中樣本的數(shù)量;Ent(D)為數(shù)據(jù)集D的熵,用于衡量數(shù)據(jù)的不確定性;m為加權(quán)子集熵的總數(shù)。其計算過程如公式(6)所示。
(6)
式中:pk為數(shù)據(jù)集中術(shù)語類別k的樣本比例;K為2個時間序列對齊后的最大長度。
在鐵路信號維護(hù)決策支持系統(tǒng)中,決策樹可以分析故障類型和原因、維護(hù)操作的影響以及可能的維護(hù)結(jié)果。訓(xùn)練決策樹模型,基于系統(tǒng)的歷史維護(hù)數(shù)據(jù)和故障記錄識別導(dǎo)致故障的關(guān)鍵因素,為維護(hù)團(tuán)隊(duì)提供可行的維護(hù)建議。
貝葉斯網(wǎng)絡(luò)是一種表示條件依賴關(guān)系的圖形模型,節(jié)點(diǎn)表示隨機(jī)變量,邊表示變量間的概率依賴關(guān)系。貝葉斯網(wǎng)絡(luò)根據(jù)已知的故障概率和維護(hù)措施的效果預(yù)測采取某種維護(hù)措施后系統(tǒng)狀態(tài)的改變概率。
3 試驗(yàn)驗(yàn)證
3.1 試驗(yàn)設(shè)計
試驗(yàn)數(shù)據(jù)集包括2021年第一季度至2023年第二季度某鐵路信號系統(tǒng)在實(shí)際運(yùn)行過程中收集的數(shù)據(jù)以及系統(tǒng)記錄的相關(guān)故障與維修數(shù)據(jù)。將預(yù)處理后的數(shù)據(jù)集劃分為訓(xùn)練集、驗(yàn)證集和測試集,其數(shù)據(jù)比例為6∶2∶2。利用訓(xùn)練集分別訓(xùn)練GRU和LSTM網(wǎng)絡(luò)模型,使用驗(yàn)證集對模型進(jìn)行調(diào)優(yōu),使用測試集評估模型的性能,驗(yàn)證模型的預(yù)測能力。
3.2 故障預(yù)測模型的驗(yàn)證
本文對GRU故障預(yù)測模型進(jìn)行性能評估,GRU模型與原有系統(tǒng)性能對比如圖3所示。
從圖3中可以看出,與原有系統(tǒng)相比,GRU模型的準(zhǔn)確率和召回率更高,說明其在故障預(yù)測方面性能更好。F1分?jǐn)?shù)是衡量二分類模型精確度的指標(biāo),兼顧分類模型的精確率和召回率,分?jǐn)?shù)提升也表明模型在準(zhǔn)確性和召回率之間取得了較好的平衡。
3.3 預(yù)防維護(hù)模型的驗(yàn)證
本文對LSTM預(yù)防維護(hù)模型進(jìn)行性能評估,本文采用均方根誤差(RMSE)、平均絕對誤差(MAE)以及決定系數(shù)(R2)作為評估指標(biāo)。2023年第一、二季度數(shù)據(jù)的預(yù)防維護(hù)模型評估結(jié)果見表3。
從表3可以看出,LSTM模型的RMSE與MAE較低,說明模型預(yù)測的準(zhǔn)確性較高,模型預(yù)測值與實(shí)際值之間的差異較小。R2反映了模型解釋數(shù)據(jù)變異的能力,值越接近1,模型越能準(zhǔn)確預(yù)測數(shù)據(jù)變動。LSTM模型R2較高,說明其在鐵路信號系統(tǒng)預(yù)防維護(hù)方面適用性較高。
4 結(jié)論
本文研究了鐵路信號系統(tǒng)故障預(yù)警與預(yù)防維護(hù)技術(shù)以及應(yīng)用數(shù)據(jù)預(yù)處理與特征提取技術(shù),有效減少了數(shù)據(jù)噪聲并突出了趨勢特征。經(jīng)試驗(yàn)驗(yàn)證,本文構(gòu)建的基于GRU的故障預(yù)測模型和基于LSTM的預(yù)防維護(hù)模型性能良好,能夠?yàn)殍F路信號系統(tǒng)的故障預(yù)警提供可靠的技術(shù)支持。
參考文獻(xiàn)
[1]韓昶.鐵路信號設(shè)備的可靠性設(shè)計與維護(hù)策略研究[J].運(yùn)輸經(jīng)理世界,2023(35):166-168.
[2]常懌.如何利用微機(jī)監(jiān)測系統(tǒng)分析和處理鐵路信號設(shè)備故障[J].信息系統(tǒng)工程,2023(4):83-85.
[3]邢玉龍.面向預(yù)測性維護(hù)的軌道電路故障診斷及預(yù)測方法研究[D].北京:北京交通大學(xué),2022.
[4]王坤.基于機(jī)器學(xué)習(xí)的鐵路信號設(shè)備故障預(yù)警系統(tǒng)的設(shè)計與實(shí)現(xiàn)[D].邯鄲:河北工程大學(xué),2021.
[5]尹航.鐵路信號集中監(jiān)測系統(tǒng)智能分析及預(yù)警方法研究[D].蘭州:蘭州交通大學(xué),2021.