梅 歡,馬艷東,單九思,彭 曄
(1.河北省科學院 應用數(shù)學研究所,河北 石家莊 050081;2.河北省信息安全認證工程技術研究中心,河北 石家莊 050081;3.石家莊鐵道大學,河北 石家莊 050043)
基于樣條插值與RBF網(wǎng)絡的道岔故障診斷系統(tǒng)
梅 歡1,2,馬艷東1,2,單九思3,彭 曄3
(1.河北省科學院 應用數(shù)學研究所,河北 石家莊 050081;2.河北省信息安全認證工程技術研究中心,河北 石家莊 050081;3.石家莊鐵道大學,河北 石家莊 050043)
隨著列車運行速度與行車密度的不斷提高,道岔將面臨更加嚴峻的考驗,而傳統(tǒng)依靠維護人員研讀相關監(jiān)測數(shù)據(jù)進行故障診斷的手段,越來越不能夠適應鐵路對運行安全的高要求。為快速、準確診斷出道岔故障,特建立基于三次樣條插值與RBF神經(jīng)網(wǎng)絡的智能道岔故障診斷模型。利用基于三次樣條插值的數(shù)據(jù)整合模塊將不同維數(shù)的道岔動作電流數(shù)據(jù)劃歸成統(tǒng)一的數(shù)據(jù)維數(shù)。采用新型RBF神經(jīng)網(wǎng)絡對其進行故障診斷。利用某火車站道岔動作的真實歷史監(jiān)測數(shù)據(jù)對所提模型的有效性與可行性進行驗證。實驗結(jié)果表明,所提出的模型不僅能夠適應不同數(shù)據(jù)維數(shù)的道岔動作曲線數(shù)據(jù),而且還可以快速、準確地對道岔故障進行診斷,從而幫助維護人員縮短故障處理時間,提高鐵路行車的安全性。
道岔故障診斷;人工智能;RBF神經(jīng)網(wǎng)絡;三次樣條插值;道岔動作電流
隨著列車運行速度與行車密度的不斷提高,作為限制火車運行速度的關鍵設備之一—道岔[1-5]將面臨更加嚴峻的考驗。如果能夠及時發(fā)現(xiàn)道岔故障、準確診斷故障類型,不僅可以預防重大事故,避免人員傷亡和財產(chǎn)損失,而且可以減少維修成本,避免維修盲目性,以獲得最大經(jīng)濟效益。目前,國內(nèi)的道岔故障診斷手段主要是依靠相關業(yè)務人員分析微機監(jiān)測系統(tǒng)現(xiàn)場采集的道岔各組成設備的檢測信息,依靠其工作經(jīng)驗、業(yè)務水平、精力與責任心。這種傳統(tǒng)的發(fā)現(xiàn)問題和解決問題的手段越來越不能滿足鐵路發(fā)展的現(xiàn)狀。如何采用智能化手段及時、準確地診斷故障是亟待解決的問題。
相對于傳統(tǒng)BP神經(jīng)網(wǎng)絡,RBF神經(jīng)網(wǎng)絡[6-7]不僅具有結(jié)構簡單、收斂速度快、泛化能力強等特點,還具有優(yōu)異的函數(shù)逼近能力、全局尋優(yōu)和最佳逼近能力。研究表明,RBF神經(jīng)網(wǎng)絡節(jié)點的寬度、中心、權重等參數(shù)選取的是否合理將直接影響到RBF神經(jīng)網(wǎng)絡的性能表現(xiàn)。故而在所提出的道岔故障診斷系統(tǒng)中,采用基于AutoEncoder的RBF神經(jīng)網(wǎng)絡對道岔動作電流數(shù)據(jù)進行建模,以期挖掘?qū)W習到蘊含其中的道岔故障信息。
由于受到鐵路現(xiàn)場溫度、濕度、設備狀況、天氣狀況等因素的影響,從微機監(jiān)測系統(tǒng)中獲取的道岔動作電流數(shù)據(jù)的維數(shù)會在一個較大的范圍內(nèi)波動。如何在盡量保留原始監(jiān)測數(shù)據(jù)所包含信息的前提下,使其數(shù)據(jù)維數(shù)調(diào)整到固定維數(shù),從而能夠輸入到智能算法模型中,具有重要的現(xiàn)實意義。為此,采用基于三次樣條插值的數(shù)據(jù)處理方法將不同數(shù)據(jù)維數(shù)的道岔動作電流數(shù)據(jù)劃歸成統(tǒng)一的數(shù)據(jù)維數(shù),以便將其輸入到RBF神經(jīng)網(wǎng)絡中進行學習訓練。
綜上所述,采用三次樣條插值與新型RBF神經(jīng)網(wǎng)絡等技術,將不同數(shù)據(jù)維數(shù)的道岔動作電流數(shù)據(jù)劃歸成統(tǒng)一的數(shù)據(jù)維數(shù),采用新型的RBF神經(jīng)網(wǎng)絡對其進行故障診斷,以幫助維護人員快速、準確地對道岔故障進行診斷,減少故障處理時間,提高鐵路行車的安全性。
受設備自身健康狀況的變化、環(huán)境因素的干擾以及其他未知因素的影響,由微機監(jiān)測系統(tǒng)采集的數(shù)據(jù)維數(shù)有可能發(fā)生較大的變化。如道岔動作電流的數(shù)據(jù)維數(shù)就很有可能在200~3 000的范圍內(nèi)變化。不管是利用神經(jīng)網(wǎng)絡、深度學習,還是其他人工智能算法,這些算法模型大都要求輸入數(shù)據(jù)的維數(shù)固定不變。否則,會給模型的建立、算法的實現(xiàn)帶來很大困難。為此,提供一種方法——不管傳入數(shù)據(jù)的維數(shù)是如何變化不穩(wěn)定,這種算法都能夠在盡可能保留原始數(shù)據(jù)所包含信息的前提下,將不同維數(shù)的數(shù)據(jù)劃歸到指定的維數(shù)。
1.1 三次樣條插值
設f(x)是區(qū)間[a,b]上的一個連續(xù)可微函數(shù),在區(qū)間[a,b]上給定一組基點:
a=x0 設函數(shù)S(x)滿足條件: (1)S(x)在每個子區(qū)間[xi,xi+1](i=0,1,…,n-1)上是次數(shù)不超過m的多項式; (2)S(x)在區(qū)間[a,b]上有m-1階連續(xù)導數(shù)。 則稱S(x)是定義在[a,b]上的m次樣條函數(shù)[8]。x0,x1,,xn稱為樣條節(jié)點,其中x1,x2,,xn-1稱為內(nèi)節(jié)點。x0,xn稱為邊界節(jié)點。當m=3時,便成為最常用的三次樣條函數(shù)。利用三次樣條函數(shù)作為插值函數(shù)的插值方法即為三次樣條插值。 1.2 基于三次樣條插值的數(shù)據(jù)整合算法 前提條件:已知采集上來的原始數(shù)據(jù)集R是M×1維數(shù)據(jù)。 現(xiàn)場要求: 將R從M×1維調(diào)整到N×1維,其中N為指定自然數(shù),且N≠M; 盡可能使劃歸后的新數(shù)據(jù)與原數(shù)據(jù)的方差保持最小; 保留原數(shù)據(jù)集中的極值、零值。 算法步驟如下: Step1:令Q為某個特定的自然數(shù),將原始數(shù)據(jù)平均劃分為Q份。 Step2:令Qi為平均劃分后的原始數(shù)據(jù)的第i份數(shù)據(jù)集。 Step3:在Qi份數(shù)據(jù)集的基礎上,利用三次樣條插值算法,生成樣條函數(shù)fi(x)。 Step4:在樣條函數(shù)fi(x)上等間距采樣[N/Q]個,形成數(shù)據(jù)集Qi*。如果Q不能被N整除,那么,令(int)[N/Q]為N/Q的整數(shù)部分,K為N/Q的余數(shù)部分,則可以隨機選擇K個數(shù)據(jù)集。這些選中的數(shù)據(jù)集上選擇(int)[N/Q]+1個數(shù)據(jù),其他未被選中的數(shù)據(jù)集上選擇(int)[N/Q]個數(shù)據(jù)。 Step5:查找數(shù)據(jù)集Qi*的極值點、零點及其位置信息。 Step6:根據(jù)Step5的結(jié)果,在數(shù)據(jù)集Qi*上,查找Qi的極值點與零點與哪個點的距離最近。并用這些極值點與零點替換這些在Qi*中的數(shù)據(jù),從而形成新的數(shù)據(jù)集QQi; Step7:令i遍歷1,2,…,Q,分別執(zhí)行Step3~Step6,得到數(shù)據(jù)子集QQ1,QQ2,…,QQQ。 Step8:將數(shù)據(jù)子集QQ1,QQ2,…,QQQ,按次序依次拼接成新的最終數(shù)據(jù)集QQ。 Step9:跳出。 RBF神經(jīng)網(wǎng)絡是一種特殊的三層前饋神經(jīng)網(wǎng)絡,其網(wǎng)絡結(jié)構包括一個輸入層、一個隱含層和一個輸出層。輸入層節(jié)點負責將網(wǎng)絡與外界實際連接起來,其個數(shù)由輸入數(shù)據(jù)的維數(shù)決定。隱含層節(jié)點由徑向基函數(shù)構成,其主要作用是輸入空間到隱含層空間之間進行非線性變換,在大多數(shù)情況下,隱含層空間有較高的維數(shù)。而輸出層節(jié)點通常是由簡單的線性函數(shù)構成,其作用主要是為輸入層信號作出最終響應。 AutoEncoder自動編碼器是深度學習[9-14]領域的重要算法之一,是利用人工神經(jīng)網(wǎng)絡具有層次結(jié)構的特點,假定其輸出數(shù)據(jù)與輸入數(shù)據(jù)相同,即輸入數(shù)據(jù)的類標是其本身。然后,訓練調(diào)整網(wǎng)絡各個參數(shù),得到每一層節(jié)點的參數(shù)及權重。通常隱含層節(jié)點的數(shù)目要小于輸入層節(jié)點的數(shù)目。那么,在給定的條件下,隱含層節(jié)點的直接輸出值可以看做是從輸入數(shù)據(jù)抽取出來的特征。也就是說可以利用隱含層直接輸出的數(shù)據(jù)恢復輸入層的數(shù)據(jù)。這樣AutoEncoder就是一種盡可能復現(xiàn)輸入信號的神經(jīng)網(wǎng)絡。 針對AutoEncoder自編碼器提取的輸入特征能夠更好地發(fā)現(xiàn)樣本間的相關性的優(yōu)點,算法[15]擬利用AutoEncoder的訓練結(jié)果,替代隨機初始化RBF神經(jīng)網(wǎng)絡的各個參數(shù),然后利用梯度下降法進一步調(diào)整更新網(wǎng)絡的各個參數(shù)。 其算法步驟如下: Step1:設置算法終止條件: (1)RBF神經(jīng)網(wǎng)絡的訓練精度。 (2)梯度下降更新網(wǎng)絡參數(shù)的最大迭代次數(shù)。 只要滿足上述兩個條件的任何一個即可結(jié)束迭代。 Step2:歸一化訓練樣本,這里采用min-max標準化方法,其轉(zhuǎn)換函數(shù)如下: (1) 其中,x*為樣本數(shù)據(jù)轉(zhuǎn)換后的標準數(shù)據(jù),且有x*∈[0,1];xmax為樣本數(shù)據(jù)中的最大值;xmin為樣本數(shù)據(jù)中的最小值;x為樣本數(shù)據(jù)的原始值。 Step3:隨機抽取樣本數(shù)據(jù)的70%作為訓練集,其余30%為測試集。 Step4:在訓練集上,利用AutoEncoder自編碼器進行學習訓練。訓練結(jié)束后得到RBF神經(jīng)網(wǎng)絡NN*。 Step5:在網(wǎng)絡NN*各個參數(shù)的基礎上,利用梯度下降法繼續(xù)調(diào)整更新各個參數(shù),直至滿足終止條件。 3.1 系統(tǒng)整體設計 基于樣條插值與RBF網(wǎng)絡的道岔故障診斷系統(tǒng)(其原理圖如圖1所示)包括基于三次樣條插值的數(shù)據(jù)整合模塊與基于AutoEncoder的RBF神經(jīng)網(wǎng)絡模塊。其中前者負責將處于不同數(shù)據(jù)維數(shù)的道岔動作電流數(shù)據(jù)劃歸為統(tǒng)一的數(shù)據(jù)維數(shù)。之后,由后者對該數(shù)據(jù)進行學習訓練與測試。 圖1 基于樣條插值與RBF網(wǎng)絡的 該道岔故障診斷系統(tǒng)可分為針對歷史數(shù)據(jù)的離線學習與針對實時數(shù)據(jù)的在線診斷兩個階段。在其歷史數(shù)據(jù)離線學習階段,將歷史數(shù)據(jù)按比例隨機拆分成訓練集與測試集兩個部分。該道岔故障診斷系統(tǒng)將訓練集數(shù)據(jù)輸入到基于三次樣條插值的數(shù)據(jù)整合模塊中,將原始數(shù)據(jù)維數(shù)劃歸為某個特定維數(shù);之后,將整合后的數(shù)據(jù)輸入到RBF神經(jīng)網(wǎng)絡進行學習訓練;在訓練結(jié)束后,將驗證集輸入到該RBF神經(jīng)網(wǎng)絡以驗證網(wǎng)絡的泛化推廣能力;在RBF神經(jīng)網(wǎng)絡滿足泛化需求之后,將其拷貝到現(xiàn)場進行實時故障診斷;通過人機交互模塊,對該道岔故障診斷系統(tǒng)的診斷結(jié)果進行反饋。如果診斷錯誤,則需要將診斷的正確結(jié)果輸入到RBF神經(jīng)網(wǎng)絡,并啟動RBF神經(jīng)網(wǎng)絡的增量訓練模式,對網(wǎng)絡參數(shù)進行微調(diào),以使其學習到新的信息,進一步提高網(wǎng)絡性能。 3.2 算法實現(xiàn) 步驟1:將道岔動作電流數(shù)據(jù)的維數(shù)劃歸為某特定維數(shù)。 步驟2:對道岔動作電流的歷史數(shù)據(jù)采用式(2)進行歸一化處理。 (2) 其中,x為原始數(shù)據(jù);x*為歸一化后的數(shù)據(jù);μ為所有樣本數(shù)據(jù)的平均值;σ為所有樣本數(shù)據(jù)的標準差。 步驟3:基于訓練集,學習訓練基于AutoEncoder的RBF神經(jīng)網(wǎng)絡。 步驟4:用步驟3中訓練好的RBF神經(jīng)網(wǎng)絡對測試集進行故障診斷,并計算診斷的精度。如果精度較低,則返回步驟3。否則,進入下一步。 步驟5:將RBF網(wǎng)絡各個參數(shù)拷貝到對道岔動作電流進行實時診斷的電腦。 步驟6:對實時診斷結(jié)果進行判斷。如果診斷正確,則進入對下一條數(shù)據(jù)進行診斷的流程。否則,則將該條道岔動作電流數(shù)據(jù)與其正確的故障類型輸入到RBF神經(jīng)網(wǎng)絡,并啟動增量學習模式,對網(wǎng)絡參數(shù)進行微調(diào),以使該網(wǎng)絡學習到新的知識。 3.3 仿真實驗 道岔動作電流歷史數(shù)據(jù)集采集自某車站的——包括正常、啟動電路斷線、外線混線、繼電器接觸不良、電機匝間短路、道岔動作困難、未能解鎖、轉(zhuǎn)換不暢、電機轉(zhuǎn)子斷線、轉(zhuǎn)換阻力增大、道岔不閉鎖與減速器或電機抱死等12種故障類型的——真實的現(xiàn)場監(jiān)測數(shù)據(jù),共1 050條,數(shù)據(jù)維數(shù)在189~693之間。 在仿真實驗中,隨機選擇歷史數(shù)據(jù)集中30%的數(shù)據(jù)作為訓練數(shù)據(jù),用來學習訓練RBF神經(jīng)網(wǎng)絡的各個節(jié)點的參數(shù);再隨機抽取該數(shù)據(jù)集另外20%的數(shù)據(jù)作為驗證集,用來檢驗RBF神經(jīng)網(wǎng)絡的學習性能,以決定是否終止網(wǎng)絡的學習過程;其余50%的數(shù)據(jù)作為測試集,用來模擬實時數(shù)據(jù),以判斷整個模型的最終表現(xiàn)。 設定數(shù)據(jù)整合后的維數(shù)為100,即將數(shù)據(jù)維數(shù)在189~693之間的歷史監(jiān)測數(shù)據(jù),通過基于三次樣條插值的數(shù)據(jù)整合模塊,統(tǒng)一劃歸為100維。 因此,模型中的RBF神經(jīng)網(wǎng)絡的輸入節(jié)點個數(shù)等于輸入數(shù)據(jù)的維數(shù)100;輸出節(jié)點的個數(shù)等于故障類型的數(shù)目12;其隱含層節(jié)點數(shù)目的確定到目前為止沒有很好的方法,在實驗仿真過程中,就采用不斷嘗試的方法以確定RBF神經(jīng)網(wǎng)絡隱含層節(jié)點的最終數(shù)目。并且,在訓練過程中,對每一個所嘗試的隱含層節(jié)點數(shù)目都重復實驗10次,以便從這10次訓練好的RBF神經(jīng)網(wǎng)絡中挑選中表現(xiàn)最好的網(wǎng)絡。 最終實驗結(jié)果參見圖2與表1。 圖2 故障診斷精度與隱含層節(jié)點 由圖2可知,當RBF神經(jīng)網(wǎng)絡隱含層節(jié)點數(shù)目為52時,網(wǎng)絡的泛化能力最高。 表1 實驗仿真結(jié)果 由表1可知,當RBF神經(jīng)網(wǎng)絡的隱含層節(jié)點數(shù)目等于52時,該模型在其第10次訓練時,所學習訓練得到的RBF神經(jīng)網(wǎng)絡的訓練精度、驗證精度、測試精度分別高達99.682 5%、96.190 5%與97.142 9%。也說明此時該神經(jīng)網(wǎng)絡具有更好的泛化能力,也就是具有更好的識別未知樣例故障類型的能力。 針對道岔故障數(shù)據(jù)維數(shù)變化不定且故障數(shù)據(jù)量大,難以實時、快速、準確地進行人工診斷這一現(xiàn)實需求,綜合采用基于三次樣條插值與RBF神經(jīng)網(wǎng)絡等技術手段,建立了新型道岔故障診斷系統(tǒng)。通過應用某站真實歷史監(jiān)測數(shù)據(jù)進行驗證,證明所建立的模型不僅能夠適應不同數(shù)據(jù)維數(shù)的現(xiàn)場監(jiān)測數(shù)據(jù),而且還可以幫助維護人員快速、準確地對道岔故障進行診斷,減少故障處理時間,提高鐵路行車的安全性。 [1] 馮琳玲.運用微機監(jiān)測道岔電流曲線分析提速道岔故障[J].鐵路通信信號工程技術,2011,8(1):73-75. [2] 周桂強.利用微機監(jiān)測道岔動作電流曲線指導日常維修[J].鐵道運營技術,2006,12(3):34-35. [3] 候志宇,崔澤彬.電動轉(zhuǎn)轍機自動開閉器故障原因及解決方法[J].鐵道通信信號,2005,41(6):25. [4] 姜 玥,韓麗英,張曉鋒.微機監(jiān)測道岔電流采集中的故障分析[J].鐵道通信信號,2011,47(11):45-46. [5] 王玉芬.S700K1/30提速道岔常見故障分析與對策[J].上海鐵道科技,2009(1):38-39. [6] Schwenker F,Kestler H A,Palm G.Three learning phase for radial-basis-function networks[J].Neural Networks,2001,14:439-458. [7] Roy A,Govil S,Miranda R.An algorithm to generate Radial Basis Function (RBF)-like nets for classification problems[J].NeuralNetworks,1995,8(2):179-201. [8] 王仁宏.數(shù)值逼近[M].北京:高等教育出版社,1999:220-253. [9] 孫志軍,薛 磊,許陽明,等.深度學習研究綜述[J].計算機應用研究,2012,29(8):2806-2810. [10]ErhanD,BengioY,CoupvileA,etal.Whydoesunsupervisedpre-traininghelpdeeplearning[J].JournalofMachineLearningResearch,2010,11(3):625-660. [11]LasersonJ.Fromneuralnetworkstodeeplearing:zeroinginonthehumanbrain[J].XRDS,2011,18(1):29-34. [12]HintonGE,OsinderoS,TehY.Afastlearningalgorithmfordeepbeliefnets[J].NeuralComputation,2006,18(7):1527-1554. [13]BengioY.LearningdeeparchitecturesforAI[J].FoundationsandTrendsinMachLearning,2009,2(1):1-127. [14]LecunY,BottouL,BengioY,etal.Gradient-basedlearningappliedtodocumentrecognition[J].ProceedingsoftheIEEE,1998,86(11):2278-2324. [15] 馬艷東.一種基于AutoEncoder的RBF神經(jīng)網(wǎng)絡訓練算法[J].中國科技信息,2015(9):59-60. Research on Switch Fault Diagnosis System with Cubic SplineInterpolation and RBF Neural Network MEI Huan1,2,MA Yan-dong1,2,SHAN Jiu-si3,PENG Ye3 (1.Institute of Applied Mathematics,Hebei Academy of Sciences,Shijiazhuang 050081,China;2.Hebei Authentication Technology Engineering Research Center,Shijiazhuang 050081,China;3.Shijiazhuang Tiedao University,Shijiazhuang 050043,China) The train rail switch is facing more demanding request with the increasing speed and traffic density.The traditional fault diagnosis method which relies on maintenance personnel monitoring data cannot meet the higher safety request for the train operation safety.In order to diagnose the faults of the rail switch rapidly and accurately,the new intelligent rail switch fault diagnosis model based on Cubic Spline Interpolation and RBF neural network is established.The data integration module based on Cubic Spline Interpolation has been used to normalize the electric current curves of the rail switch into the same dimension.Then,the new RBF neural network is used to diagnose the new data of the electric current curves of the rail switch with same dimension.The model has been validated and evaluated with the historical and real monitoring data from certain railway station.The experiment results show that this model can not only be used to process the electric current curves of the rail switch action with different dimensions,but also can be used to diagnose rail switch faults rapidly and accurately.With this model,the fault processing time can be significantly decreased and the railway traffic can be safer. switch fault diagnosis;artificial intelligence;RBF neural network;Cubic Spline Interpolation;electric curves of switch action 2016-06-06 2016-09-15 網(wǎng)絡出版時間:2017-03-07 河北省科技計劃項目(15210331);河北省科學院科技計劃項目(16606) 梅 歡(1981-),女,助理研究員,CCF會員,研究方向為數(shù)據(jù)挖掘。 http://kns.cnki.net/kcms/detail/61.1450.TP.20170307.0922.072.html TP182 A 1673-629X(2017)05-0160-04 10.3969/j.issn.1673-629X.2017.05.0332 基于AutoEncoder的RBF神經(jīng)網(wǎng)絡訓練方法
3 基于三次樣條插值與新型RBF神經(jīng)網(wǎng)絡的道岔故障診斷系統(tǒng)
4 結(jié)束語