楊菊花,于苡健,陳光武,司涌波,邢東峰
(1. 蘭州交通大學(xué) 交通運(yùn)輸學(xué)院,甘肅 蘭州 730070; 2. 蘭州交通大學(xué) 自動(dòng)控制研究所, 甘肅 蘭州 730070;3. 甘肅省高原交通信息工程及控制重點(diǎn)實(shí)驗(yàn)室, 甘肅 蘭州 730070)
隨著中國(guó)鐵路的快速發(fā)展,對(duì)鐵路信號(hào)設(shè)備的運(yùn)營(yíng)維護(hù)也提出了更高要求。大數(shù)據(jù)分析、機(jī)器學(xué)習(xí)和人工智能技術(shù)也將逐漸應(yīng)用在鐵路信號(hào)系統(tǒng)中。道岔是鐵路信號(hào)系統(tǒng)中的基礎(chǔ)設(shè)備之一,通過轉(zhuǎn)轍機(jī)完成列車不同進(jìn)路之間的轉(zhuǎn)換,是保障列車安全運(yùn)行的重要節(jié)點(diǎn)。在鐵路信號(hào)設(shè)備中,道岔是出現(xiàn)故障較高的設(shè)備,根據(jù)鐵路用戶的統(tǒng)計(jì),信號(hào)設(shè)備發(fā)生的故障中,道岔故障約占信號(hào)故障總數(shù)的39%。基于狀態(tài)的維護(hù)(Condition Based Maintenance,CBM)在機(jī)械故障診斷領(lǐng)域應(yīng)用廣泛[1-3]。本文將在道岔故障診斷中應(yīng)用CBM技術(shù),通過信號(hào)集中監(jiān)測(cè)系統(tǒng)掌握道岔實(shí)時(shí)狀態(tài),應(yīng)用人工智能技術(shù),實(shí)現(xiàn)道岔故障類型定位,以改變現(xiàn)有的鐵路現(xiàn)場(chǎng)維護(hù)方式,提高維護(hù)人員故障處理效率。
目前,國(guó)內(nèi)外學(xué)者針對(duì)道岔故障進(jìn)行了許多研究,在應(yīng)用方法上也是各具特色。文獻(xiàn)[4]通過人工對(duì)S700K轉(zhuǎn)轍機(jī)的動(dòng)作電流曲線進(jìn)行故障特征提取,建立故障特征矩陣,最后作為BP神經(jīng)網(wǎng)絡(luò)的輸入,進(jìn)行故障識(shí)別。文獻(xiàn)[5]通過對(duì)ZD6轉(zhuǎn)轍機(jī)的電流曲線進(jìn)行特征提取,最后使用BP神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)道岔的故障診斷。文獻(xiàn)[6]通過信號(hào)集中監(jiān)測(cè)系統(tǒng)中記錄的故障文本信息,進(jìn)行特征提取,建立故障文本數(shù)據(jù)庫(kù)。文獻(xiàn)[7]通過增加道岔設(shè)備的中間故障狀態(tài),將道岔狀態(tài)細(xì)分,在功率曲線的時(shí)域和值域提取故障特征,建立隱馬爾科夫模型實(shí)現(xiàn)道岔故障診斷。另外還有應(yīng)用Bayesian Network、SVM、灰關(guān)聯(lián)和專家系統(tǒng)等方法進(jìn)行道岔故障診斷的研究[8-13]。
以上研究主要是針對(duì)電流曲線或功率曲線進(jìn)行特征提取。然而,道岔動(dòng)作電流曲線可以反映道岔轉(zhuǎn)換時(shí)的電氣特性、時(shí)間特性和機(jī)械特性,可以發(fā)現(xiàn)道岔動(dòng)作過程的不良現(xiàn)象;道岔的動(dòng)作功率曲線更能反映道岔在動(dòng)作過程的阻力情況和機(jī)械性能。所以,本文提出將道岔的動(dòng)作電流曲線和功率曲線結(jié)合起來(lái),進(jìn)行特征提取。先通過哈爾小波變換,建立特征矩陣,再通過卷積神經(jīng)網(wǎng)絡(luò)(CNN)自動(dòng)進(jìn)行特征提取,最后應(yīng)用GRU對(duì)道岔進(jìn)行故障診斷。
在信號(hào)集中監(jiān)測(cè)系統(tǒng)中,交流轉(zhuǎn)轍機(jī)的監(jiān)測(cè)通過道岔采集單元實(shí)現(xiàn)。監(jiān)測(cè)內(nèi)容包括電流、電壓、道岔一啟動(dòng)繼電器(1DQJ)狀態(tài)、定位反位表示狀態(tài)[14]等。三相交流轉(zhuǎn)轍機(jī)的采集原理見圖1。
采集單元放置在組合架附近,通常一個(gè)采集單元采集一組轉(zhuǎn)轍機(jī)的三相電流、三相電壓、1DQJ和定位反位表示開關(guān)量。而只有在道岔轉(zhuǎn)動(dòng)時(shí),1DQJ吸起,采集點(diǎn)與外線接通,進(jìn)行數(shù)據(jù)采集。
電流采集點(diǎn)位于斷相保護(hù)器(DBQ)輸出與1DQJ之間;電壓采集點(diǎn)在DBQ前級(jí)端子11、31、51點(diǎn)上;1DQJ采集點(diǎn)接入1DQJ繼電器的空接點(diǎn)上;道岔定位和反位表示的采集點(diǎn)分別為定表繼電器(DBJ)和反表繼電器(FBJ)上的空接點(diǎn)。
1DQJ動(dòng)作時(shí),產(chǎn)生開關(guān)量的變化,同時(shí)啟動(dòng)互感器采集電機(jī)動(dòng)作時(shí)的電流和電壓值,每40 ms計(jì)算一次有功功率,并記錄下來(lái)。同時(shí)電流和電壓的實(shí)時(shí)值、1DQJ、DBJ和FBJ的狀態(tài)將通過通信總線傳輸給站機(jī)進(jìn)行顯示處理。
本文以S700K型轉(zhuǎn)轍機(jī)為研究對(duì)象,其道岔在轉(zhuǎn)換過程中正常動(dòng)作的電流和功率曲線見圖2。
S700K交流轉(zhuǎn)轍機(jī)的動(dòng)作過程主要有以下5個(gè)階段[15]。
0—T1階段:1DQJ吸起,道岔動(dòng)作曲線開始記錄。
T1—T2階段:2DQJ轉(zhuǎn)極,動(dòng)作電流曲線出現(xiàn)一個(gè)尖峰,說明道岔啟動(dòng)電路接通,道岔動(dòng)作開始。
T2—T3階段:此階段為道岔動(dòng)作過程,正常情況下其電流曲線應(yīng)平滑,動(dòng)作電流大小應(yīng)與參考曲線大體相同。
T3—T4階段:道岔轉(zhuǎn)換完畢,自動(dòng)開閉器節(jié)點(diǎn)轉(zhuǎn)換,同時(shí)斷開啟動(dòng)電路,表示電路接通,DBQ無(wú)電流通過使BHJ落下,但是1DQJ具有緩放功能,電路切斷后會(huì)進(jìn)入緩放狀態(tài),在緩放時(shí),啟動(dòng)電路仍有兩相電流存在。
T4時(shí)間點(diǎn):1DQJ落下,停止記錄道岔動(dòng)作曲線。
S700K型轉(zhuǎn)轍機(jī)單動(dòng)道岔常見故障見表1。
表1 S700K道岔常見故障現(xiàn)象和原因
常見故障的三相電流和功率曲線見圖3。
根據(jù)鐵路運(yùn)營(yíng)用戶的統(tǒng)計(jì),道岔出現(xiàn)的故障中,卡缺口和道岔夾異物約占40%,是道岔故障中出現(xiàn)次數(shù)最多的;道岔轉(zhuǎn)換阻力大和鎖鉤缺油兩種故障大約占20%;而其他故障則出現(xiàn)頻率較低。
道岔故障診斷的算法結(jié)構(gòu)見圖4。
首先數(shù)據(jù)預(yù)處理,從信號(hào)集中監(jiān)測(cè)系統(tǒng)中得到道岔的電流和功率數(shù)據(jù),分為訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù),分別經(jīng)過哈爾小波變換,將變換后的數(shù)據(jù)與原始數(shù)據(jù)結(jié)合,建立特征矩陣,作為CNN-GRU模型的輸入。然后在模型中,經(jīng)過CNN卷積層的自動(dòng)提取特征,把高維數(shù)據(jù)矩陣自動(dòng)降維,得到低維矩陣,作為GRU網(wǎng)絡(luò)層的輸入,得到訓(xùn)練后的模型,再用測(cè)試數(shù)據(jù)測(cè)試模型準(zhǔn)確率,實(shí)現(xiàn)道岔故障診斷。
對(duì)數(shù)據(jù)進(jìn)行特征提取前,先對(duì)電流和功率數(shù)據(jù)進(jìn)行哈爾小波變換。對(duì)道岔故障診斷的特征提取,常見的是在動(dòng)作電流或功率的各個(gè)動(dòng)作階段進(jìn)行特征提取,這樣會(huì)忽略在動(dòng)作曲線上各數(shù)據(jù)點(diǎn)之間的信息,而哈爾小波變換可以提取到相鄰數(shù)據(jù)點(diǎn)間的信息。
哈爾基函數(shù)是由一組常值分段函數(shù)組成的函數(shù)集,常用于圖像壓縮,可以將圖像以少于原始圖像像素點(diǎn)進(jìn)行保存,而不失去圖像原始信息[16-17]。在經(jīng)過哈爾小波變換后,得到相鄰數(shù)據(jù)點(diǎn)之間的信息,作為道岔故障診斷的特征參數(shù)。
哈爾小波的小波函數(shù)表示為
( 1 )
對(duì)應(yīng)的尺度函數(shù)為
( 2 )
小波變換的基本思想是用一組小波函數(shù)或者基函數(shù)表示一個(gè)函數(shù)或者信號(hào)。將三相電流和功率曲線中的數(shù)據(jù)點(diǎn)抽取成一維矩陣,分別計(jì)算各自的哈爾小波變換系數(shù)
( 3 )
( 4 )
( 5 )
( 6 )
式中:IAi、IBi、ICi為三相電流曲線上數(shù)據(jù)點(diǎn);Pi為功率曲線上的數(shù)據(jù)點(diǎn)。
哈爾小波變換系數(shù)求取如下:
(1) 求平均值,計(jì)算相鄰數(shù)據(jù)對(duì)的平均值,得到短的矩陣,新的矩陣長(zhǎng)度是原來(lái)的1/2。
(2) 求差值,經(jīng)過求平均值,矩陣已經(jīng)丟失部分信息,為還原原始矩陣,需要存儲(chǔ)矩陣的細(xì)節(jié)信息,以方便找回丟失信息。所以,用數(shù)據(jù)對(duì)的第一個(gè)數(shù)據(jù)減去數(shù)據(jù)對(duì)的平均值。
將這些平均值和差值存儲(chǔ)下來(lái),得到變換后的系數(shù),組成新的矩陣,作為道岔故障診斷的特征參數(shù)。變換后各曲線哈爾小波變換系數(shù)矩陣為
( 7 )
( 8 )
( 9 )
(10)
式中:AIAi、AIBi、AICi和APi分別為三相電流和功率曲線上數(shù)據(jù)點(diǎn)經(jīng)過哈爾小波變換后的平均值;而DIAi、DIBi、DICi和DPi則為哈爾小波變換后的差值。
最后組成特征候選矩陣
(11)
在經(jīng)過哈爾小波變換后,得到更多的曲線信息,而這些信息中還會(huì)包含多余的細(xì)節(jié),需要對(duì)矩陣做進(jìn)一步的處理,從而得到低維矩陣而不失曲線原本信息。
多數(shù)道岔故障研究的特征提取,經(jīng)過各種變換后,會(huì)由人工進(jìn)行,而隨著人工智能技術(shù)的發(fā)展,可以采用神經(jīng)網(wǎng)絡(luò)方法自動(dòng)完成特征提取工作。
卷積神經(jīng)網(wǎng)絡(luò)是一種更適合圖像和語(yǔ)音識(shí)別的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),可以出色地完成特征提取工作,而且訓(xùn)練簡(jiǎn)單[18]。
卷積神經(jīng)網(wǎng)絡(luò)中激活函數(shù)往往選擇Relu函數(shù),它的定義為
f(x)=max(0,x)
(12)
Relu函數(shù)相比sigmoid函數(shù),計(jì)算速度快,意味著在訓(xùn)練模型時(shí),迭代速度快,可以減輕梯度消失的問題。對(duì)比sigmoid函數(shù),在使用反向傳播算法進(jìn)行神經(jīng)元之間的梯度計(jì)算時(shí),Relu函數(shù)的導(dǎo)數(shù)為1,不會(huì)出現(xiàn)梯度減小的問題。Relu函數(shù)會(huì)將小于0的映射為0,減少神經(jīng)元之間的依賴,使網(wǎng)絡(luò)變稀疏,避免過擬合。所以在模型中使用Relu函數(shù)可以訓(xùn)練更深,速度更快,并且能夠得到更稀疏的網(wǎng)絡(luò)模型。
若干個(gè)卷積層和池化層是一個(gè)卷積神經(jīng)網(wǎng)絡(luò)的主要部分。在卷積層,卷積運(yùn)算見圖5。
特征候選矩陣X作為輸入,卷積核對(duì)輸入從左到右掃描,和輸入的對(duì)應(yīng)元素相乘后累加,得到輸出的特征矩陣第一個(gè)元素。設(shè)置步長(zhǎng)可以控制每次滑動(dòng)格數(shù),掃描結(jié)束得到特征矩陣Fh,w。圖5中Wh,w的h和w分別為卷積核權(quán)重矩陣的高度和寬度,可以在搭建模型時(shí)提前設(shè)置;輸出特征矩陣的高度和寬度分別為
wF=(wX-wW+2wP)/wS+1
(13)
hF=(hX-hW+2hP)/hS+1
(14)
式中:wF為卷積后特征矩陣F的寬度;wX為特征候選矩陣X的寬度;wW為filter的寬度;wP為在原始矩陣周圍補(bǔ)零的列數(shù);wS為窗口橫向滑動(dòng)時(shí)的步幅;hF為卷積后特征矩陣F的高度;hX為特征候選矩陣的高度。hW為filter的高度;hP為在原始矩陣周圍補(bǔ)零的行數(shù);hS為窗口縱向滑動(dòng)時(shí)的步幅。式(13)和式(14)計(jì)算原理相同。
池化層在卷積層之后,其目的是繼續(xù)降低特征矩陣的維度,提高運(yùn)算速度。池化運(yùn)算選取MaxPooling,池化窗口對(duì)特征矩陣Fh,w從左到右掃描,設(shè)置步長(zhǎng)控制滑動(dòng)格數(shù),同時(shí)選取池化窗口中最大值作為該位置輸出,最后得到維數(shù)更小的特征矩陣Fh,w。
GRU是長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM)的一種變體。相比LSTM有3個(gè)門,GRU只有2個(gè)門,而且沒有細(xì)胞狀態(tài),簡(jiǎn)化了LSTM結(jié)構(gòu)[19]。所以GRU有更少的參數(shù),相對(duì)容易訓(xùn)練且不容易出現(xiàn)過擬合問題[20-21]。GRU的網(wǎng)絡(luò)結(jié)構(gòu)見圖6。圖6中,“+”為向量加運(yùn)算;“σ”為sigmoid函數(shù)運(yùn)算;“⊙”為哈達(dá)馬乘積,矩陣對(duì)應(yīng)元素相乘;“tanh”為“tanh”函數(shù)運(yùn)算。
在GRU網(wǎng)絡(luò)結(jié)構(gòu)中,更新門見圖7,輸出為
zj=σ([Wzx]j+[Uzh(t-1)]j)
(15)
輸入xt和上一時(shí)刻隱藏層h(t-1)分別與權(quán)重矩陣Wz、Uz相乘,再將結(jié)果輸入sigmoid函數(shù)中,將結(jié)果控制在0~1之間。更新門主要是決定上一層隱藏狀態(tài)下有多少信息傳遞給當(dāng)前隱藏層ht。zj接近0,說明第j個(gè)信息被遺忘;接近1,說明信息繼續(xù)保留。
GRU的重置門和更新門的運(yùn)算操作類似,區(qū)別在于權(quán)重矩陣不同。重置門的運(yùn)算結(jié)構(gòu)見圖8,輸出為
rj=σ([Wrx]j+[Urh(t-1)]j)
(16)
它決定上一時(shí)刻隱藏狀態(tài)中的信息有多少是需要被遺忘的。更新門和重置門的作用對(duì)象是不同的,更新門決定上一時(shí)刻隱藏狀態(tài)和記憶內(nèi)容,而重置門決定當(dāng)前的記憶內(nèi)容。
確定當(dāng)前記憶內(nèi)容的結(jié)構(gòu)見圖9,輸出為
(17)
重置門rt和ht-1進(jìn)行哈達(dá)馬乘積,決定在當(dāng)前記憶內(nèi)容中要遺忘部分上一時(shí)刻隱藏狀態(tài)的內(nèi)容,再將部分信息經(jīng)過tanh激活函數(shù),把結(jié)果控制在-1到1之間。
上一時(shí)刻的重要信息和當(dāng)前時(shí)刻輸入的重要信息組成GRU當(dāng)前時(shí)刻的記憶內(nèi)容,這是它記錄到的所有重要信息。
最后確定當(dāng)前時(shí)刻隱藏層保留的信息,運(yùn)算結(jié)構(gòu)見圖10,輸出為
(18)
式(18)中的第一項(xiàng)決定了上一時(shí)刻部分信息需要保留在當(dāng)前時(shí)刻隱藏單元ht,第二項(xiàng)(1-zj)決定需要遺忘的信息。當(dāng)前記憶內(nèi)容是當(dāng)前時(shí)刻保留的所有信息,而當(dāng)前時(shí)刻需要的信息在隱藏層中。
特征矩陣Fh,w作為GRU的輸入,經(jīng)過全連接層Dense,激活函數(shù)采用softmax,輸出分類概率,模型經(jīng)過優(yōu)化和訓(xùn)練后,實(shí)現(xiàn)道岔故障診斷。
CNN-GRU模型使用python編譯平臺(tái),在Keras框架下搭建,模型中包括二維卷積層,二維池化層,GRU層和全連接層,整體模型見圖11。
輸入矩陣尺寸為8×176,176是樣本曲線數(shù)據(jù)點(diǎn)長(zhǎng)度,每40 ms采集一組數(shù)據(jù),并截取7 s的曲線。如正常動(dòng)作時(shí)間在6.5 s左右,在曲線數(shù)據(jù)點(diǎn)后補(bǔ)零;如果故障動(dòng)作時(shí)間超過7 s,則取曲線前7 s數(shù)據(jù)。最終每個(gè)曲線采集175個(gè)數(shù)據(jù)點(diǎn),三相電流和功率經(jīng)過哈爾小波變換后,樣本長(zhǎng)度變成176,將原始數(shù)據(jù)第一列加上動(dòng)作時(shí)間,組成8×176的特征候選矩陣。
最后輸出8個(gè)節(jié)點(diǎn),是正常情況和7種故障所對(duì)應(yīng)的概率,判定概率最高值所對(duì)應(yīng)的故障類別為故障診斷結(jié)果。
以S700K型道岔為研究對(duì)象,正常動(dòng)作情況和每種故障各取20組樣本,隨機(jī)排序后,取其中120組數(shù)據(jù)做訓(xùn)練,其余40組樣本做測(cè)試,驗(yàn)證道岔診斷模型準(zhǔn)確率。測(cè)試在迭代75次和100次時(shí),不同維數(shù)的特征矩陣F,仿真結(jié)果對(duì)比見圖12。
由圖12可以發(fā)現(xiàn),在特征矩陣F維數(shù)為40時(shí),迭代70次和100次,有較好的訓(xùn)練準(zhǔn)確率和驗(yàn)證準(zhǔn)確率。所以模型選取特征矩陣F維數(shù)為40。
確定特征矩陣維數(shù)后,改變迭代次數(shù),仿真結(jié)果準(zhǔn)確率見圖13(a),損失函數(shù)值見圖13(b),訓(xùn)練時(shí)間見圖13(c)。
由仿真結(jié)果可以發(fā)現(xiàn),綜合模型準(zhǔn)確率、損失函數(shù)值和時(shí)間,迭代75次時(shí),模型有滿意的結(jié)果,準(zhǔn)確率為95%,損失函數(shù)值為0.344,訓(xùn)練時(shí)間為8.49 s,而超過75次時(shí),模型準(zhǔn)確率和損失函數(shù)值變化幅度小,所以選取迭代75次可以滿足現(xiàn)場(chǎng)維護(hù)要求。
最終確定模型特征矩陣選取40維,迭代次數(shù)選75次。最終測(cè)試結(jié)果見圖14。
測(cè)試預(yù)測(cè)結(jié)果中:一個(gè)樣本故障3(道岔夾異物)被識(shí)別為故障2(卡缺口),由故障曲線可以發(fā)現(xiàn),故障2和故障3曲線整體相似,是導(dǎo)致模型識(shí)別錯(cuò)誤的主要原因;另一個(gè)故障6(鎖鉤缺油)被識(shí)別為故障4(室外表示電路開路),雖然兩種故障曲線不相似,但是經(jīng)過哈爾小波變換后,曲線上數(shù)據(jù)點(diǎn)之間的平均值和差值整體相近,導(dǎo)致模型出現(xiàn)錯(cuò)誤判斷。
診斷準(zhǔn)確率和訓(xùn)練時(shí)間分別見表2、表3。
表2 診斷準(zhǔn)確率
表3 訓(xùn)練時(shí)間
由表2和表3可知,經(jīng)過與PCA-HMM和 PCA-GA-SVM方法對(duì)比,本文方法的準(zhǔn)確率優(yōu)于PCA-HMM方法的準(zhǔn)確率,在訓(xùn)練時(shí)間上優(yōu)于PCA-GA-SVM方法。而且CNN-GRU模型在經(jīng)過調(diào)試后,可以保存為.h5文件,再次調(diào)用后,可以直接使用,不需要再次訓(xùn)練優(yōu)化,如果無(wú)法滿足要求,可以繼續(xù)訓(xùn)練優(yōu)化,重復(fù)使用率高于其他方法。
通過提取信號(hào)集中監(jiān)測(cè)系統(tǒng)中的道岔電流和功率故障曲線,經(jīng)過哈爾小波變換后,與原始數(shù)據(jù)組成高維的特征候選矩陣,作為CNN的輸入,經(jīng)過卷積網(wǎng)絡(luò)對(duì)特征候選矩陣的自動(dòng)提取,得到低維特征矩陣,再經(jīng)過GRU網(wǎng)絡(luò)的判斷,輸出每種故障狀態(tài)的概率,實(shí)現(xiàn)故障診斷。通過仿真實(shí)驗(yàn)及對(duì)比其他方法,CNN-GRU道岔故障診斷模型準(zhǔn)確率達(dá)95%,在訓(xùn)練時(shí)間上也優(yōu)于其他方法,能夠滿足鐵路現(xiàn)場(chǎng)維護(hù)需求。