李長江,韓志偉,鐘俊平,王立有,劉志剛
(西南交通大學(xué) 電氣工程學(xué)院,四川 成都 610031)
在高速鐵路接觸網(wǎng)支撐與懸掛裝置中,等電位線起到防止燒損支持的作用,確保支持與定位零件的短路穩(wěn)定性。當(dāng)列車受電弓通過接觸網(wǎng)時(shí),定位器會存在一定抬升,從而使其與定位器支座產(chǎn)生間隙。在間隙產(chǎn)生時(shí),如果等電位線松脫或斷裂,定位器支座將承受較大的電氣沖擊,造成電化學(xué)腐燭,嚴(yán)重時(shí)導(dǎo)致定位器與支座連接處斷裂脫離,影響行車運(yùn)行安全[1]。
近年來,接觸網(wǎng)非接觸式檢測由于安全、行車干擾小等優(yōu)勢,在接觸網(wǎng)故障檢測中獲得越來越廣泛的應(yīng)用[2-3]。目前已有的基于圖像處理技術(shù)的接觸網(wǎng)零部件檢測方法[4-7],是基于局部特征匹配(SIFT、SURF、LBP等)和模板匹配等算法實(shí)現(xiàn)旋轉(zhuǎn)雙耳、絕緣子以及斜撐套筒等高鐵接觸網(wǎng)定位支撐裝置零部件的定位,并通過灰度分布規(guī)律、小波變換等算法實(shí)現(xiàn)零部件故障檢測。它們屬于傳統(tǒng)的圖像識別算法:圖像的特征提取與分類兩部分是分開進(jìn)行的,因此需要手工構(gòu)建選擇定位的目標(biāo)特征,不僅增大工作量,而且在面臨復(fù)雜陌生問題時(shí),往往無法設(shè)計(jì)出足夠優(yōu)秀的特征;人工設(shè)計(jì)出的特征往往缺乏魯棒性,針對于諸如梯度、顏色、紋理等某一方面的淺層特征。這就使得傳統(tǒng)的圖像識別算法有很大的局限性,性能提高空間有限。
在檢測車獲取的接觸網(wǎng)支撐裝置圖像中,由于等電位線目標(biāo)較小,故障特征不明顯,如圖1中方框標(biāo)識所示。等電位線對于拍攝參數(shù)較為敏感,要檢測其缺失、散股等不良狀態(tài)存在較大困難。目前對等電位線散股問題檢測研究較少。
圖1 接觸網(wǎng)裝置等電位線圖
針對等電位線定位、故障監(jiān)測等研究的困難,提出一種基于級聯(lián)Faster R-CNN等電位線目標(biāo)提取與故障識別的算法,檢測等電位線的不良狀態(tài)。為減少其他因素影響,提高等電位線故障檢測準(zhǔn)確性,在等電位線定位識別過程中,通過第一級Faster R-CNN對等電位線所在的定位器支座進(jìn)行定位;在一級對象定位的基礎(chǔ)上利用第二級Faster R-CNN學(xué)習(xí)等電位線散股故障特征,實(shí)現(xiàn)正常與故障等電位線的分類,通過實(shí)驗(yàn)分析Faster R-CNN在不同訓(xùn)練樣本數(shù)量、迭代次數(shù)等因素對檢測時(shí)間及識別效果的影響。通過統(tǒng)計(jì)分析,確定故障判斷閾值,作為等電位線是否發(fā)生散股故障的判據(jù)。
傳統(tǒng)目標(biāo)檢測算法,如SIFT[8]、HOG[9]等,一般人工設(shè)計(jì)目標(biāo)特征,再輸入到分類器中學(xué)習(xí)分類。傳統(tǒng)方法比較復(fù)雜、費(fèi)時(shí)費(fèi)力、精度不高,并且對設(shè)計(jì)者學(xué)術(shù)水平有較高要求。由于等電位線形狀不固定,故障特征不明顯,故采用級聯(lián)Faster R-CNN提取等電位線散股故障特征以實(shí)現(xiàn)不良狀態(tài)識別。Faster RCNN能夠直接將圖像數(shù)據(jù)作為輸入,與圖像像素進(jìn)行卷積、提取圖像特征,避免了圖像預(yù)處理和特征抽取等復(fù)雜操作[10]。網(wǎng)絡(luò)神經(jīng)元之間采用局部連接,簡化了計(jì)算量,加快了特征提取的速度,并且神經(jīng)元之間能夠權(quán)值共享,簡化了網(wǎng)絡(luò)模型,提高了訓(xùn)練效率。文獻(xiàn)[11]采用多層網(wǎng)絡(luò)構(gòu)建深度卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)對行人的檢測。文獻(xiàn)[12]基于卷積神經(jīng)網(wǎng)絡(luò)和SVM分類器實(shí)現(xiàn)高速公路上主要三種車型的分類。表1為RCNN系列方法對比。在標(biāo)準(zhǔn)集VOC2007中,在RCNN系列深度學(xué)習(xí)算法中,F(xiàn)aster R-CNN在檢測精度和時(shí)間上都有明顯提高。因此,采用級聯(lián)Faster RCNN對等電位線進(jìn)行故障識別。
表1 R-CNN系列方法對比
R-CNN算法[13]核心是對圖像中每個(gè)區(qū)域通過CNN提取特征,通過分類器預(yù)測區(qū)域中目標(biāo)對象的置信度,轉(zhuǎn)換成圖像分類問題,分類器可以是獨(dú)立訓(xùn)練的SVM[14],也可以是簡單的全連接分類。Fast R-CNN回避了R-CNN要對每個(gè)區(qū)域都使用一遍CNN,直接對全圖進(jìn)行卷積,獲得特征圖。而Faster R-CNN由特征提取+RPN(Region Proposal Networks)+Fast R-CNN構(gòu)成分類器,是一種多層監(jiān)督學(xué)習(xí)網(wǎng)絡(luò),有輸入層、卷積層、下采樣層、全連接層和輸出層,通過反向傳播優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu),求解未知參數(shù)。
通過5層深度ZF網(wǎng)絡(luò)提取定位器支座特征。網(wǎng)絡(luò)構(gòu)建過程如圖2所示[15]。
深度卷積神經(jīng)網(wǎng)絡(luò)沒有一套有效理論來分析特定物體部件之間的關(guān)系,但深度網(wǎng)絡(luò)可以非顯示地計(jì)算這些特征[15]。通過深度 Faster R-CNN獲得特征具有辨別性,忽略背景信息,轉(zhuǎn)而提取關(guān)鍵信息。深度卷積神經(jīng)網(wǎng)絡(luò)從背景、顏色等低層特征開始學(xué)習(xí),經(jīng)過多層卷積,得到具有辨別性的關(guān)鍵特征,訓(xùn)練分類器。
卷積神經(jīng)網(wǎng)絡(luò)首層是輸入層,由于Faster R-CNN能夠主動(dòng)學(xué)習(xí)二維圖像的特征,故將接觸網(wǎng)成像檢測車拍攝的高鐵接觸網(wǎng)支撐懸掛裝置圖像經(jīng)過灰度化處理作為網(wǎng)絡(luò)輸入。
網(wǎng)絡(luò)卷積層,即為特征提取層,每個(gè)神經(jīng)元的輸入與輸入圖像的局部接受域相連,通過96個(gè)大小7×7濾波器和可加偏置(可加偏置一般設(shè)為+1)積操作,提取該局部特征。特征被提取后,其與其他特征間的位置關(guān)系也隨之確定下來。不同卷積核得到不同的特征圖,卷積操作示意圖如圖3所示。
圖2 ZF網(wǎng)絡(luò)基本框架
圖3 卷積過程示意
網(wǎng)絡(luò)下采樣層,即為網(wǎng)絡(luò)特征映射層,每個(gè)特征映射為一個(gè)平面,通過權(quán)值共享,使得平面上所有神經(jīng)元的權(quán)值相等,減少了網(wǎng)絡(luò)自由參數(shù)的個(gè)數(shù),進(jìn)而降低了網(wǎng)絡(luò)參數(shù)選擇的復(fù)雜度。通過影響函數(shù)核小的Sigmoid函數(shù)作為卷積網(wǎng)絡(luò)的激活函數(shù),使得特征映射具有位移不變性。
(1)接觸網(wǎng)成像檢測車采集的接觸網(wǎng)支撐懸掛裝置圖像大小為2 048×2 048。
(2)在矩陣計(jì)算中卷積核都是4維的,第一層的卷積核維度是7×7×3×96。CONV1得到的結(jié)果是110×110×96。為了能夠整除,要進(jìn)行填充操作,在圖片周圍補(bǔ)充像素得到卷積圖像的大小。
s=(a-b+pad)/c+1 (1)式中:s為卷積得到的圖像大小;a為卷積層中輸入的圖片尺寸;b為卷積濾波器大?。籶ad為填充像素;c為步長。
(3)為了降低網(wǎng)絡(luò)參數(shù)選擇復(fù)雜度,對卷積得到的結(jié)果進(jìn)行下采樣,得到POOL1,池化核大小為3×3,池化后圖片維度為55×55×96。
(4)類似操作重復(fù)層2、3、4、5,前一層的輸出作為下一層的輸入。
(5)取CONV5輸出的特征向量輸入到區(qū)域建議網(wǎng)絡(luò)。
ZF網(wǎng)絡(luò)各層參數(shù)見表2。
表2 ZF網(wǎng)絡(luò)卷積過程參數(shù)
相對于 R-CNN系列其他網(wǎng)絡(luò),F(xiàn)aster R-CNN 可以看做“區(qū)域生成網(wǎng)絡(luò)+Fast R-CNN”的系統(tǒng),用區(qū)域生 成 網(wǎng) 絡(luò) (RPN)代 替 Fast R-CNN 中 Selective Search[16]方法,使得在精度不變的同時(shí),速度變得更快。RPN核心思想是使用卷積神經(jīng)網(wǎng)絡(luò)直接產(chǎn)生區(qū)域建議,本質(zhì)就是滑動(dòng)窗口。RPN網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示[17]。假設(shè)給定600×100的輸入圖像,經(jīng)過一系列卷積操作得到最后一層大小約為40×60的卷積特征圖,最后一層卷積層共有256個(gè)卷積特征圖。
圖4 RPN網(wǎng)絡(luò)示意圖
在這個(gè)特征圖上使用3×3滑動(dòng)窗口與最后一層得到的特征圖進(jìn)行卷積,在這個(gè)3×3的區(qū)域上,每一個(gè)特征圖上得到1個(gè)1維向量,256個(gè)特性圖即可得到256維特征向量。
后邊接入到兩個(gè)全連接層,即分類層和回歸層,分別用于分類和邊框回歸。分類層包含2個(gè)元素,用于判別目標(biāo)和非目標(biāo)的估計(jì)概率,正樣本與真實(shí)區(qū)域重疊大于0.7,負(fù)樣本與真實(shí)區(qū)域重疊小于0.3?;貧w層包含4個(gè)坐標(biāo)元素(x,y,w,h),用于確定目標(biāo)位置,返回區(qū)域位置。
根據(jù)建議區(qū)域得分高低,選取前300個(gè)建議區(qū)域,作為輸入進(jìn)行目標(biāo)檢測。
在運(yùn)用卷積神經(jīng)網(wǎng)絡(luò)對接觸網(wǎng)圖像提取特征對定位器支座定位過程中,分別輸入50,100,150和200張高鐵接觸網(wǎng)支撐懸掛裝置圖像,訓(xùn)練等電位線識別模型。輸入圖片分為訓(xùn)練和測試兩部分,其中訓(xùn)練圖像占總數(shù)量的70%,剩下的作為測試圖像,迭代次數(shù)分別為500、1 000、1 500、2 000次,學(xué)習(xí)率為0.01,表3為不同樣本數(shù)量以及在不同迭代次數(shù)情況下的訓(xùn)練時(shí)間。
表3 不同樣本數(shù)量、不同迭代次數(shù)的訓(xùn)練時(shí)間 s
通過輸入不同訓(xùn)練樣本數(shù)量和迭代次數(shù)組合,得到16個(gè)等電位線識別模型,通過輸入600張測試圖像分別檢測訓(xùn)練得到每張圖像的平均檢測時(shí)間和等電位線識別模型的準(zhǔn)確度。由表4可知,在模型訓(xùn)練完成之后,單張檢測時(shí)間隨訓(xùn)練數(shù)目和迭代次數(shù)的增加有所增長。
表4 不同樣本數(shù)量、不同迭代次數(shù)的測試時(shí)間 s
表5 不同樣本數(shù)量、不同迭代次數(shù)的準(zhǔn)確度 s
由表5可知,在應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練模型時(shí),需要數(shù)以萬計(jì)的圖像。由于接觸網(wǎng)圖像的特殊性,僅對等電位線單一物體特征提取,實(shí)行定位監(jiān)測,就可以通過訓(xùn)練較少圖像達(dá)到理想效果。
在神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中,迭代輸出lg信息中,一般包括迭代次數(shù)、訓(xùn)練損失代價(jià)、測試損失代價(jià)、測試精度等。通過繪制訓(xùn)練曲線(圖5),不同訓(xùn)練圖像數(shù)目訓(xùn)練損失代價(jià)下降幅度不同,并且都隨迭代次數(shù)增加而不斷下降,200張圖片迭代2 000次,訓(xùn)練損失較小,達(dá)到較好的訓(xùn)練效果。
圖5 訓(xùn)練損失代價(jià)曲線
圖6為輸入200張圖像迭代2 000次訓(xùn)練得到的定位結(jié)果。圖6(a)是經(jīng)過第一級Faster R-CNN獲得的定位結(jié)果;圖6(b)是截取定位結(jié)果,用于下一步故障檢測。
圖6 定位器支座定位效果
在運(yùn)用卷積神經(jīng)網(wǎng)絡(luò)對上一步定位得到的接觸網(wǎng)定位器支座圖像中,200張散股故障圖片分為訓(xùn)練和測試兩部分,其中訓(xùn)練占總數(shù)量的70%,剩下圖像作為測試圖像,設(shè)其迭代次數(shù)為2 000次,學(xué)習(xí)率為0.01。
圖7 等電位線散股故障分類
依據(jù)經(jīng)驗(yàn)將等電位線散股故障分為兩類:局部嚴(yán)重散股,如圖7中標(biāo)識1的方框和輕微散股,標(biāo)識為2的方框。至于等電位線輕微散股故障,經(jīng)過多次實(shí)驗(yàn)分析,設(shè)SA為等電位線的全部面積,S1,S2,…,Sk為檢測故障方框面積且大小依次遞減,S為所有方框面積之和,統(tǒng)計(jì)圖像庫中輕微散股圖片,根據(jù)經(jīng)驗(yàn)取值可制定如下狀態(tài)判據(jù):
(1)若S/SA≥0.072,則為等電位線輕微散股狀態(tài)。
(2)若S/SA<0.072,則為正常狀態(tài)。
以上判據(jù)中閾值數(shù)據(jù)均為經(jīng)驗(yàn)取值,能夠較準(zhǔn)確地判斷等電位線輕微散股故障,為維修工人提供維修依據(jù)。等電位線局部嚴(yán)重散股故障可直接由卷積神經(jīng)網(wǎng)絡(luò)定位得出發(fā)出預(yù)警,如圖8所示,防止等電位線故障引起其他接觸網(wǎng)問題,造成不可挽回的損失。
圖8 等電位線局部嚴(yán)重散股故障
使用上述方法對接觸網(wǎng)成像檢測車拍攝到的2 000張高鐵接觸網(wǎng)支撐懸掛裝置圖像進(jìn)行實(shí)驗(yàn)檢測。含有等電位線部件的圖片有1 400張,其中等電位線出現(xiàn)散股故障的圖片有100張,實(shí)驗(yàn)檢測結(jié)果見表6。
表6 等電位線故障實(shí)驗(yàn)檢測數(shù)據(jù)
由表6可知,算法在等電位線部件的定位提取中有較高的準(zhǔn)確率,且檢測速度可滿足實(shí)時(shí)性。等電位線出現(xiàn)定位錯(cuò)誤主要是由于該處接觸網(wǎng)部件拍攝角度出現(xiàn)遮擋,發(fā)生遮擋重疊,如圖9所示,造成定位判斷錯(cuò)誤。
圖9 等電位線散股故障檢測算法實(shí)現(xiàn)框架
本文基于數(shù)字圖像處理技術(shù),采用卷積神經(jīng)網(wǎng)絡(luò)Faster R-CNN實(shí)現(xiàn)等電位線的定位以及散股故障,成功率較高。實(shí)驗(yàn)結(jié)果表明,基于級聯(lián)Faster R-CNN能有效定位提取等電位線部件并正確判斷零件故障,相比傳統(tǒng)的人工篩查方式具有較高的檢測效率,為接觸網(wǎng)支撐裝置零部件故障判斷提供了技術(shù)參考。