張 益,何應(yīng)德,吳 迪
(北京康拓紅外技術(shù)股份有限公司,北京 100095)
基于數(shù)字圖像分析的鐵路貨車閘瓦插銷竄出故障自動識別方法
張 益,何應(yīng)德,吳 迪
(北京康拓紅外技術(shù)股份有限公司,北京 100095)
本文基于數(shù)字圖像分析技術(shù),提出一種TFDS鐵路貨車閘瓦插銷竄出故障的自動識別方法。算法對原始輸入圖像進(jìn)行必要的區(qū)域定位、直方圖均衡化、去噪等預(yù)處理;針對處理后的閘瓦插銷的圖像,設(shè)計(jì)適合其形狀、紋理和位置3個方面特征的梯度方向直方圖來描述閘瓦插銷的特征向量;提取特征向量輸入到已經(jīng)訓(xùn)練好的線性可分支持向量機(jī)分類器模型中進(jìn)行故障判斷和自動識別。實(shí)驗(yàn)數(shù)據(jù)證明了該識別算法的穩(wěn)定性、可靠性和實(shí)用性。
TFDS;閘瓦插銷;圖像分析;梯度向量直方圖
鐵路貨車運(yùn)行故障動態(tài)圖像檢測系統(tǒng)(TFDS)作為車輛運(yùn)行安全監(jiān)控系統(tǒng)(5T系統(tǒng))的重要組成部分,通過布置于軌側(cè)、軌下的高速工業(yè)相機(jī)陣列對運(yùn)行中的貨車車體進(jìn)行圖像采集,再由列檢人員根據(jù)傳輸?shù)搅袡z中心的貨車圖像進(jìn)行故障識別和判斷,充分利用計(jì)算機(jī)機(jī)器視覺技術(shù),實(shí)現(xiàn)列檢從完全的室外作業(yè)到室內(nèi)作業(yè)的有機(jī)轉(zhuǎn)變。隨著貨運(yùn)列車(貨車)開行密度和運(yùn)量的不斷增加,貨車列檢故障識別的必然趨勢是由列檢人員高強(qiáng)度、滿負(fù)荷的人工判斷逐步轉(zhuǎn)為計(jì)算機(jī)自動識別。數(shù)字圖像分析的引入將提高故障自動識別的效率和可靠性,對保障鐵路安全運(yùn)輸、提升貨車運(yùn)行效率具有重要意義。
閘瓦插銷是把貨車閘片固定在閘瓦托上的重要配件。閘瓦插銷竄出是列車較易發(fā)生的故障之一,它的竄出可能導(dǎo)致閘瓦丟失,影響車輛制動,給列車行車安全帶來嚴(yán)重隱患。因此,對閘瓦插銷狀態(tài)的檢查是列車安全行駛的重要保障。圖1為TFDS軌邊相機(jī)拍攝的閘瓦插銷圖像。圖1(a)為正常情況下的圖像,閘瓦插銷從閘瓦托的插槽里伸出;圖1(b)為閘瓦插銷竄出故障圖像,閘瓦插銷向上竄出(圖的深度方向),在閘瓦托的插槽里已經(jīng)看不見插銷。
由于軌邊高速相機(jī)處于室外,受雨雪天氣和強(qiáng)弱光等環(huán)境的影響,以及像機(jī)與通過的列車共振產(chǎn)生的抖動,導(dǎo)致采集的貨車動態(tài)圖像的亮度和對比度差異大,存在曝光不足或過度、局部反射光斑、模糊和對比度低等問題。從圖1可知,閘瓦插銷部件在整幅圖像中僅占較小的部分,為減少整體算法的運(yùn)算量,僅需處理包含該部件的一個矩形區(qū)域即可,稱之為閘瓦插銷感興趣區(qū)域。
圖1 TFDS拍攝的閘瓦插銷圖像
針對閘瓦插銷圖像的上述特點(diǎn),在預(yù)處理過程中,預(yù)處理算法通過判斷閘瓦及閘瓦托的邊緣空間位置的先驗(yàn)關(guān)系來確定閘瓦插銷的感興趣區(qū)域,對感興趣區(qū)采用灰度直方圖均衡化和高斯平滑方法進(jìn)行預(yù)處理。圖2(b)是直方圖均衡化后的效果圖,可以看到經(jīng)過直方圖均衡化后圖像的灰度分布更加均衡,減小圖像灰度分布差異對特征向量提取的影響。但直方圖均衡化對圖像增強(qiáng)的同時,噪聲也被放大,因此在預(yù)處理過程中對直方圖均衡化后的圖像采用了高斯平滑對圖像進(jìn)行去噪。圖2(c)為高斯平滑后的插銷圖像。
圖2 直方圖均衡化、高斯平滑前后效果圖
由于圖像中插銷方向的無序性和不規(guī)則性,需要先提取故障區(qū)域圖片的特征,再進(jìn)行分析和判斷。本文采用梯度方向直方圖(HOG) 進(jìn)行特征提取。圖像特征提取完畢之后,利用支持向量機(jī)分類器(SVM)對特征圖像進(jìn)行分類決策。識別過程具體如下:
(1)鏡像圖像。插銷出口的位置統(tǒng)一朝“左上”方向。這樣做可以簡化插銷出口的定位和插銷竄出(或丟失)的識別。
(2)獲取HOG特征向量,并進(jìn)行歸一化。對絕大部分的車型而言,歸一化過程不僅包含了足夠的插銷圖像信息,同時不會引入過多干擾識別的噪聲信息,還能夠避免光照不一致性的影響。
(3)決策識別。將插銷出口的HOG特征輸入訓(xùn)練好的SVM,SVM給出識別結(jié)果。“-1”表示插銷丟失,“+1”表示圖像正常。具體如圖3所示。
圖3 閘瓦插銷竄出識別算法流程圖
2.1 閘瓦插銷竄出特征向量
2.1.1梯度方向直方圖
梯度方向直方圖是2005年由Navneet Dalal提出的[1~2],用來作為物體檢測的特征。梯度方向直方圖是圖像局部區(qū)域特征的累加,而非單純的針對一整幅圖像。HOG的局部提取范圍稱作窗,需要判斷的就是這個窗區(qū)域中是否包含特征物體。在提取的窗中,進(jìn)一步將窗分割成塊和細(xì)胞。單個梯度方向的直方圖提取的最基本區(qū)域是細(xì)胞。
提取過程可分為5步:(1)將待提取區(qū)域歸一化成統(tǒng)一大小,本文采用插銷區(qū)域的像素大小。(2)計(jì)算窗區(qū)域中的梯度值,分為梯度模值和梯度方向兩張圖。(3)將窗口分割為若干個相互之間有重疊的矩形塊,每一個塊分割成幾個固定數(shù)目的細(xì)胞單元。在每一個細(xì)胞單元中計(jì)算細(xì)胞本身的該梯度方向的直方圖。(4)將一個矩形塊中包含的各子細(xì)胞單元直方圖相連得到該塊的直方圖向量,同時進(jìn)行歸一化。(5)將窗口中各塊的直方圖向量相連接,得到該插銷區(qū)域圖像完整的HOG特征向量,如圖4所示。
2.1.2梯度計(jì)算
梯度可以有效地表現(xiàn)輪廓、邊緣和一些紋理特征,同時受光照變化的影響較小。對于每個像素點(diǎn)梯度的計(jì)算,本文采用一維的中心對稱算子[1,0,1]對插銷圖像提取梯度方向直方圖特征向量。
圖4 梯度方向直方圖特征提取流程
2.1.3單元格內(nèi)直方圖投票
單元格內(nèi)直方圖投票是為了獲取圖像局部梯度的信息編碼,盡可能地減少插銷位移或外形的微小變化帶來的影響。塊中的每一個細(xì)胞在指定區(qū)間量的梯度方向投票得到其對應(yīng)的一個直方圖,幅值作為直方圖計(jì)算的投票值。單個像素在直方圖的區(qū)間位置由該像素的梯度方向決定,角度范圍可以分為無符號0~180度,或有符號的0~360度。若細(xì)胞的直方圖維度過高,會增加直方圖向量的長度,增大計(jì)算量;并會使特征變得過分敏感,在插銷和插銷托形變的魯棒性方面不理想;而直方圖維度太低,則造成特征表達(dá)稍顯粗糙,不能有效描述細(xì)胞內(nèi)部的物體邊緣分布情況。Navneet Dalal 和 Bill Triggs在其論文中給出了證明,通常使用的直方圖是九維的,即每20度統(tǒng)一到一個維度[2]。
2.1.4塊直方圖歸一化
每一個塊內(nèi)的所有細(xì)胞在投票結(jié)束后,將相鄰的直方圖按照固定的位置次序連接,并進(jìn)行向量歸一化處理,得到塊的直方圖向量。對塊的直方圖向量做整體上的歸一化處理的目的是消除不同圖片上梯度模值的差異,減少邊緣的銳利程度,加強(qiáng)局部區(qū)域邊緣方向的分布情況。
本文采用L2-norm的歸一化方法,設(shè)V是未歸一化的直方圖向量,(||V||K, K=1, 2)是V的K范數(shù),ε 是一個常數(shù),用于校正,則L2-norm如式(1)所示。
經(jīng)過歸一化后,將窗口中的各塊向量連接成完整的HOG特征,完成描述插銷圖像的HOG特征向量的提取。
2.2 支持向量機(jī)分類器
根據(jù)HOG的特點(diǎn),本文選擇線性可分支持向量機(jī)分類器進(jìn)行機(jī)器學(xué)習(xí)和分類[3]。
支持向量機(jī)實(shí)現(xiàn)的關(guān)鍵是尋找最優(yōu)分類超平面。圖5所示為二維空間中的兩類線性可分的樣本,方形和圓形分別代表兩種樣本。假設(shè)分類線為H, H1和H2分別為各類樣本中距離H最近且平行的直線,稱H1和H2之間的距離叫做分類間隔。最優(yōu)分類線就是要求分類線不但能夠?qū)深悩颖菊_分開,而且使得分類間隔最大。
圖5 最佳分割超平面
設(shè)最優(yōu)超平面的方程為wTx+b=0。根據(jù)點(diǎn)到平面的距離公式可知,樣本X與最佳超平面(w, b)之間的距離為對其進(jìn)行歸一化,選擇w和 b,使得距離超平面最近的樣本xk滿足
圖5中,H1和H2上黑色的樣本點(diǎn)稱為支持向量,是各類樣本中距離H最近的樣本。最優(yōu)分類函數(shù)為:
2.3 分類器訓(xùn)練
分類器訓(xùn)練是為了構(gòu)造分類模型,訓(xùn)練流程如圖6所示,訓(xùn)練過程分為4步。
圖6 分類器訓(xùn)練流程圖
(1)準(zhǔn)備訓(xùn)練樣本。收集朝向一致向“左上”方的插銷出口圖像,正負(fù)樣本各400張。圖7為部分正負(fù)樣本示意圖。(2)提取HOG特征。提取所有樣本的HOG特征,并對特征向量歸一化。樣本的特征向量組合成一個特征矩陣,矩陣的每一行對應(yīng)一個樣本特征向量。另有一個結(jié)果指示矩陣,行數(shù)與特征矩陣相同,只有一列,其每一行指示了對應(yīng)特征矩陣樣本的正負(fù)。(3)訓(xùn)練SVM。采用高斯核函數(shù),核函數(shù)參數(shù)gamma以及軟邊界代價(jià)因子C通過掃描方法確定最佳取值。(4)保存訓(xùn)練結(jié)果。
圖7 正負(fù)樣本示意圖
本算法的測試環(huán)境為:Windows 7(32 bit)操作系統(tǒng),英特爾酷睿2雙核處理器,4 GB內(nèi)存,VS2010的開發(fā)環(huán)境。為檢驗(yàn)識別算法的可靠性、穩(wěn)定性和魯棒性,分別采集4類環(huán)境下(光照充足、曝光不足、雨天模糊、型號特殊)的插銷圖像數(shù)據(jù)共計(jì)4 000個樣本進(jìn)行測試,同時與較為常用的模板匹配的算法進(jìn)行比較,實(shí)驗(yàn)結(jié)果如表1和表2所示。
表1 不同環(huán)境采集圖像實(shí)驗(yàn)測試結(jié)果
表2 兩類識別算法實(shí)驗(yàn)測試結(jié)果
從表1和表2可知本文算法分別在4類環(huán)境圖像的識別中表現(xiàn)了較高的識別率,平均達(dá)到98.25%,運(yùn)行時間平均每個樣本16 ms左右。比模板匹配的方法識別率提高了6.95%,運(yùn)行時間縮短了1/3,這是因?yàn)椴邃N的伸出方向不確定,在第1到第3象限的270。范圍內(nèi)都有可能,還可能存在扭曲和彎曲的現(xiàn)象。這給模板的準(zhǔn)備造成了很大的困難,同時也會大大降低模板匹配方法的識別效率。提取圖像梯度特征的直方圖,很大程度上削弱了插銷位置的影響,因而具有更好的識別效果和魯棒性。
本文結(jié)合數(shù)字圖像分析理論,提出一種基于數(shù)字圖像分析的鐵路貨車閘瓦插銷竄出故障自動識別方法。實(shí)驗(yàn)結(jié)果表明,該方法使用的向量特征能很好的識別出插銷竄出的故障圖像,不受目標(biāo)位置偏移、形變的影響,抗噪性能較強(qiáng),對分辨率低,曝光不足和模糊等質(zhì)量較差的圖像具有很強(qiáng)的適應(yīng)性,同時算法運(yùn)算速度較快,效率較高。
[1] Navneet Dalal, Bill Triggs. Histograms of Oriented Gradients for Human Detection[J]. Proceedings of the 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition, vol.2, 2005:886-893.
[2] Navneet Dalal. Finding People in Images and Videos[D]. Grenoble, France: The French National Institute for Research in Computer Science and Control, 2006: 10-25.
[3] Corinna Cortes , V.Vapnik. Support-Vector Networks[J]. Machine Learning, 20, 1995:273-297.
責(zé)任編輯 陳 蓉
Automatic recognizing for brake shoe key fault of railway freight cars based on image analysis
ZHANG Yi, HE Yingde, WU Di
( Beijing Ctrowell Technology Co.Ltd., Beijing 100095, China )
This article presented an automatic recognition method to identify the fault of railway truck brake shoe key, based on the technology of digital image analysis of Trouble of moving Freight car Detection System(TFDS). Regional localization for the original image, histogram equalization and image de-noising were taken in image pretreatment. Through the histograms of oriented gradients to extract the feature vector of the brake shoe bolt, the extract features vector was imputed to the trained classif i er linearly separable support vector machine (SVM) model for fault diagnosis and automatic recognition. Experimental results demonstrated that the proposed algorithms of automatic fault recognizing for brake shoe key were available, stability and reliability.
Trouble of moving Freight car Detection System(TFDS); brake shoe key; image analysis; histograms of oriented gradients
U294.2∶TP39
A
1005-8451(2015)10-0039-04
2015-04-15
張 益,高級工程師;何應(yīng)德,工程師。