于博軒
(中車(chē)工業(yè)研究院有限公司,北京 100070)
作為一種大運(yùn)量、經(jīng)濟(jì)型交通工具,鐵路在我國(guó)的經(jīng)濟(jì)生活中占有重要的地位,為我國(guó)經(jīng)濟(jì)社會(huì)發(fā)展做出了巨大貢獻(xiàn)。2019年我國(guó)鐵路營(yíng)業(yè)里程超過(guò)13.9萬(wàn) km,其中電氣化里程10.0萬(wàn)km,電氣化率為71.9%。電氣化鐵路的快速發(fā)展對(duì)接觸網(wǎng)檢測(cè)提出了更高要求。
電器化鐵路接觸網(wǎng)由接觸懸掛、定位裝置、支持裝置、支柱等部分組成,是電氣化鐵路的重要組成部分。其中,接觸網(wǎng)定位裝置由定位管、定位器、定位線夾及其連接零件組成,用于將接觸網(wǎng)懸掛定位在設(shè)計(jì)的空間范圍內(nèi),使其滿足受電弓取流的幾何要求。接觸網(wǎng)的露天架設(shè),導(dǎo)致接觸網(wǎng)定位裝置在外部環(huán)境以及自身壽命的影響下出現(xiàn)部件松動(dòng)、斷裂、小部件缺失等問(wèn)題,而一旦定位器底座開(kāi)口銷(xiāo)缺失,將帶來(lái)重大安全隱患,因此,如何及時(shí)發(fā)現(xiàn)定位器底座開(kāi)口銷(xiāo)缺失是急需解決的技術(shù)難題。
接觸網(wǎng)懸掛狀態(tài)檢測(cè)系統(tǒng)是一種包含了圖像處理技術(shù)、動(dòng)態(tài)拍攝技術(shù)、激光攝像技術(shù)、數(shù)據(jù)庫(kù)技術(shù)的成像檢測(cè)系統(tǒng)。該系統(tǒng)搭載于接觸網(wǎng)作業(yè)車(chē)或?qū)S密?chē)輛上,隨車(chē)輛行駛過(guò)程自動(dòng)識(shí)別接觸網(wǎng)支持裝置并通過(guò)圖像抓拍技術(shù)獲得接觸網(wǎng)懸掛狀態(tài)圖像,所拍攝的圖像能夠有效呈現(xiàn)接觸網(wǎng)支持裝置、附加懸掛、接觸懸掛及吊柱座區(qū)域零部件的技術(shù)狀態(tài)。數(shù)據(jù)處理分析模塊采用圖像穩(wěn)定技術(shù)對(duì)高清相機(jī)采集的圖片進(jìn)行處理,得到高分辨率圖像。該高分辨率的圖像一方面可以分辨出懸掛裝置出現(xiàn)的松動(dòng)、脫落、斷裂等故障,另一方面可以提供公里標(biāo)、桿號(hào)、站區(qū)等綜合信息用于定位。
本文采用的接觸網(wǎng)懸掛狀態(tài)檢測(cè)系統(tǒng)硬件結(jié)構(gòu)由剛性接觸網(wǎng)成像模塊(包括定位點(diǎn)剛性懸掛成像模塊、剛性懸掛高位吊柱座成像模塊、連續(xù)視頻錄像模塊)、柔性接觸網(wǎng)成像模塊(包括定位裝置及支持裝置成像模塊、附加懸掛成像模塊、桿號(hào)成像模塊、接觸懸掛成像模塊)、嵌入式觸發(fā)控制模塊、時(shí)空同步定位模塊、支吊柱/定位點(diǎn)識(shí)別模塊、補(bǔ)償光源模塊、車(chē)地傳輸模塊、顯示與操作模塊、數(shù)據(jù)處理分析模塊等組成,如圖 1所示。
圖1 接觸網(wǎng)檢測(cè)系統(tǒng)構(gòu)成
在每張接觸網(wǎng)檢測(cè)圖像中,接觸網(wǎng)定位器底座區(qū)域圖像只占到接觸網(wǎng)檢測(cè)圖像中2 900萬(wàn)像素圖像的很小一塊面積,為準(zhǔn)確定位并獲得定位器底座區(qū)域圖像數(shù)據(jù),提高定位器底座開(kāi)口銷(xiāo)缺失檢測(cè)效率,本文采用歸一化互相關(guān)模板匹配(NCC)算法,該算法既支持線陣連續(xù)圖像數(shù)據(jù),也支持面陣圖像數(shù)據(jù)。
NCC算法是一種基于統(tǒng)計(jì)學(xué)且取值范圍在[-1,1]之間的算法,常被用來(lái)比較2幅圖像的相似程度,也就是圖像的相關(guān)性。對(duì)圖像來(lái)說(shuō),每個(gè)像素點(diǎn)都可以看作是1個(gè)樣本數(shù)據(jù)子集,這樣整幅圖像就構(gòu)成了1個(gè)樣本數(shù)據(jù)合集。如果該合集中的1個(gè)子集與另外1個(gè)樣本數(shù)據(jù)中的某個(gè)子集出現(xiàn)匹配的情況,則它的NCC值為1,表示相似度極高,反之,如果NCC的值為-1,則表示完全不相關(guān)。基于該理論,NCC算法可以表示如下:
式(1)中,W為在待匹配像素位置構(gòu)建的鄰域窗口;I1(x,y)為模板圖像像素值;I2(x,y)為搜索子圖像素值。
NCC算法優(yōu)點(diǎn)是抗白噪聲干擾能力強(qiáng),且在灰度變化及幾何畸變不大的情況下精度很高,計(jì)算結(jié)果有固定的范圍[-1,1],方便設(shè)置檢測(cè)閾值。
采用NCC算法定位出定位器底座區(qū)域后,本文通過(guò)遞進(jìn)式的銷(xiāo)釘區(qū)域識(shí)別和開(kāi)口銷(xiāo)識(shí)別實(shí)現(xiàn)開(kāi)口銷(xiāo)缺失的智能判別,首先從定位器底座圖像中識(shí)別出銷(xiāo)釘目標(biāo),再根據(jù)銷(xiāo)釘區(qū)域圖像識(shí)別開(kāi)口銷(xiāo)是否缺失。為使不同場(chǎng)景下的開(kāi)口銷(xiāo)缺失識(shí)別效果最優(yōu)化,需要事先通過(guò)自編碼器(AE)進(jìn)行定位器開(kāi)口銷(xiāo)區(qū)域數(shù)據(jù)采集,采集不同場(chǎng)景、不同光照、不同尺寸條件下的定位器底座圖像、開(kāi)口銷(xiāo)圖像和銷(xiāo)釘圖像。其中,不同場(chǎng)景指白天和野外,不同光照指圖像曝光偏暗、圖像過(guò)曝等,不同尺寸涵蓋接觸網(wǎng)檢測(cè)常見(jiàn)的1 600萬(wàn)像素、2 000萬(wàn)像素、2 900萬(wàn)像素圖像。本文最終目的是智能識(shí)別開(kāi)口銷(xiāo)是否缺失,對(duì)于開(kāi)口銷(xiāo)銷(xiāo)釘狀態(tài)圖像采集需要盡量滿足多樣性,如果采集的銷(xiāo)釘狀態(tài)圖像多樣性過(guò)少,識(shí)別正確率會(huì)降低。因此,銷(xiāo)釘狀態(tài)圖像需要涵蓋銷(xiāo)釘掰開(kāi)的不同程度、銷(xiāo)釘?shù)牟煌颉N(xiāo)釘?shù)牟煌屡f程度等。
自編碼器是一類(lèi)在半監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)中使用的人工神經(jīng)網(wǎng)絡(luò),其功能是通過(guò)將輸入信息作為學(xué)習(xí)目標(biāo),對(duì)輸入信息進(jìn)行表征學(xué)習(xí)。令輸入層向量為x,通過(guò)自編碼器后的輸出層向量為x',但輸出層向量x'和自身輸入層向量x之間仍然存在一定的差異。自編碼器也是一種有損壓縮,可通過(guò)損失函數(shù)最小來(lái)實(shí)現(xiàn)x'近似于x的值?;镜淖跃幋a器是一種包含數(shù)據(jù)輸入層、隱藏層、輸出層3層的神經(jīng)網(wǎng)絡(luò)模型。自編碼器包含編碼過(guò)程和解碼過(guò)程,從輸入層到隱藏層為編碼過(guò)程,從隱藏層到輸出層為解碼過(guò)程。自編碼器就是將原始數(shù)據(jù)進(jìn)行編碼,降低維度,發(fā)現(xiàn)數(shù)據(jù)之間規(guī)律的過(guò)程。3層自編碼神經(jīng)網(wǎng)絡(luò)的模型如圖2所示。
圖2 3層自編碼神經(jīng)網(wǎng)絡(luò)模型
自編碼器特征提取算法包括2個(gè)過(guò)程,輸入層—隱藏層h的編碼過(guò)程,如式(2)所示:
式(2)中,δe為編碼函數(shù),W1,b1為編碼的權(quán)重和偏置。
隱藏層—輸出層的解碼過(guò)程,如式(3)所示:
式(3)中,δd為解碼函數(shù),W2、b2為解碼的權(quán)重和偏置。
編碼、解碼之間的壓縮損失JE( W,b)是:
式(4)中, W、b為整個(gè)自編碼器網(wǎng)絡(luò)的權(quán)重和偏置,r表示訓(xùn)練集中的樣本序號(hào),m表示訓(xùn)練集的樣本總數(shù)。
由于開(kāi)口銷(xiāo)狀態(tài)各異,且采集圖像背景復(fù)雜多變,實(shí)踐中發(fā)現(xiàn)采用灰度梯度直方圖特征(HOG)、局部二值模式特征(LBP)等傳統(tǒng)方法提取圖像特征的識(shí)別效果不夠理想。因此,采用自編碼器自動(dòng)提取圖像特征,使用BP神經(jīng)網(wǎng)絡(luò)算法進(jìn)行訓(xùn)練,使其輸入值等于輸出值,對(duì)輸入的定位裝置底座區(qū)域圖像進(jìn)行降維處理。實(shí)際網(wǎng)絡(luò)中,網(wǎng)絡(luò)輸入層L1為圖像數(shù)據(jù),考慮到開(kāi)口銷(xiāo)銷(xiāo)釘?shù)某叽缣攸c(diǎn),輸入層L1采用70×70的神經(jīng)元數(shù)量,隱藏層L2神經(jīng)元數(shù)量設(shè)置為 1 000,輸出層神經(jīng)元數(shù)量和輸入層L1一樣也為70×70。
具體做法是,首先收集5~10萬(wàn)各種場(chǎng)景下不同形態(tài)的開(kāi)口銷(xiāo)樣本圖像,并縮放圖像尺寸為70×70;然后采用開(kāi)口銷(xiāo)樣本圖像訓(xùn)練自編碼器網(wǎng)絡(luò);最后輸入待識(shí)別的定位裝置底座區(qū)域圖像至訓(xùn)練好的自編碼器,提取隱藏層的1 000維數(shù)據(jù)作為開(kāi)口銷(xiāo)特征,送入支持向量機(jī)(SVM)進(jìn)行開(kāi)口銷(xiāo)缺失識(shí)別。
定位器底座開(kāi)口銷(xiāo)缺失識(shí)別可通過(guò)支持向量機(jī)SVM實(shí)現(xiàn)。對(duì)于已經(jīng)得到了的帶標(biāo)簽的訓(xùn)練數(shù)據(jù)(即其 中為自編碼器提取的1 000維特征,yi為開(kāi)口銷(xiāo)是否缺失類(lèi)別標(biāo)簽,i= 1~M),現(xiàn)在需要1個(gè)超平面將這些特征數(shù)據(jù)分為正常開(kāi)口銷(xiāo)和開(kāi)口銷(xiāo)缺失2類(lèi),假設(shè)該超平面函數(shù)為為M維向量的轉(zhuǎn)置,b為實(shí)數(shù)),當(dāng) 0 時(shí),x位于超平面上,的點(diǎn)對(duì)應(yīng)yi= +1的數(shù)據(jù)點(diǎn),的點(diǎn)對(duì)應(yīng)yi= -1的數(shù)據(jù)點(diǎn),為此設(shè):
根據(jù)支持向量機(jī)(SVM)的推導(dǎo)過(guò)程,可得到如下模型公式:
式(6)對(duì)于線性可分的任務(wù)通常有較好的效果,但是用于開(kāi)口銷(xiāo)缺失分類(lèi)的特征數(shù)據(jù)較為復(fù)雜,該線性模型已經(jīng)不能適應(yīng)。因此,根據(jù)支持向量機(jī)(SVM)理論,將輸入數(shù)據(jù)映射到高維空間,使其在該空間中盡量線性可分,故上述模型的約束條件可寫(xiě)為:
式(7)中,φ是輸入數(shù)據(jù)映射到高維空間的映射函數(shù)。
該模型直接求解非常困難,目前基本都是通過(guò)優(yōu)化其對(duì)偶問(wèn)題來(lái)求解,其對(duì)偶問(wèn)題可通過(guò)拉格朗日乘子和對(duì)偶定理進(jìn)行推導(dǎo),這里不做詳細(xì)闡述。在其對(duì)偶模型中,涉及到的向量?jī)?nèi)積計(jì)算為另一輸入數(shù)據(jù)映射至高緯空間的向量,j= 1~M),而映射后的特征空間維數(shù)通常很高,甚至是無(wú)窮維,因此直接計(jì)算是非常困難的。為解決這個(gè)問(wèn)題,可通過(guò)引入核函數(shù),將高維空間內(nèi)積轉(zhuǎn)化為求原始空間中核函數(shù)值的方式求解,即:
式(8)中, 是引入的核函數(shù)。本文采用的是高斯核函數(shù),其具有如下形式:
式(9)中, 為高斯核函數(shù)的寬度參數(shù)。上述推導(dǎo)的理論目標(biāo)不允許任何數(shù)據(jù)分錯(cuò),要求所有點(diǎn)都在分類(lèi)間隔外,這通常都會(huì)導(dǎo)致嚴(yán)重的過(guò)擬合問(wèn)題。為防止過(guò)擬合,增強(qiáng)模型泛化能力,可以引入松弛變量,進(jìn)而模型可寫(xiě)為:
引入松弛變量后,其物理意義在于訓(xùn)練時(shí)可通過(guò)參數(shù)C來(lái)控制分類(lèi)間隔,允許部分點(diǎn)分錯(cuò),這樣就可以在訓(xùn)練時(shí)很大程度地抑制過(guò)擬合,提升模型的泛化能力,以適應(yīng)新的分類(lèi)數(shù)據(jù)。對(duì)于新輸入的定位器底座圖像,即可先輸入訓(xùn)練好的自編碼器網(wǎng)絡(luò)提取降維圖像特征,再將降維圖像特征送入支持向量機(jī)(SVM)進(jìn)行分類(lèi),識(shí)別是否存在開(kāi)口銷(xiāo)缺失異常。實(shí)際應(yīng)用時(shí),可先采用上述方法識(shí)別定位器底座開(kāi)口銷(xiāo)圖像中的銷(xiāo)釘區(qū)域,再在銷(xiāo)釘區(qū)域判定開(kāi)口銷(xiāo)是否缺失。
為檢驗(yàn)本文提出的定位器底座開(kāi)口銷(xiāo)缺失識(shí)別方法的有效性,在現(xiàn)場(chǎng)設(shè)置3處平腕臂底座橫向開(kāi)口銷(xiāo)缺失和8處斜腕臂底座縱向開(kāi)口銷(xiāo)缺失,采用本文提出的開(kāi)口銷(xiāo)缺失識(shí)別方法進(jìn)行開(kāi)口銷(xiāo)缺失在線識(shí)別,識(shí)別效果如圖2、圖3所示,識(shí)別結(jié)果如表1所示。
圖2 平腕臂底座橫向開(kāi)口銷(xiāo)缺失
圖3 斜腕臂底座縱向開(kāi)口銷(xiāo)缺失
由表1可知,現(xiàn)場(chǎng)設(shè)置的10處平腕臂底座橫向開(kāi)口銷(xiāo)缺失均實(shí)現(xiàn)了正確識(shí)別,11處斜腕臂底座縱向開(kāi)口銷(xiāo)缺失中有1處未識(shí)別,其原因在于部件邊緣污垢較多造成區(qū)域特征難以與背景圖像區(qū)分。
表1 開(kāi)口銷(xiāo)缺失識(shí)別結(jié)果統(tǒng)計(jì)
為高效準(zhǔn)確地對(duì)接觸網(wǎng)定位器底座開(kāi)口銷(xiāo)缺失進(jìn)行識(shí)別,針對(duì)開(kāi)口銷(xiāo)形態(tài)小、分布廣的特點(diǎn),采用歸一化互相關(guān)模板匹配(NCC)算法進(jìn)行定位器底座區(qū)域定位,同時(shí)采用無(wú)監(jiān)督學(xué)習(xí)的自編碼器(AE)提取圖像的降維特征,再通過(guò)支持向量機(jī)(SVM)對(duì)開(kāi)口銷(xiāo)進(jìn)行識(shí)別分類(lèi),有效解決了開(kāi)口銷(xiāo)缺失識(shí)別問(wèn)題。現(xiàn)場(chǎng)試驗(yàn)結(jié)果表明,本文提出的算法能夠?qū)?fù)雜線路環(huán)境圖像中的定位器底座開(kāi)口銷(xiāo)缺失進(jìn)行準(zhǔn)確識(shí)別和有效檢出,檢出率高,具有較高的技術(shù)推廣價(jià)值。