韓 強,劉俊博,馮其波,王勝春,戴 鵬
(1. 北京交通大學(xué) 理學(xué)院,北京 100081;2. 中國鐵道科學(xué)研究院集團(tuán)有限公司 基礎(chǔ)設(shè)施檢測研究所,北京 100081)
鋼軌是鐵路軌道的重要組成部件,鋼軌病害嚴(yán)重威脅列車運行安全。近年來,隨著我國鐵路運輸高速化和重載化的程度不斷提升,線路托運量越來越大,鋼軌病害問題也進(jìn)入高發(fā)期。研究高效、精確的鐵路鋼軌病害檢測方法,提升鐵路養(yǎng)護(hù)部門維修保養(yǎng)水平,是保障鐵路運輸安全的重要手段。
目前,基于機(jī)器視覺的自動化檢測方法在多種鐵路基礎(chǔ)設(shè)施的外觀狀態(tài)檢測中均有應(yīng)用,如軌道塞釘檢測[1]、接觸網(wǎng)檢測[2]、鋼軌扣件檢測[3-5]和鋼軌表面?zhèn)麚p檢測[6-10]等。其中,鋼軌表面?zhèn)麚p檢測方法可根據(jù)訓(xùn)練方式分為監(jiān)督式方法和非監(jiān)督式方法。監(jiān)督式方法的應(yīng)用:MOLODOVA 等人[7]提出利用光譜特征(Spectral Features, SF)表示傷損區(qū)域的特征,再利用滑動窗口法和K-近鄰(K-Nearest Neighbor,KNN)算法識別鋼軌表面?zhèn)麚p區(qū)域;DUBEY 等人[8]提取鋼軌的最大穩(wěn)定極值區(qū)域(Maximally Stable Extremal Regions,MSER) 作為傷損特征,通過訓(xùn)練支撐向量機(jī)(Support Vector Machine,SVM)識別該區(qū)域是否傷損。非監(jiān)督式方法的應(yīng)用:LI 等人[9]先對原始鋼軌圖像執(zhí)行局部歸一化(Local Normalization,LN),再利用輪廓投影(Projection Profile,PP)方法識別鋼軌損傷區(qū)域;此外,他們還嘗試使用邁克爾遜對比度(Michelson-Like Contrast,MLC)[10]增強原始鋼軌圖像中背景和傷損區(qū)域的對比度,然后采用比例強調(diào)最大熵(Proportion Emphasized Maximum Entropy,PEME)方法識別鋼軌損傷區(qū)域。然而,鐵路沿線自然環(huán)境復(fù)雜,鋼軌表面?zhèn)麚p區(qū)域的大小、形態(tài)各異,上述方法依賴圖像局部紋理特征,軌道環(huán)境、圖像噪聲以及光照強度都會對實際檢測結(jié)果產(chǎn)生影響。
得益于深度卷積神經(jīng)網(wǎng)絡(luò)(Deep Convolutional Neural Network,DCNN) 強大的特征表示能力,使各類目標(biāo)檢測任務(wù)取得一系列突破性的成果,且Faster-RCNN[11],SSD[12]和YOLO[13]等具有代表性的網(wǎng)絡(luò)模型在鐵路基礎(chǔ)設(shè)施病害檢測領(lǐng)域也得到一定的應(yīng)用。與傳統(tǒng)計算機(jī)視覺檢測方法相比,采用大量樣本訓(xùn)練的DCNN 模型,可以自動地學(xué)習(xí)目標(biāo)對象潛在的特征模式,從而大幅地提高模型的準(zhǔn)確性。然而,在鋼軌表面?zhèn)麚p檢測任務(wù)中,現(xiàn)有的基于DCNN 的目標(biāo)檢測方法還存在以下2方面問題亟待解決。
(1)基于DCNN 模型的目標(biāo)檢測方法通常分為目標(biāo)定位和目標(biāo)分類兩個模塊,每個模塊的訓(xùn)練過程都必須依賴充足的標(biāo)簽樣本數(shù)據(jù),但現(xiàn)實中有傷損的鋼軌圖像非常稀缺,無法手動收集和標(biāo)注足夠的訓(xùn)練樣本。
(2)現(xiàn)有基于DCNN 模型的目標(biāo)檢測方法是針對自然場景目標(biāo)所設(shè)計,對小面積目標(biāo)對象的定位精度不足,對于小面積的鋼軌表面?zhèn)麚p區(qū)域會發(fā)生漏檢現(xiàn)象。
本文提出一種基于多層級特征融合的鋼軌表面?zhèn)麚p檢測方法,并在60 kg·m-1和75 kg·m-12種不同類型的鋼軌表面?zhèn)麚p數(shù)據(jù)集上進(jìn)行試驗驗證。
基于多層級特征融合的鋼軌表面?zhèn)麚p檢測方法整體流程如圖1所示。首先,以檢測車為平臺,使用軌道圖像采集系統(tǒng)采集圖像;然后,提出一種鋼軌表面?zhèn)麚p數(shù)據(jù)集構(gòu)建方法,設(shè)計圖像預(yù)處理方法和隨機(jī)組合策略,基于有限的有傷損鋼軌圖像生成大批量的訓(xùn)練樣本圖像;最后,提出一種基于多層級特征融合的鋼軌表面?zhèn)麚p檢測網(wǎng)絡(luò),該網(wǎng)絡(luò)能夠融合多個層次不同感受野的圖像特征進(jìn)行目標(biāo)檢測,有利于提升小目標(biāo)對象的定位精度和分類識別準(zhǔn)確率。
圖1 基于多層級特征融合的鋼軌表面?zhèn)麚p檢測方法整體流程
安裝于檢測車底部的軌道圖像采集系統(tǒng)能夠在高速運行的狀態(tài)下動態(tài)地采集到清晰、完整的軌道圖像。系統(tǒng)的硬件配置如圖2 所示,包括線掃描相機(jī)組、LED 照明光源組、光電編碼器及供電、控制和數(shù)據(jù)傳輸設(shè)備。其中,線掃描相機(jī)組集成了6臺DALSA 工業(yè)線掃描相機(jī),最大像素為1 024,支持35 kHz的掃描頻率。
圖2 軌道圖像采集系統(tǒng)硬件配置
線掃描相機(jī)位置分布如圖3 所示。其中,1#和3#相機(jī)負(fù)責(zé)獲取左軌2 側(cè)的側(cè)面圖像數(shù)據(jù),而4#和6#相機(jī)負(fù)責(zé)獲取右軌2 側(cè)的側(cè)面圖像數(shù)據(jù),這些側(cè)面圖像可用于識別鋼軌塞釘、側(cè)面裂紋、魚尾板故障以及異常焊縫;2#和5#相機(jī)分別架設(shè)在左右軌的正上方,負(fù)責(zé)獲取鋼軌表面、鋼軌扣件以及軌道板等設(shè)施的正面圖像,對其進(jìn)行異常狀態(tài)識別。按照1.6 mm的行采樣間隔設(shè)置光電編碼器的脈沖頻率,以控制觸發(fā)線掃描相機(jī)快門,實現(xiàn)無重復(fù)的軌道圖像采集,檢測車速度可達(dá)160 km·h-1。
圖3 軌道圖像采集系統(tǒng)線掃描相機(jī)位置分布
此外,在長時間檢測過程中,軌道成像的光照條件不可避免地會發(fā)生變化,如云霧雨雪天氣或進(jìn)入山區(qū)、隧道等特殊地形。為了降低這些因素對軌道圖像采集質(zhì)量的影響,系統(tǒng)配備了2 組LED 光源,提供均勻明亮的成像環(huán)境。系統(tǒng)采集的多幅軌道圖像如圖4所示。
圖4 軌道圖像采集系統(tǒng)拍攝的軌道圖像
基于軌道圖像采集系統(tǒng)采集的軌道圖像,利用有限數(shù)量的傷損鋼軌圖像構(gòu)建鋼軌表面?zhèn)麚p數(shù)據(jù)集的構(gòu)建過程包括鋼軌圖像預(yù)處理和隨機(jī)組合策略2部分,為訓(xùn)練鋼軌表面?zhèn)麚p檢測網(wǎng)絡(luò)提供大量的訓(xùn)練數(shù)據(jù)。
1)鋼軌圖像預(yù)處理
軌道圖像是利用檢測車底部的高速線掃描相機(jī)動態(tài)采集獲得,鋼軌及其扣件、軌道基礎(chǔ)設(shè)施是圖像采集的主要目標(biāo)對象,為降低不相干目標(biāo)對檢測結(jié)果的影響,首先需要從原始軌道圖像中分割出鋼軌區(qū)域。
對每一幀軌道圖像,鋼軌區(qū)域具有固定的長度和寬度,且必定垂直于圖像的X軸。其中,長度等于軌道圖像的高度,為840 像素,寬度W需要根據(jù)鋼軌類型選取,對于60 kg·m-1鋼軌W為60 像素,對于75 kg·m-1鋼軌,W為65 像素。為分割提取出鋼軌區(qū)域圖像首先利用直線段檢測(Line Segment Detector,LSD)算法[14]找出軌道圖像中所有的直線段;然后,兩兩計算垂直于圖像X軸直線段的間距,若間距小于θ,則進(jìn)行合并;最后,找到間距在[W-γ,W+γ]區(qū)間的2 條最長直線視為鋼軌區(qū)域兩側(cè)邊界。θ和γ為人工選取的經(jīng)驗閾值,需要根據(jù)相機(jī)距離軌面的高度和角度調(diào)整。本文系統(tǒng)中,θ為2像素,γ為5像素。
鋼軌表面中間區(qū)域與車輪踏面接觸最頻繁,因此鋼軌表面較為光滑,在圖像中灰度值較高。鋼軌邊緣區(qū)域存在銹跡和污物,在圖像中灰度值較低;傷損區(qū)域由于凹陷,在圖像中灰度值也較低。因此,在鋼軌圖像預(yù)處理時可以進(jìn)一步增大傷損區(qū)域與正常區(qū)域的灰度值差異。
首先,將鋼軌圖像中每個像素p的灰度值Ip進(jìn)行對數(shù)變換,減小各像素的灰度差異,計算式為
式中:I′p為對數(shù)變換后的灰度值。
然后,將灰度值變換后的鋼軌圖像進(jìn)行z-Score 標(biāo)準(zhǔn)化,進(jìn)一步增加傷損區(qū)域與正常區(qū)域的灰度值差異,計算式為
式中:z為每個像素的灰度值歸一化后的值;μ為所有像素的灰度平均值;σ為灰度標(biāo)準(zhǔn)差。
最后,將每個像素的z值歸一化到[0,255]像素區(qū)間。
鋼軌圖像預(yù)處理前后對比如圖5 所示,從圖中可見,鋼軌圖像預(yù)處理方法能夠顯著減小正常區(qū)域的灰度值差異,加大傷損區(qū)域與正常區(qū)域的灰度值差異。
圖5 鋼軌圖像預(yù)處理前后對比
2)隨機(jī)組合策略
采用隨機(jī)組合策略,能夠從有限數(shù)量的人工標(biāo)注的鋼軌圖像中生成大量的訓(xùn)練樣本圖像,如圖6所示,每張訓(xùn)練樣本圖像由隨機(jī)抽取的T張鋼軌圖像組成,包含不同的鋼軌區(qū)域類型,從而解決訓(xùn)練樣本數(shù)量和多樣性不足的問題。
圖6 訓(xùn)練樣本圖像
隨機(jī)組合策略共包含以下5個步驟。
步驟1:鋼軌圖像類型“正常、掉塊、擦傷、塌陷、異物”分別以數(shù)字“0,1,2,3,4”來表示,再根據(jù)類型進(jìn)行排序。
步驟2:統(tǒng)計以上類型的鋼軌圖像的數(shù)量,分別為N0,N1,N2,N3和N4,其中,“正常”類型鋼軌圖像數(shù)量N0應(yīng)為最大值。
步驟3:為每種類型鋼軌圖像創(chuàng)建一個長度為T×N0的有編號圖像列表,并亂序排列。T為1幅訓(xùn)練樣本圖像中鋼軌圖像的數(shù)量,對于60 kg·m-1鋼軌,T=14,對于75 kg·m-1鋼軌,T=13。
步驟4:循環(huán)讀取每種類型圖像列表中的編號i,使用i與此類型的圖像數(shù)量取余得到索引值,然后根據(jù)索引值找到對應(yīng)的鋼軌圖像,并隨機(jī)的進(jìn)行垂直翻轉(zhuǎn)、水平翻轉(zhuǎn)、添加高斯噪聲等操作,最后將處理后的鋼軌圖像添加到此類型的圖像列表中。
步驟5:將所有類型的圖像列表合并,并亂序排列,每次讀取T幅鋼軌圖像橫向拼接為1 幅訓(xùn)練樣本圖像,共獲得5×N0幅訓(xùn)練樣本圖像。
目前,基于DCNN 模型的目標(biāo)檢測方法中,采用非極大值抑制(Non-Maximum Suppression,NMS)算法用于從大量邊界框中篩選最優(yōu)的目標(biāo)對象邊界框。然而,不同層級的特征圖中,淺層特征圖感受野小,細(xì)節(jié)信息較為豐富,邊界框定位較為精準(zhǔn),但淺層特征圖缺乏高級語義信息,導(dǎo)致預(yù)測的分類概率較低;深層特征圖感受野較大,含豐富的高級語義信息,預(yù)測的邊界框分類概率較高,但由于細(xì)節(jié)信息的缺失,導(dǎo)致邊界框定位不精確。因此,NMS 算法的篩選結(jié)果會偏向于分類概率值高但定位不精確的邊界框。
本文提出一種基于多層級特征融合的鋼軌表面?zhèn)麚p檢測網(wǎng)絡(luò),該網(wǎng)絡(luò)首先提取多個層級不同感受野的圖像特征,然后進(jìn)行跨通道特征融合,最后進(jìn)行目標(biāo)定位和目標(biāo)分類。
1)網(wǎng)絡(luò)架構(gòu)
基于多層級特征融合的鋼軌表面?zhèn)麚p檢測網(wǎng)絡(luò)架構(gòu)如圖7 所示,包括圖像輸入層、6 級特征提取層、3 種目標(biāo)檢測器和檢測結(jié)果輸出層,共使用55個卷積層和5個最大池化層。
圖7中,Conv為卷積層,其尺寸中,前2個維度表示卷積核的窗口大小,單位為像素,第3個維度表示卷積核的通道數(shù)量,單位為個。C為目標(biāo)檢測器中最后一個卷積層的通道數(shù)量,與預(yù)測的類別總數(shù)相關(guān),即
式中:M為鋼軌表面?zhèn)麚p的類別數(shù)量;4 為邊界框偏移量的數(shù)量;6為基準(zhǔn)定位框的種類數(shù)量。
圖7 基于多層級特征融合的鋼軌表面?zhèn)麚p檢測網(wǎng)絡(luò)架構(gòu)
6級特征提取層中,第1級包含1個尺寸為3×3×32(前2 個維度表示卷積核的窗口大小,單位為像素,第3 個維度表示卷積核的通道數(shù)量,單位為個)的卷積層;第2 級包含2 個尺寸為1×1×64 的卷積層和1 個尺寸為3×3×32 的卷積層;第3 級包含2 個尺寸為1×1×128 的卷積層和2 個尺寸為3×3×64 的卷積層;第4 級包含2 個尺寸為1×1×256 的卷積層和8 個尺寸為3×3×128 的卷積層;第5 級包含2 個尺寸為1×1×512 的卷積層和8 個尺寸為3×3×256 的卷積層;第6 級包含2個尺寸為1×1×1 024的卷積層和4個尺寸為3×3×512 的卷積層。每個卷積層的步長均為1,每級特征提取層之間使用1 個窗口大小為2×2,步長為2 的最大池化層做降采樣操作。構(gòu)造批量歸一化層(Batch Normalization Layer)[15],并將其附加在每個卷積層之后,可以有效防止過擬合現(xiàn)象。為了進(jìn)一步加快網(wǎng)絡(luò)收斂速度,激活函數(shù)可選用泄露修正線性單元(Leaky Rectified Linear Unit)[16]。
目標(biāo)檢測器在多層級特征圖上根據(jù)預(yù)設(shè)的長寬比和尺度生成6種不同大小的基準(zhǔn)定位框,每個基準(zhǔn)定位框d使用四元組(dx,dy,dw,dh)來表示,其中,(dx,dy)表示基準(zhǔn)定位框的中心點坐標(biāo),(dw,dh)表示基準(zhǔn)定位框的寬和高?;鶞?zhǔn)定位框與真實標(biāo)注框用于回歸學(xué)習(xí)邊界框的4 個偏移量(px,py,pw,ph)?;鶞?zhǔn)定位框的數(shù)量與待檢測圖像的尺寸正相關(guān),圖像尺寸越大,產(chǎn)生的基準(zhǔn)定位框數(shù)量越多。然而,鋼軌傷損區(qū)域真實標(biāo)注框的數(shù)量是固定的,導(dǎo)致產(chǎn)生的基準(zhǔn)定位框中,有傷損和非傷損的基準(zhǔn)定位框的數(shù)量不平衡。因此,將與真實標(biāo)注框的交并比(Intersection over Union,IoU)值大于0.7 的基準(zhǔn)定位框標(biāo)注為有傷損,并分配鋼軌傷損類型標(biāo)簽,再根據(jù)1:3 的比例挑選非傷損基準(zhǔn)定位框,并分配正常區(qū)域標(biāo)簽。
鋼軌表面?zhèn)麚p檢測網(wǎng)絡(luò)工作時包含以下5 個步驟。
步驟1:將待檢測圖像縮放至320像素×320像素。
步驟2:融合多層級特征圖。具體來說,將第5和第6級特征圖進(jìn)行2倍上采樣,再依次與第4和第5 級特征圖級聯(lián),得到3 種融合不同感受野的特征圖,以豐富淺層特征圖的高級語義信息。
步驟3:設(shè)置基準(zhǔn)定位框。先對3 種不同感受野的特征圖設(shè)置不同的尺度因子S=(0.3,0.6,0.9),再設(shè)置5 種不同的長寬比ar=(1,2,3,1/2,1/3),當(dāng)ar=1 時,額外指定1 個較大的尺度因子然后,根據(jù)下式計算特征圖中基準(zhǔn)定位框的寬度和高度為
式中:k∈[1,2,3],表示3種感受野的特征圖。
由此,特征圖中每個位置可得到6 種基準(zhǔn)定位框,其中心坐標(biāo)為該位置對應(yīng)到原圖的中心坐標(biāo)。
步驟4:預(yù)測邊界框偏移量和分類特征向量。3 種目標(biāo)檢測器分別接受3 種不同感受野的特征圖輸入,先經(jīng)過6 層卷積的跨通道特征融合和降維,再利用最后1 層卷積層預(yù)測基準(zhǔn)定位框的偏移量,并計算該定位框的分類特征向量。
步驟5:測試階段,預(yù)測的邊界框偏移量和分類特征向量分別用于計算候選邊界框以及對應(yīng)的分類概率值,再采用NMS 算法篩選出最優(yōu)的邊界框,作為最終的鋼軌傷損檢測結(jié)果。
2)目標(biāo)損失函數(shù)
為實現(xiàn)端到端的模型訓(xùn)練過程,網(wǎng)絡(luò)模型的目標(biāo)損失函數(shù)定義為
式中:Lloc為邊界框定位損失函數(shù);Lcls為邊界框分類損失函數(shù);λ為平衡系數(shù),用于調(diào)節(jié)網(wǎng)絡(luò)模型對邊界框定位精度的敏感程度。
邊界框分類屬于多類別分類問題,采用經(jīng)典的交叉熵?fù)p失函數(shù)進(jìn)行計算,其定義為
式中:N為基準(zhǔn)定位框總數(shù);xi表示第i個基準(zhǔn)定位框的分類特征向量;yi為第i個基準(zhǔn)定位框的類別標(biāo)簽;Wyi為第yi個類別的權(quán)重參數(shù)向量;Wj為第j個類別的權(quán)重參數(shù)向量;byi為第yi個類別的偏置項;bj為第j個類別的偏置項;α為正則懲罰項系數(shù)。
邊界框定位損失函數(shù)Lloc的計算方式為
其中,
式中:G為真實標(biāo)注的鋼軌傷損區(qū)域邊界框數(shù)量;δil的取值為0 或1,表示基準(zhǔn)定位框di與真實標(biāo)注框gl的IoU 值是否大于0.7;p*i為模型預(yù)測的邊界框偏移量;分別為基準(zhǔn)定位框di與真實標(biāo)注框gl的左上角x,y坐標(biāo)和寬高w,h的真實偏移量。
采用所提方法構(gòu)建2 個不同鋼軌類型的鋼軌表面?zhèn)麚p數(shù)據(jù)集,在此數(shù)據(jù)集基礎(chǔ)上,采用對比驗證的方式證明所提方法的有效性。訓(xùn)練和測試網(wǎng)絡(luò)模型的計算服務(wù)器采用2 顆Intel E5-2640v4 型CPU和1塊NVIDIA RTX 2080Ti型GPU計算卡。
1)鋼軌表面?zhèn)麚p數(shù)據(jù)集
為評估所提方法在不同類型鋼軌上的檢測性能,分別從60 kg·m-1和75 kg·m-1的軌道圖像中提取鋼軌區(qū)域圖像,并人工標(biāo)注傷損區(qū)域位置和類別,各類型鋼軌圖像數(shù)量詳細(xì)信息見表1。從表可見:采用提出的鋼軌表面?zhèn)麚p數(shù)據(jù)集構(gòu)建方法,共獲得60 kg·m-1鋼軌的樣本圖像137 185 幅,75 kg·m-1的134 835幅。
表1 鋼軌表面?zhèn)麚p檢測試驗數(shù)據(jù)詳細(xì)信息
2)鋼軌表面?zhèn)麚p檢測對比試驗
采用精確率(Precision)、召回率(Recall)和F1 分?jǐn)?shù)這3 個指標(biāo)評價鋼軌表面?zhèn)麚p檢測網(wǎng)絡(luò)的檢測性能,采用每秒檢測圖片幀數(shù)(Frames Per Second,F(xiàn)PS)評價鋼軌表面?zhèn)麚p檢測網(wǎng)絡(luò)的檢測速度。選取2 種傳統(tǒng)計算機(jī)視覺的方法和5 種基于DCNN 模型的方法進(jìn)行對比試驗。對比方法中,MSER+SVM[8]是一種有監(jiān)督學(xué)習(xí)的鋼軌表面?zhèn)麚p檢測方法,MLC+PEME[10]是一種無監(jiān)督學(xué)習(xí)的鋼軌表面?zhèn)麚p檢測方法;Faster-RCNN[11],SSD[12], YOLOv3[13], EfficientDet[17]和YOLOv5 是目前最流行的5 種基于DCNN 模型的目標(biāo)檢測方法。MSER+SVM 和MLC+PEME 方法是直接使用原始鋼軌圖像數(shù)據(jù)進(jìn)行訓(xùn)練和測試,F(xiàn)aster-RCNN,SSD,YOLOv3,EfficientDet 和YOLOv5 方法是使用構(gòu)建的鋼軌表面?zhèn)麚p數(shù)據(jù)集進(jìn)行訓(xùn)練和測試。需要注意的是,EfficientDet 和YOLOv5 方法中部分圖像增強方法僅對彩色RGB圖像有效,本文鋼軌圖像是灰度圖像,因此,模型訓(xùn)練階段未使用部分圖像增強方法。
以9∶1 的比例將樣本圖像分為訓(xùn)練集和測試集,用于訓(xùn)練網(wǎng)絡(luò)模型和測試網(wǎng)絡(luò)模型性能。訓(xùn)練階段,模型一次性輸入128 幅樣本圖像,各層網(wǎng)絡(luò)的學(xué)習(xí)率初始化為0.015,最大訓(xùn)練時期為60 輪。模型采用隨機(jī)梯度下降法進(jìn)行優(yōu)化,每學(xué)習(xí)20 輪,各層網(wǎng)絡(luò)的學(xué)習(xí)率會下降10倍,動量為0.9。計算損失值時,平衡因子設(shè)置為0.5,正則懲罰項系數(shù)設(shè)置為5×10-4。
此外,為使網(wǎng)絡(luò)模型學(xué)習(xí)更豐富的多尺度圖像特征,每訓(xùn)練10 輪,對樣本圖像的分辨率進(jìn)行重新調(diào)整。樣本圖像的分辨率選取8 的倍數(shù),取值范圍是[320,608]。
每輪訓(xùn)練開始前,從訓(xùn)練集中隨機(jī)抽取1/10的樣本圖像作為驗證集。完成所有訓(xùn)練時期后,在驗證集上取得最優(yōu)性能的網(wǎng)絡(luò)參數(shù)作為最終模型,并使用測試集進(jìn)行測試,對比試驗結(jié)果見表2,其中IoU閾值設(shè)置為0.5。
由于鋼軌表面?zhèn)麚p檢測任務(wù)涉及鐵路運輸安全,評價指標(biāo)中,召回率和F1 分?jǐn)?shù)更能評價檢測系統(tǒng)的可用性。由表2 可見:本文方法在2 種類型鋼軌的測試集上,召回率和F1 分?jǐn)?shù)兩種指標(biāo)均取得最優(yōu),充分證明了本文方法的可用性;得益于DCNN 強大的學(xué)習(xí)能力,本文方法的性能大幅超越MSER+SVM 和MLC+PEME 方法;與Faster-RCNN,SSD 和YOLOv3 方法相比,本文方法不僅在檢測性能上有一定提升,檢測速度也快于3種經(jīng)典的目標(biāo)檢測方法,能夠滿足鋼軌表面?zhèn)麚p檢測任務(wù)的需求;EfficientDet[17]和YOLOv5 均是利用多層級的圖像特征進(jìn)行目標(biāo)檢測,達(dá)到提升小目標(biāo)檢測性能的目的,在各種計算機(jī)視覺目標(biāo)檢測挑戰(zhàn)賽上取得了很好的成績,充分說明了多層級圖像特征融合對目標(biāo)檢測任務(wù)的有效性。
表2 鋼軌表面?zhèn)麚p檢測方法對比試驗結(jié)果
在鋼軌表面?zhèn)麚p檢測試驗中,本文方法的檢測性能雖優(yōu)于EfficientDet[17]和YOLOv5的簡化版方法,但檢測速度較慢;EfficientDet[17]和YOLOv5的性能版方法僅在檢測精確率上略占優(yōu)勢,但本文方法的召回率、F1 分?jǐn)?shù)和FPS 都達(dá)到了最優(yōu)。對比試驗結(jié)果說明,本文方法更適用于執(zhí)行鋼軌表面?zhèn)麚p檢測任務(wù)。
基于特征融合的思路,提出了一種基于多層級特征融合的深度網(wǎng)絡(luò)模型用于檢測鋼軌表面?zhèn)麚p。首先,積累有限的鋼軌圖像構(gòu)建大規(guī)模鋼軌表面?zhèn)麚p數(shù)據(jù)集,解決了鋼軌傷損檢測網(wǎng)絡(luò)訓(xùn)練樣本數(shù)量不足的問題;然后,提出一種基于多層級特征融合的鋼軌表面?zhèn)麚p檢測網(wǎng)絡(luò),融合多個層級不同感受野的圖像特征進(jìn)行目標(biāo)檢測,不僅能夠提升檢測結(jié)果的準(zhǔn)確性,還可以降低對小面積傷損區(qū)域的漏檢率。與現(xiàn)有方法進(jìn)行對比試驗,結(jié)果表明,該方法在2種數(shù)據(jù)集上均取得最優(yōu)的檢測性能。
本文方法能夠提升鋼軌表面?zhèn)麚p檢測的精度,實現(xiàn)了端到端的鋼軌表面?zhèn)麚p檢測,解決了現(xiàn)有技術(shù)存在的問題,也為其他同類型檢測任務(wù)提供可借鑒的技術(shù)方案思路。
未來,將在實際檢測任務(wù)中繼續(xù)收集和標(biāo)注不同工況下的鋼軌表面?zhèn)麚p圖像,如道岔區(qū)段或雨雪天氣等,以構(gòu)建更具挑戰(zhàn)性的鋼軌表面?zhèn)麚p數(shù)據(jù)集,使檢測算法能夠適應(yīng)各種工況。此外,還將研究利用三維結(jié)構(gòu)光成像,獲取鋼軌的三維圖像,并與二維圖像融合進(jìn)行檢測,以進(jìn)一步提升鋼軌表面?zhèn)麚p檢測的正確性。