吳祿慎,萬 超,張 叢
隨著鐵路交通運(yùn)輸?shù)牟粩喟l(fā)展,其本身的安全性越來越受到重視,在當(dāng)前國內(nèi)外對軌道安全的檢測手段主要是通過計(jì)算機(jī)視覺、圖像處理的方法來完成??奂糠质擒壍赖闹匾M成部分之一,是將鐵軌與軌枕連接的關(guān)鍵連接件,由于其形狀的特殊性,所以在圖像處理檢測時(shí)一般通過特征提取的方式來實(shí)現(xiàn)對它的識別檢測。在圖像的特征中主要是指可以通過測量或處理能夠抽取的數(shù)據(jù),而這些數(shù)據(jù)相對于其他的圖像部分來說是不一樣的,或是有較為明顯的規(guī)律的,能夠從圖像中很好的識別出來。這其中特征可以根據(jù)其自身特點(diǎn)分為統(tǒng)計(jì)特征和結(jié)構(gòu)特征。主要采用的方法就是統(tǒng)計(jì)特征。常用的統(tǒng)計(jì)特征方法有:區(qū)域描繪子,直方圖特征,灰度共生矩陣,SIFT特征,HOG特征等,每一種描繪子都有其自身特點(diǎn),有適用的檢測目標(biāo)類型,針對不同類型使用不同描繪子,從而達(dá)到最好的特征提取效果。
近年來隨著機(jī)器視覺檢測技術(shù)的不斷發(fā)展,國內(nèi)外對此研究也較為深入,也探索出了一些特征提取的算法。文獻(xiàn)[1]首先將小波變換應(yīng)用于定位扣件,再通過閾值分割和形態(tài)學(xué)算法得到二值圖,后通過提取其結(jié)構(gòu)特征進(jìn)行扣件識別,但這種方法對環(huán)境要求較高,而扣件周圍有較多灰度級相同的石塊,在很多情況下無法識別。文獻(xiàn)[2]提出對圖像中所有的像素進(jìn)行空間位置關(guān)系進(jìn)行統(tǒng)計(jì)的灰度共生矩陣紋理描述法,但由于其需對每個(gè)像素點(diǎn)進(jìn)行數(shù)據(jù)分析,計(jì)算量過大,時(shí)間成本相對較高,且對硬件設(shè)備有一定要求。文獻(xiàn)[3]提出了基于局部自適應(yīng)Niblack算法的LBP紋理分析(N-LBP),該方法主要是加入了一個(gè)光照的因子來減少光對圖像閾值的選取,達(dá)到提高LBP算子對光照的自適應(yīng)能力。文獻(xiàn)[4]等提出一種基于LBP金字塔特征的識別算法,該方法通過對圖像的多尺度分塊,然后分別對其中的塊進(jìn)行LBP算法求特征向量,根據(jù)塊的大小組成金字塔型,然后將金字塔分成多個(gè)特征區(qū)域,最后用直方圖來統(tǒng)計(jì);最后合并各直方圖特征作為特征用于分類識別,但該算法的應(yīng)用在于對人臉的面部特征識別,暫不適合用于軌道扣件的特征提取。一般好的特征應(yīng)該具有以下特點(diǎn):(1)便于提取,在特征的獲得上的工作量不應(yīng)過大;(2)對噪聲和不相干轉(zhuǎn)化不敏感,比如幾何圖形變換、圖像旋轉(zhuǎn)等;(3)能夠具有很好的區(qū)分功能。
主要檢測對象是軌道扣件,圖像來源是通過CCD線陣相機(jī)所拍攝的灰度圖像。根據(jù)灰度圖中每個(gè)像素的灰度值變化特性,可選用局部二進(jìn)制對其進(jìn)行特征提取,其具有很強(qiáng)的分類能力,計(jì)算速度相對較快,對灰度變化具有不變性,但原始的局部二進(jìn)制是與領(lǐng)域范圍內(nèi)的像素有關(guān),因此對噪聲比較敏感;其提取過程中窗口大小是不變的,無法適應(yīng)不同大小的特征,易出現(xiàn)提取誤差;隨著圖像維度的增加,計(jì)算數(shù)據(jù)不斷加大。提出一種將小波變換與局部二進(jìn)制相結(jié)合的軌道扣件特征提取算法,首先利用小波變換對圖像進(jìn)行預(yù)處理,減少圖像中噪聲的干擾,降低圖像維度,減少圖像數(shù)據(jù)量,由于扣件的特征主要是其輪廓特征,而小波變換對輪廓部分影響相對較小,不會(huì)對后續(xù)的特征提取有較大影響;然后采用逐點(diǎn)掃描的方法,得到各個(gè)部分的LBP直方圖,最后將所有的直方圖進(jìn)行連接融合,生成能夠代表扣件特征的特征圖。
小波變換是在頻率域中運(yùn)用廣泛的方法,它能夠表現(xiàn)出很好的局部化特征,而且能夠提供所需的信號所有子段的頻率信息,這也是分類信號的重要信息。如果直接采用空間域的圖像增強(qiáng)則會(huì)對原有圖像信息有一定的破壞,不利于后面的特征提取。小波變換主要分為兩種:連續(xù)小波變換和離散小波變換[5]。采用的是單層二維離散小波,小波變換就是通過一個(gè)尺度函數(shù)Φ(x)和小波函數(shù)Ψ(x)的結(jié)合生成的基礎(chǔ)函數(shù):
所對應(yīng)的原始圖像其實(shí)就是一個(gè)二維矩陣,其分辨率為1024×2048,將圖像經(jīng)過上述小波變換后,圖像會(huì)平均分成256×512大小的四個(gè)子區(qū)塊。如下圖所示,四個(gè)區(qū)塊分別代表著不同頻率區(qū)域的小波系數(shù),首先對圖像的水平和豎直方向上進(jìn)行隔點(diǎn)采樣,得到第一輪的小波變換結(jié)果,如圖1所示。等到進(jìn)行第二輪小波變換時(shí),只對第一輪處理后的低頻部分進(jìn)行,也就是下圖中所顯示的LL頻率帶區(qū)域。
圖1 小波變換Fig.1 The Wavelet Transform
LL頻帶保持了原始圖像的內(nèi)容信息,圖像的能量集中于此頻帶。
HL頻帶表示圖像水平方向上的高頻邊緣信息。
LH頻帶表示圖像豎直方向上的高頻邊緣信息。
HH頻帶表示圖像對角線方向上的高頻邊緣信息。
上面四個(gè)等式就代表了圖像小波變換的基本處理信息,其中<·>表示內(nèi)積運(yùn)算。整體來說,二維小波變換處理圖像所取得的細(xì)節(jié)圖像的過程是:水平方向是原圖像經(jīng)過水平方向上的低通濾波隔點(diǎn)采樣后,再通過豎直方向上的高通濾波隔點(diǎn)采樣獲得;豎直方向則是先經(jīng)過水平方向的高通濾波隔點(diǎn)采樣,然后再通過豎直方向的低通濾波隔點(diǎn)采樣獲得;對角線方向則是通過水平和豎直兩個(gè)方向的高通濾波隔點(diǎn)采樣獲得的。由于小波變換后的圖像數(shù)據(jù)類型會(huì)轉(zhuǎn)變?yōu)閐ouble型,所以進(jìn)行正則化處理,使其重新轉(zhuǎn)化為可正常顯示的uint8型,以便后續(xù)處理。經(jīng)過小波變換后的圖像去除了不少噪聲,目標(biāo)輪廓相對清晰,圖片細(xì)節(jié)部分會(huì)有較為明顯的增強(qiáng),有利于進(jìn)行下一步的特征提取。
局部二進(jìn)制[6](local binary patterns,LBP)算法的基本原理有點(diǎn)像空間濾波中的模板操作,取一個(gè)(3×3)的區(qū)域,如圖2所示。一共分為了9個(gè)區(qū)域,其中有中心區(qū)域,及其8個(gè)鄰域,其中顯示的數(shù)字分別是各個(gè)區(qū)域像素所對應(yīng)的灰度值,將其中心的灰度值分別與領(lǐng)域的灰度值大小進(jìn)行比較,以某一特定的順序進(jìn)行,將中心點(diǎn)的灰度值作為閾值,對周圍領(lǐng)域的像素進(jìn)行二值化,將二值化后的結(jié)果組成一個(gè)二進(jìn)制數(shù)字,最后將這個(gè)二進(jìn)制數(shù)字轉(zhuǎn)化為十進(jìn)制,得出的數(shù)字就作為中心點(diǎn)的響應(yīng)。在整個(gè)處理的過程中,可以得到一個(gè)LBP的響應(yīng)圖像,而這個(gè)圖像就是原始圖像所對應(yīng)的LBP統(tǒng)計(jì)直方圖,這就是最后得到的特征。
圖2 基本局部二進(jìn)制算法Fig.2 The Basic LBP
其中(xC,yC)是中心像素,ic代表中心像素的灰度值,ip代表相鄰像素的灰度值,s是符號函數(shù)。由于基本LBP算子因?yàn)榻Y(jié)構(gòu)被限定,無法進(jìn)行任意尺度運(yùn)算,所以后續(xù)LBP算子被改進(jìn)為使用不同大小和形狀的模板區(qū)塊。其中有采用圓形區(qū)域與雙線性插值運(yùn)算相結(jié)合的圓形領(lǐng)域模塊,雙線性插值的有點(diǎn)就在于可以獲得任意半徑和任意數(shù)目的領(lǐng)域像素點(diǎn),基本原理就是一個(gè)半徑為2的8領(lǐng)域像素的圓形領(lǐng)域,其中每一個(gè)方格代表像素點(diǎn),當(dāng)所定的位置正好處于方格中心的領(lǐng)域點(diǎn)的位置時(shí),直接取該領(lǐng)域點(diǎn)的灰度值作為該點(diǎn)的值,當(dāng)其不處于方格中心時(shí),就需要通過雙線性插值來確定值[7]。所采用的是局部二進(jìn)制就是這種圓形的局部二進(jìn)制算子,記做LBPRP,其下標(biāo)的P代表領(lǐng)域數(shù)量,R代表圓形區(qū)域的半徑[8],如圖3所示。根據(jù)不同尺度對圖像進(jìn)行分區(qū)處理,得到多尺度下的LBP特征向量,然后將不同尺度下的特征進(jìn)行融合,這樣在突出扣件的局部特征的同時(shí)又能夠保存下其全局的特征[9]。
圖3 圓形領(lǐng)域局部二進(jìn)制Fig.3 The Circular Field LBP
選用最小距離分類器[10]對上述特征進(jìn)行分類,其是基于匹配的分類技術(shù)通過以一種原型模式向量代表每一個(gè)類別,識別時(shí)會(huì)按照預(yù)先設(shè)定的相似性度量與其距離最近類別進(jìn)行分類。
首先將圖片進(jìn)行小波變換處理,選取db1的小波基,小波變換過程,如圖4所示。
圖4 小波變換過程圖Fig.4 Wavelet Transform Process Diagram
通過小波變換的圖像在邊緣細(xì)節(jié)部分有明顯的增強(qiáng),而且扣件區(qū)域與周圍的石塊的整體灰度出現(xiàn)了一定程度的差值,非常有利于后續(xù)的特征提取。將上述通過小波變換的圖像進(jìn)行局部二進(jìn)制處理得到的分區(qū)塊特征向量直方圖以及合并直方圖,如圖5所示。使用最近鄰分類器對采用不同分塊數(shù)的LBP圖像進(jìn)行識別判斷,如表1所示。對不同小波基的選取,如表2所示。
圖5 分區(qū)塊特征圖Fig.5 Partition Block Diagram
表1 效果對比Tab.1 Effect Comparison
表2 識別率Tab.2 Recognition Rate
通過實(shí)驗(yàn)結(jié)果可以看出在子塊部分較大時(shí),識別率較低,因?yàn)檎w特征量較少,不利于識別,當(dāng)子塊數(shù)量增多,塊體大小減小后,識別率開始逐漸變高,且在一定范圍內(nèi),保持在一個(gè)較高的識別效果,但當(dāng)子塊數(shù)量超過36塊,也就是(6×6)時(shí),其識別率開始下降,這是因?yàn)樽訅K數(shù)量過多,其所含有的局部特征數(shù)量減少,導(dǎo)致其識別率的下降,而經(jīng)過算法處理后的直方圖特征向量在識別時(shí)相比于其他分塊識別效率高,具有較好的識別能力。可以看出在加入了小波變換后識別率較單獨(dú)使用LBP算法提高了不少,主要是因?yàn)槭褂昧诵〔ㄗ儞Q后的圖像局部細(xì)節(jié)部分更加突出,使得后續(xù)的特征提取更加的容易,且特征向量也更能被識別。
針對軌道扣件區(qū)域特征提取,首先采用的小波變換能夠很好的突出圖像的細(xì)節(jié)部分,過濾掉圖像中的大部分噪聲,后續(xù)的LBP算子通過多尺度的分塊能夠充分發(fā)揮其單調(diào)灰度變換不變性,對圖像紋理特征的提取具有很好的效果,在保持整體特點(diǎn)的同時(shí)又保留下來了局部的特征,最后使用最小距離分類對其進(jìn)行識別,能具有較高的識別率。主要針對的是軌道扣件的特征提取,可選用harr小波基,若用于其他圖像的特征可選用不同小波基進(jìn)行處理。結(jié)果表明采用算法所提取出的軌道扣件特征便于后期分類、識別,可以有效的提高識別率。