基于加權(quán)極限學(xué)習(xí)機(jī)的貨車篷布識別技術(shù)探討

2020-11-05 16:33宋坤駿張萼輝中國鐵路上海局集團(tuán)有限公司科研所

上海鐵道增刊 2020年2期

宋坤駿張萼輝中國鐵路上海局集團(tuán)有限公司科研所

1 引言

為有效防止貨車篷布破損使貨物受潮或篷布繩網(wǎng)斷裂導(dǎo)致篷布脫落，目前上海局大型貨站每日需要人工檢查的高清篷布照片數(shù)在3萬張左右，工人長時間看圖容易導(dǎo)致視覺疲勞，不僅檢查效率低下還使得誤檢和漏檢層出不窮，存在安全事故隱患[1]。由此可見，研發(fā)一套機(jī)器視覺車頂照片自動判別系統(tǒng)可以有效降低人工支出，提升看圖效率和準(zhǔn)確度，為上海鐵路局貨運(yùn)建設(shè)提質(zhì)增效提供基礎(chǔ)技術(shù)支撐。工人需要查看的貨車車頂樣例圖片如圖1和圖2所示，圖1和圖2分別是沒有篷布的貨車車頂原始照片和有篷布的敞車車頂?shù)脑颊掌?/p>

圖1 一張沒有篷布的貨車車頂樣例圖片

圖2 一張有篷布的敞車車頂樣例圖片

由樣例圖片可見，單憑人工過濾幾萬張圖片不僅成本高企，效率低下，不利于工人身心健康和工作積極性，也無法保證準(zhǔn)確率。

2 算法描述

完整的篷布故障識別問題實際上是一個多分類問題，包括無篷布，正常篷布，問題篷布等類別，其中問題篷布又可以細(xì)分為篷布破洞，繩網(wǎng)斷線，篷布積水等類別。為了提升準(zhǔn)確率起見，將此多分類問題轉(zhuǎn)化為多個二分類問題，即首先分辨是否有篷布，然后判斷篷布是否有故障。針對判斷篷布有無的問題，筆者曾嘗試過基于深度學(xué)習(xí)的圖像分類算法，然而深度學(xué)習(xí)準(zhǔn)確率并不能達(dá)到較高水平如95%以上，并且對于硬件要求較高，訓(xùn)練耗時長于本文提出的算法。因而，筆者抓住篷布獨(dú)有的交叉斜向網(wǎng)格繩網(wǎng)特點，建立了灰度圖的方向梯度直方圖(Histogram of Oriented Gradient,HOG)特征[2]。該特征的建立步驟如下：將圖像灰度化并Gamma校正后劃分為多個cells（例如16*16像素/cell），統(tǒng)計每個cell中像素點的梯度方向的直方圖，形成各個cell的HOG特征描述子，然后將各個cell組織成block(例如2*2個cell/block)，block中所有cell的特征描述子串聯(lián)起來得到該block的HOG特征描述子。再把圖中所有block的特征描述子串聯(lián)起來就可以得到該圖的HOG特征向量了。由于HOG是在圖像的局部方格單元上操作，所以它對圖像幾何的和光學(xué)的形變都能保持很好的不變性，這兩種形變只會出現(xiàn)在更大的空間鄰域上。

完整的檢測篷布有無的算法步驟如下：

（1）將圖像灰度化以后用雙三次插值法統(tǒng)一縮放到高128,寬320的尺寸。

（2）以16×16像素的cell大小，2×2cells的block大小提取block無交疊的HOG特征，梯度方向統(tǒng)計范圍為-180度到180度之間均勻分布的9個區(qū)間。

（3）將各幅圖像的HOG特征向量排列成特征矩陣作為加權(quán)極限學(xué)習(xí)機(jī)的輸入進(jìn)行訓(xùn)練，其中權(quán)重為訓(xùn)練集中每類樣本數(shù)的倒數(shù)。

（4）使用訓(xùn)練好的加權(quán)極限學(xué)習(xí)機(jī)模型對測試樣本進(jìn)行預(yù)測判斷篷布有無。

為了判斷篷布是否存在破洞，繩網(wǎng)斷線，積水等情況，HOG這種刻畫物體形狀的特征不適合描述。以樣本數(shù)最多的篷布積水情況為例，肉眼識別時主要依賴存在的反光現(xiàn)象，因此引入另一個描述灰度變化的紋理特征描述子LBP(Local Binary Pattern)來輔助篷布故障情況的判斷。某像素點LBP特征的計算原理是考慮一定采樣半徑的圓形鄰域內(nèi)的鄰近像素點，假設(shè)采集P個采樣點，將這P個采樣點的灰度值同該中心點灰度值比較，若采樣點灰度值大于中心點灰度值，則該采樣點位置標(biāo)記為1，否則為0，這樣P個采樣點可以形成P位二進(jìn)制數(shù)，即為中心點的LBP值，可以反映該鄰域的紋理信息。該定義僅僅滿足灰度不變性，為了得到旋轉(zhuǎn)不變的特征，研究人員提出如下改進(jìn)：不斷旋轉(zhuǎn)圓形鄰域得到一系列LBP值，取最小值作為鄰域的旋轉(zhuǎn)不變LBP特征。

除了HOG和LBP這些經(jīng)典的特征，作者還提出了一種手工構(gòu)造的特征，能夠較好的反映積水圖片的反光特點。該特征的構(gòu)造方法為：首先將圖像的四周各裁去50像素以去除不含篷布網(wǎng)繩的無關(guān)部分。裁剪后的圖像轉(zhuǎn)為灰度圖，并用雙三次插值法縮放到高514，寬2400的尺寸。隨后將該灰度圖等分為48小塊，高度方向4等分，寬度方向12等分。對每一小塊，找出該小塊中灰度值最高的一個像素點，然后在該像素點的上下左右四個方向計算該像素點的灰度值同周圍像素點灰度值之差。其中每個方向都取同該像素點距離為10,15,20,25,30個像素的鄰近點計算灰度差值。若這些距離處的鄰近點越出邊界，則取為邊界點。

由此可以得到在蓋有篷布的貨車頂照片中識別故障篷布的完整算法如下:

（1）將圖像灰度化以后用雙三次插值法統(tǒng)一縮放到高614,寬1200的尺寸。

（2）在每一像素半徑為2像素的圓形鄰域內(nèi)采集8個采樣點計算旋轉(zhuǎn)不變的LBP特征，計算鄰近采樣點時采用線性插值。

（3）再將圖片裁剪灰度化后縮放到高514，寬2400的尺寸提取上述手工特征。

（4）將LBP特征和手工特征排列成特征矩陣，并用MINMAX方法歸一化特征矩陣的每一列。

（5）特征矩陣作為加權(quán)極限學(xué)習(xí)機(jī)的輸入進(jìn)行訓(xùn)練，其中權(quán)重為訓(xùn)練集中每類樣本數(shù)的倒數(shù)。

（6）使用訓(xùn)練好的加權(quán)極限學(xué)習(xí)機(jī)模型將有篷布圖片分為正常或故障兩類。

以上算法中涉及的極限學(xué)習(xí)機(jī)的理論在文獻(xiàn)[4]中有較為詳細(xì)的介紹?？紤]到苫蓋有篷布的敞車數(shù)量遠(yuǎn)少于沒有篷布的其他貨車數(shù)量，訓(xùn)練集樣本是不均衡的，因此采用了樣本加權(quán)的方式考慮不均衡性。所述加權(quán)正則化極限學(xué)習(xí)機(jī)的理論概要如下，設(shè)單隱層前饋神經(jīng)網(wǎng)絡(luò)的輸出層和隱層神經(jīng)元數(shù)分別為m和l，則關(guān)于輸入特征向量的第j維輸出表達(dá)式為：

圖3 極限學(xué)習(xí)機(jī)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖

加權(quán)正則化極限學(xué)習(xí)機(jī)采用的是逐樣本加權(quán)的方式，每個樣本的訓(xùn)練權(quán)重等于訓(xùn)練集中該類樣本的樣本數(shù)的倒數(shù)，可以證明這是最優(yōu)的權(quán)重。所有樣本的權(quán)重排列成一個N×N對角矩陣W。其中N是訓(xùn)練集樣本數(shù)。加權(quán)正則化極限學(xué)習(xí)機(jī)輸出層權(quán)值β的學(xué)習(xí)結(jié)果由如下公式給出：

上式中C是正則化參數(shù)，通過反復(fù)試驗，針對本問題正則化參數(shù)C取為30。W是樣本權(quán)重矩陣，H是隱層輸出矩陣，由如下公式給出：

根據(jù)以上公式得出極限學(xué)習(xí)機(jī)的算法步驟如圖4所示：

圖4 極限學(xué)習(xí)算法應(yīng)用步驟

3 算法運(yùn)行結(jié)果

以上兩個算法在數(shù)據(jù)集上的運(yùn)行結(jié)果如下：

就區(qū)分有篷布的敞車和其他無篷布貨車的算法來說，訓(xùn)練集包含2872張有篷布苫蓋車頂照片以及3088張無篷布車頂照片。測試集包含7197張有篷布苫蓋車頂照片和102099張無篷布車頂照片。所有圖片均為三通道彩色圖片。除極少數(shù)圖片外，各圖片高度統(tǒng)一為614像素，寬度大致分布在2000-3100像素間。算法在如上數(shù)據(jù)集上取得了99.98%的訓(xùn)練集準(zhǔn)確率以及96.40%的測試集準(zhǔn)確率和99.61%的測試集召回率。

在另一套數(shù)據(jù)集中，訓(xùn)練集包含3548張圖，其中有篷布苫蓋的圖有1739張。無篷布的圖有1809張。測試集包含115004張圖，其中無篷布的圖有106674張，有篷布的圖有8330張。區(qū)分篷布有無的算法取得了99.71%的測試集準(zhǔn)確率，99.13%的測試集精確度和96.90%的測試集召回率。

就區(qū)分篷布是否有故障的算法而言，共有10069張有篷布車頂照片，正常苫蓋狀態(tài)篷布為一類，問題篷布為另一類，訓(xùn)練集1739張圖片，測試集8330張圖片，訓(xùn)練集和測試集中正常圖片，積水圖片，斷線和破洞圖片張數(shù)比例大致和10069張圖的數(shù)據(jù)全集相同。在這樣的訓(xùn)練集和測試集條件下，該算法取得了99.88%的訓(xùn)練集準(zhǔn)確率以及95.94%的測試集召回率和69.94%的測試集準(zhǔn)確率。

區(qū)分篷布是否有故障的算法，如果去掉LBP特征，單用筆者構(gòu)造的手工特征可以起到提升準(zhǔn)確率的效果。單用手工特征的加權(quán)極限學(xué)習(xí)分類器在935個訓(xùn)練樣本上訓(xùn)練后能夠在9134個樣本的測試集上取得87.83%的準(zhǔn)確率。但是召回率僅有75.05%。原因在于，同上文以LBP和手工特征為特征的分類器相比，誤分類的負(fù)樣本數(shù)FN增加，而誤分類的正樣本數(shù)FP減少了。

本文介紹的算法訓(xùn)練時對于硬件要求低，不需要GPU，速度能夠滿足實際工程要求。其次由于本算法準(zhǔn)確率較高，因而其人工標(biāo)定成本也較低。標(biāo)定時可以先手工標(biāo)定小量幾百張訓(xùn)練圖片用算法預(yù)運(yùn)行一趟得到全部圖片粗估分類值，然后再予以人工修正即可，大大減輕了手工標(biāo)定數(shù)萬張圖的工作量。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

基于加權(quán)極限學(xué)習(xí)機(jī)的貨車篷布識別技術(shù)探討

1 引言

2 算法描述

3 算法運(yùn)行結(jié)果