季忠源 李丹美
摘?要:為了解決工廠實際中遇到的鋁材表面缺陷問題,本文介紹了基于RCNN上發(fā)展的Faster?RCNN與Cascade?RCNN算法,并且簡要概述了利用特征金字塔網(wǎng)絡(luò)來解決Faster?RCNN在處理多尺度檢測問題上的不足,還提出了通過改進RPN來加強Faster?RCNN的檢測準(zhǔn)確率,利用殘差網(wǎng)絡(luò)ResNet50替換了原始網(wǎng)絡(luò),增強其檢測效果。
關(guān)鍵詞:深度學(xué)習(xí);Faster?RCNN;Cascade?RCNN;瑕疵檢測;殘差網(wǎng)絡(luò)
,因為多方因素的干擾,鋁材表面會出現(xiàn)多種缺陷,例如臟點、起坑、噴流等各種表面瑕疵[1],這些表面存在的缺陷會使得鋁材在實際的使用過程中受到不同程度的影響。為了鋁材在工業(yè)實際應(yīng)用中不會出現(xiàn)問題,造成各種事故或者導(dǎo)致各種工程存在缺憾,檢測鋁材表面是否存在明顯瑕疵的需求日益壯大。但是傳統(tǒng)地利用工人肉眼檢查十分費時費力,并且還可能出現(xiàn)錯漏,效率低下的同時還要付出極大的人工成本。所以,各大工廠將目光投向了近幾年技術(shù)發(fā)展異常迅猛的深度學(xué)習(xí)領(lǐng)域[2],開展了為數(shù)不少的圖像識別競賽,想要將圖像識別項目落實于工廠實際,為工業(yè)領(lǐng)域做出貢獻。人工智能領(lǐng)域技術(shù)的革新讓不少鋁材商人看到了機會,本文將探討現(xiàn)有的深度學(xué)習(xí)算法檢測鋁材表面瑕疵的實際過程,并且對現(xiàn)有算法進行一定改進,使得其更貼合于工業(yè)實際應(yīng)用。
1?基于RCNN的目標(biāo)檢測算法
1.1?Faster?RCNN
Faster?RCNN[3]是目前在目標(biāo)檢測領(lǐng)域應(yīng)用十分廣泛并且地位相當(dāng)高的一種Twostage的目標(biāo)檢測算法。Faster?RCNN可大致概括為兩個步驟,第一步通過RPN來獲得輸入圖像的感興趣的區(qū)域ROI,接著Fast?RCNN網(wǎng)絡(luò)會檢測和分類之前初步得到的ROI。相比起一些Onestage的算法,faster?RCNN的檢測效果要更加地精確,但是在檢測速度上可能會落后于一些Onestage的算法。
上圖1為Faster?RCNN的網(wǎng)絡(luò)結(jié)構(gòu),主要由以下四部分組成:(1)對輸入圖片進行特征提取,并且輸出其特征的卷積層。(2)初步劃分設(shè)定的感興趣區(qū)域,代替了Fast?RCNN中的Selective?Search用于產(chǎn)生建議窗口的RPN網(wǎng)絡(luò)。(3)對不同的輸入的圖片進行轉(zhuǎn)換并且輸出固定大小的ROI?Pooling層。(4)精確定位每個圖像中的候選的特征,輸出特征的類別并且加以定位的分類和回歸層。
1.2?Cascade?RCNN
Cascade?RCNN[4]是近兩年來在RCNN算法的基礎(chǔ)上,加以拓展的用于目標(biāo)檢測的新算法。其算法的主要思想是利用不斷提高的IoU(intersection?over?union)閾值,在樣本數(shù)保持不變的情況下不斷訓(xùn)練,來得到高精度的檢測器,級聯(lián)多個RCNN檢測網(wǎng)絡(luò)來達(dá)成檢測的目標(biāo)。這個目標(biāo)檢測算法還是通過分類與定位兩個步驟來實現(xiàn)檢測。
Cascade?RCNN的網(wǎng)絡(luò)結(jié)構(gòu)在Faster?RCNN的網(wǎng)絡(luò)結(jié)構(gòu)上進行了延伸,首先是將用于提取候選區(qū)域的子網(wǎng)絡(luò)H0用于一整張輸入的圖片,然后是用于ROI檢測的網(wǎng)絡(luò)H1會得到分類分?jǐn)?shù)和邊界框。Cascade?RCNN中的模型是將前一個步驟中的輸出用來訓(xùn)練,而不是與之前的Faster?RCNN網(wǎng)絡(luò)一樣對最早輸入的圖片數(shù)據(jù)進行訓(xùn)練。利用調(diào)控不同的IOU閾值來得到想要得到的數(shù)據(jù),這是Cascade?RCNN的一大優(yōu)點。
總的來說,Cascade?RCNN由四個階段組成,分別是一個RPN與三個檢測IOU閾值為0.5、0.6、0.7的網(wǎng)絡(luò)。
該網(wǎng)絡(luò)的特性可以概括為以下三點:(1)調(diào)高IOU閾值的同時,網(wǎng)絡(luò)的檢測能力會降低,這是因為提供的訓(xùn)練樣本數(shù)量呈指數(shù)減少,導(dǎo)致了過擬合。(2)這是一個極具創(chuàng)新性的級聯(lián)RCNN,由一系列的檢測器組成,這些檢測器會隨著IOU閾值的提高而訓(xùn)練。(3)每一個級聯(lián)的RCNN網(wǎng)絡(luò)都設(shè)有不一樣的IOU閾值,這使得結(jié)果精確度得到了提高,并且作為下一級網(wǎng)絡(luò)的輸入,來不斷地提升網(wǎng)絡(luò)的精確性。
2?改進Faster?RCNN
2.1?重新定義anchor框尺寸
工業(yè)中使用的鋁材在多方因素干擾下,會生成較多種類的瑕疵,較容易分辨的分為不導(dǎo)電、擦花、漏底、臟點、起坑、噴流、桔皮、角位漏底、漆泡、雜色共十類瑕疵。每種瑕疵對應(yīng)的部位、分布面積均有細(xì)微差異,而且多種瑕疵密集分布時可能使得檢測框出現(xiàn)重疊情況,導(dǎo)致檢測結(jié)果不理想。所以為了能夠適應(yīng)不同種類瑕疵的檢測情況,我們需要重新設(shè)計anchor框的長寬比以及尺寸來產(chǎn)生較為合適的建議區(qū)域。
模型中原有的anchor框長寬比固定在2∶1、1∶2、1∶1的比例,但是鋁材中存在桔皮、擦花等大面積不規(guī)則瑕疵,例如桔皮瑕疵如果在檢測過程中將anchor框比例設(shè)置在5∶1會得到更好的檢測準(zhǔn)確度結(jié)果。
2.2?使用特征金字塔網(wǎng)絡(luò)
在原始的Faster?RCNN網(wǎng)絡(luò)中僅僅利用了單個高層特征,即RPN只選擇特征提取網(wǎng)絡(luò)中最后一層的特征,這種方式在大目標(biāo)檢測時有很好地發(fā)揮,但是對于像素信息十分少的小型目標(biāo)來說,其信息在采樣的過程中十分容易丟失,導(dǎo)致檢測精度的減小并且會出現(xiàn)不少檢測錯誤。為了解決檢測小目標(biāo)困難的問題,常用的辦法是使用圖像金字塔來對多尺度變換進行增強,但是圖像金字塔會使計算量急劇增加,所以文中選擇了特征金字塔網(wǎng)絡(luò)結(jié)構(gòu)來改進Faster?RCNN在多尺度變化檢測上的不足。
常見的圖像金字塔結(jié)構(gòu)能夠?qū)斎氲拿恳怀叨鹊膱D像進行特征提取,能夠解決大多數(shù)的多尺度變化問題,但是其運行時間過長,而且運行期間會占用大量內(nèi)存使得它在實際應(yīng)用中不可行。而SSD中也存在一定的問題,例如網(wǎng)絡(luò)中的低層會存在特征圖信息不足,分辨率不高等缺陷。
為了解決這些常見的問題,我們所使用的特征金字塔(FPN)網(wǎng)絡(luò)結(jié)構(gòu)中每一層不同尺度的特征圖像都具備足夠的信息。FPN能夠在僅增加較少計算量的同時解決多尺度變化問題。
2.3?利用resnet50替代原始網(wǎng)絡(luò)
原始Faster?RCNN采取VGG16網(wǎng)絡(luò)為特征提取網(wǎng)絡(luò),在模型訓(xùn)練期間將網(wǎng)絡(luò)中提取到的誤差進行反向傳播從而使權(quán)重得到更新,但是這樣的過程在小目標(biāo)檢測時會產(chǎn)生兩個嚴(yán)重的問題:(1)瑕疵檢測中目標(biāo)瑕疵過小,所攜帶信息容易在特征提取的過程中丟失,導(dǎo)致檢測結(jié)果不理想。(2)不斷加深的網(wǎng)絡(luò)深度中,會導(dǎo)致反向傳播過程中的梯度發(fā)生彌散甚至?xí)沟锰荻认А?/p>
為了防止上述的問題出現(xiàn),本文提出更換特征提取網(wǎng)絡(luò),選擇了另一種resnet50殘差網(wǎng)絡(luò)。ResNet利用捷徑連接將輸入與輸出進行跳層連接,將單元的輸入輸出加在一起進行激活,通過這種操作模型會學(xué)習(xí)到映射后相對于原來的偏差,這種結(jié)構(gòu)可以使小目標(biāo)缺陷在深度網(wǎng)絡(luò)中存活更長時間。
上述為resnet50的網(wǎng)絡(luò)結(jié)構(gòu),由于加入了大量跳層連接,訓(xùn)練過程中會保留更多的小目標(biāo)瑕疵信息,在檢測效果上會得到優(yōu)化。
3?結(jié)論
為了加大深度學(xué)習(xí)算法在檢測鋁材瑕疵的工業(yè)實際上得到靈活運用,本文介紹了Faster?RCNN與Cascade?RCNN的基本原理,并且分析了其優(yōu)劣與網(wǎng)絡(luò)結(jié)構(gòu)區(qū)別。還在Faster?RCNN的基礎(chǔ)上提出了算法改進,使其能夠更加充分靈活地應(yīng)用于鋁材這類小目標(biāo)瑕疵的檢測。
參考文獻:
[1]張旭.基于深度卷積神經(jīng)網(wǎng)絡(luò)的鋁材表面缺陷檢測[D].華東理工大學(xué),2020.
[2]魏若峰.基于深度學(xué)習(xí)的鋁型材表面瑕疵識別技術(shù)研究[D].浙江大學(xué),2019.
[3]Ren?S,He?K,Girshick?R,et?al.Faster?RCNN:Towards?RealTime?Object?Detection?with?Region?Proposal?Networks[J].IEEE?Transactions?on?Pattern?Analysis?&?Machine?Intelligence,2017,39(6):11371149.
[4]Zhao?W,Huang?H,Li?D,et?al.Pointer?Defect?Detection?Based?on?Transfer?Learning?and?Improved?CascadeRCNN[J].Sensors,2020,20(17):4939.
作者簡介:季忠源(1996—?),男,漢族,浙江溫州人,碩士,研究方向:圖像識別。