張旭 黃定江
摘要:隨著信息技術在工業(yè)制造領域的深入應用,工業(yè)制造大數據研究正成為實現智能制造、幫助政府指導制造企業(yè)轉型升級的重要參考依據.在傳統(tǒng)的鋼鐵、鋁材等金屬制造行業(yè),更是存在生產方式粗放、生產工藝簡單等問題.因此,迫切需要利用人工智能等新一代信息技術來改善生產流程,提高生產效率.在使用鋁材時,必須檢查鋁材表面.現有的鋁材表面缺陷檢測受限于傳統(tǒng)人工肉眼檢查,十分費力,或基于傳統(tǒng)的機器視覺算法,識別率不高,通常不能及時準確地判斷出表面瑕疵.為解決這些問題,利用深度學習來進行鋁材表面缺陷檢測:首先運用兩大目標檢測算法Faster R-CNN(Region-CNN(Convolutional Neural Networks))和YOLOv3對制作的鋁材缺陷數據集進行檢測;然后基于YOLOv3算法進行改進,提升鋁材表面很小缺陷的檢測效果.在廣東工業(yè)智造大數據創(chuàng)新大賽提供的“鋁型材瑕疵識別”數據集上進行了實驗驗證,實驗結果顯示,改進算法的平均精度均值(mean Average Precision.mAP)比YOLOv3算法高3.4%,比Faster R-CNN算法高1.8%。
關鍵詞:鋁材缺陷;檢測;機器視覺;深度學習
中圖分類號:TP391
文獻標志碼:A
文章編號:1000-5641(2020)06-0105-10
0引言
工業(yè)制造大數據是政府治理大數據最重要的類型之一,對其進行研究將為制造業(yè)企業(yè)向智能制造轉型升級,并為地方政府在產業(yè)、人才引進和招商引資等方面提供重要決策參考.比如在傳統(tǒng)的鋼鐵、鋁材等金屬制造行業(yè),存在生產方式粗放、生產工藝簡單等問題,因此迫切需要通過利用人工智能等新一代信息技術改善生產流程、提高生產效率.在鋁型材的實際生產過程中,由于各方面因素的影響,鋁型材表面會產生裂紋、擦花、起皮、起坑、劃傷、雜色、臟點等瑕疵,這些瑕疵會嚴重影響鋁型材的質量.為保證產品質量,對鋁材表面進行機器自動化的缺陷檢測變得十分重要.事實上,早在20世紀70年代,日本的新日鐵、千葉、歌山等企業(yè)已在冷軋鍍層板和電工鋼板生產線上采用了“激光掃描表面缺陷檢測系統(tǒng)”;20世紀80年代中期,德國尤格爾(Ungerer)公司開發(fā)出冷軋帶鋼表面缺陷自動識別系統(tǒng)“Fire”,它可以在線自動識別冷軋帶鋼表面缺陷.進入20世紀90年代以來,表面自動檢測技術從早期的逐點激光掃描發(fā)展到逐行掃描的線陣CCD(Charge Coupled Device)技術,如德國的NANO Systems測量技術有限公司開發(fā)的NANO系統(tǒng)采用的是線陣CCD攝像頭,該系統(tǒng)可以在帶寬為1200mm、軋制速度為90m/min的情況下,檢測最小尺寸為0.5mm的帶鋼表面缺陷;20世紀90年代初,華中理工大學羅志勇等采用激光掃描方法測量冷軋鋼板寬度和檢測孔洞缺陷,并開發(fā)了相應的信號處理電路,此后又開展了線陣CCD和面陣CCD檢測技術的研究工作.
目前國際上常用的缺陷檢測方法有:①渦流檢測的方法;②紅外檢測的方法;③漏磁檢測的方法;④機器視覺檢測的方法.前3種方法由于其檢測原理的局限性,導致其應用不夠廣泛,對于種類繁多的缺陷,其檢測的效果無法達到令人滿意的程度;第四種基于機器視覺的檢測方法已經逐步取代前3種方法,在工業(yè)無損檢測領域得到廣泛運用,這得益于當今CCD技術、激光技術、計算機技術的快速發(fā)展.
機器視覺大多數基于普通的圖像處理技術來對缺陷進行特征提取和檢測.從不同的角度也可以對缺陷進行新的描述:①被邊緣所包圍的區(qū)域;②紋理不均勻的區(qū)域;③高低不平,有凹凸的區(qū)域.根據這幾個特點,其對應的檢測方法分別是基于邊緣的缺陷檢測方法、基于紋理的缺陷檢測方法、基于凹凸不平整特點的缺陷檢測方法.
近年來,深度學習在圖像檢測識別領域得到大量的應用,如文獻[9-10]用卷積神經網絡來進行表面缺陷檢測.目前,目標檢測任務在深度學習上有兩個主流方法:第一個主流方法分為兩步,即先得到一些錨點框,再對其進行分類和回歸,如Fast R-CNN、Faster R-CNN等;第二個主流方法只有一步,即端到端的檢測方法,如YOLO、SSD等.第一個主流方法精確度高,但是檢測速度慢;而第二個主流方法的精確度不如第一個,但是檢測速度比較快.這些目標檢測的方法都是基于深度卷積網絡.
本文主要針對目前鋁材表面缺陷檢測的實際問題,利用和擴展兩大目標檢測算法Faster R-CNN和YOLOv3來進行鋁材表面缺陷檢測,獲得了較好的結果.首先運用Faster R-CNN和YOLOv3對制作的鋁材缺陷數據集進行檢測;然后基于YOLOv3算法進行改進,提升鋁材表面很小缺陷的檢測效果.本文在廣東工業(yè)智造大數據創(chuàng)新大賽提供的“鋁型材瑕疵識別”數據集上進行了實驗驗證,實驗結果顯示,改進算法的平均精度均值比YOLOv3的mAP高3.4%,比Faster R-CNN的高1.8%.4%,比Faster R-CNN的高1.8%.
1相關工作
在過去的十幾年中,計算機視覺的目標檢測研究大致分為傳統(tǒng)的檢測算法和基于深度學習的檢測算法.在2013年之前,大部分目標檢測都是基于手工的特征選擇,HOG行人檢測和SIFT特征點檢測最為有名.但是對于提高檢測精度的方法,人們大多數都只是在一些低層次的特征上進行算法改進,所以效果不佳.然而在1994年,LeNet卷積神經網絡對手寫字符識別與分類,準確率達到了98%;盡管受限于當時的計算機發(fā)展水平,這種卷積神經網絡算法沒有引起足夠的關注,但是這一方法卻奠定了現代卷積神經網絡的基礎.LeNet的體系結構見圖1.
到了2012年,名為AlexNet的分類算法在當年的ImageNet比賽中獲得了冠軍.此后,卷積神經網絡在計算機視覺中蓬勃發(fā)展,后續(xù)也出現了幾個比較優(yōu)秀的卷積網絡,如VGG、ResNet等,這些卷積網絡為后面的基于深度學習的計算機視覺研究打下了良好的基礎.在目標檢測中,Ross Girshick等人抓住這一機會,利用卷積神經網絡對目標進行特征提取并檢測,提出了區(qū)域卷積網絡目標檢測框架(R-CNN),精度上取得了比傳統(tǒng)算法更好的結果,從這一篇文章開始,基于卷積神經網絡的目標檢測算法大量出現,并且精度越來越高.這些算法從不同的角度出發(fā),有不同的分類方法:①從步驟上來說,可分為兩步(two-stage)方法,如Fast R-CNN、Faster R-CNN等,一步(one-stage)方法,如YOLO等;②從有無錨點框上來說,可分為anchor-based方法,如Faster R-CNN和anchor-free方法、Densebox和FSAF等.這些算法有著各自的特點,既有優(yōu)點,也有缺點:two-stage方法,檢測精度比較高,但是速度相對較慢;one-stage則速度占優(yōu);anchor-based方法具有啟發(fā)式特征選擇,所以其結果可能不是最優(yōu)的,最近的anchor-free的方法則克服了這一缺點,兩者都為目標檢測精度的提升做出了很大的貢獻.本文將利用深度學習算法來對鋁材缺陷檢測進行研究.
3.3基礎網絡參數設置
實驗中本文采用VGG-16和Darknet-53作為各算法的基礎網絡.雖然VGG-16結構最早用于圖像分類,但是它在其他方面有著很大的成就,比如目標檢測、語義分割等.這個網絡模型有16層,包括13個卷積層與3個全連接層,并且有5個最大池化層.Darknet-53由一系列的1×1和3×3卷積層組成,總共有53個卷積層,但是這些卷積層中間也添加了一些與殘差網絡中shotcut類似的連接方式,使得網絡結構更強大,本文只提供了Daknet-53的卷積網絡結構,見圖10.此網絡結構比殘差網絡ResNet-101更好,速度提升了5倍.Darknet-53與ResNet-152具有相似的性能,但速度提高了2倍.
3.4實驗分析
實驗中,由于數據相對較少,為了有好的檢測效果并且盡量全方位檢測到缺陷,后面采用了數據增強的方法,對原有的數據進行旋轉,旋轉角度為90°,接著對數據加噪聲和做鏡像處理.這樣訓練數據就有10000張圖片.訓練過程中,進行了20000次迭代,隨機梯度下降法可能下降緩慢,并且可能陷入局部最小值,所以引入momentum優(yōu)化方法,并且其值設置為0.9,初始學習率設置為0.001,然后隨著迭代次數增加來動態(tài)減小學習率.
下面討論這幾個算法所用到的損失函數.因為檢測的是單瑕疵缺陷,所以分類損失函數一致采用的是二分類的交叉熵損失函數,即
3.5實驗結果
使用文章中提到的3種檢測算法對已有的數據進行實驗,且3種算法采用了2種不同的基礎網絡,得出各算法的平均精度(mAP),結果見表2.從表2可以看出Faster R-CNN比YOLOv3的mAP的確高一點,從而驗證了two-stage方法的準確率高于one-stage,改進的算法的mAP相對于前兩個是有所提升的.但是3個算法的mAP都沒有達到90%以上,對于工業(yè)生產來說,這種結果還是不能夠滿足必要的需求.
其中擦花和臟點兩種缺陷的檢測結果展示見圖11和圖12,圖中較小的臟點也被準確地檢測出來.
4總結與展望
本文主要針對目前鋁材表面缺陷檢測的實際問題,通過利用Faster R-CNN和YOLOv3以及基于YOLOv3改進的算法對基于廣東工業(yè)智造大數據創(chuàng)新大賽提供的“鋁型材瑕疵識別”數據集進行檢測實驗,實驗結果顯示,鋁材表面上很小的缺陷檢測效果得到了提升,改進算法的mAP比YOLOv3的mAP高3.4%,比Faster R-CNN高1.8%.但是由于正負樣本偏差和實驗數據集相對較小,因此實際的缺陷檢測準確率在未來還有待進一步提升.在未來的研究中,將通過采集更多的數據,或通過混合鋼材表面缺陷數據來進一步提升檢測準確率.另外,本次實驗主要是考慮了檢測目標的大小問題,而通過對數據的研究發(fā)現,鋁材表面的缺陷型狀非常不規(guī)則,普通的卷積神經網絡可能對不規(guī)則的物體檢測效果不是很好,接下來的工作是對上述算法中所用的卷積神經網絡進行改進,不必改變卷積網絡層數或者網絡結構,可以嘗試改進卷積和池化的方式.