朱詠梅,李玉玲,奚崢皓,盛鴻宇
1. 上海電子信息職業(yè)技術(shù)學(xué)院 繼續(xù)教育學(xué)院,上海 201411;2. 北京科技大學(xué) 自動化學(xué)院,北京 100083; 3. 上海工程技術(shù)大學(xué) 電子電氣工程學(xué)院,上海 201620;4. 北京聯(lián)合大學(xué) 機器人學(xué)院,北京 100101
瑕疵/缺陷檢測是制造業(yè)的一項重要任務(wù),有助于確保產(chǎn)品的質(zhì)量和防止?jié)撛诘陌踩kU.木質(zhì)板材是林業(yè)產(chǎn)業(yè)經(jīng)濟中最重要的資源型原材料之一,在國民經(jīng)濟體系中發(fā)揮著不可或缺的作用[1].在瑞典、芬蘭等森林資源充裕的發(fā)達(dá)國家,木材綜合利用率高達(dá)90%.與之形成鮮明對比的是,我國木材綜合利用率不足60%,造成了嚴(yán)重的資源浪費[2].隨著中國經(jīng)濟的快速發(fā)展,人們越來越追求高品質(zhì)的生活,導(dǎo)致對木材和木制品的需求增加,如實木板、人造板、紙和紙板等消費水平位居世界前列,隨之而來對木制品的制造要求也日益嚴(yán)格.然而,現(xiàn)有的木材儲存能力和加工水平使其難以滿足快速增長的需求.木材供應(yīng)不足和使用率低導(dǎo)致中國木材工業(yè)發(fā)展受限.在木材加工生產(chǎn)中,木材缺陷會對木材品質(zhì)產(chǎn)生很大的影響,而木材品質(zhì)又決定木材及其制品的商品價值和使用價值.國內(nèi)木材原材料綜合使用率偏低的主要原因之一是木材缺陷檢測效率較低[3].
近年來,眾多學(xué)者為了提高木材原料綜合使用率,研究并提出了木材缺陷的檢測方法,如基于3D掃描技術(shù)的木材缺陷定量化分析、鉆入阻抗法檢測木材缺陷、基于快速算法和LBP(Local Binary Pattern,LBP)算法的木材缺陷識別等[4-7].這些方法或多或少存在著檢測設(shè)備成本高、對實際檢測工作環(huán)境要求苛刻等問題,無法大規(guī)模產(chǎn)業(yè)化推廣應(yīng)用.而基于機器視覺的木材缺陷檢測技術(shù)既可降低識別過程中主觀因素的影響,又可擺脫對特定檢測設(shè)備的依賴.
文獻(xiàn)[8]提出一種基于修剪決策樹的人造板表面缺陷識別方法,該方法通過對已有的人造板缺陷圖像進(jìn)行預(yù)處理和分割,獲取缺陷形狀和紋理特征作為輸入,然后利用成本復(fù)雜度算法對生成的CART(Classification And Regression Tree,CART)樹進(jìn)行修剪,最終識別人造板缺陷.文獻(xiàn)[9]提出一種基于近紅外(Near-Infrared Spectroscopy,NIR)光譜和逆神經(jīng)網(wǎng)絡(luò)的木材缺陷識別方法.此外,Mohsin等[10]應(yīng)用多通道Gabor過濾器和k均值聚類來檢測木材缺陷的位置和形狀.Riana 等[11]提出一種用于圖像分割的模糊最小-最大神經(jīng)網(wǎng)絡(luò)(Fuzzy Min-Max Neural Network,FMMIS),并使用SVM(Support Vector Machine,SVM)分類器對各種木材缺陷進(jìn)行分類,準(zhǔn)確率達(dá)到91%.Hu等[12]提出了樹狀結(jié)構(gòu)SVM,用于識別不同的節(jié)點,該方法取得了較高的分類率.然而,SVM 分類器可以對小樣本產(chǎn)生良好的性能,對大樣本卻不能.Cho等[13]提出了一種基于主成分分析(Principal Component Analysis,PCA)和壓縮感知的自組織特映射(Self-Organizing Map,SOM)神經(jīng)網(wǎng)絡(luò)識別某些木材缺陷(死結(jié)、活結(jié)和裂紋)的方法.這種方法是無監(jiān)督聚類方法之一,與傳統(tǒng)聚類方法(如k均值)相比,SOM 神經(jīng)網(wǎng)絡(luò)是一種用于模式分類和數(shù)據(jù)壓縮的神經(jīng)網(wǎng)絡(luò)模型,受網(wǎng)絡(luò)權(quán)重初始化和噪聲數(shù)據(jù)的影響較小,且SOM 神經(jīng)網(wǎng)絡(luò)相較于其他神經(jīng)網(wǎng)絡(luò)模型具有較高的魯棒性,對數(shù)據(jù)中的小擾動和噪聲具有很好的抗干擾能力.然而,當(dāng)數(shù)據(jù)量非常大時SOM 神經(jīng)網(wǎng)絡(luò)需要執(zhí)行大量的計算才能達(dá)到理想結(jié)果,會導(dǎo)致計算時間較長.Chen等[14]采用不同缺陷權(quán)重的凸優(yōu)化(Convex Optimization,CO)作為平滑的預(yù)處理方法,并采用Otsu分割法對木材缺陷圖像進(jìn)行分割,提取木材缺陷的幾何和強度特征,并使用回歸樹(CART)分類器對各種木材缺陷進(jìn)行分類.
深度學(xué)習(xí)具有特征層次深、檢測精度高、魯棒性好等優(yōu)點,已逐步應(yīng)用于各個領(lǐng)域的缺陷檢測[15].文獻(xiàn)[16]改進(jìn)了SSD模型的VGG(Visual Geometry Group Network,VGG)網(wǎng)絡(luò)部分,使用深度殘差網(wǎng)絡(luò)替換VGG網(wǎng)絡(luò).改進(jìn)后的SSD(Single Shot MultiBox Detector,SSD)模型對冷杉和松木缺陷的平均檢測準(zhǔn)確率超過89%.文獻(xiàn)[17]利用DenseNet網(wǎng)絡(luò)將改進(jìn)的SSD模型和遷移學(xué)習(xí)與改進(jìn)的SSD模型相結(jié)合,實現(xiàn)了木材缺陷的高精度檢測.此外,還有基于區(qū)域建議的方法,如R-CNN(Region-based Convolutional Neural Network,R-CNN)模型和快速R-CNN模型[18-19].
盡管以往的研究已經(jīng)取得了重大進(jìn)展,但在缺陷檢測方面仍然存在一些挑戰(zhàn),如木質(zhì)板材表面的復(fù)雜性及缺陷類型和尺寸的變化.這些缺陷在原材料面板和單板性能上不同,除了背景材料差異外,即使是相同的凸起對于圖像端的原材料板和成品板來說也有很大不同.另外,這些圖像分割和特征提取過程通常困難和復(fù)雜,因為每塊木材都有獨特的外觀,并且可能有多種類型的缺陷.針對這些問題,本文提出一種基于可變性卷積網(wǎng)絡(luò)和注意力機制的新方法來檢測和識別木質(zhì)板材缺陷.結(jié)果表明,本文方法采用的網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)于現(xiàn)有其他方法,該網(wǎng)絡(luò)無需對圖像預(yù)處理和特征提取提出重大要求,在減少圖像處理時間的前提下,可以提高木質(zhì)板材缺陷的檢測精度.
本文的貢獻(xiàn)如下:
1) 通過可變形卷積網(wǎng)絡(luò)(DCN)將矩形網(wǎng)格轉(zhuǎn)換為變形網(wǎng)格,使模型專注于具有更多有用圖像信息的區(qū)域.
2) 將DCN輸出饋送到門控循環(huán)單元(GRU)層以學(xué)習(xí)缺陷圖像的高級特征.
3) 通過關(guān)注輸入圖像的最重要特征,應(yīng)用注意力機制加強瑕疵區(qū)域的高亮度,從而提高模型識別的準(zhǔn)確性.
本文模型最初受到規(guī)范卷積循環(huán)神經(jīng)網(wǎng)絡(luò)(Convolutional Recurrent Neural Network,CRNN)架構(gòu)的啟發(fā),結(jié)合卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)的優(yōu)勢,利用了局部相關(guān)性和長景上下文來識別特征信息.在相關(guān)研究中,學(xué)者們評估了兩種類型的RNN,它們分別是長短期記憶(Long Short-Term Memory,LSTM)和門控循環(huán)單元(GRU).與LSTM一樣,GRU具有控制單元內(nèi)部信息流的門控單元,但沒有單獨的存儲單元.在性能和復(fù)雜性方面,GRU顯著優(yōu)于LSTM.因此,本文采用GRU作為模型的構(gòu)建塊.
近年來,注意力架構(gòu)在圖像特征識別中得到廣泛應(yīng)用,并取得了巨大成功.由于注意力機制能夠使模型更加注重不同的特征區(qū)域,提高模型對關(guān)鍵信息的關(guān)注度,同時減輕對噪聲和無關(guān)信息的處理,因此在圖像識別任務(wù)中使用注意力機制可以幫助模型更加準(zhǔn)確地定位并識別缺陷.
本文開發(fā)了一種將CRNN網(wǎng)絡(luò)作為編碼器部分與注意力部分相結(jié)合的架構(gòu).該模型利用了規(guī)范的CRNN架構(gòu),但在CRNN中沒有使用常規(guī)CNN,而是使用DCN,即一種特殊類型的CNN.DCN是一種增強了感受野變化的卷積神經(jīng)網(wǎng)絡(luò),在固定尺寸的卷積過濾器上運行,就像常規(guī)CNN一樣,但具有各種形狀的網(wǎng)格.DCN的可變形卷積核能力,可以更好地適應(yīng)各種不同形狀和尺寸的對象,從而提高網(wǎng)絡(luò)的泛化能力.與傳統(tǒng)CNN相比,DCN可以在感受野形狀和大小發(fā)生變化時對輸入信號更精確地建模.
圖1為板材缺陷識別模型的端列端架構(gòu).本文模型的輸入是N×F矩陣,其中N是特征序列的長度,F是特征的維數(shù).模型結(jié)構(gòu)包括一層DCN、多層單向GRU.GRU層的輸出被送入到注意力機制層,生成更緊湊的特征表示.應(yīng)用線性變換和Softmax解碼特征進(jìn)行判別輸出.
圖1 板材缺陷識別模型的端到端架構(gòu)
端到端模型可以直接輸出置信度分?jǐn)?shù),無需任何后續(xù)處理方法,也不涉及搜索算法,無需事先對齊即可訓(xùn)練模型.當(dāng)輸出超過預(yù)定義閾值時,系統(tǒng)就會被觸發(fā).該模型的原理是在輸出置信度分?jǐn)?shù)時,通過設(shè)定一個預(yù)定義閾值來觸發(fā)系統(tǒng),使模型能夠自動分類和處理需要的信息.這種模型的優(yōu)點是可以快速地進(jìn)行訓(xùn)練和推理,并且準(zhǔn)確率通常較高.
圖像特征中的信息容易變形,且只有少數(shù)區(qū)域有用.規(guī)則卷積在預(yù)定義的矩形網(wǎng)格上運行,因此過濾器無法用各種形狀適當(dāng)?shù)馗采w特征結(jié)構(gòu),限制了其在特征中學(xué)習(xí)更多圖像信息的能力.本文使用可變形卷積代替?zhèn)鹘y(tǒng)卷積來解決此問題.DCN學(xué)習(xí)將矩形網(wǎng)格轉(zhuǎn)換為變形網(wǎng)格,使模型專注于具有更多有用圖像信息的區(qū)域.可變形卷積架構(gòu)如圖2所示,它由兩個步驟組成.
圖2 可變形卷積網(wǎng)絡(luò)架構(gòu)
步驟1生成偏移場: 偏移表示執(zhí)行可變形卷積時需要使用的像素坐標(biāo).每個偏移值是一對(offsetn,offsetf),其中offsetn和offsetf分別是沿時間軸和頻率軸的像素坐標(biāo).偏移量是可學(xué)習(xí)的變量,由對輸入特征操作的常規(guī)卷積(ConvOffset)產(chǎn)生.
(1)
圖3 雙線性插值示意圖
(2)
在該模型中,雙線性插值函數(shù)使用偏移周圍的4個像素,其值為u00=I(iL,jL),u01=I(iB,jL),u10=I(iL,jB),u11=I(iH,jH),其中,iL=offsetf,iB=offsetf+1,jL=offsetn和jB=offsetn+1.
雙線性插值計算為:
(3)
式(3)中x,y∈{0,1},mxy是對應(yīng)于像素uxy的權(quán)重,定義為:
m00=(1-Δi)×(1-Δj)
m01=Δi×(1-Δj)
m02=(1-Δi)×Δj
m03=Δi×Δj
(4)
式(4)中Δi=offsetf-offsetf,Δj=offsetn-offsetn.Δi,Δj用來表示偏移值offsetf和offsetn相對于其整數(shù)部分的偏移.
步驟3生成輸出: DCN最終輸出由另一個卷積(ConvOut)生成.對于ConvOut的每個核窗,首先使用輸入特征I和學(xué)習(xí)偏移值O之間的雙線性插值來計算變形特征,然后將變形值乘以ConvOut的核權(quán)重,得到最終輸出.
(5)
式(5)中,d[w,x,y]表示ConvOut在時頻指數(shù)(x,y)第w個通道的輸出,d∈RTC×N′×F′也是DCN的最終輸出,hxy是雙線性插值.M∈RTC×LN×LF是ConvOut的可學(xué)習(xí)權(quán)重,與傳統(tǒng)CNN類似,過濾器數(shù)量為TC,過濾器大小為(LN,LF)和步長(SN,SF).
ConvOut被認(rèn)為是兩個輸入的函數(shù),輸入特征I和偏移值O.ConvOut之后,DCNd中d的輸出是(TC,N′,F′)形狀.為了保持d的形式(時間×頻率)進(jìn)行下一個塊(GRU塊),d需要被重塑為(N′,TC×F′).
門控循環(huán)單元可以使每個遞歸單元自適應(yīng)地捕獲不同時間尺度的依賴關(guān)系.與長短期存儲器(LSTM)單元類似,GRU具有控制單元內(nèi)信息流的門控單元,但GRU不包括單獨的存儲單元.
rn=σ(Mxrdn+hxr+Mbrbn-1+hbr)
kn=σ(Mxkdn+hxk+Mbkbn-1+hbk)
tn=tanh(Mxtdn+hxt+rn⊙(Mbtbn-1+hbt))
bn=(1-kn)⊙tn+kn⊙bn-1
(6)
式(6)中,bn是隱藏狀態(tài)下時間n時的GRU輸出,bn-1是時間n-1隱藏狀態(tài)或時間n=1時的初始隱藏狀態(tài)b0.Mxr和hxr是從GRU輸入調(diào)諧復(fù)位門的權(quán)重和偏置,分別從先前的隱藏狀態(tài)調(diào)諧復(fù)位門.rn,kn和tn分別是重置門、更新門和新門.(Mxk,hxk),(Mbk,hbk)和(Mxt,hxt),(Mbt,hbt)的利用率相似,但是用于更新和新建門.σ是sigmoid函數(shù),將輸入映射到區(qū)間(0,1);tanh表示雙曲正切函數(shù),將輸入映射到區(qū)間(-1,1); ⊙是元素乘積.
本文根據(jù)文獻(xiàn)[20]中5種注意力機制的比較研究得出結(jié)論,即共享參數(shù)非線性注意力取得了最好的效果.因此,在本文模型中采用共享參數(shù)非線性注意機制來提取和強調(diào)最相關(guān)的隱藏GRU特征.
注意力機制框架如圖1所示.注意力塊使用注意力機制從編碼器輸出中學(xué)習(xí)歸一化權(quán)重,最常用的注意力函數(shù)之一是加型注意力,使用具有單個隱藏層的前饋網(wǎng)絡(luò)來計算權(quán)重.
α=softmax(tanh(bM0+h0)M1+h1)
(7)
式(7)中b=[b0,b1,…,bN′]∈RN′×TR是GRU層的輸出,M0∈RTR×TG,M1∈RTG×TR是可學(xué)習(xí)權(quán)重,而h0∈RTG×1,h1∈RTR×1是前饋層的偏差.
在式(7)中,矩陣α=[α0,α1,…,αN′]∈RN′×TR是注意力機制的權(quán)重.固定長度向量c成為N′時間步長上α和b之間的加權(quán)平均值:
(8)
通過線性變換(具有可學(xué)習(xí)的權(quán)重矩陣M2∈RTR×2和偏差h2∈R2×1)生成預(yù)測輸出,然后是softmax層為:
j=softmax(cM2+h2)
(9)
在沒有任何后處理方法的情況下,j值被用作最終置信度得分,并根據(jù)GRU特征進(jìn)行木板缺陷檢測.
為了評估所提算法的性能,本文在4個木質(zhì)板材缺陷數(shù)據(jù)集上進(jìn)行缺陷識別實驗,分別是Mader缺陷數(shù)據(jù)集、Lumber Grading紅松木質(zhì)板材數(shù)據(jù)集、Timber Defect Image 數(shù)據(jù)集和WCTD木質(zhì)板材缺陷數(shù)據(jù)集.并將本文方法與其他3種對比方法(文獻(xiàn)[21]、文獻(xiàn)[22]和文獻(xiàn)[23])進(jìn)行比較分析.為了實現(xiàn)從本文算法中獲得結(jié)果,Matlab (R2015a) 在具有16 GB RAM、Intel core i7-470 K @ 4.0 GHz 的計算機上使用.
2.1.1 Mader缺陷數(shù)據(jù)集
Mader缺陷數(shù)據(jù)集是一個由瑞典皇家工學(xué)院制作的木質(zhì)板材缺陷數(shù)據(jù)集,包括12個類別的缺陷(例如瘤、干裂等)和正常木材,共160張圖像.本實驗中將其設(shè)為木質(zhì)板材下的次數(shù)據(jù)集1.
2.1.2 Lumber Grading紅松木質(zhì)板材數(shù)據(jù)集
Lumber Grading紅松木質(zhì)板材數(shù)據(jù)集是由美國USDA Forest Service提供的紅松木質(zhì)板材數(shù)據(jù)集,包括正常板材和各種程度的缺陷,共518張圖像.本實驗中將其設(shè)置為木質(zhì)板材下的次數(shù)據(jù)集2.
2.1.3 Timber Defect Image Dataset
Timber Defect Image Dataset是由英國倫敦帝國學(xué)院提供的木材缺陷數(shù)據(jù)集,包括正常板材和多種缺陷,如裂紋、瘤、旋度、孔洞等,共660張圖像.本實驗中將其設(shè)置為木質(zhì)板材下的次數(shù)據(jù)集3.
2.1.4 WCTD木質(zhì)板材缺陷數(shù)據(jù)集
WCTD木質(zhì)板材缺陷數(shù)據(jù)集是由中國林業(yè)科學(xué)研究院木材工業(yè)研究所提供的木質(zhì)板材缺陷數(shù)據(jù)集,包括多種木材種類,共12 000張圖像.本實驗中將其設(shè)置為木質(zhì)板材下的次數(shù)據(jù)集4.
根據(jù)木質(zhì)板材缺陷的工藝和原因不同,分為生物危害缺陷、生長缺陷和加工缺陷.其中,生長缺陷和生物危害缺陷是自然缺陷,具有一定的形狀和結(jié)構(gòu)特征,也是木材等級分類的重要依據(jù).一般來講,木質(zhì)板材生長缺陷和生物危害缺陷可分為死節(jié)、活節(jié)、蟲洞、腐爛等.本文實驗使用4個木質(zhì)板材缺陷數(shù)據(jù)集的木材采樣圖像,通過實木板激光輪廓和彩色集成掃描技術(shù)獲得了5 000多張300×300有缺陷的木板圖片.其中,常見的缺陷主要包括死節(jié)、活節(jié)、腐爛、霉變、裂紋、蟲眼等6種特征缺陷,如圖4所示.
圖4 木質(zhì)板材常見缺陷
根據(jù)準(zhǔn)確性、靈敏度和特異性指標(biāo)評估本文方法與其他3種對比方法的性能.
(10)
(11)
(12)
式(10)中,正確檢測多張木質(zhì)板材瑕疵圖像為tP,正確拒絕多張木質(zhì)板材缺陷圖像為tN(真陰性),錯誤地將多張木質(zhì)板材缺陷圖像誤判為正常的情況記為fP(假陽性),錯誤地拒絕一些真實存在木質(zhì)板材缺陷圖像的情況記為fN(假陰性).
2.2.1 不同性能對比
將本文方法與文獻(xiàn)[21-23]進(jìn)行比較,幾種方法在4個不同木質(zhì)板材缺陷數(shù)據(jù)集上的性能比較結(jié)果如圖5-圖7所示.
本文方法與其他3種對比方法在不同數(shù)據(jù)庫的準(zhǔn)確率比較如圖5所示.本文方法在4個數(shù)據(jù)集上的準(zhǔn)確率分別為 96.5%,98%,99.2%和95%.具體為: 在數(shù)據(jù)庫1上與文獻(xiàn)[21]、文獻(xiàn)[22]和文獻(xiàn)[23]等現(xiàn)有方法相比,本文方法的準(zhǔn)確性分別提高了2.4%,4.7%和8.9%.在數(shù)據(jù)庫2上與其他3種對比方法相比,本文方法的準(zhǔn)確率分別提高了5.3%,9.0%和7.4%.在數(shù)據(jù)庫3上本文方法的準(zhǔn)確率比其他3種對比方法的準(zhǔn)確率分別提高了11.2%,4.8%和9.5%.在數(shù)據(jù)庫4上與其他3種對比方法相比,本文方法的準(zhǔn)確率分別提高了13.2%,8.3%和3.1%.
圖5 不同方法在4種木質(zhì)板材缺陷數(shù)據(jù)集上的準(zhǔn)確率比較
圖6顯示了本文方法與其他3種對比方法在不同數(shù)據(jù)集上的靈敏度比較.本文方法的靈敏度分別為88.7%,92.6%,94.5%和95.3%.具體為: 在數(shù)據(jù)集1上本文方法的靈敏度比文獻(xiàn)[21]、文獻(xiàn)[22]和文獻(xiàn)[23]分別高9.2%,3.5%和10.2%.在數(shù)據(jù)集2上本文方法的靈敏度比文獻(xiàn)[21]提高了5.9%,比文獻(xiàn)[22]提高了3.3%,比文獻(xiàn)[23]提高了16.6%.在數(shù)據(jù)集3中與其他3種對比方法相比,本文方法的靈敏度分別提高了6.8%,4.3%和3.7%.在數(shù)據(jù)集4中本文方法的靈敏度比文獻(xiàn)[21]提高了10.9%,比文獻(xiàn)[22]提高了7.6%,比文獻(xiàn)[23]提高了4.4%.
4種算法在不同數(shù)據(jù)集的特異性比較如圖7所示.從圖7中可以看出,本文方法的特異性為 92.5%,96.3%,97%和95.8%.在數(shù)據(jù)集1上本文方法的特異性優(yōu)于文獻(xiàn)[21]12.4%,優(yōu)于文獻(xiàn)[22]8.2%,優(yōu)于文獻(xiàn)[23]17.8%.在數(shù)據(jù)集2上本文方法的特異性優(yōu)于文獻(xiàn)[21]8.6%,優(yōu)于文獻(xiàn)[22]14.2%,優(yōu)于文獻(xiàn)[22]21%.在數(shù)據(jù)集3中與文獻(xiàn)[21]、文獻(xiàn)[22]和文獻(xiàn)[23]相比,本文方法的特異性分別提高了13.8%,8.3%和4%.在數(shù)據(jù)集4上本文方法的特異性分別比其他3種對比方法提高15.6%,4.6%和13%.
為了清晰直觀地觀察數(shù)據(jù),本文將以上評價指標(biāo)的性能總結(jié)如下(表1).
圖6 不同方法在4種木質(zhì)板材缺陷數(shù)據(jù)集上的靈敏度比較
圖7 不同方法在4種木質(zhì)板材缺陷數(shù)據(jù)集上的特異性比較
表1 不同方法的識別性能評估表
從表1中可以清楚地看到,本文方法在4個木質(zhì)板材缺陷數(shù)據(jù)集上的各個性能均優(yōu)于其他3種對比方法.實驗結(jié)果說明,本文模型可以更好地適應(yīng)各種不同形狀和尺寸的對象,提高網(wǎng)絡(luò)泛化能力,從而更精確地檢測和識別木質(zhì)板材缺陷.
2.2.2 缺陷識別效果對比
為了更直觀地分析引入可變性卷積網(wǎng)絡(luò)與注意力機制對模型性能的提升,本文設(shè)計了木材缺陷識別實驗對不同模型進(jìn)行分析.由圖8可知,本文方法的平均識別查準(zhǔn)率約為90.1%,明顯高于其他3種對比方法.其中,對于腐爛、霉變這兩種缺陷,本文算法識別效果略優(yōu)于其他3種對比方法.而對于節(jié)子(死節(jié)、活節(jié))、蟲眼、裂紋的識別效果,本文方法均明顯優(yōu)于其他3種方法.
圖8 木質(zhì)板材缺陷識別效果對比
木材在生長與加工過程中受到環(huán)境與工藝影響會形成不同缺陷,這些缺陷直接影響木制產(chǎn)品的等級和品質(zhì).因此,快速準(zhǔn)確地進(jìn)行木材缺陷檢測對木材有效利用具有重要的意義.為了提高木質(zhì)板材缺陷識別的準(zhǔn)確率與速度,本文提出了基于可變形卷積網(wǎng)絡(luò)和注意力機制的神經(jīng)架構(gòu)模型.可變形卷積層驅(qū)動模型更多地關(guān)注缺陷圖像區(qū)域,從而提取圖像的深層特征; 而注意力機制則進(jìn)一步關(guān)注圖像特征中最關(guān)鍵的部分,加強缺陷區(qū)域的高亮度進(jìn)行缺陷識別.通過在4個木質(zhì)板材缺陷數(shù)據(jù)集上將本文方法與文獻(xiàn)[21]、文獻(xiàn)[22]和文獻(xiàn)[23]3種分類識別方法進(jìn)行比較分析,結(jié)果表明本文方法具有最佳的準(zhǔn)確率、靈敏度及特異性,分類識別準(zhǔn)確率高達(dá)98%,驗證了本文方法具有很好的木材缺陷識別能力.本實驗結(jié)果可以幫助學(xué)者們了解木質(zhì)板材缺陷檢測的相關(guān)研究進(jìn)展,并提供一定的參考價值.未來的工作需要探索腐爛、霉變這兩種缺陷查準(zhǔn)率不高的原因和改進(jìn)方法.此外,本課題組計劃研究目標(biāo)位置信息的回歸方法,以提高目標(biāo)的定位準(zhǔn)確率,從而進(jìn)一步提升目標(biāo)識別的整體準(zhǔn)確率.