何拓,劉守佳,陸楊,焦立超,殷亞方
(中國林業(yè)科學(xué)研究院木材工業(yè)研究所, 中國林業(yè)科學(xué)研究院木材標(biāo)本館,北京 100091)
隨著全球森林資源貿(mào)易的劇增,以《瀕危野生動(dòng)植物物種國際貿(mào)易公約》(Convention on International Trade in Endangered Species of Fauna and Flora, CITES)管制物種為代表的木材貿(mào)易成為全球關(guān)注的焦點(diǎn)。我國是CITES締約國之一,也是全球最大的木材進(jìn)口國。2019年我國木材進(jìn)口量1.14 億m3,同比增長(zhǎng)1.72%,我國木材缺口持續(xù)增加,木材資源對(duì)外依存度已超過50%[1]。但在利益驅(qū)動(dòng)下,瀕危珍貴木材走私活動(dòng)日益猖獗,我國木材進(jìn)口受到國際社會(huì)的廣泛關(guān)注。同時(shí),根據(jù)聯(lián)合國環(huán)境規(guī)劃署和國際刑警組織統(tǒng)計(jì),全球每年木材非法貿(mào)易金額高達(dá)150億美元,對(duì)全球森林資源及生物多樣性造成嚴(yán)重破壞[2]。在木材貿(mào)易流通環(huán)節(jié),對(duì)木材樹種進(jìn)行準(zhǔn)確快速識(shí)別,是打擊木材非法貿(mào)易活動(dòng)的重要科學(xué)途徑。因此,開展木材樹種的精準(zhǔn)識(shí)別技術(shù)研究并進(jìn)行推廣應(yīng)用,對(duì)保障國家木材安全、保護(hù)森林物種多樣性以及加強(qiáng)林產(chǎn)品產(chǎn)業(yè)鏈監(jiān)管具有重要的現(xiàn)實(shí)意義。
傳統(tǒng)木材樹種識(shí)別方法是建立在木材解剖學(xué)基礎(chǔ)上,通過木材宏觀和微觀構(gòu)造特征進(jìn)行樹種分類,一般只能識(shí)別木材到“屬”或者“類”[3-4]。基于分子生物學(xué)的DNA條形碼[5]以及基于組織化學(xué)的近紅外光譜[6-7]、氣相色譜-質(zhì)譜[8]、實(shí)時(shí)直接分析質(zhì)譜[9-10]等方法,雖然為木材“種”水平的識(shí)別提供了新的途徑,但構(gòu)建完善可靠的木材識(shí)別特征(DNA序列、化學(xué)指紋圖譜等)數(shù)據(jù)庫需要花費(fèi)大量的人力財(cái)力,且難以在口岸現(xiàn)場(chǎng)進(jìn)行大批量樣本的快速識(shí)別應(yīng)用推廣,從而限制了以上木材識(shí)別方法的進(jìn)一步發(fā)展。
隨著計(jì)算機(jī)技術(shù)的快速發(fā)展,計(jì)算機(jī)視覺技術(shù)在木材識(shí)別領(lǐng)域逐漸發(fā)展應(yīng)用,為木材樹種的準(zhǔn)確快速識(shí)別提供了新的途徑。與其他識(shí)別特征相比,木材構(gòu)造圖像特征更加容易獲得,構(gòu)建木材構(gòu)造圖像數(shù)據(jù)庫更加省時(shí)省力,為木材樹種的精準(zhǔn)快速識(shí)別提供了可能。傳統(tǒng)木材樹種計(jì)算機(jī)視覺識(shí)別方法通過獲取木材宏觀或微觀構(gòu)造圖像,采用數(shù)字圖像處理技術(shù)對(duì)木材識(shí)別特征進(jìn)行提取,進(jìn)而采用分類器對(duì)木材樹種進(jìn)行分類。而最新發(fā)展的基于深度學(xué)習(xí)(deep learning)的木材樹種計(jì)算機(jī)視覺識(shí)別方法在建立圖像數(shù)據(jù)集基礎(chǔ)上,通過構(gòu)建深度卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)對(duì)圖像數(shù)據(jù)進(jìn)行訓(xùn)練學(xué)習(xí),自動(dòng)提取木材圖像識(shí)別特征,從而實(shí)現(xiàn)對(duì)木材樹種的快速分類[11-12]。
筆者從圖像采集、特征提取和樹種分類等方面介紹了傳統(tǒng)木材樹種計(jì)算機(jī)視覺識(shí)別技術(shù)的研究概況,進(jìn)而從圖像數(shù)據(jù)集建立、模型構(gòu)建、訓(xùn)練與測(cè)試以及系統(tǒng)開發(fā)與應(yīng)用等方面,對(duì)基于深度學(xué)習(xí)的木材樹種計(jì)算機(jī)識(shí)別技術(shù)研究進(jìn)展情況進(jìn)行綜述。在此基礎(chǔ)上,對(duì)基于深度學(xué)習(xí)的木材樹種計(jì)算機(jī)視覺技術(shù)在木材識(shí)別領(lǐng)域的應(yīng)用前景進(jìn)行了展望,以期為木材樹種自動(dòng)精準(zhǔn)識(shí)別技術(shù)研究應(yīng)用提供新的思路。
傳統(tǒng)木材樹種計(jì)算機(jī)視覺識(shí)別方法通過獲取木材宏觀或微觀構(gòu)造圖像,采用數(shù)字圖像處理技術(shù)對(duì)木材的識(shí)別特征進(jìn)行提取,進(jìn)而采用分類器進(jìn)行木材樹種分類[13](圖1)。
圖1 傳統(tǒng)木材計(jì)算機(jī)視覺識(shí)別技術(shù)流程Fig. 1 Process flow chart of traditional computer vision technology for wood identification
傳統(tǒng)木材樹種計(jì)算機(jī)視覺識(shí)別方法按照識(shí)別對(duì)象主要分為兩類,即基于宏觀特征圖像和微觀特征圖像的木材識(shí)別[14]。木材宏觀、微觀特征圖像中包含著木材識(shí)別特征,可以為木材樹種識(shí)別提供有效的特征信息。
基于宏觀特征圖像的木材識(shí)別,主要通過數(shù)碼相機(jī)、工業(yè)相機(jī)和掃描儀等圖像采集裝置獲取顏色[15-18]和紋理[19-23]等物理特征圖像,進(jìn)而對(duì)木材樹種進(jìn)行識(shí)別。研究表明,木材宏觀圖像中顏色和紋理包含的識(shí)別特征較少,尤其對(duì)于相似樹種木材,其顏色和紋理的特征差異非常小。同時(shí),木材顏色容易受到外界環(huán)境的影響而改變,且木材在不同方向上顯示的紋理差別較大,導(dǎo)致顏色和紋理特征對(duì)木材樹種的識(shí)別能力十分有限[24]。
基于微觀特征圖像的木材識(shí)別,利用實(shí)體顯微鏡、生物顯微鏡以及掃描電子顯微鏡采集木材三切面的微觀構(gòu)造圖像,提取出管孔、軸向薄壁組織和木射線等微觀構(gòu)造特征進(jìn)行木材樹種識(shí)別[25-30]。相比而言,微觀特征圖像包含木材更加豐富的構(gòu)造特征,尤其是木材橫切面構(gòu)造圖像,包含木材管孔、軸向薄壁組織和木射線等重要構(gòu)造特征,為木材樹種的識(shí)別提供了關(guān)鍵信息[31-33]。
但同時(shí)注意到,木材宏、微觀圖像均屬于細(xì)粒度圖像,需要專業(yè)的木材鑒定人員對(duì)圖像進(jìn)行準(zhǔn)確標(biāo)注。目前研究使用的圖像很少是從經(jīng)正確定名的木材標(biāo)本采集而來,用于模型訓(xùn)練的圖像可靠性無法保證,從而影響識(shí)別結(jié)果的準(zhǔn)確性。同時(shí),木材宏觀特征圖像通過非專業(yè)圖像采集裝置獲取,容易受到外界環(huán)境的影響,圖像噪聲較大,圖像數(shù)據(jù)集的一致性較差,導(dǎo)致圖像質(zhì)量不高,從而影響了最終的識(shí)別精度;而木材微觀構(gòu)造圖像采集依賴于實(shí)體顯微鏡、光學(xué)顯微鏡和掃描電子顯微鏡等大型儀器設(shè)備,難以在木材樹種現(xiàn)場(chǎng)識(shí)別領(lǐng)域得到應(yīng)用。因此,亟須采用專業(yè)便攜的圖像采集裝置從經(jīng)正確定名的木材標(biāo)本采集高質(zhì)量木材構(gòu)造圖像,建立木材構(gòu)造圖像參考數(shù)據(jù)庫,為木材樹種計(jì)算機(jī)視覺識(shí)別技術(shù)的發(fā)展和應(yīng)用奠定基礎(chǔ)[34]。
木材宏觀圖像中包含木材的顏色和紋理等分類特征,從木材圖像提取出有效的識(shí)別特征是木材樹種識(shí)別的基礎(chǔ)。顏色是木材在宏觀尺度上重要的物理特征,通過提取RGB顏色空間、顏色直方圖和顏色矩等特征參數(shù)作為識(shí)別特征,進(jìn)而對(duì)木材樹種進(jìn)行分類[35-37]。但木材顏色易受到外界環(huán)境的影響,木材在空氣中緩慢氧化或受到霉菌侵染,其顏色會(huì)隨之發(fā)生變化,而且相似樹種的木材顏色十分接近,因此顏色特征在木材樹種識(shí)別方面具有較大的局限性[38]。木材紋理由生長(zhǎng)輪、木射線和軸向薄壁組織等解剖分子相互排列組合組成,紋理是木材樹種的基本特征,也是木材樹種識(shí)別的關(guān)鍵特征。大量研究通過對(duì)木材紋理進(jìn)行定量化研究,獲取紋理形狀、紋理方向、紋理周期密度、紋理粗細(xì)均勻度、紋理基元大小、紋理行程和灰度分布均勻性等特征參數(shù),用于木材樹種的分類[39-41]。在宏觀尺度上,同種木材的紋理變異性較大,而且木材在不同角度的切面顯示的紋理各異,導(dǎo)致木材紋理對(duì)木材樹種的識(shí)別難度大,識(shí)別結(jié)果不穩(wěn)定。
木材微觀構(gòu)造特征的提取方法主要分為兩類:基于圖像分割的特征提取和基于整體圖像的特征提取。基于圖像分割的特征提取方法主要利用圖像處理技術(shù)的二值化、閾值分割以及數(shù)學(xué)形態(tài)方法對(duì)木材微觀構(gòu)造中的管孔、軸向薄壁組織、木射線、胞間道等主要組織類型進(jìn)行分割,分別提取這些微觀構(gòu)造的形態(tài)因子、組織比量和幾何結(jié)構(gòu)等特征[42-43]。大量研究對(duì)管孔特征進(jìn)行分割和提取,并基于管孔的輪廓、數(shù)量、分布和組合類型等特征對(duì)木材樹種進(jìn)行分類[44-47]。但是,在木材的微觀構(gòu)造中,各種細(xì)胞組織類型在空間上都具有一定的聯(lián)系,形成各種形態(tài)的組合類型,圖像分割在一定程度上破壞了有效的識(shí)別特征,因而更多的研究采用圖像整體的特征提取方法[48]。
圖像整體的特征提取方法主要包括方向梯度直方圖(histogram of gradient, HOG)、灰度共生矩陣(gray-level co-occurrence matrix, GLCM)、濾波法(gabor filter, GF)、小波變換(wavelet transform, WT)、尺度不變特征轉(zhuǎn)換(scale-invariant feature transform, SIFT)和局部二值模式(local binary pattern, LBP)等方法。方向梯度直方圖反映了圖像不同點(diǎn)位之間像素的梯度,通過將整個(gè)木材圖像細(xì)分為多個(gè)紋理基元進(jìn)行特征提取,保持了圖像光學(xué)和幾何特征的不變性,對(duì)木材樹種具有較好的識(shí)別效果[49-50]。灰度共生矩陣可以定義圖像不同的統(tǒng)計(jì)量特征參數(shù),從不同角度對(duì)木材紋理特征進(jìn)行表示,常用的特征參數(shù)有能量、熵、對(duì)比度、差異度、逆差矩和方差等。由于灰度共生矩陣特征參數(shù)豐富,對(duì)木材紋理可以進(jìn)行全面刻畫,因而在木材紋理特征提取研究中得到了廣泛應(yīng)用[51-53]。濾波法通過特定方向上的局部頻率信息進(jìn)行圖像紋理的表示,在木材紋理特征提取方面表現(xiàn)出顯著的效果[54-56];但是,濾波法無法表示木材紋理在不同尺度和方向的細(xì)節(jié)結(jié)構(gòu)特征。小波變換是空間(時(shí)間)和頻率的局部變換,通過變換可以突出木材圖像中局部重點(diǎn)特征,進(jìn)而從木材圖像中提取有效的識(shí)別信息[57-58]。尺度不變特征變換具有較好的穩(wěn)定性和不變性,能夠適應(yīng)圖像旋轉(zhuǎn)、尺度縮放、亮度的變化,能在一定程度上不受視角變化、仿射變換、噪聲的干擾,對(duì)木材不同方向的圖像具有很好的辨別能力,可以提取出木材管孔的形狀信息[59-61]。局部二值模式是用來描述圖像局部紋理特征的方法,具有旋轉(zhuǎn)不變性和灰度不變性等顯著優(yōu)點(diǎn),提取的特征是圖像局部的紋理特征,在木材紋理特征提取中被廣泛應(yīng)用,并取得較好的識(shí)別結(jié)果[62-63]。
雖然以上特征提取方法可以在一定程度上提取出有效特征對(duì)測(cè)試圖像進(jìn)行分類,但需要專業(yè)的知識(shí)經(jīng)驗(yàn)進(jìn)行人工設(shè)計(jì)特征,而且所提取的特征往往對(duì)于未知樣本的圖像識(shí)別能力比較有限,即模型的泛化能力較差[64]。
從木材構(gòu)造圖像中提取出有效的識(shí)別特征,需要采用合適的分類器對(duì)木材樹種進(jìn)行分類。在木材識(shí)別研究中采用較多的分類器有線性判別分析(linear discriminant analysis, LDA)、人工神經(jīng)網(wǎng)絡(luò)(artificial neural network, ANN)、支持向量機(jī)(support vector machine, SVM)和最近鄰分類法(K-nearest neighbor, KNN)等算法。線性判別分析是經(jīng)典的線性分類方法,基本思路是將兩個(gè)類別的數(shù)據(jù)投影到一條直線上,使這兩個(gè)類別數(shù)據(jù)之間盡可能遠(yuǎn)離,且同類數(shù)據(jù)盡可能聚集在一起。Khairuddin等[65]采用LDA方法對(duì)提取的52種木材圖像特征進(jìn)行降維,解決了非線性結(jié)構(gòu)特征數(shù)據(jù)的木材樹種分類問題。人工神經(jīng)網(wǎng)絡(luò)通過模擬人的神經(jīng)網(wǎng)絡(luò)進(jìn)行信號(hào)的傳遞、處理和輸出,具有較好的魯棒性和容錯(cuò)性,在木材圖像分類中得到了廣泛應(yīng)用[66-67]。Ibrahim等[68]從30種木材的3000張圖像中提取出24個(gè)圖像特征,采用人工神經(jīng)網(wǎng)絡(luò)算法進(jìn)行分類,樹種識(shí)別成功率達(dá)到89%。支持向量機(jī)的基本思路是求解能夠正確劃分訓(xùn)練數(shù)據(jù)集且?guī)缀伍g隔最大的分離超平面,除了進(jìn)行線性分類之外,支持向量機(jī)還可以使用核函數(shù)有效地進(jìn)行非線性分類,將其輸入數(shù)據(jù)映射到高維特征空間中進(jìn)行分類。在木材圖像分類研究中,支持向量機(jī)算法獲得的分類結(jié)果普遍較好[26,50]。最近鄰分類法是從訓(xùn)練數(shù)據(jù)集中找到與輸入樣本最鄰近的K個(gè)樣本,這K個(gè)樣本的多數(shù)屬于某個(gè)類別,即把該輸入樣本分類到這個(gè)類別[69]。Chao等[70]采用最緊鄰分類法對(duì)LBP提取的特征進(jìn)行分類,顯著提高了分類效率以及識(shí)別成功率。研究表明,即使基于相同的特征參數(shù),不同分類器對(duì)木材樹種分類結(jié)果也存在差異[71]。以上分類器雖然取得了一定的樹種分類效果,但是也存在一些局限性。例如,線性判別分析容易導(dǎo)致欠擬合,分類精度易受到提取特征的影響;人工神經(jīng)網(wǎng)絡(luò)對(duì)初始網(wǎng)絡(luò)異常敏感,且需要消耗大量的算力;最近鄰分類法的K值需要人為設(shè)定,算法的復(fù)雜度較高。同時(shí),分類器的性能高度依賴于所提取的特征,但目前的分類器設(shè)計(jì)和特征提取是兩個(gè)獨(dú)立的過程,忽略了兩者之間的聯(lián)系,導(dǎo)致分類器的識(shí)別結(jié)果不穩(wěn)定[67]。
綜上所述,傳統(tǒng)木材樹種計(jì)算機(jī)視覺識(shí)別方法在以下三方面還存在不足:一是圖像多數(shù)不是來自經(jīng)正確定名的木材標(biāo)本,未建立專業(yè)可靠的木材構(gòu)造圖像數(shù)據(jù)集,且圖像采集多采用專業(yè)大型儀器,無法在木材樹種檢測(cè)現(xiàn)場(chǎng)使用;二是特征提取主要依靠人工設(shè)計(jì)特征來完成,提取的特征對(duì)未知樣本的識(shí)別結(jié)果不理想,模型的泛化能力較差;三是分類器設(shè)計(jì)與特征提取分離,分類器對(duì)數(shù)據(jù)比較敏感,導(dǎo)致分類器不穩(wěn)定、分類精度欠佳。因此,傳統(tǒng)的木材樹種計(jì)算機(jī)視覺識(shí)別技術(shù)尚未在木材識(shí)別領(lǐng)域得到應(yīng)用推廣。
近年來,深度學(xué)習(xí)逐漸成為機(jī)器學(xué)習(xí)領(lǐng)域最為熱門的研究方向,在圖像識(shí)別、語音識(shí)別、自然語言處理、醫(yī)療自動(dòng)診斷和無人駕駛等領(lǐng)域取得了突破性的進(jìn)展[72]。深度學(xué)習(xí)是一類主要使用深度神經(jīng)網(wǎng)絡(luò)為工具的機(jī)器學(xué)習(xí)算法,通過學(xué)習(xí)大量樣本數(shù)據(jù)(文字、圖像和聲音等)的內(nèi)在規(guī)律和表示層次,旨在使機(jī)器能夠像人一樣具有分析學(xué)習(xí)能力,可以識(shí)別文字、圖像和聲音等數(shù)據(jù)。深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域的快速應(yīng)用,為木材樹種識(shí)別提供了新的思路。深度學(xué)習(xí)方法通過構(gòu)建深度卷積神經(jīng)網(wǎng)絡(luò)(包括輸入層、卷積層、池化層和全連接層等),將特征提取和分類器整合到多層網(wǎng)絡(luò)結(jié)構(gòu)中,通過卷積層和池化層從木材構(gòu)造圖像中自主學(xué)習(xí)并提取特征,進(jìn)而采用全連接層對(duì)木材樹種進(jìn)行分類。與傳統(tǒng)的分類模型相比,卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練是“端對(duì)端”的映射過程,不需要精確的數(shù)學(xué)表達(dá)式即可表示輸入和輸出的關(guān)系,避免了因圖像預(yù)處理、分割、特征提取等操作帶來的誤差,從而突破了傳統(tǒng)計(jì)算機(jī)視覺方法人工提取特征的技術(shù)瓶頸[73]?;谏疃葘W(xué)習(xí)的木材樹種計(jì)算機(jī)視覺識(shí)別方法通過建立專業(yè)的圖像數(shù)據(jù)集,構(gòu)建深度學(xué)習(xí)模型并進(jìn)行訓(xùn)練測(cè)試,進(jìn)而基于圖像采集硬件以及算法軟件,構(gòu)建木材樹種識(shí)別系統(tǒng)(圖2),應(yīng)用于木材樹種現(xiàn)場(chǎng)快速檢測(cè)領(lǐng)域。
圖2 基于深度學(xué)習(xí)的木材計(jì)算機(jī)視覺識(shí)別技術(shù)流程Fig. 2 Process flow diagram of computer vision technology based on deep learning for wood identification
相比傳統(tǒng)的計(jì)算機(jī)視覺識(shí)別模型,深度學(xué)習(xí)模型需要輸入代表樣本多樣性的大量圖像對(duì)模型進(jìn)行訓(xùn)練,以避免模型出現(xiàn)“過擬合”,即模型對(duì)用于訓(xùn)練的樣本具有較好的識(shí)別能力,但對(duì)其他未知樣本的識(shí)別結(jié)果不理想。由于木材構(gòu)造圖像數(shù)據(jù)集的準(zhǔn)確性會(huì)直接影響樹種識(shí)別結(jié)果,用于圖像采集的樣本都應(yīng)該來自經(jīng)正確定名的木材標(biāo)本。全球約有180個(gè)木材標(biāo)本館,收藏木材標(biāo)本超過150萬份,大量的木材標(biāo)本為圖像數(shù)據(jù)集的建立奠定了物質(zhì)基礎(chǔ)[74]。在基于深度學(xué)習(xí)的木材樹種計(jì)算機(jī)視覺識(shí)別技術(shù)中,圖像采集一般采用專業(yè)便捷的圖像采集裝置[75-77]或者手機(jī)外置鏡頭[78-79],以適應(yīng)大樣本量的圖像采集任務(wù)以及木材樹種現(xiàn)場(chǎng)識(shí)別應(yīng)用場(chǎng)景。一方面,從大量的木材標(biāo)本上采集圖像,建立木材原始圖像數(shù)據(jù)集;另一方面,也可以采用圖像數(shù)據(jù)增強(qiáng)方法對(duì)原始圖像進(jìn)行旋轉(zhuǎn)、鏡像、平移和縮放等處理,以增大數(shù)據(jù)集的規(guī)模以及圖像數(shù)據(jù)的多樣性。
國內(nèi)外專家學(xué)者已針對(duì)不同樹種建立了木材圖像數(shù)據(jù)集。例如:Tang等[78]構(gòu)建了41個(gè)巴西樹種包含2 942張木材構(gòu)造圖像的數(shù)據(jù)集;Ravindran等[11]基于美國農(nóng)業(yè)部林產(chǎn)品實(shí)驗(yàn)室木材標(biāo)本構(gòu)建了楝科10種木材包含2 303張圖像的數(shù)據(jù)集;He等[12]從全球4個(gè)木材標(biāo)本館采集了黃檀屬和紫檀屬共26種木材包含10 237張圖像的數(shù)據(jù)集。這些圖像數(shù)據(jù)集都是通過專業(yè)裝置從木材標(biāo)本上采集的木材橫切面構(gòu)造圖像,圖像分辨率高、噪聲小、一致性好,為深度學(xué)習(xí)模型構(gòu)建和訓(xùn)練奠定了高質(zhì)量的數(shù)據(jù)基礎(chǔ)。在圖像采集時(shí),為了盡量獲取木材的種內(nèi)變異特征,每種木材應(yīng)選取盡可能多的木材標(biāo)本進(jìn)行圖像采集,并且圖像采集區(qū)域應(yīng)覆蓋整個(gè)橫切面。在模型訓(xùn)練前,通常先將圖像數(shù)據(jù)集劃分為訓(xùn)練集和測(cè)試集,訓(xùn)練集圖像用于對(duì)模型進(jìn)行訓(xùn)練,測(cè)試集圖像用于測(cè)試模型的精度。訓(xùn)練集和測(cè)試集一般采用80%/20%、70%/30%或60%/40%比例隨機(jī)進(jìn)行劃分,或采用n倍交叉驗(yàn)證的方法進(jìn)行劃分,用于訓(xùn)練的圖像通常不會(huì)被劃分入測(cè)試集。
深度學(xué)習(xí)是一種“端對(duì)端”的算法模型,圖像輸入到模型中,通過卷積神經(jīng)網(wǎng)絡(luò)對(duì)大量的圖像數(shù)據(jù)進(jìn)行訓(xùn)練學(xué)習(xí)、自動(dòng)化提取特征和分類樣本,進(jìn)而輸出分類結(jié)果。卷積神經(jīng)網(wǎng)絡(luò)一般由輸入層、卷積層、池化層和全連接層構(gòu)成,淺層網(wǎng)絡(luò)主要提取圖像的邊緣特征,而深層網(wǎng)絡(luò)可以學(xué)習(xí)到深度表示層次的圖像特征[11]?;谏疃葘W(xué)習(xí)的計(jì)算機(jī)視覺識(shí)別技術(shù),本質(zhì)上是將傳統(tǒng)計(jì)算機(jī)視覺識(shí)別中的特征提取和分類器融合到深層卷積神經(jīng)網(wǎng)絡(luò)中。其中,卷積層和池化層起到了特征提取的作用,全連接層相當(dāng)于分類器。卷積神經(jīng)網(wǎng)絡(luò)中比較常見的網(wǎng)絡(luò)結(jié)構(gòu)一般包括AlexNet、GoogleNet、VGG16和ResNet等。
在基于深度學(xué)習(xí)的木材計(jì)算機(jī)視覺識(shí)別中,研究人員分別基于VGG16、AlexNet、 Inception v4和ResNet 等網(wǎng)絡(luò)結(jié)構(gòu)建立了深度學(xué)習(xí)的模型[11-12,75-79]。深度學(xué)習(xí)模型需要大量的圖像數(shù)據(jù)對(duì)模型訓(xùn)練,才能保障模型具有較好的識(shí)別能力。目前雖然已經(jīng)建立了不同的木材構(gòu)造圖像數(shù)據(jù)集,但相比物體檢測(cè)等領(lǐng)域的圖像數(shù)據(jù)集而言,數(shù)據(jù)集的樣本量還相對(duì)較少,容易導(dǎo)致模型產(chǎn)生“過擬合”。 同時(shí),木材構(gòu)造圖像是一種細(xì)粒度圖像,具有種內(nèi)變異大、種間差異小的特點(diǎn),相比普通的圖像分類任務(wù),木材構(gòu)造圖像分類難度更大。因此,在深度學(xué)習(xí)模型進(jìn)行訓(xùn)練時(shí),通常先采用遷移學(xué)習(xí)(transfer learning)方法在谷歌ImageNet大規(guī)模數(shù)據(jù)集上對(duì)模型進(jìn)行預(yù)訓(xùn)練,再對(duì)模型的網(wǎng)絡(luò)參數(shù)進(jìn)行微調(diào)(fine tuning),進(jìn)而用于木材構(gòu)造圖像分類任務(wù)中。在模型訓(xùn)練過程中,卷積層通過一系列卷積核從圖像中提取特征,池化層可以降低卷積層輸出的維數(shù),以減少模型參數(shù)量和計(jì)算量。同時(shí),通過設(shè)置初始值學(xué)習(xí)率、動(dòng)量等參數(shù),采用隨機(jī)梯度下降方法對(duì)模型訓(xùn)練進(jìn)行加速,使模型快速收斂并找到全局最優(yōu)。
為了進(jìn)一步防止模型出現(xiàn)“過擬合”,采用Dropout函數(shù)隨機(jī)刪除部分特征來提高模型的泛化能力,或者采用批量歸一化(batch normalization)正則化方法加速深度卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練[65]。模型測(cè)試和評(píng)價(jià)采用測(cè)試集圖像進(jìn)行,一般在科、屬、種不同分類水平或者在圖像塊(patch)、原始圖像等不同圖像尺度水平上對(duì)模型的識(shí)別精度進(jìn)行測(cè)試,并結(jié)合混淆矩陣和誤判結(jié)果對(duì)模型的表現(xiàn)進(jìn)行綜合分析和評(píng)價(jià)[11-12]。但是,目前針對(duì)模型精度的測(cè)試處于實(shí)驗(yàn)室階段,還未使用貿(mào)易流通中的木材樣本對(duì)模型進(jìn)行測(cè)試,以評(píng)價(jià)模型在實(shí)際應(yīng)用中對(duì)于未知樣本的識(shí)別能力。
深度學(xué)習(xí)模型雖然可以自動(dòng)提取木材圖像識(shí)別特征并進(jìn)行快速分類,但深度學(xué)習(xí)模型是一個(gè)“黑盒子”模型,即圖像輸入到模型后,模型輸出分類結(jié)果,模型提取的分類特征是不可見的。然而,對(duì)于木材樹種分類而言,不同樹種之間存在的精細(xì)構(gòu)造特征差異,是木材樹種進(jìn)行分類的科學(xué)基礎(chǔ)[12]。因此,對(duì)深度學(xué)習(xí)模型自動(dòng)提取的特征進(jìn)行可視化分析,通過圖像特征可視化挖掘木材樹種之間存在的精細(xì)構(gòu)造特征差異,對(duì)于木材分類研究具有重要的科學(xué)意義。
基于深度學(xué)習(xí)的木材計(jì)算機(jī)視覺識(shí)別技術(shù),由于其識(shí)別準(zhǔn)確率高、速度快,在木材樹種現(xiàn)場(chǎng)識(shí)別領(lǐng)域具有潛在的應(yīng)用價(jià)值。開發(fā)基于深度學(xué)習(xí)的木材樹種計(jì)算機(jī)視覺識(shí)別系統(tǒng)并實(shí)現(xiàn)應(yīng)用,需要硬件和軟件的相互配合。目前國內(nèi)外研究多數(shù)采用專業(yè)圖像采集裝置或者手機(jī)外置鏡頭在實(shí)驗(yàn)室場(chǎng)景下采集圖像,構(gòu)建深度學(xué)習(xí)模型進(jìn)行訓(xùn)練和測(cè)試,針對(duì)解決木材現(xiàn)場(chǎng)識(shí)別技術(shù)難題而專門開發(fā)圖像采集硬件和軟件的機(jī)構(gòu)有美國農(nóng)業(yè)部林產(chǎn)品實(shí)驗(yàn)室、馬來西亞拉曼大學(xué)和中國林業(yè)科學(xué)研究院木材工業(yè)研究所。
美國農(nóng)業(yè)部林產(chǎn)品實(shí)驗(yàn)室開發(fā)了XyloTron木材構(gòu)造圖像采集裝置[75],重點(diǎn)采集了南美洲、非洲和拉丁美洲等地區(qū)熱帶樹種木材橫切面構(gòu)造圖像,建立了包含約130 000張圖像的數(shù)據(jù)集,分別針對(duì)楝科10種相似木材、加納地區(qū)15種熱帶木材建立了深度學(xué)習(xí)模型,識(shí)別精度分別為97.5%和97%[11, 76]。Ravindran 等[77]將基于深度學(xué)習(xí)的木材樹種計(jì)算機(jī)視覺識(shí)別方法與化學(xué)識(shí)別方法(DART)進(jìn)行比較,結(jié)果表明,前者獲得了更高的識(shí)別精度和識(shí)別效率,在木材樹種現(xiàn)場(chǎng)識(shí)別領(lǐng)域具有應(yīng)用潛力。
馬來西亞拉曼大學(xué)采用手機(jī)外置放大鏡頭采集了100種馬來西亞產(chǎn)地木材的101 546張圖像,利用輕量級(jí)網(wǎng)絡(luò)SqeezeNet構(gòu)建了深度學(xué)習(xí)模型,并開發(fā)了MyWood-ID木材圖像識(shí)別系統(tǒng),可以實(shí)現(xiàn)馬來西亞100種常見貿(mào)易木材的快速識(shí)別,平均識(shí)別精度為77.52%[78]。
中國林業(yè)科學(xué)研究院木材工業(yè)研究所在國內(nèi)率先開展了基于深度學(xué)習(xí)的木材樹種計(jì)算機(jī)視覺識(shí)別技術(shù)研究,研發(fā)了木材構(gòu)造圖像專業(yè)采集裝置iWood,并基于中國林業(yè)科學(xué)研究院木材標(biāo)本館,建立了包含黃檀屬、紫檀屬、古夷蘇木屬、桃花心木屬、洋椿屬等64種常見貿(mào)易瀕危珍貴木材構(gòu)造圖像數(shù)據(jù)庫,構(gòu)建了15種黃檀屬和11種紫檀屬木材構(gòu)造圖像深度學(xué)習(xí)模型,識(shí)別精度高達(dá)99.34%[12]。同時(shí),該所首次實(shí)現(xiàn)了深度學(xué)習(xí)模型自動(dòng)提取的木材構(gòu)造圖像特征可視化,揭示了所提取的黃檀屬和紫檀屬木材構(gòu)造關(guān)鍵識(shí)別特征分別為管孔和軸向薄壁組織,開發(fā)了基于深度學(xué)習(xí)的木材樹種計(jì)算機(jī)視覺識(shí)別系統(tǒng)iWood[80],初步實(shí)現(xiàn)了瀕危珍貴木材在實(shí)驗(yàn)室、海關(guān)和貿(mào)易市場(chǎng)等不同場(chǎng)景下的自動(dòng)精準(zhǔn)識(shí)別(圖3)。
圖3 應(yīng)用iWood木材識(shí)別系統(tǒng)進(jìn)行木材識(shí)別Fig. 3 Wood identification application using iWood system
傳統(tǒng)的木材樹種計(jì)算機(jī)視覺識(shí)別技術(shù)經(jīng)過多年的發(fā)展,雖然在特征提取和分類器方法開展了大量研究,但由于缺乏專業(yè)便捷的圖像采集裝置以及科學(xué)可靠的木材構(gòu)造圖像數(shù)據(jù)庫,未能在木材識(shí)別領(lǐng)域得到廣泛應(yīng)用。相比而言,基于深度學(xué)習(xí)的木材樹種計(jì)算機(jī)視覺識(shí)別技術(shù),通過專業(yè)圖像采集裝置或者手機(jī)外置鏡頭等從木材標(biāo)本上采集了大量圖像,建立了高質(zhì)量木材構(gòu)造圖像數(shù)據(jù)集。同時(shí),利用深度卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)了木材圖像特征的自動(dòng)提取與精準(zhǔn)分類,具有識(shí)別準(zhǔn)確率高、速度快、成本低和便攜性好等優(yōu)點(diǎn),可以在海關(guān)檢驗(yàn)、質(zhì)量監(jiān)督和木材貿(mào)易等領(lǐng)域得到廣泛應(yīng)用,為提升國際履約水平、保護(hù)森林樹種多樣性和加強(qiáng)木材產(chǎn)業(yè)鏈監(jiān)管提供技術(shù)支撐。為了進(jìn)一步推動(dòng)基于深度學(xué)習(xí)的木材樹種計(jì)算機(jī)視覺識(shí)別技術(shù)的發(fā)展和應(yīng)用,建議未來在以下幾個(gè)方面開展工作:
1)借助木材標(biāo)本國家創(chuàng)新聯(lián)盟等專業(yè)平臺(tái),開展木材標(biāo)本數(shù)字化工作,采用專業(yè)化、標(biāo)準(zhǔn)化圖像采集硬件和軟件采集木材構(gòu)造圖像,建立起準(zhǔn)確可靠的木材構(gòu)造圖像數(shù)據(jù)庫,為基于深度學(xué)習(xí)的木材樹種計(jì)算機(jī)視覺識(shí)別技術(shù)發(fā)展和應(yīng)用奠定堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ);
2)比較分析不同卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)及其參數(shù)對(duì)模型精度的影響機(jī)制,確立適用于木材構(gòu)造圖像的最優(yōu)深度學(xué)習(xí)參數(shù)體系,實(shí)現(xiàn)木材樹種計(jì)算機(jī)視覺識(shí)別技術(shù)的標(biāo)準(zhǔn)化;
3)基于木材構(gòu)造圖像數(shù)據(jù)庫和深度學(xué)習(xí)模型參數(shù)體系,建立基于深度學(xué)習(xí)的木材樹種計(jì)算機(jī)視覺自動(dòng)精準(zhǔn)識(shí)別系統(tǒng),并在實(shí)驗(yàn)室、貿(mào)易市場(chǎng)和海關(guān)口岸等不同場(chǎng)景進(jìn)行測(cè)試,根據(jù)測(cè)試結(jié)果對(duì)模型不斷進(jìn)行優(yōu)化,提高模型的精度和泛化能力;
4)開展計(jì)算機(jī)視覺的識(shí)別特征可視化研究,解譯木材識(shí)別構(gòu)造特征中無法通過人類視覺發(fā)現(xiàn)的精細(xì)構(gòu)造特征,進(jìn)一步揭示木材精細(xì)構(gòu)造特征在種間水平的變異規(guī)律,為木材分類理論提供科學(xué)依據(jù);
5)開展計(jì)算機(jī)視覺信息與遺傳信息、化學(xué)信息等多源數(shù)據(jù)深度挖掘研究,建立多源數(shù)據(jù)分類特征庫;借助大數(shù)據(jù)和人工智能,實(shí)現(xiàn)木材多源數(shù)據(jù)分類特征的深度融合,形成基于精細(xì)構(gòu)造圖像、DNA條形碼和特征化合物等多特征融合的木材精準(zhǔn)識(shí)別技術(shù)體系。
致謝:感謝國家林業(yè)和草原局野生動(dòng)植物保護(hù)司(中華人民共和國瀕危物種進(jìn)出口管理辦公室)對(duì)本項(xiàng)目的資助;同時(shí),感謝中國林業(yè)科學(xué)研究院木材工業(yè)研究所姜笑梅研究員、美國農(nóng)業(yè)部林產(chǎn)品實(shí)驗(yàn)室Alex C. Wiedenhoeft博士對(duì)本論文提供的幫助和建議。