王子軒,湯 健 ,夏 恒,張曉曉,荊中嶺,韓紅桂
(1.北京工業(yè)大學信息學部 北京 100024;2.智慧環(huán)保北京實驗室 北京 100124;3.北京抱撲再生環(huán)保科技有限公司 北京 100124)
隨著科技的發(fā)展和5G的迅速普及,智能手機的更迭速度不斷加快.據(jù)Strategy Analytics預測,2021年全球智能手機的出貨量將同比反彈6.5%,總量達13.8億部[1].人們更換手機速度的加快是導致其出貨量不斷提高的主要原因,這也導致個人閑置手機的累計量逐年增多.因此,國內外市場對手機回收產(chǎn)業(yè)的回收效率提出更高要求.廢舊手機(used moble phone,UMP)作為一種典型的城市再生資源,利用無人化、智能化的回收裝備對其進行回收,能夠節(jié)省大量人工成本.其中:智能化UMP識別方法是完成上述任務的關鍵.
本文將UMP回收裝備的實拍圖片作為建模數(shù)據(jù)集,旨在解決應用于回收裝備的UMP識別算法可信度低的問題.以現(xiàn)階段內置圖像識別方法的UMP回收裝備為例,回收過程如下:首先,用戶根據(jù)操作指示將UMP放入回收裝備;接著,通過內部攝像頭采集手機背部圖像;然后,通過智能算法模塊對待回收UMP的品牌等特征信息進行識別;最后,根據(jù)識別結果提示用戶登記相關信息,進而完成回收.
針對UMP識別的研究,現(xiàn)階段僅有BP神經(jīng)網(wǎng)絡、卷積神經(jīng)網(wǎng)絡(convolutional neural network,CNN)模型應用于回收裝備[2],但上述模型的識別精度無法達到回收需求,在回收裝備中僅作為識別參考項,后續(xù)還需工作人員進行分類,無法有效節(jié)省人工成本.因此,建立面向回收裝備的高精度、強魯棒性的UMP識別模型以提高其智能化程度是亟待解決的實際問題.
基于上述研究背景,文獻[3]提出“面向智能回收裝備的廢舊手機深度森林識別模型”,文獻[4]采用差分進化算法對其參數(shù)進行優(yōu)化,旨在通過智能化識別算法提高回收效率并降低人工成本,但并未對UMP實拍圖像進行定位裁剪等預處理,還存在模型識別率低和參數(shù)優(yōu)化耗時長等待解決問題.
基于回收裝備的UMP實拍圖像的定位裁剪能夠減少無關背景對識別精度的影響,還可降低圖像像素和降低模型復雜度.手機定位裁剪問題與“車牌檢測”、“紅外行人檢測”等問題類似.對于上述問題,文獻[5]使用YOLOv3算法檢測紅外圖像中的行人;文獻[6]使用SLPNet對道路中車牌進行定位檢測;文獻[7]將Faster-RCNN算法用于超新星的自動檢測.上述研究均在包含大量無關背景的圖像中使用圖像檢測算法獲取相關內容,與本文需求一致.因此,在UMP識別之初,有必要使用圖像檢測算法對UMP回收裝備拍攝圖像的相關區(qū)域進行定位裁剪,以減少無關背景的影響.
深度森林(deep forest,DF)模型與深度神經(jīng)網(wǎng)絡模型(deep neural network,DNN)相比,具有超參數(shù)少、模型深度自適應等特點,其已被證實在小樣本分類問題中具有良好的性能表現(xiàn)[8-9].但是,DF的滑動窗格參數(shù)決定了模型性能[10],窗格太小會導致目標過于分散,窗格太大會包含更多無用的背景信息.在數(shù)據(jù)量較少的UMP識別問題中,DF模型的計算依賴于顯存配置,窗格過小也會生成過多的特征,進而產(chǎn)生“休斯效應”;窗格過大則會占用過多計算資源,導致模型極易崩潰.文獻[11-12]將含有滑動窗的特征預處理部分更換為卷積特征,使模型能夠獲取抽象特征,但該種方法所獲取特征的可解釋性差,難以針對實際問題對預處理部分進行改進.因此,需面向UMP識別問題對DF模型進行改進,提高模型處理圖像像素能力的同時,生成適合手機識別問題的特征.
差分進化算法(differential evolution,DE)因具有結構簡單、收斂速度快、魯棒性強等優(yōu)點,被廣泛用于解決連續(xù)變量的全局優(yōu)化問題[13-15].因此,在前文研究中將其作為DF超參數(shù)的優(yōu)化方法,但DE優(yōu)化時間隨模型復雜度的增加而增加,且算法效果依賴于最大迭代次數(shù)的設定,錯誤的設定會使進化時間進一步增加.原始DE算法固有的運算成本導致其無法在短暫時間內完成DF模型的超參數(shù)更新.因此,需對DE結構進行改進,提高其進化效率.
綜上,本文在實際需求驅動下對相關算法進行改進,提出一種用于真實場景下UMP識別的并行差分進化(parallel differential evolution,PDE)-梯度特征深度森林(gradient feature deep forest,GfDF)識別模型,通過實驗驗證所提方法在識別精度和訓練時間方面的有效性.
在UMP回收裝備工作中,易出現(xiàn)擺放位置偏差和手機背部反光等問題,這使得手機圖像質量不高(如圖1所示),存在鏡像、模糊、手機倒置等問題.
圖1 回收裝備內部UMP實拍圖Fig.1 UMP image taken by recycling equipment
由于UMP回收裝備實拍圖片數(shù)量較少且質量不高,常用模型需要大量標記樣本進行訓練,深度學習算法難以有效應用.因此對小樣本手機識別方法進行研究至關重要.
為解決回收裝備中UMP識別問題,可選方案有2種.
1)構建CNN網(wǎng)絡:使用回收裝備實拍圖像或其他手機數(shù)據(jù)集構建UMP識別模型.但基于回收裝備的手機圖像數(shù)量稀少且與其他手機數(shù)據(jù)集差異性較大,這導致CNN識別精度較低,無法達到工業(yè)應用需求.
2)多模型串聯(lián)的模塊化結構:首先,利用目標檢測模塊在整張圖中定位UMP位置;然后,針對UMP位置圖像構建小樣本識別模型.該種結構目標檢測模型消除UMP圖像中背景部分的影響,基于小樣本圖像的識別模型能夠有效緩解UMP圖像數(shù)據(jù)少的問題.
本文采取第2種模塊化結構構建基于梯度特征深度森林的廢舊手機識別方法.本文所提方法將UMP識別過程分為UMP定位裁剪、梯度特征深度森林(Gf-DF)識別兩部分.首先,對回收裝備拍攝的照片進行UMP定位和裁剪處理;接著,對裁剪后圖像進行數(shù)據(jù)增強,以數(shù)據(jù)增強后的圖像為數(shù)據(jù)集構建GfDF模型.本文所提UMP識別模型的整體結構如圖2所示.
圖2 廢舊手機識別模型結構圖Fig.2 The structure of the UMP regression model
UMP定位剪裁模塊用于解決因擺放位置差異引起的圖像不完整問題.考慮到該模塊用于去除無關背景影響,同時TensorFlow框架中已集成基于ImageNet數(shù)據(jù)集的Faster-RCNN算法模型,從降低模型復雜度,降低訓練成本角度,本文定位算法采用Faster-RCNN目標檢測算法,其結構如圖3所示.
Faster-RCNN算法是基于候選區(qū)域的目標檢測算法,由主干網(wǎng)絡特征提取、候選區(qū)域生成、框架精修分類3部分組成,如圖3所示.該算法使用區(qū)域生成網(wǎng)絡(region proposal network,RPN)替代RCNN族網(wǎng)絡中的選擇性搜索與候選框生成模塊,其具有高準確率且檢測時間與直接目標檢測算法相近等優(yōu)勢[16].本文所提基于Faster-RCNN算法的UMP定位裁剪模塊實現(xiàn)過程如下:
1)VGG16圖像特征提取.基于CNN的圖像特征提取質量決定了目標檢測精度.不同深度CNN提取的特征存在差異性,目前已有ResNet18,VGG16,Res-Net50等CNN模型用于Faster-RCNN圖像特征提取部分.已有研究表明采用VGG16作為Faster-RCNN主干網(wǎng)絡,模型復雜度較低且提取效果較佳[17-18].
本文基于UMP實拍圖像,采用不同主干網(wǎng)絡進行“手機”目標檢測并以IoU函數(shù)作為評價指標,如下所示:
其中:Y表示標注“手機”范圍,S表示檢測“手機”范圍.
IoU評價結果如表1所示,可見ResNet50和VGG16的IoU指標均可達90%以上,且二者差距不明顯.這表明在50層ResNet網(wǎng)絡較深層的網(wǎng)絡的作用并不顯著,因此從降低模型復雜度角度考慮,本文采用VGG16作為主干網(wǎng)絡,以提高運行效率.
表1 不同主干網(wǎng)絡檢測結果Table 1 Results on different backbone networks
2)RPN生成候選框.首先,RPN網(wǎng)絡根據(jù)VGG16卷積結果確定錨點(即候選框中心點);接著,根據(jù)錨點位置生成不同大小候選窗;然后,根據(jù)softmax函數(shù)確定各候選窗內前景和背景信息(如圖3中RPN網(wǎng)絡上側所示);同時,RPN網(wǎng)絡通過邊框回歸得到錨點偏移量,用于獲取更精確邊框(如圖3中RPN網(wǎng)絡下側所示);最后,綜合所有候選窗前景、背景信息和錨點偏移量獲取最終候選框并將其送入下一部分.
圖3 Faster-RCNN結構圖Fig.3 Structure of Faster-RCNN
3)候選框分類與圖像裁剪.得到候選框后,通過全連接層和softmax函數(shù)對候選框內部物體進行分類,若邊框內物體是手機的概率最大,則記錄邊框坐標;同時再次通過邊框回歸對“手機邊框”進行精修,獲得最終“手機邊框”坐標;最后剪裁手機圖片,將“手機邊框”內圖像傳入識別模型中.
原始DF模型由多粒度掃描和級聯(lián)森林兩部分構成,其中:多粒度掃描模塊用于特征提取,級聯(lián)森林模塊根據(jù)上一模塊所提取特征進行識別.多粒度掃描采用滑動窗劃分子特征和隨機森林子特征提取相結合的方式對二維圖像特征進行降維,該方式在增加子特征間聯(lián)系的同時也加劇了計算資源的消耗,應用于像素較多的UMP圖像數(shù)據(jù)時極易出現(xiàn)內存溢出問題.因此,針對上述問題對DF模型的特征提取部分進行改進.
根據(jù)先驗知識,UMP識別主要依靠輪廓、攝像頭位置、字符logo等紋理特征.HOG特征是計算機視覺和圖像處理領域常用的描述圖像局部紋理的特征,多用于目標識別領域[19].該特征提取僅涉及求導操作,在較復雜圖片特征提取問題上占用計算資源小,速度遠優(yōu)于DF模型的多粒度掃描模塊.此外,HOG特征獲取過程也具有滑動窗思想.該方法通過改變胞元大小提取不同尺度紋理特征.基于上述優(yōu)點,本文作者使用不同尺度組合的梯度特征(histogram of oriented gradient,HOG)提取模塊代替多粒度掃描模塊,實現(xiàn)針對廢舊手機識別問題的DF算法改進.本文所述GfDF手機識別模型如圖5所示,流程如下所示:
1)數(shù)據(jù)增強.回收裝備拍攝的UMP圖像因拍攝環(huán)境、手機擺放位置等差異而存在不同.圖像傾斜程度尤其影響HOG特征提取結果,因此在訓練模型前需對實驗數(shù)據(jù)進行增強,以提高模型魯棒性.本文方法中數(shù)據(jù)增強包括高斯噪聲、椒鹽噪聲、圖像翻轉、圖像旋轉共4種,數(shù)據(jù)增強后的圖像作為訓練集輸入后續(xù)識別模型.
2)多尺度HOG特征提取.
a)UMP灰度圖像橫縱坐標梯度提取.HOG特征注重圖像輪廓紋理等特征,弱化光照對圖像分類的影響,因此在特征提取前需對圖像進行二值化,用于獲得UMP灰度圖像.設灰度圖像中某像素點坐標(x,y),其水平方向梯度幅值gx和垂直方向梯度幅值gy如式(2)所示
其中f(x,y)為(x,y)的像素亮度值.
由此,像素坐標(x,y)方向梯度幅值m(x,y)和梯度方向θ(x,y)如式(3)-(4)所示:
b)胞元梯度特征統(tǒng)計,獲取每個像素點的梯度值后,將若干相鄰像素點組合成胞元特征,根據(jù)設定方向梯度的數(shù)量計算胞元內像素梯度直方圖.例如,將方向梯度θ設置為4,則[0°,90°,180°,360°]作為梯度直方圖統(tǒng)計對象,根據(jù)θ(x,y)將m(x,y)在統(tǒng)計對象上的投影值計入梯度直方圖.進而,將胞元特征表示為梯度直方圖矢量CellHOG.
文獻[20]表明,當存在空間或序列的特征關系時,多粒度掃描有利于提高模型性能.滑動窗思想使特征能夠表征圖像像素位置信息,選取不同尺度滑動窗則能夠表征不同視野下像素間的位置信息.文獻[21]表明,多尺度特征融合能獲取更多圖像特征.基于上述思想,作者將HOG特征胞元特征作為放縮因子,選取不同胞元大小的HOG特征作為級聯(lián)森林模型的輸入特征,以實現(xiàn)特征增強.不同尺度HOG特征的線性組合如下所示:
3)級聯(lián)森林識別.GfDF模型仍采用原始DF模型中的級聯(lián)森林部分.首先,將多尺度HOG特征提取結果XHOG作為輸入,利用隨機森林(random forest,RF)和完全隨機森林(complete random forest,CRF)并列構建識別子模型;接著,將識別子模型的結果和XHOG級聯(lián)形成后構建新的識別子模型,若識別精度有所提高則重復上述步驟實現(xiàn)模型深度的自適應;否則,基于平均加權策略得到識別模型.此外,上述子模型的識別精度均采用交叉驗證方式獲得.
圖4 GfDF識別模型結構Fig.4 Structure of GfDF recognition model proposed
深度模型參數(shù)是影響模型性能的重要因素.與DNN相比,DF及本文所提GfDF分類模型超參數(shù)數(shù)量遠少于DNN模型,且GfDF模型參數(shù)多數(shù)為決策樹參數(shù),無法通過迭代獲得最優(yōu)值.已有研究表明,參數(shù)尋優(yōu)算法能對多個參數(shù)同時尋優(yōu)以提高識別模型精度[22].因此,本文擬采用差分進化算法(DE)對GfDF模型參數(shù)進行調整.
DE廣泛應用于求解多維空間中的整體最優(yōu)解,但模型中的參數(shù)尋優(yōu)需要對大量目標函數(shù)進行評估.經(jīng)典DE算法的典型運行時間為數(shù)小時至數(shù)天[23].為改善DE進化耗時長問題,作者提出一種并行DE算法(parallel DE,PDE),其利用多種群并行和縮小子種群規(guī)模的方式縮減進化時間,同時以約束迭代中子種群進化方向的方式進一步提高進化效率.該算法可分為尋優(yōu)參數(shù)編碼、參數(shù)初始化、種群劃分、并行進化共4部分.
1)尋優(yōu)參數(shù)編碼.首先,PDE算法對需要優(yōu)化的參數(shù)進行編碼,將實際問題轉換到進化空間.GfDF識別模型中的HOG特征尺度表示在候選HOG特征組合中選取特征的尺度和數(shù)量,該參數(shù)直接影響后續(xù)模型的輸入特征維度;因此,將作為優(yōu)化參數(shù)之一.由第1.3小節(jié)可知,級聯(lián)森林模型由不同類型的隨機森林構成,本文選取隨機森林中決策樹數(shù)量J、決策樹最大特征數(shù)Mj作為優(yōu)化參數(shù)進行編碼.
2)參數(shù)初始化.本文所提PDE算法包括種群NP規(guī)模fsize(NP)、子種群數(shù)量A、子種群放縮因子F、子種群交叉概率CR共4個超參數(shù),其中:fsize(NP)和A作用于種群劃分,影響算法的進化時間和收斂速度;F和CR作用于并行進化過程中的每個子種群,影響子種群收斂的速度.
3)種群劃分.算法根據(jù)子種群數(shù)量A隨機劃分,其過程可表示為
其中fsize(·)代表種群NP的規(guī)模.
4)并行進化.其分為子種群獨立進化和PDE整體進化兩部分.其中:子種群在設定迭代次數(shù)內獨立完成進化過程;整體進化環(huán)節(jié)需匯總各子種群的局部最優(yōu)解,進而形成局部最優(yōu)解集,根據(jù)相似度度量結果判斷是否需要繼續(xù)進化.
a)子種群獨立進化.
進化過程之初,子種群會對當前子種群中的染色體進行解碼和適應度評估.GfDF識別模型的適應度評估值決定了當前子種群是否需要在設定迭代次數(shù)內繼續(xù)進化.以第α個子種群的第0代sub_NPα(0)為例代表第m條染色體.
子種群的進化策略與標準DE策略一致,分為“變異”、“交叉”和“選擇”3個部分.
變異:PDE算法選用收斂性較強的DE/current-tobest/1策略完成子種群變異
交叉:子種群個體的交叉重組與染色體中待優(yōu)化變量密切相關.第t+1代第m條候選染色體如下:
其中randk是在[0,1]生成的隨機浮點數(shù),當設定的交叉概率CR小于randk時,執(zhí)行交叉重組操作.
每個子種群進化達到設定迭代次數(shù)或滿足適應度評估值后,得到局部最優(yōu)解,如下:
b)PDE整體進化.
完成一次并行進化后,匯總各子種群局部最優(yōu)解得到局部最優(yōu)解集合,如下:
PDE整體進化過程中,根據(jù)歐氏距離度量局部最優(yōu)解集合中各元素的相似性,其中任意的兩個元素,如其相似度Dα,β的計算如公下:
為驗證所提方法的有效性,在UMP實拍數(shù)據(jù)集上進行驗證性和對比性實驗.
本文所述UMP識別模型基于python3.7及Tensor-Flow-GPU-2.3.0框架構建.其訓練和測試硬件環(huán)境如表2所示.
表2 硬件配置Table 2 Hardware con figuration
廢舊手機回收裝備的應用場景如圖5所示,本文實驗數(shù)據(jù)源于該裝備的實拍圖片.數(shù)據(jù)集共123張圖像,包含8個類別的手機品牌,分別是華為(HUAWEI)、榮耀(Honor)、小米(Mi)、中興(ZTE)、OPPO、VIVO、蘋果(Apple)、其他品牌(Others).
圖5 廢舊手機回收裝備應用場景Fig.5 Application scenarios of UMP equipment
數(shù)據(jù)集劃分方面,由于所用DF模型具有交叉驗證步驟,因此僅將數(shù)據(jù)按8:2劃分為訓練集和測試集.由于實驗數(shù)據(jù)較少,采用數(shù)據(jù)增強手段對訓練集和測試集樣本進行擴充.將定位剪裁預處理后將處理后的UMP圖像進行旋轉、翻折、加噪聲等數(shù)據(jù)增強操作,處理后的數(shù)據(jù)集共1476個樣本.考慮到非90°的旋轉操作再對圖片進行放縮會導致手機圖片失真.針對90°整倍數(shù)旋轉,會產(chǎn)生旋轉90°和旋轉180°兩種情況,對應的圖片會變?yōu)?70×480,480×270大小,針對上述現(xiàn)象,本文借鑒空間金字塔池化(spatial pyramid pooling,SPP)方式,通過設定HOG特征中block參數(shù)將不同block的HOG特征進行線性拼接,使最終特征向量長度一致.樣本擴充如圖6所示.
圖6 數(shù)據(jù)增強示意圖Fig.6 Effection of data enhancement
由前文描述可知,原始數(shù)據(jù)集中存在大量異常樣本(約60%),為解決數(shù)據(jù)集出現(xiàn)的圖像不完整、鏡像、傾斜等問題,本文采用Faster-RCNN算法對原始UMP圖像進行“手機定位”,得到僅包含UMP特征的圖片,實現(xiàn)背景和噪聲干擾的消除.
本文所用回收裝備實拍UMP圖像數(shù)據(jù)較少,對異常圖像進行人工標定并訓練模型的方式難以實現(xiàn),因此基于遷移學習思想采用TensorFlow_hub模塊中固化的由ImageNet數(shù)據(jù)訓練完成的Faster-RCNN模型實現(xiàn)“手機定位”.
原始數(shù)據(jù)集像素為640×480,長寬比為4:3,而當前市場常見手機比例為16:9.因此,在確定手機定位坐標后,將剪裁圖像統(tǒng)一設定為480×270像素,并盡可能保證定位后手機圖像的長寬比.
首先驗證多尺度HOG特征在梯度特征DF模型中的有效性;接著,以定位剪裁后的UMP圖像作為數(shù)據(jù)集,將多尺度梯度特征DF模型與同規(guī)?;瑒哟癉F模型進行對比,以說明DF改進算法在識別精度和訓練時間方面的優(yōu)越性;最后,在數(shù)據(jù)量較少的基準圖像數(shù)據(jù)集中進行驗證,進一步說明本文所提DF改進算法在小樣本圖像分類問題中的有效性.
1)多尺度HOG特征有效性驗證.不同胞元HOG特征可視化結果如圖7所示,其中:左圖為裁剪后UMP圖像,右圖為塊尺度[2,2],胞元特征分別為[36,36],[25,25],[4,4]的HOG特征可視化結果.以剪裁、數(shù)據(jù)增強后的UMP數(shù)據(jù)作為數(shù)據(jù)集,不同尺度HOG特征的對比實驗結果如表3所示.顯然,胞元特征較小的特征圖可獲取更多紋理細節(jié)特征,但由于UMP圖像數(shù)據(jù)量較少,模型不能通過小樣本學習得到所有特征.隨后,本文采用線性搜索方式獲取效果顯著胞元特征,結果如圖7所示.
圖7 HOG特征可視化Fig.7 HOG feature visualization
表3 不同尺度HOG特征對比實驗結果Table 3 Comparison of results of HOG features at different scales
由圖8可知,隨著胞元的增大,單塊HOG特征內將包含更多無關背景信息,同時模型的識別精度也會下降.因此,識別準確率隨胞元特征增長呈現(xiàn)先增后減的趨勢.
圖8 胞元特征線性搜索結果Fig.8 Cell scale linear search results
不同尺度HOG特征組合實驗的結果如表4所示.
表4 HOG特征組合對比實驗結果Table 4 HOG feature combination comparison experiment results
由上述結果可知,不同尺度HOG特征進行線性拼接可有效提高UMP識別準確率;但拼接后特征數(shù)量超過模型表征能力,導致識別精度有所下降.如何從眾多候選特征組合中獲得最佳特征組合將是參數(shù)尋優(yōu)部分的重點內容.
2)GfDF模型在UMP數(shù)據(jù)集中的有效性驗證.由手機定位裁剪實驗可知,廢舊手機識別模型輸入為480×270像素的圖像.多次實驗表明,原始DF模型受限于計算機內存,其無法根據(jù)480×270像素的UMP圖像進行訓練.因此,在對比實驗中將圖像尺寸縮小為原來的1/5(即96×54)進行訓練.實驗以原始圖像輸入的梯度特征DF模型,降維圖像輸入的GfDF模型、原始的DF模型為基礎,胞元特征和滑動窗尺寸均為[25,25]+[60,60],分別從識別準確率、訓練時間兩個角度進行驗證.GfDF及原始DF對比實驗結果如圖9所示.
圖9 GfDF及原始DF的對比實驗結果Fig.9 GfDF and original DF contrast experimen
降維數(shù)據(jù)輸入的GfDF模型與原始的DF模型的識別準確率相近,但GfDF模型穩(wěn)定性優(yōu)于原始DF模型且訓練時間明顯縮短;像素為480×270的回收裝備實拍UMP圖片可直接傳入GfDF模型進行識別,模型識別準確率略高于降維數(shù)據(jù)訓練模型.
3)GfDF模型普適性驗證.為進一步驗證本文所提DF改進算法在小樣本圖像識別問題中的有效性,使用圖像分類基準數(shù)據(jù)集分別構建原始DF模型和GfDF模型.識別效果和模型訓練時間對比分別如表5和表6所示.
表5 基準數(shù)據(jù)集的DF及GfDF識別精度對比Table 5 Comparison of DF and GfDF recognition accuracy of benchmark data sets
表6 不同數(shù)據(jù)集的DF及GfDF訓練時間對比Table 6 Comparison of DF and GfDF training time of different data sets
由表5-6可知,GfDF在圖像數(shù)據(jù)集上表現(xiàn)明顯優(yōu)于原始DF模型的性能.
由第1.4小節(jié)可知,本文將HOG特征尺度XkHOG,級聯(lián)森林模型的決策樹數(shù)量J和決策樹最大特征數(shù)Mj作為優(yōu)化參數(shù)進行編碼.最佳胞元特征為二維尋優(yōu)問題,難以在短時間內獲得最優(yōu)解,且多種不同胞元特征的組合會進一步增加該參數(shù)尋優(yōu)的候選空間,這使尋優(yōu)算法的時間復雜度劇增.因此,在尋優(yōu)之初通過前文實驗經(jīng)驗對效果較優(yōu)秀、跨度較大的胞元特征進行選擇,通過排列組合的方式生成候選多尺度HOG特征并對其進行預編碼.候選HOG特征如表7所示.
表7 HOG特征候選表Table 7 HOG feature candidate list
DE參數(shù)尋優(yōu)問題中,種群差異性決定了解空間的覆蓋范圍,這使得初始種群范圍的選取尤為重要.在PDE算法中,每個子種群功能與原始DE算法是一致的,而各子種群由初始種群劃分得到.此外,子種群的數(shù)量決定了算法尋優(yōu)時間,因此在PDE算法中的總種群設定包括種群規(guī)模和子種群切分數(shù)量兩部分.優(yōu)化效果及優(yōu)化時間的箱線圖如圖10所示.
圖10 GfDF及原始DF的對比實驗結果Fig.10 PDE optimization box plot
為進一步說明所提結構化UMP識別模型中各模塊必要性,作者采用控制變量法對識別模型進行分析,結果如表8所示.
表8 UMP識別模型消融實驗表Table 8 UMP recognition model ablation experiment
最后,將本文所提方法與當前主流小樣本分類模型進行比較,其中:微調(fine-tuning)方法中使用ImageNet作為原始數(shù)據(jù)集訓練VGG16和ResNet50,將卷積層權重參數(shù)固定,采用本文所述廢舊手機圖像訓練最后的全連接層參數(shù);元學習(meta learning)方法中采用基于度量準則(metric based)的Siamese network,使用網(wǎng)絡爬蟲獲取手機背部圖像訓練一個VGG16網(wǎng)絡,再通過圖像訓練另一個VGG16網(wǎng)絡,利用歐氏距離計算相同類別高清樣本與實拍樣本在對應模型中的高維特征相似度,具體結果如表9所示.
表9 多模型精度對比Table 9 Accuracy comparison of multiple models
由結果可知,GfDF方法精度雖然略低于微調方法的ResNet50網(wǎng)絡,但本文所提方法無需在大規(guī)模數(shù)據(jù)集中進行預訓練,訓練成本較低、模型復雜度低.
本文針對廢舊手機回收裝備中的手機識別算法存在的精度低、可信度差等問題,提出一種基于并行差分進化算法-梯度特征深度森林算法的識別方法,其創(chuàng)新點如下:
1)首次提出由手機定位裁剪模塊、梯度特征深度森林識別模塊、并行差分進化參數(shù)優(yōu)化模塊組成的識別算法,實現(xiàn)對回收裝備拍攝廢舊手機圖片的定位裁剪和識別.
2)對原始深度森林模型進行改進,首次提出梯度特征深度森林模型,使其更加適用于基于紋理特征的廢舊手機圖像識別問題.此外,通過MNIST等基準圖像數(shù)據(jù)集驗證了所提方法相比于原始DF模型在識別精度上具有顯著提升.
3)改進差分進化算法為并行模式,并首次將其應用于梯度特征深度森林模型超參數(shù)尋優(yōu)問題.
實驗表明,本方法對回收裝備實拍圖像識別準確率和訓練時間均優(yōu)于其他算法.但本文方法仍存在一定不足,例如:在多尺度特征選擇方面并未篩選各尺度HOG特征中的有效信息,且研究過程中僅采用HOG特征作為分類特征,下一步本文作者將對手機圖像不同區(qū)域提取不同尺度HOG特征進行加權組合,在特征工程部分增加顏色矩、特定位置紋理等特征,進一步提高識別模型在廢舊手機回收問題中的可靠性.