李秋彤
(長安大學(xué)工程機械學(xué)院,陜西 西安 710021)
隨著社會智能化程度的不斷提高,智能控制技術(shù)在工程機械控制中的運用越來越廣泛,工程機械產(chǎn)業(yè)的智能化進程不斷加快[1]。為使機群中挖掘機的協(xié)同工作效果達到最佳,需要加強對挖掘機的智能化管理和科學(xué)調(diào)度,挖掘機制造商識別系統(tǒng)的設(shè)計與完善,對于實現(xiàn)工程機械的智能化、集群化管理具有重要意義[2]。近年來,深度神經(jīng)網(wǎng)絡(luò)開始走向?qū)嵱没?,隨著深度學(xué)習(xí)的快速發(fā)展,計算機視覺領(lǐng)域中各種視覺處理任務(wù)的效果得到了極大提高[3]。為了取得進一步突破,許多科研人員開始從人類視覺特性角度出發(fā),結(jié)合額外知識表示進行圖像處理[4]。本文選定Alexnet深度學(xué)習(xí)網(wǎng)絡(luò)進行訓(xùn)練,通過調(diào)整模型的參數(shù),探究特征提取網(wǎng)絡(luò)參數(shù)改變對挖掘機生產(chǎn)商識別效果的影響。
繪制流程圖有助于更加順利地完成課題,在正式開始軟件設(shè)計流程之前,有必要先繪制軟件設(shè)計流程圖,軟件初步設(shè)計流程圖如圖1所示。
圖1 軟件初步設(shè)計流程圖
本文主要以挖掘機為研究對象,識別任務(wù)目標體積較大,因此需要網(wǎng)絡(luò)適合識別大中型目標。本文所使用的挖掘機數(shù)據(jù)集較小,要求網(wǎng)絡(luò)具有良好的特征學(xué)習(xí)能力和較強的抗過擬合性能,同時要求盡可能提高網(wǎng)絡(luò)識別的訓(xùn)練速度,并且還對網(wǎng)絡(luò)的可移植性有一定的要求[5]。因此,選擇較為基礎(chǔ)且易于掌握的Alexnet作為本次實驗的基礎(chǔ)框架。
1)圖像數(shù)據(jù)集的構(gòu)建。本文依據(jù)不同的挖掘機生產(chǎn)商圖像建立了一個包含18家挖掘機生產(chǎn)商圖像的樣本數(shù)據(jù)集,共計搜集了900張圖片,基本包含了工程實際生產(chǎn)中常見的挖掘機生產(chǎn)商。由于資源搜集能力的限制,每一家廠商搜集到50張照片。為了保證識別的精度,每個圖像中僅有一輛或兩輛挖掘機,并且圖像中的生產(chǎn)商特征沒有重疊或損壞,如圖2所示。
圖2 數(shù)據(jù)集中的圖像舉例
2)圖像數(shù)據(jù)集的標簽化處理。由于深度學(xué)習(xí)算法屬于有監(jiān)督的學(xué)習(xí)方式[6],需要采用有標簽的樣本圖片進行訓(xùn)練,采集得到的各型挖掘機圖像并沒有標簽,因此需要對所搜集的挖掘機圖像進行人工標定。識別的目標為挖掘機生產(chǎn)商,理論上打標簽的對象為挖掘機身上的生產(chǎn)商標志,但是在實際工程應(yīng)用中需要識別整個挖掘機,本文創(chuàng)新性地設(shè)計了“整機+生產(chǎn)商標志”的組合數(shù)據(jù)集,既解決了實際工程中的整機識別問題,又保證了識別精度。為了測試不同標簽方法的識別效果,本文嘗試建立了3種不同的數(shù)據(jù)集即生產(chǎn)商標志數(shù)據(jù)集、“整機+生產(chǎn)商標志”數(shù)據(jù)集和整機數(shù)據(jù)集,本文分別對3種數(shù)據(jù)集進行網(wǎng)絡(luò)訓(xùn)練,并根據(jù)最終的訓(xùn)練結(jié)果選定最優(yōu)的數(shù)據(jù)集方案。
3)圖像數(shù)據(jù)集的歸一化處理。網(wǎng)絡(luò)模型中的訓(xùn)練數(shù)據(jù)來自于imagelabeler裁剪出來的圖像,裁剪出來的圖像大小并不能做到完全一致,所以存在圖像規(guī)格不統(tǒng)一的問題。又因為Alexnet網(wǎng)絡(luò)模型所要求的圖像輸入尺寸為227×227×3,所以本文對搜集到的挖掘機圖像進行了歸一化處理,統(tǒng)一了數(shù)據(jù)集中圖像的規(guī)格。
4)圖像數(shù)據(jù)集的擴充。本文通過旋轉(zhuǎn)圖像、添加噪聲等手段進行了圖像數(shù)據(jù)集的擴充。
通過以上步驟,最終生成來自18家挖掘機生產(chǎn)商的4500幅圖像。每個生產(chǎn)商有250張圖像,每張圖像的尺寸為227×227×3。
采用遷移學(xué)習(xí)方法訓(xùn)練得到的網(wǎng)絡(luò)模型識別精度更高、訓(xùn)練效果更好[7],因此本文采用遷移學(xué)習(xí)方法。在對本次實驗的數(shù)據(jù)集進行訓(xùn)練后,通過不斷調(diào)整網(wǎng)絡(luò)的參數(shù),使網(wǎng)絡(luò)與本文數(shù)據(jù)集更好匹配,提高訓(xùn)練精度,減少訓(xùn)練時長,最終找到使得網(wǎng)絡(luò)的性能和實用性達到最優(yōu)的一組網(wǎng)絡(luò)模型。
通過不斷調(diào)試Alexnet網(wǎng)絡(luò)的主要參數(shù),得到了若干組網(wǎng)絡(luò)模型,其中權(quán)重為5、偏差為5、Minibatchsize為10、MaxEpochs為6、學(xué)習(xí)率為0.0001、測驗頻率為10的一組網(wǎng)絡(luò)模型的準確率為87.89%,為本次試驗最佳結(jié)果。
1)挖掘機生產(chǎn)商類別數(shù)的對比實驗。分別使用挖掘機生產(chǎn)商類別數(shù)為9家、18家、27家的數(shù)據(jù)集進行訓(xùn)練,三類數(shù)據(jù)集每類的圖像數(shù)量一致。在對比實驗中的三次訓(xùn)練使用了相同的參數(shù),訓(xùn)練結(jié)果如圖3、圖4、圖5所示。
圖3 9類生產(chǎn)商識別結(jié)果
圖4 18類生產(chǎn)商識別結(jié)果
圖5 27類生產(chǎn)商識別結(jié)果
由訓(xùn)練結(jié)果可知,在使用相同網(wǎng)絡(luò)和參數(shù)的情況下,使用9組生產(chǎn)商的數(shù)據(jù)集的識別精度為91.78%,訓(xùn)練時間為8 min24 s;使用18組生產(chǎn)商的數(shù)據(jù)集的識別精度為87.89%,訓(xùn)練時間為23 min10 s,使用27組生產(chǎn)商的數(shù)據(jù)集的識別精度為82.15%,訓(xùn)練時間為116 min25 s。隨著輸入訓(xùn)練的數(shù)據(jù)集的類別增多,網(wǎng)絡(luò)的識別精度逐漸下降,且訓(xùn)練時間不斷上升,綜合考慮訓(xùn)練時間與訓(xùn)練精度的影響,以及最終工程應(yīng)用中需要的識別種類,決定選用18家目前市面常見的挖掘機生產(chǎn)商作為數(shù)據(jù)集,既能夠保證較高的識別率和訓(xùn)練速度,又可以涵蓋目前市面上的大部分生產(chǎn)商。
2)使用不同標簽標定數(shù)據(jù)集的對比實驗。分別使用只有生產(chǎn)商標志的數(shù)據(jù)集、“整機+生產(chǎn)商標志”的數(shù)據(jù)集以及挖掘機整機的數(shù)據(jù)集進行訓(xùn)練,保持三類數(shù)據(jù)集的圖像數(shù)量相同,并且在對比實驗中的訓(xùn)練使用了相同的參數(shù)。生產(chǎn)商標志的數(shù)據(jù)集中共18類,每類有250張生產(chǎn)商標志圖像,訓(xùn)練后精度為91.33%;挖掘機“整機+生產(chǎn)商標志”的數(shù)據(jù)集共18類,每類有250張圖像,其中整機圖像200張,生產(chǎn)商標志圖像50張,訓(xùn)練后精度為87.89%;挖掘機整機的數(shù)據(jù)集共18類,每類有250張整機圖像,訓(xùn)練后精度為83.33%。
在使用相同網(wǎng)絡(luò)和參數(shù)的情況下,使用僅有生產(chǎn)商標志的數(shù)據(jù)集精確度最高,但若輸入挖掘機整機圖像其無法識別挖掘機生產(chǎn)商,只能輸入生產(chǎn)商標志進行識別,“整機+生產(chǎn)商標志”數(shù)據(jù)集識別率明顯高于僅有挖掘機整機的數(shù)據(jù)集。實驗結(jié)果表明,使用挖掘機整機與生產(chǎn)商標志混合的數(shù)據(jù)集可以有效提高訓(xùn)練效果。
文章對挖掘機生產(chǎn)商圖像識別系統(tǒng)軟件設(shè)計展開研究。介紹了挖掘機生產(chǎn)商自動識別系統(tǒng)的建立過程,對圖像樣本數(shù)據(jù)集的建立和模型訓(xùn)練及數(shù)據(jù)對比都進行了較為詳細的介紹。并采用基于深度學(xué)習(xí)技術(shù)的網(wǎng)絡(luò)Alexnet,通過實驗對網(wǎng)絡(luò)參數(shù)進行了測試與優(yōu)化,提高了挖掘機生產(chǎn)商的識別精度。從實驗結(jié)果來看,本算法可以滿足實際工程生產(chǎn)的要求。