国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于輕量級(jí)卷積神經(jīng)網(wǎng)絡(luò)的蘋果表面缺陷檢測方法

2021-09-18 03:25:29周雨帆,李勝旺,楊奎河,白宇,宋子盈
河北工業(yè)科技 2021年5期
關(guān)鍵詞:卷積神經(jīng)網(wǎng)絡(luò)

周雨帆,李勝旺,楊奎河,白宇,宋子盈

摘要:為了解決目前農(nóng)業(yè)信息領(lǐng)域?qū)μO果表面缺陷檢測準(zhǔn)確率低的問題,提出一種基于輕量級(jí)卷積神經(jīng)網(wǎng)絡(luò)的蘋果表面缺陷檢測方法。首先采集蘋果缺陷樣本圖片制作實(shí)驗(yàn)數(shù)據(jù)集用于模型訓(xùn)練和測試;其次在AlexNet網(wǎng)絡(luò)結(jié)構(gòu)的基礎(chǔ)上,引入深度可分離卷積代替原有網(wǎng)絡(luò)中的標(biāo)準(zhǔn)卷積運(yùn)算來進(jìn)行圖像特征的提取;最后利用全局平均池化方法代替原有網(wǎng)絡(luò)中的全連接層,從而將卷積層輸出的多個(gè)特征圖以自身為單位進(jìn)行映射得到特征點(diǎn)。實(shí)驗(yàn)結(jié)果表明:改進(jìn)后網(wǎng)絡(luò)對(duì)蘋果缺陷識(shí)別精度達(dá)到了98.57%,較改進(jìn)前提升1.55%;較改進(jìn)前模型參數(shù)量減少99.3%、訓(xùn)練速度提高32.67%、FPS提高33.28%,改進(jìn)后的輕量級(jí)卷積神經(jīng)網(wǎng)絡(luò)不僅減少了模型參數(shù)量和訓(xùn)練時(shí)間,而且提高了檢測精度和速度。因此,新的檢測方法在減少模型參數(shù)量的同時(shí),還可保證模型的檢測精度和效率,具有較強(qiáng)的工程實(shí)用性,可為蘋果缺陷分類提供理論參考。

關(guān)鍵詞:計(jì)算機(jī)神經(jīng)網(wǎng)絡(luò);卷積神經(jīng)網(wǎng)絡(luò);表面缺陷檢測;深度可分離卷積;全局平均池化

中圖分類號(hào):TP391.41文獻(xiàn)標(biāo)識(shí)碼:ADOI: 10.7535/hbgykj.2021yx05006

Apple surface defect detection method based on lightweight

convolutional neural network

ZHOU Yufan,LI Shengwang,YANG Kuihe,BAI Yu,SONG Ziying

(School of Information Science and Engineering,Hebei University of Science and Technology,Shijiazhuang,Hebei 050018,China)

Abstract:In order to solve the problem of low accuracy of apple surface defect detection in the field of agricultural information,a method of apple surface defect detection based on lightweight convolutional neural network was proposed.Firstly,apple defect sample images were collected to make experimental dataset for model training and testing;Secondly,on the basis of AlexNet network structure,depth separable convolution was introduced to replace the standard convolution operation in the original network to extract image features;Finally,the global average pooling method was used to replace the full connection layer in the original network,and the output feature maps of the convolution layer as a unit were mapped to get the feature points.The experimental results show that the recognition accuracy of the improved network is 98.57%,which is 1.55% higher than that before;Compared with the model before improvement,the model parameters reduce by 99.3%,training speed increases by 32.67%,and FPS increases by 33.28%.The improved lightweight convolutional neural network not only reduces the model parameters and training time,but also improves the detection accuracy and speed.Therefore,the new detection method can reduce the number of model parameters,as well as ensure the detection accuracy and efficiency of the model,which has strong engineering practicability and provides theoretical reference for apple defect classification.

Keywords:computer neural network;convolutional neural network;surface defect detection;depth separable convolution;global average pooling

隨著人們生活質(zhì)量的提高,消費(fèi)者對(duì)水果的品質(zhì)提出了更高的要求。但水果在生長、采摘、運(yùn)輸、儲(chǔ)存過程中,不可避免地會(huì)產(chǎn)生缺陷和損壞,水果表面缺陷是衡量水果外觀質(zhì)量的重要指標(biāo)。目前,水果表面質(zhì)量檢測多采用人工檢測,通過培訓(xùn)工人識(shí)別復(fù)雜的表面缺陷,可以實(shí)現(xiàn)水果的篩選。但是該方法的采樣率和準(zhǔn)確率低,勞動(dòng)強(qiáng)度大且效率不高,易受人工經(jīng)驗(yàn)和主觀因素影響[1]。蘋果作為日常生活中常見水果,對(duì)蘋果表面缺陷進(jìn)行檢測,對(duì)實(shí)現(xiàn)水果的自動(dòng)分揀具有較強(qiáng)的實(shí)用性。

人類已步入人工智能的新時(shí)代,機(jī)器視覺與深度學(xué)習(xí)是人工智能的重要組成部分,它們的結(jié)合可以很好地代替人類完成目標(biāo)對(duì)象的分類和識(shí)別任務(wù)[2]。早在20世紀(jì)70年代,國外學(xué)者就采用機(jī)器視覺技術(shù)對(duì)水果進(jìn)行無損檢測,并取得了一些成果[3]。在數(shù)據(jù)量和計(jì)算能力不斷增加的背景下,深度學(xué)習(xí)以其卓越的建模和特征提取能力在各個(gè)領(lǐng)域得到了廣泛應(yīng)用。近年來,基于深度卷積神經(jīng)網(wǎng)絡(luò)的視覺檢測方法經(jīng)常應(yīng)用在表面缺陷檢測中,不僅提高了檢測效率,而且大大提高了檢測精度[4]。SUSTIKA等[5]探討不同深度卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)對(duì)草莓分級(jí)系統(tǒng)(品質(zhì)檢驗(yàn))精確度的影響,評(píng)估了現(xiàn)有不同類型的深層CNN架構(gòu)。熊紅林等[6]提出了一種基于多尺度卷積神經(jīng)網(wǎng)絡(luò)方法用于玻璃表面缺陷檢測,該方法具有較高的識(shí)別精度。程春燕[7]構(gòu)建了一種基于改進(jìn)的殘差網(wǎng)絡(luò)的模型,用于臍橙質(zhì)量自動(dòng)分類,將臍橙圖像分為高質(zhì)量、良好、合格和不合格4種,準(zhǔn)確率為92%。

隨著神經(jīng)網(wǎng)絡(luò)規(guī)模的增大,在提高網(wǎng)絡(luò)性能的同時(shí)也會(huì)消耗更多計(jì)算資源,這樣的網(wǎng)絡(luò)并不利于實(shí)際應(yīng)用。因此,有必要設(shè)計(jì)更加輕量級(jí)的網(wǎng)絡(luò)模型。HOWARD等[8]提出的MobileNet就摒棄傳統(tǒng)的標(biāo)準(zhǔn)卷積,而使用深度可分離卷積,并采用步長為2的卷積代替池化操作,可以在不損失模型精度的情況下大大減少參數(shù)量和模型計(jì)算量。

綜上所述,傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)對(duì)缺陷檢測能達(dá)到很好的效果,但同時(shí)網(wǎng)絡(luò)中也存在著大量的冗余參數(shù)。為解決這個(gè)問題,本文提出了一個(gè)輕量級(jí)的卷積神經(jīng)網(wǎng)絡(luò),利用深度可分離卷積代替標(biāo)準(zhǔn)卷積運(yùn)算,利用全局池化方法代替全連接層,在減少模型參數(shù)量的同時(shí)又保證了模型的檢測精度和效率。

1卷積神經(jīng)網(wǎng)絡(luò)

卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)[9]是一種常見的深度學(xué)習(xí)模型,標(biāo)準(zhǔn)的卷積神經(jīng)網(wǎng)絡(luò)包括輸入層、卷積層、激活層、池化層、全連接層和分類層。輸入層用于獲取數(shù)據(jù)并對(duì)其進(jìn)行預(yù)處理;卷積層用于提取圖像高級(jí)特征;激活層對(duì)卷積層的結(jié)果做非線性映射;池化層可以降低各個(gè)特征圖的維度,用于降采樣;全連接層整合卷積層提取的高級(jí)圖像特征;分類層在模型最后部分輸出每個(gè)類型預(yù)測概率[10]。

AlexNet是 KRIZHEVSKY等[11]提出的一個(gè)深度學(xué)習(xí)模型,曾在2012年獲得了ILSVRC 視覺領(lǐng)域競賽的冠軍。圖1給出了AlexNet的網(wǎng)絡(luò)結(jié)構(gòu)圖,其中Input,Conv,Pool,F(xiàn)C,Softmax 分別代表輸入層,卷積層,池化層,全連接層和分類層。

2改進(jìn)的輕量級(jí)卷積神經(jīng)網(wǎng)絡(luò)

2.1深度可分離卷積

在深度可分離卷積(depthwise separable convolution,DSC)出現(xiàn)之前,神經(jīng)網(wǎng)絡(luò)大多是由不同尺度的卷積核組成,伴隨著模型精度的提高,神經(jīng)網(wǎng)絡(luò)的深度和模型參數(shù)量也在不斷增加[12]。谷歌于2017年提出的基于深度可分離卷積的MobileNet是一種專注于神經(jīng)網(wǎng)絡(luò)應(yīng)用在移動(dòng)端和嵌入式設(shè)備的輕量級(jí)神經(jīng)網(wǎng)絡(luò)。本文引入深度可分離卷積代替AlexNet中的標(biāo)準(zhǔn)卷積運(yùn)算,可以在保證模型表達(dá)能力的前提下極大地降低了參數(shù)量。

在常規(guī)卷積算法中,輸入H×W×C的特征圖與N個(gè)尺寸為K×K×C的卷積和進(jìn)行卷積計(jì)算,輸出特征圖為H×W×N,則計(jì)算量為H×W×K×K×C×N,參數(shù)量為K×K×C×N,卷積過程如圖2所示。

深度可分離卷積核心思想是將一個(gè)完整的卷積運(yùn)算分解為深度卷積(Depthwise Convolution)與逐點(diǎn)卷積(Pointwise Convolution)2個(gè)步驟。深度卷積是分別計(jì)算輸入的每張?zhí)卣鲌D,一個(gè)卷積核負(fù)責(zé)一個(gè)通道,而一個(gè)通道只能被一個(gè)卷積核卷積,通道之間并沒有信息交互,提取的是通道內(nèi)部的特征信息。對(duì)輸入的同一通道類進(jìn)行尺寸為K×K的卷積,其計(jì)算量為H×W×K×K×C,參數(shù)量為K×K×C。

逐點(diǎn)卷積就是將深度卷積輸出的特征圖與通道數(shù)相同且大小為1×1的卷積核相卷積,該操作將特征圖的各維度進(jìn)行了結(jié)合。在這部分中,逐點(diǎn)卷積核的個(gè)數(shù)就代表著提取特征的個(gè)數(shù)。利用N個(gè)尺寸為1×1×C的卷積核對(duì)深度卷積輸出的特征圖進(jìn)行通道融合計(jì)算,計(jì)算量為H×W×1×1×C×N,參數(shù)量為1×1×C×N,深度可分離卷積過程如圖3所示。

2.2全局池化

在傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)中,全連接層之前的卷積層負(fù)責(zé)圖像的特征提取,得到特征后再接上全連接層,然后進(jìn)行激活分類[13]。本文利用全局池化層來代替全連接層,將卷積層輸出的多個(gè)特征圖以自身為單位進(jìn)行映射,映射結(jié)果為一個(gè)特征點(diǎn)。多個(gè)特征點(diǎn)便得到了與上述特征展開相似的一維向量,然后將其引入分類層中進(jìn)行分類[10]。全局池化層除了保留了前面各個(gè)卷積層和池化層提取到的空間/語義信息外,還極大減少了模型的參數(shù)量,避免了過擬合問題[14]。全連接層和全局池化層的結(jié)構(gòu)如圖4所示。

全局池化包括全局平均池化(global average pooling,GAP)[15]和全局最大池化(global max pool-ing,GMP)2個(gè)類型。設(shè)xkij為卷積層中第k個(gè)特征圖的第(i,j)個(gè)元素,最后一個(gè)卷積層的大小為m×n,GAP,GMP過程如式(1)和式(2)所示:

ykGAP=1mn×∑m-1i=0∑n-1j=0xkij ,(1)

ykGMP=max(xkij),(2)

式中:ykGAP是GAP層的輸出;ykGMP是GMP層的輸出。

2.3激活函數(shù)

采用ReLu激活函數(shù)[16]對(duì)卷積后的結(jié)果進(jìn)行非線性映射,可以加快網(wǎng)絡(luò)收斂速度,防止梯度消失,增強(qiáng)特征稀疏性和非線性表達(dá)能力[17],其函數(shù)表示為

f(x)=x,x≥0,

0,x<0。(3)

2.4批量歸一化

在機(jī)器學(xué)習(xí)中,輸入數(shù)據(jù)通常會(huì)進(jìn)行歸一化處理,使得每個(gè)特征的數(shù)值尺度在同一個(gè)層次上,這樣可以加速梯度下降的收斂過程[18]。在本文的神經(jīng)網(wǎng)絡(luò)中,除了對(duì)輸入數(shù)據(jù)進(jìn)行歸一化外,還采用批量歸一化(Batch Normalization)算法[19]對(duì)卷積層的輸出值進(jìn)行歸一化,避免出現(xiàn)梯度小或梯度爆炸的情況,同時(shí)還可以加快網(wǎng)絡(luò)模型的收斂速度。

xkij代表第j層的第i神經(jīng)元模型在訓(xùn)練第k條數(shù)據(jù)時(shí)的輸出值;σij表示這批數(shù)據(jù)在第j層第i神經(jīng)元處輸出值的標(biāo)準(zhǔn)差;μij表示這批數(shù)據(jù)在第j層的i神經(jīng)元處的平均輸出值。批量歸一化后的輸出值ykij為

ykij=xkij-μijσij。(4)

神經(jīng)元輸出值的均值μij為

μij=1m∑mk=1xkij。(5)

神經(jīng)元輸出值的標(biāo)準(zhǔn)差σij為

σij=1m∑mk=1(xkij-μij)2+ε,(6)

式中:m是單個(gè)mini-batch包含樣本個(gè)數(shù);ε是一個(gè)很小的常數(shù),為了防止分母為零。

通常,為防止變換后網(wǎng)絡(luò)的表達(dá)能力下降,會(huì)對(duì)ykij進(jìn)行進(jìn)一步處理,增加2個(gè)學(xué)習(xí)參數(shù)γ和β,調(diào)整歸一化的輸出值為

y~kij=γykij+β。(7)

2.5損失函數(shù)

網(wǎng)絡(luò)模型使用交叉熵(Cross Entropy)損失函數(shù)來衡量真實(shí)值和預(yù)測值二者間的誤差,首先對(duì)網(wǎng)絡(luò)最后一層的輸出通過Softmax求出屬于某一類的概率y^(i) ,然后將y^(i)和樣本的實(shí)際標(biāo)簽y(i)做一個(gè)交叉熵。公式如下:

y^(i)=softmax(xi),

L=-∑iy(i)log(y^(i))+(1-y(i))log(1-y^(i))。(8)

2.6評(píng)價(jià)指標(biāo)

實(shí)驗(yàn)采用準(zhǔn)確率A(Accuracy)、精確率P(Precision)、召回率R(Recall)、F1 score和每秒幀數(shù)(frames per second,F(xiàn)PS)5個(gè)指標(biāo)對(duì)算法模型進(jìn)行評(píng)估,計(jì)算公式如下:

A=TP+TNTP+TN+FP+FN,

P=TPTP+FP,

R=TPTP+FN,

F1=2TP2TP+FP+FN,(9)

式中:TP(True Positive)為真正例,TN(True Negative)為真負(fù)例,F(xiàn)P((False Positive)為假正例,F(xiàn)N(False Negative)為假負(fù)例。

每秒幀數(shù)(FPS),即每秒內(nèi)可以檢測的圖片數(shù)量,可用來評(píng)估算法的檢測速度,值越大檢測速度越快[20]。

3實(shí)驗(yàn)及結(jié)果分析

3.1數(shù)據(jù)集及預(yù)處理

構(gòu)建深度學(xué)習(xí)模型并在蘋果圖像上進(jìn)行訓(xùn)練,進(jìn)而實(shí)現(xiàn)模型對(duì)蘋果圖像的缺陷檢測和分類。實(shí)驗(yàn)所需要的蘋果圖片是由部分網(wǎng)上下載的圖片和實(shí)景拍攝的圖片組成,分為健康、機(jī)械傷、病蟲害、褶皺、腐爛5個(gè)類別,共4 186張圖片,如圖5所示。利用Python腳本語言對(duì)圖片進(jìn)行處理并制作為數(shù)據(jù)集。劃分實(shí)驗(yàn)數(shù)據(jù)集,其中70%為訓(xùn)練集,30%為測試集。

3.2實(shí)驗(yàn)?zāi)P驮O(shè)計(jì)

圖6給出了改進(jìn)后的輕量級(jí)神經(jīng)網(wǎng)絡(luò)架構(gòu)示意圖,可以看出在特征提取過程中,由于池化層的作用,特征圖的尺寸不斷減小,維度由于卷積核個(gè)數(shù)的增多不斷增加。算法逐步提取出更多且更高級(jí)的圖像特征信息,以更好地勝任分類識(shí)別任務(wù)。實(shí)驗(yàn)以小批量的形式進(jìn)行,每批同時(shí)用16張圖片迭代25次進(jìn)行訓(xùn)練/測試。此外,改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)的算法各層級(jí)信息如表1所示,其中“(11,11)”代表卷積核大小;“DSConv”代表深度可分離卷積;“96/S4”代表卷積核個(gè)數(shù)與卷積步長。以第1層卷積 “(11,11),DSConv,96/S4”為例,該層參數(shù)由逐通道卷積與逐點(diǎn)卷積2個(gè)部分再加上偏差組成,首先逐通道卷積部分參數(shù)為“卷積核大小×輸入通道數(shù)”即“(112×3)”,其次逐點(diǎn)卷積部分為“點(diǎn)卷積核大小×輸入通道數(shù)×卷積核個(gè)數(shù)”即“(1×1×3)×96”,最后偏差為“卷積核個(gè)數(shù)”即96,同理可得第2層參數(shù),區(qū)別在于輸入通道數(shù)由3變?yōu)?6。批量歸一化(Batch Normalization)層的參數(shù)量為“輸入特征圖數(shù)目×4”。從表1中可以明顯看出,加入全局平均池化策略后省去了傳統(tǒng)全連接層大量的參數(shù),如果不采用全局池化方法改進(jìn)該部分,則全連接層的參數(shù)為6×6×256×4 096+4 096=37 752 832。

3.3實(shí)驗(yàn)環(huán)境及設(shè)置

實(shí)驗(yàn)在圖形處理單元(GPU)模式下進(jìn)行,實(shí)驗(yàn)所用計(jì)算機(jī)的詳細(xì)配置為內(nèi)存 16 GB,Nvidia GeForce GTX 1660Ti顯卡,使用的操作系統(tǒng)為64位 Windows10。實(shí)驗(yàn)選用的腳本語言為Python,并安裝Anaconda,OpenCV圖像處理庫、Tensorflow深度學(xué)習(xí)框架。

3.4結(jié)果分析

3.4.1模型改進(jìn)前后評(píng)價(jià)指標(biāo)比較

表2給出了改進(jìn)后的輕量級(jí)卷積神經(jīng)網(wǎng)絡(luò)模型與AlexNet神經(jīng)網(wǎng)絡(luò)模型在各評(píng)價(jià)指標(biāo)上的比較情況??梢钥闯?,改進(jìn)后模型的測試準(zhǔn)確率、精確率、召回率和F1評(píng)分都有了明顯提高,其中準(zhǔn)確率從96.41%提高至98.57%,漲幅2.16%;精確率從97.09%提高至98.64%,漲幅1.55%;召回率從95.78%提高至98.50%,漲幅2.72%;F1評(píng)分從96.41%提高至98.57%,漲幅2.16%;損失值從0.117 1降至0.048 9,減少0.068 2。由表2可知,改進(jìn)后模型的性能有所提升,這是因?yàn)閾碛旋嫶髤?shù)量的全連接層會(huì)導(dǎo)致傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)產(chǎn)生過擬合現(xiàn)象,從而降低測試的準(zhǔn)確率等指標(biāo)。對(duì)全連接層的優(yōu)化很好地解決了該問題,同時(shí)利用深度可分離卷積代替標(biāo)準(zhǔn)卷積運(yùn)算在一定程度上也減少了卷積層中的參數(shù)量,提高了測試準(zhǔn)確率。實(shí)驗(yàn)結(jié)果也驗(yàn)證了所提改進(jìn)方法的可靠性與可行性。

圖7和圖8展現(xiàn)了AlexNet模型和改進(jìn)后模型在數(shù)據(jù)集上的測試精度和測試損失。由圖7和圖8可以看出,在迭代停止時(shí)改進(jìn)后的模型擁有更高的測試精度和更低的測試損失,收斂精度優(yōu)于原模型。從收斂速度來看,改進(jìn)后的模型在第6個(gè)epoch開始收斂,而原模型在第15個(gè)epoch才開始收斂,改進(jìn)后模型的收斂速度優(yōu)于原模型。深度可分離卷積和全局平均池化策略結(jié)合可以減少模型參數(shù)量,改善網(wǎng)絡(luò)的易過擬合特性,同時(shí)加快模型收斂速度并提高模型的性能。

3.4.2全局池化類型對(duì)測試結(jié)果的影響

討論在改進(jìn)策略中不同類型的全局池化算法對(duì)改進(jìn)的輕量級(jí)卷積神經(jīng)網(wǎng)絡(luò)的影響。在全局池化算法中,全局平均池和全局最大池的區(qū)別在于對(duì)每個(gè)輸出通道的特征圖的所有像素計(jì)算是一個(gè)平均值還是最大值。從表3可知,當(dāng)前的網(wǎng)絡(luò)結(jié)構(gòu)上全局平均池化較全局最大池化在測試結(jié)果上取得了更高的測試精度和更低的測試損失,同時(shí)也表明對(duì)當(dāng)前數(shù)據(jù)提取整體特征的效果更好。

3.4.3改進(jìn)策略對(duì)模型的影響

表4給出了網(wǎng)絡(luò)的改進(jìn)策略對(duì)測試精度、參數(shù)量及模型大小的影響。由表4可知,采用深度可分離卷積代替?zhèn)鹘y(tǒng)卷積后,進(jìn)一步降低了原卷積層部分的參數(shù),大大改善了復(fù)雜網(wǎng)絡(luò)的易過擬合特性,在減少參數(shù)量、降低模型所占內(nèi)存的同時(shí),提高了測試精度。由于全連接層占了原有網(wǎng)絡(luò)的大部分參數(shù),所以采用全局池化方法代替全連接層,減少了網(wǎng)絡(luò)的主要參數(shù),可以看出采用深度可分離卷積和全局平均池化方法改進(jìn)后的模型參數(shù)量和所占內(nèi)存遠(yuǎn)遠(yuǎn)小于AlexNet模型和只采用深度可分離卷積改進(jìn)過的模型。

3.4.4模型改進(jìn)前后訓(xùn)練時(shí)間及檢測速率比較

表5給出了模型改進(jìn)前后所需訓(xùn)練時(shí)間和檢測速率的比較情況。由表5可知,從模型的訓(xùn)練時(shí)間方面看,原始模型的訓(xùn)練需要273.91 s,采用深度可分離卷積改進(jìn)后的模型訓(xùn)練需要246.03 s,采用深度可分離卷積和全局平均池化改進(jìn)后的模型訓(xùn)練僅需要184.42 s,較改進(jìn)前有明顯差別。從模型檢測速率方面看,原始模型每秒可以檢測625張圖片,改進(jìn)后的模型每秒可以檢測833張圖片,檢測速度有明顯提升。綜合來看,改進(jìn)后模型在訓(xùn)練速度和檢測速度上都有顯著提升,可以節(jié)省時(shí)間成本,且具有較強(qiáng)的實(shí)時(shí)性。

4結(jié)語

提出了一種輕量級(jí)神經(jīng)網(wǎng)絡(luò)模型算法來實(shí)現(xiàn)蘋果的表面缺陷檢測識(shí)別與分類。算法首先引入深度可分離卷積代替AlexNet網(wǎng)絡(luò)中的標(biāo)準(zhǔn)卷積運(yùn)算,減少了模型在卷積層的參數(shù)量;其次采用全局平均池化方法代替原有網(wǎng)絡(luò)中的全連接層,大大減少了模型的參數(shù)量。改進(jìn)后的模型參數(shù)量只有原有網(wǎng)絡(luò)的1/150,避免了過擬合現(xiàn)象的產(chǎn)生,減少了內(nèi)存占用。同時(shí)實(shí)驗(yàn)結(jié)果表明,改進(jìn)后的網(wǎng)絡(luò)模型所需的訓(xùn)練時(shí)間減少,并在測試準(zhǔn)確率、檢測速度等各項(xiàng)評(píng)價(jià)指標(biāo)上均有提升,具有很好的準(zhǔn)確性和實(shí)時(shí)性,能夠滿足對(duì)蘋果表面缺陷進(jìn)行檢測的需求。

本文只將蘋果常見的缺陷簡單劃分為5類進(jìn)行檢測,其實(shí)還可以再進(jìn)行細(xì)分。后續(xù)將對(duì)改進(jìn)后的模型進(jìn)行更大數(shù)據(jù)集和更多種類的訓(xùn)練和實(shí)驗(yàn),同時(shí)其他水果缺陷數(shù)據(jù)集的擴(kuò)展研究也將被考慮在內(nèi),以提高模型解決這類問題的泛化能力。

參考文獻(xiàn)/References:

[1]TABERNIK D,SELA S,SKOCAJ J,et al.Segmentation-based deep-learning approach for surface-defect detection[J].2020,31(3):759-776.

[2]林云森,范文強(qiáng),姜佳良.基于深度學(xué)習(xí)的水果識(shí)別技術(shù)研究[J].光電技術(shù)應(yīng)用,2019,34(6):45-48.

LIN Yunsen,F(xiàn)AN Wenqiang,JIANG Jialiang.Research on fruit recognition technology based on deep learning[J].Electro-Optic Technology Application,2019,34(6):45-48.

[3]何文斌,魏愛云,明五一,等.基于機(jī)器視覺的水果品質(zhì)檢測綜述[J].計(jì)算機(jī)工程與應(yīng)用,2020,56(11):10-16.

HE Wenbin,WEI Aiyun,MING Wuyi,et al.Survey of fruit quality detection based on machine vision[J].Computer Engineering and Applications,2020,56(11):10-16.

[4]廉家偉,何軍紅,牛云,等.基于多尺度壓縮CNN的表面缺陷快速檢測[J/OL].計(jì)算機(jī)集成制造系統(tǒng),(2021-02-01)[2020-05-07].http://kns.cnki.net/kcms/detail/11.5946.TP.20210129.1551.002.html.

LIAN Jiawei,HE Junhong,NIU Yun,et al.Rapid detection of surface defects based on multi-scale compression CNN[J/OL].Computer Integrated Manufacturing Systems,(2021-02-01)[2021-05-07].http://kns.cnki.net/kcms/detail/11.5946.TP.20210129.1551.002.html.

[5]SUSTIKA R,SUBEKTI A,PARDEDE H F,et al.Evaluation of deep convolutional neural network architectures for strawberry quality inspection[J].International Journal of Engineering & Technology,2018,7(4.40):75-80.

[6]熊紅林,樊重俊,趙珊,等.基于多尺度卷積神經(jīng)網(wǎng)絡(luò)的玻璃表面缺陷檢測方法[J].計(jì)算機(jī)集成制造系統(tǒng),2020,26(4):900-909.

XIONG Honglin,F(xiàn)AN Chongjun,ZHAO Shan,et al.Glass surface defect detection method based on multiscale convolution neural network[J].Computer Integrated Manufacturing Systems,2020,26(4):900-909.

[7]程春燕.基于機(jī)器視覺的臍橙品質(zhì)自動(dòng)檢測分類技術(shù)研究[D].贛州:江西理工大學(xué),2018.

CHENG Chunyan.Research on the Technology of Navel Orange Quality Automatic Detection and Classification Based on Machine Vision[D].Ganzhou:Jiangxi University of Science and Technology,2018.

[8]HOWARD A G,ZHU Menglong,CHEN Bo,et al.MobileNets:Efficient convolutional neural networks for mobile vision applications[EB/OL].[2017-04-17].http://arxiv.org/pdf/1704.04861.pdf.

[9]GU Jiuxiang,WANG Zhenhua,KUEN J,et al.Recent advances in convolutional neural networks[J].Pattern Recognition,2018,77:354-377.

[10]賈鶴鳴,郎春博,姜子超.基于輕量級(jí)卷積神經(jīng)網(wǎng)絡(luò)的植物葉片病害識(shí)別方法[J].計(jì)算機(jī)應(yīng)用,2021,41(6):1812-1819.

JIA Heming,LANG Chunbo,JIANG Zichao.Plant leaf disease recognition method based on lightweight convolutional neural network[J].Journal of Computer Applications,2021,41(6):1812-1819.

[11]KRIZHEVSKY A,SUTSKEVER I,HINTON G E.ImageNet classification with deep convolutional neural networks[C]//Proceedings of the 25th International Conference on Neural Information Processing Systemss.RedHook:Curran Associates Inc,2012:1097-1105.

[12]鄧若辰,彭程,邊赟.基于深度可分離卷積的指靜脈識(shí)別算法[J].計(jì)算機(jī)應(yīng)用,2020,40(sup2):199-203.

DENG Ruochen,PENG Cheng,BIAN Yun.Finger Vein recognition algorithm based on depthwise convolution[J].Journal of Computer Applications,2020,40(sup2):199-203.

[13]LIN Min,CHEN Qiang,YAN Shuicheng.Network in network[EB/OL].[2014-03-04].http://arxiv.org/pdf/1312.4400.pdf.

[14]HAWKINS D M.The problem of overfitting[J].Journal of Chemical Information and Computer Sciences,2004,44(1):1-12.

[15]周飛燕,金林鵬,董軍.卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J].計(jì)算機(jī)學(xué)報(bào),2017,40(6):1229-1251.

ZHOU Feiyan,JIN Linpeng,DONG Jun.Review of convolutional neural network[J].Chinese Journal of Computers,2017,40(6):1229-1251.

[16]GLOROT X,BORDES A,BENGIO Y.Deep sparse rectifier neural networks[C]//Proceedings of the Fourteenth International Conference on Artificial Intelligence and Statistics.Lille:PMLR,2011:315-323.

[17]陳鑫華,錢雪忠,宋威.基于輕量級(jí)特征融合卷積網(wǎng)絡(luò)的圖像分類算法[J/OL].計(jì)算機(jī)工程.(2020-12-17)[2021-05-07].https://kns.cnki.net/kcms/detail/detail/31.1289.TP.20201-216.1712.012.html.

CHEN Xinhua,QIAN Xuezhong,SONG Wei.Image classification algorithm based on lightweight feature fusion convolutional network[J/OL].Computer Engineering.(2020-12-17)[2021-05-07].https://kns.cnki.net/kcms/detail/detail/31.1289.TP.20201216.1712.012.html.

[18]BA J L,KIROS J R,HINTON G E.Layer normalization[EB/OL].[2016-07-21].http://arxiv.org/pdf/1607.06450.pdf.

[19]IOFFE S,SZEGEDY C.Batchnormalization:Accelerating deep network training by reducing internal covariate shift[C]//Proceedings of the 32nd International Conference on International Conference on Machine Learning.Lille:PMLR,2015:448-456.

[20]劉亞姣,于海濤,劉寶順,等.基于YOLOv3的H型鋼表面缺陷檢測系統(tǒng)[J].河北工業(yè)科技,2021,38(3):231-235.

LIU Yajiao,YU Haitao,LIU Baoshun,et al.H-beam surface defect detection system based on YOLOv3 algorithm[J].Hebei Journal of Industrial Science & Technology,2021,38(3):231-235.

猜你喜歡
卷積神經(jīng)網(wǎng)絡(luò)
基于深度神經(jīng)網(wǎng)絡(luò)的微表情識(shí)別
卷積神經(jīng)網(wǎng)絡(luò)中減少訓(xùn)練樣本時(shí)間方法研究
卷積神經(jīng)網(wǎng)絡(luò)語言模型研究
基于卷積神經(jīng)網(wǎng)絡(luò)的車輛檢索方法研究
基于卷積神經(jīng)網(wǎng)絡(luò)溫室智能大棚監(jiān)控系統(tǒng)的研究
基于深度卷積神經(jīng)網(wǎng)絡(luò)的物體識(shí)別算法
深度學(xué)習(xí)算法應(yīng)用于巖石圖像處理的可行性研究
基于深度卷積網(wǎng)絡(luò)的人臉年齡分析算法與實(shí)現(xiàn)
軟件工程(2016年8期)2016-10-25 15:47:34
深度學(xué)習(xí)技術(shù)下的中文微博情感的分析與研究
軟件(2016年5期)2016-08-30 06:27:49
基于卷積神經(jīng)網(wǎng)絡(luò)的樹葉識(shí)別的算法的研究
收藏| 常熟市| 盈江县| 新民市| 建德市| 体育| 五指山市| 六盘水市| 齐河县| 元朗区| 廉江市| 即墨市| 共和县| 东港市| 文化| 青铜峡市| 神池县| 定襄县| 额敏县| 青海省| 麻阳| 林周县| 瑞安市| 亚东县| 鹤山市| 宁蒗| 永胜县| 青阳县| 永平县| 东辽县| 景谷| 津市市| 克什克腾旗| 桓仁| 竹山县| 通江县| 合肥市| 罗源县| 凉山| 尼木县| 翁源县|