陳品嵐,朱立學(xué),張世昂
(1.仲愷農(nóng)業(yè)工程學(xué)院機(jī)電工程學(xué)院,廣東 廣州 510225;2.仲愷農(nóng)業(yè)工程學(xué)院自動(dòng)化學(xué)院,廣東 廣州 510225)
我國(guó)是世界上的水果生產(chǎn)大國(guó),在2020 年我國(guó)的果園面積為1 228 萬(wàn)hm2,而且水果的產(chǎn)量正在逐年增長(zhǎng),同年水果產(chǎn)量已經(jīng)達(dá)到了28 962 萬(wàn)t[1]。此外,從2005—2019 年,農(nóng)業(yè)就業(yè)的人數(shù)減少了5 800萬(wàn)人[2],采摘作業(yè)所用勞動(dòng)力占整個(gè)生產(chǎn)過(guò)程所用勞動(dòng)力的33%~50%[3]。隨著現(xiàn)代農(nóng)業(yè)技術(shù)的發(fā)展,水果的生產(chǎn)與采收自動(dòng)化是必然趨勢(shì),而水果的目標(biāo)識(shí)別是實(shí)現(xiàn)采摘自動(dòng)化的重要環(huán)節(jié)之一。
任何一個(gè)水果采摘機(jī)器人都離不開(kāi)對(duì)目標(biāo)果實(shí)精準(zhǔn)識(shí)別的視覺(jué)系統(tǒng)。視覺(jué)系統(tǒng)的好壞直接影響采摘機(jī)器人的工作效率和采后水果的損傷程度。它的性能指標(biāo)主要有2 個(gè)部分,分別是識(shí)別速度和平均精度均值(mean Average Precision,mAP)[3]。影響視覺(jué)系統(tǒng)的性能指標(biāo)因素有很多,比如在自然環(huán)境下的光照變化、果實(shí)生長(zhǎng)環(huán)境和生長(zhǎng)程度、果實(shí)重疊、枝葉的遮擋等,同時(shí)使用的識(shí)別方法對(duì)其性能指標(biāo)也有很大影響,比如所使用圖像處理的方法、數(shù)據(jù)集、神經(jīng)網(wǎng)絡(luò)算法的層數(shù)等。此外,視覺(jué)系統(tǒng)所用的硬件設(shè)備會(huì)限制其性能指標(biāo)。
水果外觀的特征因生物學(xué)的特性而有很大的不同,同時(shí)自然環(huán)境的復(fù)雜性和時(shí)間變化也會(huì)增加水果外觀的變化,這使得視覺(jué)系統(tǒng)對(duì)目標(biāo)果實(shí)識(shí)別難度增大。因此,目標(biāo)識(shí)別的方法也在不斷地發(fā)展與創(chuàng)新,其主要的方法有3 部分,分別是傳統(tǒng)圖像處理技術(shù),如KURTULMUS 等[4]使用顏色和Gabor 紋理的特征分析方法識(shí)別了未熟的柑橘,達(dá)到了75.3%的識(shí)別正確率,但對(duì)枝葉覆蓋的水果的識(shí)別效果較差;機(jī)器學(xué)習(xí)算法,如WANG 等[5]使用K-means聚類(lèi)將荔枝與樹(shù)葉、樹(shù)枝和背景進(jìn)行分離,該識(shí)別方法對(duì)光照變化的影響具有較強(qiáng)的魯棒性,對(duì)未遮擋荔枝和部分遮擋荔枝的平均識(shí)別率最高,分別為98.8%和97.5%;卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)算法,如武星等[6]使用了一種輕量化網(wǎng)絡(luò)Light YOLOv3 對(duì)復(fù)雜背景下的蘋(píng)果果實(shí)進(jìn)行檢測(cè),對(duì)YOLOv3 的卷積塊和損失函數(shù)進(jìn)行了改進(jìn),并使用了多階段的學(xué)習(xí)優(yōu)化技術(shù),最后模型的平均精度可達(dá)94.69%,其在復(fù)雜環(huán)境下的復(fù)雜目標(biāo)識(shí)別任務(wù)中表現(xiàn)出良好的識(shí)別能力。
傳統(tǒng)圖像處理技術(shù)的水果目標(biāo)識(shí)別主要對(duì)果實(shí)顏色、紋理和形狀等外部特征進(jìn)行檢測(cè)處理,從而實(shí)現(xiàn)目標(biāo)檢測(cè)。
蘋(píng)果[4,6-7,16]、柑橘[8-11]、荔枝[5,12,18]等果實(shí)具有顯著的顏色特征[13-15],對(duì)于目標(biāo)果實(shí)的顏色特征與其背景有明顯差異時(shí),一般通過(guò)不同的顏色空間,如RGB、HSI 和HSV 等,來(lái)提取水果的顏色特征,并使用閾值分割提前果實(shí)區(qū)域進(jìn)行目標(biāo)識(shí)別[13]。如陳雪鑫等[17]使用改進(jìn)最大類(lèi)間方差法OTSU 對(duì)水果圖像進(jìn)行分割,提取目標(biāo)果實(shí)顏色特征,其方法最終對(duì)蘋(píng)果的識(shí)別正確率為90%。熊俊濤等[18]分析荔枝果實(shí)、果梗和樹(shù)葉的顏色信息特征,并對(duì)不同自然光照條件下的荔枝進(jìn)行識(shí)別,識(shí)別率可達(dá)95.5%。
紋理特征[19-21]是果實(shí)重要生物特征,可以區(qū)分果實(shí)與背景或遮擋物,將目標(biāo)果實(shí)從圖像中分割出來(lái)。如謝忠紅等[22]對(duì)自然場(chǎng)景下蘋(píng)果的彩色水果圖像進(jìn)行分割,利用灰度共生矩陣分析果實(shí)和背景的紋理特征,對(duì)果實(shí)和背景顏色相似的圖像進(jìn)行分割,分割成功率均達(dá)到95%以上。
形狀特征[23-24]則可通過(guò)提取果實(shí)與背景的邊緣特征獲取,使用Hough 變換法、幾何屬性法、最小二乘法等方法將目標(biāo)果實(shí)從復(fù)雜的背景圖像中提取出來(lái)。如朱堅(jiān)民等[25]使用灰色關(guān)聯(lián)分析和模糊隸屬度匹配方法提取球形水果圖像中的顏色和形狀特征,最終的識(shí)別正確率達(dá)99%。
由于自然環(huán)境中存在很多干擾因素,僅僅對(duì)一種特征進(jìn)行提取,往往果實(shí)的識(shí)別精準(zhǔn)度會(huì)不穩(wěn)定且有所下降。因此,采用多特征尺度對(duì)果實(shí)識(shí)別具有更高的精準(zhǔn)度和魯棒性。如麥春艷等[26]使用RGB-D 相機(jī)提取自然環(huán)境下蘋(píng)果的顏色特征,并結(jié)合圖像的深度信息進(jìn)行三維球體形狀提取,在存在干擾的情況下仍有較高的識(shí)別率,其果實(shí)正確識(shí)別率達(dá)95.5%。
機(jī)器學(xué)習(xí)是一種發(fā)現(xiàn)數(shù)據(jù)集中規(guī)則和模式的技術(shù),通過(guò)自動(dòng)分析數(shù)據(jù)集以獲得顯著結(jié)構(gòu)規(guī)律[27]。機(jī)器學(xué)習(xí)能夠使用來(lái)自多個(gè)潛在互連的數(shù)據(jù)集自主解決大型非線(xiàn)性問(wèn)題,為數(shù)據(jù)驅(qū)動(dòng)決策提供了一個(gè)強(qiáng)大而靈活的框架,在真實(shí)場(chǎng)景中實(shí)現(xiàn)更好的決策和明智的行動(dòng)[28],如基于最近鄰(K-Nearest Neighbor,KNN)算法、基于樸素貝葉斯分類(lèi)(Native Bayesian Classifier,NB)算法、基于支持向量機(jī)(Support Vector Machine,SVM)算法、人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,ANN)、基于K-means 聚類(lèi)算法等。
KNN 在機(jī)器學(xué)習(xí)中為最簡(jiǎn)單的學(xué)習(xí)算法,通過(guò)從訓(xùn)練集找到與新樣本最接近的K 條數(shù)據(jù),從而判斷新樣本的類(lèi)別。如GILL[29]采用KNN 分類(lèi)器算法對(duì)紅蘋(píng)果、金蘋(píng)果、青蘋(píng)果、橙子、香蕉進(jìn)行分類(lèi),最終準(zhǔn)確率為100% 。
SVM 是有監(jiān)督的分類(lèi)學(xué)習(xí)算法,主要為解決小樣本數(shù)據(jù)的學(xué)習(xí)和分類(lèi)預(yù)測(cè),具有很好的分類(lèi)準(zhǔn)確率。PENG 等[30]使用SVM 分類(lèi)器對(duì)水果進(jìn)行分類(lèi)識(shí)別,對(duì)蘋(píng)果、柑橘的識(shí)別率分別為95%、97.5%。
ANN 是一種類(lèi)似于大腦神經(jīng)結(jié)構(gòu)進(jìn)行的數(shù)學(xué)模型。如趙玲等[14]建立BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,判斷果實(shí)成熟度等級(jí),正確識(shí)別率大于90%。
K-means 聚類(lèi)算法是通過(guò)確定k 個(gè)中心點(diǎn),尋找所有數(shù)據(jù)點(diǎn)到其各自聚類(lèi)中心的距離之和的最小值,從而判斷該數(shù)據(jù)樣本是屬于哪一類(lèi)別。如劉剛、高瑞[31]使用K-means 聚類(lèi)算法對(duì)圖像進(jìn)行聚類(lèi)分割,最終識(shí)別正確率高于81%。宋懷波等[32]使用K-means聚類(lèi)對(duì)蘋(píng)果圖像進(jìn)行處理,結(jié)合凸殼理論提取果實(shí)輪廓,實(shí)現(xiàn)果實(shí)的識(shí)別定位,該方法的平均識(shí)別定位誤差只有4.28%。
同時(shí)也有使用多分類(lèi)器結(jié)合識(shí)別的,如朱玲[33]采用K-means 聚類(lèi)對(duì)蘋(píng)果、梨子、火龍果、石榴、香蕉、橘子進(jìn)行分類(lèi)識(shí)別,并在K-means 聚類(lèi)算法基礎(chǔ)上加入BP 神經(jīng)網(wǎng)絡(luò),最終分類(lèi)識(shí)別準(zhǔn)確率為96.28%,并且大大減少了識(shí)別時(shí)間。
由于不同的分類(lèi)器對(duì)同樣的水果識(shí)別準(zhǔn)確率不一樣,為解決此問(wèn)題,蔡浩等[16]提出了一種基于多分類(lèi)器DS(Dempster Shafer)證據(jù)理論融合的水果識(shí)別方法,根據(jù)不同分類(lèi)器對(duì)5 種水果的識(shí)別準(zhǔn)確率,使用基本概率函數(shù)將分類(lèi)器進(jìn)行DS 證據(jù)理論融合。其中文獻(xiàn)[16]的識(shí)別結(jié)果見(jiàn)表1。
表1 文獻(xiàn)[16]樣本集識(shí)別結(jié)果
深度學(xué)習(xí)是通過(guò)采用多個(gè)特征層進(jìn)行深度卷積,并從大量的數(shù)據(jù)中自動(dòng)學(xué)習(xí)圖像特征[34]。近年來(lái),因其對(duì)目標(biāo)識(shí)別分割具有良好識(shí)別精度和速度,其在水果采摘機(jī)器人的目標(biāo)識(shí)別上也逐漸被廣泛應(yīng)用。對(duì)于果實(shí)識(shí)別,主要使用算法有RCNN(Region Convolutional Neural Networks)系列、SSD(Single Shot Multibox Detector)、YOLOv1~v5、CenterNet 等。
Faster RCNN 是兩個(gè)階段的目標(biāo)檢測(cè)算法,其網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,因此訓(xùn)練與識(shí)別速度慢,但檢測(cè)目標(biāo)的精度高。如熊俊濤等[35]使用Faster RCNN 對(duì)自然環(huán)境下的綠色柑橘檢測(cè),最終得到的模型平均精度為85.49%,處理1 張圖像的平均時(shí)間為0.4 s。
SSD、YOLO 系列為一個(gè)階段的目標(biāo)檢測(cè)算法,其算法對(duì)目標(biāo)檢測(cè)與分類(lèi)是同時(shí)進(jìn)行的,其優(yōu)勢(shì)就是速度快,但因其訓(xùn)練目標(biāo)與背景數(shù)量不平衡,導(dǎo)致算法的準(zhǔn)確率降低。如LIANG 等[36]提出了一種基于SSD 算法的樹(shù)上芒果實(shí)時(shí)檢測(cè)框架,得到模型F1 分?jǐn)?shù)為0.911,識(shí)別速度為35 fps/s,檢測(cè)性能比Faster RCNN 更高。趙德安等[37]為提高蘋(píng)果采摘機(jī)器人的效率與適應(yīng)性,提出使用YOLOv3 對(duì)蘋(píng)果識(shí)別定位方法,其平均精度為87.71%,單張圖像的處理速度為16.69 ms,在復(fù)雜環(huán)境下魯棒性高。
CenterNet 是一種中心網(wǎng)絡(luò)算法,是基于anchorfree 的目標(biāo)檢測(cè),它相對(duì)于一些其他基于box 的網(wǎng)絡(luò)算法更簡(jiǎn)單、速度更快。如李小敏等[38]使用CenterNet 網(wǎng)絡(luò)模型對(duì)林下落果柑橘進(jìn)行檢測(cè)識(shí)別,經(jīng)過(guò)訓(xùn)練后的模型的識(shí)別準(zhǔn)確率大于90%,單張圖像識(shí)別速度小于0.3 s,為研究不同深度學(xué)習(xí)框架在實(shí)際果園環(huán)境中識(shí)別效率與準(zhǔn)確性,此文使用了4種算法進(jìn)行落果檢測(cè)性能比較,得到Y(jié)OLOv3 識(shí)別性能最佳,各模型性能如表2 所示。
表2 文獻(xiàn)[38]不同模型性能
數(shù)據(jù)增強(qiáng)是一種擴(kuò)充數(shù)據(jù)規(guī)模的有效方法[39],一定程度可提高目標(biāo)檢測(cè)算法的性能指標(biāo)。對(duì)于運(yùn)用在水果目標(biāo)檢測(cè)數(shù)據(jù)集的數(shù)據(jù)增強(qiáng)方法有翻轉(zhuǎn)、旋轉(zhuǎn)、亮度變換、縮放、裁剪、噪聲、模糊、隨機(jī)擦除和Retinex 圖像增強(qiáng)等。如TIAN 等[40]對(duì)蘋(píng)果圖像在顏色、亮度、旋轉(zhuǎn)和模糊方面進(jìn)行了預(yù)處理。同時(shí)為了驗(yàn)證數(shù)據(jù)增強(qiáng)對(duì)模型性能的影響,采用控制變量方法每次刪除一種數(shù)據(jù)增強(qiáng),并獲得IOU 值和F1 分?jǐn)?shù)。結(jié)果如表3 所示。
表3 使用控制變量方法訓(xùn)練的模型的F1分?jǐn)?shù)和IOU值[40]
張磊等[41]對(duì)蘋(píng)果、桃子、橙子數(shù)據(jù)集采用了翻轉(zhuǎn)、0°~180°隨機(jī)旋轉(zhuǎn)以及縮放處理操作。為了驗(yàn)證不同訓(xùn)練集數(shù)量對(duì)模型性能的影響,控制訓(xùn)練集圖片數(shù)目為10、50、100 和500 進(jìn)行模型訓(xùn)練,精準(zhǔn)率和召回率隨著訓(xùn)練圖片數(shù)量的增加而上升,同時(shí)模型檢測(cè)性能更好。
Retinex 是一種科研中常用的圖像增強(qiáng)方法,它可以減少光照不均對(duì)圖像的影響,改善圖像整體的視覺(jué)感觀。JI 等[42]為解決光照對(duì)果園中柑橘識(shí)別的影響,使用Retinex 對(duì)采集的圖像進(jìn)行優(yōu)化處理,并使用YOLOv5 算法進(jìn)行訓(xùn)練,通過(guò)對(duì)比不同時(shí)間和不同的Retinex 圖像增強(qiáng)方法,得到在10:00-11:00和14:00-15:00 時(shí)段采集的數(shù)據(jù),使用多尺度Retinex的模型比原模型平均精度高9.28%,其他方法均對(duì)模型平均精度有一定的提升。
此外,文獻(xiàn)[43-47]均使用了圖像增強(qiáng)方法對(duì)數(shù)據(jù)集進(jìn)行優(yōu)化。
不同的檢測(cè)目標(biāo)的算法模型性能不同,對(duì)算法模型改進(jìn),其目的就是為了獲得更好的檢測(cè)性能,更好對(duì)目標(biāo)特征進(jìn)行提取。算法模型改進(jìn)主要可以從主干特征提取網(wǎng)絡(luò)、特征金字塔網(wǎng)絡(luò)、損失函數(shù)、卷積核大小、注意力機(jī)制等方面進(jìn)行。其主干特征提取網(wǎng)絡(luò)主要有LeNet、AlexNet、ZFNet、DSPNet、GoogleNet、VGGNet、ResNet、MobileNetv1~v3、DenseNet 等。
如李林升等[43]對(duì)Faster RCNN 中的RPN 網(wǎng)絡(luò)進(jìn)行改進(jìn)。改進(jìn)后對(duì)蘋(píng)果識(shí)別準(zhǔn)確率提高2.3%,達(dá)到了97.6%,但由于卷積核增加,模型訓(xùn)練和識(shí)別速度有所下降。
閆建偉等[44]提出改進(jìn)Faster RCNN 刺梨果實(shí)識(shí)別方法,將算法中感興趣區(qū)域池化改進(jìn)為感興趣區(qū)域校準(zhǔn)區(qū)域特征聚集方式,提高模型準(zhǔn)確率,并使用VGG16 代替Faster RCNN 主干特征提取網(wǎng)絡(luò),其準(zhǔn)確率達(dá)95.53%,每幅圖像識(shí)別時(shí)間為0.2 s,有一定實(shí)時(shí)性。
彭紅星等[45]以蘋(píng)果、荔枝等4 種水果為對(duì)象,將傳統(tǒng)SSD 算法中的主干網(wǎng)絡(luò)模型VGG16 替換為ResNet101,并使用遷移學(xué)習(xí)方法降低訓(xùn)練時(shí)間,最終改進(jìn)后模型平均精度為89.53%,提升了3.15%,但此模型的檢測(cè)速度比原始模型增加了0.09 s,實(shí)時(shí)性下降。
趙輝等[46]為使采摘機(jī)器人在自然果園環(huán)境下可以對(duì)不同成熟度的蘋(píng)果實(shí)現(xiàn)快速、精準(zhǔn)識(shí)別,改進(jìn)了YOLOv3 算法,通過(guò)將殘差網(wǎng)絡(luò)與CSPNet 結(jié)合,降低網(wǎng)絡(luò)參數(shù)量。在特征提取FPN(Feature Pyramid Networks)網(wǎng)絡(luò)中加入SPP(Spatial Pyramid Pooling)網(wǎng)絡(luò),提高召回率。使用Soft 非極大值抑制算法代替?zhèn)鹘y(tǒng)非極大值抑制算法,最后再使用Focal Loss 和CIoU Loss 優(yōu)化損失函數(shù)。最終改進(jìn)后的模型平均精度達(dá)96.3%,提高了3.8%,檢測(cè)平均速度為27.8 fps/s,實(shí)時(shí)性高。
陳文康等[47]針對(duì)果園中柑橘目標(biāo)小且遮擋嚴(yán)重等問(wèn)題,對(duì)YOLOv4 算法進(jìn)行改進(jìn),通過(guò)Canopy算法和K-Means++算法優(yōu)化先驗(yàn)框,在尺度特征變化的輸出層后加入1 個(gè)調(diào)整層,并將殘差網(wǎng)絡(luò)與DenseNet 結(jié)合,優(yōu)化損失函數(shù),提高對(duì)小柑橘的識(shí)別率,最后去除一些通道和網(wǎng)絡(luò)層,降低模型參數(shù)量。最終改進(jìn)后的模型對(duì)不同生長(zhǎng)階段的柑橘識(shí)別準(zhǔn)確率為96.04%,每張圖像的檢測(cè)平均時(shí)間為0.06 s,實(shí)時(shí)性高。
李志軍等[48]為提升果園蘋(píng)果測(cè)產(chǎn)準(zhǔn)確率,對(duì)YOLOv5 算法進(jìn)行改進(jìn),通過(guò)將YOLOv5 中特征提取網(wǎng)絡(luò)的普通卷積替換為深度可分離卷積,并加入注意力機(jī)制,兩者結(jié)合構(gòu)成池化注意力模塊,改進(jìn)后平均精度達(dá)96.79%,檢測(cè)速度最大提升了15.37%,具有良好準(zhǔn)確性和實(shí)時(shí)性。
夏雪等[49]提出改進(jìn)算法輕量級(jí)無(wú)錨點(diǎn)深度學(xué)習(xí)網(wǎng)絡(luò)模型(M-CenterNet)對(duì)果園蘋(píng)果檢測(cè),其通過(guò)使用輕量級(jí)的MobileNetv3 網(wǎng)絡(luò)代替CenterNet 算法中的主干網(wǎng)絡(luò),同時(shí)在MobileNetv3 中加入了基于壓縮與激勵(lì)結(jié)構(gòu)輕量級(jí)注意力模塊,增強(qiáng)網(wǎng)絡(luò)學(xué)習(xí)能力。最終平均精度為88.9%,模型大小為14.2 M,檢測(cè)速度為8.1 fps/s,比SSD 算法提高了近1 倍。
兩階段網(wǎng)絡(luò)算法由于網(wǎng)絡(luò)本身參數(shù)量大的原因,經(jīng)過(guò)改進(jìn)后雖能一定程度上提高檢測(cè)精度和速度,但實(shí)時(shí)性仍然較低。一階段網(wǎng)絡(luò)算法其網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)量較低,經(jīng)過(guò)改進(jìn)后,其表現(xiàn)出良好的檢測(cè)性能,其中YOLO 算法表現(xiàn)出的檢測(cè)性能最佳。
1)傳統(tǒng)的圖像處理技術(shù)用作目標(biāo)檢測(cè),其檢測(cè)精度受自然環(huán)境的影響程度高,環(huán)境中的光照變化、果實(shí)與枝葉之間的無(wú)規(guī)律遮擋、果實(shí)生長(zhǎng)姿態(tài)的不確定性,對(duì)其特征提取會(huì)造成極大的干擾,即使使用多特征提取相結(jié)合的方法,仍無(wú)法對(duì)自然環(huán)境中果實(shí)實(shí)現(xiàn)較好的檢測(cè)效果。
2)機(jī)器學(xué)習(xí)算法運(yùn)用在目標(biāo)檢測(cè),其檢測(cè)性能優(yōu)于傳統(tǒng)的圖像處理技術(shù),通過(guò)多分類(lèi)器融合并結(jié)合傳統(tǒng)的圖像處理技術(shù),在一定情況下可表現(xiàn)出良好的檢測(cè)效果,但其對(duì)數(shù)據(jù)依賴(lài)性強(qiáng),且需要提前設(shè)定好各種分類(lèi)參數(shù),對(duì)訓(xùn)練結(jié)果影響大。當(dāng)環(huán)境多變時(shí),其檢測(cè)性能會(huì)受到很大的影響。
3)深度學(xué)習(xí)算法對(duì)圖像目標(biāo)特征具有很好的提取能力,經(jīng)過(guò)訓(xùn)練后得到的模型,其檢測(cè)性能受自然環(huán)境變化的干擾程度低。此外,兩階段網(wǎng)絡(luò)算法雖表現(xiàn)出良好的識(shí)別準(zhǔn)確率,但其檢測(cè)的實(shí)時(shí)性低。而一階段和CenterNet 算法準(zhǔn)確率與速度并存,在一些情況下,其準(zhǔn)確率更高于二階段算法,但一階段算法對(duì)于小目標(biāo)檢測(cè)性能較差。
4)數(shù)據(jù)增強(qiáng)在對(duì)果實(shí)目標(biāo)檢測(cè)的深度學(xué)習(xí)算法的模型性能中展現(xiàn)出了極大的價(jià)值。數(shù)據(jù)增強(qiáng)作為深度學(xué)習(xí)算法數(shù)據(jù)集圖像預(yù)處理方法,通過(guò)增加圖像目標(biāo)數(shù)量和質(zhì)量來(lái)提高模型平均精度、F1 分?jǐn)?shù)等,已得到較廣泛的應(yīng)用。
5)深度學(xué)習(xí)算法模型的改進(jìn)就是為了使模型對(duì)目標(biāo)具有更好的檢測(cè)性能。其主干特征提取網(wǎng)絡(luò)一般選用參數(shù)量小的DSPNet、MobileNetv1~v3 和網(wǎng)絡(luò)深度高的ResNet 等網(wǎng)絡(luò)。對(duì)于水果采摘機(jī)器人的目標(biāo)檢測(cè)算法,應(yīng)根據(jù)對(duì)應(yīng)的識(shí)別目標(biāo)進(jìn)行改進(jìn),以此使算法更適合識(shí)別目標(biāo)的檢測(cè),提高模型檢測(cè)性能。因此,深度學(xué)習(xí)算法更適合作為水果采摘機(jī)器人的目標(biāo)檢測(cè)算法。
6)從水果采摘機(jī)器人的目標(biāo)檢測(cè)算法的發(fā)展來(lái)看,傳統(tǒng)的圖像處理技術(shù)和機(jī)器學(xué)習(xí)算法作為其檢測(cè)系統(tǒng)已經(jīng)越來(lái)越少,深度學(xué)習(xí)算法表現(xiàn)出來(lái)的良好識(shí)別能力和抗干擾能力,使其魯棒性越來(lái)越高。