国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于深度學(xué)習(xí)的罐式煉爐送料口視覺檢測與跟蹤方法

2021-04-12 06:48:52河,李煥,羅
關(guān)鍵詞:準確率卷積聚類

閆 河,李 煥,羅 成

(1.重慶理工大學(xué),重慶 400054;2.重慶市兩江人工智能學(xué)院,重慶 401135)

在機械控制生產(chǎn)中,鐘料罐是必不可少的設(shè)備,而在視頻流中能夠準確、魯棒性地檢測與跟蹤送料口成為工業(yè)生產(chǎn)的重中之重。同時煉爐罐的負荷存在變化,轉(zhuǎn)速并非均勻。而且煉爐罐高溫易產(chǎn)生大量的煙霧,對送料口的檢測與跟蹤會有一定的干擾。

傳統(tǒng)圖像處理的目標檢測方法是通過手工設(shè)計特征來實現(xiàn)的,代表的特征有方向梯度直方圖HOG[1]、局部二值特征LBP[2]、尺度不變特征變換SIFT[3]等。分類器常見的有支持向量機SVM[4]、DPM[5]等。傳統(tǒng)的目標檢測存在2個主要的問題:一是需要手工的設(shè)計特征,滑動窗口的選擇往往沒有針對性,提取的特征不夠,最后檢測出來的目標存在漏檢及誤檢的問題,準確率低;二是對于多樣變化的物體,手工設(shè)計的特征魯棒性低。傳統(tǒng)視覺檢測和跟蹤算法受煉爐高溫產(chǎn)生煙霧的影響,易導(dǎo)致送料口檢測和跟蹤失效。

近年來,隨著AlexNet[6]網(wǎng)絡(luò)在ILS-VRC-2012比賽中取得勝利,深度學(xué)習(xí)中卷積神經(jīng)網(wǎng)絡(luò)(CNN)[7]逐漸的走入研究者的視線中,卷積神經(jīng)網(wǎng)絡(luò)具有快速特征提取和分類的特點。相比較于傳統(tǒng)的目標檢測,深度學(xué)習(xí)提取到的特征更多更豐富?;诖颂卣鳎芯咳藛T提出了一系列目標檢測算法。在2014年Girshick等[8]提出了區(qū)域卷積神經(jīng)網(wǎng)絡(luò)(RCNN),該網(wǎng)絡(luò)首次使用候選區(qū)域(region proposal)網(wǎng)絡(luò)代替?zhèn)鹘y(tǒng)目標中使用的滑動窗口的方法,使用卷積神經(jīng)網(wǎng)絡(luò)提取特征,輸入到支持向量機中訓(xùn)練。該網(wǎng)絡(luò)訓(xùn)練速度慢、占用磁盤空間大。在此基礎(chǔ)上Girshick[9]提出了快速區(qū)域網(wǎng)絡(luò)(fast RCNN),該網(wǎng)絡(luò)在最后一層之后加入ROI Pooling層,生成固定尺寸的特征圖,相較于RCNN訓(xùn)練速度有所提升。Ren等[10]提出了超快速區(qū)域卷積神經(jīng)網(wǎng)絡(luò)(faster RCNN)首次使用RPN(region proposal network)[11]代替原來的Selective Search[12]方法生成建議窗口,從最初的2 000個減少為300個,提取到的特征更多,訓(xùn)練速度更快、準確高。在準確率的基礎(chǔ)上,為了提高檢測速率,Redmom等[13]提出了一種更為輕量級的Yolo網(wǎng)絡(luò),該網(wǎng)絡(luò)的核心思想是將整張圖作為網(wǎng)絡(luò)的輸入,直接在輸出層分類和回歸,這樣保留了檢測目標全部的特征,訓(xùn)練效果更好,在coco數(shù)據(jù)集[14]能跑45 fps。接著Redmom又提出了Yolo v2[15]和Yolo v3[16]網(wǎng)絡(luò),其中Yolo v3速度更快,檢測準確率更高。實現(xiàn)了在coco數(shù)據(jù)集上51 ms時間內(nèi)map達到57.9的效果。由此可見,Yolo v3網(wǎng)絡(luò)在兼顧準確率的同時,也能有很好的檢測速率。

1 Yolo V3原理

在CVPR2016上,Yolo v3是由Redmom等人提出的一種端到端的網(wǎng)絡(luò)。它放棄了之前Faster RCNN網(wǎng)絡(luò)中使用Two Stage方法,在圖片上直接生成區(qū)域建議的步驟,而是直接將整張圖片作為卷積神經(jīng)網(wǎng)絡(luò)的輸入,在輸出層直接回歸目標的位置及目標所屬的類別,極大地提高了目標檢測的準確率。

1.1 Darknet-53網(wǎng)絡(luò)

Yolo v3使用一個全新的、更深層次的卷積神經(jīng)網(wǎng)絡(luò)Darknet-53,這個網(wǎng)絡(luò)是由多個殘差單元疊加組成的。相比較在Yolo V2中使用的Darknet_19網(wǎng)絡(luò),該網(wǎng)絡(luò)主要是由連續(xù)的1×1和3×3的卷積層組成的,包含有53個卷積層和5個池化層,每個卷積層后面都會有一個批量歸一化層(batch normalization)[17]。為了解決過擬合的問題,加入了去droput處理。引入多尺度融合的思想,能夠更好地檢測小目標,網(wǎng)絡(luò)結(jié)構(gòu)圖如圖1所示。

圖1 Darkent-53網(wǎng)絡(luò)部分結(jié)構(gòu)圖

1.2 多尺度特征融合

Yolo網(wǎng)絡(luò)使用的端到端的思想,就是將整張圖片作為神經(jīng)網(wǎng)絡(luò)的輸入,提取特征、檢測速度比較快。但是在檢測小目標的時候效果較差,這是因為神經(jīng)網(wǎng)絡(luò)中低層中的特征語義信息相對較少,但是目標位置信息準確。高層的特征語義信息比較豐富,感受野大,但是位置信息就相對較少。為了解決這個問題,Yolo網(wǎng)絡(luò)借鑒了FPN[18]思想,采用上采樣融合的方式,融合3個尺度(13×13,26×26,52×52),在多個尺度的特征圖(feature map)上單獨檢測、預(yù)測目標的位置以及類別,最終對小目標的檢測效果有比較明顯的提升。

1.3 信息預(yù)測

Yolo v3繼續(xù)使用在Yolo v2中K-means[19]聚類方式做Anchor Box[20]的初始化,這種通過加入先驗知識的方式,不需要提前對目標的位置坐標進行訓(xùn)練,而是為每種下采樣尺度設(shè)定3種先驗框,總共聚類9種,具有最大感受野的目標,應(yīng)用較大的先驗框,比較適合檢測較大的對象。具有最小感受野的目標,應(yīng)用較小的先驗框,比較適合檢測較小的目標。

在預(yù)測目標的類別時候,拋棄以往使用的softmax分類器,改為使用logistic分類器的輸出進行預(yù)測。這是因為softmax只支持單一的類別預(yù)測,而logistic能夠支持多標簽多類別的對象。

2 改進的方法

Yolo v3網(wǎng)絡(luò)在目標檢測領(lǐng)域取得了較好的效果,原文獻中的網(wǎng)絡(luò)是基于COCO數(shù)據(jù)集進行訓(xùn)練的,該數(shù)據(jù)集包含90種類別的目標,目標之間尺度變化大、特征明顯。而本文中主要是使用Yolo v3網(wǎng)絡(luò)對送料口進行檢測與跟蹤,送料口不屬于數(shù)據(jù)集中的一類,且屬于小目標,需要對Yolo v3網(wǎng)絡(luò)進行適當?shù)母倪M,以便適用于送料口數(shù)據(jù)集的檢測。基于數(shù)據(jù)集的聚類方法改進如下。

在Yolo v3網(wǎng)絡(luò)中借鑒Faster RCNN網(wǎng)絡(luò)提出的anchor boxes方法作為先驗框,對目標進行預(yù)測。而在Faster RCNN網(wǎng)絡(luò)中需要提前手工設(shè)定先驗框,然后在之后的訓(xùn)練中調(diào)整anchor boxes的尺寸,這是按照研究者的經(jīng)驗而定,人工主觀性比較強。如果能以某種方式,自動地選擇一個合適的先驗框,這樣卷積神經(jīng)網(wǎng)絡(luò)將會更容易的學(xué)習(xí),做出更準確的檢測。為了解決這個問題,Yolo v3網(wǎng)絡(luò)中采用維度聚類的方法,使用K-means方法計算出anchor boxes的個數(shù)和尺寸,對數(shù)據(jù)集的目標預(yù)測框大小進行聚類。

K-means方法中通常使用曼哈頓距離、歐式距離等計算方式來判斷兩點間的距離,然后當檢測目標較小,先驗框的尺寸較大的時候,使用這種方式得到的誤差也更大。當使用歐式距離作為計算公式的時候,大的候選框比小的候選框會產(chǎn)生更多的錯誤,從而影響檢測結(jié)果。為了讓預(yù)測框與groundtruth的交并比(IOU)更大,并且IOU是與anchor boxes的尺寸無關(guān)的,且能夠適用于本文中的送料口數(shù)據(jù)集,本文使用一種新的距離公式,有:

式中:centroid表示簇的中心;box表示檢測目標的邊框信息;IOU表示簇中心框的值與聚類得到的框的交并比。其中IOU交并比公式為:

式中:A表示真實框;B表示預(yù)測框。IOU交并比越大,表示預(yù)測的值越準確。

本文使用送料口數(shù)據(jù)集進行聚類分析研究,選取K=1,2,3,4,5,6,7,8,9,得到的結(jié)果中心個數(shù)K與距離之間的關(guān)系,如圖2所示。

圖2 K-means聚類圖

由圖2可以看出,當K=4的時候,折線開始變得平緩。因此針對本文中送料口數(shù)據(jù)集,選擇anchor boxes的數(shù)量為4,在預(yù)測框上設(shè)定4個聚類中心框,可以得到比較好IOU的值,在本文的訓(xùn)練集上使用K-means方法得到的4種尺寸大小為(15,43),(16,25),(22,38),(40,75)。

由圖1可知,Yolo v3網(wǎng)絡(luò)在COCO數(shù)據(jù)集上分別對52×52,26×26,13×13大小的分辨率圖像進行預(yù)測,而本文只檢測送料口,且屬于小目標,通過K-means方法聚類得到的最大anchor boxes尺寸大小為(40,75),如果使用52×52尺度上預(yù)測,會導(dǎo)致誤檢的現(xiàn)象,因此本文針對送料口數(shù)據(jù)集的情況,僅使用26×26和13×13尺度下預(yù)測,每種尺度有2種anchor boxes。

3 實驗結(jié)果

3.1 自建數(shù)據(jù)樣本

本文實驗室環(huán)境下,讓視頻流中勻速轉(zhuǎn)動的鐘料罐不斷采集每一幀的圖片,自建大量有煙霧干擾的圖片樣本,總共1 100張。然后將整理得到的照片統(tǒng)一裁剪416×416像素,以適應(yīng)Yolo v3網(wǎng)絡(luò)訓(xùn)練集大小。為了擴充數(shù)據(jù)集的數(shù)量,增加樣本的多樣性,對圖片進行數(shù)據(jù)增強,比如隨機裁剪、旋轉(zhuǎn)、翻轉(zhuǎn)等,將數(shù)據(jù)集增加到2 500張。通過數(shù)據(jù)增強的方法不會丟失圖片的特征,可以增加數(shù)據(jù)集的多樣性。圖3表示使用LabelImg工具制作數(shù)據(jù)集的過程。得到矩形框的位置信息(Xmin,Ymin,Xmax,Ymax)和目標類別的信息。然后制作成VOC數(shù)據(jù)集的格式,并按照訓(xùn)練集∶測試集∶驗證集=7∶2∶1的比例進行分配數(shù)據(jù)集。

圖3 數(shù)據(jù)集制作圖

3.2 實驗結(jié)果

為了驗證Yolo v3網(wǎng)絡(luò)在本文中對送料口的檢測效果,實驗平臺采用的是Inter(R)Xeon(R)cpu E5-2630 v4,GPU采用的是英偉達K80顯卡,操作系統(tǒng)為win7 64位,深度學(xué)習(xí)框架:darknet-53。

針對送料口數(shù)據(jù)集,需要對Yolo V3的網(wǎng)絡(luò)訓(xùn)練過程進行適當?shù)母淖?。載入權(quán)重模型,epoch訓(xùn)練50次,訓(xùn)練的batch_size為6,學(xué)習(xí)率為0.001。大概訓(xùn)練12 h后Loss值趨于穩(wěn)定,基本收斂,得到最終的檢測模型。

不同閾值檢測效果對比。在深度學(xué)習(xí)檢測過程中,可以為目標設(shè)定一個閾值,低于該值的預(yù)測框都會被拋棄,不顯示出來。在原文中,作者使用的閾值score=0.35,為了在本文的數(shù)據(jù)集中得到最佳的閾值,對比6組不同閾值大小進行試驗(見圖4),不同閾值下的數(shù)據(jù)如表1所示。

表1 不同閾值下的數(shù)據(jù)

圖4為6組不同閾值大小的實驗結(jié)果,當閾值過高或過低的時候,漏檢或誤檢率較高。當閾值score=0.5的時候檢測效果較好。

圖4 不同閾值對比圖

表1中預(yù)測框的個數(shù)表示為在當前閾值下,生成的預(yù)測框平均個數(shù)。由表1可知,在閾值score=0.5的時候,誤檢率最低.因此本文中使用改進的后的Yolo v3網(wǎng)絡(luò)進行檢測,采用閾值為0.5,能得到較好的檢測結(jié)果。

為了驗證改進后的Yolo v3網(wǎng)絡(luò)的性能,在本文實驗中使用送料口測試集對訓(xùn)練完成的模型進行檢測,分別計算準確率和召回率以及檢測速率,其中準確率計算公式為:

式(3)中:Tp表示正確檢測出來的送料口數(shù)量;Fp表示被誤檢的送料口數(shù)量。

由表2可知,與Yolo v3方法以及傳統(tǒng)的目標檢測HOG+SVM進行對比,本文方法準確率達到了97.20%,改變聚類方法及多尺度特征融合的方式,能夠準確地檢測目標,而原文中Yolo v3網(wǎng)絡(luò)使用6種anchor boxes方式以及閾值設(shè)置的不正確,會導(dǎo)致目標的漏檢以及誤檢的情況。而傳統(tǒng)的目標檢測方法需要經(jīng)過一系列人為的手工設(shè)定特征,進行多步驟圖像預(yù)處理,且在受煉爐高溫產(chǎn)生煙霧的影響下,檢測準確率以及檢測速度都不及深度學(xué)習(xí)方法。

表2 實驗數(shù)據(jù)

而在工業(yè)生產(chǎn)中,非勻速轉(zhuǎn)動送料口,位置及形狀都發(fā)生變化,再加上煙霧及周圍環(huán)境的干擾,使得傳統(tǒng)的目標檢測方法很難檢測出來。本文中改進后的Yolo v3網(wǎng)絡(luò)具有極強的泛化性和魯棒性,檢測速度達到30幀/s,基本上能滿足工業(yè)上的需求。圖5表示多幀效果。

圖5 多幀效果圖

4 結(jié)論

針對在實驗場景下送料口的檢測與跟蹤問題,本文提出了基于Yolo v3改進的目標檢測方法。根據(jù)本文中數(shù)據(jù)集中的尺度,對網(wǎng)絡(luò)結(jié)構(gòu)做出改進,使用K-means聚類的方法,得到最適合本數(shù)據(jù)集的尺寸大小。經(jīng)實驗表明,本文改進的網(wǎng)絡(luò)在檢測準確率以及檢測速度上,基本能滿足工業(yè)控制生產(chǎn)的要求。

猜你喜歡
準確率卷積聚類
基于3D-Winograd的快速卷積算法設(shè)計及FPGA實現(xiàn)
乳腺超聲檢查診斷乳腺腫瘤的特異度及準確率分析
健康之家(2021年19期)2021-05-23 11:17:39
不同序列磁共振成像診斷脊柱損傷的臨床準確率比較探討
2015—2017 年寧夏各天氣預(yù)報參考產(chǎn)品質(zhì)量檢驗分析
從濾波器理解卷積
電子制作(2019年11期)2019-07-04 00:34:38
高速公路車牌識別標識站準確率驗證法
基于傅里葉域卷積表示的目標跟蹤算法
基于DBSACN聚類算法的XML文檔聚類
電子測試(2017年15期)2017-12-18 07:19:27
基于改進的遺傳算法的模糊聚類算法
一種層次初始的聚類個數(shù)自適應(yīng)的聚類方法研究
阿鲁科尔沁旗| 灌南县| 宜兰县| 长治县| 武邑县| 冕宁县| 晴隆县| 夏邑县| 张家口市| 汾阳市| 临朐县| 大姚县| 西城区| 河曲县| 达拉特旗| 金坛市| 六安市| 鸡西市| 友谊县| 兴城市| 沙河市| 大荔县| 合阳县| 藁城市| 且末县| 城固县| 辉县市| 云和县| 泾川县| 扶沟县| 东乌珠穆沁旗| 秦皇岛市| 定日县| 鹤岗市| 炉霍县| 杭锦旗| 桐乡市| 偃师市| 平邑县| 安吉县| 磐石市|