国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

改進(jìn)的YOLOv4模型在自動(dòng)駕駛多目標(biāo)檢測(cè)的應(yīng)用

2021-11-03 09:23:44成都錦城學(xué)院自動(dòng)駕駛實(shí)驗(yàn)室陳旭淼張皞宇
電子世界 2021年18期
關(guān)鍵詞:錨框卷積聚類

成都錦城學(xué)院自動(dòng)駕駛實(shí)驗(yàn)室 高 揚(yáng) 陳旭淼 張皞宇

目標(biāo)檢測(cè)是自動(dòng)駕駛汽車與外界環(huán)境實(shí)現(xiàn)信息交互的重要環(huán)節(jié),為了能有效地對(duì)多個(gè)目標(biāo)進(jìn)行實(shí)時(shí)檢測(cè),本文針對(duì)在道路目標(biāo)檢測(cè)中小目標(biāo)和被物體遮擋的目標(biāo)易被漏檢或檢測(cè)框定位不準(zhǔn)確等問(wèn)題,提出一種基于YOLOv4的目標(biāo)檢測(cè)模型。增加152x152的特征融合結(jié)構(gòu),減少每個(gè)YOLO層前的兩個(gè)卷積層,以優(yōu)化目標(biāo)特征提取,模型訓(xùn)練前用kmeans++聚類算法優(yōu)化錨框,以提升模型對(duì)自動(dòng)駕駛多目標(biāo)的檢測(cè)性能。實(shí)驗(yàn)結(jié)果表明,本文改進(jìn)YOLOv4算法比原始算法提升1.5個(gè)百分點(diǎn),在檢測(cè)精度和檢測(cè)速度上均有一定提升,改進(jìn)算法具有一定的實(shí)用價(jià)值。

自動(dòng)駕駛汽車是未來(lái)汽車產(chǎn)業(yè)發(fā)展的必然趨勢(shì),也是具有革命性影響的交通工具。自動(dòng)駕駛技術(shù)涉及計(jì)算機(jī)科學(xué)、車輛工程、傳感器技術(shù)等交叉學(xué)科內(nèi)容,它對(duì)于社會(huì)經(jīng)濟(jì)發(fā)展、科學(xué)技術(shù)研究等方面都有重大影響。在自動(dòng)駕駛技術(shù)的組成單元中,環(huán)境感知是至關(guān)重要的環(huán)節(jié)。其中多目標(biāo)檢測(cè)是環(huán)境感知的重要分支,通過(guò)對(duì)行人、車輛、交通信號(hào)燈、交通標(biāo)志等物體的檢測(cè),結(jié)合激光雷達(dá)的探測(cè)、道路交通規(guī)則以及汽車行駛狀態(tài)等信息對(duì)自動(dòng)駕駛汽車進(jìn)行規(guī)劃與控制。

本文基于YOLOv4網(wǎng)絡(luò),增加152x152的特征融合結(jié)構(gòu),用于提升小目標(biāo)檢測(cè)性能,優(yōu)化特征檢測(cè)層的卷積層數(shù),平衡網(wǎng)絡(luò)參數(shù),提高模型檢測(cè)速度,用kmeans++聚類算法優(yōu)化適用于本實(shí)驗(yàn)所用數(shù)據(jù)集的錨框,減少非必要誤差。

1 算法解析與改進(jìn)

1.1 多尺度特征融合結(jié)構(gòu)改進(jìn)

實(shí)際駕駛場(chǎng)景下部分目標(biāo)對(duì)象存在因距離或物體遮擋、重合等因素被漏檢或識(shí)別框定位不準(zhǔn)確等情況,多尺度特征融合層可以有效地解決此類問(wèn)題。本文提出一種采用四種檢測(cè)尺度的特征融合結(jié)構(gòu)。改進(jìn)后的YOLOv4網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)化圖如圖1所示,輸入圖像尺寸為608x608時(shí),在CSPDarkNet-53網(wǎng)絡(luò)的主體結(jié)構(gòu)中進(jìn)行五次下采樣,同時(shí)使用四個(gè)上采樣層作為FPN結(jié)構(gòu),使用三個(gè)PAN結(jié)構(gòu)組成特征金字塔。FPN結(jié)構(gòu)自下而上提取豐富的語(yǔ)義信息,PAN結(jié)構(gòu)自上而下提取準(zhǔn)確的位置信息,從而實(shí)現(xiàn)不同的主干層對(duì)不同的檢測(cè)層的特征融合。網(wǎng)絡(luò)檢測(cè)尺度增加到四個(gè)后得到的152x152、76x76、38x38和19x19的特征圖,能更有效地應(yīng)不同大小的目標(biāo)物體。

圖1 改進(jìn)YOLOv4網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)圖

1.2 特征檢測(cè)層優(yōu)化

為平衡網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)量和避免模型學(xué)習(xí)效果因網(wǎng)絡(luò)結(jié)構(gòu)加深而退化的情況,在每個(gè)YOLO層前減少兩個(gè)卷積層,由之前的5層卷積轉(zhuǎn)為3層卷積,如圖2所示。在平衡和避免以上情況的同時(shí)一定程度上提高了模型檢測(cè)速度,優(yōu)化了模型性能。

圖2 三層卷積

1.3 kmeans++聚類算法優(yōu)化錨框

為避免Anchor Box造成的聚類局部最優(yōu)的情況,本文采用K-means++聚類算法生成適用于本實(shí)驗(yàn)所用數(shù)據(jù)集的錨框,算法基本流程如下:

每個(gè)樣本點(diǎn)成為下一個(gè)聚類中心的概率為P,其計(jì)算公式為:

2 數(shù)據(jù)處理與實(shí)驗(yàn)分析

2.1 數(shù)據(jù)集處理與訓(xùn)練參數(shù)優(yōu)化

本文使用KITTI數(shù)據(jù)集訓(xùn)練YOLOv4系列模型。本文將KITTI數(shù)據(jù)集的Car、Van、Truck、Tram類合并為Car類,將Person_sitting、Pedestrain合并為Pedestrain類,Cyclist不變,共計(jì)三類。利用Python批處理方法將數(shù)據(jù)集處理為PASCAL VOC2007數(shù)據(jù)格式,訓(xùn)練集(含驗(yàn)證集)與測(cè)試集的比例為9:1,具體標(biāo)記圖數(shù)與標(biāo)記個(gè)數(shù)見(jiàn)表1所示。

表1 標(biāo)記數(shù)

數(shù)據(jù)集制作完成后,使用Kmeans++聚類算法生成適用于該數(shù)據(jù)集的錨框,聚類散點(diǎn)分布如圖6所示,12個(gè)錨框參數(shù)值分別為(13,40),(25,55),(13,116),(45,63),(33,92),(29,220),(62,104),(77,155),(58,305),(116,190),(133,300),(192,354)。

圖3 Kmeans++聚類散點(diǎn)圖

2.2 實(shí)驗(yàn)結(jié)果與分析

本文實(shí)驗(yàn)采用顯卡配置為Nvidia GeFo orce RTX 1080Ti的Windows操作系統(tǒng)和Darknet深度學(xué)習(xí)框架搭建實(shí)驗(yàn)環(huán)境。

在訓(xùn)練前需準(zhǔn)備預(yù)訓(xùn)練權(quán)重(即yolov4.conv.137文件),結(jié)合本文2.1節(jié)給出的參數(shù)優(yōu)化結(jié)果修改YOLOv4模型配置文件,以滿足本文所用數(shù)據(jù)集的訓(xùn)練要求,部分參數(shù)的設(shè)置詳見(jiàn)表2。初始學(xué)習(xí)率為0.0013,本文設(shè)置當(dāng)模型訓(xùn)練至總迭代次數(shù)的80%(24000輪)和90%(27000輪)時(shí)學(xué)習(xí)率下降90%,以達(dá)到訓(xùn)練初期模型快速收斂,訓(xùn)練后期模型收斂至最優(yōu)解的目的。

表2 部分訓(xùn)練參數(shù)

本文模型訓(xùn)練的損失值和平均精度均值變化如圖7所示,在前18000輪迭代中模型的loss值和mAP值變化相對(duì)較快,在迭代24000輪后loss值穩(wěn)定在1.6左右,迭代25000輪后mAP值穩(wěn)定在92%左右。

用k-means++聚類算法優(yōu)化錨框后,改進(jìn)的YOLOv4網(wǎng)絡(luò)在KITTI數(shù)據(jù)集上訓(xùn)練的mAP結(jié)果為91.99%,和原始YOLOv4在該數(shù)據(jù)集上訓(xùn)練的mAP結(jié)果相比,提升了1.5個(gè)百分點(diǎn)。為進(jìn)一步驗(yàn)證改進(jìn)模型的效果,將本文改進(jìn)模型與原YOLOv4模型、多尺度特征融合結(jié)構(gòu)改進(jìn)模型(YOLOv4-A)、特征檢測(cè)層改進(jìn)模型(YOLOv4-B)以及Faster-RCNN網(wǎng)絡(luò)進(jìn)行對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表3、圖4所示。

圖4 loss與mAP訓(xùn)練過(guò)程變化

表3 對(duì)比實(shí)驗(yàn)的各項(xiàng)數(shù)據(jù)

由表3可看出,本文改進(jìn)算法各類別準(zhǔn)確率和mAP指標(biāo)均高于其余三種算法,且FPS指標(biāo)高于Faster-RCNN網(wǎng)絡(luò)。綜合mAP指標(biāo)和FPS指標(biāo),本文算法優(yōu)于其他檢測(cè)算法,提升了自動(dòng)駕駛多目標(biāo)檢測(cè)性能。

本文提出了一種改進(jìn)YOLOv4算法,旨在提升自動(dòng)駕駛多目標(biāo)檢測(cè)的檢測(cè)性能,為自動(dòng)駕駛汽車的智能決策提供更有效的數(shù)據(jù)支撐。增加152x152特征融合結(jié)構(gòu),減少特征檢測(cè)層的兩層卷積層,用Kmeans++聚類算法可以在最大程度上減小隨機(jī)生成初始聚類中心的誤差,避免聚類局部最優(yōu)導(dǎo)致訓(xùn)練的模型魯棒性低和檢測(cè)精度低的問(wèn)題出現(xiàn)。因此,本文改進(jìn)的YOLOv4算法將模型的mAP指標(biāo)相較于原YOLOv4算法提升了1.5個(gè)百分點(diǎn),F(xiàn)PS指標(biāo)基本持平。

本文從網(wǎng)絡(luò)結(jié)構(gòu)、數(shù)據(jù)集聚類的角度改進(jìn)算法使模型檢測(cè)性能得到一定的提升,但對(duì)于YOLOv4主體網(wǎng)絡(luò)而言還有很大的改進(jìn)空間。這些都需要在未來(lái)的科研中研究和解決的內(nèi)容。

猜你喜歡
錨框卷積聚類
基于YOLOv3錨框優(yōu)化的側(cè)掃聲吶圖像目標(biāo)檢測(cè)
錨框策略匹配的SSD飛機(jī)遙感圖像目標(biāo)檢測(cè)
基于SSD算法的輕量化儀器表盤(pán)檢測(cè)算法*
基于GA-RoI Transformer的遙感圖像任意方向目標(biāo)檢測(cè)
基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
從濾波器理解卷積
電子制作(2019年11期)2019-07-04 00:34:38
基于傅里葉域卷積表示的目標(biāo)跟蹤算法
基于DBSACN聚類算法的XML文檔聚類
基于改進(jìn)的遺傳算法的模糊聚類算法
一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
林芝县| 巴中市| 和政县| 平阳县| 准格尔旗| 梁山县| 敦化市| 安徽省| 朝阳县| 阳春市| 兰坪| 朝阳区| 肇庆市| 游戏| 方山县| 铜陵市| 泰安市| 秦安县| 沧州市| 台东县| 凉山| 长治县| 禹城市| 新野县| 建昌县| 银川市| 叙永县| 洞口县| 二连浩特市| 台安县| 綦江县| 卓资县| 通海县| 承德县| 宜阳县| 澄城县| 饶河县| 图们市| 利辛县| 上高县| 安庆市|