国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于深度學(xué)習(xí)的視野內(nèi)狀況檢測(cè)方法研究

2024-07-01 23:56:20葉兆元張亮智梁海泓蘇湘鈿黎志勇
專用汽車 2024年6期
關(guān)鍵詞:特征提取卷積道路

葉兆元 張亮智 梁海泓 蘇湘鈿 黎志勇

摘要:隨著深度學(xué)習(xí)技術(shù)的發(fā)展,自動(dòng)駕駛汽車對(duì)道路信息的檢測(cè)變得至關(guān)重要。一個(gè)全面的檢測(cè)系統(tǒng)需要車輛和道路的全方位信息,傳統(tǒng)的道路巡檢方式以及專用設(shè)備檢測(cè)方式成本高昂,效率低下,嚴(yán)重制約了道路的維護(hù)和安全。目標(biāo)檢測(cè)和語(yǔ)義分割是實(shí)現(xiàn)車輛視覺(jué)感知的主要技術(shù),但單一的任務(wù)檢測(cè)不能滿足復(fù)雜道路環(huán)境的需要。針對(duì)傳統(tǒng)道路異常狀態(tài)檢測(cè)存在的高成本和低效率問(wèn)題,提出了一種基于深度學(xué)習(xí)的智能化檢測(cè)方法,構(gòu)建了包含多種異常狀態(tài)的數(shù)據(jù)集,并采用Faster RCNN目標(biāo)檢測(cè)算法以及半監(jiān)督策略的生成對(duì)抗網(wǎng)絡(luò),實(shí)現(xiàn)了對(duì)道路異常狀態(tài)的自動(dòng)化檢測(cè)和分割。

關(guān)鍵詞:CNN;Faster RCNN;RPN;網(wǎng)絡(luò)模型結(jié)構(gòu);VGG-16

中文圖類號(hào):U472.9? 收稿日期:2024-03-25

DOI:1019999/jcnki1004-0226202406035

1 前言

隨著汽車數(shù)量的增加和道路負(fù)荷的增大,公路出現(xiàn)了各種異常狀態(tài),如路面裂縫、塌陷、坑槽等,嚴(yán)重威脅了交通安全并增加了維護(hù)成本[1]。傳統(tǒng)的道路異常狀態(tài)檢測(cè)主要依賴人工方法,但存在一些問(wèn)題,包括主觀性、低效率、高成本、安全風(fēng)險(xiǎn)以及可能引發(fā)交通堵塞等。深度學(xué)習(xí)通過(guò)卷積神經(jīng)網(wǎng)絡(luò)等技術(shù)可以從道路圖像中提取更多層次的特征信息,提高了圖像處理的效率和準(zhǔn)確性,為道路異常狀態(tài)檢測(cè)提供了新的途徑。

近年來(lái),研究者將深度學(xué)習(xí)應(yīng)用于道路工程的各個(gè)方面,包括設(shè)計(jì)、檢查監(jiān)測(cè)、維護(hù)等。這些研究包括使用改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)算法來(lái)提高路面裂縫異常狀態(tài)檢測(cè)的速度,使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)來(lái)檢測(cè)道路裂縫異常狀態(tài),并使用深度殘差網(wǎng)絡(luò)對(duì)不同尺度的特征信息進(jìn)行融合,以實(shí)現(xiàn)裂縫的精細(xì)分割。

2 基礎(chǔ)理論分析

在自動(dòng)駕駛領(lǐng)域,深度學(xué)習(xí)被廣泛用于解決感知、決策、控制等算法中面臨的難題,以提高自動(dòng)駕駛系統(tǒng)的智能化水平[2]。卷積神經(jīng)網(wǎng)絡(luò)(CNN)能夠自動(dòng)地從原始圖像中學(xué)習(xí)到有用的特征,并且具有良好的魯棒性,能夠處理各種不同形狀和大小的圖像。

循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)也是一種常用的深度學(xué)習(xí)算法,主要用于處理序列數(shù)據(jù),如語(yǔ)音、文本等。RNN通過(guò)循環(huán)連接的方式實(shí)現(xiàn)對(duì)序列數(shù)據(jù)的記憶和傳遞,從而能夠有效地處理時(shí)序數(shù)據(jù)。在自動(dòng)駕駛領(lǐng)域,RNN可用于處理車輛行駛中的傳感器數(shù)據(jù)和GPS軌跡等序列數(shù)據(jù)。

深度置信網(wǎng)絡(luò)(DBN)能夠通過(guò)逐層貪婪訓(xùn)練的方式,從復(fù)雜繁瑣的原始數(shù)據(jù)中逐層分離提取出越來(lái)越高級(jí)的特征。DBN的優(yōu)點(diǎn)在于其能夠有效地處理高維數(shù)據(jù),并且具有較好的特征學(xué)習(xí)能力。

在自動(dòng)駕駛領(lǐng)域,深度學(xué)習(xí)被廣泛應(yīng)用于感知等算法,實(shí)現(xiàn)對(duì)道路、車輛、行人等目標(biāo)的識(shí)別和跟蹤。在決策方面,深度學(xué)習(xí)利用循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)和長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM)等算法,對(duì)車輛行駛數(shù)據(jù)和交通流數(shù)據(jù)進(jìn)行處理,實(shí)現(xiàn)車輛行駛策略的優(yōu)化和控制。在控制方面,深度學(xué)習(xí)通過(guò)對(duì)車輛動(dòng)力學(xué)和機(jī)械系統(tǒng)的理解,利用深度強(qiáng)化學(xué)習(xí)等算法,實(shí)現(xiàn)對(duì)車輛的精確控制。

3 檢測(cè)算法

采用Faster RCNN算法為基礎(chǔ)模型,并對(duì)其進(jìn)行改進(jìn)。Faster RCNN算法能夠有效地在輸入圖像中定位目標(biāo)并輸出相應(yīng)目標(biāo)類別的概率。改進(jìn)方向包括特征提取優(yōu)化,引入多尺度特征金字塔融合策略以提升多尺度目標(biāo)檢測(cè)性能,并解決傳統(tǒng)感興趣區(qū)域池化層所導(dǎo)致的目標(biāo)定位精度問(wèn)題,采用ROI Align進(jìn)行替代。Faster RCNN算法為經(jīng)典的two-stage目標(biāo)檢測(cè)算法,分為兩個(gè)階段:首先,通過(guò)特征提取骨干網(wǎng)絡(luò)生成候選框;然后進(jìn)行目標(biāo)類別分類和候選框位置回歸。

31 特征量提取算法

圖片特征信息的提取在目標(biāo)檢測(cè)算法中起著關(guān)鍵作用,而Faster RCNN算法選擇VGG-16網(wǎng)絡(luò)作為其特征提取的基礎(chǔ)。VGG-16網(wǎng)絡(luò)是在AlexNet網(wǎng)絡(luò)的基礎(chǔ)上進(jìn)行更深層次的設(shè)計(jì),從而形成的一個(gè)深度卷積神經(jīng)網(wǎng)絡(luò)。其卷積特征提取部分由13個(gè)卷積層和5個(gè)池化層的有序組合構(gòu)成。

VGG-16網(wǎng)絡(luò)的特征提取過(guò)程可以概括為以下幾個(gè)步驟:a.圖像經(jīng)過(guò)兩次3×3大小的卷積核的卷積操作,然后進(jìn)行一次最大池化操作,以減小圖像尺寸;b.經(jīng)過(guò)兩次3×3大小的卷積核的卷積運(yùn)算,然后再次進(jìn)行最大池化,以繼續(xù)壓縮特征圖的尺寸;c.卷積核的數(shù)量增加到256,并使用3組卷積核對(duì)上一階段的輸出進(jìn)行卷積操作,然后再次送入最大池化層進(jìn)行特征圖的進(jìn)一步壓縮;d.卷積核的數(shù)量增加到512,與之前的階段類似,對(duì)上一階段的輸出進(jìn)行卷積操作,然后再次進(jìn)行最大池化;e.繼續(xù)使用512個(gè)卷積核進(jìn)行卷積操作,然后經(jīng)過(guò)一次最大池化,以得到抽象的語(yǔ)義信息特征圖。獲取輸入圖像的抽象語(yǔ)義特征,為Faster RCNN算法提供了強(qiáng)大的圖像特征,有助于檢測(cè)和定位圖像中的目標(biāo)物體。

32 Region Proposal Network

RPN是Faster RCNN的關(guān)鍵組成部分之一,其主要任務(wù)是接受任意尺寸的輸入圖像,并生成一組矩形框,這些框包含與目標(biāo)對(duì)象相關(guān)的概率得分。RPN基于卷積特征圖的滑動(dòng)窗口操作,利用共享的卷積頂層特征信息,在大小為w×w的特征圖上,RPN對(duì)每個(gè)像素位置采樣A個(gè)初始區(qū)域,從而得到W×H/A個(gè)候選區(qū)域。

RPN將候選區(qū)域傳遞給分類器進(jìn)行篩選。使用交并比(IOU,Intersection over Union)來(lái)評(píng)估每個(gè)候選區(qū)域與實(shí)際目標(biāo)的重疊程度。當(dāng)候選區(qū)域與至少一個(gè)目標(biāo)的IOU不低于07時(shí),才被標(biāo)記為正樣本,表示可能包含目標(biāo)對(duì)象,有效地過(guò)濾掉了不包含目標(biāo)的候選區(qū)域。

[Lrpn({pi},{ti})=1NclsiLcls(pi,p?i)=]

[λ1Nregip?iLreg(ti,t?i)]????????????????????? (1)

式中,i為Anchor Boxes的索引;[p?i]為真實(shí)值標(biāo)簽的值;l表示正樣本;0為負(fù)樣本;[t?i]是索引為i的Anchor Box的邊界框修正值;[Lcls]為分類損失函數(shù);[Lreg]為邊界框回歸的損失函數(shù),用于衡量預(yù)測(cè)的邊界框與真實(shí)邊界框之間的誤差;[λ]為分類損失函數(shù)和邊界框回歸損失函數(shù)之間的平衡權(quán)重,用于調(diào)整它們的相對(duì)重要性。通過(guò)最小化損失函數(shù),這個(gè)方程描述了RPN的訓(xùn)練過(guò)程,是目標(biāo)檢測(cè)中的重要組成部分。

RPN執(zhí)行邊界框回歸,以修正正樣本的邊界框位置,從而提高目標(biāo)檢測(cè)的精度。RPN根據(jù)損失函數(shù)進(jìn)行訓(xùn)練,該損失函數(shù)包括分類損失和邊界框回歸損失。分類損失使用交叉熵?fù)p失函數(shù)來(lái)衡量預(yù)測(cè)值與真實(shí)標(biāo)簽之間的誤差。邊界框回歸損失用于修正候選區(qū)域的位置,以更準(zhǔn)確地?cái)M合目標(biāo)。RPN通過(guò)利用卷積特征圖,生成并篩選目標(biāo)候選區(qū)域,從而為目標(biāo)檢測(cè)提供了有效的輸入。通過(guò)訓(xùn)練RPN,可以預(yù)測(cè)和修正這些候選區(qū)域,從而提高了目標(biāo)檢測(cè)的性能。

33 鏈?zhǔn)骄W(wǎng)絡(luò)配比

對(duì)于目標(biāo)分類和邊界框回歸,DF RCN則采用了一種分離的策略,將這兩個(gè)任務(wù)分別傳輸給全連接結(jié)構(gòu)和卷積結(jié)構(gòu)。全連接結(jié)構(gòu)負(fù)責(zé)目標(biāo)分類,而卷積結(jié)構(gòu)則用于目標(biāo)定位。這種分離的方法旨在實(shí)現(xiàn)更準(zhǔn)確的目標(biāo)分類和更精確的目標(biāo)定位,從而提高目標(biāo)檢測(cè)性能。通過(guò)這種策略,DF RCN有效地利用自動(dòng)學(xué)習(xí)圖像的特征,改善目標(biāo)檢測(cè)的準(zhǔn)確性和靈敏性。

全連接層的作用是將之前提取到的特征進(jìn)行整合和分類,輸出最終的分類結(jié)果。這種結(jié)構(gòu)的設(shè)計(jì)使卷積神經(jīng)網(wǎng)絡(luò)能夠有效地處理復(fù)雜數(shù)據(jù),提高分類的準(zhǔn)確性和魯棒性。全連接結(jié)構(gòu)包含兩層全連接層,每一層的神經(jīng)節(jié)點(diǎn)數(shù)目都為1 024[3-4]。第一層全連接層將ROI Align輸出的7×7×256張量降維到1 024維,而第二層全連接層也有1 024個(gè)神經(jīng)節(jié)點(diǎn),能夠更好地識(shí)別復(fù)雜的圖像特征和執(zhí)行分類任務(wù)。這種結(jié)構(gòu)設(shè)計(jì)有助于提高模型的性能,能處理和解決復(fù)雜圖像分類問(wèn)題。

34 算法改進(jìn)

道路異常檢測(cè)場(chǎng)景具有以下特點(diǎn):a.道路圖像的背景復(fù)雜多樣,同時(shí),由于拍攝道路圖片的時(shí)間、季節(jié)和氣候等自然因素的變化,許多道路異常狀態(tài)與圖像背景相似度非常高。這需要模型具備強(qiáng)大的特征提取能力,以有效提取出道路異常的特征。b.由于攝像頭需要保持一定的高度對(duì)道路進(jìn)行拍攝取樣,導(dǎo)致圖像中的道路異常目標(biāo)相對(duì)較小,模型需要具備較高的小目標(biāo)檢測(cè)能力。c.道路圖片樣本的獲取方式多種多樣,不同獲取方式導(dǎo)致樣本在拍攝距離和角度方面存在較大差異。模型需要具備多尺度目標(biāo)檢測(cè)和識(shí)別的能力。

為了應(yīng)對(duì)這些挑戰(zhàn),對(duì)Faster RCNN目標(biāo)檢測(cè)算法進(jìn)行了改進(jìn)。a.采用了ResNet50網(wǎng)絡(luò)作為特征提取的骨干網(wǎng)絡(luò),以提高特征提取性能。b.引入了FPN網(wǎng)絡(luò),將ResNet50的第2至第5個(gè)殘差模塊的輸出作為基礎(chǔ),融合多級(jí)尺度的特征信息,增強(qiáng)了輸出特征的空間細(xì)節(jié)和語(yǔ)義信息。c.為了解決ROI Pooling層可能引入的錨框定位誤差問(wèn)題,引入了ROI Align模塊,采用雙線性插值方式對(duì)錨框進(jìn)行池化操作。

4 實(shí)驗(yàn)結(jié)果分析

本實(shí)驗(yàn)采用Python實(shí)現(xiàn),版本為310,基于PyTorch v181框架。實(shí)驗(yàn)設(shè)備為聯(lián)想 ThinkStation P350圖形工作站。第一個(gè)實(shí)驗(yàn)分別使用Faster R-CNN和Divide Faster R-CNN在相同的設(shè)置下訓(xùn)練,設(shè)置batch size為1,訓(xùn)練步數(shù)為200,總共訓(xùn)練100個(gè)周期。第二個(gè)實(shí)驗(yàn)吸塵器塵袋數(shù)據(jù)集上的性能比較:收集吸塵器塵袋數(shù)據(jù)集1,這個(gè)數(shù)據(jù)集應(yīng)專注于吸塵器塵袋內(nèi)部對(duì)象的檢測(cè)。在相同的設(shè)置下,使用Faster R-CNN和Divide Faster R-CNN分別進(jìn)行訓(xùn)練。確保batch size為1,訓(xùn)練步數(shù)為200,總共訓(xùn)練100個(gè)周期。第三個(gè)實(shí)驗(yàn)用于驗(yàn)證算法的性能,檢驗(yàn)增加類別后算法的魯棒性,首先準(zhǔn)備原始數(shù)據(jù)集1。然后,收集擴(kuò)展數(shù)據(jù)集2,并將其與原始數(shù)據(jù)集1合并,形成一個(gè)類別更豐富的數(shù)據(jù)集。實(shí)驗(yàn)中,Divide Faster RCNN采用帶動(dòng)量的SGD算法,動(dòng)量為09,學(xué)習(xí)率為0000 1。輸入圖像的大小在第一個(gè)實(shí)驗(yàn)縮放為512×512,而在第二個(gè)和第三個(gè)實(shí)驗(yàn)中,圖像大小縮放為1 024×1 024。

為了減少計(jì)算量,采用瓶頸層方式,先利用1×1卷積將輸入通道數(shù)降低,對(duì)降低之后的特征圖進(jìn)行進(jìn)一步卷積,最后通過(guò)1×1卷積將輸出通道數(shù)重新升高到預(yù)設(shè)維度。模型的檢測(cè)速度仍然優(yōu)于Mask RCNN但略遜于Faster RCNN。同時(shí),由于增加了卷積結(jié)構(gòu),導(dǎo)致模型在訓(xùn)練過(guò)程中l(wèi)oss的下降速度稍微變慢,但下降趨勢(shì)基本沒(méi)有變化。通過(guò)對(duì)比實(shí)驗(yàn)前后的性能指標(biāo),驗(yàn)證算法在增加類別后的魯棒性和泛化能力。在所有實(shí)驗(yàn)中,確保Divide Faster R-CNN和Faster R-CNN的其他設(shè)置(如學(xué)習(xí)率、優(yōu)化器、損失函數(shù)等)盡可能保持一致,以便公平比較。在實(shí)驗(yàn)過(guò)程中,注意監(jiān)控訓(xùn)練過(guò)程中的指標(biāo)(如損失、準(zhǔn)確率等),以便及時(shí)調(diào)整訓(xùn)練策略。最后,確保收集充足的測(cè)試數(shù)據(jù)來(lái)全面評(píng)估模型的性能。

5 結(jié)語(yǔ)

針對(duì)傳統(tǒng)道路異常狀態(tài)檢測(cè)存在的高成本和低效率問(wèn)題,提出了一種針對(duì)道路異常檢測(cè)場(chǎng)景的目標(biāo)檢測(cè)算法,同時(shí)提出了一種基于深度學(xué)習(xí)的智能化檢測(cè)方法,構(gòu)建了包含多種異常狀態(tài)的數(shù)據(jù)集,通過(guò)多方面的改進(jìn)措施,如特征提取優(yōu)化、多尺度感知、RPN的改進(jìn)等,并采用Faster RCNN目標(biāo)檢測(cè)算法以及半監(jiān)督策略的生成對(duì)抗網(wǎng)絡(luò),實(shí)現(xiàn)了對(duì)道路異常狀態(tài)的自動(dòng)化檢測(cè)和分割。

該方法有效地應(yīng)對(duì)了這一特殊場(chǎng)景的挑戰(zhàn),有效降低檢測(cè)成本和提高效率,為自動(dòng)駕駛安全提供更有效的支持。實(shí)驗(yàn)結(jié)果證明了算法的有效性和性能優(yōu)越性。研究結(jié)果對(duì)于道路異常檢測(cè)以及其他特定場(chǎng)景的目標(biāo)檢測(cè)任務(wù)具有一定的指導(dǎo)意義,為相關(guān)領(lǐng)域的研究提供了有價(jià)值的經(jīng)驗(yàn)和思路。

參考文獻(xiàn):

[1]梁泓基于深度學(xué)習(xí)的道路異常狀態(tài)檢測(cè)方法研究[D]上海:東華大學(xué),2022

[2]段續(xù)庭,周宇康,田大新,等深度學(xué)習(xí)在自動(dòng)駕駛領(lǐng)域應(yīng)用綜述[J]無(wú)人系統(tǒng)技術(shù),2021,4(6):1-27

[3]陳國(guó)良,龐裕雙基于改進(jìn)Faster RCNN的微操作空間目標(biāo)檢測(cè)算法[J]傳感器與微系統(tǒng),2024,43(3):144-147+151

[4]代恒軍基于改進(jìn)的Faster R-CNN圖像目標(biāo)檢測(cè)方法研究[J]信息技術(shù)與信息化,2023(8):91-94

作者簡(jiǎn)介:

葉兆元,男,2001年生,本科生,研究方向?yàn)樽詣?dòng)駕駛算法、無(wú)監(jiān)督學(xué)習(xí)。

黎志勇(通訊作者),男,1979年生,副教授,博士研究生,研究方向?yàn)椴牧铣尚巍⒅悄芩惴ā?/p>

基金項(xiàng)目:國(guó)家級(jí)大創(chuàng)項(xiàng)目(202213720002,202313720002);省級(jí)大創(chuàng)項(xiàng)目(S202313720007)

猜你喜歡
特征提取卷積道路
堅(jiān)持中國(guó)道路——方向決定道路,道路決定命運(yùn)
道聽(tīng)途說(shuō)
基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
我們的道路更寬廣
青年歌聲(2020年12期)2020-12-23 06:30:00
從濾波器理解卷積
電子制作(2019年11期)2019-07-04 00:34:38
基于Daubechies(dbN)的飛行器音頻特征提取
電子制作(2018年19期)2018-11-14 02:37:08
基于傅里葉域卷積表示的目標(biāo)跟蹤算法
Bagging RCSP腦電特征提取算法
一次騎行帶來(lái)的感悟
基于MED和循環(huán)域解調(diào)的多故障特征提取
孟津县| 锡林郭勒盟| 固原市| 北安市| 师宗县| 神农架林区| 寿光市| 镇赉县| 乐至县| 新竹市| 五常市| 仙居县| 英德市| 大关县| 东宁县| 永嘉县| 当涂县| 莱州市| 钟山县| 诸城市| 五大连池市| 绵阳市| 始兴县| 莱州市| 临猗县| 弥渡县| 延安市| 商丘市| 临夏市| 鹿邑县| 宝清县| 思南县| 太和县| 彭州市| 班玛县| 曲阳县| 宾阳县| 南华县| 望谟县| 华容县| 商丘市|