国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

動(dòng)態(tài)卷積的3D點(diǎn)云目標(biāo)檢測(cè)算法

2023-01-12 01:15蔡黎明杜吉祥劉懷進(jìn)張洪博黃敬東
關(guān)鍵詞:體素卷積動(dòng)態(tài)

蔡黎明 ,杜吉祥,劉懷進(jìn),張洪博,黃敬東

(1.華僑大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,福建 廈門 361021;2.華僑大學(xué) 福建省大數(shù)據(jù)智能與安全重點(diǎn)實(shí)驗(yàn)室,福建 廈門 361021;3.華僑大學(xué) 廈門市計(jì)算機(jī)視覺(jué)與模式識(shí)別重點(diǎn)實(shí)驗(yàn)室,福建 廈門 361021)

在汽車、飛機(jī)等交通工具中,以計(jì)算機(jī)智能為核心的無(wú)人操作,稱為自動(dòng)駕駛.為了提高駕駛安全、緩解交通壓力、適應(yīng)不同人群等問(wèn)題,自動(dòng)駕駛已經(jīng)成為人工智能領(lǐng)域的熱門話題.在自動(dòng)檢測(cè)場(chǎng)景中出現(xiàn)的目標(biāo)是自動(dòng)駕駛研究的關(guān)鍵.在過(guò)去研究中,目標(biāo)檢測(cè)研究主要側(cè)重于二維圖像中的目標(biāo)檢測(cè).然而,當(dāng)目標(biāo)檢測(cè)圖片出現(xiàn)嚴(yán)重的遮擋與噪聲時(shí),常導(dǎo)致檢測(cè)算法不精確.在自動(dòng)駕駛中,常用的傳感器是激光雷達(dá)傳感器,與單目相機(jī)相比,激光雷達(dá)傳感器可以提供更準(zhǔn)確的深度信息,且能生成三維(3D)點(diǎn)云來(lái)捕捉場(chǎng)景的3D結(jié)構(gòu).準(zhǔn)確的空間位置信息使自動(dòng)駕駛汽車能夠有效地預(yù)測(cè)和規(guī)劃路徑,避免發(fā)生不必要的交通事故.因此,基于3D點(diǎn)云的目標(biāo)檢測(cè)研究在自動(dòng)駕駛領(lǐng)域備受關(guān)注.

為了處理非結(jié)構(gòu)化的三維點(diǎn)云,體素的檢測(cè)器通常將不規(guī)則的點(diǎn)轉(zhuǎn)換成規(guī)則的體素網(wǎng)格,采用3D卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行特征學(xué)習(xí).Zhou等[1]提出一種新的體素特征編碼層,提高了體素網(wǎng)格的有效并行處理能力.Yan等[2]利用3D子流形稀疏卷積[3],提出一種高效架構(gòu),使計(jì)算和內(nèi)存效率顯著提高.Lang等[4]提出將體素簡(jiǎn)化為柱子.Shi等[5]提出一種兩階段檢測(cè)器,由部件感知模塊和聚合模塊組成.Deng等[6]在兩階段的算法中引入全卷積網(wǎng)絡(luò)來(lái)擴(kuò)展一種新的高性能3D目標(biāo)檢測(cè)(PV-RCNN)算法,在體素特征中提取感興趣區(qū)域特征,使粗體素粒度的檢測(cè)精度得到提高.Ma等[7]將點(diǎn)云分配到規(guī)則的三維網(wǎng)格中,并使用三維稀疏卷積提取體素特征.Xu等[8]將原始的3D點(diǎn)云數(shù)據(jù)進(jìn)行體素化,同時(shí)設(shè)計(jì)一個(gè)輕量級(jí)的位置注意模塊,采用加權(quán)特征融合的方法,高效地獲得多層次特征.

與體素的方法不同,基于點(diǎn)的算法是直接從非結(jié)構(gòu)化的點(diǎn)中學(xué)習(xí)特征生成感興趣區(qū)域.Qi等[9-10]開(kāi)創(chuàng)性地采用直接從點(diǎn)中學(xué)習(xí)特征的算法,保留了較多的特征信息,提升了模型的分類分割精度.Shi等[11]提出一種從原始點(diǎn)云中檢測(cè)3D物體的兩階段3D目標(biāo)檢測(cè)(PointRCNN)算法,該算法可以直接從原始點(diǎn)云中分割前景點(diǎn),為預(yù)測(cè)3D回歸框減少搜索空間.Yang等[12]在下采樣過(guò)程中提出一種融合采樣策略,對(duì)點(diǎn)進(jìn)行檢測(cè),設(shè)計(jì)了包含候選生成層、無(wú)錨回歸頭和3D中心性分配策略的預(yù)測(cè)網(wǎng)絡(luò).Shi等[13]將圖神經(jīng)網(wǎng)絡(luò)引入三維目標(biāo)檢測(cè)的框架中.

上述的3D目標(biāo)檢測(cè)算法在特征提取時(shí)采用的卷積均為靜態(tài).針對(duì)此問(wèn)題,Xu等[14]提出一種用于點(diǎn)云處理的位置自適應(yīng)卷積算子.在點(diǎn)云三維立體空間中,點(diǎn)與點(diǎn)之間的關(guān)系復(fù)雜,可以使卷積核的選取適應(yīng)周圍的變化.點(diǎn)云三維目標(biāo)檢測(cè)的難點(diǎn)主要是點(diǎn)云的不規(guī)則性,若樣本遮擋嚴(yán)重且較為稀疏,則難以提取關(guān)鍵特征,經(jīng)常要轉(zhuǎn)為有序的表達(dá)方式.基于此,本文提出一種新的3D目標(biāo)檢測(cè)算法,嘗試解決不規(guī)則且稀疏點(diǎn)云數(shù)據(jù)中的目標(biāo)檢測(cè)問(wèn)題.

1 實(shí)驗(yàn)方法

1.1 算法的整體框架

圖1 PAC-PointRCNN算法框架圖Fig.1 PAC-PointRCNN algorithm framework diagram

提出一種結(jié)合動(dòng)態(tài)卷積學(xué)習(xí)特征的PointRCNN(PAC-PointRCNN)算法,其框架如圖1所示.整體架構(gòu)模型分為2個(gè)階段:第1階段主要通過(guò)構(gòu)建動(dòng)態(tài)卷積進(jìn)行特征提取,并構(gòu)建3D檢測(cè)框;第2階段對(duì)第1階段的輸出進(jìn)行精細(xì)化處理.在第1階段首先對(duì)點(diǎn)進(jìn)行預(yù)處理,將得到的點(diǎn)數(shù)據(jù)送入骨干網(wǎng)絡(luò)提取特征,每個(gè)點(diǎn)產(chǎn)生特征向量,同時(shí),對(duì)周圍的上下文信息進(jìn)行編碼,增大其感受野,通過(guò)KITTI數(shù)據(jù)集標(biāo)注的3D邊界框可以判斷出前景點(diǎn)信息;然后,根據(jù)特征向量進(jìn)行前景點(diǎn)分割,對(duì)得到的前景點(diǎn)進(jìn)行分類回歸,在對(duì)前景點(diǎn)預(yù)測(cè)所屬對(duì)象的包圍框時(shí),用bin機(jī)制[11]把回歸問(wèn)題先轉(zhuǎn)化為分類問(wèn)題,再進(jìn)行回歸,以提高效率及精度;得到大量預(yù)選框后,將預(yù)選框進(jìn)行非極大值抑制處理,送入第2階段進(jìn)行特征融合,提取局部特征,得到的點(diǎn)位置坐標(biāo)通過(guò)規(guī)范化處理,再分類回歸得到精細(xì)框.

圖2 骨干網(wǎng)絡(luò)Fig.2 Backbone network

1.2 骨干網(wǎng)絡(luò)

骨干網(wǎng)絡(luò),如圖2所示.骨干網(wǎng)絡(luò)由4個(gè)下采樣編碼的集合抽象層和4個(gè)上采樣編碼的特征傳播層組成.

集合抽象層,如圖3所示.圖3中:N,N1為點(diǎn)集中點(diǎn)的數(shù)量;d為坐標(biāo)空間維度;C,C1為特征空間維度;k為固定值.在集合抽象層中,采用最遠(yuǎn)點(diǎn)采樣的方法對(duì)輸入點(diǎn)進(jìn)行降采樣,將輸入點(diǎn)集從N降到更小的N1,最遠(yuǎn)點(diǎn)采樣是使采樣的各個(gè)點(diǎn)之間盡可能遠(yuǎn),這種降采樣的結(jié)果比較均勻且具有更好的覆蓋效果.在骨干網(wǎng)絡(luò)的第1個(gè)集合抽象層中,對(duì)輸入的原始點(diǎn)進(jìn)行最遠(yuǎn)點(diǎn)采樣,得到的降采樣結(jié)果作為第2個(gè)集合抽象層的輸入點(diǎn),以此類推,直到第4個(gè)集合抽象層.將降采樣得到點(diǎn)的數(shù)量N1進(jìn)行分組,選取這N1個(gè)中心點(diǎn),每個(gè)中心點(diǎn)采用球查詢的方式尋找固定的k個(gè)鄰域點(diǎn),先劃定某一半徑,找在該半徑球內(nèi)的點(diǎn)作為鄰域點(diǎn),如果點(diǎn)數(shù)大于固定值k,取前k個(gè)點(diǎn)為鄰域點(diǎn),如果點(diǎn)數(shù)小于固定值k,對(duì)點(diǎn)進(jìn)行重采樣以達(dá)到固定值k.這樣形成一個(gè)局部鄰域,共組成N1個(gè)局部鄰域,這個(gè)過(guò)程中,坐標(biāo)空間維度d和特征空間維度C沒(méi)有發(fā)生變化.球查詢?cè)诰植苦徲蚪M內(nèi)固定了區(qū)域尺度,使局部區(qū)域特征在空間上更具有泛化性.

動(dòng)態(tài)網(wǎng)絡(luò),如圖4所示.在動(dòng)態(tài)網(wǎng)絡(luò)中,對(duì)每一組局部鄰域進(jìn)行動(dòng)態(tài)網(wǎng)絡(luò)編碼,將采樣和分組后的點(diǎn)作為輸入,送進(jìn)具有動(dòng)態(tài)內(nèi)核組裝的位置自適應(yīng)卷積即PAConv動(dòng)態(tài)卷積里,使每個(gè)點(diǎn)的特征維度升高,以獲取更多的特征信息,再通過(guò)最大池化選取最重要的特征作為新特征輸出.在此過(guò)程中,坐標(biāo)空間維度d沒(méi)有發(fā)生變化,特征空間維度從C變成更高的維度C1,即特征的通道數(shù)升高了.在特征傳播層中,采用基于距離的插值和跨越跳級(jí)鏈路的分層傳播策略,與集合抽象層的反過(guò)程類似,將集合抽象層每一層得到的結(jié)果通過(guò)插值點(diǎn)特征傳播到原始點(diǎn)集.PointNet為直接從點(diǎn)云中學(xué)習(xí)特征的網(wǎng)絡(luò)結(jié)構(gòu);PointNet++在PointNet的基礎(chǔ)上進(jìn)行改進(jìn),具有多層次特征提取結(jié)構(gòu).在PointNet++的集合抽象層基礎(chǔ)上,骨干網(wǎng)絡(luò)將PointNet層嵌入PAConv動(dòng)態(tài)卷積,生成動(dòng)態(tài)網(wǎng)絡(luò),沒(méi)有改變其他架構(gòu)配置.

圖3 集合抽象層 圖4 動(dòng)態(tài)網(wǎng)絡(luò)Fig.3 Set abstraction layer Fig.4 Dynamic network

1.3 動(dòng)態(tài)卷積

在三維空間中,點(diǎn)與點(diǎn)之間的關(guān)系與二維平面中點(diǎn)之間的關(guān)系有很大的不同.例如,在二維平面的網(wǎng)格中,中心點(diǎn)周圍的鄰域點(diǎn)個(gè)數(shù)是固定的,但在點(diǎn)云的三維空間里,取一個(gè)中心點(diǎn)(圖5),它周圍的鄰近點(diǎn)有無(wú)限可能,多一個(gè)維度會(huì)使點(diǎn)關(guān)系變的錯(cuò)綜復(fù)雜.在二維平面空間中,使用卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)得到的特征可以很好地反映點(diǎn)之間的相關(guān)性;而在三維空間里,由于點(diǎn)的無(wú)序不規(guī)則性,使用二維空間里學(xué)習(xí)特征的卷積核算子會(huì)使相關(guān)性變差,從而導(dǎo)致檢測(cè)不精確.因此,重新設(shè)計(jì)卷積核函數(shù),使其能動(dòng)態(tài)地學(xué)習(xí)點(diǎn)特征.PAConv動(dòng)態(tài)卷積,如圖6所示.首先,定義由幾個(gè)權(quán)重矩陣組成的權(quán)重庫(kù);接著,設(shè)計(jì)一個(gè)LearnNet學(xué)習(xí)系數(shù)向量,根據(jù)點(diǎn)的位置組合權(quán)重矩陣;最后,結(jié)合權(quán)值矩陣及其相關(guān)的位置自適應(yīng)系數(shù)生成動(dòng)態(tài)核.

圖5 3D點(diǎn) 圖6 PAConv動(dòng)態(tài)卷積 Fig.5 3D point Fig.6 PAConv dynamic convolution

構(gòu)景要素以自然、人文為主線,交通為紐帶,民俗文化為趣味點(diǎn),形成主題各異、形象鮮明的旅游精品線路,造出“同飲黃河水,共賞民俗情”的主題式旅游[10]。民俗文化有著獨(dú)特的文化內(nèi)涵、濃烈的原始?xì)馕丁⒑裰氐臍v史氛圍、顯著的地域差距、歡愉的生活情調(diào)及豐富多彩的表現(xiàn)形式,對(duì)游客產(chǎn)生強(qiáng)大的吸引力和感召力。

P=(Aj-Ai,Ai),

(1)

(Aj-Ai,Ai)=(xj-xi,yj-yi,zj-zi,xi,yi,zi).

(2)

LearnNet的輸出向量Ei,j表達(dá)式為

Ei,j=softmax(relu(δ(P))).

(3)

(4)

得到動(dòng)態(tài)核后,生成的自適應(yīng)動(dòng)態(tài)卷積可以更加靈活地學(xué)習(xí)特征.因此,權(quán)重庫(kù)的規(guī)模越大,權(quán)重矩陣的靈活性和可用性也越大,但由于權(quán)重矩陣是隨機(jī)初始化的,在網(wǎng)絡(luò)的訓(xùn)練過(guò)程中,卷積核學(xué)習(xí)得到的合理權(quán)值會(huì)趨于相似,不能保證權(quán)重矩陣的多樣性.為了避免這種情況,采用權(quán)值正則化來(lái)懲罰不同權(quán)值矩陣之間的相關(guān)性,讓權(quán)重矩陣的分布更加多樣化,進(jìn)一步保證生成核的多樣性.因此,將PAConv動(dòng)態(tài)卷積嵌入骨干網(wǎng)絡(luò),從而可以更加靈活精確地學(xué)習(xí)三維空間的點(diǎn)特征.

1.4 損失函數(shù)

為了便于比較,采用PointRCNN的損失函數(shù),由于大型戶外場(chǎng)景前景點(diǎn)的數(shù)量比背景點(diǎn)的數(shù)量少,因此,在第1階段的子網(wǎng)絡(luò)中,使用焦點(diǎn)損失[15]解決前景-背景分類不均衡的問(wèn)題,得到的損失為L(zhǎng)focal,即

Lfocal(pt)=-φt(1-pt)γlnpt.

(5)

式(5)中:t為前景點(diǎn)即正確分類點(diǎn);pt為正確分類的概率;φt,γ為超參數(shù)調(diào)節(jié)因子,φt=0.25,γ=2.

使用回歸損失函數(shù)[11]生成3D預(yù)選框,即

(6)

在第2階段的子網(wǎng)絡(luò)中,將預(yù)選框坐標(biāo)轉(zhuǎn)到規(guī)范的坐標(biāo)系下,總的損失Lrefine為

(7)

2 實(shí)驗(yàn)結(jié)果與分析

2.1 數(shù)據(jù)集

KITTI的三維檢測(cè)數(shù)據(jù)集包含7 481個(gè)訓(xùn)練樣本和7 518個(gè)測(cè)試樣本,與PointRCNN算法一樣,將訓(xùn)練樣本分為訓(xùn)練集(3 712個(gè)樣本)和驗(yàn)證集(3 769個(gè)樣本).標(biāo)注文件里的字段含義分別為類別、截?cái)嗦?、遮擋程度、觀測(cè)角度、2D邊界框左右下角坐標(biāo)、3D邊界框的長(zhǎng)寬高和在相機(jī)的坐標(biāo)、相對(duì)Y軸旋轉(zhuǎn)角度.激光雷達(dá)點(diǎn)云數(shù)據(jù)以浮點(diǎn)二進(jìn)制文件格式存儲(chǔ).

2.2 實(shí)驗(yàn)設(shè)置

采用兩階段的訓(xùn)練方式,對(duì)于訓(xùn)練集中的每個(gè)3D點(diǎn)云場(chǎng)景,從每個(gè)場(chǎng)景中抽取16 384個(gè)點(diǎn)作為輸入,不足16 384個(gè)點(diǎn)的場(chǎng)景,隨機(jī)重復(fù)抽取以達(dá)到16 384個(gè)點(diǎn).在骨干網(wǎng)絡(luò)中,使用4個(gè)多尺度分組的集合抽象層,將輸入的點(diǎn)下采樣為4 096,1 024,256,64的組.然后,使用4個(gè)特征傳播層獲取點(diǎn)特征向量,用于分割和生成預(yù)選框細(xì)化子網(wǎng)絡(luò).從每個(gè)感興趣的集合區(qū)域隨機(jī)抽取512個(gè)點(diǎn)作為細(xì)化子網(wǎng)絡(luò)的輸入,為了使對(duì)象置信度分類和提案位置細(xì)化,采用3個(gè)單尺度分組的集合抽象層(組大小為128,32,1)生成單個(gè)特征向量.在KITTI數(shù)據(jù)集中,汽車類的樣本數(shù)量最多,對(duì)其訓(xùn)練細(xì)節(jié)的描述也適用于其他類別(如行人和自行車).將3D真值框內(nèi)的所有點(diǎn)視為前景點(diǎn),其余點(diǎn)視為背景點(diǎn),在訓(xùn)練過(guò)程中,忽略物體邊界附近的背景點(diǎn).由于3D真值框可能會(huì)有小的變化,所以,通過(guò)在物體的每一側(cè)將3D真值框放大0.2 m進(jìn)行魯棒分割.對(duì)于bin機(jī)制,參數(shù)設(shè)置的搜索范圍S=3 m,2個(gè)垂直方向共劃分12個(gè)區(qū)間,每個(gè)區(qū)間為0.5 m.

評(píng)估時(shí),難度等級(jí)Easy,Moderate,Hard表示的最小邊界框高度分別為40,25,25 px,最大遮擋程度分別為完全可見(jiàn)、部分可見(jiàn)、很難看到,最大的截?cái)嗦史謩e為15%,30%,50%.在PointRCNN開(kāi)源代碼的基礎(chǔ)上進(jìn)行修改,為了便于對(duì)比分析,實(shí)驗(yàn)的參數(shù)設(shè)置與原模型一致,只在第1階段的骨干網(wǎng)絡(luò)部分將PAConv動(dòng)態(tài)卷積嵌入其中進(jìn)行改進(jìn).為了增加額外的非重疊真值框,在場(chǎng)景中使用隨機(jī)翻轉(zhuǎn)、縮放、旋轉(zhuǎn)和數(shù)據(jù)增強(qiáng)等方法.兩個(gè)階段的子網(wǎng)絡(luò)分開(kāi)訓(xùn)練,在訓(xùn)練過(guò)程中,第1階段采用單個(gè)圖形處理器(GPU)方式進(jìn)行訓(xùn)練;第2階段采用兩種訓(xùn)練方式,即在線的數(shù)據(jù)增強(qiáng)和離線的數(shù)據(jù)增強(qiáng),在線數(shù)據(jù)增強(qiáng)易于訓(xùn)練,離線數(shù)據(jù)增強(qiáng)訓(xùn)練效果更好.

2.3 實(shí)驗(yàn)對(duì)比結(jié)果

為了驗(yàn)證文中算法的有效性,根據(jù)PointRCNN提供的代碼指令,采用在線和離線兩種數(shù)據(jù)增強(qiáng)方式,在汽車類數(shù)據(jù)集中進(jìn)行復(fù)現(xiàn),在交并比閾值(IOU)為0.7的情況下,記錄平均檢測(cè)精度(PA).汽車類數(shù)據(jù)集上文中算法與現(xiàn)有算法、PointRCNN算法的平均檢測(cè)精度對(duì)比,如表1所示.表1中:黑體數(shù)據(jù)表示最好的實(shí)驗(yàn)結(jié)果.

表1 不同算法在汽車類KITTI驗(yàn)證集上的平均檢測(cè)精度對(duì)比Tab.1 Comparison of average detection precision of different algorithms on car class of KITTI val split

由表1可知:文中算法在PointRCNN的基礎(chǔ)上融入PAConv動(dòng)態(tài)卷積模塊,在汽車類數(shù)據(jù)集的Moderate,Hard等級(jí)難度下,文中算法的平均檢測(cè)精度均優(yōu)于現(xiàn)有其他算法.

在行人和自行車類數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),文中算法與PointRCNN算法的平均檢測(cè)精度對(duì)比,如表2所示.由表2可知:由于行人和自行車類數(shù)據(jù)集的體積小且樣本稀疏,文中算法在行人類數(shù)據(jù)集Hard等級(jí)難度下的檢測(cè)精度較好,在自行車類數(shù)據(jù)集Easy,Moderate等級(jí)難度下的檢測(cè)精度更好.由此可見(jiàn),文中算法在遮擋嚴(yán)重且樣本稀疏的目標(biāo)檢測(cè)上具有優(yōu)越性.

表2 不同算法在行人和自行車類KITTI驗(yàn)證集上的平均檢測(cè)精度對(duì)比Tab.2 Comparison of average detection precision of different algorithms on pedestrian and bicycle class of KITTI val split

表3 訓(xùn)練時(shí)間的對(duì)比Tab.3 Comparison of training time

為了驗(yàn)證文中算法的可行性,采用文中算法和PointRCNN算法對(duì)兩階段進(jìn)行訓(xùn)練,其訓(xùn)練時(shí)間的對(duì)比,如表3所示.表3中:t1,t2分別為第1階段、第2階段的訓(xùn)練時(shí)間.由表3可知:文中算法比PointRCNN算法所用的訓(xùn)練時(shí)間更少,再次驗(yàn)證了文中算法的優(yōu)越性.

2.4 消融實(shí)驗(yàn)

為了探究不同的輸入方式對(duì)PAConv動(dòng)態(tài)卷積效果的影響,采用4種不同的輸入方式進(jìn)行消融分析實(shí)驗(yàn).以中心點(diǎn)Ai和鄰近點(diǎn)Aj兩者之間的關(guān)系設(shè)計(jì)4種不同的任務(wù),Oi,j表示Ai和Aj的歐式距離.不同輸入方式下的召回率(ηR),如表4所示.由表4可知:將鄰近點(diǎn)與中心點(diǎn)的距離差和中心點(diǎn)一起輸入,召回率最高,加入兩點(diǎn)的歐式距離及鄰近點(diǎn)后,召回率變差,表明在大型的戶外場(chǎng)景中運(yùn)用動(dòng)態(tài)卷積自適應(yīng)時(shí),輸入的越多,越容易產(chǎn)生誤差,從而影響檢測(cè)效果.因此,選擇(Aj-Ai,Ai)作為輸入,該輸入方式的召回率高,得到的最終檢測(cè)精度最好.

表4 不同輸入方式下的召回率Tab.4 Recall rate under different input modes

2.5 效果可視化

在KITTI訓(xùn)練集上對(duì)汽車、行人和自行車三類進(jìn)行標(biāo)記,采用分開(kāi)訓(xùn)練的方式,將得到的模型可視化展示.汽車、行人和自行車類的檢測(cè)對(duì)比圖,分別如圖7~9所示.圖7~9中:圖(a)為2D標(biāo)記框;圖(b)為3D標(biāo)記框;圖(c)為預(yù)測(cè)框;圖(d)為預(yù)測(cè)框與3D標(biāo)記真值框的對(duì)比;圖(e)為圖(d)部分結(jié)果的放大效果;綠色為汽車類標(biāo)記框;藍(lán)色為行人類標(biāo)記框;黃色為自行車類標(biāo)記框;紅色為預(yù)測(cè)框;紅色箭頭表示方向.

圖7 汽車類的檢測(cè)對(duì)比圖Fig.7 Car detection comparison chart

圖9 自行車類的檢測(cè)對(duì)比圖Fig.9 Bicycle detection comparison chart

由圖7~9可知:2D標(biāo)記框的遮擋問(wèn)題在3D點(diǎn)云場(chǎng)景中得到很好地解決,因?yàn)?D檢測(cè)框是立體的,使檢測(cè)框得到很好的分離,顯示出3D目標(biāo)檢測(cè)的優(yōu)越性;在汽車、行人、自行車類的檢測(cè)效果圖中,預(yù)測(cè)框與標(biāo)記框的誤差小,證明了文中算法的有效性.

3 結(jié)束語(yǔ)

提出一種將動(dòng)態(tài)卷積作為特征提取的3D點(diǎn)云目標(biāo)檢測(cè)算法.針對(duì)點(diǎn)云的不規(guī)則無(wú)序性問(wèn)題,相較于現(xiàn)有算法,文中算法的優(yōu)點(diǎn)是運(yùn)用動(dòng)態(tài)卷積的方法,可以更好地提取關(guān)鍵特征.文中算法采用PAConv動(dòng)態(tài)卷積的方式,通過(guò)相對(duì)點(diǎn)位置自適應(yīng)地學(xué)習(xí)生成分配系數(shù),從而動(dòng)態(tài)調(diào)整權(quán)重,有效地避免了因遮擋和樣本稀疏造成的模型不精確問(wèn)題.從KITTI數(shù)據(jù)集的訓(xùn)練結(jié)果可知,在汽車類的Moderate,Hard等級(jí)難度下,文中算法的平均檢測(cè)精度優(yōu)于現(xiàn)有算法;由于行人和自行車類數(shù)據(jù)集的體積小且樣本稀疏,在行人類數(shù)據(jù)集的Hard等級(jí)難度下,文中算法的平均檢測(cè)精度較好,在自行車類數(shù)據(jù)集的Easy,Moderate等級(jí)難度下,文中算法的平均檢測(cè)精度較好.實(shí)驗(yàn)結(jié)果表明:針對(duì)不規(guī)則無(wú)序、遮擋、稀疏的點(diǎn)數(shù)據(jù),文中算法具有更好的檢測(cè)精度.

猜你喜歡
體素卷積動(dòng)態(tài)
基于多級(jí)細(xì)分的彩色模型表面體素化算法
國(guó)內(nèi)動(dòng)態(tài)
國(guó)內(nèi)動(dòng)態(tài)
瘦體素決定肥瘦
國(guó)內(nèi)動(dòng)態(tài)
基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
運(yùn)用邊界狀態(tài)約束的表面體素加密細(xì)分算法
卷積神經(jīng)網(wǎng)絡(luò)的分析與設(shè)計(jì)
動(dòng)態(tài)
從濾波器理解卷積