国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于全卷積神經(jīng)網(wǎng)絡(luò)和點(diǎn)云的道路檢測算法

2022-04-08 04:55陳佳琪蘇治寶趙熙俊索旭東
車輛與動(dòng)力技術(shù) 2022年1期
關(guān)鍵詞:激光雷達(dá)標(biāo)簽卷積

陳佳琪, 蘇治寶, 趙熙俊, 索旭東

(1.中國北方車輛研究所,北京100072;2.智能移動(dòng)機(jī)器人(中山)研究院,中山528436)

無人駕駛關(guān)鍵技術(shù)主要分為環(huán)境感知、導(dǎo)航定位、路徑規(guī)劃、決策控制4個(gè)方面.道路檢測是環(huán)境感知中的重要研究方向之一,是實(shí)現(xiàn)自主行駛的關(guān)鍵組成部分[1].道路檢測是指利用車輛本身搭載的傳感器對(duì)于前方環(huán)境進(jìn)行感知,劃分出可通行的道路區(qū)域,為后續(xù)的局部路徑規(guī)劃提供依據(jù).傳統(tǒng)的道路檢測算法依靠視覺傳感器采集的圖像信息進(jìn)行可通行區(qū)域檢測,主要分為基于圖像紋理特征的檢測算法[2-4]、基于圖像顏色特征的檢測算法[5-6]和基于分類器的檢測算法[7-8]3類.然而,由于圖像數(shù)據(jù)對(duì)于環(huán)境光十分敏感,同時(shí)光強(qiáng)度的快速變化也會(huì)導(dǎo)致采集圖像的嚴(yán)重失真,因此基于視覺傳感器的道路檢測算法的魯棒性較差.基于機(jī)器學(xué)習(xí)的視覺道路識(shí)別算法盡管在一定程度上能夠降低環(huán)境光對(duì)于檢測結(jié)果的影響,但仍然難以應(yīng)用于例如晨昏、夜間等實(shí)際的駕駛環(huán)境.

激光雷達(dá)(LiDAR)是以激光為信號(hào)源,通過接收反射光得到周圍環(huán)境的3D點(diǎn)云數(shù)據(jù).每個(gè)點(diǎn)云數(shù)據(jù)包含空間位置(x,y,z)和反射強(qiáng)度(intensity)信息.相比于視覺傳感器,利用激光雷達(dá)進(jìn)行道路檢測的優(yōu)勢(shì)一方面在于不依賴于外部信號(hào),具有受環(huán)境和光線影響小的特點(diǎn),另一方面能夠獲取豐富的三維空間信息,為利用結(jié)構(gòu)關(guān)系進(jìn)行檢測提供了可能.

全卷積神經(jīng)網(wǎng)絡(luò)(Fully Convolutional Networks, FCN)是圖像領(lǐng)域的一種成熟的端到端(end-to-end)分割網(wǎng)絡(luò),能夠有效實(shí)現(xiàn)像素級(jí)的語義分割任務(wù).本研究將在全卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,設(shè)計(jì)針對(duì)于點(diǎn)云的道路檢測網(wǎng)絡(luò)算法,并借助KITTI公開數(shù)據(jù)集進(jìn)行訓(xùn)練和測試.

1 基于全卷積神經(jīng)網(wǎng)絡(luò)的道路檢測算法

1.1 點(diǎn)云數(shù)據(jù)處理

盡管激光雷達(dá)點(diǎn)云能夠有效表示環(huán)境的三維結(jié)構(gòu),但由于點(diǎn)云的無序性,F(xiàn)CN網(wǎng)絡(luò)無法直接對(duì)其進(jìn)行學(xué)習(xí).3D正態(tài)分布變換(3D-NDT)算法[9]是基于統(tǒng)計(jì)學(xué)特征的點(diǎn)云配準(zhǔn)方法.該算法提出利用三維柵格化方法解決點(diǎn)云無序性的問題.考慮到FCN網(wǎng)絡(luò)在處理二維圖像數(shù)據(jù)上的優(yōu)勢(shì),我們將點(diǎn)云進(jìn)行二維壓縮后再進(jìn)行柵格化處理.如圖1所示,首先建立一個(gè)平行于LiDAR的x-y平面的二維網(wǎng)格,將每個(gè)激光點(diǎn)進(jìn)行投影,然后提取每個(gè)網(wǎng)格單元中的統(tǒng)計(jì)學(xué)信息.

圖1 點(diǎn)云數(shù)據(jù)處理流程

1.2 道路檢測網(wǎng)絡(luò)結(jié)構(gòu)

基于全卷積神經(jīng)網(wǎng)絡(luò)的道路檢測網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示.

圖2 基于全卷積神經(jīng)網(wǎng)絡(luò)的道路檢測網(wǎng)絡(luò)結(jié)構(gòu)

該網(wǎng)絡(luò)可以分為輸入層、編碼層、全卷積層、解碼層、輸出層5部分.

1)輸入層.針對(duì)道路檢測任務(wù),在每個(gè)柵格中提取點(diǎn)云數(shù)量、平均反射率、平均點(diǎn)云高度、點(diǎn)云高度標(biāo)準(zhǔn)差、最大點(diǎn)云高度和最小點(diǎn)云高度6個(gè)特征.

2)編碼層.利用了降采樣(Subsampling)網(wǎng)絡(luò)對(duì)于原特征圖進(jìn)行編碼,降低FCN網(wǎng)絡(luò)的內(nèi)存需求.卷積(Convolution)部分的卷積核為3×3,步長為1,填充策略為零填充,激活函數(shù)為ELU;降采樣部分采用了窗口為2×2、步長為2的最大池化層.

3)全卷積層.通過使用擴(kuò)展卷積(Dilated Convolutions)[10]實(shí)現(xiàn)網(wǎng)絡(luò)在不明顯提高卷積層數(shù)的基礎(chǔ)上擴(kuò)大網(wǎng)絡(luò)的感知域,提高網(wǎng)絡(luò)對(duì)于稀疏點(diǎn)云投影圖的學(xué)習(xí)能力.擴(kuò)展卷積部分的卷積核為3×3,步長為1,填充策略為零填充,激活函數(shù)為ELU;卷積部分的卷積核為1×1.

4)解碼層.利用最大反池化層進(jìn)行上采樣(Upsampling),得到與輸入層大小相同的輸出圖.卷積部分的卷積核為3×3,步長為1,填充策略為零填充,激活函數(shù)為ELU;利用Softmax回歸輸出道路檢測結(jié)果的概率圖.

5)輸出層.返回語義分割結(jié)果圖,即圖像中的每個(gè)值代表其對(duì)應(yīng)網(wǎng)格單元是否為可通行道路區(qū)域.

1.3 損失函數(shù)

采用Adam優(yōu)化算法[11]對(duì)FCN網(wǎng)絡(luò)進(jìn)行訓(xùn)練,初始學(xué)習(xí)率為0.01,學(xué)習(xí)衰減率為2.如式(1)所示,以二值交叉熵為損失函數(shù):

(1)

式中:W和H為輸出層的寬度和高度;N為批量尺寸,設(shè)置為25;y為FCN網(wǎng)絡(luò)預(yù)測的道路區(qū)域的概率.

為了提高模型泛化能力,防止出現(xiàn)過擬合,在每個(gè)擴(kuò)展網(wǎng)絡(luò)層之間添加空間丟棄層(Spatial Dropout 2D)[12],丟棄比例為0.25.FCN網(wǎng)絡(luò)使用以Tensorflow為后端的Keras框架實(shí)現(xiàn),并在內(nèi)存為16GB的Nvidia Tesla T4上進(jìn)行訓(xùn)練.

2 道路數(shù)據(jù)的獲取與處理

2.1 KITTI數(shù)據(jù)集

KITTI Road and Lane Estimation Benchmark數(shù)據(jù)集[13]中含有289個(gè)訓(xùn)練集和290個(gè)測試集數(shù)據(jù),包含城市無標(biāo)記道路(uu)、城市有標(biāo)記道路(um)、城市有標(biāo)記多車道道路(umm)3類典型駕駛場景.每個(gè)場景包含彩色圖像、灰度圖像、訓(xùn)練標(biāo)簽、激光雷達(dá)點(diǎn)云、相機(jī)雷達(dá)校準(zhǔn)參數(shù)等多種信息.

在本研究中,如表1所示,對(duì)于3類訓(xùn)練集數(shù)據(jù)分別進(jìn)行隨機(jī)采樣,各選取10份數(shù)據(jù)作為驗(yàn)證集.訓(xùn)練集用于訓(xùn)練FCN網(wǎng)絡(luò)權(quán)值,驗(yàn)證集用于評(píng)估每次訓(xùn)練的效果,測試集用于對(duì)于模型泛化誤差的評(píng)估.

表1 KITTI數(shù)據(jù)集信息與劃分

2.2 數(shù)據(jù)處理

如圖3所示,KITTI數(shù)據(jù)集提供的訓(xùn)練標(biāo)簽是在透視圖的基礎(chǔ)上手工標(biāo)注的.因此,需要將激光雷達(dá)點(diǎn)云(圖3(a))與標(biāo)簽數(shù)據(jù)(圖3(c))進(jìn)行融合,以確定每個(gè)激光點(diǎn)是否屬于道路區(qū)域,進(jìn)而得到特征圖的標(biāo)簽.

圖3 KITTI數(shù)據(jù)集信息

針對(duì)上述問題,一種常用的方法是對(duì)于圖片進(jìn)行逆透視變換(Inverse Perspective Mapping, IPM),即將由于透視效應(yīng)存在使得原本平行的事物在圖像中呈現(xiàn)相交的直線重新變?yōu)槠叫械牟僮?然而,IPM算法的前提假設(shè)是平坦無障礙的平面.在本研究的問題中,如圖4所示,激光雷達(dá)和視覺傳感器會(huì)采集車輛前方超過30 m的環(huán)境數(shù)據(jù),顯然會(huì)有大量情況不滿足上述假設(shè),從而導(dǎo)致獲取的標(biāo)簽信息錯(cuò)誤.另一種方法是依靠激光雷達(dá)和視覺傳感器之間的位置關(guān)系,將點(diǎn)云數(shù)據(jù)投影至透視圖中,以確定激光點(diǎn)的標(biāo)簽類型.

圖4 IPM投影誤差

在獲取標(biāo)簽數(shù)據(jù)后,需要對(duì)于點(diǎn)云進(jìn)行壓縮和柵格化處理.本研究將網(wǎng)格覆蓋區(qū)域限定為以車輛前方6 m為中心的寬20 m、長40 m的矩形區(qū)域,每個(gè)網(wǎng)格大小設(shè)置為0.1 m×0.1 m.本研究采用多數(shù)票規(guī)則獲得每個(gè)柵格的標(biāo)簽,即柵格中大多數(shù)點(diǎn)云的標(biāo)簽決定該柵格的標(biāo)簽.考慮到FCN網(wǎng)絡(luò)的訓(xùn)練,網(wǎng)格區(qū)域的標(biāo)簽采用one-hot編碼規(guī)則[14].

3 結(jié)果分析

3.1 評(píng)價(jià)指標(biāo)

在道路檢測任務(wù)中,一般將道路區(qū)域記為正類(Positive),其他區(qū)域記為負(fù)類(Negative).根據(jù)樣本的實(shí)際類別與分類器預(yù)測結(jié)果的組合,數(shù)據(jù)可以分為4類:判斷為正類的正類數(shù)據(jù)(True Positive)、判斷為負(fù)類的負(fù)類數(shù)據(jù)(True Negative)、判斷為正類的負(fù)類數(shù)據(jù)(False Positive)和判斷為負(fù)類的正類數(shù)據(jù)(False Negative).在此基礎(chǔ)上,道路檢測問題的混淆矩陣(Confusion Matrix)如表2所示.

表2 混淆矩陣

利用混淆矩陣的4個(gè)指標(biāo),可以得到評(píng)價(jià)道路檢測算法的常用指標(biāo):精確率、召回率、假陽性率和F值.精確率(Precision)指的是正類集合中被預(yù)測為正類的實(shí)例數(shù)量在所有預(yù)測為正類的實(shí)例數(shù)量中所占比例.召回率(Recall)指的是正類集合中預(yù)測為正類的實(shí)例數(shù)量在總體集合中正類實(shí)例總數(shù)中所占比例.假陽性率(FPR)指的是負(fù)類集合中預(yù)測為正類的實(shí)例數(shù)量在總體集合中負(fù)類實(shí)例總數(shù)中所占比例.綜合考慮精確率和召回率兩個(gè)指標(biāo),可以得到F值(F1-measure)指標(biāo).

,

(2)

,

(3)

,

(4)

.

(5)

3.2 算法結(jié)果分析

本研究算法在KITTI數(shù)據(jù)集下測試,并采用將帶標(biāo)簽激光雷達(dá)點(diǎn)云數(shù)據(jù)投影至相機(jī)圖像的方法進(jìn)行結(jié)果展示.圖5、圖6、圖7分別展示了模型在3類不同場景下的檢測情況.

圖5 城市無標(biāo)記道路檢測結(jié)果

圖6 城市有標(biāo)記道路檢測結(jié)果

圖7 城市有標(biāo)記多車道道路

從總體上看,模型對(duì)于各類道路場景具有較強(qiáng)的魯棒性,在有標(biāo)記道路和有標(biāo)記多車道道路上檢測效果較好,在無標(biāo)記道路上檢測結(jié)果較差,噪點(diǎn)較為明顯.對(duì)于場景中出現(xiàn)的障礙物,盡管有部分車身和障礙物表明包含有道路點(diǎn),但這并不會(huì)顯著影響對(duì)于道路的檢測.從點(diǎn)云俯視圖上來看,此類點(diǎn)由于具有相同的x和y的值,因而不會(huì)擴(kuò)大道路范圍.

表3為采用基于全卷積神經(jīng)網(wǎng)絡(luò)的道路檢測模型在KITTI數(shù)據(jù)集上的測試結(jié)果.在各類場景下,道路檢測的平均精確率為80.65%,平均召回率為77.01%,平均假陽性率為0.58%,平均F值為78.40%.

表3 KITTI數(shù)據(jù)集測試結(jié)果

盡管采用3類數(shù)據(jù)同時(shí)進(jìn)行訓(xùn)練,但模型對(duì)于三類道路的檢測能力有所不同.從精準(zhǔn)度和假陽性率來看,模型對(duì)有標(biāo)記多車道道路的檢測更好,即檢測為車道的部分可通行的概率更高;而從召回率來看,模型對(duì)有標(biāo)記道路的檢查更好,即檢測為車道的部分與真實(shí)車道的重合率更高.綜合考慮以上指標(biāo),模型對(duì)于有標(biāo)記道路的檢測能力最高.

分析原因,車道線相比普通路面的反射率更高,提高了模型對(duì)于道路的檢測效果.為了進(jìn)一步提高模型對(duì)于道路檢測的準(zhǔn)確度,可以考慮對(duì)于無標(biāo)記道路進(jìn)行單獨(dú)訓(xùn)練,通過激光雷達(dá)或相機(jī)檢測當(dāng)前環(huán)境是否存在車道線而決定使用何種模型進(jìn)行道路檢測.

從耗時(shí)來看,各類場景下的平均檢測耗時(shí)為93.6 ms.盡管耗時(shí)接近百毫秒,但考慮到檢測范圍為車輛前方6 m至46 m,所以認(rèn)為該模型能夠滿足實(shí)時(shí)檢測的要求.為了進(jìn)一步提高算法效率,可以考慮使用性能更高的GPU進(jìn)行模型的預(yù)測.

3.3 有效區(qū)域分析

激光雷達(dá)采集到的點(diǎn)云信息是不均勻的,密度隨著距離增加而減小.因此,不同的感知范圍將影響感知結(jié)果.表4為不同感知范圍對(duì)于模型評(píng)價(jià)指標(biāo)的影響.

表4 不同距離模型檢測效果

由表4可知,該模型在23 m以內(nèi)表現(xiàn)最好,之后隨著距離的增加檢測能力有一定下降.但在38 m的范圍內(nèi)F1-measure的值都超過了82%,具有較強(qiáng)的檢測能力.為了處理更遠(yuǎn)距離的道路檢測問題,可以考慮采用累計(jì)的點(diǎn)云進(jìn)行訓(xùn)練和預(yù)測.

4 結(jié) 論

針對(duì)無人駕駛中的道路檢測問題,本研究提出了一種基于全卷積神經(jīng)網(wǎng)絡(luò)和點(diǎn)云的道路檢測算法.算法通過點(diǎn)云構(gòu)建、標(biāo)簽獲取、網(wǎng)絡(luò)訓(xùn)練、模型預(yù)測等步驟對(duì)于車輛前方道路進(jìn)行檢測,并在KITTI數(shù)據(jù)集上進(jìn)行了效果測試.結(jié)果表明,道路檢測算法的平均精確率為80.65%,平均召回率為77.01%,平均假陽性率為0.58%,平均F值為78.40%,平均檢測耗時(shí)為93.6 ms,前方38 m范圍內(nèi)均有較強(qiáng)的檢測能力,對(duì)于各類場景具有較強(qiáng)的魯棒性.算法在識(shí)別精度、計(jì)算耗時(shí)、感知范圍和穩(wěn)定性上能夠滿足對(duì)于車輛前方道路的檢測要求.

猜你喜歡
激光雷達(dá)標(biāo)簽卷積
基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
法雷奧第二代SCALA?激光雷達(dá)
基于HITRAN數(shù)據(jù)庫的大氣激光雷達(dá)信號(hào)仿真
卷積神經(jīng)網(wǎng)絡(luò)的分析與設(shè)計(jì)
從濾波器理解卷積
基于激光雷達(dá)通信的地面特征識(shí)別技術(shù)
基于激光雷達(dá)的多旋翼無人機(jī)室內(nèi)定位與避障研究
無懼標(biāo)簽 Alfa Romeo Giulia 200HP
不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
基于傅里葉域卷積表示的目標(biāo)跟蹤算法
伊春市| 易门县| 白朗县| 富顺县| 龙井市| 南郑县| 万安县| 旬阳县| 微博| 资溪县| 大邑县| 竹北市| 共和县| 西乌| 富川| 镇安县| 特克斯县| 聂拉木县| 陆良县| 万盛区| 长泰县| 探索| 柳江县| 江山市| 西贡区| 汕头市| 家居| 商河县| 长岭县| 平昌县| 红桥区| 松滋市| 河东区| 京山县| 澜沧| 鸡泽县| 尚志市| 喀喇沁旗| 大连市| 军事| 湄潭县|