朱云濤 李 飛 胡釗政▲ 吳華偉
(1.武漢理工大學智能交通系統(tǒng)研究中心 武漢 430063;2.武漢理工大學重慶研究院 重慶401120;3.湖北文理學院汽車與交通工程學院 湖北 襄陽 441053)
近些年,“汽車智能化”越來越受到學術界和工業(yè)界的關注,其中的高精度定位技術[1]是智能車技術的基礎和核心。激光雷達[2]由于有探測精準、信息量豐富、抗干擾性強等優(yōu)點,被廣泛應用在智能車定位領域。
基于激光雷達的定位主要分為激光SLAM[3](simultaneous localization and mapping)和地圖定位[4]2種。Zhang等[5]提出實時建立三維點云地圖并基于地圖矯正位姿的方法,但該方法在線建圖較耗時且隨運動距離增長會產(chǎn)生累積誤差。K.Koide等[6]同時融合GPS,慣性測量單元和激光雷達進行實時建圖和定位,引入了閉環(huán)優(yōu)化策略大大改善了累積誤差和定位高程差問題,但實際中閉環(huán)檢測和優(yōu)化非常困難。而地圖定位由于地圖離線采集、精度高等優(yōu)點,目前已經(jīng)被廣泛應用于工程實踐和生活當中。
語義地圖是通過語義分割建立的地圖。S.Thrun等[7]利用投影網(wǎng)格中點的高度差分割地面,D.Zermas等[8]對分段的地面點云分別利用RANSAC分割地面;彭澤民等[9]提取標準圖片與待識別圖片的垂直、水平方位的灰度分布,通過計算Pearson相關系數(shù)識別交通標志牌;李游[10]對體素化后的數(shù)據(jù)進行垂直連續(xù)性分析,同時結合自適應圓柱模型的方法分割桿狀物。這些單一方法都存在欠分割和使用場景單一的缺點。
利用語義地圖[11]對智能車定位意義重大。R.Dube等[12]將分割的語義目標直接匹配實現(xiàn)場景識別,但分割目標包括車輛等靜態(tài)物體,影響后續(xù)定位。Liu等[13]利用語義地圖中各語義目標的拓撲關聯(lián)信息實現(xiàn)場景識別,但單一的拓撲信息不能很好地表征場景。Chen等[14]使用深度學習剔除動態(tài)語義目標以實現(xiàn)靜態(tài)語義地圖的構建和智能車定位,但深度學習方法存在參數(shù)多、訓練量大的缺點?;诘貓D的智能車定位分為節(jié)點級定位和度量級定位2個部分,本文主要研究基于地圖的節(jié)點級定位。
本文提出了1種基于3D點云語義地圖表征的智能車定位方法,分為語義分割、地圖表征、定位3個部分。分割的語義目標由地面、交通標志牌、桿狀物組成;地圖表征模型由一系列位置節(jié)點組成,各位置節(jié)點由語義編碼和高精度全局位置共同表征,其中語義編碼的生成先后經(jīng)過語義俯視投影、帶權有向圖生成、語義路生成和語義路編碼4個過程,高精度全局位置由高精度慣導的數(shù)據(jù)表征;定位時,首先利用地圖節(jié)點的全局位置進行GPS粗定位,然后采用語義編碼漸進匹配的策略完成節(jié)點級定位,最后完成整個智能車定位過程。
圖1為系統(tǒng)流程圖,系統(tǒng)共分為3個模塊。
圖1 系統(tǒng)流程圖Fig.1 Flow of the system
1)語義分割。首先,對點云預處理和規(guī)則化實現(xiàn)地面點云分割;然后,基于反射強度和形狀特征實現(xiàn)交通標志牌的篩選;最后,利用基于對象分析的方法分割桿狀物。
2)地圖表征。利用語義編碼對地圖節(jié)點作語義表征,利用組合慣導采集的高精度GPS對地圖節(jié)點作全局位置表征,再由一系列位置節(jié)點組成語義地圖表征模型。
3)定位。在語義地圖表征模型建立后,通過GPS粗定位確定待定位節(jié)點在地圖中的大致范圍,語義編碼漸進匹配確定與當前車輛位置相距最近的表征模型的節(jié)點。
地面點占據(jù)整個點云的絕大部分,對分割影響較大,需要在分割其他物體前剔除;交通標志牌和桿狀物是道路場景的典型靜態(tài)特征,其形狀規(guī)則且特征顯著,分別代表了場景的水平維度特征和豎直維度特征;因此本文選擇這三者作為語義分割對象。
1.2.1 基于俯仰角評估的地面分割
對規(guī)則化后的點云作俯仰角評估實現(xiàn)地面點云分割,見圖2。先通過條件濾波截取設定范圍內的點云,再用統(tǒng)計濾波器去除離群點,再對點云規(guī)則化,即求出任意1個點的行和列下標,則點Pi(xi,yi,zi)的垂直角θvi和水平角θhi分別為
圖2 俯仰角評估示意圖Fig.2 Schematic of pitch angle evaluation
式中:(xi,yi,zi)為點云p中第i個點云pi的坐標;sqrt()為平方根函數(shù);arctan()為僅正切函數(shù)。
點P(xi,yi,zi)的水平序號IDh為
式中:θres為激光雷達的垂直角分辨率;θh為激光點云的水平角;floor()為向下取整函數(shù)。
分別連接相同水平序號的相鄰2個點,即點Pa(xa,ya,za)和其上面1個點Pb(xb,yb,zb),則其的俯仰角θab為
式中:abs()為絕對值函數(shù);xab,yab和zab分別為對應方向的坐標。由于實際中城市道路斜面坡度很小,本文設置俯仰角閾值為10°,若滿足θab≤θmax,則認為pb屬于地面點云。
1.2.2 基于反射強度和形狀特征的交通標志牌分割
利用反射強度和形狀特征從地面分割后的剩余點云中繼續(xù)分割交通標志牌。設置強度閾值對點云粗分割,將點云分割為大強度點云和小強度點云?;趶姸葘煌酥九谱鞔址指畹木唧w的效果見圖3。
圖3 交通標志牌粗分割Fig.3 Coarse segmentation of traffic signs
大強度點云包含絕大多數(shù)明顯的交通標志牌,對其歐式聚類,再對各聚類點云基于3種先驗信息構建多級濾波器完成精確分割,多級濾波器中設置點云數(shù)量閾值Nmin,高度閾值Hmin,高度差閾值Hdiff,當聚類Ci同時滿足
則該聚類Ci為最終分割的交通標志牌。
小強度點云可能包含背面朝向激光雷達的交通標志牌,以下對小強度點云實施精分割,精分割最終效果見圖4。舍棄高度Hi<Hmin的點,以去除灌木叢等干擾物,再利用PCA(principal component analysis)算法求出對應的特征值λ1,λ2和λ3以描述點云的形態(tài)特征,設λ1≥λ2≥λ3,D為空間維度,則有以下關系。
圖4 交通標志牌精分割Fig.4 Precise segmentation of traffic signs
由于道路上的交通標志牌附著在桿狀物體上,其點云集具有平面維度特征,因此若檢測到某點云點集的空間維度D=2,則表明其可能含有交通標志牌。其次再通過點的曲率特征,定義某幀點云中某1個點pi的曲率為
式中:|S|為點集S中的點云數(shù)量,S為與pi在同1條激光線束上的點集,且S表示的點集均勻分布在pi的兩側;ri為點云pi與激光坐標系原點間的歐式距離;rj為S中另1個點云pj與激光坐標系原點間的歐式距離;計算出某1個點的曲率后,設置曲率閾值cth,當滿足ci<cth則該點為平面上的點云。最終利用上述基于先驗信息的多級濾波器篩選出交通標志牌。
綜合對大強度點云的分割結果和對小強度點云的分割結果,可準確提取整個場景中的交通標志牌。
1.2.3 基于對象分析的桿狀語義目標分割
利用基于對象分析的方法從地面分割、交通標志牌分割后的剩余點云中分割桿狀目標,其主要包括桿狀交通設施和樹干。
對濾除地面和交通標志牌后的剩余點云歐式聚類生成點簇對象集合,該對象集合中存在僅包含單個物體的點簇對象和可能包含桿狀物的混合點簇對象。通過最小外包盒和迭代最小割結合的方法從混合對象中初步分割桿狀物,生成所有點簇對象的最小外包盒并設置篩選條件。
式中:st,Smin,zt,Hmin分別為最小外包盒在水平面上的俯視投影面積、面積閾值、最小外包盒高度、高度閾值。將滿足該條件的對象稱為混合點云對象,其次利用迭代最小割法[15]從中分割桿狀目標。
歐式聚類和迭代最小割后,桿狀目標被分割成一個個獨立的點簇對象。鑒于桿狀物豎直方向的半徑變化均勻且高度較高,本小節(jié)剔除大于一定高度的點簇對象后,用切片生長法從剩余點簇對象中分割出桿狀物,見圖5,步驟如下。
圖5 切片生長法分割Fig.5 Segmentation of slice growth
1)將點簇對象沿豎直方向均勻橫切形成若干切片,計算各切片的對角線長度di。
2)從下往上依次比較兩兩相鄰切片的對角線長度差Ddiff和長度差閾值dt,若Ddiff<dt則連接切片并進行切片增長生成增長切片。
3)設置閾值ds和Hs,按順序計算各增長切片對角線長度d和垂直高度H,若d<ds且H>Hs,若最終保留的增長切片數(shù)不為0,則為桿狀目標。
對智能車道路場景做地圖表征,表征過程見圖6,該模型由一系列地圖節(jié)點組成,各地圖節(jié)點由語義編碼和高精度全局位置組成,全局位置表示為通用橫墨卡托(universal transverse mercator,UTM)坐標。
圖6 點云語義地圖模型Fig.6 Semantic map modeling from point clouds
1.3.1 地圖節(jié)點的語義表征
首先生成語義編碼:以語義目標的整體點云質心代替實際物體,將分割的交通標志牌和桿狀語義目標作俯視投影得到語義俯視投影圖,見圖7。
圖7 語義俯視投影圖Fig.7 Semantic overhead projection
本文規(guī)定俯視圖左下角為起點,右上角為終點,從起點重復遍歷各類目標至終點結束,生成的帶權有向圖見圖8,語義目標間的權值以歐式距離表示。
圖8 語義帶權有向圖Fig.8 Semantically weighted digraph
記錄下每條路徑下的所有信息,包括目標節(jié)點序列、目標節(jié)點間距離、目標最小外包盒尺寸以及目標離地高度,生成1條語義路。式(11)表示從起點S經(jīng)過dsp1距離遍歷到桿狀目標,再經(jīng)過dp1s1遍歷到交通標志牌,再經(jīng)過ds1E距離到達終點E。
式中:lp1,wp1,hp1,zp1max分別為最小外包盒的長、寬、高和離地高度;p和s分別為桿和交通標志牌;1和2分別為桿和交通標志牌,最終所有語義路構成該場景的場景語義編碼,見圖9。
圖9 場景語義編碼Fig.9 Scene semantic coding
1.3.2 地圖節(jié)點的全局位置表征
利用組合慣導結合實時動態(tài)(real-time kinematic,RTK)載波相位差分技術采集高精度的GPS信息,由于智能車行駛的道路環(huán)境可以簡化為二維平面,UTM坐標系統(tǒng)使用基于網(wǎng)格的方法將地球的球面經(jīng)緯度坐標轉換成平面直角坐標,因此將節(jié)點的高精度GPS坐標投影到UTM平面坐標系中,即通用橫軸墨卡托投影系統(tǒng),以高精度UTM坐標表征地圖節(jié)點的全局位置。
本文以道路場景的地圖模型為基礎,將智能車定位分為粗定位和節(jié)點級定位。定位時只需要激光雷達和普通的GPS設備。
粗定位時,主要利用普通GPS縮小定位范圍,即根據(jù)待定位節(jié)點的GPS信息轉換成的UTM信息,從地圖表征模型的地圖節(jié)點中確定與當前待定位節(jié)點最相近的幾個地圖節(jié)點,該過程通過比較節(jié)點間的UTM坐標的歐式距離完成,最后得到節(jié)點候選集,粗定位過程見圖10。
圖10 GPS粗定位Fig.10 GPS coarse positioning
節(jié)點級定位時,通過不同節(jié)點對應的語義編碼之間的匹配實現(xiàn),以編碼中的語義路匹配數(shù)量表征節(jié)點間的匹配度,從節(jié)點候選集中選出和當前待定位節(jié)點匹配度最高的地圖節(jié)點,節(jié)點級定位見圖11。設semanticRoadj為待定位節(jié)點中的某條語義路,MSR={semanticRoadMi|i=1,2,…,n}為GPS粗定位后節(jié)點候選集中某個節(jié)點包含的語義路集合,待定位節(jié)點和候選節(jié)點間的語義路匹配依次按以下規(guī)則。
圖11 節(jié)點級定位Fig.11 Node-level Localization
1)目標種類序列匹配。設semanticRoadj的目標種類序列為S12121E,若MSR中存在某語義路序列與其相同則匹配成功。
2)最小外包盒和離地高度匹配。若語義路間對應種類的語義目標符合以下條件則匹配成功。
3)路徑權值匹配。設2個語義路集合的路徑權值集合為{di|i=1,2,…,N}和{dj|j=1,2,…,N},若滿足以下條件稱匹配成功。
式中:dth為路徑間的權重閾值;N為路徑總數(shù),通常經(jīng)過以上3個步驟可以確定出1條與semanticRoadj匹配上的語義路。
4)匹配唯一性檢驗。當semanticRoadj與MSR中多條語義路匹配時,此步確定出匹配度最高的語義路,設和分別為語義路中第m對桿狀物的距離和第n對交通標志牌間的距離,D為2條語義路的最終距離,則有
實驗平臺為搭載激光雷達和組合慣導的比亞迪E5智能車,見圖12(a),其上搭載的激光雷達和組合慣導系統(tǒng)的安裝位置見圖12(b)。實驗數(shù)據(jù)集由智能車以20~40 km/h的速度行駛在武漢市臨江大道上采集,雷達和慣導采集節(jié)點的頻率均為10 Hz且時間已同步,相鄰節(jié)點間距約0.5 m,實驗共采集3組數(shù)據(jù)集,總長度為3 576 m,覆蓋面積為47 628 m2,各數(shù)據(jù)集采集場景見圖12,其中:①數(shù)據(jù)集1閉環(huán)采集路線的總長度為792 m,地圖占用空間50.4 MB,共1 175個數(shù)據(jù)節(jié)點;②數(shù)據(jù)集2閉環(huán)采集路線的總長度為1 087 m,地圖占用空間91.2 MB,共1 987個數(shù)據(jù)節(jié)點;③數(shù)據(jù)集3閉環(huán)采集路線3的總長度為1 697 m,地圖占用空間168.3 MB,共3 077個數(shù)據(jù)節(jié)點。
圖12 實驗平臺和數(shù)據(jù)集路線Fig.12 Experimental platform and data set route
為充分驗證多語義目標分割算法的準確性,在3個數(shù)據(jù)集上分別對地面、交通標志牌和桿狀物的分割算法做實驗驗證。
2.1.1 地面語義分割
以改進的RANSAC算法[16]為對比算法,取每次擬合的最優(yōu)模型為最終模型,由于地面在激光雷達下方,只需對垂直角度小于0°的點云作地面分割,本文算法和RANSAC效果對比見圖13。
圖13 節(jié)點的地面分割結果Fig.13 Ground segmentation result of a node
從結果可以看出,用RANSAC會出現(xiàn)欠分割等缺點,可能會使漏檢的地面點影響后續(xù)語義目標的分割,而本文方法剔除地面充分,計算過程簡單。
2.1.2 交通標志牌語義分割
通過人工標注的方式統(tǒng)計到數(shù)據(jù)集1,2,3中分別包含交通標志牌的個數(shù)為26,42,57,以構建真值系統(tǒng),設立精確度(precision)和完整度(complete)這2個量化指標來評價交通標志牌的提取結果,計算見式(19)~(20)。
式中:TPs和FPs分別為檢測出的正確交通標志牌數(shù)量、錯誤交通標志牌數(shù)量;FNs為沒有檢測出來的交通標志牌數(shù)量。對于某1塊交通標志牌,在所有包含它的所有數(shù)據(jù)節(jié)點中,若交通標志牌都能被正確檢測出,則TPs加1;若在某1個節(jié)點中其他物體被錯誤檢測為交通標志牌,則FPs加1;若該交通標志牌在某1個節(jié)點中未能被成功檢測出,則FNs加1。
算法實驗效果見圖14,以文獻[17]所用的交通標志牌的檢測分割算法作為實驗對比的算法,對比實驗結果見表1~3。
表1 數(shù)據(jù)集1~3交通標志牌語義分割對比Tab.1 Comparative experiment results of data set 1~3
圖14 節(jié)點的交通標志牌分割結果Fig.14 Traffic-sign segmentation of a node
由表可知:本文方法在數(shù)據(jù)集1~3中的分割精確度分別為96.2%,97.6%,92.9%,完整度分別為96.2%,95.2%,94.7%,相較于文獻[17]的方法,本文方法精確度分別提高了0.2%,2.5%,1.7%;完整度分別提高了3.9%,2.3%,3.5%。從整體實驗結果來看,本文交通標志牌檢測方法優(yōu)于文獻[17]的方法,分割效果更好。
2.1.3 桿狀語義分割
通過人工標注的方式統(tǒng)計到數(shù)據(jù)集1~3中分別包含的桿狀語義的個數(shù)為132,213,326,以此構建真值系統(tǒng)。同樣,以2.1.2中的指標來評價桿狀語義的提取結果,以下標p代表桿狀語義。
實驗效果見圖15,以文獻[18]所用的桿狀物檢測算法作為對比算法,最終的對比實驗結果見表2。
由表2可知:本文方法在數(shù)據(jù)集1,2,3中的精確度分別為97.7%,97.6%,96.6%,完整度分別為96.2%,94.8%,96.2%,相比較于文獻[18]方法,本文方法分割的精確度分別提高0.9%,1.7%,2.3%。完整度分別提高6.1%,7.0%,9.4%。從整體的實驗結果來看,本文方法的精確度和完整度更高,更適用于道路場景的三維激光點云的桿狀語義目標分割。
表2 數(shù)據(jù)集1~3桿狀語義分割對比Tab.2 Comparative experiment results of data set 1~3
至此,所有語義目標分割結束,最終分割效果見圖15。
圖15 節(jié)點的桿狀語義分割結果Fig.15 Pole-shaped object segmentation result of a node
根據(jù)數(shù)據(jù)節(jié)點的位置序列,依次將數(shù)據(jù)集1~3分為奇數(shù)序列節(jié)點集和偶數(shù)序列節(jié)點集,其中奇數(shù)節(jié)點集和偶數(shù)節(jié)點集分別用于地圖表征模型的構建和定位,數(shù)據(jù)集1~3分別包含的奇數(shù)序列數(shù)據(jù)節(jié)點個數(shù)分別為588,994,1 539,本文分別為3組數(shù)據(jù)集構建了3套語義表征模型,其表征模型的地圖節(jié)點全局位置軌跡見圖16。
圖16 地圖節(jié)點全局位置軌跡Fig.16 Global positional trajectory of map nodes
偶數(shù)序列節(jié)點集用于智能車定位,數(shù)據(jù)集1,2,3分別包含的偶數(shù)序列數(shù)據(jù)節(jié)點個數(shù)為587,993,1 538。在GPS粗定位時,將GPS轉換成UTM坐標后計算待定位節(jié)點的UTM和地圖模型中各節(jié)點UTM的歐式距離,由于普通GPS的定位誤差約為10 m,因此將歐式距離小于5 m的所有節(jié)點作為粗定位結果,一般包含10個節(jié)點,得到的相鄰節(jié)點間距約1 m。節(jié)點級定位時,從粗定位結果中選擇語義編碼匹配度最高的1個節(jié)點作為節(jié)點定位結果。本文以文獻[19]中的方法作為定位的對比算法,最終得到了在數(shù)據(jù)集1~3中的定位對比實驗結果,見表3。
表3 數(shù)據(jù)集1~3定位精度對比Tab.3 Comparative experiment results of data set 1~3
由表3可知:數(shù)據(jù)集1,2,3中本文定位算法準確率分別為98.5%,97.6%,97.8%;相較于文獻[19],本文方法在以上3個數(shù)據(jù)集中準確率分別提高25.1%,30.2%,26.2%。
從實驗結果可以看出,本文提出的基于3D點云語義地圖表征的智能車定位方法的最近節(jié)點定位準確率高、魯棒性強。
針對智能車定位時節(jié)點定位準確率低、地圖存在動態(tài)物體等問題,本文提出了1種基于3D點云語義地圖表征的智能車定位方法:①提出了3種魯棒性強、精度高的語義分割算法:基于俯仰角評估的地面分割、基于反射強度和形狀特性的交通標志牌分割、基于對象分析的桿狀語義分割;②提出了新穎的智能車節(jié)點定位方法,該方法先后經(jīng)過語義投影、生成帶權有向圖、生成語義路和構造語義編碼等步驟,以語義信息表征場景信息,同時和全局位置共同表征語義地圖的各地圖節(jié)點,最終基于該語義模型實現(xiàn)了魯棒性強、精度高的節(jié)點級定位。
此外,本文的研究工作也存在一些不足之處,如:①語義分割的目標種類不是很豐富,下一步考慮增加語義分割的目標種類;②在場景過于相似之處,本文得到的語義編碼也會大致相同,下一步考慮優(yōu)化編碼方法,增強場景語義編碼的獨特性。