張小東,杜 寧,王 莉,張春亢,王慶余
(貴州大學(xué),貴州 貴陽 550025)
道路和人們的日常生活息息相關(guān),是GIS數(shù)據(jù)的組成之一,道路信息也是“智慧交通”的重要數(shù)據(jù)源。道路信息在城市規(guī)劃、交通控制以及應(yīng)急響應(yīng)等眾多領(lǐng)域都具有重要的作用[1],因此準(zhǔn)確的道路提取對(duì)一個(gè)城市而言就顯得十分重要。
基于遙感影像的道路提取研究一直是研究的熱點(diǎn),提出了許多的理論模型和方法。如傳統(tǒng)的Snake模型及其改進(jìn)[2-3]、邊緣檢測(cè)算法[4-5]等。隨著人工智能和計(jì)算機(jī)視覺的發(fā)展,道路提取算法不斷更新。其中Wang等人[6]采用深度卷積網(wǎng)絡(luò)和有限狀態(tài)機(jī)結(jié)合提取道路,提取的道路較為準(zhǔn)確,但需要人工選取種子點(diǎn)。魏清等人[7]利用批量隨機(jī)梯度下降法進(jìn)行卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練,進(jìn)而對(duì)高分影像進(jìn)行分類道路點(diǎn)云提取,采用數(shù)學(xué)形態(tài)學(xué)優(yōu)化提取道路,該方法的道路提取精度取決于構(gòu)建的網(wǎng)絡(luò),實(shí)驗(yàn)選取的道路場景較為簡單。蔡衡等人[8]采用極限學(xué)習(xí)機(jī)來進(jìn)行城市道路提取,通過改進(jìn)CS算法確定隱含層節(jié)點(diǎn),提高整體網(wǎng)絡(luò)訓(xùn)練的精度和穩(wěn)定性,進(jìn)而提高道路提取的精度。遙感影像提取道路容易受到陰影遮擋和細(xì)節(jié)干擾的影響,特別是城區(qū)建筑物和植被較多的地方,很容易造成“同譜異物”和“異物同譜”的現(xiàn)象,使得遙感影像道路提取的正確性和完整性達(dá)到瓶頸。
機(jī)載LiDAR以其具有不受天氣條件的影響、作業(yè)周期快、時(shí)效性強(qiáng)、自動(dòng)化程度高以及一定的植被穿透性等特點(diǎn),已經(jīng)成為城市道路提取重要的數(shù)據(jù)源之一。其中Zhao等人[9]先利用數(shù)學(xué)形態(tài)學(xué)方法對(duì)原始數(shù)據(jù)進(jìn)行濾波,運(yùn)用張量投票提取地面點(diǎn)的道路區(qū)域,根據(jù)平整度和凹凸性提取非地面的道路區(qū)域作補(bǔ)充,該方法能夠較完整提取道路,特別是高架道路提取效果較好。彭檢貴等人[10]通過點(diǎn)云的高程和強(qiáng)度信息粗提取道路點(diǎn)云,利用構(gòu)建的三角網(wǎng)進(jìn)行面積和邊長約束剔除道路噪聲點(diǎn),最后采用α-Shapes和數(shù)學(xué)形態(tài)學(xué)進(jìn)一步優(yōu)化提取道路輪廓和中線新。李峰等人[11]直接選取道路種子點(diǎn),根據(jù)高程和強(qiáng)度的約束進(jìn)行區(qū)域生長,進(jìn)而分割提取道路區(qū)域。機(jī)載LiDAR數(shù)據(jù)是大量不規(guī)則散亂的點(diǎn)云,缺乏光譜和語義信息。導(dǎo)致提取的道路邊界模糊、中心線彎折和細(xì)節(jié)缺失等。
機(jī)載LiDAR和遙感影像在提取道路方面都存在各自的優(yōu)缺點(diǎn),因此,結(jié)合兩者的信息來提取道路已經(jīng)成為研究的熱點(diǎn)。其中李靜怡等人[12]提出了一種信息融合的道路提取方法,該方法首先根據(jù)濾波后的點(diǎn)云反射強(qiáng)度粗提取道路中心線和關(guān)鍵點(diǎn),并融合離散度、強(qiáng)度和灰度圖像來優(yōu)化,最終利用動(dòng)態(tài)規(guī)劃法提取道路,但整體較多的閾值需要人為設(shè)定。高利鵬等人[13]首先將遙感影像和點(diǎn)云數(shù)據(jù)進(jìn)行配準(zhǔn),利用點(diǎn)云高程信息剔除建筑物,遙感影像分類出植被等偽信息,進(jìn)而提取出道路。但該方法精度依賴于配準(zhǔn)精度,且在地面停車場較多的復(fù)雜場景不適用。這些方法大都有良好的效果,但現(xiàn)今LiDAR數(shù)據(jù)內(nèi)容更加豐富,充分利用數(shù)據(jù)多種特點(diǎn)提取道路還有待加強(qiáng)。
隨著機(jī)載LiDAR技術(shù)的發(fā)展,現(xiàn)今大多的機(jī)載LiDAR都配置有CCD傳感相機(jī),獲得融合了影像即含有色彩信息的點(diǎn)云數(shù)據(jù)。該文利用這類點(diǎn)云數(shù)據(jù),提出了一種高斯混合模型組合分類的道路提取方法。高斯混合模型廣泛用于圖像分割,是無監(jiān)督分類的一種,但用于提取道路的研究不多。向晶等人[14]利用兩層高斯混合模型來對(duì)高分影像進(jìn)行無監(jiān)督分類,進(jìn)而提取道路,但效果不是很好。因此該文結(jié)合影像和LiDAR點(diǎn)云的特征,利用高斯混合模型進(jìn)行組合分類提取道路。
設(shè)xi為點(diǎn)云中第i個(gè)點(diǎn)所對(duì)應(yīng)的值,如點(diǎn)密度、反射強(qiáng)度等,總的點(diǎn)云個(gè)數(shù)為N個(gè),點(diǎn)云為d維且含有k個(gè)目標(biāo),每個(gè)目標(biāo)類所對(duì)應(yīng)的概率分布記為φj(x/θj),若都服從高斯正態(tài)分布,則對(duì)應(yīng)的高斯混合模型中xi的概率密度函數(shù)為:
(1)
其中,πj為點(diǎn)云xi屬于目標(biāo)類的先驗(yàn)概率,θj為第j個(gè)成分分布參數(shù),θ是所有參數(shù)的集合。
先驗(yàn)概率分布滿足的條件:
(2)
在式(2)的約束下,式(1)的參數(shù)解析較為復(fù)雜,一般采用迭代法。建立樣本最大似然方程,再采用EM算法對(duì)參數(shù)進(jìn)行估計(jì)。最大似然估計(jì)的基本假設(shè)是所有的N個(gè)樣本是獨(dú)立的,其似然函數(shù)可定義為:
(3)
取對(duì)數(shù),將式(1)代入得:
(4)
高斯混合模型的參數(shù)估計(jì)一般采用的是EM算法和梯度下降法,其中由Dempser等人[15]提出的EM算法是一種簡單的計(jì)算后驗(yàn)概率的迭代算法。EM進(jìn)行參數(shù)估計(jì)的過程如下:
E步:初始化模型參數(shù)μj、∑j和πj,計(jì)算樣本i屬于第j類的后驗(yàn)概率并標(biāo)準(zhǔn)化:
(5)
M步:最大化式(5),得到新的參數(shù)。具體公式如下:
(6)
(7)
(8)
重復(fù)上述過程,直至收斂,可以得到樣本i屬于第j類的后驗(yàn)概率Rij。
根據(jù)城市道路平坦且材質(zhì)均勻等特征,首先對(duì)點(diǎn)云進(jìn)行濾波和反射強(qiáng)度約束來粗提取道路點(diǎn)云。然后選取點(diǎn)云數(shù)據(jù)中的點(diǎn)密度和色彩信息進(jìn)行高斯混合模型組合分類,提取道路區(qū)域。最后利用數(shù)學(xué)形態(tài)學(xué)方法提取道路中心線。具體流程見圖1。
圖1 組合分類道路提取流程
1.3.1 點(diǎn)云數(shù)據(jù)預(yù)處理
機(jī)載LiDAR點(diǎn)云數(shù)據(jù)會(huì)出現(xiàn)一些明顯的高位和低位噪聲點(diǎn),利用局部的曲面擬合,設(shè)置較大的閾值來去掉噪聲。城區(qū)地勢(shì)較為平坦,該文采用Zhang等[16]提出的布料濾波算法從去噪后的點(diǎn)云數(shù)據(jù)中提取地面點(diǎn)。布料模擬濾波算法簡單的說就是將地形翻轉(zhuǎn),一塊布料覆蓋在上面,計(jì)算各點(diǎn)到布料的距離,設(shè)置閾值達(dá)到濾波的效果。
城市道路材質(zhì)一般為瀝青或者混凝土,其對(duì)應(yīng)的反射強(qiáng)度較低。反射強(qiáng)度值除了受材質(zhì)反射率的影響以外,還受激光入射角、材質(zhì)粗糙度等因素的影響[17],使得道路點(diǎn)云強(qiáng)度值變成區(qū)間范圍,且點(diǎn)云強(qiáng)度符合正態(tài)分布,因此該文利用偏度平衡法[18]來確定最佳的反射強(qiáng)度閾值,進(jìn)而粗提取道路點(diǎn)云。然后利用SOR濾波器過濾孤立的噪聲點(diǎn),達(dá)到粗提取道路點(diǎn)的目的。將初始道路點(diǎn)強(qiáng)度量化至0~255區(qū)間,生成初始道路點(diǎn)的強(qiáng)度影像,用于后續(xù)約束擴(kuò)展道路區(qū)域。建立Octree依次循環(huán)所有點(diǎn),計(jì)算每個(gè)點(diǎn)的點(diǎn)密度。將色彩信息值轉(zhuǎn)化為灰度值,用于高斯混合模型分類。
1.3.2 高斯混合模型組合分類
對(duì)于粗提取的道路點(diǎn),其中包含有許多和道路連接且材質(zhì)相似的停車場、天井等非道路區(qū)域?;叶戎岛忘c(diǎn)密度單個(gè)都是服從高斯混合分布,將兩者進(jìn)行聯(lián)合就形成二維的高斯混合模型,如圖2所示。
圖2 點(diǎn)密度和灰度值的高斯混合概率分布
一般選取3~5個(gè)分量數(shù)的高斯混合模型即可,該文將用4個(gè)高斯分量來擬合。首先利用K均值聚類算法粗略地找到中心點(diǎn),將點(diǎn)云中的各個(gè)點(diǎn)歸類到離它最近中心所代表的類別之中,根據(jù)中心點(diǎn)的初始值計(jì)算高斯混合模型中的參數(shù),每類點(diǎn)云個(gè)數(shù)占總點(diǎn)云數(shù)的比值作為先驗(yàn)概率。EM算法更新模型參數(shù)和先驗(yàn)概率,通過貝葉斯公式計(jì)算后驗(yàn)概率,進(jìn)而將整個(gè)數(shù)據(jù)分類,迭代直至收斂。高斯混合模型聚類屬于無監(jiān)督分類,沒有標(biāo)定數(shù)據(jù)。由于數(shù)據(jù)經(jīng)過預(yù)處理,數(shù)據(jù)量較大的部分屬于道路區(qū)域,其余歸為非道路區(qū)域。
1.3.3 道路區(qū)域優(yōu)化和中心線提取
基于高斯混合模型組合分類的道路區(qū)域靠近道路中心,因此導(dǎo)致其邊界有所缺失,特別是影像中有建筑物和樹木遮擋的區(qū)域。而機(jī)載LiDAR有一定的穿透能力,因此用量化后的強(qiáng)度影像來約束擴(kuò)展和補(bǔ)全道路區(qū)域。以數(shù)學(xué)形態(tài)學(xué)補(bǔ)全優(yōu)化的輪廓作為主動(dòng)輪廓法的初始輪廓,不斷平滑迭代。如圖3所示,其中(a)和(b)是未經(jīng)強(qiáng)度擴(kuò)展和約束的道路區(qū)域,(c)和(d)是經(jīng)過約束的道路區(qū)域。最后,用數(shù)學(xué)形態(tài)學(xué)方法提取道路中心線,得到最終的道路網(wǎng)。
圖3 強(qiáng)度影像擴(kuò)展約束對(duì)比圖
為驗(yàn)證算法的可行性,在python環(huán)境下進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)數(shù)據(jù)選取的是國外某城市的兩片中心區(qū)域,其中,實(shí)驗(yàn)1選取城市的商業(yè)區(qū),建筑物相對(duì)高大且植被較多,地勢(shì)較為平坦,道路規(guī)則。測(cè)區(qū)的面積為109 811.7平方米,點(diǎn)云個(gè)數(shù)2 390 689,平均點(diǎn)密度為每平方米21.77個(gè)。實(shí)驗(yàn)結(jié)果如圖4所示。實(shí)驗(yàn)2選取城市的住宅區(qū),地勢(shì)整體起伏較為平坦,遮擋較少,但道路密集且不規(guī)則。測(cè)區(qū)的面積為222 674.4平方米,點(diǎn)云個(gè)數(shù)3 290 206,平均點(diǎn)密度為每平方米14.77個(gè)。實(shí)驗(yàn)結(jié)果如圖5所示。
圖4 實(shí)驗(yàn)1結(jié)果
圖5 實(shí)驗(yàn)2結(jié)果
文中方法分別與使用灰度信息高斯混合模型和直接使用反射強(qiáng)度區(qū)域生長方法提取兩個(gè)實(shí)驗(yàn)區(qū)道路中心線作對(duì)比。如圖6所示,其中點(diǎn)云反射強(qiáng)度區(qū)域生長提取的道路易受點(diǎn)云疏密和強(qiáng)度的影響,其邊界不規(guī)則導(dǎo)致中心線彎折;灰度信息高斯混合模型提取易受陰影遮擋的影響。文中方法整合上述兩種方法,道路提取的完整性和正確性都較好。實(shí)驗(yàn)1中很好地減弱了陰影的影響(圖6中圓形框圈出處),提取效果較好;但仍有部分道路缺失和變形(圖6中矩形框圈出處),分析其原因是由于高大建筑物遮擋嚴(yán)重,使得強(qiáng)度點(diǎn)云和影像信息都有所缺失而導(dǎo)致。實(shí)驗(yàn)2整體道路提取較好,文中方法提取的道路中心線更加平滑且毛刺較少(圖6中橢圓形框圈出處)。
圖6 實(shí)驗(yàn)結(jié)果對(duì)比
采用三個(gè)指標(biāo)對(duì)道路提取的準(zhǔn)確性進(jìn)行量化評(píng)價(jià),分別是完整率Cp、正確率Cr和質(zhì)量Q[19]。其對(duì)應(yīng)的計(jì)算方法如下:
(9)
(10)
(11)
式中,Tp為正確提取的道路中心線長度;Fn為未能提取出的道路中心線長度;Fp為錯(cuò)誤提取道路中心線長度。
將手動(dòng)提取的道路長度與文中算法提取的道路長度進(jìn)行對(duì)比,兩組實(shí)驗(yàn)道路提取結(jié)果如表1所示。結(jié)果表明文中方法在城區(qū)的道路提取具有較好的效果。
表1 兩組實(shí)驗(yàn)道路提取精度對(duì)比
通過對(duì)各類數(shù)據(jù)道路提取算法研究分析影像和LiDAR點(diǎn)云的特征,提出了一種高斯混合模型組合分類的機(jī)載LiDAR城區(qū)道路提取方法。利用現(xiàn)有機(jī)載LiDAR點(diǎn)云數(shù)據(jù)中的色彩信息和點(diǎn)密度屬性,運(yùn)用高斯混合聚類分割提取初始道路區(qū)域,并利用強(qiáng)度影像擴(kuò)展和優(yōu)化道路輪廓,最后運(yùn)用數(shù)學(xué)形態(tài)學(xué)提取道路中心線。實(shí)驗(yàn)結(jié)果表明,該方法可以有效減弱陰影對(duì)道路提取的影響,提取的道路中心線較為平滑,對(duì)于不規(guī)則的道路也有較好的效果。但該方法仍存在不足,對(duì)于影像和點(diǎn)云數(shù)據(jù)同時(shí)存在的盲區(qū),例如高大建筑物和植被遮擋嚴(yán)重的區(qū)域提取效果不是很好,這也是后續(xù)研究改進(jìn)的重點(diǎn)。
計(jì)算機(jī)技術(shù)與發(fā)展2021年2期