郝 明,史文中,張 華
(1. 中國礦業(yè)大學(xué) 環(huán)境與測(cè)繪學(xué)院,江蘇 徐州 221116; 2. 香港理工大學(xué) 土地測(cè)量與地理資訊系,香港 999077)
基于遙感數(shù)據(jù)自動(dòng)提取建筑物和建筑物的三維重建是當(dāng)前研究的熱點(diǎn)[1-4]。利用人工提取方法從高分辨率遙感影像中提取建筑物耗時(shí)長、費(fèi)用高,而利用計(jì)算機(jī)自動(dòng)提取建筑物則會(huì)受到建筑物陰影及“同譜異物”現(xiàn)象的干擾,導(dǎo)致自動(dòng)提取結(jié)果精度偏低。機(jī)載激光掃描測(cè)高(light detection and ranging, LiDAR)技術(shù)的蓬勃發(fā)展,為建筑物的提取和三維重建提供了新的數(shù)據(jù)源和方法,并取得了較好的效果。
LiDAR技術(shù)是激光掃描測(cè)距系統(tǒng)、慣性測(cè)量系統(tǒng)(inertial measurement unit, IMU)、動(dòng)態(tài)差分全球定位系統(tǒng)(GPS)、成像系統(tǒng)和計(jì)算機(jī)的集成,能夠快速獲取高精度的地物和地面三維信息,并存儲(chǔ)為海量的點(diǎn)云數(shù)據(jù),具有全天候和大面積作業(yè)的優(yōu)點(diǎn)。近年來,國內(nèi)外學(xué)者對(duì)基于LiDAR數(shù)據(jù)的建筑物提取作了大量研究。文獻(xiàn)[2]利用馬爾可夫隨機(jī)場(chǎng)(RMF)模型根據(jù)建筑物的形狀、面積、空間關(guān)系和熵4部分能量進(jìn)行基于LiDAR數(shù)據(jù)的建筑物提??;文獻(xiàn)[3]利用多相水平集方法對(duì)建筑物屋頂進(jìn)行分類,并提取屋頂形狀,進(jìn)而得到更精確的建筑物輪廓;文獻(xiàn)[5]根據(jù)灰度共生矩陣計(jì)算的紋理特征,對(duì)規(guī)則化后的數(shù)字地表模型(DSM)進(jìn)行建筑物的提取,以區(qū)分建筑物與樹木;文獻(xiàn)[6]和文獻(xiàn)[7]將LiDAR數(shù)據(jù)與高分辨率遙感影像結(jié)合進(jìn)行建筑物的提取,充分利用LiDAR數(shù)據(jù)的高度信息和影像的光譜信息,取得了較好的效果;文獻(xiàn)[8]利用形態(tài)學(xué)濾波、區(qū)域增長和邊緣探測(cè)等方法綜合提取建筑物。研究發(fā)現(xiàn),在一些傳統(tǒng)算法中需要設(shè)置建筑物的最小和最大高程值[4, 9],當(dāng)?shù)匦未嬖谳^大起伏或呈現(xiàn)階梯狀時(shí),容易導(dǎo)致建筑物遺漏。針對(duì)該問題,本文提出一種基于層次(由粗到細(xì))的建筑物提取方法。
本文的試驗(yàn)方法流程如圖1所示。主要包括:① LiDAR數(shù)據(jù)的預(yù)處理,即對(duì)點(diǎn)云數(shù)據(jù)重采樣,生成DSM;② 利用迭代自組織數(shù)據(jù)分析(ISODATA)算法根據(jù)高度信息對(duì)DSM進(jìn)行聚類;③ 在聚類結(jié)果基礎(chǔ)上依次利用建筑物面積、地面高度差和梯度信息進(jìn)行建筑物信息的初步(粗)提?。虎?最后基于空間鄰域關(guān)系對(duì)粗提取到的建筑物進(jìn)行精處理。
圖1 由粗到細(xì)的建筑物提取流程圖
為進(jìn)行建筑物的提取,首先要對(duì)LiDAR點(diǎn)云數(shù)據(jù)進(jìn)行空間插值生成規(guī)則網(wǎng)格的DSM。文獻(xiàn)[10]對(duì)12種不同的插值方法(最近鄰插值、克里金插值、多項(xiàng)式回歸和移動(dòng)均值等)進(jìn)行了研究,結(jié)果表明最近鄰插值對(duì)間斷保存信息是適用的,且建筑物的原始高度可以較好地保存在插值后的DSM中,準(zhǔn)確提取建筑物不連續(xù)性。本文采用最鄰近插值方法對(duì)原始點(diǎn)云數(shù)據(jù)進(jìn)行插值生成2 m分辨率的網(wǎng)格DSM,作為后續(xù)處理的基礎(chǔ)數(shù)據(jù)。
ISODATA是一種動(dòng)態(tài)聚類算法,得到了廣泛應(yīng)用[11],本文用其對(duì)DSM進(jìn)行聚類。
(1)
式中,μc是c類的中心。在迭代過程中允許類的分裂、合并和刪除。誤差平方和在迭代中減小,直至達(dá)到收斂標(biāo)準(zhǔn)。
本文在ENVI軟件中執(zhí)行ISODATA算法,對(duì)DSM數(shù)據(jù)進(jìn)行聚類,需要預(yù)先設(shè)置控制參數(shù),包括類別數(shù)目C、允許迭代的最大次數(shù)I、一個(gè)類別中樣本的最少數(shù)目M、誤差平方和e、類間距離D和每次允許合并的類別對(duì)數(shù)L。
在完成對(duì)DSM距離影像的聚類之后,首先根據(jù)建筑物的最大和最小面積對(duì)各類進(jìn)行選擇,初步選出一些面積符合建筑物特征的備選目標(biāo)Oi,同時(shí)超過最大面積的目標(biāo)認(rèn)為是地面Gi,并利用這一假設(shè)進(jìn)行下一步提取。
在此基礎(chǔ)之上,利用高度信息,計(jì)算備選目標(biāo)Oi與其最近的地面G之間的高差hi
hi=Hi-HG
(2)
式中,Hi和HG分別為備選目標(biāo)Oi和距其最近的地面G的平均高度。若hi小于設(shè)定的閾值,則認(rèn)為備選目標(biāo)Oi不是建筑物。基于高差的方法代替了傳統(tǒng)的設(shè)置建筑物最小高度的方法,在一定程度上避免了由于地形起伏較大引起的建筑物錯(cuò)誤提取。
最后根據(jù)DSM的坡度信息,對(duì)備選目標(biāo)作進(jìn)一步提取。計(jì)算備選目標(biāo)的平均坡度值,并與設(shè)置的坡度閾值比較,如果大于坡度閾值,則認(rèn)為備選目標(biāo)是建筑物,否則為非建筑物。經(jīng)過上述處理,完成建筑物的粗提取。
基于粗提取到的建筑物信息,根據(jù)DSM距離影像像元之間的空間8鄰域信息,如圖2所示,對(duì)提取的建筑物內(nèi)部的小洞進(jìn)行填充,對(duì)粗提取建筑物進(jìn)行精處理。
圖2 空間8鄰域關(guān)系示意圖
該試驗(yàn)以徐州某大學(xué)校園的LiDAR數(shù)據(jù)為例,大小約為1.2 km×1.3 km。經(jīng)過最近鄰插值后生成2 m分辨率的DSM距離影像,如圖3所示,大小為596像素×651像素,最低和最高處分別為29 m和118 m。
圖3 最近鄰插值后生成的DSM
在ENVI軟件中執(zhí)行ISODATA算法,對(duì)DSM距離影像進(jìn)行聚類,初始參數(shù)設(shè)置如下:最小類別數(shù)為5,最大類別數(shù)為10,允許迭代的最大次數(shù)為20,一個(gè)類別中的最少數(shù)目為50,類間距離為10,每次允許合并的類別數(shù)為2。經(jīng)過迭代,DSM距離影像最終被聚為10類,如圖4所示。
依據(jù)聚類結(jié)果,依次對(duì)每類進(jìn)行建筑物的粗提取。首先設(shè)置建筑物的最小和最大像素?cái)?shù)目分別為25和2500,提取的備選目標(biāo)如圖5所示??梢钥闯?,建筑物被提取的同時(shí),也有一些山體、樹木和高坡被提取出來。此外,面積大于2500像素的目標(biāo)認(rèn)為是地面,并記錄下來,為高差閾值提取建筑物提供地面信息。
圖4 ISODATA算法聚類結(jié)果
圖5 面積閾值提取的備選建筑物
在此基礎(chǔ)之上,判斷備選建筑物平均高度與距其最近地面的平均高度之差,若小于設(shè)定的閾值,則認(rèn)為備選目標(biāo)是地面;反之則認(rèn)為是建筑物,接受后續(xù)處理。本文中設(shè)置高差閾值為3 m,處理后的結(jié)果如圖6所示。從圖中可以看出,原來建筑物內(nèi)部的區(qū)域已被去除。
圖6 高差閾值提取的備選建筑物
建筑物粗提取的最后一步是根據(jù)備選建筑物的坡度信息判定其真實(shí)性。圖7為試驗(yàn)區(qū)的坡度圖,最小值為0,最大值為89,本文設(shè)置坡度閾值為40。提取的結(jié)果如圖8所示。
圖7 試驗(yàn)區(qū)坡度信息
圖8 坡度閾值提取的建筑物
最后根據(jù)DSM距離影像的空間8鄰域關(guān)系,對(duì)提取的建筑物進(jìn)行填充,最終的提取結(jié)果如圖9所示。
圖9 最終提取的建筑物
從圖9中可以看出,校園的主體建筑物均被提取出來,并且位于山坡下和校園內(nèi)低矮的建筑物也能被提取。但是由于面積、高度差和坡度等閾值的設(shè)置,不可避免地造成了一些面積較小或與地面高差較小的建筑物的漏提或錯(cuò)提,見表1。試驗(yàn)區(qū)共有93棟建筑物,漏提和錯(cuò)提的建筑物分別為4棟和3棟,有89棟建筑物被正確提取出來,總誤差為7.5%,實(shí)現(xiàn)了高精度的建筑物自動(dòng)提取。
表1 建筑物提取誤差統(tǒng)計(jì)
影響本文方法精度的因素主要是ISODATA聚類數(shù)目和面積、高差、坡度閾值的設(shè)置。在ISODATA聚類過程中,類別數(shù)目設(shè)置過多或過少都會(huì)影響建筑物聚類的完整性,降低提取精度。在設(shè)置面積、高差和坡度閾值時(shí),如果設(shè)置的閾值不恰當(dāng),將造成建筑物的漏提或錯(cuò)提。因此最好對(duì)測(cè)區(qū)有些先驗(yàn)知識(shí),或者經(jīng)過多次試驗(yàn)調(diào)節(jié)這些閾值,以提高建筑物的提取精度。
針對(duì)LiDAR點(diǎn)云數(shù)據(jù)的特點(diǎn),本文提出一種由粗到細(xì)的建筑物自動(dòng)提取方法。試驗(yàn)表明,經(jīng)過粗提取和精處理,絕大部分建筑物都能被準(zhǔn)確地提取,能夠滿足三維建筑物重建的需要。特別是測(cè)區(qū)地形起伏較大時(shí),可以避免傳統(tǒng)方法中設(shè)置建筑物最小高度而引起的建筑物漏提現(xiàn)象。如果能結(jié)合測(cè)區(qū)的多光譜影像或原始GIS數(shù)據(jù)等其他信息,可以進(jìn)一步提高建筑物的提取精度,這也是今后的研究方向。
參考文獻(xiàn):
[1] BALTSAVIAS E. Object Extraction and Revision by Image Analysis Using Existing Geodata and Knowledge: Current Status and Steps towards Operational Systems [J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2004, 58(3): 129-151.
[2] APARECIDA DOS SANTOS G E, PORFRIO D P A. Extraction of Building Roof Contours from LiDAR Data Using a Markov-Random-Field-Based Approach [J].IEEE Transactions on Geoscience and Remote Sensing, 2012, 50(3): 981-987.
[3] KIM K H, SHAN J. Building Roof Modeling from Airborne Laser Scanning Data Based on Level Set Approach [J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2011, 66(4): 484-497.
[4] 馮甜甜, 龔健雅.基于 LiDAR 數(shù)據(jù)的建筑物自動(dòng)提取方法的比較[J].測(cè)繪通報(bào), 2011(2):21-23.
[5] 張皓, 黃艷, 楊洋, 等.基于 GLCM 紋理特征的 LiDAR 點(diǎn)云建筑物自動(dòng)提取[J].測(cè)繪通報(bào), 2010(11):31-33.
[6] 郝明, 鄧喀中, 張華.基于遙感數(shù)據(jù)提取建筑物的主動(dòng)輪廓改進(jìn)模型 [J].中國礦業(yè)大學(xué)學(xué)報(bào), 2012,41(5):833-838.
[7] SOHN G, DOWMAN I. Data Fusion of High-resolution Satellite Imagery and LiDAR Data for Automatic Building Extraction[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2007, 62(1):43-63.
[8] ZHANG K, YAN J,CHEN S C. Automatic Construction of Building Footprints from Airborne LIDAR Data [J].IEEE Transactions on Geoscience and Remote Sensing, 2006, 44(9):2523-2533.
[9] 張小紅. 機(jī)載激光雷達(dá)測(cè)量技術(shù)理論與方法[M]. 武漢:武漢大學(xué)出版社,2007:137-146.
[10] YANG C S, KAO S P, LEE F B, et al. Twelve Different Interpolation Methods: A Case Study of Surfer 8.0[C]∥Proceedings of the XXth ISPRS Congress.Turkey: Istanbul,2004.
[11] JAIN A K, MURTY M N, FLYNN P J. Data Clustering: A Review[J].ACM Computing Surveys, 1999, 31(3):264-323.
[12] TARABALKA Y, BENEDIKTSSON J A, CHANUSSOT J. Spectral-spatial Classification of Hyperspectral Imagery Based on Partitional Clustering Techniques [J].IEEE Transactions on Geoscience and Remote Sensing, 2009, 47(8):2973-2987.