邢鵬威,唐詩華,張 曦,張 躍,何廣煥
(1.廣西空間信息與測繪重點實驗室,廣西 桂林 541006;2.桂林理工大學測繪地理信息學院,廣西 桂林 541006;3.河北工程大學礦業(yè)與測繪工程學院,河北 邯鄲 056038)
隨著無人機行業(yè)的快速崛起,無人機在我國智慧城市、智慧工廠、智慧礦山等諸多領域發(fā)揮出必不可少的優(yōu)勢。基于水利、建筑等行業(yè)對高精度DEM(Digital Elevation Model)的需求[1],DEM的數據獲取方式也隨之改變。目前,常采用機載Lidar(Light detection and ranging)、機載相機等方法采集數據。機載Lidar數據雖然光斑小可以穿透植被,但是雷達點云密度較無人機點云稀疏,且雷達點云無顏色信息[2];而無人機影像匹配點云數據具有顏色(RGB)信息和數據量大的特點,但是匹配點云無強度與回波信息,點云會受到地表植被的影響,經分類后的點云易產生漏洞,從而影響DEM的精度。為此,本文提出一種基于LS-SVM的無人機匹配點云修補方法,對漏洞周邊點云進行提取,通過LS-SVM方法對濾波后點云數據漏洞進行預測,通過擬合預測的點云數據生成DEM,從而解決去噪后無人機匹配點云影響DEM模型精度的問題。
本文采用不規(guī)則三角網(TIN)對高山區(qū)點云數據進行處理。首先,采用人工目譯的方法去除異常噪聲點,再以測區(qū)內最大建筑物為依據,將測區(qū)內點云進行網格劃分,以每個網格中最低點的種子點云構成三角網[3]。設定其他點到三角網的角度和長度閾值,判別是否為地面點,并將判斷好的地面點不斷計入三角網進行迭代計算,直到將所有點云判別完畢。TIN降噪后的點云見圖1。
圖1 TIN降噪匹配點云數據
再通過植被指數剔除未過濾掉的植被點,獲得更精細的地面點點云。濾除植被后點云數據見圖2。
圖2 去植被匹配點云數據
Kriging插值算法是以函數加區(qū)域變量為基礎,應用于空間數據分布的自然問題[4]。Kriging的多種優(yōu)化算法都是基于微小變量,公式如下
(1)
Kriging插值方法對求解權重λi極為重要,權重應滿足無偏估計,使估計方差達到最優(yōu)。該算法無偏估計表達式為
(2)
估計方差表達式為
(3)
式中,E為數學期望;C為協方差函數,運用協方差函數和變異函數之間的關系,以拉格朗日乘法為衡量標準,構建函數,建立n+1維線性方程組,即
(4)
將已知點數據代入式(4)即可求得λi。采用Kriging局部插值算法獲取的成果見圖3。
圖3 基于Kriging插值修補成果
反距離加權算法(Inverse Distance Weighted,IDW)以權重為核心,插值點的大小會被采樣點影響,針對未知點的距離權重,以權函數為依據[5],其權函數公式如下
(5)
式中,λj為j點權重;dj為j點和待預測點間的距離;u為權指數。權重是以距離為自變量的衰減函數,采樣點與待預測點之間距離越大,權重越小,當預測點距離采樣點一定距離以外,可忽略不計權重。各個采樣點權重的和便是每1個預測點的數值,公式為
(6)
式中,zj為j點的高程值;zp為預測點的高程值;d-u為距離衰減函數。
由于預測點的值取決于不同距離采樣點的權重,是一種精確的插值算法,因此,IDW易受采樣點精度的影響,使采樣點附近模型出現凸凹現象。采用IDW插值獲取的成果見圖4。
圖4 基于IDW插值修補成果
改進Shepare插值算法是一種標準導數距離加權過程[6],加權公式如下
(7)
式中,wi為權重;di為i點到插值點的距離;r為調整距離。改進Shepard算法調整權重的形式有2種:
(1)在給定半徑范圍內,權重wi根據最遠點的距離來調整,若范圍內距預測點最遠的距離為r,則修正的距離倒數加權公式為
(8)
(9)
式中,u為權指數;δ為平滑因子。當δ=0時為精確性插值算法,δ≠0時為非精確插值算法。
(2)權重wi結合了局部二次多項式,以擬合二次多項式修正高程值為參與倒數加權函數的高程值,公式為
(10)
式中,zj為預測點;Qi為二次多項式函數。采用改進Shepard插值算法獲取的成果見圖5。
圖5 改進Shepare插值修補成果
徑向基函數插值(Radial Basis Function,RBF)算法是用多個曲面的線性組合去逼近真實曲面。RBF算法由2部分組成,公式為
(11)
式中,zp為預測點高程;λi為第i點權重值;di為預測點到第i采樣點的距離;φ(di)為徑向基函數;fj(x)為趨勢函數,是次數小于m的基本多項式。
采用徑向基函數插值算法可以選取不同種類的徑向基函數φ(di),如多重二次曲面、倒數多重二次曲面等對離散數據進行插值[7]。與IDW插值算法相比,IDW插值以采樣點作為依據進行插值,不能預測超出采樣點范圍的數值,而徑向基函數算法通過趨勢函數可以計算超出采樣點范圍的數值。此次試驗以薄板樣條函數為徑向基函數,對去噪后匹配點云數據進行插值,公式為
(12)
式中,c為光滑因子。采用RBF算法獲取的成果見圖6。
圖6 基于RBF插值修補成果
LS-SVM是一種等式約束代替不等式約束,避免了在對偶空間求解二次規(guī)劃問題的算法,在計算速度上有著極大優(yōu)越性,與其他方法相比更適用于動態(tài)模型的構建。同時,也繼承了支持向量機模型(SVM)解決非線性、局部極值等問題的功能,這使其在函數估計和預測逼近中得到了廣泛應用[8-9]。運用已知數據非線性映射到特征空間構造函數,即
g(x,w)=wTφ(x)+b
(13)
式中,g為線性回歸函數;w為權值向量;φ(x)為非線性函數映射;b為閾值。LS-SVM的最小化問題見下式
(14)
其約束條件為
s.t.yi=wTφ(xi)+b+ξi
(15)
式中,w為法向量;C為正則化參數;ξi為誤差項。對于式(14)、(15)同時構造拉格朗日函數,得
(16)
式中,ai為拉格朗日乘子。根據ai與KKT(Karush Kuhn Tucker)條件進行計算,同時引入k(xi,xj)核函數得到優(yōu)化的線性方程,即
(17)
(18)
采用LS-SVM算法插值獲取數據結果見圖7。
圖7 基于LS-SVM算法修補成果
在分析5組插值后的DEM精度時,以測區(qū)實測CORS實時動態(tài)測量數據為檢查點,檢查點點位分布見圖8。將同時在測區(qū)測量的CORS實時動態(tài)測量高程數據作為真值Zi,取插值試驗數據為預測值Ri,以Z方向偏差、平均誤差MAE、均方差RMSE、擬合優(yōu)越度R2等交叉驗證指標評判插值算法精度。公式如下
(19)
圖8 檢查點分布
表1 5種插值方法插值精度統(tǒng)計
為了更加清晰分辨數據精度,將Kriging算法、IDW算法、RBF算法與LS-SVM算法的檢查點殘差4組數據殘差生成折線圖,由于改進Shepard插值數據結果RMSE與R2較差,不能滿足模型精度需求,故不繪制其殘差折線圖。4種插值算法殘差見圖9。從圖9可知,以改進Shepard插值算法的數據誤差較大,最大誤差值達到-1.151 m,將大量誤差較大數據剔除后,DEM模型產生豎向空洞與豎向凸起,其擬合優(yōu)越度較低(R2=0.992 4);IDW算法插值數據的采樣點誤差最大為-0.735 m,遠大于CH/T 9008.2—2010《基礎地理信息數字成果1∶500、1∶1 000、1∶2 000數字搞成模型》規(guī)定的采樣點最大誤差應為中誤差2倍(0.735 m>2×0.306 m);RBF與Kriging插值精度均劣于IDW算法,同時2組結果的MAE、RMSE與R2基本一致;LS-SVM插值數據相比較前4組數據而言精度明顯提高,LS-SVM插值的MAE=-0.148 m、RMSE=0.250 m、最大殘差0.447 m。
圖9 不同修補方法檢查點殘差折線
針對無人機匹配點云數據降噪后的漏洞修補問題,本文提出了基于LS-SVM的無人機匹配點云數據修補法。與其他幾種常規(guī)插值算法相比,預測數據與實際測區(qū)高程更接近,能較好地還原實際地貌特征。經此方法修補后數據的R2=0.999 5,擬合優(yōu)越度較高,RMSE=0.250 m,最大殘差0.447 m,滿足山地RMSE≤0.5 m、高山地RMSE≤1.0 m和采樣點數據最大誤差小于2倍RMSE的規(guī)范要求,滿足山地、高山地1∶500A級數字高程數字成果生產要求。同時,還能減少外業(yè)人員對漏洞的補測工作量以及在行業(yè)設計過程中土方工程量與水庫蓄水量等相關設計誤差。