孫玉鑫 周立鵬 皮原征
(廣東省國土資源測繪院,廣東 廣州 510500)
在基礎測繪領域,高分辨率航空影像以其可靠性高、作業(yè)效率高的特點,常被用來生產(chǎn)4D產(chǎn)品,其生產(chǎn)工藝及數(shù)據(jù)處理方法趨于成熟穩(wěn)定。微軟UltraCam Eagle航攝儀獲取的航空影像,較常規(guī)航攝儀獲取的航空影像多了一個近紅外波段(670nm~940nm),大大提高了對地物信息的獲取能力,但充分利用帶有該波段航空影像進行地物分類的文獻較少。
為充分利用資源,以滿足基礎調查、專項調查、專題監(jiān)測等需求為目標,我們深入研究各類自然資源要素的分類體系,進一步拓展多源遙感影像的應用范圍,建立起多源遙感影像數(shù)據(jù)源與自然資源調查監(jiān)測對象之間的映射關系[1,2]。在對高空間分辨率的遙感影像進行分類時,傳統(tǒng)的基于像素的分類方法易產(chǎn)生“椒鹽現(xiàn)象”,為避免這個現(xiàn)象,我們考慮采用面向對象的遙感影像分類方法。采用面向對象的遙感影像分類方法進行分類時,除了要考慮影像分割算法、特征提取與特征選擇,分類算法的選擇也很重要。針對高分遙感影像,不同分類算法的分類結果差異較大。本實驗目的是探索高分辨率航空影像數(shù)據(jù)中可見光與近紅外波段相結合在地物分類中的優(yōu)勢,充分利用近紅外區(qū)域電磁波對不同地物的輻射特征,采用不同的面向對象遙感影像分類提取方法對高分辨率航空影像數(shù)據(jù)進行地物分類,并將人工的分類結果作為參考標準,對不同方法的分類結果進行定量評價[3],以探索建立多元遙感影像數(shù)據(jù)源與自然資源調查監(jiān)測對象之間的映射關系的可行性。
本實驗以某“高分辨率影像獲取”項目成果為實驗對象進行,影像數(shù)據(jù)由焦距為92mm的UCE航攝儀拍攝獲得,地面分辨率優(yōu)于0.2米,包含3個可見光通道和1個近紅外通道。實驗中使用的數(shù)據(jù)格式為無壓縮TIFF。截取其大小為2000×2000像素的影像進行不同地物分類方法的測試,測試區(qū)域分布的地物類型十分多樣,影像上部有河流穿過,河岸邊分布有常綠闊葉林和草地。影像主體部分位于郊區(qū),建筑物主要由零散村鎮(zhèn)中的低層居民房構成;影像中的交通道路類型包括一條省道、普通柏油馬路以及水泥路面。影像中段東部有面積廣闊的耕地,由表面有作物覆蓋與表面無作物覆蓋兩種耕地類型混合而成,因此在分類中依次劃分到植被類和裸露土地類中。地物包括林地、草地、耕地、裸地、道路、水體、建筑物以及其他地物等,適合開展高分辨率航空影像地物分類實驗[4]。
多尺度分割方法,是指依據(jù)選定的光譜特征和空間關系類別,將具有相同光譜特征和相近空間關系的像元劃分為同一像素集。在滿足像元平均異質性最小、對象內部像元之間同質性最大的前提條件下,再通過合并相鄰像素或小的分割對象來實現(xiàn)影像的分割[5]。
通過分割形成的影像對象,也就是像素集,將在面向對象的分類方法中承載更多附加信息,包括光譜、形狀和層次等。光譜特征和空間關系的選擇與提取極大地影響著分類器的設計和性能。通過對特征空間進行合理的特征選擇,再將經(jīng)過優(yōu)選的特征空間作為分類特征[5]。
實驗中用到了以下三種分類算法:
K最近鄰(K-Nearest Neighbor,KNN)分類算法,是用基于特征空間中最近的訓練數(shù)據(jù)對待分類對象進行分類的方法,是一個理論上比較成熟的方法,也是最簡單的機器學習算法之一[5]。K最近鄰分類方法依據(jù)待分類數(shù)據(jù)與訓練區(qū)元素在N維空間的歐幾里得距離來對影像進行分類,N由分類時目標物屬性數(shù)目來確定。相對傳統(tǒng)的最鄰近方法,K最近鄰法產(chǎn)生更小的敏感異常和噪聲數(shù)據(jù)集,從而得到更準確的分類結果,它自己會確定像素最可能屬于哪一類。
PCA算法(Principal Component Analysis),即主成分分析,它是最常用的降維方法之一,通過正交變換,將一組可能存在相關性的變量數(shù)據(jù)轉換為一組線性不相關的變量,轉換后的變量被稱為主成分。它會比較在主成分空間的每個分割對象和樣本,將得分最高的歸為這一類。
支持向量機(Support Vector Machine,SVM)是一種基于統(tǒng)計學習理論的機器學習算法。它通過解算最優(yōu)化問題,在高維特征空間中尋找最優(yōu)分類超平面,從而解決復雜數(shù)據(jù)的分類及回歸問題。支持向量機屬于一般化線性分類器,這種分類器的特點是它們能夠同時最小化經(jīng)驗誤差與最大化幾何邊緣區(qū),因此支持向量機也被稱為最大邊緣區(qū)分類器。
高空間分辨率遙感圖像上擁有更為豐富的地物幾何結構、細節(jié)紋理等方面的信息。針對現(xiàn)有的遙感影像分類理論、技術與軟件現(xiàn)狀,綜合分析高分辨率影像數(shù)據(jù)地物類型特點與景觀分布結構,實驗將從基本的圖像分割方法出發(fā),借助面向對象的遙感影像分類程序,利用不同的分類算法對高分影像進行地物分類。實驗的具體技術流程(如圖1所示):
圖1 實驗技術流程圖
通過選擇合適的參數(shù),對高分影像樣本進行多尺度分割,將具有相同光譜特征和相近空間關系的像元分割提取出來,合并為像素集。通過人工對樣本數(shù)據(jù)進行解譯分類,統(tǒng)計分類結果,得到標準分類成果。通過對像素集進行樣本選取和樣本定義,得到樣本庫,分別使用KNN、PCA和SVM三種分類方法得到監(jiān)督分類結果,與人工標準分類結果進行比對,得到精度評定結果,并進行統(tǒng)計分析。
影像被分為林地、草地、耕地、裸地、水體、房屋、道路、其他等8個類別,三個分類器共得到三個分類結果。為了能夠定性與定量地對實驗結果進行評價,對實驗數(shù)據(jù)進行人工分類,并將此結果(如圖2(b)所示)作為分類的參考標準來評估實驗中使用的不同分類方法的分類效果。此次實驗所使用的數(shù)據(jù)(如圖2(a)所示),而基于面向對象思想的不同分類算法處理的目視效果圖展示(如圖2(c)~(e)所示)(Masked類為掩膜區(qū)域超出影像范圍的無意義部分,不參與精度評定)。
圖2 實驗數(shù)據(jù)及分類效果圖
對手動分類結果與不同分類算法的分類結果分別計算混淆矩陣,并計算分類精度和Kappa系數(shù),將其作為定量分析中評估不同分類算法分類效果的評價指標。分類精度計算結果(如表1所示):
表1 不同分類器的分類結果精度對比
從目視效果看,三種方法都得到了較好的分類結果,基本上都能夠較好地反映影像地物的大致分布,且三者在分類結果的表現(xiàn)上存在一定的相似性,即它們都能夠將耕地、草地、林地等植被覆蓋區(qū)域進行較好的識別,但在植被覆蓋區(qū)域內部,如林地與耕地、草地與耕地之間的區(qū)分仍然存在一定的錯誤分類現(xiàn)象。此外,支持向量機與K最近鄰法分類結果中存在少量錯誤歸類的現(xiàn)象,如將水體錯分為房屋、將道路與房屋錯分為裸土等等,而在主成分分析法的分類結果中,不同類別之間的錯分現(xiàn)象更為嚴重,地物分類效果較差。
從精度評價結果來看,SVM和KNN取得了較好的分類精度,而PCA的分類精度則相對較差。其中,SVM的分類精度最高,達到了89.56%,Kappa系數(shù)也最高,為0.8378。而KNN分類的精度次之,達到了81.31%,Kappa系數(shù)為0.7031。PCA分類精度最差,僅為58.73%,Kappa系數(shù)為0.4667。
值得注意的是,將植被細分為林地、草地和耕地的分類方法,拖累了三種分類器的表現(xiàn),將上述三類地物合并為植被綜合類時,三種分類器的整體精度有所提升。
對三種分類器得到的分類結果分析如下:
(1)就結果而言,支持向量機的分類結果精度最好,地物錯分較少,結果可靠性高。對于類似實驗區(qū)域而言,這是較好的分類方法,能夠基本將擁有豐富地物幾何結構與細節(jié)紋理的高空間分辨率遙感圖像進行有效地分類,并取得相對較好的分類結果;
(2)從上表中可以看到,K最近鄰法中裸地類別與主成分分析法中草地類別的錯分比例都出現(xiàn)了異常的高值,說明這兩種方法的分類結果分別在裸地與草地類別上出現(xiàn)的錯分現(xiàn)象尤其嚴重。而支持向量機法在各個地物類別的錯分比例分布上表現(xiàn)得相對均衡,與K最近鄰法、主成分分析法相比,分類效果相對較好;
(3)從三種算法分類結果中植被綜合(林地、草地與耕地的綜合)與水體的錯分比例結果中發(fā)現(xiàn),三種方法錯分比例均相對較低,這說明具有可見光與近紅外的高分辨率航空影像數(shù)據(jù)在提取植被區(qū)域與水體區(qū)域具有明顯的優(yōu)勢。
高分樣本數(shù)據(jù)的整個分類過程中,每一個步驟都影響著其分類結果的精度,包括影像分割、樣本選擇、特征選擇、分類算法選擇等。實驗表明,高分航空影像的分類精度受分類特征維度和分類算法的選擇影響較大。其中,光譜特征、形狀特征和紋理特征都能較好地表達高分遙感數(shù)據(jù)的特點,可以用于區(qū)分城郊地區(qū)典型地物的類型。而不同分類算法對分類結果的影響最大,所以在分類過程中分類算法的選擇至關重要。
高分辨率航空影像數(shù)據(jù)中可見光與近紅外波段協(xié)同進行地物分類時,能夠充分展現(xiàn)出近紅外區(qū)域的電磁波對地表植被覆蓋區(qū)域的高反射特點以及對水體區(qū)域的高吸收特征,使得在植被與水系的識別中具備較大的優(yōu)勢,但植被種類細分時仍然存在較大的誤差。近紅外波段圖像在植被與水體提取方面精度較高,具有較大的應用價值。
本次實驗實現(xiàn)了面向對象圖像分類,探索了基于面向對象思想的高分辨率航空影像數(shù)據(jù)的三種監(jiān)督分類方法,并將支持向量機法(SVM)、K最近鄰法(KNN)、主成分分析法(PCA)三種不同分類算法的分類結果分別與人工分類結果進行對比,進而對各個算法的分類效果進行了定性與定量的評價。其中支持向量機法的整體分類效果最佳,且支持向量機法和K最近鄰法在植被和水體提取方面效果相近,且都優(yōu)于主成分分析法。本實驗的結果對城郊高分影像的分類有一定的參考價值,但對于具體的分類任務,還需根據(jù)實際情況選擇合適的分類算法,以充分發(fā)揮分類算法的決定性優(yōu)勢。