摘 "要: 分類技術(shù)是從遙感影像數(shù)據(jù)中提取信息必不可少的步驟,選擇合適的分類器對(duì)提高分類精度至關(guān)重要,針對(duì)特定的研究如何選擇適合的分類算法是一個(gè)亟需研究的問題。以北京市中心誠區(qū)中某一區(qū)域?yàn)檠芯繀^(qū),應(yīng)用“高分一號(hào)”(GF?1)數(shù)據(jù)和Landsat 8數(shù)據(jù),分別采用最常用且分類精度相對(duì)較高的監(jiān)督分類中的最小距離法、最大似然法、支持向量機(jī)法,將研究區(qū)分為林地、草地、水體、裸土、建筑物5種類型,并對(duì)分類結(jié)果進(jìn)行空間分布、面積、精度三個(gè)方面的比對(duì)分析。結(jié)果表明,分類算法的選擇主要取決于研究區(qū)的地物特點(diǎn),其中最小距離法應(yīng)用于植被覆蓋面積較大的區(qū)域時(shí)精度較高,最大似然法適合于分類建筑物較多的區(qū)域,支持向量機(jī)法對(duì)各類地物的分類具有較高的普適性。
關(guān)鍵詞: 遙感影像; 分類技術(shù); 最小距離分類; 最大似然分類; 支持向量機(jī); GF?1; Landsat 8
中圖分類號(hào): TN929?34; TP391; P237 " " " " " " " " 文獻(xiàn)標(biāo)識(shí)碼: A " " " " " " " 文章編號(hào): 1004?373X(2024)06?0137?05
Scalability analysis of typical remote sensing image classification method
WU Yingjie1, 2, FENG Yong1, 2, XU Xiaolin1, 2, LIU Siyu1, 2, ZHU Hui1, 2
(1. Key Laboratory for Meteorological Disaster Prevention and Mitigation of Shandong, Jinan 250031, China;
2. Shandong Meteorological Data Center, Jinan 250031, China)
Abstract: The classification is an indispensable step to extract information from remote sensing images. Selecting appropriate classifier is very important to improve the classification accuracy. How to choose suitable classification algorithm for specific research is an urgent problem to be solved. An area in the central of Beijing is selected as the research area, the GF?1 data and Landsat 8 data are applied, and the most commonly used and relatively high classification accuracy supervised classification methods such as minimum distance method, maximum likelihood method, and support vector machine method are applied, resperctively. The research is divided into five categories: forest land, grassland, water body, bare soil and buildings. The comparative analysis for the classification results in terms of spatial distribution, area, and accuracy are conducted. The results show that the selection of the classification algorithm mainly depends on the characteristics of the ground features in the study area, among which the minimum distance classification has a higher accuracy when applied to the area with large vegetation cover, the maximum likelihood classification is suitable for the area with many buildings, and the support vector machine has high universality to all kinds of objects.
Keywords: remote sensing images; classification techniques; minimum distance classification; maximum likelihood classification; support vector machine; GF?1; Landsat 8
0 "引 "言
遙感影像分類是將影像的所有像元根據(jù)其性質(zhì),按照某種規(guī)則或算法來劃分為不同的類別[1]。為有效地從遙感影像數(shù)據(jù)中提取出有用的信息,分類技術(shù)是必不可少的,而且分類的結(jié)果是眾多研究的基礎(chǔ)。因此,遙感影像分類技術(shù)一直備受關(guān)注[2?5]。在過去的研究中已經(jīng)開發(fā)了許多分類方法,常用的分類方法有非監(jiān)督分類中的K均值、ISODATA和監(jiān)督分類中的最小距離分類(Minimum Distance Classification, MDC)、最大似然分類(Maximum Likelihood Classification, MLC)、支持向量機(jī)(Support Vector Machine, SVM)[6?8]。這些算法創(chuàng)建時(shí)間較早,目前已經(jīng)發(fā)展得較為成熟,在各影像處理軟件中均有集成,應(yīng)用范圍極為廣泛[9?10]。由于監(jiān)督分類過程中加入了先驗(yàn)知識(shí),所以其分類結(jié)果的精度普遍高于非監(jiān)督分類。因此,目前在對(duì)遙感影像進(jìn)行分類時(shí)多選擇監(jiān)督分類中的最大似然法、最小距離法和支持向量機(jī)三種方法。
遙感影像分類是一個(gè)復(fù)雜的過程,受到諸多因素的影響,例如所選擇的遙感數(shù)據(jù)、研究區(qū)域的復(fù)雜性以及影像處理和分類的方法[11?12]。在實(shí)際分類中,并不存在一個(gè)單一“正確”的分類形式,需根據(jù)研究內(nèi)容及要求選擇合適的分類器。以往對(duì)遙感分類的研究多集中于發(fā)展先進(jìn)的分類方法和技術(shù)以提高分類精度[13?14],但對(duì)分類方法適用性的研究較少,而選擇合適的分類器對(duì)提高分類精度至關(guān)重要。針對(duì)特定的研究區(qū)域、特定的遙感數(shù)據(jù)、特定的研究內(nèi)容,如何選擇適合的分類算法是一個(gè)亟需研究的問題。
針對(duì)上述問題,本文以北京市中心城區(qū)中某一區(qū)域?yàn)檠芯繀^(qū),選擇高分辨率遙感數(shù)據(jù)的代表數(shù)據(jù)“高分一號(hào)”(GF?1)數(shù)據(jù)和中分辨率遙感數(shù)據(jù)的代表數(shù)據(jù)Landsat 8數(shù)據(jù),進(jìn)行如下研究:
1) 采用最常用且分類精度相對(duì)較高的監(jiān)督分類中的最小距離法、最大似然法、支持向量機(jī)三種方法將研究區(qū)分為5種常見的類別:林地、草地、水體、裸地、建筑物;
2) 對(duì)各類別分類結(jié)果的空間分布特征和面積進(jìn)行對(duì)比分析;
3) 對(duì)比分析運(yùn)用不同數(shù)據(jù)和不同分類方法分類的精度。
通過研究來說明各分類方法的特點(diǎn)及其適用性,為選擇適合于某一特定研究的遙感影像分類方法提供依據(jù)。
1 "研究區(qū)
研究區(qū)位于北京市中心城區(qū),如圖1所示,經(jīng)緯度范圍為:39°56'35[″]~40°1'3[″]N,116°13'46[″]~116°19'29[″]E。研究區(qū)內(nèi)地物類型豐富,如:建筑物所占面積較大,較為密集,而且建筑物類型豐富,有低矮的建筑區(qū)、高層建筑群、飛機(jī)場等;水域類型較為全面,不僅有大片水域,還有城市公園中面積較小的觀景湖,同時(shí)還有河流;研究區(qū)內(nèi)的植被既有林地也有草地,且存在一些未開發(fā)的裸地。因此,以該研究區(qū)為例對(duì)分類方法適用性進(jìn)行研究,其研究結(jié)果具有一定的代表性和普適性。
2 "數(shù)據(jù)與分類方法
2.1 "數(shù) "據(jù)
本文選取“高分一號(hào)”(GF?1)數(shù)據(jù)和Landsat 8數(shù)據(jù)作為分類影像數(shù)據(jù),分別代表高分辨遙感數(shù)據(jù)和中分辨率遙感數(shù)據(jù)?!案叻忠惶?hào)”(GF?1)來源于中國資源衛(wèi)星應(yīng)用中心(http://www.cresda.com/CN/),影像獲取時(shí)間為 2015年9月24日,空間分辨率為16 m,包含藍(lán)、綠、紅、近紅4個(gè)波段。Landsat8數(shù)據(jù)來源于美國地質(zhì)調(diào)查局 (http://glovis.usgs.gov/),影像獲取時(shí)間為2015年9月23日,空間分辨率為30 m,包含藍(lán)邊、藍(lán)、綠、紅、近紅、中紅(兩個(gè))等7個(gè)波段。同時(shí)選擇同年的Google Earth影像作為參考影像,用以選擇驗(yàn)證樣本來驗(yàn)證分類結(jié)果。所選影像在研究區(qū)內(nèi)均無云,研究區(qū)假彩色合成的原始影像如圖2所示。
2.2 "分類方法簡介
2.2.1 "最小距離法
最小距離分類是最簡單的監(jiān)督分類方法,它是一種含參數(shù)的分類器。該算法是利用訓(xùn)練樣本數(shù)據(jù)計(jì)算出每一類的均值向量[mii=1,2,…],然后以均值向量作為該類在特征空間中的中心位置, 計(jì)算未知向量X到各類中心的距離D,到哪一類中心的距離最小就屬于哪一類。其中距離即為判別函數(shù),最常用的距離是歐幾里得距離。
[D=X-miTX-mi] (1)
2.2.2 "最大似然法
最大似然分類算法是一種用于監(jiān)督分類的參數(shù)分類算法,是1999年由Erdas提出的基于貝葉斯方程計(jì)算未知測量向量X,屬于已知類別M中的似然度D的算法[6]。
[D=lnac-12lncovc-12X-McTcov-1cX-Mc]
(2)
式中:[ac]表示類別M中包含向量X的概率;[Mc]和[covc]是M的均值向量和協(xié)方差矩陣;未知向量X將隸屬于似然度最高的類別。
最大似然算法的優(yōu)勢(shì)在于其考慮了類別內(nèi)的方差?協(xié)方差,對(duì)于正態(tài)分布數(shù)據(jù),相較于其他分類算法而言表現(xiàn)得更好;但對(duì)于非正態(tài)分布的數(shù)據(jù),結(jié)果可能存在較大誤差。
2.2.3 "支持向量機(jī)
支持向量機(jī)是一種用于分類和回歸的非參數(shù)算法。SVM理論最初是1971年由Vapnik和Chervonenkis提出的,1998年被引入了遙感領(lǐng)域。設(shè)訓(xùn)練樣本集為k個(gè)樣本的兩類問題,可以用[Xi,yi(i=1,2,…,k)]表示。其中,[X∈RN],是N維的空間向量;[y∈{-1,1}],為類別標(biāo)簽。SVM算法是以兩類別之間的距離最大為原則,尋找最優(yōu)的分類超平面[15],從而分離兩個(gè)類別。分類超平面可以表示為:
[W??X+b=0] (3)
式中:W為垂直于線性超平面的向量(它決定了超平面的方向);標(biāo)量b表示判別超平面與原點(diǎn)的偏移量;[?]為將X映射到高維特征空間的映射函數(shù),用于在高維空間中構(gòu)造最優(yōu)分類平面。在從低維映射到高維的時(shí)候,常用的核函數(shù)包括線性核函數(shù)、多項(xiàng)式函數(shù)、徑向基函數(shù)(RBF)和Sigmoid核函數(shù)。
2.3 "影像分類
根據(jù)研究區(qū)地物特點(diǎn)將研究區(qū)分為5類常見的類別:林地、草地、水體、裸地、建筑物,全面均勻地在研究區(qū)的“高分一號(hào)”(GF?1)數(shù)據(jù)上選取具有代表性的訓(xùn)練樣本,勾選樣本均為純凈像元,經(jīng)檢驗(yàn)樣本在Landsat 8數(shù)據(jù)上也均為純凈像元。對(duì)訓(xùn)練樣本進(jìn)行波譜可分離度檢驗(yàn),分離度均在1.8以上,都屬于合格樣本。利用選取的訓(xùn)練樣本,采用最小距離法、最大似然法、以RBF為核函數(shù)的支持向量機(jī)法和以Sigmoid為核函數(shù)的支持向量機(jī)法等方法對(duì)研究區(qū)內(nèi)的“高分一號(hào)”(GF?1)和Landsat 8數(shù)據(jù)的全部像元進(jìn)行分類。
3 "結(jié) "果
3.1 "分類結(jié)果
兩類數(shù)據(jù)5類地物4種分類方法的8個(gè)分類結(jié)果如圖3所示,對(duì)分類結(jié)果中各地物類別面積的統(tǒng)計(jì)結(jié)果如圖4所示。將分類結(jié)果與原始影像對(duì)比分析可知,最小距離法的分類結(jié)果中水體面積偏大,建筑物面積偏小,這是由于將建筑物陰影錯(cuò)分為水體所致。最大似然法的分類結(jié)果中建筑物和草地面積較大,水體和林地的面積偏小,存在部分林地錯(cuò)分為建筑物的情況以及水體漏分的情況,其中河流分類效果較差。采用不同核函數(shù)的支持向量機(jī)的分類方法的分類結(jié)果類似,僅在水體和林地分類結(jié)果中存在微小的區(qū)別。相比于另外兩種分類方法,支持向量機(jī)法分類結(jié)果的各地物面積均處于較均勻的水平;但存在將建筑物陰影錯(cuò)分為水體的現(xiàn)象,且以Sigmoid為核函數(shù)的方法要比以RBF為核函數(shù)的方法現(xiàn)象更為嚴(yán)重。綜上,各分類方法結(jié)果不同的根本原因是分類算法的不同。
同種分類算法不同遙感影像的分類結(jié)果也存在區(qū)別,由于Landsat 8影像的分辨率較低,所以其分類結(jié)果相對(duì)較為粗糙。GF?1數(shù)據(jù)分類結(jié)果中建筑物和草地的面積均偏低,裸地面積均偏高;Landsat 8影像最大似然法的分類結(jié)果中草地面積較大,裸地面積則偏小;采用支持向量機(jī)分類時(shí),Landsat 8影像的分類結(jié)果要比GF?1影像的分類結(jié)果更好,河流可以得到較好的區(qū)分,裸地的分類結(jié)果也較為準(zhǔn)確,但依舊存在將建筑物陰影錯(cuò)分為水體的現(xiàn)象。不同影像的分類結(jié)果不同,這與數(shù)據(jù)的空間和波譜分辨率有著密不可分的關(guān)系,同時(shí)也和研究區(qū)的地物特點(diǎn)相關(guān)。因此,對(duì)研究區(qū)進(jìn)行分類時(shí)要依據(jù)研究目的,結(jié)合研究區(qū)特點(diǎn)選擇合適分辨率的影像。
3.2 "精度評(píng)價(jià)
通過目視解譯Google Earth參考影像選擇檢驗(yàn)樣本。利用混淆矩陣對(duì)分類結(jié)果進(jìn)行精度評(píng)定,所有分類結(jié)果均使用相同的檢驗(yàn)樣本進(jìn)行精度評(píng)定,結(jié)果見表1、表2。表中:Prod.Acc為制圖精度;UserAcc為用戶精度。
表中最大似然分類的結(jié)果精度最高,應(yīng)用GF?1分類的總體精度為89.15%,應(yīng)用Landsat 8分類的總體精度為98.42%,分類效果整體較好,僅裸地用戶精度和水體的制圖精度相對(duì)其他分類結(jié)果的精度而言較低,以及存在少部分裸地誤分的現(xiàn)象,導(dǎo)致裸地分類結(jié)果中面積過大,而水體則存在漏分現(xiàn)象,致使分類結(jié)果中面積過小。
最小距離分類結(jié)果精度最低,應(yīng)用GF?1數(shù)據(jù)進(jìn)行分類時(shí)的總體精度僅為66.78%,這是由于過多建筑物的陰影被錯(cuò)分為水體所導(dǎo)致的。應(yīng)用支持向量機(jī)的兩種核函數(shù)(RBF、Sig)的分類結(jié)果均處于中等水平,其中應(yīng)用核函數(shù)RBF要比應(yīng)用Sig函數(shù)的分類精度高。采用支持向量機(jī)分類存在的主要問題是裸地的錯(cuò)分現(xiàn)象嚴(yán)重,使得最終分類總體精度降低,同時(shí)也存在林地錯(cuò)分致使其面積過大的現(xiàn)象,但其對(duì)水體的分類相較于其他兩種方法而言精度較高,用戶精度均在80%以上,制圖精度均在95%以上,但存在建筑物陰影錯(cuò)分為水體的現(xiàn)象。
對(duì)比GF?1數(shù)據(jù)和Landsat 8數(shù)據(jù)分類結(jié)果的精度可得知,Landsat 8數(shù)據(jù)分類結(jié)果的精度要整體高于GF?1數(shù)據(jù)的分類結(jié)果,這可能是Landsat 8數(shù)據(jù)波段信息更為豐富的原因。最小距離法分類結(jié)果中應(yīng)用Landsat 8數(shù)據(jù)進(jìn)行分類時(shí)水體分類精度有明顯提高,且建筑物陰影錯(cuò)分為水體的現(xiàn)象有顯著的改善,但是裸地和林地的制圖精度有所降低。最大似然分類結(jié)果中Landsat 8數(shù)據(jù)分類結(jié)果的精度均大于GF?1數(shù)據(jù)的分類結(jié)果。支持向量機(jī)的分類結(jié)果中應(yīng)用RBF為核函數(shù)的支持向量機(jī)分類時(shí),Landsat 8數(shù)據(jù)分類結(jié)果中建筑物的用戶精度和裸地的制圖精度有微小的降低,其余精度均有所提高;而應(yīng)用Sigmoid為核函數(shù)的支持向量機(jī)分類時(shí),Landsat 8數(shù)據(jù)分類結(jié)果的精度均大于GF?1數(shù)據(jù)的分類結(jié)果。
4 "結(jié) "論
本文以北京市中心城區(qū)中某一區(qū)域?yàn)檠芯繀^(qū),應(yīng)用“高分一號(hào)”(GF?1)數(shù)據(jù)和Landsat 8數(shù)據(jù),采用最小距離法、最大似然法、以RBF為核函數(shù)的支持向量機(jī)法和以Sigmoid為核函數(shù)的支持向量機(jī)法等方法將研究區(qū)分為林地、草地、水體、裸地、建筑物5類,并對(duì)分類結(jié)果進(jìn)行了空間分布、面積、精度三個(gè)方面的對(duì)比分析,得出如下結(jié)論:
1) 最小距離法的分類精度最低,存在較為嚴(yán)重的將建筑物陰影錯(cuò)分為水體和建筑物錯(cuò)分為裸地的現(xiàn)象,林地和草地的分類精度相對(duì)其他類別而言精度較高。因此,若研究區(qū)內(nèi)植被覆蓋面積較大時(shí),可以采用最小距離法進(jìn)行分類。
2) 應(yīng)用最大似然法進(jìn)行分類所得到的分類結(jié)果精度最高,這與研究區(qū)內(nèi)建筑物面積較大有關(guān)。建筑物的像元較為雜亂,像素值整體呈正態(tài)分布,采用最大似然法進(jìn)行分類的結(jié)果較好;而水體像素值比較集中,不適合應(yīng)用最大似然法進(jìn)行分類。
3) 支持向量機(jī)分類的結(jié)果中各類別的分類精度較為均勻,不存在某一類別精度過高或過低的現(xiàn)象,說明該方法更具有普適性。采用不同核函數(shù)進(jìn)行分類時(shí)結(jié)果精度的變化不大,而以RBF為核函數(shù)的分類精度相對(duì)較高。
4) 不同分辨率影像分類結(jié)果精度不同,運(yùn)用Landsat 8影像進(jìn)行分類的分類結(jié)果精度大于運(yùn)用GF?1影像的分類結(jié)果。由此說明,并非空間分辨率越高則分類精度越高,需要根據(jù)具體的研究內(nèi)容選擇合適的影像數(shù)據(jù)。各分類算法對(duì)不同影像的分類結(jié)果精度排名一致,這說明影像數(shù)據(jù)對(duì)分類算法的選擇影響較小,主要影響分類算法選擇的是研究區(qū)的地物特征。
注:本文通訊作者為馮勇。
參考文獻(xiàn)
[1] 鄭瀟柔.面向遙感影像分類的半監(jiān)督學(xué)習(xí)及其時(shí)效評(píng)估研究[D].深圳:中國科學(xué)院大學(xué),2022.
[2] 胡杰,張瑩,謝仕義.國產(chǎn)遙感影像分類技術(shù)應(yīng)用研究進(jìn)展綜述[J].計(jì)算機(jī)工程與應(yīng)用,2021,57(3):1?13.
[3] 高劍,孫輝,潘之騰,等.基于分類回歸樹方法的遙感信息快速提取研究[J].現(xiàn)代電子技術(shù),2023,46(11):33?37.
[4] 陳磊,周詢,陳明葉.一種多級(jí)再分類技術(shù)耕地提取方法[J].遙感信息,2017,32(4):120?125.
[5] 隋瑜,徐泮林,谷彥斐.基于遙感數(shù)據(jù)的土地資源分類方法比較研究[J].測繪與空間地理信息,2021,44(2):107?110.
[6] 李小玉,蒲智,李全勝.基于最大似然分類算法的土地利用變化特征分析[J].計(jì)算機(jī)與數(shù)字工程,2022,50(6):1153?1157.
[7] 孫文瑞,姜慧芳,左曉慶,等.Landsat8影像分類多分類器對(duì)比分析[J].地理空間信息,2022,20(1):101?104.
[8] 張峰,趙忠國,李剛,等.基于不同分類器的農(nóng)用地分類提取[J].新疆農(nóng)業(yè)科學(xué),2019,56(8):1560?1568.
[9] 李楠,王雪林.基于ENVI的遙感圖像分類方法研究[J].科技創(chuàng)新與生產(chǎn)力,2020(5):63?65.
[10] 童威.基于ENVI的遙感影像監(jiān)督分類方法的研究[J].科技創(chuàng)新與應(yīng)用,2019(23):6?9.
[11] 周珂,楊永清,張儼娜,等.光學(xué)遙感影像土地利用分類方法綜述[J].科學(xué)技術(shù)與工程,2021,21(32):13603?13613.
[12] 賈玉潔,劉云根,楊思林,等.面向Sentinel?2A影像的大理市土地利用分類方法適用性研究[J].浙江農(nóng)林大學(xué)學(xué)報(bào),2022,39(6):1350?1358.
[13] CHENG X, SUN Y, ZHANG W, et al. Application of deep learning in multitemporal remote sensing image classification [J]. Remote sensing, 2023, 15(15): 104.
[14] 楊星,宋玲玲,王時(shí)繪.基于改進(jìn)的ResNeXt網(wǎng)絡(luò)結(jié)構(gòu)的遙感圖像分類[J].計(jì)算機(jī)科學(xué),2023,50(z1):282?287.
[15] 萬意,李長春,趙旭輝,等.基于SVM的光學(xué)遙感影像分類與評(píng)價(jià)[J].測繪地理信息,2018,43(6):74?77.