許偉 奚硯濤
摘要:基于Landsat8衛(wèi)星2013年9月獲取的合肥市OLI多光譜數(shù)據(jù),在經(jīng)過校正以及波段的融合等處理后得到的數(shù)據(jù)作為研究數(shù)據(jù),采用不同分類方法進行分類識別,并且對比不同分類器在遙感影像分類中的效果和分類精度。根據(jù)國家土地利用現(xiàn)狀分類的標準和合肥市土地利用的現(xiàn)狀,將合肥市的土地主要分為建設(shè)用地、交通用地、水體、綠化用地、農(nóng)業(yè)用地、林地等6類,并采用5種常見監(jiān)督分類方法和BP神經(jīng)網(wǎng)絡(luò)分類法對于本研究數(shù)據(jù)進行分類,結(jié)合實際用地情況對分類結(jié)果進行了總結(jié)分析,完成總體分類精度和Kappa系數(shù)等指標對各分類器精度的評價,對比了各分類器對各要素的分類精度。
關(guān)鍵詞:遙感;Landsat8;土地利用分類; 監(jiān)督分類;BP神經(jīng)網(wǎng)絡(luò)
中圖分類號:F301.24;S127 文獻標識碼:A 文章編號:0439-8114(2015)15-3625-05
Abstracts: Based on OLI multi-spectral data acquired from Landsat8 of Hefei City in September 2013, after correction and band fusion, the processed data as the research data. The effects and classification accuracy among different classifiers were compared by using different classification recognition in remote sensing images. According to the national standards of land using classification and the land use present situation about Hefei, the land in Hefei is divided into construction land, transportation land, water, green land, agricultural land and forest land, then use 5 kinds of common supervised classification methods and BP neural network method for this paper's research data, analyzed the classification results combined with the actual status in land use. The evaluation about each classifier accuracy was completed by some indicators such as overall accuracy and Kappa coefficient, and the classification accuracy of each elements with each classifier was compared.
Key words: remote sensing; Landsat8; land use classification; supervised classification; BP neural network
遙感技術(shù)發(fā)展至今,已經(jīng)展現(xiàn)出其宏觀、動態(tài)、實時的特點,無論是植被覆蓋研究還是土地利用變化,以及商業(yè)化領(lǐng)域的農(nóng)作物監(jiān)測等方面都發(fā)揮著重要作用。其中,遙感影像數(shù)據(jù)分類是對于遙感數(shù)據(jù)分析和信息提取的重要內(nèi)容,主要是將圖像中的每個像元根據(jù)在不同波段下的亮度和空間結(jié)構(gòu)特征,按照某種規(guī)則或算法劃分為不同類別[1]。運用遙感影像對于城市土地利用變化的宏觀動態(tài)監(jiān)測技術(shù)已經(jīng)得到廣泛應(yīng)用。根據(jù)城市影像數(shù)據(jù)的信息提取,可以將城市的土地劃分出其區(qū)域特點的利用類型。
Landsat8衛(wèi)星是美國對地觀測的最新數(shù)據(jù)支持系統(tǒng)[2],于2013年發(fā)射成功,代替Landsat7衛(wèi)星繼續(xù)為全球的生態(tài)環(huán)境提供連續(xù)的觀測數(shù)據(jù),繼承了先前系列的傳統(tǒng),提供多波段,中高分辨率影像。Landsat 8衛(wèi)星提供多光譜8個波段,空間分辨率30 m,一個全色波段,空間分辨率達到15 m,此外還有熱紅外數(shù)據(jù)。文研究運用平行六面體法、最小距離法、馬氏距離法、最大似然法、波譜角法、BP神經(jīng)網(wǎng)絡(luò)法等6種分類方法,對合肥市2013年9月的Landsat8遙感影像數(shù)據(jù)進行土地利用的分類,以期對合肥市土地利用現(xiàn)狀有一定的了解。
1 研究區(qū)概況及數(shù)據(jù)來源
1.1 研究區(qū)概況
合肥市是安徽省的省會,地處安徽中部,江淮流域之間,地理坐標位于北緯31°31′-32°37′、東經(jīng)116°40′-117°52′。全年四季分明,冬冷夏熱,春秋溫和,屬于暖溫帶向亞熱帶的過渡帶氣候類型,為亞熱帶濕潤性季風(fēng)氣候。年平均氣溫15.7 ℃,年降雨量近1 000 mm,年日照時間2 100多個小時。合肥地處江淮丘陵,北起舜耕山,南至巢湖盆地周圍,大部分地域崗沖起伏,壟畈相間,總的地勢是中部高,南北低。合肥市建市歷史悠久,早在秦漢年間就開始在此設(shè)置縣城,在歷史車輪的滾動下,合肥市的城市形態(tài)逐漸發(fā)展為塊狀結(jié)構(gòu)。隨著城市發(fā)展進程的進一步加快,以市中心向外輻射為典型的環(huán)形結(jié)構(gòu),原有的土地滿足不了城市大規(guī)模的發(fā)展要求,近些年來,城市郊區(qū)地帶發(fā)展比較迅速,土地利用類型也變得多式多樣。
1.2 數(shù)據(jù)來源及預(yù)處理
美國Landsat8衛(wèi)星是美國對地觀測的最新數(shù)據(jù)支持系統(tǒng),于2013年2月11日發(fā)射成功,在3月底正式為全球的生態(tài)環(huán)境提供連續(xù)的觀測數(shù)據(jù),并且可以提供免費下載。Landsat8采用兩個傳感器[2],Operational Land Imager(OLI,陸地成像儀)和Thermal Infrared Sensor(TIRS,熱紅外傳感器)。其中OLI陸地成像儀,共包括9個波段,除了包括ETM+傳感器的所有波段外,為了避免大氣吸收特征,OLI對波段進行了重新調(diào)整,比較大的調(diào)整是OLI Band5(0.85~0.88 μm),排除了0.825 μm處的水汽吸收特征,OLI全色波段Band8波段范圍較窄,使得在全色圖像上更好區(qū)分植被和無植被特征;此外還添加了兩個新的波段:深藍波Band1(0.43~0.45 μm),主要應(yīng)用海岸帶觀測;卷云波段Band9(1.36~1.39 μm),對水汽強吸收特征可用于云檢測。Landsat8與Landsat7有關(guān)參數(shù)對照見表1。
本研究區(qū)的數(shù)據(jù)來源于地理空間數(shù)據(jù)云,經(jīng)過篩選,選取數(shù)據(jù)標識為LC81210382013246LGN00的數(shù)據(jù),條帶號為121,行編號為38,云量為4.38,研究區(qū)內(nèi)云量為0,圖像質(zhì)量很好。研究區(qū)的遙感影像已經(jīng)經(jīng)過幾何校正,誤差精度小于1個像素,影像投影為UTM,參考橢球體為WGS-84橢球,影像獲取時間2013年9月3日。
為了提高分類結(jié)果的準確性,本研究采用波譜融合的方法,將OLI傳感器的全色波段的高分辨率影像(15 m)與OLI的前7個波段的影像(30 m)進行融合,將得到融合后的7個波段圖像的分辨率提高到15 m,并且保存了波段信息的完整,融合結(jié)果很理想。以真彩色合成波段(band4,3,2)打開原圖像和融合后圖像,得到融合前后對比圖,圖像變得更加清晰,有助于分類時樣本信息的提取。融合結(jié)果如圖1。
2 研究方法
基于光譜的影像分類可分為監(jiān)督分類與非監(jiān)督分類[3]。監(jiān)督分類又稱為訓(xùn)練分類法,簡單的來說就是用被確認類別的樣本像元去識別其他未知類別像元的過程。在分類之前通過目視判讀和野外調(diào)查,對遙感圖像上某些樣本區(qū)的地物類別有了先驗認識,接下來對每種類別選取一定數(shù)量的訓(xùn)練樣本,計算每種訓(xùn)練樣本區(qū)的統(tǒng)計信息,同時用這些子類別對判別函數(shù)進行訓(xùn)練,當滿足對子類別分類的要求后,用訓(xùn)練好的判別函數(shù)對其他待分數(shù)據(jù)進行分類。將每個像元與訓(xùn)練樣本進行比較,最終劃分到和其最相似的樣本類,從而完成對整幅圖像的分類。遙感影像的監(jiān)督分類一般包括5個步驟[4]:
1)類別判定:確定待分類類別;
2)樣本選擇:選取一定量的樣本數(shù),一般根據(jù)待分類別種類進行樣本的選?。?/p>
3)分類器選擇:常用的分類器包括平行六面體、最大似然、最小距離、馬氏距離、神經(jīng)網(wǎng)絡(luò)以及波譜角等;
4)影像分類:通過一些處理遙感圖像的軟件,如ENVI、ERDAS等進行監(jiān)督分類,得到分類結(jié)果;
5)結(jié)果精度檢驗和分析:對于分類后的結(jié)果進行相應(yīng)的檢驗和分析。
對于遙感影像分類,必須依據(jù)城市自然和人文的綜合屬性,在《國家土地利用現(xiàn)狀分類表》的基礎(chǔ)上進行分類[5]。一般有兩種方式,一種是利用現(xiàn)有的城市土地利用圖作為背景數(shù)據(jù),以此為依據(jù),進行土地利用的分類。另一種是依據(jù)人工判讀,和結(jié)合地圖材料或?qū)嵉仳炞C等方法,建立感興趣區(qū)。本研究采用后面一種,通過目視的方法建立樣本區(qū),并且劃分為6種土地利用類型:建設(shè)用地、交通用地、水體、綠化用地、農(nóng)業(yè)用地、林地。
本研究區(qū)是通過裁剪得到合肥市主城區(qū)范圍的影像數(shù)據(jù),沒有包括其轄屬的幾個縣市(巢湖市、長豐縣、肥西縣、肥東縣、廬江縣)。將研究區(qū)內(nèi)的土地劃分為6種類型:建設(shè)用地、交通用地、水體、綠化用地、農(nóng)業(yè)用地、林地等;每類樣本各選取250個,總計1 500個樣本數(shù)。選取的訓(xùn)練樣本進行必要的可分離性判定,常見使用Jeffries-Matusita和Transformed Divergence兩種參數(shù),值都是在0~2之間,并且越接近2越好,小于1,則應(yīng)該考慮將兩類樣本進行合并[6]。本研究中選用Jeffries-Matusita系數(shù)進行可分離性的判定。影像數(shù)據(jù)是在9月初獲得的,此時植被茂盛,種類繁多,各類地物要素之間的區(qū)分度不夠明顯,如綠化用地與農(nóng)業(yè)用地,以及林地之間的可分離度相對較低。Jeffries-Matusita系數(shù)如表2所示。
通過對得到的Jeffries-Matusita系數(shù)進行分析,選取的訓(xùn)練樣本適用下一步分類的進行,樣本采集合理有效。
3 結(jié)果與分析
根據(jù)選取的樣本,運用了平行六面體、最小距離、馬氏距離、最大似然、波譜角、BP神經(jīng)網(wǎng)絡(luò)共6種分類器對研究區(qū)的影像進行了土地利用類型的分類。其中平行六面體、最小距離和波譜角分類器分類結(jié)果中包含未分類像元,沒有被簡單地歸為某一種類型中,其他幾種分類器的分類結(jié)果中沒有出現(xiàn)未分類像元。
3.1 傳統(tǒng)監(jiān)督分類結(jié)果
平行六面體分類法原理:相當于在多維數(shù)據(jù)特征空間中劃分出若干個互不重疊的平行六面體塊,根據(jù)樣本的亮度值形成一個n維的平行六面體數(shù)據(jù)空間,其他像元的光譜值如果落在平行六面體任何一個訓(xùn)練樣本的區(qū)域內(nèi),就被劃分到對應(yīng)類別中。最小距離分類法原理:是以特征空間中的距離作為像素分類的依據(jù)。根據(jù)訓(xùn)練樣本得到每一類別的均值和協(xié)方差矩陣,然后以各類的均值作為該類在多維空間的中心,計算待分類圖像的每個像元到各類中心的距離,最近的像元就歸類為此類。馬氏距離法原理:馬氏距離是一種加權(quán)的歐氏距離,計算待分類圖像到各樣本的馬氏距離,統(tǒng)計馬氏距離最小的即為此類別。最大似然法原理:最大似然法是基于Bayes分類準則的應(yīng)用最廣泛的監(jiān)督分類方法,前提是認為每一類的概率分布都是正態(tài)的,然后依據(jù)光譜性質(zhì)的相似和屬于某類的概率最大的假設(shè)來指定每個像元的類別。波譜角法原理:是對地物光譜波形相似度的一種度量,它將每條光譜都視為波段空間的一個矢量,通過計算一個測試光譜與一個參考光譜之間的“角度”來確定它們之間的相似性。分類結(jié)果如圖2所示。
除了以上幾種常見的傳統(tǒng)監(jiān)督分類的方法外,近些年來,隨著遙感技術(shù)、計算機技術(shù)、智能科學(xué)以及非線性理論的發(fā)展,在遙感影像的分類中也涌現(xiàn)出許多新的分類技術(shù)[3]。如決策樹分類、模糊分類、人工神經(jīng)網(wǎng)絡(luò)(ANN)、支持向量機(SVM)等分類方法。其中人工神經(jīng)網(wǎng)絡(luò)分類取得了很多成就,并得到了大量的使用。
3.2 BP神經(jīng)網(wǎng)絡(luò)分類結(jié)果
使用人工神經(jīng)網(wǎng)絡(luò)對遙感圖像進行分類具有很大的優(yōu)勢[7]。神經(jīng)網(wǎng)絡(luò)方法與傳統(tǒng)數(shù)值計算方法相比最大的優(yōu)點就是其非線性映射能力,此外,其計算過程大量并行,使得能夠高速處理大量數(shù)據(jù)和求解非常復(fù)雜的問題;具有自學(xué)習(xí)、自適應(yīng)和自組織能力,能利用已知類別遙感圖像樣本的先驗知識,自動并行計算提取出類別要素等。BP(Back Propagation,反向傳播)網(wǎng)絡(luò)是采用誤差反向傳播的前饋式網(wǎng)絡(luò),網(wǎng)絡(luò)結(jié)構(gòu)包括輸入層、隱含層和輸出層[8]。同一層神經(jīng)元之間互不相連,不同層神經(jīng)元之間則相互連接。隱含層神經(jīng)元太多或太少都不能使神經(jīng)網(wǎng)絡(luò)達到最佳效果,太多會加重網(wǎng)絡(luò)的負擔,延長訓(xùn)練時間,太少會影響信息的容量,網(wǎng)絡(luò)難以學(xué)到知識[9,10]。往往通過試驗來確定隱含層神經(jīng)元個數(shù)。在結(jié)構(gòu)上最簡單最常用的是三層BP神經(jīng)網(wǎng)絡(luò)(圖3)。
圖3中,輸入層m個節(jié)點對應(yīng)網(wǎng)絡(luò)m個輸入,本試驗中,將研究區(qū)待分類的融合后影像,包括7個波段的數(shù)據(jù)作為輸入特征;輸出層n個節(jié)點,對應(yīng)于待分類的6種土地利用類型;隱含層設(shè)為一層。即構(gòu)成最常用的三層BP神經(jīng)網(wǎng)絡(luò)。通過設(shè)計好的神經(jīng)網(wǎng)絡(luò),使用ENVI軟件監(jiān)督分類模塊的神經(jīng)網(wǎng)絡(luò)方法,在輸入所需參數(shù)后,經(jīng)過1 000次的迭代運算,得到基于BP神經(jīng)網(wǎng)絡(luò)算法的合肥市土地利用分類圖如圖4所示。
3.3 分類精度評價
遙感圖像的分類精度評價是對分類結(jié)果與實際地表準確的土地使用現(xiàn)狀進行比較,通過正確分類的比例來表示精度,最常用的評價系數(shù)就是總體精度系數(shù)和Kappa系數(shù)[11-13]。本研究通過現(xiàn)有的土地利用現(xiàn)狀圖與實地測驗,選取合適的檢驗樣本,對各分類結(jié)果進行了精度評價。
1)混淆矩陣?;煜仃囀沁M行精度評價的第一步?;煜仃囀且粋€n×n矩陣,其中n為分類數(shù),如本研究的n是6。此外,本研究有的分類結(jié)果中含有未分類的圖像,所以在計算精度時,為了保證數(shù)據(jù)的準確性,這時n則是7?;煜仃嚨谋磉_式如表3所示。
表3中,Pij是第i類分類數(shù)據(jù)與第j類實測數(shù)據(jù)所占的組成成分;Pi是第i類分類數(shù)據(jù)的總和;P′i是第i類實測數(shù)據(jù)的總和;P為樣本總數(shù)。當i=j時,表示的是分類正確的數(shù)據(jù)。實測總和表示各類別真實像元的總數(shù)量,分類總和表示分類器所得各類別的總數(shù)量。
2)整體分類精度(Overall accuracy)。整體分類精度是指分類結(jié)果與對應(yīng)地區(qū)實際類型相一致的比例,由正確分類的像元總和除以總像元數(shù)決定的。此外,Kappa系數(shù)也是常與整體分類精度一起比較,并且結(jié)果相近。整體分類精度的公式如下:
Poa=■Pkk/P (1)
3)制圖精度(Mapping accuracy):是指分類器將整個影像的像元正確分為第m類的像元數(shù)(對角線值)與第m類實測參考總和(混淆矩陣中第m類(列)的總和)的比例。
Pma=Pkk/Pk k∈(1,n)(2)
精度分析的結(jié)果如圖4和圖5所示。
由圖4可知,根據(jù)各分類器的分類結(jié)果比較,結(jié)果差異很明顯,整體分類精度最高的是基于BP神經(jīng)網(wǎng)絡(luò)的分類,說明所選用的網(wǎng)絡(luò)結(jié)構(gòu)和樣本作用明顯,取得比較理想的結(jié)果,整體分類精度達到了89.30%。此外,使用最大似然法和馬氏距離法也得到了較高的精度,整體分類精度分別達到了87.18%和81.72%,說明這兩種分類器在傳統(tǒng)分類方法中是較為合適的選擇,平行六面體法的分類精度最差,整體分類精度只有40.30%。
另外,從圖4還可以看出,各分類器得到的整體分類精度和Kappa系數(shù)是呈正比關(guān)系的,整體分類精度高,則Kappa系數(shù)也高,本研究中基于BP神經(jīng)網(wǎng)絡(luò)的分類Kappa系數(shù)達到了0.836 3,最大似然法的Kappa系數(shù)為0.806,馬氏距離法的Kappa系數(shù)為0.726 5;而平行六面體法、最小距離法和波譜角法的Kappa系數(shù)分別為0.286 3、0.547、0.560 2。由此可以得到,整體分類精度越高,Kappa系數(shù)越高,并且兩個系數(shù)的差值較小;整體分類精度越低,Kappa系數(shù)越低,并且兩個系數(shù)的差值較大。如BP神經(jīng)網(wǎng)絡(luò)分類法的整體分類精度和Kappa系數(shù)的絕對差值為0.056 7,最大似然法、馬氏距離法、波譜角法、最小距離法和平行六面體法的整體分類精度和Kappa系數(shù)的絕對差值分別為0.075 8、0.080 7、0.132 7、0.130 6、0.116 7。
圖5中,通過計算各土地利用分類的制圖精度,可以從中了解每種類型分類的準確性以及不同分類器對于各類別分類的效果有所不同。其中,對于水體的分類效果很好,除了平行四面體法,其他幾種分類器的分類精度都達到了80%以上,也反映出水體在遙感影像分類中是較易分類的一種類型;對于建設(shè)用地的分類,幾種分類器的效果很相近,BP神經(jīng)網(wǎng)絡(luò)法相對取得的效果更好;對于農(nóng)業(yè)用地的分類,各分類器的分類結(jié)果相差明顯,BP神經(jīng)網(wǎng)絡(luò)的分類精度最高,達到了86.29%,從而體現(xiàn)出它的優(yōu)勢;而對于綠化用地的分類,相比較其他幾種常規(guī)分類器,BP神經(jīng)網(wǎng)絡(luò)法取得的效果反而不夠理想,精度只有51.09%。
4 小結(jié)和討論
1)分類器選擇的不同,對于Landsat8遙感影像數(shù)據(jù)的分類結(jié)果差異較大。本研究中基于BP神經(jīng)網(wǎng)絡(luò)、最大似然法、馬氏距離法的分類精度較高,其整體分類精度分別達到了89.30%、87.18%、81.72%,說明BP神經(jīng)網(wǎng)絡(luò)法在Landsat8遙感影像分類中取得的效果很好。研究經(jīng)過對原影像進行波段的融合,分辨率得到提高,對于提高分類結(jié)果的精度是有所幫助的。
2)遙感影像分類對于樣本選取的質(zhì)量要求很高,如果選取的樣本可分離性不高,那么分類結(jié)果往往會受到很大影響。對于綠化用地的分類,整體分類精度最高的BP神經(jīng)網(wǎng)絡(luò)法,其對于綠化用地的分類反而效果很差,可見樣本選取的質(zhì)量影響到了最后的結(jié)果。
3)水體是較為容易識別的一種類型。本研究中,各分類器對于水體的分類精度都很高,基于BP神經(jīng)網(wǎng)絡(luò)法、最大似然法、馬氏距離法、波譜角法、最小距離法的分類精度都在80%以上,分別達到了99.10%、98.80%、95.76%、88.66%、82.80%。
雖然BP神經(jīng)網(wǎng)絡(luò)在遙感影像分類中已經(jīng)得到很多的應(yīng)用,并且效果也很好,但是由于其所需的時間較長,所以應(yīng)用還是不夠廣泛。并且從本研究可知,對于某些類型的分類,效果還不夠理想,在今后的研究中對于BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)或者參數(shù)進行改進,將是提高分類精度的有效措施。
參考文獻:
[1] 趙英時.遙感應(yīng)用分析原理與方法[M].北京:科學(xué)出版社,2003.
[2] 徐涵秋,唐 菲.新一代Landsat系列衛(wèi)星:Landsat 8遙感影像新增特征及其生態(tài)環(huán)境意義[J].生態(tài)學(xué)報,2013,33(11):3249-3257.
[3] 杜培軍.遙感原理與應(yīng)用[M].江蘇徐州:中國礦業(yè)大學(xué)出版社,2006.
[4] 楊 鑫.淺談遙感圖像監(jiān)督分類與非監(jiān)督分類[J].四川地質(zhì)學(xué)報,2008,28(3):251-254.
[5] 李雙成,鄭 度.人工神經(jīng)網(wǎng)絡(luò)模型在地學(xué)研究中的應(yīng)用進展[J].地球科學(xué)進展,2003,18(1):68-76.
[6] 汪少華,張茂震,趙平安,等.基于TM影像、森林資源清查數(shù)據(jù)和人工神經(jīng)網(wǎng)絡(luò)的森林碳空間分布模擬[J].生態(tài)學(xué)報,2011,31(4):998-1008.
[7] 韓 玲.基于人工神經(jīng)網(wǎng)絡(luò)--多層感知器(MLP)的遙感影像分類模型[J].測繪通報,2004(9):29-30,42.
[8] 駱劍承,周成虎,楊 艷.人工神經(jīng)網(wǎng)絡(luò)遙感影像分類模型及其與知識集成方法研究[J].遙感學(xué)報,2001,5(2):122-129.
[9] 李朝鋒,楊茂龍,許 磊,等.概率神經(jīng)網(wǎng)絡(luò)與BP網(wǎng)絡(luò)模型在遙感圖像分類中的對比研究[J].國土資源遙感,2004(4):11-13.
[10] 王野喬.遙感及多源地理數(shù)據(jù)分類中的人工神經(jīng)網(wǎng)絡(luò)模型[J].地理科學(xué),1997,17(2):10-17.
[11] 付 佳,黃海軍,楊曦光.基于ENVI的唐山灣三島土地利用遙感分類方法的比較分析[J].海洋科學(xué),2014,38(1):20-26.
[12] 張 雨,林 輝,臧 卓,等.基于MODIS數(shù)據(jù)的遼寧省土地利用分類研究[J].西南林業(yè)大學(xué)學(xué)報,2014,34(1):52-54.
[13] 孫艷玲,楊小喚,王新生,等.基于決策樹和MODIS數(shù)據(jù)的土地利用分類[J].資源科學(xué),2007,29(5):169-174.b