肖博林
摘? 要:高光譜遙感是將成像技術(shù)和光譜技術(shù)相結(jié)合的多維信息獲取技術(shù)。自發(fā)展以來,已在各個(gè)方面都顯示出了巨大的研究潛力,成為遙感應(yīng)用最廣泛的領(lǐng)域之一。然而,如何充分利用高光譜遙感數(shù)據(jù)提供的豐富的地表信息,以及如何在如此大量的信息中提取有用信息,是擺在研究者面前的一項(xiàng)重要課題。高光譜遙感影像處理的一項(xiàng)重要內(nèi)容就是地物目標(biāo)的分類。文章基于支持向量機(jī)算法原理,提出了一種應(yīng)用于高光譜影像的分類機(jī)制,并在印度松樹(Indian Pines)和帕維亞大學(xué)(Pavia University)數(shù)據(jù)集上進(jìn)行了驗(yàn)證實(shí)驗(yàn),取得了較高的分類精度。
關(guān)鍵詞:高光譜遙感;支持向量機(jī);分類算法
中圖分類號(hào):TP751? ? ? ? ?文獻(xiàn)標(biāo)志碼:A? ? ? ? ?文章編號(hào):2095-2945(2020)04-0022-03
Abstract: Hyperspectral remote sensing is a multi-dimensional information acquisition technology that combines imaging technology and spectral technology. Since its development, it has shown tremendous research potential in all aspects, and has become one of the most widely applied fields of remote sensing. However, how to make full use of the rich surface information provided by hyperspectral remote sensing data and how to extract useful information from such a large amount of information is an important issue facing researchers. An important content of hyperspectral remote sensing image processing is the classification of ground objects. Based on the principle of support vector machine algorithm, this paper proposes a classification mechanism applied to hyperspectral imagery, and has performed verification experiments on the Indian Pines and Pavia University Dataset, which has achieved higher Classification accuracy.
Keywords: hyperspectral remote sensing; support vector machine; classification algorithm
1 概述
高光譜遙感又稱成像光譜遙感,是將成像技術(shù)和光譜技術(shù)相結(jié)合的多維信息獲取技術(shù)[1]。高光譜遙感數(shù)據(jù)因其有著豐富的光譜信息和地物空間分布信息,極大地提高了識(shí)別和區(qū)分各類地物的能力。目前高光譜遙感已在社會(huì)生活各個(gè)方面都凸顯出了巨大的研究潛力,在精細(xì)農(nóng)業(yè)、地質(zhì)調(diào)查、生態(tài)建設(shè)、海洋遙感、軍事偵察等方面具有重要的研究?jī)r(jià)值和意義。
鑒于高光譜遙感數(shù)據(jù)豐富的光譜信息和地物空間分布信息,極大地提高了區(qū)分和識(shí)別各類地物的能力。因此對(duì)高光譜遙感影像進(jìn)行分類是人們獲取信息價(jià)值的重要途徑之一,通過分類可以清晰地認(rèn)識(shí)地物的空間分布,從中發(fā)現(xiàn)規(guī)律,并將圖像中所有像元?jiǎng)澐譃椴煌耐恋馗采w類型,由此進(jìn)行專題信息的提取或是專題地圖的制作,從而反映出某類地物的空間分布以及各類地物的詳細(xì)情況。
2 本文分類算法
支持向量機(jī)[2](Support Vector Machine,SVM)是Vapnik團(tuán)隊(duì)開發(fā)出來的一種基于統(tǒng)計(jì)學(xué)習(xí)理論的機(jī)器學(xué)習(xí)算法,是統(tǒng)計(jì)學(xué)習(xí)理論中最新穎、最具實(shí)用性的方法之一。SVM的特點(diǎn)是可以同時(shí)最小化經(jīng)驗(yàn)誤差和最大化分類間隔,即通過尋找一個(gè)既能保證分類精度,又能使兩類數(shù)據(jù)之間間隔最大化的超平面來實(shí)現(xiàn)監(jiān)督學(xué)習(xí)。該方法具有較強(qiáng)的非線性和高維數(shù)據(jù)處理能力,也較好地解決了維數(shù)災(zāi)難問題,是當(dāng)前國際機(jī)器學(xué)習(xí)界的研究熱點(diǎn)之一[3]。
在SVM中,模型在較高維空間中構(gòu)造一個(gè)超平面或一組超平面。SVM的超平面線性模型可以定義為:
其中?準(zhǔn)(x)是變換后的特征空間。間隔定義為從決策超平面到數(shù)據(jù)集中最近點(diǎn)的最小距離。在SVM問題中,我們?cè)噲D構(gòu)造決策邊界超平面,以使數(shù)據(jù)集的邊際最大化。對(duì)于每個(gè)數(shù)據(jù)點(diǎn),ti是目標(biāo)標(biāo)簽,其中t∈{-1,1}。在我們的方案中,問題是非線性可分,所以我們將使用軟邊距SVM,并引入松弛變量ξi≥0。ξ允許對(duì)輪廓進(jìn)行錯(cuò)誤分類。當(dāng)ξi>1時(shí),數(shù)據(jù)點(diǎn)被錯(cuò)誤分類。同時(shí),我們應(yīng)具有以下不等式約束:
這是因?yàn)閷?duì)于tn=1的點(diǎn),我們需要使y(xn)>0,對(duì)于tn=-1的點(diǎn),必須使y(xn)<0。從數(shù)據(jù)點(diǎn)xn到?jīng)Q策邊界的距離為硬邊距由下式給出:
為了找到最大的邊距解決方案,我們簡(jiǎn)化了軟邊距的松弛變量,SVM問題最終變?yōu)椋?/p>
變量C是正則化參數(shù),用于控制邊距和分類錯(cuò)誤的容忍度之間的權(quán)衡。由于SVM問題是凸優(yōu)化問題,因此我們總是可以從模型中獲得全局最優(yōu)值。有了最佳決策邊界,我們可以使用它來將數(shù)據(jù)集分類為不同的標(biāo)簽。
3 實(shí)驗(yàn)分析
3.1 實(shí)驗(yàn)數(shù)據(jù)
印度松樹(Indian Pines,IN)數(shù)據(jù)集是AVIRIS(機(jī)載可見光/紅外成像光譜儀)傳感器于1992年在印第安納州西北部的測(cè)試場(chǎng)地上收集的場(chǎng)景,具有145×145個(gè)像素和224個(gè)光譜反射帶,通過去除覆蓋吸水區(qū)域的20多個(gè)頻帶,將頻帶數(shù)量減少到200個(gè)。其中可用的土地覆蓋被指定為16個(gè)類別。如圖1所示。
帕維亞大學(xué)(Pavia University,UP)數(shù)據(jù)集是ROSIS傳感器于1991年在意大利北部帕維亞上空飛行時(shí)拍攝的場(chǎng)景,具有610×340像素,空間分辨率為1.3m。丟棄有噪聲的頻帶之后,使用剩余的103個(gè)頻帶用于評(píng)估,共包含9種城市土地覆蓋類型。如圖2所示。
3.2 精度評(píng)價(jià)方法
對(duì)高光譜遙感圖像分類進(jìn)行評(píng)價(jià)指的是依據(jù)地面實(shí)況圖來評(píng)估所分得的結(jié)果的準(zhǔn)確性。常用評(píng)價(jià)方法主要有總體分類精度、平均分類精度以及Kappa系數(shù)等。下面對(duì)這些評(píng)價(jià)指標(biāo)進(jìn)行具體的介紹。
(1)總體分類精度(Overall Accuracy,OA)
總體分類精度(OA)等于被正確分類的像元總和除以總像元數(shù)。被正確分類的像元數(shù)目沿著混淆矩陣的對(duì)角線分布,總像元數(shù)等于所有真實(shí)參考源的像元總數(shù)。公式如下,N代表樣本總數(shù),n為類別數(shù)目。
(2)平均分類精度(Average Accuracy,AA)
平均分類精度(AA)指的是每一類分類精度的平均值,即采用各個(gè)類別分類精度(CA)除以類別總量N,其公式如下:
(3)Kappa系數(shù)
Kappa系數(shù)是通過把所有真實(shí)參考的像元總數(shù)(N)乘以混淆矩陣對(duì)角線(hkk)的和,再減去各類中真實(shí)參考像元數(shù)與該類中被分類像元總數(shù)之積之后,再除以像元總數(shù)的平方減去各類中真實(shí)參考像元總數(shù)與該類中被分類像元總數(shù)之積對(duì)所有類別求和的結(jié)果。Kappa系數(shù)綜合考慮了混淆矩陣中的各個(gè)因子,能比較全面的反映總體分類的精度,Kappa系數(shù)的值越大,代表相應(yīng)的分類算法的精度越高。一般公式如下:
3.3 實(shí)驗(yàn)結(jié)果
圖3和圖4可視化了基于支持向量機(jī)的高光譜影像分類結(jié)果,表3給出了精度評(píng)價(jià)的三個(gè)指標(biāo)??梢钥闯?,兩類數(shù)據(jù)集的分類結(jié)果還算令人滿意,但是也存在些許噪聲點(diǎn)。例如IN數(shù)據(jù)集中玉米地和大豆地之間,以及農(nóng)作物和樹木之間錯(cuò)分較為明顯,這可能是因?yàn)槠涔庾V特征距離較小而導(dǎo)致的(異物同譜);UP數(shù)據(jù)集只是在裸地中出現(xiàn)了些許金屬板數(shù)據(jù)點(diǎn),可能因?yàn)閿?shù)據(jù)本身質(zhì)量較好,所以錯(cuò)分的現(xiàn)象不是很明顯。
4 結(jié)束語
本文基于支持向量機(jī)算法原理,提出了一種高光譜影像的分類機(jī)制,并在印度松樹數(shù)據(jù)集和帕維亞大學(xué)數(shù)據(jù)集上進(jìn)行了驗(yàn)證實(shí)驗(yàn),取得了良好的分類精度。鑒于分類過程中出現(xiàn)的錯(cuò)分現(xiàn)象,接下來的研究重點(diǎn)將對(duì)此進(jìn)行進(jìn)一步的探討。針對(duì)數(shù)據(jù)本身存在的“同物異譜”或是“異物同譜”問題,提出更完善的分類機(jī)制,以及對(duì)分類后的結(jié)果做進(jìn)一步的降噪和平滑處理。
參考文獻(xiàn):
[1]Goetz A F H , Vane G , Solomon J E , et al. Imaging Spectrometry for Earth Remote Sensing[J]. Science, 1985,228(4704):1147-1153.
[2]Vapnik V N. 1998. Statistical Learning Theory. New York: John Wiley&Sons.
[3]杜培軍,林卉,孫敦新.基于支持向量機(jī)的高光譜遙感分類進(jìn)展[J].測(cè)繪通報(bào),2006(12):40-43+53.
[4]張良培.光譜分析在高光譜遙感中的應(yīng)用[D].武漢:武漢測(cè)繪科技大學(xué),1998.
[5]牟多鐸,劉磊.ELM與SVM在高光譜遙感圖像監(jiān)督分類中的比較研究[J].遙感技術(shù)與應(yīng)用,2019,34(01):115-124.
[6]李靜,吳孔江.基于PCA和極限學(xué)習(xí)機(jī)的高光譜遙感分類研究[J].北京測(cè)繪,2018,32(07):794-799.