李佳遜
摘 要 隨著遙感科學(xué)的迅速發(fā)展,高光譜圖像受到人們越來越多的關(guān)注。尤其是分類問題已經(jīng)成為高光譜遙感最為重要的應(yīng)用方向,具有重要的研究價值。多種圖像處理技術(shù)已經(jīng)廣泛應(yīng)用于高光譜遙感圖像的分類中,并取得了一定的效果。本文通過介紹幾種主要的分類方法,加深對高光譜圖像分類方法的了解。
關(guān)鍵詞 高光譜遙感 遙感技術(shù) 圖像分類
中圖分類號:TP751. 1 文獻(xiàn)標(biāo)識碼:A
遙感是一項重要的現(xiàn)代觀測技術(shù),其最大的特點就是不直接接觸物體而對物體的各種性質(zhì)進(jìn)行感知。遙感技術(shù)通過地面目標(biāo)對不同波長電磁波的響應(yīng)來獲取關(guān)于目標(biāo)的信息,然后對接收到的信息進(jìn)行分析,進(jìn)而對所感知物體的各種性質(zhì)進(jìn)行判斷和識別。它憑借著覆蓋范圍廣、得到的地物信息豐富并且實時性高等一系列傳統(tǒng)手段不具有的優(yōu)點,已經(jīng)在資源勘探、環(huán)境監(jiān)測、精細(xì)農(nóng)業(yè)、災(zāi)害評估、目標(biāo)識別等眾多的技術(shù)領(lǐng)域得到了廣泛的應(yīng)用。遙感圖像分類主要有兩類分類方法:一種是非監(jiān)督分類方法,另一種是監(jiān)督分類方法。非監(jiān)督分類方法是一個聚類過程,而監(jiān)督分類則是一個學(xué)習(xí)和訓(xùn)練的過程,需要一定的先驗知識。
1 K-均值
K-均值分類方法也稱為k-means算法,是一種較典型的逐點修改迭代的動態(tài)運算的聚類算法,也是一種普遍采用算法。K-means聚類的準(zhǔn)則是使每一聚類中多模式點到該類別的中心距離的平方和最小。首先確定初始聚類點,然后把其余的待分點分到各類中,完成初始分類。初始分類完成后,重新計算各聚類中心,完成第一次迭代,依次循環(huán)迭代,直至前后兩次的聚類中心相同,循環(huán)結(jié)束。
k-means算法是一種無監(jiān)督的分類方法,該方法的不足是初始聚類中心和最佳聚類數(shù)對聚類結(jié)果影響很大。
2 支持向量積
支持向量積(SVM)主要思想是建立一個超平面作為決策曲面,使得正例和反例之間的隔離邊緣被最大化。同理,在多維空間假定訓(xùn)練數(shù)據(jù)可以被一個超平面分開,如果這個向量集合能被超平面沒有錯誤地分開,并且離超平面最近的向量與超平面之間的距離最大,則稱這個向量集合被這個最優(yōu)超平面最大分開。
SVM作為一種高維有監(jiān)督的分類方法,它憑借著不受Hughes現(xiàn)象影響的優(yōu)勢,取得了很好的分類效果。
3 K-最鄰近結(jié)點算法
K-最鄰近結(jié)點算法,是一個理論上比較成熟的方法,也是最簡單的機器學(xué)習(xí)算法之一。該方法的思路是:如果一個樣本在特征空間中的k個最相似(即特征空間中最鄰近)的樣本中的大多數(shù)屬于某一個類別,則該樣本也屬于這個類別。KNN算法中,所選擇的鄰居都是已經(jīng)正確分類的對象。該方法在定類決策上只依據(jù)最鄰近的一個或者幾個樣本的類別來決定待分樣本所屬的類別。
當(dāng)樣本不平衡時,如一個類的樣本容量很大,而其他類樣本容量很小時,有可能導(dǎo)致當(dāng)輸入一個新樣本時,該樣本的K個鄰居中大容量類的樣本占多數(shù)。因此可以采用權(quán)值的方法(和該樣本距離小的鄰居權(quán)值大)來改進(jìn)。該方法的另一個不足之處是計算量較大,因為對每一個待分類的樣本都要計算它到全體已知樣本的距離,才能求得它的K個最近鄰點。目前常用的解決方法是事先對已知樣本點進(jìn)行剪輯,事先去除對分類作用不大的樣本。該算法比較適用于樣本容量比較大的類域的自動分類,而那些樣本容量較小的類域采用這種算法比較容易產(chǎn)生誤分。
下面對K-近鄰算法描述:
輸入:訓(xùn)練數(shù)據(jù)集,其中是第個樣本的條件屬性,是類別,新樣本,距離函數(shù)。
輸出:的類別。
For i = 1 to N do
計算和之間的距離;
End for
對距離排序,得到;
選擇前個樣本:;
統(tǒng)計中每個類別出現(xiàn)的次數(shù),確定的類別。
4平行多面體分類方法
平行多面體分類法是根據(jù)設(shè)定在各軸上的值域,在多維數(shù)據(jù)特征空間中劃分出若干個互不重疊的平行多面體塊段(特征子空間)。應(yīng)用這種方法進(jìn)行分類需要由訓(xùn)練組數(shù)據(jù)學(xué)習(xí)產(chǎn)生基本的統(tǒng)計量信息,包括每個類別的均值向量和標(biāo)準(zhǔn)向量。若有個波段,個類別,用代表第類第波段的均值,為對應(yīng)的標(biāo)準(zhǔn)差,為像元在波段的像元值。
對于某一個類別,當(dāng)像元滿足:
,
即該像元在所有波段的灰度值都符合上述條件,就把像元歸入第列,即;否則不能歸入已知類別,即。式中為人為規(guī)定的閾值,相當(dāng)于有概率分布觸發(fā),采用幾個標(biāo)準(zhǔn)差作為可信的分類邊界,越大則一個類的范圍越大。
這種方法比較簡單,計算速度比較快。主要問題是按照各個波段的均值為標(biāo)準(zhǔn)差劃分的平行多面體與實際地物類別數(shù)據(jù)點分布的點群形態(tài)不一致,也就造成兩類的互相重疊,混淆不清的情況。
5結(jié)論
本文針對高光譜圖像,介紹了四種常見的分類方法,并分析了它們的特點以及實現(xiàn)算法,對高光譜圖像的分類有一定的研究意義。
參考文獻(xiàn)
[1] 胡高翔,韓孜. 基于K均值的遙感圖像自動識別分類[J].武漢理工大學(xué)學(xué)報(信息與管理工程版),2005.
[2] 譚琨,杜培軍.基于支持向量機的高光譜遙感圖像分類[J].紅外與毫米波學(xué)報, 2008,27(2):123-128.
[3] 趙振凱.結(jié)合近鄰選擇的高光譜圖像分類算法研究[D].南京師范大學(xué),2016.
[4] 劉紅巖,陳劍,陳國青.數(shù)據(jù)挖掘中的數(shù)據(jù)分類算法綜述[J].清華大學(xué)學(xué)報自然科學(xué)版,2002, 42(6):727-730.