盧紅洋+魏仲民
摘 要:文章提出一種基于多特征的高光譜遙感影像主動(dòng)學(xué)習(xí)方法,從遙感影像中提取形態(tài)學(xué)特征,灰度共生紋理和小波紋理描述遙感影像上的空間信息,將獲得的多種空間特征與光譜特征相疊加進(jìn)行主動(dòng)學(xué)習(xí),結(jié)合MCLU準(zhǔn)則選擇最具信息量的樣本進(jìn)行標(biāo)記,通過(guò)計(jì)算機(jī)和專家的不斷交互,獲得可靠的分類結(jié)果。在公共數(shù)據(jù)集Pavia University影像上的實(shí)驗(yàn)結(jié)果表明,文章提出的基于多特征的主動(dòng)學(xué)習(xí)方法能夠獲得比基于光譜的主動(dòng)學(xué)習(xí)方法和結(jié)合單一空間特征的主動(dòng)學(xué)習(xí)方法更好的分類結(jié)果。
關(guān)鍵詞:主動(dòng)學(xué)習(xí);多特征;高光譜;遙感;影像分類
中圖分類號(hào):O433 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):2095-2945(2017)33-0077-03
引言
隨著機(jī)器學(xué)習(xí)的不斷發(fā)展,主動(dòng)學(xué)習(xí)的策略被用于解決高光譜遙感影像分類中的訓(xùn)練樣本獲取問(wèn)題。眾多研究者針對(duì)高光譜遙感影像主動(dòng)學(xué)習(xí)展開(kāi)了研究。根據(jù)樣本信息量評(píng)定標(biāo)準(zhǔn)的差異,當(dāng)前主流的主動(dòng)學(xué)習(xí)算法可以分為以下幾類:(1)基于委員會(huì)的算法:該算法基于多個(gè)分類器結(jié)果的共同決策,選擇在多個(gè)分類器中預(yù)測(cè)標(biāo)記分歧最大的樣本進(jìn)行標(biāo)記并加入訓(xùn)練樣本集。(2)基于邊界最大化的算法:基于邊界最大化的方式是基于支持向量機(jī)(SVM)模型而提出的,它考慮了樣本在高維特征空間中與分類超平面的空間位置關(guān)系,認(rèn)為在特征空間中最靠近超平面的點(diǎn)信息量最大。(3)基于后驗(yàn)概率的算法:此類方法使用樣本屬于各個(gè)類別的后驗(yàn)概率來(lái)衡量樣本的信息量。若一個(gè)樣本屬于兩個(gè)最可能的類別的概率差異很小,則該樣本具有較大的信息量。然而,以上方法往往從單個(gè)像素自身的光譜特性出發(fā),忽略了遙感影像上像素間的聯(lián)系,對(duì)遙感影像的空間信息利用不足。
近年來(lái),光譜-空間聯(lián)合分類方法在遙感影像解譯中受到極大的關(guān)注。大量的研究表明,遙感影像空間信息豐富,利用影像的空間特征,能夠有效地增強(qiáng)高光譜遙感影像的分類精度。因此,文章提出了一種基于多特征的高光譜遙感影像主動(dòng)學(xué)習(xí)方法。本研究立足于遙感影像地物分布特點(diǎn),從高光譜影像中獲取多種空間特征,增強(qiáng)不同類別的光譜可分性,從而提升主動(dòng)學(xué)習(xí)的性能。該方法旨在利用多種空間特征的互補(bǔ)信息,克服單一空間特征表達(dá)能力不足的問(wèn)題,利用少量的標(biāo)記樣本獲得較好的分類結(jié)果。為了驗(yàn)證提出方法的有效性,文章采用了公用的高光譜遙感影像進(jìn)行測(cè)試,同時(shí),對(duì)比了僅考慮光譜的主動(dòng)學(xué)習(xí)方法和結(jié)合單一空間特征的主動(dòng)學(xué)習(xí)方法。
1 方法描述
文章提出了一種基于多特征的高光譜遙感影像主動(dòng)學(xué)習(xí)方法,該方法主要包括兩個(gè)部分:多特征提取和主動(dòng)學(xué)習(xí)。多特征提取的目的在于從影像中提取多種特征對(duì)地物空間分布進(jìn)行描述,從而便于不同類別地物的區(qū)分。另一方面,主動(dòng)學(xué)習(xí)立足于提取到的空間特征和影像的光譜屬性,選擇最具信息量的樣本進(jìn)行標(biāo)記。
1.1 多特征提取
(1)形態(tài)學(xué)特征
形態(tài)學(xué)是基于數(shù)學(xué)形態(tài)學(xué)提出的用于提取目標(biāo)結(jié)構(gòu)形態(tài)特征的算法。該方法立足于地物在遙感影像上所呈現(xiàn)的多尺度性,使用形態(tài)學(xué)開(kāi)重構(gòu)和閉重構(gòu),采取一系列不同大小的形態(tài)學(xué)算子對(duì)獲取地物特征,獲取多個(gè)的形態(tài)學(xué)輪廓特征全面描述目標(biāo)的空間結(jié)構(gòu)信息。使用具有不同大小的形態(tài)學(xué)算子對(duì)基影像進(jìn)行開(kāi)重構(gòu)和閉重構(gòu),可以獲得形態(tài)學(xué)輪廓。在形態(tài)學(xué)輪廓的基礎(chǔ)上,計(jì)算結(jié)構(gòu)算子大小變化而引起的灰度變化,獲得差分形態(tài)學(xué)特征,用于表示地物在不同尺度下的響應(yīng):
(1)
其中,MP和MP分別代表在形態(tài)算子為λ時(shí),所獲得的形態(tài)學(xué)開(kāi)運(yùn)算和閉運(yùn)算的結(jié)果。
(2)灰度共生紋理
灰度共生紋理是基于灰度共生矩陣獲取的地物紋理信息。將原始影像映射至特定灰度級(jí),并統(tǒng)計(jì)在固定大小窗口中特定方向上的像素間的灰度共生關(guān)系,構(gòu)建灰度共生矩陣表示影像局部的地物分布規(guī)律。影像中不同地物的空間分布往往會(huì)對(duì)應(yīng)著不同的灰度共生矩陣,可以使用基于灰度共生矩陣的統(tǒng)計(jì)測(cè)度表示不同地物的紋理和結(jié)構(gòu)特性。在本研究中,采用對(duì)比度和同質(zhì)性作為統(tǒng)計(jì)測(cè)度來(lái)描述影像的紋理特性。對(duì)比度表示相鄰像素的灰度差異,同質(zhì)性代表局部區(qū)域的灰度變化,計(jì)算方式如下:
(2)
其中,g(i,j)代表灰度級(jí)為i和j的共生像素出現(xiàn)的頻率,Ng代表影像灰度級(jí)。
(3)小波紋理
小波紋理可以視為將高光譜影像小波分解后所得到的結(jié)果。該方法將原始影像視為一個(gè)立體塊,并將其分解為{LxLyLz,LxHyLz,LxLyHz,LxHyHz,HxLyLz,HxHyLz,HxLyHz,HxHyHz}共8個(gè)子成分,其中L和H分別代表低通子成分和高通子成分,x和y表示的是影像的空間坐標(biāo),而z表示的是光譜維。本研究使用影像小波分解后獲得的低通子成分和高通子成分作為影像的小波紋理,具體的分解方式如下:
(3)
1.2 主動(dòng)學(xué)習(xí)
主動(dòng)學(xué)習(xí)旨在利用少量的最具信息量的樣本,獲取可靠的分類結(jié)果,從而降低樣本標(biāo)記所需的代價(jià)。其基礎(chǔ)理論在于,利用少量精心選擇的樣本生成的分類器的解譯能力并不弱于大量隨機(jī)選擇的樣本生成的分類器,從而能夠減少需要標(biāo)記的樣本數(shù)量,降低標(biāo)記過(guò)程的消耗。主動(dòng)學(xué)習(xí)通過(guò)計(jì)算機(jī)的計(jì)算能力,從候選樣本集中選擇最具信息量的樣本并交于專家進(jìn)行標(biāo)記,將標(biāo)記后的樣本加入訓(xùn)練集重新構(gòu)建分類器,通過(guò)計(jì)算機(jī)和專家的不斷交互,不斷擴(kuò)充分類樣本集從而提升分類模型的準(zhǔn)確性和魯棒性。假設(shè)存在僅包含n個(gè)標(biāo)記樣本的訓(xùn)練集T={Xi,yi},其中,Xi為樣本的特征向量,而yi={1,2,...,K}為樣本Xi的標(biāo)記。此外,存在包含m個(gè)未標(biāo)記樣本的候選集U={Xi}代表未標(biāo)記樣本集,并且候選樣本集中的樣本數(shù)量遠(yuǎn)遠(yuǎn)多于標(biāo)記樣本集中的樣本數(shù)量。主動(dòng)學(xué)習(xí)立足于當(dāng)前的訓(xùn)練樣本集T,計(jì)算機(jī)通過(guò)計(jì)算候選集U中樣本的不確定性,選擇對(duì)分類器最有幫助的樣本并將其反饋給專家,而專家結(jié)合自身的經(jīng)驗(yàn)及實(shí)地調(diào)研或目視解譯的結(jié)果對(duì)反饋的樣本進(jìn)行標(biāo)記。endprint
本研究將從高光譜遙感中提取到的多種空間特征與光譜特征進(jìn)行疊加,形成光譜-空間聯(lián)合特征向量用于分類。在選擇樣本的過(guò)程中,采用了MLCU準(zhǔn)則去衡量未標(biāo)記樣本的信息量,計(jì)算方式如下:
其中,r1max(Xi)和r2max(Xi)分別表示樣本Xi到最近和第二近的超平面的距離。如果cdiff(Xi)的值越小,則樣本的信息量越高,該樣本更可能被認(rèn)為是對(duì)分類模型有益的樣本。
2 實(shí)驗(yàn)分析
2.1 數(shù)據(jù)介紹
實(shí)驗(yàn)采用的高光譜遙感影像為Pavia University數(shù)據(jù)集。Pavia University影像由ROSIS傳感器在意大利帕維亞市上空獲取,共包含9種不同類型的地物。影像大小為610像素×340像素,空間分辨率為1.3米/像素。由于原始影像中部分波段包含較多噪聲,將12個(gè)噪聲波段去除后,影像剩余103個(gè)波段。實(shí)驗(yàn)中所使用的高光譜影像為測(cè)試遙感影像算法的公用數(shù)據(jù)集,其測(cè)試樣本由數(shù)據(jù)發(fā)布方提供。Pavia University影像和對(duì)應(yīng)的測(cè)試數(shù)據(jù)如圖1所示。
2.2 實(shí)驗(yàn)參數(shù)
在多特征提取中,采用PCA降維后的第一主成分和第二主成分作為提取形態(tài)學(xué)特征和灰度共生紋理的基準(zhǔn)影像??紤]到遙感影像上地物的多尺度特性,提取形態(tài)學(xué)特征所用的結(jié)構(gòu)算子為圓形算子,半徑設(shè)置為1到10。提取灰度共生紋理時(shí),灰度等級(jí)設(shè)置為16,使用的窗口大小為3,5,…,11。而小波紋理的提取窗口大小設(shè)置為4,8,16,32。
文章采用的分類器為支持向量機(jī)(SVM, support vector machine),使用的核函數(shù)為徑向基函數(shù)(RBF, radial basis function)。懲罰系數(shù)和RBF帶寬均通過(guò)交叉驗(yàn)證的方式獲取。每類的初始訓(xùn)練樣本個(gè)數(shù)為5個(gè),共有9類,共45個(gè)樣本。計(jì)算機(jī)每次選擇信息量最大的5個(gè)樣本交于專家標(biāo)記,共標(biāo)記50次。為了確保結(jié)果的可靠性,所有實(shí)驗(yàn)使用隨機(jī)選擇的初始樣本并重復(fù)10次。實(shí)驗(yàn)對(duì)比中采用10次結(jié)果的整體精度(OA, overall accuracy)的均值對(duì)不同算法進(jìn)行對(duì)比。
2.3 實(shí)驗(yàn)對(duì)比
為了驗(yàn)證算法的有效性,實(shí)驗(yàn)對(duì)比了基于光譜的主動(dòng)學(xué)習(xí)方法和聯(lián)合單一空間特征的主動(dòng)學(xué)習(xí)方法。其中,聯(lián)合單一空間特征的主動(dòng)學(xué)習(xí)方法分別結(jié)合了形態(tài)學(xué)輪廓,灰度共生紋理,和小波紋理。實(shí)驗(yàn)結(jié)果如圖2所示。
圖中,橫軸代表的是標(biāo)記樣本的數(shù)量,縱軸代表的是算法取得的精度。從精度曲線中可以看出,結(jié)合了空間特征的算法的結(jié)果明顯優(yōu)于僅依賴于光譜特征的算法,而基于多特征的主動(dòng)學(xué)習(xí)方式明顯獲得了最優(yōu)的結(jié)果。
具體而言,對(duì)于Pavia University影像,僅依賴光譜的主動(dòng)學(xué)習(xí)方法能夠獲得的最優(yōu)精度為89.43%,結(jié)合單一空間特征的方法獲得的最優(yōu)精度分別為94.00%、89.71%和94.62%。而提出的基于多特征的主動(dòng)學(xué)習(xí)方法獲得的最優(yōu)精度為97.79%。當(dāng)使用250個(gè)標(biāo)記樣本時(shí),基于光譜的主動(dòng)學(xué)習(xí)方法的精度為88.60%。結(jié)合形態(tài)學(xué)特征,灰度共生紋理和小波紋理的主動(dòng)學(xué)習(xí)方法所獲得的精度分別為93.14%、88.80%和93.78%,我們提出的算法獲得的精度為97.06%。當(dāng)獲得90%的分類精度時(shí),基于光譜和結(jié)合灰度共生紋理的主動(dòng)學(xué)習(xí)方法需要標(biāo)記的樣本數(shù)量多于300個(gè),結(jié)合形態(tài)學(xué)特征和結(jié)合小波紋理的主動(dòng)學(xué)習(xí)方法分別需要135個(gè)和145個(gè)標(biāo)記樣本,而提出的算法只需要標(biāo)記110個(gè)樣本,明顯少于其他的對(duì)比方法??梢?jiàn),基于多特征的主動(dòng)學(xué)習(xí)能夠使用較少的樣本獲得更高的精度,實(shí)驗(yàn)結(jié)果證明了所提出方法的有效性。
3 結(jié)論與展望
文章針對(duì)高光譜遙感影像分類中的樣本標(biāo)記問(wèn)題,提出了一種基于多特征的主動(dòng)學(xué)習(xí)方法。該方法有效地挖掘了高光譜遙感影像的空間信息,發(fā)揮不同特征的互補(bǔ)性,增強(qiáng)不同類別的可分性,從而有利于選擇出最具信息量的樣本。文章使用了形態(tài)學(xué)特征,灰度共生紋理和小波紋理描述遙感影像的空間信息,同時(shí)采用MCLU準(zhǔn)則衡量待標(biāo)記樣本的信息量,選擇對(duì)分類模型構(gòu)建最優(yōu)幫助的樣本點(diǎn)進(jìn)行標(biāo)記,通過(guò)計(jì)算機(jī)與專家的不斷交互,減少需要標(biāo)記的樣本數(shù)量,降低樣本標(biāo)記的消耗。從實(shí)驗(yàn)結(jié)果中可以看出,文章所提出的算法能夠獲得比依賴于光譜的主動(dòng)學(xué)習(xí)方式和考慮了單一空間特征的主動(dòng)學(xué)習(xí)方法更好的結(jié)果。將來(lái)的研究工作將著眼于聯(lián)合半監(jiān)督學(xué)習(xí)和主動(dòng)學(xué)習(xí)的高光譜遙感影像分類方法,進(jìn)一步減少需要標(biāo)記的樣本數(shù)量。
參考文獻(xiàn):
[1]Crawford M M, Tuia D, Yang H L. Active learning: Any value for classification of remotely sensed data[J]. Proceedings of the IEEE,2013,101(3):593-608.
[2]陳建杰,葉智宣.多分類SVM主動(dòng)學(xué)習(xí)及其在遙感圖像分類中的應(yīng)用[J].測(cè)繪科學(xué),2009,34(4):97-100.
[3]杜培軍,夏俊士,薛朝輝,等.高光譜遙感影像分類研究進(jìn)展[J].遙感學(xué)報(bào),2016,20(2):236-256.
[4]田彥平,陶超,鄒崢嶸,等.主動(dòng)學(xué)習(xí)與圖的半監(jiān)督相結(jié)合的高光譜影像分類[J].測(cè)繪學(xué)報(bào),2015,44(8):919-926.
[5]李寵,谷瓊,蔡之華,等.改進(jìn)的主動(dòng)學(xué)習(xí)算法及在高光譜分類中的應(yīng)用[J].華中科技大學(xué)學(xué)報(bào):自然科學(xué)版,2013(S2):274-278.
[6]Benediktsson J A, Palmason J A, Sveinsson J R. Classification of hyperspectral data from urban areas based on extended morphological profiles[J]. IEEE Transactions on Geoscience and Remote Sensing, 2005,43(3):480-491.
[7]Ye Z, Prasad S, Li W, et al. Classification based on 3-D DWT and decision fusion for hyperspectral image analysis[J]. IEEE Geoscience and Remote Sensing Letters, 2014,11(1):173-177.
[8]李智峰,朱谷昌,董泰鋒.基于灰度共生矩陣的圖像紋理特征地物分類應(yīng)用[J].地質(zhì)與勘探,2011,47(3):456-461.endprint