金鵬飛 湯瑜瑜 危峻
摘 ?要: 針對寬波段成像光譜儀數據為中等空間分辨率、譜段多的特點,提出一種結合雙子支持向量機(TSVM)和紋理特征的WIS遙感影像快速分類方法。選用經過幾何校正的二級數據產品,進行大氣校正、反射率計算等預處理后,裁切出500×500大小的影像作為實驗對象。選擇以相關性分析的方法獲取特征波段。為解決狹小水體混合像元難以區(qū)分的問題,選擇計算NDWI指數,然后提取其紋理特征。最后,基于TSVM和傳統(tǒng)SVM進行分類實驗,樣本訓練及預測的時間分別為14.27 s,26.41 s,得到的總體分類精度分別為87.861 3%,87.659 0%。結果表明,基于TSVM和紋理特征的分類算法不僅訓練速度快,而且具有良好的泛化能力。寬波段成像光譜儀數據在中等尺度的土地覆蓋分類中具有極大的應用價值。
關鍵詞: 遙感影像; 快速分類; TSVM; 寬波段成像光譜儀; 紋理特征提取; 結果分析
中圖分類號: TN911.73?34; TP751 ? ? ? ? ? ? ? 文獻標識碼: A ? ? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2020)02?0001?04
WIS remote sensing image classification method based on TSVM and texture features
JIN Pengfei1,2, TANG Yuyu2, WEI Jun2
Abstract: As for the characteristics of medium spatial resolution and multi spectral coverage of broadband imaging spectrometer data, a WIS remote sensing image fast classification method in combination with the twin support vector machine (TSVM) and texture features is proposed. The secondary data products with geometric correction are selected to perform the pre?processing such as atmospheric correction and reflectance calculation, after which the image of the 500×500 size are cut out as the experimental objects. The feature band is obtained by means of the correlation analysis method. The NDWI index is calculated, and then the texture features are extracted to solve the indistinguishable problem of the mixed water pixels in the narrow water. The classification experimen based on TSVM and traditional SVM is carried out, the sample training and prediction time is 14.27 s, 26.41 s, respectively, and the overall classification accuracy is 87.861 3%, 87.659 0%. The results show that the classification algorithm based on TSVM and texture features not has fast training speed, but has good generalization ability. The broadband imaging spectrometer data has great application value in medium?scale land cover classification.
Keywords: remote?sensing image; fast classification; TSVM; broadband imaging spectrometer; feature extraction detection; results analysis
非平行支持向量機作為支持向量機的延伸,近些年受到廣泛關注。與傳統(tǒng)SVM算法最大的不同在于,非平行支持向量機針對每一類別構造相應的支持超平面。讓每一個超平面更“接近”于相應的類別,而不限定超平面是否平行和間隔大小[1]。因此,對于某些數據而言,比如交叉型數據,非平行支持向量機具有更好的分類效果。同時在計算速度方面,非平行支持向量機具有絕對的優(yōu)勢。非平行支持向量機中影響程度較大的兩種類型分別是廣義特征值支持向量機(Generalized Eigenvalue Proximal SVM,GEPSVM)和雙子支持向量機(Twin Support Vector Machine,TSVM)。GEPSVM是非平行支持向量機的首個模型,是Mangasarian等人在2006年提出的[2]。雙子支持向量機具有和GEPSVM較為相似的非平行特性,但在超平面和類別的距離處理方面,有著不同的取舍。實驗結果證明,TSVM具有較小的訓練規(guī)模和良好的泛化能力[3]。
雖然非平行支持向量機具有更好的性能,已經成為支持向量機研究的新熱點,但其應用研究卻相對較少。在國內外,非支持向量機的研究較多的還是理論和模型構建,以雙子支持向量機和廣義特征值支持向量機的變體以及結合其他優(yōu)化算法的研究為主[4]。盡管如此,在遙感方面也已經有少部分的應用[5?6]。胡根生等人利用最小二乘法的雙子支持向量機(LS?WTSVM)和灰度共生矩陣進行云層的檢測分類,結果得出Kappa系數為0.897 2,優(yōu)于其他方法[7]。王立國等人將雙子支持向量機與K?means結合,通過非監(jiān)督分類方法減小訓練樣本規(guī)模,進行高光譜遙感圖像的半監(jiān)督分類實驗[8]。在農業(yè)遙感方面,還有結合HJ衛(wèi)星數據和LS?WTSVM進行小麥蚜蟲的監(jiān)測,實驗結果比傳統(tǒng)SVM高9%左右。
隨著遙感技術的發(fā)展以及應用精度的日益提高,遙感影像分類不在僅僅依靠光譜特征。紋理特征的利用極大提高了分類精度。針對WIS影像中狹小水體混合像元現象嚴重的情況,選擇歸一化水體指數NDWI圖像作為紋理特征提取的原始圖像。這樣可以極大縮小計算量,在有效區(qū)分出水體的同時,也增加了房屋、農田等其他地物類型的紋理特征。因此,該結合TSVM和紋理特征的分類算法較適合WIS多光譜遙感影像的快速分類。
1 ?雙子支持向量機的原理
分類問題中,傳統(tǒng)支持向量機最為重要的思想就是“最大間隔”原則,以一對平行超平面去劃分不同的類別。其基本約束和目標函數可表示為:
[minω,b12∥ω∥2s.t. ?yi(ωTxi+b)≥1, ?i=1,2,…,m] ? (1)
而雙子支持向量機目的在于尋找一對非平行的擬合超平面,如下:
[f1(x)=ωT1x+b1=0f2(x)=ωT2x+b2=0] ?(2)
希望每個超平面分別擬合一類樣本點以尋找相同類別之間的相似性,同時希望非本類別樣本點遠離本類擬合超平面。雙子支持向量機不同于GEPSVM的特點在于,放寬對于負類樣本的“遠離原則”,限制條件為負類樣本處于正類超平面平行偏離一個單位的超平面[ωT1x+b1=-1]的一側即可。同樣,對于正類樣本的要求與之相似。新的樣本點的預測分類取決于其離哪個超平面更加接近。因此,TSVM算法可以簡化為求解以下兩個優(yōu)化問題:
[minω1,b1,ξ212ω1x1+e1b12+c1eT2ξ2s.t. ?-(ω1x2+e2b1)+ξ2≥e2,ξ2≥0] ? (3)
[minω2,b2,ξ112ω2x2+e2b22+c2eT1ξ1s.t. ?(ω2x1+e1b2)+ξ1≥e1,ξ1≥0] ? (4)
式中:[c1>0]和[c2>0]為調節(jié)參數;[e1]和[e2]表示分量為1的列向量;[ξ1∈Rm1]和[ξ2∈Rm2]為松弛向量,其幾何意義十分明了,即用一對非平行超平面盡量去擬合相應類別。新的樣本點的預測函數為:
[Classi=argmini=1,2|ωTix+bi|∥ωi∥] ?(5)
根據理論計算,傳統(tǒng)SVM算法的復雜度為[m3],[m]為樣本規(guī)模。TSVM算法由于是處理兩個接近原來樣本規(guī)模一半的問題,所以復雜度為[2×m23=m34]。因此,在相同核方法和優(yōu)化條件下,TSVM的處理速度接近SVM的4倍。
2 ?數據與方法
2.1 ?數據介紹
寬波段成像光譜儀是裝載在“天宮二號”空間站上的新一代對地光學觀測綜合遙感器,主要為滿足高性能海洋海岸帶的水色水溫監(jiān)測需求而研制,同時兼顧陸地和大氣探測。儀器包括14個在軌可編程的可見近紅外(譜段范圍為0.40~1.04 μm)光譜通道、2個短波紅外通道(譜段范圍為1.232~1.252 μm和1.630~1.654 μm)和2個熱紅外通道(譜段范圍為8.125~8.825 μm和8.925~9.275 μm),3個譜段星下點的空間分辨率分別為100 m,200 m和400 m。本文選用的實驗數據為南京地區(qū)500×500的遙感影像,區(qū)域概況如圖1所示。由于數據屬于中等分辨率,混合像元較多,目視解譯選取訓練樣本困難。最終確定實驗區(qū)域有六類地物類型,分別是:水體、林地、綠地、裸土、一類建筑、二類建筑(高反射),每類訓練樣本為1 500個。
2.2 ?方法流程
本文僅利用可見光近紅外14個波段的數據進行分類實驗。同時,原始數據為經過幾何校正的二級輻亮度數據產品,由于大氣校正精度對分類實驗的影響不大,采用暗像元法進行大氣校正,然后根據頭文件中的太陽高度角以及每個波段的太陽輻照度,計算出地物反射率。根據計算出的NDWI(如式(6)所示,近紅外為波段4,綠色為波段10),結合灰度共生矩陣提取其紋理特征。其基本原理是計算灰度圖像各個灰度值之間在指定方向和距離上出現的次數,從而生成灰度共生矩陣,然后利用灰度矩陣計算出不同的二階統(tǒng)計特征值,以此作為紋理測度。根據對比分析,以下四種紋理測度的區(qū)分度較好:協(xié)方差(Variance)、反差(Contrast)、熵(Entropy)、角二階矩(Angular Second Moment,ASM)。
[NDWI=Green-NIRGreen+NIR] ? (6)
雖然可見光近紅外范圍內具有精細的光譜數據,給地物參數反演帶來極大的便利,但對于地物分類來說,也是極大的數據冗余。根據波段間相關性分析,選取相關性小的4個波段(Band1,Band8,Band10,Band13)來分類,既可以減少數據量,又可以得出相對較好的效果[9]。結合選取出的4個紋理特征圖像,一共8個特征組成新的圖像作為分類輸入特征。
實驗數據預處理、相關性分析以及紋理特征的提取是基于ENVI 5.3軟件上實現的。為比較兩種支持向量機的訓練速度,傳統(tǒng)SVM與TSVM的分類均是基于Matlab 2014實現的,其中傳統(tǒng)SVM使用了LibSVM庫[10]。為了控制變量,TSVM與傳統(tǒng)SVM分類時均采用“一對一”的分類模式。實驗所用計算機的處理器為Intel i7?6700,3.40 GHz,內存為32 GB,系統(tǒng)為Windows 10專業(yè)版。
圖2為分類實驗的具體流程圖。
3 ?結果分析
從圖3可以發(fā)現,NDWI可以有效地提取出狹小水體,但不足的是受周圍像元干擾,無法選取閾值。因此,在不干擾其他地物區(qū)分的基礎上,選取4種區(qū)分度比較大的紋理特征,得到水體目標的空間信息。最終以相關性分析篩選出的第1,8,10,13波段加上4個紋理特征作為分類的輸入圖像。與不加紋理特征的原始圖像的分類對比如圖4所示。經過對比,狹小水體的分類效果大大提高,建筑、綠地、裸土范圍內夾雜的狹小河流都得到區(qū)分;農田、建筑等其他地物的分類效果僅稍微有所變化,主要表現為城區(qū)部分綠地等混雜像元得以撇除。相對于圖4i),紋理特征豐富了圖4h)中的地物覆蓋類型。
TSVM與SVM最大的不同在于,構建兩個非平行的超平面,而不是一對最大間隔的平行超平面。這意味著,從一個較大的訓練規(guī)模變成兩個較小的規(guī)模,理論上來說速度變成4倍。但對于實際分類來說,速度的提升遠沒有4倍之多。在同樣“一對一”的分類模式以及基于徑向基核函數的分類情況下,每類訓練樣本選取個數為1 500個,基于SVM的分類時間為26.41 s ,基于TSVM的分類時間為14.27 s。原因在于,SVM實驗使用的是LibSVM庫,代碼的優(yōu)化提升了速度。對于分類精度,無論基于紋理特征還是原始圖像,TSVM與SVM的效果相差不多。結合紋理特征的TSVM分類精度為87.861 3%,Kappa系數為0.854 3;結合紋理特征的傳統(tǒng)SVM的分類精度為87.659 0%,Kappa系數為0.851 9;單純基于TSVM的分類精度為81.088 6%,Kappa系數為0.773 2。混淆矩陣如表2所示。因此,結合紋理特征和TSVM的分類算法不僅時間將近縮短[12],而且在分類精度上提高了6.8%左右。最終,基于TSVM和紋理特征的總體分類效果如圖5所示。
4 ?結 ?論
針對“天宮二號”寬波段成像光譜儀遙感影像分類中狹小水體難以區(qū)分的問題,本文提出一種結合雙子支持向量機和紋理特征的快速分類方法。通過相關性分析減少特征波段,加上TSVM算法大大提升樣本訓練速度,從而提升總體分類速度。結合NDWI圖像的紋理特征,很好地提升了分類精度。對于空間分辨率較低的多光譜遙感影像的分類具有較高的適用價值。不足的是,TSVM算法的遙感影像多分類應用還不夠成熟,需要更多的優(yōu)化算法,進一步提升分類速度和魯棒性。同時針對不同影像的不同特點,結合其他地物參數的應用是下一步研究的重點。
致謝:感謝載人航天工程提供“天宮二號”寬波段成像儀數據產品。
注:本文通訊作者為湯瑜瑜。
參考文獻
[1] 邵元海,楊凱莉,劉明增,等.從支持向量機到非平行支持向量機[J].運籌學學報,2018,22(2):55?65.
[2] MANGASARIAN O L, WILD E W. Multisurface proximal support vector machine classification via generalized eigenvalues [J]. IEEE transactions on pattern analysis and machine intelligence, 2006, 28(1): 69?74.
[3] LIU Z, ZHU L. A novel remote sensing image classification algorithm based on multi?feature optimization and TWSVM [C]// 9th International Conference on Digital Image Processing. Hongkong, China: SPIE, 2017: 12?17.
[4] ?KHEMCHANDANI R, CHANDRA S. Twin support vector mach?
ines for pattern classification [M]// NEOGY S K, BAPAT R B, DAS A K, et al. Mathematical programming and game theory for decision making. Singapore: World Scientific, 2007: 147?152.
[5] TASKIN G. A comprehensive analysis of twin support vector machines in remote sensing image classification [C]// 2015 23nd Signal Processing and Communications Applications Conference. Malatya: IEEE, 2015: 2427?2429.
[6] KUCUK C, TORUN Y, KAYA G T, et al. Remote sensing image classification by non?parallel SVMS [C]// 2014 IEEE Geoscience and Remote Sensing Symposium. Quebec: IEEE, 2014: 1269?1272.
[7] 胡根生,陳長春,張學敏,等.LS?WTSVM的遙感多光譜影像云檢測[J].安徽大學學報(自然科學版),2014(1):53?60.
[8] 王立國,杜心平.K均值聚類和孿生支持向量機相結合的高光譜圖像半監(jiān)督分類[J].應用科技,2017(3):12?18.
[9] KAYA G T, TORUN Y, KUCUK C. Recursive feature selection based on non?parallel SVMs and its application to hyperspectral image classification [C]// 2014 IEEE International Geoscience and Remote Sensing Symposium. Quebec: IEEE, 2014: 3558?3561.
[10] CHANG C C, CHIH J. LIBSVM: A library for support vector machines [J]. ACM transactions on intelligent systems and technology, 2011, 2(3): 21?27.
作者簡介:金鵬飛(1994—),男,博士研究生,研究方向為遙感及成像光譜技術。
湯瑜瑜(1981—),女,副研究員,主要從事空間遙感及模擬技術方面的研究工作。