李穎
(1.中國氣象局 河南省農(nóng)業(yè)氣象保障與應(yīng)用技術(shù)重點(diǎn)實驗室,鄭州 450003;2.河南省氣象科學(xué)研究所,鄭州 450003)
近年來,田間雜草識別研究普遍利用RGB相機(jī)影像或多光譜影像基于機(jī)器視覺開展[1-2]。由于此類方法利用的光譜信息有限,主要借助形狀特征進(jìn)行識別,當(dāng)雜草與作物形態(tài)相似時,很難取得理想的識別精度。成像光譜技術(shù)的誕生使光學(xué)遙感進(jìn)入了一個嶄新的階段,解決了傳統(tǒng)遙感科學(xué)領(lǐng)域“成像無光譜”和“光譜不成像”的歷史問題[3]。在田間雜草識別研究中,使用成像光譜技術(shù)能夠細(xì)致、全面地獲取田間不同種類植物的光譜特征,以像元為識別單元時可以取得令人滿意的識別精度[4]。
遙感數(shù)據(jù)的分類識別算法眾多,其中,SVM算法不受“維數(shù)災(zāi)難”的影響,在小樣本學(xué)習(xí)、學(xué)習(xí)效率、抗噪聲性能、推廣性等方面表現(xiàn)優(yōu)秀,近年來得到了廣泛的應(yīng)用[5-7]。Pal和Mather[8]應(yīng)用SVM對DAIS高光譜數(shù)據(jù)進(jìn)行分類,結(jié)果表明,無論在高維特征空間還是利用降維后的特征,SVM算法的分類精度普遍高于其他算法。Melgani和Bruzzone[9]將SVM算法用于AVIRIS高光譜數(shù)據(jù)的分類實驗,證明了使用RBF核函數(shù)的SVM分類精度高于RBF人工神經(jīng)網(wǎng)絡(luò)、K-最近鄰法等。
本研究利用地面成像光譜儀獲取田間影像,鑒于SVM算法的優(yōu)越性,將SVM算法用于成像光譜數(shù)據(jù)田間雜草識別。在高空間分辨率成像光譜數(shù)據(jù)中,地物光譜存在較強(qiáng)的不確定性,加之田間作物雜草的光譜通常較為相近,使得僅使用原始光譜特征進(jìn)行雜草識別時的精度受到制約。杜培軍等[10]指出,將原始光譜特征與其他特征結(jié)合時,多特征參與的SVM方法有望得到更高的分類識別精度。目前,根據(jù)成像光譜數(shù)據(jù)自身的特點(diǎn)提取多特征用于SVM分類的例子還比較少。多特征參與的SVM方法是成像光譜數(shù)據(jù)田間雜草識別中一個值得關(guān)注的研究點(diǎn)。本文利用地面成像光譜數(shù)據(jù)開展了多特征參與的SVM田間雜草識別方法研究,根據(jù)地面成像光譜數(shù)據(jù)兼具高光譜分辨率與高空間分辨率的特點(diǎn)提取田間作物雜草的多類可辨別特征,并進(jìn)行特征降維。
(1)紋理特征
承繼成等[11]認(rèn)為高光譜圖像中地物光譜的不確定性可通過加入空間和結(jié)構(gòu)特征來控制。同一種植物不同個體的紋理相似,而不同種類植物個體的紋理通常不同,本研究選擇高光譜遙感圖像的紋理特征幫助識別田間植物種類。
灰度共生矩陣研究圖像中兩種灰度級的聯(lián)合分布情況,能較好地反映圖像灰度級的空間相關(guān)性規(guī)律,是描述紋理特征最常用的一種統(tǒng)計方法?;叶裙采仃囀怯跋窕叶燃壷g聯(lián)合概率密度函數(shù)P(i,j,d,θ)的矩陣形式,該函數(shù)表示以灰度i為起點(diǎn),給定空間距離d和方向θ時,出現(xiàn)灰度j的概率。本研究基于灰度共生矩陣,計算均值、協(xié)同性、相異性、熵、二階矩和相關(guān)性等6種紋理特征[12]。
(2)連續(xù)統(tǒng)去除后的光譜特征
連續(xù)統(tǒng)去除法最早由Clark和Ruosh提出,并得到發(fā)展完善[13-14]。該方法認(rèn)為光譜曲線覆蓋了一層代表背景的外殼(Hull),Hull由光譜曲線上的吸收起點(diǎn)和吸收終點(diǎn)連接而成,去除Hull可將光譜歸一化到0和1之間,并突顯吸收峰與吸收谷。連續(xù)統(tǒng)去除可增強(qiáng)光譜曲線的特征吸收帶,使吸收峰更加明顯,放大地物光譜間的細(xì)微差異,本研究選擇連續(xù)統(tǒng)去除后的光譜特征幫助識別田間植物種類。
(3)高光譜植被指數(shù)特征
多種高光譜植被指數(shù)與植物中的某些生化組分含量具有較強(qiáng)的相關(guān)關(guān)系。同一種植物的不同個體處于同一生長發(fā)育階段且處于相近的水熱條件下時,個體間的各項生化組分含量通常是相近的,不同種類植物個體間的各項生化組分含量則往往不同,因此,可有效反演植物多種生化組分含量的高光譜植被指數(shù)有助于對植物種類的識別。本研究選取表1中與葉綠素、胡蘿卜素、花青素等3種色素含量相關(guān)性強(qiáng)的14種高光譜植被指數(shù)特征幫助識別田間植物種類。
表1 可有效反演植物多種生化組分含量的高光譜植被指數(shù)
續(xù)表1
成像光譜數(shù)據(jù)自身具有維度高,波段間相關(guān)性強(qiáng)的特點(diǎn),多特征計算在提供更豐富信息的同時進(jìn)一步增加了數(shù)據(jù)的維度和冗余量。SVM算法不受“維數(shù)災(zāi)難”的影響,在克服高維數(shù)據(jù)冗余性的方面也有優(yōu)秀的表現(xiàn),但多特征計算后,總的特征維度通常在千維以上,利用全特征SVM分類對計算機(jī)的性能有很高的要求,同時大大增加了計算的時間成本。為了降低計算的時間成本,同時在保持原始光譜信息不損失的前提下盡可能充分利用其他特征集的信息,本研究制定以下降維策略:①原始光譜特征集不降維;②維度小于等于30的特征集不降維;③維度大于30的特征集采用特征提取算法中的PCA算法進(jìn)行降維,并根據(jù)特征值分布情況確定保留主成分波段的個數(shù)(原則上使數(shù)據(jù)方差的累積百分比在80%以上)。
2009年7月22日午時,在中國農(nóng)業(yè)大學(xué)西區(qū)實驗田利用地面成像光譜輻射測量系統(tǒng)(Field Imaging Spectrometer System,F(xiàn)ISS)以1.2m的高度垂直觀測采集田間影像,在379 nm~870 nm的光譜范圍內(nèi)共獲取344 nm個波段,光譜采樣間隔約為1.4 nm,光譜分辨率在4 nm~7 nm,影像空間分辨率在0.24cm左右。圖像景中的作物為西瓜苗,雜草包括牛筋草、馬齒莧、野莧菜3種。對采集到的成像光譜數(shù)據(jù)逐波段進(jìn)行檢查,去除壞線與條帶,并使用最小噪聲分離變換(MNF)去除噪聲,在MNF變換后選擇特征值大于MNF特征值曲線陡坡轉(zhuǎn)折處的成分反變換回原光譜空間,去除原數(shù)據(jù)空間中的噪聲。
將紋理特征(降維)、高光譜植被指數(shù)特征、連續(xù)統(tǒng)去除后的光譜特征(降維)等3類特征的灰度值標(biāo)準(zhǔn)化到0~255,與原始DN值特征范圍一致。將實驗數(shù)據(jù)的原始光譜特征和提取出的紋理特征(降維)、連續(xù)統(tǒng)去除后的光譜特征(降維)、高光譜植被指數(shù)特征等組成3種多特征組合,參與SVM田間雜草識別。3種多特征組合見表2。
表2 多特征組合
提取統(tǒng)一的訓(xùn)練樣本,分別利用344維原始光譜特征和表2中3組多特征向量參與SVM分類,經(jīng)人機(jī)交互實驗,最終確定以高斯徑向基核(Radial Basis Function,RBF)為核函數(shù),對全分辨率進(jìn)行分類,核函數(shù)的懲罰系數(shù)設(shè)為100,核函數(shù)的γ值設(shè)為0.003,得到田間雜草識別結(jié)果。圖1為利用原始光譜特征時和利用多特征組合Ⅲ時的SVM田間雜草識別結(jié)果、地表真實圖像及FISS高光譜影像。根據(jù)地表真實圖像計算混淆矩陣對3種多特征組合參與的SVM雜草識別精度進(jìn)行評價,將利用原始光譜特征時和利用3種多特征組合時的SVM識別精度進(jìn)行對比,見表3。
由表3可知,當(dāng)訓(xùn)練樣本一致時,3種多特征組合參與的SVM田間雜草識別精度均優(yōu)于僅使用原始光譜特征時的情況。在3種多特征組合中,使用包含原始光譜特征、紋理特征、高光譜植被指數(shù)特征和連續(xù)統(tǒng)去除后的光譜特征的多特征組合Ⅲ時,田間雜草識別精度最高。分析實驗結(jié)果得出以下結(jié)論:①多特征參與可以有效控制地物光譜的不確定性,提高SVM分類識別的精度;②紋理特征、多種高光譜植被指數(shù)特征和連續(xù)統(tǒng)去除后的光譜特征的參與,均有助于提高SVM田間雜草識別精度。
表3 利用原始光譜特征時和利用3種多特征組合時的SVM識別精度
本文利用地面成像光譜數(shù)據(jù)開展了多特征參與的SVM田間雜草識別方法研究。根據(jù)地面成像光譜數(shù)據(jù)兼具高空間分辨率和高光譜分辨率的特點(diǎn),提取紋理特征、連續(xù)統(tǒng)去除后的光譜特征和高光譜植被指數(shù)特征等3類田間作物雜草的可辨別特征,并對高維特征集進(jìn)行降維,利用多種多特征組合參與SVM田間雜草識別。實驗結(jié)果證明,在訓(xùn)練樣本一致的前提下,多特征參與的SVM田間雜草識別精度優(yōu)于僅使用原始光譜特征時的情況。更進(jìn)一步的研究可針對不同遙感測量尺度的成像光譜數(shù)據(jù),全面篩選出有助于辨別田間作物雜草的特征向量,制定多特征組合策略,對不同多特征向量參與下的SVM識別精度和效率進(jìn)行評價。
參考文獻(xiàn):
[1] SLAUGHTER D C,GILES D K,F(xiàn)ENNIMORE S A,et al.Multispectral machine vision identification of lettuce and weed seedlings for automated weed control[J].Weed Technology,2008,22(2):378-384.
[2] SWAIN K C,NORREMARK M,JORGENSEN R N,et al.Weed identification using an automated active shape matching (AASM) technique[J].Biosystems Engineering,2011,110(4):450-457.
[3] 童慶禧,張兵,鄭蘭芬.高光譜遙感—原理、技術(shù)與應(yīng)用[M].北京:高等教育出版社,2006:38-44.
[4] 劉波,方俊永,劉學(xué),等.基于成像光譜技術(shù)的作物雜草識別研究[J].光譜學(xué)與光譜分析,2010,30(7):1830-1833.
[5] MOUSTAKIDIS S,MALLINIS G,KOUTSIAS N,et al.SVM-based fuzzy decision trees for classification of high spatial resolution remote sensing images[J].Geoscience and Remote Sensing,IEEE Transactions on,2012,50(1):149-169.
[6] SEGATA N,PASOLLI E,MELGANI F,et al.Local SVM approaches for fast and accurate classification of remote-sensing images[J].International Journal of Remote Sensing,2012,33(19):6186-6201.
[7] MAULIK U,CHAKRABORTY D.Learning with transductive SVM for semisupervised pixel classification of remote sensing imagery[J].ISPRS Journal of Photogrammetry and Remote Sensing,2013,(77):66-78.
[8] PAL M,MATHER P M.Support vector classifiers for land cover classification[C].GIS Development,Haryana,India,2003.
[9] MELGANI F,BRUZZONE L.Classification of hyperspectral remote sensing images with support vector machines[J].IEEE Transactions on Geoscience and Remote Sensing,2004,42(8):1778-1790.
[10] 杜培軍,林卉,孫敦新.基于支持向量機(jī)的高光譜遙感分類進(jìn)展[J].測繪通報,2006,(12):37-40,50.
[11] 承繼成,郭華東,史文中,等.遙感數(shù)據(jù)的不確定性問題[M].北京:科學(xué)出版社,2004.
[12] KEKRE H B,THEPADE S D,SARODE T K,et al.Image retrieval using texture features extracted from GLCM,LBG and KPE[J].International Journal of Computer Theory and Engineering,2010,2(5):695-700.
[13] FILIPPI A M JENSEN J R.Effect of continuum removal on hyperspectral coastal vegetation classification using a fuzzy learning vector quantizer[J].IEEE Transactions on Geoscience and Remote Sensing,2007,45(6):1857-1869.
[14] YOUNGENTOB K N,ROBERTS D A,HELD A A,et al.Mapping two Eucalyptus subgenera using multiple endmember spectral mixture analysis and continuum-removed imaging spectrometry data[J].Remote Sensing of Environment,2011,115(5):1115-1128.