馬 毅, 張 杰, 任廣波, 崔廷偉
(國(guó)家海洋局 第一海洋研究所, 山東 青島 266061)
在遙感影像分類應(yīng)用中, 不同分類器的分類精度各異, 同一分類器對(duì)不同地物的分類精度也不一樣。決策級(jí)數(shù)據(jù)融合就是應(yīng)用各種分類器之間的互補(bǔ)性, 通過融合策略發(fā)揮不同分類器的優(yōu)勢(shì), 使最終的分類精度得到提高。高光譜圖像數(shù)據(jù)具有圖譜合一的特點(diǎn), 可以提供豐富的光譜及其導(dǎo)出信息,然而對(duì)于多種地物的分類問題, 受地物特征混疊以及相鄰波段間相關(guān)性高的限制, 使得單一分類器往往得不到滿意的分類結(jié)果。
決策級(jí)數(shù)據(jù)融合源于模式識(shí)別領(lǐng)域[1-4], 近年來已成功地應(yīng)用于遙感分類研究中, 常見的融合策略包括簡(jiǎn)單投票法[5-8]、加權(quán)投票法[9]、模糊隸屬度法[10-11]、最大概率類別法[12]和 Adaboost算法[13-14]等。然而,基于決策級(jí)數(shù)據(jù)融合分類研究多集中于多光譜遙感圖像, 針對(duì)高光譜遙感圖像的成果較少[15-18], 且研究工作主要側(cè)重探討簡(jiǎn)單投票法和加權(quán)投票法融合策略的分類效果。這種情況產(chǎn)生的主要原因是高光譜遙感一般是通過挖掘光譜及其導(dǎo)出特征來提高分類精度, 對(duì)綜合多分類器優(yōu)勢(shì)的決策級(jí)融合分類方法關(guān)注不夠。事實(shí)上, 決策級(jí)數(shù)據(jù)融合是在目前已有單分類器資源的前提下, 提升高光譜圖像數(shù)據(jù)分類精度的一種重要手段。
將單分類器進(jìn)行有效組合, 根據(jù)不同分類器的優(yōu)缺點(diǎn), 進(jìn)行取長(zhǎng)補(bǔ)短, 即決策融合策略的設(shè)計(jì)是研究多分類器組合的關(guān)鍵。作者選取 8種常用的遙感圖像監(jiān)督分類方法, 綜合利用多數(shù)投票與先驗(yàn)識(shí)別概率信息, 設(shè)計(jì)多種決策級(jí)融合策略, 在應(yīng)用地物豐富的黃河口濕地CHRIS高光譜圖像數(shù)據(jù)進(jìn)行分類實(shí)驗(yàn)的基礎(chǔ)上, 開展不同融合策略決策分類結(jié)果的比較研究, 分析融合策略對(duì)高光譜圖像總體分類精度以及不同地物分類精度的影響。
CHRIS(Compact High Resolution Imaging Spectrometer)是搭載于歐洲空間局(European Space Agency, ESA)小衛(wèi)星PROBA上的遙感器, 全稱為緊湊式高分辨率成像光譜儀, 具有5種成像模式(表1),可獲取 0°、+36°、-36°、+55°和-55°等 5 種角度的高光譜圖像。作者應(yīng)用的實(shí)驗(yàn)數(shù)據(jù)是2012年6月獲取的黃河口濱海濕地CHRIS工作模式2的0°圖像,假彩色合成圖像見圖1, 其共有 18個(gè)波段, 光譜為406~1035 nm, 波段寬度從10.8 nm到44.1 nm不等,地面空間分辨率17 m。采用ESA提供的HDFclean軟件去除 CHRIS影像的噪聲, 包括缺失像元填充、條帶噪聲去除。
表1 CHRIS傳感器成像參數(shù)Tab.1 Imaging parameters of CHRIS
CHRIS圖像覆蓋區(qū)域位于黃河入??谛吕先牒搅髑灏算夂颓逅疁系慕唤缣?。該區(qū)域分布有天然濕地和人工濕地, 其中天然濕地包括蘆葦、堿蓬、檉柳、海水、河流和灘涂等類型, 人工濕地包括養(yǎng)殖水面、水庫(kù)和坑塘等。為了準(zhǔn)確評(píng)價(jià)CHRIS圖像地物分類精度, 需要得到圖像覆蓋區(qū)域的地物解譯圖。為此, 利用2012年秋季、2013年春季和秋季3次現(xiàn)場(chǎng)踏勘資料, 采用典型樣區(qū)和路線記錄的方法采集現(xiàn)場(chǎng)地物類型, 應(yīng)用人機(jī)交互解譯, 生成 CHRIS圖像覆蓋區(qū)域的地物解譯結(jié)果, 地物解譯圖見圖2。
圖1 CHRIS圖像Fig.1 CHRIS image
圖2 結(jié)合現(xiàn)場(chǎng)踏勘的地物解譯結(jié)果Fig.2 Object interpretation map combined with field survey
作者選用了8種常用的遙感圖像監(jiān)督分類算法:最大似然(ML)、最小距離(MD)、馬氏距離(Mad)、光譜角度(SAM)、光譜信息散度(SID)、二進(jìn)制編碼(BE)、神經(jīng)網(wǎng)絡(luò)(ANN)和支持向量機(jī)(SVM), 上述算法的分類結(jié)果作為決策級(jí)數(shù)據(jù)融合的輸入。作者綜合利用分類器分類結(jié)果多數(shù)投票與先驗(yàn)分類概率信息, 給出如下4個(gè)原則來綜合各分類器的優(yōu)勢(shì): (1)全體投票通過的原則, 即所有算法分類結(jié)果一致時(shí),采用共識(shí)的結(jié)果; (2)加權(quán)投票通過的原則, 即總體分類精度(OA)最高和次高的算法結(jié)果一致時(shí), 采用共識(shí)的結(jié)果; (3)減少錯(cuò)分和漏分的原則, 即選用生產(chǎn)者精度(PA)、用戶精度(UA)或者PA+UA最高的結(jié)果; (4)利用先驗(yàn)識(shí)別概率知識(shí)的原則, 采用總體分類精度、PA、UA或PA+UA最高的分類器結(jié)果。通過上述原則的級(jí)聯(lián)組合, 設(shè)計(jì)了如下 3組決策融合策略。
策略1: 所有的算法分類結(jié)果一致的, 采用共識(shí)的結(jié)果; 分類結(jié)果不一致, 選用地物分類精度(PA、UA或PA+UA)最高的, 空穴和縫隙采用OA最高的。
假設(shè)Ci是第i個(gè)分類算法在遙感影像上某一像素的類別,C是決策融合分類結(jié)果, 其中f=PA、UA或 PA+UA,gi是第i個(gè)分類算法的 OA, 于是策略 1的融合規(guī)則可表達(dá)為:
(1) 若C1=C2=C3=C4=C5=C6=C7=C8, 則C=C1
(2) 若f(Ck)=max(f(Ci)),i=1, 2,···, 8, 則C=Ck
(3) 若gk=max(gi),i=1, 2,···, 8, 則C=Ck
策略2: 最優(yōu)和次優(yōu)的算法分類結(jié)果一致的, 采用共識(shí); 分類結(jié)果不一致, 選用地物分類精度(PA、UA或PA+UA)最高的, 空穴和縫隙采用OA最高的。融合規(guī)則可表達(dá)為:
(1) 若C1=C2, 則C=C1
(2) 若f(Ck)=max(f(Ci)),i=1, 2,···, 8, 則C=Ck
(3) 若gk=max(gi),i=1, 2,···, 8, 則C=Ck
策略3: 最優(yōu)和次優(yōu)的算法分類結(jié)果一致的, 采用共識(shí); 分類結(jié)果不一致, 在保持一定 UA的前提下,選用地物分類精度(PA、UA或PA+UA)最高的, 空穴和縫隙采用OA最高的。融合規(guī)則可表達(dá)為:
(1) 若C1=C2, 則C=C1
(2) 若 UA(Ck)>m且f(Ck)=max(f(Ci)),i=1, 2,···,8, 則C=Ck
(3) 若gk=max(gi),i=1, 2,···, 8, 則C=Ck
需要指出的是, 上述f有PA、UA和PA+UA共3種選項(xiàng), 即每組策略對(duì)應(yīng)有3種決策級(jí)融合算法。
8種監(jiān)督分類算法的分類結(jié)果和分類采用的訓(xùn)練區(qū)如圖3, 分類精度如表2和表3所示。8種分類器 OA和 Kappa系數(shù)(KC)參差不齊, 以 ML、SVM和ANN為高, Mad和BE居中, MD、SAM和SID表現(xiàn)較差; 同一分類器對(duì)不同類別分類精度存在較大差異, 如ANN的PA以蘆葦最高、堿蓬最低; 8種分類器對(duì)同一類別分類精度具有差異性, 如灘涂的 PA差異達(dá)45個(gè)百分點(diǎn); 上述差異性帶來的互補(bǔ)性是決策級(jí)融合數(shù)據(jù)的重要基礎(chǔ)。3組決策融合策略的分類結(jié)果如圖4、圖5和圖6所示, 分類精度見表4和表5??傮w來看, 3組策略的分類結(jié)果有如下表現(xiàn): (1)3組策略的OA和KC都有提高; (2)策略3分類表現(xiàn)最好,即維持最小虛警率的前提下降低錯(cuò)分可以提高分類精度; (3)每組策略中PA+UA算法的分類表現(xiàn)最好, 即綜合考慮生產(chǎn)者精度和用戶精度時(shí)分類精度最高; (4)部分地物目標(biāo)的分類精度有提高, 且較單一分類器消除了碎斑, 即減少了不同地物相鄰處的混分情況。
圖3 監(jiān)督分類算法的分類結(jié)果和分類ROIFig.3 Classification results and ROI of supervised classification algorithms
表2 監(jiān)督分類算法的PA和OATab.2 PA and OA of the supervised classification algorithms
表3 監(jiān)督分類算法的UA和KCTab.3 UA and KC of the supervised classification algorithms
圖4 策略1的分類結(jié)果Fig.4 Classification results of strategy I
圖5 策略2的分類結(jié)果Fig.5 Classification results of strategy II
圖6 策略3的分類結(jié)果Fig.6 Classification results of strategy III
表4 決策融合與ML的OA和KC比較Tab.4 OA and KC comparison between decision-level data fusion algorithm and ML
表5 3組決策融合分類策略中表現(xiàn)最佳算法的PA和UATab.5 PA and UA of optimal algorithm in three decision-level data fusion classification strategy
策略 1三種算法中, 綜合考慮生產(chǎn)者精度和用戶精度的算法最優(yōu), 其OA和KC較8種單分類器均有提升, OA達(dá)到86.41%, 較單分類器的提升幅度為1.3%~28.8%, Kappa系數(shù)為 0.80, 提升了 0.03~0.31;與8種單分類器中表現(xiàn)最優(yōu)的ML相比, 策略1采用PA+UA的融合分類結(jié)果部分消除了分類結(jié)果的碎斑,尤其是蘆葦和灘涂以及水體和灘涂的交界處, 如圖7; 但是對(duì)于堿蓬地物, 在沒有提升PA的情形下UA有明顯下降。
策略2三種算法的表現(xiàn)與策略1相似, 除策略2采用UA算法的OA和KC略有提升外, 其他的表現(xiàn)與策略1相同。
策略3三種算法的OA分別為88.13%、87.37%和88.81%, KC分別為0.80、0.81和0.82, 其中綜合考慮 PA和 UA的算法最優(yōu), OA提升幅度達(dá)3.7%~31.2%; 同時(shí), 策略 3的算法也消除了圖像的碎斑, 尤其是蘆葦和灘涂以及水體和灘涂的交界處。對(duì)于策略3中表現(xiàn)最優(yōu)的算法, 與ML相比, 蘆葦、灘涂保持了很高的精度, PA和UA都優(yōu)于85%; 水體在保持較高 UA的情形下 PA有大幅提升, 增加了11%; 河道在PA增加的情況下, UA有下降; 堿蓬和檉柳的分類精度變化不大, 克服了策略1和策略2的算法結(jié)果堿蓬UA有明顯下降的問題。因此, 該算法不僅增加或保持了較高的精度, 且做到了地物分類性能的均衡。
圖7 決策融合算法消除了邊界處的碎斑Fig.7 Breaking speckle removed by decision-level data fusion algorithm
作者選取8種常用的遙感圖像監(jiān)督分類方法——最大似然、最小距離、馬氏距離、光譜角度、光譜信息散度、二進(jìn)制編碼、神經(jīng)網(wǎng)絡(luò)和支持向量機(jī), 綜合利用多數(shù)投票與先驗(yàn)分類概率信息, 設(shè)計(jì)了 3組決策級(jí)融合分類策略, 在應(yīng)用地物豐富的黃河口濕地 CHRIS高光譜圖像數(shù)據(jù)進(jìn)行分類實(shí)驗(yàn)的基礎(chǔ)上,開展了不同融合策略決策分類結(jié)果的比較研究, 分析了融合策略對(duì)高光譜圖像總體分類精度以及不同地物分類精度的影響。主要結(jié)論如下: (1)3組決策融合策略總體分類精度大于85%, Kappa系數(shù)大于0.77,較單分類器均有提高, 表明決策融合是利用已有分類器資源、提高高光譜圖像分類精度的一種途徑;(2)策略 3的分類表現(xiàn)最好, 即維持最小虛警率的前提下降低錯(cuò)分可以提高分類精度, 蘆葦、灘涂地物同時(shí)保持了很高的生產(chǎn)者精度和用戶精度, 均接近90%, 且水體在保持較高用戶精度的情形下生產(chǎn)者精度有大幅提升, 增幅達(dá)11%; (3)每組策略綜合考慮生產(chǎn)者精度和用戶精度的情形下分類精度最高, 較僅考慮生產(chǎn)者精度或用戶精度的情形提升了 1~2個(gè)百分點(diǎn), 表明設(shè)計(jì)算法時(shí)應(yīng)同時(shí)考慮減少錯(cuò)分和漏分的情況。
需要指出的是, 上述決策融合算法對(duì)于堿蓬和檉柳地物的分類精度沒有提升, 這與兩種地物生長(zhǎng)稀疏, 混合像元導(dǎo)致光譜特征不明顯相關(guān), 使得所有單分類器的分類精度都不高。另外, 決策級(jí)數(shù)據(jù)融合分類的精度與分類樣本的選擇、單分類器的選擇以及單分類器的分類能力等密切相關(guān), 而這些又與從事分類工作的專家知識(shí)以及所選圖像和區(qū)域關(guān)聯(lián)。
致謝: 感謝ESA提供CHRIS高光譜影像數(shù)據(jù)。
[1]Xu L, Krzyzak A, Suen C Y.Methods of combining multiple classifiers and their applications to handwriting recognition[J].IEEE Transaction on Systems, Man,Cybernetics, 1992, 22(3): 418-435.
[2]Freund Y.Boosting a weak learning algorithm by majority[J].Information and Computation, 1995,121(2): 256-285.
[3]Breiman L.Bagging predictor[J].Machine Learning,1996, 24(2): 123-140.
[4]Kittler J, Hatef M, Duin R, et al.On combining classifiers[J].IEEE Trans On Pattern Analysis and Machine Intelligence, 1998, 20 (3): 226-239.
[5]Lin X F, Yacou B, Sherif B J, et al.Performance analysis of pattern classifier combination by plurality voting[J].Pattern Recognition Letter, 2003, 24(12):1959-1969.
[6]柏延臣, 王勁峰.結(jié)合多分類器的遙感數(shù)據(jù)專題分類方法研究[J].遙感學(xué)報(bào), 2005, 9(5): 554-563.
[7]張秀英, 馮學(xué)智, 劉偉.基于多分類器結(jié)合的IKONOS影像城市植被類型識(shí)別[J].東南大學(xué)學(xué)報(bào)(自然科學(xué)版), 2007, 37(3): 399-403.
[8]張丹, 楊斌, 張瑞禹.多種分類器融合的遙感影像分類[J].遙感信息, 2009, 5: 41-43.
[9]孫灝, 杜培軍, 趙衛(wèi)常.基于多分類器組合的高分辨率遙感影像目標(biāo)識(shí)別[J].地理與地理信息科學(xué), 2009,25(1): 33-35.
[10]賈永紅, 李德仁.多源遙感影像像素級(jí)融合分類與決策級(jí)分類融合法的研究[J].武漢大學(xué)學(xué)報(bào)(信息科學(xué)版), 2001, 26(5): 431-434.
[11]Fauvel M, Chanussot J, Benediktsson J A.Decision fusion for the classification of urban remote sensing images[J].IEEE Transactions on Geoscience and Remote Sensing, 2006, 44(10): 2828-2838.
[12]彭正林, 毛先成, 劉文毅, 等.基于多分類器組合的遙感影像分類方法研究[J].國(guó)土資源遙感, 2011, 2:19-25.
[13]Briem G J, Benediktsson J A, Sveinsson J R.Boosting,bagging, and consensus based classification of multisource remote sensing data[C]//The Second International Workshop on Multiple Classifier Systems, Cambridge,2001.
[14]許凱, 秦昆, 杜鹢.利用決策級(jí)融合進(jìn)行遙感影像分類[J].武漢大學(xué)學(xué)報(bào)(信息科學(xué)版), 2009, 34(7):826-829.
[15]宮大鵬, 李之歆, 韓建峰, 楊哲海, 張雅爭(zhēng).高光譜影像分類及組合分類器的應(yīng)用[J].海洋測(cè)繪, 2006,26(5): 20-23.
[16]Licciardi G, Pacifici F, Tuia D, et al.Decision fusion for the classification of hyperspectral data: Outcome of the 2008 GRS-S data fusion contest[J].IEEE Transactions on Geoscience and Remote Sensing, 2009,47(11): 3857-3865.
[17]Hemanth R K, Lori M B.Decision-Level fusion of spectral reflectance and derivative information for robust hyperspectral land cover classification[J].IEEE Transactions on Geoscience and Remote Sensing, 2010,48(11): 4047-4058.
[18]He Y, Qian D, Ben M.Decision fusion on supervised and unsupervised classifiers for hyperspectral imagery[J].IEEE Transactions on Geoscience and Remote Sensing Letters, 2010, 7(4): 875-879.