徐文斌,林寧,盧文虎,岳昂
(1.國家海洋信息中心 天津 300171;2.天津師范大學 天津 300387)
隨著國家海島監(jiān)視監(jiān)測系統(tǒng)的不斷完善,其已積累了大量我國海島高精度航空影像資料。為深入挖掘影像所蘊含的海島信息,有必要深入開展影像分析歸類。本文利用2012年5月地面分辨率0.1 m的釣魚島航空遙感圖像作為數(shù)據(jù)源,基于最大似然法對釣魚島進行影像分類,旨在為海島航空監(jiān)視監(jiān)測數(shù)據(jù)的有效應(yīng)用進行探索。
遙感影像分類可分為監(jiān)督分類和非監(jiān)督分類,監(jiān)督分類依據(jù)遙感目視解譯、實地調(diào)查地物等先驗的類別知識對訓(xùn)練區(qū)樣本進行標簽化處理,非監(jiān)督分類則是對類別之間的空間屬性、光譜屬性、紋理特征進行對比分析。影像分類主要具有以下特征:
(1)光譜特征。相異地物在同一波段上灰度值不同,相近地物在同一波段上灰度值相似,相異地物在各個波段圖像上灰度的呈現(xiàn)規(guī)律不同,這就構(gòu)成了區(qū)分不同地物的物理依據(jù)。
(2)空間特征。距離、長度、面積等幾何學中的空間特征,可對單個像元進行有效描述,也可針對多個像元進行系統(tǒng)分析,方法較靈活(黎展榮等,2010)。
(3)紋理特征。影像中灰度的反差在一定的面域中體現(xiàn)出周期變化性特征,例如密集的林地在影像中看起來具有粗糙紋理,而平靜的水面看起來具有平滑紋理。
基于影像監(jiān)督分類,在采集訓(xùn)練區(qū)樣本時,各類地物樣本之間應(yīng)保證同質(zhì)性,同時也需要具備一定的反差變化范圍,從而確保樣本能反映出地物解譯特征。因此在實際應(yīng)用中,就需要選擇不止一個訓(xùn)練區(qū),如果類別方差較大則很難選擇正確的訓(xùn)練區(qū)。在選擇同質(zhì)區(qū)域時,一個常見的問題是,稀疏的植被區(qū)可能被分到植被類別或土壤類別。解決這種問題的一種技術(shù)就是在建立最終類別特征之前從數(shù)據(jù)中清除這些異常的像元,保證信息準確。
在進行監(jiān)督分類前需采集樣本,即采集感興趣區(qū)域,而在使用最大似然法進行影像分類時,樣本的選取應(yīng)呈正態(tài)分布曲線,正態(tài)分布一般會取得比較理想的數(shù)學結(jié)果。本文采用影像的頻率直方圖來檢驗樣本光譜特性是否服從正態(tài)分布,當樣本服從正態(tài)分布時,其頻率直方圖應(yīng)只存在一個波峰。
移民休閑制約因素包括:語言不通、在主流人群中感到不自在、工作疲勞、沒時間、不熟悉遷入國的生活方式以及社會隔離、歧視等[57-58]。學者[57-58]用文化同化理論解釋移民休閑制約的變化模式。Stodolska M[57]研究新遷入加拿大埃德蒙頓的波蘭移民制約因素,將制約因素分為靜態(tài)因素和動態(tài)因素2種:一些因素如歧視、缺乏獲取資源的途徑、文化差異顯示出靜態(tài)特征;另一些制約因素會隨著同化程度的加深而減弱直至消失,如語言問題、不熟悉新環(huán)境等。
最大似然分類是在兩類或者多類判決當中,用統(tǒng)計的方法根據(jù)最大似然比貝葉斯判決準則法來建立非線性判別函數(shù)集而進行分類的一種圖像分類方法,流程見圖1。
算法本身是通過假設(shè)遙感圖像的每個波段數(shù)據(jù)都為正態(tài)分布,每類地物數(shù)據(jù)在空間中構(gòu)成特定的點群,每一類的每一維數(shù)據(jù)都在自己的數(shù)軸上為正態(tài)分布。根據(jù)各類的已知數(shù)據(jù),可以構(gòu)造出各類的概率密度函數(shù)(概率分布函數(shù))。這種分類方法是基于貝葉斯準則的分類方法,是一種非線性分類,其錯誤概率最小,也是目前應(yīng)用較廣泛成熟的一種監(jiān)督分類方法(王增林 等,2010)。其判別函數(shù)為:
圖1 最大似然分類流程圖
式中,p(n|i)為類別i中具有特征向量n的像元概率;p(i)是類別i的先驗概率。通過假定地物光譜特征服從正態(tài)分布,上式貝葉斯判別準則可表示為:
通過取對數(shù)的形式,并去掉多余項,得出類別i的K維最大似然辨析函數(shù):
計算不同類別的最大似然辨析函數(shù),對于不同的地物類別i和j,如果有Mj(n)≤Mi(n),則將像元分配給類別i。
釣魚島是釣魚島及其附屬島嶼的主島,是中國的固有領(lǐng)土,位于東海,距離浙江省溫州市約356 km、福建省福州市約385 km、臺灣省基隆市約190 km、臺灣省彭佳嶼約140 km(圖2)。釣魚島面積約3.91 km2,最高點約362 m,地勢北部較平坦,東南側(cè)山巖陡峭,東側(cè)巖礁頗似尖塔,中央山脈橫貫東西。釣魚島盛產(chǎn)山茶、棕櫚、仙人掌、海芙蓉及珍貴中藥材,棲息著大批海鳥,有“花鳥島”的美稱。釣魚島附近海域魚類資源豐富,是中國漁民的傳統(tǒng)漁場,此外還擁有豐富的石油和天然氣資源。
本次研究使用的航空影像數(shù)據(jù)(圖3)圖像清晰逼真,此時植物處于生長旺盛階段,山茶花覆蓋面積較大,隨處可見。
圖2 釣魚島及其附屬島嶼位置示意圖
圖3 釣魚島航空遙感圖像
最大似然分類算法是將樣本區(qū)像元的統(tǒng)計特征值作為類別的統(tǒng)計特征值來構(gòu)建類別的判別函數(shù),所以樣本區(qū)選擇是否科學合理直接關(guān)系到判別函數(shù)的正確性和最后分類的精度。選擇樣本區(qū)一般采用人工選定或利用種子像元區(qū)域增長來獲得。訓(xùn)練數(shù)據(jù)必須具有代表性、完整性和分散性。為了確保樣本選擇的準確,由若干名遙感解譯工作人員依據(jù)先驗知識和基礎(chǔ)數(shù)據(jù)對航空影像進行人工目視解譯和樣本選擇,并將釣魚島地物類型分為巖礁石、裸地、樹木、山茶花、水體五類(表1),顯示樣本區(qū)直方圖基本屬于正態(tài)分布。在ENVI軟件處理圖像時,對樣本區(qū)進行分類統(tǒng)計分析,剔除樣本區(qū)分離度較大的樣本像元,合并相似分類類型,確保樣本之間的可分離系數(shù)達到1.9以上,實現(xiàn)最優(yōu)方案。
根據(jù)樣本篩選,在ENVI軟件中執(zhí)行最大似然分類算法,得出釣魚島分類結(jié)果圖像(圖4)。
本文從生產(chǎn)精度、用戶精度、總精度和Kappa系數(shù)四個類別對釣魚島裸地、巖灘、樹木、山茶花和水體5種地物進行精度評價。
表1 釣魚島區(qū)域圖像解譯特征
圖4 釣魚島分類圖
生產(chǎn)精度指分類器將整個圖像的像元正確分為A類的像元數(shù)(對角線值)與A類真實參考總數(shù)(混淆矩陣中A類列的總和)的比。用戶精度指正確分到A類的像元總數(shù)(對角線值)與分類器將整個圖像的像元分為A類的像元總數(shù)(混淆矩陣中A類行的總和)的比??偩葹檎_分類的像元總和除以總像元數(shù)。
Kappa系數(shù)則是通過把所有真實參考的像元總數(shù)(N)乘以混淆矩陣對角線(xkk)的和,減去某一類中真實參考像元數(shù)與該類中被分類像元總數(shù)之積后,再除以像元總數(shù)的平方減去某一類中真實參考像元總數(shù)與該類中被分類像元總數(shù)之積對所有類別求和的結(jié)果。Kappa計算公式為:
根據(jù)歷年同時段遙感影像及專家目視解譯信息建立驗證樣本并建立混淆矩陣,在ENVI軟件中運算得出分類精度(表2)。
信息源分類后處理是遙感影像分類的重要部分,減少噪聲和精度保持兩個相互沖突的目的是所有研究者都面臨的難題。隨著分辨率的提高,傳感器對噪聲變得更加敏感,遙感影像采集傳輸過程中產(chǎn)生的復(fù)雜噪聲等加大了去噪處理難度,對影像去噪的方法提出了更高的要求。
表2 釣魚島分類精度
由于釣魚島分類圖像元尺寸的界定,圖像上完全意義的地物像元較少,大部分為混合像元?;旌舷裨袃煞N形式,一種是圖斑邊界處形成混合像元,另一種是小圖斑以分散的方式位于背景地物之中。前者可以通過邊緣檢測等手段進行很好地識別提取,后者則需要一種盡可能不影響分類效果的去噪方式進行分類后處理。為了較好地反演圖像地貌,本文采用主次要分析去噪法對分類圖進行分類后處理。
對3×3的卷積核進行主次要分析運算,將9個像元內(nèi)最中間像元的地物類型歸為9個像元中地物類型概率最大的像元,從而在盡可能不影響圖像分類效果的情況下,達到去噪目的。
經(jīng)過反復(fù)實驗分析,過大的濾波會產(chǎn)生模糊,過小則濾波效應(yīng)有限。最終選定利用3×3的卷積核為一個運算體進行主次要分析運算能較好去除噪聲,按照3×3卷積核模型(圖5),x為中間像元,以9個像元為一個運算體進行運算。
按此方法,則可提高分類精度(圖6、表3)。
圖5 3×3卷積核模型
結(jié)果表明:
圖6 局部區(qū)域主次要分析去噪法對比圖
表3 去噪后分類精度
(1)該島生態(tài)環(huán)境較好,植被面積約2.70 km2,覆蓋率達69%。環(huán)島四周有大量巖灘,巖灘高程值較低,地勢平坦,坡度較緩,巖灘面積約0.27 km2,約占總面積的7%。近海岸線地區(qū)和植被間隙存在大片裸地,受地形地勢影響,裸地以巖石為主,道路為輔,主島東部區(qū)域巖石較多,分布均勻,西部裸地則以近海岸道路為主,裸地面積約0.94 km2,約占總面積約24%。影像拍攝正值山茶花開花時節(jié),島上山茶花覆蓋區(qū)域明顯,范圍較廣。
(2)裸地雖然解譯特征較明顯,但在近海岸區(qū)域和巖灘界限不易區(qū)分,受季節(jié)影響,島上植被過于茂密,遮擋部分裸地區(qū)域,影響裸地分類精度;近海岸岸邊附近巖灘和水體相連,二者解譯特征區(qū)分顯著,故分類精度較高;樹木解譯特征明顯,形狀呈區(qū)域連片,樹木相對同一區(qū)域地物長勢較高,對同一區(qū)域地物表面有效覆蓋,故分類精度較高;山茶花像素范圍較小,花瓣呈粉色,花蕊呈灰白色,受到混合像元的影響較大,區(qū)分不易,精度偏低。
(3)基于最大似然分類法得出釣魚島分類圖像總精度達82.61%,由于受到同譜異物和同物異譜影響,難免影響分類精度,但總體上較好地鑒別出島嶼地物的基本類型,達到了預(yù)期效果。經(jīng)過主次要分析去噪法處理后,表2和表3對比得出,遙感分類總精度提高2.1個百分點,裸地、巖灘、樹木、水體等分類精度提高約1-2個百分點,去噪效果較為明顯,山茶花去噪效果較突出,區(qū)域明顯閉合成面圖層,噪聲減少,分類精度提升約5個百分點,達到了較好的去噪效果。
本文總結(jié)了利用最大似然分類算法進行海島監(jiān)視監(jiān)測信息提取時影響圖像分類精度的主要環(huán)節(jié)。這些環(huán)節(jié)包括地物類型的先驗識別、樣本區(qū)選擇、分類后處理的改進等?;趯Ω鳝h(huán)節(jié)進行深入流程化分析,有效地提高了海島監(jiān)視監(jiān)測信息提取的精度。為今后研究不同時段釣魚島區(qū)域動態(tài)監(jiān)測提供依據(jù),同時依托最大似然分類算法提供了一整套海島影像計算機智能化分類的流程方法,從而減少了目視解譯的工作量,提高了工作效率。
RichardJ,AspinallW,AndrewMarcus,etal, 2002.Considerations in collecting,processing,and analysing high spatial resolution hyperspectral data for environmental investigations.J Geograph Syst,(4):15-29.
Robert A.Schowengerdt,2010.Models and Methods for Image Processing.
陳敬柱,賀瑞霞,郭恒亮,2004.最大似然法在植被信息識別提取中的應(yīng)用.水文地質(zhì)工程地質(zhì),31(2):94-96.
黎展榮,陳朝暉,黃國強,2010.高分辨率遙感影像自動分類方法研究.廣西師范學院學報:自然科學版,27(2):71-75.
李慶亭,張連蓬,楊鋒杰,2005.高光譜遙感圖像最大似然分類問題及解決方法.山東科技大學學報:自然科學版,24(3):61-64.
王增林,朱大明,2010.基于遙感影像的最大似然分類算法的探討.河南科學,28(11):1458-1461.
胥兵,2008.遙感影像土地分類結(jié)果的矢量化研究.遙感信息,(4):81-85.
張倩,黃昕,張良培,2012.高分辨率遙感影像的全變分分割模型.測繪科學,37(5):81-83.