張波,胡亞東,洪津
(1 中國科學(xué)院合肥物質(zhì)科學(xué)研究院安徽光學(xué)精密機(jī)械研究所,中國科學(xué)院通用光學(xué)定標(biāo)與表征技術(shù)重點(diǎn)實(shí)驗(yàn)室,安徽 合肥 230031;2 中國科學(xué)技術(shù)大學(xué), 安徽 合肥 230026)
地表上空覆蓋的云在遙感衛(wèi)星對地觀測時(shí)會(huì)對地物造成遮擋,導(dǎo)致遙感圖像上的地物信息在不同程度上缺失,影響了遙感圖像的處理與應(yīng)用。準(zhǔn)確地實(shí)現(xiàn)遙感圖像的云檢測是遙感圖像后續(xù)應(yīng)用的前提和基礎(chǔ),意義重大。但由于云的種類繁多且云檢測的地物背景復(fù)雜,導(dǎo)致云檢測過程中容易出現(xiàn)誤判、漏判等情況。減小云和地物在遙感圖像中容易相互混淆的部分對云檢測結(jié)果的負(fù)面影響,提高檢測準(zhǔn)確率是遙感圖像云檢測方向研究的重點(diǎn)及難點(diǎn)之一。
目前,研究人員在遙感圖像的云檢測方面做了大量的研究工作,提出了多種各具特色的云檢測方法,這些云檢測方法可歸類為光譜閾值法、空間紋理法、模式識(shí)別法及綜合優(yōu)化法[1]。光譜閾值法是利用云和地物在不同波段的光譜特征差異,通過設(shè)置閾值來實(shí)現(xiàn)云檢測。為了提升云檢測的準(zhǔn)確率,光譜閾值法常采用多波段閾值組合或者借助地表反射率集等先驗(yàn)知識(shí)來進(jìn)行云檢測[2]。但一些高分辨率衛(wèi)星可用于云檢測的波段有限,這類遙感圖像可用于云檢測的光譜信息相對較少,同時(shí)在空間分辨率上也與常用的地表反射率數(shù)據(jù)集差距明顯,所以普通的光譜閾值法在這類遙感圖像上直接運(yùn)用往往效果不佳??臻g紋理法是依據(jù)云和地物在遙感圖像上的紋理特征差異,利用統(tǒng)計(jì)學(xué)的方法提取遙感圖像的紋理特征和空間特征來實(shí)現(xiàn)云的檢測與識(shí)別。隨著遙感圖像空間分辨率的提高,空間紋理法獲得了越來越多的應(yīng)用,但部分云和地物在遙感圖像上的紋理特征相似,只使用紋理特征法進(jìn)行云檢測時(shí)難以區(qū)分這些容易相互混淆的云和地物,紋理特征法通常和其他方法共同使用來提升云檢測的準(zhǔn)確率[3]。隨著計(jì)算機(jī)技術(shù)的發(fā)展,各種模式識(shí)別類的方法被引入到遙感圖像云檢測的研究中并取得了良好的效果,為了保證云檢測的準(zhǔn)確率,模式識(shí)別類的云檢測方法在實(shí)驗(yàn)樣本的選擇、特征的選擇與提取、分類器的設(shè)計(jì)與訓(xùn)練等方面提出了很高的要求[4,5]。綜合優(yōu)化法綜合利用光譜閾值法、紋理特征法、模式識(shí)別法等方法各自的優(yōu)點(diǎn)來實(shí)現(xiàn)云檢測,往往能取得較好的效果。
云的形態(tài)各異,依據(jù)不同的分類標(biāo)準(zhǔn)會(huì)產(chǎn)生不同的分類結(jié)果。在學(xué)術(shù)交流和工程應(yīng)用中經(jīng)常會(huì)將云分為厚云、薄云兩類。但厚云、薄云本身并沒有明確且嚴(yán)謹(jǐn)?shù)亩x,實(shí)際應(yīng)用中一般將完全遮擋地物目標(biāo)、嚴(yán)重影響地物判讀的云稱為厚云,而將沒有完全遮擋地物目標(biāo),對地物場景判讀影響有限的云稱為薄云[6]。各種云檢測方法在對厚云的檢測上大多能取得良好的效果,但云和地物中都存在著一些在遙感圖像上容易相互混淆的部分,導(dǎo)致實(shí)際的云檢測過程中會(huì)出現(xiàn)誤判和漏判。其中被誤判為云的地物主要是冰雪、裸地、高亮建筑物等似云地物,被漏判的云主要是包括厚云邊緣過渡部分在內(nèi)的各種薄云。薄云對地物并沒有形成完全的遮擋,可以通過技術(shù)手段實(shí)現(xiàn)被遮擋的地物信息在一定程度上恢復(fù),因此一些遙感圖像應(yīng)用場合會(huì)對遙感圖像中的厚云、薄云區(qū)別處理,通過各種方法恢復(fù)被薄云遮擋部分的地物信息,從而提高遙感圖像的利用率[7]。
本文設(shè)計(jì)了一種基于多特征融合的層次支持向量機(jī)云檢測算法。算法綜合利用云和地物在遙感圖像上的灰度、紋理、頻率特征的差異,分兩層設(shè)計(jì)了三個(gè)有針對性的分類器,對云檢測過程容易相互混淆的部分增加有針對性的檢測環(huán)節(jié),實(shí)現(xiàn)了厚云、薄云、地物之間的區(qū)分,從而提升了云檢測的準(zhǔn)確率。另外,將云在檢測結(jié)果上分為厚云、薄云兩部分給遙感圖像的后續(xù)應(yīng)用提供了更多的參考信息。
云在自然界中通常以不規(guī)則的幾何形狀聚合出現(xiàn),在遙感圖像特別是在高分辨率遙感圖像上表現(xiàn)為閉合的連通區(qū)域,極少以孤立的像素點(diǎn)形式出現(xiàn)。因此,以像素塊為單位進(jìn)行云檢測相較于以像素點(diǎn)為單位進(jìn)行云檢測可以更好地利用云這一形狀特征,提升云檢測的效率,同時(shí)以像素塊為單位進(jìn)行云檢測還可以消除單個(gè)像素點(diǎn)噪聲對云檢測結(jié)果的影響。
超像素分割是利用被分割圖像中臨近像素點(diǎn)在紋理、顏色、亮度等特征上的相似性進(jìn)行聚類,將原圖分割成數(shù)個(gè)形狀和面積各不相同的像素塊的圖像分割方法。由于云的幾何形狀不規(guī)則,在云檢測過程中采用超像素分割的方法相較于將遙感圖像規(guī)則分割的方法更能充分利用云和地物的形狀特征。簡單線性迭代聚類算法(Simple linear iterative clustering,SLIC)是Achnta 等[8]提出的一種經(jīng)典的超像素分割方法。SLIC算法首先將RGB 圖像轉(zhuǎn)換為CIELAB 顏色空間和XY 坐標(biāo)下的5 維特征向量,然后再對這5 維特征向量構(gòu)造度量標(biāo)準(zhǔn),并對圖像像素進(jìn)行局部聚類實(shí)現(xiàn)生成超像素。相較于其他超像素分割算法,SLIC 算法在運(yùn)算速度、物體輪廓保持等方面優(yōu)勢明顯[8,9]。更重要的是,SLIC 算法可以結(jié)合實(shí)際需求控制生成超像素的個(gè)數(shù)及超像素塊的大小規(guī)模,相較于其他超像素分割算法,以SLIC 算法分割形成的像素塊為云檢測單位可以更好地實(shí)現(xiàn)小面積云塊的檢測。因此選擇SLIC 算法對遙感圖像進(jìn)行超像素分割,并以分割后形成的像素塊為單位進(jìn)行云檢測。
各種云檢測方法都是利用云和地物在不同特征方面存在的差異來實(shí)現(xiàn)云和地物的區(qū)分,難點(diǎn)是部分云和地物在某些特征上十分相似導(dǎo)致在云檢測時(shí)容易產(chǎn)生混淆,采用單一特征進(jìn)行云檢測往往效果并不理想。采用多特征融合的方法進(jìn)行云檢測,綜合云和地物的灰度、紋理、頻率特征更容易實(shí)現(xiàn)云和地物的區(qū)分。
1.2.1 灰度特征選擇
云在可見光波段的反射率高,在可見光遙感圖像上表現(xiàn)為灰度值較高,呈現(xiàn)出白色和明亮的特點(diǎn),易與大部分地面物體區(qū)分。設(shè)計(jì)的云檢測算法選擇灰度均值、灰度方差作為云和地物區(qū)分的灰度特征。
1.2.2 紋理特征選擇
云的形態(tài)多種多樣,不同的云在紋理上會(huì)有一定的區(qū)別,但遙感圖像上的云相較于大部分地物具有紋理光滑的特點(diǎn)。設(shè)計(jì)的云檢測算法選擇灰度共生矩陣(Gray level co-occurrence matrix,GLCM)及局部二值模式特征(Local binary patterns,LBP)來描述遙感圖像的紋理特征。
灰度共生矩陣是一種通過研究灰度的空間相關(guān)特性來描述紋理的方法[10],設(shè)計(jì)的云檢測算法選取角二階矩(Angular second moment)、熵(Entropy)、對比度(Contrast)、相關(guān)性(Correlation)4 個(gè)常用的灰度共生矩陣的統(tǒng)計(jì)特征來描述遙感圖像的紋理特征,其計(jì)算公式分別為
式中: x、y 為灰度共生矩陣的第x 行、第y 列,P(x,y)為灰度共生矩陣中第x 行、第y 列的元素,μx、μy為均值,σx、σy為標(biāo)準(zhǔn)差。
LBP 特征是一種用來描述圖像局部紋理特征的算子,相較于整個(gè)像素層上進(jìn)行紋理分析的方法具有理論簡單、計(jì)算容易、灰度不變性和旋轉(zhuǎn)不變性等諸多優(yōu)勢[11],廣泛用于遙感圖像紋理特征的描述[12]。
1.2.3 頻率特征選擇
云和地物在遙感圖像的頻域上表現(xiàn)出不同的特性,遙感圖像中的云區(qū)域在頻域上主要分布在低頻部分,而地物區(qū)域主要集中在頻率較高的部分[13],小波變換可以實(shí)現(xiàn)遙感圖像時(shí)域到頻域的變換,在薄云檢測和地物信息恢復(fù)時(shí)能夠起到良好的效果[14]。設(shè)計(jì)的云檢測算法利用小波分解原理,將圖像分解為高頻和低頻分量,選取小波變換提取的低頻系數(shù)作為頻率特征。
支持向量機(jī)(Support vector machine,SVM)是基于統(tǒng)計(jì)學(xué)習(xí)理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理的機(jī)器學(xué)習(xí)方法,在解決小樣本、非線性及高維模式識(shí)別問題上效果顯著,已被廣泛應(yīng)用于遙感影像的云檢測中,并取得了良好的效果[15]。層次支持向量機(jī)(Hierarchical support vector machines,H-SVM)是將二叉樹分類的思想引入支持向量機(jī)分類器的設(shè)計(jì)中,采用二叉樹構(gòu)造支持向量機(jī)分類器,將分類對象分為兩個(gè)子類,再將每個(gè)子類進(jìn)一步分類,最終得到單獨(dú)的類別,具有邏輯清晰、容易實(shí)現(xiàn)、分類效率高的優(yōu)勢[16]。由于云和地物中都存在著一些在遙感圖像上容易相互混淆的部分,為了保證準(zhǔn)確率,普通支持向量機(jī)分類器在針對波段數(shù)有限的遙感圖像進(jìn)行云檢測時(shí)往往對樣本訓(xùn)練、特征提取、分類器設(shè)計(jì)要求很高,算法實(shí)現(xiàn)難度大的同時(shí)針對薄云、似云地物等的檢測效果并不理想。為了更準(zhǔn)確的區(qū)分出云和地物中容易相互混淆的部分,保證云檢測的準(zhǔn)確率,本文采用層次支持向量機(jī)對遙感圖像分兩層設(shè)計(jì)三個(gè)分類器進(jìn)行分類。由于是分層分類,第二層分類器可以對第一層分類的結(jié)果進(jìn)行有針對性的優(yōu)化,所以每個(gè)分類器面向的分類對象相對簡單,每個(gè)分類器的樣本訓(xùn)練及特征提取可以更加有針對性,這樣既降低了樣本選擇及分類器設(shè)計(jì)的難度,同時(shí)也提升了分類的準(zhǔn)確率。算法具體可分為以下5 個(gè)步驟:
1)遙感圖像分割。采用SLIC 算法對遙感圖像進(jìn)行超像素分割,對分割后的像素塊按式(5)進(jìn)行灰度化并保存,作為后續(xù)云檢測算法的基本單位。
2)第一層支持向量機(jī)分類。第一層分類器SVM1 主要實(shí)現(xiàn)云和地物的初步分離,選擇典型的厚云像素塊及地物像素塊作為訓(xùn)練樣本,提取灰度均值、灰度方差、LBP 特征對選擇的樣本進(jìn)行訓(xùn)練。用訓(xùn)練好的分類器對超像素分割后的遙感圖像以像素塊為單位進(jìn)行第一層分類,結(jié)果分為“云”、“地物”兩類。由于還要進(jìn)行第二層分類,所以對第一層分類的準(zhǔn)確度要求不高,這樣降低了樣本選擇及分類器設(shè)計(jì)的難度。第一層被分類為“云”的像素塊中含有被誤判為云的似云地物,“地物”中則含有被漏判的云。
3)第二層支持向量機(jī)分類。第二層分類器針對第一層的分類結(jié)果做進(jìn)一步分類。對第一層分類結(jié)果為“云”的像素塊設(shè)計(jì)一個(gè)針對云和似云地物的分類器SVM2。選擇厚云與城鎮(zhèn)、裸地、冰雪等典型的似云地物作為訓(xùn)練樣本,提取圖像的LBP 紋理、灰度共生矩陣對選擇的樣本進(jìn)行訓(xùn)練。用訓(xùn)練好的分類器對第一層分類結(jié)果為“云”的像素塊進(jìn)行分類,檢測出第一層分類被誤判為云的似云地物,結(jié)果分類為“厚云”、“似云地物”兩類。對于第一層分類結(jié)果為“地物”的像素塊設(shè)計(jì)一個(gè)針對普通地物與薄云的分類器SVM3,選擇薄云與普通地物作為訓(xùn)練樣本,提取圖像的灰度均值、小波頻率特征對選擇的樣本進(jìn)行訓(xùn)練。用訓(xùn)練好的分類器對第一層分類結(jié)果為“地物”的像素塊進(jìn)行分類,檢測出第一層分類中被漏判的云,主要為包括碎云及厚云邊緣過渡部分在內(nèi)的各種薄云,結(jié)果分類為“薄云”、“普通地物”。
4)將第二層分類結(jié)果中“似云地物”、“普通地物”的像素塊合并為“地物”,經(jīng)過層次支持向量機(jī)兩層分類后遙感圖像被分為“薄云”、“厚云”、“地物”三個(gè)部分。對分類結(jié)果進(jìn)行標(biāo)記,將被分類為“地物”的像素塊灰度值設(shè)為0,被分類為“薄云”的像素塊灰度值設(shè)為125、被分類為“厚云”像素塊灰度值設(shè)為255,形成初步的云掩膜圖。
5)對云掩膜的結(jié)果進(jìn)行圖形學(xué)的膨脹處理,可以消除云檢測結(jié)果中存在的孔洞部分,并使云檢測的邊緣更加自然,形成最終云檢測結(jié)果。
整個(gè)云檢測算法的流程框圖如下:
圖1 云檢測流程圖Fig.1 Flow chart of cloud detection
高分一號(hào)上搭載了4 臺(tái)寬視場多光譜相機(jī)(Wide field view sensor,WFV),WFV 影像包含藍(lán)(0.45~0.52μm)、綠(0.52~0.59μm)、紅(0.63~0.69μm)、近紅外(0.77~0.89μm)4 個(gè)波段,各波段的分辨率為16 m,數(shù)據(jù)的量化精度為10 bit。選取高分一號(hào)WFV 的RGB 波段合成圖像進(jìn)行試驗(yàn)來測試算法的有效性。由于遙感圖像的原圖數(shù)據(jù)量過大,縮略顯示后難以看清云檢測算法對于薄云、碎云、云區(qū)邊緣、各種地物的檢測細(xì)節(jié),為了便于更直觀的評(píng)估云檢測算法的效果,截取遙感原圖中500 pixel×500 pixel 的子圖進(jìn)行實(shí)驗(yàn)并展示云檢測算法的結(jié)果。實(shí)驗(yàn)選取的遙感圖像的下墊面包含了植被、海洋、城鎮(zhèn)、裸地、雪地等不同的地表類型,同時(shí)也包含了厚云、薄云、碎云等多種云類型。選擇基于傳統(tǒng)支持向量機(jī)的云檢測算法作為對比,圖2 直觀展示了兩種云檢測算法的云檢測結(jié)果,每組圖像從左到右分別是灰度化后的遙感圖像、傳統(tǒng)支持向量機(jī)算法的云檢測結(jié)果圖、本文算法的云檢測結(jié)果圖。
圖2 下墊面分別為植被(a)、海洋(b)、城鎮(zhèn)(c)、裸地(d)、雪地(e)時(shí)云檢測結(jié)果對比Fig.2 Comparison of cloud detection results when underlying surface are vegetation(a),ocean(b),town(c),bare land(d),snow(e)
圖2(a)-(e)的下墊面分為植被、海洋、城鎮(zhèn)、裸地、雪地。由圖2 可直觀看出,設(shè)計(jì)的云檢測算法實(shí)現(xiàn)了厚云、薄云的區(qū)分檢測,兩種算法在針對不同下墊面遙感圖像的厚云檢測上都取得了良好的效果,但在厚云邊緣、小面積碎云、特別是圖2(d)大面積薄云的檢測上優(yōu)勢明顯。設(shè)計(jì)的云檢測算法在對碎云、包括厚云邊緣過渡部分在內(nèi)的各種薄云檢測時(shí)減少了漏判現(xiàn)象,整體云檢測效果優(yōu)于對比算法。
為了定量統(tǒng)計(jì)所提算法的云檢測效果,文獻(xiàn)[17]利用目視解譯的方法從原始遙感圖像中提取云掩膜作為真實(shí)云層信息,并采用召回率(Recall)、虛警率(Falsealarm)、準(zhǔn)確率(Accuracy)對兩種算法的云檢測效果進(jìn)行對比。其中召回率的定義為遙感圖像中被云檢測算法正確識(shí)別為云的像素占圖像中真實(shí)云像素總數(shù)的比例,取值范圍為0~1,數(shù)值越高說明算法正確識(shí)別出的云像素越多,算法性能越好。虛警率的定義為遙感圖像中被云檢測算法識(shí)別為云的像素中地物像素所占的比例,取值范圍為0~1,數(shù)值越低說明被算法誤判為云的地物越少,算法性能越好。準(zhǔn)確率表明算法正確識(shí)別的云像素和地物像素占遙感圖像總像素的比例,在0~1 的取值范圍內(nèi)數(shù)值越高說明算法整體性能越好。召回率、虛警率、準(zhǔn)確率的計(jì)算公式分別為
式中: TP 為云檢測算法正確識(shí)別的云像素?cái)?shù)量,FN 為被云檢測算法漏判的云像素?cái)?shù)量,FP 為被云檢測算法誤判為云的地物像素?cái)?shù)量,TN 為云檢測算法正確識(shí)別的地物像素?cái)?shù)量,N 為遙感圖像中像素的總量。
由于作為對比的云檢測算法在檢測結(jié)果上沒有實(shí)現(xiàn)薄云、厚云的區(qū)分,因此在定量統(tǒng)計(jì)云檢測結(jié)果時(shí),將本文算法云檢測結(jié)果中的“厚云”、“薄云”統(tǒng)一作為云像素進(jìn)行統(tǒng)計(jì)。表1 為兩種算法的結(jié)果定量對比。
表1 云檢測定量評(píng)價(jià)Table 1 Quantitative evaluation of cloud detection
由表1 可見,在對圖2(a)、(b)、(c)的檢測上,本文算法的召回率明顯高于對比算法,兩種算法的虛警率差距不大,且對于不同下墊面表現(xiàn)不同,準(zhǔn)確率總體稍高于對比算法。對于圖2(d)的大面積薄云檢測上,新算法的準(zhǔn)確率、召回率遠(yuǎn)高于對比算法,優(yōu)勢十分明顯。對于下墊面為雪地的圖2(e),新算法的虛警率低于對比算法,整體準(zhǔn)確率高于對比算法。兩種算法的虛警率分別為27.6%、36.3%,高于對于其他類型下墊面遙感圖像云檢測時(shí)的虛警率,說明當(dāng)下墊面為雪地時(shí),兩種算法都存在較明顯的將雪地誤判為云的現(xiàn)象。對五幅圖像的檢測結(jié)果取平均值,新算法對于實(shí)驗(yàn)圖像的平均召回率為93.6%,高于對比算法的75.2%;平均虛警率為8.5%,低于對比算法的10.5%;平均準(zhǔn)確率為95.4%,高于對比算法的88.9%。由定量分析結(jié)果可見,基于層次支持向量機(jī)的云檢測算法適用于多種下墊面的云檢測,整體云檢測效果優(yōu)于傳統(tǒng)的支持向量機(jī)算法,在對包括厚云邊緣過渡部分在內(nèi)的各種薄云檢測上優(yōu)勢明顯。
設(shè)計(jì)的云檢測算法綜合了云和地物在遙感圖像上灰度、紋理、頻率特征的差異,采取層次支持向量機(jī)進(jìn)行分類。定性和定量分析表明,在僅使用RGB 波段的條件下,算法能夠?qū)Χ喾N情況下的遙感圖像實(shí)現(xiàn)有效的云檢測,具有較高云檢測準(zhǔn)確率的同時(shí)可以實(shí)現(xiàn)厚云、薄云的區(qū)分檢測。相較于傳統(tǒng)支持向量機(jī)云檢測方法明顯提升了對包括厚云邊緣過渡部分在內(nèi)的各種薄云的檢測能力,同時(shí)算法在針對似云地物的檢測方面也較傳統(tǒng)支持向量機(jī)算法具有一定優(yōu)勢。但算法在對下墊面為雪地的遙感圖像進(jìn)行檢測時(shí)虛警率偏高,同時(shí)厚云和薄云雖然在學(xué)術(shù)交流和遙感圖像應(yīng)用中經(jīng)常使用,但二者并沒有準(zhǔn)確可量化的分類標(biāo)準(zhǔn),所以實(shí)驗(yàn)只對厚云、薄云進(jìn)行了初步的定性區(qū)分,并沒有進(jìn)行定量分析。后續(xù)研究將重點(diǎn)針對這兩點(diǎn)不足之處進(jìn)行完善。