曹地,曹建農(nóng),朱倩
(1.長安大學(xué) 地球科學(xué)與資源學(xué)院,西安 710054;2. 國土資源部退化及未利用土地整治工程重點實驗室,西安 710054;3. 長安大學(xué) 地質(zhì)工程與測繪學(xué)院,西安 710054)
人類視覺在多尺度感知機(jī)制的驅(qū)動下[1],面對一個整體的視覺對象時可以獲取該對象不同尺度的視覺信息[2],并捕捉相應(yīng)尺度下的信息特征。模擬人類視覺的這種多尺度感知機(jī)制進(jìn)行圖像處理一直是圖像分析研究領(lǐng)域的熱點。多尺度圖像處理的主要方法是基于降維解構(gòu)分析,例如,廣泛使用的傅立葉變換、Gabor變換、短時傅里葉變換、小波變換[3]、多尺度幾何分析[4]、脊波變換Ridgelet、曲波變換Curvelet[5]、輪廓波變換Contourlet[6]、條帶波變換Bandelet、楔波變換Wedgelet、小線變換Beamlet、剪切波變換Shearlet[7]等均屬此類。雖然維度的降低意味著信息解構(gòu)會更容易且更完全,但也勢必造成高維信息的破碎與損失。因此,非降維解構(gòu)是圖像分析的發(fā)展方向之一。
已有少量研究人員致力于非降維結(jié)構(gòu)的圖像分析方法研究。A.Cohen、I.Daubechies、R.Q.Jia以及龍瑞麟等對經(jīng)典小波分析理論進(jìn)行了高維度推廣,但研究進(jìn)展緩慢,應(yīng)用則滯于以張量替代真二維[8-10]。二維小波張量的引入,在一定程度上彌補(bǔ)了降維造成的損失,并嘗試降低冗余,但這種改善依舊不能突破降維本身制造的上限。如圖1所示,多尺度幾何分析的發(fā)展以及多尺度塔式模型的運(yùn)用讓圖像分析向真二維方向發(fā)展有了新的邁進(jìn)。但是目前,相較于降維解構(gòu)分析發(fā)展的完善程度和發(fā)展速度來說,非降維的多尺度模型構(gòu)建方法單一,基礎(chǔ)理論不完善,沒有系統(tǒng)的評價機(jī)制,模型建成后精準(zhǔn)尺度篩選依然較少受到關(guān)注。
本文基于人類視覺多尺度感知機(jī)制,利用經(jīng)典小波理論以及多尺度幾何分析理論中多分辨率的思想,通過塔式模型的建立將非降維的連續(xù)尺度圖像解構(gòu)分析引入圖像分析的整體過程中。實驗表明,連續(xù)尺度圖像解構(gòu)分析的加入可以優(yōu)化圖像分割的結(jié)果。
圖像的多尺度分析是指圖像空間L2(R)中滿足單調(diào)性、逼近性、伸縮性、平移不變性、Riesz基存在性的一個空間序列{Vj}j∈Z[11]。關(guān)玉景等[12]突破了經(jīng)典多尺度理論的限制,提出了廣義多尺度分析的概念。在廣義多尺度分析的概念中,允許不同的尺度空間由不同的尺度函數(shù)平移伸縮生成[13]。假設(shè)L2(R)為一個空間,{Vj}j∈Z為一個空間序列,Vj?L2(R),Vj?Vj+1,j∈Z,若對每個空間{Vj}j∈Z存在φj(x),使得{φj(x-k/2j)}k∈Z是Vj的標(biāo)準(zhǔn)正交基,則稱{Vj}j∈Z是廣義多尺度分析。
常見的多尺度構(gòu)建共有如圖2所示的8種模式。在傳統(tǒng)塔式模型的構(gòu)造過程中選擇模式f1,如Gaussian Pyramid。模式f1具有計算速度快,迭代衰減速度快,信息認(rèn)知的整體性高等優(yōu)勢,也是最常用的建模模式。但其劣勢也很顯著,隨著塔式模型的生成,相鄰尺度間間隔不斷增大,間隔距離呈指數(shù)增長。這種模式很有可能導(dǎo)致錯失某一應(yīng)用需求下信息最豐富,應(yīng)用價值最高的最優(yōu)尺度,如圖3所示。而連續(xù)尺度塔式模型f2~f8則可以彌補(bǔ)這一缺憾,同時更加接近人類視覺的多尺度感知機(jī)制。f2~f8中,又尤其以f3實現(xiàn)最便捷,運(yùn)算速度最快,因而本文選用模式f3模式。
圖2 多尺度模式
圖3 塔式模型
多尺度分割算法一般依賴于圖像經(jīng)過多尺度解構(gòu)后產(chǎn)生的不同尺度的圖像,各尺度圖像獨立分割,以各類圖像特征作為分割與合并的判別依據(jù),并以權(quán)重調(diào)控。
本文采用的多尺度分割算法為光譜與形狀特征加權(quán)的多尺度分型網(wǎng)絡(luò)演化算法。該算法以多尺度分型網(wǎng)絡(luò)演化進(jìn)行分割,并綜合采用光譜特征和形狀特征,以二者的加權(quán)值作為異質(zhì)性評價準(zhǔn)則進(jìn)行最小異質(zhì)性合并[14],最終獲取分割結(jié)果。
(1)
(2)
(3)
(4)
wc代表c維度下權(quán)重,n1、n2代表區(qū)域面積,h1c、h2c和hmc分別代表合并前相鄰區(qū)域的異質(zhì)性和合并后新區(qū)域的異質(zhì)性。光譜特征hspectral采用區(qū)域標(biāo)準(zhǔn)差δ表示,形狀特征hshape包括光滑度b和緊致度n兩個指標(biāo)。l代表對象邊界長度,b代表對象輪廓最小外接矩形的周長,n代表面積,1、2 代表合并前相鄰區(qū)域的指標(biāo),下標(biāo)m代表合并后指標(biāo)。綜合3種異質(zhì)性度量指標(biāo),合并代價函數(shù)為:
f=wspectralhspectral+(l-wspectral)hshape
(5)
hshape=wsmoothhspectral+(l-wsmooth)hcompact
(6)
矩(moment)的概念來源于數(shù)學(xué),在數(shù)學(xué)統(tǒng)計學(xué)中矩被用以描述隨機(jī)變量的特征,在圖像學(xué)中矩被用于描述圖像的特征[15]。良好的特征不受光照、噪聲以及幾何形變的干擾。因此在廣義多尺度分析的基礎(chǔ)上,我們引入圖像的幾何矩以建立非降維的多尺度圖像解構(gòu)分析模型。
(7)
(8)
中心矩和原點矩的關(guān)系:
(9)
歸一化中心矩定義為:
(10)
對于圖像的矩,階數(shù)越低,對極值越敏感,運(yùn)算復(fù)雜度越低;階數(shù)越高,穩(wěn)定性越低,且運(yùn)算復(fù)雜度越高。
Hu.M.K首先提出了不變矩的概念[16]。并利用二階和三階歸一化中心矩構(gòu)造下面7個不變矩函數(shù)式:
φH1=η20+η02
(11)
(12)
φH3=(η30-3η12)2+(η03+3η21)2
(13)
φH4=(η30+η12)2+(η21+η03)2
(14)
φH5=(η30-3η12)(η30+η12)[(η30+η12)2-3(η21+η03)2]+
(3η21-η03)(η21+η03)[3(η30+η12)2-(η21+η03)2]
(15)
(16)
φH7=(3η21-η03)(η30+η12)[(η30+η12)2-3(η21+η03)2]+
(3η12-η30)(η21+η03)[3(η30+η12)2-(η21+η03)2]
(17)
Hu.M.K證明了以上7組矩具有旋轉(zhuǎn)不變性、縮放不變性和平移不變性,是一組高濃縮、高穩(wěn)定度的圖像特征。后續(xù)研究證明,在圖像識別中,φH1和φH2的不變性保持得比較好,φH3、φH4、φH5、φH6、φH7幾個不變矩則由于階數(shù)過高存在一定程度的誤差[17]。
矩可以很好捕捉圖像特征,且不受光照、噪聲以及幾何形變干擾,因此本文將以矩作為連續(xù)尺度解構(gòu)模型的基礎(chǔ)算子。
本文針對單通道遙感圖像,構(gòu)造10組獨立的解構(gòu)空間并建立非降維解構(gòu)模型,10組模型中包括2組基于一階矩的模型、1組基于二階矩的模型,以及7組基于由二階矩與三階矩組成的不變矩的模型。后對各組模型進(jìn)行分析。
如表1所示,10組解構(gòu)空間構(gòu)造分別基于Ma,Mb,Mc,Md,Me,Mf,Mg,Mh,Mi,Mj,10組圖像矩。其中,為降低極值對于低階矩的干擾,構(gòu)造b組空間同時對圖像進(jìn)行降噪處理。
表1 解構(gòu)空間的矩算子
解構(gòu)模型層級存在自然上限,也可以設(shè)置固定值上限,本文設(shè)定固定值解構(gòu)上限為50,即全部10組模型的解構(gòu)層級N均為50。構(gòu)造過程采用多尺度模式f3,即解構(gòu)模型單層窗口大小與層級對應(yīng),窗口建立從圖像左上角開始,層級間隔一致。對尺度窗口內(nèi)的圖像區(qū)域進(jìn)行矩運(yùn)算,獲取的特征值作為窗口值。
即對于解構(gòu)模型窗口:
WN={(xn,yn)=MomentN*N,n=1,2,…,N};
(18)
{N:1~50};
{Moment:Ma,Mb,Mc,Md,Me,Mf,Mg,Mh,Mi,Mj}。
10組解構(gòu)模型如圖4所示。
圖4 解構(gòu)模型
1)統(tǒng)計分析。以上10組解構(gòu)模型的50層級平均信息量統(tǒng)計結(jié)果顯示,在這10組空間中,信息量分布呈現(xiàn)兩種模式:均衡模式與增長模式。如表2所示。
表2 信息量分布模式
呈現(xiàn)均衡模式的模型,平均信息量在層級間變化不明顯,無顯著上升或下降趨勢;呈現(xiàn)增長模式的模型,平均信息量在相鄰層級間存在突變,整體呈現(xiàn)緩慢上升趨勢(圖5)。
圖5 平均信息量統(tǒng)計圖
2)縱剖面分析。如圖6所示,在連續(xù)解構(gòu)空間的縱剖面中,即同一解構(gòu)空間的不同尺度下,呈現(xiàn)均衡模式的三組解構(gòu)空間Ma,Mb,Md,其信息分布狀態(tài)相近,且隨著尺度增大,信息分布變化趨勢相近,波峰無明顯位移;呈現(xiàn)增長模式的7組解構(gòu)空間Mc,Me,Mf,Mg,Mh,Mi,Mj,其信息分布狀態(tài)相近,且隨著尺度增大,信息分布變化趨勢也相近,波峰隨尺度變化右移。相較于均衡模式,增長模式下的解構(gòu)空間信息變化規(guī)律更明顯,衰減速度更快,整體穩(wěn)定度更高。
圖6 連續(xù)解構(gòu)模型縱剖面
3)橫剖面分析。如圖7所示,在連續(xù)解構(gòu)空間的橫剖面中,即不同解構(gòu)空間的同一尺度下,均衡模式與增長模式的解構(gòu)結(jié)果同樣存在明顯分異。如圖,呈現(xiàn)均衡模式的解構(gòu)空間對于細(xì)節(jié)信息更敏感,更適合于細(xì)節(jié)信息獲取,而呈現(xiàn)增長模式的解構(gòu)空間對于邊緣信息更敏感,更適合用于邊緣提取與圖像分割,但幾何矩階數(shù)過高會使解構(gòu)結(jié)果破碎,整體可用性降低。
圖7 連續(xù)解構(gòu)模型橫剖面
將解構(gòu)模型代入光譜與形狀特征加權(quán)的多尺度分型網(wǎng)絡(luò)演化分割算法驗證。驗證對象為均衡模式解構(gòu)空間組和增長模式解構(gòu)空間組。驗證區(qū)間為解構(gòu)空間的第6~20層級,共15級。分割過程中,多尺度組合模式為原始圖像疊加相應(yīng)層級,所有圖層權(quán)重一致,參數(shù)設(shè)定一致。
作為對照組,將未解構(gòu)的原始圖像分別代入多尺度分割算法、分水嶺分割算法和四叉樹分割算法進(jìn)行分割。分割結(jié)果如圖8、圖9所示。
熵值是體現(xiàn)混亂程度的度量。在信息量位于同一量級的前提下,熵值也在同一量級,此時熵值越低信息混亂程度越低。
圖8 多尺度分割
圖9 對照組
如圖10所示:(1)3組算法中,相較于分水嶺算法與四叉樹算法,多尺度分割算法本身存在優(yōu)勢;(2)多尺度算法下,相較于空白對照組,加入解構(gòu)信息后的2組分割結(jié)果信息混亂程度都更低,分割效果更佳;(3)對比均衡模式解構(gòu)空間和增長模式解構(gòu)空間的分割結(jié)果。二者在分割結(jié)果上存在明顯差異,后者在所有層級上信息混亂程度均更低,即增長模式解構(gòu)空間提供的多尺度信息更有利于圖像分割。但同時二者存在一致性,即均在第8層級體現(xiàn)出最優(yōu)分割結(jié)果。
圖10 熵值圖
提取第8層級分割結(jié)果進(jìn)行進(jìn)一步對比(圖11)。對原始圖像標(biāo)定100個對照檢測點位,對照加入。均衡模式下,有效點位為60%;增長模式下,有效點位為72%。同為有效點位,增長模式下,優(yōu)勢點位更多。
圖11 第8層級點位檢測
本文建立了一種基于圖像幾何矩的非降維連續(xù)尺度解構(gòu)模式,并在此模式下構(gòu)建了10組非降維解構(gòu)模型。分析顯示這些模型呈現(xiàn)均衡模式和增長模式兩種形態(tài)。代入多尺度分割算法驗證結(jié)果證明:本文所提出的非降維連續(xù)解構(gòu)分析方法可以提升多尺度分割的效果,且增長模式下的解構(gòu)信息對于圖像分割更有利。