張子丹
(上海海事大學(xué)商船學(xué)院,上海 200135)
海平面背景下的目標(biāo)區(qū)域分割是機(jī)器視覺(jué)研究中的難點(diǎn),其主要原因是動(dòng)態(tài)海平面背景和光照使分割出來(lái)的前景目標(biāo)含有大量噪聲.另外,海浪劇烈波動(dòng)引起的相機(jī)晃動(dòng)也會(huì)影響目標(biāo)檢測(cè)的精度.因此,建立高魯棒性背景模型是提高動(dòng)態(tài)背景下的目標(biāo)區(qū)域分割的關(guān)鍵.目前較為經(jīng)典的背景模型有自適應(yīng)平滑模型[1]、多分辨率多尺度自回歸(multiscale autoregressive)模型[2]、高斯模型[3-4]、非參數(shù)模型[5]以及卡爾曼預(yù)測(cè)模型等.上述模型能解決某些特殊場(chǎng)景的目標(biāo)區(qū)域分割,但對(duì)于復(fù)雜海面背景有一定的局限性,如僅考慮背景的亮度信息,而很少考慮豐富的海浪紋理信息等.本文介紹1種根據(jù)海平面背景特點(diǎn)和海浪紋理信息建立的馬爾科夫高斯混合模型[6-8],通過(guò)獲取圖像特征,并假設(shè)圖像特征遵守正態(tài)分布,將分割問(wèn)題轉(zhuǎn)化為紋理圖像的聚類(lèi)問(wèn)題,從而分割出海浪紋理背景下的目標(biāo)區(qū)域.
由于海浪受環(huán)境(風(fēng)速、光照等)影響而引起的海面變化,反映在二維圖像中為亮度和顏色的變化,微視覺(jué)模式[9]在海浪紋理中重復(fù)出現(xiàn),因此,海平面波浪紋理區(qū)呈現(xiàn)隨機(jī)排列的多樣模式,區(qū)別于結(jié)構(gòu)性較強(qiáng)的周期紋理,見(jiàn)圖1.
圖1 不同特征的海浪紋理圖像
海浪紋理分析主要借助紋理基元,圖2為不同場(chǎng)景下的海浪紋理基元特點(diǎn).
圖2 不同場(chǎng)景下海浪紋理基元比較
圖2 (a)為微浪紋理,其基元紋理呈現(xiàn)細(xì)小紋理特征,但紋理排列未呈現(xiàn)周期性,因此,該場(chǎng)景下的海浪紋理屬微紋理[5];圖2(b)為中浪紋理,其紋理更不規(guī)律,紋理基元較大;圖2(c)為大風(fēng)浪場(chǎng)景下的紋理,其紋理基元更大,基元間的內(nèi)在運(yùn)動(dòng)關(guān)系更難以描述.因此,僅依靠基元特性和像素灰度信息分析海浪紋理遠(yuǎn)遠(yuǎn)不夠,可考慮充分利用紋理的空間布局和統(tǒng)計(jì)方法描述海浪紋理.
可見(jiàn)光下海浪的灰度和顏色內(nèi)在的相互作用形成海浪紋理圖像,圖3為可見(jiàn)光下的海浪紋理圖像及其直方圖.由圖3(a)可知,海浪細(xì)致紋理圖像像素符合多態(tài)正態(tài)分布;在圖3(b)輕浪背景下,海浪開(kāi)始破碎,呈現(xiàn)較多的反射棱角,因此,直方圖分布變得較不規(guī)則;在圖3(c)中,海浪紋理更不規(guī)則,直方圖分布更復(fù)雜,像素的分布已不符合正態(tài)分布.因此,本文根據(jù)單模態(tài)的思想用多模態(tài)思想描述復(fù)雜場(chǎng)景中像素點(diǎn)值的變化.[10]
圖3 海平面背景的直方圖分布
馬爾科夫隨機(jī)場(chǎng)(Markov Random Field,MRF)模型因其能充分利用空間的信息而廣泛應(yīng)用于紋理分析和模糊聚類(lèi),被認(rèn)為是描述圖像像素聯(lián)合概率分布的有力工具.從隨機(jī)場(chǎng)的觀點(diǎn)看,海面目標(biāo)的檢測(cè)問(wèn)題可看作分類(lèi)問(wèn)題,即如何從觀測(cè)到的灰度圖像中獲取圖像真實(shí)類(lèi)別的標(biāo)記圖像.
設(shè)二維m×n平面圖像像素點(diǎn)集合為S={1,2,…,m ×n},K={1,2,…,Q}為像素的標(biāo)記集合,Q為類(lèi)別數(shù).圖像分割就是對(duì)圖像上的每個(gè)像素分配1個(gè)像素標(biāo)記集合K中的1個(gè)類(lèi)別v,標(biāo)記圖像為分割后的結(jié)果,表示為
可將Y定義為S上的1個(gè)MRF.
設(shè)圖像某像素點(diǎn)r的鄰域?yàn)棣莚(r?ηr),S上的鄰域系統(tǒng)集合 η ={ηr,r∈S}.如果?v∈K,r∈S,則像素點(diǎn)r在其鄰域ηr中被賦予標(biāo)記v的概率為P(yr=v|yηr)=P(v),表示為1個(gè) MRF實(shí)現(xiàn),表示某像素點(diǎn)僅與其鄰域系統(tǒng)有關(guān),與鄰域系統(tǒng)外的點(diǎn)無(wú)關(guān).由于MRF和Gibbs分布的一致性,P(Y)可表示為
像素組 C={(i,q),i∈S,q∈η},η 為像素點(diǎn) q 的鄰域系統(tǒng);β為分割因子,U(y)值越小,實(shí)現(xiàn)Y的能量越小,越可能實(shí)現(xiàn).
根據(jù)MRF與Gibbs分布的一致性,通過(guò)能量函數(shù)確定MRF的條件概率,從而使其在全局上具有一致性.通過(guò)單個(gè)像素及其領(lǐng)域的局部交互,MRF模型可獲得復(fù)雜的全局行為,即計(jì)算局部的Gibbs分布可得到全局的統(tǒng)計(jì)結(jié)果.
已知所觀測(cè)的輸入灰度紋理圖像Y是定義在網(wǎng)格集合S上的,由貝葉斯公式得
式中:P(X|Y)為后驗(yàn)概率;P(Y|X)為Y的條件概率;P(X)為先驗(yàn)Gibbs分布概率.目標(biāo)的分割就是給定1個(gè)特定的y(y是Y的1個(gè)實(shí)現(xiàn)),在某種最優(yōu)準(zhǔn)則條件下求得X的1個(gè)估計(jì),即求使P(Y|X)最大的分割標(biāo)記:
式中:x和y分別為X和Y的樣本.假設(shè)Y中的每個(gè)灰度信息 yr(r∈S)符合高斯分布,參數(shù) θr=(μr,σv),v=xr(r∈S),則
由MRF高斯混合模型表達(dá)式可得變量X和Y的聯(lián)合似然概率P(X,Y)=P(Y|X)P(X),聯(lián)合概率可進(jìn)一步表示為
由于y分布獨(dú)立,變量x和y的聯(lián)合似然概率為
由文獻(xiàn)[9]可知,最優(yōu)化概率估計(jì)問(wèn)題可轉(zhuǎn)化為能量最小化問(wèn)題
由上述可知,最優(yōu)化概率估計(jì)問(wèn)題可轉(zhuǎn)化為能量最小化問(wèn)題,能量最小化問(wèn)題可轉(zhuǎn)化為求式(8)的最優(yōu)解問(wèn)題.由于能量函數(shù)U(y|x)為非凸函數(shù),其極小值較多,在類(lèi)別不定時(shí),不可能通過(guò)窮盡的搜索方式得到最優(yōu)解.圖像邊界信息的存在以及參數(shù)和類(lèi)標(biāo)記的相互獨(dú)立性,使觀察數(shù)據(jù)不完備,因此,選擇EM算法[11]從不完備的數(shù)據(jù)集合里提取參數(shù).設(shè) y~為估計(jì)所丟失的數(shù)據(jù),則{y~,y}為完備的數(shù)據(jù)集.通過(guò)最大化完全數(shù)據(jù)對(duì)數(shù)估計(jì)E(log P(x,y|θ))估計(jì)新的參數(shù)集合θ,再經(jīng)過(guò)E-step和M-step,參數(shù)的集合可表示為
式中:t為迭代次數(shù).
EM算法可簡(jiǎn)單描述如下:
BEGIN
輸入圖像
步驟0 7×7中值濾波;
步驟1 初始化參數(shù)和分割參數(shù)以及迭代條件;
步驟2 E-step,用式(5)和(7),計(jì)算 U(x|y),U(x),θ,計(jì)算后驗(yàn)概率分布Pt(k|yi);
步驟3 M-step,極大化t時(shí)刻的期望值,更新t時(shí)刻的參數(shù);
步驟4 執(zhí)行以上步驟,滿足迭代條件則停止;
步驟5 中值濾波以及形態(tài)學(xué)處理.
輸出圖像
END
為驗(yàn)證方法的可行性,可對(duì)不同紋理下的海浪紋理進(jìn)行分析.所測(cè)試的圖片來(lái)自網(wǎng)絡(luò)和課題組,目標(biāo)是將彩色圖像轉(zhuǎn)換為灰度圖像.圖像的背景為較寬廣的水域,因此,設(shè)分割類(lèi)別K=2,分別表示海面背景和船艦?zāi)繕?biāo)(以及部分天空背景).由于分割光滑因子β值的選取沒(méi)有較好的估計(jì)模型,試驗(yàn)中的β值均是在反復(fù)比較的情況下得到的.為得到較為理想的分割效果,對(duì)圖像組首先進(jìn)行中值濾波.由于基于迭代的EM算法對(duì)初始值的要求較為敏感,試驗(yàn)中的均值μ0取樣本的均值向量.
表1為樣本集合的部分訓(xùn)練參數(shù),從中選擇較合適的參數(shù)作為初始化參數(shù).表1中的object表示圖像集合中的船舶集合和落水人員等小目標(biāo)集合;background表示海浪細(xì)致紋理背景模型集合.
表1 樣本集合的部分訓(xùn)練參數(shù)
由于參數(shù)β過(guò)大會(huì)造成細(xì)節(jié)的丟失,太小會(huì)使鄰域信息變?nèi)?,難以有效濾除噪聲,本文通過(guò)多次選擇確定β大小.由于微浪紋理較細(xì),為控制分割光滑程度,分割因子β選擇0.4.
為表示該算法的可行性,選擇幾個(gè)經(jīng)典的紋理分割方法與本文方法作比較.圖4為經(jīng)典的圖像分割方法和本方法的比較,其中:圖4(a)為較細(xì)海浪紋理背景下的原始圖像,圖像場(chǎng)景為對(duì)比度較小且受到光照影響的海面背景;圖4(b)為GS(Gibbs-Sampler)方法得到結(jié)果;圖4(c)為基于區(qū)域生長(zhǎng)和邊界信息的分割結(jié)果,區(qū)域生長(zhǎng)方法未能充分利用海浪的空間分布信息而產(chǎn)生過(guò)分割問(wèn)題;圖4(d)為改進(jìn)的OSCU方法[12],基于直方圖的自動(dòng)閾值選取對(duì)于受光照影響較大的海面背景目標(biāo)區(qū)域分割有局限性;圖4(e)為本文的試驗(yàn)結(jié)果,較前面的幾種方法有更好的分割效果,基本能將目標(biāo)分割出來(lái),并且背景沒(méi)有過(guò)多地被劃分到目標(biāo)區(qū)域中.
圖4 紋理分割效果對(duì)比
為表現(xiàn)本文方法的有效性,用分割正確率(Correct Classification Ratio,CCR)表示分割效果:
式中:C為分割正確率;Nc為分類(lèi)正確的像素個(gè)數(shù),Nt為像素總個(gè)數(shù).表2給出各種方法的分割正確率,由表2可知本文方法的分割正確率較其他方法有較大的改進(jìn).
表2 不同方法的圖像正確分割率
圖5給出算法的時(shí)間比較,由算法收斂的抽樣點(diǎn)得到.文獻(xiàn)[12]的OSCU方法因其較為簡(jiǎn)單,沒(méi)有大量的迭代運(yùn)算,快于其他算法;本文算法(改進(jìn)的MRF方法)雖含有大量迭代運(yùn)算,但初值取得較為合理,因此算法時(shí)間符合要求;基于區(qū)域生長(zhǎng)和邊界分割方法(區(qū)域生長(zhǎng)方法)由于最初的數(shù)據(jù)量有限,收斂速度與其他方法相差不多,但隨著數(shù)據(jù)量的增加,收斂性受到較大限制,該算法的時(shí)間逐漸增加;GS方法(Gibbs-Sampler方法)雖然有較好的分割效果,但需要進(jìn)行較多的浮點(diǎn)運(yùn)算,且要花費(fèi)較多的時(shí)間尋求全局的最優(yōu)化,算法的實(shí)時(shí)性較差.
圖5 本文算法和傳統(tǒng)算法的時(shí)間比較
海浪紋理背景下的目標(biāo)區(qū)域分割與傳統(tǒng)的場(chǎng)景分割有很大的不同,需要結(jié)合海浪的內(nèi)在紋理形成機(jī)制和背景像素的空間分部信息進(jìn)行分割.本文結(jié)合像素空間分布信息以及統(tǒng)計(jì)思想提出1種基于MRF高斯混合模型的海浪紋理背景目標(biāo)區(qū)域分割方法.試驗(yàn)結(jié)果表明該算法對(duì)細(xì)海浪紋理分割有可行性,但同時(shí)還存在著若干問(wèn)題,如對(duì)于大浪和中浪背景紋理,本方法的分割精確度較低,對(duì)于天空背景和地岸等多類(lèi)別的背景會(huì)造成誤分割或過(guò)分割,需進(jìn)一步解決和討論.
[1]LONG W.Stationary background generation:an alternative to the difference of two images[J].Pattern Recognition,1990,23(12):1351-1359.
[2]FRAKC A.Internal multi-scale auto-regression process,stochastic realization & covariance estimation[D].Cambridge,Massachusetts:MIT,1999.
[3]SCAUFFER C,GRIMSON W.Learning patterns of activity using real-time cracking[J].IEEE Trans on Pattern Anal& Machine Intelligence,2000,22(8):747-757.
[4]COLLINS R,LIPTON A,KANADE T,et al.A system for video surveillance& monitoring[C]//8th Int Topical Meeting Robotic& Remote Systems,1999:510-514.
[5]ELGAMMAL A.Non-parametric model for background subtraction[C]//Eur Conf on Comput Vision.London:Springer-Verlag.2000:751-767.
[6]DENG Huawu,CLAUSI D A.Gaussian MRF rotation-invariance features for image[J].IEEE Trans on Pattern Anal& Machine Intelligence,2004,26(7):951-955.
[7]KASHYAP R L,KHOTANZAD A.A model-based method of rotation invariance texture classification[J].IEEE Trans on Pattern Anal& Machine Intelligence,1986,8(4):472-481.
[8]DENG Huawu,CLAUSI D A.Advanced Gaussian MRF rotation invariance texture features for classification of remote sensing imagery[C]//Proc 2003 IEEE Comput Soc Conf on Comput Vision& Pattern Recognition.Madison,Wisconsin,2003:42-48.
[9]ZHANG Yongyue,SMITH S,BRADY M.Segmentation of brain MR images through a hidden Markov random field model and the EM algorithm[J].IEEE Trans on Med Imaging,2001,20(1):46-51.
[10]GEMAN S,GEMAN D.Stochastic relaxation,Gibbs distributions & the Bayesian restoration of images[J].IEEE Trans on Pattern Anal&Machine Intelligence,1984,6(2):721-741.
[11]HALL N R,HALL D,NASCIMENTO J,et al.Comparison of target detection algorithm using adaptive background models[C]//2005 Int Workshop on Performance Evaluation of Cracking and Surveillance.2005:217-219.
[12]JIN Lisheng,TIAN Lei,WANG Rongben,et al.An improved OSCU method for image segmentation[C]//IEEE ICSP 2006 Proc,2006:159-168.