婁聯(lián)堂,陳佳騏,但 威
(中南民族大學(xué) 數(shù)學(xué)與統(tǒng)計學(xué)學(xué)院,武漢430074)
基于弦理論的目標輪廓提取方法
婁聯(lián)堂,陳佳騏,但 威
(中南民族大學(xué) 數(shù)學(xué)與統(tǒng)計學(xué)學(xué)院,武漢430074)
為保證目標輪廓的連續(xù)性,以弦理論為基礎(chǔ),在滿足Dirichlet邊界條件下,建立目標輪廓能量泛函模型.通過把目標輪廓曲線看作離散粒子相互作用組成的系統(tǒng),構(gòu)造粒子運動的響應(yīng)函數(shù),模擬粒子間的相互作用,采用增量法,逐步搜尋滿足條件的輪廓曲線,在滿足能量泛函最小時,提取出目標輪廓.實驗結(jié)果表明:通過設(shè)置相關(guān)參數(shù),能夠有效提取出目標輪廓曲線,保證輪廓曲線的完整性,使得曲線支持無級縮放.該算法只須給定兩個端點就可提取一條開目標輪廓曲線,減少了目標輪廓提取人工交互次數(shù),提高了工作效率.
弦理論; 目標輪廓提取;能量泛函模型;響應(yīng)函數(shù)
圖像目標輪廓提取在機器視覺中扮演著重要的角色,廣泛應(yīng)用于圖像分割[1]、圖像檢索[2]、目標檢測和目標識別中.通過應(yīng)用的模型知識的不同,可以分為基于物理的輪廓模型和基于統(tǒng)計學(xué)的輪廓模型.在物理輪廓模型中最早是以經(jīng)典力學(xué)為基礎(chǔ),由Mumford和Shah將能量泛函引入到目標輪廓提取中,使得復(fù)雜的輪廓提取問題轉(zhuǎn)化為簡潔明了的數(shù)學(xué)問題[3-5],此后為了消除圖像尺度對模型的影響[6,7],適用范圍更廣的量子力學(xué)模型[8]被引入目標輪廓提取中.本文通過目標輪廓的弦理論表示,建立輪廓曲線的能量模型,通過模擬粒子在勢場中的運動,搜尋使能量泛函達到最小值的目標輪廓曲線.提取出的輪廓曲線具有無級縮放的性質(zhì),而且能夠通過參數(shù)方程具體表示出來,具有連續(xù)性.
在物理學(xué)的弦理論中,存在兩種形式的弦.通過弦的兩端是否相連,可分為開弦和閉弦.
若一維開弦x(σ),y(σ),σ∈[0,π]滿足Dirichlet(狄利克雷)邊界條件:
x(0)=x(π)=0,y(0)=y(π)=0.
(1)
則:
(2)
其中:
(3)
若一維開弦x(σ),y(σ),σ∈[0,π]滿足Neuman邊界條件:
(4)
則:
(5)
其中:
(6)
本文在滿足Dirichlet邊界條件下,提取已知起點和終點的目標輪廓曲線.設(shè)目標輪廓曲線的起點和終點分別為(xs,ys)和(xe,ye),即目標輪廓曲線L:(x(σ),y(σ))滿足條件:
x(0)=xs,x(π)=xe,y(0)=ys,y(π)=ye.
(7)
進行坐標轉(zhuǎn)換后并使用Dirichlet邊界條件,可以得到目標輪廓曲線的參數(shù)方程,通過對其進行正弦展開得:
(8)
于是:
(9)
(10)
對于目標輪廓,可看作是一條兩端固定的開弦在外部勢場作用的引導(dǎo)下,從初始狀態(tài)到達輪廓所在狀態(tài)時的曲線.輪廓曲線總能量表示為:
Etol=Eint+Eext,
(11)
式中內(nèi)能主要包括由于運動弦所具有的動能和由于拉伸、彎曲所造成的彈性勢能.
(12)
其中α,β為相應(yīng)的權(quán)重系數(shù).
外部能量為弦在所處位置上具有的勢能:
(13)
f(x,y)為勢函數(shù),一般與圖像的梯度有關(guān),為準確提取圖像中目標輪廓曲線,f(x,y)應(yīng)為圖像梯度的單調(diào)遞減函數(shù),并且是非負函數(shù),例如,對于圖像I(x,y),可以取f(x,y)=e.
于是,目標輪廓提取問題,可以看作在內(nèi)能和勢能的作用下,粒子在勢場中的運動軌跡,粒子沿此軌跡有最小能量,即目標輪廓提取問題可變?yōu)榍蠼馐沟孟旅婺芰糠汉_到最小值時的輪廓曲線:
(14)
(15)
最終將圖像目標輪廓提取問題轉(zhuǎn)化為求使得(15)式達到最小值時各系數(shù)X1,…,XN,Y1,…,YN的值.進而由(8)式可求得完整的目標輪廓曲線,該曲線支持無級縮放.
3.1 響應(yīng)函數(shù)的構(gòu)造
hσ0(σ)應(yīng)滿足以下性質(zhì):
(1) hσ0(σ)≥0;
(2) hσ0(0)=hσ0(π)=0,hσ0(σ0)=1;
(3) hσ0(σ)在[0,σ0]上單調(diào)遞增,在[σ0,π]上單調(diào)遞減;
(4) hσ0(σ)在[0,π]存在二階連續(xù)導(dǎo)數(shù).
本文中采用如下形式的hσ0(σ):
hσ0(σ)=e-γ(σ-σ0)2-a(σ-σ0)2n,n≥2.
(16)
其中參數(shù)γ,n可通過自行調(diào)試設(shè)置,參數(shù)a由性質(zhì)(2)可解得:
(17)
(18)
若當(dāng)前曲線所處的位置為(x0(σ),y0(σ)),在d個單位大小的運動響應(yīng)函數(shù)hσ0(σ)的作用下,位置變化為(x1(σ),y1(σ)).改變前后位置之間存在的轉(zhuǎn)換關(guān)系為:
(19)
若變化前的系數(shù)為X1,X2,…,Xn和Y1,Y2,…,Yn,變化后的系數(shù)為X11,X12,…,X1n,Y11,Y12,…,Y1n.改變前后,系數(shù)之間存在的轉(zhuǎn)換關(guān)系為:
(20)
則最終的目標輪廓曲線參數(shù)方程可由處于初始狀態(tài)的曲線和粒子運動響應(yīng)函數(shù)來表示:
(21)
(22)
其中,系數(shù)xm,ym分別表示輪廓曲線從初始狀態(tài)到達總能量最小時,橫縱坐標受到各響應(yīng)函數(shù)的影響程度.
3.2 模型的求解
為了得到能夠使能量泛函達到最小值的目標輪廓曲線,在此使用增量法來求解,即對于曲線(x(σ),y(σ)),每次在(x1,y1),…,(xM,yM)中選擇一個點(xi,yi),允許點的橫坐標和縱坐標能增加或減少d個單位,使新的目標輪廓曲線的總能量小于原來的總能量,直到總能量不變?yōu)橹?
具體算法流程為:
(i) 目標輪廓曲線的初始狀態(tài)為首尾兩點連接成的一條直線:
此時,曲線所具有的內(nèi)能和外部能分別為:
Eext(x(σ),y(σ))=
(ii) 設(shè)置橫縱坐標可變范圍d,求需要變化的點m0、相應(yīng)的橫坐標變化量Δx、縱坐標變化量Δy,使得:
在運動響應(yīng)函數(shù)的作用下,橫縱坐標的改變量可由(19)式得到,頻率分量系數(shù)的改變量可由(20)式得到.在得到橫縱坐標及各頻率分量系數(shù)后,可以通過(15)式求得總能量,進而通過比較,找到使得總能量達到最小的響應(yīng)函數(shù)、橫縱坐標的改變量、各系數(shù)變化量.
(iii) 若Emin 本文在Matlab7.10.0環(huán)境下實現(xiàn)其相關(guān)算法,完成灰度圖像目標輪廓曲線的提取.在模型(15)中各權(quán)重系數(shù)α,β調(diào)節(jié)著各能量在總能量中的比重.取值將決定總能量在收斂到最小值時,曲線能否到達目標輪廓所處的狀態(tài).在嘗試過程中發(fā)現(xiàn),α的取值限制著曲線的伸展長度,α取值越大,曲線越難振動;取值過小,會造成曲線隨意振動.β決定著曲線的彎曲程度,β取值越大,曲線越平滑,造成難以提取出輪廓局部凹凸細節(jié);取值過小,會使得輪廓曲線中添加過多的、無用的局部凹凸細節(jié). 在目標輪廓曲線的參數(shù)方程中,正弦級數(shù)頻率最大值N的取值反映輪廓的具體走勢.對于輪廓曲線的取點個數(shù)M,若取得太大,會嚴重消耗內(nèi)存和時間;若取得過小,會影響局部細節(jié)的提取.在此同樣不斷地嘗試對N,M進行取值. 對于粒子的運動響應(yīng)函數(shù)式(16),參數(shù)γ,n將會影響響應(yīng)函數(shù)波型的寬窄.在設(shè)置橫縱坐標的取值范圍d時,取值過小會造成搜尋次數(shù)過多,消耗時間,有可能使搜尋結(jié)果陷入局部極小值;取值過大會使每次搜尋過程消耗過多的內(nèi)存,增加程序中間計算量. 在參數(shù)設(shè)置為α=0.001,β=0,N=15,M=400,γ=2,n=2,d=5的時候,光學(xué)圖像中初始曲線在迭代過程中的變化情況見圖 2. 為方便目標輪廓的提取,在圖像上選取初始點的過程中,應(yīng)盡量選取靠近目標輪廓邊緣的點.對于圖 3中目標輪廓的提取,通過參數(shù)的調(diào)整發(fā)現(xiàn)α=0.001,β=0,N=15,M=400,γ=2,n=2,d=5時,能完整地提取光學(xué)圖像和X射線圖像的目標輪廓;d=20時能提取出完整的超聲圖像中的目標輪廓,如圖 4. 通過算法的實現(xiàn),對本文所建立的能量泛函模型進行求解,能夠較為完整地提取出圖像中目標輪廓曲線,得到輪廓曲線的參數(shù)方程,進而保留了輪廓曲線的相關(guān)性質(zhì). 但是在初始點的選取上,需要人工選擇,使得初始狀態(tài)的曲線盡量地靠近輪廓曲線,對各參數(shù)沒有定性的方法確定其取值大小,只能通過實驗結(jié)果嘗試后選取. 本文算法提取一段開曲線,只須給定兩個端點,從目標輪廓提取的角度,這已經(jīng)是初始點個數(shù)的極限,其它的輪廓提取模型(如snake模型等)提取一條開輪廓曲線往往要選擇很多初始點,并且提取的結(jié)果與這些初始點的位置有很大的關(guān)聯(lián)性.當(dāng)然,在本算法中,將一段封閉曲線分割為幾段開曲線要提取,此時,為了讓實驗結(jié)果更理想,分段的數(shù)量有時可以大一點,即使這樣,所取的點數(shù)也不是太多. [1] Malik J, Blelngie S, Leung T, et al. Contour and texture analysis for image segmentation[J]. IJCV, 2001,43(1):7-27. [2] Cao Y, Wang C, Zhang L, et al. Edge index for large-scale sketch-based image search[C]// IEEE. IEEE International Conference on Computer Vision and Pattern Recognition . Barcelona: IEEE, 2011:761-768. [3] Belongie S, Malik J, Puzicha J. Shape matching and object recognition using shape contexts[J]. IEEE Transcantions on Pattern Analysis and Machine Intelligence, 2002, 24(4): 509-522. [4] Mumford D, Shah J. Boundary detection by minimizing functionals[C]// IEEE. IEEE International Conference on Computer Vision Pattern Recognition, San Francisco: IEEE, 1985(5): 22-26. [5] 夏利民, 谷士文. 基于活動輪廓的運動目標的動態(tài)分割[J]. 中國圖象圖形學(xué)報, 1999, 4A(8): 631-634. [6] Ambrosio L, Tortorelli V. On the approximation of functionals depending on jumps by elliptic functionals[J]. Comm Pure and Appl Math, 1990, 43: 999-1036. [7] Malladi R, Sethian J, Vemuri B. Shape modeling with front propagation: a level set approach[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1995, 17(2): 158-175. [8] Lou L,Ding M.Principle and approach of boundary extraction based on particle motion in quantum mechanics[J].Optical Engineering,2007,46(2):027005-027005-16. Object Contour Extraction Based on String Theory Lou Liantang, Chen Jiaqi, Dan Wei (College of Mathematics and Statistics,South-Central University for Nationalities,Wuhan 430074,China) In order to guarantee the continuity of the object contour, the energy functional model of object contour based on the string theory satisfying the Dirichlet boundary conditions is established in this paper. By taking the object contour curve as a composition system of discrete interaction particles, the response function of particle motion is constructed such that the interaction between particles is simulated. Finally, the incremental method is adopted to gradually search contour curve which satisfies minimization condition of energy function. Experimental results show that the object contour can be extracted effectively by reasonable configuration of relevant parameters, in the meanwhile, the integrity of the contour curve can be ensured and the extracted curve can be zoomed without limitation. An open contour curve with two end points can be extracted efficiently using this algorithm which need lesser manual interaction. string theory; object contour extraction; energy functional model; response function 2015-09-07 婁聯(lián)堂(1966-),男,教授,博士,研究方向:數(shù)學(xué)應(yīng)用方法與圖像處理,E-mail: louliantang@163.com 國家自然科學(xué)基金資助項目(60975011);中南民族大學(xué)中央高?;究蒲袠I(yè)務(wù)費專項資金資助項目(YZZ13003;CZW15051) TP751.1 A 1672-4321(2015)04-0123-064 實驗結(jié)果及分析