孫 靜,楊森林,師 超,陳 偉,張曉麗
(1.西安文理學(xué)院 機(jī)械與材料工程學(xué)院,西安 710065; 2.西安應(yīng)用光學(xué)研究所,西安 710065)
用于從捕獲的場景中提取對象信息的所有處理步驟稱為圖像處理,圖像處理廣泛應(yīng)用于人們?nèi)罕娚a(chǎn)生活的各個領(lǐng)域,諸如遙感、物體探測以及制造和數(shù)據(jù)處理中。圖像處理旨在準(zhǔn)確地找到、量化和分類圖像中的目標(biāo)[1-2]。圖像處理可以以手動或自動方式進(jìn)行,自動化圖像處理系統(tǒng)會產(chǎn)生很多圖像數(shù)據(jù),而手動處理變得非常耗時耗力,雖然手動圖像分析可提供可靠的結(jié)果,但時間效率低且對大數(shù)據(jù)集造成負(fù)擔(dān)。在這種情況下,使用自動圖像處理算法來執(zhí)行高效且自動化的圖像分析顯得必要且迫切。自動圖像分析需要較少或幾乎不需要用戶干預(yù),但是參數(shù)調(diào)優(yōu)亦是一項不可避免的繁瑣任務(wù)。
通常,圖像處理過程包括預(yù)處理、分割、特征提取及分類4個步驟。對于每個處理步驟,需要使用一個或多個適當(dāng)參數(shù)的操作符。預(yù)處理的目的是統(tǒng)一所有圖像,即在某種意義上抑制噪聲、最小化陰影等。分割用于區(qū)分有用對象和不重要的背景區(qū)域。目前已經(jīng)提出了許多方法,如閾值分割[3]、邊緣檢測[4]、分水嶺[5]等。由于陰影、噪聲、遮擋等原因,圖像數(shù)據(jù)集會出現(xiàn)畸變,圖像處理會因此受到影響。不同圖像的陰影和失真不同,如果涉及大量參數(shù),則用戶很難以前饋方式選擇全局參數(shù)。操作符可以為特定的圖像子集提供良好的結(jié)果,相同的參數(shù)集可能不適用于其他圖像[6],因此需要一個圖像處理流程的最優(yōu)參數(shù)集。操作符的參數(shù)是根據(jù)圖像數(shù)據(jù)集的子集自動查找或手動設(shè)置的,手動設(shè)置參數(shù)需要有關(guān)要查找的對象和要使用算法的參數(shù)的先驗信息,該先驗信息用于以手動反饋的方式改善參數(shù)[7]。因此,根據(jù)先驗信息,不僅可以調(diào)整諸如圖像分割等單一操作符,還可以添加其他操作符。該調(diào)整是手動完成的,用戶可以評估中間結(jié)果或最終結(jié)果。
近些年來,許多學(xué)者在圖形圖像處理學(xué)領(lǐng)域研究做出了積極貢獻(xiàn)。朱浩亮等[8]設(shè)計基于改進(jìn)布谷鳥搜索算法的圖像分割方法,對標(biāo)準(zhǔn)布谷鳥搜索算法進(jìn)行改進(jìn),加快算法收斂速度和尋優(yōu)效率。蔣磊[9]采用脈沖耦合神經(jīng)網(wǎng)絡(luò)通過自適應(yīng)地調(diào)整閾值的衰減速度來自動分割圖像,詳細(xì)介紹了脈沖耦合神經(jīng)網(wǎng)絡(luò)模型的基本原理,運行機(jī)制和特性,針對模型中存在的參數(shù)難以確定等固有的問題,給出了有效的解決辦法。然而,這些方法都不允許在優(yōu)化過程中插入先驗知識,例如估計對象大小、數(shù)量或?qū)ο箢惖姆植?。為了度量圖像分割和分類的準(zhǔn)確性,數(shù)據(jù)集必須同時包含分割和分類的基準(zhǔn)數(shù)據(jù)。A.Khan等[10]開發(fā)了一個基準(zhǔn)數(shù)據(jù)集,其中包含具有關(guān)于目標(biāo)位置、目標(biāo)類別、變化的噪聲和陰影的基準(zhǔn)數(shù)據(jù)圖像場景。本文設(shè)計了一種針對圖像分割過程中涉及的參數(shù)反饋自適應(yīng)方法,并討論圖像陰影和噪聲對分割和分類精度的影響。以期在不同陰影等級的背景下,獲得較好圖像分割、分類效果提供圖像處理方法學(xué)借鑒。
圖像處理流程中目標(biāo)分割和分類的場景以及在這些場景中要實現(xiàn)的目標(biāo)對于計算機(jī)程序員來說是不同的。例如,監(jiān)督圖像分割的成功與否是基于一個基準(zhǔn)數(shù)據(jù)的評價指標(biāo)來判斷的,然而,就對象的特征和類別而言,基準(zhǔn)數(shù)據(jù)可能是絕對的,也可能不完整或不明確。在這些場景中,評估度量和參數(shù)調(diào)優(yōu)可能彼此不同。圖1為圖像處理流程圖。
圖1 圖像處理流程
當(dāng)存在明確基準(zhǔn)數(shù)據(jù)的情況時,進(jìn)行基于自動反饋的圖像處理。選擇一個圖像處理的步驟,即圖像分割,將圖像分類標(biāo)準(zhǔn)適當(dāng)?shù)丶傻皆u估標(biāo)準(zhǔn)中,以便為每個單獨的圖像選擇最佳參數(shù)集?;谠谒嘘幱八皆u估圖像質(zhì)量的魯棒性度量,可以使用整個數(shù)據(jù)集的反饋機(jī)制自動找到一個魯棒參數(shù)集,還可以在變化的陰影水平上調(diào)整每個單獨圖像的參數(shù),然后評估整個數(shù)據(jù)集上圖像分割算法的魯棒性[11-12]。
基準(zhǔn)數(shù)據(jù)集是專門為評估標(biāo)準(zhǔn)設(shè)計的。A.Khan等[10]給出了對數(shù)據(jù)集的完整描述,它基于包含實體對象的4個場景(r=1,…,4)。利用陰影級別b(b=1,…,B)和人工背景高斯噪聲n(n=1,…,N)的聚合來描述每個圖像的陰影級A(r,b,n),B和N的值分別為13和14。
A.Khan等[10]使用的給定基準(zhǔn)數(shù)據(jù)度量是分割度量(q1,q2)和分類度量(q3)。相對于基準(zhǔn)數(shù)據(jù),分割度量懲罰檢測到的對象與不重疊像素數(shù)之間的差異,分類度量是相對于基準(zhǔn)數(shù)據(jù)的誤分類像素的數(shù)量。這些度量值(q1,q2,q3)使用標(biāo)準(zhǔn)轉(zhuǎn)換為模糊函數(shù),并表示為μ1,μ2,μ3。測度的總體質(zhì)量度量Q(r,b,n)如式(1)所示:
Q(r,b,n)=μ1·μ2·μ3
(1)
魯棒性度量(R)為式(2):
(2)
可以使用標(biāo)準(zhǔn)圖像分割評估方法,如Rand指數(shù)(RI)度量。然而,該度量方法會嚴(yán)重加權(quán)背景,不利于進(jìn)行圖像分割。由于數(shù)據(jù)集中存在大量的背景像素,因此即使算法沒有檢測到前景對象,Rand指數(shù)也會假設(shè)較高的值,因此,采用基于前景對象的方法。
針對每個片段類型,目標(biāo)特征可以是幾何的(面積、偏心率等)、強(qiáng)度相關(guān)的(亮度、噪聲等)和基于內(nèi)容的(子片段數(shù)等)。特征提取至關(guān)重要,因為對象分類是在特征空間中進(jìn)行的。在圖像處理過程中,每選擇一個參數(shù)集p,就會在圖像中產(chǎn)生特定數(shù)量的片段,這些片段可能在大小、范圍、底層像素值等方面與其他p選擇獲得的片段不同。
基準(zhǔn)數(shù)據(jù)是通過不同對象類型中希望看到的特征(平均對象大小、對象數(shù)量等)來描述的?;谔卣飨蛄縡i=(fi1,…,fim)的標(biāo)準(zhǔn),考慮到每段i(i=1,…,nt)需要構(gòu)建的特征個數(shù)為j(j=1,…,m),找到的對象數(shù)量記為nt,在圖像中找到的片段總數(shù)nc可以是附加的先驗知識。
有兩種方法可以實現(xiàn)自動參數(shù)調(diào)整:1)對所有圖像使用一個魯棒參數(shù)集;2)對每個圖像分別進(jìn)行參數(shù)調(diào)整。根據(jù)可用的基準(zhǔn)數(shù)據(jù)類型,自動參數(shù)調(diào)整的方式有所不同。當(dāng)存在絕對基準(zhǔn)數(shù)據(jù)(每個像素都有一個分段和類分配)時,對依賴于p的噪聲斑點的評價方法可以用模糊術(shù)語表示為μ1(p)、μ2(p)和μ3(p)。因此,每個p值的總體質(zhì)量度量由式(3)表達(dá):
Q(r,b,n,p)=μ1(p)·μ2(p)·μ3(p)
(3)
為了計算基于目標(biāo)特征向量fi的質(zhì)量度量Qfeat,由用戶提供字母數(shù)字參考特征,用戶可以根據(jù)待找對象特征的模糊知識推導(dǎo)出這些特征,這些特征用θ表示的模糊隸屬函數(shù)式(5)來描述,其中(aj,bj,cj,dj)是梯形函數(shù)的邊:
(5)
式(5)給出的梯形曲線是fij的函數(shù),并且取決于4個標(biāo)量參數(shù)aj,bj,cj和dj。這些值由用戶基于抽象特征信息來設(shè)置。對于分割對象中的每個特征值,使用梯形模糊函數(shù)對隸屬度值θ進(jìn)行評估。
使用用戶提供的(aj,bj,cj,dj)作為抽象基準(zhǔn)數(shù)據(jù),總參考計數(shù)nc也可以根據(jù)式(5)的θc用模糊術(shù)語表示。因此,基于參數(shù)向量puser的模糊隸屬函數(shù)的Qfeat可以寫為式(6):
(6)
其中:nt(puser)是基于puser分割的對象數(shù)量。式(6)中的求和項表示所有對象特征與抽象基準(zhǔn)數(shù)據(jù)特征的集體偏差。還需要對式(6)中的puser進(jìn)行最大化,以獲得最優(yōu)參數(shù)集popt,user,如式(7)所示:
(7)
式(6)和式(7)中的下標(biāo)“user”指的是用戶定義的抽象基準(zhǔn)數(shù)據(jù)的最佳參數(shù)集。在用戶提供的抽象基準(zhǔn)數(shù)據(jù)存在的情況下,式(7)用于對每個單獨圖像進(jìn)行參數(shù)自適應(yīng)調(diào)整。整個數(shù)據(jù)集的魯棒參數(shù)值計算式(8):
(8)
其中:prob表示包含越來越高陰影水平的整個數(shù)據(jù)集的魯棒參數(shù)集。
圖2中顯示了用于實現(xiàn)反饋參數(shù)自適應(yīng)的流程圖。其包含了反饋結(jié)構(gòu),給出了前饋圖像處理結(jié)構(gòu)和參數(shù)自適應(yīng)的新元素。針對不同的情況,采用了兩種不同的分割方法,并對分割參數(shù)進(jìn)行了調(diào)整。在比較標(biāo)準(zhǔn)的分割方法時,兩種情況下(即有反饋和無反饋)圖像的形態(tài)學(xué)操作符結(jié)構(gòu)和預(yù)處理及后處理均保持不變。
圖2 基準(zhǔn)圖像分割方法的參數(shù)自適應(yīng)流程
隨后,同時調(diào)整圖2中的其他所有參數(shù),以顯示對單參數(shù)自適應(yīng)的改進(jìn)。在數(shù)據(jù)集變大或涉及的調(diào)整參數(shù)數(shù)量多需要手動調(diào)整的情況下,采用給定的反饋參數(shù)自適應(yīng)方法使計算機(jī)程序員能夠自動調(diào)整圖像處理參數(shù)。
本文定義了具有3個圖像分割算子的圖像處理流程,即卷積、閾值、開放運算。參數(shù)向量p=(w,t,s)T由3個參數(shù)組成:w為圖像卷積濾波器大小,強(qiáng)度閾值為t,圖像打開的結(jié)構(gòu)元素的大小為s。圖3顯示了在陰影較小的情況下,程序員手動調(diào)整參數(shù)的效果。顯然,p=(1,180,1)T的參數(shù)集可提供最優(yōu)結(jié)果見圖3(d)。但是,這可能不是最優(yōu)參數(shù)集popt。
圖3 使用參數(shù)集p=(w,t,s)T進(jìn)行分割的結(jié)果
如圖4所示,如果存在較高的陰影,則可能需要一個不同的p以獲得良好的分割結(jié)果,這是由于某些陰影效果也被解釋為對象,使用假設(shè)的參數(shù)集p=(1,180,1)T得到了不同的對象特征和錯誤的對象標(biāo)注。如圖4(c)所示,在該陰影水平,更好的參數(shù)集可以是p=(3,120,5)T,其中,t低于180。因為在較低的值下,物體的陰影不會被檢測到。同樣,較高的s將允許使用較低的t值來去除較小的噪聲斑點。在此,更改w對分割結(jié)果影響不大。如果圖像數(shù)據(jù)集很大或涉及很多參數(shù),那么對于實際應(yīng)用而言,找到最佳參數(shù)集幾乎是不可能的[15]。
圖4 存在較高的陰影使用參數(shù)集p=(w,t,s)T的分割結(jié)果
當(dāng)用戶擁有大量具有絕對基準(zhǔn)數(shù)據(jù)的圖像并且要在其中分割許多對象時,即使使用標(biāo)準(zhǔn)方法,手動參數(shù)調(diào)整也會非常麻煩。用戶可以根據(jù)可用的基準(zhǔn)數(shù)據(jù)標(biāo)記一組圖像,并根據(jù)具有不同陰影級別的單個圖像使用反饋機(jī)制自動調(diào)整參數(shù)。首先,整個數(shù)據(jù)集都采用了在所有陰影級別都最有效的魯棒參數(shù)集;然后,使用反饋機(jī)制對每個單獨的圖像進(jìn)行最優(yōu)參數(shù)設(shè)置,對選定的Otsu分割和Sobel邊緣檢測兩種分割方法進(jìn)行了實驗?;趫D2中給出的圖像處理流程,將Otsu分割和Sobel邊緣檢測的參數(shù)自適應(yīng)應(yīng)用于數(shù)據(jù)集(r=1)。對于Otsu分割,使用強(qiáng)度閾值tOtsu,迭代地調(diào)整此參數(shù)以查看分割結(jié)果。對于Sobel邊緣檢測,標(biāo)準(zhǔn)應(yīng)用程序還使用了一個參數(shù)并進(jìn)行了自動參數(shù)調(diào)整。兩種方法的標(biāo)準(zhǔn)實現(xiàn)稱為這些方法的前饋應(yīng)用,簡寫為StdOtsu和StdEdge。在標(biāo)準(zhǔn)實現(xiàn)中,不會手動設(shè)置tOtsu和tEdge的參數(shù)值,而是由各個方法自動選擇。但是,這些值在前饋方法中沒有變化,無法觀察到分割結(jié)果的改善。
為了進(jìn)行參數(shù)調(diào)整,在tOtsu和tEdge的邊界內(nèi)使用步長δ進(jìn)行了詳盡地搜索。由于圖像數(shù)據(jù)集的強(qiáng)度值歸一化在[0,1],因此應(yīng)在這些范圍內(nèi)指定最高和最低參數(shù)值。AutoOtsu的下限為tOtsu,low=0.1,上限為tOtsu,high=0.78,其中δ=0.02。在AutoEdge的情況下,tEdge,low=0.01,tEdge,high=0.21,其中δ=0.01。圖5顯示了由Q(r,b,n)表示的所有方法中,隨著陰影水平A(r,b,n)的增加,性能逐漸下降。為了量化性能,給出了魯棒性度量。RStd,Otsu和RStd,Edge分別是StdOtsu和StdEdge根據(jù)式(2)得到的魯棒性度量。RAuto,Otsu和RAuto,Edge分別是AutoOtsu和AutoEdge根據(jù)式(2)得到的魯棒性度量。魯棒性度量越大,魯棒性越強(qiáng)。
圖5 圖像分割參數(shù)適應(yīng)在基準(zhǔn)數(shù)據(jù)集r=1上的結(jié)果
Otsu分割和Sobel邊緣檢測的分割結(jié)果如圖6所示。從圖6(a)、6(b)可以清楚地看到,由于存在陰影,使用標(biāo)準(zhǔn)前饋Otsu分割時會發(fā)現(xiàn)錯誤的斑點。相反,當(dāng)調(diào)整閾值參數(shù)時,在高陰影水平下可獲得更好的分割質(zhì)量。在Sobel邊緣檢測的情況下,使用兩種技術(shù)(即前饋與反饋參數(shù)自適應(yīng))對在相同陰影級別發(fā)現(xiàn)的斑點進(jìn)行比較。由于存在陰影,無法完全檢測到邊緣,并且預(yù)定義的圖像膨脹參數(shù)無法形成所有斑點,導(dǎo)致使用標(biāo)準(zhǔn)前饋應(yīng)用程序的Q(r,b,n)值較低。相反,當(dāng)使用反饋迭代調(diào)整tEdge時,可以在較高的陰影級別獲得更好的分割質(zhì)量。
圖6 Otsu分割和Sobel邊緣檢測的分割結(jié)果
基于反饋的圖像處理參數(shù)自適應(yīng)方法實際應(yīng)用可以得到如下結(jié)論:用戶可以手動標(biāo)記一組圖像,無需詳細(xì)了解圖像處理過程即可獲得最優(yōu)參數(shù)。與常見的圖像處理方法相比,本文方法參數(shù)化程序?qū)υ肼暫完幱熬哂休^強(qiáng)的魯棒性。同時,還可以幫助專家查看整個數(shù)據(jù)集,并在變化的陰影級別上為圖像調(diào)整最優(yōu)參數(shù)。最優(yōu)圖像分割的質(zhì)量取決于找到特定目標(biāo)參數(shù)的程度。