李新利 李笑笑 楊國(guó)田
摘 ? 要:圖像處理是人工智能的基礎(chǔ),而圖像分割是圖像處理的關(guān)鍵技術(shù)。圖像特征提取和目標(biāo)識(shí)別,在一定程度上取決于圖像分割的質(zhì)量如何。在圖像處理與分析課程教學(xué)過(guò)程中,文章針對(duì)閾值分割算法和效果進(jìn)行研究,提出了一種基于和聲搜索的閾值尋優(yōu)算法;基于圖形用戶界面,編寫(xiě)了圖像閾值分割算法軟件。軟件可實(shí)現(xiàn)基本全局閾值、Otsu最佳全局閾值、多個(gè)全局閾值、局部均值閾值、局部中值閾值、自適應(yīng)分塊閾值以及基于和聲搜索的閾值分割算法。學(xué)生可直觀感受不同閾值分割算法的分割效果和特點(diǎn),圖像閾值分割軟件具有良好的教學(xué)效果和啟發(fā)學(xué)生創(chuàng)新思維的作用。
關(guān)鍵詞:圖像處理;閾值分割;和聲搜索;圖形用戶界面
中圖分類(lèi)號(hào):TP317.4 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1673-8454(2020)13-0093-04
一、引言
圖像處理、分析和識(shí)別是進(jìn)行人工智能深入研究的基礎(chǔ)。隨著人們對(duì)人工智能科學(xué)的進(jìn)一步重視,圖像處理問(wèn)題作為一項(xiàng)研究熱點(diǎn)進(jìn)入越來(lái)越多人的視野。圖像處理與分析課程是模式識(shí)別與智能系統(tǒng)學(xué)科核心專(zhuān)業(yè)學(xué)位課,其內(nèi)容融合了計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺(jué)和模式識(shí)別等多個(gè)領(lǐng)域的知識(shí),需要學(xué)生具有較強(qiáng)的理論綜合能力和實(shí)踐能力。因此培養(yǎng)理論與實(shí)踐并重的高素質(zhì)人才成為教學(xué)的重要任務(wù)。
圖像分割是圖像識(shí)別和計(jì)算機(jī)視覺(jué)至關(guān)重要的預(yù)處理。沒(méi)有正確的分割就不可能有正確的識(shí)別。但是,在進(jìn)行具體的分割時(shí)經(jīng)常會(huì)遇到各種問(wèn)題。例如光照不均、噪聲過(guò)多、背景與目標(biāo)差別過(guò)大等,造成分割效果不理想。而不同的圖像分割算法也各具特點(diǎn)。因此在教學(xué)中,為了讓學(xué)生能夠?qū)Ρ壤斫舛喾N圖像分割算法的特點(diǎn),本文基于圖形用戶界面,設(shè)計(jì)圖像閾值分割算法軟件,并提出一種基于和聲搜索的閾值分割算法,不僅能讓學(xué)生直觀感受不同圖像閾值分割算法的特點(diǎn)與效果,還啟發(fā)學(xué)生對(duì)科研創(chuàng)新的靈感。
二、圖像閾值分割算法
1.圖像閾值分割原理[1]
假設(shè)圖像中的灰度直方圖對(duì)應(yīng)于圖像f(x,y),該圖像由暗色背景上的較亮物體組成,以這樣的組成方式,物體像素和背景像素所具有的灰度值組成了兩種支配模式。閾值分割即通過(guò)選擇閾值T,將不同模式分開(kāi),從背景中提取物體。此時(shí),f(x,y)>T的任何點(diǎn)(x,y)為一個(gè)對(duì)象點(diǎn);否則為背景點(diǎn)。分割后的圖像g(x,y)如(1)所示。
g(x,y)=1, ? f(x,y)>T ? 0, ? f(x,y)≤T(1)
式(1)中,當(dāng)適用于整個(gè)圖像時(shí)為全局閾值處理。當(dāng)T值發(fā)生改變時(shí),圖像中任何點(diǎn)(x,y)的T值取決于(x,y)的鄰域特性(例如鄰域中像素的平均灰度),此時(shí)為可變閾值。
2.全局閾值
全局閾值的分割與點(diǎn)的灰度值有關(guān)。整幅圖像使用同一個(gè)閾值做分割處理,適用于背景和前景有明顯對(duì)比的圖像。
(1)基本全局閾值
在目標(biāo)和背景差異明顯、灰度值相差較大的時(shí)候,采用基本全局閾值比較好。如圖1所示,原始圖像取自伯克利數(shù)據(jù)庫(kù)。[2]分割閾值選擇直方圖中兩個(gè)波峰間的波谷所對(duì)應(yīng)的灰度值,實(shí)現(xiàn)對(duì)場(chǎng)景中月亮的分割。
(2)Otsu最佳閾值
Otsu算法采取最大類(lèi)間方差作為判斷標(biāo)準(zhǔn),不需要輸入附加參數(shù)。不論圖像的直方圖是否有明顯的雙峰,均可以找到較理想的閾值,獲取較好的分割效果。圖2為生物質(zhì)燃料燃燒實(shí)驗(yàn)中的火焰圖像,其直方圖沒(méi)有明顯的雙峰。采用Otsu最佳閾值分割,其分割效果如圖2c所示。分割有助于提取火焰面積、形狀等特征信息,進(jìn)一步進(jìn)行燃燒狀況、燃料燃燒性能等的深入研究。
(3)多閾值
多閾值是對(duì)單個(gè)閾值的擴(kuò)展。當(dāng)圖像直方圖有多個(gè)波峰波谷的時(shí)候,可以采用多閾值處理把圖像分割成多個(gè)區(qū)域。圖3原始圖像取自伯克利數(shù)據(jù)庫(kù)[2],采用多閾值分割效果如圖3所示。
3.可變閾值
(1)分塊閾值
可變閾值分割與圖像像素的空間坐標(biāo)有關(guān)。當(dāng)照明不均勻、有突發(fā)噪聲或者背景灰度變化較大時(shí),分塊閾值分割能得到較好的分割效果。將原始圖像劃分成較小的子圖像,并對(duì)每個(gè)子圖像選取相應(yīng)的閾值。圖4為某燃煤機(jī)組爐膛燃燒層的燃燒火焰圖像,煤粉和一次風(fēng)混合氣流從左側(cè)進(jìn)入爐膛,在火焰圖像中形成一段類(lèi)似舌形黑龍的區(qū)域,即未燃燒區(qū)。通過(guò)圖像分割可提取未燃燒區(qū)信息,對(duì)進(jìn)一步研究爐內(nèi)燃燒狀況具有重要作用。
(2)局部閾值
局部閾值分割可以根據(jù)圖像的局部特征進(jìn)行處理,其與圖像像素位置、灰度值及鄰域特征值有關(guān)。圖5為墻體裂縫圖像,由于光源位置和拍攝角度產(chǎn)生光照不均問(wèn)題,采用局部閾值分割可以得到比較好的效果。
三、基于和聲搜索的閾值分割算法
1.和聲搜索算法思想
和聲搜索(Harmony Search,HS)算法是一種新穎的智能優(yōu)化算法,模擬了音樂(lè)演奏的原理?;竞吐曀阉魉惴ㄋ枷肴缦拢篬3]
Step1:在可選音調(diào)范圍[xmin,xmax]內(nèi)隨機(jī)產(chǎn)生與和聲記憶庫(kù)大?。℉armony Memory Size,HMS)數(shù)目相同的HMS組音調(diào)X1、X2……XHMS。其中每組音調(diào)包含n個(gè)音,以X1為例:X1=[X11,X12,…,X1n],x11,x12,…,x1n皆屬于[xmin,xmax]范圍。
Step2:將每組音調(diào)按照某種組合方式生成HMS個(gè)和聲f(X1)、f(X2)……f(XHMS)。將每組音調(diào)與對(duì)應(yīng)的和聲一起放入和聲記憶庫(kù)(Harmony Memory,HM),得到初始化和聲記憶庫(kù),其形式如(2)所示:
Step3:在[0,1]之間隨機(jī)產(chǎn)生一個(gè)變量r1,將r1與記憶庫(kù)取值概率(Harmony Memory Considering Rate,HMCR)相比較。如果r1小于HMCR,則在初始化的和聲記憶庫(kù)中隨機(jī)選取一組和聲。否則,在可選音調(diào)范圍[xmin,xmax]隨機(jī)產(chǎn)生一組音調(diào),按照Step2中的組合方式生成得到一組和聲。
Step4:如果這組和聲是從和聲記憶庫(kù)中得到的,需要對(duì)這組和聲進(jìn)行微調(diào)。在[0,1]之間隨機(jī)產(chǎn)生變量r2,如果r2小于音調(diào)微調(diào)概率(Pitch Adjusting Rate,PAR),則隨機(jī)讓音調(diào)向上或向下調(diào)整微調(diào)帶寬 (band width,bw)大小,得到一組新和聲。否則,不做調(diào)整。
Step5:若新和聲優(yōu)于和聲記憶庫(kù)中最差和聲,則用新和聲替換最差和聲,得到新的和聲記憶庫(kù)。否則,和聲記憶庫(kù)不做改變。不斷重復(fù)Step3、Step4,直到創(chuàng)作(迭代)次數(shù)達(dá)到設(shè)定值。此時(shí)和聲記憶庫(kù)中的最優(yōu)和聲即為所求。
2.基于和聲搜索的圖像閾值分割
基于和聲搜索的圖像閾值分割算法,本質(zhì)是進(jìn)行閾值尋優(yōu)。通過(guò)選取圖像類(lèi)間灰度均值差作為和聲搜索算法的目標(biāo)函數(shù),能使類(lèi)間灰度均值差最大的閾值即為分割閾值。其分割流程如圖6所示。
針對(duì)電纜隧道的隧道墻體裂紋檢測(cè),隧道的特殊環(huán)境會(huì)使攝像機(jī)拍攝墻體圖片時(shí),出現(xiàn)光照不足和對(duì)比度不高情況。對(duì)此墻體圖像進(jìn)行圖像處理檢測(cè)裂縫,采用本文所提出的基于類(lèi)間灰度均值差的和聲搜索算法進(jìn)行分割,并與其他閾值分割算法進(jìn)行對(duì)比,如圖7所示。基于類(lèi)間灰度均值差的和聲搜索算法可以取得較為滿意的結(jié)果。
四、基于圖形用戶界面的圖像閾值分割
圖形用戶界面主要由窗口、菜單、對(duì)話框等各種圖形對(duì)象組成,便于人機(jī)交互。[4]本文基于圖形用戶界面編程實(shí)現(xiàn)包括圖像全局閾值分割、可變閾值分割以及基于和聲搜索的閾值分割在內(nèi)的7種圖像分割算法。
1.圖像閾值分割界面設(shè)計(jì)
為便于實(shí)驗(yàn)演示和學(xué)生操作,設(shè)計(jì)軟件通過(guò)選擇圖像按鈕獲取圖像并得到圖像直方圖分別顯示在兩個(gè)axes部件,通過(guò)點(diǎn)擊不同的圖像閾值分割算法可以對(duì)圖像進(jìn)行處理并在第三個(gè)axes部件上輸出圖像??删庉嫿缑嫒鐖D8所示。
軟件中包含七種分割算法可供選擇,通過(guò)不同的算法可以得到不同的分割效果。用戶界面可對(duì)分割算法參數(shù)進(jìn)行調(diào)整,包括改變多閾值分割閾值數(shù)量、改變局部閾值分割中濾波窗口的大小、改變自適應(yīng)閾值分割的分塊數(shù)目。學(xué)生可以在實(shí)際操作中了解各種分割算法及參數(shù)對(duì)分割效果的影響,從而在今后圖像分割算法的選擇上得到啟發(fā)。
2.圖形用戶界面運(yùn)行
圖形用戶界面運(yùn)行窗口如圖9所示。通過(guò)點(diǎn)擊選擇圖像可獲取原始圖像及原始圖像直方圖,點(diǎn)擊所選算法,可直觀顯示圖像分割效果。再次選擇其他算法,可以獲得不同算法對(duì)同一圖像的處理結(jié)果,通過(guò)保存圖像按鈕可以保存原始圖像、原始圖像直方圖及處理后的圖片,便于學(xué)生之后進(jìn)行更細(xì)致的對(duì)比和分析。
五、教學(xué)應(yīng)用及效果
圖像處理與分析課程具有較強(qiáng)的理論性和實(shí)踐性,為提升學(xué)生的綜合素質(zhì)和創(chuàng)新能力,針對(duì)圖像閾值分割的教學(xué),基于教學(xué)內(nèi)容和教學(xué)方法進(jìn)行研究和改進(jìn)。
一是融入學(xué)科前沿和電力特色的教學(xué)內(nèi)容。針對(duì)圖像閾值分割,除了講授經(jīng)典分割方法,如全局閾值、Otsu最佳閾值、多閾值、分塊閾值和局部閾值等,還給學(xué)生引入了基于和聲搜索的閾值分割,及時(shí)讓學(xué)生了解和關(guān)注到前沿知識(shí)和技術(shù)。針對(duì)圖像閾值分割案例,緊密結(jié)合電力大學(xué)的學(xué)科特色,所選用的圖像閾值分割案例包括電廠鍋爐燃燒火焰圖像、電纜隧道的墻體裂紋圖像,以及生物質(zhì)燃燒火焰圖像等,把工程實(shí)際和科研項(xiàng)目中的相關(guān)圖像處理內(nèi)容融入教學(xué)過(guò)程中,實(shí)現(xiàn)專(zhuān)業(yè)知識(shí)和研究領(lǐng)域緊密結(jié)合。
二是理論和實(shí)踐并重的教學(xué)方法。首先通過(guò)理論講解,讓學(xué)生初步學(xué)習(xí)不同圖像閾值分割的算法原理,然后通過(guò)所設(shè)計(jì)的圖像閾值分割軟件,演示不同閾值分割算法的分割效果,以及分割算法中參數(shù)改變對(duì)分割效果的影響,讓學(xué)生直觀體會(huì)不同分割算法、不同參數(shù)的分割效果和特點(diǎn),有助于學(xué)生理解不同分割算法的適用范圍。理論和實(shí)踐并重的教學(xué)方法,加深了學(xué)生對(duì)算法的理解,激發(fā)了學(xué)生的學(xué)習(xí)興趣。
六、結(jié)語(yǔ)
在圖像處理與分析課程教學(xué)過(guò)程中,本文針對(duì)閾值分割算法和效果進(jìn)行研究,提出了一種基于和聲搜索的閾值尋優(yōu)算法。基于圖形用戶界面,設(shè)計(jì)實(shí)現(xiàn)包括基本全局閾值、Otsu最佳全局閾值、多個(gè)全局閾值、局部均值閾值、局部中值閾值、自適應(yīng)分塊閾值以及基于和聲搜索的閾值分割算法。在教學(xué)中,實(shí)現(xiàn)了將學(xué)科前沿和電力特色內(nèi)容融入基礎(chǔ)知識(shí)的教學(xué)內(nèi)容改進(jìn),以及理論與實(shí)踐并重的教學(xué)模式。所設(shè)計(jì)的教學(xué)圖像閾值分割軟件不僅方便學(xué)生使用,而且培養(yǎng)了學(xué)生創(chuàng)新思維和科研能力。
參考文獻(xiàn):
[1](美)Rafael C.Gonzalez,Richard E.Woods;阮秋琦,阮宇智等譯.數(shù)字圖像處理(第三版)[M].北京:電子工業(yè)出版社,2011.6:443-513.
[2]Arbelaez P,Maire M,F(xiàn)owlkes C,et al.Contour Detection and Hierarchical Image Segmentation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2011,33(5): 898-916.
[3]趙玉新,楊新社,劉利強(qiáng).新興元啟發(fā)式優(yōu)化方法[M].北京:科學(xué)出版社,2013.8:201-219.
[4]宗節(jié)保,段柳云,王瑩等.基于MATLAB GUI軟件制作方法的研究與實(shí)現(xiàn)[J].電子設(shè)計(jì)工程,2010,18(7):54-56.
(編輯:王天鵬)