奉琦 黎小琴
摘要:本文基于Matlab平臺(tái)設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)數(shù)字圖像實(shí)驗(yàn)軟件,主要是利用Matlab圖像處理工具箱進(jìn)行數(shù)字圖像處理的一些常見(jiàn)的經(jīng)典操作,其中包括Matlab實(shí)現(xiàn)圖像的圖像分割、圖像的幾何變換、圖像的平滑銳化、直方圖均衡化、邊緣檢測(cè)等圖像處理操作。系統(tǒng)運(yùn)行效果良好,界面美觀,操作人性化。
關(guān)鍵詞:數(shù)字圖像處理;MATLAB;圖形用戶界面
1 引言
數(shù)字圖像的起源可以追溯到20世紀(jì)五十年代,隨著信息科技的發(fā)展以及人們對(duì)圖像處理的要求,用數(shù)字化對(duì)圖像進(jìn)行處理開(kāi)始慢慢發(fā)展。其主要原理為將所輸入的圖像信號(hào)轉(zhuǎn)變?yōu)閿?shù)字信號(hào),這樣就可以被計(jì)算機(jī)所識(shí)別。本文的設(shè)計(jì)主要是基于MATLAB的數(shù)字圖像處理實(shí)驗(yàn)軟件平臺(tái)開(kāi)發(fā),創(chuàng)建一個(gè)圖形用戶界面,主要包括菜單欄、一般處理、圖像分割、圖像的幾何處理、噪聲添加、平滑銳化、直方圖均衡化、邊緣檢測(cè)等主模塊及相應(yīng)的子模塊,界面簡(jiǎn)潔,功能良好。
2 系統(tǒng)總框架設(shè)計(jì)
本系統(tǒng)主界面主要由9個(gè)主模塊及其子模塊組成,在系統(tǒng)框架中,將平滑與銳化合并到了一起,系統(tǒng)框架如圖1所示。
2.1 系統(tǒng)各模塊的功能
(1)菜單欄:包括載人圖片、保存圖片、退出;
(2)一般處理模塊:包括圖像的灰度、底片處理、截圖處理;
(3)圖像分割模塊:包含區(qū)域提取法和閾值分割;
(4)圖像的幾何變換模塊:包括有圖像的仿射變換,順、逆時(shí)針360°旋轉(zhuǎn);
(5)添加噪聲模塊:包括圖像的椒鹽噪聲、高斯噪聲的添加;
(6)平滑和銳化模塊:其中包括圖像的中值濾波與均值濾波的平滑,Laplacian算子Prewitt算子與Sobel算子的銳化;
(7)直方圖均衡化模塊:其中包括原圖直方圖、均衡化以后的灰度圖和均衡化以后的RGB圖;
(8)邊緣檢測(cè)模塊:包括圖像的不同算子(Canny算子、Log算子、Sobel算子、Prewitt算子和Roberts算子)的檢測(cè);
(9)其他操作:包括圖像的撤銷(xiāo)與還原。
其系統(tǒng)界面如圖2。
3 模塊具體設(shè)計(jì)
3.1 文件菜單
文件的菜單包含有三個(gè)功能:載人圖片、保存圖片以及退出。為了使用戶界面更加清楚明白,可以將這三個(gè)功能設(shè)置為菜單欄。
我們主要利用imread函數(shù)和imshow函數(shù)來(lái)讀取圖片。在GUI界面上創(chuàng)建兩個(gè)坐標(biāo)軸(將第一個(gè)坐標(biāo)軸命名為原圖像,第二個(gè)坐標(biāo)軸命名為效果圖),用來(lái)顯示圖片,然后,利用imread函數(shù)讀取圖片再通過(guò)ims-how函數(shù)將所選取圖片展示在第一個(gè)坐標(biāo)軸內(nèi)。
圖片保存主要利用imwrite函數(shù)。載入圖片之后,我們可以對(duì)其進(jìn)行平臺(tái)上的任何處理,然后將所得的新圖像顯示在第二個(gè)坐標(biāo)軸也就是效果圖內(nèi)。當(dāng)系統(tǒng)檢測(cè)到效果圖中含有文件,uiputfile函數(shù)可以將圖片以默認(rèn)名字untitled.jpg進(jìn)行保存。否則圖像將“取消保存”。
退出程序則相對(duì)簡(jiǎn)單,直接利用close函數(shù)關(guān)閉文件即可。
3.2 一般處理
灰度圖像是具有相同的顏色分量的特殊彩色圖像。在MATLAB里我們對(duì)原圖進(jìn)行灰度轉(zhuǎn)化主要是利用rgb2gray函數(shù)。當(dāng)所選圖片的像素?cái)?shù)大于2時(shí),圖片才可從RGB格式轉(zhuǎn)換成灰度圖像。
在MATLAB當(dāng)中對(duì)指定圖像進(jìn)行底片處理(取反運(yùn)算)就是RGB圖像到CMY的一種轉(zhuǎn)換。假設(shè)RGB中某一像素值為x,可以利用(255-x)得到CMY空間。底片處理的操作主要是運(yùn)用imcomplement函數(shù),圖像可以為二值圖像、灰度圖像或者RGB圖像。
截圖是運(yùn)用imcrop函數(shù)來(lái)完成對(duì)圖片某一區(qū)域的截取,使用此功能,用戶可以用鼠標(biāo)交互式地選擇要截取的區(qū)域。這樣可以更好的實(shí)現(xiàn)用戶友好界面,滿足使用者任意截取圖像的想法。
3.3 圖像分割
圖像分割中的區(qū)域提取主要是利用Hough變換,霍夫變換的關(guān)鍵點(diǎn)在于投票算法,將圖像坐標(biāo)轉(zhuǎn)換到參數(shù)坐標(biāo)然后再求解。若要解出在一幅圖片中的某條直線所在的參數(shù)坐標(biāo),我們可以通過(guò)直線的方程y=kx+b求得,即點(diǎn)(x0,y0)確定了一簇直線。方程y0=kx0+b在參數(shù)k-b平面上是一條直線(b=-kx0+y0),這樣,圖像x-y平面上的一個(gè)像素點(diǎn)就對(duì)應(yīng)到了參數(shù)k-b平面上的一條直線,霍夫變換的基本思想是把圖像平面上的點(diǎn)映射到參數(shù)平面上的線。
閾值分割也就是指圖像的閾值化處理,具體是指根據(jù)圖像的若干灰度級(jí)設(shè)定一個(gè)灰度級(jí)作為閾值或門(mén)限,將圖像中的像素的灰度值與該閾值或門(mén)限逐次地進(jìn)行比較。本文選取了四種方法進(jìn)行圖像的閾值分割。
(1)均勻性度量法的研究思路,我們使用方差來(lái)衡量像素是否均衡分布,如果將圖像分成不同的目標(biāo)和不同的背景時(shí),那么屬于相同類(lèi)別的像素值的分布就會(huì)是均勻的。
(2)類(lèi)間最大距離法可以告訴我們最好的最完善的分割是在給定閾值時(shí),經(jīng)過(guò)圖像分割之后的前景對(duì)象和背景門(mén)類(lèi)之間的差異。要測(cè)量?jī)蓚€(gè)類(lèi)別之間的差異可以計(jì)算類(lèi)別的中心之間的距離差異和閾值。
(3)最大嫡方法,嫡是衡量數(shù)據(jù)中信息量的一種度量,當(dāng)?shù)杖≈底畲髸r(shí),意味著獲得的信息量最大。設(shè)計(jì)思想是選擇一個(gè)合適的閾值然后將圖像分為兩類(lèi),若是兩類(lèi)平均熵之和最大,則從圖像中獲取最大信息量,并設(shè)置最佳閾值最后確認(rèn)。
(4)最大類(lèi)間、類(lèi)內(nèi)方差比法,在統(tǒng)計(jì)上,方差是代表數(shù)據(jù)分布不平衡的統(tǒng)計(jì)數(shù)據(jù)。為了通過(guò)閾值對(duì)兩種問(wèn)題進(jìn)行分類(lèi),很明顯適當(dāng)?shù)拈撝凳沟脙蓚€(gè)數(shù)據(jù)之間的差異盡量大。
3.4 圖像的幾何變換
圖像的幾何處理功能模塊含有圖像的仿射變換以及圖像的旋轉(zhuǎn)兩種功能。
設(shè)原圖像坐標(biāo)為(i,j),變換后圖像的坐標(biāo)為(i′,j′),則滿足式(1),
的變換稱為仿射變換。
圖像的旋轉(zhuǎn)以順時(shí)針或逆時(shí)針?lè)较蛞蕴囟ń嵌刃D(zhuǎn),使用圖像中的某個(gè)點(diǎn)作為原點(diǎn),本系統(tǒng)設(shè)計(jì)是以圖片中心為旋轉(zhuǎn)點(diǎn)旋轉(zhuǎn),通常會(huì)調(diào)整圖像的大小,系統(tǒng)選擇從顯示區(qū)域提取圖像。
3.5 添加噪聲
添加噪聲功能模塊。本圖像處理實(shí)驗(yàn)軟件平臺(tái)主要利用f=imnoise()函數(shù),實(shí)現(xiàn)對(duì)椒鹽噪聲與高斯噪聲的添加。椒鹽噪聲出現(xiàn)在圖像中是比較明顯的,對(duì)于圖像分割或是邊緣檢測(cè)再或特征提取等一些后面的操作具有很厲害的破壞性。
3.6 平滑和銳化
平滑和銳化功能模塊主要含有平滑濾波和銳化濾波兩個(gè)功能,平滑主要是對(duì)圖像進(jìn)行均值濾波處理、中值濾波處理。銳化則主要是對(duì)圖像進(jìn)行Sobel算子銳化、Prewitt算子銳化與Laplacian算子銳化。
均值濾波包含相鄰像素及其自己的像素,利用該模板中全部像素的平均值替代原始像素值。
中值濾波是一種非線性信號(hào)處理技術(shù),它基于排序統(tǒng)計(jì)理論有效地抑制了噪聲,其實(shí)現(xiàn)原理如下:根據(jù)灰度值對(duì)某一像素鄰域內(nèi)的像素進(jìn)行排序,然后選擇該序列的中間值作為輸出像素值,以使灰度差異較大的像素周期性像素的值應(yīng)該繞過(guò)像素值并且接近該值,以此來(lái)消除孤立的噪聲點(diǎn)。中值濾波可用于在移動(dòng)窗體時(shí)給圖像進(jìn)行平滑處理。該算法較為簡(jiǎn)單,且時(shí)間的復(fù)雜度較低。主要使用medfilt2函數(shù)實(shí)現(xiàn)中值濾波。
在圖像增強(qiáng)期間,使用不同類(lèi)型的圖像平滑算法來(lái)消除噪聲,有一定效果,但是在原始圖像被平滑之后,會(huì)出現(xiàn)另外的問(wèn)題,像是模糊圖像的邊緣和圖像的輪廓的情況。為了減少這些不好的影響,有必要使用圖像的銳化來(lái)增亮圖像的邊緣,但是應(yīng)該指出的是,可以銳化的圖像具有較高的噪聲比,否則圖像噪聲比銳化后的噪聲會(huì)降低,這會(huì)導(dǎo)致比信號(hào)更多的噪音,因此通常的做法是首先去除或降低噪音,然后重新加工。本系統(tǒng)就選擇了三種算子進(jìn)行銳化處理,采用h=fspecial()函數(shù)定義算子,然后利用imadd函數(shù)添加算子銳化邊緣。
由于算子引入了相似的部分平均運(yùn)算,能有效地對(duì)噪聲進(jìn)行平滑,這樣可以很好地去掉噪聲的影響。Sobel算子由兩組3X3的矩陣組成,即水平和垂直模板。水平和垂直亮度差差不多可以通過(guò)將該圖像與圖像水平卷積來(lái)獲得。然而,當(dāng)單獨(dú)使用Sohel算子來(lái)執(zhí)行邊緣檢測(cè)和邊緣銳化時(shí),邊緣定位精度不夠高,邊緣像素可能大于某些邊緣地方的響應(yīng)或響應(yīng)差異不顯著,從而導(dǎo)致漏檢或誤檢。
Prewitt算子在使用圖像空間中的圖像執(zhí)行鄰域卷積時(shí),使用兩個(gè)方向模板,一個(gè)用于檢測(cè)水平邊緣,一個(gè)用于檢測(cè)垂直邊緣。
經(jīng)過(guò)Prewitt算子處理后的所展示出來(lái)的圖片與Sobel算子處理后所展示出來(lái)的圖片很相似。但是,作為模板系數(shù)變化的結(jié)果,與Sobel算子相比,可以在一定程度上提高干涉預(yù)防效果。
鑒于拉普拉斯算子是一個(gè)微分算子,它強(qiáng)調(diào)了圖像的灰度變換,同時(shí)減少了灰度轉(zhuǎn)換速度較緩的區(qū)間,得到圖像邊緣增強(qiáng)的效果,如果在突出邊緣信息的同時(shí)希望能夠保持原圖像的細(xì)節(jié),可以在該模板中增加當(dāng)前像元數(shù)據(jù)的權(quán)重。
3.7 直方圖均衡化處理
原圖的灰度直方圖主要是先利用rgb2gray函數(shù)將彩色圖像轉(zhuǎn)變?yōu)榛叶葓D像,然后用imhist函數(shù)將灰度圖像用直方圖表示。
直方圖均衡主要用于處理灰度圖像,并且原始圖像直方圖從相對(duì)灰度間隔變?yōu)槿叶确秶?/p>
均衡化后的灰度圖像就是將原始圖像的直方圖改成均衡分布的形式,以此來(lái)讓圖片質(zhì)量更完美。利用histeq函數(shù),使灰度圖像處理后的圖像更加順眼。RGB圖像是將原圖中的各種顏色,都用不同比例的紅(R)、綠(G)、藍(lán)(B)混合而成。這里主要也是使用histeq函數(shù)來(lái)將圖像轉(zhuǎn)化為RGB圖像。
3.8 邊緣檢測(cè)
邊緣檢測(cè)的基本原理是先利用邊緣增強(qiáng)算子來(lái)強(qiáng)調(diào)圖像中物體的邊緣,計(jì)算灰度圖像中的邊緣強(qiáng)度,最后設(shè)置閾值提取點(diǎn)。
檢測(cè)算子都是用edge函數(shù)實(shí)現(xiàn)邊緣檢測(cè)實(shí)現(xiàn),在界面邊緣檢測(cè)按鈕中回調(diào)函數(shù),顯示其結(jié)果,這幾種邊緣檢測(cè)算子各有其特點(diǎn):
(1)Roberts算子比較淺顯易懂,而且雖然對(duì)具有明顯的低噪聲的圖像效果很完美,但是對(duì)于邊沿的提取卻很不嚴(yán)謹(jǐn),而且容易受噪聲影響;
(2)Prewitt算子與Sobel算子都擁有對(duì)圖像的平滑作用,可以減少少許噪聲,也能抹掉一些假的邊沿,再一個(gè)可以對(duì)真正的邊沿進(jìn)行平滑,不過(guò)定位精確度不高;Sobel邊緣檢測(cè)算子的高頻像素少,低頻像素多,降低了像素的平均灰度值;
(3)Log算子和Canny算子可以保存圖像邊緣細(xì)節(jié),Log算子在最開(kāi)始的時(shí)候會(huì)對(duì)圖片執(zhí)行高斯模板濾波并在某種程度上模糊圖像的邊緣,邊緣提取由Canny算子提取,提取出來(lái)的邊緣概況非常明顯而且很?chē)?yán)謹(jǐn),不會(huì)出現(xiàn)錯(cuò)誤。
4 結(jié)束語(yǔ)
本實(shí)驗(yàn)平臺(tái)包含了一些常見(jiàn)的經(jīng)典操作,包括圖像分割、圖像的幾何變換,圖像的添加噪聲,圖像的平滑與銳化、直方圖均衡化以及邊緣檢測(cè)。該平臺(tái)界面美觀易操作,學(xué)生在實(shí)際操作后能更好地掌握數(shù)字圖像處理的基本原理。
參考文獻(xiàn)
[1]陳剛,魏晗,高毫林.MATLAB在數(shù)字圖像處理中的應(yīng)用[M].清華大學(xué)出版社,2016.
[2]梅林.基于K-均值聚類(lèi)及數(shù)學(xué)形態(tài)學(xué)的細(xì)胞圖像自動(dòng)分割方法研究[D].重慶大學(xué),2014.
[3]劉麗麗.適于重要場(chǎng)所個(gè)人身份的步態(tài)識(shí)別技術(shù)研究[D].哈爾濱工程大學(xué),2009.