伊力哈木·亞爾買買提
摘 要: 針對(duì)復(fù)雜背景下維吾爾文字圖像分割時(shí)產(chǎn)生缺陷和干擾問題,提出一種自適應(yīng)二值勢函數(shù)目標(biāo)模糊C均值算法。首先,使用自適應(yīng)勢目標(biāo)二值函數(shù)聚類方法來獲取集群的維吾爾文字二值圖像分割和聚類中心,然后利用其隸屬度矩陣的最佳數(shù)量確定模糊計(jì)算維吾爾文字圖像分割模糊聚類的維吾爾文字圖像。實(shí)驗(yàn)結(jié)果表明,該算法可以實(shí)現(xiàn)維吾爾文字圖像的自適應(yīng)分割,準(zhǔn)確地分割出維吾爾文字區(qū)域部分,同時(shí)極大地減少了計(jì)算復(fù)雜性,有利于實(shí)現(xiàn)維吾爾文字圖像處理的準(zhǔn)確度。
關(guān)鍵詞: 維吾爾文字; 勢函數(shù); 隸屬度矩陣; 像素分割理論
中圖分類號(hào): TN911.73?34; TP391 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2017)04?0120?04
Research on an improved image segmentation algorithm for Uyghur characters
YILIHAMU Yaermaimaiti
(College of Electrical Engineering, Xinjiang University, Urumqi 830047, China)
Abstract: Since the Uyghur characters segmented under the complicated background may cause the defect and interference, a binary potential function target segmentation algorithm of the adaptive fuzzy C?means is proposed. The adaptive potential target binary function clustering method is used to segment the Uyghur characters binary image of the clustering and obtain the clustering center. The optimal quantity of the membership matrix is employed to determine the Uyghur characters image by means of the pixel segmentation theory, which obtained from the Uyghur characters′ image segmentation fuzzy clustering with fuzzy calculation. The experimental results show this algorithm can segment the Uyghur characters image adaptively and Uyghur characters area accurately, reduce the computational complexity greatly, and is conducive to the improvement of the image processing accuracy of the Uyghur characters.
Keywords: Uyghur character; potential function; membership matrix; pixel segmentation theory
0 引 言
對(duì)維吾爾文字符圖像分割識(shí)別的研究,不僅可以增強(qiáng)對(duì)新疆少數(shù)民族信息處理技術(shù)的提高和中國多文種信息處理及辦公自動(dòng)化具有很大的促進(jìn)作用,而且對(duì)使用阿拉伯文字的國家和民族也具有較強(qiáng)的適應(yīng)性和通用性[1]。
現(xiàn)在維吾爾文字圖像目標(biāo)分割技術(shù)具有不同類型的分割方法,比較有突出代表性的有邊緣目標(biāo)檢測法,閾值目標(biāo)分割法,特定區(qū)域目標(biāo)生長方法和特征目標(biāo)二值聚類算法等[2]。
邊緣檢測法主要是基于圖像像素的邊界點(diǎn)的主要邊緣檢測算子突變的灰色值,如果圖像檢測數(shù)據(jù)的邊緣呈現(xiàn)不連續(xù)性,則主要分為兩種類型的串行和并行算法,其缺點(diǎn)是圖像的形象尚不清楚,或包含更多的邊緣差分割。基于圖像區(qū)域方法其特性值為類似圖像的同一區(qū)域,區(qū)域或類似像素和像素區(qū)域是基于區(qū)域的方法,單獨(dú)和不同切片區(qū)域最終形成很大的差異,缺點(diǎn)是其進(jìn)程序列的性質(zhì),有選擇的種子和像素或區(qū)域過程, 很強(qiáng)依賴性及高復(fù)雜性和測試序列對(duì)象在灰度圖像閾值分割方法,應(yīng)用最廣泛?;叶葓D像直方圖有多個(gè)峰值,每一個(gè)峰對(duì)應(yīng)于區(qū)域,此算法的缺點(diǎn)是該算法考慮到只是灰色的級(jí)別的信息,無視圖像的空間信息,并且呈現(xiàn)不連續(xù)性。
鑒于此,提出一種新的基于維吾爾文字圖像的自適應(yīng)模糊C均值的二值勢函數(shù)目標(biāo)分割算法。首先確定潛在二值函數(shù)聚類算法第一圖像自適應(yīng)的最優(yōu)簇?cái)?shù)目,然后確定聚類函數(shù)中心和最后分割的維吾爾文字圖像模糊二值聚類方法。實(shí)驗(yàn)結(jié)果表明該算法可以實(shí)現(xiàn)維吾爾文字圖像的自適應(yīng)分割。
1 勢函數(shù)聚類方法
1.1 基于圖像分割的二值勢函數(shù)聚類算法
定義1:設(shè)代表一類數(shù)字圖像,,代表準(zhǔn)備圖像分割的具體大小是,代表準(zhǔn)備分割的圖像在像素為單位點(diǎn)的灰度平均值。確定準(zhǔn)備分割的圖像的質(zhì)量分布圖機(jī)會(huì)率密度函數(shù)為[3]:
(1)
式中,
(2) 灰度平均值為的像素單位點(diǎn)在準(zhǔn)備分割的圖像中表現(xiàn)的機(jī)會(huì)率由近似局部表示。在準(zhǔn)備分割的圖像中,不同的圖像目標(biāo)區(qū)域和圖像背景區(qū)域,要準(zhǔn)備分割的圖像像素單位點(diǎn)的灰度值不均勻地分布在所有灰度圖像,但主要集中在幾個(gè)不同灰度范圍,這表明一定灰度范圍內(nèi)出現(xiàn)圖像單位像素點(diǎn)的灰度值機(jī)會(huì)率相對(duì)較大,這就是圖像質(zhì)量分布圖機(jī)會(huì)率函數(shù)曲線表現(xiàn)出的特征峰的原因。
定義2:設(shè)代表準(zhǔn)備分割的圖像的質(zhì)量分布圖機(jī)會(huì)率函數(shù),并設(shè)定將準(zhǔn)備分割的圖像的歸一化質(zhì)量分布圖機(jī)會(huì)率函數(shù)為:
(3) 式中,,通過歸一化質(zhì)量分布圖函數(shù)的定義,質(zhì)量分布圖機(jī)會(huì)率函數(shù)變換范圍為區(qū)間。
定義3:將分割的維吾爾文字圖像的質(zhì)量分布圖二值勢函數(shù)表示為:
(4)
準(zhǔn)備分割的圖像的質(zhì)量分布圖勢函數(shù)本質(zhì)是對(duì)勢函數(shù)的基準(zhǔn)點(diǎn)的插值,其基礎(chǔ)函數(shù)一般采用的模式。作為一個(gè)平滑二值函數(shù),其二值自變量的漲勢呈現(xiàn)平方二值化倒數(shù)的比值遞減,因此,質(zhì)量分布圖勢函數(shù)較二值歸一化機(jī)會(huì)率函數(shù)要光滑很多。使用適當(dāng)?shù)姆亲兞靠刂贫狄蜃?,則質(zhì)量分布圖勢函數(shù)與歸一化二值質(zhì)量分布圖機(jī)會(huì)率函數(shù)的特征峰谷特性十分相似[4]。
定義4:定義準(zhǔn)備分割的維吾爾文字圖像的歸一化二值函數(shù)質(zhì)量分布圖勢函數(shù)為:
(5)
其歸一化的二值函數(shù)質(zhì)量分布圖勢函數(shù)的定義即將函數(shù)質(zhì)量分布圖二值勢函數(shù)變換為區(qū)間。
定義5:設(shè)為準(zhǔn)備分割的有效維吾爾文字圖像的當(dāng)前歸一化的二值質(zhì)量分布圖勢函數(shù),其準(zhǔn)備分割的維吾爾文字圖像的二值函數(shù)質(zhì)量分布圖階剩余的有效二值勢函數(shù)為:
(6)
式中:
(7)
為半徑衰減控制函數(shù)因素;為二值函數(shù)質(zhì)量分布圖中其特征波峰的基數(shù)值。
定義模糊衰減因子:
(8)
式中:為實(shí)驗(yàn)基本常數(shù);代表準(zhǔn)備分割的圖像灰度級(jí)的深度,其代表值為準(zhǔn)備分割的圖像中最大和最小像素灰度規(guī)模的區(qū)別[5]。
定義6:基于質(zhì)量分布圖二值函數(shù)的剩余潛力定義為潛在分區(qū)二值函數(shù)組數(shù)為:
(9)
式(9)表示潛在的分區(qū)函數(shù)組就是其中心點(diǎn)在并其高度為的四次二值基函數(shù)。在潛在的分區(qū)函數(shù)組中,如果各個(gè)特征波峰在質(zhì)量分布圖潛在的分區(qū)函數(shù)中分布均勻,則兩個(gè)峰值之間的最佳距離應(yīng)為。
定義7:自適應(yīng)模糊二值贗勢因子。
系數(shù)如下:
(10)
式中,為一實(shí)驗(yàn)常數(shù)。
設(shè)和為潛在的分區(qū)函數(shù)組中兩個(gè)橫向相鄰的峰值點(diǎn)的潛在功能分區(qū)坐標(biāo),其結(jié)果值由式(7)計(jì)算得到,若:
(11)
則其中一個(gè)潛在的分區(qū)函數(shù)為偽勢,此時(shí)將這兩個(gè)潛在的分區(qū)函數(shù)合并。合并偽勢的具體做法為:分別提取質(zhì)量分布圖潛在的分區(qū)函數(shù)組中存在偽勢的兩個(gè)質(zhì)量分布圖潛在的分區(qū)函數(shù)的極值,比較這兩個(gè)穩(wěn)定值獲得其一的最大值,接下來將這兩個(gè)潛在的分區(qū)函數(shù)二值曲線疊加,并且來合并其和二值勢函數(shù)如式(12)所示,然后進(jìn)一步得到質(zhì)量分布圖潛在合并偽勢后的分區(qū)函數(shù):
(12) 式中:表示潛在的分區(qū)二值函數(shù)存在偽勢的兩個(gè)質(zhì)量分布圖的最大值;代表和函數(shù)的穩(wěn)定二值基數(shù)點(diǎn)。
1.2 最大勢剩余高度的自適應(yīng)確定
勢能二值函數(shù)聚類的算法中其閾值必須在其循環(huán)迭代中停止,在算法中該閾值二值函數(shù)被稱為剩余高度的最大勢,而且其結(jié)果基數(shù)值的變化范圍為。需要達(dá)到以下兩個(gè)原則[6]:
(1) 針對(duì)不同灰階的圖像特性,的設(shè)定需要留存圖像的“勢”的信息特征;
(2) 的設(shè)定要降低算法的運(yùn)算復(fù)雜性,以免造成不必要的重復(fù)運(yùn)算。
找出二值函數(shù)最大勢的剩余高度與分散之間的灰度級(jí)函數(shù)圖像的關(guān)系,得到歸一化二值函數(shù)自適應(yīng)的最大勢方法來確定其剩余高度。
2 基于自適應(yīng)模糊C均值的二值勢函數(shù)的維
吾爾文字圖像分割算法
算法的具體步驟如下:
(1) 其聚類中心和集群的準(zhǔn)備分割維吾爾文字圖像的最佳數(shù)目由有效聚類算法的二值勢函數(shù)來確定:
① 由式(1)、式(4)、式(5)計(jì)算準(zhǔn)備分割的維吾爾文字圖像的質(zhì)量分布圖機(jī)會(huì)率二值函數(shù),二值勢函數(shù),有效歸一化質(zhì)量分布圖二值勢函數(shù),其中為有效灰度級(jí)范圍數(shù)。
② 由步驟①計(jì)算可得歸一化質(zhì)量分布圖二值勢函數(shù)的所有峰值為,其中為歸一化質(zhì)量分布圖二值勢函數(shù)的波峰的數(shù)量;
③ 令初始分類數(shù);
④ 由式(8)計(jì)算模糊遞減系數(shù),由式(10)計(jì)算模糊二值偽勢因子;
⑤ 令各個(gè)二值偽勢數(shù),由式(6)計(jì)算剩余二值勢函數(shù),其隸屬于準(zhǔn)備分割的維吾爾文字圖像質(zhì)量分布圖階[7],以及二值勢穩(wěn)定值點(diǎn),;對(duì)應(yīng)于所有,若其中出現(xiàn)偽勢,則定義;
⑥ 計(jì)算的峰值,如果,則到步驟⑦,否則,到步驟④;
⑦ 由式(9)計(jì)算準(zhǔn)備分割的圖像質(zhì)量分布圖二值函數(shù)組;
⑧ 將按照由升序的順序排序,并按照的排序規(guī)則對(duì)潛在的分區(qū)二值函數(shù)組進(jìn)行排序,并得到其排序結(jié)論為;
⑨ 是否存在真正的偽勢一般由潛在兩峰值間距的分區(qū)二值函數(shù)組來斷定,如果存在,那么就由式(12)對(duì)兩個(gè)潛在的分區(qū)二值函數(shù)來進(jìn)行有效合并,在得到真正的有效合并偽勢后的潛在的分區(qū)二值函數(shù)。經(jīng)過真正的偽勢有效合并后,所求得的聚類中心為其潛在的分區(qū)二值函數(shù)組中勢穩(wěn)定值點(diǎn),而且勢穩(wěn)定二值函數(shù)值點(diǎn)數(shù)目即為準(zhǔn)備分割的維吾爾文字圖像[8]的最佳二值聚類數(shù)目。
(2) 模糊聚類:
① 計(jì)算出準(zhǔn)備分割的歐氏距離,即維吾爾文字圖像中每個(gè)基本二值像素單位點(diǎn)與二值聚類中心的距離,其式如下:
(13)
② 由及計(jì)算出準(zhǔn)備分割的維吾爾文字圖像中所有像素有效單位點(diǎn)以及從屬于聚類中心的從屬度,如下:
(14)
③ 像素單位點(diǎn)的分類,將準(zhǔn)備分割的圖像中每個(gè)像素單位點(diǎn)的從屬度,來做詳細(xì)比較,把像素單位點(diǎn)歸納并屬于最大的一類,經(jīng)二值聚類[9]得到最終的分割的圖像。
維吾爾文字圖像分割算法流程如圖1所示。
3 實(shí)驗(yàn)結(jié)果與分析
在實(shí)驗(yàn)中設(shè)置聚類數(shù)目相同的情況下,比較其兩種算法的分割有效結(jié)果及其效率。在實(shí)驗(yàn)中,選取兩組維吾爾文字圖像有效數(shù)據(jù)進(jìn)行仿真實(shí)驗(yàn),這兩組維吾爾文字圖像都是屬于復(fù)雜背景之下。
實(shí)驗(yàn)參數(shù)的選?。汉愣刂埔蜃?,參數(shù),,傳統(tǒng)分割算法中循環(huán)迭代次數(shù)次,閾值數(shù),模糊加權(quán)指數(shù)。如圖2及圖3所示。
兩種算法運(yùn)算時(shí)間對(duì)比如表1所示。
由仿真實(shí)驗(yàn)分割圖結(jié)果可以看出,本文所提出的分割算法在實(shí)驗(yàn)效果圖上能夠與傳統(tǒng)的模糊均值方法效果相同或分割結(jié)果更好,并從表1對(duì)比結(jié)果可以得到,本文所提出的算法在分割速率上好于傳統(tǒng)的模糊均值算法。本文算法能夠自適應(yīng)獲得每幅圖像的最大二值函數(shù)勢的剩余高度,并由來控制維吾爾文字圖像的自適應(yīng)二值聚類,從而達(dá)到一種完全實(shí)現(xiàn)自動(dòng)的無監(jiān)督的圖像分割方法,不僅確保了分割的準(zhǔn)確度,提高了分割速率,而且該算法是一種有效的分割算法。
4 結(jié) 論
本文首先詳細(xì)介紹了二值勢函數(shù)集群理論,并根據(jù)圖像像素單位點(diǎn)的灰度級(jí)分布特征,針對(duì)傳統(tǒng)的模糊C均值算法必須預(yù)先設(shè)置二值聚類有效個(gè)數(shù)、高度的計(jì)算缺陷的操作復(fù)雜性,將有效合理的二值勢函數(shù)的集群驗(yàn)證理論深入到分割算法中,提出一種基于二值勢函數(shù)有效集群的自適應(yīng)二值函數(shù)模糊C均值維吾爾文字圖像分割算法,該算法確定最優(yōu)群集數(shù)和直接通過群集聚類的方法獲取集群的維吾爾文字圖像分割和聚類中心,然后使用圖像像素的模糊隸屬度矩陣計(jì)算理論,及模糊聚類有效合理的分割最終獲取維吾爾文字圖像。實(shí)驗(yàn)結(jié)果表明,該算法能夠?qū)崿F(xiàn)維吾爾文字圖像的自適應(yīng)分割,確保其分割的準(zhǔn)確度,同時(shí)大大降低了算法的計(jì)算復(fù)雜度,它有利于對(duì)維吾爾文字圖像準(zhǔn)確性分割處理。
參考文獻(xiàn)
[1] MAYER A, GREENSPAN H. An adaptive mean?shift framework for MRI brain segmentation [J]. IEEE transactions on medical image, 2009, 28(8): 1238?1250.
[2] BAZI Y, BRUZZONE L, MELGANI F. Image thresholding based on the EM algorithm and the generalized Gaussian distribution [J]. Pattern recognition, 2007, 40(2): 619?634.
[3] 王秀和.利用K均值算法改進(jìn)后的蟻群優(yōu)化算法對(duì)高光譜圖像聚類研究[J].科技通報(bào),2015,31(3):202?206.
[4] 劉剛,梁曉庚,張京國.基于輪廓波變換和改進(jìn)模糊C均值聚類的紅外圖像分割[J].系統(tǒng)工程與電子技術(shù),2011,33(2):443?448.
[5] 王坤,張愷,王力,等.結(jié)合博弈論的馬爾可夫隨機(jī)場紅外圖像分割[J].紅外技術(shù),2014(10):801?806.
[6] 安劍奇,吳敏,何勇,等.基于信息融合的高爐料面紅外圖像分割方法[J].中南大學(xué)學(xué)報(bào)(自然科學(xué)版),2011,42(2):391?397.
[7] 哈力旦·A,庫爾班·買提木沙.基于小波變換的圖像中維吾爾文字定位[J].計(jì)算機(jī)工程,2011(8):197?198.
[8] 邵海燕,張振海,李科杰,等.復(fù)雜野外環(huán)境下水障礙識(shí)別技術(shù)綜述[J].計(jì)算機(jī)測量與控制,2014(1):1?4.
[9] 楊如林,丑修建,李慶,等.一種快速魯棒的紅外圖像分割方法[J].電視技術(shù),2015,39(3):11?15.
[10] 魏英姿,李靜靜.紅外圖像分割的改進(jìn)模糊C均值聚類方法[J].計(jì)算機(jī)工程與應(yīng)用,2014(9):163?166.