国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

手寫體字符細化算法的研究

2015-06-02 03:16韓抒真程杰柳青
電腦知識與技術 2015年9期
關鍵詞:細化

韓抒真 程杰 柳青

摘要:字符細化是手寫體識別預處理中的關鍵技術,細化結果的好壞直接關系到識別率的高低。由于手寫字符的多樣性和隨意性,目前沒有統(tǒng)一的細化算法,因此細化算法的研究受到越來越多學者的關注。該文以非粘連字符作為研究對象,對基于模板的細化算法進行研究。采用FPA細化算法、SPTA細化算法、改進的Hilditch細化算法進行理論分析和編程實現(xiàn),通過對比細化效果,分析了幾種細化算法的優(yōu)缺點。

關鍵詞:手寫體字符;細化;FPA算法;SPTA算法;Hilditch算法

中圖分類號:TP18 文獻標識碼:A 文章編號:1009-3044(2015)09-0226-02

字符細化,即提取字符僅有一個像素寬度的字符骨架,因此也稱為字符骨架化[1]。字符骨架化的過程是在保障像素間能夠拓撲連接的前提下,對整幅圖像的邊緣像素進行連續(xù)擦除的處理,最終保留僅一個像素寬度組成的字符。

字符進行細化處理后能夠消除字符圖像中包含的冗余信息,避免不相關因素(如,手寫字符的粗細)的干擾,減少計算機的運算量,進而使識別時間縮短。采用不同的字符細化算法提取到的字符骨架不同,會直接影響到在字符骨架的基礎上提取的字符特征的好壞,最終對字符識別的正確率產生影響。因此,字符細化算法的研究顯得尤為重要。

1 字符細化算法研究

1.1 FPA細化算法

針對經(jīng)過二值化處理的手寫字符圖像中的任意一像素,選取周圍的窗口做判斷處理,如圖1所示。FPA方法[2]的原理,將筆劃的外圍黑像素進行逐層的剝除,最終保留屬于字符骨架的像素點。為了確保骨架提取的連續(xù)性,將每次處理又分解成兩次子處理。

第一次子處理:從所選窗口區(qū)域的東南邊界和西北角對滿足式a)、b)、c)、d)的黑像素點進行剝除處理;

第二次子處理:從所選窗口區(qū)域的西北邊界和東南角對滿足式a)、b)、c')、d')的黑像素點進行剝除處理;

反復執(zhí)行以上兩次子處理,直到得到字符骨架為止。

a) 2≤B(P1)≤6;

b) A(P1)=1;

c) P2×P4×P6=0; c') P2×P4×P8=0;

d) P4×P6×P8=0; d') P2×P6×P8=0;

其中,A(P1)表示P2,P3,P4,P5,P6,P7,P8,P9,P2序列中出現(xiàn)01對的個數(shù),B(P1)表示1在P1的周圍八鄰域窗口內出現(xiàn)的個數(shù)。公式a)用來限制字符骨架的端點不被剝離,公式b)保障字符骨架中間點的存留,如圖2所示。公式c)、d)和公式c')、d')分別用來確保細化過程中只剝離東南邊和西北角、西北邊和東南角中不屬于字符骨架的冗余點。

運用此算法對實驗分割后的單個漢字進行細化,部分實驗結果如下:圖3為原圖,圖4為原圖取反后的圖,圖5為實驗得到的細化圖。

1.2 SPTA細化算法

SPTA算法[3]同樣選取

3)從P1開始,對像素點進行逐對判斷,若前一點和后一點的值分別為0和1,則將Ti的值置為1,否則置為0,i的范圍為1,2,…,8。若[i=18Ti=1],則表示滿足該條件,記為Z0(P0)=1。

4)P1×P3×P7=0即點P1,P3,P7中任意一個或者多個點的值為0,或者Z0(P1)≠1即以P1為基準點的8—鄰域點的Z0計算結果值不等于1。

5)P1×P3×P5=0即P1,P3,P5中任意一個或者多個點的值為0,或者Z0(P3)≠1即以P3為基準點的8—鄰域點的Z0計算結果值不等于1。

當關注P1和P3的Z0運算時,P1和P3的8—鄰域像素點情況示意圖分別如圖11和圖12所示。

明顯得知,計算Z0時,需要計算Ti在上述條件c)中,其i的取值范圍為[1,8],但是,點P1、P3鄰域點的下標與i的取值范圍保持不同。

運用此算法對實驗分割后的單個漢字進行細化,部分實驗結果如下:圖13為原圖,圖14為原圖取反后的圖,圖15為細化后的結果。

2 算法結果分析

本文通過對60個樣本的實驗分析,從連續(xù)性、速度、骨架的保持、細化結果、像素特性、算法實現(xiàn)的難易度、以及細化效果方面對三個算法進行了比較分析,分析結果如表1所示。

3 結論

通過理論研究和實驗分析,對三種算法提出了對比論證,F(xiàn)PA算法兼顧了連續(xù)性和四周噪聲免疫,處理效果較好,容易實現(xiàn)。SPTA算法處理的結果是嚴格的單像素筆畫,便于筆畫跟蹤提取,并且比較好地代表了筆畫的中軸和保持了筆畫的連續(xù)性,達到了細化的基本要求。對于Hilditch算法的改進,也是一種較好的模板法,細化后的圖像沒有改變原圖像的主要特征,而且很好的排除了大量冗余信息的干擾。

雖然三個算法相對細化效果較好,但都存在一定問題,F(xiàn)PA算法難于排除撇、捺方向交叉筆畫的畸變,且不是嚴格的單一像素。SPTA算法結果雖然是單一像素,但是速度比FPA稍慢,而且SPTA也難于克服45°交叉點畸變的問題。Hilditch算法雖然將轉折位置的結構特征保留了下來,但個別多余信息冗余仍然存在,需對細節(jié)做進一步處理。

參考文獻:

[1] 魏煒, 劉亞寧. 改進的脫機手寫漢字細化算法[J]. 計算機系統(tǒng)及應用, 2011, 20(6): 184-187.

[2] 張學東, 張仁秋, 關云虎, 等. 一種快速的手寫體漢字細化算法[J]. 計算機應用與軟件, 2009,26(11): 17-19.

[3] 黃鐵英, 姜昱明. 一種快速手寫漢字細化算法[J]. 計算機工程, 2004, 30(19): 121-128.

[4] 白瑩. 手寫漢字的細化算法研究[D]. 西安電子科技大學, 2014.

[5] 賈瑜, 饒建輝. 一種對文字圖像細化的改進Hilditch算法研究[J]. 武漢工業(yè)學院學報, 2006(3).

猜你喜歡
細化
鋁青銅合金軸承組織細化方法的探討
在融入鄉(xiāng)村振興中細化文明實踐
專利名稱:一種雙重細化鋅合金中初生相的方法
“細化”市場,賺取百萬財富
高效晶粒細化劑稀土鋁鈦硼的制備
“住宅全裝修”政策亟需細化完善
目標細化使課堂教學更有效
運用細化方法 促進“兩個責任”落實
凈化·細化·亮化——關于踐行“三嚴三實”的三維思考
基于數(shù)據(jù)分析的大氣腐蝕等級細化研究