国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

一種改進的文本圖像二值化方法

2014-07-03 05:06卜飛宇
電腦知識與技術 2014年12期

卜飛宇

摘要:針對常用的局部閾值方法-Niblack算法中存在的問題,提出了一種改進的文本圖像二值化算法。改進后的Niblack算法對背景灰度不均勻的圖像具有良好的適應性, 抗噪聲能力強,保持筆畫連通性好, 更適合于文本圖像的二值化。實驗證明了該算法的有效性。

關鍵詞:文本圖像;二值化;局部閾值;全局閾值;Niblack算法

中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2014)12-2822-03

An Improved Binarization Method for Document Image

BU Fei-yu

(Institute of Information Science and Engineering, Hunan City University,YiYang 413000, China)

Abstract: After analyzing the shortcomings of Niblack algorithm, which is one of the commonly used algorithms based on local threshold, this paper proposes an improved binarization algorithm for document image. The improved approach is robust to noise and makes connectivity of stroke better. The experiment results have proved the advantages of the proposed algorithm.

Key words: document image; binarization; local threshold; global threshold; niblack algorithm

文本圖像的二值化效果是影響OCR(光學字符識別)系統(tǒng)性能的主要因素,研究人員為此作了大量工作。二值化方法可分為全局閾值法和局部閾值法。全局閾值法根據(jù)文本圖像的直方圖或灰度空間分布確定一個閾值,算法較簡單,對于目標和背景明顯分離、直方圖分布呈雙峰的圖像效果良好,但對光照不均勻、噪聲干擾較大的圖像,二值化效果明顯變差。局部閾值法通過定義考察點的鄰域,并由鄰域計算模板實現(xiàn)考察點灰度與鄰域點的比較,根據(jù)區(qū)域灰度分布特性,自適應調節(jié)閾值。典型的局部閾值法有均值分割法、Kamel-Zhao算法[1]、Bernsen算法[2] 、Niblack算法[3]等。局部閾值法較全局閾值法有更廣泛的應用,但缺點也較明顯,如速度慢、容易出現(xiàn)偽影現(xiàn)象和筆畫斷裂現(xiàn)象。

近年來,對文本圖像二值化的研究仍在繼續(xù)。如Gatos提出了針對退化文本圖像的二值化方法[4];Bolan Su則提出將多種文本圖像二值化方法結合使用[5]。文獻[6]針對Bernsen算法提出了一種改進算法,通過引入一個簡單的整體閾值進行輔助判斷,對算法得到的閾值曲面進行光滑處理并對局部窗口的極大、極小值進行考察,從而較好地避免了偽影及筆畫斷裂。文獻[7]和[8]分別將譜聚類和圖譜理論應用于文本圖像二值化算法中。文獻[9]對一種基于局部閾值分割的LLT算法給出了改進方法。文獻[10]則在Niblack方法的基礎上提出了一種改進的針對退化文本圖像的二值化方法,該方法僅在文本區(qū)域周圍較小范圍內進行局部閾值計算,減少了運算量,克服了Niblack方法容易產(chǎn)生大量背景噪聲的缺點,對于低對比度的文本圖像有更好的適應性。

到目前為止,還沒有一種通用的文本圖像二值化方法[11]。尋找更好的文本圖像二值化方法,仍然是圖像處理研究領域的目標之一。該文以Niblack算法為基礎,針對Niblack算法所存在的問題,綜合一些已有算法的優(yōu)點,提出了一種改進的二值化方法。改進后的Niblack算法抗噪能力強,較好地避免了偽影,并且能最大限度地保持筆畫像素。

1 Niblack算法概述

在以下的討論中,不妨設筆畫占據(jù)灰度文本圖像低灰度級部分,背景占據(jù)高灰度級部分。這與一般掃描的文本圖像是相符的。

記f(x,y)為圖像在考察點(x,y)坐標的灰度,W為估計最大筆畫寬度,一般取W=7。考察以(x,y)點為中心的(2W+1)×(2W+1)窗口,則NiBlack算法計算點(x,y)處閾值的公式為:

T(x,y) = m(x,y)-k×V(x,y) (1)

其中m(x,y)和V(x,y)分別是窗口內(2W+1)×(2W+1)個像素點的平均灰度值和均方差,k是根據(jù)經(jīng)驗預定的某閾值,一般取k = 0.1~0.5。Niblack算法的閾值由考察點鄰域的灰度確定,強調二值化閾值隨區(qū)域變化而動態(tài)調整,對容易受光源影響的圖像和字符灰度變化較大的圖像,有比較好的適應性,但容易出現(xiàn)筆畫斷裂及偽影現(xiàn)象。這是因為Niblack算法以公式(1)計算考察點的閾值,當考察窗內像素絕大部分為目標(或背景)點,而目標(或背景)灰度又不均勻時,會使得宏觀上本應同類的部分像素:目標(或背景)被強行二值化為背景(或目標),從而產(chǎn)生筆畫斷裂及偽影。另外,由于對圖像中每個像素點(x,y),均需取一個以(x,y)點為中心的(2W+1)×(2W+1)窗口計算平均灰度值和均方差,運算量較大。

為減少運算量和偽影,在Niblack算法中,一般先用全局閾值方法估計一個粗閾值T。計算方法如下:對整個圖像計算平均灰度值m和均方差V,通過公式T = m-k×V計算得到粗閾值。得到粗閾值T后,把圖像中灰度值大于T的像素強行判定為背景像素點,不再參與計算。因為文本圖像背景像素點至少占到50%以上,而且往往達75%以上,所以運算量減少了很多。但仍然存在如下問題:(1)背景灰度不均勻的區(qū)域,偽影仍然較多(圖1);(2)可能導致較淡的字符筆畫的丟失;(3)筆畫斷裂現(xiàn)象依舊沒有得到改善。endprint

為了盡量保全較淡的字符筆畫、避免字符斷裂和有效地減少偽影,下面對Niblack算法進行一些改進。

2 改進的Niblack算法

本文對Niblack算法的改進主要有以下幾個方面:1)為克服圖像獲取的光照條件未知等缺點,先對文本灰度圖像進行灰度拉伸。2)給出了一種新的估算粗閾值T的方法。3)為避免字符筆畫斷裂,對考察點閾值的計算公式進行了改進。4)為了消除偽影,對鄰域灰度均值較大的考察點的閾值作了進一步的調整。下面給出具體的實現(xiàn)步驟。

2.1 對圖像進行灰度拉伸

設原始灰度圖像f(x,y)的最大灰度值為MaxGray,最小灰度值為MinGray,灰度拉伸后的圖像為g(x,y),則g(x,y) = 255×( f(x,y)-MinGray)/(MaxGray-MinGray)。經(jīng)過灰度拉伸后,圖像灰度將分布在0~255之間,避免了獲取圖像時環(huán)境光線強弱變化的影響。以下針對拉伸后的圖像g(x,y)進行討論。

2.2 選取粗閾值

粗閾值選取除了上述通過整個圖像的平均灰度值m和均方差V來估算外,也可以利用已有的一些方法確定全局閾值,如Otsu法,Li和Lee的最小交叉熵方法,Huang和Wang的基于最小模糊度的方法等。為了盡量保全較淡的字符筆畫,該文提出一種類似比賽評分的機制,通過估算出的字符平均灰度和背景平均灰度來計算粗閾值的方法。

根據(jù)對文本圖像的大量統(tǒng)計,發(fā)現(xiàn)筆畫像素至少占據(jù)圖像像素的2%以上,但不會超過50%,從而可以根據(jù)灰度直方圖估算出字符平均灰度和背景平均灰度。先去掉灰度值最小的1%的像素點,再去掉20%的灰度值最大的像素點,對圖像上剩下的像素點,取1%灰度值最小的像素點的灰度平均值作為字符平均灰度CharAver,再取20%灰度值最大的像素點的灰度平均值作為背景平均灰度BackAver,最后通過下面的公式計算出粗閾值T。

T = (CharAver + 4×BackAver)/5 (2)

由于統(tǒng)計出的背景平均灰度BackAver一般很準確,而計算出的T值小于且接近背景平均灰度,所以,通過粗閾值T既可以濾除大部分背景,又能完整的保留較淡的字符筆畫。對灰度拉伸后的圖像g(x,y),當g(x,y)>T時,直接將考察點(x,y)判為背景像素點。

2.3 閾值計算公式的改進

通過對Niblack算法二值化后的文本圖像的分析,發(fā)現(xiàn)筆畫斷裂現(xiàn)象主要出現(xiàn)在多筆畫字符的中心。因為當待考察像素點(x,y)位于多筆畫字符的中心時,考察點(x,y)鄰域的平均灰度值m(x,y)較小,而均方差V(x,y)較大。此時,通過原Niblack算法閾值計算公式(1)計算出的考察點閾值T(x,y)會偏小, 從而在二值化時會把部分筆畫點錯誤的歸入背景點,造成筆畫斷裂。為了克服上述偏差,我們將原閾值計算公式(1) 改進如下:

T(x,y) = m(x,y)-k×V(x,y)×(1-V(x,y)/m(x,y)) (3)

改進后的公式,相當于對公式(1)中的系數(shù)k根據(jù)考察點的鄰域性質進行了動態(tài)調整。當考察點位于多筆畫字符的中心時,m(x,y)較小,而V(x,y)較大,此時k×(1-V(x,y)/m(x,y))比k要小很多,甚至為負值,從而T(x,y)的值得到了有效的提升。這樣,就能較好的避免把部分筆畫像素點錯誤的歸入背景點。

2.4 消除偽影

經(jīng)過上述三個步驟的改進后,字符的完整性得到了較好的保證,但在背景灰度不均勻的區(qū)域,偽影仍然較多。這是因為,當待考察的像素點(x,y)位于背景區(qū)域時,考察點鄰域的平均灰度值m(x,y)很大,而均方差V(x,y)較小,另外,在公式(3)中,系數(shù)k=0.1~0.5,因此T(x,y)≈m(x,y),即T(x,y)與考察點鄰域的平均灰度值m(x,y)很接近,所以始終會把一部分背景點錯誤的歸為筆畫點,形成偽筆畫。為了消除偽影,需要對由公式(3)計算出的閾值作進一步調整。

對待考察的像素點(x,y)和它的8鄰域有下面的平滑性假設:筆畫點的鄰域點很可能是筆畫點,而背景點的鄰域點很可能是背景點。從而可以認為:考察點(x,y)的8鄰域的平均灰度值越大,則該點是背景點的可能性越大。根據(jù)上述假設,若考察點(x,y)的8鄰域平均灰度值m8(x,y)較大,可適當降低由公式(3)計算出的閾值T(x,y)。當m8(x,y) > 4×T/5時(T為由公式(2)計算出的粗閾值),將閾值計算公式(3)最終調整為如下形式:

T(x,y) = m(x,y)-k×V(x,y)×(1-V(x,y)/m(x,y))-(m8(x,y)-V(x,y))/10 (4)

經(jīng)過上述幾個步驟改進后的Niblack算法,能較有效的消除偽影,較完整的保留淡的字符筆畫,并克服多筆畫字符的筆畫斷裂現(xiàn)象。改進后的Niblack算法的二值化效果(圖2)與原始的Niblack算法的二值化效果(圖1)相比,偽影明顯少了很多。

3 實驗結果分析

下面是分別用Niblack算法與本文改進后的Niblack算法對幾幅具代表性的文本圖像進行二值化的效果(圖3(a)—(d))。實驗中取W=7,k = 0.2,算法用VC++6.0編程實現(xiàn)。

從實驗結果來看,文本圖像采用原始的Niblack算法二值化后有較明顯的偽影,非常不利于字符的識別,而采取本文的改進措施后,偽影現(xiàn)象基本消除,字符斷裂情況也減少。但對有紋理背景的圖像,仍會有少量偽影現(xiàn)象存在(圖3(c))。

4 結束語

Niblack算法是常用的文本圖像局部二值化方法,但存在著易出現(xiàn)偽影及字符筆畫斷裂等缺陷,給字符的識別帶來不便。該文分析了Niblack算法存在的問題,對其提出了幾項改進措施,其中給出了一種新的估算粗閾值T的方法,并對考察點閾值的計算公式進行了改進。改進后的Niblack算法能較好的消除偽影及筆畫斷裂現(xiàn)象,能適應各種不同對比度和復雜背景的文本圖像二值化。實驗結果證明了改進后算法的有效性。endprint

參考文獻:

[1] Kamel M, Zhao A. Extraction of Binary Character/Graphics Images from Grayscale Document Images[J]. Graphical Models and Image Processing. 1993,55(3):203-217.

[2] Bernsen J. Dynamic Thresholding of Gray-level Images[C]. Proceedings of 8th International Conference on Pattern Recognition. Paris, France: IEEE Computer Society Press, 1986:1251-1255.

[3] Niblack W. An Introduction to Image Processing[M]. Prentice-Hall, Inc, 1986:115-116.

[4] Gatos B, Pratikakis I, Perantonis S J. Adaptive Degraded Document Image Binarization[J]. Pattern recognition, 2006, 39(3): 317-327.

[5] SU Bo-lan, LU Shi-jian, Tan C L. Combination of Document Image Binarization Techniques[C]. Document Analysis and Recognition (ICDAR), 2011 International Conference on. IEEE, 2011:22-26

[6] 陳丹,張峰,賀貴明. 一種改進的文本圖像二值化算法[J]. 計算機工程,2003, Vol.29 No.13: 85-86.

[7] 吳銳,黃劍華,唐降龍. 基于灰度直方圖和譜聚類的文本圖像二值化方法[J]. 電子與信息學報, 2009(10): 2460-2464.

[8] 常丹華,苗丹,何耘嫻. 圖譜理論在文本圖像二值化算法中的應用[J]. 計算機應用, 2010(10):2802-2804.

[9] 孫陽光. 一種改進的字符圖像分割方法[J]. 電腦知識與技術, 2013(4):844-845.

[10] 樊汝策,王慶,翟正軍,等. 一種改進的針對退化文本圖像的二值化方法[J].測控技術,2013(5):29-32.

[11] 童立靖,張艷,舒巍. 幾種文本圖像二值化方法的對比分析[J]. 北方工業(yè)大學學報, 2011(1):25-33.endprint

參考文獻:

[1] Kamel M, Zhao A. Extraction of Binary Character/Graphics Images from Grayscale Document Images[J]. Graphical Models and Image Processing. 1993,55(3):203-217.

[2] Bernsen J. Dynamic Thresholding of Gray-level Images[C]. Proceedings of 8th International Conference on Pattern Recognition. Paris, France: IEEE Computer Society Press, 1986:1251-1255.

[3] Niblack W. An Introduction to Image Processing[M]. Prentice-Hall, Inc, 1986:115-116.

[4] Gatos B, Pratikakis I, Perantonis S J. Adaptive Degraded Document Image Binarization[J]. Pattern recognition, 2006, 39(3): 317-327.

[5] SU Bo-lan, LU Shi-jian, Tan C L. Combination of Document Image Binarization Techniques[C]. Document Analysis and Recognition (ICDAR), 2011 International Conference on. IEEE, 2011:22-26

[6] 陳丹,張峰,賀貴明. 一種改進的文本圖像二值化算法[J]. 計算機工程,2003, Vol.29 No.13: 85-86.

[7] 吳銳,黃劍華,唐降龍. 基于灰度直方圖和譜聚類的文本圖像二值化方法[J]. 電子與信息學報, 2009(10): 2460-2464.

[8] 常丹華,苗丹,何耘嫻. 圖譜理論在文本圖像二值化算法中的應用[J]. 計算機應用, 2010(10):2802-2804.

[9] 孫陽光. 一種改進的字符圖像分割方法[J]. 電腦知識與技術, 2013(4):844-845.

[10] 樊汝策,王慶,翟正軍,等. 一種改進的針對退化文本圖像的二值化方法[J].測控技術,2013(5):29-32.

[11] 童立靖,張艷,舒巍. 幾種文本圖像二值化方法的對比分析[J]. 北方工業(yè)大學學報, 2011(1):25-33.endprint

參考文獻:

[1] Kamel M, Zhao A. Extraction of Binary Character/Graphics Images from Grayscale Document Images[J]. Graphical Models and Image Processing. 1993,55(3):203-217.

[2] Bernsen J. Dynamic Thresholding of Gray-level Images[C]. Proceedings of 8th International Conference on Pattern Recognition. Paris, France: IEEE Computer Society Press, 1986:1251-1255.

[3] Niblack W. An Introduction to Image Processing[M]. Prentice-Hall, Inc, 1986:115-116.

[4] Gatos B, Pratikakis I, Perantonis S J. Adaptive Degraded Document Image Binarization[J]. Pattern recognition, 2006, 39(3): 317-327.

[5] SU Bo-lan, LU Shi-jian, Tan C L. Combination of Document Image Binarization Techniques[C]. Document Analysis and Recognition (ICDAR), 2011 International Conference on. IEEE, 2011:22-26

[6] 陳丹,張峰,賀貴明. 一種改進的文本圖像二值化算法[J]. 計算機工程,2003, Vol.29 No.13: 85-86.

[7] 吳銳,黃劍華,唐降龍. 基于灰度直方圖和譜聚類的文本圖像二值化方法[J]. 電子與信息學報, 2009(10): 2460-2464.

[8] 常丹華,苗丹,何耘嫻. 圖譜理論在文本圖像二值化算法中的應用[J]. 計算機應用, 2010(10):2802-2804.

[9] 孫陽光. 一種改進的字符圖像分割方法[J]. 電腦知識與技術, 2013(4):844-845.

[10] 樊汝策,王慶,翟正軍,等. 一種改進的針對退化文本圖像的二值化方法[J].測控技術,2013(5):29-32.

[11] 童立靖,張艷,舒巍. 幾種文本圖像二值化方法的對比分析[J]. 北方工業(yè)大學學報, 2011(1):25-33.endprint

房山区| 双城市| 杂多县| 安吉县| 华蓥市| 扎鲁特旗| 三门县| 延吉市| 河曲县| 延安市| 缙云县| 淮滨县| 两当县| 安徽省| 留坝县| 中超| 宿迁市| 正阳县| 德昌县| 会泽县| 三亚市| 堆龙德庆县| 宜黄县| 诏安县| 绍兴县| 扎兰屯市| 永年县| 垦利县| 启东市| 五寨县| 奎屯市| 乌什县| 新宁县| 张北县| 龙山县| 桑植县| 峨山| 山东省| 安陆市| 加查县| 承德市|