国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

文本圖像條帶污染去除的0稀疏模型與算法

2022-07-12 14:03耿則勛
關(guān)鍵詞:條帶識(shí)別率強(qiáng)度

喻 恒 耿則勛,2

1(平頂山學(xué)院信息工程學(xué)院 河南 平頂山 467000) 2(信息工程大學(xué)地理空間信息學(xué)院 河南 鄭州 450052)

0 引 言

文字作為人們普遍使用的信息交流載體,在信息傳播中發(fā)揮著重要作用,現(xiàn)代文字通常采用橫向表述的方式,因此條帶污染是網(wǎng)絡(luò)文本圖像最常用、最經(jīng)常出現(xiàn)的干擾、加噪及涂改方式(如圖1所示),這種圖像涂改方式并不會(huì)影響閱讀者對(duì)于文字圖像內(nèi)容的理解,但是會(huì)嚴(yán)重干擾網(wǎng)絡(luò)監(jiān)管系統(tǒng)的對(duì)文字信息的自動(dòng)識(shí)別,因此研究污染的文本圖像條帶去除技術(shù),對(duì)網(wǎng)絡(luò)中文本圖像的識(shí)別和監(jiān)管具有重要的現(xiàn)實(shí)意義。

(a) 文檔圖像 (b)網(wǎng)絡(luò)文本圖像圖1 條帶污染的文本圖像

一般意義上受污染的文本圖像主要指采用掃描儀、復(fù)印機(jī)等光學(xué)儀器對(duì)紙質(zhì)文檔掃描成像時(shí),受紙張質(zhì)量、背景等原因產(chǎn)生的噪聲[2],大量研究都集中在去除這類(lèi)噪聲污染而針對(duì)人為或手工故意添加的條帶型污染、劃痕、標(biāo)注等噪聲去除與恢復(fù)的研究較少。通常學(xué)術(shù)界對(duì)條帶噪聲的研究一般集中于遙感圖像,是由探測(cè)元件掃描不一致或探測(cè)器運(yùn)動(dòng)、溫度變化等因素的影響引起的一種系統(tǒng)性條紋污染[3]。這種噪聲污染與文本圖像的條帶污染都是對(duì)圖像的像素進(jìn)行逐行破壞,具有一定相似性。

近年來(lái),針對(duì)遙感圖像的條帶去除方法主要是分為三類(lèi):基于濾波的方法、基于統(tǒng)計(jì)的方法和基于泛函變分的方法?;跒V波的方法是通過(guò)各種濾波器去除遙感圖像的條帶噪聲(如文獻(xiàn)[4-6])?;诮y(tǒng)計(jì)的方法主要是分析條紋的分布(如文獻(xiàn)[7-8])。最近,基于泛函變分的方法在遙感圖像去除條帶噪聲問(wèn)題上顯示出優(yōu)越性,該方法主要是探索和發(fā)現(xiàn)內(nèi)在先驗(yàn)知識(shí),生成合理的正則化模型。文獻(xiàn)[9]提出了一種去除MODIS圖像條紋的單向全變分(Unidirectional Total Variation,UTV)模型。文獻(xiàn)[10]提出了一種將UTV與稀疏條紋先驗(yàn)相結(jié)合的優(yōu)化模型。文獻(xiàn)[11]利用具有各向異性光譜空間全變分正則化的分裂Bregman迭代法去除多光譜圖像條紋。文獻(xiàn)[3]提出了一種非凸L0稀疏遙感圖像去噪模型,并通過(guò)近似交替方向乘數(shù)法(PADMM)為基礎(chǔ)的算法求解得到了較好的結(jié)果。然而,文本圖像中的條帶噪聲相比較于遙感圖像中的條帶噪聲對(duì)于圖像像素的逐行破壞比較嚴(yán)重,對(duì)文字覆蓋的像素寬度比例也更大,單純采用遙感圖像的去條帶方法并不能準(zhǔn)確地估計(jì)出條帶圖像,需要尋找到合適的方法準(zhǔn)確地估計(jì)并修復(fù)條帶區(qū)域,這也是本文的主要工作。

圖像修復(fù)方法主要分為兩類(lèi):基于偏微分方程(PDE)的方法和基于范例/樣本的方法?;跇颖镜姆椒ㄊ且环N非常有效的大目標(biāo)區(qū)域修復(fù)方法。它們傾向于通過(guò)直接從源區(qū)域復(fù)制和粘貼來(lái)填充目標(biāo)區(qū)域,從而很好地保留圖像紋理[12-14]?;谄⒎址匠痰姆椒ú惶m合恢復(fù)大區(qū)域的紋理,但非常適合于完成直線、曲線和修補(bǔ)小區(qū)域,可以有效避免斷裂邊緣,因此更適合文本字符圖像的修復(fù)。這項(xiàng)技術(shù)首先由Bertalmio等提出[15]。根據(jù)Bertalmio等的工作,文獻(xiàn)[16-17]提出了兩個(gè)基于偏微分方程的模型,全變分(TV)模型和曲率驅(qū)動(dòng)擴(kuò)散(CDD)模型,用于處理非紋理圖像的修復(fù)問(wèn)題。近年來(lái)基于TV模型的修復(fù)研究得到不斷拓展,文獻(xiàn)[18]提出了一種自適應(yīng)分?jǐn)?shù)階TV修復(fù)算法,利用分?jǐn)?shù)階微分的全局性,將ROF修復(fù)模型的正則項(xiàng)由一階微分拓展到分?jǐn)?shù)階微分。文獻(xiàn)[19]提出結(jié)合紋理結(jié)構(gòu)的分?jǐn)?shù)階微分TV模型,文獻(xiàn)[20]改進(jìn)了TV修復(fù)算法,在正則項(xiàng)中加入自適應(yīng)參數(shù)擴(kuò)散調(diào)節(jié)系數(shù),提高了運(yùn)算速度,獲得了較好的效果。因此可以判斷出TV模型算法是一種廣泛使用的基于偏微分方程的修復(fù)算法。

綜上所述,為了去除文本圖像的條帶污染,我們從條帶的結(jié)構(gòu)特性出發(fā),提出了一個(gè)基于稀疏模型的污染范圍(或區(qū)域)估計(jì)方法,該模型主要由三個(gè)稀疏先驗(yàn)構(gòu)成,包括基于原圖與修復(fù)圖相似性的約束項(xiàng)、條帶(Y軸)的方向特性的L0稀疏先驗(yàn)、條帶(X軸)的過(guò)平滑“L0稀疏先驗(yàn)”;在X軸和Y軸先驗(yàn)?zāi)P椭幸胱赃m應(yīng)參數(shù),實(shí)現(xiàn)對(duì)水平條帶的細(xì)節(jié)保持和其他方向紋理的平滑并給出對(duì)該稀疏模型的優(yōu)化求解算法,估計(jì)出準(zhǔn)確的條帶污染區(qū)域。為了保證字符的完整連續(xù),我們采用經(jīng)典的TV模型圖像修復(fù)方法恢復(fù)文字。仿真和測(cè)試圖像的結(jié)果表明,該方法可以有效去除文本圖像的條帶污染,與當(dāng)前最新的遙感圖像去除條帶噪聲算法以及條紋脈沖噪聲圖像修復(fù)算法相比,本文估計(jì)的條帶污染區(qū)域更加準(zhǔn)確,PSNR和SSIM值也有很大提高,均值分別在20和0.93以上,污染英文文本圖片文字正確識(shí)別率提高40%以上,中文文本提高10%以上。

1 條帶估計(jì)算法研究

1.1 條帶噪聲模型

遙感圖像條帶噪聲一般由加性成分和乘性成分組成[21]。文本圖像中的條帶污染主要是人為在原圖上添加的規(guī)則或不規(guī)則的條紋型噪聲污染,因此本文將研究集中在加性條帶模型上。

u(x,y)=n(x,y)+s(x,y)

(1)

式中:u(x,y)表示觀察圖像;s(x,y)表示條帶分量;n(x,y)表示底層文本圖像。為了方便起見(jiàn),將式(1)按照逐行轉(zhuǎn)置疊加的方式改寫(xiě)成如下的向量形式:

U=N+S

(2)

式中:U,N,S∈Rn,n=M×N,分別表示觀測(cè)圖像、修復(fù)圖像和條帶噪聲,M和N表示圖像的行列數(shù)。我們的工作目的是估計(jì)條帶S,找出被污染的區(qū)域,然后進(jìn)行修復(fù)。

1.2 0梯度最小化模型

(3)

式中:第一項(xiàng)是保真項(xiàng),Sp表示平滑后輸出圖像,Up表示輸入的觀測(cè)圖,p表示圖像像素坐標(biāo)位置;λ是正則化參數(shù),C(S)表示0范數(shù)正則化項(xiàng)即

C(S)=‖▽Sp‖0=#{p||▽xSp|+|▽ySp|≠0}

(4)

式中:▽是圖像的差分運(yùn)算符,▽x表示沿水平方向的差分運(yùn)算,▽y表示沿垂直方向的差分運(yùn)算。C(S)表示圖像在水平方向和垂直方向梯度不為0的像素個(gè)數(shù)。

1.3 條帶估計(jì)模型

分析條帶污染的文本圖像,可將未覆蓋的文字區(qū)域看作待平滑區(qū)域,條帶區(qū)域?yàn)槠交蟮拇A魠^(qū)域。污染條帶一般是逐行(X軸)或近似逐行出現(xiàn)的,并且條帶自身可近似為灰度相等、均勻連續(xù)的水平條狀窄帶,相鄰像素之間水平差異(X方向梯度)很小,或者甚至接近零,因此,我們使用條帶水平方向(X軸)梯度稀疏的先驗(yàn)?zāi)P?,?

R1=λ1‖▽xS‖0

(5)

?yS>>?xS?xS≠0

(6)

式中:?xS和?yS分別表示圖像水平方向和垂直方向的偏導(dǎo)數(shù)。如果只采用式(5)的正則項(xiàng),可以對(duì)圖1(a)所示的條帶污染進(jìn)行完美的估計(jì),但是對(duì)手工添加的不規(guī)則條帶污染(圖2(a))提取效果比較差。圖2(b)所示為只包含式(5)的模型對(duì)圖2(a)提取的條帶區(qū)域,可以看出無(wú)法精確地提取出非水平方向的條帶。

(a) 人工條帶污染文本圖

(b) X軸正則項(xiàng)提取條帶圖像

(c) 非自適應(yīng)正則參數(shù)提取條帶圖像圖2 只保留X軸正則項(xiàng)和不包含自適應(yīng)參數(shù)條帶提取

為此我們引入帶自適應(yīng)參數(shù)的垂直方向正則化項(xiàng)并定義正則化項(xiàng)參數(shù):

(7)

同時(shí)定義式(5)正則化參數(shù)λ1為:

(8)

式中:k1,k2∈R+為輔助參數(shù);ε為不等于零的極小正數(shù),防止出現(xiàn)分母為零的情況。在近似水平條帶區(qū)域,▽xS值較小,▽yS的值較大,λ1值趨近于無(wú)窮小,λ2的值趨近于無(wú)窮大,可以有效地平滑掉垂直方向的紋理,保持水平條帶,這與我們的目的一致。但是在垂直紋理區(qū)域(文本字符部分區(qū)域)當(dāng)▽xS值較小,▽yS的值較大,λ1值趨近于無(wú)窮大,λ2的值趨近于無(wú)窮小,會(huì)保持垂直紋理,這與我們的目的不一致,因此設(shè)置兩個(gè)輔助參數(shù)k1、k2,k1參數(shù)值偏大,用來(lái)抑制Y軸方向梯度,k2參數(shù)值偏小,用來(lái)盡可能保持水平紋理。而在非垂直非水平的紋理(字符的部分筆畫(huà))部分,λ1、λ2可保持在合適的數(shù)值,使得非條帶區(qū)域的文本部分被有效地平滑掉。如果缺乏自適應(yīng)參數(shù),則模型會(huì)有效地保持任意梯度的紋理?xiàng)l紋,使得針對(duì)條帶污染的提取失敗,如圖2(c)所示。

(9)

式中:第一項(xiàng)為保真項(xiàng),S為條帶圖像,U為觀測(cè)的條帶污染圖像。

1.4 模型求解

(10)

C1(S)=#{p||▽xS|≠0}

(11)

C2(S)=#{p||▽yS|≠0}

(12)

引入輔助變量(hp,vp),令hp=▽xSp,vp=▽ySp,將目標(biāo)函數(shù)重寫(xiě)為:

(▽yS-vp)2]+λ1C1(h)+λ2C2(v)}

(13)

式(13)的目標(biāo)函數(shù)可分解為下述3個(gè)子問(wèn)題:

S子問(wèn)題:

(14)

h子問(wèn)題:

(15)

v子問(wèn)題:

(16)

下邊分別討論每個(gè)子問(wèn)題求解方法。

1)S子問(wèn)題最小化可寫(xiě)作以下形式:

(17)

以矩陣向量的形式表示為:

(18)

式(18)為連續(xù)可微凸泛函,對(duì)J求關(guān)于S的一階偏導(dǎo)數(shù),并令偏導(dǎo)數(shù)等于零,得到:

S=[E+β(BTB+DTD)]-1[U+β(BTH+DTV)]

(19)

直接求逆矩陣計(jì)算耗時(shí),可對(duì)上述方程兩端作傅里葉變換,注意B、D為循環(huán)矩陣,其傅里葉變換的卷積等于對(duì)應(yīng)元素的乘積,因而有:

(20)

2)h子問(wèn)題能量函數(shù)可以寫(xiě)作:

(21)

因?yàn)镃1(h)是0范數(shù),當(dāng)λ1/β≥(▽xSp)2時(shí),若hp不等于0,則:

(22)

若hp等于0,則:

Ep=(▽xSp)2

(23)

所以hp=0時(shí),minEp=(▽xSp)2。

當(dāng)λ2/β<(▽xSp)2時(shí),若hp不等于0,則:

(24)

若hp等于0,則:

(25)

綜合以上兩種情況,有h子問(wèn)題最優(yōu)解表達(dá)式為:

(26)

3) 對(duì)于v子問(wèn)題最優(yōu)解表達(dá)式為:

(27)

綜合以上三個(gè)子問(wèn)題的分析,對(duì)于式(9)的最小化求解算法如算法1所示。

算法1式(9)算法

輸入:觀察圖像U(包含條帶污染),參數(shù)β0、βmax迭代系數(shù)r,參數(shù)k1、k2。

初始化:S←U,β←β0,i←0

當(dāng)β≤βmax重復(fù):

3)β←rβ,i++

輸出:圖像S

結(jié)合步驟1)到步驟3),給出式(9)的完整算法。特別是子問(wèn)題都有閉式解公式。有關(guān)算法的收斂性分析參見(jiàn)文獻(xiàn)[22]。算法1中總結(jié)了求解過(guò)程,其中β0、βmax、k1、k2是預(yù)先定義的參數(shù)。本文將k1設(shè)置為1 000,k2設(shè)置為0.001。

由于文本或文檔圖像中的字符包含有極小的水平梯度的像素區(qū)域,因此通過(guò)算法1得到的條帶估計(jì)圖像會(huì)一定程度上保留這些水平梯度區(qū)域,在估計(jì)的條帶圖像中以噪聲的形式存在,因此需要對(duì)條帶圖像做進(jìn)一步去噪處理,以得到準(zhǔn)確的條帶圖。本文采用了形態(tài)學(xué)去除小區(qū)域的方法,以8連通域?yàn)闃?biāo)準(zhǔn),計(jì)算各區(qū)域像素個(gè)數(shù)記為該連通域面積,將像素面積較小的噪聲區(qū)域進(jìn)行去除,從而得到文本圖像條帶污染區(qū)域的最終估計(jì)。

2 文本圖像修復(fù)

文本文檔圖像中的條帶污染一般可分為覆蓋文字區(qū)域和未覆蓋文字區(qū)域兩類(lèi)對(duì)于未覆蓋文字的條帶形標(biāo)注、涂改可采用N=U-S直接獲取底層文本圖像,但是因?yàn)楦采w文字的條帶區(qū)域較大,簡(jiǎn)單的通過(guò)式(2)獲得的去條帶圖像會(huì)有很大部分的像素缺失,對(duì)于文本識(shí)別是不利的。考慮到文本圖像不同于普通的灰度圖像,文字特征在圖像中的表達(dá)更趨近于一種紋理,因此本文采用基于TV模型的圖像修復(fù),在之前估計(jì)出的污染區(qū)域的基礎(chǔ)上,進(jìn)一步恢復(fù)被條帶污損的文字。

TV模型圖像修復(fù)方法是一種基于偏微分方程的圖像修復(fù)方法,其修復(fù)模型為:

(28)

式中:D為待修復(fù)區(qū)域即估計(jì)的條帶區(qū)域,E為D的鄰域,第一項(xiàng)為正則項(xiàng),作用是尋求E∪D區(qū)域的最優(yōu)解,第二項(xiàng)是保真項(xiàng),u0為待修復(fù)圖像,u為估計(jì)得到的最優(yōu)修復(fù)圖像,λ為平衡正則項(xiàng)和保真項(xiàng)的正則化參數(shù)。

(29)

(30)

3 實(shí)驗(yàn)結(jié)果與比較

本節(jié)將對(duì)所提出的方法性能進(jìn)行分析,針對(duì)英文和中文文本圖像中水平方向的規(guī)則條帶、近似水平的不規(guī)則條帶以及各種行寬強(qiáng)度的條帶污染進(jìn)行估計(jì)和修復(fù),并分析修復(fù)前后的文本圖像PNSR和SSIM值,以及文字識(shí)別率。因?yàn)槟壳搬槍?duì)文本圖像去條帶污染的相關(guān)研究較少,本文與幾種最新的去條帶方法和圖像修復(fù)方法進(jìn)行比較,包括遙感圖像條帶去除和脈沖噪聲圖像修復(fù)等。由于沒(méi)有標(biāo)準(zhǔn)的測(cè)試圖像集,我們使用規(guī)則/非規(guī)則條帶噪聲污染文本圖像建立一個(gè)包含150幅圖像的測(cè)試集(測(cè)試文本包含原圖以及污染圖片,內(nèi)容為隨機(jī)選取中英文文檔,不包含任何含義),其中規(guī)則條帶污染各種文本文檔圖像50幅,不規(guī)則條帶污染各種文本文檔圖像50幅,不同強(qiáng)度條帶污染圖像50幅。所有實(shí)驗(yàn)均在4 GB RAM和Inter(R)Core(TM)CPU i7- 5500UCPU,@2.40 GHz的臺(tái)式機(jī)上用MATLAB(R2016a)進(jìn)行。

3.1 規(guī)則條帶文本圖像修復(fù)

規(guī)則的條帶污染文本文檔圖像一般指使用辦公軟件或者圖像編輯軟件自動(dòng)添加的水平條紋,這種方式添加的條帶一般為絕對(duì)水平梯度,覆蓋整個(gè)文字區(qū)域。本文算法效果如圖3所示。

(a) 英文文本圖像修復(fù)

(b) 中文文本圖像修復(fù)圖3 規(guī)則條帶污染的文本圖像條帶估計(jì)與修復(fù)

可以看出,使用辦公軟件對(duì)英文和中文文本添加的規(guī)則水平梯度的條帶污染,本文算法可以準(zhǔn)確地估計(jì)出條帶圖像,修復(fù)后的圖像能夠完整地去除條帶部分,并對(duì)條帶遮擋區(qū)域進(jìn)行了效果滿意的恢復(fù),如字母“e”和漢字“民”,但是個(gè)別字符仍然存在修復(fù)不完全的情況,如字母“A”和漢字“毛”。

為了客觀評(píng)價(jià)算法的有效性,我們比較去除條帶前后圖像的PSNR、SSIM值,同時(shí)為了驗(yàn)證算法的實(shí)際應(yīng)用性(即條帶污染的網(wǎng)絡(luò)文本圖像的文字識(shí)別),我們使用同一文字識(shí)別模型的OCR識(shí)別算法對(duì)修復(fù)前后的文本圖像進(jìn)行識(shí)別。按照識(shí)別率=正確識(shí)別字符個(gè)數(shù)/全部字符個(gè)數(shù)×100%的公式計(jì)算(下文的識(shí)別率都按照此方法進(jìn)行初步定性分析)。

圖2(a)英文文本圖像修復(fù)前PSNR、SSIM值分別為16.216 4、0.876 7,正確識(shí)別(按順序)率44.2%,修復(fù)后PSNR、SSIM值分別為22.357 9、0.967 3,正確識(shí)別率98%,;圖2(b)漢字文本圖像共31個(gè)字符(包括標(biāo)點(diǎn))修復(fù)前PSNR、SSIM值分別為18.382 6、0.889 4,正確識(shí)別率87%,修復(fù)后PSNR、SSIM值為25.397 7、0.953 3,正確識(shí)別率達(dá)到100%。我們對(duì)50副規(guī)則條帶污染文本圖像(英文23副,中文27副)進(jìn)行實(shí)驗(yàn),英文條帶文本圖像PSNR平均提高6.53,SSIM值平均提高0.087,字符識(shí)別率平均提高53.2%,中文條帶文本圖像PSNR平均提高7.93,SSIM值平均提高0.092,字符識(shí)別率平均提高14.9%,因此本文算法對(duì)于規(guī)則條帶污染的文本圖像修復(fù)具有較好的效果。

3.2 不規(guī)則條帶文本圖像修復(fù)

不規(guī)則條帶污染指的是人為添加條狀或近似條狀的涂改,一般包括兩種情況,一種是指通過(guò)圖像編輯軟件手動(dòng)添加的條狀涂改標(biāo)注等,這一類(lèi)是直接對(duì)數(shù)字圖像進(jìn)行編輯;另一類(lèi)是紙質(zhì)書(shū)籍、文檔中手工添加的條帶狀標(biāo)注、涂改、刪除等,當(dāng)需要轉(zhuǎn)化為電子文檔、數(shù)字圖片進(jìn)行保存或?qū)?shū)籍文檔中的文字進(jìn)行自動(dòng)識(shí)別時(shí),就需要將這些條帶污染去除。這類(lèi)條帶污染一般是近似水平梯度的情況,而且是不規(guī)則的出現(xiàn),如圖4所示。

(a) 中文書(shū)籍文本圖像修復(fù)

(b) 英文書(shū)籍文本圖像修復(fù)

(c) 中文電子文檔文本圖像修復(fù)

(d) 英文電子文檔文本圖像修復(fù)圖4 不規(guī)則條帶污染的文本圖像(黑色背景上的 白色條子圖帶表示估計(jì)的污染區(qū)域)

可以看出,分別對(duì)中文書(shū)籍圖像(圖4(a))、英文書(shū)籍圖像(圖4(b)),中文字符電子文檔圖像(圖4(c))、英文字符電子文檔圖像(圖4(d))人工添加條帶污染,雖然條帶噪聲在部分區(qū)域呈現(xiàn)非水平梯度,算法仍然能夠很好地提取完整的條帶圖像,并對(duì)文本圖像進(jìn)行修復(fù),達(dá)到正常閱讀和識(shí)別的目的,這從實(shí)驗(yàn)的視覺(jué)效果中可以直接體會(huì)到。修復(fù)前后PSNR、SSIM與OCR算法文字識(shí)別率(只針對(duì)條帶覆蓋字符區(qū)域)結(jié)果如表1所示。

表1 人工條帶污染文本圖像修復(fù)前后評(píng)價(jià)數(shù)據(jù)對(duì)比

可以看出,條帶污染對(duì)英文文本的字符識(shí)別率破壞比較嚴(yán)重,而被污染的中文字符的識(shí)別率稍高,經(jīng)本文算法處理后的文本圖像的PSNR、SSIM值以及識(shí)別率都得到了有效改善。通過(guò)對(duì)50幅人工污染的條帶文本圖像(中文書(shū)籍圖片15幅,英文書(shū)籍圖片8幅,中文電子文檔圖片15幅,英文電子文檔圖片12幅)仿真實(shí)驗(yàn)分析,中文書(shū)籍圖片修復(fù)后文字PSNR和SSIM平均分別提高4.98、0.079,識(shí)別率平均提高12.5%,英文書(shū)籍圖片修復(fù)后PSNR和SSIM平均提高4.33、0.068,識(shí)別率提高50.3%,中文電子文檔圖片修復(fù)后識(shí)別率提高9.8%,PSNR和SSIM分別提高7.84、0.082,英文電子文檔圖片修復(fù)后識(shí)別率提高62.4%,PSNR和SSIM分別提高8.14、0.089。因此本文方法在去除人工污染的英文文本圖像中不規(guī)則條帶方面同樣有很好的表現(xiàn),有效去除了條帶噪聲,提高了文本圖像的識(shí)別率。

3.3 不同強(qiáng)度條帶去除分析

從圖4的結(jié)果中可以初步分析出,條帶區(qū)域在覆蓋文字字符占比較大即條帶行寬較大的情況下,文字修復(fù)后的視覺(jué)效果和識(shí)別率均有一定程度的降低。為了進(jìn)一步分析本文算法對(duì)于文本圖像不同行寬的條帶污染估計(jì)和修復(fù)能力,我們對(duì)同一文本圖像添加不同行寬的條帶污染,分析本文算法對(duì)條帶圖像的估計(jì)情況和修復(fù)效果。

如圖5、圖6所示,對(duì)同一英文文本圖像和中文文本圖像添加不同行寬強(qiáng)度的規(guī)則與不規(guī)則的條帶污染,通過(guò)實(shí)驗(yàn)結(jié)果視覺(jué)效果可以看出,本文算法能夠精確地估計(jì)出不同強(qiáng)度的條帶污染區(qū)域,但是隨著條帶行寬強(qiáng)度增大,字符修復(fù)的效果逐漸變差,在條帶噪聲強(qiáng)度最大的最后一行出現(xiàn)字符被遮擋區(qū)域效果更差。

圖5 英文文本不同強(qiáng)度條帶估計(jì)與修復(fù)

圖6 中文文本不同強(qiáng)度條帶估計(jì)與修復(fù)

為了分析本文方法在不同強(qiáng)度條帶污染的文本圖像修復(fù)的文字識(shí)別率,對(duì)同一文本圖像添加強(qiáng)度逐漸增加的條帶污染,計(jì)算PSNR和SSIM值,通過(guò)OCR方法進(jìn)行識(shí)別,并分析識(shí)別率。

如圖7所示,對(duì)同一英文文檔圖像(共計(jì)34字符)添加三種強(qiáng)度寬度規(guī)則條帶污染和不規(guī)則條帶污染。修復(fù)前后的PSNR與SSIM值如表2所示。圖7(a)三幅圖像字符識(shí)別率分別為58.8%、26.5%、0%;修復(fù)后圖7(e)字符識(shí)別率分別為100%、79.4%、18.8%;圖7(b)字符識(shí)別率分別為64.7%、56.3%、41.2%,修復(fù)后圖7(f)字符識(shí)別率分別為100%、91.2%、79.4%。通過(guò)實(shí)驗(yàn)結(jié)果可以分析出本文方法在不同強(qiáng)度條帶污染的英文文本圖像修復(fù)上都大幅度提高了字符的識(shí)別率,但是隨著條帶強(qiáng)度的增大,PSNR與SSIM值以及識(shí)別率有所下降,但相比較比原圖有著一定提高,這一數(shù)據(jù)也和主觀視覺(jué)感受相一致。

(a) 規(guī)則條帶 (b) 不規(guī)則條帶

(c) 規(guī)則條帶估計(jì) (d) 不規(guī)則條帶估計(jì)

(e) 規(guī)則條帶修復(fù)圖像 (f) 不規(guī)則條帶修復(fù)圖像圖7 多強(qiáng)度條帶英文文本圖像修復(fù)

表2 多強(qiáng)度條帶英文文本圖像修復(fù)PSNR和SSIM

如圖8所示,對(duì)同一中文文檔圖像(共計(jì)15字符)添加三種強(qiáng)度寬度規(guī)則條帶污染和不規(guī)則條帶污染,修復(fù)前后的PSNR與SSIM值如表3所示。原始圖像圖8(a)三字符識(shí)別率分別為80%、66.7%、60%;修復(fù)后圖8(e)字符識(shí)別率分別為100%、93.3%、53.3%;圖8(b)字符識(shí)別率分別為93.3%、53.3%、46.7%,修復(fù)后圖8(f)字符識(shí)別率分別為100%、93.3%、46.7%。通過(guò)實(shí)驗(yàn)可以分析出因?yàn)橹形淖址慕Y(jié)構(gòu)與英文的差別,條帶污染對(duì)中文字符識(shí)別率的影響要低于英文字符,但相同的是條帶強(qiáng)度越大,PSNR、SSIM值和識(shí)別率越低,通過(guò)本文算法修復(fù)后的各項(xiàng)數(shù)據(jù)均有一定提高,在條帶強(qiáng)度逐漸增大的情況下,數(shù)據(jù)改善效果逐漸降低。

(a) 規(guī)則條帶 (b) 不規(guī)則條帶

(c) 規(guī)則條帶估計(jì) (d) 不規(guī)則條帶估計(jì)

(e) 規(guī)則條帶修復(fù)圖像 (f) 不規(guī)則條帶修復(fù)圖像圖8 多強(qiáng)度條帶中文文本圖像修復(fù)

表3 多強(qiáng)度條帶中文文本圖像修復(fù)PSNR與SSIM

為了驗(yàn)證本文方法在不同強(qiáng)度條帶污染圖像修復(fù)效果一般性,我們采用圖7、圖8實(shí)驗(yàn)方法分析三種強(qiáng)度條帶污染(規(guī)則和不規(guī)則)的文本圖像50幅(電子文本圖片)的文字識(shí)別率,每幅不少于100字符。其中英文25幅(規(guī)則條帶12幅,不規(guī)則13幅),每幅中文25幅(規(guī)則條帶12幅,不規(guī)則13幅),計(jì)算修復(fù)后的字符識(shí)別率(如圖9、圖10所示),直方圖縱坐標(biāo)為字符識(shí)別率,橫坐標(biāo)為測(cè)試圖像編號(hào),淺灰色直方圖為0.5磅寬度條帶,標(biāo)注為強(qiáng)度1,深灰色直方圖為1.5磅寬度條帶,標(biāo)注為強(qiáng)度2,黑色為2.5磅寬度條帶,標(biāo)注為強(qiáng)度3。

(a) 規(guī)則條帶英文OCR識(shí)別率直方圖

(b) 不規(guī)則條帶英文OCR識(shí)別率直方圖圖9 英文文本圖像OCR識(shí)別率直方圖對(duì)比

(a) 規(guī)則條帶中文OCR識(shí)別率直方圖

(b) 不規(guī)則條帶中文OCR識(shí)別率直方圖圖10 中文文本圖像OCR識(shí)別率直方圖對(duì)比

由識(shí)別率直方圖對(duì)比結(jié)果可以看出,本文算法對(duì)不同強(qiáng)度條帶污染文本圖像的修復(fù)識(shí)別率顯著提高,但是隨著條帶行寬增加(如強(qiáng)度3條帶圖像),條帶覆蓋字符區(qū)域面積比例較大,對(duì)字符結(jié)構(gòu)破壞比較嚴(yán)重,修復(fù)后識(shí)別率提高效果不明顯,說(shuō)明修復(fù)算法還有進(jìn)一步提升的空間,但是實(shí)驗(yàn)結(jié)果仍然證明本文方法在去除條帶,提高文本圖像識(shí)別率上確實(shí)有效的。

3.4 本文算法與其他算法比較

因?yàn)槟壳霸谖谋緢D像條帶污染去除方面的研究較少,為了進(jìn)一步分析本文算法與其他方法在文本圖像去除條帶的修復(fù)效果,我們選擇在遙感圖像去除條帶噪聲效果較好的幾種最新算法,包括方向0稀疏建模的圖像條紋噪聲去除(UESTC)[3](圖11(a))、基于圖像分解的遙感圖像條紋噪聲去除(LRSID)[25](圖11(b)),以及0TV稀疏優(yōu)化方法的脈沖噪聲圖像恢復(fù)算法[23](圖11(c))??梢钥闯鋈N算法在條帶估計(jì)和圖像修復(fù)上都有較好的視覺(jué)效果。

(a) UESTC

(b) LRSID

(c) 0TV圖11 三種算法條帶估計(jì)和去除

為了比較三種算法和本文方法文本圖像條帶去除效果,實(shí)驗(yàn)選用0.5磅強(qiáng)度的規(guī)則/不規(guī)則條帶污染文本圖像,分別給出了四種算法對(duì)測(cè)試圖的條帶估計(jì)級(jí)圖像修復(fù)效果,并比較去除條帶后圖像的PSNR、SSIM值以及OCR識(shí)別率。

如圖12(b)所示,UESTC算法能夠較好地估計(jì)出文本圖像規(guī)則條帶污染圖像,修復(fù)效果也可達(dá)滿意效果,但是對(duì)于不規(guī)則條帶的估計(jì)和修復(fù)效果不好,特別是非水平梯度區(qū)域;圖12(c)中LRSID算法也可估計(jì)出規(guī)則條帶,但是對(duì)于不規(guī)則條帶的估計(jì)以及整體修復(fù)結(jié)果較差;圖12(d)0TV算法因?yàn)槿鄙倬_的條帶估計(jì)方法,使得對(duì)所有類(lèi)型文本圖像修復(fù)效果都比較差。本文算法可以精確地估計(jì)規(guī)則條帶進(jìn)行修復(fù),尤其在不規(guī)則條帶的估計(jì)和文本圖像修復(fù)上有著明顯優(yōu)于其他算法的表現(xiàn),這從實(shí)驗(yàn)的視覺(jué)效果中可以直接體現(xiàn)出來(lái)。

(a) 條帶污染文本圖

(b) UESTC

(c) LRSID

(d) 0TV

(e) 本文算法圖12 不同算法去除文本條帶污染效果比較

為了量化本文算法文本圖像去條帶能力,實(shí)驗(yàn)分別給出4種算法條帶污染文本圖像修復(fù)后對(duì)應(yīng)的PSNR、SSIM以及文字OCR識(shí)別率(以單個(gè)字符為準(zhǔn))計(jì)算值如表4所示。為了制表方便,圖12(a)四幅受污染文本圖像分別標(biāo)記為圖像1、圖像2、圖像3和圖像4。

表4 四種算法PSNR、SSIM和OCR識(shí)別率

可以看出,本文算法修復(fù)的圖像在PSNR和SSIM值上都明顯優(yōu)于其他三種算法,尤其在修復(fù)圖像識(shí)別率上有著更優(yōu)秀的表現(xiàn)。采用以上方法對(duì)10幅條帶污染圖像的實(shí)驗(yàn)分析比較,本文算法在英文文本修復(fù)圖像的PSNR值均在20左右,SSIM值在0.93左右,對(duì)中文文本修復(fù)圖像的PSNR值均在24左右,SSIM值在0.94左右,都優(yōu)于其他算法。OCR識(shí)別率本文算法的規(guī)則條帶識(shí)別率都在90%以上,不規(guī)則條帶文本識(shí)別率均在95%以上,綜合以上實(shí)驗(yàn)數(shù)據(jù),本文算法具有良好的文本圖像條帶去除能力,基本達(dá)到提高識(shí)別率的要求。

3.5 一般性實(shí)驗(yàn)

為了驗(yàn)證算法的一般性,我們又對(duì)包含文本字符較多的大幅文本圖像進(jìn)行了仿真實(shí)驗(yàn),部分實(shí)驗(yàn)結(jié)果如圖13所示。

(a) 英文文本條帶提取與修復(fù)

(b) 中文文本條帶提取和修復(fù)圖13 多行大幅文本圖像條帶提取和修復(fù)

由圖13的實(shí)驗(yàn)結(jié)果可以觀察到,本文算法針對(duì)行數(shù)較多的大幅文本圖像也能夠較好地提取條帶污染并進(jìn)行修復(fù)。我們?cè)跍y(cè)試集基礎(chǔ)上添加了20幅平均超過(guò)15行的大幅文本污染圖像,經(jīng)過(guò)實(shí)驗(yàn)均能有效地提取出文本中的條帶污染進(jìn)行修復(fù),證明本文算法針對(duì)一般尺寸的書(shū)籍、文檔等數(shù)字圖像的條帶污染具有較好的修復(fù)能力。

3.6 局限性分析

由于我們的方法是假定文本圖像條帶的具體類(lèi)型是水平梯度和近水平梯度的,雖然這與文本涂改的一般情況相一致,但是對(duì)于非水平梯度的涂改污染修復(fù)效果還是有限的。同時(shí)本文方法雖然可以良好地估計(jì)出各種行寬強(qiáng)度的條帶圖像,但是對(duì)強(qiáng)度較大的條帶圖像修復(fù)效果還達(dá)不到滿意的結(jié)果,因此對(duì)于任意方向、行寬強(qiáng)度條帶污染文本污染的估計(jì)和文本圖像的修復(fù)算法還需要進(jìn)一步研究。

4 結(jié) 語(yǔ)

猜你喜歡
條帶識(shí)別率強(qiáng)度
基于高光譜成像的肉品檢測(cè)去條帶噪聲方法
受災(zāi)區(qū)域衛(wèi)星遙感監(jiān)測(cè)的條帶分解方法研究
巧用廢舊條幅輔助“蹲踞式起跑”教學(xué)
檔案數(shù)字化過(guò)程中OCR技術(shù)的應(yīng)用分析
基于PCA與MLP感知器的人臉圖像辨識(shí)技術(shù)
計(jì)算電場(chǎng)強(qiáng)度常用的幾種方法
電場(chǎng)強(qiáng)度疊加問(wèn)題的求解
電場(chǎng)強(qiáng)度單個(gè)表達(dá)的比較
科技文檔中數(shù)學(xué)表達(dá)式的結(jié)構(gòu)分析與識(shí)別
人工智能現(xiàn)狀和發(fā)展