包蘋蘋 李玲香 段華斌 宋 均
(湖南科技學(xué)院 電子與信息工程學(xué)院,湖南 永州 425199)
女書字符,也稱女字,其識別技術(shù)是信息化處理的重要環(huán)節(jié),而圖像分割是女字識別技術(shù)的重要前期工作。近年來,國內(nèi)一些學(xué)者對女書信息化處理研究取得一定的進(jìn)展[2-4],提出了一些女書字符圖像分割算法[5-10],這些算法都是針對背景簡單的手寫女書分割,目前國內(nèi)外學(xué)者對布帕、繡品等女紅作品的女字分割研究甚少,因為女紅作品樣式繁多、圖形多樣,進(jìn)行女字分割時,復(fù)雜圖案的處理成為圖像分割的難點。本文針對背景復(fù)雜的女紅作品,在自適應(yīng)閾值圖像分割的基礎(chǔ)上,結(jié)合形態(tài)學(xué),提出了一種半自動化的女書圖像分割方法。
閾值法分割是一種基于區(qū)域的圖像分割技術(shù),其基本原理是:通過設(shè)定不同的特征閾值,把圖像分為若干類。特征包括來自原始圖像的灰度或彩色特征、由原始灰度或彩色值變換得到的特征。設(shè)原始圖像為 f(x,y),按照一定的準(zhǔn)則從f(x,y)中找到特征值T,將圖像分割為兩部分,分割后的圖像為
當(dāng) b0=0 , b1=1 ,就是圖像的二值化。
圖1 給出三種女紅作品的原始圖,像繡帕類的女紅作品因材質(zhì)存在較強的褶皺,如圖1(a)所示。對圖像二值化處理帶來困難,可以采用自適應(yīng)閾值方法進(jìn)行分割,高灰度區(qū)用高閾值分割,低灰度區(qū)就使用低閾值分割,可以在一定程度上減小光照不均的影響,分塊數(shù)目大,每塊的光照都近似均勻,這樣分割的效果更好,但是分塊數(shù)并不是越大越好,太大的分塊數(shù)會對目標(biāo)像素產(chǎn)生損耗。
圖1 女紅作品原始圖
本文分別對圖1 女紅作品的原始圖進(jìn)行了自適應(yīng)閾值女紅的女字圖像分割,其效果圖如圖 2 所示。
圖2 自適應(yīng)閾值女紅的女字分割效果圖
對于繡帕類的女紅作品采用自適應(yīng)閾值算法進(jìn)行女字分割實驗表明:作品1 背景簡單,無多余圖案,女字分割后清晰,正確率高,見圖2(a)效果圖。作品2、作品3 背景復(fù)雜,含有多余圖案,女字分割后不清晰,分割效果較差,見圖2(b)和(c)效果圖。
針對背景復(fù)雜的女紅作品,如背景含有多余的圖案,如圖1 中的作品2 和作品3,本文提出了一種基于閾值和形態(tài)學(xué)結(jié)合的女書圖像分割方法,其處理流程是:先進(jìn)行圖像二值化預(yù)處理,再進(jìn)行人機交互自主選定文字區(qū)域,將圖案多樣的女紅作品中的女字區(qū)域裁剪出來,然后利用閾值與形態(tài)學(xué)相結(jié)合的分割法實現(xiàn)女書字符與背景分離,最后對處理后的二值化圖像做單個文字切割,其處理流程如圖3 所示。
按照中圖分類法,對比改革開放40年前后圖書出版種類,文化、科學(xué)、教育、體育類,文學(xué)類和工業(yè)技術(shù)類始終排列前三。改革開放40年,其他兩類變化不大,文化、科學(xué)、教育、體育類增量較大,在改革開放前所占圖書出版總量20%基礎(chǔ)上又增加了7個百分點。對比1978年與2017年圖書出版種類可見,總體分布基本保持了一致。
圖3 女紅女字圖像處理流程
2.1.1 二值化預(yù)處理
圖像二值化使圖像呈現(xiàn)出黑白效果,點的像素值為1 或0。根據(jù)需求選擇灰度圖二值化還是彩色圖二值化。二值化的目的一是為了將背景與目標(biāo)分離凸顯感興趣的目標(biāo),二是減少計算量,三是為隨后的文字切分和后續(xù)處理奠定基礎(chǔ)。
2.1.2 人機交互定位文字區(qū)域
要分割出復(fù)雜背景中的女字,女字區(qū)域的準(zhǔn)確定位是非常重要的。人們將柔美的女字繡在布帕上,想要除去如此復(fù)雜的圖案背景是比較困難的,而且圖案與文字的位置關(guān)系靈活多樣,雖然深度學(xué)習(xí)的文本檢測看似靈活有效,但是訓(xùn)練所需的女字?jǐn)?shù)據(jù)集制作有限制,難以獲得足夠多的樣本數(shù)據(jù)。手動定位文字區(qū)域的方法雖略顯笨拙,對于字?jǐn)?shù)量少且圖案復(fù)雜的文本能體現(xiàn)其特有的優(yōu)勢。人機交互自定義功能函數(shù)如下:
function g=getROIbyIter(f)
bw=roiploy(f);%交互式定位文本區(qū)
[I,J]=find(bw==1);%獲得目標(biāo)區(qū)域的數(shù)據(jù)矩陣
G=find(min(I):max(I), min(J):max(J));%自動裁剪
2.1.3 迭代自動閾值分割
裁剪后的女紅女書圖像雖已經(jīng)去除了背景圖案的大干擾,但仍然存在一部分干擾,比如光照不均勻、明顯的折痕、各類噪聲、圖像對比度差等情況使得圖像有效二值化處理閾值的確定更加復(fù)雜。
迭代法自動閾值分割首先要為全局閾值選擇初始估計值(灰度值)作為初始閾值,用初始閾值分割圖像,獲得新的閾值,依次迭代進(jìn)行分割獲得最佳閾值。其實現(xiàn)步驟如下:
①選擇整幅圖像的最小灰度值和最大灰度值的平均值為初始閾值Gk,k 為迭代次數(shù),初始時k=0,這樣選取初始閾值既能較好地保留重要像素值,也能去除部分無關(guān)像素值。
2.1.4 形態(tài)學(xué)去噪
圖像形態(tài)學(xué)中最常用的兩種基本操作就是膨脹與腐蝕。在形態(tài)變換中,結(jié)構(gòu)元素相當(dāng)于信號處理中的“濾波窗口”,但結(jié)構(gòu)元素的合理選擇也影響著去噪的效果??紤]到女字形體嬌小纖細(xì)、外輪廓光滑,為了防止去噪處理后女字的輪廓出現(xiàn)較大程度上的失真,本文選擇圓形結(jié)構(gòu)元素做膨脹操作,根據(jù)數(shù)字圖像本身的特性,選取方形結(jié)構(gòu)元素做腐蝕操作,更易腐蝕掉多余的像素點,半徑與長度大小需根據(jù)二值圖像中白斑的大小進(jìn)行人工確定。鑒于腐蝕后的圖像還存在少許孤立的白色小點,通過最小值濾波與均值濾波結(jié)合使用濾除白色噪聲點,最后通過膨脹操作對文字輪廓進(jìn)行修繕。
2.1.5 文字切割
女書字符識別技術(shù)是信息化處理的重要環(huán)節(jié)。女書識別的關(guān)鍵在于單個文字的切割,文字區(qū)域定位之后,需要將區(qū)域內(nèi)的文字切分出來。通過觀察發(fā)現(xiàn),大部分繡帕上的女書行與行之間不存在平行關(guān)系,且繡帕上的女書文字都是獨立的個體,在進(jìn)行預(yù)處理后排除非目標(biāo)像素的影響,每個女字屬于一個獨立的連通域。由于投影法切割屬于手動切割,效率低且麻煩,而連通域的切割方法可以避免第二次手動切割,本文采用連通域的切割方法對單個女字進(jìn)行切割。
2.2.1 基于閾值和形態(tài)學(xué)的女紅女字分割效果
本文以圖 1 中的像素尺寸分別為509 ×493的女紅作品1、273 ×300的女紅作品2和800 ×766的女紅作品3 的原始圖為例,用本文提出的新方法進(jìn)行女紅字符圖像分割,其分割效果圖如圖4 所示。
圖4 基于閾值和形態(tài)學(xué)的女紅女字分割效果圖
從圖4 實驗結(jié)果表明:本文的方法對于圖1(a)光照不均、嚴(yán)重皺褶以及圖1(b)和圖1(c)有背景圖案的女紅女字圖像分割均可獲得較好的分割效果,此方法也適用于其他女紅類的古典文字分割,但對于污染嚴(yán)重的女紅女字分割效果較差。
2.2.2 基于連通域的女字切分效果圖
本實驗利用閾值與形態(tài)學(xué)相結(jié)合的分割法實現(xiàn)了圖1 中的作品1、作品2、作品3 原圖的女書字符與背景分離,然后對處理后的二值化圖像采用連通域法實現(xiàn)單個女字切割,其效果圖如圖5 所示。
從圖5 分割效果圖可以看出:采用連通域的女字切分法對于圖1(a)和(b)粘連不是特別嚴(yán)重的女字能夠取得較好的切分效果(見圖5(a)和(b)),但是對于圖1(c)粘連、重疊嚴(yán)重的女字切分效果不盡如人意(見圖5(c))。
圖5 基于連通域的女字切割效果圖
圖5(續(xù))
本文針對女紅類女書無論從顏色還是文字布局、文字大小都存在多樣化的特點,采用人工交互的方法靈活定位文字區(qū)域,利用自適應(yīng)閾值、形態(tài)學(xué)去噪等方法實現(xiàn)了女紅女字的分割、提取。實驗結(jié)果表明:該方法對圖案復(fù)雜的繡品女書字符圖像分割具有較高的正確率和較強去噪聲能力,為女書字符識別提供一定的理論參考,對于女書粘連的單個女字切分效果欠佳、而且字符圖像預(yù)處理后采用了一種半自動的文字區(qū)域定位,不適合于大批量女書圖像樣本處理。