馬永力,曾 瑄,黃志開
(南昌工程學(xué)院 電氣工程學(xué)院,江西 南昌 330099)
中國古代書法碑帖圖像具有獨(dú)特的表現(xiàn)形式、高度的藝術(shù)成就和深厚的文化內(nèi)涵。然而,很多碑帖由于各種原因存在紙質(zhì)表面臟污、碑文殘破、圖像字跡損毀和殘缺等問題,采用一般的處理方法難以實(shí)現(xiàn)圖像分割。借助圖像處理、模式識別等技術(shù)進(jìn)行二值化處理,可以使?jié)h字筆畫、字體等的分析處理更加方便,分割識別更加準(zhǔn)確,為數(shù)字拓片提供了精確、完整的漢字模型,對修復(fù)損毀、殘缺的書法作品,重現(xiàn)中國古代碑帖文物的藝術(shù)、文化和歷史價(jià)值具有重要意義。
圖像的二值化就是把人們感興趣的區(qū)域從背景中分離出來,即圖像分割,主要有閾值法[1-2]、數(shù)學(xué)形態(tài)學(xué)[3]、邊緣檢測法[4-5]、聚類法[6]等方法。隨著科研人員不斷探索,一些新的算法被應(yīng)用于圖像分割,如模糊聚類[7-8]、遺傳算法、支持向量機(jī)、超像素算法、神經(jīng)網(wǎng)絡(luò)算法等。其中,聚類和支持向量機(jī)適用于多類別的分類,神經(jīng)網(wǎng)絡(luò)算法的用時(shí)較長,通常需要綜合運(yùn)用多種方法才能獲得較理想的圖像分割效果。對于碑帖圖像的分割,閾值法會更適合,但是單純的閾值法并不能達(dá)到較好的分割效果。因此,本文建立基于閾值分割和形態(tài)學(xué)相結(jié)合的二值化復(fù)原算法,對數(shù)字碑帖圖像進(jìn)行合理分割,旨在更好地重現(xiàn)其藝術(shù)價(jià)值。
特征提取是指使用計(jì)算機(jī)技術(shù)提取數(shù)字圖像信息,判斷數(shù)字圖像上的每個(gè)點(diǎn)是否具有某種特征,并將其分為不同的子集。特征提取在計(jì)算機(jī)視覺和圖像處理中具有非常重要的作用。為了加快處理進(jìn)度,碑帖圖像特征提取得到二值化圖形后,通常將彩色圖像轉(zhuǎn)換成灰度圖像再做進(jìn)一步處理?;叶?Gray)的轉(zhuǎn)換公式為:
Gray=0.299R+0.587G+0.114B
(1)
式(1)中,R為紅色亮度值;G為綠色亮度值;B為藍(lán)色亮度值。
碑帖圖像特征提取如圖1所示。運(yùn)算結(jié)果四舍五入后,灰度圖像的亮度范圍在(0~255)間。如果灰度圖像的直方圖顯示為2個(gè)波峰,那么二值化分割閾值就是這2個(gè)波峰中間的某個(gè)灰度值。
(a) 紅色直方圖 (b) 綠色直方圖 (c) 藍(lán)色直方圖 (d) 灰度直方圖
圖像閾值化分割是一種最常見、最基本、應(yīng)用最廣的傳統(tǒng)圖像分割方法,特別適用于目標(biāo)和背景占據(jù)明顯不同灰度級范圍的圖像,可以極大地壓縮數(shù)據(jù)量,簡化分析和處理步驟,具有計(jì)算簡單、運(yùn)算效率高的優(yōu)點(diǎn),是對圖像進(jìn)行進(jìn)一步分析、特征提取與模式識別前必要的圖像預(yù)處理過程。根據(jù)碑帖圖像的特點(diǎn),本文初始二值化采用閾值分割算法。
迭代閾值分割是改進(jìn)的雙峰算法,采用基于逼近的算法思想,便于尋優(yōu),具體步驟如下。
1)求出圖像中最小灰度值Zmin和最大灰度值Zmax,設(shè)閾值分割的初始值為T0,則T0=(Zmin+Zmax)/2。
2)根據(jù)已知閾值將圖像分成目標(biāo)A和背景B,分別求出其平均灰度值:
(2)
(3)
3)求出新閾值Tk+1=(ZA+ZB)/2。
4)如果Tk=Tk+1,則運(yùn)算結(jié)束;否則,k+1→k,轉(zhuǎn)到歩驟2。
5)歩驟4結(jié)束后,Tk即為最佳閾值。
光照均勻和光照不均勻圖像分割結(jié)果分別如圖2和圖3所示。對比圖2和圖3可以看出,對于光照均勻、前景與背景區(qū)別較大的圖像,分割效果較好,多數(shù)情況下都能滿足要求;但光照不均勻的圖像,采用單一的閾值分割明顯不能滿足需求。
(a) 原始圖像 (b) 基本閾值分割 (c) 迭代閾值分割
(a) 原始圖像 (b) 基本閾值分割 (c) 迭代閾值分割
Otsu即最大類間方差法,是基于圖像所有灰度值的一種全局閾值選取法。針對碑帖圖像的特殊性,采用基于Otsu的初始二值化算法,在此基礎(chǔ)上進(jìn)行后續(xù)去噪處理,復(fù)原圖像[9-10]。
(4)
(5)
(6)
(7)
2類之間的數(shù)學(xué)期望為:
μ=μ0ω0+μ1ω1
(8)
于是,可得類間方差σ2(k)為:
(9)
閾值分割法是全局閾值,當(dāng)圖像中存在陰影、光照不均勻、背景灰度變化較大等情況時(shí),如果僅用1個(gè)固定的全局閾值對整幅圖像進(jìn)行分割,效果不理想。為此,可以采用與像素值位置相關(guān)的1組閾值,把圖像分成若干個(gè)區(qū)域后分別進(jìn)行二值化,避免部分區(qū)域無法分割的情況。這種方法就是自適應(yīng)閾值算法,其優(yōu)點(diǎn)是抗噪聲能力強(qiáng),對于不能使用全局閾值分割的圖像效果較好,缺點(diǎn)是算法處理時(shí)間較長。Otsu算法與自適應(yīng)閾值算法的分割效果如圖4所示。從圖4可以看出,Otsu算法分割時(shí),由于光照不均勻,較暗處的圖像被分割為背景;而自適應(yīng)閾值算法的分割效果有很大提升,即使是光線較暗,也能分出前景和背景。
(a) 原始圖像 (b) Otsu算法 (c) 自適應(yīng)閾值算法
中國古代碑帖圖像的書寫材料、保存方法及保護(hù)方式不同,造成的殘缺、污損程度也不同,因此沒有統(tǒng)一的二值化方法能夠適應(yīng)所有的圖像。對于光照不均勻的圖像,可以采用自適應(yīng)閾值進(jìn)行分割;對于文字與背景差別較大、容易區(qū)分的碑帖圖像,直接使用Otsu算法就能取得不錯(cuò)的分割效果。由于碑帖圖像的特殊性,經(jīng)過Otsu算法分割的圖像通常存在大量的噪聲,且文字本身存在很多的漏洞。因此,數(shù)字碑帖圖像二值化復(fù)原的研究工作就主要集中在去除噪聲方面,如:消除圖像上的噪聲,對碑帖圖像進(jìn)行平滑處理,以消除文字內(nèi)部的“小洞”。均值濾波器是以均方誤差為準(zhǔn)則的最優(yōu)線性濾波器,但其在消除圖像噪聲的同時(shí)也會使目標(biāo)邊緣模糊,弱化文字的細(xì)節(jié),不利于文字的精確提取。選擇不同尺度的非線性濾波器(形態(tài)學(xué)或中值濾波),可以去除文檔圖像的椒鹽噪聲,但是,在使用大的結(jié)構(gòu)元素時(shí),形態(tài)學(xué)操作可能會損害文本和圖形組件的邊緣完整性,也會導(dǎo)致邊緣特征退化。因此,噪聲去除首先需要提取圖像的特征信息,再采取適當(dāng)?shù)姆椒ㄟM(jìn)行初始二值化。
數(shù)學(xué)形態(tài)學(xué)是一門建立在嚴(yán)格數(shù)學(xué)理論基礎(chǔ)上的科學(xué),是一種應(yīng)用于圖像處理和模式識別領(lǐng)域的新方法,其基本運(yùn)算有膨脹和腐蝕:腐蝕的作用是去除圖像中多余的毛刺,膨脹是腐蝕的反操作,可以去除圖像中輕微的缺損,兩者都是圖像去噪的一種手段。
對形態(tài)學(xué)操作進(jìn)行數(shù)學(xué)描述,用E表示歐拉距離,用A表示E中的二值圖像,如果用B表示結(jié)構(gòu)元素,則B對A的腐蝕可以定義為:
AΘB={z∈E|Bz?A}
(10)
式(10)中,Bz是向量z對B的平移,即Bz={b+z|b∈E},?z∈E。
當(dāng)結(jié)構(gòu)元素B具有一個(gè)中心,且這個(gè)中心位于E的原點(diǎn)時(shí),B對A腐蝕就可以理解為:隨著B在A中的任意移動,B的中心所能達(dá)到的區(qū)域。
B對A的膨脹可以定義為:
A⊕B={z∈E|(BS)z∩A≠φ}
(11)
式(11)中,BS是B的對稱集合,即BS={x∈E|-x∈B} 。
若是B以原點(diǎn)為中心,那么B對A膨脹就可以理解為:隨著B的中心在A中的任意移動,B上的任意一點(diǎn)所能達(dá)到的區(qū)域。
先腐蝕后膨脹為開運(yùn)算,一般能平滑圖像的輪廓,削弱狹窄的部分,去掉細(xì)的突出。B對A的開操作,即先對A進(jìn)行腐蝕操作,然后再進(jìn)行膨脹操作:
A°B=(AΘB)⊕B
(12)
先膨脹后腐蝕為閉運(yùn)算,也能平滑圖像的輪廓。與開運(yùn)算相反,它一般融合窄的缺口,去掉小洞,填補(bǔ)輪廓上的縫隙。B對A的閉操作,即先對A進(jìn)行膨脹操作,然后再進(jìn)行腐蝕操作:
A·B=(A⊕B)ΘB
(13)
考慮到要保留文字的筆畫信息,采用形態(tài)學(xué)的開運(yùn)算,既能去除大量椒鹽噪聲,又能保留圖像邊緣,為接下來進(jìn)行連通域?yàn)V波做準(zhǔn)備。筆畫較粗和筆畫較細(xì)的形態(tài)學(xué)濾波處理結(jié)果分別如圖5和圖6所示。從圖5和圖6可以看出,對于筆畫較粗、噪聲較小的圖像,形態(tài)學(xué)處理效果還是不錯(cuò)的。對于文字筆畫較細(xì)的圖像,如果僅使用形態(tài)學(xué)濾波,反而出現(xiàn)了新的噪聲,因此需要綜合運(yùn)用多種算法(結(jié)合連通域、均值濾波),以進(jìn)一步修復(fù)文字信息。
(a) 原始圖像 (b) 二值處理 (c) 形態(tài)學(xué)處理
(a) 原始圖像 (b) 二值處理 (c) 形態(tài)學(xué)處理
考慮到噪聲的面積一般小于正常筆畫,可以采用連通域的方法進(jìn)行濾波。連通區(qū)域標(biāo)記通過對二值圖像中白色像素(目標(biāo))進(jìn)行標(biāo)記,讓每個(gè)單獨(dú)的連通區(qū)域形成一個(gè)被標(biāo)識的塊,然后獲取這些塊的輪廓、外接矩形、質(zhì)心、不變矩等幾何參數(shù)。連通區(qū)域?yàn)V波步驟為:①計(jì)算圖像連通域的面積;②計(jì)算圖像連通域的數(shù)目;③尋找濾波閾值Ti(針對噪聲較多的碑帖圖像,一般可設(shè)為連通域平均面積的1/2),低于閾值的連通域像素設(shè)置為0;④濾波后的圖像進(jìn)行5×5的均值濾波,進(jìn)一步去除毛刺;⑤輸出圖像。
在MATLAB 2019a上測試算法,測試結(jié)果如圖7所示。由于碑帖圖像并沒有標(biāo)準(zhǔn)的圖形庫來驗(yàn)證分割的準(zhǔn)確率,通過肉眼分辨,從圖7可以看出本文綜合算法對于復(fù)雜的圖像有很好的分割效果,幾乎去除了所有噪聲,且保留了文字邊緣,明顯優(yōu)于其他方法。
(a) 原始圖像 (b) Otsu算法 (c) 均值濾波 (d) 形態(tài)學(xué)濾波 (e) 綜合算法
以基于閾值的分割方法為基礎(chǔ),結(jié)合連通域與形態(tài)學(xué),建立了數(shù)字碑帖圖像二值化綜合算法,并在MATLAB 2019a上進(jìn)行算法測試。測試結(jié)果表明,對噪聲嚴(yán)重的數(shù)字碑帖圖像進(jìn)行二值化分割,不僅能夠?qū)D中大量的背景噪聲濾去除掉,還能夠填充筆畫中的小洞,保留圖像的邊緣,盡可能全面恢復(fù)碑帖圖像的原始面貌。該算法在處理復(fù)雜、含有大面積噪聲的圖像時(shí)分割效果非常理想。