王 巖,于 明,陳冀川,于 洋,閻 剛
(河北工業(yè)大學(xué)信息工程學(xué)院,天津 300401)
作為司法鑒定和身份驗(yàn)證的重要手段,筆跡鑒別獲得了廣泛的關(guān)注。隨著計(jì)算機(jī)的普及和發(fā)展,不依靠專家的計(jì)算機(jī)筆跡鑒別更是作為模式識別領(lǐng)域的一個(gè)研究熱點(diǎn)。目前,對外文筆跡的鑒別研究已經(jīng)取得了一定的進(jìn)展,但是對于中文的筆跡鑒別,由于漢字結(jié)構(gòu)的復(fù)雜性和數(shù)目繁多,研究起步較晚,所以方法比較單一并且識別率較低?,F(xiàn)有的中文筆跡鑒別方法按照特征提取技術(shù)的不同分為全局鑒別法和局部鑒別法。
全局鑒別法基于書寫人筆跡的走向和形狀不同,鑒別不依賴于書寫的文本。朱勇等人首次使用Gabor濾波器提取筆跡圖像的全局紋理特征[1]。He等人借鑒這種方法進(jìn)行中文筆跡的特征提?。?]。此后,He等人又采用小波變換對筆跡進(jìn)行特征提?。?],為了克服小波變換平移變化和缺乏方向選擇等問題,又提出基于輪廓波變換的方法[4],但是依然會導(dǎo)致平移變化,對筆跡的鑒別效果并不十分理想。
局部鑒別法基于手寫筆跡的局部特征,尤其是特定字符的筆跡特征。劉成林等人用簡化Winger進(jìn)行筆跡鑒別[5],計(jì)算量和存儲量小,但只是對相同單字進(jìn)行比較,對于大樣本或相同字少的樣本鑒別率較低。吳賽等人[6]根據(jù)“橫”、“豎”、“撇”、“捺”筆畫在書寫中出現(xiàn)的不同情況來提取起收筆特征,但這種方法只適合于簡單漢字的特征提取。
近年的研究表明,全局和局部特征提取都是必要的,全局特征描述的是筆跡的整體風(fēng)格,局部特征表征筆段的細(xì)節(jié)變化。Srihari等人[7]通過提取大量的局部和全局特征來確定書寫者,融合全局紋理特征和局部特征可以提高鑒別率。受此啟發(fā),本文提出一種新筆跡鑒別方法,首先利用改進(jìn)的Gabor變換提取中文筆跡的全局特征,在此基礎(chǔ)上通過聚類把特征集分成兩類,分別為有效類和無效類,之后在有效類中提取筆跡的矩特征作為局部特征,局部特征與筆跡鑒定專家對筆跡特征的感知非常接近,最后經(jīng)歐式距離分類得出較高的鑒別率。
為了得到更有效的筆跡特征,本文把筆跡的全局和局部特征通過串聯(lián)方式結(jié)合到一起。在全局特征提取階段采用一種改進(jìn)的Gabor變換,提取的特征經(jīng)過聚類后,即可以根據(jù)筆跡風(fēng)格的不同把筆跡樣本分成兩類,這樣就可以舍棄類別不同的筆跡樣本即無效類,保留相似的樣本類,即有效類,大大減少了計(jì)算量。接下來,在相似的樣本中繼續(xù)提取筆跡局部細(xì)節(jié)特征,本文采用矩法進(jìn)行局部特征提取,最后通過歐式距離進(jìn)行分類比對,如圖1所示。
圖1 筆跡鑒別的特征提取
筆跡圖像的紋理有很強(qiáng)的頻譜特性和方向性,Gabor變換可以同時(shí)進(jìn)行頻率和方向選擇,是一種常用的筆跡全局特征提取方法。Gabor變換的濾波函數(shù)取高斯函數(shù),公式為[8]
Gabor變換的參數(shù)選取問題是難點(diǎn),已有文獻(xiàn)證明,由于漢字本身有較強(qiáng)的方向性,主要分布于垂直、水平和對角方向,對于筆跡圖像紋理來說只需要通過選取不同的方向和頻率即可得到有效的特征。本文以“維”字為例,經(jīng)預(yù)處理后,取4 個(gè)頻率,對應(yīng)于 v=0,1,2,3,σ =,濾波選0°,45°,90°和 135°等 4 個(gè)方向進(jìn)行改進(jìn) Gabor特征提取,結(jié)果如圖2所示。
圖2 Gabor變換提取漢字的4個(gè)方向特征
從0°,90°和135°方向3幅圖中可以看出相位的不同并沒對結(jié)果有很大的影響,基本所提取的特征相同。出現(xiàn)這種問題的原因是,Gabor變換是各向同性的,在各個(gè)方向均會得到完全的采樣,會丟失很多諸如筆跡圖像的直線或邊緣等與方向相關(guān)的重要特征。
鑒于此,本文采用一種改進(jìn)的Gabor變換進(jìn)行特征提取,它是由Geusebroek等提出的一種各向異性高斯濾波法[9],公式為
u-v坐標(biāo)與x-y坐標(biāo)的變換關(guān)系為
這種方法在不同方向選取不同的高斯尺度,很好地避免了Gabor變換的缺陷,同時(shí)它速度快,能在時(shí)域直接變換,不用像Gabor那樣變換到頻域的優(yōu)點(diǎn)。依然以“維”字為例進(jìn)行實(shí)驗(yàn),所采用的參數(shù)與Gabor變換相同,結(jié)果如圖3所示。
圖3 改進(jìn)的Gabor變換提取漢字特征
很明顯地看出,在同等條件下,本文所采用的改進(jìn)的Gabor變換對中文筆跡的特征提取效果要遠(yuǎn)遠(yuǎn)好于常用的Gabor變換,這樣也證明的了前面分析的正確性。
聚類把數(shù)據(jù)分為多個(gè)類或者簇,在類內(nèi)的數(shù)據(jù)對象有很高的相似性,類間的對象差別很大,鑒于此,考慮到可以把上一步提取的特征集通過聚類分成幾類,進(jìn)行鑒別時(shí),對相似度很差的無效類可以直接舍去,只需要找到其中與待檢筆跡最相似的有效聚類,進(jìn)行進(jìn)一步的局部特征提取和匹配,這樣極大地降低了計(jì)算量,最終提高特征提取和分類器的效率。
在聚類現(xiàn)有的若干算法中,K-means算法作為一種代表性的劃分方法,有很高的效率和伸縮性,具有簡單、快速的有點(diǎn),因此本文采用K-means進(jìn)行全局特征聚類。對于大小為N個(gè)筆跡文本組成的特征集,其算法流程如下:
1)首先選取任意k個(gè)筆跡作為初始類中心;
2)根據(jù)每個(gè)筆跡與各個(gè)類中心的相似度,給它賦予最相似的類;
3)重新計(jì)算每個(gè)類的中心;
4)重復(fù)以上步驟,直到筆跡的重新分配不再變化。
上面幾步過后,相似的筆跡被分成一類,在接下來的匹配中,只研究與檢測樣本特征相似的類中筆跡樣本的局部特征,即通過提取單個(gè)字符進(jìn)行特征比較。
漢字筆跡的字形、字位傾斜和重心偏向等特征是字符重要的筆跡特征,這些特征能夠很好地反映出書寫人的書寫風(fēng)格,并且有明確的物理意義。矩法在計(jì)算機(jī)視覺領(lǐng)域是定量表示這些整體形狀特征的重要方法,非常適合對字符進(jìn)行局部特征提取。在多種矩的形式中,幾何矩是應(yīng)用最廣泛的,其中的二、三階幾何矩的值明顯對應(yīng)于筆跡的形狀特征,因此選用能表達(dá)更復(fù)雜形狀特征三階矩進(jìn)行字符特征提取。
對于一個(gè)大小為M×N的筆跡圖像,p+q階幾何矩的計(jì)算公式為
物體中心表示為X=m10/m00,Y=m01/m00,坐標(biāo)原點(diǎn)為重心時(shí),中心距表示為
三階中心矩 U30,U03,U21,U12可按式(5)進(jìn)行計(jì)算。
對三階中心矩進(jìn)行變化,提取8個(gè)能表征字符形狀的歸一化特征,分別是長寬比、字位方向、慣性比、伸展度、水平偏度、垂直偏度、水平伸展均衡度和垂直伸展均衡度。
為了驗(yàn)證所提出算法的有效性,本文采集15人的筆跡,每人10個(gè)筆跡樣本圖片進(jìn)行測試,紙張選用A4打印紙,以200dpi的精度將每幅圖像進(jìn)行掃描,存儲于計(jì)算機(jī)中作為筆跡樣本庫,如圖4所示。
圖4 筆跡樣本
在對樣本進(jìn)行特征提取之前,為消除紙張背景、行間距、字間距和標(biāo)點(diǎn)等因素對鑒別效果的影響,需要先對筆跡圖像進(jìn)行預(yù)處理。本文采取文獻(xiàn)[8]的預(yù)處理方法,先通過RGB法設(shè)置一定閾值去除紙張背景以及字間分隔線,二值化后,分別進(jìn)行水平和垂直方向投影,去除行或字之間的空白間距以及標(biāo)點(diǎn)。最后將縮放成16×16的單字粘貼成128×128的圖像,形成預(yù)處理后的筆跡紋理圖,如圖5所示。
圖5 經(jīng)預(yù)處理后的筆跡紋理圖
把每人的5份筆跡共75份作為訓(xùn)練樣本,另外5份筆跡共75份作為測試樣本進(jìn)行Gabor全局特征提取,考慮到紋理特征的尺度與濾波器頻率成反比,大尺度的紋理不能反映筆跡的特點(diǎn),因而低中心頻率的Gabor濾波器在筆跡鑒別中用處不大,因此只對濾波器取4,8,16,32,64這5 個(gè)頻率,選取0,π/8,π/4,3π/8,π/2,5π/8,3π/4,7π/8這8個(gè)相位,總共40個(gè)通道,這些通道的均值和方差作為筆跡特征,這樣,每個(gè)紋理圖像就得到80個(gè)特征向量。
聚類實(shí)驗(yàn)證明,K-means的k值為2時(shí)鑒別效果最好,因此通過聚類把樣本分為兩類,一類為與待檢筆跡相似度高的類,稱為有效類,另外一類為相似度低的類,稱為無效類,另外,K-means算法由于是隨機(jī)選取聚類中心,聚類結(jié)果會受到影響,所以運(yùn)行100次求其平均。在此,舍棄無效類,只需要對有效類進(jìn)行局部特征提取,用矩法提取每份樣本中字符的特征,構(gòu)建新的特征集,實(shí)驗(yàn)表明,聚類后減少了局部特征提取和分類器的計(jì)算量。最后用歐式距離作為分類器對特征值進(jìn)行度量,在整個(gè)過程中,把待檢筆跡樣本與其他人的樣本進(jìn)行比較,計(jì)算二者之間的歐式距離,按照距離從小到大排序,若待檢樣本與距離最小的書寫人屬于同一人,則鑒別正確,否則錯(cuò)誤(此為首選正確率)。分別與Gabor變換、改進(jìn)Gabor變換和矩法相比較,在圖6中,依次比較了這幾種方法的前10選正確率,可以看出,所提出的方法在中文筆跡鑒別性能上明顯好于另外幾種方法。
圖6 不同方法的筆跡識別率比較
提出了一種新的中文筆跡鑒別方法。首次提出把筆跡的全局特征和局部特征融合起來,不僅考慮到了筆跡的整體書寫風(fēng)格,還利用了單個(gè)字符的局部統(tǒng)計(jì)特征,實(shí)驗(yàn)證明,在取得較高的識別率的同時(shí)也提高了分類器的效率。另外,本方法有一定的魯棒性,根據(jù)不同筆跡的細(xì)節(jié)特征,適當(dāng)調(diào)整Gabor濾波器的窗口大小,還可以對其他語言的筆跡進(jìn)行識別。此方法對于大樣本的中文筆跡鑒別同樣適用。
[1]朱勇,譚鐵牛,王蘊(yùn)紅.基于筆跡的身份鑒別[J].自動化學(xué)報(bào),2001,27(2):229-234.
[2]HE Z Y,TANG Y Y.Chinese handwriting-based writer identification by texture analysis[C]//Proc.the 3rd International Conference on Machine Learning and Cybernetics.Shanghai:IEEE,2004:3488-3491.
[3]HE Z Y,YOU X,TANG Y Y.A Contourlet-based method for writer identification[C]//Proc.Conf.Systems,Man and Cybernetics.Hawaii,USA:[s.n.],2005:364-368.
[4]HE Z Y,YOU X,TANG Y Y.Writer identification of Chinese handwriting documents using hidden Markov tree[J].Pattern Recognition,2008,41(4):1295-1307.
[5]劉成林,戴汝為,劉迎建.簡化的Winger分布及在筆跡鑒別中的應(yīng)用[J].計(jì)算機(jī)學(xué)報(bào),1997,20(11):1018-1023.
[6]吳賽,劉俊,張憲榮.基于基本筆畫起收筆特征的手寫漢字的筆跡鑒定[J].上海大學(xué)學(xué)報(bào),2004,10(3):248-251.
[7]SRIHARI S,CHA S,ARORA H,et al.Individuality of handwriting[J].Journal of Forensic Sciences,2002,47(4):1-17.
[8]劉宏,李錦濤,崔國勤,等.基于SVM和紋理的筆跡鑒別方法[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2003,15(12):1479-1485.
[9]GEUSEBROEK J M,SMEULDERS A W M,WEIJIE J V D.Fast anisotropic Gauss filtering[J].IEEE Trans.Image Processing,2003,12(8):938-943.
[10]鄢煜塵.基于信息融合的中文筆跡鑒別研究[D].武漢:武漢大學(xué),2009.