陳忠鶴 于璐
摘要:冠字號技術(shù)在金融安全、現(xiàn)金管理等領(lǐng)域發(fā)揮著巨大作用。本文基于人民幣冠字號的字符特征,通過數(shù)字圖像處理方式,完成對冠字號圖像的預(yù)處理(包括圖像去噪、局部二值化、圖像分割)、字符分割、歸一化、字符識別的過程,實現(xiàn)了對人民幣冠字號的自動識別。
關(guān)鍵詞:冠字號;自動識別;圖像處理
中圖分類號:TP391 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-9416(2018)11-0120-02
0 引言
人民幣作為我國的法定貨幣,其冠字號碼具有一票一號的性質(zhì),相當(dāng)于每張人民幣的“身份證”,在智能設(shè)備的現(xiàn)金管理中可發(fā)揮巨大作用。冠字號技術(shù)能夠?qū)崿F(xiàn)單張現(xiàn)金的全過程跟蹤,從而能夠更好的加強(qiáng)金融機(jī)構(gòu)對現(xiàn)金的管理,提高對假鈔的查處力度,為公安機(jī)關(guān)偵破金融相關(guān)案件提供有力幫助。
1 冠字號的組成
冠字與號碼共同構(gòu)成紙幣的冠字號碼?!肮谧帧笔怯≡诩垘派嫌脕順?biāo)記印刷批次的兩個或三個英文字母,由印鈔廠按一定規(guī)律編排和印刷;“號碼”則是印在冠字后面的阿拉伯?dāng)?shù)字流水號,用來標(biāo)明每張鈔票在同冠字批次中的排列順序。
2 冠字號識別算法
本文基于人民幣冠字號的字符特征,通過數(shù)字圖像處理方式,完成對冠字號圖像的預(yù)處理(包括圖像去噪、局部二值化、圖像分割)、字符分割、歸一化、字符識別的過程,實現(xiàn)了對人民幣冠字號的自動識別過程。
2.1 圖像預(yù)處理
人民幣在流通過程中會產(chǎn)生污損和褶皺,并且為了防偽功能會帶有水印、條紋等背景圖案,同時,在人民幣信息采集的過程中會由于擺放位置的傾斜、光照不均勻、圖像采集裝置自帶的噪聲等原因使得采集的圖像具有噪聲,并且我們關(guān)心的只是圖像中冠字號的部分,從而需要將冠字號部分與紙幣整體進(jìn)行分割。為解決上述為題,在獲得采集圖像后,對圖像進(jìn)行預(yù)處理。
2.1.1 圖像去噪
本文選擇中值濾波作為去噪算法。
一維信號中值濾波處理過程為:取濾波窗口為奇數(shù),所有排列的數(shù)值當(dāng)中最中間數(shù)的平均數(shù)我們稱為中值的輸出結(jié)果。
二維的中值濾波器就是提取了一維的奇數(shù)而延伸出來的,二維的濾波窗口相應(yīng)的也比一維窗口增加了一個。如公式(2.1)為二維的中值濾波定義:
不同開窗類型適用于不同場景需求,如線形、方形、圓形、十字形等。
2.1.2 局部二值化
為提取圖像特征,我們關(guān)注的不再是圖像的細(xì)節(jié),而是圖像的邊緣特征,需要將圖像進(jìn)行二值化處理。
全局閾值方法是將圖像中各個像素點的光強(qiáng)進(jìn)行數(shù)理統(tǒng)計,計算獲得單一閾值T0,圖像中的每個點分別于T0進(jìn)行比較。但對于退化的灰度圖像,該算法的誤差較明顯。
局部閾值方法又稱為自適應(yīng)閾值方法,是指對于每一個像素點,根據(jù)其一定鄰域內(nèi)(統(tǒng)計窗口)的光強(qiáng)信息計算一個閾值,以此形成一個閾值平面。即每一個像素點都對應(yīng)一個不同的閾值來實現(xiàn)對目標(biāo)點的檢測與分類。局部閾值方法因其考慮了鄰域窗口范圍內(nèi)像素點的光強(qiáng)分布特性,對于一些復(fù)雜光照的圖樣有較好的測試性能。
2.1.3 圖像分割及字符分割
在人民幣整幅圖像中冠字號的排列整齊并且大小形狀和位置都是不變的,但在冠字號圖像區(qū)域旁邊有很多空白的部分,所以在整張人民幣中先選擇靠左偏下的區(qū)域來檢索冠字號碼。
冠字號圖像經(jīng)過二值化處理之后,僅含兩種灰度值,其中號碼區(qū)域用黑色表示,背景區(qū)域用白色表示。由于定位處理之后,冠字號區(qū)域的背景可能會包含其他部分圖像的噪聲干擾。所以,首先要對其進(jìn)行水平投影處理,確定冠字號碼的寬度。首先,自生而下掃描統(tǒng)計黑色像素點總數(shù),當(dāng)大于設(shè)定閾值時,確定冠字號區(qū)域的上邊界,同樣方法確定下邊界,從而完成行切分的水平投影。同理,再進(jìn)行垂直投影切割即可得到分割后的圖像。
2.2 字符歸一化
對紙幣冠字號字符進(jìn)行了分割之后,它們的形狀大小不一,需要進(jìn)行歸一化處理。分為位置歸一化和大小歸一化。
把目標(biāo)圖像調(diào)整到預(yù)定的地方就是位置歸一化,該坐標(biāo)代表冠字號圖像上隨機(jī)的像素點,之后將調(diào)整到圖像中心區(qū)點,就會出現(xiàn)新的坐標(biāo),其余沒有選擇的點,在調(diào)整之后也會隨之改變,就是調(diào)整后的坐標(biāo)。
對人民幣上面大小不一的字符做變換,使其大小相同,這個過程就是字符的大小歸一化。方法是對不同尺寸的圖像,進(jìn)行像素坐標(biāo)線性變化處理,使其轉(zhuǎn)換成規(guī)定尺寸大小的圖像。本文采取線性歸一化的方法。
2.3 字符識別
模板匹配的基本思想是:將經(jīng)過圖像二值化處理之后的紙幣號字符圖像和預(yù)先構(gòu)造好的理想字符圖像模板相比較,根據(jù)對比的相似程度來確定識別的結(jié)果。
冠字號碼字符識別過程中如果讓待檢測字符A與字符模板字符B相減,求得的字符A基本等于字符B所以答案基本接近0,那么字符B就是我們的目標(biāo)字符。一副標(biāo)準(zhǔn)冠字號的字符只有十個,這十個字符是由漢語拼音字符和阿拉伯字符組成。
3 結(jié)語
本文基于人民幣冠字號的字符特征,通過數(shù)字圖像處理方式,完成對冠字號圖像的預(yù)處理(包括圖像去噪、局部二值化、圖像分割)、字符分割、歸一化、字符識別的過程,實現(xiàn)了對人民幣冠字號的自動識別。
參考文獻(xiàn)
[1]陳光清.ATM機(jī)紙幣冠字號識別技術(shù)研究[D].電子科技大學(xué),2015.
[2]張良超.基于單根CIS的人民幣冠字號識別技術(shù)研究[D].電子科技大學(xué),2016.
[3]馮博遠(yuǎn),任明武,張煦堯等.人民幣冠字號碼識別預(yù)處理算法研究[J].計算機(jī)工程與科學(xué),2015,37(06):1148-1153.
Research on Recognition Algorithm of RMB Crown Word Number
CHEN Zhong-he,YU Lu
(Zhonghuan Information College Tianjin University of Technology, Tianjin? 300380)
Abstract:The technology of crown word number plays an important role in financial security, cash management and other fields. This paper is based on the characteristics of RMB crown word number. Through image preprocessing, which contains image denoising, local binarization, image segmentation, and character segmentation, normalization, character recognition, the image of crown word number is identified automatically.
Key words:RMB crown word number; automatic identification; image processing