秦 潔,張明舉
(1.安徽農(nóng)業(yè)大學經(jīng)濟技術學院,安徽合肥 230011;2.安徽大學出版社,安徽合肥 230039)
現(xiàn)代人類科技的進步,使得基于人民幣紙幣面值識別技術的自動化、智能化無人收費系統(tǒng)在各個行業(yè)都得到應用,節(jié)省了大量的人力資源。在自動售貨售票機、銀行的自動存取款機或手機營業(yè)廳的自動繳費機等設備上,人民幣紙幣面值識別技術得到了更好的應用,具有很好的應用前景。本文從人民幣面值特征參數(shù)提取及面值識別兩方面著手,提出了切實有效的識別方法。
在研究紙幣圖像識別時有個基本的要求,就是圖像必須是無變形和無失真的。在本文中,圖像的獲取是由數(shù)碼相機得到的,圖像無幾何變形現(xiàn)象,所以本文的圖像滿足圖像識別的要求。但是在圖像獲取的過程中,圖像會或多或少地受到其它因素的影響,比如:(1)獲取到的圖像除了含有紙幣圖像外,還會有一部分對面值識別沒有用的背景信息;(2)噪聲會存在于采集到的紙幣圖像中;(3)直接獲取到的紙幣圖像可能是傾斜的,所以不能直接對獲取的圖像進行圖像識別,在進行識別之前必須對圖像進行傾斜校正??傊?,為了能正確地對紙幣面值進行識別,在識別前要先對圖像進行預處理,包括濾波、二值化等基本操作。紙幣圖像預處理流程如圖1所示。
圖1 紙幣圖像預處理流程圖
確定人民幣紙幣的面向是進行人民幣紙幣面值識別的首要任務。只有確定出面向,才能準確定位紙幣要識別的目標區(qū)域。面向可分為:正面正放(A)、正面倒放(B)、反面正放(C)和反面倒放(D)四種情況(下文統(tǒng)一用A、B、C、D分別表示正面正放、正面倒放、反面正放和反面倒放)。在進行識別前應先對人民幣圖像進行預處理,如傾斜校正、濾波、二值化等處理,在面向識別中,采用目前常用的方法,即根據(jù)灰度來確定面向。這種方法識別速度快,準確率高[1]。本文稍做改進,將紙幣圖像分割成6塊區(qū)域,對紙幣左右兩邊的兩個區(qū)域進行比較,也就是說6塊區(qū)域中只有4塊(S1,S2,S3,S4)對本方法是有用的,如圖2所示,4塊區(qū)域面積相同,比較前對圖像進行二值化處理并反色,這時只要比較每個區(qū)域中“1”的和的大小就可以判斷出面向。因為相同區(qū)域在不同面向時“1”的和的大小是不一樣的。
S1S3S2S4
圖2紙幣比較區(qū)域示意圖
具體比較方法如表1所示。sum1、sum2、sum3、sum4分別是所對應區(qū)域S1、S2、S3、S4二值化后反色過后“1”的和。
表1 紙幣正反面比較方法
經(jīng)過上節(jié)識別出紙幣面向后,根據(jù)定位出的紙幣的上、下、左、右邊界,在指定的區(qū)域提取出紙幣中目標圖像(面值區(qū)域),為以后提取特征值做準備。本文采用的方法是在紙幣中設固定區(qū)域,來提取紙幣不同擺放時的固定區(qū)域的面值圖像。
對于一個圖像來說紋理和顏色是比較重要的特征,也是能代表自己特點的重要特征,為了能更好地提取特征的細節(jié),本文對比幾種方法,選擇小波變換的方法提取圖像紋理和顏色特征參數(shù)。具體實施如下:
(1)本文對目標區(qū)域圖像選用了二維離散小波變換進行四次分解。在變換前對原彩色圖像在R、G、B三色上先進行分解,然后對每個單色都利用二維離散小波變換進行四次分解,使用haar小波基。例如在R單色上主要代碼如下:
[ca1,ch1,cv1,cd1]=dwt2(r,’haar’);
[ca2,ch2,cv2,cd2]=dwt2(ca1,’haar’);
[ca3,ch3,cv3,cd3]=dwt2(ca2,’haar’);
[ca4,ch4,cv4,cd4]=dwt2(ca3,’haar’);
對100元面值區(qū)域的紅色單色的一次、二次分解的結果如圖3所示,本文做了四次分解。
(a)原圖 (b)一次分解 (c)二次分解圖3 一次、二次小波變換分解近似圖
(2)在每次分解上都有水平、垂直和對角三個方向的分量,而本文提取的紋理特征參數(shù)就是每個單色在每次小波變換分解上的三個方向上的分量值。每個單色上有12個參數(shù)值,總共有36個。流程示意圖如圖4所示。
圖4 紋理特征提取流程圖
以R單色圖像為例,進行四次小波變換,每次都有三個分量值,也就是每單色上取12個參數(shù)值,共提取紋理特征參數(shù)36個。
(3)提取顏色特征參數(shù)是在R、G、B每個單色上及RG、RB、GB兩色差異上提取的灰度值和總的灰度值的比值。在提取前把灰度區(qū)間分為6個小區(qū)間來求灰度值,這樣顏色特征參數(shù)也有36(6×6)個值。
(4)所以對于一個面值區(qū)域圖像提取了36個紋理特征參數(shù),36個顏色特征參數(shù),總共有72個參數(shù)值,這與用R、G、B三個參數(shù)值作為特征參數(shù)比起來,識別率更高,也增加了其魯棒性[2]。
3.1.1 網(wǎng)絡層數(shù)確定
任何的非線性識別問題都可以用三層的BP神經(jīng)網(wǎng)絡來解決,為了降低誤差,可以增加神經(jīng)網(wǎng)絡的層數(shù),但是這樣同時也增加了網(wǎng)絡的訓練時間,還有另一種方法來降低誤差,就是增加神經(jīng)元數(shù),本文中的神經(jīng)網(wǎng)絡設計為三層:輸入層、中間層、輸出層。
3.1.2 輸入層和輸出層神經(jīng)元數(shù)的確定
根據(jù)神經(jīng)網(wǎng)絡理論知識,神經(jīng)網(wǎng)絡中的輸入節(jié)點與樣本的特征是一一對應的關系。本文研究中提取了72個特征參數(shù),所以本文的BP神經(jīng)網(wǎng)絡系統(tǒng)中輸入節(jié)點有72個。
本文只研究新版100元、50元、20元、10元四種面值的紙幣,其它面值的紙幣可以根據(jù)本文的設計思路進行補充擴展。由于BP神經(jīng)網(wǎng)絡的輸出節(jié)點個數(shù)是由所識別對象的類別數(shù)確定的。而本文中要識別的對象的類別有4個,用1個輸出端可以表示,所以本文所設計的BP神經(jīng)網(wǎng)絡的輸出節(jié)點數(shù)為1[3]。
每種紙幣有A、B、C、D四種方向的情況,本文把它們作了不同的輸入樣本來處理。比如說,對于100元的紙幣,取10張不同的100元紙幣,每一張的A、B、C、D四種情況都分別提取72個參數(shù)作為輸入節(jié)點的輸入值,每一組所對應的期望輸出值都一樣,設為1。這樣也就減少了輸出節(jié)點數(shù),增加了運算速度。
3.1.3 中間層神經(jīng)元數(shù)的確定
3.1.4 網(wǎng)絡的初始權值和訓練函數(shù)的選取
權值和閉值的初始值通常設為-1到+1之間的隨機數(shù)。傳輸函數(shù)的選取對網(wǎng)絡的收斂性具有很重要的作用,在網(wǎng)絡結構和數(shù)據(jù)全都確定的情況下,網(wǎng)絡的誤差就完全由傳輸函數(shù)決定。總誤差函數(shù)E完全由神經(jīng)元的激勵函數(shù)f(x)決定。本文選用的傳輸函數(shù)為Sigmoid函數(shù)和purelin函數(shù),其中purelin函數(shù)在網(wǎng)絡的最后一層使用,訓練函數(shù)要根據(jù)不同的系統(tǒng)進行選擇。
本文建立一個三層的BP神經(jīng)網(wǎng)絡,其輸入層神經(jīng)元數(shù)為72,中間層神經(jīng)元數(shù)為15,輸出層神經(jīng)元數(shù)為1,網(wǎng)絡傳輸函數(shù)用Sigmoid函數(shù)和purelin函數(shù),最大訓練次數(shù)設定為5000次,訓練要求精度小于10-6時,認為網(wǎng)絡收斂,學習率為0.05[6]。
因為網(wǎng)絡訓練用的樣本與網(wǎng)絡性能有著密切關系,所以樣本集的選擇是至關重要的。
由于本文篇幅有限,只對新版100元、50元、20元、10元四種面值的紙幣進行研究,其它面值可以以此推廣。實驗中BP網(wǎng)絡的學習樣本選取每一種面值的紙幣不同擺放形式各10幅,每幅圖像中提取72個特征參數(shù)值用于網(wǎng)絡訓練,共計160幅紙幣圖像、11520個特征值。將這些特征值作為樣本中的輸入值對網(wǎng)絡進行訓練。
本文識別的只有四種面值的紙幣,所以用不同的輸出值來表達四種面值,用“1”表示100元,“0”表示50元,“3”表示20元,“2”表示10元。測試結果的表示方式如圖5所示。
圖5 測試結果的表示方式
綜上所述,本文對紙幣面值區(qū)域提取72個特征參數(shù)進行BP神經(jīng)網(wǎng)絡訓練,這72個特征參數(shù)分別是36個紋理特征參數(shù)和36個顏色特征參數(shù)。這兩類參數(shù)同時使用,避免了單獨使用時的局限性,在識別時起到很好的效果。