劉曉雅
摘要:有價證券快速鑒偽一直是金融領(lǐng)域重點研究課題,本文針對有價證券序列號識別速度慢、效率低的問題,提出了一種基于BP神經(jīng)網(wǎng)絡(luò)的有價證券序列號模式識別算法。算法首先通過中值濾波降噪、二值化等等方法將光學(xué)傳感設(shè)備獲得的有價證券原始圖像進行預(yù)處理,然后采用基于網(wǎng)格的八方向梯度特征對序列號進行特征提取,最后通過訓(xùn)練后的BP神經(jīng)網(wǎng)絡(luò)對有價證券序列號圖像進行識別,得到有價證券序列號。仿真結(jié)果對比表明了該方法的有效性。
關(guān)鍵詞:徑向基,神經(jīng)網(wǎng)絡(luò),特征提取,有價證券識別
中圖分類號:G64 文獻標(biāo)識碼:A 文章編號:1672-3791(2015)05(c)-0000-00
1引言
隨著我國經(jīng)濟快速發(fā)展,有價證券在日常經(jīng)濟活動中的流通也更加頻繁,如何對有價證券進行快速鑒偽越來越重要。每張有價證券都具有獨一無二的序列號,是每張有價證券的“身份證”,金融領(lǐng)域常采用有價證券序列號來進行有價證券的鑒偽,因此,如何對有價證券序列號進行快速識別是有價證券鑒偽工作的關(guān)鍵,也成為圖像識別與人工智能領(lǐng)域研究的熱點問題[1]。
傳統(tǒng)的有價證券序列號主要采取人工識別,人工識別不但浪費大量的人力成本,而且識別效率低,已經(jīng)不能適應(yīng)快速發(fā)展的經(jīng)濟活動需求。隨著計算機技術(shù)與自動驗鈔技術(shù)的發(fā)展,有價證券序列號自動識別系統(tǒng)引起了廣大學(xué)者的廣泛關(guān)注,新的算法與技術(shù)不斷涌現(xiàn)出來。有價證券序列號識別主要為序列號圖像特征的提取與分類兩個階段,其中分類器算法的設(shè)計是整個識別過程的關(guān)鍵。目前分類器算法主要采取模式匹配法。模式匹配算法是一種數(shù)字統(tǒng)計方法,在識別過程中由于有價證券自身的殘缺、特征提取不夠明顯的前提下,會出現(xiàn)錯識別現(xiàn)象,影響了整個系統(tǒng)的識別精度。同時模式匹配算法也缺乏智能性,無法適應(yīng)整個清分系統(tǒng)的發(fā)展需求[2]。近年隨著人工智能算法的不斷發(fā)展,在不同領(lǐng)域得到了廣泛應(yīng)用,其中人工神經(jīng)網(wǎng)絡(luò)更是在模式識別算法中得到了重要應(yīng)用,也為有價證券序列號識別提供了新的解決思路。
本文基于人工神經(jīng)網(wǎng)絡(luò)算法,提出了一種快速的有價證券序列號模式識別算法,并運用模擬仿真與模式識別算法進行了對比分析。
2 有價證券序列號碼識別流程
有價證券序列號識別系統(tǒng)通常有硬件部分與軟件部分組成。硬件部分包括計算機、光學(xué)圖像傳感器與數(shù)字信號處理單元,軟件部分包括圖像預(yù)處理、序列號特征提取與序列號識別等[3]。本文算法主演研究軟件部分,識別系統(tǒng)如圖1所示。
圖1 有價證券序列號識別流程圖
3 有價證券圖像預(yù)處理與序列號特征提取
3.1有價證券圖像預(yù)處理
圖像預(yù)處理是機器視覺實際應(yīng)用中非常重要的一個環(huán)節(jié),能有效提高有價證券序列號的識別準確率。預(yù)處理包括對圖像進行噪聲抑制、信號增強及目標(biāo)提取等。
有價證券放入驗鈔機后,通過CIS采集序列號正反兩面圖像,通常序列號的透射圖像與反射圖像位置信息基本一致,但由于有價證券在流通過程中會不可避免出現(xiàn)磨損、污染、缺損等現(xiàn)象,加上圖像傳感器本身存在的噪聲源,因此圖像采集過程中噪聲會加載到原始圖像上而影響后期處理。抑制噪聲通常采用濾波操作,本文采用中值濾波法去除圖像噪聲。中值濾波法是基于鄰域的算法,不僅可以有效清除脈沖噪聲,同時能較好地保護圖像邊沿。其核心思想是為待處理像素點選取一個鄰域,然后將鄰域中所有的像素點按灰度級排序,再取中間值作為該點輸出的像素。中值濾波的效果通常由鄰域的空間范圍和中值計算中所涉及的像素個數(shù)決定。去噪后的圖像采用基于占空比的二值化方法對序列號圖像進行二值化,同時利用Hough變換對序列號碼圖像進行了傾斜校正[4]。
基于有價證券圖像特征,采用垂直投影法對字符上下邊界及左右邊界進行了準確定位與切分。切分好的序列號圖像采用線性歸一化方法,通過最近鄰域插值法縮放成32x48的字符圖像。
3.2有價證券序列號特征提取
特征提取是整個字符識別系統(tǒng)中十分重要的步驟,其基本任務(wù)是從原始數(shù)據(jù)中找到最能代表同類數(shù)據(jù)的特征及同類數(shù)據(jù)中的差異,從而有效提高識別率[5]。通過對比分析,本文采用基于網(wǎng)格的八方向梯度特征作為序列號字符的識別特征,網(wǎng)格特征能有效降低圖像的維度并具有較好地區(qū)分性能,而梯度信息能反映出圖像的輪廓信息。
4基于BP神經(jīng)網(wǎng)絡(luò)的有價證券序列號識別
人工神經(jīng)網(wǎng)絡(luò)是由許多神經(jīng)元的節(jié)點相互連接構(gòu)成,通常采用基本的BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)或其衍生網(wǎng)絡(luò)。BP神經(jīng)網(wǎng)絡(luò)是單向傳播的多層前饋網(wǎng)絡(luò),第一層為輸入節(jié)點,最后一層為輸出節(jié)點,中間有一層或多層隱藏節(jié)點。一般中間層采用Sigmoid傳遞函數(shù),而輸出層一般采用線性變換函數(shù)。BP神經(jīng)網(wǎng)絡(luò)的特點是各神經(jīng)元僅與相鄰層神經(jīng)元有連接而與本層神經(jīng)元無連接,如圖2所示。
圖2 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
根據(jù)BP神經(jīng)網(wǎng)絡(luò)的特性,其初始值與激勵函數(shù)對模型的識別性能有較大的影響。初始值選取不當(dāng)可能造成神經(jīng)網(wǎng)絡(luò)的早熟或不收斂。本文采用遺傳算法確定BP神經(jīng)網(wǎng)絡(luò)初值,激勵函數(shù)采用經(jīng)典Sigmoid函數(shù),其模型如下式:
其中Θ為閾值,T為網(wǎng)絡(luò)溫度常數(shù)。
本文針對有價證券序列號包含字符與數(shù)字的特征,采用的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如表1所示,識別基本步驟如下:
1) 按照3.1所示方法對有價證券圖像進行預(yù)處理;
2) 按照3.2所示方法對有價證券序列號圖像進行字符分割與特征提取;
3) 對特征向量采取BP神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,建立有價證券序列號識別模型;
4) 對待識別有價證券序列號模型進行識別,輸出結(jié)果。
5仿真分析
為驗證BP神經(jīng)網(wǎng)絡(luò)在有價證券序列號識別中的有效性,選擇了500張有價證券進行仿真測試,其中450張用于學(xué)習(xí)建模,50張用于測試,檢驗?zāi)P托阅?,運行結(jié)果表明,該方法能夠很好對有價證券進行識別。該仿真采用PC機配置為:CPU PⅣ 2.4G,內(nèi)存為2G,操作系統(tǒng)為Windows XP,編程語言Matlab,調(diào)用Matlab人工神經(jīng)網(wǎng)絡(luò)工具箱。同時以識別率和耗時最為指標(biāo)對識別模型進行評估,并與模式匹配算法和向量機作為對比算法[6],樣本測試結(jié)果如表2所示。
從表2結(jié)果分析,采用BP神經(jīng)網(wǎng)絡(luò)算法正確率達到96%,高于其他兩種算法的識別效果,識別速度也有較大的提升,更加符合有價證券序列號的在線、實時識別,結(jié)果表明了算法的有效性。
6 結(jié)論
本文以圖像處理技術(shù)為基礎(chǔ),提出了一種基于BP神經(jīng)網(wǎng)絡(luò)的有價證券序列號識別算法。首先通過中值濾波降噪、二值化等技術(shù)對圖像預(yù)處理,然后采用基于網(wǎng)格的八方向梯度特征對序列號進行特征提取,最后采用BP神經(jīng)網(wǎng)絡(luò)對其進行識別,并運用MATLAB進行仿真分析。仿真結(jié)果表明,本文算法具有識別準確率高,識別速度快的優(yōu)點,驗證了算法的有效性。
參考文獻
[1]胡學(xué)娟阮雙琛等.基于改進梯度方向直方圖的有價證券識別.深圳大學(xué)學(xué)報理工版.2014(9)Vol.31
[2]涂豫.神經(jīng)網(wǎng)絡(luò)的有價證券序列號識別算法.計算機仿真.2011(12)
[3]劉洋.有價證券紙幣號碼識別算法的研究.遼寧工程技術(shù)大學(xué).2012
[4]朱雪嬌.圖像清分的有價證券序列號碼識別關(guān)鍵技術(shù)研究.南京理工大學(xué)2014
[5]蓋杉劉鵬等.新的紙幣圖像特征提取方法.通信學(xué)報.2010(4)
[6]蓋杉羅立民.基于退化四元小波變換的紙幣識別.數(shù)據(jù)采集與處理.2014(9)