朱小艷 張西芝
摘要:在信息化飛速發(fā)展的時代,字符識別是信息錄入和轉化的一個重要內(nèi)容。其中,手寫體數(shù)字的識別有著非常廣泛的應用,如郵政編碼、手機手寫等。該文使用一種基于“孤立點”、交叉數(shù)和中間數(shù)的手寫數(shù)字識別方法,利用孤立點對數(shù)字(0-9)進行首次分類,再利用交叉數(shù)和中間數(shù)對分類后的數(shù)字進行進一步分類和識別。實驗結果表明,該算法有效提高了數(shù)字識別的效率。
關鍵詞:特征提??;孤立點;交叉數(shù);中間數(shù);效率
中圖分類號:TP18文獻標識碼:A文章編號:1009-3044(2012)16-3969-04
Research of Handwritten Numeral Recognition Algorithm Based on the Outlier
ZHU Xiao-yan1, ZHANG Xi-zhi2
(1.Software College of Henan University, Zhengzhou 450064, China;2. Department of Information Management ,Shengda Economics Trade & Management College of Zhengzhou, Xinzheng 451191,China)
Abstract: In the age of information development, character recognition is an important content of information input and conversion.Hand? written numeral recognition has a very wide range of applications, such as postal code, mobile phone handwriting recognition. This paper presents a handwritten digital recognition method based on the" outlier", crossing number and middle number , which uses isolated point to digital (0-9) for classification, then uses crossing number and middle number for further classification and recognition. The test results show that, the algorithm can improve the efficiency of digital recognition.
Key words: Feature extraction ;outlier; crossing number; middle number; efficiency
在信息化飛速發(fā)展的時代,字符識別是信息錄入和轉化的一個重要內(nèi)容。字符識別處理的信息可分為兩大類:一類是文字信息,處理的主要是用各國家、各民族的文字(如:漢字、英文等)書寫或印刷的文本信息,目前在印刷體和聯(lián)機手寫方面技術已趨向成熟,并推出了很多應用系統(tǒng);另一類是數(shù)據(jù)信息,主要是由阿拉伯數(shù)字及少量特殊符號組成的各種編號和統(tǒng)計數(shù)據(jù)。
手寫數(shù)字識別(Handwritten Numeral Recognition)是光學字符識別技術(Optical Character Recognition,簡稱OCR)的一個分支,它研究的對象是:如何利用電子計算機自動辨認人手寫在紙張或者與計算機相連的手寫板上的阿拉伯數(shù)字。隨著社會信息化的發(fā)展,手寫數(shù)字的識別研究有著重大的實用價值,如在郵政編碼、稅務報表、統(tǒng)計報表財務報表、銀行票據(jù)、海關等需要處理大量字符信息錄入的場合。手寫數(shù)字的識別也具有商業(yè)意義,現(xiàn)在市面上流行實用的各種寫字筆,手機上面嵌入的手寫功能等等。因此,手寫數(shù)字的識別研究有著重大的現(xiàn)實意義,一旦研究成功并投入應用,將產(chǎn)生巨大的社會和經(jīng)濟效益。[1]
數(shù)字字符識別是目前模式識別功能的一個重要組成部分?;诠铝Ⅻc、交叉數(shù)和中間數(shù)研究,該文研究了一種新的手寫數(shù)字識別算法。主要內(nèi)容包括:對所寫字符進行截取以及掃描所寫字符并利用特征提取獲得孤立點、交叉點和和中間點,從而進行數(shù)字識別。
1數(shù)字識別概述
手寫體數(shù)字識別方法大體可分為兩類:基于統(tǒng)計的識別方法和基于結構的識別方法。第一類方法包括模板匹配法、矩法、筆道的點密度測試、字符軌跡法及數(shù)字變換法等。第二類則是盡量抽取數(shù)字的骨架或輪廓特征,如孤立點、交叉點、內(nèi)部的虛實,起點和終點位于中線的位置等,兩類方法具有一定的互補性。該文中使用了一個基于結構特征的分類識別。
數(shù)字識別的基本過程分為位圖模式確定,位圖截取,數(shù)字識別和輸出結果四部分。其中,位圖模式是指使用在手寫過程中,任何一個圖形的形成都是有有限個像素點組成的位圖和像素陣列來表示的圖像,基于這種模式我們可以獲取圖形的大小和一些特征。
位圖截取指通過對位圖模式的掃描,根據(jù)上,下,左,右四個方向掃描,首先獲取到的點就作為該方向的邊界。識別指對剛才截取的圖像重新進行掃描,根據(jù)算法獲取到孤立點個數(shù),交叉數(shù)的數(shù)目和中間數(shù)的值,依據(jù)它們進行識別。最后,識別完成后,在相應的區(qū)域輸出所識別的結果,如果無法識別,也需要做相應處理。
1的孤立點有兩個,并且對書寫的1的細度有要求,此時1也沒識別。7的左下部分的三分之一為空,此時7也沒識別出來。
由于手寫數(shù)字字符的任意性比較高,對一些數(shù)字字符還存在識別錯誤和不能識別。一個是因為鼠標書寫的不易操作性造成了書寫時可能做成圈,還有一些頓筆。一個是對特征提取的還不足夠多,以至于在有些數(shù)字的識別上出現(xiàn)錯誤識別。
由于本算法對特征提取的不足,如果能把手寫區(qū)域那部分的區(qū)域進行擴大,例如擴大到16×16的像素點界面,就能很好的解決鼠標的不易操作性和頓筆。另外是改進算法,獲取足夠多的特征進行識別。例如基于BP神經(jīng)網(wǎng)絡的識別算法就比較好,不過它要預先存入相當多的樣本,在對不熟悉的字符進行識別時,必須先進行樣本訓練,等到獲得相當多的樣本時,提取特征,進行識別。
[1]張宏林,Visual C++數(shù)字圖像模式識別技術及工程實踐[M].北京:人民郵電出版社,2003:167-196.
[2]鄭靈芝,黃德才.基于最近鄰相似度的孤立點檢測及半監(jiān)督聚類算法[J].計算機系統(tǒng)應用,2012(2).