江波 史鳳波
摘 要:隨著科學信息技術的不斷發(fā)展,計算機技術也得到了快速地發(fā)展和廣泛地應用,同時也促使模式識別技術在文字識別領域得到廣泛的應用。近些年來,模式識別技術的發(fā)展和應用也得到了廣大專家學者和社會的關注和重視。該文主要從模式識別技術的發(fā)展歷史和現狀出發(fā),對文字識別的基本原理進行闡述,對其統計決策及字句結構等基礎識別方法及在文字識別領域的相關應用進行研究分析和總結,并對模式識別技術領域的前景和未來做出展望。
關鍵詞:文字識別 模式識別 應用 科技信息技術
中圖分類號:TP391.4 文獻標識碼:A 文章編號:1672-3791(2015)09(c)-0006-02
隨著高科技信息技術的快速發(fā)展,計算機技術在存取信息、輸出和高速運算等方面得到了不斷的完善和健全,但目前計算機的信息輸入還是主要依靠人工,文字識別中的模式識別技術主要是運用大腦識別機理通過計算機的模擬工作,從而構造出一個完全能夠代替人工完成分類的識別等工作,以達到實現自動信息處理的機器系統的目的[1]。隨著人工智能、思維科學和計算機技術迅速發(fā)展,在文字識別領域的模式識別技術也在不斷的向更深、更高層次發(fā)展。模式識別主要是由模糊理論、統計、神經網絡、句法結構以及支持向量機識別等方法,筆者就文字識別領域的中模式識別的應用原理做出分析。
1 模式識別系統的基本概念
人們在看到某個事物和現象時會不自覺的收集該事物或現象的相關信息,并將該信息與大腦中已經儲存的信息進行匹配或比較后得出相應的結果。對該事物或現象中所獲取到的時間及空間信息將其統稱為模式。而將模式中同一類別模式統稱為模式類[2]。當需要將具體的樣本進行歸類時就叫做模式分別或模式識別。模式識別系統通常由四部分組成,分別為數據獲取、數據預處理、數據的特征提取及選擇和分類決策。數據獲取指的是把輸入模式切換成適合計算機處理形式的一個過程。數據預處理主要是將多余的噪音去除,從中提取需要的信息,通過專業(yè)的輸入設備對殘缺的信息進行必要的修復和處理,以便于計算機提取特征,在通過數據獲取和預處理后輸入信息的數據維數較高,為了達到分類識別的目的,對原始數據進行處理過程中,通過相互的轉換從數據中提取出最原始的模式特征。原始數據空間又可以被稱為測量空間,而分類識別都是在一個稱為特征空間中進行的。所謂的模式識別系統指的是在測量空間模式中,維數由低向高的轉化的過程,這也是該系統通常采用的特診提取及特診選擇。文字算法是文字識別的關鍵和核心。
2 模式識別技術的應用方法
2.1 統計識別
在數學決策理論的基礎上,產生了一種新的識別方法,也就是統計識別方法。在進行特征提取時,就可以采用統計識別的方法,這時可以將相應的特征向量通過一個特征空間進行定義,全部的特征矢量都在這個特征空間內。這個特征空間的點都能與各種對象及特征向量之間進行對應。在分類階段中,通常采用統計決策的方法完成對特征空間信息的分類,以此來達到對各類特征對象識別的目的效果。隨著科學技術的進步,我國的統計識別技術已經逐漸成熟,尤其是對特征提取的識別。
2.2 模糊識別
模糊識別的方法主要是采用模糊數學的原理、概念和方法解決分別識別中存在的問題。模糊識別根據識別事物邏輯思維與吸取大腦識別的特征,把計算機中的二位邏輯不斷地向連續(xù)邏輯進行相關的轉化。模糊識別的結果根據已經被采用被識別對象所屬于的某個類別程度,也就是隸屬度得出結果,一個對象可以適應于不同的類別或不同程度的類別。通常情況下,一個對象只可以對應某一個類別。單模糊集理論就是將識別方法按模糊聚類法、擇近原則識別法或最大隸屬原則識別法分為多個類別[3]。
2.3 神經網絡識別
20世紀50年代,一些相關技術人員對動物神經系統的某些功能進行了研究分析,并對其進行模擬,他們通過使用計算機技術對大量的數據進行處理,從中實現了處理單元結點的建立,這種單元的出現為互聯拓撲網絡的建立提供了依據,被稱之為人工神經網絡[4]。人工神經網絡可以將不同的處理單元進行互連成為一個網絡,在進行識別分類的過程中,能夠通過網絡對人的神經系統進行相關模仿,從而實現分類的效果。這種網絡識別方式相比于其它識別方法存在較大的差別,人工精神網絡對識別的對象不需要要求有過多的認識和分析,并且可以實現智能化處理。神經網絡可以實現和模擬人認知過程中的形象思維、感知覺、分布式記憶、自組織與自學習,同時神經網絡識別方法和符號處理之間可以實現互補的作用,主要用于有處理需求且要考慮諸多條件和因素,信息模糊或不精準的信息處理。
2.4 句法結構識別
句法識別是統計識別的基礎上進行的延伸和補充,統計識別主要是通過利用數值對圖像的主要特征進行相應的描述,而句法結構識別主要是通過符號的特征描述圖像。而句法結構識別通過對語言學中句法層次結構進行一定的模仿,通過利用分層描述的技術對圖像進行層次分解,從中獲得較為簡單的子圖像,這種識別方法體現出了識別對象各層次的信息。圖像識別的方法也是在統計方法的基礎上進行的延伸,而句法結構識別方法的識別能力較圖像識別的識別能力明顯提升,句法結構識別不在是單純的對象物進行歸類處理,對物體結構和景物同樣具備識別能力。
2.5 支持向量機的模式識別
支持向量機的核心思想主要是在特征或樣本空間中打造一個最優(yōu)的超平面,而這個最優(yōu)超平面與各種類樣本集之間的距離最大,就是要使其達到最大的泛化能力。支持向量機具有泛化能力強、結構相對簡單、全局最優(yōu)性等特點,關于支持向量機的模式識別在20世紀90年代中期提出后就得到了大量的專家和學者的重視,并得到了較為廣泛的認知和應用[5]。支持向量機識別解決了函數估計和模式識別等問題。在數字圖像處理中具有尋找圖像像素的特征,可根據像素點的特征和周圍的環(huán)境檢測出其差異,并具備各像素點區(qū)分功能。
3 結語
隨著科技的進步和信息技術的發(fā)展,利用計算機技術對文字進行識別的應用越來越廣泛,該文通過模式識別技術的幾種應用方法進行了簡單分析,對其在統計識別、模糊識別、神經網絡識別、句法結構識別、支持向量機的模式識別的應用上加以總結和歸納,從中了解到模式識別技術還具有巨大的發(fā)展空間,通過人們的不斷研究,模式識別技術不僅能夠更好的應用到文字識別中,同時還能夠廣泛的應用到其它領域中。
參考文獻
[1] 張俊玲,趙林.模式識別的方法與應用[J].產業(yè)與科技論壇,2014(13):131-132.
[2] 高翔,邢玉娟.模式識別及其在圖像處理中的應用[J].自動化與儀器儀表,2015(3):102-103.
[3] 羅笑玲,黃紹鋒,歐陽天優(yōu),等.基于多分類器集成的圖像文字識別技術及其應用研究[J].軟件,2015,36(3):98-102.
[4] 崔志國,曾麗娟,李曉靜.創(chuàng)新技術與應用模式提升勘驗系統應用效率[J].警察技術,2011(2):26-28.
[5] 李新良.模式識別理論的研究與應用[J].北京電子科技學院學報,2011(4):75-79.