王雪純
摘要:本文主要是研究并設(shè)計(jì)了文字特征提取、文字特征識(shí)別以及基于數(shù)字圖像預(yù)處理的文字識(shí)別方法。在研究文字的數(shù)字圖像預(yù)處理時(shí),提出了一種算法,叫做數(shù)字文字圖像的信息增強(qiáng)算法,這可以精確定位數(shù)字文字圖像;而且還實(shí)現(xiàn)了對(duì)數(shù)字文字圖像架構(gòu)信息的分析提取,以及在非完整文字獲取情況下的算法修正。并且,通過(guò)對(duì)文字筆畫、位置等的分析,設(shè)計(jì)了特別的提取算法,以及特征識(shí)別器,實(shí)現(xiàn)了數(shù)字文字的特征提取,以及后續(xù)的識(shí)別,并對(duì)測(cè)試樣本進(jìn)行了測(cè)試。
關(guān)鍵詞:數(shù)字識(shí)別;數(shù)字圖像處理;結(jié)構(gòu)特征
一、圖像處理技術(shù)
在當(dāng)今世界,計(jì)算機(jī)的使用與普及已經(jīng)遠(yuǎn)遠(yuǎn)超乎了人們的想象。所以,在文字圖形處理方面,人們也開(kāi)始想要運(yùn)用計(jì)算機(jī)技術(shù)來(lái)簡(jiǎn)化工作,于是就出現(xiàn)了一種新的技術(shù),叫做圖像識(shí)別技術(shù)。
圖像識(shí)別技術(shù),也就是指運(yùn)用計(jì)算機(jī)這種處理工具,將圖像先變成數(shù)字信息保存,然后再處理或重現(xiàn)。我們所研究的文章方向的數(shù)字圖像識(shí)別是指利用計(jì)算機(jī)的數(shù)字圖像識(shí)別技術(shù)來(lái)整篇地識(shí)別出文字,而節(jié)省人力進(jìn)行文字圖像轉(zhuǎn)文本的工序。
目前,利用這項(xiàng)技術(shù)的方面越來(lái)越多,可是日益增長(zhǎng)的技術(shù)需求面對(duì)的卻是技術(shù)不成熟的圖像處理技術(shù),在現(xiàn)今,計(jì)算機(jī)對(duì)外部信息的感知依然不能稱之為智能感知,所以感知力仍然很薄弱,所以依然需要大量的人力物力來(lái)維持技術(shù)的實(shí)現(xiàn),我們要所做的就是改變這種局面。
我們總說(shuō),圖像信息,圖像確實(shí)是一種信息,里面可以存儲(chǔ)著許許多多的信息,所以處理方法也就復(fù)雜多樣了。一些數(shù)字設(shè)備比如說(shuō)計(jì)算機(jī)會(huì)把圖像轉(zhuǎn)化成數(shù)字信息存儲(chǔ),然后在通過(guò)一些手段進(jìn)行重現(xiàn)、處理或者傳輸。從很早開(kāi)始,數(shù)字圖像識(shí)別技術(shù)就有了應(yīng)用,比如航天科學(xué)、信息安全、工農(nóng)業(yè)生產(chǎn)、物理學(xué)、醫(yī)療衛(wèi)生、軍事科學(xué)等。
數(shù)字圖像識(shí)別的處理系統(tǒng)主要包括三個(gè)部分:數(shù)字化一儀器、計(jì)算機(jī)設(shè)備、顯示設(shè)備。我們得到的物理圖像被劃分成不同的小格。每個(gè)小格我們稱之為像素,在圖像處理方面,主要是以像素為單位進(jìn)行處理。我們?cè)趫D像的色彩、亮度等方面通過(guò)對(duì)像素性質(zhì)的改變來(lái)處理圖像。每個(gè)像素的信息被量化,而得到圖像所對(duì)應(yīng)的矩陣,把矩陣信息以一定的形式存在電腦中,就實(shí)現(xiàn)字圖像的存儲(chǔ)。然后再經(jīng)過(guò)一些技術(shù)上的處理,就可以進(jìn)行后續(xù)的傳輸、重現(xiàn)等。
在以上的三個(gè)基本部件中,毋庸置疑,計(jì)算機(jī)是最重要的??梢赃@么說(shuō),對(duì)于圖像進(jìn)行的數(shù)字處理與識(shí)別工作的絕大部分都是靠計(jì)算機(jī)技術(shù)才能完成的,每一種處理圖像的算法也都是有了計(jì)算機(jī)才能實(shí)現(xiàn),因此,計(jì)算機(jī)技術(shù)的發(fā)展也影響著圖像識(shí)別技術(shù)的發(fā)展。
我們本次研究主要以文章方向的數(shù)字圖像識(shí)別技術(shù)為研究重點(diǎn),選取了幾種圖像處理的常用技術(shù)作為研究對(duì)象,比如銳化、中值濾波等等。并由Visual C++來(lái)實(shí)現(xiàn)?,F(xiàn)在,數(shù)字圖像的識(shí)別技術(shù)正在不斷地發(fā)展,應(yīng)用也比較廣泛。
二、數(shù)字圖像處理的常用方法
所謂圖像增強(qiáng),就是為了改善畫質(zhì),為了使人們更好地從圖像中獲取信息,當(dāng)然,在本例中,應(yīng)該是為了使計(jì)算機(jī)更好地識(shí)別圖像中的信息,就是改善視覺(jué)上的效果。圖像增強(qiáng)其實(shí)在很多方面都有應(yīng)用,因?yàn)樗椒ê?jiǎn)單卻效果明顯,在數(shù)字圖像識(shí)別領(lǐng)域具有十分重要的地位。以下是三種常用的圖像增強(qiáng)的方法:
1.灰度增強(qiáng)
灰度增強(qiáng)的意義是指在圖像處理中按照一定變換關(guān)系逐點(diǎn)地改變?cè)瓉?lái)圖像中每一個(gè)像素的灰度值。圖像會(huì)變得更加鮮明,這是灰度增強(qiáng)的好處。
2.銳化
由于客觀因素,比如信道的通帶過(guò)窄或者攝像系統(tǒng)的聚焦不好,就可能會(huì)造成圖像中目標(biāo)信息的輪廓模糊不清。而圖像銳化技術(shù)就是一種可以加重圖像的輪廓的技術(shù)。一般來(lái)說(shuō),經(jīng)過(guò)銳化技術(shù)處理過(guò)的圖像往往比精確再現(xiàn)的圖像更加清晰。所以說(shuō),圖像銳化的作用就是針對(duì)處于目標(biāo)輪廓上的像素,使其灰度值比原來(lái)小的更小,比原來(lái)大的更大,而對(duì)輪廓以外的像素不起作用。
3.中值濾波
中值濾波是一種非線性處理技術(shù),它的主要目的抑制圖像的噪聲。我們知道,在一維情況下,中值濾波器它是一個(gè)含有奇數(shù)個(gè)像素的窗口。中值濾波的處理原理是對(duì)于位于窗口正中像素的灰度值,就用窗口內(nèi)個(gè)像素灰度值的中值代替。因?yàn)橹兄禐V波不影響階躍函數(shù)和斜坡函數(shù),所以它對(duì)圖像邊界也是有保護(hù)作用的。
三、識(shí)別步驟
1.數(shù)據(jù)獲?。簲?shù)據(jù)獲取的過(guò)程是指為使計(jì)算機(jī)能夠?qū)Ω鞣N現(xiàn)象進(jìn)行分類識(shí)別,用計(jì)算機(jī)可以運(yùn)算的符號(hào)來(lái)表示所研究對(duì)象的二維圖像。通過(guò)采樣、測(cè)量和一些量化處理,然后用向量或矩陣表示成二維的數(shù)字圖像。
2.預(yù)處理:獲取的圖像都需要經(jīng)過(guò)預(yù)處理,預(yù)處理的目的是去除噪聲,加強(qiáng)有用的信息,同時(shí)其它因素或?qū)斎霚y(cè)量?jī)x器所造成的圖像的像素退化現(xiàn)象進(jìn)行復(fù)原。
3.特征提取和選擇:因?yàn)閳D像包含了很多信息,所以由圖像所得到數(shù)字圖像中含有的數(shù)據(jù)量非常大。為了有效地實(shí)現(xiàn)信息的分類識(shí)別,要對(duì)最原始的數(shù)據(jù)先進(jìn)行一定的變換,然后得到的取最能反映信息分類本質(zhì)的特征。
4.分類決策:是指在我們所說(shuō)的特征空間中用統(tǒng)計(jì)學(xué)的科學(xué)方法把被某些識(shí)別對(duì)象歸為某一類別。在復(fù)查時(shí),分類決策方法可以在一定層面上減少信息采集時(shí)的錯(cuò)誤概率。
結(jié)束語(yǔ)
在本文中,我們所說(shuō)的文章方向的數(shù)字圖像識(shí)別技術(shù)其實(shí)是一個(gè)范圍很大的技術(shù)領(lǐng)域,作者在此只是有選擇地進(jìn)行了一些研究。其實(shí),僅就文章方向的數(shù)字圖像識(shí)別技術(shù)這一部分而言,就有很多需要繼續(xù)完成的工作,可將這些問(wèn)題與其它一些數(shù)字圖像處理方法進(jìn)一步同步實(shí)現(xiàn),如圖像的膨脹腐蝕、圖像矩陣的變換、各種編碼圖像的讀寫與顯示,以及圖像的幾何變換。這一部分可以做成一個(gè)專用的文字圖像處理平臺(tái)。在一定意義上,本次研究基本明白了文字的數(shù)字圖像處理與識(shí)別的常用技術(shù),而還有很多具體的數(shù)字圖像識(shí)別處理方法可以繼續(xù)學(xué)習(xí)并實(shí)現(xiàn),研究中的識(shí)別方法還可以進(jìn)一步研究和更新。(作者單位:沈陽(yáng)師范大學(xué)學(xué)院科信軟件學(xué)院)
參考文獻(xiàn):
[1]鄭建英.數(shù)字圖像處理技術(shù)[J].內(nèi)蒙古科技與經(jīng)濟(jì),2002(5):58-59;
[2]章毓晉.中國(guó)圖像工程及當(dāng)前的幾個(gè)研究熱點(diǎn)[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2002,14(6):489-493;
[3]周杰,盧春雨,張長(zhǎng)水等.人臉自動(dòng)識(shí)別方法綜述[J].電子學(xué)報(bào),2000,28(4):102-106;