李曉陽+趙新慧+顧冉冉+呂計(jì)坤
摘 要: 為了提高材料試驗(yàn)機(jī)測量值的讀取效率、降低人工操作造成的誤差和減輕操作員的工作強(qiáng)度,提出一種具有較強(qiáng)魯棒性的實(shí)時(shí)材料試驗(yàn)機(jī)測量值自動(dòng)識(shí)別方法,利用一系列圖像處理技術(shù)對(duì)材料試驗(yàn)機(jī)測量值圖像進(jìn)行識(shí)別。實(shí)驗(yàn)證明識(shí)別準(zhǔn)確率和識(shí)別速度完全滿足實(shí)際需求。這里創(chuàng)新地對(duì)數(shù)字切分中處理斷裂數(shù)字的合并和粘連數(shù)字的分割采用二次閾值化分割法。
關(guān)鍵詞: 數(shù)字識(shí)別; 圖像預(yù)處理; 自動(dòng)檢測; 材料試驗(yàn)機(jī)
中圖分類號(hào): TN919?34; TP391 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2014)16?0114?03
Research on digital recognition technology of automatic detection system
in material testing machine
LI Xiao?yang, ZHAO Xin?hui, GU Ran?ran, L? Ji?kun
(School of Computer and Communication Engineering, Liaoning Shihua University, Fushun 113001, China)
Abstract: In order to improve the reading efficiency of values measured by ??material testing machine, reduce human error caused by the operators and lighten the working intensity of the operators, a robust real?time automatic identification method of values measured by material testing machine is presented in this paper. A series of image processing technologies were adopted to identify the digital images measured by material testing machine. The experimental results show that the recognition accuracy and speed can fully meet the actual needs of the system. The innovation is to use the secondary threshold method to deal with the broken digit merger and adhent digit division.
Keywords: digital recognition; image preprocessing; automatic detection; material testing machine
當(dāng)前計(jì)量測試所對(duì)材料試驗(yàn)機(jī)定期檢測時(shí),使用人工方式比對(duì)標(biāo)準(zhǔn)測力儀和材料試驗(yàn)機(jī)測量點(diǎn)數(shù)據(jù)。這種人工方式不僅費(fèi)時(shí)費(fèi)力,而且誤差較大。針對(duì)上述問題,本文提出了一種具有較強(qiáng)健壯性和實(shí)時(shí)性的材料試驗(yàn)機(jī)測量值自動(dòng)識(shí)別方法,利用一系列圖像處理技術(shù)對(duì)材料試驗(yàn)機(jī)測量值圖像進(jìn)行自動(dòng)識(shí)別,然后與采集的標(biāo)準(zhǔn)測力儀讀出的數(shù)據(jù)進(jìn)行比較,進(jìn)行相應(yīng)的計(jì)算統(tǒng)計(jì),從而提高材料試驗(yàn)機(jī)測量值的讀取效率,降低人工操作造成的誤差和減輕操作員的工作強(qiáng)度。
1 識(shí)別流程
材料試驗(yàn)機(jī)測量值圖像的實(shí)時(shí)識(shí)別流程如圖1所示。將攝像頭獲取材料試驗(yàn)機(jī)屏幕的連續(xù)視頻幀圖像進(jìn)行灰度化、二值化、圖像濾波和數(shù)字切分處理,獲得單個(gè)數(shù)字的二值圖像,然后對(duì)每個(gè)數(shù)字圖像提取一組具有高區(qū)分度的特征,并將特征值輸入識(shí)別器[1],從而實(shí)現(xiàn)材料試驗(yàn)機(jī)測量值圖像的實(shí)時(shí)識(shí)別 。
圖1 試驗(yàn)機(jī)測量值實(shí)時(shí)識(shí)別流程
2 預(yù)處理
2.1 灰度化
灰度圖是一種只包含圖像亮度信息而不包含顏色信息的圖像,它的每個(gè)像素只需要一個(gè)字節(jié)來存放灰度值,存儲(chǔ)空間小,運(yùn)算快。本文根據(jù)RGB和YUV顏色空間的變化關(guān)系建立亮度Y與R,G,B三個(gè)顏色分量的對(duì)應(yīng) [2?3]:
[Y=0.299R+0.587G+0.114B] (1)
式(1)可將真彩色圖像轉(zhuǎn)換成灰度圖像。
2.2 圖像濾波
圖像的濾波處理是濾除圖像中的各種噪聲干擾,得到原始的數(shù)字圖像。濾波的方法有很多,本文主要使用了自適應(yīng)中值濾波來去除噪聲干擾。自適應(yīng)中值濾波的濾波方式和常規(guī)的中值濾波一樣,都使用一個(gè)矩形區(qū)域的窗口,不同的是在濾波過程中,自適應(yīng)濾波會(huì)根據(jù)一定的設(shè)定條件改變(即增加)濾波窗的大小,同時(shí)當(dāng)判斷濾波窗中心的像素是噪聲時(shí),該值用中值代替,否則不改變其當(dāng)前像素值。具體步驟為:
(1) 對(duì)圖像各區(qū)域進(jìn)行噪聲檢測;
(2) 根據(jù)各區(qū)域受噪聲污染的狀況確定濾波窗口的尺寸;
(3) 對(duì)檢測出的噪聲點(diǎn)進(jìn)行濾波。
2.3 二值化
二值化的目的是把彩色圖像轉(zhuǎn)變?yōu)楹诎讏D像,從而便于進(jìn)行圖像分割等后續(xù)處理。本文采用全局二值化的方法。全局二值化在圖像的二維空間內(nèi)表示為[4?5]: [g(x,y)=0, f(x,y) 式中T為閾值,通過圖像二值化處理,可以將圖像分為前景和背景兩部分,使方便取出所關(guān)心的部分。另外,為了提高靈活性,提供給用戶手動(dòng)設(shè)置閾值的接口,從而可以讓用戶根據(jù)現(xiàn)場情況去調(diào)整。
2.4 數(shù)字切分
數(shù)字字符切分有多種方法,最常用的方法是根據(jù)圖像中的連通域來切分?jǐn)?shù)字字符。正常情況下,每個(gè)數(shù)字字符都會(huì)構(gòu)成一個(gè)獨(dú)立的連通圖像域,獲取每個(gè)數(shù)字字符連通域的行和列的起始和終止位置,也就獲取此數(shù)字的最小矩形,從而也就完成了此數(shù)字字符的切分工作。
本文使用了投影法[6]對(duì)數(shù)字圖像進(jìn)行分割。投影法是一種傳統(tǒng)的切分圖像的方法。在切分處理過程中面臨的主要困難是怎樣判斷是否存在數(shù)字?jǐn)嗔鸦蛘哒尺B,以及如何處理斷裂或粘連的數(shù)字。本文中斷裂數(shù)字的合并和粘連數(shù)字的分割采用二次閾值化分割方法。在二值圖像投影上找出所有滿足先直線下降到0值或接近0值然后又直線上升的駐點(diǎn),閾值取所有駐點(diǎn)的最大值,以此閾值進(jìn)行第一次分割。第一次分割后可能存在數(shù)字?jǐn)嗔鸦蛘哒尺B現(xiàn)象,所以還需要進(jìn)行二次分割和合并。具體步驟如下:
(1) 首先分析切分出的數(shù)字的寬度,在這個(gè)過程中找出與其他數(shù)字寬度相差大的特殊切分?jǐn)?shù)字,這樣的切分?jǐn)?shù)字可能是斷裂或粘連的數(shù)字或是數(shù)字“1”。
(2) 在去除了以上特殊切分?jǐn)?shù)字后,統(tǒng)計(jì)出切分?jǐn)?shù)字的最大寬度widthmax和最小寬度widthmin。
(3) 在特殊切分?jǐn)?shù)字中對(duì)于寬度特別窄的切分?jǐn)?shù)字,需要排除是否為數(shù)字“1”,方法是數(shù)字“1”的投影兩端有非常大的斜率,如果排除了是數(shù)字“1”,就說明是斷裂數(shù)字,那么分別計(jì)算其與前后切分?jǐn)?shù)字合并后的寬度,若兩者都小于widthmax,則和較小的合并;若只有一個(gè)小于widthmax,則合并它們,若都不小于,則不合并。
(4) 特殊切分?jǐn)?shù)字中寬度特別寬的切分?jǐn)?shù)字是粘連數(shù)字,尋找切分?jǐn)?shù)字中投影最窄的地方進(jìn)行切分。
2.5 大小歸一化
大小歸一化是對(duì)不同大小的切分?jǐn)?shù)字的圖像做幾何變換,使之成為同一大小尺寸。大小歸一化的目的為了使切分出來的數(shù)字圖像在提取特征時(shí)能有一致的標(biāo)準(zhǔn)。切分?jǐn)?shù)字圖像的大小歸一化需要保持原始切分?jǐn)?shù)字圖像的拓?fù)浣Y(jié)構(gòu)不能改變,從而最大限度地降低切分?jǐn)?shù)字圖像失真,以便提高識(shí)別準(zhǔn)確率。本文將切分?jǐn)?shù)字圖像寬度小于25像素的統(tǒng)一歸一化寬度為25像素。
3 特征提取
將切分出的數(shù)字圖像的長度和寬度都進(jìn)行N等分,得到N×N均勻小區(qū)域,稱為N×N模板[7]。將每一個(gè)小區(qū)域內(nèi)的數(shù)字白像素(或黑像素)個(gè)數(shù)進(jìn)行統(tǒng)計(jì),用統(tǒng)計(jì)出的白像素(或黑像素)個(gè)數(shù)除以該小區(qū)域的面積,即得特征值。N值越大,區(qū)分能力就越強(qiáng),但計(jì)算量也會(huì)越大,本文取N值為5。
4 數(shù)字識(shí)別
考慮到模板匹配算法在數(shù)字類型較少時(shí)具有計(jì)算速度快的優(yōu)點(diǎn),能夠滿足實(shí)時(shí)性要求,本文采用模板匹配算法[8?10]。設(shè)有M個(gè)類別:ω1,ω1,…,ωM,每類由若干個(gè)向量表示,如ωi,有:
[Xi=xi1,xi2,xi3,…,xin]
對(duì)于被識(shí)別的數(shù)字X:
[X=x1,x2,x3,…,xn]
計(jì)算距離d(X,Xi),若存在某一個(gè)i,使d(X,Xi) 實(shí)際使用時(shí),X,Y兩點(diǎn)距離可以用|X-Y|2來表示。具體實(shí)現(xiàn)步驟如下: (1) 待測數(shù)字圖像X與模板集每個(gè)模板Xi的距離采用公式d(X,Xi)=|X-Xi|2計(jì)算。 (2) 分別計(jì)算待測數(shù)字圖像和模板集中各已知模板之間的距離,找出距離待測數(shù)字圖像最近的已知模板,待測數(shù)字圖像中的數(shù)字就是該已知模板的中的數(shù)字。 5 實(shí)驗(yàn)結(jié)果與分析 實(shí)驗(yàn)中使用攝像頭獲取材料試驗(yàn)機(jī)屏幕的連續(xù)視頻幀,視頻幀分辨率為640×480。在AMD Ⅱ x2 B24 2.99 GHz,2 GB內(nèi)存的PC機(jī)上進(jìn)行了試驗(yàn)。系統(tǒng)運(yùn)行界面如圖2所示。結(jié)果如表1所示。 圖2 系統(tǒng)運(yùn)行界面 表1 不同樣本的測試結(jié)果 從實(shí)驗(yàn)結(jié)果可看出,在數(shù)字圖像清晰的情況下,識(shí)別率可以達(dá)到100%;對(duì)有輕微點(diǎn)狀噪聲和輕微斷痕的樣本,識(shí)別率也是很高的,但對(duì)存在數(shù)字殘缺的樣本,識(shí)別率有所下降。由于實(shí)際使用環(huán)境是在室內(nèi),光線是可以調(diào)節(jié)的,另外,本系統(tǒng)可以由用戶根據(jù)現(xiàn)場情況手動(dòng)調(diào)節(jié)二值化閾值,所以實(shí)際使用中可以保證數(shù)字圖像的清晰。實(shí)驗(yàn)中,數(shù)字圖像識(shí)別時(shí)間小于30 ms,遠(yuǎn)低于材料試驗(yàn)機(jī)檢測時(shí)的誤差時(shí)間要求(低于100 ms)。 6 結(jié) 語 本文研究了一種材料試驗(yàn)機(jī)測量值實(shí)時(shí)識(shí)別方法,該方法具有以下三個(gè)特點(diǎn):數(shù)字切分中處理斷裂數(shù)字的合并和粘連數(shù)字的分割采用了二次閾值化分割法; 識(shí)別速度快,識(shí)別時(shí)間短;能夠由用戶手動(dòng)調(diào)整閾值,不需要進(jìn)行細(xì)化、平滑等耗時(shí)的運(yùn)算。 參考文獻(xiàn) [1] 張海波,段會(huì)川,張曙光,等.一種數(shù)字儀表顯示值快速識(shí)別方法[J].計(jì)算機(jī)工程與應(yīng)用,2005,41(4):223?226. [2] 陳明華.印刷體數(shù)字識(shí)別算法研究[D].武漢:華中科技大學(xué),2012. [3] 陳軍勝.組合結(jié)構(gòu)特征的自由手寫體數(shù)字識(shí)別算法研究[J].計(jì)算機(jī)工程與應(yīng)用,2013,49(5):179?184. [4] 張金鳳.變電站數(shù)字識(shí)別技術(shù)和運(yùn)動(dòng)物體檢測方法的研究[D].重慶:重慶大學(xué),2008. [5] 陳愛斌,陸麗娜.基于多特征的印刷體數(shù)字識(shí)別[J].計(jì)算技術(shù)與自動(dòng)化,2011,30(3):105?108. [6] 崔行臣,段會(huì)川,王金玲,等.數(shù)顯儀表數(shù)字實(shí)時(shí)識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)工程與設(shè)計(jì),2010,31(1):214?217. [7] 左飛,萬晉森,劉航.數(shù)字圖像處理原理與實(shí)踐:基于Visual C++開發(fā)[M].北京:電子工業(yè)出版社,2011. [8] 趙紀(jì)華.基于模板匹配算法的槍械編號(hào)識(shí)別研究[J].計(jì)算機(jī)與數(shù)字工程,2013,41(10):80?81. [9] 楊淑瑩.圖像模式識(shí)別[M].北京:北方交通大學(xué)出版社,2005. [10] 黃濤.模板匹配在圖像識(shí)別中的應(yīng)用[J].云南大學(xué)學(xué)報(bào):自然科學(xué)版,2005,27(5):327?332.
2.4 數(shù)字切分
數(shù)字字符切分有多種方法,最常用的方法是根據(jù)圖像中的連通域來切分?jǐn)?shù)字字符。正常情況下,每個(gè)數(shù)字字符都會(huì)構(gòu)成一個(gè)獨(dú)立的連通圖像域,獲取每個(gè)數(shù)字字符連通域的行和列的起始和終止位置,也就獲取此數(shù)字的最小矩形,從而也就完成了此數(shù)字字符的切分工作。
本文使用了投影法[6]對(duì)數(shù)字圖像進(jìn)行分割。投影法是一種傳統(tǒng)的切分圖像的方法。在切分處理過程中面臨的主要困難是怎樣判斷是否存在數(shù)字?jǐn)嗔鸦蛘哒尺B,以及如何處理斷裂或粘連的數(shù)字。本文中斷裂數(shù)字的合并和粘連數(shù)字的分割采用二次閾值化分割方法。在二值圖像投影上找出所有滿足先直線下降到0值或接近0值然后又直線上升的駐點(diǎn),閾值取所有駐點(diǎn)的最大值,以此閾值進(jìn)行第一次分割。第一次分割后可能存在數(shù)字?jǐn)嗔鸦蛘哒尺B現(xiàn)象,所以還需要進(jìn)行二次分割和合并。具體步驟如下:
(1) 首先分析切分出的數(shù)字的寬度,在這個(gè)過程中找出與其他數(shù)字寬度相差大的特殊切分?jǐn)?shù)字,這樣的切分?jǐn)?shù)字可能是斷裂或粘連的數(shù)字或是數(shù)字“1”。
(2) 在去除了以上特殊切分?jǐn)?shù)字后,統(tǒng)計(jì)出切分?jǐn)?shù)字的最大寬度widthmax和最小寬度widthmin。
(3) 在特殊切分?jǐn)?shù)字中對(duì)于寬度特別窄的切分?jǐn)?shù)字,需要排除是否為數(shù)字“1”,方法是數(shù)字“1”的投影兩端有非常大的斜率,如果排除了是數(shù)字“1”,就說明是斷裂數(shù)字,那么分別計(jì)算其與前后切分?jǐn)?shù)字合并后的寬度,若兩者都小于widthmax,則和較小的合并;若只有一個(gè)小于widthmax,則合并它們,若都不小于,則不合并。
(4) 特殊切分?jǐn)?shù)字中寬度特別寬的切分?jǐn)?shù)字是粘連數(shù)字,尋找切分?jǐn)?shù)字中投影最窄的地方進(jìn)行切分。
2.5 大小歸一化
大小歸一化是對(duì)不同大小的切分?jǐn)?shù)字的圖像做幾何變換,使之成為同一大小尺寸。大小歸一化的目的為了使切分出來的數(shù)字圖像在提取特征時(shí)能有一致的標(biāo)準(zhǔn)。切分?jǐn)?shù)字圖像的大小歸一化需要保持原始切分?jǐn)?shù)字圖像的拓?fù)浣Y(jié)構(gòu)不能改變,從而最大限度地降低切分?jǐn)?shù)字圖像失真,以便提高識(shí)別準(zhǔn)確率。本文將切分?jǐn)?shù)字圖像寬度小于25像素的統(tǒng)一歸一化寬度為25像素。
3 特征提取
將切分出的數(shù)字圖像的長度和寬度都進(jìn)行N等分,得到N×N均勻小區(qū)域,稱為N×N模板[7]。將每一個(gè)小區(qū)域內(nèi)的數(shù)字白像素(或黑像素)個(gè)數(shù)進(jìn)行統(tǒng)計(jì),用統(tǒng)計(jì)出的白像素(或黑像素)個(gè)數(shù)除以該小區(qū)域的面積,即得特征值。N值越大,區(qū)分能力就越強(qiáng),但計(jì)算量也會(huì)越大,本文取N值為5。
4 數(shù)字識(shí)別
考慮到模板匹配算法在數(shù)字類型較少時(shí)具有計(jì)算速度快的優(yōu)點(diǎn),能夠滿足實(shí)時(shí)性要求,本文采用模板匹配算法[8?10]。設(shè)有M個(gè)類別:ω1,ω1,…,ωM,每類由若干個(gè)向量表示,如ωi,有:
[Xi=xi1,xi2,xi3,…,xin]
對(duì)于被識(shí)別的數(shù)字X:
[X=x1,x2,x3,…,xn]
計(jì)算距離d(X,Xi),若存在某一個(gè)i,使d(X,Xi) 實(shí)際使用時(shí),X,Y兩點(diǎn)距離可以用|X-Y|2來表示。具體實(shí)現(xiàn)步驟如下: (1) 待測數(shù)字圖像X與模板集每個(gè)模板Xi的距離采用公式d(X,Xi)=|X-Xi|2計(jì)算。 (2) 分別計(jì)算待測數(shù)字圖像和模板集中各已知模板之間的距離,找出距離待測數(shù)字圖像最近的已知模板,待測數(shù)字圖像中的數(shù)字就是該已知模板的中的數(shù)字。 5 實(shí)驗(yàn)結(jié)果與分析 實(shí)驗(yàn)中使用攝像頭獲取材料試驗(yàn)機(jī)屏幕的連續(xù)視頻幀,視頻幀分辨率為640×480。在AMD Ⅱ x2 B24 2.99 GHz,2 GB內(nèi)存的PC機(jī)上進(jìn)行了試驗(yàn)。系統(tǒng)運(yùn)行界面如圖2所示。結(jié)果如表1所示。 圖2 系統(tǒng)運(yùn)行界面 表1 不同樣本的測試結(jié)果 從實(shí)驗(yàn)結(jié)果可看出,在數(shù)字圖像清晰的情況下,識(shí)別率可以達(dá)到100%;對(duì)有輕微點(diǎn)狀噪聲和輕微斷痕的樣本,識(shí)別率也是很高的,但對(duì)存在數(shù)字殘缺的樣本,識(shí)別率有所下降。由于實(shí)際使用環(huán)境是在室內(nèi),光線是可以調(diào)節(jié)的,另外,本系統(tǒng)可以由用戶根據(jù)現(xiàn)場情況手動(dòng)調(diào)節(jié)二值化閾值,所以實(shí)際使用中可以保證數(shù)字圖像的清晰。實(shí)驗(yàn)中,數(shù)字圖像識(shí)別時(shí)間小于30 ms,遠(yuǎn)低于材料試驗(yàn)機(jī)檢測時(shí)的誤差時(shí)間要求(低于100 ms)。 6 結(jié) 語 本文研究了一種材料試驗(yàn)機(jī)測量值實(shí)時(shí)識(shí)別方法,該方法具有以下三個(gè)特點(diǎn):數(shù)字切分中處理斷裂數(shù)字的合并和粘連數(shù)字的分割采用了二次閾值化分割法; 識(shí)別速度快,識(shí)別時(shí)間短;能夠由用戶手動(dòng)調(diào)整閾值,不需要進(jìn)行細(xì)化、平滑等耗時(shí)的運(yùn)算。 參考文獻(xiàn) [1] 張海波,段會(huì)川,張曙光,等.一種數(shù)字儀表顯示值快速識(shí)別方法[J].計(jì)算機(jī)工程與應(yīng)用,2005,41(4):223?226. [2] 陳明華.印刷體數(shù)字識(shí)別算法研究[D].武漢:華中科技大學(xué),2012. [3] 陳軍勝.組合結(jié)構(gòu)特征的自由手寫體數(shù)字識(shí)別算法研究[J].計(jì)算機(jī)工程與應(yīng)用,2013,49(5):179?184. [4] 張金鳳.變電站數(shù)字識(shí)別技術(shù)和運(yùn)動(dòng)物體檢測方法的研究[D].重慶:重慶大學(xué),2008. [5] 陳愛斌,陸麗娜.基于多特征的印刷體數(shù)字識(shí)別[J].計(jì)算技術(shù)與自動(dòng)化,2011,30(3):105?108. [6] 崔行臣,段會(huì)川,王金玲,等.數(shù)顯儀表數(shù)字實(shí)時(shí)識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)工程與設(shè)計(jì),2010,31(1):214?217. [7] 左飛,萬晉森,劉航.數(shù)字圖像處理原理與實(shí)踐:基于Visual C++開發(fā)[M].北京:電子工業(yè)出版社,2011. [8] 趙紀(jì)華.基于模板匹配算法的槍械編號(hào)識(shí)別研究[J].計(jì)算機(jī)與數(shù)字工程,2013,41(10):80?81. [9] 楊淑瑩.圖像模式識(shí)別[M].北京:北方交通大學(xué)出版社,2005. [10] 黃濤.模板匹配在圖像識(shí)別中的應(yīng)用[J].云南大學(xué)學(xué)報(bào):自然科學(xué)版,2005,27(5):327?332.
2.4 數(shù)字切分
數(shù)字字符切分有多種方法,最常用的方法是根據(jù)圖像中的連通域來切分?jǐn)?shù)字字符。正常情況下,每個(gè)數(shù)字字符都會(huì)構(gòu)成一個(gè)獨(dú)立的連通圖像域,獲取每個(gè)數(shù)字字符連通域的行和列的起始和終止位置,也就獲取此數(shù)字的最小矩形,從而也就完成了此數(shù)字字符的切分工作。
本文使用了投影法[6]對(duì)數(shù)字圖像進(jìn)行分割。投影法是一種傳統(tǒng)的切分圖像的方法。在切分處理過程中面臨的主要困難是怎樣判斷是否存在數(shù)字?jǐn)嗔鸦蛘哒尺B,以及如何處理斷裂或粘連的數(shù)字。本文中斷裂數(shù)字的合并和粘連數(shù)字的分割采用二次閾值化分割方法。在二值圖像投影上找出所有滿足先直線下降到0值或接近0值然后又直線上升的駐點(diǎn),閾值取所有駐點(diǎn)的最大值,以此閾值進(jìn)行第一次分割。第一次分割后可能存在數(shù)字?jǐn)嗔鸦蛘哒尺B現(xiàn)象,所以還需要進(jìn)行二次分割和合并。具體步驟如下:
(1) 首先分析切分出的數(shù)字的寬度,在這個(gè)過程中找出與其他數(shù)字寬度相差大的特殊切分?jǐn)?shù)字,這樣的切分?jǐn)?shù)字可能是斷裂或粘連的數(shù)字或是數(shù)字“1”。
(2) 在去除了以上特殊切分?jǐn)?shù)字后,統(tǒng)計(jì)出切分?jǐn)?shù)字的最大寬度widthmax和最小寬度widthmin。
(3) 在特殊切分?jǐn)?shù)字中對(duì)于寬度特別窄的切分?jǐn)?shù)字,需要排除是否為數(shù)字“1”,方法是數(shù)字“1”的投影兩端有非常大的斜率,如果排除了是數(shù)字“1”,就說明是斷裂數(shù)字,那么分別計(jì)算其與前后切分?jǐn)?shù)字合并后的寬度,若兩者都小于widthmax,則和較小的合并;若只有一個(gè)小于widthmax,則合并它們,若都不小于,則不合并。
(4) 特殊切分?jǐn)?shù)字中寬度特別寬的切分?jǐn)?shù)字是粘連數(shù)字,尋找切分?jǐn)?shù)字中投影最窄的地方進(jìn)行切分。
2.5 大小歸一化
大小歸一化是對(duì)不同大小的切分?jǐn)?shù)字的圖像做幾何變換,使之成為同一大小尺寸。大小歸一化的目的為了使切分出來的數(shù)字圖像在提取特征時(shí)能有一致的標(biāo)準(zhǔn)。切分?jǐn)?shù)字圖像的大小歸一化需要保持原始切分?jǐn)?shù)字圖像的拓?fù)浣Y(jié)構(gòu)不能改變,從而最大限度地降低切分?jǐn)?shù)字圖像失真,以便提高識(shí)別準(zhǔn)確率。本文將切分?jǐn)?shù)字圖像寬度小于25像素的統(tǒng)一歸一化寬度為25像素。
3 特征提取
將切分出的數(shù)字圖像的長度和寬度都進(jìn)行N等分,得到N×N均勻小區(qū)域,稱為N×N模板[7]。將每一個(gè)小區(qū)域內(nèi)的數(shù)字白像素(或黑像素)個(gè)數(shù)進(jìn)行統(tǒng)計(jì),用統(tǒng)計(jì)出的白像素(或黑像素)個(gè)數(shù)除以該小區(qū)域的面積,即得特征值。N值越大,區(qū)分能力就越強(qiáng),但計(jì)算量也會(huì)越大,本文取N值為5。
4 數(shù)字識(shí)別
考慮到模板匹配算法在數(shù)字類型較少時(shí)具有計(jì)算速度快的優(yōu)點(diǎn),能夠滿足實(shí)時(shí)性要求,本文采用模板匹配算法[8?10]。設(shè)有M個(gè)類別:ω1,ω1,…,ωM,每類由若干個(gè)向量表示,如ωi,有:
[Xi=xi1,xi2,xi3,…,xin]
對(duì)于被識(shí)別的數(shù)字X:
[X=x1,x2,x3,…,xn]
計(jì)算距離d(X,Xi),若存在某一個(gè)i,使d(X,Xi) 實(shí)際使用時(shí),X,Y兩點(diǎn)距離可以用|X-Y|2來表示。具體實(shí)現(xiàn)步驟如下: (1) 待測數(shù)字圖像X與模板集每個(gè)模板Xi的距離采用公式d(X,Xi)=|X-Xi|2計(jì)算。 (2) 分別計(jì)算待測數(shù)字圖像和模板集中各已知模板之間的距離,找出距離待測數(shù)字圖像最近的已知模板,待測數(shù)字圖像中的數(shù)字就是該已知模板的中的數(shù)字。 5 實(shí)驗(yàn)結(jié)果與分析 實(shí)驗(yàn)中使用攝像頭獲取材料試驗(yàn)機(jī)屏幕的連續(xù)視頻幀,視頻幀分辨率為640×480。在AMD Ⅱ x2 B24 2.99 GHz,2 GB內(nèi)存的PC機(jī)上進(jìn)行了試驗(yàn)。系統(tǒng)運(yùn)行界面如圖2所示。結(jié)果如表1所示。 圖2 系統(tǒng)運(yùn)行界面 表1 不同樣本的測試結(jié)果 從實(shí)驗(yàn)結(jié)果可看出,在數(shù)字圖像清晰的情況下,識(shí)別率可以達(dá)到100%;對(duì)有輕微點(diǎn)狀噪聲和輕微斷痕的樣本,識(shí)別率也是很高的,但對(duì)存在數(shù)字殘缺的樣本,識(shí)別率有所下降。由于實(shí)際使用環(huán)境是在室內(nèi),光線是可以調(diào)節(jié)的,另外,本系統(tǒng)可以由用戶根據(jù)現(xiàn)場情況手動(dòng)調(diào)節(jié)二值化閾值,所以實(shí)際使用中可以保證數(shù)字圖像的清晰。實(shí)驗(yàn)中,數(shù)字圖像識(shí)別時(shí)間小于30 ms,遠(yuǎn)低于材料試驗(yàn)機(jī)檢測時(shí)的誤差時(shí)間要求(低于100 ms)。 6 結(jié) 語 本文研究了一種材料試驗(yàn)機(jī)測量值實(shí)時(shí)識(shí)別方法,該方法具有以下三個(gè)特點(diǎn):數(shù)字切分中處理斷裂數(shù)字的合并和粘連數(shù)字的分割采用了二次閾值化分割法; 識(shí)別速度快,識(shí)別時(shí)間短;能夠由用戶手動(dòng)調(diào)整閾值,不需要進(jìn)行細(xì)化、平滑等耗時(shí)的運(yùn)算。 參考文獻(xiàn) [1] 張海波,段會(huì)川,張曙光,等.一種數(shù)字儀表顯示值快速識(shí)別方法[J].計(jì)算機(jī)工程與應(yīng)用,2005,41(4):223?226. [2] 陳明華.印刷體數(shù)字識(shí)別算法研究[D].武漢:華中科技大學(xué),2012. [3] 陳軍勝.組合結(jié)構(gòu)特征的自由手寫體數(shù)字識(shí)別算法研究[J].計(jì)算機(jī)工程與應(yīng)用,2013,49(5):179?184. [4] 張金鳳.變電站數(shù)字識(shí)別技術(shù)和運(yùn)動(dòng)物體檢測方法的研究[D].重慶:重慶大學(xué),2008. [5] 陳愛斌,陸麗娜.基于多特征的印刷體數(shù)字識(shí)別[J].計(jì)算技術(shù)與自動(dòng)化,2011,30(3):105?108. [6] 崔行臣,段會(huì)川,王金玲,等.數(shù)顯儀表數(shù)字實(shí)時(shí)識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)工程與設(shè)計(jì),2010,31(1):214?217. [7] 左飛,萬晉森,劉航.數(shù)字圖像處理原理與實(shí)踐:基于Visual C++開發(fā)[M].北京:電子工業(yè)出版社,2011. [8] 趙紀(jì)華.基于模板匹配算法的槍械編號(hào)識(shí)別研究[J].計(jì)算機(jī)與數(shù)字工程,2013,41(10):80?81. [9] 楊淑瑩.圖像模式識(shí)別[M].北京:北方交通大學(xué)出版社,2005. [10] 黃濤.模板匹配在圖像識(shí)別中的應(yīng)用[J].云南大學(xué)學(xué)報(bào):自然科學(xué)版,2005,27(5):327?332.