国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于DSP的字符識別系統(tǒng)的設(shè)計與實現(xiàn)

2016-10-10 09:21劉宇旸鐘詩航邢昊然王睿
中國科技縱橫 2016年14期
關(guān)鍵詞:字符識別彩色圖像字符

劉宇旸 鐘詩航 邢昊然 王睿

(北方工業(yè)大學(xué)電子信息工程學(xué)院,北京 100043)

基于DSP的字符識別系統(tǒng)的設(shè)計與實現(xiàn)

劉宇旸 鐘詩航 邢昊然 王睿

(北方工業(yè)大學(xué)電子信息工程學(xué)院,北京 100043)

本系統(tǒng)(DSP)TMS320VC5509A應(yīng)用圖像處理和字符識別技術(shù),擬實現(xiàn)對一張圖片中單個字母與數(shù)字的識別、一行數(shù)字與字母的識別、多行數(shù)字與字母的識別、在同一行中字體大小不一的字母與數(shù)字的識別,以及部分漢字的識別等文字信息的處理和識別,并以可編輯的形式輸出。

DSP CCS 數(shù)字圖像處理 字符識別

隨著計算機網(wǎng)絡(luò)飛速發(fā)展,信息電子化已經(jīng)成為一個時代的必然趨勢。文字作為信息中最重要、最集中的載體,其電子化進程顯得越來越重要。很多的電子圖書、期刊文獻和會議論文中都包含著大量有用的信息,但這些文件大都是以PDF格式進行保存的,只能以圖片的形式查看,無法直接對其中的文字信息進行復(fù)制和編輯,因此如何快捷地獲取這些文字信息,一直是困擾著人們的一個難題。本系統(tǒng)實現(xiàn)對字母以及部分漢字的識別和處理并以可編輯形式輸出。

1 系統(tǒng)設(shè)計方案(圖一)

2 各部分原理

(1)灰度化彩色圖像。實現(xiàn)將一張彩色RGB圖像轉(zhuǎn)換成灰度圖[1]。日常生活中人們所見到的圖像一般為彩色圖像,其每個像素點的顏色值由三個字節(jié)組成,分別為R(紅)、G(綠)、B(藍)三個分量,每個分量占一個字節(jié),因此每個像素點的顏色變化范圍為0~255*255*255,如果對彩色圖像直接進行處理識別的話會非常麻煩,因此本系統(tǒng)將所采集的彩色圖像先進行了灰度化處理,使一個字節(jié)代表一個像素點,每個像素點的顏色值變化范圍為0~255,從而很大程度上減少了運算量[2]。

(2)二值化處理?;叶葓D像的二值化處理,就是將圖像上像素點的灰度值設(shè)置為0或255,也就是使整個圖像呈現(xiàn)出明顯的只有黑和白的視覺效果,以便于后期對圖像的進一步處理。二值化是圖像處理中很重要的一步,二值化后的圖像效果很大程度上影響到圖像識別的準(zhǔn)確率[3]。

(3)分隔字符。通過算法處理,實現(xiàn)將每一個字符單獨分割出來,以便于處理和識別。由于行與行之間、字符與字符之間都是存在空白間隙,利用這一原理可掃描并識別出每一行字符的上下邊界,以及每一行中每一個字符的左右邊界,從而將每個字符的上下左右邊界確定[4],實現(xiàn)字符與字符之間的分割。

(4)制作字符庫。即制作出一套標(biāo)準(zhǔn)的參照數(shù)據(jù)庫,每個字符都有自己獨特的特征,可根據(jù)這些特征的不同來區(qū)分不同的字符。將分割后每個字符的數(shù)據(jù)信息與字符庫進行特征對比和匹配,從而識別出該字符,最終輸出并顯示。

圖一 系統(tǒng)設(shè)計框圖

圖二 測試原圖

圖三 識別結(jié)果

3 各部分算法實現(xiàn)

3.1 灰度化彩色圖像

讀入彩色圖像每一點的索引值,并將此索引值作為該點的灰度值,存入存放該圖像的一位數(shù)組。

3.2 二值化處理

首先求出圖像的最佳閾值,我們采用了迭代法來計算,步驟如下:

(1)求出圖像灰度的最大和最小值Hmax、Hmin,取初始閾值為其均值,即(Hmax+Hmin)/2,記作T(0);

(2)根據(jù)閾值T(k)將圖像分為前后景,分別求前后景平均灰度值,在對其求平均,作為T(k+1);

(3)重復(fù)第2步,知道T(k+1)-T(k) 小于我們設(shè)定的精度極限,得到最佳閾值。得到最佳閾值后,再對像素點遍歷,大于該值的改為255,小于的記為0[5]。

3.3 分隔字符

得到二值化的圖像后,需要將一個個的字符單獨提取出來。我們利用了圖像投影來分割字符。

當(dāng)我們把一行字符沿行方向投影后,我們可以看到一系列分離的堆,每一個堆代表一個字符,這樣我們便可以記錄堆間空白的位置信息來分割字符[6]。

同理,沿列方向投影,我們可以分割出各個行。

所以我們首先對圖像進行行分割,再對各個行進行字符分割。需要注意,此時分割出的字符在列方向并不是完全去除了白邊(由于行分割是對一行的投影,一行的字符高度并不一定相等),所以需要有一個調(diào)整的步驟,把分離出來的圖像再沿行方向投影,從頂部和底部開始,分別找到第一個非零值后,即以此點位置開始裁剪。

通過以上步驟即可得到一個個完全且僅包含一個字符的子圖像。

3.4 特征提取

表1

表2

表3

英文字符和簡單漢字的結(jié)構(gòu)都不太復(fù)雜,我們選擇用就一個九維向量來描述它的特征。

我們求取上述步驟提取的字符子圖像總的非零像素點數(shù)。然后將每個子圖像等分為9區(qū),求取每區(qū)非零像素點數(shù)占總點數(shù)的比值,作為特征向量的一個值[7]。

3.5 制作字符庫

該步驟需要獲取標(biāo)準(zhǔn)字符的信息,我們利用Matlab的便捷來進行處理。對標(biāo)準(zhǔn)字符進行上述步驟處理后,會得到各個標(biāo)準(zhǔn)字符的特征向量,整理后作為模板,以待后續(xù)識別使用。

3.6 匹配模板并輸出

字符的識別部分采用了余弦算法,利用余弦定理來判斷其與標(biāo)準(zhǔn)字符的相似性。

4 測試結(jié)果

4.1 測試結(jié)果展示圖二、圖三(部分字符庫字符識別)

4.2 可識別字符庫

4.2.1 可識別的英文字母以及識別率(單位 %)(見表1)

4.2.2 可識別的數(shù)字以及識別率(單位:%)(見表2)

4.2.3 可識別的漢字以及識別率(單位:%)(見表3)

5 結(jié)語

本文提出了基于DSP的字符識別系統(tǒng)的設(shè)計,原理與基本算法。通過最后的實驗結(jié)果,可以表明,系統(tǒng)工作穩(wěn)定,識別效率高,識別精度高,并有較大的提升空間。伴隨著大量的文章,圖片分別以PDF以及BMP格式進入互聯(lián)網(wǎng),對字符以及圖像中的字符識別成為了一大難題,同時也說明了有較大的研究空間和發(fā)展價值[8]。

[1]Rafael C.Gonzalez,Richard E.Woods.數(shù)字圖像處理第三版.Digital Image Processing,Third Edition.[M].北京:電子工業(yè)出版社,2011.6.

[2]Rafael C.Gonzalez,Richard E.Woods,Steven L.Eddins.數(shù)字圖像處理的MATLAB實現(xiàn)(第2版)[M].北京:清華大學(xué)出版社,2013.4.

[3]汪春梅,孫洪波.TMS320C55xx DSP原理及應(yīng)用[M].北京:電子工業(yè)出版社,

[4]趙小強,李大湘,白本督.DSP原理及圖像處理應(yīng)用[M].

[5]孫明.數(shù)字圖像處理與分析基礎(chǔ)——MATLAB和C++實現(xiàn)[M].北京:電子工業(yè)出版社,

[6]劉珂含,何培宇,關(guān)勝平,田芳芳,吳嶸.基于TMS320VC5509A的圖像采集與識別系統(tǒng)[J].四川大學(xué)學(xué)報(自然科學(xué)版),2008,45(1).

[7]陳炳權(quán).基于DSP+FPGA的實時圖像識別系統(tǒng)硬件與算法設(shè)計[J].衡陽師范學(xué)院學(xué)報 2008,29(3).

[8]肖明明,黎耀榮.基于DSP的字符識別系統(tǒng)的實現(xiàn)[J].微計算機信息(嵌入式與SOC), 2009,25(1-2).

猜你喜歡
字符識別彩色圖像字符
字符代表幾
一種USB接口字符液晶控制器設(shè)計
基于FPGA的實時彩色圖像邊緣檢測
消失的殖民村莊和神秘字符
一種改進深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)的英文字符識別
基于最大加權(quán)投影求解的彩色圖像灰度化對比度保留算法
儀表字符識別中的圖像處理算法研究
基于顏色恒常性的彩色圖像分割方法
基于CUDA和深度置信網(wǎng)絡(luò)的手寫字符識別
機加工件點陣字符識別研究
白水县| 凌海市| 仁怀市| 大理市| 湄潭县| 婺源县| 河北省| 商水县| 隆德县| 黎川县| 镇安县| 视频| 聊城市| 上思县| 崇州市| 大荔县| 隆子县| 阜城县| 太原市| 容城县| 永年县| 历史| 黎平县| 剑阁县| 江陵县| 页游| 博乐市| 丘北县| 黄龙县| 乐陵市| 香格里拉县| 阿克苏市| 海南省| 洮南市| 秭归县| 永清县| 镇原县| 治多县| 甘肃省| 加查县| 张掖市|