任日麗 彭利紅
摘要:隨著移動互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,智能手機(jī)等觸控式智能設(shè)備迅速進(jìn)入人們的生活。本文通過對我國傳統(tǒng)的客觀題閱卷方式進(jìn)行分析,針對客觀題閱卷中存在閱卷工作量大、考生成績準(zhǔn)確性有誤差等問題,提出了利用表格圖像的傾斜校正法與改進(jìn)十三點(diǎn)特征提取方法,運(yùn)用Android平臺下調(diào)用本地化代碼、圖像采集與定位技術(shù)與手寫字符識別術(shù),設(shè)計(jì)與實(shí)現(xiàn)了移動閱卷系統(tǒng)。該系統(tǒng)包括圖像的釆集、圖像的預(yù)處理、表格圖像的傾斜校正、表格圖像定位和字符識別等模塊。論文詳細(xì)的論述了其研究過程。
關(guān)鍵詞:智能閱卷;圖像校正法;字符識別術(shù)
中圖分類號:TP18 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2015)09-0197-02
考試作為衡量教學(xué)效果的重要指標(biāo),考試離不開試卷評閱。傳統(tǒng)的正軌考試考生必須通過2B鉛筆在特定的答題紙上作答,并且使用專業(yè)的價(jià)格不菲的光電閱卷機(jī),這不是所有學(xué)校的最佳選擇對象。由于市面上經(jīng)常出現(xiàn)不合格的2B鉛筆,造成光電閱卷機(jī)識別不了,導(dǎo)致考生成績不準(zhǔn)確等違背考試公平性的現(xiàn)象。還有一些學(xué)校采取答題卡作答方式考試,評閱老師則采取在正確答案處挖孔,采用覆蓋答題卡的形式閱卷,但這樣部分考生可以找到答題捷徑,就是多涂幾個(gè)答案,這樣便會導(dǎo)致評閱成績的誤差,由于這種方式缺乏科學(xué)性也沒有廣泛應(yīng)用。還有一種基于影像識別自動閱卷系統(tǒng),它通過掃描采集數(shù)據(jù)再通過圖像識別技術(shù),識別試卷答案圖像并計(jì)算得分,系統(tǒng)將自動存入成績以供學(xué)生在線查詢。但這種評閱系統(tǒng)需要對答題卷的格式進(jìn)行特定的設(shè)置,而且對每一份答題進(jìn)行掃描,也是一個(gè)相對比較繁重的工作,并且學(xué)校需要配置多臺掃描儀,比較不符合實(shí)際教學(xué)現(xiàn)狀。
鑒于以上幾種閱卷方式的弊端,筆者研究通過智能手機(jī)攝像頭拍攝試卷,采集試卷圖像,然后利用圖像識別算法實(shí)現(xiàn)自動評閱試卷的功能。系統(tǒng)自動將成績錄入,學(xué)生只需要擁有一臺Android智能手機(jī),便可在線查閱考試成績及排名等情況。這種方式既有利于減輕評閱老師的工作量,又利于學(xué)生能第一時(shí)間收到成績單,從而提高學(xué)生學(xué)習(xí)的積極性。無需再通過寄成績單的形式,將考生成績郵寄到家長手中。閱卷前,老師只需提前把正確答案錄入到Android智能手機(jī)中即可。由于電子化社會的飛速發(fā)展,絕大部分的師生及家長都在使用Android智能手機(jī),因此不需要額外的設(shè)備配置,減輕了學(xué)校財(cái)務(wù)支出。而且考生與閱卷老師的比例一般是幾十比一,拍照的任務(wù)量不多,能很好的解決考試成績誤差、閱卷老師工作量大、學(xué)生及家長獲取成績不及時(shí)等問題。因此,這一研究對廣大教育工作者評閱試卷具有重大意義。
1 研究內(nèi)容
1)搭建自動閱卷系統(tǒng)的整體框架
框架模塊由圖像數(shù)據(jù)預(yù)處理模塊、表格圖像定位拆分模塊、字符識別模塊。其中圖像數(shù)據(jù)預(yù)處理模塊主要包括學(xué)生試卷圖像灰度化、圖像的二值化、圖像的去噪;表格圖像定位拆分模塊則包括圖像識別區(qū)域的定位、表格版面分析;字符識別模塊包括字符特征提取、手寫字符的識別。
2)圖像采集與定位技術(shù)
由于學(xué)生答題卷不存在顏色特征,系統(tǒng)采集的學(xué)生答題卷圖片需要某種方式來對學(xué)生答題區(qū)域進(jìn)行定位。實(shí)際考試中,學(xué)生可能采用黑色筆作答,不能像車牌識別一樣通過顏色定位的方法來確定識別區(qū)域。同時(shí),由于學(xué)生作答習(xí)慣不同,如何使用恰當(dāng)?shù)乃惴ù_定試卷答題區(qū)域,并從中提取出需要識別的字母是本課題難題。本課題采用智能手機(jī)的照相機(jī)獲取真彩色圖像的方式進(jìn)行圖像釆集。與利用掃描儀進(jìn)行圖像釆集相比,釆用智能手機(jī)中自帶的照相機(jī)進(jìn)行圖像釆集的方式有簡單、方便、快捷等優(yōu)勢。通過Android操作系統(tǒng)自帶的照相機(jī)進(jìn)行圖像的采集,并將采集到的圖像存儲到SD-card中等待后臺應(yīng)用程序進(jìn)行處理。
3)手寫字符識別
字符識別是一種新型的自動化技術(shù),常常應(yīng)用于車牌識別、路標(biāo)識別、文檔識別等領(lǐng)域中。而手寫字符識別則作為字符識別中的重要研究模塊之一,是圖像處理與人工智能相結(jié)合的一種技術(shù)。在本系統(tǒng)中,如何選擇適合應(yīng)用在智能手機(jī)下的手寫字符識別算法來高效地識別出客觀題的答案是本課題的重點(diǎn)。本文采用的手寫體字符特征提取的具體步驟為:首先搜索字符區(qū)域,將搜索到的字符區(qū)域分割成2*4=8個(gè)小區(qū)域,計(jì)算出每個(gè)小區(qū)域中黑色像素點(diǎn)的個(gè)數(shù),將每個(gè)區(qū)域的黑色像素點(diǎn)個(gè)數(shù)除以每個(gè)小區(qū)域像素總數(shù),分別得到8個(gè)特征;然后分別統(tǒng)計(jì)水平方向中間兩行和垂直方向中間兩列的黑色像素占整行,整列的比例作為4個(gè)特征;最后統(tǒng)計(jì)所有黑色像素占整個(gè)區(qū)域的比例作為最后一個(gè)特征。
特征提取之后,需要對手寫字符進(jìn)行識別,目前手寫字符識別算法很多,如模板匹配、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)等。由于本課題的設(shè)計(jì)平臺是智能手機(jī)終端,所以選擇模板匹配中的最近鄰算法進(jìn)行字符識別。本文首先將標(biāo)準(zhǔn)的書寫方式作為模板錄入模板庫中,接著利用圖像之間的最短距離作為判別函數(shù)。本文分別利用了模板提取法(選用25個(gè)特征),十三點(diǎn)特征提取法以及改進(jìn)后的十三點(diǎn)特征提取算法。利用最近鄰匹配算法進(jìn)行對比,每個(gè)字母和數(shù)字選用了 3個(gè)模板、24個(gè)測試集。由于書寫風(fēng)格不同,光照、紙張對圖像識別效果的影響,現(xiàn)有的對脫機(jī)手寫字符識別的算法很難得到100%的準(zhǔn)確率。不過,相對于改進(jìn)前的十三點(diǎn)特征提取算法與模板提取法。利用十三點(diǎn)特征提取算法,在A、C、D識別上準(zhǔn)確率已經(jīng)很高。
2 結(jié)束語
本文設(shè)計(jì)完成了基于Android智能手機(jī)的自動閱卷系統(tǒng),并在三個(gè)方面取得研究進(jìn)展:其一,針對表格圖像的傾斜校正,改進(jìn)了傳統(tǒng)的投影輪廓分析法,用實(shí)驗(yàn)驗(yàn)證了改進(jìn)后的算法有更好的運(yùn)行效率;其二,針對表格圖像定位與拆分模塊進(jìn)行了優(yōu)化,彌補(bǔ)了傳統(tǒng)表格定位算法在特殊場合下定位不準(zhǔn)確的不足;其三,針對手寫字符識別模塊,改進(jìn)了適用于手持終端的十三點(diǎn)特征提取法。本項(xiàng)目所涉及到的研究內(nèi)容不僅在理論上具有較大的意義,而且具有非常重要的實(shí)用價(jià)值和廣泛的應(yīng)用推廣前景。
參考文獻(xiàn):
[1] 張站,劉政怡,吳建國,等.基于圖像識別的閱卷系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].微型機(jī)與應(yīng)用,2011, 30(4): 44-47.
[2] 李旭東.基于Android移動終端攝像的圖像處理與應(yīng)用[D].電子科技大學(xué),2011.
[3] 葛艷,高占江.基于Android系統(tǒng)的音樂播放器設(shè)計(jì)與實(shí)現(xiàn)[J].微型機(jī)與應(yīng)用,2014(1).
[4] 曾健平,邵艷潔.Android系統(tǒng)架構(gòu)及應(yīng)用程序開發(fā)研究[J].微計(jì)算機(jī)信息,2011,27(9):1-3.
[5] 葉炳發(fā),孟小華.Android圖形系統(tǒng)的分析與移植[J].電信科學(xué),2010(2): 65-68.
[6] 王克鋒.基于Android的信息推送管理系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)[D]. 大連理工大學(xué), 2012.
[7] 許雁飛,陳春玲,陳夏梅.基于OpenCV的脫機(jī)手寫字符識別技術(shù)[J].信息與電腦,2011(8):039.
[8] 于伯峰.印刷體中文文檔中表格和漢字的識別研究[D].哈爾濱工程大學(xué),2011.