尹本雄
專用自動(dòng)閱卷系統(tǒng)已經(jīng)普及使用多年,但由于專用設(shè)備具有價(jià)格較高、不便攜帶等缺點(diǎn),一般多用在較大型的規(guī)范化考試中。近年來(lái),隨著智能手機(jī)的廣泛普及,利用智能手機(jī)構(gòu)建低成本的自動(dòng)閱卷系統(tǒng)也隨之發(fā)展起來(lái),這類自動(dòng)閱卷系統(tǒng)能夠有效地幫助廣大中小學(xué)教師快速地完成繁重的閱卷工作。同時(shí),后臺(tái)管理數(shù)據(jù)庫(kù)還支持平均分統(tǒng)計(jì)、優(yōu)秀率及格率統(tǒng)計(jì)、最高分最低分統(tǒng)計(jì)、排序、個(gè)人成績(jī)單生成、對(duì)指定學(xué)生進(jìn)行某時(shí)間段內(nèi)成績(jī)追蹤分析等功能。
● 當(dāng)前自動(dòng)閱卷系統(tǒng)的分析
當(dāng)前常見(jiàn)的自動(dòng)閱卷系統(tǒng)根據(jù)答題卡讀取方式的不同,一般有攝像頭閱卷系統(tǒng)、掃描儀閱卷系統(tǒng)、數(shù)碼相機(jī)閱卷系統(tǒng)及光電閱卷系統(tǒng)。由于攝像頭的普及性、便攜性及低成本特性,在這幾類閱卷系統(tǒng)中,攝像頭閱卷系統(tǒng)無(wú)疑具有很大的優(yōu)勢(shì)。
1.客觀題自動(dòng)閱卷系統(tǒng)的分析
在客觀題自動(dòng)閱卷系統(tǒng)里,出現(xiàn)過(guò)一些較為智能的系統(tǒng)。例如,西南交通大學(xué)研究的閱卷系統(tǒng),通過(guò)模式識(shí)別等方法,可以允許考生對(duì)選擇題用“A、B、C、D”作答。但該系統(tǒng)的識(shí)別準(zhǔn)確率沒(méi)有填涂方式的識(shí)別率高,特別是對(duì)以下兩種情況的識(shí)別準(zhǔn)確率較低:一是考生書寫比較潦草的答案;二是擦除重新修改過(guò)的答案。
2.主觀題自動(dòng)閱卷系統(tǒng)的分析
對(duì)答題卡評(píng)價(jià)的準(zhǔn)確性是閱卷系統(tǒng)最關(guān)鍵的參數(shù)。目前的自動(dòng)閱卷系統(tǒng)多是針對(duì)客觀題的評(píng)閱,雖然有一些主觀題自動(dòng)閱卷系統(tǒng)出現(xiàn),但這些系統(tǒng)在準(zhǔn)確性方面還達(dá)不到使用要求。例如,主觀題自動(dòng)閱卷的系統(tǒng)評(píng)價(jià)長(zhǎng)句優(yōu)于短句、無(wú)法判斷事物的真?zhèn)涡缘?。如果考生事先?jīng)過(guò)針對(duì)該閱卷系統(tǒng)的適應(yīng)性培訓(xùn),“投其所好”,則比較容易“欺騙”閱卷系統(tǒng),取得高分。因而,該系統(tǒng)只能在一定層面對(duì)文章的語(yǔ)義進(jìn)行歸納,而不能用于主觀題閱卷。它更適合用在類似于搜索引擎中的語(yǔ)義搜索,可以提高對(duì)檢索關(guān)鍵字的檢全率和檢準(zhǔn)率。
● 智能手機(jī)攝像頭自動(dòng)閱卷系統(tǒng)的研究
1.答題卡的圖像處理
基于智能手機(jī)攝像頭的自動(dòng)閱卷系統(tǒng)構(gòu)成如圖1所示。
對(duì)于該系統(tǒng)而言,閱卷程序中答題卡圖像的預(yù)處理最關(guān)鍵,直接影響到最終的閱卷準(zhǔn)確率。其包括如下幾個(gè)步驟。
(1)灰度化處理與二值化處理
為了節(jié)省手機(jī)CPU的運(yùn)算資源,我們首先應(yīng)對(duì)攝像頭采集到的彩色圖像進(jìn)行灰度化處理,即去掉顏色特征。原始圖像中各像素點(diǎn)可以分解為RGB顏色分量,通過(guò)亮度計(jì)算公式B=0.299Red+0.587Green+0.114Blue計(jì)算像素點(diǎn)的亮度值,再用亮度值B代替RGB的顏色分量值并寫回到圖像中,即可完成彩色圖像到灰度圖像的變換。
二值化處理是將上一步得到的灰度圖變換為只有黑、白兩種顏色的模式圖像。處理的方法是,設(shè)定一個(gè)灰度閾值,大于閾值的像素用白色點(diǎn)顯示,小于閾值的像素用黑色點(diǎn)顯示。對(duì)于這個(gè)閾值,一般的做法是選擇最大灰度等級(jí)的一半,即128。但我們?cè)趯?shí)際測(cè)試中發(fā)現(xiàn),如果采用固定閾值128的做法,效果不理想。為此,本系統(tǒng)中采用局部平均閾值方法,具有自適應(yīng)特性,雖然消耗較多的計(jì)算資源,但是對(duì)于改善不同答題卡二值化的效果有較好的作用。
(2)光照引起的噪聲點(diǎn)處理
由于每次拍攝時(shí)環(huán)境光強(qiáng)差異較大,如果我們?cè)谝恍┉h(huán)境光強(qiáng)不夠的條件下拍攝,得到的圖像會(huì)有較多的噪聲點(diǎn)。為了減少圖像的噪聲點(diǎn),可以對(duì)圖像進(jìn)行平滑濾波處理。常見(jiàn)的處理方法有領(lǐng)域平均法、選擇平均法、低通濾波法等。為了防止領(lǐng)域平均法對(duì)目標(biāo)邊緣造成模糊影響,這里采用了選擇平均法,僅對(duì)灰度值相近的像素點(diǎn)進(jìn)行加權(quán)平均處理。
(3)圖像定位與傾斜校正
為了簡(jiǎn)化算法和提高閱卷準(zhǔn)確性,答題卡設(shè)計(jì)有固定的分隔符與對(duì)齊符(如圖2)。由于拍攝角度和距離的原因,得到的圖像一般都會(huì)有一定程度的傾斜和旋轉(zhuǎn)。通過(guò)答題卡上設(shè)置的分隔符和對(duì)齊符,進(jìn)行圖像定位于傾斜校正。
(4)歸一化處理
歸一化處理是指對(duì)每一幅圖像在進(jìn)行判別之前,先進(jìn)行圖像統(tǒng)一大小的縮放處理。根據(jù)所得到的圖像大小的邊界尺寸,計(jì)算出一個(gè)縮放因子,進(jìn)行縮放處理。
(5)答案的差分處理
對(duì)答題卡每一題答案的匹配,即是判斷答案正確與否的過(guò)程??梢圆扇〔罘痔幚淼姆椒?,將答題卡答案位置的像素與答案模板的相應(yīng)位置像素進(jìn)行相減運(yùn)算,相減的差值大小體現(xiàn)了答題卡答案和參考答案的相近程度。具體可以采用以下公式計(jì)算:
式中是答題卡像素點(diǎn)分量值,是參考答案模板像素點(diǎn)分量值。每一個(gè)答案的匹配度S是一個(gè)介于0~1的數(shù),越接近1則表示考生答案越趨近于參考答案。設(shè)置一個(gè)匹配閾值,匹配度大于閾值的為正確,反之為錯(cuò)誤。因每個(gè)考生的填涂習(xí)慣不一樣,閾值的設(shè)置可以針對(duì)每一份答題卡自動(dòng)動(dòng)態(tài)分析。例如,以科目和準(zhǔn)考證號(hào)的填涂位置為參考來(lái)確定該份答題卡的匹配閾值,因?yàn)檫@兩個(gè)地方一般不會(huì)填錯(cuò)。
2.后臺(tái)成績(jī)管理軟件的設(shè)計(jì)
為了更好地管理考生的成績(jī),應(yīng)提高自動(dòng)閱卷系統(tǒng)的效用。這樣在中小學(xué)里便于教師了解各學(xué)生的學(xué)習(xí)進(jìn)步情況,也方便了期末成績(jī)單的打印。如果能在PC端利用數(shù)據(jù)庫(kù)管理方便地開(kāi)發(fā)出各種統(tǒng)計(jì)分析功能就更好了。