尹本雄
專用自動閱卷系統(tǒng)已經普及使用多年,但由于專用設備具有價格較高、不便攜帶等缺點,一般多用在較大型的規(guī)范化考試中。近年來,隨著智能手機的廣泛普及,利用智能手機構建低成本的自動閱卷系統(tǒng)也隨之發(fā)展起來,這類自動閱卷系統(tǒng)能夠有效地幫助廣大中小學教師快速地完成繁重的閱卷工作。同時,后臺管理數據庫還支持平均分統(tǒng)計、優(yōu)秀率及格率統(tǒng)計、最高分最低分統(tǒng)計、排序、個人成績單生成、對指定學生進行某時間段內成績追蹤分析等功能。
● 當前自動閱卷系統(tǒng)的分析
當前常見的自動閱卷系統(tǒng)根據答題卡讀取方式的不同,一般有攝像頭閱卷系統(tǒng)、掃描儀閱卷系統(tǒng)、數碼相機閱卷系統(tǒng)及光電閱卷系統(tǒng)。由于攝像頭的普及性、便攜性及低成本特性,在這幾類閱卷系統(tǒng)中,攝像頭閱卷系統(tǒng)無疑具有很大的優(yōu)勢。
1.客觀題自動閱卷系統(tǒng)的分析
在客觀題自動閱卷系統(tǒng)里,出現(xiàn)過一些較為智能的系統(tǒng)。例如,西南交通大學研究的閱卷系統(tǒng),通過模式識別等方法,可以允許考生對選擇題用“A、B、C、D”作答。但該系統(tǒng)的識別準確率沒有填涂方式的識別率高,特別是對以下兩種情況的識別準確率較低:一是考生書寫比較潦草的答案;二是擦除重新修改過的答案。
2.主觀題自動閱卷系統(tǒng)的分析
對答題卡評價的準確性是閱卷系統(tǒng)最關鍵的參數。目前的自動閱卷系統(tǒng)多是針對客觀題的評閱,雖然有一些主觀題自動閱卷系統(tǒng)出現(xiàn),但這些系統(tǒng)在準確性方面還達不到使用要求。例如,主觀題自動閱卷的系統(tǒng)評價長句優(yōu)于短句、無法判斷事物的真?zhèn)涡缘取H绻忌孪冉涍^針對該閱卷系統(tǒng)的適應性培訓,“投其所好”,則比較容易“欺騙”閱卷系統(tǒng),取得高分。因而,該系統(tǒng)只能在一定層面對文章的語義進行歸納,而不能用于主觀題閱卷。它更適合用在類似于搜索引擎中的語義搜索,可以提高對檢索關鍵字的檢全率和檢準率。
● 智能手機攝像頭自動閱卷系統(tǒng)的研究
1.答題卡的圖像處理
基于智能手機攝像頭的自動閱卷系統(tǒng)構成如圖1所示。
對于該系統(tǒng)而言,閱卷程序中答題卡圖像的預處理最關鍵,直接影響到最終的閱卷準確率。其包括如下幾個步驟。
(1)灰度化處理與二值化處理
為了節(jié)省手機CPU的運算資源,我們首先應對攝像頭采集到的彩色圖像進行灰度化處理,即去掉顏色特征。原始圖像中各像素點可以分解為RGB顏色分量,通過亮度計算公式B=0.299Red+0.587Green+0.114Blue計算像素點的亮度值,再用亮度值B代替RGB的顏色分量值并寫回到圖像中,即可完成彩色圖像到灰度圖像的變換。
二值化處理是將上一步得到的灰度圖變換為只有黑、白兩種顏色的模式圖像。處理的方法是,設定一個灰度閾值,大于閾值的像素用白色點顯示,小于閾值的像素用黑色點顯示。對于這個閾值,一般的做法是選擇最大灰度等級的一半,即128。但我們在實際測試中發(fā)現(xiàn),如果采用固定閾值128的做法,效果不理想。為此,本系統(tǒng)中采用局部平均閾值方法,具有自適應特性,雖然消耗較多的計算資源,但是對于改善不同答題卡二值化的效果有較好的作用。
(2)光照引起的噪聲點處理
由于每次拍攝時環(huán)境光強差異較大,如果我們在一些環(huán)境光強不夠的條件下拍攝,得到的圖像會有較多的噪聲點。為了減少圖像的噪聲點,可以對圖像進行平滑濾波處理。常見的處理方法有領域平均法、選擇平均法、低通濾波法等。為了防止領域平均法對目標邊緣造成模糊影響,這里采用了選擇平均法,僅對灰度值相近的像素點進行加權平均處理。
(3)圖像定位與傾斜校正
為了簡化算法和提高閱卷準確性,答題卡設計有固定的分隔符與對齊符(如圖2)。由于拍攝角度和距離的原因,得到的圖像一般都會有一定程度的傾斜和旋轉。通過答題卡上設置的分隔符和對齊符,進行圖像定位于傾斜校正。
(4)歸一化處理
歸一化處理是指對每一幅圖像在進行判別之前,先進行圖像統(tǒng)一大小的縮放處理。根據所得到的圖像大小的邊界尺寸,計算出一個縮放因子,進行縮放處理。
(5)答案的差分處理
對答題卡每一題答案的匹配,即是判斷答案正確與否的過程??梢圆扇〔罘痔幚淼姆椒ǎ瑢⒋痤}卡答案位置的像素與答案模板的相應位置像素進行相減運算,相減的差值大小體現(xiàn)了答題卡答案和參考答案的相近程度。具體可以采用以下公式計算:
式中是答題卡像素點分量值,是參考答案模板像素點分量值。每一個答案的匹配度S是一個介于0~1的數,越接近1則表示考生答案越趨近于參考答案。設置一個匹配閾值,匹配度大于閾值的為正確,反之為錯誤。因每個考生的填涂習慣不一樣,閾值的設置可以針對每一份答題卡自動動態(tài)分析。例如,以科目和準考證號的填涂位置為參考來確定該份答題卡的匹配閾值,因為這兩個地方一般不會填錯。
2.后臺成績管理軟件的設計
為了更好地管理考生的成績,應提高自動閱卷系統(tǒng)的效用。這樣在中小學里便于教師了解各學生的學習進步情況,也方便了期末成績單的打印。如果能在PC端利用數據庫管理方便地開發(fā)出各種統(tǒng)計分析功能就更好了。