劉叔才, 張泉慧, 何佳, 丁一民, 沈瑞文
考試作弊是許多大型考試中普遍存在的現象。隨著科技的發(fā)展,作弊的方式也變得多樣化,這給考試的監(jiān)管帶來了極大的挑戰(zhàn)。為了杜絕作弊,除了事前防范,現場偵查,事后舉報等傳統(tǒng)手段,先進的統(tǒng)計方法也逐漸成為作弊甄別的一個較為有效的手段。國外在20世紀20年代就已開始對考試作弊進行甄別研究,其中包括Angoff(1974)的B指數、g2方法、CP統(tǒng)計量、錯同分析、K指數方法、kappa統(tǒng)計量等方法;國內的研究起步較晚,主要有趙世明[1](2002及2003)的錯同率方法、kappa方法、K指數方法等。這些方法中,以錯同率方法應用最廣,這是因為作弊結果主要體現在作答雷同,答錯雷同就成為了重要指標。但實際上,作答雷同包括答對相同和答錯相同,因此本研究中選擇了答錯雷同和錯同、對同雷同進行分析驗證。
研究對象來自某年某類考試科目一成績低于一個標準差,且科目四成績大于一個標準差的考生群體,共3 100人,稱為異??忌?。樣本選取依據切比雪夫(Chebyshev)不等式數據生成方法[2]。
使用基于Delphi開發(fā)的平臺軟件,以該軟件分析錯同率和錯同對同率。
總選同數:A考生答卷和B考生答卷選項相同的題目數。
總選同率:A考生答卷和B考生答卷選項相同的題目數占總題目數的比例。
錯同數:A考生答卷和B考生答卷都答錯且選項相同的題目數。
對同數:A考生答卷和B考生答卷都答對且選項相同的題目數。
錯同率A:A考生答卷和B考生答卷都答錯且選項相同的題目數占A考生答卷答錯題目數的比例。
對同率A:A考生答卷和B考生答卷都答對且選項相同的題目數占A考生答卷答對題目數的比例。
錯同率B:A考生答卷和B考生答卷都答錯且選項相同的題目數占B考生答卷答錯題目數的比例。
對同率B:A考生答卷和B考生答卷都答對且選項相同的題目數占B考生答卷答對題目數的比例。平均錯同率:錯同率A和錯同率B的平均值。平均對同率:對同率A和對同率B的平均值。錯同對同率:錯同率和對同率的乘積。
用錯同率法作為某考試5選項選擇題作弊雷同答卷的判斷標準,既往的研究結果主要有:①在無作弊行為的正常常規(guī)考場(室)情況下,錯同率在不同分數段具有一定穩(wěn)定性,且接近選項的隨機選項選擇率0.20[1];②在考慮5選項選擇題錯同率影響因素的條件下,可以得出每年的錯同率的上限浮動在0.5上下,可以作為適當情況下的判斷標準[3]。
在本次研究中,以上述異??忌? 100人為主要研究對象。根據上述研究結論,篩選出錯同率≥0.54的考生[1],同時篩選出錯同率≥0.735,且對同率≥0.735的考生,即錯同對同率≥0.54的考生,對這兩組人群進行分析。從科目一數據分析來看,錯同率法和錯同對同率法得出的疑似作弊考生完全一致的有2 950人,占95%以上;對科目四做了同樣的分析,疑似作弊考生完全一致的比例也大于95%。由此可見,用錯同率法和錯同對同率法篩選疑似作弊考生的結果非常接近。以下主要采用錯同法對作弊甄別進行分析論述。
對異??忌? 100人用錯同率法分析軟件進行分析,首先按考試的不同類別進行分析匯總,如表1和表2,發(fā)現:類別1中,科目四的雷同率均>96%,而科目一雷同率均<10%,說明相關考生科目四存在的疑似作弊人數比較多,科目一的疑似作弊人數少,差異比較大;類別2中,相關考生科目四和科目一可能存在作弊人數在50%左右,差異不太大;其他類別中,科目四和科目一雷同人數少,存在可疑的作弊人數非常少。其次,對異常考生3 100人用錯同率法分析軟件進行分析,篩選出科目四疑似作弊考生2 800人,按省、市進行分布匯總(表格在此從略),在實際工作中可以將結果反饋至相關考區(qū),提示其對雷同率較高地區(qū)重點關注。最后,將科目四疑似作弊考生2 800人按雷同人次數排序匯總,得出雷同人次數最多為1 200的考生,雷同人次數最少為1的考生,其他介于兩者之間。必要時,這些數據可以為相關部門調查大規(guī)模通訊工具作弊情況提供支持。
表1 某年某類考試科目一部分疑似作弊考生雷同卷全國統(tǒng)計 n,%
表2 某年某類考試科目四部分疑似作弊考生雷同卷全國統(tǒng)計 n,%
防止考試作弊是考試管理者所需考慮的重要方面之一,是確保考試公平、公正關鍵所在,也是規(guī)范考試秩序、提升考試質量的重要一環(huán)。除了考試現場加強監(jiān)管,提高防止作弊的技術手段外,考試后對試卷的作弊甄別也十分必要。由此,國際上有諸多研究,特別是一些統(tǒng)計學方法的應用也成為了作弊甄別的一種有效工具[4]。本文利用Delphi平臺軟件的分析程序,采用“答錯雷同、錯同對同雷同”對某大學考試作弊甄別的分析驗證,所得結果具有很強的參考價值,能敏感地分析出雷同率較高地區(qū),可為相關部門針對重點的疑似作弊地區(qū)(或考點)進行稽查提供反饋信息支持。為此,建議全國或區(qū)域性的大型考試要充分利用行之有效的統(tǒng)計學方法加強考試后作弊甄別,建立對雷同率偏高的省、市的反饋機制,加大對甄別出雷同人次數較高的地區(qū)(或考點)及可能作弊的相關考生的稽查與打擊力度,以進一步完善防止考試作弊的管理工作,規(guī)范考試秩序。
[1]趙世明,著.資格考試的理論與實踐[M].上海:上海社會科學院出版社,2007.
[2]盛驟,謝式千,潘承毅,編.概率論與數理統(tǒng)計[M].第4版.北京:高等教育出版社,2008.
[3]牛諍,朱晶晶,郭永松.以錯同率作為醫(yī)師資格考試多選題作弊檢測指標及意義的研究[J].中國高等醫(yī)學教育,2010,(1):12-13.
[4]劉叔才,劉博雷,葛利榮,等.基于J2EE的醫(yī)學外語考試網上閱卷系統(tǒng)的研究[J].中國社會醫(yī)學雜志,2011,28(6):380-382.