謝雙梅
摘 要: 語言測(cè)試的目的是了解、評(píng)價(jià)學(xué)生的語言水平。現(xiàn)代技術(shù)迅猛發(fā)展與運(yùn)用,其已經(jīng)滲入語言的各個(gè)領(lǐng)域。由此,計(jì)算機(jī)化英語考試應(yīng)運(yùn)而生。計(jì)算機(jī)化考試有其特點(diǎn)和規(guī)律,考試研發(fā)者必須在遵循這些特點(diǎn)和規(guī)律的基礎(chǔ)上開發(fā)出符合考試要求的計(jì)算機(jī)化語言測(cè)試體系。本文主要從機(jī)輔語言測(cè)試的試題庫建設(shè)、測(cè)試過程、閱卷評(píng)分等方面對(duì)其進(jìn)行討論。
關(guān)鍵詞: 試題庫 機(jī)輔語言測(cè)試 機(jī)輔語言閱卷評(píng)分
1.語言測(cè)試簡述
本文主要從機(jī)輔語言測(cè)試的試題庫建設(shè)、測(cè)試過程、閱卷及評(píng)分等方面描述機(jī)輔語言測(cè)試的全過程。實(shí)現(xiàn)語言測(cè)試的現(xiàn)代化,不僅能提高工作效率、降低成本,而且對(duì)整個(gè)語言教學(xué)將會(huì)產(chǎn)生深遠(yuǎn)影響。目前,人們對(duì)計(jì)算機(jī)化考試的誤區(qū)主要體現(xiàn)在:計(jì)算機(jī)化考試就是紙筆考試的計(jì)算機(jī)化(應(yīng)用新技術(shù)考查舊內(nèi)容);簡化考務(wù)工作等方面[1]。
2.計(jì)算機(jī)在語言測(cè)試中的應(yīng)用
計(jì)算機(jī)語言測(cè)試備受教育領(lǐng)域和考試領(lǐng)域的廣泛關(guān)注,它的應(yīng)用主要體現(xiàn)在題庫建設(shè)(item banking),計(jì)算機(jī)輔助語言測(cè)試(computer- assisted language testing),以及計(jì)算機(jī)自適應(yīng)語言測(cè)試(computer adaptive language testing)等方面[2]。
2.1題庫建設(shè)
題庫由許多適用于不同目的和任務(wù)需要,且具有必要參數(shù)的大量優(yōu)質(zhì)題目組成,是進(jìn)行測(cè)試的基礎(chǔ)。題庫建設(shè)不是簡單地將數(shù)量眾多的試題存儲(chǔ)在計(jì)算機(jī)中,它涉及教育測(cè)量理論、統(tǒng)計(jì)及認(rèn)知心理等多方面理論。計(jì)算機(jī)技術(shù)在題庫建設(shè)中扮演著無可替代的角色,例如,它可以快捷方便地完成對(duì)試題的儲(chǔ)存、修改,可以按要求自動(dòng)生成試卷等。但是,在題庫建設(shè)這一環(huán)節(jié)中仍然有許多問題值得注意。比如,控制入庫試題的質(zhì)量,控制入庫題目的結(jié)構(gòu)比例,保證內(nèi)容的廣泛性,以及數(shù)據(jù)的安全性等問題。
2.2計(jì)算機(jī)輔助語言測(cè)試
20世紀(jì)60年代,美國教育家率先將計(jì)算機(jī)用于教育測(cè)量,并稱其為計(jì)算機(jī)輔助測(cè)試(Computer-Assisted Testing),即計(jì)算機(jī)按預(yù)定的測(cè)試目標(biāo)發(fā)送測(cè)試題目,學(xué)生接收,并根據(jù)自己的理解做出反應(yīng);計(jì)算機(jī)將學(xué)生的反應(yīng)與設(shè)定目標(biāo)作對(duì)比,進(jìn)一步向測(cè)試者傳送反饋信息、教學(xué)內(nèi)容等,從而使教學(xué)得到進(jìn)一步發(fā)展,達(dá)到計(jì)算機(jī)輔助測(cè)試的目的,全方位對(duì)學(xué)生的學(xué)習(xí)進(jìn)行分級(jí)、判斷和評(píng)價(jià)。機(jī)輔測(cè)試系統(tǒng)有一個(gè)比較強(qiáng)大的題庫,它與傳統(tǒng)測(cè)試構(gòu)成是一樣的,但整個(gè)過程得到了相當(dāng)大的簡化和改進(jìn)。機(jī)輔測(cè)試具有生成試卷、閱卷、分析試卷、管理成績等功能,并且計(jì)算機(jī)閱卷快速、準(zhǔn)確,能夠及時(shí)有效地對(duì)考試結(jié)果進(jìn)行分析,發(fā)現(xiàn)試題的缺陷,并幫助改正,從而大幅度提高了測(cè)試的效度和信度。
2.3計(jì)算機(jī)自適應(yīng)語言測(cè)試
隨著計(jì)算機(jī)在測(cè)試領(lǐng)域的應(yīng)用及項(xiàng)目反應(yīng)理論(IRT)的興起,以此為基礎(chǔ)的計(jì)算機(jī)化自適應(yīng)考試(Computer Adaptive Test)備受關(guān)注,這種測(cè)試能根據(jù)被試者的特點(diǎn)自動(dòng)生成適應(yīng)被試者具體情況的試卷。計(jì)算機(jī)自適應(yīng)語言測(cè)試是計(jì)算機(jī)輔助語言測(cè)試的發(fā)展趨勢(shì),具有很大的潛力。它主要有三個(gè)特點(diǎn):(1)考試項(xiàng)目根據(jù)單個(gè)考生的情況而定;(2)當(dāng)考生的能力水平得到確定時(shí)考試結(jié)束;(3)考試項(xiàng)目較一般紙筆考試更少,而且時(shí)間更短。
在傳統(tǒng)測(cè)試中,對(duì)于每個(gè)考生而言,無論水平如何,全部都要接受同一批題目的測(cè)試,但是,測(cè)試題目中只有一部分是代表自己真實(shí)能力的,其余題目要么過于簡單,要么過難。計(jì)算機(jī)自適應(yīng)測(cè)試是對(duì)每個(gè)考生提供難易度適中的測(cè)試內(nèi)容的一種測(cè)試方法,其基本過程是考生首先回答一個(gè)中等難度的測(cè)試題目,如果考生正確回答了這一項(xiàng)目,那么下一個(gè)測(cè)試項(xiàng)目的難度就要相對(duì)增加;反之亦然??荚嚾桃杂?jì)算機(jī)為媒介,考生根據(jù)自己的判斷作答,作答后計(jì)算機(jī)立即反饋答題信息。根據(jù)項(xiàng)目反應(yīng)理論原理,考生每回答一個(gè)測(cè)驗(yàn)項(xiàng)目,計(jì)算機(jī)就給出一個(gè)相應(yīng)的能力估計(jì)值。這個(gè)能力估計(jì)值會(huì)成為選擇下一個(gè)測(cè)驗(yàn)題目的依據(jù),直到準(zhǔn)確測(cè)出考生水平為止。計(jì)算機(jī)自適應(yīng)測(cè)試比傳統(tǒng)測(cè)試效率更高,它可以用比傳統(tǒng)測(cè)試更少的試題而取得與之相比更佳的測(cè)試效果。有實(shí)驗(yàn)表明,在同等測(cè)量精確度的條件下,自適應(yīng)測(cè)試可將測(cè)試時(shí)間縮短為原來的40%~60%[3]。
2.4機(jī)輔語言測(cè)試的閱卷評(píng)分
計(jì)算機(jī)輔助測(cè)試系統(tǒng)能完成的工作有局限性,目前機(jī)輔測(cè)試主要以客觀題形式出現(xiàn),雖具有客觀性,信度較高,但客觀題的大量使用使測(cè)試的表面效度大大降低。利用問答式題目測(cè)試評(píng)價(jià)學(xué)生的綜合能力的測(cè)試現(xiàn)階段還難以實(shí)現(xiàn)。用計(jì)算機(jī)分析學(xué)生對(duì)輸出型題目的回答,目前還受到兩方面的限制:一是使用計(jì)算機(jī)硬件識(shí)別、處理文字的能力是一種新技術(shù),且價(jià)格相對(duì)昂貴;二是應(yīng)用計(jì)算機(jī)進(jìn)行語言的分析還不夠成熟,并不能全面處理此種題型,所能進(jìn)行的分析成果還未能達(dá)到實(shí)用階段。
3.計(jì)算機(jī)在語言測(cè)試中應(yīng)用的優(yōu)勢(shì)
3.1利用計(jì)算機(jī)構(gòu)成的題庫系統(tǒng)自動(dòng)化程度較高,可大大提高命題效率,使教師有更多時(shí)間和精力開展科研、教學(xué)及管理工作。它避免了一張?jiān)嚲?、多處統(tǒng)考的弊端,為現(xiàn)代化教學(xué)管理提供了有利的手段。
3.2基于項(xiàng)目反應(yīng)理論(IRT)的題庫試題可以與施測(cè)樣本無關(guān),即使在不同時(shí)間內(nèi)進(jìn)行考試,其測(cè)量結(jié)果也是可以比較的。題庫的建設(shè)有利于學(xué)生自我檢驗(yàn)學(xué)習(xí)成績,有利于教師出題考試及判斷教學(xué)效果。
4.結(jié)語
計(jì)算機(jī)在考試中的應(yīng)用已從最初的考務(wù)管理、監(jiān)考等工作延伸到計(jì)算機(jī)化測(cè)試和計(jì)算機(jī)評(píng)卷等方面。機(jī)輔語言測(cè)試采用考生直接輸入答案的形式,與人工閱卷相比,減少了由于人為因素導(dǎo)致的計(jì)分過程中產(chǎn)生的誤差。計(jì)算機(jī)超凡的記憶力和準(zhǔn)確率使閱卷記分等誤差降到零,在很大程度上保證了測(cè)試的公正性、客觀性?;跈C(jī)輔測(cè)試的上述優(yōu)越性,其越來越“橫行”于語言測(cè)試領(lǐng)域。計(jì)算機(jī)自適應(yīng)語言測(cè)試由于題量靈活,時(shí)間可長可短,測(cè)試后能即時(shí)記分并報(bào)告成績,實(shí)效性和經(jīng)濟(jì)性強(qiáng),其無可厚非地成了今后語言測(cè)試的發(fā)展方向。
隨著計(jì)算機(jī)人工智能、語音識(shí)別、光學(xué)字符識(shí)別等技術(shù)的發(fā)明,不久,我們將能夠?qū)崿F(xiàn)計(jì)算機(jī)與考生直接交互、識(shí)別和判斷書面甚至口頭語言進(jìn)行評(píng)估。由此可見,實(shí)現(xiàn)語言測(cè)試的現(xiàn)代化,與世界接軌,是大勢(shì)所趨,是我們今后改革外語測(cè)試、提高外語教學(xué)質(zhì)量的必備條件。當(dāng)然計(jì)算機(jī)語言測(cè)試作為一種新興測(cè)試方法,存在很多不足。我們必須遵循其特點(diǎn)和規(guī)律,開發(fā)出符合考試發(fā)展和需要的計(jì)算機(jī)化語言測(cè)試。
參考文獻(xiàn):
[1]張權(quán).計(jì)算機(jī)化的語言測(cè)試:現(xiàn)狀與發(fā)展[M].上海:上海外語教育出版社,2001.55.
[2]何克抗.建立題庫的理論[A].全國CBE學(xué)會(huì)第七屆學(xué)術(shù)會(huì)議論文集.國防科技大學(xué)出版社,1995.
[3]楊滿珍.20世紀(jì)90年代國外語言測(cè)試的發(fā)展[J].外語教學(xué),2002.104-106.
[4]顧海根.一種新的測(cè)驗(yàn)形式——計(jì)算機(jī)自適應(yīng)測(cè)驗(yàn)[J].上海教育科研,1999.5-7.