陳雯雯
摘 ?要:隨著計算機的普及和快速發(fā)展,信息技術(shù)對語言測試形式產(chǎn)生了重要的影響。很顯然,計算機適應(yīng)性語言測試已經(jīng)成為這一領(lǐng)域最重要的發(fā)展方向。本文主要介紹了計算機化調(diào)適性語言測試(Computerized Adaptive Language Test以下稱CALT)的定義。并且分析了CALT的優(yōu)勢及其面臨的問題與挑戰(zhàn)。并指出,計算機化調(diào)適性語言測試因為它符合外語教學(xué)改革發(fā)展的實際需求,將成為引領(lǐng)外語測試的新方向。
With the popular of computer and its rapid development,information technology has a significant impact on language testing. Obviously,Computerized Adaptive Language Test(CALT)has become the most important development direction in this field. This article mainly introduces the definition of CALT. At the same time,it not only analyzes the advantages of CALT but also analyzes the questions and challenges it faced. It also point out that because CALT can meet the actual demand of foreign language teaching reform,it will become the new leading direction of foreign language testing.
計算機技術(shù)的發(fā)展不但影響著外語教與學(xué)的整個過程,同時也使得語言測試的技術(shù)手段和方式發(fā)生了重大的改變。語言測試技術(shù)已經(jīng)成為眾多研究者關(guān)注的新課題。2001年在美國舉行的第23屆國際語言測試研討會的主題就是“語言測試與技術(shù)”,基于計算機技術(shù)所構(gòu)建的測試新方法——計算機化調(diào)適性語言測試成了本次會議的重要議題。計算機化調(diào)適性語言測試由于其因材施測、能精確估計考生能力及節(jié)省施測時間等顯著的優(yōu)點,正逐步滲透到各類外語測試中去,將引領(lǐng)外語測試發(fā)展的新方向。
一、計算機化調(diào)適性語言測試的定義
計算機化調(diào)適性語言測試源于計算機化調(diào)適性測試(Computerized Adaptive Test)(下稱CAT),是一種技術(shù)上受計算機終端和PC管理的先進的測試語言能力的方法。它是現(xiàn)代語言測試理論與當代多媒體技術(shù)相結(jié)合的產(chǎn)物,采用項目反應(yīng)理論為數(shù)學(xué)模型建立題庫,并以此根據(jù)題目的各方面信息和受測者的答題情況,從題庫中選取符合受測者語言水平的題目進行測試,在最短的時間內(nèi)迅速準確地估計受測者的語言能力,直到達到預(yù)定的測試精度要求。
二、計算機化調(diào)適性語言測試的優(yōu)勢
計算機技術(shù)的發(fā)展和測量學(xué)“項目反應(yīng)理論”的成熟催生了新一代計算機化語言測試——計算機適應(yīng)性語言測試。這種被稱為“量體裁衣”式的測試具有傳統(tǒng)的紙筆測試無法比擬的優(yōu)勢,如具有良好的反饋作用,測試的個性化、人性化加強,安全性提高。為每位受試提供適合其語言能力的題目或任務(wù),能夠提高他們的興趣,促使他們發(fā)揮最佳水平,從而實現(xiàn)對受試語言能力更準確的測量。例如,基于網(wǎng)絡(luò)的DI-ALANG融自我評估和診斷性測試為一體,為受試提供個性化的語言能力評估信息。一些新題型得以開發(fā)使用,如文章復(fù)原法可以用來考察受試在句子和語篇層面的語言理解能力。
比較傳統(tǒng)的紙筆考試而言,CALT具有以下的四點優(yōu)勢:
(一)具有人性化和個體性
在傳統(tǒng)的考試中,不管考生實際語言能力如何,都必須做大量的固定的試題進行語言考查,需要較多的時間;而在CALT中,后面試題的呈現(xiàn)是以前面答題的反應(yīng)情況來決定的,或難或易,循序漸進的進行。同時,CALT還可以根據(jù)不同的測試對象確定不同的常模,考試的內(nèi)容、題量因人而異,有針對性的施加測試題目,具有無可比擬的個體性,具有人性化特征,符合外語教學(xué)改革的要求。
(二)具有科學(xué)性和準確性
效度與信度是語言測試中最重要的兩個原則,測試的科學(xué)與準確性取決于該測試是否具有高效度和高信度。在傳統(tǒng)的測試中,由于不同考生接受同一批題目的測驗,語言水平低的考生無法作答難度大的題目,那些難度小的題目對語言水平高的考生又測不出真實水平,測試的效度時而高、時而低,難以把握。CALT則不同,它不但定義了信息函數(shù)這一綜合質(zhì)量指標作為科學(xué)挑選題目的標準,而且題目函數(shù)估計準確,電腦能根據(jù)題目相對難度、題型和考生對初始題目應(yīng)答的整體表現(xiàn),適度調(diào)整出與考生水平相適應(yīng)的題目。因此,由于測驗的信息量最大,也就能最大限度地測算出代表考生實際語言能力的成績,測試的效度也就最好,實得分數(shù)分布與目標分數(shù)的分布的擬合度也最好。同時,就信度而言,傳統(tǒng)的測試評分往往由人工評判,雖然有統(tǒng)一的參考評判尺度,也難免會因人而異而產(chǎn)生誤差。CALT則通常具有良好的穩(wěn)定性、等值性與客觀性,且考生每答對一個試題就會重新估計一次考生的能力估計值,測試之后能馬上打印測試結(jié)果,各項工作由電腦自行進行,排除了人為的因素,測試成績公開、公正、公平、真實可靠、準確性高。
(三)具有保密性和安全性
與傳統(tǒng)的測試不同,CALT由于對不同的考生施測不同內(nèi)容,大大地降低了猜題、舞弊的發(fā)生,對題庫中題目曝光頻率的控制與測試數(shù)據(jù)的層級保密很大程度上都提高了語言測試的安全性。
(四)具有經(jīng)濟性與實效性
比較傳統(tǒng)的測試,CALT的題量較少,考試時間短,節(jié)省了大量的人力物力,降低了成本。測試之后能立即計分并報告成績和給出反饋,快捷又實效。除此之外,CALT由于可以調(diào)整學(xué)生的作答速度與題目難度,測試環(huán)境自然、寬松,降低了考生的考試焦慮與挫折感,尤其在口語、聽力考試中更益于考生正常發(fā)揮自己的真實水平。
這種被稱為“量體裁衣”式的測試具有傳統(tǒng)的紙筆測試無法比擬的優(yōu)勢,如具有良好的反饋作用,測試的個性化、人性化加強,安全性提高。與其他的考試相比,CALT考試更注重考試過程及其測試精確度的提升。CALT能為每位受試提供適合其語言能力的題目或任務(wù),由此可提高他們的興趣,促使他們發(fā)揮最佳水平,從而實現(xiàn)對受試語言能力更準確的測量。
總之,CALT的優(yōu)勢在于具有明顯的漸進性和個體性,即受試者即將面對的試題是以其前面答題情況而定,其題目或難或易,因人而易,循序漸進,具有很強的科學(xué)性和準確性。CALT不但以信息函數(shù)這一綜合質(zhì)量指標為科學(xué)的選題標準,而且題目函數(shù)估計準確,能最大限度地測算受試者的實際語言水平,并且具有穩(wěn)定性、等值性與客觀性的特點。CALT安全指數(shù)高保密性好,幾乎不可能猜題、壓題、舞弊。CALT由于題量靈活,時間可長可短,測試后能即時記分并報告成績,所以說其具有經(jīng)濟性和實效性。
三、計算機化調(diào)適性語言測試面臨的問題與挑戰(zhàn)
現(xiàn)代信息和網(wǎng)絡(luò)技術(shù)為語言測試帶來了許多快捷和希望,同時也帶來了一些問題和隱患。雖然互聯(lián)網(wǎng)和電腦技術(shù)的普及速度非常快,但目前網(wǎng)絡(luò)帶寬和網(wǎng)絡(luò)安全還是一個急需解決的問題。在我國有些地區(qū)計算機還不夠普及,這就給計算機化語言測試的推廣帶來一定的困難?!督逃筷P(guān)于 2013 年深化教育領(lǐng)域綜合改革的意見》提出要實施高考英語科目一年多次考試。隨著“一年多考制度”的推廣,必然會遇到同時使用多套試題的情況,隨著而來的是試題庫建設(shè),現(xiàn)代網(wǎng)絡(luò)和計算機技術(shù)的發(fā)展為試題庫建設(shè)帶來諸多方便,但試題庫建設(shè)和使用涉及多方面的工作。試題參數(shù)的確定需要做大量前期工作。試題庫的試題需重復(fù)使用,在試題使用之后主要問題之一是試題的安全性,如何不讓使用過的試題泄露出去,這些需要更多研究和實踐。同時為了保證考試的公平,多套同時使用的試卷之間的等值顯得尤為重要,如何科學(xué)地利用現(xiàn)代技術(shù)等值試卷還需進一步進行研究。基于計算機的考試改變傳統(tǒng)紙筆考試的一些題型和做法,這些改變對學(xué)生有影響,會在一定程度上影響試卷的效度。
而由于CALT研究起步較晚,所依據(jù)的理論基礎(chǔ)與技術(shù)手段有待進一步完善,加之語言測試的特殊性及其與傳統(tǒng)測試的差異性等原因,均不可避免地決定了CALT仍存在著諸多的問題:
(一)CALT的評分問題
傳統(tǒng)測試中,如果學(xué)生不能回答某些問題,可以跳題或者省略,然而在CALT中允許跳題,若選題項沒有被計分,學(xué)生可跳過題項答題時可能會對題目的安全性有影響。而如果不允許跳題,則是剝奪了學(xué)生資助決定做題順序的自由。
(二)CALT的題項設(shè)計問題
在題項的采集上,傳統(tǒng)測試在設(shè)計上常常根據(jù)明確的考試要求來收集某個特定領(lǐng)域不同的知識或者技能題項。而CALT的一般時間上會比傳統(tǒng)測試短,很難像傳統(tǒng)測試一樣根據(jù)具體要求來收集題項。它一般是從所有可能的集體要求中隨機抽選出。
(三)CALT測試題目中的交際能力問題
外語教學(xué)的目的是培養(yǎng)學(xué)生的交際能力,測試考生交際能力的高低則通過對語言行為的衡量來判斷,即需在交際、環(huán)境、話題和目的等語言使用環(huán)境中測試考生的語言組織能力與語用能力;但是由于語用背景是具體的,千變?nèi)f化的,沒有固定的模式可尋,難以數(shù)字化和信息化,測試結(jié)果也只能被看成在考試所設(shè)計的背景下的特定的運用外語行為,而非考生在真實外語生活環(huán)境下的交際能力。因此,如何鎖定測試目標設(shè)計出充分體現(xiàn)交際能力的真實測試項目是CALT須解決的棘手問題。
(四)CALT題型與語言測試目標能力關(guān)聯(lián)性問題
不同起始題目與題型的選擇對不同目標能力初步估計值的效度也不同,直接影響到目標測試能力的準確定位,起始題目、題型的選擇對整個測試過程起著關(guān)鍵的導(dǎo)航作用??忌鷾y試速度與語言能力的關(guān)系、CALT對教學(xué)的反撥作用、計算機操作熟練程度與測試成績之間的關(guān)系以及如何避免商業(yè)化等問題都有待我們外語工作者與軟件工程師進一步研究與實踐。
曾用強教授在2009年全國英語專業(yè)四、八級測試暨計算機技術(shù)應(yīng)用專題研討會中,作了“計算機化考試的幾點思考”為題的發(fā)言。他認為目前人們對計算機化考試存在一些誤解,主要體現(xiàn)在:計算機化考試就是紙筆考試的計算機化或網(wǎng)絡(luò)化;計算機網(wǎng)絡(luò)技術(shù)決定了機考的發(fā)展;實現(xiàn)多次考試;簡化考務(wù)工作。計算機化考試一般要經(jīng)過內(nèi)容設(shè)計、技術(shù)開發(fā)和實施三個階段,計算機化考試有它獨特的特點和規(guī)律,我們必須遵循這些特點和規(guī)律才能開發(fā)出符合考試發(fā)展和需要的計算機化考試。
四、總結(jié)
綜上所述,CALT是現(xiàn)代化教育技術(shù)改變測試手段的新方向,世界上許多很有影響的國際性英語考試也正在全面推行CALT。作為一個新興的事物,CALT仍有許多問題和挑戰(zhàn),需要不斷地改進與完善。隨著語言教學(xué)的改革與進步,計算機技術(shù)的優(yōu)勢將扮演越來越重要的角色。目前,在我國這方面的研究涉足并不多,相信計算化調(diào)試性語言測試將會越來越普及,研究成果也將日益豐碩。
參考文獻
[1] ?陳冰冰. 引領(lǐng)外語測試新方向——計算機化調(diào)適性語言測試[J]. 外語電化教學(xué),2005 (102)
[2] ?陳慧麟. 基于紙筆的語言測試和基于計算機的語言測試之間效度對等性驗證模式初探[J]. 外語界,2009(3)
[3] ?蔡基剛. 大學(xué)英語四、六級計算機口語測試效度、信度和可操作性研究[J]. 外語界,2005(4)
[4] ?高國安. 淺談計算機在外語教學(xué)中的應(yīng)用[J]. 高校社科信息,2001(3)
[5] ?何蓮珍. 認知計算機適應(yīng)性考試模型的設(shè)計[J]. 現(xiàn)代外語,1999(2)
[6] ?洪云. 計算機化語言測試的發(fā)展及其面臨的問題[J]. 中國成人教育2010(15)
[7] ?金艷. 計算機化語言測試的效度研究——淺析計算機能力與測試構(gòu)念的關(guān)系[J]. 外語電化教學(xué),2012(1)
[8] ?金艷,張曉藝. 技能綜合對語言測試構(gòu)念效度的影響——培生考試與大學(xué)英語六級網(wǎng)考的對比研究[J]. 外語電化教學(xué),2013(154)
[9] ?孔文,李清華. 大規(guī)模語言測試的方向:計算機適應(yīng)性語言測試[J]. 外語界,2002(2)
[10] ?劉建達. 現(xiàn)代技術(shù)與語言測試應(yīng)用、影響及發(fā)展方向[J]. 外語電化教學(xué),2013(152)
[11] ?李清華,孔文. 基于計算機的語言測試及其效度驗證[J]. 外語界,2009(3)
[12] ?李清華. 基于紙筆的語言測試與基于計算機的語言測試的等效研究綜述[J]. 外語界,2006(04)
[13] ?田文燕. 國外計算機化語言測試(IBT)現(xiàn)狀綜述[J]. 外語界,2006(5)
[14] ?田文燕. 從紙筆測試到計算機化語言測試的發(fā)展[J]. 湖北廣播電視大學(xué)學(xué)報,2007(2)
[15] ?田文燕,張震宇. 計算機化語言測試的應(yīng)用問題與展望[J]. 外語電化教學(xué),2007(4)
[16] ?吳會芹. 用現(xiàn)代化手段輔助語言測試[J]. 外語電化教學(xué),2006(109)
[17] ?王勇旗. 計算機化語言——新測試形式帶來的思考[J]. 學(xué)科改革,2008(05)
[18] ?楊安良,田少華. 我國計算機化調(diào)適性語言測試(CALT)研究現(xiàn)狀[J]. 外語界,2008(2)
[19] ?應(yīng)真箭,葉新東. 計算機適應(yīng)性語言測試的幾個問題[J]. 教學(xué)與管理,2005(6)
[20] ?楊滿珍. 20世紀90年代國外語言測試的發(fā)展[J]. 外語教學(xué),2002(05)
[21] ?楊琪. 計算機輔助大規(guī)模英語口語測試的實踐與反思[J]. 外語電化教學(xué),2012
[22] ?朱音爾,張肖瑩. 基于網(wǎng)絡(luò)的大學(xué)英語機考探索與實踐[J]. 外語電化教學(xué),2009(126)
[23] ?鄭佩蕓,史光孝,潘鳴武. 信息技術(shù)在語言測試中的應(yīng)用現(xiàn)狀及展望——計算機信息技術(shù)應(yīng)用專題研討會述評[J]. 外語電化教學(xué),2010(131)