曹娟
摘 要: 語言測試是大學(xué)英語教學(xué)過程中必不可少的一環(huán),是檢測外語教學(xué)成效和提高英語教學(xué)質(zhì)量的重要手段。本文首先說明了信度與效度的定義及關(guān)系,然后以分析廣泛用于大學(xué)英語測試中的多項(xiàng)選擇題為入口,發(fā)現(xiàn)大學(xué)英語在應(yīng)試教育的指揮棒作用下有普遍追求高信度而忽視效度的傾向,提出當(dāng)前大學(xué)英語語言測試的取向應(yīng)是效度重于信度。
關(guān)鍵詞: 效度 語言測試 信度 多項(xiàng)選擇題
1.信度與效度
1.1信度。信度是什么?信度是指測量的結(jié)果要有穩(wěn)定、可靠和一致性,一般情況下,多以內(nèi)部的一致性表示測驗(yàn)信度的高或低。信度的系數(shù)如果越高,此測驗(yàn)的結(jié)果就越可靠、一致、穩(wěn)定。由于系統(tǒng)誤差始終以同樣的方式影響測量值,不會(huì)造成不一致性,因此系統(tǒng)誤差對(duì)信度的影響可以忽略。相反,隨機(jī)誤差卻可能因?yàn)閷?dǎo)致不一致性而降低信度。我們可以把信度定義為隨機(jī)誤差r影響測量值的程度,如果r=0,就認(rèn)為信度最高,測量是完全可信的。在大學(xué)英語測試中,信度表明了試題、應(yīng)試者及分?jǐn)?shù)之間相互的關(guān)系,而影響試題的因素很多,包括考試的相關(guān)組織形式、試題質(zhì)量和試卷的評(píng)判等。測試者要想確保有較高的信度,必須首先保證試卷有一定的量。一般情況下,試題量愈大,信度就愈高,而且考試的分?jǐn)?shù)必須有一定的分散性,即兩頭小,中間大。那么,怎樣才能達(dá)到這個(gè)標(biāo)準(zhǔn)呢?首先,試卷要能很容易被區(qū)分開,這樣方能將不同水準(zhǔn)的考試者區(qū)別開來;其次,試題要具備適宜的難度,既不能太難,又不能太簡單,否則測不出考試者的層次;最后,試題應(yīng)具有同質(zhì)性,也就是說,要考的內(nèi)容屬于同一個(gè)范圍,試題與應(yīng)試者之間具有相互適應(yīng)性。
1.2效度。效度指什么?效度指的是一種相關(guān)性,表示的是測試與測試目的的相關(guān)度。我們可從以下兩方面進(jìn)行理解,首先,想考的內(nèi)容與所考的內(nèi)容是否是一樣的;其次,考試能否達(dá)到目的。效度是考試的關(guān)鍵所在,即如果某項(xiàng)高信度的考試沒有考到應(yīng)考的內(nèi)容,那么這項(xiàng)考試效度就低。各種考試種類多,規(guī)模大,但大多數(shù)只管得到成績,很少有人考慮成績是否有效,命題人員很少分析考試的結(jié)果。如果命題人對(duì)所命的題缺乏足夠充足的反饋信息而命題,那么題目的水平就難以得到提高。最近幾年開始有一些考試的分析研究,但只限于研究信度,對(duì)一些大型的如CET等考試,需要對(duì)其展開效度調(diào)查和研究。原因是在一項(xiàng)測試中,效度信度同等重要,若其中的任一項(xiàng)被忽略,命題的質(zhì)量就無法得到保證、
2.語言測試中效度與信度的關(guān)系
第一,信度與效度是辯證統(tǒng)一的關(guān)系。一個(gè)語言測試擁有以下兩個(gè)基本的過程:一是確保語言行為能有效說明受試者的語言能力,并在此范圍內(nèi)選擇樣本;二要確保受試者的語言行為能被測試結(jié)果準(zhǔn)確真實(shí)地反映出來。因此,語言測試效度反映的是語言能力與所測語言行為的關(guān)系,而語言測試的信度則表明考試結(jié)果與語言行為的關(guān)系。如果沒有信度,那么測試人員難以借此測量出任何東西,該測試不能真實(shí)地反映被測試者的語言行為。相反,無效度測試也是沒有意義的,因?yàn)闆]有效度的測試準(zhǔn)確地測量出了與語言能力毫無關(guān)系的東西。在此情況下,測試者同樣沒辦法根據(jù)測試結(jié)果推測被測試者真實(shí)的語言能力。綜上所述,效度信度要在一起方可實(shí)現(xiàn)某項(xiàng)語言測試的目標(biāo),二者具有辯證統(tǒng)一性。
第二,信度與效度是相互對(duì)立的。信度要求語言測試彰顯語言的科學(xué)性,即將語言進(jìn)行劃分處理,并要求測試題目具有同質(zhì)性,如此方能使語言測試的內(nèi)容與形式與語言應(yīng)用的真實(shí)情況脫離開來;效度則聲稱語言測試需關(guān)注語言的整體性、藝術(shù)性及題目的多樣性,并且,測試的內(nèi)容與形式應(yīng)符合語言應(yīng)用的真實(shí)情景。因此,任何測試題型、任何測試,都不能同時(shí)兼有極高的效度與信度。以真實(shí)語言為內(nèi)容的交際性測試能保證較高效度,而強(qiáng)調(diào)以分散性為主要特征的語言測試則能確保較高的信度。
3.多項(xiàng)選擇題信度效度剖析
3.1題型信度分析。一是題目具有客觀性。廣泛存在于大學(xué)英語測試中的多項(xiàng)選擇題是通過測試學(xué)生所掌握的詞匯、語法、語音等知識(shí),推斷學(xué)生構(gòu)建句子、理解句子及語篇的能力。由于此種題型考點(diǎn)層次比較低,因此,在有限的時(shí)間內(nèi),多項(xiàng)選擇題語言點(diǎn)覆蓋面較廣泛,而且通常題量較大,這會(huì)讓評(píng)閱試卷的人能夠更準(zhǔn)確地推測出考生對(duì)語言知識(shí)的掌握程度。因此,多項(xiàng)選擇題擁有較高的信度。而且,只要某多項(xiàng)選擇題被用于語言測試,那么它的評(píng)分就不會(huì)受到一些人為因素的干擾。所以,多項(xiàng)選擇題具有客觀性。
二是評(píng)分的客觀性。只要多項(xiàng)選擇題的題目被設(shè)計(jì)好,每個(gè)題目的分值比例被確定,那么閱卷人對(duì)其進(jìn)行評(píng)閱就很便捷。在規(guī)模比較大的語言測試中,此優(yōu)越性特別受人們的歡迎,原因是多項(xiàng)選擇題題型的答案已經(jīng)是固定了的,評(píng)分非常客觀,完全不會(huì)受到不同評(píng)卷人主觀情緒等因素的影響,甚至可以使用電腦進(jìn)行閱卷,能維持很高的評(píng)分信度。
3.2題型效度分析。第一,英語語言能力包括聽、說、讀、寫,多項(xiàng)選擇題只能測試被測試者的language receptive ability,即語言接受能力,如聽和讀,卻不能測試被測試人員的language productive ability,即語言輸出能力,如寫和說。多項(xiàng)選擇題孤立地測試組成語言的元素,忽視了聽、說、讀、寫這些元素在真實(shí)語境中的相互作用功能。然而,語言的本質(zhì)不單單是各要素處于孤立狀態(tài)而呈現(xiàn)出的特性,更重要的是這些要素在語言整體系統(tǒng)中相互作用而體現(xiàn)的功能。綜上所述,多項(xiàng)選擇題考察的僅僅是學(xué)生的語言形式識(shí)別能力,而對(duì)語言的輸出能力和語言知識(shí)的運(yùn)用能力無從判斷,也無法測試出學(xué)生的語言知識(shí)與語境特征相結(jié)合時(shí)的創(chuàng)新能力。
第二,多項(xiàng)選擇題題型有些時(shí)候所測試的只是受試人員的猜測和推理能力,而不是他們真正的語言運(yùn)用能力。
考試大綱不能依據(jù)考試內(nèi)容設(shè)定,不應(yīng)該把語言技能訓(xùn)練的主要方法定義為考試技術(shù)訓(xùn)練,正常教學(xué)不能被測試取代。大學(xué)英語語言測試不僅要重視信度,更要思慮其效度,效度要重于信度。通過上述對(duì)多項(xiàng)選擇題題型的信度效度剖析,可知多項(xiàng)選擇題題型的優(yōu)點(diǎn)與弱點(diǎn)并存,既有其他類型題型所無法比擬的優(yōu)點(diǎn),又具有語言使用不真實(shí)、不能測試受試者語言輸出能力等效度方面的弱點(diǎn)。筆者認(rèn)為對(duì)待該題型應(yīng)采取科學(xué)和理性的態(tài)度,可通過采取綜合考慮各項(xiàng)語言技能、不同考試不同對(duì)待、保證命題質(zhì)量、提高試題效度等策略。
參考文獻(xiàn):
[1]孫成崗.現(xiàn)代語言測試與試卷分析[J].解放軍外國語學(xué)院學(xué)報(bào),2000(4).
[2]牛強(qiáng).現(xiàn)行高校英語測試中的問題[J].外語教學(xué)與研究,2001(2).