淺析大學(xué)英語語言測試中的信度與效度

2015-09-10 07:22曹娟

考試周刊 2015年103期

關(guān)鍵詞：效度信度

曹娟

摘要：語言測試是大學(xué)英語教學(xué)過程中必不可少的一環(huán)，是檢測外語教學(xué)成效和提高英語教學(xué)質(zhì)量的重要手段。本文首先說明了信度與效度的定義及關(guān)系，然后以分析廣泛用于大學(xué)英語測試中的多項(xiàng)選擇題為入口，發(fā)現(xiàn)大學(xué)英語在應(yīng)試教育的指揮棒作用下有普遍追求高信度而忽視效度的傾向，提出當(dāng)前大學(xué)英語語言測試的取向應(yīng)是效度重于信度。

關(guān)鍵詞：效度語言測試信度多項(xiàng)選擇題

1.信度與效度

1.1信度。信度是什么？信度是指測量的結(jié)果要有穩(wěn)定、可靠和一致性，一般情況下，多以內(nèi)部的一致性表示測驗(yàn)信度的高或低。信度的系數(shù)如果越高，此測驗(yàn)的結(jié)果就越可靠、一致、穩(wěn)定。由于系統(tǒng)誤差始終以同樣的方式影響測量值，不會(huì)造成不一致性，因此系統(tǒng)誤差對(duì)信度的影響可以忽略。相反，隨機(jī)誤差卻可能因?yàn)閷?dǎo)致不一致性而降低信度。我們可以把信度定義為隨機(jī)誤差r影響測量值的程度，如果r=0，就認(rèn)為信度最高，測量是完全可信的。在大學(xué)英語測試中，信度表明了試題、應(yīng)試者及分?jǐn)?shù)之間相互的關(guān)系，而影響試題的因素很多，包括考試的相關(guān)組織形式、試題質(zhì)量和試卷的評(píng)判等。測試者要想確保有較高的信度，必須首先保證試卷有一定的量。一般情況下，試題量愈大，信度就愈高，而且考試的分?jǐn)?shù)必須有一定的分散性，即兩頭小，中間大。那么，怎樣才能達(dá)到這個(gè)標(biāo)準(zhǔn)呢？首先，試卷要能很容易被區(qū)分開，這樣方能將不同水準(zhǔn)的考試者區(qū)別開來；其次，試題要具備適宜的難度，既不能太難，又不能太簡單，否則測不出考試者的層次；最后，試題應(yīng)具有同質(zhì)性，也就是說，要考的內(nèi)容屬于同一個(gè)范圍，試題與應(yīng)試者之間具有相互適應(yīng)性。

1.2效度。效度指什么？效度指的是一種相關(guān)性，表示的是測試與測試目的的相關(guān)度。我們可從以下兩方面進(jìn)行理解，首先，想考的內(nèi)容與所考的內(nèi)容是否是一樣的；其次，考試能否達(dá)到目的。效度是考試的關(guān)鍵所在，即如果某項(xiàng)高信度的考試沒有考到應(yīng)考的內(nèi)容，那么這項(xiàng)考試效度就低。各種考試種類多，規(guī)模大，但大多數(shù)只管得到成績，很少有人考慮成績是否有效，命題人員很少分析考試的結(jié)果。如果命題人對(duì)所命的題缺乏足夠充足的反饋信息而命題，那么題目的水平就難以得到提高。最近幾年開始有一些考試的分析研究，但只限于研究信度，對(duì)一些大型的如CET等考試，需要對(duì)其展開效度調(diào)查和研究。原因是在一項(xiàng)測試中，效度信度同等重要，若其中的任一項(xiàng)被忽略，命題的質(zhì)量就無法得到保證、

2.語言測試中效度與信度的關(guān)系

第一，信度與效度是辯證統(tǒng)一的關(guān)系。一個(gè)語言測試擁有以下兩個(gè)基本的過程：一是確保語言行為能有效說明受試者的語言能力，并在此范圍內(nèi)選擇樣本；二要確保受試者的語言行為能被測試結(jié)果準(zhǔn)確真實(shí)地反映出來。因此，語言測試效度反映的是語言能力與所測語言行為的關(guān)系，而語言測試的信度則表明考試結(jié)果與語言行為的關(guān)系。如果沒有信度，那么測試人員難以借此測量出任何東西，該測試不能真實(shí)地反映被測試者的語言行為。相反，無效度測試也是沒有意義的，因?yàn)闆]有效度的測試準(zhǔn)確地測量出了與語言能力毫無關(guān)系的東西。在此情況下，測試者同樣沒辦法根據(jù)測試結(jié)果推測被測試者真實(shí)的語言能力。綜上所述，效度信度要在一起方可實(shí)現(xiàn)某項(xiàng)語言測試的目標(biāo)，二者具有辯證統(tǒng)一性。

第二，信度與效度是相互對(duì)立的。信度要求語言測試彰顯語言的科學(xué)性，即將語言進(jìn)行劃分處理，并要求測試題目具有同質(zhì)性，如此方能使語言測試的內(nèi)容與形式與語言應(yīng)用的真實(shí)情況脫離開來；效度則聲稱語言測試需關(guān)注語言的整體性、藝術(shù)性及題目的多樣性，并且，測試的內(nèi)容與形式應(yīng)符合語言應(yīng)用的真實(shí)情景。因此，任何測試題型、任何測試，都不能同時(shí)兼有極高的效度與信度。以真實(shí)語言為內(nèi)容的交際性測試能保證較高效度，而強(qiáng)調(diào)以分散性為主要特征的語言測試則能確保較高的信度。

3.多項(xiàng)選擇題信度效度剖析

3.1題型信度分析。一是題目具有客觀性。廣泛存在于大學(xué)英語測試中的多項(xiàng)選擇題是通過測試學(xué)生所掌握的詞匯、語法、語音等知識(shí)，推斷學(xué)生構(gòu)建句子、理解句子及語篇的能力。由于此種題型考點(diǎn)層次比較低，因此，在有限的時(shí)間內(nèi)，多項(xiàng)選擇題語言點(diǎn)覆蓋面較廣泛，而且通常題量較大，這會(huì)讓評(píng)閱試卷的人能夠更準(zhǔn)確地推測出考生對(duì)語言知識(shí)的掌握程度。因此，多項(xiàng)選擇題擁有較高的信度。而且，只要某多項(xiàng)選擇題被用于語言測試，那么它的評(píng)分就不會(huì)受到一些人為因素的干擾。所以，多項(xiàng)選擇題具有客觀性。

二是評(píng)分的客觀性。只要多項(xiàng)選擇題的題目被設(shè)計(jì)好，每個(gè)題目的分值比例被確定，那么閱卷人對(duì)其進(jìn)行評(píng)閱就很便捷。在規(guī)模比較大的語言測試中，此優(yōu)越性特別受人們的歡迎，原因是多項(xiàng)選擇題題型的答案已經(jīng)是固定了的，評(píng)分非常客觀，完全不會(huì)受到不同評(píng)卷人主觀情緒等因素的影響，甚至可以使用電腦進(jìn)行閱卷，能維持很高的評(píng)分信度。

3.2題型效度分析。第一，英語語言能力包括聽、說、讀、寫，多項(xiàng)選擇題只能測試被測試者的language receptive ability，即語言接受能力，如聽和讀，卻不能測試被測試人員的language productive ability，即語言輸出能力，如寫和說。多項(xiàng)選擇題孤立地測試組成語言的元素，忽視了聽、說、讀、寫這些元素在真實(shí)語境中的相互作用功能。然而，語言的本質(zhì)不單單是各要素處于孤立狀態(tài)而呈現(xiàn)出的特性，更重要的是這些要素在語言整體系統(tǒng)中相互作用而體現(xiàn)的功能。綜上所述，多項(xiàng)選擇題考察的僅僅是學(xué)生的語言形式識(shí)別能力，而對(duì)語言的輸出能力和語言知識(shí)的運(yùn)用能力無從判斷，也無法測試出學(xué)生的語言知識(shí)與語境特征相結(jié)合時(shí)的創(chuàng)新能力。

第二，多項(xiàng)選擇題題型有些時(shí)候所測試的只是受試人員的猜測和推理能力，而不是他們真正的語言運(yùn)用能力。

考試大綱不能依據(jù)考試內(nèi)容設(shè)定，不應(yīng)該把語言技能訓(xùn)練的主要方法定義為考試技術(shù)訓(xùn)練，正常教學(xué)不能被測試取代。大學(xué)英語語言測試不僅要重視信度，更要思慮其效度，效度要重于信度。通過上述對(duì)多項(xiàng)選擇題題型的信度效度剖析，可知多項(xiàng)選擇題題型的優(yōu)點(diǎn)與弱點(diǎn)并存，既有其他類型題型所無法比擬的優(yōu)點(diǎn)，又具有語言使用不真實(shí)、不能測試受試者語言輸出能力等效度方面的弱點(diǎn)。筆者認(rèn)為對(duì)待該題型應(yīng)采取科學(xué)和理性的態(tài)度，可通過采取綜合考慮各項(xiàng)語言技能、不同考試不同對(duì)待、保證命題質(zhì)量、提高試題效度等策略。

參考文獻(xiàn)：

[1]孫成崗.現(xiàn)代語言測試與試卷分析[J].解放軍外國語學(xué)院學(xué)報(bào)，2000（4）.

[2]牛強(qiáng).現(xiàn)行高校英語測試中的問題[J].外語教學(xué)與研究，2001（2）.

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

淺析大學(xué)英語語言測試中的信度與效度