魏 華
(江西外語外貿職業(yè)學院 江西南昌 330099)
網絡語言學習環(huán)境中的聽說測試信度與效度分析
魏 華
(江西外語外貿職業(yè)學院 江西南昌 330099)
語言測試是教學環(huán)節(jié)中不可或缺的重要組成部分,科學的評價體系能夠有力地推動語言人才的培養(yǎng)。本文就當前網絡語言學習環(huán)境中的聽說測試進行信度與效度分析,闡述了網絡化聽說測試的利弊,提出了這一測試改革的進一步思路。
網絡語言學習;聽說測試;信度與效度
語言測試是應用語言學領域的后起之秀,是一個“深奧且不受歡迎的行當”(Bachman & Palmer, 1988), 但是社會對測試的需求推動著這一科學的發(fā)展。(2011,金艷)。筆者認為,語言測試是一個包含人文價值觀的特殊項目,特別是其“產出性”技能的測試,對測試的評價體系帶來了難度。結合當前語言網絡化學習的發(fā)展趨勢,本文將對語言聽說測試的信度與效度進行分析,擬達到科學評價標準。
語言測試是用來衡量語言習得的重要手段之一,因此一直以來受到教育界學者的共同關注。筆者院校非常注重語言教學與測試,雖然在各測試工作中列有明確的量化測評標準,但隨著測試手段的不斷革新,在出卷、評卷等方面能否達到科學的信度與效度都存在一定的問題。
語言測試的兩個重要評價指標就是“信度”和“效度”。“信度”是指語言測試的可信度。Bachman(1996)定義“信度”為測試的一致性(consistency of measurement),即同樣的試卷在不同的環(huán)境中是否能達到同樣的測試效果。這對當下使用網絡環(huán)境下的測試起著非常重要的作用,因為一份缺乏信度的試卷根本實現不了測試的價值?!靶Ф取笔侵刚Z言測試的“可靠度”。武尊民(2002)定義“效度”為測試需考查測試的目標,即考試結果需用來評判預定要測試的語言能力,是一種測試與測試目標之間的相關性?!靶哦取迸c“效度”既矛盾又統(tǒng)一,可以說,任何測試難以達到兩者的最高點。因此,在測試題型、組卷、評卷中,盡量減少“信度”的誤差和增大“效度”的效果是語言測試必須考慮的因素。
在國際化英語語言測試能力的需求下,網絡化語言測試模式在眾多學院考試中得嘗試,帶動了語言測評的教改工作。我院近年采用了藍鴿校園網語言學科平臺為師生搭建了課堂教學、作業(yè)、自主學習、測試等實用模塊。這里主要介紹測試模塊在語言考評中的運用情況。
為適應我院學生特點,針對聽說測試我院采取了語言學科平臺中的智能化題庫平臺。老師可以自己設定相應的專業(yè)化題庫,并按照題目屬性分類,進行試題的添加、刪除等工作。
然后輸入“難度系數、試題形式”等條件,系統(tǒng)自動生成試卷。此類測試與之前的紙質試卷相比,在難度系數上更得到了科學的把控;在監(jiān)考、閱卷上也更加科學化、智能化,節(jié)省了大量的人力和物力。更加關鍵的是,網考無紙化測試推動了測試的趨勢發(fā)展,使語言學習者能夠適應國際化英語水平考試和社會應用型人才培養(yǎng)的要求,充分達到了測試的可信度。但同時,我院測試改革還處在起步階段,在硬件設備上還有待優(yōu)化。更加值得關注的是,在平時語言教學中,如何有效利用學科平臺中的教學板塊和其他板塊,使其真正促進語言的教學和測試,做到教考的有機統(tǒng)一,能夠科學實現測試的效度。
在語言聽說測試的改革中,從傳統(tǒng)紙質考試到機考再到網考,經歷了前后近5年的時間。雖在考試方法、設備使用方面都已比較嫻熟,但為達到最大化的聽說測試信度和效度,測試的出卷、組卷、評卷工作總在不斷優(yōu)化之中。
在試卷的出卷環(huán)節(jié)中:為提高信度,要求采用客觀題,如選擇題,確保測試結果的客觀性;同時,為確保效度,試題也采用了部分主觀題,如回答問題、兩人對話。在組卷方面:要提高信度,就一定要考慮試題本身的可靠性和評分的可靠性這兩個方面。試題本身的可靠性主要取決于試題的范圍、數量、試題的區(qū)分度等因素;評分的可靠性主要取決于評分標準是否客觀和準確。以大二上學期試卷為例,我們采用了三個大題,各部分之間梯度由易到難,考查了測試對象的語言聽說綜合運用能力,這也同時保證了測試的效度,特別是表面效度和內容效度。在評卷方面:要同時注意客觀性和主觀性的評價。一般來說,客觀題的評分標準在測試前就已得到保證,可以全部錄入測試平臺由機考一次性完成,關鍵是主觀性的評價還要由教師根據預定評判標準給測試對象打分,并且由兩位教師(聽說課和口語課)共同完成主觀題打分。
組卷題型
這是一份大二學生上學期組卷模式,兼顧了聽說兩項基本技能的測試,而且非常合理地把二者相互結合,達到了科學測試的目的。但是,題型偏向主觀,缺乏客觀題,乃至信度不高。但這份試卷效度非常高,區(qū)分度也很明顯,這也正說明信度和效度難以統(tǒng)一,但在今后的進一步改革嘗試中,可以站在增加信度的角度上,優(yōu)化題型。例如:第二大題可改為選擇題:聽小短文,然后根據意思選擇正確答案??偠灾@份試卷還是可行的。Davies(1990)提出,我們能夠使一個高效度的測試增加信度,但我們難以使一個高信度的測試更加有效。筆者也認為:語言測試應該更傾向于效度,這將推動語言教學向培養(yǎng)學生實用語言能力方向發(fā)展。
信度和效度是語言測試的兩大基本要求,而網絡化測試帶動了現代化技術在教育體系中的科學改革,能夠更加科學全面地實現測試的信度和效度檢驗。測試任務和網絡多媒體技術的有機結合也將是目前教育的必然發(fā)展趨勢,其良好創(chuàng)建了集立體化和生態(tài)化為一體的交際情境,有助于考試有效語言的輸出,但同時也對教育硬件環(huán)境和軟件環(huán)境提出了更高的要求。
[1]金艷.語言測試半個世紀的發(fā)展歷程——“第33界語言語言測試研究研究學術研討會”綜述[J].外語測試與教學,2011(10).
[2]吳小青.從我校英語測試談語言測試的信度與效度[J].科技信息,2011(21).
[3]施麗娜,徐芝蘋.國內十年語言測試信度與效度研究的統(tǒng)計分析[J].四川教育學院學報,2010(12).
[4]趙成發(fā).談語言測試的信度與效度[J].西安外國語學院學報,2010(3).
[5]Bachman L and Palmer A.Language Testing in Practice[M]. Oxford University Press,1996.
The reliability and validity of the test in the environment of network language learning
Wei Hua
(Jiangxi College of Foreign Studies, Nanchang Jiangxi,330099, China)
Language test is an important part of teaching, scientific evaluation system can greatly facilitate the language talent cultivation. This article analyzes the reliability and validity of the test in the environment of network language learning, elaborates the advantages and disadvantages of network listening testing, put forward ideas of this test reform.
network language learning; listening and speaking test; reliability and validity
H31
A
1000-9795(2014)04-0408-02
[責任編輯:劉麗杰]
2014-02-19
魏 華(1975-),女,江西南昌人,副教授,從事英語系教學工作。
江西省高等學校教學改革研究省級立項課題(JXJG-12-38-4)。