韓 笑
(鄭州成功財(cái)經(jīng)學(xué)院,河南 鞏義 451200)
語言測(cè)試是檢驗(yàn)學(xué)生語言水平的重要手段。要設(shè)計(jì)好一套測(cè)試題,需要遵循一定的標(biāo)準(zhǔn),如效度、信度、區(qū)分度等。其中,效度是一個(gè)非常重要的標(biāo)準(zhǔn)。效度指測(cè)試是否考查了設(shè)計(jì)者想要考查的內(nèi)容,或者說在多大程度上考查了想要考查的內(nèi)容。效度的高低是衡量語言測(cè)試最重要的指標(biāo),它是語言測(cè)試的基本出發(fā)點(diǎn)。高等學(xué)校英語專業(yè)八級(jí)考試(以下簡(jiǎn)稱TEM-8 或?qū)0丝荚?是根據(jù)《高等學(xué)校英語專業(yè)英語教學(xué)大綱》(2000 版)要求,全面檢查已完成英語專業(yè)高年級(jí)階段課程的學(xué)生是否達(dá)到了《大綱》所規(guī)定的英語語言綜合運(yùn)用能力標(biāo)準(zhǔn)以及英語專業(yè)知識(shí)的高水平測(cè)試。專八考試屬于標(biāo)準(zhǔn)參照性教學(xué)檢查類考試,每年的三月份舉辦一次,考試對(duì)象為高校英語專業(yè)大學(xué)本科四年級(jí)學(xué)生,考試由教育部高等學(xué)校外語專業(yè)教學(xué)指導(dǎo)委員會(huì)英語組組織有關(guān)測(cè)試專家命題,外語專業(yè)教學(xué)指導(dǎo)委員會(huì)辦公室負(fù)責(zé)考試的實(shí)施。2011 年TEM-8 于2011 年3月舉行,本年度考試是否貫徹了考試大綱的宗旨,試題質(zhì)量如何,考試對(duì)教學(xué)有哪些啟示,這些問題值得我們探討。
本文以Bachman & Palmer 提出的任務(wù)特性(Task Characteristics)為基礎(chǔ),融入Bachman 的最新測(cè)試?yán)碚摗靶Ф日w觀”把評(píng)估行為和基于評(píng)估結(jié)果做出的決定聯(lián)系在一起,形成了“評(píng)估使用論證(Assessment Use Argument,AUA)”框架,包括六大要素(elements)和四大類主張(claims)。六大要素即為效度論證的主要內(nèi)容,主要包括:觀點(diǎn)(claim)、數(shù)據(jù)(data)、根據(jù)(warrant)、證據(jù)(backing)、反證(rebuttal)及反證證據(jù)(rebuttal backing)并結(jié)合《高校英語專業(yè)八級(jí)考試大綱》對(duì)2011 年的TEM-8 閱讀理解部分的效度進(jìn)行研究。本研究對(duì)閱讀考試內(nèi)容和形式的不斷完善,課堂教學(xué)的組織優(yōu)化,以及學(xué)生閱讀能力的提高有重要啟示作用。
內(nèi)容效度是語言測(cè)試效度研究的一個(gè)核心問題。內(nèi)容效度決定了測(cè)試方法多大程度上測(cè)試出語言能力。測(cè)試的內(nèi)容效度是指測(cè)試是否考了考試大綱規(guī)定要考的內(nèi)容或者目標(biāo)。閱讀作為語言學(xué)習(xí)中最重要的基本技能之一,是獲取語言知識(shí)最直接、最有效的方法,閱讀能力則是衡量掌握語言綜合能力的一項(xiàng)標(biāo)志。學(xué)習(xí)閱讀,學(xué)會(huì)閱讀,提高英語閱讀能力,是提高整體英語水平、最終熟練掌握英語的必經(jīng)之路。閱讀部分在英語專業(yè)八級(jí)考試中占有相當(dāng)大的比重,不論是學(xué)生還是教師都應(yīng)對(duì)此非常重視。其內(nèi)容效度的實(shí)現(xiàn)對(duì)整個(gè)考試內(nèi)容效度的實(shí)現(xiàn)有很重要的影響。依據(jù)考試大綱,我們一般從三個(gè)方面來檢驗(yàn)?zāi)炒螠y(cè)試的內(nèi)容效度:(1)測(cè)試內(nèi)容,即試題是否具有代表性;(2)測(cè)試內(nèi)容是否和測(cè)試目標(biāo)有關(guān);(3)測(cè)試內(nèi)容是否符合代表對(duì)象。
從2005 年起英語專業(yè)八級(jí)考試測(cè)試題型有所更改,其中閱讀部分不再區(qū)分快速閱讀和一般閱讀,但測(cè)試目的基本沒變,還是考查英語專業(yè)學(xué)生對(duì)高級(jí)英語閱讀能力和技巧的掌握(其中包括略讀、精讀)。所以本文把2011 年TEM-8 考試中閱讀理解部分的測(cè)試內(nèi)容(總共4 篇閱讀材料,20 道題)作為樣本,依照考試大綱對(duì)其進(jìn)行內(nèi)容分析。
表1 2011 年TEM-8 考試閱讀理解材料主題和篇章體裁
材料主題范圍包括社會(huì)與生活、文化習(xí)俗、人物介紹、金融貿(mào)易、科技通訊和時(shí)事熱點(diǎn)等各個(gè)方面,具有較好的代表性和較廣的覆蓋面,避免了由于考試選材缺陷而產(chǎn)生的偏頗,為提升考試公平性打下良好基礎(chǔ)。其次,這些主題范圍和學(xué)生的學(xué)習(xí)生活以及他們關(guān)注的社會(huì)經(jīng)濟(jì)科技及擇業(yè)等問題息息相關(guān),這有助于增強(qiáng)試題的交互性。交互性指考生與測(cè)試任務(wù)之間的互動(dòng),材料主題和考生越貼近,互動(dòng)的可能性就越大,從而有利于提高考試的有效性。根據(jù)Bachman & Palmer(1996:17 ~37)提出的考試有效性模型,交互性是任何一項(xiàng)有效考試必備的六大品質(zhì)之一,此次考試中這些考察的主題范圍直接和語言知識(shí)有關(guān),用于檢測(cè)考生對(duì)語言知識(shí)的掌握,題型的整體設(shè)計(jì)與語言能力的檢測(cè)密切相關(guān),以此可以證明八級(jí)考試具有作為高校英語專業(yè)教學(xué)檢查類考試的本質(zhì)屬性和使命。
測(cè)試效度必須與測(cè)試目的相結(jié)合,脫離了具體的測(cè)試目標(biāo)而討論測(cè)試效度是沒有意義的,結(jié)構(gòu)效度是試卷質(zhì)量的關(guān)鍵。Bachman &Palmer 認(rèn)為結(jié)構(gòu)效度關(guān)系到我們依據(jù)考試成績(jī)所做的,對(duì)評(píng)價(jià)測(cè)試結(jié)果的解釋是否有意義并且恰當(dāng)。也就是說,我們有把握說一個(gè)考生成績(jī)能夠表明考生具有所考查的語言能力。我們必須闡明所要測(cè)量的是哪些語言能力,并用恰當(dāng)?shù)姆绞矫枋鲞@些能力,然后依據(jù)這些能力描述設(shè)置考查這些能力的考試任務(wù)。這樣測(cè)試者就能夠比較有把握地根據(jù)考試成績(jī)來解釋考生的語言能力。
本文對(duì)2011 年閱讀部分的材料進(jìn)行一個(gè)粗略的統(tǒng)計(jì),對(duì)材料的篇數(shù)、詞數(shù)及類型作一個(gè)總結(jié)。
表2 2011 年TEM-8 考試閱讀理解材料字?jǐn)?shù)統(tǒng)計(jì)
《考試大綱》規(guī)定八級(jí)閱讀材料總詞匯量為3000 個(gè)單詞左右,按照規(guī)定,閱讀理解部分的答題時(shí)間是30 分鐘。根據(jù)表2 統(tǒng)計(jì),閱讀理解材料總字?jǐn)?shù)加上題目字?jǐn)?shù),閱讀理解測(cè)試部分的閱讀量約在3600 左右,閱讀速度為120 字/分,從材料的篇幅和閱讀速度方面是符合了考綱的要求。
第二語言閱讀能力由兩個(gè)構(gòu)成成分組成,一是詞匯和字面理解能力,二是總體閱讀理解能力或推理能力,而在實(shí)際操作中TEM-8 閱讀理解題型可分為四類:字面理解題、信息重組和釋義題、推理題和評(píng)判題,鑒于此,我們?cè)趯?shí)際分析中對(duì)題型作如下分類:字面理解題即從文字表面就能找到答案的題目,且一般都在一句話之中。信息重組和釋義題可進(jìn)一步細(xì)分為兩類:信息重組題和釋義題。信息重組題需要整合多處細(xì)節(jié),跨越原文數(shù)個(gè)句子甚至段落,通常選擇時(shí)需要對(duì)比多重信息。比較典型的題目:Which of the following statements is true?釋義題考查考生對(duì)文章某個(gè)部分意義的理解,如本次八級(jí)試題第22 題:... class still indicates something less blunt than mere wealth (para. 3)means that 推理題考查考生對(duì)材料進(jìn)行推理的能力,通常答案無法直接從文中找到,考生需要讀懂文字之外的意思。比如,八級(jí)考試第20 題:What is the author's attitude towards paperlessness?我們采用上述題目分類法分析了本次八級(jí)考試閱讀理解部分的客觀題,結(jié)果如表3 所示。
閱讀理解部分在題目上的考查力度有明顯區(qū)別,八級(jí)更側(cè)重檢測(cè)考生對(duì)多處細(xì)節(jié)的信息整合能力,閱讀理解著重檢測(cè)考生信息重組與釋義以及推理的能力,也有一定比例檢測(cè)字面理解和評(píng)判能力。由此可見,試題設(shè)計(jì)不僅保證了對(duì)不同層次理解能力的綜合檢測(cè),也根據(jù)考生層次確定了不同層次的題目的比重差異,這樣的安排體現(xiàn)了考試大綱的相關(guān)要求,并且有利于考生在考試中根據(jù)需要自覺調(diào)整閱讀技巧。
表3 2011 年TEM-8 考試閱讀理解題項(xiàng)類型分析
TEM-8 針對(duì)全國(guó)高等院校英語專業(yè)全日制本科四年級(jí)學(xué)生,即全面檢查已完成英語專業(yè)高年級(jí)階段課程的學(xué)生是否達(dá)到英語語言綜合運(yùn)用能力的標(biāo)準(zhǔn)以及英語專業(yè)知識(shí)的要求。閱讀理解測(cè)試部分的內(nèi)容是否適合測(cè)試對(duì)象,答案應(yīng)該是肯定的。根據(jù)全國(guó)高等學(xué)校外語專業(yè)考試辦公室提供的數(shù)據(jù)如表4 所示:
表4 2011 年TEM-8 考試(RD 表示閱讀理解)
我們不難看出,閱讀理解部分的得分率在57.95%,而這個(gè)成績(jī)與英語專業(yè)八級(jí)考試的通過率56.06%基本持平。從學(xué)生的成績(jī)上來看,學(xué)生的平均得分在12 分左右,成績(jī)居于中等,閱讀部分幾乎沒有得滿分或者零分的情況也可以表明測(cè)試內(nèi)容基本符合大綱所要求的測(cè)試對(duì)象。總的來說,2011 年專業(yè)八級(jí)考試閱讀部分難度適中,基本上符合大部分的測(cè)試對(duì)象,其效度可以說是不錯(cuò)的。
本文以Bachman & Palmer 提出的任務(wù)特性(Task Characteristics)為基礎(chǔ),融入Bachman 的最新測(cè)試?yán)碚揂UA 框架為理論依據(jù),結(jié)合《大綱》對(duì)2011 年的TEM-8 閱讀理解部分的內(nèi)容效度和結(jié)構(gòu)進(jìn)行分析,我們認(rèn)為2011 年八級(jí)考試閱讀理解部分基本符合大綱要求,具有較高的效度較好地貫徹了考試大綱的要求,對(duì)英語專業(yè)基礎(chǔ)階段和高年級(jí)階段的英語教學(xué)以及學(xué)生英語水平的檢測(cè)較為全面客觀公正。作為一項(xiàng)高水平的英語能力的測(cè)試,閱讀理解部分題型的設(shè)置還有一定改進(jìn)空間,比如說閱讀理解的測(cè)試形式,可以由單一的多項(xiàng)選擇題改變?yōu)楹?jiǎn)短問答,判斷正誤等多種題型;就體裁的選擇方面可以融入更多的不同類型的文章,尤其是近幾年沒有涉及過的語篇類型;話題的設(shè)置也可以從社會(huì)生活中擴(kuò)展到更加多樣化。