賀 靜
(巢湖學(xué)院 外語系,安徽 巢湖 238024)
高考英語,是國(guó)家組織的高中畢業(yè)生參加的選拔性英語考試,是一項(xiàng)大規(guī)模、標(biāo)準(zhǔn)化、高風(fēng)險(xiǎn)的考試。自2004年起,教育部大力推進(jìn)了 “統(tǒng)一考試,分省命題”的新舉措。依據(jù)區(qū)域教育實(shí)際,安徽省于2005年開始自主命制高考英語試題。在自主命題的過程中,考試的任務(wù)要求和題型設(shè)計(jì)都有了相應(yīng)的變化和調(diào)整。其中,閱讀理解一直是權(quán)重最大、賦分最高的部分,考生在閱讀理解測(cè)試上的表現(xiàn)將很大程度上影響其英語考試的成績(jī)??梢?,能否命制出效度高的閱讀試題對(duì)于整個(gè)測(cè)試的質(zhì)量起著重要的作用。據(jù)此,本文以2005-2011年間安徽省高考英語閱讀理解試題為對(duì)象,依據(jù)測(cè)試效度理論和驗(yàn)證框架,結(jié)合高中英語課程標(biāo)準(zhǔn)、考試大綱來驗(yàn)證試題的內(nèi)容效度,借以給今后該省高考英語閱讀試題的命制提供參考和借鑒。
效度、信度、反撥作用和可行性是語言測(cè)試研究的根本問題,其中效度最為重要,是衡量語言測(cè)試質(zhì)量最重要的指標(biāo)。Bachman指出效度是現(xiàn)代語言測(cè)試的核心,是語言測(cè)試的基本出發(fā)點(diǎn)[1]。Weir指出效度是一項(xiàng)測(cè)試是否真正測(cè)量了它所要測(cè)量的東西[2]。席仲恩認(rèn)為語言測(cè)試的效度涉及測(cè)試數(shù)據(jù)支持與解釋測(cè)試的準(zhǔn)確程度[3]。韓艷梅指出“論證效度的辦法之一就是分析考試中的語言現(xiàn)象與考試的建構(gòu)是否一致”[4]。綜合而言,我們認(rèn)為效度指測(cè)試是否測(cè)量了設(shè)計(jì)者想要測(cè)的內(nèi)容,并在多大程度上測(cè)量了要測(cè)的內(nèi)容。
效度大體分為內(nèi)容效度、構(gòu)念效度、效標(biāo)關(guān)聯(lián)效度。內(nèi)容效度是內(nèi)在效度,即存在測(cè)試本身的效度。它是指測(cè)試是否考了考試大綱規(guī)定要考的,或者說考試題目在多大程度上能代表它所測(cè)量的目標(biāo)??荚噧?nèi)容效度的保證,主要靠試題設(shè)計(jì)和試題命題、審題時(shí)嚴(yán)格遵守考試大綱要求[5]。Hughes也指出內(nèi)容效度越高,就越可能準(zhǔn)確測(cè)量出它所要測(cè)量的內(nèi)容[6]。此外,近年來國(guó)內(nèi)外學(xué)者在內(nèi)容效度研究方面內(nèi)容呈多樣化趨勢(shì),影響較大的有:楊惠中和Weir對(duì)大學(xué)英語四、六級(jí)考試從結(jié)構(gòu)效度、內(nèi)容效度、預(yù)期效度方面的研究。鄒申對(duì)TEM考試效度的歷時(shí)研究。陳曉扣采用客觀類試題效度研究模型TEM4客觀試題作了整體研究。但這些研究大多集中在大學(xué)英語和英語專業(yè)方面,對(duì)基礎(chǔ)英語測(cè)試方面的研究,尤其是對(duì)高考這一大規(guī)模 “國(guó)考”的效度研究并不充分,與其重要的社會(huì)影響并不相稱,因而我們對(duì)安徽省高考英語閱讀理解效度的歷時(shí)研究是十分必要的。
在效度研究框架方面,Bachman&Palmer提出了測(cè)試任務(wù)特征框架。該框架把測(cè)試方法分為五個(gè)層面:測(cè)試環(huán)境、測(cè)試說明、測(cè)試輸入信息、輸入信息的預(yù)期回答、輸入和回答的關(guān)系[7]。這個(gè)框架的提出為其后各種測(cè)試的效度研究提供了方法依據(jù)。同時(shí),考慮到安徽省高考閱讀理解試題的命題要求及受試者特點(diǎn),本文在Bachman任務(wù)特征框架基礎(chǔ)上進(jìn)行的改進(jìn),使其更具操作性,并側(cè)重從測(cè)試輸入和預(yù)期回答兩大層面展開研究,具體包括六個(gè)方面的驗(yàn)證 (見表1)。
表1 閱讀測(cè)試內(nèi)容效度驗(yàn)證框架
依據(jù)內(nèi)容效度驗(yàn)證框架,并結(jié)合高中英語課程標(biāo)準(zhǔn)及考試說明的要求,從文章長(zhǎng)度、閱讀速度、易讀度、文章題材、文章體裁以及閱讀微技能六個(gè)方面進(jìn)行分析,其目的在于全面驗(yàn)證閱讀試題的內(nèi)容效度。
閱讀測(cè)試是對(duì)受試接受性技能的考查,閱讀長(zhǎng)度適當(dāng)與否是考查考生閱讀能力的重要因素之一,因而對(duì)文章長(zhǎng)度的統(tǒng)計(jì)分析成為內(nèi)容效度研究的首要觀察點(diǎn)。文章長(zhǎng)度即文章所包含的總詞數(shù),這里我們按單詞數(shù)來表征文章長(zhǎng)度,同時(shí)除去了文章中所有漢語注釋對(duì)文章進(jìn)行了統(tǒng)計(jì),其結(jié)果如下表所示(見表 2)。
表2 閱讀文章長(zhǎng)度統(tǒng)計(jì)匯總
《考試說明》對(duì)閱讀量的要求做了明確的闡述,在2005-2008年說明中要求對(duì)所提供的文章長(zhǎng)度不少于1000詞,而由于新課程改革的實(shí)施從2009年起考試說明規(guī)定閱讀文章長(zhǎng)度不少于1200詞。按照五篇文章計(jì)算,每篇文章的閱讀量至少應(yīng)控制在200至240詞左右。此外,韓寶成指出閱讀測(cè)試的篇幅長(zhǎng)度應(yīng)控制在200至500詞的范圍內(nèi)是比較合適的[8]。據(jù)此對(duì)照表2,可以發(fā)現(xiàn)2005年閱讀量最少,2010年閱讀量最多,2011年試題閱讀量有所減少,閱讀強(qiáng)度稍有降低,但總體上七年來閱讀文章長(zhǎng)度及總長(zhǎng)度基本呈上升趨勢(shì),文章的長(zhǎng)度符合命題的要求。因此我們認(rèn)為閱讀文章長(zhǎng)度應(yīng)保持總體的穩(wěn)定性,體現(xiàn)穩(wěn)中有變的命題思路。
閱讀速度常被視為衡量閱讀者閱讀水平的參考性指數(shù)。在閱讀過程中,閱讀者總是試圖在不影響理解效果的基礎(chǔ)上努力提高閱讀速度。在安徽高考英語中,自2009年起 《考試說明》要求考生應(yīng)在規(guī)定的35分鐘內(nèi)完成閱讀量不少于1200詞的文章。但考慮到給定的35分鐘包括閱讀文章時(shí)間及回答問題時(shí)間,按照楊惠中提出的1︰0.75的時(shí)間分配比例,可得出閱讀文章時(shí)間約為25分鐘,而答題時(shí)間約為15分鐘。依據(jù)這種時(shí)間分配,我們分別通過兩種方式計(jì)算出各年文章的閱讀速度。結(jié)果如表3所示。
表3 閱讀速度統(tǒng)計(jì)匯總
(續(xù)前表)
從表3可見,文章閱讀速度基本在60詞/分鐘至70詞/分鐘的范圍內(nèi),偶有波動(dòng),各年平均閱讀速度為63.6詞/分鐘。而總體閱讀速度基本在50詞/分鐘至60詞/分鐘,體現(xiàn)出較好的穩(wěn)定性,未有較大的波動(dòng)。在閱讀速度上,《課程標(biāo)準(zhǔn)》指出在文章生詞率少于3%的情況下,基本閱讀速度應(yīng)達(dá)到50-70詞/分鐘,而較高要求應(yīng)達(dá)到70-80詞/分鐘??梢姼髂晡恼麻喿x速度和總體閱讀速度達(dá)到了基本要求,符合命題要求。但隨著新課程改革的深入,從提高測(cè)試區(qū)分度的角度我們認(rèn)為今后閱讀速度的應(yīng)適當(dāng)提高 (控制在65-70詞/分鐘),從而更好的考查考生的綜合閱讀能力。
易讀度即可讀性,指文章容易閱讀的程度,涉及到句長(zhǎng)、音節(jié)數(shù)、生詞量等。閱讀文章的易讀度應(yīng)難易適中,過易或過難都反映不出考生的實(shí)際閱讀能力。常用的公式有Flesh易讀度公式,具體為Readability=206.84- ( 0.85*NSYLL)-(1.02*W/S),其中,NSYLL指單詞中的音節(jié)數(shù),W/S指每個(gè)句子的平均詞數(shù)[9]。易讀度的指數(shù)分布在0-100范圍內(nèi),指數(shù)越小,文章難度越大。如易讀度指數(shù)在0-30的文章非常難,而指數(shù)在70-80的文章較容易。因而,根據(jù)易讀度公式并運(yùn)用Word對(duì)文章的易讀度進(jìn)行了統(tǒng)計(jì),結(jié)果如表4所示。
表4 閱讀文章易讀度匯總
從表4可知,七年來閱讀文章的易讀度指數(shù)最低為38.2,最高為79.5,平均易讀度指數(shù)處于58.8-68.4范圍內(nèi)??梢灾v易讀度指數(shù)分布區(qū)間較廣,涵蓋不同難度的文章。結(jié)合表5從易讀度指數(shù)分布而言,易讀度指數(shù)處于適中和較容易的區(qū)間占了65.8%,這部分文章是安徽高考英語閱讀試題的主體,同時(shí)易讀度指數(shù)處于中等難度以上的文章占34.2%,文章難易結(jié)合,合理分布??傮w而言,閱讀文章的易讀度分布較為平衡,較好的體現(xiàn)了測(cè)試的要求。
題材是文章所涉及的話題領(lǐng)域。Bachman指出閱讀測(cè)試中涉及的題材對(duì)受試者的表現(xiàn)有較大影響,產(chǎn)生一種 “題材效應(yīng)”[9]。閱讀文章題材分布的得當(dāng)與否不僅影響試題的偏頗性,而且關(guān)系到試題效度的高低。同時(shí),《考試說明》中要求考生讀懂熟悉的有關(guān)日常生活話題的簡(jiǎn)短文字材料,如公告、說明、廣告以及書、報(bào)中關(guān)于一般性話題的簡(jiǎn)短文段[10]。此外,《課程標(biāo)準(zhǔn)》也明確提出考生應(yīng)熟悉涉及社會(huì)、校園生活、科技、歷史等24類話題。為此,我們對(duì)文章題材做了統(tǒng)計(jì)歸納,結(jié)果如表5所示。
從表5可見,文章題材涉及到科技、環(huán)保、中西文化、生活感悟、素質(zhì)發(fā)展等多方面話題,題材分布廣泛,選材貼近考生,反映現(xiàn)實(shí)生活,兼具知識(shí)性和時(shí)代性。同時(shí),題材的選擇契合了新課標(biāo)注重培養(yǎng)學(xué)生跨文化交際意識(shí)的理念,不僅選取了中國(guó)傳統(tǒng)的民俗文化的材料,也選用了西方社會(huì)歷史文化的文章,體現(xiàn)了語言學(xué)習(xí)的本質(zhì)??梢灾v,考生在閱讀過程中既拓展了視野、增加了知識(shí),又了解了歷史文化,實(shí)現(xiàn)了閱讀測(cè)試的工具性與人文性的統(tǒng)一。因此,文章題材的分布符合命題要求,題材深淺有度,安排合理。
體裁涉及到篇章組織的文體特點(diǎn),不同的體裁的文章會(huì)對(duì)受試者的理解會(huì)產(chǎn)生影響, 因而對(duì)體裁的分析也是內(nèi)容效度驗(yàn)證的應(yīng)有之義。在英語中,體裁大體可歸為記敘文、描寫文、說明文和議論文四類。同時(shí),《課程標(biāo)準(zhǔn)》要求高中畢業(yè)生能夠識(shí)別不同體裁文章的特點(diǎn)以及讀懂簡(jiǎn)單的應(yīng)用文。據(jù)此,我們按四大類對(duì)文章體裁進(jìn)行統(tǒng)計(jì),結(jié)果如表6所示。
表6 閱讀文章體裁分布匯總
從表6中可見,文章體裁分布較為廣泛,涵蓋了四種體裁,體現(xiàn)了體裁多樣性的特點(diǎn),符合 《考試大綱》的要求。從體裁類別分布來看,記敘文和說明文是閱讀測(cè)試的主體,同時(shí)兼顧對(duì)應(yīng)用文這類實(shí)用性文體的考查,避免了體裁的單一化,對(duì)測(cè)試實(shí)施和考生的閱讀能力的培養(yǎng)都產(chǎn)生了積極的反撥效應(yīng)。但由于閱讀測(cè)試旨在考核考生捕捉和理解信息的能力,從這個(gè)角度講,說明文信息量較大,議論文論點(diǎn)鮮明,有利于考查考生的信息定位、推斷能力以及邏輯思辨能力,我們認(rèn)為在今后的體裁選擇中可以適當(dāng)加強(qiáng)對(duì)這兩類文體的測(cè)試。
閱讀測(cè)試中內(nèi)容效度的驗(yàn)證既要從內(nèi)容也要從理解技能方面進(jìn)行分析,而閱讀微技能正是理解內(nèi)容和技能應(yīng)用的結(jié)合。楊惠中指出閱讀測(cè)試內(nèi)容效度的研究要考察連續(xù)幾年試題是否覆蓋了對(duì)全部或大部分閱讀技能的考查[11]。同時(shí),《考試說明》明確列出了六種閱讀微技能:理解主旨和要義、理解文中具體信息、根據(jù)上下文推斷生詞的詞義、作出判斷和推理、理解文章的基本結(jié)構(gòu)、理解作者的意圖、觀點(diǎn)和態(tài)度。對(duì)閱讀微技能統(tǒng)計(jì)分析不僅有助于了解試題的不同層次技能的分布特點(diǎn),而且有助于試題內(nèi)容效度的優(yōu)化和調(diào)控。為此我們對(duì)題目的微技能考點(diǎn)進(jìn)行統(tǒng)計(jì),結(jié)果如表7所示。
表7 閱讀微技能分布匯總
從表7中可知,各年試題基本涵蓋了對(duì)主要閱讀微技能的考查,對(duì)理解文章結(jié)構(gòu)這一技能的考查相對(duì)薄弱,但總體符合閱讀測(cè)試的命題要求。具體而言,“理解具體信息”和 “詞義推斷”兩類技能的試題占據(jù)了55.9%,而 “理解主旨要義”和 “理解觀點(diǎn)態(tài)度”等技能試題占據(jù)44.1%,可見閱讀測(cè)試是以中等難度技能的試題為主體,兼顧對(duì)中高難度試題的考查,基本符合以 “中等難度試題”為主的命題思路。但從技能分布看,我們發(fā)現(xiàn)某些年份對(duì)具體信息技能的考查的權(quán)重偏大,以至對(duì)高層次技能的考查有所薄弱,尤其是對(duì)理解文章結(jié)構(gòu)技能的考查,因此我們建議對(duì)閱讀微技能考查的分布應(yīng)更加合理,適當(dāng)提高中高難度技能的比例,突出試題的選拔性功能。
依據(jù)效度理論對(duì)安徽省高考英語閱讀試題內(nèi)容效度的研究,結(jié)果表明閱讀測(cè)試符合 《課程標(biāo)準(zhǔn)》、《考試說明》的相關(guān)要求,命題合理,具有較高的內(nèi)容效度。七年來閱讀理解試題既保持著總體的穩(wěn)定性,又具有動(dòng)態(tài)的變化性,命題的質(zhì)量穩(wěn)步提高。同時(shí),內(nèi)容效度研究過程中發(fā)現(xiàn)相關(guān)閱讀項(xiàng)目的命制仍有不足,需要進(jìn)一步改進(jìn)優(yōu)化。如單個(gè)試卷閱讀材料的題材、體裁分布稍過集中、高層次閱讀技能的考查略顯不足等。因此,我們建議今后安徽省高考英語閱讀試題既要保持一定的穩(wěn)定性,也要在選材、設(shè)題、閱讀微技能控制等方面進(jìn)一步加強(qiáng),實(shí)現(xiàn) “三個(gè)轉(zhuǎn)向”的命題思路,實(shí)現(xiàn)試題的能力立意,逐步形成以考促改、以考促學(xué)的反撥效應(yīng)。
[1]Bachman,L.F.FundamentalConsiderations in Language Testing[M].Oxford:Oxford University Press,1999.
[2]Weir,C.J.Language Testing and Validation:An Evidence-based Approach[M].New York:Palgrave Macmillan,2005.
[3]席仲恩.語言測(cè)試分?jǐn)?shù)的導(dǎo)出、報(bào)道和解釋[M].成都:四川大學(xué)出版社,2006.
[4]韓艷梅.廣東高考英語讀寫任務(wù)測(cè)試的語篇特點(diǎn)分析[J].長(zhǎng)江師范學(xué)院學(xué)報(bào)(教育科學(xué)),2012,(2):84.
[5]鄒 申.TEM考試效度研究[M].上海:上海外語教育出版社,1997.
[6]Hughes.A.Testing for Language Teachers[M].Beijing:Foreign Language Teaching and Research Press,2000.
[7]Bachman,L.F.&Palmer,A.Language Testing in Practice[M].Shanghai:Foreign Language Teaching and Research Press,1999.
[8]韓寶成.語言測(cè)試和它的方法[M].北京:外語教學(xué)與研究出版社,2000.
[9]辜向東.CET閱讀測(cè)試與大學(xué)英語閱讀教材易讀度抽樣研究[J].西安外國(guó)語學(xué)報(bào),2003,(9):39.
[10]安徽省教育招生考試院.普通高等學(xué)校招生全國(guó)統(tǒng)一考試安徽卷考試說明[M].合肥:安徽教育出版社,2011.
[11]楊惠中,C.J.Weir.大學(xué)英語四、六級(jí)考試效度研究[M].上海:上海外語教育出版社,1998.