陶百強
(江西金太陽教育研究院,南昌 330032)
基于核心素養(yǎng)的英語學(xué)考與高考命題探討
陶百強
(江西金太陽教育研究院,南昌 330032)
我國高中英語課程標(biāo)準(zhǔn)規(guī)定英語學(xué)科學(xué)核心素養(yǎng)含語言能力、文化品格、思維品質(zhì)和學(xué)習(xí)能力四個方面,為基于英語學(xué)科核心素養(yǎng)的綜合素質(zhì)評價與學(xué)業(yè)水平考試(簡稱學(xué)考)、高考命題確立了指導(dǎo)方針。高利害測試性質(zhì)的學(xué)考與高考命題宜有機融匯學(xué)科核心素養(yǎng)的考查或?qū)?,利用測評對教學(xué)的正面反撥作用,為發(fā)展我國學(xué)生的英語學(xué)科核心素養(yǎng)和立德樹人的教育宏觀目標(biāo)服務(wù)。本文從考試大綱研制、考查內(nèi)容、命題素材或命題情境、命題技藝等方面,探討如何基于核心素養(yǎng)進行英語學(xué)業(yè)水平考試和高考命題。
課程標(biāo)準(zhǔn);核心素養(yǎng);高考改革;學(xué)業(yè)水平考試;高考命題
黨的十八大報告把立德樹人作為教育的根本任務(wù),立德樹人首次被確立為教育的根本任務(wù)。黨的十八屆三中全會要求堅持立德樹人、加強社會主義核心價值體系教育、完善中華優(yōu)秀傳統(tǒng)文化教育等。教育部為貫徹十八大精神,啟動立德樹人工程,2014年3月,教育部發(fā)布《關(guān)于全面深化課程改革落實立德樹人根本任務(wù)的意見》,提出落實立德樹人工程的十大關(guān)鍵領(lǐng)域,其中,研制學(xué)生發(fā)展核心素養(yǎng)是首要環(huán)節(jié),并提出把核心素養(yǎng)體系作為研究學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)和修訂課程標(biāo)準(zhǔn)的依據(jù)[1]。核心素養(yǎng)指學(xué)生應(yīng)具備的、能夠適應(yīng)終身發(fā)展和社會發(fā)展需要的必備品格和關(guān)鍵能力?;诤诵乃仞B(yǎng)框架修訂的高中英語課程標(biāo)準(zhǔn)(以下簡稱課標(biāo)),在我國課標(biāo)研發(fā)歷史上首次制定了基于核心素養(yǎng)的學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn),提出了評價建議和學(xué)業(yè)水平考試(以下簡稱學(xué)考)和高考命題建議。
在此國策背景和課標(biāo)統(tǒng)領(lǐng)下,高考改革(含學(xué)考體系)必將體現(xiàn)并基于核心素養(yǎng)理念。教育部考試中心副主任于涵認(rèn)為,高考是核心素養(yǎng)落地的重要環(huán)節(jié),高考對課標(biāo)落實有極大的推動作用,核心素養(yǎng)和高考目標(biāo)、方向是一致的,即立德樹人[2],這為高考命題基于核心素養(yǎng)提供了可能性。
早在20世紀(jì)中后期,世界發(fā)達國家和經(jīng)合組織等國際組織就研究核心素養(yǎng)課題,國外對在學(xué)生評價中融入核心素養(yǎng)的研究早在20世紀(jì)90年代就出現(xiàn)了,如澳大利亞昆士蘭州1996年便有了有關(guān)報告[3]。我國核心素養(yǎng)框架在2016年9月發(fā)布,基于核心素養(yǎng)的各科高中課標(biāo)同年9月完成征求意見稿,故關(guān)于學(xué)科高考命題如何融合核心素養(yǎng)的公開文獻暫較少[4-6]。本文試圖從考試大綱研制、考查內(nèi)容、命題素材或命題情境、命題技藝等方面探討如何基于核心素養(yǎng)進行英語學(xué)業(yè)水平考試和高考命題。
2.1 考試大綱的重要意義
考試大綱研制是試題開發(fā)重要的前端環(huán)節(jié)。我國從1989年首次頒布高考英語科考試說明(后改名考試大綱)。李筱菊認(rèn)為,考試大綱是打破考試神秘化的文件,因過去的考試喜歡把考試神秘化,一不公布考試大綱,二把題型變來變?nèi)?,影響考試公平[7]??荚嚧缶V以前作為測試藍圖,用于指導(dǎo)命題,在現(xiàn)代效度理論中,測試研發(fā)本身被視為驗效程序的一個部分,考試大綱被視為一個驗效證據(jù)[8]。美國2014版教育與心理測試標(biāo)準(zhǔn)提到考試大綱要素包括:測試目的與用途、測試內(nèi)容、題型、考試時間、考試形式、施測、評分、分?jǐn)?shù)報告等[9]。世界著名語言測試均發(fā)布考試大綱,因無法囊括考試大綱的要素,課程標(biāo)準(zhǔn)無法完全代替考試大綱,參考課標(biāo)設(shè)計科學(xué)的考試大綱對指導(dǎo)命題和考生備考意義重大。
2.2 考試大綱研制依據(jù)
考試大綱研制在總體上可參考Bachman和Palmer提出的對語言測試的評價六原則,即效度、信度、真實性、交互性、后效、可操作性[10]。
2.2.1 基于當(dāng)代語言測試?yán)碚撆c國情
考試大綱研制應(yīng)依據(jù)當(dāng)代語言測試?yán)碚?,特別是效度理論。Weir闡述的基于證據(jù)的效度驗證框架因可操作性強,值得借鑒,效度驗證基于5個方面:基于理論的效度、語境效度、評分效度、校標(biāo)關(guān)聯(lián)效度、后效效度[11]17-40?!拔覈鴽]有專門針對外國語言文字的國家語言規(guī)劃,目前學(xué)界在討論國家語言能力這一概念,從相關(guān)項目和研究中包含外國語言方面的內(nèi)容……基礎(chǔ)和高校外語教學(xué)方面的要求可算作規(guī)劃的內(nèi)容?!苯虒W(xué)或測評相關(guān)文件缺乏國家外語語言規(guī)劃的宏觀指導(dǎo),導(dǎo)致社會和學(xué)界對英語語言和語言能力定位與地位、題型權(quán)重觀點各異。英語在我國定位為外語(EFL)而非二語(ESL)決定了我國英語測評不宜過度重視聽說能力,而宜讀寫領(lǐng)先[12],故在考試大綱研制中聽說部分權(quán)重不宜偏大,特別是閱讀,它是我國大多數(shù)人今后吸收域外信息的最重要方式,在考試大綱研制中可著重體現(xiàn),以體現(xiàn)高考綜合改革的基礎(chǔ)性原則。
效度解釋和測試用途相關(guān),我國高考勿唯西方國家馬首是瞻,因高考和國外語言考試目的不同,宜結(jié)合國情和高校與職場外語需求分析開發(fā)基于中國國情和國際視野、具有中國特色的高考外語考試大綱。此外,我國高考綜合改革方案確定英語一年兩考,涉及外語考試有效期的理論問題,根據(jù)語言損耗理論和國外外語考試有效期實踐,規(guī)定高考外語成績有效期為兩年。
2.2.2 基于核心素養(yǎng)
本輪新課程改革,特別是高中課標(biāo)修訂的兩個突出特色是將學(xué)生發(fā)展核心素養(yǎng)和學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)有機地融入新的課程標(biāo)準(zhǔn)之中,而且特別強調(diào)學(xué)生的學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)是基于學(xué)生核心素養(yǎng)構(gòu)建的[13],所以考試大綱研發(fā)應(yīng)基于學(xué)科核心素養(yǎng)。
中國學(xué)生發(fā)展核心素養(yǎng)以培養(yǎng)“全面發(fā)展的人”為核心,分為文化基礎(chǔ)、自主發(fā)展、社會參與三個方面,綜合表現(xiàn)為人文底蘊、科學(xué)精神、學(xué)會學(xué)習(xí)、健康生活、責(zé)任擔(dān)當(dāng)、實踐創(chuàng)新六大素養(yǎng),具體細化為國家認(rèn)同等18個基本要點。結(jié)合學(xué)科特點,英語學(xué)科核心素養(yǎng)綜合表現(xiàn)為四大素養(yǎng),即語言能力、文化品格、思維品質(zhì)和學(xué)習(xí)能力。核心素養(yǎng)應(yīng)體現(xiàn)在高考改革中,否則就會導(dǎo)致核心素養(yǎng)被“懸置”[14],但要避免直接而生硬[2],應(yīng)避免“貼標(biāo)簽”,而應(yīng)考慮到測試目標(biāo)的可測性或可測量性(testabili?ty),正如愛因斯坦所言,“并非所有重要的東西都能被測量,并非能被測量的東西都是重要的”[15]。高考與課標(biāo)銜接不能簡單搬用,也不宜為體現(xiàn)課標(biāo)而“言必稱核心素養(yǎng)”,如文化品格這一重要的核心素養(yǎng)非常重要,但卻不具備可測性(精確地表述為可測量性,下同),雖然文化知識可測,但若用考生的文化知識測試的得分來推斷或支持考生的人文修養(yǎng)和行為取向等文化品格素養(yǎng),效度很低。核心素養(yǎng)的綜合性、情境性、內(nèi)隱性和適應(yīng)性等特點造成其評價困難,目前歐盟國家的一種思路是將核心素養(yǎng)轉(zhuǎn)換為可觀察的外顯表現(xiàn),進而開發(fā)出相應(yīng)的測量工具和量規(guī),通過態(tài)度調(diào)查問卷、表現(xiàn)性評價等形式對核心素養(yǎng)開展評價[16]。
我國課標(biāo)務(wù)實地在命題建議中提到“側(cè)重考查語言運用能力,同時考查其他核心素養(yǎng)”[17]77,且在英語學(xué)業(yè)水平考試和高考宜側(cè)重考查“可以通過考試來考查的內(nèi)容”[17]81。
嚴(yán)格說來,學(xué)考和高考英語只能直接測評語言能力,文化品格與思維品質(zhì)可通過終結(jié)性評價間接測試來反撥教學(xué),如測試文化知識或在語言能力測試中融入思維認(rèn)知能力測試。無法直接測試的學(xué)習(xí)能力目前只能通過形成性評價實現(xiàn)并體現(xiàn)到考生綜合素質(zhì)評價中,但實行基于互聯(lián)網(wǎng)的機考可間接測試部分學(xué)習(xí)能力。有些核心素養(yǎng)在測試中的體現(xiàn)宜“潤物細無聲”或“潛移默化”。
對思維品質(zhì)的測試可有機融入到語言運用能力測試中,在語言運用能力測評中有機融合認(rèn)知層級,考試大綱可用認(rèn)知層級中的行為動詞細化認(rèn)知能力要求,體現(xiàn)學(xué)考和高考的不同認(rèn)知分級,因英語學(xué)科重視語言綜合運用能力測試且英語科屬技能導(dǎo)向型學(xué)科(skill-based subject),課標(biāo)《附錄A英語學(xué)科核心素養(yǎng)的水平劃分》對命題的具體指導(dǎo)似有限[17]96。
總之,考試大綱制定應(yīng)務(wù)實而為可為之處,對于目前不可測量的核心素養(yǎng),可利用形成性評價或跨學(xué)科任務(wù)考查并體現(xiàn)到作為招生錄取參考依據(jù)的綜合素質(zhì)評價中,但可融入與相關(guān)素養(yǎng)相關(guān)的知識,以對目前終結(jié)性測試技術(shù)無法測試的素養(yǎng)培育進行導(dǎo)向。
2.2.3 基于課標(biāo)分級要求
課標(biāo)第六章之“實施建議”含“學(xué)業(yè)水平考試與高考命題建議”,從考試的性質(zhì)與目的、命題建議、考查內(nèi)容、考試形式四個層面提出了一些具體建議[17]75-89。課標(biāo)含學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn),以核心素養(yǎng)為統(tǒng)領(lǐng),將具體教學(xué)目標(biāo)進行水平劃分,形成基于核心素養(yǎng)的學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn),在幫助學(xué)生學(xué)習(xí)、進行過程性學(xué)業(yè)評價、指導(dǎo)學(xué)業(yè)水平考試和高考命題中發(fā)揮作用[17]2。鑒于學(xué)考和高考要求不同,測試性質(zhì)不同(學(xué)考為標(biāo)準(zhǔn)參照測試,高考為常模參照測試),學(xué)考和高考的考試大綱應(yīng)分別研制,如體現(xiàn)在內(nèi)容和認(rèn)知分級要求等方面??荚嚧缶V研制結(jié)合課標(biāo)內(nèi)容標(biāo)準(zhǔn)、學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)、附錄A核心素養(yǎng)的水平劃分三處相關(guān)內(nèi)容,提取具有可測性的內(nèi)容和認(rèn)知要求。學(xué)考和高考考試大綱的考試要求應(yīng)清晰明確,避免因命題人員不同而產(chǎn)生自由裁量權(quán),如參照托福和雅思考試等明確對閱讀理解詞數(shù)的上下限要求,而非僅約定下限。
根據(jù)我國高考綜合改革宏觀方案,學(xué)考由省級教育行政部門命題,語數(shù)外高考科目由教育部統(tǒng)一命題。既然學(xué)考要求都基于全國統(tǒng)一的課標(biāo),合格性學(xué)考的要求理論上全國是相同的,定位為標(biāo)準(zhǔn)參照測試的學(xué)考考試大綱為了節(jié)省研制成本和確??茖W(xué)性,似可研制全國統(tǒng)一的學(xué)考大綱。
2.3 考試大綱研發(fā)內(nèi)容
“考什么,怎么考”是測評的根本和永恒主題,考試大綱研發(fā)的核心內(nèi)容是“考什么,怎么考,怎么評”。考試大綱研制影響深遠,影響效度并具有強大的教學(xué)反撥作用,故考試大綱研發(fā)應(yīng)該基于理論與實證研究。隨著語言測試?yán)碚摵蛯嵺`的發(fā)展以及基于實際測試中的新問題、新發(fā)現(xiàn),考試大綱也應(yīng)相應(yīng)修訂和不斷完善,如全國高考英語科考試大綱在語法填空施行一年后于2015年及時修訂完善[18]。
2.3.1 考什么
課標(biāo)規(guī)定學(xué)考與高考“側(cè)重考查語言運用能力,同時考查其他核心素養(yǎng)”[17]77,不排除語言運用能力基礎(chǔ)的語言知識(新增語用和語篇知識)考查,但整套試卷直接考查語言知識部分權(quán)重應(yīng)低于語言技能(聽說讀看寫)的權(quán)重,側(cè)重讀寫更適合中國國情,建議偏重閱讀,因閱讀是今后國民最主要的信息輸入方式。條件成熟后實施聽說機考,賦予合適權(quán)重以引導(dǎo)基礎(chǔ)英語教育不忽視聽說教學(xué)?!翱础保╲iewing)的技能指解讀視覺媒體,如圖片、圖畫、圖表、地圖等,或電視互聯(lián)網(wǎng)光盤媒介上的視頻資料,如可以在聽說機考設(shè)置視頻片段,或在閱讀理解或?qū)懽魉夭闹杏脠D畫、圖表等體現(xiàn)。
具體考試內(nèi)容的確定結(jié)合測試內(nèi)容與認(rèn)知層級[19]。最新的認(rèn)知目標(biāo)分類為:記憶、理解、應(yīng)用、分析、評價、創(chuàng)造[20]。考查內(nèi)容應(yīng)特別關(guān)注可測性因素,某些目標(biāo)適合用形成性評價如檔案袋測評[4]。高考錄取參考依據(jù)的綜合素質(zhì)評價可融合無法用終結(jié)性評價手段直接或間接測試的教學(xué)目標(biāo),避免核心素養(yǎng)標(biāo)簽化。具體測試內(nèi)容參見課標(biāo)分級要求(遵循課標(biāo)內(nèi)容標(biāo)準(zhǔn)、學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)和附錄A英語學(xué)科核心素養(yǎng)的水平劃分),特別是課標(biāo)中相對詳細的內(nèi)容標(biāo)準(zhǔn)部分,取自課標(biāo)的高中英語課程語法知識內(nèi)容標(biāo)準(zhǔn),如表1所示。
2.3.2 怎么考
怎么考指題型設(shè)計。題型本無優(yōu)劣,其選擇取決于特定測試目的和施測者優(yōu)先考慮的方面,被廣為詬病的多項選擇題若命制得當(dāng)也可測試高級思維能力[21]。語言理解能力測試宜用選擇性反應(yīng)題,語言表達能力測試宜用建構(gòu)性反應(yīng)題[22]。對于大規(guī)模高利害測試的學(xué)考與高考,題型規(guī)劃應(yīng)考慮到測試信度或閱卷的可操作性和效率。
表1 高中英語課程語法知識內(nèi)容標(biāo)準(zhǔn)
新題型的引進應(yīng)基于理論研究、文獻研究、實證研究和調(diào)查論證,即使題型的考試時間和題量等細節(jié)也應(yīng)進行實證研究,避免基于考試大綱決策者的偏好。新題型引進可基于Weir認(rèn)知-語境效度框架進行效度驗證研究[23],如全國高考英語科考試大綱中新題型引入前都進行嚴(yán)謹(jǐn)研究[24]。
老題型的改革也應(yīng)與時俱進,根據(jù)當(dāng)代語言測試?yán)碚摰陌l(fā)展改革或廢除,如在很多國外測試中已經(jīng)消失的完形填空題型值得研討,該題立足語篇測試語言知識(詞匯辨析能力),但詞匯測試的廣度囿于命題語篇而極其有限,且在理論上,該題型與Weir主張的認(rèn)知-語境效度框架相去甚遠。根據(jù)課標(biāo)命題建議,“設(shè)計試題時,要盡可能提供語義相對完整的語境,要盡可能使考試題型接近或類似現(xiàn)實生活中語言使用的實際情況,也就是說,試題要求學(xué)生做的事情(答題)應(yīng)接近或類似現(xiàn)實中使用語言來完成的事情”。從此角度考慮,完形填空題型也不符合課標(biāo)理念。真實性原則是語言測試中的一個重要原則[25],真實性研究涉及輸入的真實性(如測試文本、測試任務(wù))、輸出的真實性和情景的真實性[26]。Weir語境效度關(guān)注的是測試要盡可能接近“情境真實”(situational authenticity),此觀點也被語言測試權(quán)威J.C.Alderson強調(diào)[27]2-3。
高風(fēng)險測試的題型規(guī)劃必須非常慎重,課標(biāo)建議題型有的只適合課堂測試,如閱讀簡答題并不適合學(xué)考與高考,因答案可控性存疑,該題型被語言測試權(quán)威專家J.C.Alderson提出質(zhì)疑為難以控制答案完整性,因考生回答無法預(yù)料,需試測等[27]227。我國高考為全球最大規(guī)模的考試,考生人數(shù)多,閱卷人力資源有限,更應(yīng)考慮評分可操作性。此外,課標(biāo)提到“考試題型既要相對穩(wěn)定,又要有適當(dāng)?shù)撵`活性和可選擇性”,此舉在學(xué)考和高考中亦須慎重,因為不同題型的考查內(nèi)容和難度客觀上存在差異,若沒有技術(shù)校驗措施,可能威脅測試公平。我國外語高考實施多考制后,不同考次之間的題型是否可變值得探討,題型變化后對考生的內(nèi)容和認(rèn)知要求均變了,可能威脅考試公平,即使采用等值技術(shù)處理,但等值需滿足條件而并不能徹底解決不同考次試題的難度差異問題。國外學(xué)者認(rèn)為,等值操作有前提,等值應(yīng)滿足3個理想條件:待等值的試卷完全平行或非常接近平行、考生群體基本穩(wěn)定、等值樣本具代表性且足夠大以讓等值誤差最小化。在現(xiàn)實中若無法滿足理想條件,等值誤差是必然的,等值有先天局限性,只適合對難度差異很小的試題進行等值,若試卷間難度差變大,等值也不可靠[28]。在測評實踐中,美國教育考試服務(wù)中心(ETS)數(shù)據(jù)分析顯示,等值局限于校準(zhǔn)不同考次之間的細微難度差異[29]。
最后,題型設(shè)置也應(yīng)考慮公平性,對公平高度追求的美國ETS經(jīng)數(shù)年醞釀研究后,基于公平性因素等考量,在2016年3月后施測的英語試題將寫作改革為選考而非必考部分。
2.3.3 怎么評
長期以來,在作文評分的思想性、內(nèi)容豐富性、結(jié)構(gòu)、邏輯、語言、書寫、卷面整潔等評分要素的相對比重中,一直是存在爭論的,不同的評分規(guī)則,會影響到效度,影響到分?jǐn)?shù)的解釋。對此,是需要論證的”[30]。作為高利害測試的學(xué)考和高考,評分制度對確保測試的質(zhì)量和效度、信度至關(guān)重要。
Weir效度框架將傳統(tǒng)的“信度”稱為“評分效度”,把它作為整體效度驗證的證據(jù)之一[11]22。命題者宜從科學(xué)性和人文關(guān)懷角度制定答案與評分標(biāo)準(zhǔn),特別是在我國高考因高度保密性而無試測機制的國情下。因為閱卷等原因,美國SAT考試2016年 3月后實施的測試取消了原來必考的寫作,而改為選考。
我國課標(biāo)對評分標(biāo)準(zhǔn)也很重視,要求“合理制定評分標(biāo)準(zhǔn)”[17]80。選擇性題型可通過機器自動評卷,怎么評的問題主要涉及建構(gòu)性試題,如口語和寫作測試等。課標(biāo)提到主觀性試題命題既要考慮效度,更要考慮閱卷等工作的可行性,合理制定評分標(biāo)準(zhǔn)……如聽力部分主要考查學(xué)生的聽力理解能力,那么評分標(biāo)準(zhǔn)就應(yīng)該以學(xué)生是否聽懂為依據(jù),評分標(biāo)準(zhǔn)要靈活處理書寫的準(zhǔn)確性問題;寫作部分主要考查學(xué)生以書面形式表達意義、傳遞信息、再現(xiàn)生活經(jīng)驗的能力,因此評分標(biāo)準(zhǔn)應(yīng)該側(cè)重評價這些方面的能力[17]80。
關(guān)于我國高考英語寫作要求的詞數(shù)問題,現(xiàn)行高考大綱要求詞數(shù)100左右,且在考試大綱說明的書面表達評分原則中規(guī)定:詞數(shù)少于80和多于120的,從總分中扣去2分。在高考高度緊張的環(huán)境下,考生很容易誤判詞數(shù)??v觀世界各主要英語語言測試的寫作要求,鮮有同時規(guī)定寫作文本的下限和上限的,而傾向于規(guī)定下限,即規(guī)定不少于多少詞,如IELTS考試寫作(學(xué)術(shù)類)作文一(應(yīng)用文類)要求考生文章字?jǐn)?shù)不能少于150字,否則將會被扣分,字?jǐn)?shù)多于150字不會被扣分;作文二(論述性)要求考生文章字?jǐn)?shù)不能少于250字。建議今后不宜苛求考生精確將寫作詞數(shù)控制到某個閉區(qū)間,而只約定詞數(shù)下限。
改革高考寫作評分辦法。高考書面表達的評分區(qū)間太大(0~25分),導(dǎo)致評分主觀性較大,且高考閱卷因為時間非常緊張,盡管有雙評制,評分員可能給保守分。實際上,國際上大型英語語言測試的評分區(qū)間都很小,這是充分考慮到了人本身的認(rèn)知局限性,如托福寫作(含綜合寫作和獨立寫作兩節(jié))均從0到5的評分標(biāo)準(zhǔn)進行評分,兩項寫作任務(wù)的平均分?jǐn)?shù)最終再被轉(zhuǎn)換為0到30分,而不由評分員直接在0~30分賦分區(qū)間評分。2016年3月后實施的SAT考試將寫作改革為選考,實行雙人評分,每位評分員分別針對閱讀、分析和寫作能力賦分,賦分區(qū)間為1~4分,然后將兩個評分員的賦分相加,最后考生在SAT作文部分得到3個分?jǐn)?shù),分別針對閱讀、分析和寫作能力,每項的得分區(qū)間為2~8分。評分員無法被訓(xùn)練成精密的測量儀器,無法獲得區(qū)間較大的刻度感。筆者建議評分也應(yīng)該借鑒自然科學(xué)領(lǐng)域的“實驗具有可重復(fù)性”原則,否則無法確保評分的公平性,最終威脅測評效度。借鑒國外閱卷,改革我國語言測試作文賦分和閱卷方法,以確保測試公平,并讓寫作測試促進學(xué)生寫作能力的提高[31]。
選擇合適的命題素材或命題情境是重要的命題前期核心環(huán)節(jié),各個題型都涉及命題素材的選擇,如聽力測試、聽說綜合技能測試、閱讀理解、寫作或讀寫綜合測試等。國外著名測試機構(gòu)對命題素材的選擇很重視,對命題素材就有專門文件約定篩查審核環(huán)節(jié),涉及對命題語篇話題、語篇類型、詞匯難度、語言難度或文本易讀度(readability)、長度、敏感性,公平性等。我國高考命題對素材等已有嚴(yán)格全面的規(guī)范,如高考命題質(zhì)量標(biāo)準(zhǔn)中規(guī)定了多項政治性、公平性要求[32]。
3.1 導(dǎo)向性
基于核心素養(yǎng)的課標(biāo)意在最終教育目標(biāo)——立德樹人,作為學(xué)考或高考的命題素材應(yīng)體現(xiàn)思想性、教育性,讓考生潛移默化受到正面隱性教育?!督逃筷P(guān)于全面深化課程改革落實立德樹人根本任務(wù)的意見》(教基二[2014]4號文件)要求加強考試招生和評價的育人導(dǎo)向。立德樹人的教育目標(biāo)并非口號,它有利于提高國民素養(yǎng),各國均重視德行教育,如美國重視對學(xué)生個性品質(zhì)、價值觀方面的教育,培養(yǎng)誠實公正禮貌責(zé)任尊嚴(yán)忠誠寬容等品德,使學(xué)生形成良好的品德和正確的價值觀,以提高公民素養(yǎng)[33]。
部分命題素材體現(xiàn)社會主義核心價值觀或中外文化,樹立文化自信。命題素材兼顧人文性與科學(xué)性,間接體現(xiàn)核心素養(yǎng)培養(yǎng)目標(biāo)。課標(biāo)對命題語篇有明確建議,如“在閱讀理解部分,可以適當(dāng)選擇涉及文化背景和文化差異、情感態(tài)度和價值觀的語篇”[17]77。但是,選擇命題素材時應(yīng)考慮測量目標(biāo),如富含中國傳統(tǒng)文化元素的文本就不適合用來測試閱讀或聽力理解能力,因存在信息差先天缺陷,內(nèi)容可能對一般考生缺乏挑戰(zhàn)性,可能淪為主要測試考生的中國文化知識,此類語篇如命制語法填空題型等更妥當(dāng)。
高考命題素材來源宜規(guī)避我國一般師生較易接觸到的命題來源,且應(yīng)頻繁而無規(guī)律變化,以應(yīng)對備考方出于押中命題素材的心理而進行投機性備考,否則可能強化愈演愈烈的題海戰(zhàn)術(shù)。
3.2 課標(biāo)吻合度
課標(biāo)對文學(xué)性語篇進行了強調(diào),文學(xué)作品是潛移默化培養(yǎng)讀者人文情懷、人文修養(yǎng)和文化品格的重要媒介,高考適當(dāng)選用優(yōu)秀文學(xué)語篇將對教學(xué)產(chǎn)生正面影響。課標(biāo)在傳統(tǒng)聽說讀寫的基礎(chǔ)上增加了語言技能——“看”,這個新要求在紙筆測試中可通過選用非連續(xù)性文本或混合文本作為閱讀理解等命題素材來體現(xiàn)。
文化知識可融入到命題素材中,涉及中外文化知識,并根據(jù)考查題型而科學(xué)選擇匹配的題型進行命題。關(guān)于命題素材的語篇類型,參見課標(biāo)多樣化的語篇類型。就命題主題來看,嚴(yán)格地說,學(xué)考和高考有差異,例如,課標(biāo)學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)二級水平即學(xué)考語篇建議為“學(xué)生能夠圍繞有關(guān)社會生活、品行與道德、人與自然等話題……”,四級水平即高考要求建議語篇為“學(xué)生熟悉或不太熟悉的話題”,學(xué)考選擇一般學(xué)生相對熟悉的話題,而高考則未加限制,可以選擇“不太熟悉的話題”作為命題素材。
3.3 語言的真實地道性
面向21實際核心素養(yǎng)的測評原則之一是選擇真實情境考查問題解決能力[34],經(jīng)合組織研發(fā)的PISA測試對真實性特別重視,如科學(xué)部分的命題注重選擇實際生活情境。語言測試的真實性原則從命題素材或命題情境的選擇就開始體現(xiàn)。英語測試也應(yīng)依據(jù)真實的生活情境或素材,如招聘廣告類命題素材不能缺乏簡歷投遞截止時間和聯(lián)系方式等真實生活中招聘廣告的必需元素。
課標(biāo)也在教學(xué)和測試材料中提倡“真實、多樣的語篇材料和語篇形式”[17]17,“學(xué)生有機會接觸更多真實生活中的語篇”[17]38,“考題的設(shè)計……在選擇語言素材時,要盡量使用真實、地道、典型的當(dāng)代英語素材,可根據(jù)考試的目的和學(xué)生的語言水平,對真實的語言材料進行適當(dāng)?shù)膭h減和改寫”[17]79。但還應(yīng)關(guān)注刪減改寫時命題者首先要充分理解原文,并確保加工后的文本保持語篇意義的獨立性、完整性和銜接性。
英語測試素材必須高度關(guān)注語言質(zhì)量,語言地道至關(guān)重要,在某些題型中甚至直接影響到答案制定而可能導(dǎo)致命題瑕疵。
命題是一項高度專業(yè)性的任務(wù),從20世紀(jì)80年代后期以來,我國高考命題技藝水平一直在改革與完善,已積累較成熟的命題制度和經(jīng)驗。借鑒美國ETS的測試審題標(biāo)準(zhǔn)和我國現(xiàn)行高考命題原則,研究者提出高考命題質(zhì)量審查原則包括:原創(chuàng)性、科學(xué)性、敏感性、公平性、編校規(guī)范性[28],如何在常規(guī)命題原則的基礎(chǔ)上進一步融匯核心素養(yǎng)因素以直接或間接考查或?qū)蚴且粋€宏大的課題,本文僅作簡述。
4.1 語言能力
語言能力的考查是終結(jié)性學(xué)考和高考的核心。對作為語言技能的基礎(chǔ)語言知識部分,課標(biāo)進行了改革,語言知識包括語音、語法、詞匯、語篇和語用知識,其中的語篇和語用知識以前也要求或測試,課標(biāo)單獨提出以凸顯其重要性,這點也宜體現(xiàn)到命題者挖掘?qū)φZ篇和語用知識點的命題。除了命題關(guān)注外,在評分標(biāo)準(zhǔn)的制定上也可體現(xiàn),如寫作評分標(biāo)準(zhǔn)提高對考生語篇能力的要求。為了導(dǎo)向我國基礎(chǔ)英語教育真正扭轉(zhuǎn)過分重視知識而輕語言技能與語言運用能力的狀況,命題不宜設(shè)計偏難怪的語言知識考點,而將命題重心置于語言技能或語言綜合運用能力考查。
4.2 文化品格
文化品格是指對中外文化的理解和對優(yōu)秀文化的認(rèn)同,是學(xué)生在全球化背景下表現(xiàn)出的文化意識、人文修養(yǎng)和行為取向,文化品格的培育有助于學(xué)生樹立世界眼光,增強國家認(rèn)同感和家國情懷,學(xué)會做人做事,成長為有文化修養(yǎng)和社會責(zé)任感的人[17]5。文化品格無法用終結(jié)性測試考查,但文化知識可測,雖文化知識考查主要體現(xiàn)在命題素材的選擇上,但是在命題環(huán)節(jié)也可體現(xiàn),“試題的設(shè)計可以引導(dǎo)學(xué)生對其中的文化差異進行理解和判斷,對語篇反映的情感態(tài)度和價值觀進行分析和闡釋,寫作試題可引導(dǎo)學(xué)生對現(xiàn)象、觀點、情感態(tài)度進行比較和分析,并在此基礎(chǔ)上發(fā)表自己的觀點、態(tài)度和價值判斷……”[17]77。
4.3 思維品質(zhì)
本輪各科課標(biāo)修訂目標(biāo)都非常重視思維品質(zhì),表現(xiàn)在邏輯性、批判性和創(chuàng)造性等方面。課標(biāo)提倡要通過語言材料的選擇、考查重點的設(shè)置、考試項目和考試形式的設(shè)計等,直接或間接地考查考生的思維品質(zhì)[17]77,本文以閱讀理解和寫作任務(wù)的命題為例,簡述如何關(guān)注思維品質(zhì)的考查。
閱讀理解一直是我國高考英語科重要的被測技能,命題時首先提煉課標(biāo)對學(xué)考和高考的分級思維目標(biāo)要求。課標(biāo)之學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)分級進行了思維要求,要準(zhǔn)確把握這些目標(biāo)描述中使用的“闡釋”“評價”“分析”“比較”“理解”“區(qū)分”“找出”等描述詞語的內(nèi)涵差異[35]。明確思維考查層次后,命題者在具體試題設(shè)計中予以體現(xiàn),命題者考慮到我國高中生的思維現(xiàn)狀,避免考查過多低級思維層次的題目。對批判性思維能力的考查,我國高考現(xiàn)有閱讀理解多項選擇題題型也可考查[36],有的思維層級若無法在現(xiàn)行題型考查且對考生發(fā)展和人才培養(yǎng)又非常重要,可進行題型改革,如借鑒國外測試進行新題型引入與改良,美國SAT閱讀測試中的雙語篇閱讀(Paired Passages)很利于考查批判性思維能力。
關(guān)于寫作測試,考察國外母語或外語寫作測試實踐,兼顧考查獨立思考能力、邏輯思維能力以及語言表達能力等。我國也應(yīng)在教育測量中注重對獨立思考和自由表達能力的考查,在教育考試中具體體現(xiàn)“鼓勵創(chuàng)新、鼓勵獨立思考”,通過命題為核心素養(yǎng)培育目標(biāo)作出貢獻。我國課標(biāo)認(rèn)為“寫作試題可以引導(dǎo)學(xué)生對現(xiàn)象、觀點、情感態(tài)度進行比較和分析,并在此基礎(chǔ)上發(fā)表自己的觀點、態(tài)度和價值判斷,以考查學(xué)生的思維能力”[17]77。英文寫作是重要的英語語言表達和書面英語交際技能,寫作也是發(fā)展問題解決能力和批判性思維技能的重要渠道[37],但也是中國英語學(xué)習(xí)者的弱項。我國傳統(tǒng)高考英語寫作應(yīng)用文比例偏高,建議減少考查功能有限的應(yīng)用文比例,而增加議論文等語篇類型的寫作任務(wù),選取貼近學(xué)生生活、貼近現(xiàn)實和社會的題材,如增加社會文化類話題,通過語言測試的反撥作用引導(dǎo)學(xué)生關(guān)注社會、生活和人生,培養(yǎng)學(xué)生的社會責(zé)任感和人文素養(yǎng)等,增強問題解決和批判性思維能力,發(fā)揮教育測試的隱性育人功能,扭轉(zhuǎn)學(xué)生“兩耳不聞窗外事,一心只讀圣賢書”的狀況。2016年10月,高考綜合改革試點省浙江啟用了有利考查考生思維力的讀后續(xù)寫題型,提高了對考生思維內(nèi)容組織能力的要求。為了用寫作題型培養(yǎng)思維品質(zhì)這項核心素養(yǎng),建議進一步研發(fā)基于證據(jù)的讀寫綜合 題 型(Evidence-based reading-into-writing tasks),并考慮認(rèn)知效度、語境效度和評分信度。
基于核心素養(yǎng)的英語學(xué)考與高考命題是一個宏大的話題,本文僅從部分維度拋磚引玉。核心素養(yǎng)的培養(yǎng)任重道遠且有跨學(xué)科性,首先應(yīng)體現(xiàn)到學(xué)校課程規(guī)劃與管理、學(xué)校教學(xué)活動中,作為教育中重要環(huán)節(jié)之一的教育測評也應(yīng)承擔(dān)這項重要責(zé)任,有效運用形成性評價并科學(xué)且盡量“去功利化”地體現(xiàn)到綜合素質(zhì)評價這一高考參考依據(jù)中,以糾正師生“考什么教什么,考什么學(xué)什么”的功利化思想;同時,在終結(jié)性評價如學(xué)業(yè)水平考試和高考命題中對核心素養(yǎng)教育目標(biāo)進行科學(xué)、有效體現(xiàn)和導(dǎo)向。同時,學(xué)界和社會應(yīng)對學(xué)考與高考秉持合理科學(xué)的期待,因高考環(huán)節(jié)無法也不能荷載所有的教育期待,只有各環(huán)節(jié)系統(tǒng)推進和踐行,才能逐漸推進我國核心素養(yǎng)、立德樹人宏偉教育不斷前行。
(感謝北京外國語大學(xué)韓寶成教授提供有關(guān)交流信息。)
[1]林崇德.21世紀(jì)學(xué)生發(fā)展核心素養(yǎng)研究[M].北京:北京師范大學(xué)出版社,2016:2.
[2]于涵.2016明德論壇:高考改革與核心素養(yǎng)[EB/OL].(2016-11-07)[2016-11-08].http://edu.china.com.cn/2016-11/08/content_ 39658617.htm.
[3]Board of Senior Secondary School Studies.Final Report:Integrating the Key Competencies into the Assessment and Reporting of Stu?dent Achievement in Senior Secondary Schools in Queensland[R].Queensland,1997.
[4]胡知凡.基于高中美術(shù)學(xué)科核心素養(yǎng)的命題與測評[J].教育參考,2016(4):9-17.
[5]吳成軍.基于生物學(xué)核心素養(yǎng)的高考命題研究[J].中國考試, 2016(10):25-31.
[6]幸世強.聚焦數(shù)學(xué)學(xué)科核心素養(yǎng)的高考命題視角——以2016年四川高考數(shù)學(xué)試題為例[J].教育科學(xué)論壇,2016(10):48-51.
[7]李筱菊.語言測試科學(xué)與藝術(shù)(第2版)[M].長沙:長沙湖南教育出版社,2001:78.
[8]KIM J,DAVIDSON F.Effect-Driven Test Specifications[C]//The Companion to Language Assessment II:7:47.2013:788-795.
[9]American Educational Research Association,American Psychologi?cal Association,and National Council on Measurement in Educa?tion.Standards for Educational and Psychological Testing[M].Wash?ington,D.C:American Educational Research Association,2014:76.
[10]BACHMAN L F,PALMER A.Language Testing in Practice[M].Ox?ford:Oxford University Press,1996:17.
[11]WEIR C J.Language Testing and Validation:An Evidence-Based Approach[M].Basingstoke:Palgrave Macmillan,2005.
[12]董亞芬.我國英語教學(xué)應(yīng)始終以讀寫為本[J].外語界,2003(1): 2-6.
[13]辛濤.學(xué)生發(fā)展核心素養(yǎng)研究應(yīng)注意幾個問題[J].華東師范大學(xué)學(xué)報(教育科學(xué)版),2016(1):6-7.
[14]崔允漷.追問“核心素養(yǎng)”[J].全球教育展望,2016(5):3-10.
[15]BACHMAN L F.Modern language testing at the turn of the centu?ry:assuring that what we count counts[J].Language Testing,2000, 17(1),1-42.
[16]劉新陽,裴新寧.教育變革期的政策機遇與挑戰(zhàn)——歐盟“核心素養(yǎng)”的實施與評價[J].全球教育展望,2014(4):75-85.
[17]教育部.普通高中英語課程標(biāo)準(zhǔn)(征求意見稿)[S].2016.
[18]陶百強,李明楷,李建平.對我國高考英語命題中建構(gòu)性題型答案可控性的探討[J].中國考試,2014(10):22-34.
[19]HALADYNA T M,RODRIGUEZ M C.Developing and validating test items[M].New York,NY:Routledge,2013:28.
[20]ANDERSON L W,KRATHWOHL(Eds.).A Taxonomy for Learn?ing,Teaching,and Assessing:A Revision of Bloom’s Taxonomy of Educational Objectives[M].New York,NY:Longman,2001.
[21]HALADYNA T M,DOWNING S M.A taxonomy of multiplechoice item-writing rules[J].Applied Measurement in Education, 1989:37-50.
[22]陶百強,陳效.我國高考英語考試大綱(說明)的問題與思考[J].教育與考試,2008(4):29-34.
[23]CHAN,SATHENA HIU CHONG.Establishing the validity of read?ing-into-writing test tasks for the UK academic context[D].Univer?sity of Bedfordshire,2013.
[24]劉慶思,程蒙蒙.關(guān)于高考英語科啟用語篇型語法填空題的研究[J].中小學(xué)外語教學(xué),2013(11):1-5.
[25]LEWKOWICZ J A.Authenticity in language testing:some outstand?ing questions[J].Language Testing,2000,17(1):43-64.
[26]黃大勇.語言測試中的真實性概念[J].語言教學(xué)與研究,2004(2):77-80.
[27]ALDERSON J C.Assessing Reading[M].Cambridge University Press,2000.
[28]陶百強,劉清華,李明楷.關(guān)于高考實施社會征題的思考[J].中國考試,2016(5):48-57.
[29]ETS.How the SAT is Scored[EB/OL].(2015-08-20)[2016-04-16].https://sat.collegeboard.org/scores/how-sat-is-scored.
[30]謝小慶.測驗效度概念的新發(fā)展[J].考試研究,2013(3):56-64.
[31]陶百強.2016年高考英語全國卷命題比較研究與建議[J].考試研究,2016(5):14-30.
[32]李光明,等.教育考試國家題庫——理論與實踐[M].北京:高等教育出版社,2014:49-50.
[33]王定華.美國基礎(chǔ)教育:觀察與研究[M].北京:人民教育出版社,2016:181.
[34]劉晟,魏銳,等.21世紀(jì)核心素養(yǎng)教育的課程、教學(xué)與評價[J].華東師范大學(xué)學(xué)報(教育科學(xué)版),2016(3):38-45.
[35]程曉堂,趙思奇.英語學(xué)科核心素養(yǎng)的實質(zhì)內(nèi)涵[J].課程·教材·教法,2016(5):79-86.
[36]喬輝.批判性思維及其在英語閱讀中的考查[J].中國考試,2010(4):45-49.
[37]DEMPSEY,et al.Helping preservice teachers learn to assess writ?ing:Practice and feedback in a Web-based environment[J].As?sessing Writing,2009,14(1):38-61.
An Exploration into Item Writing for the English Achievement Test&NMET
TAO Baiqiang
(Sunducation Educational Research Institute,Nanchang 330032,China)
Four core competencies including linguistic competence,cultural literacy,thinking quality and learning capacity are stipulated in China’s latest high school English Curriculum Standards,thus establishing the guiding principles for English subject core competencies-based comprehensive quality assessment and item writing for the achievement test and National Matriculation English Test(NMET).It is recommended that the core competencies should be directly or indirectly integrated into item writing for the achievement test and NMET,and consequently producing positive washback to learning,teaching and ultimately to the fundamental task of education—fostering and promoting all-round personal development.The paper explores how to conduct core competencies-based item writing for the achievement test and NMET from four dimensions—test specification design,test content,item stimuli and item writing techniques.
Curriculum Standards;Key Competencies for English Subject;College Entrance Examination Reform; High School Achievement Test;Item Writing for College Entrance Examination
G405
A
1005-8427(2017)04-0025-9
10.19360/j.cnki.11-3303/g4.2017.04.005
(責(zé)任編輯:周黎明)
本文系2014年度國家社會科學(xué)基金項目“學(xué)校利益相關(guān)者視角下實施高考新方案的教育功效研究”(項目批準(zhǔn)號:14BGL128)的研究成果之一。
陶百強(1971—),男,金太陽教育研究院英語教研組長,研究員。