国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

取消高考大綱后的新型考試研發(fā)模式探析

2021-01-07 12:17:10楊志明潘送球孔淑儀楊笑穎
關(guān)鍵詞:理解能力課標(biāo)維度

楊志明,潘送球,孔淑儀,楊笑穎

(1.湖南師范大學(xué) 測評研究中心/外國語學(xué)院,湖南 長沙 410081;2.湖南省教育考試院,湖南 長沙 410012)

2019年,國務(wù)院辦公廳印發(fā)了《關(guān)于新時代推進普通高中育人方式改革的指導(dǎo)意見》(以下簡稱《指導(dǎo)意見》),要求“在實施普通高中新課程的省份不再制定考試大綱,學(xué)業(yè)水平選擇性考試和高等學(xué)校招生全國統(tǒng)一考試命題都要以國家普通高中課程標(biāo)準(zhǔn)和高校人才選拔要求為依據(jù),促進教考有效銜接”[1]。2020年,中共中央和國務(wù)院印發(fā)了《深化新時代教育評價改革總體方案》(以下簡稱《總體方案》),強調(diào)要“改進結(jié)果評價,強化過程評價,探索增值評價,健全綜合評價,著力破除唯分?jǐn)?shù)、唯升學(xué)、唯文憑、唯論文、唯帽子的頑瘴痼疾,建立科學(xué)的、符合時代要求的教育評價制度和機制”[2]。顯然,取消高考大綱已成必然,搞好四個評價是未來的努力方向。但是,在“取消考試大綱”[1,3]情況下如何搞好考試研發(fā)工作挑戰(zhàn)極大。一旦重大考試出現(xiàn)任何失誤,如信度不高或效度證據(jù)不足,或分?jǐn)?shù)表達(dá)和使用不當(dāng),或結(jié)果不公平(fairness)等問題,則不僅會危害為國選才和基礎(chǔ)教育等工作,而且會給考試工作和管理者帶來重大責(zé)任[4-9]。本文以英語學(xué)科為例,參考《中國高考評價體系》(以下簡稱高考評價體系)[10-13]、《中國英語能力等級量表》(以下簡稱量表)[14-16]及《普通高中英語課程標(biāo)準(zhǔn)(2017年版)》(以下簡稱課標(biāo))[17],結(jié)合中國國情,從教育測量學(xué)的角度探索考試研發(fā)的新模式[18-20],為改進教育評價制度和機制提供新的視角。

一、課標(biāo)和量表概述

高考評價體系[10]明確要求,今后的高考命題要確?!傲⒌聵淙恕⒎?wù)選才和引導(dǎo)教學(xué)”一個核心目標(biāo),覆蓋“必備知識、關(guān)鍵能力、學(xué)科素養(yǎng)和核心價值”四個層次的內(nèi)容,使用“基礎(chǔ)性、綜合性、應(yīng)用性和創(chuàng)新性”四種命題手法。就英語科來說,要體現(xiàn)這“一核”“四層”“四翼”要求,就必須掌握課標(biāo)和量表的基本內(nèi)容及其相互關(guān)系。

1.課標(biāo)概述

課標(biāo)規(guī)定:“英語課程的任務(wù)是:激發(fā)和培養(yǎng)學(xué)生學(xué)習(xí)英語的興趣,使學(xué)生樹立自信心,養(yǎng)成良好的學(xué)習(xí)習(xí)慣和形成有效的學(xué)習(xí)策略,發(fā)展自主學(xué)習(xí)的能力和合作精神;使學(xué)生掌握一定的英語基礎(chǔ)知識和聽、說、讀、寫技能,形成一定的綜合語言運用能力;培養(yǎng)學(xué)生的觀察、記憶、思維、想象能力和創(chuàng)新精神;幫助學(xué)生了解世界和中西方文化的差異,拓寬視野,培養(yǎng)愛國主義精神,形成健康的人生觀,為他們的終身學(xué)習(xí)和發(fā)展打下良好的基礎(chǔ)。”[17]簡單地說,課標(biāo)的重點在于指導(dǎo)教學(xué)活動,包括對教學(xué)目標(biāo)、教學(xué)設(shè)計、教學(xué)過程和教學(xué)評價等各個方面的指導(dǎo)。它涵蓋了“主題語境、語篇類型、語言知識、文化知識、語言技能、學(xué)習(xí)策略”六大要素,強調(diào)了“知識與能力、過程與方法、情感態(tài)度與價值觀”的三維學(xué)習(xí)和評價目標(biāo)。其突出特點表現(xiàn)為如下兩個方面:

其一,課標(biāo)要求在傳授英語知識的同時,要幫助學(xué)生發(fā)展“語言能力、思維品質(zhì)、文化意識和學(xué)習(xí)能力”四種學(xué)科素養(yǎng),要體現(xiàn)英語學(xué)科工具性和人文性相融合的特點。此外,課標(biāo)還強調(diào)幫助學(xué)生運用英語學(xué)習(xí)其他學(xué)科知識的價值,鼓勵學(xué)生利用英語,有效地汲取世界文化精華,傳播中華文化,進而發(fā)展跨文化交流能力,樹立人類命運共同體的意識及多元文化意識,形成開放包容的態(tài)度等,最終為學(xué)生繼續(xù)學(xué)習(xí)英語,或選擇就業(yè)及適應(yīng)世界多極化、經(jīng)濟全球化和社會信息化奠定基礎(chǔ)。

其二,課標(biāo)倡導(dǎo)指向?qū)W科核心素養(yǎng)的教學(xué)觀念和教學(xué)設(shè)計;鼓勵學(xué)生開展自主性學(xué)習(xí)、合作式學(xué)習(xí)、參與式學(xué)習(xí)和探究式學(xué)習(xí);強調(diào)教學(xué)設(shè)計要注重啟發(fā)式,要體現(xiàn)英語學(xué)習(xí)的綜合性、關(guān)聯(lián)性和實踐性特點;要求學(xué)生通過學(xué)習(xí)理解、應(yīng)用實踐和遷移創(chuàng)新等形式,把語言、文化和思維融為一體,特別要求學(xué)生能從語篇中提取和整合信息,能對事實、概念和過程知識做出恰當(dāng)?shù)脑忈尯驮u價,能運用英語表達(dá)個人的觀點、意圖和情感態(tài)度,能體會中外文化的異同,形成多元思維的意識和批判性思維的習(xí)慣,發(fā)展英語的學(xué)習(xí)能力和運用能力。

2.量表概述

與課標(biāo)不同,量表側(cè)重于英語能力維度和層次兩個方面。其主要內(nèi)容包括以下兩個方面:

其一,量表對英語能力維度給予大量操作性界定。比如,關(guān)于英語知識和能力結(jié)構(gòu),量表把它表述為“語言知識(組構(gòu)知識和語用知識)”、“語言理解能力(聽、讀)”、“語言表達(dá)能力(說、寫)”、“語用能力(理解、表達(dá))”、“翻譯能力(口譯、筆譯)”及“使用策略(言語策略)”共六個維度。其中,“語言理解能力”、“語言表達(dá)能力”和“翻譯能力”分別包含了“描述”“敘述”“說明”“指示”“論述”“互動”“策略”七個子維度,“使用策略”則細(xì)分為“理解策略(聽、讀)”、“表達(dá)策略(說、寫)”、“翻譯策略(口、筆)”及“組構(gòu)知識學(xué)習(xí)策略”四個子維度。

具體地,閱讀理解能力指的是“讀者閱讀并處理書面材料時,運用各種知識(包括語言知識和非語言知識)和策略,圍繞所讀材料構(gòu)建意義的能力。包括識別與提取書面信息的能力、概括與分析書面信息的能力、批判與評價書面信息的能力”[14]。聽力理解能力指的是一種綜合認(rèn)知能力,“由與聽力活動相關(guān)的識別、提取、概括、分析、批判、評價等認(rèn)知能力組成”[14]??陬^表達(dá)能力指的是“說話人在分析情境、參與者、表達(dá)目的、交流渠道等語境因素的基礎(chǔ)上,恰當(dāng)?shù)剡\用語言知識和交際策略,有效地完成口語交際任務(wù),實現(xiàn)交際目的”[14],其口頭表達(dá)策略包括了“規(guī)劃”“執(zhí)行”“評估與補救”三個子維度。書面表達(dá)能力指的是“撰寫不同功能文本的能力”,其書面表達(dá)策略也包括了“規(guī)劃(構(gòu)思)”、“執(zhí)行(撰寫)”及“評估與補救(修改)”三個子維度。語用能力指的是“結(jié)合具體語境,運用各種知識和策略,理解和表達(dá)特定意圖的能力,包括語用理解能力和語用表達(dá)能力”[14]。翻譯能力包括口譯能力和筆譯能力。其中,口譯能力指的是“通過口頭表達(dá)形式,調(diào)用語言知識和策略將一次性的源語聽力文本轉(zhuǎn)換為目的語文本的跨文化語際中介能力”[14];筆譯能力指的是調(diào)用語言知識和策略將源語文本轉(zhuǎn)換為目標(biāo)語文本的跨文化語際中介能力;翻譯策略也包括“規(guī)劃”、“執(zhí)行”及“評估與補救”三個子維度。

其二,英語量表對不同英語能力水平從行為表現(xiàn)角度給予了大量描述。比如,關(guān)于英語閱讀理解能力,量表對九個層級的表現(xiàn)水平給予了詳細(xì)界定,覆蓋了從“入門”到“杰出”等級的水平(詳見表1)。

從表1可看出,學(xué)生在閱讀中,不僅需要會閱讀純文本,同時也要會從書信、通知、告示、新聞報道等可能包含文字、表格、符號等多模態(tài)的文章中加工并處理信息。即,英語量表對閱讀理解能力不僅具體界定了會做哪些事情(能力結(jié)構(gòu)),而且對不同層次(級別)的行為表現(xiàn)做出了具體描述。根據(jù)這個描述,無論是研發(fā)英語閱讀理解測驗,還是進行教學(xué)設(shè)計和實施教學(xué)過程,都比較容易判斷出學(xué)生的短板,以及當(dāng)前的發(fā)展水平層次,對教師的教和學(xué)生的學(xué),都具有重要指導(dǎo)意義。

表1 《中國英語能力等級量表》閱讀理解能力部分等級水平的行為描述[14]

3.量表與課標(biāo)的比較

課標(biāo)和量表都十分關(guān)注英語學(xué)習(xí)的目的、內(nèi)容、層次、過程、手段和結(jié)果等各個方面?,F(xiàn)參照中國高考評價體系[10-13],分別從課標(biāo)和量表的定位,以及“必備知識”“關(guān)鍵能力”“學(xué)科素養(yǎng)”“核心價值”角度比較它們的異同。

第一,課標(biāo)和量表的定位、目的、內(nèi)容,以及應(yīng)用范圍和理論基礎(chǔ)具有差異。英語課標(biāo)的定位是明確界定英語學(xué)科對不同年級學(xué)生所要求掌握的知識、能力、情感、態(tài)度、價值觀和文化理解等方面的內(nèi)容,目的是指導(dǎo)教學(xué)和教學(xué)評價。課標(biāo)內(nèi)容主要涵蓋了英語學(xué)科關(guān)于教學(xué)目標(biāo)、教學(xué)內(nèi)容、教學(xué)方式和教學(xué)評價等方面的要求。比如,課標(biāo)提倡以“主題—語篇—語言—技能—策略—文化”為框架設(shè)計課程,其要求就是一種具體的教學(xué)指導(dǎo)建議。此外,課標(biāo)的應(yīng)用范圍比較廣,涵蓋了英語教學(xué)和評價的所有方面。其理論基礎(chǔ)主要是各種有關(guān)人類語言習(xí)得的理論,如認(rèn)知語言學(xué)、心理語言學(xué)、神經(jīng)語言學(xué),以及有關(guān)第二語言習(xí)得的理論和課程論原理等。

量表的定位是從行為表現(xiàn)的角度闡述語言習(xí)得和運用的方方面面,目的是為診斷英語能力的結(jié)構(gòu)特點和層次水平提供邏輯框架,其內(nèi)容涵蓋了“信息輸入”(閱讀理解、聽力理解)、“信息儲存”(語言知識的獲得)、“信息加工”(使用策略和翻譯能力)、“信息輸出”(口頭表達(dá)和書面表達(dá))這樣一個完整認(rèn)知加工過程的各個環(huán)節(jié),體現(xiàn)了清晰的認(rèn)知語言學(xué)理論基礎(chǔ)。其應(yīng)用范圍主要在確立教學(xué)目標(biāo)、指導(dǎo)考試命題、診斷學(xué)業(yè)特點與水平、開展成長性評估等方面。其能力層次的描述涵蓋了從“入門”水平到“杰出”水平共九個等級。

第二,課標(biāo)與量表關(guān)于英語知識的界定比較接近。課標(biāo)所指的語言知識,包括語音、詞匯、語法、語篇、語用知識及相關(guān)的文化知識,并在課標(biāo)中具體羅列了相關(guān)的詞匯和語法項目。量表所指的語言知識,包括“組構(gòu)知識(語法知識和篇章知識)和語用知識(功能知識和社會語言知識)”兩個方面,并分別從“語法”“語音系統(tǒng)和書寫形式”“詞匯”“句法”“篇章”“修辭或會話”“銜接”“組構(gòu)”共八個維度進行了細(xì)致解讀。顯然,課標(biāo)與量表關(guān)于語言知識的界定內(nèi)容基本一致,但二者的表述角度有所不同,量表的邏輯性和操作性更強。

第三,課標(biāo)與量表關(guān)于英語能力的內(nèi)容基本重合但表述不同。課標(biāo)定義的語言能力指的是“在社會情境中,以聽、說、讀、看、寫等方式理解和表達(dá)意義的能力,以及在學(xué)習(xí)和使用語言的過程中所形成的語言意識和語感”[17]。其中,“聽”“讀”“看”是理解性技能,“說”和“寫”是表達(dá)性技能。特別地,“看”特指利用多模態(tài)語篇中的圖形、表格、動畫、符號及視頻等理解意義的技能。顯然,“看”屬于一種比較特殊的閱讀,所以把它與“聽、說、讀、寫”并列的做法在邏輯上比較勉強。量表所定義的語言能力以思維加工為參照標(biāo)準(zhǔn),內(nèi)容包括“理解能力(聽力、閱讀)”、“表達(dá)能力(口語、寫作)”、“語用能力”、“翻譯能力”及“使用策略(言語策略)”五個維度。同時,每個維度又依據(jù)書面或口語材料的不同,分別從“描述”“敘述”“說明”“指示”“論述”“互動”“策略”七個子維度做了細(xì)化解讀。顯然,課標(biāo)與量表關(guān)于語言能力的內(nèi)容重合不少,但量表的內(nèi)容更為豐富,其層次性、邏輯性和操作性都更強。

第四,課標(biāo)與量表關(guān)于學(xué)科素養(yǎng)的界定有較大差異。課標(biāo)所界定的英語學(xué)科素養(yǎng),包括語言能力、文化意識、思維品質(zhì)和學(xué)習(xí)能力四個維度。其中,語言能力在前文中已有解釋,此處從略。文化意識指的是“對中外文化的理解和對優(yōu)秀文化的認(rèn)同,是學(xué)生在全球化背景下學(xué)生所表現(xiàn)的跨文化認(rèn)知、態(tài)度和行為取向”[17]。思維品質(zhì)指“學(xué)生思維在邏輯性、批判性、創(chuàng)新性等方面所表現(xiàn)的能力和水平”[17]。學(xué)習(xí)能力指“學(xué)生積極運用和主動調(diào)試英語學(xué)習(xí)策略、拓寬英語學(xué)習(xí)渠道、努力提升英語學(xué)習(xí)效率的意識和能力”[17]。與此不同,量表沒有對英語學(xué)科素養(yǎng)做專門的界定,但量表關(guān)于語言能力的描述與課標(biāo)所界定的學(xué)科素養(yǎng)有很多重合內(nèi)容。比如,量表中關(guān)于“理解能力”和“表達(dá)能力”所包含的內(nèi)容體現(xiàn)在課標(biāo)的語言能力和思維品質(zhì)維度之中,關(guān)于“語用能力”和“使用策略”的定義與課標(biāo)中關(guān)于“學(xué)習(xí)能力”的解釋也有較多共同之處,并在很多方面體現(xiàn)了“文化意識”。此外,課標(biāo)關(guān)于學(xué)科素養(yǎng)的界定在邏輯上不夠理想,因為“語言能力”“思維品質(zhì)”“學(xué)習(xí)能力”之間存在很多重疊內(nèi)容,“文化意識”也廣泛滲透在其他三個維度之中。同時,課標(biāo)本身對語言能力和學(xué)科素養(yǎng)沒有做明確的區(qū)分。從測驗研發(fā)和改進教學(xué)等角度來看,量表比課標(biāo)顯得更為實用。

第五,課標(biāo)和量表關(guān)于英語學(xué)科核心價值觀的表述有明顯差異。課標(biāo)在關(guān)于課程性質(zhì)的描述中對核心價值問題有過專門的說明,強調(diào)要“全面貫徹黨的教育方針、落實立德樹人根本任務(wù)、……培養(yǎng)社會主義建設(shè)者和接班人……”。量表對核心價值沒有專門的論述,而是把核心價值滲透在理解能力、表達(dá)能力及語用能力的定義之中。比如,要求學(xué)生會鑒賞語言藝術(shù)及社會價值,會跨文化交際,并具有文化差異的對比意識等。兩者不同之處在于:課標(biāo)突出的是文化意識的培養(yǎng),對比文化差異,對于不同文化,要求能取其精華,棄其糟粕;量表除了要求體現(xiàn)文化層面的認(rèn)知,還包含了對社會、文化評論中的多項思辨能力。課標(biāo)和量表對于英語學(xué)科的核心價值問題都未做深度闡述。

二、基于課標(biāo)和量表的考試研發(fā)模式

在研發(fā)英語考試項目時,量表和課標(biāo)都具有重要價值,但二者在知識、能力、素養(yǎng)及價值等方面的表述存在一定差異,因此很有必要從中提煉出一個考試研發(fā)的綜合模式。

關(guān)于英語測試,國外許多著名的考試項目,如托福(TOEFL)和雅思(IELTS),都是圍繞著英語“聽、說、讀、寫”四個方面進行操作的。與此不同,課標(biāo)主張英語學(xué)科應(yīng)該包括“聽、說、讀、寫、看”五個方面[17],其相應(yīng)的學(xué)科素養(yǎng)包括“語言能力、思維品質(zhì)、文化意識和學(xué)習(xí)能力”四個維度[17]。量表認(rèn)為,英語能力應(yīng)該包括“語言知識”、“理解能力”、“表達(dá)能力”、“語用能力”、“翻譯能力”和“使用策略”(言語策略)六個維度。另外,由于英語是中國人的外語,所以英語翻譯(口譯和筆譯)也必須作為重要的考察內(nèi)容。因此,比較理想的英語測試應(yīng)該包含“聽力”“口語”“閱讀”“寫作”“翻譯”五個部分或五個分測驗(課標(biāo)中“看”的內(nèi)容包含在“閱讀”之中)。鑒于量表關(guān)于語言知識和語言能力的定義具有更好的邏輯性和操作性,并覆蓋了課標(biāo)所羅列的所有學(xué)科素養(yǎng),因此,英語考試的內(nèi)容和結(jié)構(gòu)以“語言知識”“理解能力”“表達(dá)能力”“語用能力”“翻譯能力”“使用策略”六個維度為宜。于是,綜合課標(biāo)和量表可以得到一個新的英語測試研發(fā)模式(詳見圖1)。

圖1 基于課標(biāo)和量表的英語測試研發(fā)模式

其中,方框圖(聽、說、讀、寫、譯)代表觀測變量(測驗的部分或分測驗),橢圓圖(知識、理解、表達(dá)、語用、翻譯和策略)代表英語測試應(yīng)該覆蓋的各種潛在變量(量表中所定義的知識和能力維度),箭頭線表示測驗各部分或分測驗所覆蓋的知識和能力維度。此外,“語言知識”包含組構(gòu)知識(語法知識與語境或篇章知識)和語用知識(功能知識和社會語言學(xué)知識)兩個部分,表現(xiàn)為“語法”“語音系統(tǒng)和書寫形式”“詞匯”“句法”“篇章”“修辭或會話”“銜接”“組構(gòu)”共八個子維度。

根據(jù)圖1模式,在題目編寫時就必須明確所要測查知識和能力的具體要求。

例1: What does the underlined word “stumbles”in paragraph 2 refer to?

A.Improper pauses.

B.Bad manners.

C.Spelling mistakes.

D.Silly jokes.

該題為2019年高考英語全國卷I閱讀理解第25題,其正確選項是A,考查的是語法知識(詞匯)、語境或篇章知識(根據(jù)上下文猜詞)、閱讀理解能力及言語策略(元認(rèn)知策略—評估及認(rèn)知策略—推斷)??忌衾斫庥姓`,則很有可能會選C。因為短文中Chris是一個非英語母語的人,容易讓考生聯(lián)想到發(fā)音錯誤,進而影響他們根據(jù)語境篇章信息猜測生詞的水平。

例2: What can we infer about the author from the text?

A.He loves poetry.

B.He’s an editor.

C.He’s very ambitious.

D.He teaches reading.

該題為2020年高考英語全國卷I閱讀理解第27題,其正確選項是A,考查的是功能知識(探究)和閱讀理解能力(概括分析、演繹歸納、細(xì)節(jié)辨認(rèn)等能力)。

例3: 短文改錯題(2020年高考英語全國卷I短文改錯第一節(jié))。該題文本中共有10處語言錯誤,每句中最多有兩處。每處錯誤僅涉及一個單詞的增加、刪除或修改。其中,增加指的是在缺詞處加一個漏字符號(∧),并在其下面寫出該加的詞;刪除是把多余的詞用斜線()劃掉;修改是在錯的詞下劃一橫線,并在該詞下面寫出修改后的詞。以下為題目文本及其答案。

本題不僅考查了豐富的英語知識(語法、篇章、功能和社會語言知識),而且考查了多種英語能力(理解能力、表達(dá)能力、言語策略和語用能力)。具體地,本文依次考查的語言知識要點為:形容詞副詞(simply/simple)、分詞(frying/fried)、不定式(to多余和錯用)、鏈接詞(but和and)、名詞(chopstick/chopsticks)、介詞(on/off)、鏈接詞(unless與until/till)、冠詞(the)、代詞(us/me)的用法。該題所覆蓋的語言能力主要為遣詞造句、篇章結(jié)構(gòu)、邏輯連貫等方面的語言理解和表達(dá)能力,以及對話中所體現(xiàn)的符合人物身份、場合的語用能力和言語策略等。

三、新型考試研發(fā)模式的作用

顯然,基于課標(biāo)和量表的新型考試研發(fā)模式,在改進結(jié)果評價、強化過程評價、探索增值評價和健全綜合評價等方面具有很大價值,其具體作用簡述如下:

第一,它可以通過界定考試內(nèi)容和結(jié)構(gòu)的方式指導(dǎo)考試藍(lán)圖的設(shè)計。保障考試質(zhì)量的根本措施之一是在考試項目研發(fā)之前,確定考試內(nèi)容或結(jié)構(gòu),細(xì)化考試藍(lán)圖。根據(jù)圖1考試研發(fā)模式,英語考試的測驗藍(lán)圖可以設(shè)計成如表2所示的模式。

表2 基于英語課標(biāo)和量表的測驗藍(lán)圖設(shè)計(示例)/分

其中,表內(nèi)的數(shù)字可以為測驗的分值或分值比例或題目個數(shù),所有分測驗所覆蓋的語言知識滿分為100分(或100題),其他5種能力維度滿分100分(或100題)。

需要說明的是,所有題目都應(yīng)當(dāng)與語言知識、語用能力和言語策略有關(guān)。因此,在設(shè)計考試藍(lán)圖時,語言知識部分的分值(或題量)之和應(yīng)當(dāng)為滿分(或題目總數(shù)),而“理解能力、表達(dá)能力、語用能力、翻譯能力和言語策略”5個能力維度的總分或總題目總數(shù)可以小于或等于試卷總分或總題目個數(shù)。當(dāng)然,不同測試可以根據(jù)測試目的和條件有不同的題量或分值安排。

第二,它可以通過明確考試結(jié)構(gòu)提供效度研究的方向。根據(jù)國際考試行業(yè)的標(biāo)準(zhǔn),任何考試都需要提供有力的效度證據(jù)。比如,美國教育考試服務(wù)中心(Educational Testing Service,ETS)在其《ETS質(zhì)量與公平性準(zhǔn)則》[20]中,明確要求考試的效度研究可以遵循以下七個步驟:一是明確考試目的和受測總體(describing test purpose and population),包括確定計劃測查的知識、技能或其他潛在素質(zhì),考試用途,分?jǐn)?shù)的解讀計劃等;二是闡明效度證據(jù)選取的依據(jù)(providing rationale for the choice of evidence),包括評估各類效度證據(jù)和依據(jù)測試做某種決策的恰當(dāng)性和合理性,比如評估各種推論和決策的合理性,判斷錯用分?jǐn)?shù)的可能后果,比較類似考試的效度研究報告,考量樣本容量的影響,效度證據(jù)獲取的技術(shù)局限性,效標(biāo)選擇的合理性等;三是收集并存檔效度證據(jù)(obtaining and documenting the evidence);四是警示可能的考試誤用(warning of likely misuses);五是預(yù)判考試的負(fù)面后果(negative consequences);六是再度評價效度(reevaluating validity);七是協(xié)助用戶研究當(dāng)?shù)氐男Ф茸C據(jù)(helping users to develop local evidence)。顯然,課標(biāo)和量表關(guān)于測試內(nèi)容和結(jié)構(gòu)的界定,為效度研究尤其是其中的第一步和第二步研究工作,提供了關(guān)鍵性依據(jù)。特別地,量表中關(guān)于各種能力的行為特征的界定,可以直接用作效度研究過程中的效標(biāo)。

第三,它可以通過定義知識能力的深度和素材廣度拓寬考試命題的思路。課標(biāo)對各個年級學(xué)生所需要掌握的知識和能力給出了具體說明,量表則針對學(xué)生的英語能力發(fā)展水平提供了詳盡的描述。因此,在確定試題所涉及的知識層次和思維加工深度時,課標(biāo)和量表中相關(guān)等級的行為描述具有具體的指導(dǎo)價值。比如,假若需要研發(fā)一套初中升高中的英語試卷,各道題目的思維加工水平可以參照量表中各種能力維度的第二和第三等級描述,并在編寫題目的過程中具體注明相應(yīng)題目的知識深度(Depth of Knowledge,DOK)指數(shù)為“2”或“3”。假若需要編寫一套高考模擬試卷,則題目的知識深度DOK指數(shù)應(yīng)該為“3”或“4”,即相當(dāng)于量表中的第三級或第四級水平。

此外,由于量表針對每個能力維度都界定了“描述”“敘述”“說明”“指示”“論述”“互動”“言語策略”共七個方面的行為特點,因此,在準(zhǔn)備聽、說、讀、寫、譯的題目材料時,可以從上述七個方面入手。這不僅拓寬并規(guī)范了命題思路,而且要求在編輯考試試卷時,其組卷方案(form planner)應(yīng)當(dāng)盡可能兼顧上述七個方面的素材,確保每套試卷都能準(zhǔn)確反映考試藍(lán)圖的要求。

第四,它可以用其定義的能力等級驗證常模質(zhì)量和規(guī)范標(biāo)準(zhǔn)設(shè)定步驟,從而提升結(jié)果評價的水平??荚囇邪l(fā)的核心內(nèi)容之一是使得測驗分?jǐn)?shù)具有明確的含義。國際考試行業(yè)解決這類問題的方法主要有兩種,即研發(fā)測驗常模(norming)或?qū)嵤?biāo)準(zhǔn)設(shè)定(standard setting)。其中,常模研發(fā)的基本思路是:首先選擇一個恰當(dāng)?shù)膮⒄湛傮w(population),獲得該總體的正常表現(xiàn)數(shù)據(jù)(如均值和標(biāo)準(zhǔn)差等);然后將個體的分?jǐn)?shù)與總體的一般水平進行比較,以總體得分的標(biāo)準(zhǔn)差或其他指標(biāo)為單位,把每個個體的卷面原始分?jǐn)?shù)(raw score)都轉(zhuǎn)換成相對于總體的導(dǎo)出分?jǐn)?shù)(derived score)或具有穩(wěn)定度量系統(tǒng)的量表分?jǐn)?shù)(scale score),目的是可以確定個體在總體中的相對水平。這種分?jǐn)?shù)通常用于選拔性考試。由于這種分?jǐn)?shù)是參照正常群體一般水平轉(zhuǎn)換而來的,所以在考試行業(yè)稱之為常模參照分?jǐn)?shù)(norm-referenced score)。標(biāo)準(zhǔn)設(shè)定主要用于標(biāo)準(zhǔn)參照性考試(criterion-referenced test),其關(guān)注點是某些特定的分?jǐn)?shù)線,比如“合格”“良好”“優(yōu)秀”三條分?jǐn)?shù)線,目的是判斷某些學(xué)習(xí)項目的學(xué)習(xí)效果,而不在乎個體在群體中的相對水平。無論是常模研發(fā)還是標(biāo)準(zhǔn)設(shè)定,最為困難的任務(wù)是如何確定“合格”“良好”“優(yōu)秀”等各種分?jǐn)?shù)線。顯然,依據(jù)課標(biāo)關(guān)于各年級學(xué)生的知識能力要求和量表中關(guān)于各種能力等級的行為描述,很容易事后驗證測驗常模的質(zhì)量(若根據(jù)常模所導(dǎo)出的分?jǐn)?shù)與量表中所描述的對應(yīng)行為表現(xiàn)相符,則說明常模質(zhì)量好),更能事前為標(biāo)準(zhǔn)設(shè)定工作提供專家評判準(zhǔn)則,從而規(guī)范標(biāo)準(zhǔn)設(shè)定的過程和步驟。

第五,它可以通過豐富分?jǐn)?shù)報告內(nèi)容發(fā)揮考試的診斷效用。依據(jù)課標(biāo)和量表,測驗成績的報告可以變得豐富多彩,為學(xué)業(yè)成績的診斷提供精準(zhǔn)信息,從而改進結(jié)果評價,加強過程評價。表3是依據(jù)測驗藍(lán)圖(表2)所設(shè)計的某位考生的成績診斷報告(常模參照分?jǐn)?shù)因缺乏常模沒有報告)。

由表3很容易得到該考生的英語聽、說、讀、寫、譯的表現(xiàn)水平(圖2),以及其英語知識和能力水平(圖3),可以為改進教與學(xué)提供精準(zhǔn)信息。

由表3和圖2、圖3可知,該考生的英語水平一般,其英語知識的掌握率僅為75%。不過,其英語閱讀理解水平較高,掌握分?jǐn)?shù)為92.86%;其次是聽力水平,掌握分?jǐn)?shù)為75.00%;最弱是翻譯水平,掌握分?jǐn)?shù)僅為58.33%。從英語能力上看,表現(xiàn)最好的指標(biāo)為閱讀和聽力理解能力,掌握分?jǐn)?shù)為86.36%;最差的項目是英語使用策略,掌握分?jǐn)?shù)僅為64.00%。顯然,若英語考試的成績報告能夠達(dá)到表3和圖2、圖3的設(shè)計水平,教師和學(xué)生的收獲一定會很大,而且能避免因為單純根據(jù)考試總分進行年級或班級排名所造成的負(fù)面?zhèn)Α?/p>

表3 某考生英語測試成績診斷報告(樣例)

圖2 某考生英語聽、說、讀、寫、譯的測試成績

圖3 某考生英語知識和能力的測試成績

第六,它可以通過驗證試卷結(jié)構(gòu)等方法提供考試評價的框架。在取消考試大綱的條件下,如何評價考試質(zhì)量會是一個十分現(xiàn)實的問題。依據(jù)課標(biāo)和量表,比較容易明確試卷結(jié)構(gòu)和能力層次,這對于評價考試工作的測量效度很有價值。比如,運用高考評價體系、量表和課標(biāo)對最近兩年高考英語測試內(nèi)容效度的研究[21]就是一次有益的嘗試。

總之,高考評價體系、課標(biāo)和量表在考試研發(fā)等方面作用很大?;谡n標(biāo)和量表的英語測試研發(fā)模式,不僅在界定考試內(nèi)容、結(jié)構(gòu)和層次,指導(dǎo)考試藍(lán)圖的設(shè)計,指明效度證據(jù)的搜集方向,以及定義題目的深度和廣度,進而保障考試的有效性和公平性方面很有理論價值,而且在驗證常模質(zhì)量、規(guī)范標(biāo)準(zhǔn)設(shè)定步驟、豐富成績報告內(nèi)容,進而保障考試分?jǐn)?shù)的正確解讀和使用,發(fā)揮考試的診斷和評價作用,以及改進結(jié)果評價,強化過程評價,探索增值評價,健全綜合評價等方面具有十分重要的實用價值。

猜你喜歡
理解能力課標(biāo)維度
依托課標(biāo) 夯實基礎(chǔ) 精準(zhǔn)備考
高中生物新舊課標(biāo)比較——以實驗版課標(biāo)和2017版課標(biāo)為例
甘肅教育(2020年12期)2020-04-13 06:25:34
淺論詩中“史”識的四個維度
中華詩詞(2019年7期)2019-11-25 01:43:00
2016年全國課標(biāo)卷透視與2017年備考展示
基于課標(biāo)“教學(xué)評一致性”的教學(xué)設(shè)計
如何提高中學(xué)生的英語閱讀理解能力
大學(xué)生公民國際理解能力測評指標(biāo)體系構(gòu)建
光的維度
燈與照明(2016年4期)2016-06-05 09:01:45
“五個維度”解有機化學(xué)推斷題
運用紙質(zhì)地圖提高學(xué)生的理解能力(上)
会昌县| 高州市| 宁夏| 高唐县| 皮山县| 子长县| 绥宁县| 新巴尔虎右旗| 扶余县| 贵港市| 广灵县| 武汉市| 万盛区| 清涧县| 东丽区| 藁城市| 乡宁县| 沁源县| 武清区| 同仁县| 同心县| 伊宁县| 兴海县| 革吉县| 常宁市| 无锡市| 山阳县| 自治县| 台前县| 大洼县| 丹江口市| 文安县| 白银市| 龙泉市| 夹江县| 滦平县| 衡阳县| 攀枝花市| 泽州县| 兰溪市| 丽水市|