杜 娟 榮維東
當(dāng)今語文考試改革中的測試框架建構(gòu)
——2014年度語文論著評析之十二
杜 娟 榮維東
主持人簡介:王榮生,語文課程與教學(xué)論博士,上海師范大學(xué)學(xué)科教育研究所教授、博士生導(dǎo)師。
執(zhí)行主持簡介:胡根林,語文課程與教學(xué)論博士,上海市浦東教育發(fā)展研究院副研究員。
黨的十八大報(bào)告提出:“全面實(shí)施素質(zhì)教育,深化教育領(lǐng)域綜合改革,著力提高教育質(zhì)量,培養(yǎng)學(xué)生社會責(zé)任感、創(chuàng)新精神、實(shí)踐能力?!薄翱荚囍贫雀母锼婕暗牟粌H僅是高考制度,還涉及整個考試評價,包括從小學(xué)開始一直到博士研究生階段??荚嚫母锏暮诵氖窃谂ΡU瞎降那疤嵯拢蚱颇壳翱荚囋u價及人才選拔手段太過單一的局面。要逐步推行初高中學(xué)業(yè)水平考試和綜合素質(zhì)評價。”①在綱領(lǐng)性文件的指導(dǎo)下,語文考試制度改革也在逐步推進(jìn),我們不妨從2014年度《中國教育學(xué)刊》與《課程·教材·教法》刊登的三篇文章中透視“語文考試改革中的測試框架”的內(nèi)涵和發(fā)展方向。
【評析文章】葉麗新:《測試框架:語文考試改革的重要著眼點(diǎn)》,原載于《中國教育學(xué)刊》2014年第4期。
【原文提要】考試改革一般會從宏觀的制度改革和微觀的試題優(yōu)化兩個層面著手。然而,中觀層面的“測試框架”也是我們必須予以重視的,它是從課程目標(biāo)、評價理念到考試命題之間的一個有效的引導(dǎo)和過渡。新構(gòu)建的語文“測試框架”文件,應(yīng)該符合國際“測驗(yàn)框架”文件的屬性:對測量對象有清晰、立體的認(rèn)識;描述、引導(dǎo)“概念理解”與實(shí)際命題之間的關(guān)系;具有關(guān)于出題、評分等的重要技術(shù)指導(dǎo);基于考試結(jié)果不斷完善對測量對象的認(rèn)識?!皽y試框架”將是促進(jìn)教學(xué)和考試之間形成良性循環(huán)的關(guān)鍵。
(一)構(gòu)建新的語文測試框架的必要性
考試招生制度改革是教育領(lǐng)域綜合改革的突破口,也是家長、教師、學(xué)校、全社會最關(guān)心的事情?!吨袊逃龍?bào)》2014年10月1日第002版刊登了一篇新聞評論——《語文評分之爭要向考試改革求解》,透過湖南籍青年作家張一一將湖南教育考試院告上法庭的事件,揭示了現(xiàn)行高考作文評分標(biāo)準(zhǔn)的機(jī)械死板,使得原本最為主觀性的,最能考察學(xué)生語言能力的題目落入“套路”,從技術(shù)上說,類似于“八股文”。作者最后強(qiáng)調(diào),問題出在卷子上,高考模式、考試命題模式、教育模式等體制性因素存在很大的問題。同樣的,葉麗新在其文章開篇指出,考試改革是我國面臨的一個大難題,這個難題一般會從宏觀的制度改革和微觀的試題優(yōu)化兩個層面著手。然而,這兩個層面之間需要有一個關(guān)鍵性的引導(dǎo)和過渡,也就是作者指出的“測試框架”。對于概念界定時作者給出的三種表述:“測驗(yàn)框架、測評框架、測試框架”,是為了在不同語境中使用最恰當(dāng)?shù)恼f法。針對我國語文考試制度的實(shí)際情況,作者最終確定了“測試框架”這一說法。由美國教育研究協(xié)會(AmericanE ducationalResearchAssociation,AERA)、美國心理學(xué)協(xié)會(AmericanPsychologicalAssociation,APA)和全美教育測量學(xué)會 (NationalCouncilonMeasurementin Education,NCME)三家共同研制的《教育與心理測試標(biāo)準(zhǔn)》界定了“測驗(yàn)框架”的定義:“在構(gòu)念或內(nèi)容范疇的概念形成和研制評估構(gòu)念的測驗(yàn)之間常常會有微妙的相互作用發(fā)生。測驗(yàn)框架將這個構(gòu)念或內(nèi)容范疇如何體現(xiàn)在測驗(yàn)中具體描述出來。用于出題、制定評分規(guī)則和檢查試題特性的步驟常有助于闡明框架的內(nèi)容。”為了更直觀地表述這個概念的要點(diǎn),我們用下表進(jìn)行說明。
隨后,結(jié)合我國語文測試的實(shí)際情況和其他學(xué)者的已有研究,作者分析了語文測試研究和實(shí)踐中既有的相關(guān)“框架”、依據(jù)及其缺憾。她指出:在語文命題實(shí)踐中,顯性和隱性的“框架”有三類。其一,語文考試命題直接遵循的基本依據(jù)是“考試大綱”和“考試說明”,但目前考試大綱與新課程改革對語文知識與能力的要求和目標(biāo)匹配度不高,對測試的基本問題說明也不夠充分。其二,從語文課程標(biāo)準(zhǔn)的角度來說,應(yīng)依據(jù)國家課程標(biāo)準(zhǔn)進(jìn)行評估和考試命題。其局限性一是比考試的測量目標(biāo)和內(nèi)容領(lǐng)域?qū)挿旱枚啵侨狈σ痪S性,對各類知識或特點(diǎn)的描述不夠清晰。其三,長期潛在地影響著各級各類考試的宏觀框架是布盧姆的教育目標(biāo)分類學(xué)框架。然而這個框架很難指導(dǎo)命題實(shí)踐。此外,在其《能力測試點(diǎn)與試題之間的“張力”:國際閱讀測評項(xiàng)目的經(jīng)驗(yàn)》(《全球教育展望》,2014年第6期)一文中,作者從微觀層面指出:在大規(guī)??荚囍校瑢φZ文能力測試點(diǎn)的定位、理解偏于簡單化,語文能力測試點(diǎn)與試題之間的對接過于模式化,即每一次考試的考點(diǎn)似乎都很“明確”“穩(wěn)定”,但又似乎過于“明確”“穩(wěn)定”,考點(diǎn)的穩(wěn)定直接體現(xiàn)在題型和題目表達(dá)層面上②。
正是由于存在各種各樣的問題,而目前又有一個過渡性的“測評框架”,因此構(gòu)建新的語文測評框架是語文考試改革走向深化的必經(jīng)之路。
(二)國外測評框架的經(jīng)驗(yàn)及對我國的啟示
綜觀PISA、PIRLS、NAEP等國際閱讀測評項(xiàng)目,作者認(rèn)為,他們具有三個比較明顯的特征,值得我國的“考試大綱”借鑒。一是測驗(yàn)文件翔實(shí),能夠兼顧理念與技術(shù),即以扎實(shí)的理論研究為基礎(chǔ),也在實(shí)際操作中不斷完善。如上海中小學(xué)曾參與過的國際學(xué)生評價項(xiàng)目PISA(TheProgrammeforInternationalStudentAs sessment)就有兩份文件對其進(jìn)行說明,即測評框架和技術(shù)報(bào)告。我國語文測試中缺少的正是如三大測評項(xiàng)目中列出的對命題的理念、內(nèi)容、依據(jù)進(jìn)行細(xì)致入微的解釋和說明的 “測評框架”(AssessmentFramework)以及能將命題和后期數(shù)據(jù)分析方面的技術(shù)細(xì)節(jié)進(jìn)行詳細(xì)規(guī)定的“技術(shù)報(bào)告”(TechnicalReport)或“測評說明”(Specifications)。二是“概念框架”清晰,即測量的“構(gòu)念”明確?;径际菑拈喿x的目的、閱讀的情境(或環(huán)境)、文本類型、認(rèn)知目標(biāo)(或過程)幾個基本要素展開的。三是化抽象為具體命題實(shí)踐,落實(shí)概念框架。如NAEP評價框架,在層層理論解釋和量的規(guī)定的基礎(chǔ)上,測評項(xiàng)目中文本的選擇范圍和特定文本命題的指向相對清晰。作者強(qiáng)調(diào),在國際測評項(xiàng)目中,我們可以看到,所有的概念、分類等都能對命題過程和結(jié)果產(chǎn)生直接和真實(shí)的影響,從設(shè)定測量目標(biāo)到編制試題的過程,認(rèn)知目標(biāo)闡釋立體,與試題之間內(nèi)在的準(zhǔn)確對應(yīng),試題本身的表達(dá)與認(rèn)知目標(biāo)的表達(dá)沒有固定的對應(yīng)模式。相比之下,我國既有的“考試大綱”則不夠立體,認(rèn)知目標(biāo)與試題之間缺少“張力”。
(三)構(gòu)建新的語文測試框架的實(shí)施路徑
如何構(gòu)建新的語文測評框架呢?作者直言我國與國外語言、課程、教育目標(biāo)、測評目的等方面存在諸多差異,因而在分析了國際閱讀“測評框架”文件的可借鑒性之后,作者明確我們需要的不是直接“套用”過來,而是依據(jù)我國語文測試實(shí)際存在的問題重新構(gòu)建適應(yīng)我國考試招生改革制度的新的“測試框架”。她提出在符合新課程改革和符合測量與評價規(guī)范的基礎(chǔ)上,我們至少可以從三個層面學(xué)習(xí)國外的“測評框架”,分別是從基層定位對全新的測驗(yàn)文件的認(rèn)識,從橫向?qū)用娼∪珜y量對象的認(rèn)識,在縱向?qū)用嬉苿永砟畹矫}實(shí)踐的轉(zhuǎn)化,并依次對這三個層次從不同角度進(jìn)行闡述。
在基本定位上,新的語文測試框架是指導(dǎo)命題的中觀框架和依據(jù)。它是位于教育目標(biāo)分類學(xué)和課程標(biāo)準(zhǔn)下一層級的專門的命題依據(jù);能夠引導(dǎo)教學(xué)實(shí)踐;內(nèi)容也更加立體、豐富,能完善或更新目前的“考試大綱”“考試說明”。
在橫向構(gòu)建上,新的語文測試框架作出了對測量對象(語文素養(yǎng)以及可考察的子要素)符合測試語境的內(nèi)涵和外延的認(rèn)識、界定。它以對語文素養(yǎng)的合理理解為基礎(chǔ),且勾勒出語文測試需要考慮的相關(guān)維度;相對完滿、立體地揭示原本抽象的測試“構(gòu)念”,對后續(xù)命題具有指導(dǎo)意義;適用于測試評估,是可操作的,利于命題者分類處理材料和試題,也利于后期數(shù)據(jù)統(tǒng)計(jì)和結(jié)果解釋。
在縱向構(gòu)建上,新的語文測試框架能夠推動理念到命題實(shí)踐的轉(zhuǎn)化,勾勒出“測試途徑”和設(shè)計(jì)題型示例。它保證了命題的彈性空間,由此弱化了當(dāng)前的考題
模式化及由此導(dǎo)致的應(yīng)試風(fēng)氣;能夠矯正考試與教學(xué)之間的關(guān)系,解決從“構(gòu)念”到具體“測試工具”之間的過渡性指導(dǎo);并且?guī)椭痪€教師真正深刻理解語文素養(yǎng),探尋各種具體的語文能力的培養(yǎng)途徑。
【評析文章】張燕華,鄭國民,關(guān)惠文:《中學(xué)生語文學(xué)科能力表現(xiàn)——基于Rasch模型的語文測試評價》,原載于《課程·教材·教法》2014年第11期。
【原文提要】基于語文學(xué)科能力的測試評價既是了解學(xué)生學(xué)業(yè)水平的途徑,同時也可以形成測試中的“反撥效應(yīng)”,對語文課堂教學(xué)產(chǎn)生一定的影響。以能力考察為核心的語文測試評價框架包括學(xué)習(xí)理解、實(shí)踐應(yīng)用和創(chuàng)新遷移三個能力層級。在建構(gòu)中學(xué)生語文學(xué)科能力構(gòu)成體系的基礎(chǔ)上,對北京市兩個區(qū)的七年級至十一年級共4322名中學(xué)生的語文能力進(jìn)行測試,運(yùn)用Rasch模型進(jìn)行分析與討論,研究結(jié)果發(fā)現(xiàn):從學(xué)習(xí)理解能力來說,中學(xué)生尤其應(yīng)該加強(qiáng)分析概括能力和領(lǐng)會理解能力的培養(yǎng);從實(shí)踐應(yīng)用能力來說,語文教學(xué)應(yīng)該關(guān)注中學(xué)生應(yīng)用交際能力的培養(yǎng)。針對不同的文類,應(yīng)該培養(yǎng)學(xué)生的文類意識;從創(chuàng)新遷移能力來說,應(yīng)該重視培養(yǎng)中學(xué)生的寫作能力,尤其在內(nèi)容創(chuàng)新、表達(dá)真情實(shí)感等方面更需要加強(qiáng)。
《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010-2020年)》提出了“堅(jiān)持能力為重”的指導(dǎo)思想③。三十多年來,我國把各門課程的學(xué)科能力表現(xiàn)統(tǒng)統(tǒng)歸結(jié)為“分析問題、解決問題的能力”,并作為“雙基”的重要一維來看待,顯然缺乏對學(xué)科能力表現(xiàn)的深入剖析,沒有“基本技能”的具體指標(biāo)和要求,從而導(dǎo)致教學(xué)過程中“基礎(chǔ)知識”的教學(xué)十分系統(tǒng)和扎實(shí),但“基本技能”的培養(yǎng)難以系統(tǒng)地落實(shí)④。因而通過學(xué)科學(xué)習(xí),切實(shí)促進(jìn)學(xué)生能力的發(fā)展,是當(dāng)前深化基礎(chǔ)教育課程改革、全面提高教育質(zhì)量的關(guān)鍵點(diǎn)。作者們抓住了這一“關(guān)鍵點(diǎn)”,認(rèn)為以能力考察為核心的語文測試評價框架包括學(xué)習(xí)理解、實(shí)踐應(yīng)用和創(chuàng)新遷移三個能力層級。在這個基礎(chǔ)上,語文測試試卷以主題為內(nèi)容,分為文化底蘊(yùn)(優(yōu)秀詩文、經(jīng)典名著和名言警句),閱讀(文言文、實(shí)用類、文學(xué)類)和寫作(任務(wù)型表達(dá)和個性化表達(dá))。這個結(jié)論的得出得益于運(yùn)用Rasch模型(Rasch模型是丹麥數(shù)學(xué)家和統(tǒng)計(jì)學(xué)家GeorgRasch在丹麥政府的委托之下開始研究現(xiàn)代考試?yán)碚摚瑥亩岢龅囊粋€數(shù)學(xué)公式,它是基于項(xiàng)目反應(yīng)模型提出的一個潛在特征模型。Rasch模型通過個體在題目上的表現(xiàn)——通常表示為原始分?jǐn)?shù)——來測量不可直接觀察的、潛在的變量,它是一個理性化的數(shù)學(xué)模型。)對北京市兩個區(qū)的七年級至十一年級共4322名中學(xué)生的語文能力測試結(jié)果的分析與討論,此次測試評價主要是運(yùn)用Rasch模型分析試題的難度和學(xué)生平均得分率兩方面的內(nèi)容。
這篇文章的主旨是語文測試要“以能力考查為核心”。依據(jù)這個主旨,作者指出語文測試評價框架的建立主要參照了認(rèn)知理論、語言學(xué)理論、各類測試評價標(biāo)準(zhǔn)及課程文件。學(xué)科能力表現(xiàn)大致可分為基礎(chǔ)性學(xué)科能力表現(xiàn)、知識性學(xué)科能力表現(xiàn)、學(xué)科素養(yǎng)性能力表現(xiàn)等不同類型⑤。具體到語文學(xué)科,作者認(rèn)為中學(xué)語文學(xué)科能力構(gòu)成體系包括三個遞進(jìn)的能力層級,即基礎(chǔ)能力——學(xué)習(xí)理解能力(代號A)、中級能力——實(shí)踐應(yīng)用能力(代號B)和最高能力——創(chuàng)新遷移能力(代號C)。每一個能力層級下又有幾個逐級遞進(jìn)的分層。語文學(xué)科學(xué)習(xí)理解(A)包括觀察注意(A1)、記憶(A2)、信息提?。ˋ3)、分析概括(A4)和領(lǐng)會理解(A5),強(qiáng)調(diào)多角
度地觀察生活和積累等能力;實(shí)踐應(yīng)用能力(B)包括應(yīng)用交際(B1)、解釋推斷(B2)、解決問題(B3)、策略應(yīng)用(B4),強(qiáng)調(diào)根據(jù)不同目的和場合表達(dá)觀點(diǎn),能解釋現(xiàn)象,解決問題等能力;創(chuàng)新遷移能力(C)包括發(fā)散創(chuàng)造(C1)、批判賞析(C2)、內(nèi)化完善(C3),強(qiáng)調(diào)加深對世界的認(rèn)識思考,能批判性地評價多元文化,完善自身等能力。作者認(rèn)為,這樣的評價框架不僅能打破各個評價內(nèi)容之間的界限,還能打破年級限制即考察不同年級的學(xué)生在某一能級的水平,從而為教學(xué)診斷提供參考。
【評析文章】潘涌:《高考作文的深度轉(zhuǎn)向:接軌國際“學(xué)術(shù)能力導(dǎo)向”——評年高考作文的基本特點(diǎn)》,原載于《中國教育學(xué)刊》2014年第9期。
【原文提要】通過評析2014年我國各地高考作文,從“全命題”到“探索話題和開放材料”的蛻變呈現(xiàn)出了高考作文題型所發(fā)生的曲折而顯著的進(jìn)步,特點(diǎn)之一是開放生活哲學(xué)的空間;特點(diǎn)之二是通過“思想評論體”來釋放考生的“自由評論力”。認(rèn)為我國高考作文在深化改革的價值取向下已經(jīng)開始與國際高考作文“學(xué)術(shù)能力導(dǎo)向”相接軌,完全順應(yīng)全球化背景下“語言強(qiáng)國”的戰(zhàn)略需要。國內(nèi)高考作文命題研制上的進(jìn)步趨勢,要言之即引導(dǎo)考生釋放“思想力”和“評論力”。這種新趨勢符合國際語言考試和語言教育的價值導(dǎo)向——“寫作即交流”。
如果說,第一篇闡述建立新的語文測試框架的必要性,以及應(yīng)該建立什么樣的測評框架;第二篇文章則是基于數(shù)據(jù)分析得出語文測評框架應(yīng)該以考察學(xué)生學(xué)科能力為宗旨。那么接下來要評析的文章講的就是將以上理念應(yīng)用到實(shí)際測試中——如何進(jìn)行高考作文測試。文章中作者的基本觀點(diǎn)是高考作文測試要接軌國際“學(xué)術(shù)能力導(dǎo)向”,即以美國學(xué)術(shù)能力評估測試SAT(ScholasticAssessmentTest)考試中“寫作”科目的測試文體“Essay”為借鑒對象,認(rèn)為高考作文測試的深度轉(zhuǎn)向是要引導(dǎo)學(xué)生的“思想力”和“評論力”。
作者分析了2014年21份高考作文試卷,認(rèn)為2014年高考作文命題打破了長期以來過度預(yù)制、過度封閉、過度壟斷的指令性課程束縛,突破了單一、狹隘、指向過于明確的形式命題,徹底告別了各種各樣的“命題”,迎來一個思維空間開放、價值導(dǎo)向多元的“后命題時代”。同時,作者指出,2014年高考作文的話題特色是“接軌生活”,采用“探索話題”或“開放材料”的形式,引導(dǎo)學(xué)生進(jìn)行“思想評論體”的獨(dú)立自由創(chuàng)作。隨后,透過分析Essay的話題及其材料的三個特征——爭議性、思辨性、主觀性,及其文體結(jié)構(gòu)特征——論和評,作者認(rèn)為完成Essay的過程實(shí)際上是一個表達(dá)的過程。這與 2011年美國國家教育進(jìn)展評估委員會(NAEP,2011)寫作評定框架強(qiáng)調(diào)“寫作即交流”的觀點(diǎn)類似,NAEP將寫作活動界定為交流活動⑥,即作者與目標(biāo)讀者之間的交流,主要針對三種寫作能力進(jìn)行評定,即勸說能力、解釋能力和傳達(dá)能力。具體能力要素體現(xiàn)的方面如下:第一,在一個觀念、視角多元化的復(fù)雜社會里,學(xué)生需要清晰地、富有邏輯地表達(dá)自己的觀點(diǎn),以說服他人。因此,2011年美國國家教育進(jìn)展評估委員會測試的是學(xué)生用寫作進(jìn)行說服的能力,目的是要改變讀者觀點(diǎn),影響讀者行為。第二,在信息時代,傳遞信息和概念的能力至關(guān)重要。2011年,NAEP寫作評定框架評估了學(xué)生的解釋能力,目的是拓展讀者的理解力。第三,世界各國之間聯(lián)系日益密切,通過寫作不僅可以探索和分享個人經(jīng)歷,而且可以實(shí)現(xiàn)全球共享。2011年,NAEP寫作評定框架評估了學(xué)生的表達(dá)能力,即敘述或撰寫故事的能力,目的是與讀者進(jìn)行交流。
綜上所述,我們認(rèn)為語文考試改革要實(shí)現(xiàn)深度轉(zhuǎn)向,其測試框架要以測評語言文字運(yùn)用能力(語用能力)為核心進(jìn)行構(gòu)建,也是第二篇文章中說的“從實(shí)踐應(yīng)用能力來說,語文教學(xué)應(yīng)該關(guān)注中學(xué)生應(yīng)用交際能力的培養(yǎng)”,“語言學(xué)理論對于建構(gòu)評價框架的啟示作用在于強(qiáng)調(diào)語言學(xué)習(xí)的情境化及其交際運(yùn)用的功能,并且強(qiáng)調(diào)語言的學(xué)習(xí)不能脫離生活和社會實(shí)際?!痹僬撸隧?xiàng)能力也符合《義務(wù)教育語文課程標(biāo)準(zhǔn)(2011年版)》指出的“學(xué)科特性”:語文課程是一門學(xué)習(xí)語言文字運(yùn)用的綜合性、實(shí)踐性課程。
①劉利民:《中學(xué)教育綜合改革與校長的使命——在第四屆中國中學(xué)校長大會上的講話》,《中國教育學(xué)刊》,2014年第6期。
②葉麗新:《能力測試點(diǎn)與試題之間的 “張力”:國際閱讀測評項(xiàng)目的經(jīng)驗(yàn)》,《全球教育展望》,2014年第6期。
③中華人民共和國國務(wù)院:《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010-2020)》,2010年版。
④⑤郭元祥,馬友平:《學(xué)科能力表現(xiàn):意義、要素與類型》,《教育發(fā)展研究》,2015年第15-16期。
⑥李英杰:《美國NAEP(2011)寫作評價框架評介》,《語文建設(shè)》,2012年第9期。
[作者通聯(lián):西南大學(xué)文學(xué)院]