李清華
教育評估既可以監(jiān)測教育教學(xué)水平,還可以評價學(xué)生的學(xué)習(xí),對學(xué)習(xí)提供診斷性信息。從評估與學(xué)習(xí)的關(guān)系來看,教育評估可分為三種:對學(xué)習(xí)的評估(assessment of learning,簡稱AoL)、為學(xué)習(xí)的評估/學(xué)習(xí)性評估(assessmentforlearning,簡稱 AfL)、作為學(xué)習(xí)的評估(assessment as learning,簡稱AaL)(Earl,2003)?!皩W(xué)習(xí)的評估”在單元、課程或?qū)W期結(jié)束時進行,相當于總結(jié)性評估(SummativeAssessment),通常是根據(jù)評估結(jié)果(考試分數(shù)或等級)作出分班、提升、證書頒發(fā)等決定。而“促進學(xué)習(xí)的評估”的重心從學(xué)習(xí)結(jié)果轉(zhuǎn)移到學(xué)習(xí)過程,目的是用評估結(jié)果為下階段的學(xué)習(xí)提供必要的指導(dǎo)。在這種評估中,教師借助于學(xué)生的“學(xué)習(xí)成果”(artifacts),跟蹤學(xué)生學(xué)習(xí)發(fā)展的過程,對學(xué)生提供及時的個性化反饋。在“作為學(xué)習(xí)的評估”中,學(xué)生既是評估的對象又是評估的主人,評估真正融入教學(xué)與學(xué)習(xí)之中。在當今世界的教育評估中,最常見的是第一種評估,第二種評估正在迅速發(fā)展,而第三種評估則初露端倪(Earl,2003)。
形成性評估(FormativeAssessment)具有巨大的促學(xué)潛力,也被稱為“學(xué)習(xí)性評估”(Berry,2008;Berry&Adamson,2011;Broadfoot&Black,2004;Stiggins,2002,2005)或“促學(xué)評估”(Huhta,2008)。自從Black&Wiliam(1998)關(guān)于形成性評估的綜述發(fā)表以來,形成性評估實踐在全世界的教育評估中迅速發(fā)展。但是,形成性評估的理論構(gòu)建一直沒有受到足夠的重視。這是形成性評估研究中存在的主要問題之一(Bennett,2011)。一些學(xué)者提出的形成性評估理論(如,Black&Wiliam2005,2009)也僅僅是從操作實踐的層面來勾畫評估實施的步驟和策略,似乎形成性評估不過是一些評估技巧與方法,沒有什么理論。本文擬追溯教育評估范式的演變,評述現(xiàn)有形成性評估理論的研究,并據(jù)此提出形成性評估的理論框架,以指導(dǎo)形成性評估實踐和研究。
一些學(xué)者從哲學(xué)范式的視角來審視教育評估的變革?!胺妒健币辉~由美國著名科學(xué)哲學(xué)家?guī)於鳎↘uhn)于1962年提出,在自然科學(xué)與社會科學(xué)研究中得到了廣泛的應(yīng)用。范式是一套相互關(guān)聯(lián)的概念,它提供了人們觀察和理解特定問題和活動的框架,決定了人們的研究目的、解釋觀察到的現(xiàn)象以及解決出現(xiàn)問題的方式。當舊范式不能解決新出現(xiàn)的問題時,范式便要發(fā)生變革。而教育評估范式是指,人們以某種特定的思維方式,對教育評估的理論與技術(shù)進行研究,進而所形成的一系列基本規(guī)范。在此基礎(chǔ)上建立起來一套能夠表征人們對教育價值有某種特定認識的理論與技術(shù)框架,用以指導(dǎo)人們進行揭示教育價值和建構(gòu)價值世界的認識活動。正如瑞典教育學(xué)家胡森(Husen,1989)指出的那樣,自教育學(xué)這門學(xué)科形成之日起,它本身就存在著兩種范式之間的沖突:一是模仿自然科學(xué),強調(diào)適合于數(shù)學(xué)工具分析的、經(jīng)驗的、可定量化的觀察,研究任務(wù)在于確定因果關(guān)系,并做出解釋,因其哲學(xué)思想來自于實證主義,故被稱為“實證主義范式”;而另一類范式是從人文科學(xué)推衍而來的,所注重的是整體和定性的信息以及說明的方法,可以稱之為“后實證主義范式”。20世紀,很多領(lǐng)域都經(jīng)歷了“實證主義范式”到“后實證主義范式”的演變,二者的對照詳見表1(Jacobs&Farrell,2001)。
表1 “實證主義范式”與“后實證主義范式”的對比
Gipps(1994:158)指出,“評估正處于范式演變之中,評估實踐從心理計量學(xué)走向教育評估,從測試文化(testing culture) 走向評估文化(assessmentculture)”。對于評估范式的變化,有的學(xué)者主張二元論,如,Berlak等(1992)的“心理計量范式”(psychometricparadigm)與“情景化范式”(contextual paradigm),Jacobs&Farrell(2001)提出的“實證主義范式”與“后實證主義范式”;更多人認為存在三個階段,如Shepard(2000,2006)的“科學(xué)測量范式”、“分裂型范式”和“社會建構(gòu)主義理論框架下的課堂評估范式”,Gipps(1994)的“心理計量范式”、“教育測量范式”(educational measurement)和“教育評估范式”(educational assessment),Mabry(1999)的“心理計量范式”、“情景化范式”和“個人化范式”(personalized paradigm)。
下面簡要討論Mabry(1999)、Shepard(2000,2006)、Jacobs&Farrell(2001)的觀點。
1.“心理計量范式”、“情景化范式”和“個人化范式”
Mabry(1999)從評估策略、關(guān)注的焦點、實施的情景、題型、評估人、形成性或總結(jié)性、自我評估等方面總結(jié)了“心理計量范式”、“情景化范式”和“個人化范式”的特點,并指出各自的優(yōu)點與不足,詳見表2。
表2 心理計量范式、情景化范式和個人化范式的比較
2.“科學(xué)測量范式”、“分裂型范式”和“社會建構(gòu)主義理論框架下的課堂評估范式”
Shepard(2000,2001)根據(jù)學(xué)習(xí)、教學(xué)與評估關(guān)系的演變及其理論基礎(chǔ),提出了教育評估的三種范式:(1)科學(xué)測量范式(1900s~2000+):20世紀占統(tǒng)治地位,延續(xù)至今;(2)分裂型(dissolution)范式(1980s~2000+):教學(xué)思想與測試思想分裂,盛行于當今;(3)社會建構(gòu)主義理論框架下的課堂評估范式(1990s~2000+):處于萌芽狀態(tài)。
在科學(xué)測量范式中,教學(xué)與測試主要受連接主義(associationist)和行為主義(behaviorist)學(xué)習(xí)理論的影響,其原則包括:
(1)學(xué)習(xí)是“刺激—反應(yīng)”的過程;
(2)學(xué)習(xí)是零散知識點的積累過程;
(3)學(xué)習(xí)的內(nèi)容有嚴格的先后順序和高低層次;
(4)每個目標應(yīng)明示地傳授,目標之間很少存在遷移;
(5)為保證學(xué)習(xí)效果,采取“測試—教學(xué)—測試”的循環(huán)流程;
(6)學(xué)習(xí)動機來自于對諸多小進步的肯定。
在這些原則指導(dǎo)下,教師擔(dān)心對學(xué)生學(xué)習(xí)整體評價的“主觀性”,會盡可能保證課堂評估的“客觀性”,所以傾向于使用以多項選擇為代表的所謂“客觀測試”。傳統(tǒng)范式所倡導(dǎo)的“科學(xué)測量”至今仍對教師的評估思想及教學(xué)實踐具有很大影響。
20世紀80年代以來出現(xiàn)的“分裂型范式”的主要特點是測試與教學(xué)的錯位:外部測試完全脫離教學(xué),而課堂評估也模仿外部測試,與日常教學(xué)脫節(jié)。造成這種局面的根本原因是,一方面建構(gòu)主義教學(xué)思想廣為大眾接受,另一方面語言測試仍受“科學(xué)測量”的禁錮。交際教學(xué)思想促進了教學(xué)實踐的改革,但配套的評估體系并未建立起來。滯后的評估范式阻礙了語言教學(xué)的發(fā)展。
20世紀90年代以來逐漸發(fā)展的“社會建構(gòu)主義理論框架下的課堂評估范式”所依據(jù)的學(xué)習(xí)理論和教學(xué)思想促使人們把關(guān)注的焦點轉(zhuǎn)移到課堂之中。
認知心理學(xué)和社會建構(gòu)主義的學(xué)習(xí)理論主要強調(diào)以下幾點:
(1)思維能力是在特定的社會和文化環(huán)境中發(fā)展起來的;
(2)學(xué)習(xí)者的知識建構(gòu)與理解是在特定的社會情景中發(fā)生的;
(3)新的學(xué)習(xí)建立在已有的知識之上;
(4)學(xué)習(xí)過程涉及元認知(meta-cognition)能力(即,對學(xué)習(xí)和思維進行自我調(diào)整的能力);
(5)只有“深刻理解”(deep understanding)的知識才能遷移并運用到新的場合;
(6)認知行為表現(xiàn)取決于情感傾向和個性認同。
基于上述學(xué)習(xí)理論的社會建構(gòu)主義課堂教學(xué)理念及評估原則詳見表3。
表3 社會建構(gòu)主義的課堂教學(xué)理念及評估原則
總之,新范式下的學(xué)習(xí)是主動反思的知識構(gòu)建,教學(xué)以學(xué)習(xí)為中心,評估則是基于行為的情景化的“為教與學(xué)服務(wù)的評估”(Birenbaum,2003)。
3.后實證主義范式
近半個世紀以來,在外/二語教育領(lǐng)域的“后實證主義范式”表現(xiàn)為從以行為主義心理學(xué)和結(jié)構(gòu)主義語言學(xué)為主導(dǎo)轉(zhuǎn)變?yōu)橐哉J知心理學(xué)、社會認知心理學(xué)和功能語言學(xué)為主導(dǎo),主要原則如下(Jacobs&Farrell,2001):
(1)更重視學(xué)習(xí)者的角色,教學(xué)從以教師為中心轉(zhuǎn)變?yōu)橐詫W(xué)生為中心;
(2)更重視學(xué)習(xí)過程,教學(xué)從以結(jié)果為導(dǎo)向轉(zhuǎn)變?yōu)橐赃^程為導(dǎo)向;
(3)更重視學(xué)習(xí)的社會屬性,不把學(xué)生看成孤立的與社會情境無關(guān)的個體;
(4)更重視學(xué)習(xí)者之間的差異性,注重研究個體差異,個性差異不應(yīng)看作學(xué)習(xí)的障礙,而應(yīng)受到認可和欣賞;
(5)更重視教室內(nèi)的教學(xué)活動參與者的看法和情境的獨特性,而不僅僅關(guān)注外部專家的看法,更重視質(zhì)性研究;
(6)把學(xué)校及其外部世界結(jié)合起來研究,促進整體學(xué)習(xí)的發(fā)展;
(7)幫助學(xué)生理解學(xué)習(xí)目標并形成自己的學(xué)習(xí)目標;
(8)教學(xué)應(yīng)從總體到部分,而不是從部分到總體;
(9)強調(diào)“意義”的重要性,而不是僅僅死記硬背的“形式”;
(10)主張終身學(xué)習(xí)的學(xué)習(xí)觀,反對為考試而學(xué)習(xí)。
因此,在外/二語教學(xué)中,應(yīng)實現(xiàn)八個方面的轉(zhuǎn)變:
(1)培養(yǎng)學(xué)生的自主學(xué)習(xí)能力(learner autonomy),強調(diào)內(nèi)部動機和自我評估;
(2)倡導(dǎo)合作學(xué)習(xí);
(3)加強課程整合,實施內(nèi)容為導(dǎo)向的教學(xué);
(4)重視意義;
(5)重視多樣性,表現(xiàn)在學(xué)習(xí)風(fēng)格、學(xué)習(xí)策略等方面;
(6)重視高級思維能力,如,批判性思維、創(chuàng)造性;
(7)實施非傳統(tǒng)評估,如,真實性評估、同伴評估、檔案評估(portfolio)等;
(8)教師的角色是學(xué)習(xí)的合作者。
這八個方面是互相聯(lián)系在一起的,相互依賴,相互支撐。僅僅追求某些方面而忽視其他因素,都難以成功。所以,新評估范式的建立和實施是一項系統(tǒng)工程。
總之,盡管學(xué)者們使用的名稱不同,但范式之分的實質(zhì)基本相同。Shepard的第二種范式其實是一種過渡狀態(tài),其第一種范式與“實證主義范式”一致,第三種范式則與“后實證主義范式”和“個人化范式”基本吻合。上述三種范式的出現(xiàn)雖有先后,但當今教育評估中三種范式并存,尤其是第三種范式尚處于萌芽狀態(tài),它所倡導(dǎo)的課堂評估尚未得到應(yīng)有的重視(Shepard,2000,2006)。在評估范式的演變浪潮中,形成性評估的角色越來越清晰,在第二和第三范式中均占有重要地位。世界范圍的教育評估正經(jīng)歷著范式的變革:從心理測量模型向著更廣泛的教育評價模型,從測試文化向著評估文化演變。形成性評估思想正是順應(yīng)了這一潮流,應(yīng)當在這場變革中扮演更重要的角色。
Pryor&Crossouard(2008)基于他們的研究和社會文化理論,提出了形成性評估的社會文化模式(A socio-cultural model of formative assessment)(詳見圖1)。
圖1 形成性評估的社會文化模式
在圖1上部的六邊形表示形成性評估的循環(huán)過程。六邊形內(nèi)的“溝通”是指,師生之間對評估任務(wù)和質(zhì)量評價標準的討論——這一活動在評估過程中占有核心地位,其他三種活動——提問(教師對學(xué)生既可以進行以測量或測試為目的的提問,也可以給予“支架類”的幫助式提問)、觀察(教師觀察學(xué)生的學(xué)習(xí)過程和結(jié)果)、反饋和判斷(教師對學(xué)生的表現(xiàn)提出反饋信息和評價意見),均以此為出發(fā)點和落腳點。右側(cè)的箭頭表示,學(xué)生在與教師或同伴的合作活動中完成自己的學(xué)習(xí)任務(wù)。
圖1下方的六邊形內(nèi)容與上方的內(nèi)容相同,這是新一輪評估的過程。右側(cè)的箭頭表示,學(xué)生通過“元語境反思”(metacontextualreflection)可能會改變自己的“身份”(identity)——修改已經(jīng)完成的學(xué)習(xí)成果。
兩個六邊形之間用波浪形的箭頭連接是為了突出形成性評估過程的動態(tài)性和循環(huán)性。最右邊的“元語境反思”是指,在師生之間對評估任務(wù)和質(zhì)量評價標準的討論中不僅可以使學(xué)生更加清楚評估任務(wù)和評價標準,而且可以調(diào)整預(yù)設(shè)的評價標準,修改已經(jīng)完成的學(xué)習(xí)成果。
在這一評估模式中,Pryor&Crossouard充分強調(diào)了社會和文化因素的重要性。形成性評估發(fā)生在教室這一微觀的情景中,但也會受到學(xué)校、地區(qū)和國家這樣宏觀的情景因素的影響。師生之間、學(xué)生之間的溝通是權(quán)力的博弈和身份的認知與重構(gòu)。應(yīng)當指出的是,這一社會文化模式?jīng)]有涉及形成性評估的教育學(xué)和測量學(xué)的理論基礎(chǔ)。
綜合上文所述,我們認為有必要在社會文化的大環(huán)境下構(gòu)建全面的形成性評估理論。形成性評估理論應(yīng)包括主要的原則和實施的策略(Bennett,2011)。Shepard(2006:640)強調(diào),“理想的新課堂評估理論必須建立在當代認知和社會文化學(xué)習(xí)理論之上”。學(xué)習(xí)理論是形成性評估的理論基礎(chǔ)之一。除此之外,還應(yīng)當有教育學(xué)理論、心理學(xué)理論、測量學(xué)理論等。形成性評估的操作框架應(yīng)當基于形成性評估理論結(jié)合當時當?shù)卦u估的具體條件來設(shè)計。(詳見圖2)
形成性評估理論包括的基本原則如下:
(1)評估的目的:形成性評估主要是為促進學(xué)生知識和能力提高提供持續(xù)的反饋,也可以對學(xué)生的知識和能力做全面的衡量,評估的結(jié)果為教師改進教學(xué)提供依據(jù)。
(2)評估實施的時間:在教學(xué)過程中進行。
(3)學(xué)生的角色:鼓勵學(xué)生參與評估過程,決定評估的內(nèi)容和評分標準,學(xué)生具有內(nèi)在動機,以掌握學(xué)習(xí)目標為目的。
(4)教師的角色:讓學(xué)生清楚了解具體的學(xué)習(xí)目標和評估目標,與學(xué)生溝通決定評估的內(nèi)容和評分標準;及時向?qū)W生提供非評價性的、具體的、與學(xué)習(xí)目標相關(guān)的反饋,為學(xué)生提供修改和完善學(xué)習(xí)任務(wù)以及加深理解的機會,根據(jù)評估結(jié)果做出教學(xué)調(diào)整。
(5)所衡量的認知能力:涉及深層次的理解、應(yīng)用、推理等能力。
(6)評估程序:可以根據(jù)實際情況調(diào)整。
(7)評估方法:形成性評估一般采用非正式的方法,如,自我評估、同伴評估、檔案評估、課堂觀察、作業(yè)等。
(8)評估的技術(shù)質(zhì)量:評估在多大程度上促進了學(xué)生知識和能力的提高?
形成性評估的操作框架可以多樣化。這里介紹Rea-Dickins(2001)提出的“課堂評估的過程和策略”框架。操作過程分為四步,即,計劃——實施——調(diào)整——記錄和發(fā)布。從第一步到第四步并不是嚴格的線性先后順序。在第二步的實施中獲得的信息可能促使“計劃”的修正;第三步的“調(diào)整”中包含修改教師的教學(xué)計劃和學(xué)生的學(xué)習(xí)計劃,更是直接為“計劃”的完善提供信息。至于第四步的評估結(jié)果發(fā)布,則使得形成性評估具有了一定的“高風(fēng)險”(詳見圖3)。
圖2 形成性評估的理論框架
圖3 課堂評估的過程和策略
形成性評估是一種評估理念,而不是某種或某些評估方法或策略。形成性評估理論既包括理論依據(jù),也包括具體的操作程序與方法。本文認為,形成性評估應(yīng)當基于教育學(xué)、心理學(xué)、測量學(xué)等理論,在實際評估過程中評估者可以從具體情況出發(fā),依據(jù)形成性評估的基本原則設(shè)計操作框架,用以指導(dǎo)評估實踐。當然,本文提出的“形成性評估理論框架”,尚需在形成性評估實踐中不斷完善。
注釋:
因篇幅限制,本文未能展開討論形成性評估的理論基礎(chǔ),如教育學(xué)理論、心理學(xué)理論、測量學(xué)理論等。對此,我們另文闡述。
[1]Bennett,R.E.Formative Assessment:A Critical Review[J].Assessment in Education:Principles,Policy&Practice,2011(1):5~25.
[2]Berlak,H.,etal.Toward a New Science of Educational Testing and Assessment[C].Albany:State University of New York,1992.
[3]Berry,R.Assessment for Learning[M].Hong Kong:HongKongUniversityPress,2008.
[4]Berry,R.&Adamson,B.(Eds.).Assessment Reform in Education:Policy and Practice[C].New York:Springer,2011.
[5]Birenbaum,M.New Insights into Learning and Teaching and Their Implications for Assessment[C]//M.Sergers,F(xiàn).Dochy&E.Cascallar(Eds.).OptimizingNewModesofAssessment:In Search of Qualities and Standards.Dordrecht:Kluwer AcademicPublishers,2003.13~36.
[6]Black,P.,&Wiliam,D.Assessment and Classroom Learning[J].AssessmentinEducation,1998(1):7~74.
[7]Black,P.,&Wiliam,D.Developing a Theory of Formative Assessment[C]//J.Gardner(Ed.).Assessment and Learning.London:Sage,2005.81~100.
[8]Black,P.J.,&Wiliam,D.Developing the Theory of Formative Assessment[J].Educational Assessment,Evaluation,andAccountability,2009(1):5~31.
[9]Broadfoot,P.,&Black,P.Redefining Assessment?TheFirstTenYearsofAssessmentinEducation[J].Assessment inEducation:Principles,PolicyandPractice,2004(1):7~26.
[10]Earl,L.M.Assessment as Learning:Using Classroom AssessmenttoMaximizeStudentLearning[M].ThousandOaks,California:CorwinPress,2003.
[11]Gipps,C.V.Beyond Testing:Towards a Theory of E-ducationalAssessment[M].London:FalmerPress,1994.
[12]Huhta,A.Diagnostic and Formative Assessment[C]//Spolsky,B.,&Hult,F(xiàn).M.(Eds.)The Handbook of Educational Linguistics.Malden,MA:Blackwell Publishing Ltd,2008.235~246.
[13]Kuhn,T.S.The Structure of Scientific Revolutions(2nded.)[M].Chicago:UniversityofChicagoPress,1970.
[14]Jacobs,G.M.,&Farrell,T.S.Paradigm Shift:UnderStanding and Implementing Change in Second Language Education[J].TESL-EJ,2001(1).
[15]Mabry,L.Portfolios Plus:A Critical Guide to AlternativeAssessment[M].California:CorwinPress,Inc.1999.
[16]Pryor,J.,&Crossouard,B.A Socio-cultural TheorizationofFormativeAssessment[J].OxfordReviewofEducation,2008(1):1~20.
[17]Rea-Dickins,P..Mirror,Mirror on The Wall:IdentifyingProcessesofClassroomAssessment[J].LanguageTesting,2001(4):429~462.
[18]Shepard,L.A.The Role of Assessment in a Learning Culture[J].EducationalResearcher,2000(7):4~14.
[19]Shepard,L.A.Classroom assessment[C]//R.Brennan(ed.).Educational Measurement(4th ed.).Westport,CT:Praeger,2006.624~646.
[20]Stiggins,R.J.Assessment Crisis:The Absence of Assessment for Learning[J].Phi Delta Lappan,2002(10):758~765.
[21]Stiggins,R.J.Student-involved Assessment for Learning[M].UpperSaddleRiver,NJ:PrenticeHall,2005.
[22]胡森·托爾斯頓(Husén,Torsten).平等——學(xué)校和社會政策的目標[M].張人杰(譯).上海:華東師范大學(xué)出版社,1989.