●王少非
課堂需要什么樣的評(píng)價(jià)*
●王少非
傳統(tǒng)的評(píng)價(jià)理論及其所期望的實(shí)踐并不完全適合于課堂。課堂評(píng)價(jià)理論的構(gòu)建必須建基于學(xué)習(xí)的基本原理,充分考慮評(píng)價(jià)與課程、教學(xué)之間的互動(dòng)關(guān)系。課堂評(píng)價(jià)實(shí)踐關(guān)注與目標(biāo)相關(guān)的學(xué)習(xí);收集學(xué)生學(xué)習(xí)的充分的準(zhǔn)確的信息;在教-學(xué)活動(dòng)中持續(xù)實(shí)施。
評(píng)價(jià);學(xué)習(xí);課程;教學(xué);課堂評(píng)價(jià)
評(píng)價(jià)在人類(lèi)社會(huì)生活中無(wú)處不在,是人類(lèi)社會(huì)生活中最普遍的現(xiàn)象之一。所有的評(píng)價(jià)也許都遵循相同的邏輯,但不同領(lǐng)域的評(píng)價(jià)一定存在差異,比如地溝油的檢測(cè)與學(xué)術(shù)論文的評(píng)審一定不同。那么,所有的“教育評(píng)價(jià)”都一樣嗎?鑒于本文的目的,更確切的問(wèn)題是,傳統(tǒng)的教育評(píng)價(jià)理論及其所期望的實(shí)踐適合于課堂嗎?如果不適合,那么課堂需要什么樣的評(píng)價(jià)?筆者認(rèn)為,源于大規(guī)模測(cè)驗(yàn)的基于心理測(cè)量學(xué)的傳統(tǒng)教育評(píng)價(jià)理論和實(shí)踐不適合于教師日常專(zhuān)業(yè)實(shí)踐層面的評(píng)價(jià),課堂需要適合于課堂的評(píng)價(jià)理論和評(píng)價(jià)實(shí)踐。
這里所稱(chēng)的“傳統(tǒng)教育評(píng)價(jià)”主要是指以往大多數(shù)以《教育評(píng)價(jià)學(xué)》為名的教材中所涉及的評(píng)價(jià)理論以及其所要求的實(shí)踐,其核心就是支撐美國(guó)心理學(xué)會(huì)(American Psychological Association,APA)、美國(guó)教育研究會(huì)(American Educational Research Association,AERA) 和美國(guó)教育測(cè)量委員會(huì)(National Council on Measurement in Education,NCME)所制定的《教育與心理測(cè)驗(yàn)標(biāo)準(zhǔn)》的測(cè)量理論,本質(zhì)上來(lái)源于大規(guī)模測(cè)驗(yàn),秉持的是一種心理測(cè)量學(xué)范式。
(一)心理測(cè)量學(xué)的假定不能在課堂中成立
心理測(cè)量學(xué)建基于幾個(gè)基本假定之上。首先,測(cè)驗(yàn)應(yīng)測(cè)量個(gè)體穩(wěn)定的特征。測(cè)驗(yàn)應(yīng)當(dāng)準(zhǔn)確可靠地測(cè)量?jī)?nèi)在的、穩(wěn)定的、不受“污染”的特性,測(cè)量的結(jié)果不能受背景的影響。其次,測(cè)驗(yàn)就是對(duì)某種單一屬性的測(cè)量。測(cè)驗(yàn)就是對(duì)某種單一的屬性的估計(jì),與整體分?jǐn)?shù)有高相關(guān)的試題意味著它能檢測(cè)所想要測(cè)的那種屬性,具有高區(qū)分度,是良好的試題;而與整體分?jǐn)?shù)沒(méi)有高相關(guān)的試題則意味著它檢測(cè)了所想要測(cè)的屬性之外的東西,缺少高區(qū)分度,不應(yīng)容納在測(cè)驗(yàn)之中。第三,測(cè)驗(yàn)分?jǐn)?shù)對(duì)于不同個(gè)體具有本質(zhì)上相同的意義。測(cè)驗(yàn)分?jǐn)?shù)具有普遍意義,標(biāo)準(zhǔn)化和標(biāo)準(zhǔn)參照測(cè)驗(yàn)所測(cè)到的東西存在一種單一的、一致的、超越了社會(huì)情境和歷史的意義。正因如此,不同個(gè)體在相同的測(cè)驗(yàn)中獲得的分?jǐn)?shù)可以進(jìn)行直接的比較。第四,技術(shù)具有價(jià)值中立性。測(cè)驗(yàn)是一種價(jià)值中立的科學(xué)工具,只能按其科學(xué)價(jià)值來(lái)判斷。達(dá)成目標(biāo)或結(jié)果的工具或最佳路徑的選擇被看作一種技術(shù)選擇,而不是一個(gè)價(jià)值選擇,因此測(cè)驗(yàn)專(zhuān)家能夠不用價(jià)值判斷而作出技術(shù)決定。[1]
當(dāng)心理測(cè)量學(xué)成為教育評(píng)價(jià)的基本范式后,效度、信度、區(qū)分度等源于這些假定的技術(shù)指標(biāo)也就成了教育評(píng)價(jià)理論的核心觀念。問(wèn)題是,這樣一些假定在課堂情境中不能成立。課堂,就其本意而言,是特定的物理場(chǎng)所的一種,與工廠、農(nóng)場(chǎng)一樣,但經(jīng)常被用來(lái)指代其中所發(fā)生的事——教育或?qū)W習(xí)。課堂是學(xué)習(xí)發(fā)生之處,就為學(xué)習(xí)而設(shè)置,而學(xué)習(xí)的本質(zhì)就是“變化”,就此而言,對(duì)學(xué)習(xí)的評(píng)價(jià)也就是對(duì)變化的評(píng)價(jià)。從這一點(diǎn)來(lái)看,基于心理測(cè)量學(xué)的評(píng)價(jià)理論本質(zhì)上是反學(xué)習(xí)的。這也許就是為什么基于心理測(cè)量范式的傳統(tǒng)評(píng)價(jià)理論從根本上不適合課堂的關(guān)鍵原因。而且,我們追求什么樣的學(xué)習(xí),這在不同社會(huì)背景和歷史時(shí)代的課堂中是不一樣的,本質(zhì)上基于我們的價(jià)值選擇,而由于評(píng)價(jià)的技術(shù)取決于其所評(píng)價(jià)的學(xué)習(xí)的性質(zhì),因而也就必然是價(jià)值負(fù)載的。此外,評(píng)價(jià)的結(jié)果對(duì)于不同的學(xué)生在不同的情境中經(jīng)常有不同的意義,有利于學(xué)生學(xué)習(xí)的不是分?jǐn)?shù),而是關(guān)于其個(gè)人學(xué)習(xí)的信息;課堂的目的也不在于對(duì)學(xué)生進(jìn)行區(qū)分,而在于幫助學(xué)生學(xué)習(xí)或?qū)崿F(xiàn)“變化”。
(二)基于心理測(cè)量學(xué)的教育評(píng)價(jià)局限于“對(duì)學(xué)習(xí)的評(píng)價(jià)”
無(wú)可否認(rèn),教育評(píng)價(jià)領(lǐng)域在借用心理測(cè)量學(xué)范式時(shí)也曾經(jīng)嘗試依據(jù)教育評(píng)價(jià)的特性進(jìn)行過(guò)一些改造——布魯姆的教育目標(biāo)分類(lèi)學(xué)實(shí)際上表明教育者開(kāi)始清楚地表達(dá)對(duì)一種專(zhuān)門(mén)服從教育目的的評(píng)價(jià)的需求,而格拉瑟對(duì)常模參照測(cè)驗(yàn)和標(biāo)準(zhǔn)參照測(cè)驗(yàn)的區(qū)分,就是一種將教育評(píng)價(jià)從心理測(cè)量學(xué)中分離出來(lái)的一個(gè)重要嘗試。[2]一些專(zhuān)門(mén)指向于教育評(píng)價(jià)的專(zhuān)業(yè)規(guī)范也曾經(jīng)被編制且得到應(yīng)用,如《教育中的公平考試實(shí)踐規(guī) 范 》(Code ofFairTesting Practicesin Education,JointCommittee on Testing Practices,1988),《學(xué)生評(píng)價(jià)系統(tǒng)的原則與指標(biāo)》(Principles and indicatorsforstudentassessmentsystems, National Forum on Assessment,1998)等。但問(wèn)題是,這些評(píng)價(jià)理論或許關(guān)注到學(xué)習(xí)了,卻只局限于“對(duì)學(xué)習(xí)的評(píng)價(jià)”(assessment of learning),經(jīng)常只是將評(píng)價(jià)當(dāng)做教學(xué)過(guò)程的附加環(huán)節(jié)加以考察,而沒(méi)有以學(xué)習(xí)為核心,在教育情境——即學(xué)習(xí)、課程、教學(xué)、評(píng)價(jià)的互動(dòng)關(guān)系中——考察評(píng)價(jià),評(píng)價(jià)止于對(duì)學(xué)習(xí)的判斷,缺少對(duì)課程、教學(xué)的關(guān)懷。在柏拉克(Berlak,H.)看來(lái),這種評(píng)價(jià)不只是不適合教育,甚至對(duì)學(xué)校教育產(chǎn)生了明顯的阻礙作用。[3]可能正因?yàn)槿绱?,出身于心理測(cè)量學(xué)的斯蒂金斯(Stiggins,R.)等承認(rèn),長(zhǎng)期以來(lái)測(cè)量學(xué)界對(duì)教學(xué)的貢獻(xiàn)甚少,“測(cè)量學(xué)界一直來(lái)忽視課堂評(píng)價(jià),這讓他們錯(cuò)過(guò)了通過(guò)改善課堂評(píng)價(jià)促進(jìn)學(xué)校改善的黃金機(jī)會(huì)?!盵4]
(三)基于心理測(cè)量學(xué)范式的教育評(píng)價(jià)原理無(wú)法為教師所用
即使這些評(píng)價(jià)規(guī)范適合于課堂,教師也無(wú)法運(yùn)用,實(shí)際上也沒(méi)有必要運(yùn)用。首先,作為專(zhuān)業(yè)規(guī)范,主要用于規(guī)范相關(guān)成員的專(zhuān)業(yè)行為,而這些規(guī)范的成員經(jīng)常是學(xué)者、研究者、測(cè)驗(yàn)公司;而且通常沒(méi)有監(jiān)控執(zhí)行的機(jī)制,其落實(shí)都更多地依賴(lài)于專(zhuān)業(yè)共同體的自律。其次,專(zhuān)業(yè)自律的背后實(shí)際上隱含著一個(gè)“技術(shù)精英”的意識(shí),強(qiáng)調(diào)專(zhuān)業(yè)共同體,并將之與“非專(zhuān)業(yè)”的外行隔絕開(kāi)來(lái)。標(biāo)準(zhǔn)和規(guī)范成為隔絕專(zhuān)業(yè)與非專(zhuān)業(yè)人員的工具之時(shí),包括教師在內(nèi)的眾多“專(zhuān)業(yè)”以外的人會(huì)本能地疏離這一專(zhuān)業(yè)及其標(biāo)準(zhǔn)和規(guī)范。第三,標(biāo)準(zhǔn)和規(guī)范本身也存在缺陷,如相關(guān)的規(guī)定過(guò)于原則,只籠統(tǒng)地陳述了標(biāo)準(zhǔn)而未提供指導(dǎo)標(biāo)準(zhǔn)達(dá)成的指南,也沒(méi)有說(shuō)明如何執(zhí)行,未能清楚地描述證明評(píng)價(jià)達(dá)成了技術(shù)標(biāo)準(zhǔn)所要求的證據(jù)。這顯然導(dǎo)致了運(yùn)用上的麻煩,比如,在美國(guó)關(guān)于測(cè)驗(yàn)的諸多訴訟案例中,原告和被告雙方邀請(qǐng)的專(zhuān)家證人都聲稱(chēng)支持標(biāo)準(zhǔn)中的一般原則,卻可以對(duì)標(biāo)準(zhǔn)和規(guī)范作出完全相反的解釋。[5]最后,更重要的是,即使教師們擁有了相關(guān)的專(zhuān)業(yè)知識(shí),他們事實(shí)上也不會(huì)用——誰(shuí)會(huì)在自己實(shí)施的課堂測(cè)驗(yàn)中運(yùn)用那種實(shí)際上已經(jīng)成為一種統(tǒng)計(jì)學(xué)事務(wù)的測(cè)驗(yàn)技術(shù)呢?再說(shuō),只有幾十個(gè)學(xué)生的班級(jí)中又有什么必要運(yùn)用那種技術(shù)呢?
課堂中的評(píng)價(jià)是以學(xué)習(xí)為核心的,目的在于促進(jìn)學(xué)習(xí),而且與課堂中的其他活動(dòng)之間存在著緊密的聯(lián)系。這意味著,在有效的課堂中,一切都應(yīng)當(dāng)圍繞學(xué)習(xí)來(lái)展開(kāi),而且必須遵循或反映學(xué)習(xí)的本質(zhì)和基本原理。同時(shí),圍繞著學(xué)習(xí)展開(kāi)的一切都應(yīng)當(dāng)是相互配合的,如果相互之間沒(méi)有聯(lián)系,或者不匹配,那么就可能無(wú)助于學(xué)習(xí),甚至可能損害學(xué)習(xí)。如果我們要構(gòu)建課堂評(píng)價(jià)的理論,就必須基于學(xué)習(xí)的基本原理,必須在整個(gè)系統(tǒng)中及其與各個(gè)子系統(tǒng)關(guān)系中考察評(píng)價(jià)。
(一)課堂評(píng)價(jià)與學(xué)習(xí)理論
若課堂中的評(píng)價(jià)要評(píng)價(jià)學(xué)習(xí)并保證這種評(píng)價(jià)能夠促進(jìn)學(xué)習(xí),我們就必須理解學(xué)習(xí)的本質(zhì)和基本原理。只有在此基礎(chǔ)上建構(gòu)的評(píng)價(jià)理論才可能真正適用于課堂。盡管到目前為止我們尚未窮盡對(duì)學(xué)習(xí)的理解——只要大腦這一“黑箱”沒(méi)有被完全打開(kāi),對(duì)學(xué)習(xí)的理解就不可能窮盡——但迄今為止關(guān)于學(xué)習(xí)的研究仍然能夠?yàn)槲覀兲峁╆P(guān)于學(xué)習(xí)的重要發(fā)現(xiàn)。首先,學(xué)習(xí)總是建基于學(xué)習(xí)者先前已有的知識(shí)經(jīng)驗(yàn)以及認(rèn)知框架。奧蘇伯爾在其《教育心理學(xué):一種認(rèn)知觀》的扉頁(yè)中所寫(xiě):“如果我不得不把全部教育心理學(xué)還原為一條原理的話,我將會(huì)說(shuō),影響學(xué)習(xí)的唯一最重要因素是學(xué)習(xí)者已經(jīng)知道了什么?!苯?gòu)主義認(rèn)為,學(xué)習(xí)是意義的主動(dòng)建構(gòu),是學(xué)習(xí)者以自己原有的知識(shí)經(jīng)驗(yàn)為基礎(chǔ),對(duì)新信息重新認(rèn)識(shí)和編碼,通過(guò)新舊知識(shí)經(jīng)驗(yàn)間的反復(fù)的、雙向的相互作用過(guò)程而建構(gòu)意義。如果教學(xué)不能在新的信息與學(xué)生已有的理解之間建立聯(lián)系,那么這種教學(xué)不可能真正有效。
其次,深入的學(xué)習(xí)需要事實(shí)性知識(shí),更需要在概念框架中的理解,以及有利于促進(jìn)應(yīng)用的組織方式。學(xué)習(xí)不只是記住一些事實(shí)性知識(shí),更為重要的是獲得知能(expertise),能夠應(yīng)用知識(shí),實(shí)現(xiàn)遷移,解決新的問(wèn)題。因此,所學(xué)知識(shí)的概念化組織或者“大觀念”(big idea)比知識(shí)本身更重要。
第三,學(xué)習(xí)能力的發(fā)展是最為重要的學(xué)習(xí)。如果個(gè)體心理和行為上的變化都可以通過(guò)學(xué)習(xí)來(lái)獲得,那么在終身學(xué)習(xí)的時(shí)代就沒(méi)有什么學(xué)習(xí)比學(xué)習(xí)能力本身的發(fā)展更為重要了。包括自我評(píng)價(jià)在內(nèi)的元認(rèn)知策略就是學(xué)習(xí)能力的最關(guān)鍵的成分之一,元認(rèn)知策略的習(xí)得不僅能夠極大改善當(dāng)前的學(xué)習(xí),而且會(huì)極大影響未來(lái)的學(xué)習(xí)和發(fā)展。
(二)課堂評(píng)價(jià)與課程、教學(xué)
課堂中影響學(xué)習(xí)的因素非常多樣,既包括學(xué)生內(nèi)部的因素,也包括學(xué)生之外的因素。就學(xué)生之外的因素來(lái)說(shuō),最重要的也許就是三個(gè)元素或“信息系統(tǒng)”[6]:課程、教學(xué)和評(píng)價(jià)。實(shí)際上課堂中學(xué)生以外的影響學(xué)習(xí)的因素基本上都可以歸入這三個(gè)子系統(tǒng)。這三個(gè)子系統(tǒng)也就相當(dāng)于教師專(zhuān)業(yè)實(shí)踐的三個(gè)領(lǐng)域——按波帕姆(Popham,W.J.)的看法,這構(gòu)成了“我們稱(chēng)之為‘教育’的游戲中的三個(gè)競(jìng)技場(chǎng)”。[7]
令人遺憾的是,多年來(lái)我們對(duì)這三個(gè)“競(jìng)技場(chǎng)”的認(rèn)識(shí)并不到位。從教師層面來(lái)說(shuō),課堂就是教學(xué)的場(chǎng)所,一涉及課堂,中心話語(yǔ)就是教學(xué),在絕大多數(shù)情況下,教學(xué)還被狹化為“怎么教”,教師的核心關(guān)注點(diǎn)是如何處理內(nèi)容、運(yùn)用什么方法、讓學(xué)生從事哪些活動(dòng)、安排哪些環(huán)節(jié)或步驟;課程是課程專(zhuān)家的事,教學(xué)甚至不需要考慮目標(biāo),更不會(huì)聯(lián)系課程目標(biāo)——許多教師備課時(shí)都只關(guān)注教學(xué)過(guò)程設(shè)計(jì),至多在教學(xué)過(guò)程設(shè)計(jì)完成后拍拍腦袋加上幾點(diǎn)教學(xué)目標(biāo);至于評(píng)價(jià),如果是大規(guī)模評(píng)價(jià),那是評(píng)價(jià)專(zhuān)家的事,或者教研部門(mén)的事,如果是課堂層面的評(píng)價(jià),有現(xiàn)成的試卷和作業(yè)本,不需要去編制或設(shè)計(jì),甚至不用做選擇,所要做的僅僅是批改,而批改經(jīng)常被視為“負(fù)擔(dān)”。在近年課程改革的語(yǔ)境中,課程開(kāi)始逐漸進(jìn)入教師的日常話語(yǔ),甚至成為教師日常話語(yǔ)中的熱詞——盡管實(shí)踐中并不一定成為關(guān)注焦點(diǎn)。但評(píng)價(jià)在教師的話語(yǔ)和實(shí)踐中依然邊緣。
但這不能歸咎于教師。根本的原因在于我們并沒(méi)有生產(chǎn)出適合教師的評(píng)價(jià)理論,更確切地說(shuō),是沒(méi)有生產(chǎn)出適合于課堂的評(píng)價(jià)理論。傳統(tǒng)的評(píng)價(jià)理論本質(zhì)上是心理學(xué)和統(tǒng)計(jì)學(xué)的混合物,在操作中更已成為一種比較純粹的統(tǒng)計(jì)學(xué)事務(wù)了。更為糟糕的是,這些評(píng)價(jià)理論是去情境化的,沒(méi)有在評(píng)價(jià)與課程、教學(xué)之間建立聯(lián)系。
評(píng)價(jià)與課程、教學(xué)之間的關(guān)系的確遠(yuǎn)未清晰化,但我們依然可以看到一些聯(lián)系。我們先來(lái)看評(píng)價(jià)與課程的關(guān)系。真正意義上的教育評(píng)價(jià)不同于心理測(cè)量學(xué),所要評(píng)的是學(xué)習(xí)的結(jié)果,而不是與生俱來(lái)的固定的品質(zhì)。從課堂來(lái)說(shuō),盡管服從于教育的目的,但課堂學(xué)習(xí)的目標(biāo)是有限目標(biāo),從屬于課程目標(biāo),因此,課堂中的評(píng)價(jià)一定得是與課程匹配的。換言之,課程目標(biāo)決定了評(píng)價(jià)。但需要指出的是,現(xiàn)實(shí)中許多評(píng)價(jià)無(wú)關(guān)乎課程,所謂的“神題”[8]的普遍存在就是明證,這說(shuō)明課程對(duì)評(píng)價(jià)的制約是一種應(yīng)然。但評(píng)價(jià)對(duì)課程的影響卻是一種實(shí)然,只要有評(píng)價(jià)存在,這種評(píng)價(jià)一定會(huì)影響課程——教師領(lǐng)悟的課程部分源于對(duì)評(píng)價(jià)(包括考綱)的領(lǐng)悟,基于這種領(lǐng)悟在課堂中運(yùn)行的課程會(huì)受評(píng)價(jià)的影響,而學(xué)生實(shí)際經(jīng)驗(yàn)到的課程同樣受到評(píng)價(jià)的引導(dǎo)——所謂“考什么,就教什么,學(xué)什么”就是表現(xiàn)。這種情況幾乎是無(wú)法避免的,就此而言,評(píng)價(jià)即課程,至少構(gòu)成了隱性課程的一部分。[9]
再看評(píng)價(jià)與教學(xué)的關(guān)系。評(píng)價(jià)通常被視為教學(xué)環(huán)節(jié)終結(jié)時(shí)的一個(gè)附加環(huán)節(jié),作為對(duì)教學(xué)結(jié)果的一種判斷,因此所評(píng)應(yīng)為所教。這表明教學(xué)對(duì)評(píng)價(jià)的制約,教什么就應(yīng)評(píng)什么,不能評(píng)未教也未要求學(xué)生學(xué)的東西。其實(shí),評(píng)價(jià)與教學(xué)的關(guān)系遠(yuǎn)非那么簡(jiǎn)單,兩者之間存在著復(fù)雜的互動(dòng)關(guān)系,而且這種互動(dòng)貫穿于教學(xué)過(guò)程的始終——在很多情況下,尤其在與學(xué)生互動(dòng)時(shí),教與評(píng)實(shí)際上很難分得開(kāi),評(píng)即是教,教即是評(píng)。有效的評(píng)價(jià)不僅有助于學(xué)生達(dá)成學(xué)習(xí)目標(biāo),而且示范了有效的評(píng)價(jià)。特別重要的是,有效的教中即使看不到明顯的評(píng),但評(píng)其實(shí)無(wú)處不在,就像蘇格拉底在他的詰問(wèn)中,每一個(gè)問(wèn)題背后都有評(píng)。只有基于評(píng)價(jià)的教學(xué)才可能是有效的教學(xué)。換言之,在有效的教學(xué)中,評(píng)價(jià)是教學(xué)的基礎(chǔ)。
要生產(chǎn)適合于課堂的評(píng)價(jià)知識(shí),就必須在課程-教學(xué)-評(píng)價(jià)的互動(dòng)關(guān)系中來(lái)審視評(píng)價(jià)。在這一方面,理論界做得遠(yuǎn)遠(yuǎn)不夠。在教育追求科學(xué)化的過(guò)程中,分化、專(zhuān)門(mén)化被視為科學(xué)的標(biāo)志,不同領(lǐng)域的專(zhuān)家各有一塊自留地,相互隔絕,結(jié)果產(chǎn)生了波帕姆所說(shuō)的“高度專(zhuān)門(mén)化的鈍化效果”。[10]也許這種分化、專(zhuān)門(mén)化對(duì)于純理論研究是必要的,但如果我們?cè)噲D對(duì)課堂產(chǎn)生影響,那么我們就必須將課堂當(dāng)做一個(gè)整體,必須聯(lián)結(jié)課程、教學(xué)和評(píng)價(jià)?!罢n程與教學(xué)”之間已經(jīng)有好的聯(lián)系,但與兩者與評(píng)價(jià)之間似乎依然存在著清晰的邊界??尚睦頊y(cè)量學(xué)界早就在反思這種分界了,前面所提的波帕姆的觀點(diǎn)就體現(xiàn)了這種反思,而布魯克哈特(Brookhart,S.M.)等已經(jīng)在致力于開(kāi)發(fā)一種具有“教學(xué)關(guān)懷”的“課堂測(cè)量學(xué)”(classroometric)的測(cè)量理論了。[11]
課堂需要什么樣的評(píng)價(jià)實(shí)踐?這取決于課堂中評(píng)價(jià)的目的。課堂中的評(píng)價(jià)最終是為了學(xué)習(xí)的,通過(guò)對(duì)課程、教學(xué)的影響,有時(shí)也直接影響學(xué)習(xí)。因此,課堂中的評(píng)價(jià)不是“evaluation”所隱含的“引出價(jià)值”,或價(jià)值判斷,而應(yīng)當(dāng)是“assessment”所強(qiáng)調(diào)的收集信息。判斷在以選拔、認(rèn)證等為目的的外部評(píng)價(jià)中是有價(jià)值的,但在以促進(jìn)學(xué)習(xí)為核心的課堂中就沒(méi)有意義——如果有意義的話,這種意義經(jīng)常局限于對(duì)學(xué)生情緒動(dòng)力的影響,而這種影響既可能是正面也可能是負(fù)面的。課堂中的評(píng)價(jià)實(shí)踐應(yīng)當(dāng)致力于收集學(xué)生學(xué)習(xí)的充分的準(zhǔn)確的信息,并將信息用于支持課程、教學(xué)甚至于評(píng)價(jià)本身的改善,或直接支持學(xué)生學(xué)習(xí)的改進(jìn)。這樣一種課堂評(píng)價(jià)實(shí)踐應(yīng)當(dāng)遵循一些重要的實(shí)踐原則。
(一)課堂評(píng)價(jià)必須關(guān)注與目標(biāo)相關(guān)的學(xué)習(xí)
課堂評(píng)價(jià)旨在促進(jìn)學(xué)習(xí),那么就得關(guān)注學(xué)習(xí)。課堂評(píng)價(jià)本質(zhì)上是一種成就評(píng)價(jià)而不是心向評(píng)價(jià),應(yīng)當(dāng)關(guān)注學(xué)生通過(guò)學(xué)習(xí)獲得的結(jié)果和學(xué)習(xí)的過(guò)程,而不是智力、“聰明”之類(lèi)與生俱來(lái)的穩(wěn)定的心向;關(guān)注學(xué)生在學(xué)習(xí)過(guò)程中所做的事,而不是他是一個(gè)什么樣的人。學(xué)生實(shí)際發(fā)生的學(xué)習(xí)極為多樣,通過(guò)學(xué)習(xí)獲得成就也非常多樣,但課堂評(píng)價(jià)應(yīng)當(dāng)關(guān)注的不是所有的學(xué)習(xí),而是要關(guān)注學(xué)生通過(guò)教師的教學(xué)而產(chǎn)生的學(xué)習(xí),應(yīng)當(dāng)是學(xué)校課程所要求的學(xué)習(xí),是課程和教學(xué)目標(biāo)所指向的學(xué)習(xí),而不能是學(xué)生的那些與社會(huì)經(jīng)濟(jì)地位相關(guān)的學(xué)習(xí)。盡管我們的社會(huì)、學(xué)校、教師對(duì)學(xué)生的最終發(fā)展很多期望,但課堂評(píng)價(jià)只能關(guān)注有限的要求或目標(biāo),也就是評(píng)價(jià)所涉的范圍內(nèi)的教學(xué)目標(biāo)。特別需要指出的是,課堂評(píng)價(jià)的目標(biāo)還應(yīng)當(dāng)是教學(xué)目標(biāo)中所涉的核心目標(biāo),學(xué)生的學(xué)習(xí)總是基于先前的學(xué)習(xí)基礎(chǔ),對(duì)某一目標(biāo)的達(dá)成可能會(huì)受以往目標(biāo)達(dá)成狀況的影響,但評(píng)價(jià)不應(yīng)關(guān)注以往的目標(biāo)。比如,本課的目標(biāo)是學(xué)生能寫(xiě)出一個(gè)總-分-總結(jié)構(gòu)的片段,那么評(píng)價(jià)的核心目標(biāo)就應(yīng)在于這樣一個(gè)結(jié)構(gòu),而不是有沒(méi)有錯(cuò)別字,是否存在語(yǔ)法錯(cuò)誤,是否存在標(biāo)點(diǎn)符號(hào)用法錯(cuò)誤等,盡管這些的確會(huì)影響學(xué)生所寫(xiě)的片段的質(zhì)量。也許這樣做可能引發(fā)對(duì)教師責(zé)任心的質(zhì)疑,但問(wèn)題在于,即使關(guān)注到所有的問(wèn)題,如果問(wèn)題得不到解決,那就沒(méi)有任何意義。實(shí)際上,只關(guān)注當(dāng)前目標(biāo)所要求的那些問(wèn)題會(huì)更有效。希洛克斯(Hillocks,G.)在評(píng)述書(shū)面寫(xiě)作研究時(shí),注意到在糾正錯(cuò)誤的研究中,相比較于只標(biāo)注出當(dāng)前教學(xué)所關(guān)注的錯(cuò)誤的教師,將每一錯(cuò)誤都標(biāo)注出來(lái)的教師在提升學(xué)生作業(yè)質(zhì)量上更無(wú)效。[12]
這意味著,課堂評(píng)價(jià)應(yīng)當(dāng)是一種基于目標(biāo)的評(píng)價(jià),換言之,評(píng)價(jià)目標(biāo)應(yīng)當(dāng)與教學(xué)目標(biāo)和學(xué)習(xí)目標(biāo)一致。當(dāng)我們將課堂評(píng)價(jià)理解為收集信息時(shí),我們經(jīng)常會(huì)將要收集的信息理解為學(xué)生當(dāng)前學(xué)習(xí)的信息。這沒(méi)錯(cuò),但必須明確,同樣的信息在不同的框架中有完全不同的意義,在一個(gè)參照系中有意義的信息放到另一個(gè)參照系中就可能沒(méi)有任何意義——就像GPS,如果只告訴你在某處,卻沒(méi)有將當(dāng)前所處的位置與你的目的地聯(lián)系起來(lái),對(duì)于你到達(dá)目的地有何意義呢?因此,準(zhǔn)確地說(shuō),課堂評(píng)價(jià)要收集的信息不是學(xué)生當(dāng)前學(xué)習(xí)狀況的信息,而是關(guān)于當(dāng)前學(xué)習(xí)狀況與目標(biāo)狀況的關(guān)系的信息。如果所評(píng)非所教,評(píng)價(jià)目標(biāo)與教學(xué)目標(biāo)、學(xué)習(xí)目標(biāo)不一致,那么就無(wú)法收集到關(guān)于學(xué)生當(dāng)前學(xué)習(xí)與目標(biāo)狀況的關(guān)系的信息,也就無(wú)法支持學(xué)生的學(xué)習(xí),無(wú)法支持課程、教學(xué)、評(píng)價(jià)的改善。
(二)課堂評(píng)價(jià)必須收集學(xué)生學(xué)習(xí)的充分的準(zhǔn)確的信息
嚴(yán)格地說(shuō),評(píng)價(jià)促進(jìn)學(xué)習(xí)的關(guān)鍵不在于信息收集本身,而在于評(píng)價(jià)信息的適當(dāng)運(yùn)用,即用以支持學(xué)生的學(xué)習(xí)決策和教師的課程、教學(xué)乃至于評(píng)價(jià)決策。但如果所收集的信息不準(zhǔn)確,那么基于這些信息的決策就不可能是有效的,甚至?xí)a(chǎn)生誤導(dǎo)。試想,如果GPS不能為準(zhǔn)確確定你當(dāng)前所在的位置,它能否給予你如何到達(dá)目的地的正確指令?要保證所收集的信息的準(zhǔn)確性,首先評(píng)價(jià)的方法或工具要用對(duì),這取決于評(píng)價(jià)的目標(biāo),關(guān)鍵在于所用的方法或工具能夠引出學(xué)生那種包含了你想收集的信息的活動(dòng)或反應(yīng)。正如你想知道氣溫,你得用溫度計(jì),而不能用鼠標(biāo);如果你想收集學(xué)生在某個(gè)實(shí)驗(yàn)操作上的信息,你得讓學(xué)生去操作,而不是出一份卷子來(lái)讓他做;如果你想了解學(xué)生在某個(gè)高層次學(xué)習(xí)目標(biāo)上的表現(xiàn),你也就不能用填空題或者匹配題去檢測(cè)。其次,這種方法或工具應(yīng)當(dāng)是高質(zhì)量的,地?cái)偵腺I(mǎi)的一個(gè)溫度計(jì)可能用水替代了水銀,自然不可能讓你準(zhǔn)確地知道當(dāng)前的氣溫;低質(zhì)量的評(píng)價(jià)工具也不可能讓教師獲得關(guān)于學(xué)生學(xué)習(xí)的準(zhǔn)確信息,比如一道選擇題,要求學(xué)生在一個(gè)句子中確定有幾個(gè)錯(cuò)別字,教師是不可能從學(xué)生的回答中收集到有意義的信息的。再次,所收集的信息應(yīng)當(dāng)是充分的,這是保證信息準(zhǔn)確性的重要前提。我們并非沒(méi)有馬航370的任何線索,但我們到目前為止依然不知其所終,原因也許就是只有一顆衛(wèi)星接收到它的“握手”信息,如果有三顆以上的衛(wèi)星接收到它的信息,那定位會(huì)準(zhǔn)確得多——GPS之所以能準(zhǔn)確定位,就是因?yàn)樗C合了4顆以上衛(wèi)星所接收的信息。同樣,只根據(jù)學(xué)生在一道題目上的表現(xiàn)對(duì)其知識(shí)掌握的情況做出推斷完全可能存在偏差,但如果試卷上針對(duì)同一知識(shí)點(diǎn)有多道題目,那么從學(xué)生的表現(xiàn)中做出的關(guān)于其對(duì)該知識(shí)點(diǎn)的掌握情況的推斷就會(huì)準(zhǔn)確得多。這需要教師們運(yùn)用測(cè)驗(yàn)、觀察、交流以及各種評(píng)價(jià)技術(shù)獲得關(guān)于學(xué)生學(xué)習(xí)的多樣信息,并運(yùn)用這些相互印證,來(lái)準(zhǔn)確地對(duì)學(xué)生學(xué)習(xí)狀況進(jìn)行定位——課堂評(píng)價(jià)的信度就在于此。[13]
(三)課堂評(píng)價(jià)必須在教-學(xué)活動(dòng)中持續(xù)實(shí)施
在課程理論中,課程評(píng)價(jià)被視為課程的要素之一,但對(duì)課程要素的常見(jiàn)表述法經(jīng)常讓人以為評(píng)價(jià)是課程實(shí)踐的終結(jié)環(huán)節(jié);教師日常的評(píng)價(jià)實(shí)踐也容易讓教師產(chǎn)生一種印象:評(píng)價(jià)是一個(gè)相對(duì)完整的教學(xué)過(guò)程終結(jié)時(shí)的活動(dòng)。評(píng)價(jià)是課程實(shí)踐的一部分,但課程四要素之間絕不是一種簡(jiǎn)單的線性關(guān)系,即使存在順序,至少也是一個(gè)反復(fù)的循環(huán)——課程實(shí)踐就是課程四要素反復(fù)循環(huán),螺旋式上升的過(guò)程。在教學(xué)理論中,評(píng)價(jià)被視為教學(xué)終結(jié)之后的附加于教學(xué)之上的一種活動(dòng)。但評(píng)價(jià)不是凌駕于教學(xué)之上的一個(gè)孤立的環(huán)節(jié),而是教學(xué)過(guò)程的有機(jī)組成部分,與教、學(xué)互為前提,事實(shí)上,課堂中許多行動(dòng)很難分得清是教還是評(píng),至少,每一種教的行動(dòng)背后都有評(píng)價(jià)。
“教學(xué)即決策”,這一觀念正被越來(lái)越廣泛的認(rèn)同。毫無(wú)疑問(wèn),這一觀念至少部分地反映了教學(xué)的本質(zhì),教師的任何行動(dòng)都是決策的結(jié)果,只不過(guò)這種行動(dòng)背后的決策過(guò)程或顯或隱。當(dāng)然,有效的教學(xué)背后的決策一定不是那種拍腦袋的決策,或者僅基于某種隱含觀念的想當(dāng)然的決策,而是有依據(jù)的決策。如果說(shuō)教學(xué)開(kāi)始之前準(zhǔn)備階段的決策可能涉及到多方面的依據(jù)的話,那么教學(xué)過(guò)程中決策的主要依據(jù)就是學(xué)生的學(xué)習(xí)狀況。教學(xué)發(fā)生于一個(gè)變動(dòng)不居的情境中,永遠(yuǎn)無(wú)法僅依賴(lài)于執(zhí)行事先的決策來(lái)完成,有效的教學(xué)需要教師持續(xù)不斷地收集學(xué)生學(xué)習(xí)的信息,并在這些信息的基礎(chǔ)上作出有助于教學(xué)改善,最終促進(jìn)學(xué)生學(xué)習(xí)的決策。定期的評(píng)價(jià)也能夠成為教學(xué)決策的基礎(chǔ),但試想一下,你要不要用一臺(tái)隔一個(gè)小時(shí)才能給你一次信息的GPS?現(xiàn)實(shí)中大部分評(píng)價(jià)都只提供了學(xué)生在特定時(shí)間點(diǎn)上的學(xué)習(xí)狀況的“快照”(snapshots),但新的評(píng)價(jià)實(shí)踐必須秉持一個(gè)新觀念,即“評(píng)價(jià)是持續(xù)的關(guān)注學(xué)生進(jìn)步的信息流的創(chuàng)造。”[14]
實(shí)際上課堂中的信息流是一種客觀存在,關(guān)鍵在于教師要意識(shí)到這種信息流及其對(duì)教學(xué)進(jìn)而對(duì)學(xué)生學(xué)習(xí)的意義,并主動(dòng)自覺(jué)地去收集運(yùn)用這些信息。這也許有些難,但技術(shù)的發(fā)展能夠提供幫助。20多年前,我父親在老家開(kāi)了一間賣(mài)五金日雜的小店。店不大,但貨物種類(lèi)很多。記得當(dāng)時(shí)每隔個(gè)把月,小店就要關(guān)門(mén)歇業(yè)一次,就為了盤(pán)點(diǎn)存貨。歇業(yè)一兩天會(huì)帶來(lái)?yè)p失自不必說(shuō),更為麻煩的是盤(pán)點(diǎn)的工作量非常大??墒?,如今許多便利店甚至很大的百貨商店都不再歇業(yè)。難道他們不需要盤(pán)點(diǎn)存貨?秘密就在于貨物上的條形碼和電子收款系統(tǒng)。因?yàn)橛辛诉@些裝置,每一次出貨都能被記錄下來(lái),形成了關(guān)于貨物流動(dòng)的持續(xù)的信息流,店主隨時(shí)都可以獲得豐富的信息,比如存貨情況,比如哪種品牌的花生米最暢銷(xiāo)。如果我們的課堂也有類(lèi)似的裝置能夠隨時(shí)收集、儲(chǔ)存、處理學(xué)生學(xué)習(xí)的信息,而不需要專(zhuān)門(mén)抽出時(shí)間“歇業(yè)”來(lái)考試,那么這些持續(xù)的信息流就能為課程、教學(xué)的改善,最終為學(xué)習(xí)的改善提供強(qiáng)大的保障。鑒于當(dāng)今信息技術(shù)日新月異的發(fā)展,這樣的裝置并非鏡花水月,應(yīng)該指日可待——大數(shù)據(jù)時(shí)代都來(lái)了,提供小數(shù)據(jù)還不容易嗎?但僅有這樣的裝置是不夠的,關(guān)鍵還在于教師能否有效運(yùn)用其產(chǎn)生的數(shù)據(jù)。也許,我們需要及早為這樣一個(gè)時(shí)代的到來(lái)做好準(zhǔn)備。
[1]王少非.校內(nèi)考試監(jiān)控研究[M].上海:華東師范大學(xué)出版社,2009:33-34.
[2]Gipps,C.(1996),Assessment for learning[A],In:Little,A.& A.Wolf(eds.)Assessment in Transition:learning,monitoring and selection in international perspective.Pergamon.P254.
[3]Berlak,H.(1992),The need for a new science of assessment [A],In:Berlak,H.,et al,Toward a New Science of Educational Testing and Assessment,State University of New York Press,P12.
[4]Stiggins,R.J.& Conklin,N.F.(1992),In teachers’hands:Investigating the practices of classroom assessment[M],State University of New York Press,P12.
[5]Madaus,G..(1992),An Independent Auditing Mechanism for Testing[J],Educational Measurement:Issue and Practices,1992(1),26-30,31.
[6]Bernstein,B.1977.轉(zhuǎn)引自:Patricia Broadfoot,Marilyn Osborn,Keith Sharpe,and claire Planel.PupilAssessmentand Classroom Culture:A Comparative Study ofthe Language ofAssessmentin England and France[A].In:David Scott(2001).Curriculum and Assessment.Ablex Publishing.41~62.
[7]Popham,W.J.,Curriculum,Instrnction, and Assessment:Amiable Allies or Phony Friends[R],presented at the annual meeting of the National Council on Measurement in Education,April 22-24,2003,Chicago,Illinois.
[8]如果在網(wǎng)絡(luò)上搜索,我們能夠找到很多關(guān)于“神題”的網(wǎng)頁(yè)。這些神題通常指學(xué)生甚至成人都無(wú)法解決的題目,在我看來(lái),這些神題的共同的特征就是評(píng)非所教。
[9]王少非.論評(píng)價(jià)的課程意蘊(yùn)——兼論課堂評(píng)價(jià)的隱性課程性質(zhì),待發(fā)表.
[10]Popham,W.J.,Curriculum,Instrnction,and Assessment:Amiable Allies or Phony Friends[R],presented at the annual meeting oftheNationalCouncilon Measurementin Education,April22-24,2003,Chicago,Illinois.
[11]Brookhart,S.M.,Helena,M.T.,Developing Measurement Theory forclassroom AssessmentPurposesand Uses[J].Educational Measurement:Issues and Practice,2003(4).
[12]轉(zhuǎn)引自:chappuis,J.How Am I Doing?[J].Educational leadership,70(1):36-41.
[13]Smith,J.K.(2003),Reconsidering Reliability in classroom Assessmentand Grading [J].EducationalMeasurement:Issuesand Practice,26-33.
[14]Simpson,M.,Differentiation and Assessment[A].In:David Scott(2001).Curriculum and Assessment.Ablex Publishing.25~40.
(責(zé)任編輯:張 斌)
*本文為華東師范大學(xué)課程與教學(xué)研究所教育部人文社會(huì)科學(xué)重點(diǎn)研究基地重大項(xiàng)目“義務(wù)教育階段促進(jìn)學(xué)習(xí)的課堂評(píng)價(jià)研究”(項(xiàng)目編號(hào):13JJD880014)的成果,也是國(guó)家社科基金項(xiàng)目“我國(guó)體育課程論學(xué)科體系建設(shè)研究(項(xiàng)目編號(hào):12BTY032)”的成果。
王少非/華東師范大學(xué)課程與教學(xué)研究所兼職研究員,教育學(xué)博士,臺(tái)州學(xué)院教授,主要研究教師教育、教育評(píng)價(jià)