【摘 要】表現(xiàn)性評價是以落實核心素養(yǎng)為主要目的,以學習活動中學生學習行為、學習能力、學習效能為主要評價對象的一種綜合性、客觀性評價,是學生達到學習目標、完成學習任務的絕對性評價,是將教學過程、學習活動與評價活動融為一體的評價。作為一種新型的學習活動評價,我們應思考表現(xiàn)性評價與核心素養(yǎng)的落實,與高階思維,與學習活動的外顯化、行為化、過程化等之間的關系。
【關鍵詞】表現(xiàn)性評價;深度學習;高階思維
【中圖分類號】G420 【文獻標志碼】A 【文章編號】1005-6009(2019)14-0027-04
【作者簡介】彭鋼,江蘇省教育科學研究院(南京,210000)研究員,江蘇教育現(xiàn)代化研究院首席專家,國家督學。
所謂“新”,是與現(xiàn)有的評價方式相比,但我們只能以“舊”的評價理論為基本框架進行比較。以現(xiàn)代評價理論為基本分析框架,綜觀上述四文(為表述方便,簡稱“陳靜”的文章為“陳文”,以此類推)所體現(xiàn)的認識和實踐,可將“表現(xiàn)性評價”概括為以下五個要點:
一是從評價目的來看,“表現(xiàn)性評價”是以落實核心素養(yǎng)為主要目的,以學習活動中學生學習行為(表現(xiàn))、學習能力(學力)、學習效能(進步)為主要評價對象,可簡稱為“學習活動”的評價,即評價的是學生的學習活動,而非教師的“教學活動”;評價的是學生的學習行為和能力表現(xiàn),而非知識掌握的全面和準確(知識的遷移和運用則是一種能力),因而與課堂教學評價和學業(yè)成就評價相區(qū)別。陳文直接把標題寫成了“促進兒童學力生長的表現(xiàn)性評價探索”,從“思維可視”“學力外顯”“素養(yǎng)提升”三個方面展開,以數(shù)學學科為例,明確表明了表現(xiàn)性評價的目的是以兒童、兒童學習行為、兒童學習力生長為評價的主旨。我以為這是理解表現(xiàn)性評價的核心和關鍵,其余的理解都可以具有一定的彈性。
二是從評價性質來看,“表現(xiàn)性評價”主要是一種過程性評價,強調其“形成性”的功能,強調的是一種達到學習目標、完成學習任務的“絕對性”評價。過程與結果相對,表現(xiàn)性評價明顯更重過程,重視學習過程中的學習表現(xiàn)、所展示和形成的學習能力以及通過學習所形成的進步和成長,而非簡單的學習結果“作品”或“產(chǎn)品”,當然更不是分數(shù),周文反復強調此觀點,有一定的正確性。其功能表現(xiàn)為以評價促發(fā)展,促進和形成學生的進步,而非鑒別和區(qū)分所達到的層次和水平,因而是形成性評價而非總結性評價;以是否落實核心素養(yǎng)、達成課程標準、完成特定學習任務為衡量尺度,不需要排相對名次,因此是一種“絕對評價”,即根據(jù)確定性的目標所進行的評價,有可能每一個學生都達到了目標,都完成了任務,都表現(xiàn)優(yōu)異,不需要進行相對排名,更不需要選擇和淘汰。評價過程中也可能需要“區(qū)分”,但區(qū)分的是不同學生在完成學習任務中的不同學習表現(xiàn)和學習風格。
三是從評價內容來看,“表現(xiàn)性評價”是一種綜合性評價,而非單一性的評價,即使是學科評價也涉及更為廣泛的內容。如張文中舉例“給同伴做一個小古文微講座”是語文學科的學習活動,評分規(guī)則中包括的評價內容共分六個維度,作者畫了個表格,其中包括:示范、朗讀、詞句理解、文章理解、講解表達、PPT制作。陳文在介紹數(shù)學學科的“招聘方案”的學習活動方案時,設計了四項評價內容或維度,其中包括:文本的閱讀與理解、平均數(shù)概念的掌握與運用、招聘方案設計、同伴合作與交流。正因為評價內容具有的綜合性特點,因而佟文引用了外國研究者的觀點“表現(xiàn)性任務能適應比標準化測試更廣泛的學習風格”。
四是從評價方式來看,是將教學過程與評價過程、學習活動與評價活動融為一體的評價。有專家稱之為“逆向設計”,即將作為教學過程中位于教學“后部”的教學評價,提前為首要環(huán)節(jié)并覆蓋整個學習活動的設計,以評價為主線引導教學過程和學習活動。于是,有了周文所說的表現(xiàn)性評價的三大步驟:設計表現(xiàn)性目標、明確表現(xiàn)性任務、研制評分規(guī)則,從而將教學活動過程后的評價,以設計表現(xiàn)性目標和任務的方式提前到教學之前。佟文則有另一種相同意思的表述,直接把標題寫成了“表現(xiàn)任務連接教學與評估”,其核心詞之一是“教學評一體化”,其實更應該倒過來,即“評學教一體化”,即“評價貫穿、學習強化、教學內隱”(傳統(tǒng)意義上的“教”)。這樣一來就對教師提出了很高的要求,即將教學活動設計為學習活動,以學習目標為中心設計學習任務,引發(fā)學習行為,評價學習表現(xiàn),這一完整的過程則稱之為表現(xiàn)性評價。因而表現(xiàn)性評價不是外在于教學過程的一個特定教學環(huán)節(jié),而是內在于學習活動的一條主線,正是在這個意義上它們融為一體了。
五是從評價的技術來看,似乎更強調的是一種客觀性評價,是一種更重視“行為表現(xiàn)”的評價,是一種更重視“產(chǎn)出”的評價,也是一種更重視客觀證據(jù)的評價。陳文強調表現(xiàn)性評價的“performance”英文釋義為“實行”“執(zhí)行”“績效”等“行為表現(xiàn)”,尤其強調“思維可視”“學力外顯”,試圖將思維和學力等內在的能力(competent)通過活動進行客觀評價。佟文用英文“productiveactivity”來表達“生成性的學習活動”,也包括“生產(chǎn)性”,外化為“產(chǎn)品”或“作品”,即學習活動具有“產(chǎn)品性”“作品性”。周文反復強調不能簡單地將作品或產(chǎn)品評價當作表現(xiàn)性評價,也說明二者極易混淆,“產(chǎn)品”或“作品”本身是包含在表現(xiàn)性評價的客觀性之內的,起碼是表現(xiàn)學習行為、學習能力重要證據(jù)之一。張文用了三個本土化的案例闡明學習活動的評價技術,既有評價的內容也有評價的指標還有評價的等級,似乎是無論教師還是學生都可據(jù)此進行一種客觀性評價。但到目前為止,從技術的角度看,有了評分規(guī)則并力求客觀,也極有可能退化為一種主觀性的評價,因為評價設計本身就包含著主觀性,同樣的學習活動不同的教師會有不同的評價設計;同樣的行為表現(xiàn)和能力表現(xiàn),不同的評價者也會打出不同的等級。但無論如何,我看到了力求“客觀”評價的意圖和指向。
作為一種新型的學習活動評價不可能完美無缺,需要在實踐中不斷研究、不斷探索、不斷完善,既要向外部學習,掌握其精神實質,如周文和佟文;也要結合我國中小學的教學實際進行本土化的探索,如陳文和張文。從這個意義上看,我以為這組文章很有價值。我想結合閱讀四文所表達的觀點和傾向,從更廣泛的意義上探討三個問題。
首先,我們應如何全面準確地理解核心素養(yǎng)的落實?我想主要有三個層次:一是核心素養(yǎng)體現(xiàn)的是國家意志,是國家層面所厘定的社會主義建設者和接班人的質量標準。因此,我們可以把核心素養(yǎng)理解為國家對基礎教育全面提高教育質量的頂層設計,是基礎教育各級各類學校都應貫徹和執(zhí)行的統(tǒng)一的、基本的、重要的要求。二是從學校層面看,落實核心素養(yǎng)需要形成完整的、系統(tǒng)的、多層級的工作機制,其中學科育人是重要機制和途徑之一,但也不是唯一機制和途徑。而學科育人的關鍵則是課程標準如何體現(xiàn)學科核心素養(yǎng),而且我們還不能說各學科的學科核心素養(yǎng)簡單相加,就必然是核心素養(yǎng)的總體和全部。只有學校教育的各系統(tǒng)、各部門、各層次、各環(huán)節(jié)協(xié)同一致,才能共同落實核心素養(yǎng)的培養(yǎng)。因而我們決不能把核心素養(yǎng)的落實寄托在某個具體的操作環(huán)節(jié)上,寄托在某個尚未完善的評價技術上。三是對于不同的學校、不同的教育活動、不同的學科教學、不同的學生成長,落實核心素養(yǎng)必然會有不同的重點、不同的側重、不同的要求。比如,不同的教育活動會有不同的特點,德育和學科顯然不同,因而在落實核心素養(yǎng)時顯然要結合德育的特點;再如,不同的學科有明顯的學科特質,數(shù)學學科和體育學科落實核心素養(yǎng)必然有明顯的差異;再如,不同的學生具有發(fā)展的多元智能和心理傾向,我們需要結合學生發(fā)展的實際進行教育和教學,培養(yǎng)學生的核心素養(yǎng)。綜上所述,我們決不能簡單化地說只有表現(xiàn)性評價才是落實核心素養(yǎng)的重要途徑,甚至是唯一途徑。要求表現(xiàn)性評價的設計和實施對準核心素養(yǎng)是正確的,但把核心素養(yǎng)的落實全部寄托在表現(xiàn)性評價上,會嚴重誤導我們的思維方向。
其次,表現(xiàn)性評價只對應著評價高階思維?衡量表現(xiàn)性評價的主要尺度就是看是否是評價高階思維?我以為不能這么理解,也不宜這么理解。首先是高階思維的問題,本身就是個相對的概念,而不是絕對的概念。小學生有小學生的高階思維,中學生有中學生的高階思維,大學生、研究生也有他們的高階思維,以此類推可以推到不同專業(yè)工作者的高階思維。不同的學段,有不同的高階思維,并不是思維越高階越好,否則就完全是學術精英、學術人才培養(yǎng)的狹隘思路。請問海德格爾所說的高級技師“手指”上的精湛技術,是高階思維的產(chǎn)物還是低階思維的產(chǎn)物?以作品或產(chǎn)品制作為對象的學習活動,如STEM、STEAM學習活動中,只評價抽象思維能力或反思能力,不評價最具有外顯性的動手能力嗎?不同的人有不同類型的高階思維,對一個音樂家而言,“音準”是本能,太低階了;而對一個“音盲”而言,“音準”太難了,太高階了!從學理上看,任何高階思維都不是赤裸祼的,而是包含著各類低階思維并提升了低階思維,譬如不僅“分析”和“綜合”需要“記憶”和“理解”加入,同時也在新的層面上提升了“記憶”和“理解”的層次、水平和功效。因而我們怎么能簡單地說“記憶”和“理解”是低階的?斯賓塞認為,最好的記憶是運用,就是通過“運用”提升了記憶的層次和水平?;氐奖憩F(xiàn)性評價,我們如何可能只評價“運用”而剔除運用中所包含的“記憶”“理解”和“分析”?如何可能只評價“運用”而不評價其他相關的低階思維?基本上不存在這樣的評價技術。譬如PPT制作是高階思維的產(chǎn)物還是低階思維的產(chǎn)物?你有再高階的思維和能力,電腦技術不行你就做不成PPT。因此,我以為表現(xiàn)性評價主要評價的是學生在表現(xiàn)性活動中的“表現(xiàn)”及“成就”,既包括深度學習,也包括淺層學習;既包括高階思維,也包括低階思維,并整體性、融合性地表現(xiàn)在學習活動的過程之中,很難區(qū)分。同時,我并不認可所有的學科、所有的教學、所有的學習活動都可以用某種方式重構為“表現(xiàn)性”的學習活動。企圖以表現(xiàn)性活動取代所有學習活動基本上是不可能的,就像是企圖以表現(xiàn)性評價取代其他評價方式一樣。根據(jù)我的知識背景和實踐體驗,很多“深度”的東西是不適宜用“表現(xiàn)性”這個概念的,越深的東西越無法表現(xiàn),甚至需要很高的表現(xiàn)技巧。譬如社會責任感,需要特別表現(xiàn)嗎?特別表現(xiàn)出來還是社會責任感嗎?由此必將陷入“道德悖論”。
第三,強調通過教學引發(fā)學習,強調以學習活動為中心建構教學活動,強調學習活動盡可能外顯化、行為化、過程化,目的何在?是為了更好地促進學生的發(fā)展,而絕不是為了方便評價,更不是為了研發(fā)出一種新的評價方式,為評價而評價。從學生發(fā)展和成長的角度看,我們應該只評應該評和必須評的,盡可能少評而不是多評,盡可能簡化評價而不是將其復雜化,盡可能科學化而不是讓每個教師都成為評價的專家,都成為深度學習的研究者,都成為高水平的心理學家,從而能夠創(chuàng)造出一把新的尺子來對學生的一切學習都評頭論足、做出判斷。教師只是教師,最重要的任務是教書育人,教好書育好人是最核心的價值和行為取向,而絕不是整天著魔于表現(xiàn)性評價,整天去設計表現(xiàn)性目標和任務,去制定評分規(guī)則?;A教育中的評價謬誤還少嗎?實在是太多了。多了一把尺子去衡量學生固然可以評價出過去看不到的東西,但多一把尺子也必將成為學生學習活動的新的束縛和壓迫?,F(xiàn)代學校教育制度創(chuàng)造出考試評價之類的控制方式,反過來考試評價又控制了教育教學,中國基礎教育成為這種“異化”和“反轉”的典型。在關于學生“深度學習”和“高階思維”的發(fā)展上,我以為教師尤應慎評,應該少說少評,甚至不說不評,更重要的是創(chuàng)造一種自由發(fā)展的環(huán)境,由其自主生長、自然發(fā)展,我相信學生的發(fā)展一定會超過我們設定的標準和尺度,超過我們的想象給我們以驚喜。我要說的是,真正意義上良好的教和學是不用評價的,是遠遠超出任何評價框架的,因為支撐好的教學、好的學習的絕不是評價,而是對教師對學科的認識和理解,對學生的認識和理解;是師生對教學和學習的熱愛和情感,是一種強大的內在動機和持之以恒的興趣。
如果要說“一定”的話,好的教學和學習一定存在,古今中外一直存在,它一定不是任何評價評出來的,而是教和學出來的。