文東茅
( 北京大學教育學院/教育經(jīng)濟研究所教授,國家教育考試指導委員會專家工作組成員)
由中央全面深化改革委員會審議通過的《深化新時代教育評價改革總體方案》 可謂切中時弊、事關全局,意義深遠、勢在必行。 而要真正落實該方案,不僅需要有決心和魄力、有具體政策支持,更需要一場面向全民的有關教育、考試、評價的常識啟蒙,否則仍然會舉步維艱、困難重重。因為常識是常人通常應該具有的基本認識,只有回歸“基本”才能把握“總體”,只有拓展群眾基礎才能進一步“深化改革”。在教育評價方面需要普及的常識至少包括以下方面。
評價是對已有工作的評判、 分析和總結(jié),是未來工作的基礎。“以評促建”是評估工作的基本理念。 可能正因為覺得只要有評估就可以有鞭策、競爭、激勵和問責,就可以改進工作,再加之有強大的行政能力和統(tǒng)一的制度規(guī)定,我國的教育行政管理部門特別注重檢查、評估、評價,不僅要對學生的學業(yè)進行各種考試評價,對學校辦學條件、安全衛(wèi)生、教師教學、職稱評定、黨建團建、課外活動等無一不要經(jīng)常進行檢查評估。 因為評估結(jié)果涉及名次、聲譽、獎勵、晉升甚至“飯碗”和“烏紗帽”,所以沒有人敢輕視怠慢。久而久之,學校的各種工作就都以檢查評估為中心了,甚至患上“評估依賴癥”或“評估上癮癥”,似乎不評估、不迎評就不會做事。 這種病癥由來已久,頑固難治。 早在2007 年,《教育部關于規(guī)范普通中小學校檢查、評估工作的意見》就出臺了,明確指出:“各種檢查、評估過多,許多內(nèi)容多頭檢查、重復評估, 一些學校一年接受上級檢查達十幾次,有的學校甚至超過幾十次, 學校普遍反映負擔過重,校長難以靜下心來搞好教育教學工作,嚴重影響了學校正常的教學秩序。 ”但時至2018 年,在中共中央辦公廳印發(fā)的《關于統(tǒng)籌規(guī)范督查檢查考核工作的通知》 中仍然有以下表述:“近年來,督查檢查考核工作不斷加強……。 但也存在名目繁多、頻率過高、多頭重復、重留痕輕實績等問題,地方和基層應接不暇、不堪重負,干部群眾反映強烈,既不利于集中精力抓落實,也助長了形式主義、官僚主義……。 ”可見,多頭、重復檢查評估的問題并沒有得以真正解決,而且在教育部門之外也普遍存在。
此次《總體方案》指出:“教育評價事關教育發(fā)展方向,要全面貫徹黨的教育方針,堅持社會主義辦學方向,落實立德樹人根本任務,遵循教育規(guī)律。 ”這既是指導思想,也是基本常識:“立德樹人” 才是教育的根本任務, 包括各種考試、評價、檢查、評估在內(nèi)的一切工作都應該圍繞和服務于這一中心;如果檢查、評價妨礙、違背了教育,就應及時改變或制止。
幸福美好生活是人類始終如一的共同追求。從這個意義上說,“學生”不僅指代求學的那一類人,而且也指向?qū)W習的目的,即學習如何過一種幸福美好的人生;“教學”意味著要教導學生學習如何更好地“生”(學習和生活);“先生”則需要為人師表,率先成為努力學習、勤奮工作、幸福生活的表率。 但不幸的是,在現(xiàn)代教育中,人們似乎忘記了“學生”“教學”“先生”的本意、初心和本職。學校普遍的現(xiàn)狀是:一切工作為了考試、分數(shù)和升學。 因此,學生的學、教師的教都只是圍繞書本知識和考試大綱,學習的“習”只是完成習題、反復練習,學習基本上無關學生的經(jīng)驗、生活、真實需求和意義建構,更不用說增進生活的美好了。
在恢復高考、 改革開放四十余年的今天,盡管不少人對教育的需求、期待已經(jīng)發(fā)生了很大的變化,但大多數(shù)人普遍持有的觀念仍然是:高考改變命運;學歷決定人生;萬般皆下品,唯有“分數(shù)”高;只有上名校,生活才美好。 提升學歷、考取名??梢栽黾邮杖?、提高社會地位,這確實是一種常識。 殊不知,金錢的多少和地位的高低并不能決定人生是否幸福, 其影響終歸是有限的,這也應該是一種常識。 曾幾何時,小學生高高興興背著書包上學去,幾年之后,在作業(yè)、考試、分數(shù)、排名的折磨之下, 孩子們過早地失去了童年,失去了輕松、單純、好奇以及對學習的興趣,隨之而來的是不斷蔓延和加深的挫折、失敗、恐懼、迷茫和焦慮感,有些學生越學越厭學、越學越痛苦。 這種狀況下的教育和學習不但不能增進幸福,反而成了學生、家長和教師的痛苦之源。
對于學習和教育,我們可能忘記了為什么出發(fā)。 “不忘初心,為人民謀幸福,為民族謀復興”,這是共產(chǎn)黨人的初心和使命, 而為師生謀幸福,也應該是每一位教師和學生自己的初心和使命。學習幸福、幸福學習,這一理念應該成為所有師生、家長的常識、共識,也應該成為教育評價的根本目標和追求。
考試是一種檢測方式, 根據(jù)其目的的不同,可分為選拔性考試、達標性考試、檢測性考試;考試形式不只有筆試,還包括面試、演示(如藝術表演)、展示(如美術作品)、測試(如體育技能)、調(diào)研報告等多種形式;考試分數(shù)(如“80 分”)是一種客觀結(jié)果,是評價的依據(jù)之一,而“及格”“良好”“退步”“進步”才是主觀評價。 以上這些都應該屬于簡單的常識, 但在教育實踐中卻往往被人忽視,以單一的考試(筆試)取代其他考核方式已成為常態(tài),凡有考試就有分數(shù),凡有分數(shù)就有排名,有分數(shù)和排名就可直接評價學生學業(yè)優(yōu)劣以至于品德高低。 因此就有了“考考考,老師的法寶;分分分,學生的命根”的說法。
此次《總體方案》提出“針對不同主體和不同學段、不同類型教育特點,改進結(jié)果評價,強化過程評價,探索增值評價,健全綜合評價”,這就明確告訴人們:除了結(jié)果評價,還有過程評價;除了絕對分數(shù)和錄取率, 還有綜合考慮學生基礎、學校辦學條件的增值評價; 除了基于考試分數(shù)的“單一評價”,還有綜合考慮學生能力素質(zhì)、平時成績的“綜合評價”。 考試服務于評價,評價服務于育人, 要根據(jù)教育的需要選用不同的考試、評價方式,通過個性化、科學、有效的評價指導學生學會學習,鼓勵他們克服困難,幫助他們選擇學習科目、專業(yè)和學校,促進他們健康成長,這才是考試、評價的目的、意義所在,也是教育評價改革努力的方向。
長久以來,“分數(shù)面前人人平等”“按分數(shù)高低錄取才是最公平的”已然成為眾多國人堅定的信念,殊不知,“分數(shù)面前人人平等”是有前提條件的,人們對這一常識的認知缺失非常不利于當下考試、招生制度改革。 在各類大小考試中,人們看到的考試分數(shù),其實只是對部分科目、部分內(nèi)容考試成績的原始分加總,用這種分數(shù)進行排隊不僅“原始”,而且也不一定公平、合理。 試想:一人語文60 分、數(shù)學100 分,另一人語文、數(shù)學各80 分,兩人總分都是160 分,但他們的才能相同嗎? 同樣,選拔體育特長生,讓姚明與劉翔比100米(速度)、3000 米(耐力)、立定跳遠(彈跳),這公平嗎? 而很長一段時間以來,我國中考、高考以至于研究生考試的“常識”和“常規(guī)”都是統(tǒng)一科目、原始分加總、按總分高低錄取,即便是試圖綜合考慮平時成績、高考分數(shù)和高校測試的“三位一體”招生改革,也要求把三項分數(shù)按一定比例加總、排隊。 筆者認為,這樣一種“標準化”的考試評價模式,與國家倡導的“綜合評價,多元錄取”的精神實質(zhì)還有很大差距, 難以實現(xiàn) “揚長避短”“因材施教”“不拘一格降人才”的目標。
我國是考試大國,但大眾對考試、評價的普遍認知水平實在是有限。 例如,恢復高考已經(jīng)超過四十年了,國人仍然沒有接受“標準分”的概念;在歷年的志愿填報過程中,人們終于發(fā)現(xiàn)“不同年份分數(shù)不可比”,勉強接受了“不僅看分數(shù)還要看名次”的觀念,但大家能接受的仍然只是全省統(tǒng)一大排隊,即使是對“不同學科、專業(yè)可以有不同標準和不同排隊”“同一個人在不同隊伍有不同排名”這種簡單的推廣都難以接受,所以至今也難以實行 “一檔多投”“多校錄取、 自主選擇”。 再如,盡管師生都在考場身經(jīng)百戰(zhàn),但真正知道并重視“信度”“效度”概念的人卻為數(shù)不多,所以人們常常會看到,為了保證“公平”,組織者在各類考試(如研究生面試、公務員招聘)中自行建立“題庫”、考生“隨機抽題作答”的現(xiàn)象,卻很少有人關心試題的覆蓋面、等值性、預測度等問題,也較少考慮各種偶然性因素的影響。 還有,考生都知道高考后要填報志愿,但很多人并不把它視為一次重要的自我評估和學業(yè)選擇,“不浪費考分”是多數(shù)人志愿填報的基本原則。 為此,管理部門也一改“志愿優(yōu)先”的做法,統(tǒng)一將“平行志愿、分數(shù)優(yōu)先”作為基本的錄取規(guī)則。殊不知,基于興趣、專長的內(nèi)心“志愿”不論對學校招生還是學生成長都是最寶貴的,需要用心培養(yǎng)和精心呵護。
此次《總體方案》再次提出著力破除“唯分數(shù)”的頑瘴痼疾,其著力點或許不僅僅在于專家、考官的培訓和選拔, 更應該著眼于民眾對考試、評價基本認識的普及和觀念的提升。
教育評價不僅包括對學生學習的評價,也包括對教師教學的評價。 由于直接“評教”沒有統(tǒng)一標準,費時費力、困難重重,于是在中小學便以學生的考試成績來衡量教師的教學水平和業(yè)績;由于沒有學生的統(tǒng)一考試成績?yōu)橐罁?jù),在高校便主要以科研狀況作為對教師進行績效考核和職稱評定的依據(jù);由于科研水平也難以評價,于是就以科研經(jīng)費、 發(fā)文數(shù)量和期刊類型 (如是否為SCI)等指標來代替。 這些都是當下習以為常的做法,卻很少有人會反思當下教育評價中的一個基本問題,即效度:教師的本職工作是教書育人,學生成績、科研經(jīng)費和論文發(fā)表到底能不能有效測度教師在教學方面的投入和水平? 能不能體現(xiàn)他們在“育人”方面傾注的愛心、精力和智慧? 而一些常識性的錯誤, 我們卻長期一犯再犯,“唯論文”已然成了“頑瘴痼疾”,嚴重地誤導了教師的價值認知和時間、精力分配。
既然對教師的評價不能簡單化,就不應該簡單化,而應該向多元、綜合、有效的方向努力。 一方面,需要通過學生成績、進步、品德習慣養(yǎng)成等指標改進“結(jié)果評價”,同時也要通過日常備課、集體教研、公開課展示、師生日常交流等環(huán)節(jié)強化“過程評價”。 更重要的是,要讓所有教師意識到,教學和育人是“良心活”,對于投入多少、成效如何當是“如魚飲水,冷暖自知”,應該努力建立一種基于教師自我反思、自我激勵、不斷成長的機制。 減少評估、增加信任、自尊自律,可能恰恰是師生普遍歡迎的, 也是切實提高教育質(zhì)量的大道。