孔凡哲
( 中南民族大學教育學院副院長,教授,博士生導師,湖北民族教育研究中心主任)
中央全面深化改革委員會第十四次會議審 議通過了《深化新時代教育評價改革總體方案》,明確教育評價改革的重點任務是 “改進結果評價,強化過程評價,探索增值評價,健全綜合評價”。 這是繼2018 年全國教育大會提出深化教育體制改革以來首次系統(tǒng)提出“四個評價”,對基礎教育學生學業(yè)評價而言,不僅切中其難點,而且,改革的舉措相對系統(tǒng)、全面而前瞻。
學生學業(yè)成就是學生在校期間學習成果的表現(xiàn),是反映學生發(fā)展水平和學校教育質量的核心指標之一。 準確、客觀、公平、真實、發(fā)展地評估學生的學業(yè)成就,是中國基礎教育改革最難以突破的痛點。
長期以來,中國基礎教育學生學業(yè)評價改革一直處在探索之中, 從2001 年之前的 “知識為本”、憑借紙筆測試的結果評價,到基礎教育課程改革實施以來“學生發(fā)展為本,注重考察知識技能、 過程方法與情感態(tài)度價值觀的三維目標”的學生學業(yè)評價,最終形成紙筆測試為主、綜合評價等非紙筆測試為輔的評價機制,評價信息主要依靠紙筆測試而獲取。
就教育內(nèi)部而言,正如2013 年發(fā)布的《教育部關于推進中小學教育質量綜合評價改革的意見》指出,“總體上看,由于教育內(nèi)外部多方面的原因,單純以學生學業(yè)考試成績和學校升學率評價中小學教育質量的傾向還沒有得到根本扭轉”。 從教育政策視角分析,我國基礎教育評價改革出現(xiàn)“頭疼醫(yī)頭、腳疼醫(yī)腳”的局面,“減負呈現(xiàn)惡性循環(huán)”,國家政策缺乏系統(tǒng)的規(guī)劃設計。 2013年至今,七年過去了,正如《深化新時代教育評價改革總體方案》中指出的,在學生評價方面,“唯分數(shù)、唯升學”的單一評價傾向依然突出,必須要“扭轉”。
之所以出現(xiàn)這樣的局面,不僅僅是因為傳統(tǒng)觀念作祟,一個至關重要的原因在于,缺少客觀、全面、系統(tǒng)的學生評價信息,而只能將閉卷考試等結果評價方式獲取的學生評價信息作為衡量學生學業(yè)水平的標志。 在尚未找到其他科學方法之前,這種方式依然是相對客觀、相對公平的方式,中考如此,高考依然如此。
學生學業(yè)評價的前提是獲取評價信息。通過紙筆測試獲取學生學業(yè)評價的信息,是必不可少的渠道,但不是唯一渠道。
評價是收集信息、加工信息、進行價值判斷的過程。 學生的學科學業(yè)水平不僅表現(xiàn)在學生對于學科知識技能的理解和掌握狀況,而且,包含學生學科學習的能力、積極的學習態(tài)度、創(chuàng)新精神、發(fā)現(xiàn)提出問題與分析解決問題的能力、合作與溝通能力,以及正確的人生觀、價值觀、世界觀等,既包含學生學會的狀況,也包含學生會學的水平。
現(xiàn)行的學生學業(yè)評價基本局限于學生學科學習的結果,局限于知識技能的學習狀況,缺乏全面客觀地反映學生學科學習過程和未來發(fā)展?jié)撃艿男畔ⅰ?這些信息并非不存在,而是以碎片化、零散形式出現(xiàn)在學校教育教學過程之中。 由于教師日常事務的繁忙、工作重心側重于其他事務而沒有及時收集、整理,也由于學校缺乏相應的條件而沒有及時將客觀反映學生學習過程的相關信息及時匯總、儲存,更沒有及時進行加工利用,這些碎片化、零散的信息終將消散。 同時,反映學生學科學習過程和未來發(fā)展?jié)撃艿男畔?,很難通過紙筆測試的形式客觀呈現(xiàn)出來,也給評價信息的全面獲取帶來一定困難。 然而,這一切在今天的大數(shù)據(jù)時代逐漸變得可能和可行,“人工智能+教育” 不僅改變了教育教學信息的傳輸方式,也給評價信息的收集整理和加工利用帶來了機遇。
增值評價不以學生的考試成績作為評價學校和教師的唯一標準,而是以學生的進步幅度評價學校、教師的努力程度和學生的進步程度。 無論是針對學生個體,還是針對學生群體,增值評價關注的都是同一個評價對象在多次同質評價中的結果變化,并透過這種變化對學生的進步現(xiàn)狀和發(fā)展?jié)撡|做出及時、準確的判斷。
在日常教學中,采用增值評價可以有效發(fā)揮評價的激勵功能和改進功能,幫助學業(yè)水平不理想的學生激發(fā)自信心、提升學習能力、發(fā)掘潛質,最終實現(xiàn)學業(yè)水平的提升。 同時,增值評價可以很好地衡量學生的學習能力和發(fā)展?jié)撡|。
我們正處在大數(shù)據(jù)時代,“人工智能+教育”拓寬了學生的學習視野和學習空間,極大地滿足了學生的個性化需求,也為構建科學的學生學業(yè)評價體系帶來了便利。
評價學生的學業(yè)成績, 不僅包括結果評價,還包括過程評價。 結果評價既包括紙筆測試,也包括非紙筆測試,凡是反映學生學業(yè)學習狀況的信息都可以納入學業(yè)評價的項目之中;評價方式既可以用書面考試,又可以采用活動評價(如,口試、主題活動評價、實作測評)、表現(xiàn)性評價、情境測試等,也可用課堂觀察、課后訪談、作業(yè)分析、建立學生最佳作品袋和成長記錄袋等。 “學業(yè)成績評價”的等級(或分數(shù)),可根據(jù)總分、出勤和評語三項綜合評定得出,具體標準由學校制定。 比如,采用口試和面談評估初一新生的數(shù)學學業(yè)發(fā)展水平,就是很好的嘗試,因為“數(shù)學口試設計的立意不僅突出對學生數(shù)學思維過程的考查,而且聚焦學生對知識技能的理解性掌握以及對知識背后所蘊含的基本思想、基本活動經(jīng)驗的掌握狀況”。 又如,“快樂數(shù)學節(jié)”主題活動評價就是聚焦學科素養(yǎng)評價與綜合能力的新型評價方式,屬于實作測評, 評價重點放在學生實際表現(xiàn)的過程、學生作品以及兩者的結合上,評定學生在實際情景下應用知識的能力以及在情感態(tài)度和動作技能領域的學習成就。
評價改革具有普適性。美國基礎教育評價體系PARCC 以 “幫助學生升學和就業(yè)” 為基本理念,以“州核心課程評價模塊”為體系支撐,實現(xiàn)“終結性評價與過程性評價”的優(yōu)化組合,就是很好的嘗試。
疫情期間,“學習通”就是一個相對科學合理的平臺,集課程學習、知識傳播與管理分享于一體,不僅可以詳細記錄學生的學習結果,而且可以詳細記錄學生的學習過程 (作業(yè)完成狀況、課堂互動、章節(jié)測驗、主動學習狀況等),對于更加科學、合理而全面地刻畫學生的學業(yè)成績,起到了重要的支撐作用。 而“學習通”并沒有過多地增加教師的工作量,只要在平臺上操作,所有的相關信息自然保存在平臺之中。
在大數(shù)據(jù)時代的今天, 憑借 “人工智能+教育”,可以方便地收集、整理和加工、利用學生評價信息。 目前,許多中小學校普遍采用網(wǎng)絡平臺實施日常教學,借助于特定的軟件平臺,可以準確、翔實地收集學生學業(yè)發(fā)展狀況的信息;同時,任課教師只需將學生學習的各種信息及時錄入平臺系統(tǒng), 科學設定評測項目和相關項目的權重, 就可以全面客觀地反映學生的學業(yè)發(fā)展狀況。
其實,類似的平臺(如,中小學生監(jiān)測系統(tǒng))被荷蘭等許多國家采納作為學生評價的主要工具, 而加拿大安大略省高中則通過作業(yè)評價、課堂評價、考試評價、學期評價、升學評價五個維度對高中生學業(yè)進行評價,“讓評價促進學習”。 這些發(fā)達國家的成功經(jīng)驗表明,全面客觀記錄學生評價的信息,不僅能夠及時準確地評估學生的學業(yè),而且可以有效保障基礎教育的質量。
國家和各省市、區(qū)縣有必要建立或授權第三方專業(yè)機構建立獨立于教育行政部門的基礎教育質量數(shù)據(jù)庫(其核心是學生學業(yè)評價數(shù)據(jù)庫)。同時, 中小學校應建立相關制度, 及時收集、儲存、加工整理學業(yè)評價數(shù)據(jù),并即時上傳至縣區(qū)數(shù)據(jù)庫。
(1)結合學段特點,義務教育階段建立縣區(qū)級學生學業(yè)平臺(借鑒學籍管理的經(jīng)驗,順應大數(shù)據(jù)時代的要求), 全程記錄學生學業(yè)進步和發(fā)展狀況,其中,過程評價以一定權重納入中考成績之中。
(2)建議高中生日常學習的過程性評價以等級形式記錄,形成相對完整的平時成績,以一定比例納入高中學業(yè)水平考試,并以一定比例納入升學考試(即高考)之中。
(3)完善基礎教育質量監(jiān)測系統(tǒng),并將其發(fā)展為包含學生學業(yè)評價數(shù)據(jù)庫的系統(tǒng)。 我國許多省都設立了義務教育質量監(jiān)測中心,主要針對小學四年級、初中二年級進行監(jiān)測,設立至今已經(jīng)發(fā)揮了其重要作用。 隨著時代的發(fā)展,將義務教育質量監(jiān)測平臺拓廣至包含基礎教育學生學業(yè)評價數(shù)據(jù)庫的系統(tǒng),已經(jīng)變得可能和必要。