朱 穎 褚慧玲
美國著名學(xué)者吉爾伯特·薩克斯(Gilbert Sax)在其所著《教育的心理測量與評價(jià)原理》一書中指出,評價(jià)是根據(jù)各種觀察或評價(jià)者自身背景及所受訓(xùn)練,做出有價(jià)值的判斷或決策的過程。由此可知,評價(jià)是一種價(jià)值判斷和決策過程。教育評價(jià)是評價(jià)在教育領(lǐng)域的體現(xiàn)與應(yīng)用。何謂教育評價(jià)?各國學(xué)者進(jìn)行了種種解釋,但至今尚未形成一個公認(rèn)的科學(xué)定義。比較有代表性的觀點(diǎn)認(rèn)為,教育評價(jià)是指根據(jù)一定的教育價(jià)值觀或教育目標(biāo),運(yùn)用可操作的科學(xué)手段,通過系統(tǒng)地搜集信息、資料并進(jìn)行分析、整理,對教育活動、教育過程和教育結(jié)果進(jìn)行價(jià)值判斷,從而為不斷完善自我和教育決策提供可靠信息的過程。[1]
美國評價(jià)專家古巴和林肯(E.G.Guba&Y.S.Lincoln)把教育評價(jià)的發(fā)展分為四個時期,分別稱之為測驗(yàn)和測量時期、描述時期、判斷時期、建構(gòu)時期。[2]測量時期盛行于19 世紀(jì)末至20 世紀(jì)30年代,基本觀點(diǎn)認(rèn)為評價(jià)就是測量,評價(jià)者的工作就是測量技術(shù)員的工作,即選擇測量工具、組織測量、提供測量數(shù)據(jù)。描述時期(20 世紀(jì)30年代至50年代)主流理論認(rèn)為,評價(jià)是“描述”——描述教育結(jié)果與教育目標(biāo)相一致的程度。判斷時期萌生于1957年后美國因蘇聯(lián)衛(wèi)星上天而發(fā)動的教育改革。在這一時期,評價(jià)人員開始關(guān)心那些已經(jīng)確定的目標(biāo)是否需要評價(jià)和價(jià)值判斷,他們認(rèn)為評價(jià)在本質(zhì)上是“判斷”。20 世紀(jì)70年代至今,伴隨著質(zhì)性評價(jià)方法的應(yīng)用而產(chǎn)生的建構(gòu)時期評價(jià)的中心思想認(rèn)為,評價(jià)是一種通過“協(xié)商”而形成的“心理建構(gòu)”。因此,評價(jià)應(yīng)堅(jiān)持“價(jià)值多元性”的信念,反對“管理主義傾向”。建構(gòu)時期評價(jià)的基本特點(diǎn)是:把評價(jià)視為評價(jià)者和被評價(jià)者“協(xié)商”進(jìn)行的共同心理建構(gòu)過程;評價(jià)受多元主義價(jià)值觀支配;被評價(jià)者也是評價(jià)的參與者和評價(jià)的主體;評價(jià)的基本方法是質(zhì)性研究方法。
隨著我國新一輪考試招生制度改革的推進(jìn),教育評價(jià)從傳統(tǒng)的單一性評價(jià)轉(zhuǎn)向多元性評價(jià)。高考作為連接高等教育和基礎(chǔ)教育的橋梁,一方面要優(yōu)化高校人才選拔標(biāo)準(zhǔn)和評價(jià)方式,科學(xué)選拔合適的人才;另一方面,要引導(dǎo)基礎(chǔ)教育深化改革,促進(jìn)學(xué)生全面發(fā)展。新高考上海試點(diǎn)平穩(wěn)落地后,2017年,立足國際視野互鑒互通理念及其經(jīng)驗(yàn),以“教育考試評價(jià)的改革與發(fā)展”為主題,首屆考試評價(jià)國際研討會順利舉行。2018年,高考改革深入推進(jìn),對焦考試制度實(shí)施的重點(diǎn)、難點(diǎn),聚焦學(xué)業(yè)水平考試的制度設(shè)計(jì)和標(biāo)準(zhǔn)建立,以“學(xué)業(yè)水平考試的改革與發(fā)展”為主題,面向全國的學(xué)業(yè)水平考試專題研討會召開。2019年,高考綜合改革的實(shí)踐深入推動了基層教育教學(xué)改革,對接新時代育人方式的變革需求,上海市教育考試院圍繞“測評也是學(xué)習(xí)”的主題,以考試機(jī)構(gòu)專業(yè)化發(fā)展為指向,再一次組織國際研討會,國內(nèi)外專家再度攜手,共同進(jìn)行交流合作。
研討會為期兩天,大小報(bào)告40 場,圍繞測評技術(shù)運(yùn)用、學(xué)習(xí)能力測評、高校選拔標(biāo)準(zhǔn)、測評方案設(shè)計(jì)、在線考試探索、測評素養(yǎng)研究、K-12 科學(xué)素養(yǎng)測評等專題展開。會議特別邀請美國教育考試服務(wù)中心、美國大學(xué)入學(xué)考試中心、英國劍橋大學(xué)考評院、英國文化教育協(xié)會,以及愛爾蘭、澳大利亞等國際專業(yè)教育考試評價(jià)機(jī)構(gòu)和高等教育招生中心的專家學(xué)者參會發(fā)言。來自國內(nèi)外的專家,以及各省市考試機(jī)構(gòu)、高校和中學(xué)、科研部門的200 余位專業(yè)人士參加會議,研討交流最新的評價(jià)理論與實(shí)踐成果。
深化考試命題改革是新時代推進(jìn)育人方式改革的重點(diǎn)任務(wù),也是世界關(guān)注的教育關(guān)鍵環(huán)節(jié)和重點(diǎn)研究的領(lǐng)域,通過測評來優(yōu)化學(xué)習(xí)方式、完善考試評價(jià)體系,是發(fā)展素質(zhì)教育、切實(shí)引導(dǎo)各級各類學(xué)校轉(zhuǎn)變育人方式的重要途徑。
隋朝產(chǎn)生的科舉制度打破了世襲關(guān)系和世族的壟斷,實(shí)現(xiàn)了普通老百姓通過讀書進(jìn)入社會上層的階層流動,正所謂“朝為田舍郎,暮登天子堂”。隨著時代的發(fā)展,現(xiàn)代教育實(shí)踐不斷推動教育考試的改革發(fā)展,然而約定俗成的觀念是“考試就是測評”。測評極高的競爭性結(jié)果產(chǎn)生的成功者和失敗者,其結(jié)果誠如上海市教育考試院院長鄭方賢總結(jié)的那樣,“實(shí)際只有一部分人甚至是極小部分人才能展示優(yōu)秀的能力、突出的表現(xiàn),并由此獲得獎勵和自信,大多數(shù)人卻很難實(shí)現(xiàn)優(yōu)秀和獲得自尊”。雖然不斷進(jìn)步的技術(shù)為測評的科學(xué)性和客觀性提供了技術(shù)保證,但是,終結(jié)性評價(jià)的方式“反映被測學(xué)生過去的積累,而不是全部能力,也無益于學(xué)生在學(xué)習(xí)上的自我完善與能力提升,反而會引起更大的考試焦慮,扭曲學(xué)習(xí)動機(jī),并形成強(qiáng)烈的‘應(yīng)試’學(xué)習(xí)模式”?;厮莞母镩_放40年,我國不斷改革高考制度、回應(yīng)社會關(guān)切,針對“應(yīng)試教育”的頑瘴痼疾,為破解一考定終身的難解之題進(jìn)行了艱辛探索。鄭方賢院長回顧了新高考推動下,上海聚焦考試評價(jià)這一核心關(guān)鍵進(jìn)行的富有成效的探索,結(jié)合上海市高中學(xué)業(yè)水平考試學(xué)生成績報(bào)告單、中學(xué)及區(qū)域分析報(bào)告的統(tǒng)計(jì)數(shù)據(jù),解讀了上海市教育考試院為加強(qiáng)測評與教、學(xué)的融合,發(fā)揮基礎(chǔ)教育的反撥和促進(jìn)作用所開展的具體工作。
如何使測評有效促進(jìn)學(xué)習(xí),美國教育考試服務(wù)中心測評專家Randy 博士從最新的研究成果切入主題,圍繞形成性評價(jià)的概念、測評的基本原理及影響因素指出,形成性評價(jià)是一個連環(huán)活動,教師在課堂教學(xué)中要具備識別知識、過程、策略和思維方式等方面的能力,基于認(rèn)知的理論來規(guī)劃和調(diào)整課堂教學(xué)的方式、內(nèi)容和進(jìn)度,通過觀察學(xué)生的表現(xiàn),立足于證據(jù)的推理,進(jìn)而更好地因材施教、因人施教。如何提高形成性評價(jià)的質(zhì)量和影響,Randy 博士認(rèn)為,教師和學(xué)生之間要有互動,教師要能夠設(shè)置不同的情境讓學(xué)生展示出能力,然后收集證據(jù),基于證據(jù)采取行動促進(jìn)學(xué)生的學(xué)習(xí)。形成性評價(jià)中,教師要不斷強(qiáng)化形成性實(shí)踐,把形成性評價(jià)和基于證據(jù)的推理聯(lián)系起來,運(yùn)用反向推理的原則,把學(xué)生的能力表征出來,并將觀察到的學(xué)生具備的能力強(qiáng)化。在形成性評價(jià)中,教師的不斷自我反思和形成性實(shí)踐的質(zhì)量非常重要,理想的情況是,教師還應(yīng)該不斷培養(yǎng)學(xué)生同樣的自我反思和自我調(diào)節(jié)的能力,進(jìn)而達(dá)到在授課過程中開發(fā)學(xué)生能力的目標(biāo)。
考試、教學(xué)和考試結(jié)果的使用,三者構(gòu)成一個系統(tǒng),要發(fā)揮系統(tǒng)的作用,三者必須協(xié)調(diào),并且各司其職、各盡其責(zé),只有處理好各自的關(guān)系,才能夠做到有效測試、有效教學(xué)和有效使用,取得整個系統(tǒng)的最佳效果。楊惠中教授認(rèn)為,考試不可能解決教育中存在的一切問題,因此,考試的作用是有限的??荚囀且环N教育服務(wù),要使考試成為有效測試,必須提高服務(wù)質(zhì)量。效度是有效測試的核心問題,信度是檢驗(yàn)考試質(zhì)量的另一個重要指標(biāo)。從教育考試與心理測量學(xué)的專業(yè)角度出發(fā),人們在不斷探索改革的方向和方法。針對一考定終身的頑疾,楊教授探討了校內(nèi)的形成性測試——校本評核的開發(fā)工作,從價(jià)值理念、實(shí)施細(xì)節(jié)、應(yīng)用途徑、技術(shù)支持等方面分享了已經(jīng)開展的實(shí)驗(yàn)研究與培訓(xùn)工作。他指出,考試產(chǎn)生的反撥作用極其復(fù)雜,同一個考試,可能產(chǎn)生不同的結(jié)果,而決定課堂教學(xué)面貌、影響學(xué)生學(xué)習(xí)成就的因素也非常復(fù)雜。校本評核要發(fā)揮有效測評的作用需要很多先決條件,例如,滿足心理測量學(xué)的專業(yè)要求,明確考試的性質(zhì)和目的,將統(tǒng)一的標(biāo)準(zhǔn)化考試與校本評核相結(jié)合,建立科學(xué)的等級量表,對教師進(jìn)行全面的語言測試培訓(xùn),等等。楊教授指出,考試是國家的教育主權(quán),必須建立有自己特色的、科學(xué)的、符合國際教育測量學(xué)專業(yè)標(biāo)準(zhǔn)的、能夠與國際接軌的教育考試體系。
聚焦考試開發(fā)以及不同考試劃界的標(biāo)準(zhǔn),來自英國劍橋大學(xué)考評院的Nicholas Raikes 結(jié)合英國考試的背景、考試標(biāo)準(zhǔn)的設(shè)定因素,以及將不同考試形成可比性的運(yùn)作方式,指出:標(biāo)準(zhǔn)與內(nèi)容相關(guān),包含知識、技能及其他相關(guān)的能力;標(biāo)準(zhǔn)包含不同的難度和水平表現(xiàn);行為表現(xiàn)的標(biāo)準(zhǔn)能否測定需要看學(xué)生的行為表現(xiàn)?;跇?biāo)準(zhǔn)參考的考試,能夠反映出學(xué)生在考試中的表現(xiàn)和在一個群體中的位置。設(shè)定標(biāo)準(zhǔn)要把學(xué)生的能力、素質(zhì)相銜接,體現(xiàn)不同級別的變化,不同的級別表現(xiàn)出不同的能力,與相應(yīng)的素質(zhì)相關(guān)。同時,保持標(biāo)準(zhǔn)還需要確??荚嚇?biāo)準(zhǔn)隨著時間推移具有可比性。以英國普通中學(xué)教育證書考試(GCSE)為例,這是一項(xiàng)針對16 歲以上學(xué)生的資質(zhì)考試,涉及9門學(xué)科,每門學(xué)科成績都根據(jù)分?jǐn)?shù)進(jìn)行等級劃分,學(xué)生成績通過等級反映出來。證書考試一方面提供學(xué)生學(xué)業(yè)情況掌握程度的證據(jù),為后續(xù)的學(xué)業(yè)、職業(yè)學(xué)習(xí)和就業(yè)奠定基礎(chǔ);另一方面,為學(xué)校及大學(xué)提供所有學(xué)生表現(xiàn)的基本依據(jù),在學(xué)生中進(jìn)行選拔,并判斷學(xué)生未來能否成功,因此,這也是一個選拔的標(biāo)準(zhǔn)。GCSE 在英國有不同的資質(zhì)認(rèn)定機(jī)構(gòu),學(xué)生可以自行選擇考試科目以及認(rèn)證機(jī)構(gòu)。為了確保不同機(jī)構(gòu)分?jǐn)?shù)等級以及不同年份考生成績可比,就需要進(jìn)行結(jié)果的可比性認(rèn)證。Nicholas 介紹了成績可比的基本做法:參照學(xué)生以前的成績,選擇參照年份以沿用當(dāng)年的標(biāo)準(zhǔn),計(jì)算出參照年份的學(xué)習(xí)成績與GCSE 成績之間的關(guān)系,通過這個關(guān)系來預(yù)測當(dāng)前GCSE 成績等級的劃分,最后設(shè)置GCSE 等級分界分,從而實(shí)現(xiàn)預(yù)測的等級分布。在總結(jié)發(fā)言中他指出,成績可比是維持結(jié)果標(biāo)準(zhǔn)的一種技能,保持相對穩(wěn)定的前提是相對穩(wěn)定的內(nèi)容標(biāo)準(zhǔn)和需求標(biāo)準(zhǔn),同時還需使用能力的標(biāo)準(zhǔn),并結(jié)合專家的意見,只有這樣,才能使結(jié)果更加合理。
新高考改革中實(shí)施學(xué)業(yè)水平考試是制度設(shè)計(jì)的重點(diǎn),選考賦分是方案實(shí)施的難點(diǎn),來自不同國度的專業(yè)人士以不同國情的案例分析和方案設(shè)計(jì),激蕩思維,拓展思路,激發(fā)與會者的共鳴。
澳大利亞的Stephen 博士,分享了維多利亞十二年級學(xué)生科目的權(quán)重調(diào)整方案,交流了學(xué)生的學(xué)術(shù)能力因?qū)W科而表現(xiàn)不同、不同學(xué)科之間因難度不同而分?jǐn)?shù)不同的可比性問題的研究實(shí)踐工作。通過案例分析,他指出,權(quán)重調(diào)整的意義在于能夠顯示學(xué)生在群體中的真實(shí)能力,鼓勵學(xué)生敢于挑戰(zhàn)更具有競爭力的學(xué)科,可以跨越不同的州和不同的年度。華南師范大學(xué)心理學(xué)院的張敏強(qiáng)教授從我國高考改革的大背景出發(fā),從考生規(guī)模、考試命題模式、試卷使用情況、錄取模式、考試招生管理機(jī)構(gòu)等方面進(jìn)行分析,探討了大規(guī)模、多套卷、量級考生的測評大數(shù)據(jù)(高考)分析模式,以解決目前遇到的高考試題不可重復(fù)使用、社會難以接受調(diào)整分、考試分?jǐn)?shù)“分分計(jì)較”、不同年度測試結(jié)果等值困難等難題。他提出創(chuàng)新測量理論方法的應(yīng)用,選擇若干層面對教育考試大數(shù)據(jù)做出分析,如通過分層分析對試題評價(jià)、試卷與考生水平匹配分析對試卷與考生評價(jià)、不同省份同學(xué)科的比較分析對各省學(xué)科的測試情況及不同省份試卷質(zhì)量評價(jià)、以線性Logistic 測驗(yàn)?zāi)P偷臏y驗(yàn)等值分析對“一年兩考”或不同年度測試結(jié)果的評價(jià)等方式。山東省教育招生考試院的王希常博士根據(jù)新高考改革中選考科目等級賦分的情況,分析高考改革三個批次省市等級分?jǐn)?shù)轉(zhuǎn)換方案,比較不同等級分?jǐn)?shù)模型特點(diǎn),深入探討了適應(yīng)所有分?jǐn)?shù)轉(zhuǎn)換方法的統(tǒng)一標(biāo)準(zhǔn)的公式表示形式,為進(jìn)一步研究和解釋新高考等級分?jǐn)?shù)提供了一種創(chuàng)新的視角。上海復(fù)旦大學(xué)黃達(dá)博士認(rèn)為,選拔性考試需要對考生的能力進(jìn)行度量和排序,以此作為招生錄取的依據(jù)。當(dāng)前大規(guī)??荚嚩嘁钥偡譃榭忌哪芰Χ攘浚?dāng)出現(xiàn)重分時會出現(xiàn)考生能力難以區(qū)分的問題,如果考試結(jié)果分?jǐn)?shù)分布不均勻,區(qū)分度隨之降低的情況則更加嚴(yán)重,為此,他以增加信息量、降低重分現(xiàn)象、提高區(qū)分度的d 系數(shù)模型為基礎(chǔ),提出了基于試題難度的分?jǐn)?shù)重構(gòu)方案,供與會者探討。
深入推進(jìn)新高考的考試評價(jià)改革,滿足學(xué)生成長和人才培養(yǎng)的需求,需要多方合力,設(shè)計(jì)并實(shí)施好測評方案。上海市教育考試院賈林芝博士分享了基于問題解決的跨學(xué)科案例分析測評工作。根據(jù)測評開發(fā)工作的前期調(diào)研和抽樣數(shù)據(jù),結(jié)合試題案例分析,她指出:以核心概念形式組織的學(xué)科知識有助于提升學(xué)生邏輯推理與解決問題的能力,并將在未來深入研究“學(xué)生和專家不同的問題解決模式”背后的原因。華東師范大學(xué)朱廣天教授基于實(shí)證數(shù)據(jù)分析過往物理試題中學(xué)科核心素養(yǎng)的體現(xiàn)情況,分享了課題項(xiàng)目組針對性對部分物理學(xué)科核心素養(yǎng)的題目試測與結(jié)果評估開展的工作,提出了物理學(xué)科學(xué)業(yè)水平考試評價(jià)維度與指標(biāo)體系。上海市曹楊中學(xué)楊琳校長介紹了學(xué)校通過環(huán)境素養(yǎng)培育,開展的普通高中特色教育工作,結(jié)合工作實(shí)踐的思考,她認(rèn)為后續(xù)工作要將環(huán)境素養(yǎng)評價(jià)與綜合素質(zhì)評價(jià)有機(jī)結(jié)合,更好地發(fā)揮評價(jià)的激勵和導(dǎo)向作用。隨著考試數(shù)據(jù)不斷增長和積累,如何管理、優(yōu)化、挖掘和利用這些題庫中的海量數(shù)據(jù),國家題庫建設(shè)也面臨著諸多革新,教育部考試中心佟威老師提出,要加強(qiáng)用戶管理,構(gòu)建豐富的用戶管理模型;強(qiáng)化素材管理,為命制豐富多樣的試題打基礎(chǔ);優(yōu)化試題查重,借助大數(shù)據(jù)和人工智能技術(shù),利用多種算法提高試題查重的準(zhǔn)確性,探索以數(shù)據(jù)驅(qū)動的題庫開發(fā)建設(shè)模式。
高考改革承載著國家建設(shè)的育人目標(biāo),也堅(jiān)守著教育發(fā)展的內(nèi)在價(jià)值,對高校而言,應(yīng)加強(qiáng)與中學(xué)人才培養(yǎng)的互動銜接,結(jié)合學(xué)校定位和專業(yè)培養(yǎng)目標(biāo)科學(xué)選才,發(fā)揮對基礎(chǔ)教育的育人導(dǎo)向作用。愛爾蘭都柏林圣三一學(xué)院的Dominique女士,從宏觀視角介紹了愛爾蘭教育體系,以及愛爾蘭資格框架作為教育質(zhì)量評估系統(tǒng),與國家所有教育體系相對應(yīng),用以幫助學(xué)生對標(biāo)學(xué)業(yè)和自我管理的情況。根據(jù)圣三一學(xué)院入學(xué)標(biāo)準(zhǔn),她介紹了學(xué)校對于本科生及研究生的入選標(biāo)準(zhǔn)設(shè)置工作,并探討了不同來源國際生的學(xué)業(yè)標(biāo)準(zhǔn)對標(biāo)工作。復(fù)旦大學(xué)朱曉超老師分享了高校與高中教育銜接的探索工作。為順應(yīng)新高考的變化,復(fù)旦大學(xué)和上海中學(xué)攜手開展文科基地班、理科基地班合作培養(yǎng)模式,以高中作為培養(yǎng)主體,把大學(xué)教學(xué)方式、理念與高中銜接,將大學(xué)的培養(yǎng)理念前置到高中,重在拓展學(xué)生的視野和思路,發(fā)展學(xué)生的思維能力和核心素養(yǎng),以過程性評價(jià)為大學(xué)綜合素質(zhì)評價(jià)奠定基礎(chǔ),推動學(xué)生在學(xué)習(xí)方式和思維方式上的轉(zhuǎn)變。南京工業(yè)大學(xué)的季青春老師從科學(xué)科目、等級賦分制、綜合素質(zhì)評價(jià)的視角開展研究,采用實(shí)證分析的方法進(jìn)行探索,建議高校根據(jù)高考科目與各自專業(yè)的相關(guān)性加強(qiáng)政策引導(dǎo),并結(jié)合創(chuàng)新技術(shù)提高綜合素質(zhì)評價(jià)的科學(xué)性,以構(gòu)建新的遴選錄取路徑。承接學(xué)生升學(xué)路徑這一議題,上海市教育考試院李立峰博士以2019 屆上??忌鸀槔Y(jié)合上海高中生近三年20 種選考組合年度錄取情況比對分析,提出加強(qiáng)高中生涯規(guī)劃指導(dǎo)、加強(qiáng)高中選科指導(dǎo)、加強(qiáng)高校招生標(biāo)準(zhǔn)研究、優(yōu)化等級考方案等政策建議。
如何從學(xué)生認(rèn)知的視角培養(yǎng)學(xué)生的跨學(xué)科能力素養(yǎng)?上海市教育考試院與美國教育考試服務(wù)中心合作開展了K-12 科學(xué)素養(yǎng)測評項(xiàng)目,并以此為載體,進(jìn)行科學(xué)測評能力模型建構(gòu)和命題編制的研究,以實(shí)踐探索回應(yīng)了這個問題。
K-12 測評項(xiàng)目組結(jié)合具體教學(xué)內(nèi)容,將理論融入實(shí)踐探索。以科學(xué)中“力與運(yùn)動”為例,總結(jié)學(xué)習(xí)進(jìn)階層級編制的具體研究,通過對學(xué)生的訪談和試測等反復(fù)修正進(jìn)階設(shè)定的過程,項(xiàng)目組更深刻地理解了知曉學(xué)生在學(xué)習(xí)中的位置及其實(shí)際能力的重要意義。以試題樣例為切入點(diǎn),項(xiàng)目組介紹了從試題設(shè)計(jì)、認(rèn)知實(shí)驗(yàn)和試題修改,到學(xué)習(xí)進(jìn)階文本修改,最終形成試測試題的工作流程,體會構(gòu)建學(xué)習(xí)進(jìn)階的優(yōu)化、迭代過程。此外,項(xiàng)目組開展了建構(gòu)科學(xué)學(xué)科測試能力模型的科學(xué)實(shí)踐與核心概念的確立過程研究,教師們從認(rèn)識變化到行動跟進(jìn),聯(lián)系教學(xué)實(shí)際不斷調(diào)整能力評價(jià)方式,并基于評價(jià)結(jié)果調(diào)整教學(xué)策略,促進(jìn)了學(xué)生思維能力的培養(yǎng)。
課程改革的重點(diǎn)是提高學(xué)生的核心素養(yǎng),K-12 項(xiàng)目研究中,教師們從知識立意向能力立意、素養(yǎng)立意不斷努力,在試題模型設(shè)計(jì)中通過測試分析、基于評價(jià)的結(jié)果來發(fā)現(xiàn)教與學(xué)中存在的問題,提高教學(xué)的有效性,為提高學(xué)生分析問題和解決問題的能力奠定了基礎(chǔ)。結(jié)合課程改革,項(xiàng)目組代表從學(xué)校的視角分享了以課題為抓手將科學(xué)課程等國家課程校本化的實(shí)施過程;以科學(xué)論證為例,教師們交流了初中科學(xué)課堂中對學(xué)生進(jìn)行論證能力培養(yǎng)的實(shí)踐研究;立足課堂教學(xué),基地學(xué)校從學(xué)生發(fā)展的視角,以學(xué)科評價(jià)體系和學(xué)生學(xué)習(xí)行為分析為抓手,分享了項(xiàng)目組開展的探索實(shí)踐。
借助科學(xué)高效的在線考試系統(tǒng),提升考試管理的成效,是推進(jìn)考試改革、實(shí)現(xiàn)考試現(xiàn)代化的重要表征。美國教育考試服務(wù)中心的技術(shù)專家Peter 和Mankit 合作分享了在線考試系統(tǒng)的設(shè)計(jì)和開發(fā)技術(shù),并結(jié)合拓展性、可用性和便捷性的特點(diǎn)說明了在線考試平臺的運(yùn)行情況。John Peng介紹了美國教育考試服務(wù)中心的題庫設(shè)計(jì)開發(fā)工作,介紹了用數(shù)字方式呈現(xiàn)命題內(nèi)容、結(jié)構(gòu)和特點(diǎn)的方法,并提示題庫系統(tǒng)建設(shè)中需要考慮命題可重復(fù)使用、原數(shù)據(jù)可記錄、流程可追溯等因素??拼笥嶏w研究院副院長竺博通過視頻展示,詳細(xì)介紹了人工智能在英語聽說評測中的技術(shù)應(yīng)用。上海市教育考試院王彬宇老師介紹了以安全設(shè)施為考慮,創(chuàng)新開展的基于雙因素認(rèn)證的網(wǎng)上收發(fā)卷探索實(shí)踐,以及由此提升考務(wù)管理成效的工作與思考。吉林省教育考試院的孫剛老師通過對試題屬性進(jìn)行分析,提出試題部件的概念。以填空題為例,他提出從試題測評的特征入手,設(shè)計(jì)測評規(guī)則,提高閱卷和評卷效率,加強(qiáng)后續(xù)測評的針對性,進(jìn)而有效提升教學(xué)和命題質(zhì)量的思考和實(shí)踐。對應(yīng)機(jī)考模式,試題命制需要進(jìn)行大量的創(chuàng)新和研究,上海市教育考試院李子明老師通過機(jī)考與紙筆考試案例對比,分析了機(jī)考測試在試題形態(tài)和能力考查上的優(yōu)勢所在,梳理了上海市合格考機(jī)考試測的工作流程,并結(jié)合學(xué)科實(shí)例進(jìn)行實(shí)施要點(diǎn)分析。深圳市海云天科技股份有限公司王湘波博士總結(jié)了與上海市教育考試院合作開展的計(jì)算機(jī)與紙筆考試可比性研究的成果。
國務(wù)院《關(guān)于新時代推進(jìn)普通高中育人方式改革的指導(dǎo)意見》,要求全面貫徹黨的教育方針,落實(shí)立德樹人根本任務(wù),發(fā)展素質(zhì)教育,深化育人關(guān)鍵環(huán)節(jié)和重點(diǎn)領(lǐng)域改革,并提出要建立科學(xué)的教育評價(jià)和考試招生制度的改革目標(biāo),構(gòu)建全面培養(yǎng)體系。為統(tǒng)籌推進(jìn)新時代育人目標(biāo)的實(shí)現(xiàn),回歸測量服務(wù)于教育教學(xué)與學(xué)生成長的本真,真正實(shí)現(xiàn)“測量也是學(xué)習(xí)”的目標(biāo),教育招考戰(zhàn)線的工作者肩負(fù)著時代賦予的重大責(zé)任和使命。
美國大學(xué)入學(xué)考試中心的Changhua Sun Rich 博士分享了ACT 研制開發(fā)的人才全面發(fā)展理論框架以及投入實(shí)施的學(xué)習(xí)測評系統(tǒng):ACT 以實(shí)證研究支持系統(tǒng)開發(fā),將考試大綱與心理測量方法相結(jié)合,用數(shù)據(jù)建立完整的量尺,提供教育教學(xué)的終結(jié)性測評,提供師生家長教與學(xué)的過程信息。關(guān)聯(lián)系統(tǒng)的解析數(shù)據(jù),考試機(jī)構(gòu)可以研究預(yù)判學(xué)生的學(xué)術(shù)能力;對標(biāo)系統(tǒng)的能力指標(biāo),教師可以調(diào)整教學(xué)進(jìn)度,學(xué)生可以進(jìn)行學(xué)習(xí)的自我監(jiān)測。系統(tǒng)通過將測評和教學(xué)有機(jī)融合,有效促進(jìn)了學(xué)生的成長。胡惠雅博士分享了美國大學(xué)入學(xué)考試中心開發(fā)的ACTNext 項(xiàng)目,結(jié)合案例介紹了該項(xiàng)目的設(shè)計(jì)理念以及運(yùn)作方式。以促進(jìn)學(xué)生個性化學(xué)習(xí)為目標(biāo),這個用于學(xué)習(xí)測評且基于人工智能的推薦及診斷的引擎系統(tǒng),通過收集最初級的技能以了解學(xué)生的水平,進(jìn)而進(jìn)行跟蹤,推薦分享學(xué)習(xí)資源,支持學(xué)生的學(xué)習(xí)過程,學(xué)生可以了解自己的學(xué)習(xí)進(jìn)展,并根據(jù)引擎的導(dǎo)航功能進(jìn)行生涯規(guī)劃。
借鑒國際經(jīng)驗(yàn),化為本土實(shí)踐,廣西師范大學(xué)吳柳燕老師分享了以PISA 科學(xué)情境框架為主要依據(jù),構(gòu)建本土化情境分類框架的研究工作。通過試題舉例,分類展示了生活情境、自然情境、環(huán)境情境、科學(xué)實(shí)踐情境以及技術(shù)與工程情境試題,基于不同類型情境試題的學(xué)生得分統(tǒng)計(jì)結(jié)果,她建議以研究幫助命題者更加準(zhǔn)確地理解情境,提高試題情境設(shè)置的有效性和科學(xué)性,鼓勵教師更多地開展情境教學(xué),在教學(xué)過程中加強(qiáng)與生活、自然、環(huán)境、科學(xué)實(shí)踐和技術(shù)與工程等方面應(yīng)用的聯(lián)系,創(chuàng)設(shè)生動的學(xué)習(xí)情境,以有效提升學(xué)生的學(xué)科素養(yǎng)。如何考查學(xué)生的科學(xué)推理能力?廣州市增城中學(xué)謝潔純老師以化學(xué)圖表題為研究對象,從學(xué)科知識、推理任務(wù)、推理依據(jù)、推理機(jī)制、圖表解讀和問題解決等六個維度構(gòu)建了基于圖表考查的科學(xué)推進(jìn)能力構(gòu)成模型,并運(yùn)用SOLO 分類理論,建構(gòu)評價(jià)標(biāo)準(zhǔn),編制試題,采用樣本測試,通過數(shù)據(jù)分析解讀了學(xué)生在圖和表專題不同維度上的差異表現(xiàn)。
測評素養(yǎng)是實(shí)施測評的重要基礎(chǔ),來自不同國度的測評專家從不同的視角圍繞測評素養(yǎng)主題開展交流。英國劍橋大學(xué)英語考評部Hanan 女士,以測評改善教學(xué)的研究案例指出,不應(yīng)將測評與教師的表現(xiàn)掛鉤去考評教學(xué)效果,通過測評結(jié)果去發(fā)現(xiàn)學(xué)生學(xué)習(xí)過程中的優(yōu)勢和劣勢,進(jìn)而提供學(xué)習(xí)的幫助,才是極為重要的目標(biāo)。測評不是絕對因素,通過測評改善教學(xué),通過測評發(fā)現(xiàn)學(xué)習(xí)需求,都是測評需要關(guān)注的重要之處。以測評影響學(xué)生、教師、家長,增強(qiáng)學(xué)生的學(xué)習(xí)動機(jī),提升教師的自尊自信,吸引家長的合作參與,這些都是測評取得成功的重要條件。通過跨國案例的分析,她指出,項(xiàng)目設(shè)計(jì)是測試成功的一個條件,然而一個國家的文化背景也是需要考慮的重要因素。英國文化教育協(xié)會Johnathan 介紹了歐洲語言共同參考框架,這是針對歐洲所有語言所做的指導(dǎo)性、綱領(lǐng)性文件,該框架一方面對語言課程的標(biāo)準(zhǔn)、考試以及教材編寫具有重要的指導(dǎo)意義;另一方面,可以完成國家之間的互證,以不同語言層級精準(zhǔn)的描述為基礎(chǔ),從而促進(jìn)終身學(xué)習(xí),實(shí)現(xiàn)測試和教學(xué)的有效聯(lián)系。他分享了歐洲語言共同參考框架對接中國英語能力量表的研究工作,提出基于社會和認(rèn)知理論建立的中國英語能力量表,和歐洲語言共同參考框架一樣,也需要考慮課程、教學(xué)以及評價(jià)標(biāo)準(zhǔn)這些基本要素,同時,標(biāo)準(zhǔn)的銜接需要考慮本土化的需求,把國際標(biāo)準(zhǔn)本土化,使教師、學(xué)生和測試者從中受益。上海外國語大學(xué)鄒申教授以個人工作經(jīng)歷為線索,回顧了個人在語言測評方面從參加考綱制定、開展國家合作項(xiàng)目研究、設(shè)計(jì)大規(guī)??荚嚕窖邪l(fā)項(xiàng)目深入語言測試全流程的工作實(shí)踐。從專業(yè)成長的角度,她建議教師提高語言測評素養(yǎng)除了要具備基本的語言能力,更重要的是能夠多維度參與研究和工作實(shí)踐,增強(qiáng)知識儲備,加強(qiáng)學(xué)習(xí)和反思,以提升素養(yǎng)。潘鳴威教授回顧上海市高考改革歷程,分享了其在考試內(nèi)容以及考試形式的改革中參與的實(shí)踐探索,以及在英語一年兩考等值和試卷公平性等方面開展的重點(diǎn)研究工作。上海市教育考試院徐雯老師認(rèn)為,基于高考改革理念的推廣、命題教師隊(duì)伍的建設(shè)、科學(xué)測評對教學(xué)的正面反撥作用,英語教師急需提升測評素養(yǎng)。通過對上海高中英語教師測評素養(yǎng)現(xiàn)狀及需求進(jìn)行調(diào)查分析,她認(rèn)為,測評素養(yǎng)要結(jié)合教師群體的實(shí)際情況,針對大多數(shù)教師有培訓(xùn)的需求,且更關(guān)注試題命制的具體方法,今后要開展針對性培訓(xùn),并普及除試題命制外確保測評科學(xué)性的其他相關(guān)內(nèi)容。
“為考試的學(xué)習(xí)”“為評價(jià)的學(xué)習(xí)”“為學(xué)習(xí)的評價(jià)”“測評也是學(xué)習(xí)”,反映了時代變遷中教育評價(jià)理念的變化,更深刻透視出的是教育評價(jià)在內(nèi)容、形式、方向和理念上的明晰與端正。習(xí)近平總書記在全國教育大會上指出,要深化教育體制改革,健全立德樹人落實(shí)機(jī)制,扭轉(zhuǎn)不科學(xué)的教育評價(jià)導(dǎo)向,堅(jiān)決克服唯分?jǐn)?shù)、唯升學(xué)、唯文憑、唯論文、唯帽子的頑瘴痼疾,從根本上解決教育評價(jià)指揮棒問題。圍繞考試評價(jià)與學(xué)生學(xué)習(xí)的關(guān)系,不同國家的教育、考試機(jī)構(gòu)的專家,面對深入發(fā)展的考試改革的共同主題,結(jié)合實(shí)踐,追溯歷史,研討議題涵蓋國內(nèi)外前沿研究成果,既有理論的分享和方案的介紹,也有實(shí)踐的運(yùn)用和技術(shù)的分析。會議基于中國高考綜合改革的大背景,匯聚了不同研究工作背景和不同發(fā)展階段的國內(nèi)外專家,把測評的發(fā)展與改革的歷程,同上海高考改革實(shí)踐、全國高考綜合改革形勢、國際教育發(fā)展趨勢等命題融合梳理,并考量分析,集前瞻性、思想性和建設(shè)性為一體,對焦問題提供方案,激蕩思維引發(fā)共鳴,必將對于未來更好地提升我國高考綜合改革的深入思考和廣泛交流產(chǎn)生深遠(yuǎn)的影響。