周悅琪,肖 洋,熊建文
華南師范大學(xué)物理學(xué)院,廣州 510006
新一輪課程改革特別強調(diào)對學(xué)科核心素養(yǎng)進行有效評價?!镀胀ǜ咧形锢碚n程標(biāo)準(zhǔn)(2017年版2020 年修訂)》(以下簡稱《課標(biāo)》)特別指出:“要加強旨在培養(yǎng)物理學(xué)科核心素養(yǎng)的物理學(xué)科評價方法研究與創(chuàng)新”[1]。然而,傳統(tǒng)評價往往局限于認(rèn)知領(lǐng)域,并且常造成知識與技能的割裂,難以滿足對核心素養(yǎng)整體性與綜合性評價的需求[2-3]。如何落實課程標(biāo)準(zhǔn)的要求、實施核心素養(yǎng)導(dǎo)向的教學(xué)評價,是當(dāng)下物理教學(xué)亟待解決的一個關(guān)鍵問題。
美國《新一代科學(xué)評價》(Next Generation Science Assessment,簡稱NGSA)的頒布,為落實學(xué)科核心概念(Disciplinary Core Ideas,DCI)、科學(xué)與工程實踐(Science and Engineering Practices,SEP)、跨學(xué)科概念(Crosscutting Concepts,CC)三維整合學(xué)習(xí)的評價提供了依據(jù)。本文通過分析該文件落實三維整合的評價設(shè)計,為我國高中物理教學(xué)實施核心素養(yǎng)導(dǎo)向的評價提供啟示。
21 世紀(jì)以來,美國基礎(chǔ)教育階段的學(xué)生在國際大型科學(xué)教育測評中的表現(xiàn)不佳,被歸結(jié)于國家層面的標(biāo)準(zhǔn)與地區(qū)層面課程、教學(xué)和評估的不一致[4]。為此,美國國家研究理事會在2011 年頒布了《K-12 年級科學(xué)教育框架:實踐、跨學(xué)科概念和核心概念》(以下簡稱《框架》),首次正式提出學(xué)科核心概念、跨學(xué)科概念、科學(xué)與工程實踐三維整合與連貫發(fā)展理念[5]。基于此,2013年頒布的《新一代科學(xué)標(biāo)準(zhǔn)》(Next Generation Science Standards,簡稱NGSS)進一步以表現(xiàn)期望為核心實現(xiàn)了橫向的三維整合,闡明學(xué)生在完成各階段學(xué)習(xí)后掌握所學(xué)內(nèi)容應(yīng)表現(xiàn)出的外顯行為[6]。在此基礎(chǔ)上,基于NGSS 的課程開發(fā)、教師專業(yè)發(fā)展、教學(xué)和評價受到了持續(xù)關(guān)注[4,7]。但由于《框架》僅描述了各階段的評價目標(biāo),NGSS 僅提出劃清測評標(biāo)準(zhǔn)的評估界限,2014 年頒布的《開發(fā)新一代科學(xué)標(biāo)準(zhǔn)的評價》厘清了實施符合《框架》與NGSS 愿景評價的現(xiàn)狀,指出了科學(xué)學(xué)業(yè)評估系統(tǒng)的改革應(yīng)持續(xù)努力的方向[8]。最終,2018 年頒布的《新一代科學(xué)評價》(NGSA)系統(tǒng)地提出了符合《框架》與NGSS 愿景的評價開發(fā)流程、課堂評價任務(wù)案例,為有效測量學(xué)生在三維整合表現(xiàn)期望的達(dá)成程度提供了指引[9]。
在上述背景下產(chǎn)生的NGSA 主張以“可用知識”為核心理念,采用“以證據(jù)為中心”的評價任務(wù)設(shè)計模式,實施三維整合評價。“可用知識”是指學(xué)生對知識的深入理解及應(yīng)用于情境實踐解決問題的能力,對于應(yīng)用科學(xué)思想解決現(xiàn)實問題具有至關(guān)重要的作用[10-14]。在“可用知識”的指導(dǎo)下,NGSS 概括出學(xué)生應(yīng)知道什么及能做什么,并明確表述為三維整合的表現(xiàn)期望,指引著NGSA有效實施三維整合評價[14]?!耙宰C據(jù)為中心”的設(shè)計模式以“評價是基于證據(jù)的推理過程”為基礎(chǔ),強調(diào)要推斷出學(xué)生知道什么以及程度如何,需要以學(xué)生所說、所做的具體表現(xiàn)作為證據(jù)支持[15]?;谶@一模式,NGSA 系統(tǒng)地將表現(xiàn)期望拆解為一條或一系列學(xué)習(xí)表現(xiàn),提供了更多可作為證據(jù)的細(xì)節(jié),指導(dǎo)了評價任務(wù)的設(shè)計[16]。最終創(chuàng)建出的評價任務(wù)可在教學(xué)過程中使用,并獲得效度較高的證據(jù),以證明學(xué)生正逐步達(dá)到NGSS 中的表現(xiàn)期望,實現(xiàn)“教-學(xué)-評”一致性[9]。
“以證據(jù)為中心”的設(shè)計模式指向三大核心問題:測評什么、如何測評以及使用什么測評。圍繞上述問題,NGSA 將評價任務(wù)的設(shè)計過程分為6 個步驟(圖1)。首先,評價目標(biāo)的確定往往以具體的目標(biāo)表現(xiàn)期望為依據(jù),回答了“測評什么”(步驟①)。其次,“如何測評”要求在分析如何建立學(xué)生外顯行為表現(xiàn)與測評目標(biāo)水平之間聯(lián)系的基礎(chǔ)上,具體闡明能證明學(xué)生外顯行為表現(xiàn)的證據(jù)(即領(lǐng)域分析階段)。這一階段將NGSS 中的表現(xiàn)期望拆解后(步驟②),構(gòu)建整合圖清晰地描繪三個維度的詳細(xì)關(guān)系(步驟③)。最后,“使用什么測評”涉及到評價任務(wù)和評分量規(guī)的設(shè)計與開發(fā)?;陬I(lǐng)域分析的結(jié)果,重構(gòu)具體的學(xué)習(xí)表現(xiàn),制訂相應(yīng)的評價任務(wù)設(shè)計模式,描述提供給學(xué)生的任務(wù)情境,以引發(fā)能作為證據(jù)的學(xué)生行為表現(xiàn),依此設(shè)計評價任務(wù)及評分量規(guī),對應(yīng)步驟④至步驟⑥。
圖1 NGSA 中評價任務(wù)的設(shè)計過程
目標(biāo)表現(xiàn)期望通常可選取NGSS 中的一個或一系列表現(xiàn)期望作為依據(jù)。本文以初中(MS)物質(zhì)科學(xué)領(lǐng)域“物質(zhì)及其相互作用”學(xué)科核心概念(PS1)的第4 點要求(MS-PS1-4)為例,介紹評價任務(wù)的設(shè)計過程。該條目的表現(xiàn)期望為:構(gòu)建模型來預(yù)測描述粒子運動、溫度和純凈物物態(tài)如何隨熱能的變化而變化。
表現(xiàn)期望是對三維橫向整合的概括性描述,缺乏開發(fā)評價任務(wù)的細(xì)節(jié)指引,因此需要拆解表現(xiàn)期望[13]。拆解一般應(yīng)以文獻(xiàn)、教材或教學(xué)經(jīng)驗為依據(jù),明確表現(xiàn)期望涉及各維度的具體要素[17]。分析可知,MS-PS1-4 涉及“物質(zhì)的結(jié)構(gòu)與性質(zhì)”和“能量的定義”次級核心概念、“構(gòu)建和使用模型”的實踐、“因果關(guān)系”的跨學(xué)科概念。
在此基礎(chǔ)上對各維度的要素進行進一步的具體解構(gòu)。表1 為MS-PS1-4 學(xué)科核心概念維度的具體解構(gòu)情況。首先,應(yīng)準(zhǔn)確界定并細(xì)化“物質(zhì)的結(jié)構(gòu)與性質(zhì)”和“能量的定義”,如細(xì)化“物質(zhì)的結(jié)構(gòu)與性質(zhì)”包括“物質(zhì)是由不同類型的原子組成的……”。然后,明確學(xué)生學(xué)習(xí)該概念后應(yīng)達(dá)到的理解水平,如學(xué)生應(yīng)學(xué)習(xí)到“物質(zhì)是由原子和分子構(gòu)成的”。接著,確定評價邊界,即學(xué)生只需要知道什么或不需要知道什么,如明確指出學(xué)生不需要知道熱量和溫度之間的關(guān)系。最后,基于已有的文獻(xiàn)、調(diào)查或教學(xué)經(jīng)驗,判斷學(xué)生需要掌握的先前知識、認(rèn)知難點,如學(xué)生已經(jīng)能建立模型來描述物質(zhì)的微觀組成,但可能會持有“只有溫?zé)岬奈矬w才有能量”的前概念。類似的,對科學(xué)與工程實踐和跨學(xué)科概念兩個維度也主要依據(jù)其核心要素的定義或要求進行具體解構(gòu),從而闡明使用該核心要素需要的知識、技能、能力(knowledge、skills、abilities,KSAs),并確定其與其他要素的交集,在此省略[9,12]。
表1 對MS-PS1-4 在學(xué)科核心概念維度上的具體解構(gòu)情況
從三個維度對目標(biāo)表現(xiàn)期望展開的具體解構(gòu),奠定了構(gòu)建維度整合圖的基礎(chǔ)。維度整合圖以學(xué)科核心概念下屬概念間的關(guān)系為線索,以整合的方式說明了三個維度的具體內(nèi)容。如圖2 所示,“物態(tài)”概念需要“粒子間距離和相對位置”概念的支持,在學(xué)科核心概念上需要知道同一物質(zhì)的不同狀態(tài)是因為其粒子間距離和相對位置不同;在實踐維度上需要能構(gòu)建、使用和評估物質(zhì)的微觀粒子模型;在跨學(xué)科概念維度上需要知道模式的異同??梢?,維度整合圖進一步闡釋了表現(xiàn)期望的豐富內(nèi)涵,在整合各個維度的基礎(chǔ)上連貫表征目標(biāo)表現(xiàn)期望。
圖2 MS-PS1-4 的維度整合圖
NGSA 提出的學(xué)習(xí)表現(xiàn)(learning performance,LP)是在維度整合圖的基礎(chǔ)上構(gòu)造出可用于指導(dǎo)測評與教學(xué)的細(xì)節(jié)信息。基于MS-PS1-4 的維度整合圖,可構(gòu)造出多個逐漸復(fù)雜的學(xué)習(xí)表現(xiàn)。如表2 所示,LP1 描述了學(xué)習(xí)“物態(tài)”和“粒子間距離和相對位置”兩個下屬概念及其三維內(nèi)容的綜合表述,能基于粒子性質(zhì)來區(qū)別不同物態(tài);LP2要求學(xué)生考慮物態(tài)不變時熱能和粒子運動變化的關(guān)系;LP3 在LP1 和LP2 的基礎(chǔ)上要求考慮由于熱能變化而引起的物態(tài)變化,難度逐漸提高,由簡單到復(fù)雜,從而描述出學(xué)生逐步達(dá)到表現(xiàn)期望的具體表現(xiàn)。
表2 MS-PS1-4 的學(xué)習(xí)表現(xiàn)
針對每個學(xué)習(xí)表現(xiàn)需要制訂對應(yīng)的設(shè)計模式,從而為設(shè)計評價任務(wù)提供更詳細(xì)的指引。如表3 所示,針對LP2 的評價任務(wù)設(shè)計模式主要包括四個方面。一是主要考查的知識、技能、能力(KSAs)及相應(yīng)的證據(jù)表述,其中KSAs 明確了復(fù)雜的學(xué)習(xí)表現(xiàn)中需要重點關(guān)注的方面,證據(jù)表述則是在此基礎(chǔ)上形成的對學(xué)生外顯行為表現(xiàn)特征的描述。二是其他知識、技能和能力,即學(xué)習(xí)表現(xiàn)不要求、卻是達(dá)成學(xué)習(xí)表現(xiàn)所必須的,包括先前掌握的學(xué)科知識、熟悉特定的科學(xué)表征,如學(xué)生要能夠構(gòu)建模型進行解釋,必須知道模型是一種解釋現(xiàn)象發(fā)生原因或機制的表征。三是評價任務(wù)的設(shè)計特征,包括必備特征和可變特征,前者保證任務(wù)能為評價學(xué)生在目標(biāo)學(xué)習(xí)表現(xiàn)上的成就水平提供證據(jù),后者則為適合特定需要的學(xué)生調(diào)控任務(wù)難度提供了可能。如必備特征限定了物態(tài)不變的條件并提示學(xué)生構(gòu)建模型,可變特征則指出可以選用不同的物態(tài)。四是彰顯評價的公平公正,確保任務(wù)對不同社會和文化背景的學(xué)生是公平公正的。如必備特征指出任務(wù)的情境要能適合不同文化背景和經(jīng)歷的學(xué)生,語言要通俗易懂以適應(yīng)不同語言能力的學(xué)生。
表3 針對LP2 的評價任務(wù)設(shè)計模式
設(shè)計模式為設(shè)計符合學(xué)習(xí)表現(xiàn)的評價任務(wù)提供了指南,通過改變?nèi)蝿?wù)特征可設(shè)計不同評價任務(wù)。NGSA 任務(wù)中可作為評價學(xué)生的證據(jù)非常豐富,如學(xué)生作答時的表述、圖畫、模擬交互。為收集這些多元的證據(jù),任務(wù)往往基于技術(shù)在計算機或手持設(shè)備上完成,教師不僅更容易實施評價,還可以通過計算機自動化評分即時診斷學(xué)生情況,在此基礎(chǔ)上進行補救[18]。
圖3 是針對LP2 的評價任務(wù)示例,通過視頻展示了染料在不同溫度的水中以不同速度擴散的現(xiàn)象,要求學(xué)生在計算機輔助下構(gòu)建模型描述水粒子和染料粒子的變化(簡稱“染料擴散”)。該任務(wù)體現(xiàn)了必備特征和可變特征的要求,所呈現(xiàn)的擴散現(xiàn)象不涉及物態(tài)變化,提示學(xué)生為模型加上圖例或標(biāo)簽。
針對特定任務(wù)所設(shè)計的評分量規(guī)呈現(xiàn)了教師實施評價時應(yīng)重點關(guān)注的要素(即主要的KSAs)及評價要點。表4 呈現(xiàn)了“染料擴散”任務(wù)中兩個要素的評分量規(guī):要素1 側(cè)重考查學(xué)生能否構(gòu)建模型(實踐)解釋熱傳遞和粒子運動速度的關(guān)系(核心概念),展示溫度對粒子運動的影響機制(跨學(xué)科概念);要素2 側(cè)重考查學(xué)生能否將熱傳遞與溫度變化、粒子的運動聯(lián)系起來(核心概念),使用所構(gòu)建的粒子模型(實踐)描述它們的關(guān)系(跨學(xué)科概念)??梢姡恳?guī)對每個要素的評價也一貫采用三維整合的方式,一般分為從初級到熟練3 個水平,體現(xiàn)各維度達(dá)成情況的同時,為解讀學(xué)生的發(fā)展情況提供了一個便于解釋的總分。
表4 針對LP2“染料擴散”任務(wù)的評分量規(guī)
針對《框架》和NGSS 中三維整合與連貫發(fā)展的“教-學(xué)-評”一致性的愿景,NGSA 提供的設(shè)計過程呈現(xiàn)出四方面的特點。第一,保持與《框架》和NGSS 的高度一致,以表現(xiàn)期望為起點進行評價設(shè)計。第二,創(chuàng)造性地提出了學(xué)習(xí)表現(xiàn),細(xì)致地描繪出學(xué)生在相應(yīng)表現(xiàn)期望下逐漸進階發(fā)展的過程,為實施三維整合評價提供了具有高度操作性的抓手。第三,重視真實情境創(chuàng)設(shè),引發(fā)學(xué)生展現(xiàn)其概念理解和實踐能力。第四,設(shè)計與三維整合相一致的詳細(xì)評分量規(guī),賦予分?jǐn)?shù)高度的解釋效力,使診斷學(xué)生在特定學(xué)習(xí)表現(xiàn)下的發(fā)展水平成為可能。NGSA 的上述特點,為我國高中物理教學(xué)實施學(xué)科核心素養(yǎng)導(dǎo)向的評價提供了若干啟示。
NGSA 始終以NGSS 中的表現(xiàn)期望為依據(jù),以三維整合及其連貫發(fā)展為理念,對表現(xiàn)期望進行拆解,詳細(xì)闡明具體的評價內(nèi)容。與三維整合的表現(xiàn)期望相對應(yīng)的是,我國《課標(biāo)》中的內(nèi)容要求明確提出了對物理學(xué)科核心素養(yǎng)四個方面的整合學(xué)習(xí)要求,并通過學(xué)業(yè)質(zhì)量水平描述學(xué)生素養(yǎng)發(fā)展過程中的關(guān)鍵特征。
我國核心素養(yǎng)導(dǎo)向的高中物理教學(xué)評價可以借鑒NGSA 的設(shè)計模式,圍繞內(nèi)容要求和學(xué)業(yè)質(zhì)量水平從四個方面進行拆解,明確細(xì)化評價內(nèi)容。以《課標(biāo)》中必修二2.2.2 關(guān)于“平拋運動”的內(nèi)容要求為例,可結(jié)合學(xué)業(yè)質(zhì)量水平的要求,從物理觀念、科學(xué)思維、科學(xué)探究、科學(xué)態(tài)度與責(zé)任四個方面明確細(xì)化評價內(nèi)容,如圖4 所示[1]。例如,針對內(nèi)容要求“通過實驗,探究并認(rèn)識平拋運動的規(guī)律”,結(jié)合科學(xué)探究方面水平3 的學(xué)業(yè)質(zhì)量描述“能分析數(shù)據(jù),發(fā)現(xiàn)特點,形成結(jié)論,嘗試用已有的物理知識進行解釋”,細(xì)化科學(xué)探究方面的評價內(nèi)容應(yīng)包括“能通過相等時間間隔物體下落高度、水平位移的實驗數(shù)據(jù),發(fā)現(xiàn)平拋運動豎直方向及水平方向運動的特點”。細(xì)化后的評價內(nèi)容可作為后續(xù)評價任務(wù)的設(shè)計基礎(chǔ)。
圖4 基于課程標(biāo)準(zhǔn)的“平拋運動”評價內(nèi)容
NGSA 將表現(xiàn)期望解構(gòu)后重構(gòu)出學(xué)習(xí)表現(xiàn),描繪了能推斷學(xué)生三維整合表現(xiàn)的證據(jù),向上承接了表現(xiàn)期望的要求,向下指引了具體評價任務(wù)的設(shè)計。我國《課標(biāo)》同樣要求“具體描述要體現(xiàn)學(xué)生在具體學(xué)習(xí)活動中的行為表現(xiàn)”[1]。為回應(yīng)這一要求,核心素養(yǎng)導(dǎo)向的高中物理教學(xué)評價也可以借鑒NGSA 的學(xué)習(xí)表現(xiàn),以細(xì)致刻畫學(xué)科核心素養(yǎng)的達(dá)標(biāo)證據(jù)。具言之,可以從學(xué)業(yè)質(zhì)量水平對學(xué)生學(xué)業(yè)發(fā)展不同階段典型特征的刻畫出發(fā),結(jié)合具體的內(nèi)容要求,清晰界定所考查的知識、能力和素養(yǎng),構(gòu)建一系列的學(xué)習(xí)表現(xiàn)。如選擇圖4 中的“認(rèn)識平拋運動的規(guī)律”“認(rèn)識到平拋運動是一種理想化模型”和“能明確平拋運動實驗中需要測量的物理量,由此設(shè)計實驗方案”作為評價內(nèi)容,構(gòu)建出學(xué)生達(dá)成“平拋運動”的學(xué)習(xí)表現(xiàn)之一:“學(xué)生利用平拋運動模型設(shè)計方案解決實際問題”,作為推斷學(xué)生能否將實際問題與平拋運動規(guī)律(物理觀念)聯(lián)系起來,認(rèn)識到平拋運動這一理想化模型與實際情況的區(qū)別(科學(xué)思維),并利用平拋運動模型設(shè)計方案解決實際問題(科學(xué)探究)的證據(jù),從而能較準(zhǔn)確地判斷學(xué)生的核心素養(yǎng)發(fā)展水平。
NGSA 在每個評價任務(wù)中嵌入真實情境,通過試題特征調(diào)控任務(wù)難度,以期全面考查學(xué)生的素養(yǎng)表現(xiàn)。我國《課標(biāo)》中同樣明確強調(diào)了“問題情境”,指出要在情境中對學(xué)生進行評價[1]?!吨袊呖荚u價體系》也規(guī)定以情境作為高考的考查載體,承載學(xué)科素養(yǎng)、關(guān)鍵能力等“四層”考查內(nèi)容[19]。
可見,全面考查素養(yǎng)發(fā)展離不開真實情境,且需要通過不同復(fù)雜程度的真實情境引發(fā)學(xué)生展現(xiàn)出不同水平的素養(yǎng)表現(xiàn),以全面考查學(xué)生物理學(xué)科核心素養(yǎng)的進階發(fā)展。如圖5 呈現(xiàn)了粵教版高中物理必修第二冊“平拋運動”中的三道習(xí)題,均采用了真實情境,且復(fù)雜程度逐漸提高,可用于評價學(xué)生逐漸發(fā)展的素養(yǎng)水平[20]。套圈游戲?qū)W(xué)生而言屬于熟悉情境,學(xué)生只需在該情境中簡單應(yīng)用常見的平拋運動模型。射擊模擬訓(xùn)練情境則相對復(fù)雜,學(xué)生需要綜合應(yīng)用平拋運動及豎直上拋運動等物理知識解決實際問題,經(jīng)過分析和推理判斷能否擊中目標(biāo)。農(nóng)田灌溉屬于較復(fù)雜的實際問題情境,學(xué)生需要將這一復(fù)雜情境中的對象(如“某一段水”)的運動過程轉(zhuǎn)換為物理模型(如“平拋運動”模型),結(jié)合已有的平拋運動知識設(shè)計方案,估算單位時間內(nèi)的出水量。因此,通過不同復(fù)雜度的情境任務(wù),對標(biāo)學(xué)業(yè)質(zhì)量不同水平,可全面考查學(xué)生物理學(xué)科核心素養(yǎng)的發(fā)展。
圖5 不同復(fù)雜程度的真實情境及所考查的素養(yǎng)水平
NGSA 中對三維整合的評價設(shè)計過程強調(diào)與NGSS 保持高度一致,并通過學(xué)習(xí)表現(xiàn)將學(xué)生的能力外顯化,提供更多的評價證據(jù),在情境中考查學(xué)生的三維能力表現(xiàn)。這對我國高中物理教學(xué)實施素養(yǎng)導(dǎo)向的評價提供了很好的經(jīng)驗與啟示:在高中物理課程標(biāo)準(zhǔn)的指導(dǎo)下,明確細(xì)化評價內(nèi)容;依據(jù)學(xué)業(yè)質(zhì)量水平,針對具體評價內(nèi)容,構(gòu)造學(xué)習(xí)表現(xiàn),以細(xì)致刻畫達(dá)標(biāo)證據(jù);并以真實情境為載體,設(shè)計相應(yīng)的評價任務(wù)、具體化評分標(biāo)準(zhǔn),從而全面有效地實施以素養(yǎng)為本的評價。這要求教師在評價時要重視課程標(biāo)準(zhǔn),重視學(xué)生能力表現(xiàn)的真實外顯化,提供更多的證據(jù),以期實現(xiàn)全面考查學(xué)生物理學(xué)科核心素養(yǎng)的發(fā)展。