国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

語文學業(yè)水平考試研究的國際前沿與發(fā)展趨勢

2024-06-06 00:00:00李倩董怡雯鄭國民
語文建設(shè) 2024年5期

編者按

語文學業(yè)水平考試不僅是衡量學生語文核心素養(yǎng)階段性發(fā)展水平的重要手段,而且是評價區(qū)域和學校教學質(zhì)量、改進教學的重要參考。《義務(wù)教育語文課程標準(2022年版)》《普通高中語文課程標準(2017年版2020年修訂)》根據(jù)核心素養(yǎng)立意的課程目標與課程內(nèi)容,在學業(yè)水平考試部分對命題原則、規(guī)劃、要求進行了優(yōu)化與升級。本期組織了三篇文章,探討語文學業(yè)水平考試的深刻變革與發(fā)展趨勢。

北京師范大學李倩、董怡雯、鄭國民從測評理念、測評設(shè)計、測評結(jié)果三個維度,梳理了語文學業(yè)水平考試研究的國際前沿成果。北京師范大學林江澤認為語文學業(yè)水平考試命題應(yīng)充分體現(xiàn)情境性、綜合性和探究性,通過理論和實例分析,闡釋了這三個特性的內(nèi)涵及其在命題中的表現(xiàn)。北京師范大學楊磊通過梳理既有研究結(jié)果,結(jié)合學業(yè)水平考試評分現(xiàn)實情況,總結(jié)適應(yīng)核心素養(yǎng)背景下語文學業(yè)水平考試評分標準變革的關(guān)鍵因素,并嘗試設(shè)計一套評分模式。希望這三篇文章為評估學生核心素養(yǎng)發(fā)展水平、促進“教—學—評”一體化提供有益參考。

【關(guān)鍵詞】語文學業(yè)水平考試;測評理念;測評設(shè)計;測評結(jié)果

以教育考試評價理念和實踐的變革加速課程內(nèi)容和教學方式的變革,是國際課程改革的重要實踐經(jīng)驗。[1]在《義務(wù)教育語文課程標準(2022年版)》中,根據(jù)核心素養(yǎng)立意的課程目標與課程內(nèi)容,學業(yè)水平考試部分對命題原則、規(guī)劃、要求進行了優(yōu)化與升級。變革語文學業(yè)水平考試的迫切性,不僅源于教育測評和評價自身理論、實踐的優(yōu)化與迭代,更是由核心素養(yǎng)這一育人目標的特殊性決定的。相比于知識和技能,核心素養(yǎng)內(nèi)在結(jié)構(gòu)復雜程度高、構(gòu)成要素之間的關(guān)聯(lián)性強。[2]這一屬性對已有的教育考試和評價實踐經(jīng)驗提出了新的挑戰(zhàn)。近年來,以經(jīng)濟合作與發(fā)展組織(OECD)、國際教育成就評價協(xié)會(IEA)為代表的國際教育組織和研究團隊,力圖在設(shè)計理念、理論假設(shè)、試題設(shè)計等方面開展創(chuàng)新性探索。為此,本研究立足語文學業(yè)水平考試變革的現(xiàn)實需求,聚焦國際核心素養(yǎng)測評理論和實踐研究,從“測評理念”“測評設(shè)計”“測評結(jié)果”三個維度,梳理并探究語文學業(yè)水平考試研究的國際前沿和發(fā)展趨勢。

一、測評理念:強調(diào)終結(jié)性與過程性評價理念的融合

終結(jié)性評價和過程性評價構(gòu)成了語文課程評價。前者強調(diào)以特定階段的學業(yè)水平考試成績來評價語文教和學的成效,后者則重視課堂教學以及日常學習中的過程性學業(yè)表現(xiàn)和成果的價值,以此作為提升和改進教學的客觀依據(jù)。在教學實踐中,終結(jié)性評價與過程性評價往往呈現(xiàn)出涇渭分明的狀態(tài),且其某一方面的特點被逐漸強化、放大,致使對評價的片面化認識愈加突出,如將終結(jié)性評價簡化為學業(yè)水平考試,過度關(guān)注其量化傾向和價值判斷功能;將課堂評價視作過程性評價的唯一方式,忽視其優(yōu)化學生學習的功能價值。事實上,區(qū)分兩種評價模式的關(guān)鍵并非評價工具的類型,更非評價結(jié)果的形態(tài),而是評價結(jié)果的使用及其同教和學之間的互動關(guān)系。換言之,無論是終結(jié)性評價,還是過程性評價,其根本目的在于促進課程目標的有效實現(xiàn),推動教學進程的深化。從這一角度出發(fā),任何教育評價的設(shè)計和實施都應(yīng)著眼于課程評價的系統(tǒng)性與整體性,既要關(guān)注不同評價模式之間的區(qū)別,更要推動彼此之間的互動與關(guān)聯(lián)。近年來,在價值取向和設(shè)計理念方面,越來越多國際教育測評項目開始強調(diào)“評價觀的一致性”“終結(jié)性與過程性評價理念的融合”。

所謂“評價觀”,是指對評價的基本內(nèi)涵、價值、功能的基礎(chǔ)性認知與理解。隨著教育測量和評價理論的不斷革新,對“評價是什么”這一核心問題的認識,不過度強調(diào)終結(jié)性或過程性的差異,而是強調(diào)對“評價”本質(zhì)屬性認識的一致與統(tǒng)一。受心理測量學的影響,教育考試評價往往被視為客觀測量和精準丈量學生內(nèi)在穩(wěn)定特質(zhì)或?qū)傩缘倪^程。這與教育發(fā)展的客觀現(xiàn)實存在著本質(zhì)性的矛盾和沖突。學生核心素養(yǎng)的形成、發(fā)展是一個動態(tài)變化的過程,會受到課程、教師、學習同伴、家庭等諸多因素的影響??荚囋u價應(yīng)隨學習進程的變化來測量、觀察、記錄學生的變化和發(fā)展,以此推測并解釋學生學習進程的變化趨勢和影響因素。因此,教育考試評價是以特定的教育目標為出發(fā)點,運用科學有效的工具,系統(tǒng)搜集與分析不同類型證據(jù),并作出推理與判斷的過程。[3]這個對評價的核心認識成為語文教育考試和評價設(shè)計的重要認識論基礎(chǔ)。美國教育考試服務(wù)中心研發(fā)的“認知視角的學習評價、促進與作為學習工具的評價系統(tǒng)”(CognitivelyBased Assessment of,for,and as Learning),其設(shè)計依據(jù)為以證據(jù)為中心的測評理論,強調(diào)“基于證據(jù)開展推論”的核心思想。[4]從本質(zhì)上來看,測評是以搜集與觀察到的學生真實學習表現(xiàn)為基礎(chǔ),推測其發(fā)展情況或水平的過程。[5]因此,有效采集與分析證據(jù)是教育評價實踐的關(guān)鍵。據(jù)此,英語語言藝術(shù)考試評價的設(shè)計至少要包括學生模型(闡述“評價什么”)、任務(wù)模型(描述“運用怎樣的任務(wù)開展評價”)、證據(jù)模型(說明任務(wù)模型如何為學生模型提供證據(jù))等部分。值得關(guān)注的是,除了作為認識論基礎(chǔ),這一思想還影響著測試數(shù)據(jù)的搜集。國際閱讀素養(yǎng)進展研究(Progress in International ReadingLiteracy Study,簡稱PIRLS)強調(diào)要通過拓展與學生閱讀素養(yǎng)表現(xiàn)密切相關(guān)的證據(jù)。[6]具體而言,除學生閱讀素養(yǎng)測試外,還會以調(diào)查問卷的方式,搜集學生所在國家的閱讀課程政策、家庭閱讀環(huán)境、教師閱讀教學行為、學生個人閱讀投入等相關(guān)信息,以此追蹤與系統(tǒng)刻畫全球范圍內(nèi)學生閱讀素養(yǎng)的發(fā)展趨勢。

要想打破終結(jié)性與過程性評價之間的絕對壁壘,即在設(shè)計學業(yè)水平測試過程中,有意識地吸納與嵌入過程性評價的觀念。兩種評價模式的“融合與整合”,鮮明地體現(xiàn)在“如何搜集證據(jù)”“搜集哪些證據(jù)”兩個方面。一般而言,學業(yè)水平測試中“問題”或“任務(wù)”的設(shè)置往往會關(guān)注學生了解與掌握的語文學科知識和技能。顯然,這與“評價促進學習”目標存在一定的距離。在測評任務(wù)設(shè)計上,還應(yīng)體現(xiàn)學生為什么會這樣思考問題,他們的理解和想法是如何產(chǎn)生的。換言之,要充分體現(xiàn)學生理解與解決語文學科關(guān)鍵問題的過程和結(jié)果,要給予學生立體而全面地呈現(xiàn)自身語文學習經(jīng)驗的空間和條件。以英國普通中等教育畢業(yè)考試(General Certificateof Secondary Education)為例,經(jīng)典文學作品的閱讀與理解是其重要考查內(nèi)容。因其選擇的作品多為篇幅較長、體量較大的整本書,測試任務(wù)的設(shè)計并未聚焦于主要內(nèi)容、關(guān)鍵人物、重要情節(jié)的淺層理解,而是通過設(shè)置指向作品深度閱讀的系列化問題,評估學生的閱讀質(zhì)量。以文學作品《安妮塔和我》為例,主要設(shè)計了三道試題:(1)通過閱讀選段內(nèi)容,你對主人公納尼亞有哪些認識?用原著選段中的證據(jù)來支撐你的答案。(2)解釋選段中作者是如何用語言來呈現(xiàn)安妮塔的演講和行為的。用原著選段中的證據(jù)來支撐你的答案。(3)在選段中,涉及了一些不同文化的元素。嘗試說明在小說中的其他部分,不同文化的重要性。在你的回答中,你必須考慮到展示不同文化的事件,這些差異如何影響到那些涉及不同文化的內(nèi)容。從問題的具體內(nèi)容可知,除了學習成果,學生還要展現(xiàn)作品閱讀過程中的方法、策略、結(jié)構(gòu)化思考等。此外,在學業(yè)水平考試中,借助數(shù)字化測評技術(shù)與手段,記錄學生過程性的行為與表現(xiàn),以此作為推論學生學業(yè)成就表現(xiàn)水平的重要依據(jù)。以美國教育考試服務(wù)中心的寫作在線測試為例,數(shù)字化測試記錄了學生寫作過程中的按鍵數(shù)據(jù),主要包括停頓時間長短、文本刪除與無序性文字編輯、不間斷文字編輯。[7]借助過程性表現(xiàn)的分析,綜合判斷學生寫作素養(yǎng)的內(nèi)在特點與發(fā)展水平。

二、測評設(shè)計:探索教育數(shù)字化賦能測評設(shè)計和實施

數(shù)字技術(shù)的深入發(fā)展為核心素養(yǎng)測評擺脫現(xiàn)實困境提供了諸多可能。以信息網(wǎng)絡(luò)平臺與人工智能技術(shù)為基礎(chǔ),越來越多的國際教育測評實踐從紙筆測試逐漸轉(zhuǎn)向數(shù)字化在線測試。2015 年,PISA(國際學生評估項目)測試開始大規(guī)模使用計算機自適應(yīng)測試系統(tǒng);由國際教育成就評估協(xié)會組織實施的PIRLS 閱讀素養(yǎng)、TIMSS 數(shù)學素養(yǎng)測試,分別于2016 年、2019 年將數(shù)字化評估作為可選擇性的方式,并擬定于2023 年、2026 年實現(xiàn)數(shù)字化評估的全面覆蓋。同時,澳大利亞全國讀寫與算數(shù)能力評價項目,自2008 年開始推動數(shù)字化測試改革,并于2022 年實現(xiàn)所有監(jiān)測學科的數(shù)字化轉(zhuǎn)型。

所謂“數(shù)字化教育測評”是指以教育目的與目標為根本出發(fā)點,利用信息科技、大數(shù)據(jù)分析與人工智能的技術(shù)優(yōu)勢等,建立動態(tài)性搜集與分析數(shù)據(jù)的自動化平臺,為教育決策的制定與調(diào)整提供客觀依據(jù)。需要強調(diào)的是,數(shù)字化教育測評并非數(shù)字化技術(shù)與教育測評“形式”層面的簡單相加,更非媒介或手段等測評呈現(xiàn)形態(tài)的改變,而是以對教育測評、核心素養(yǎng)、教學和學習規(guī)律的深刻反思為基礎(chǔ),進行在“設(shè)計理念”“測評形式”等多層面的創(chuàng)新性探索。當前,計算機自適應(yīng)測試是數(shù)字化教育測評的核心實踐成果。該測試以項目反應(yīng)理論為基礎(chǔ),構(gòu)建包含不同難度水平的題庫,根據(jù)學生展現(xiàn)出的內(nèi)在能力水平自動匹配難度適宜的題目,最終綜合估計學生的真實能力水平。與常態(tài)化紙筆測試相比,其優(yōu)勢集中體現(xiàn)在以下三個方面。

首先,展現(xiàn)真實而復雜的語文學習生態(tài)系統(tǒng)。紙筆測試往往遵循的是“問題—個體—反應(yīng)”的模式,即以問題的形式檢驗學生對某一知識或特定技能的掌握程度。僅從測評角度來看,其優(yōu)勢在于可直接借助學生的作答反應(yīng)作出價值判斷。若立足于課程、教學、評價的互動關(guān)系,其背后的隱患和風險則不言自明。對學生而言,語文學習是由多元主體、多種要素互動協(xié)作的復雜動力系統(tǒng),不僅包含與文本材料、學習問題的互動,還必然包括與教師、學習伙伴、文化情境等多種要素的相互作用。針對這一現(xiàn)實,計算機在線測試嘗試以“問題—人際互動—個體—人際互動—行為”的模式表征語文學習的真實形態(tài),力圖實現(xiàn)“評價反映教學,促進教與學”的理念。以美國教育考試服務(wù)中心研發(fā)的“為了理解而閱讀”在線測試系統(tǒng)為例,測試單元“建設(shè)綠色校園網(wǎng)站”圍繞“如何借助主題網(wǎng)站的建設(shè),幫助社區(qū)民眾了解綠色校園”這一核心學習問題,呈現(xiàn)了以小組合作學習為主要形式的測試題目。在“ 撰寫綠色校園簡介”任務(wù)中,參加測試的學生要在學習同伴完成的內(nèi)容基礎(chǔ)上,進一步補充完善相關(guān)內(nèi)容。綜合來看,每一個測試單元包含學習主題、文本材料、合作學習小組、學習任務(wù)等要素,以此來綜合評估學生閱讀素養(yǎng)的表現(xiàn)特征和發(fā)展水平。

其次,設(shè)置連續(xù)、立體的語文學習情境。情境是指學習行為和實踐活動所依托的真實環(huán)境[8],是學生核心素養(yǎng)形成和發(fā)展的必要條件。當前,語文紙筆測試已在情境主題類型、表征形式等方面作出了諸多探索。但是,從測試效果來看,仍存在“與問題解決過程無實質(zhì)性關(guān)系”“與現(xiàn)實生活邏輯存在矛盾”等方面的問題。[9]針對這一現(xiàn)狀,計算機在線測試更為關(guān)注情境的連續(xù)性,即強調(diào)問題源于情境、情境內(nèi)所包含的要素持續(xù)參與問題解決的過程。此時,數(shù)字化測試中的“情境”至少能夠取得兩個方面的效果:一是為學生提供解決問題的立場、目的、條件等,充分提高學生的參與度和積極性,為全面了解學生真實核心素養(yǎng)發(fā)展水平提供堅實的基礎(chǔ);二是促進學生學習觀和知識觀的轉(zhuǎn)變,幫助學生在語文學習與現(xiàn)實生活之間建立合理的聯(lián)系。美國國家教育進展評估項目中,寫作素養(yǎng)的評估是借助計算機在線測試系統(tǒng)開展的。以說明類寫作試題為例,該試題要求學生寫一篇即將投稿給大學管理委員會的介紹信息科技的文章,闡釋說明科學技術(shù)對自身生活的重要性。在該試題中,情境是由若干要素構(gòu)成的整體,具體包括視頻資料、真實的交際目的和對象、預(yù)期效果等。視頻資料主要展示了當下青少年在生活中是如何使用現(xiàn)代科學技術(shù)的;交際的目的是說服他人接受自己的觀點,對象為大學管理委員會;預(yù)期取得的交際效果為使學校管理委員會關(guān)注科學技術(shù)的重要價值,并重視科學技術(shù)與學校管理的深度融合。上述要素展現(xiàn)了寫作的主題,也深度參與了學生構(gòu)思與撰寫文章的全過程。

最后,設(shè)置人機交互式測試模式?!敖换ァ睆娬{(diào)的是主體與客體之間的交流互動。在紙筆測試中,測試內(nèi)容和任務(wù)往往以靜態(tài)、線性的方式呈現(xiàn),學生與其的交流互動難以可視化。相反,以計算機網(wǎng)絡(luò)平臺為依托的數(shù)字化測試,通過“虛擬代理”預(yù)設(shè)腳本的方式[10],創(chuàng)設(shè)真實的測試情境,設(shè)置扮演不同角色的學習同伴,引導學生按照特定的路徑和流程[11],展現(xiàn)自己對問題的認識和理解。在測試過程中,學生通過角色扮演、點擊超鏈接、多媒體播放、文本拖拽等方式,真實地投入問題解決的過程中。以2021 年ePIRLS 閱讀素養(yǎng)測試為例,測試情境為“課堂專題探究”,探究的核心問題是“為了生存,以斑馬和羚羊為代表的野生動物每一年是如何完成遷徙的”。整個測試包含兩個虛擬角色,一個是“教師”,其角色功能在于介紹專題探究的內(nèi)容、引導學生遵循特定的流程完成探究任務(wù);另一個角色是“學生”,通過瀏覽文本、點擊超鏈接文本等相關(guān)操作,展現(xiàn)自己對文本、問題的理解與認識。

三、測評結(jié)果:加強測評、教學、學習之間的有效關(guān)聯(lián)

在一項測評實踐結(jié)束后,測評結(jié)果所代表的絕對意義往往備受矚目。這種現(xiàn)象背后隱含的思想觀念是“測評即是對學生學習成果、教師教學成果的價值評判”。然而,教育測評的設(shè)計和實施應(yīng)首先滿足“教育性”這一條件,即立足測評與教學、學習的良性互動關(guān)系,充分發(fā)揮測評工具、測評結(jié)果對提升教育質(zhì)量、改進優(yōu)化教學實踐的正向促進作用。換言之,教育實踐者追求的不應(yīng)是量化結(jié)果的排序和比較,而是深度挖掘、分析數(shù)據(jù)背后的意義。以此為基礎(chǔ),結(jié)合教育實踐的觀察和分析,及時捕捉教育教學發(fā)展中的關(guān)鍵問題,制訂具有改進和提升功能的行動方案。在這一觀念的影響下,越來越多的國際教育測評嘗試在“測評”“教學”“學習”三者之間建立有效的關(guān)聯(lián)互動。

根據(jù)測評結(jié)果的作用對象,可以將其價值和功能概括為三種類型,分別為“宏觀把控國家教育政策的實施效果”“有效解決學校教學實踐的現(xiàn)實困境”“及時診斷學生學習過程中的問題”。

首先,在國際教育大規(guī)模測評中,測評結(jié)果往往反映的是特定國家教育政策的實施效果。通過對學生在特定領(lǐng)域測試結(jié)果的分析,以及與不同層面影響因素的關(guān)聯(lián),能發(fā)現(xiàn)全球教育發(fā)展背景下教育教學的“最佳模式”和“關(guān)鍵問題”,從而形成分析診斷全球教育問題的專業(yè)報告,并據(jù)此對排名靠后的國家提供教育援助和支持。[12]以PIRLS 和PISA 閱讀素養(yǎng)測試為例,借助教育國際排名和影響因素的調(diào)查結(jié)果,能夠發(fā)現(xiàn)2018 年盡管我國四省市參測學生的閱讀表現(xiàn)位居全球第一位,但達到水平5與水平6 的比例之和為21.7%,明顯低于新加坡(25.8%)[13];同時,與英國、澳大利亞、芬蘭等國家相比,社會經(jīng)濟地位對學生閱讀素養(yǎng)表現(xiàn)水平具有較強的預(yù)測作用[14]。此類數(shù)據(jù)不僅能幫助我們認識到自身課程政策的優(yōu)勢和問題,也為未來課程、教學的改革明確了方向。

其次,學校是落實教育變革理念的主要實踐主體。借助測評數(shù)據(jù)客觀反映學校教育教學狀況,對促進國家教育政策的實施具有重要意義。然而,抽樣方式的特點,使大規(guī)模教育測評難以直接反映學校教育教學的現(xiàn)實情況。因此,以學校為測評及改進單位的實踐項目逐漸興起。近來,經(jīng)濟合作組織推出“基于PISA 的學校測評”項目,其測評目標主要包括三個部分:一是衡量學生閱讀素養(yǎng)及其21 世紀核心素養(yǎng)的發(fā)展水平;二是通過搜集學生社會經(jīng)濟背景、學習動機等相關(guān)數(shù)據(jù),為學校教育教學的建設(shè)與發(fā)展提供客觀依據(jù);三是借助測評數(shù)據(jù)的分析,為學校管理者和教師改進行動提供證據(jù)。該項目主要包括測評、拓展、行動三個方面。以閱讀素養(yǎng)測試為例,測評部分主要是以學校報告的方式呈現(xiàn)學生閱讀、社會情感能力等方面的整體表現(xiàn),并將其與全球、國家平均水平進行比較;拓展方面,為學校提供全球范圍內(nèi)閱讀素養(yǎng)培養(yǎng)的優(yōu)質(zhì)實踐框架,以學生數(shù)據(jù)來指導教師教學實踐和學生的個體學習,為學校學習環(huán)境的營造提供輔助信息;行動部分,幫助學校明確提升學生閱讀素養(yǎng)的起點和方向,為學校提供向國際同行學習的機會。

最后,測評數(shù)據(jù)源自學生的真實表現(xiàn),它不僅可以作用于國家教育、學校教學層面的改進提升,還可以幫助學生發(fā)現(xiàn)自身學習過程中的優(yōu)勢和問題。在大規(guī)模測試中,教師較為關(guān)注具有典型性和代表性的群體特征,并以此作為調(diào)整教學進程的重要依據(jù)。在這種情況下,學生個性化的學習問題往往會被忽略,并成為阻礙學習不斷深化的因素。為了幫助學生準確分析診斷學習困境,越來越多的測評系統(tǒng)注重個性化的“診斷”“反饋”功能。2022 年,香港考試及評核局正式推出香港中學文憑考試診斷回饋系統(tǒng),以建立“為教學和學習提供反饋”測評系統(tǒng)。教師可根據(jù)學生或教學需要,組合不同類型的試卷并分配給不同的學生,進而根據(jù)學生作答結(jié)果的分析,制訂相應(yīng)的教學改進計劃。在完成測試后,學生可獲得包含整體表現(xiàn)水平、分內(nèi)容和認知領(lǐng)域的表現(xiàn)水平、錯題表現(xiàn)、題目的學習提示等相關(guān)內(nèi)容。借助這些內(nèi)容,學生可改進自身的學習方法,優(yōu)化學習效果。

總體而言,核心素養(yǎng)這一育人目標的確定,不僅改變了課程組織形態(tài)和教學實踐方式,也促進了教育測量和評價設(shè)計理念、實施方式的深刻變革。當前,針對核心素養(yǎng)的復雜性、綜合性特點,國內(nèi)外研究者已在測評理念和形式、統(tǒng)計分析方法、測評結(jié)果自動化分析等方面作出了諸多探索與嘗試。本研究僅呈現(xiàn)了對國際學業(yè)水平考試國際前沿的階段性理解與認識,未來應(yīng)聚焦語文課程核心素養(yǎng)的特點,在上述方面作出更深入的探究。

巴彦淖尔市| 开化县| 崇明县| 忻城县| 万安县| 林甸县| 白城市| 华亭县| 香格里拉县| 上林县| 安达市| 九龙县| 茌平县| 布拖县| 双城市| 仪陇县| 宣威市| 东乡| 娄烦县| 虹口区| 临清市| 玉屏| 措勤县| 北碚区| 平江县| 龙里县| 柳州市| 厦门市| 襄垣县| 巴塘县| 本溪市| 简阳市| 东丰县| 英山县| 尤溪县| 临沧市| 法库县| 中牟县| 仁寿县| 张家界市| 河北区|