国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

增值評價中的天花板效應(yīng)及其破解思路

2020-12-23 03:08:32楊志明彭麗儀
教育測量與評價 2020年12期
關(guān)鍵詞:優(yōu)秀學(xué)生天花板量表

楊志明 彭麗儀 李 洋

2020 年,中共中央和國務(wù)院印發(fā)了《深化新時代教育評價改革總體方案》[1][2](下稱《總體方案》),強調(diào)要改進結(jié)果評價,強化過程評價,探索增值評價,……,建立科學(xué)的、符合時代要求的教育評價制度和機制。在探索增值評價方面,學(xué)者們提出了各種各樣的評價方案,比如直接用高考成績減去中考成績,或者用多次模擬考試成績分析其分?jǐn)?shù)或等級的進步幅度,或者用某種回歸方法預(yù)測結(jié)果等。不過,現(xiàn)在流行的這些方法大多遇到了天花板難題,即優(yōu)秀學(xué)生或優(yōu)質(zhì)生源學(xué)校因增值空間不足而受到了不公平的評價。本文介紹目前常用的幾種增值評價模型并對其局限性進行探討,提出了破解增值評價中天花板效應(yīng)的三種思路。

一、增值評價中的天花板效應(yīng)

增值評價由于給了各種起點層次學(xué)生努力表現(xiàn)的機會,同時鼓勵所有人努力上進,所以它一直受到人們的普遍歡迎。但是,在發(fā)展空間被人為設(shè)限的情況下,優(yōu)秀學(xué)生無法獲得足夠的增長幅度,并因此會受到不公平的增值評價。這種優(yōu)秀學(xué)生因增值空間有限而不可能獲得較大進步幅度,進而得到較低增值評價結(jié)果的現(xiàn)象就是天花板效應(yīng)。

例如,假設(shè)小王和小李兩名學(xué)生的入學(xué)成績分別為60 分和90 分,其年級排名百分等級分別是30%和85%。經(jīng)過一個學(xué)期的學(xué)習(xí)后,他們的等值化成績分別為72 分和96 分,年級排名百分等級分別為40%和95%。也就是說:小王的分?jǐn)?shù)增長了12 分,年級排名提升了10 個百分點;小李的分?jǐn)?shù)增長了6 分,年級排名也提升了10 個百分點。這時,若簡單地比較分?jǐn)?shù)增值量,則小王(增長12 分)大大高于小李(增長6 分)??墒聦嵣?,由于不同能力層次者的競爭實力不同,一個人的分?jǐn)?shù)由90 分提升到96 分,要大大難于從60分提升到72 分;一個人的分?jǐn)?shù)年級排名,從超過全年級85%提升到95%要遠(yuǎn)比從超過全年級30%提升到40%難得多。這就是說,優(yōu)秀學(xué)生小李因為其增長空間有限而得到了不公平的增值評價,他遇到了發(fā)展空間不高的天花板問題。

給學(xué)生發(fā)展設(shè)置天花板的常見表現(xiàn)是要求所有學(xué)生在教學(xué)過程中必須“齊步走”,并且不能“超綱”。例如,要求全年級的教學(xué)進度完全一致,甚至規(guī)定在考試中用高階思維解決低階問題也不能得分,就是人為設(shè)置天花板的常見表現(xiàn)。產(chǎn)生類似問題的主要原因是當(dāng)今流行的固定班級授課制,以及類似于“學(xué)生認(rèn)知能力提前發(fā)展的做法會造成學(xué)業(yè)負(fù)擔(dān)過重”的錯誤觀念。其實,并不是那些促進學(xué)生認(rèn)知能力提前發(fā)展的做法,而恰恰是那些控制學(xué)生認(rèn)知能力提前發(fā)展的做法和那些讓學(xué)生在低階思維層次開展大量低水平的機械重復(fù)的“刷題”訓(xùn)練,導(dǎo)致學(xué)生的學(xué)業(yè)負(fù)擔(dān)過重。比如,代數(shù)思維對于大多數(shù)優(yōu)秀小學(xué)生來說并不是什么難事,高等數(shù)學(xué)思維對于大多數(shù)優(yōu)秀高中生而言也不是什么難事。那種只能用算術(shù)思維而不準(zhǔn)用代數(shù)思維解決算術(shù)問題的小學(xué)“刷題”培訓(xùn),以及整個高三年級都在用初等數(shù)學(xué)思維而不是用高等數(shù)學(xué)中的微積分思維、線性代數(shù)思維、不確定性概率思維等解決高中數(shù)學(xué)問題的“刷題”行為,正是加重學(xué)生學(xué)業(yè)負(fù)擔(dān)的罪魁禍?zhǔn)祝侨藶樵O(shè)定學(xué)生成長空間,造成增值評價中天花板效應(yīng)的主要原因。

值得說明的是,個體之間存在差異是一種客觀的存在,因此,對于資質(zhì)不同的個體不必設(shè)定完全一樣的天花板高度。比如,存在讀寫障礙的學(xué)生或存在數(shù)學(xué)學(xué)習(xí)困難的學(xué)生,國家可以制定不同的天花板,即推出有效的特殊教育措施,實施不同的增值評價標(biāo)準(zhǔn),而不應(yīng)該把這批學(xué)生列入學(xué)校正常的增值評價范圍,否則,會給學(xué)校的增值評價帶來不公平的結(jié)果。

二、常用的增值評價模型無法破解天花板效應(yīng)

在實施增值評價的過程中,國際上經(jīng)常采用的方法主要有三大類。一是基于縱向等值分?jǐn)?shù)量表的方法,如增分模型(gain score)、循成長軌跡漸進 模 型(trajectory model)、 等 級 變 化 模 型(categoricalmodel)。二是基于回歸分析的方法,如殘差模型(residual)、投射模型(projection)、學(xué)生成長百分位(student growth percentile,SGP)模型。三是基于多變量復(fù)雜設(shè)計模型的方法,如多層次線性回歸模型(hierarchical linear modeling,HLM)等。[3]不過,這些方法在處理天花板效應(yīng)時效果都不夠理想,現(xiàn)對其中幾種常用方法及其局限進行探討。

1.增分模型

增分模型指的是用學(xué)生“出口”成績減去“入口”成績的評價方法,即學(xué)生在接受了一段時間的學(xué)習(xí)或干預(yù)實驗之后,其后測分?jǐn)?shù)(出口)與前測分?jǐn)?shù)(入口)之差可以作為增值的指標(biāo),當(dāng)這個差值大于0 時表明該學(xué)生進步了或增值了,否則,說明該學(xué)生退步了或沒有增值。

使用增分模型的前提條件是:多次測評的內(nèi)容基本一致;多次測評的信度一致;分?jǐn)?shù)轉(zhuǎn)換到同一個分?jǐn)?shù)度量系統(tǒng)(量表)之上。也就是說,卷面原始分?jǐn)?shù)被科學(xué)地轉(zhuǎn)換到了參照點相同、單位也相同的量表之上,實現(xiàn)了測驗分?jǐn)?shù)的平行等值或垂直鏈接。[4][5]此外,差值范圍的解讀還需要結(jié)合測量誤差進行,若差值落在正常的誤差范圍之內(nèi),則不能有力支持學(xué)生進步或退步的推斷。

這種方法僅僅給出了如何計算增值幅度的算法,未能觸及優(yōu)秀學(xué)生升值空間不足的問題,因此,它無法破解增值評價中的天花板效應(yīng)。

2.循成長軌跡漸進模型

循成長軌跡漸進模型是研究者根據(jù)最初若干次(比如最初3 年)測評數(shù)據(jù)的“增分量”變化趨勢,評判未來“增分量”是否符合該趨勢的方法。若達(dá)到或超過期望值,則表示學(xué)生進步了,否則表示沒有進步或退步了。使用該方法的前提條件是:多次測評的內(nèi)容基本一致;測驗分?jǐn)?shù)經(jīng)過平行等值或垂直鏈接。此外,分?jǐn)?shù)的波動范圍也需要結(jié)合測量誤差進行解讀。

這種方法的重點是對評價對象的成長軌跡進行評估,沒有觸及優(yōu)秀學(xué)生升值空間有限的問題,因此它也不能破解增值評價中的天花板效應(yīng)。

3.等級變化模型

等級變化模型是一種考察學(xué)生歷次測評的等級變化和變化者比例的方法。學(xué)生“由較低等級跨入較高等級”表示他進步了,否則表示沒有進步或退步了。

這種方法的重點是對評價對象的分?jǐn)?shù)等級變化情況進行評估,沒有觸及優(yōu)秀學(xué)生升值空間有限的問題(比如,級別為最高等級A 等的學(xué)生,無論他如何升值也仍然是A 等),因此它也不能破解增值評價中的天花板效應(yīng)。

4.殘差模型

殘差模型首先利用前測和后測成績建立線性回歸模型,然后考察實測分?jǐn)?shù)與預(yù)測分?jǐn)?shù)之差。差值為正表示學(xué)生成長較好,差值為0 表示學(xué)生沒有增長,差值為負(fù)數(shù)表示學(xué)生退步了。(差值需要與測量誤差綜合使用)

這種方法的重點是對評價對象的成長幅度與理論模型的預(yù)測值進行比較,沒有觸及優(yōu)秀學(xué)生升值空間有限的問題,因此也不能破解增值評價中的天花板效應(yīng)。

5.學(xué)生成長百分位模型

SGP 模型是一種根據(jù)學(xué)生后測成績在以往同層次群體中相對位置的變化情況做出增值判斷的方法。一般地,以往分?jǐn)?shù)等級相同的學(xué)生,他們的后測得分不可能仍然相等,而會呈現(xiàn)為某種條件分布。圖1 是來自以往11 個成績等級學(xué)生群體的后測分?jǐn)?shù)分布示意圖。

圖1 以往11 個成績等級學(xué)生群體的后測分?jǐn)?shù)分布

就每個等級群體而言,若學(xué)生的后測得分(正常情況下每個組都表現(xiàn)為正態(tài)分布)超過了其同群體50%的人,則說明他進步了(有增值),反之,說明他沒有進步(沒有增值)。

SGP 模型的主要特點是強調(diào)與過去水平相當(dāng)?shù)娜后w做比較,而不是簡單地根據(jù)進步幅度做比較,因此,該方法部分緩解了優(yōu)秀學(xué)生上升空間不足的矛盾。不過,SGP 也有幾個明顯的缺陷。例如,它不適合做絕對評價,因為SGP 模型永遠(yuǎn)會有而且只有50%的個體實現(xiàn)了增值,另外50%的個體必須是退步的;計算方法比較復(fù)雜,教師、學(xué)生及家長不太容易理解;增值結(jié)果為順序變量值,不利于數(shù)據(jù)的深度挖掘;對以往成績極端群體(高分組和低分組)的評價不夠準(zhǔn)確;當(dāng)生源內(nèi)部差異不大時評價結(jié)果容易受隨機誤差影響等。[6]

三、破解增值評價中天花板效應(yīng)的三種思路

由上文分析可知,目前常用的增值評價模型都會遇到天花板效應(yīng),并導(dǎo)致對優(yōu)秀學(xué)生和優(yōu)質(zhì)生源學(xué)校增值評價不公平。要解決這個問題,不妨改進教育教學(xué)模式、創(chuàng)新評價技術(shù)。現(xiàn)筆者提出以下三種具體思路供大家參考。

1.研發(fā)并應(yīng)用學(xué)生發(fā)展量表

該思路指的是研究者利用大數(shù)據(jù)或代表性樣本資料,首先研發(fā)一些學(xué)生發(fā)展量表,建立全國或局部地區(qū)同層次人群的發(fā)展曲線(全國常?;虻胤匠D#缓髤⒄粘DE袛嗄承W(xué)生的增值情況。由于發(fā)展量表可以兼顧標(biāo)準(zhǔn)參照(絕對評價)和常模參照(相對評價)的特點,即既考察學(xué)生成長的絕對量,又考察學(xué)生發(fā)展的相對量(相對于同層次人群的進步幅度),所以它可以通過與同層次學(xué)生比進步幅度的絕對值方法,較好地破解增值評價中的天花板效應(yīng)。

目前的增值評價技術(shù)主要分為兩大類型,即絕對評價和相對評價。為了解決增值評價中的天花板效應(yīng),可以通過大數(shù)據(jù)分析,首先構(gòu)造出個體的年齡或年級成長曲線(常模),研發(fā)出一個具有很高信度、效度及公平性的發(fā)展量表,然后將個體的成長曲線與大眾或其所屬群體的代表性成長曲線做比較。若實際成長曲線高于對應(yīng)的參照值,則表明該學(xué)生或群體進步了或發(fā)展得更好了;反之,則說明沒有進步或沒有增值。圖2[7]是某校各年級言語思維能力增長曲線與全國同年級學(xué)生言語思維能力增長曲線的比較(基于垂直鏈接的等值分?jǐn)?shù))。

圖2 某校各年級言語思維能力增長曲線與全國同年級學(xué)生言語思維能力增長曲線的比較

由圖2 可知,這所學(xué)校各個年級學(xué)生的言語思維能力比全國同年級學(xué)生發(fā)展得好,但該校學(xué)生的言語思維能力在7 年級階段出現(xiàn)了下滑現(xiàn)象。這是因為該校7 年級招收了大量隨機派位的學(xué)生,這些隨機派位的學(xué)生學(xué)習(xí)基礎(chǔ)偏弱。

應(yīng)用學(xué)生發(fā)展量表的突出特點是兼顧了絕對評價和相對評價的優(yōu)點,基本破解了優(yōu)秀學(xué)生或優(yōu)質(zhì)生源學(xué)校增值空間不足的難題。一方面,由于采用了等值量表分?jǐn)?shù)進行增值評價,所以可以得出所有學(xué)生的成長軌跡(這時的學(xué)生發(fā)展量表與“循成長軌跡漸進模式”類似,但強調(diào)以代表性群體的成長曲線為常模,作為增值評價的依據(jù))。另一方面,由于各種能力層次的學(xué)生主要是與同層次的學(xué)生做比較,只要本校學(xué)生的進步幅度比全國同年級學(xué)生的進步幅度大,就表明其增值效果良好,從而避免了高分段學(xué)生增幅不夠大而顯得工作業(yè)績不明顯等天花板問題。

2.提升學(xué)生成長的天花板高度

根據(jù)筆者的一項實驗研究[7],某優(yōu)質(zhì)生源學(xué)校6 年級學(xué)生的認(rèn)知發(fā)展水平已經(jīng)達(dá)到了正常高一學(xué)生的水平(盡管知識量沒有達(dá)到這么高)。對于這個層次的學(xué)生,解決增值評價中天花板效應(yīng)的有效辦法是提升學(xué)生成長的天花板高度。

具體辦法或者是把常規(guī)課堂變成探究式學(xué)習(xí)課堂,如使用項目式學(xué)習(xí)(project-based learning)或翻轉(zhuǎn)課堂等手段讓學(xué)生體驗探究的過程;或者是專門開設(shè)高階思維能力發(fā)展課程,如鼓勵學(xué)生用代數(shù)思維方法解決算術(shù)思維問題,用分析性思維(analytical thinking)和審辯性思維(critical thinking)等言語思維(verbal reasoning)方法處理單詞、詞組及知識點等問題。

在國外很多學(xué)校,分層教學(xué)設(shè)置優(yōu)才課程而不是“尖子班”的思路,包括部分高中學(xué)校給優(yōu)秀學(xué)生提供大學(xué)先修課程(AP 課程)的辦法,就從根源上解決了增值評價空間不足的問題。這就是說,沒有必要逼著小學(xué)生大量做題,這樣只能鍛煉他們用算術(shù)思維解答簡單的代數(shù)問題的能力,也沒有必要逼著高三學(xué)生限定在高中層次大量“刷題”,這樣只能鍛煉他們用初等數(shù)學(xué)思維解決數(shù)學(xué)問題的能力。若能鼓勵學(xué)生用代數(shù)思維解決算術(shù)問題,用高等數(shù)學(xué)思維解決初等數(shù)學(xué)問題,用分析性思維、審辯性思維、創(chuàng)新思維等處理中文學(xué)習(xí)中記敘文、說明文、議論文的閱讀理解、書面表達(dá)與口頭表達(dá)等問題,則可以從教育思想和教學(xué)模式上破解天花板效應(yīng)。換句話說,這時候的增值評價的目標(biāo)不能局限在學(xué)生是否進步等“貼標(biāo)簽”層面,而應(yīng)該定位在以評促學(xué)層面,重點是在增長知識的同時,提高學(xué)生的認(rèn)知加工水平或思維能力層次。

3.拓寬學(xué)生橫向發(fā)展的空間

正如人的身高、體重、外貌千差萬別,每名學(xué)生的知識結(jié)構(gòu)和層次、能力結(jié)構(gòu)和層次、興趣愛好和個性特征也是千差萬別的。因此在學(xué)生完成學(xué)業(yè)的過程中,個體差異也是必然存在的。一名“小個子”可以很喜歡打籃球,但無論他如何努力也不可能達(dá)到姚明這樣的高度。因此,對于“小個子”來說,理智的做法是保留個人愛好,同時尋找另外的發(fā)展通道,比如學(xué)習(xí)體操。因為在體操項目上,個子小是必要條件,像姚明那樣的“大個子”反而成為其劣勢。同樣,面對語文、數(shù)學(xué)、外語、物理、化學(xué)、生物、政治、歷史、地理等必修學(xué)科,萬一自己是其中某些科目的“小個子”,硬逼著自己往前沖一定會事倍功半。這時候,無論采用什么方式開展增值評價,“小個子”永遠(yuǎn)沒有出頭之日。解決這個問題的有效辦法是找出自己的“長板”,發(fā)現(xiàn)自身的長處,并設(shè)法利用長處獲得自身的生存與發(fā)展機會。從增值評價角度說,國家對有讀寫障礙或數(shù)學(xué)學(xué)習(xí)困難的學(xué)生設(shè)定不同的天花板,可以較好地避免低評學(xué)校增值業(yè)績等不公平問題。

值得說明的是,學(xué)習(xí)困難學(xué)生遇到的天花板其實主要受制于自身的資質(zhì)而不是外界的現(xiàn)有天花板,解決這類問題的正確思路是完善綜合評價。從國外很多高校招生的實踐情況看,許多一流高校給各種學(xué)業(yè)成績平平而身懷某種絕技的人預(yù)留了大量招生指標(biāo),就比較好地解決了學(xué)科成績后進生升值空間有限的問題。這就是說,增值評價應(yīng)該考慮對學(xué)生不同方面進行評價,不能局限在“學(xué)生學(xué)業(yè)成績”維度上比進步(即不能提倡“學(xué)科考試分?jǐn)?shù)論”),更不能把學(xué)生多個維度的表現(xiàn)成績合成某個總分來實施綜合評價或增值評價,因為不同性質(zhì)的指標(biāo)合成一個總分比進步的做法,就像把人的身高、體重、心跳次數(shù)合成一個總分一樣荒唐。由于綜合評價不是本文的討論重點,所以此處從略。

總之,實施增值評價對于鼓勵后進學(xué)生的成長很有意義,但常用的增值評價方法難以破解天花板效應(yīng),可能導(dǎo)致對優(yōu)質(zhì)生源學(xué)校不公平,以及薄弱學(xué)校增值到一定高度后無法持續(xù)提升的評價結(jié)果。本文提出了破解增值評價中天花板效應(yīng)的三種思路,即研發(fā)并應(yīng)用學(xué)生發(fā)展量表、提升學(xué)生縱向成長的天花板高度、拓寬學(xué)生橫向發(fā)展的空間。其中,學(xué)生發(fā)展量表方法兼顧了絕對評價和相對評價的特點,在破解增值評價中的天花板效應(yīng)方面很有價值,另外兩個思路則側(cè)重教育教學(xué)模式的改進。

猜你喜歡
優(yōu)秀學(xué)生天花板量表
值日“天花板”
敲碎天花板之后 廣汽埃安AION LX Plus
車主之友(2022年4期)2022-08-27 00:56:20
Some funny IQ quizzes
優(yōu)秀學(xué)生的九個學(xué)習(xí)細(xì)節(jié)
冼星海等人應(yīng)該是“國立音?!钡膬?yōu)秀學(xué)生
人民音樂(2017年7期)2017-07-19 13:03:03
為取消“省級優(yōu)秀學(xué)生保送”叫好
湖南教育(2017年5期)2017-03-08 20:36:12
沒有“天花板”的產(chǎn)業(yè) 如何“玩著”把錢掙了?
蘇州市師生書法臨帖 網(wǎng)絡(luò)展優(yōu)秀學(xué)生作品選登
三種抑郁量表應(yīng)用于精神分裂癥后抑郁的分析
初中生積極心理品質(zhì)量表的編制
广西| 柳河县| 通山县| 尼玛县| 鹤庆县| 凌海市| 浦县| 垣曲县| 寿宁县| 自贡市| 平湖市| 台东市| 梅河口市| 堆龙德庆县| 星子县| 五莲县| 武定县| 渝北区| 临沧市| 天全县| 丽江市| 黔江区| 兴国县| 乌拉特前旗| 平原县| 东宁县| 九龙城区| 屏山县| 泉州市| 怀柔区| 汉源县| 巨鹿县| 洪江市| 彭水| 松原市| 兴宁市| 宜兰市| 景东| 盈江县| 英吉沙县| 巴林右旗|