国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

義務(wù)教育學(xué)校紙筆考試等第化評價(jià)的緣由、技術(shù)與意義

2024-05-21 13:40:32王旭東
廣西教育·A版 2024年3期

摘 要:義務(wù)教育學(xué)校考試分?jǐn)?shù)評價(jià)誤差較大,并被廣泛用于排名排序,違背了素質(zhì)教育的初衷。順應(yīng)新時(shí)代教育評價(jià)改革和“雙減”政策要求,在全面實(shí)施2022年版義務(wù)教育課程方案及各學(xué)科課程標(biāo)準(zhǔn)的背景下,義務(wù)教育學(xué)校應(yīng)努力破除傳統(tǒng)的考試分?jǐn)?shù)評價(jià),對總分實(shí)施等第化評價(jià),有效促進(jìn)學(xué)生學(xué)業(yè)與身心健康協(xié)同發(fā)展。等第劃分必須科學(xué)合規(guī)、合情合理,可通過吸納Angoff法和Bookmark法的優(yōu)點(diǎn),改良傳統(tǒng)的固定分?jǐn)?shù)法和百分位分?jǐn)?shù)法,應(yīng)用比較科學(xué)、可操作的簡約型等第劃分技術(shù),提高等第化評價(jià)的準(zhǔn)確性。

關(guān)鍵詞:學(xué)??荚?;等第評價(jià);等第劃分;Angoff法;Bookmark法

中圖分類號:G62 文獻(xiàn)標(biāo)識碼:A 文章編號:0450-9889(2024)07-0034-05

鑒于義務(wù)教育學(xué)校紙筆考試采用傳統(tǒng)的分?jǐn)?shù)評價(jià)、排名排序評價(jià)存在諸多弊端,為切實(shí)扭轉(zhuǎn)這種不科學(xué)的教育評價(jià)導(dǎo)向,全面深化義務(wù)教育教學(xué)改革,促進(jìn)義務(wù)教育內(nèi)涵發(fā)展和質(zhì)量提升,有效減輕學(xué)生作業(yè)負(fù)擔(dān)和校外培訓(xùn)負(fù)擔(dān),中共中央、國務(wù)院在2020年印發(fā)了《深化新時(shí)代教育評價(jià)改革總體方案》,中共中央辦公廳、國務(wù)院辦公廳在2021年印發(fā)了《關(guān)于進(jìn)一步減輕義務(wù)教育階段學(xué)生作業(yè)負(fù)擔(dān)和校外培訓(xùn)負(fù)擔(dān)的意見》,教育部在2021年印發(fā)了《義務(wù)教育質(zhì)量評價(jià)指南》和《義務(wù)教育學(xué)??荚嚬芾淼耐ㄖ?、在2022年印發(fā)了2022年版義務(wù)教育課程方案及各學(xué)科課程標(biāo)準(zhǔn),以上政策文件均要求義務(wù)教育學(xué)校提高教育評價(jià)的科學(xué)性、專業(yè)性、客觀性,克服“唯分?jǐn)?shù)”的傾向,取消分?jǐn)?shù)評價(jià),實(shí)施考試成績等第化評價(jià)。2022年8月,浙江省教育廳發(fā)布了《關(guān)于小學(xué)生綜合評價(jià)改革的指導(dǎo)意見》,在地方上率先開展了小學(xué)生綜合評價(jià)改革,著力推行“等級加評語”的評價(jià)方式。面對國家和地方層面對義務(wù)教育學(xué)校提出的等第化評價(jià)改革要求,很多校長和學(xué)科教師思想上轉(zhuǎn)不過彎來,不知道如何科學(xué)實(shí)施等第化評價(jià)。為此,筆者進(jìn)行了相關(guān)的理論探析。

一、義務(wù)教育學(xué)校紙筆考試等第化評價(jià)的緣由

必要的考試是教學(xué)工作的重要環(huán)節(jié)。針對義務(wù)教育學(xué)??荚?,教育部發(fā)布的《義務(wù)教育學(xué)校考試管理的通知》提出了許多明確的要求,如:小學(xué)一二年級不進(jìn)行紙筆考試,義務(wù)教育其他年級由學(xué)校每學(xué)期組織一次期末考試,初中年級從不同學(xué)科的實(shí)際出發(fā),可適當(dāng)安排一次期中考試;各地不得面向小學(xué)各年級和初中非畢業(yè)年級組織區(qū)域性或跨校際的考試;學(xué)校和班級不得組織周考、月考、單元考試等其他各類考試,也不得以測試、測驗(yàn)、限時(shí)練習(xí)、學(xué)情調(diào)研等各種名義變相組織考試;等等。義務(wù)教育學(xué)校采用紙筆考試的做法由來已久,問題客觀存在;改用等第化評價(jià)方式不僅有政策依據(jù),而且有其不得不改的理由。

(一)學(xué)校分?jǐn)?shù)評價(jià)的專業(yè)性不強(qiáng)

當(dāng)前義務(wù)教育學(xué)校分?jǐn)?shù)評價(jià)專業(yè)性不強(qiáng),主要表現(xiàn)在以下三個(gè)方面。

首先,教師命題能力低下,導(dǎo)致義務(wù)教育學(xué)校很難研制出高質(zhì)量的試卷。目前,大部分義務(wù)教育學(xué)校教師沒有經(jīng)過系統(tǒng)的命題技術(shù)培訓(xùn),也沒有參與過區(qū)域性統(tǒng)考命題工作,甚至不知道什么樣的試題是合格的試題、什么樣的試卷是合格的試卷。教學(xué)實(shí)踐中,一些教師只能簡單地模仿或套用區(qū)域統(tǒng)考試卷或者其他名校試卷,依樣畫葫蘆地參考這些試卷的題型結(jié)構(gòu)、試題排序、題量分布和分?jǐn)?shù)結(jié)構(gòu)進(jìn)行學(xué)??荚嚸},而很少研究一份試卷對所考查的知識、能力和素養(yǎng)的內(nèi)容結(jié)構(gòu)效度,很少研究試題的難度及其區(qū)分度的結(jié)構(gòu),很少研究試題賦分技術(shù)和評分細(xì)則,等等。

其次,試卷研制流程不規(guī)范,導(dǎo)致義務(wù)教育學(xué)校的試卷整體質(zhì)量低下。一份優(yōu)質(zhì)試卷的產(chǎn)生,須經(jīng)歷命題方案研制、雙向細(xì)目表研制、試題挑選與研制、組卷磨卷、審核定稿五個(gè)基本環(huán)節(jié)。雖然學(xué)校和教師都很重視考試,但是重視的是考試的安排及其分?jǐn)?shù)評價(jià),而不是命題流程的規(guī)范和命題的質(zhì)量。由于學(xué)??荚嚧螖?shù)較多,且各備課組人力有限,通常情況下各備課組每次命題只有一兩人參與;即便有審核者,審核者常常也只是做一遍試卷,對試題中的學(xué)科性錯(cuò)誤、答案是否正確進(jìn)行把關(guān)。由于教師日常工作量都比較大,命題者常常會(huì)省去制訂命題方案和雙向細(xì)目表這兩個(gè)流程,直接模仿他人試卷進(jìn)行挑題組卷。在命題流程和試卷質(zhì)量缺乏監(jiān)管的背景下,學(xué)??荚嚨脑囶}難度常常參差不齊,一些中學(xué)甚至常常出現(xiàn)學(xué)??荚囯y度高于中考的現(xiàn)象,有時(shí)還會(huì)出現(xiàn)一些不合格試題等命題的信效度問題。

最后,試卷批改過程不嚴(yán)謹(jǐn),會(huì)加大義務(wù)教育學(xué)??荚嚨脑u分誤差。一道標(biāo)準(zhǔn)的試題由題干(或情境)、設(shè)問、答案和評分標(biāo)準(zhǔn)構(gòu)成。學(xué)校教師在命題的時(shí)候,常常會(huì)忽略了評分標(biāo)準(zhǔn)的設(shè)置。在沒有評分標(biāo)準(zhǔn)的情況下,極易產(chǎn)生不同閱卷者扣分尺寸不統(tǒng)一的問題。在批改計(jì)算題、問答題等題目時(shí),閱卷教師的主觀性、隨意性更大。此外,學(xué)校教師的閱卷任務(wù)較重。他們不像中考那樣只改一道小題,而常常需要批改一大組試題,因此通常不能保障試卷批改的精度。加上一般學(xué)校沒有像中考那樣設(shè)計(jì)雙評機(jī)制,可以對個(gè)別閱卷教師的評分誤差進(jìn)行及時(shí)糾偏,這便進(jìn)一步導(dǎo)致了這些學(xué)校試卷批改精度的下降。

作為學(xué)科教學(xué)質(zhì)量的測量工具,義務(wù)教育學(xué)??荚嚤仨毦邆漭^高的信效度。然而,教師命題能力低下、命題過程粗放,勢必導(dǎo)致試卷質(zhì)量低劣,加上批改過程不嚴(yán)謹(jǐn),有可能會(huì)加大考試分?jǐn)?shù)的誤差,因此,這樣的學(xué)??荚嚦32荒芫珳?zhǔn)反映學(xué)生的學(xué)科水平高低。比如,學(xué)??荚嚦煽?4分的學(xué)生的學(xué)科水平未必高于92分的學(xué)生的學(xué)科水平;排序?yàn)榈?0名的學(xué)生的學(xué)科水平未必高于第55名學(xué)生的學(xué)科水平。

(二)等第化評價(jià)更加有利于學(xué)生的全面發(fā)展

教育部辦公廳印發(fā)的《關(guān)于加強(qiáng)義務(wù)教育學(xué)??荚嚬芾淼耐ㄖ访鞔_規(guī)定:“義務(wù)教育學(xué)??荚嚸鎸Φ氖俏闯赡陮W(xué)生,主要發(fā)揮診斷學(xué)情教情、改進(jìn)加強(qiáng)教學(xué)、評價(jià)教學(xué)質(zhì)量等方面功能,除初中畢業(yè)生升高中考試(學(xué)業(yè)水平考試)外,其他考試不具有甄別、選拔功能?!保?]義務(wù)教育學(xué)校組織的各學(xué)科考試都是過程性考試,不是終結(jié)性考試;是低利害的考試,不是高利害的考試;是標(biāo)準(zhǔn)參照考試,不是常模參照考試;是過關(guān)性考試,不是選拔性考試。高利害考試、常模參照考試、選拔性考試、甄別性考試采用分?jǐn)?shù)評價(jià)方式,需要使用考試分?jǐn)?shù)給學(xué)生排名排序;低利害考試、標(biāo)準(zhǔn)參照考試、過關(guān)性考試、非選拔性和非甄別性考試沒有必要采取分?jǐn)?shù)評價(jià)的方式。

教育部《關(guān)于加強(qiáng)義務(wù)教育學(xué)??荚嚬芾淼耐ㄖ芬罅x務(wù)教育階段學(xué)校期中期末考試實(shí)行等級評價(jià),一般分4至5個(gè)等級。國家義務(wù)教育質(zhì)量監(jiān)測將小學(xué)評價(jià)分為優(yōu)秀、合格、待合格3個(gè)等級,初中分為優(yōu)秀、良好、合格、待合格4個(gè)等級。參考國家義務(wù)教育質(zhì)量監(jiān)測的做法和《關(guān)于加強(qiáng)義務(wù)教育學(xué)校考試管理的通知》要求,筆者以為,小學(xué)階段的學(xué)??荚囋u價(jià)可以分為3至4個(gè)等級,初中可以分為4至5個(gè)等級。各學(xué)??梢愿鶕?jù)本校的學(xué)生規(guī)模確定考試的等第層級數(shù):學(xué)生規(guī)模較大的,考試等第的層級可以多一些;學(xué)生規(guī)模較小的,考試等第的層級可以少一些。

國家義務(wù)教育質(zhì)量監(jiān)測學(xué)科考試的性質(zhì)和功能與義務(wù)教育學(xué)校組織的各學(xué)科期中、期末考試相似。根據(jù)義務(wù)教育學(xué)校期中、期末考試的性質(zhì)和功能,采取等第化評價(jià)不僅可以有效評價(jià)學(xué)校的教學(xué)質(zhì)量,而且更加有利于學(xué)生的全面發(fā)展。

二、兩種需要改良的學(xué)??荚嚨鹊趧澐址?/p>

義務(wù)教育學(xué)校采用等第化評價(jià)方式,存在兩種較為常見的等第劃分法,一種是傳統(tǒng)的固定分?jǐn)?shù)法,另一種是百分位分?jǐn)?shù)法。目前來看,兩種等第劃分法都有待改良。

(一)傳統(tǒng)的固定分?jǐn)?shù)劃分法

很多學(xué)校傳統(tǒng)上以60分、70分、80分和90分作為學(xué)生成績合格、一般、良好和優(yōu)秀的劃界分?jǐn)?shù),而不管試卷中考了什么、試題的難度如何。事實(shí)證明:60分并不能成為判斷學(xué)生合格與否的“金”標(biāo)準(zhǔn),它較適用于預(yù)先設(shè)置通過率(常模參照測驗(yàn))的以選拔為目的的測驗(yàn)類型。而將60分作為標(biāo)準(zhǔn)參照測驗(yàn)的劃界分?jǐn)?shù)是一種主觀性的劃定,在許多情形下并不適合對學(xué)生進(jìn)行科學(xué)的評價(jià)[2]。同理,用70分、80分、90分劃線來區(qū)分一般、良好和優(yōu)秀也不夠科學(xué)、合理。

根據(jù)這種等第劃分方法,如果整卷試題難度較大,評定為優(yōu)秀和良好的學(xué)生人數(shù)就會(huì)比較少,評定為合格和待合格的學(xué)生人數(shù)就會(huì)比較多;如果整卷試題難度較小,就會(huì)出現(xiàn)相反的現(xiàn)象。從橫向比較來看,同一次考試(如期末考試)不同學(xué)科考試的等第比例結(jié)構(gòu)差異較大,有可能會(huì)出現(xiàn)語文A很多、英語A很少等學(xué)科不均衡、不合理的現(xiàn)象。從縱向比較來看,也很容易出現(xiàn)同一個(gè)學(xué)生同一個(gè)學(xué)科前后兩次考試成績等第的異常變化現(xiàn)象,而變化的歸因很有可能是整卷試題的難度發(fā)生了變化,而不是學(xué)生學(xué)業(yè)真實(shí)的進(jìn)步或退步。因此,用傳統(tǒng)的固定分?jǐn)?shù)劃分等第不足以真實(shí)反映學(xué)生學(xué)業(yè)的進(jìn)步或退步。

盡管這種傳統(tǒng)的固定分?jǐn)?shù)劃分法操作簡便,但因?yàn)槿狈茖W(xué)依據(jù)而嚴(yán)重?fù)p害了考試的效度和信度,所以必須改良。

(二)百分位分?jǐn)?shù)劃分法

當(dāng)前各?。ㄗ灾螀^(qū)、直轄市)統(tǒng)一實(shí)施的學(xué)業(yè)水平考試大多將百分位分?jǐn)?shù)作為分類的依據(jù),縣級學(xué)科考試也常常采用百分位分?jǐn)?shù)等第劃分法。一種情況為各等第比率一樣,如A(優(yōu)秀)、B(良好)、C(中等)、D(合格)、E(待合格)各占20%。另一種情況為各等第比率不一樣,如A(優(yōu)秀)占10%、B(良好)占20%、C(中等)占30%、D(合格)占35%或以上、E(待合格)占5%或以下。這兩種百分位分?jǐn)?shù)劃分法,劃出的等第結(jié)果與試卷難度無關(guān),與考試內(nèi)容無關(guān),具有縱向、橫向可比性,可用于增值性評價(jià)。

但是,按照以上等第劃分法,不管試卷難度及學(xué)生課程目標(biāo)達(dá)成度,各等第整齊劃一,依然存在很大的弊端。簡單來說,即便全體學(xué)生實(shí)際上都達(dá)到了課標(biāo)的要求,也會(huì)有20%或5%的學(xué)生被評定為E(待合格);即便全體學(xué)生實(shí)際上都沒有達(dá)到課標(biāo)要求,也有80%或95%的學(xué)生被評定為合格及以上等第,甚至還有20%的學(xué)生可能被評定為優(yōu)秀。

百分位分?jǐn)?shù)劃分法實(shí)際上采用的是常模參照考試的做法,本質(zhì)上是將學(xué)生的表現(xiàn)與其他學(xué)生進(jìn)行比較,而這并不符合當(dāng)下基于課程標(biāo)準(zhǔn)的學(xué)??荚囋u價(jià)要求??梢哉f,它完全違背了基于標(biāo)準(zhǔn)的教育考試的初衷。因此,用百分位分?jǐn)?shù)劃分法劃分考試等第的做法,同樣必須改良。

三、義務(wù)教育學(xué)??荚嚨鹊趧澐值娜N技術(shù)

(一)Angoff法劃分技術(shù)

美國心理學(xué)家威廉·安戈夫(William Angoff)于1971年提出的Angoff法,是目前教育測量學(xué)中應(yīng)用十分廣泛的一種等第標(biāo)準(zhǔn)設(shè)置方法。該方法可根據(jù)各學(xué)科專家任務(wù)的不同進(jìn)一步細(xì)分為概率法和對錯(cuò)法兩種?!案怕史ā币髮W(xué)科專家判斷各等第表現(xiàn)考生能夠正確解答某題的概率值,概率值在0—1之間;“對錯(cuò)法”要求學(xué)科專家判斷各等第表現(xiàn)考生能否做對某題,能正確回答的題目賦值1,不能正確回答的賦值0,沒有中間值[3]。

Angoff法的操作步驟有三個(gè):(1)形成最低能力(各等第)表現(xiàn)考生的概念;(2)學(xué)科專家判定測驗(yàn)的每一個(gè)題目并賦值(“概率法”賦值范圍為0—1之間的某一個(gè)數(shù)值,“對錯(cuò)法”賦值為0或1);(3)求出各學(xué)科專家對各等第最低能力表現(xiàn)考生判斷的總分,其平均值即各等第劃界分?jǐn)?shù)[4]。

Angoff法常用于大型考試的劃界分?jǐn)?shù)設(shè)置,但該法側(cè)重0、1計(jì)分題目的劃界分?jǐn)?shù)設(shè)置,并不適用于多級計(jì)分的題目類型。Angoff法最大的優(yōu)點(diǎn)是直觀,且相對容易理解,評判結(jié)果數(shù)據(jù)的收集和分析也比較容易,但是對學(xué)科專家的學(xué)科教育測量能力要求很高,包括專家對學(xué)科課程標(biāo)準(zhǔn)的把握能力、對教學(xué)目標(biāo)的理解能力、對教與學(xué)效果的預(yù)測能力等。大部分一線教師很難對試題不同等第學(xué)生的得分率進(jìn)行精準(zhǔn)判斷,導(dǎo)致題目賦值誤差較大。因此,義務(wù)教育學(xué)??荚囋u價(jià)不建議直接采用這種等第劃分技術(shù)。

(二)Bookmark法劃分技術(shù)

Bookmark法最早是由Mitzel等在2001年進(jìn)行系統(tǒng)描述的基于項(xiàng)目反應(yīng)理論的設(shè)置標(biāo)準(zhǔn)等第劃界分?jǐn)?shù)的方法[5]10,是一種比較新的重要的標(biāo)準(zhǔn)設(shè)置方法[5]16,是近年來特別是在美國的K-12教育評價(jià)中得到廣泛應(yīng)用[5]11的一種標(biāo)準(zhǔn)設(shè)置方法。

Bookmark法一般分為4個(gè)操作步驟。(1)采用項(xiàng)目反應(yīng)理論(IRT)對試題進(jìn)行項(xiàng)目反應(yīng)分析,將試題按照項(xiàng)目反應(yīng)理論難度從易到難進(jìn)行排列,每道試題放置一頁,組成像書一樣的題冊。(2)有關(guān)學(xué)科專家以考試題目材料的難度參數(shù)值為基礎(chǔ),按照試題冊的順序討論每道題目,判斷等第中最低能力的考生答對所討論題目的概率是否在2/3以上:如果低于2/3,則評判專家在相應(yīng)的題目上放置書簽,以此作為設(shè)置劃界分?jǐn)?shù)的依據(jù)。(3)專家們反饋并討論第一次書簽放置結(jié)果,再次放置書簽。(4)向所有學(xué)科專家呈現(xiàn)所有書簽放置結(jié)果,參照前兩輪步驟開展第三次討論,放置書簽,結(jié)束Bookmark程序,或者視情況再進(jìn)行第四輪、第五輪討論。此外,若加以延伸,可按照相同的步驟設(shè)置良好、優(yōu)秀等多重分?jǐn)?shù)線[5]11。

在國內(nèi)的考試機(jī)構(gòu)中,掌握Bookmark法的人不多,相關(guān)研究文獻(xiàn)和實(shí)際應(yīng)用也較少。需要說明的是,要想采用Bookmark法,必須利用項(xiàng)目反應(yīng)理論(IRT)對試題進(jìn)行項(xiàng)目反應(yīng)分析[5]11,而這是大部分學(xué)校教師難以做到的。因此,義務(wù)教育學(xué)??荚囋u價(jià)不建議采用這種等第劃分技術(shù)。

(三)簡約型等第劃分技術(shù)

學(xué)科成績等第具有一定程度的標(biāo)簽效應(yīng),合適的等第評價(jià)對學(xué)生學(xué)習(xí)具有激勵(lì)和促進(jìn)作用。等第評價(jià)相對于分?jǐn)?shù)評價(jià)而言,雖然具有明顯的模糊性,但是仍然不能隨意化和主觀化,必須講究科學(xué)性、專業(yè)性和客觀性。面對常態(tài)化的期中、期末紙筆考試等第劃分工作,在各備課組教師普遍缺乏學(xué)科教育評價(jià)專業(yè)技能的情況下,義務(wù)教育學(xué)校不能簡單模仿國家教育質(zhì)量監(jiān)測、省級教育質(zhì)量監(jiān)測和市級教育質(zhì)量監(jiān)測的做法采取Angoff法、Bookmark法等專業(yè)性很強(qiáng)的等第劃分技術(shù),必須找到一種更簡易且更具可操作性的等第劃分技術(shù)。筆者團(tuán)隊(duì)基于Angoff法和Bookmark法,結(jié)合義務(wù)教育學(xué)校一線教師考試評價(jià)能力和評價(jià)工作的特點(diǎn),研制出了一種具有一定程度科學(xué)性和可操作性的簡約型等第劃分技術(shù),該技術(shù)有下面三個(gè)操作步驟。

第一步,構(gòu)建校本化等第結(jié)構(gòu)模型。校本化等第結(jié)構(gòu)模型有兩類。第一類模型側(cè)重客觀性評估功能。學(xué)??筛鶕?jù)多年來市級教育質(zhì)量監(jiān)測、省市中考、縣域期末統(tǒng)考中本校學(xué)生各等第占比數(shù)據(jù)和本校學(xué)生生源實(shí)際,擬建本校不同學(xué)段學(xué)生各等第比率結(jié)構(gòu)模型。平時(shí)學(xué)??荚嚫鞯鹊谇闆r分布可以與該模型相近。例如,若模型中A占34%、B占41%、C占22%、E占3%,則平??荚囍锌砂碅占35%、B占40%、C占20%、E占5%的比率結(jié)構(gòu)進(jìn)行設(shè)置。鑒于義務(wù)教育學(xué)校實(shí)行的是“劃片招生,就近入學(xué)”的政策,生源情況相對穩(wěn)定,這種基于大規(guī)模考試數(shù)據(jù)的模型也就相對可靠。第二類模型側(cè)重考試評價(jià)的促進(jìn)功能和激勵(lì)功能[6]。如:小學(xué)階段待合格比例約在5%以下,一二年級優(yōu)秀率約在70%及以上,三四年級優(yōu)秀率約在60%及以上,五六年級優(yōu)秀率約在50%及以上;初中階段待合格率比例約在10%以下、建議5%以下,七年級優(yōu)秀率約在50%以上,八年級優(yōu)秀率約在40%以上,九年級優(yōu)秀率約在30%以上。顯然,第二類模型的優(yōu)秀率和良好率比較高,待合格率很低,具有顯著的標(biāo)簽功能,會(huì)發(fā)生皮格馬利翁效應(yīng)。

第二步,參考Angoff法、Bookmark法初擬劃線分。這一步,需要做好以下幾項(xiàng)工作。(1)統(tǒng)計(jì)難度值??荚囬喚砗?,統(tǒng)計(jì)每一道試題的得分率和得分值,同時(shí)按照校本化等第結(jié)構(gòu)模型計(jì)算不同等第學(xué)生的每一道試題的得分率和得分值,并按全體學(xué)生的難度大小由易到難排序,形成excel電子表;這些數(shù)據(jù)將成為學(xué)科專家的重要參考。(2)組建學(xué)科專家組。人數(shù)3—7個(gè),以本備課組教師為主,其他備課組教師為輔。如果都是本備課組教師,容易出現(xiàn)自我利益化傾向,從而影響劃線的公正性和客觀性。學(xué)科專家盡量選用有三年及以上教齡的比較優(yōu)秀的教師,優(yōu)先選用參與過命題、具有一定命題能力的教師。(3)作答試卷。統(tǒng)一時(shí)間、統(tǒng)一場所,組織學(xué)科專家作答試卷,并預(yù)測不同等級學(xué)生每一道試題的最低得分率。(4)研讀標(biāo)準(zhǔn)。當(dāng)場組織專家研讀本學(xué)科課程標(biāo)準(zhǔn)中的學(xué)業(yè)質(zhì)量水平描述和教學(xué)要求,微調(diào)自己對試題的預(yù)測值。(5)初擬劃線分。匯總統(tǒng)計(jì)各專家各試題的評價(jià)得分率、平均分和等第劃線分。組織學(xué)科專家討論交流,分析大家的預(yù)測數(shù)據(jù)和實(shí)考數(shù)據(jù),研討交流,初擬各等第劃線分。

第三步,折中擬定各等第劃線分。先按校本化等第結(jié)構(gòu)模型,計(jì)算各等第的劃線分。再將專家組的預(yù)測劃線分和等第結(jié)構(gòu)模型進(jìn)行比較,取兩者平均值。例如,專家組劃線結(jié)果A占27%,等第結(jié)構(gòu)模型中A占31%,則本次考試可初擬A為29%。然后根據(jù)試卷難度、區(qū)分度、信效度、分?jǐn)?shù)分布和傳統(tǒng)習(xí)慣等因素,將各等第劃線分調(diào)整到最佳狀態(tài)。例如,把初擬的A占29%微調(diào)為占30%,根據(jù)30%的比率逆向劃定分?jǐn)?shù)線;同理,重新確定各等第劃線分,評定所有學(xué)生的等第。在這個(gè)環(huán)節(jié),要合理微調(diào)A(優(yōu)秀)和E(待合格)的劃線分。如果試卷難度很小,沒有60分以下的學(xué)生,則E(待合格)可以沒有;若96分以上學(xué)生很多,比率明顯超過等第結(jié)構(gòu)模型值,也可以都認(rèn)定為A(優(yōu)秀)。

四、義務(wù)教育學(xué)??荚嚨鹊诨u價(jià)的意義

(一)有利于學(xué)生的身心健康

根據(jù)考試分?jǐn)?shù)排名排序,異化分?jǐn)?shù)橫向比較,已經(jīng)成為當(dāng)下教學(xué)評價(jià)的頑疾。義務(wù)教育學(xué)校存在考試結(jié)果使用不當(dāng)?shù)韧怀鰡栴},違背素質(zhì)教育導(dǎo)向,造成學(xué)生應(yīng)考壓力過大、心理負(fù)擔(dān)過重,損害了學(xué)生的身心健康。

“考考考,老師的法寶;分分分,學(xué)生的命根?!边@種落后的考試觀和評價(jià)觀已經(jīng)嚴(yán)重影響了學(xué)生的身心健康。尤其是小學(xué)生,他們對數(shù)據(jù)差異特別敏感,相差一分,就感覺相差很大,會(huì)誤以為自己水平顯著低于別人,以為自己的學(xué)習(xí)成效不如他人,從而產(chǎn)生學(xué)習(xí)焦慮。又因?yàn)橥脂F(xiàn)象比較多,差異一兩分,位次排名有可能相差幾十名,會(huì)在無形中增加學(xué)生的心理負(fù)擔(dān)。再說,學(xué)校考試成績相差兩三分,都在誤差范圍以內(nèi)。消除分?jǐn)?shù)化評價(jià)是應(yīng)對“甄別與選拔功能”釜底抽薪的重要舉措,是“減負(fù)”最有效的手段之一。

為了嚴(yán)格遵守評價(jià)的倫理規(guī)范,尊重學(xué)生人格,保護(hù)學(xué)生自尊心,學(xué)校對學(xué)生必須采取等第化評價(jià)。采取等第化評價(jià),沒有了排名排序,則有利于學(xué)生消除“與他人比較”“分分計(jì)較”的思想;也會(huì)大幅度減少考試作弊現(xiàn)象,有利于學(xué)生“誠實(shí)”品格的養(yǎng)成;還會(huì)大幅度降低學(xué)生之間的學(xué)業(yè)競爭,有利于學(xué)生之間的合作學(xué)習(xí)。

(二)有利于教師面向全體學(xué)生因材施教

傳統(tǒng)的分?jǐn)?shù)評價(jià),導(dǎo)致教師普遍存在“第一名”“前三名”“前十名”的升學(xué)思想。如果班級中出現(xiàn)了“第一名”,就會(huì)標(biāo)榜出了“狀元”;如果班級中出現(xiàn)了“第二名”,就會(huì)鼓勵(lì)并大力支持“第二名”在下次考試中爭當(dāng)“狀元”;如果班級中出現(xiàn)了“第三名”,就會(huì)自我標(biāo)榜進(jìn)入了“前三甲”;如果班級中出現(xiàn)了“第四名”,就會(huì)鼓勵(lì)并大力支持“第四名”在下次考試中力爭進(jìn)入“前三甲”;如果班級中出現(xiàn)了“第十名”,就會(huì)標(biāo)榜進(jìn)入了“前十名”;如果班級中出現(xiàn)了“第十一名、第十二名”,就會(huì)鼓勵(lì)并大力支持他們在下次考試中力爭進(jìn)入“前十名”。通常情況下,前十幾名學(xué)生的學(xué)科水平都處于同一個(gè)水平層次,沒有必要鼓勵(lì)和支持他們開展過度的學(xué)業(yè)競爭。在這種傳統(tǒng)的升學(xué)思想指引下,分?jǐn)?shù)評價(jià)誤導(dǎo)了一線教師格外關(guān)注優(yōu)等生的培育,而忽略了大量中等生和部分后進(jìn)生的培育。

采取等第化評價(jià)以后,教師的關(guān)注對象將不再是“第一名”“前三名”“前十名”,而是將關(guān)注重心轉(zhuǎn)向待達(dá)標(biāo)學(xué)生和等級邊緣學(xué)生,即更加關(guān)注全體學(xué)生的等級躍遷。因此,等第化評價(jià)可以引導(dǎo)教師樹立起教育教學(xué)“面向全體”的思想,努力使每一個(gè)學(xué)生都能達(dá)到國家課程標(biāo)準(zhǔn)的要求,更加重視后進(jìn)生的轉(zhuǎn)化,不讓一個(gè)學(xué)生掉隊(duì)。如此則會(huì)縮小學(xué)生成績標(biāo)準(zhǔn)差,控制兩極分化的程度,從而整體提高學(xué)校教學(xué)質(zhì)量。

(三)有利于學(xué)校改進(jìn)教學(xué)質(zhì)量觀

目前,很多學(xué)校仍然采用考試平均分比較的方法衡量教師的教學(xué)質(zhì)量。即使平均分差異非常微小,沒有本質(zhì)差異,也要排出次序高低。雖然這種不科學(xué)的水平評價(jià)歷史悠久,但是并沒有得到教師們的認(rèn)可。采取學(xué)生等第化評價(jià)以后,學(xué)校對教師的教學(xué)評價(jià)將由“整體水平評價(jià)”調(diào)整為“整體結(jié)構(gòu)評價(jià)”,即通過學(xué)生等第分布結(jié)構(gòu)質(zhì)量評估教師的教學(xué)質(zhì)量。

例如,初中整體結(jié)構(gòu)公式為M=4A+2B+1P-4E,小學(xué)整體結(jié)構(gòu)公式為M=4A+P-4E。A、B、P、E分別代表優(yōu)秀、良好、合格、待合格學(xué)生的占比;各等第前面的系數(shù)為各等第的權(quán)重值,系數(shù)大小反映重視程度和評價(jià)導(dǎo)向。由于E(待合格)的系數(shù)權(quán)重與A(優(yōu)秀)一樣,會(huì)引導(dǎo)教師高度重視待合格學(xué)生的轉(zhuǎn)化幫扶工作。

(四)有利于家庭教育“五育”并舉

通常情況下,家長看待孩子的考試分?jǐn)?shù)很片面,一般不管試卷難度、不管是否達(dá)到課程標(biāo)準(zhǔn)。如果分?jǐn)?shù)比較低,或者分?jǐn)?shù)不如其他同學(xué),就想送孩子去校外培訓(xùn)機(jī)構(gòu)補(bǔ)習(xí)。也就是說,學(xué)??荚嚪?jǐn)?shù)評價(jià)對家長有誤導(dǎo)性。大規(guī)模義務(wù)教育監(jiān)測數(shù)據(jù)發(fā)現(xiàn),大部分學(xué)生沒有必要過度進(jìn)行文化學(xué)科的補(bǔ)習(xí)。采取等第化評價(jià)后,沒有了分?jǐn)?shù)評價(jià),便可以讓部分家長把精力從刷題教育、應(yīng)試教育轉(zhuǎn)向德育、體育、美育和勞動(dòng)教育,從而有利于家庭教育的“五育”并舉。

綜上所述,順應(yīng)新時(shí)代教育評價(jià)改革的需要,義務(wù)教育學(xué)校必須破除傳統(tǒng)的考試分?jǐn)?shù)評價(jià),實(shí)施等第化評價(jià)。等第化評價(jià)只有做到了科學(xué)合規(guī)、合情合理,才能有效促進(jìn)學(xué)生的學(xué)業(yè)與身心健康的協(xié)同發(fā)展。這種評價(jià)導(dǎo)向的改變,不僅僅指向期末考試,而且指向平常的過程性學(xué)科評價(jià),這將成為義務(wù)教育學(xué)校學(xué)科評價(jià)改革的一大趨勢。

參考文獻(xiàn)

[1]王旭東.義務(wù)教育學(xué)??荚嚨男再|(zhì)探析[J].浙江考試,2022(10):58-61.

[2]劉欣顏,劉晟,劉恩山.學(xué)業(yè)質(zhì)量水平等級標(biāo)準(zhǔn)設(shè)定及其啟示:以小學(xué)科學(xué)學(xué)科為例[J].教育學(xué)報(bào),2016,12(2):34-40.

[3]余嘉元.Angoff方法有效性的檢驗(yàn)研究[J].教育研究與實(shí)驗(yàn),2008(1):54-57.

[4]陳夢竹,張敏強(qiáng).Bookmark法設(shè)置劃界分?jǐn)?shù)的研究述評[J].心理科學(xué)進(jìn)展,2009,17(5):1102-1108.

[5]王曉華.Bookmark法在基于標(biāo)準(zhǔn)的教育考試中設(shè)置劃界分?jǐn)?shù)的應(yīng)用[J].中國考試,2014(7):10-18.

[6]王旭東,周家榮.落實(shí)“雙減”,學(xué)??荚囈貧w正道[J].云南教育,2022(7/8):58-60.

永康市| 乌海市| 秦安县| 廊坊市| 陆良县| 尉氏县| 望奎县| 广安市| 嘉荫县| 荔浦县| 宝坻区| 万年县| 安多县| 肥乡县| 勃利县| 衡山县| 烟台市| 永康市| 淳安县| 乐清市| 四子王旗| 灵寿县| 子长县| 格尔木市| 邢台市| 新源县| 县级市| 含山县| 南华县| 襄城县| 靖远县| 郸城县| 尼玛县| 凉城县| 巴林左旗| 信宜市| 延安市| 霍城县| 手游| 峨山| 毕节市|