陳方丁
中共中央、國務(wù)院印發(fā)《深化新時代教育評價改革總體方案》后,各界興起了學(xué)習(xí)、貫徹、落實(shí)的熱潮,尤其是教育領(lǐng)域,結(jié)合習(xí)近平總書記的講話及全國教育大會的精神,紛紛“對標(biāo)對表”,對原有的相關(guān)文件、相關(guān)規(guī)定、相關(guān)管理方式等進(jìn)行了修正,擬定貫徹落實(shí)的細(xì)則、工作主體及工作日程。
考試評價部門,泛指用大規(guī)模標(biāo)準(zhǔn)化考試的方式,對教育領(lǐng)域,特別是對教育領(lǐng)域內(nèi)與試者的學(xué)業(yè)成就,進(jìn)行測量評價的部門,包括從事命題、組織考試、評卷、分?jǐn)?shù)解釋與使用等業(yè)務(wù)的相關(guān)單位。它作為教育評價的一個主體,在學(xué)習(xí)、貫徹、落實(shí)《深化新時代教育評價改革總體方案》中,更是對考試評價的所有工作進(jìn)行了全面的梳理與反思。不少人對“唯分?jǐn)?shù)”與考試數(shù)據(jù)的認(rèn)識存在困惑甚至陷入誤區(qū),工作上出現(xiàn)了“不敢為”的苗頭。因此,有必要匡正認(rèn)識,放下包袱,更好地推進(jìn)考試評價改革工作。
破除“唯分?jǐn)?shù)”,能否不要分?jǐn)?shù)——分?jǐn)?shù)的必然性
數(shù)字只是一種符號,由于這種符號系統(tǒng)具有同一性、等級性、等距性、等比性等特性,特別適合邏輯運(yùn)算,所以人們通常使用數(shù)字來描述事物的屬性。我們可以用數(shù)來描述事物屬性的類別(名稱量表),也可以用數(shù)來描述事物屬性的等級(等級量表),或者進(jìn)行等距運(yùn)算(等距量表)、等比運(yùn)算(等比量表)推測事物的屬性。
數(shù)量是客觀世界存在的形式,“數(shù)量關(guān)系”是事物的固有屬性。任何現(xiàn)象,只要存在,就有數(shù)量。在教育領(lǐng)域,每個學(xué)生的學(xué)業(yè)成就、人格特征、能力傾向、職業(yè)性向、思想品德、綜合素質(zhì)等屬性,總是存在差異。這種差異可能是類別上的差異,也可能是程度上的差異,也可能是暫時的差異,也可能是未來發(fā)展的潛在差異。所有的差異都可以用數(shù)據(jù)來描述。當(dāng)我們用數(shù)據(jù)來描述學(xué)生學(xué)業(yè)成就的差異時,數(shù)據(jù)就是分?jǐn)?shù)。例如,我們將考生普通高中學(xué)業(yè)水平考試的卷面分?jǐn)?shù)從高到低劃分為A、B、C、D、E 5個等級,各等級的人數(shù)比例分別約為17%、33%、33%、15%和2%。對考生考試結(jié)果用A、B、C、D、E進(jìn)行等級描述,事實(shí)上就是運(yùn)用數(shù)據(jù)的等級量表對考生學(xué)業(yè)水平的差異進(jìn)行5分制的分?jǐn)?shù)等級描述。
可見,有物存在,就有數(shù)量;有數(shù)量存在,就可測量;有測量,就有數(shù)據(jù)。測量運(yùn)用于教育領(lǐng)域,特別是運(yùn)用大規(guī)模標(biāo)準(zhǔn)化的考試評價教育對象時,其結(jié)果的表征就是分?jǐn)?shù)。
破除“唯分?jǐn)?shù)”,并不是不要分?jǐn)?shù),考試分?jǐn)?shù)仍然是評價教育的重要手段,考試評價仍然是教育領(lǐng)域中的重要工作,分?jǐn)?shù)的統(tǒng)計與分析仍然是教育評價不可或缺的重要組成部分。在學(xué)校教學(xué)班中,教師通過對學(xué)生的診斷性考試得到的分?jǐn)?shù),仍然是診斷學(xué)生學(xué)習(xí)情況的重要指標(biāo);學(xué)校對年級各班進(jìn)行的形成性考試得到的分?jǐn)?shù),仍然是促進(jìn)教師完善教育方案、幫助學(xué)生改進(jìn)學(xué)習(xí)的重要工具;教育行政部門組織的終結(jié)性考試獲得的分?jǐn)?shù),仍然是對已制定教育方案、計劃、課程等整體效益鑒定的重要手段;普通高等教育招生考試的分?jǐn)?shù),仍然是選拔人才的主要標(biāo)尺。
只是每一種考試得到的分?jǐn)?shù),均有其獨(dú)特的功能和使用的邊界,不能夸大,更不能越界。正如列寧所說:“真理只要向前一步,哪怕是一小步,就會成為謬誤?!?/p>
追“分”路上,此分非彼分——考試評價的“分?jǐn)?shù)”追求與“唯分?jǐn)?shù)”的分?jǐn)?shù)追求具有本質(zhì)區(qū)別
考試評價部門使用大規(guī)模標(biāo)準(zhǔn)化考試的方式,評價考生的學(xué)業(yè)成就,以此作為招生錄取的依據(jù),其成效是有目共睹的?!秶鴦?wù)院關(guān)于深化考試招生制度改革的實(shí)施意見》對考試評價工作作了充分的肯定:改革開放以來,我國考試招生制度不斷改進(jìn)完善,初步形成了相對完整的考試招生體系,為學(xué)生成長、國家選才、社會公平做出了歷史性貢獻(xiàn),對提高教育質(zhì)量、提升國民素質(zhì)、促進(jìn)社會縱向流動、服務(wù)國家現(xiàn)代化建設(shè)發(fā)揮了不可替代的重要作用。
然而,隨著時代發(fā)展,考試評價及其衍生的一些問題不斷顯現(xiàn),甚至固化?!拔ǚ?jǐn)?shù)”終成了頑瘴痼疾。事實(shí)上考試評價對“分?jǐn)?shù)”的追求,對“好的分?jǐn)?shù)”的追求,從未止步。
考試評價對正確的分?jǐn)?shù)追求,從未止步。2014年,《國務(wù)院關(guān)于深化考試招生制度改革的實(shí)施意見》頒布后,教育部考試中心構(gòu)建高考評價體系的研究工作隨之啟動,組織多所高校的150多位專家,在全國廣泛調(diào)研的基礎(chǔ)上,最終形成了理論性與現(xiàn)實(shí)性相結(jié)合、國際化與民族化相結(jié)合、基礎(chǔ)教育與高等教育相銜接的中國高考評價體系。從高考層面對“培養(yǎng)什么人、怎樣培養(yǎng)人、為誰培養(yǎng)人”這一教育根本問題給出了回答。中國高考評價體系的科學(xué)建構(gòu),是健全立德樹人落實(shí)機(jī)制、實(shí)現(xiàn)德智體美勞全面發(fā)展育人目標(biāo)的必經(jīng)之路。個別地區(qū)的試題出現(xiàn)價值觀方面的誤導(dǎo),值得警惕。
考試評價對科學(xué)分?jǐn)?shù)(真分?jǐn)?shù))的追求,從未止步。組織教育學(xué)家、心理學(xué)家、測量學(xué)家、學(xué)科專家升級測量工具的工作,從未間斷。測量對象屬性的界定,不斷深化;各學(xué)科必備知識、關(guān)鍵能力、學(xué)科素養(yǎng)測量的可操作性,越來越強(qiáng);學(xué)科內(nèi)容測量的基礎(chǔ)性、綜合性、應(yīng)用性、創(chuàng)新性的把握,越來越精準(zhǔn);編制的測量工具,越來越先進(jìn);測量誤差的控制,越來越好;考試分?jǐn)?shù)的效度、信度,越來越高;特別是隨著新興測量理論的廣泛應(yīng)用,數(shù)據(jù)的統(tǒng)計與分析,越來越科學(xué)??傊荚嚪?jǐn)?shù)越來越正確、越來越準(zhǔn)確地標(biāo)示與試者的知識、能力及素養(yǎng)狀況,分?jǐn)?shù)越來越“真”,越來越有價值。
考試評價對公平分?jǐn)?shù)的追求,從未止步。由于考試分?jǐn)?shù)與教育資源、乃至社會資源的分配直接關(guān)聯(lián),考試招生制度是促進(jìn)社會縱向流動的機(jī)制之一,考試招生部門對公平分?jǐn)?shù)的追求責(zé)無旁貸。在命題環(huán)節(jié),從題型采用、分值分配、素材選取、情景創(chuàng)設(shè)、設(shè)問與參考答案和評分標(biāo)準(zhǔn)的確定、難度控制等,都將公平擺在重要位置;在考務(wù)環(huán)節(jié),從標(biāo)準(zhǔn)化考場的建設(shè)、標(biāo)準(zhǔn)化考務(wù)流程的健全、評分細(xì)則的擬定、評卷誤差的控制等,無不凸顯公平。
考試評價對全面分?jǐn)?shù)的追求,從未止步。廣東省2021年普通高校的招生,依據(jù)考生全國統(tǒng)一高考和省普通高中學(xué)業(yè)水平選擇性考試科目成績,參考綜合素質(zhì)評價實(shí)施錄取。在《關(guān)于做好2021年基于高考基礎(chǔ)上綜合評價招生錄取模式試點(diǎn)工作的通知》中規(guī)定,綜合評價錄取試點(diǎn)高校要重點(diǎn)研判考生高中綜合素質(zhì)檔案內(nèi)容,將學(xué)生社區(qū)服務(wù)、社會實(shí)踐經(jīng)歷、研究性學(xué)習(xí)和自主選修課程學(xué)習(xí)情況等作為初審的重要內(nèi)容和必要條件……要按照6:3:1比例(即學(xué)生高考成績占綜合成績的60%,高校綜合素質(zhì)測試成績占30%,高中學(xué)業(yè)水平合格性考試成績占10%)合成考生的綜合成績。這些改革,追求的就是不斷拓展的全面分?jǐn)?shù)。
可見,考試評價主體的“分?jǐn)?shù)”追求與“唯分?jǐn)?shù)”論的分?jǐn)?shù)追求,具有本質(zhì)區(qū)別??荚囋u價主體追求的“分?jǐn)?shù)”是一種“好”的分?jǐn)?shù),“唯分?jǐn)?shù)”論者追求的分?jǐn)?shù)是一種“多”的分?jǐn)?shù)。在價值取向上,考試評價主體追求的是立德樹人、服務(wù)選才、引導(dǎo)教學(xué)的分?jǐn)?shù);“唯分?jǐn)?shù)”論者追求的是“多”的分?jǐn)?shù),是為了個體獲得更多的教育資源或社會資源的分?jǐn)?shù)。在思想方法上,考試評價主體承認(rèn)分?jǐn)?shù)的相對性,承認(rèn)分?jǐn)?shù)的使用邊界;“唯分?jǐn)?shù)”論者把分?jǐn)?shù)絕對化、標(biāo)簽化,特別是對高考分?jǐn)?shù),任意擴(kuò)大使用范圍,作為評估學(xué)生、評估教師、評估學(xué)校成績的唯一指標(biāo)??荚囋u價主體努力使分?jǐn)?shù)增量,表征著知識、能力、素養(yǎng)的增量,追求分?jǐn)?shù)的“真實(shí)”;“唯分?jǐn)?shù)”論者“走捷徑”,通過“刷題”獲取“練習(xí)效益”,在同等知識、能力、素養(yǎng)水平下,得到更多的分?jǐn)?shù)增量,追求分?jǐn)?shù)的“虛胖”。
當(dāng)然,對于“虛胖”的分?jǐn)?shù),雙方都有責(zé)任。一方面,學(xué)校教師不應(yīng)通過題海戰(zhàn)術(shù),提高考生解題答題技能的辦法,獲得分?jǐn)?shù)的增量,而應(yīng)該走素質(zhì)教育的道路,努力提高學(xué)生知識、能力、素養(yǎng)的水平,獲得分?jǐn)?shù)的增量;另一方面,我們的測量還不夠正確、準(zhǔn)確,效度、信度還要提高,教育測量者要反思,測量得到的數(shù)據(jù)究竟是與試者的知識、能力、素養(yǎng)等心理屬性,還是解題答題的技能技巧等心理屬性?在編制測量工具時,一定要想辦法把這兩種不同的心理屬性區(qū)分開來,降低甚至消除“練習(xí)收益”。我們要用專業(yè)智慧,讓分?jǐn)?shù)更有價值。通過不斷改革命題形式,不斷創(chuàng)新題型,不斷創(chuàng)新試題情景,擠掉分?jǐn)?shù)的水分,讓分?jǐn)?shù)消腫,糾正“唯分?jǐn)?shù)”主體的教與學(xué)行為及價值取向,難免會引發(fā)陣痛。
“唯分?jǐn)?shù)”論的錯誤在于把相對的分?jǐn)?shù)絕對化,把全面的分?jǐn)?shù)狹隘化,把表征的分?jǐn)?shù)本質(zhì)化,把測量的誤差擴(kuò)大化,把相對穩(wěn)定、處于發(fā)展變化的分?jǐn)?shù)絕對化、靜止化??荚囋u價與“唯分?jǐn)?shù)”雙方在指派數(shù)據(jù)(分?jǐn)?shù))與獲取數(shù)據(jù)(分?jǐn)?shù))問題上的博弈,將長期存在。
“追分”路上,此分非彼分。切勿將所有對分?jǐn)?shù)的追求一概排斥,“談分色變”,不要把孩子和洗澡水一起潑掉。
用“分”場處,此用非彼用——考試評價的數(shù)據(jù)使用與“唯分?jǐn)?shù)”的數(shù)據(jù)使用存在重大差異
對考試數(shù)據(jù)的使用是否會導(dǎo)致“唯分?jǐn)?shù)”?這需要做具體分析。大規(guī)模標(biāo)準(zhǔn)化考試數(shù)據(jù)的使用,包括首次使用和再次使用。
考試數(shù)據(jù)的首次使用,就是運(yùn)用考試數(shù)據(jù)進(jìn)行招生錄取。高等學(xué)校招生“唯”分?jǐn)?shù)是導(dǎo)致高中教育“唯分?jǐn)?shù)”困局的必要條件。高等教育在價值觀層面的唯分?jǐn)?shù)錄取,恐怕無人認(rèn)同;但在現(xiàn)在社會條件下,在實(shí)踐操作層面的唯分?jǐn)?shù)錄取,恐怕是一種必然的選擇。
考試招生的有關(guān)文件規(guī)定,推行新一輪高考綜合改革的省區(qū),高考考生總成績由統(tǒng)一高考科目成績和普通高中學(xué)業(yè)水平考試科目成績組成,普通高中學(xué)業(yè)水平科目考試成績以“等級”(一般分為五個等級,各等級具體比例由各省根據(jù)基本教學(xué)質(zhì)量要求和命題情況等確定)或“合格、不合格”呈現(xiàn)。它一方面,擴(kuò)大了錄取分?jǐn)?shù)的范圍;另一方面,又使分?jǐn)?shù)的形式更加多樣化,不僅有數(shù)據(jù),也有等級。顯然這是破除“唯分?jǐn)?shù)”困局的重要舉措。
但是,要將上述規(guī)定貫徹到考試招生錄取工作中,確實(shí)不易。第三批高考綜合改革的試點(diǎn)省區(qū),為確保招生錄取的公平性與可操作性,將高考模式確定為“3+1+2”(“3”為語數(shù)外高考統(tǒng)考科目;“1”為普通高中學(xué)業(yè)水平選擇性考試的首選科目,即在物理與歷史中,選擇其一;“2”為普通高中學(xué)業(yè)水平考試的再選科目,即在化學(xué)、生物、地理、思想政治四個科目中,任選其二),“3+1”按原始分計入總分,“2”的等級成績按一定的規(guī)則依據(jù)卷面分?jǐn)?shù),分分轉(zhuǎn)換為等級分。唯分?jǐn)?shù)錄取,似乎回到原點(diǎn)。但是它向社會昭示,使用分?jǐn)?shù)錄取,只是操作層面,而非價值層面。依據(jù)分?jǐn)?shù)錄取,是出于公平的需要。
考試數(shù)據(jù)的再次使用是指招生錄取工作完成后,根據(jù)一定的需要,借助各種分析工具,對考試數(shù)據(jù)的統(tǒng)計與分析。大規(guī)模標(biāo)準(zhǔn)化的考試,由于其測驗(yàn)的編制、實(shí)施、評分、記分、分?jǐn)?shù)的解釋與使用,都按照統(tǒng)一的標(biāo)準(zhǔn)和嚴(yán)格的規(guī)定進(jìn)行,考試數(shù)據(jù)是高質(zhì)量的原始數(shù)據(jù),具有很強(qiáng)的原創(chuàng)性和針對性。我們知道,數(shù)據(jù)的質(zhì)量是一切統(tǒng)計與分析的基礎(chǔ),其重要性甚至超過分析方法本身。大規(guī)模標(biāo)準(zhǔn)化的考試數(shù)據(jù)庫,就是一個“金庫”,為我們的分析、研究和決策,奠定扎實(shí)基礎(chǔ)。對高考考試數(shù)據(jù)等大規(guī)模標(biāo)準(zhǔn)化考試的數(shù)據(jù),如果在招生錄取工作完成后,便束之高閣,不再使用,不再進(jìn)行深度挖掘,以此診斷學(xué)情教情,就是一種不作為。
在正確價值觀引領(lǐng)下,大規(guī)模標(biāo)準(zhǔn)化考試數(shù)據(jù)的再次使用和深度挖掘,并不會對“唯分?jǐn)?shù)”取向推波助瀾,反而能更好地在服務(wù)命題、引導(dǎo)教學(xué)、幫助考生規(guī)劃生涯方面發(fā)揮積極作用。
從命題角度來說,一份試卷是否承載了它應(yīng)該具有的功能,是否完成了它的任務(wù),需要做定性與定量的分析。比如從服務(wù)選才的功能來說,總分將考生的區(qū)分程度是否能滿足招生錄取工作的需要,分?jǐn)?shù)的變量是否能把考生知識、能力、素養(yǎng)等心理屬性程度上的差異,正確地、準(zhǔn)確地標(biāo)示出來,這就需要統(tǒng)計卷面的平均分、標(biāo)準(zhǔn)差、效度、信度、標(biāo)準(zhǔn)誤差,需要統(tǒng)計試題的難度、區(qū)分度、差異系數(shù)等等。這些數(shù)據(jù)的統(tǒng)計與分析,對于命題工作至關(guān)重要。
在國際大規(guī)模標(biāo)準(zhǔn)化考試項(xiàng)目中,中國命題團(tuán)隊(duì)的工作難度最大。一則中國考試承載測量以外的其他功能較多;再者在中國的環(huán)境下,試測后的試題不能直接使用,試卷試題的許多參數(shù)都只能靠命題團(tuán)隊(duì)借助試測、借助對往年考試數(shù)據(jù)的統(tǒng)計與分析,做出大致的估計,工作難度極大??荚嚁?shù)據(jù)的再次使用是下一年命題工作的基礎(chǔ),與“唯分?jǐn)?shù)”關(guān)聯(lián)不大。
教師、學(xué)校及市縣教育行政部門對考試數(shù)據(jù)統(tǒng)計與分析的愿望更為強(qiáng)烈。初級中學(xué)服務(wù)中考、高級中學(xué)服務(wù)高考,這是學(xué)校的職能之一。這些工作完成得如何,給學(xué)生、給家長、給社會的“工作匯報”,總得讓數(shù)據(jù)說話。當(dāng)然,在“唯分?jǐn)?shù)”價值觀引領(lǐng)下,統(tǒng)計并炒作諸如“高考狀元”“高分考生”“北清率”等,無疑會推波助瀾“唯分?jǐn)?shù)”。但為改進(jìn)本地區(qū)、本學(xué)校教育教學(xué)工作,深度挖掘分?jǐn)?shù)背后所蘊(yùn)含的信息,了解掌握本地區(qū)、本學(xué)校各學(xué)科必備知識、關(guān)鍵能力、學(xué)科素養(yǎng)等方面的水平與位置,了解自身的長處與短板,從只關(guān)注分?jǐn)?shù)條的分?jǐn)?shù)轉(zhuǎn)向發(fā)掘數(shù)據(jù)背后所蘊(yùn)含的信息,并不會強(qiáng)化“唯分?jǐn)?shù)”。不能因?yàn)閿?shù)據(jù)敏感,而對基層考試數(shù)據(jù)的需求視而不見,聽而不聞。天津市教育考試院通過社會服務(wù)的辦法,為有需要的學(xué)校提供正確價值觀指導(dǎo)下的相關(guān)考試數(shù)據(jù)服務(wù),其做法值得借鑒。有的省級考試機(jī)構(gòu)正在研制考試年報的地市版、學(xué)校版,也不啻對基層考試數(shù)據(jù)需求的積極回應(yīng)。
從考生個人角度看,目前給考生的考試數(shù)據(jù),內(nèi)容大體上就是總分、各學(xué)科分?jǐn)?shù)、總分排位,通俗地說就是“分?jǐn)?shù)條”,沒有更多的數(shù)據(jù)信息。教育部考試中心曾經(jīng)啟動的云海工程項(xiàng)目,改革傳統(tǒng)的高考分?jǐn)?shù)報告辦法,建立全方位、多層次、發(fā)展性、個性化的綜合考試評價體系,為考生提供內(nèi)涵豐富、并具有診斷與發(fā)展導(dǎo)向功能的評價報告,幫助考生全面、清晰地認(rèn)識自己,更好地選擇高校和志愿,做好職業(yè)生涯規(guī)劃。上海市教育考試院在普通高中學(xué)業(yè)水平合格性考試項(xiàng)目中改革了“分?jǐn)?shù)條”形式,從學(xué)科的知識內(nèi)容和能力目標(biāo)兩個維度,報告考生的學(xué)業(yè)情況。浙江省教育考試院在普通高中學(xué)業(yè)水平考試項(xiàng)目中,從試題得分、學(xué)科知識、學(xué)科能力、認(rèn)知目標(biāo)掌握四個維度,分五個層次,報告考生學(xué)業(yè)情況。這些做法,都值得借鑒與推廣。
在正確教育價值觀的引領(lǐng)下,考試分?jǐn)?shù)的再次使用與深度挖掘,不僅是必要的,而且是無止境的。