楊志明 魏 勇
高考志愿填報工作直接關系到高校的招生質量、考生的發(fā)展方向及其未來的成就,因此它一直受到全社會的高度關注。在確保公正、公平的前提下,為了增加考生的選擇機會,目前大多數(shù)省(區(qū)、市)在高考錄取過程中采用了平行志愿投檔模式,其特點是“分數(shù)優(yōu)先、遵循志愿”,以降低“高分落榜”的風險。然而,凡事有利有弊。比如,“分數(shù)優(yōu)先”的投檔規(guī)則就常常被指責為“唯分數(shù)論”,因為在這種規(guī)則下高校招生部門基本上沒有選擇學生的話語權。此外,高考分數(shù)年度之間的不等值問題也給廣大考生和家長增加了志愿填報工作的難度和復雜度,更給教育教學中的增值評價工作帶來了不少困難,因為不同年份的試卷無法做到難度完全相等,所以相同的高考總分一般具有不同的含義。[1][2][3][4][5]于是,有研究者建議使用高考等位分數(shù),幫助考生對招生高校在本省不同年份之間的錄取投檔分數(shù)情況進行比較。但是,很多人對等位分數(shù)的測量學特性并不十分了解,也不知道它與等值分數(shù)(equated score)的區(qū)別,還有人對采用等位分數(shù)開展高考志愿填報工作存在疑問。因此,很有必要從現(xiàn)代教育測量學的角度,厘清等位分數(shù)的概念,規(guī)范它的計算方法和使用條件,為考生和家長以及相關機構的高考志愿填報工作提供科學的依據(jù)和實操辦法。
在教育測量與評價領域,考試分數(shù)主要表現(xiàn)為3 種形式:一是原始分數(shù);二是量表分數(shù)(scale score,SS),或標準分數(shù)(standard score),或T 分數(shù),或標準九(stanine)等;三是等級分數(shù),如百分位等級(percentile rank,PR)分數(shù)等。[4]
原始分數(shù)特指試卷中所有題目的卷面得分之和。其優(yōu)點是簡單、直觀,而且大眾對它習以為常。但原始分數(shù)具有“分數(shù)度量單位不等距”和“分數(shù)參照點會漂移而且沒有確定含義”等缺陷。[3]比如,張三的高考語文成績“從30分增長到40分”與李四的高考語文成績“從140 分增長到150 分”的意義是極不相同的,因為前者的目標很容易實現(xiàn),而后者的目標幾乎無法實現(xiàn),即不同分數(shù)段的分數(shù)增量的含義并不相同。另外,當試卷特別容易或高水平考生比例特別高時,絕大多數(shù)人會得高分,表現(xiàn)為極端的負偏態(tài)分布(見圖1);當試卷特別難或高水平考生比例特別低時,絕大多數(shù)人會得低分,表現(xiàn)為極端的正偏態(tài)分布(見圖2)。這兩種情況下的零分并不是同一個意思,直接用這種分數(shù)的變化量實施增值評價是不科學的。
圖1 試卷特別容易或高水平考生比例特別高時的負偏態(tài)分數(shù)分布
圖2 試卷特別難或高水平考生比例特別低時的正偏態(tài)分數(shù)分布
簡單地說,原始分數(shù)在度量單位和參照零點方面存在重大缺陷。
為了克服原始分數(shù)的缺點,國際考試行業(yè)設計了多種量表分數(shù)。比如,以應考總體分數(shù)的均值為參照點、以標準差為單位的標準分數(shù)就是一種常用的量表分數(shù)。把這種標準分數(shù)做一定的線性轉換則可以得到大眾所喜歡的任何形式的導出分數(shù)(derived score)。比如,美國高考SAT 學科考試的導出分數(shù)公式如(1)[6]所示。
其中,X為SAT 某個學科考試的原始分數(shù),X是其平均值,S是其標準差,SS是相應科目的量表分數(shù)或標準分數(shù)。
值得說明的是,使用公式(1)所得的量表分數(shù)的均值是500 分,標準差為100 分,每個考生得分介于200 分到800 分之間。量表分數(shù)的最大優(yōu)點是克服了原始分數(shù)所固有的分數(shù)單位不等距和分數(shù)參照點沒有確切含義的問題。但使用這種方法的前提條件是考生的原始得分分布基本為正態(tài)分布。當原始分數(shù)的分布為圖1 和圖2 所示的極端偏態(tài)分布時,不能使用公式(1)估算考生的量表分數(shù)。
在不需要對考試結果做出嚴格區(qū)分,或在量表分數(shù)的使用前提條件不滿足的情況下,考試行業(yè)一般推薦使用等級分數(shù)。其中最常用的方法是把原始得分由低到高均勻分成1~99 等級的賦分方法(百分位等級)。也有考試項目使用了“把原始得分由高到低按照某個人為設定的應考者比例賦予等級分數(shù)”的方法。比如,某省“3+1+2”高考方案中選考科目的等級賦分規(guī)則為:應考群體中原始分由高到低的17%,33%,33%,15%和2%的人被分別賦予A,B,C,D,E這5個等級。[7]每個等級再根據(jù)插值法轉換成30~100分的分值。具體轉換關系如表1 所示。
表1 某省“3+1+2”高考方案中選考科目的等級賦分規(guī)則
值得指出的是,按照固定比例對選考人群的原始分數(shù)進行等級賦分的前提條件仍然是全體考生的原始分數(shù)分布接近正態(tài)分布。否則,若選考群體的原始分數(shù)分布為極端負偏態(tài)分布(如圖1所示),則會嚴重低估中上水平考生的成績;若選考群體的原始分數(shù)分布為極端正偏態(tài)分布(如圖2 所示),則會嚴重高估中下水平考生的成績。解決這類問題的國際經(jīng)驗是對考試分數(shù)做標準設定處理或實施測驗等值。[8]若這些國際經(jīng)驗使用的前提條件不足,則可以通過“確定賦分規(guī)則的考生群體必須為全省代表性群體而不是選考群體”[9]等辦法有效解決。
各地目前使用的等位分數(shù)是指若干相鄰年份全省高考總分排名相同的分數(shù)。參照測驗等值的做法,可以選定某一年度的高考總分度量系統(tǒng)作為高考量表(scale),隨后年份的高考總分均通過這種“排名相當分數(shù)等價”的方式,把高考總分轉換到這個參照量表之上,得到新一年度的高考等位分數(shù)。其具體算法如下。
等位分數(shù)的計算方法與等百分位等值(equipercentile equating)的思路一致。[10][11][12]考慮到高考總分滿分為750 分,因此需要把等百分位等值方法拓展為“等千分位等值”。也就是說,不能把全省的考生群體按照高考總分均勻地區(qū)分為1~99 個得分類別,而是要把全省考生群體按照高考總分均勻區(qū)分為1~999 個得分類別,以確保等位分數(shù)的計算精度(由于總共只有750 個得分點,所以把量表變成999 個得分點后會出現(xiàn)分數(shù)空隙)。其具體計算步驟如下。
步驟1:驗證等值的前提條件。檢驗新一年的高考總分X與基準年度高考總分Y是否基本滿足測驗等值的前提條件。[5]
步驟2:計算所有可能的得分等級。分別計算X和Y每個可能得分的千分等級(P)累積千分等級(CP)。
步驟3:計算X分數(shù)的等級中值。根據(jù)X總分上的Px和CPx,計算每個原始分數(shù)所對應的累積千分等級的組中值MP,如公式(2)所示。
步驟4:尋找Y測驗MP范圍。根據(jù)MP值,尋找y1和y2,使其對應的CPy1<MP,并且CPy2>MP。其中,y1與y2之間沒有任何實際得分。
步驟5:插值計算等值分Eq(X),如公式(3)所示。
至此,新一年的高考總分(X)便轉換到基準年度高考總分(Y)的分數(shù)度量系統(tǒng)之上,獲得了等位分數(shù)。
為了說明等位分數(shù)的具體算法,現(xiàn)舉例說明如下,詳見表2。
根據(jù)表2,我們可以比較容易地通過比對具有相同千分位等級的方法,找到每個年度之間高考總分的對應關系。比如,在2015 年,高考總分399 分所對應的千分位等級是356.3;在2016年,與千分位等級356.3 最接近的千分位等級是356.8,其所對應的高考總分是392 分;在2017年,與千分位等級356.3 最接近的千分位等級是355.9,其所對應的高考總分是372 分。于是,2016 年的392 分和2017 年的372 分都可轉換為2015 年高考總分量表上的399 分。依此類推,我們可以把2016 年和2017 年的所有高考總分都轉換在2015 年高考總分的度量系統(tǒng)之上,從而獲得基于2015 年高考總分度量系統(tǒng)的2016 年和2017 年高考等位分數(shù)。也就是說,若把2015 年的高考分數(shù)作為基準,則需要把2016 年的392分轉換為399 分,把2017 年的372 分轉換為399分,其余類推。
由于等位分數(shù)的計算和解讀思路與等百分位等值分數(shù)的計算和解讀思路基本一致,因此,測驗等值的根本要求同樣適用于等位分數(shù)。
首先,需要假定不同年度之間的考生總體沒有發(fā)生實質性變化。在實施等百分位等值時,通常需要用到等組設計,因此,兩個年度之間的考生總體需要假定是同質的。
其次,需要假定不同科目組合的高考總分沒有本質差異。根據(jù)測驗等值的要求,考生選考任何一種科目組合的分數(shù)必須是等價的,無論高考中的選考科目組合如何,必須假定它們之間是沒有本質差異的。事實上,這個條件基本上無法滿足,強行使用等位分數(shù)在本質上忽略了這種差異。
最后,換算后的等位分數(shù)不得變動考生在全省的排位順序。使用等位分數(shù),僅僅是方便比較高考分數(shù)年度之間的變化情況,方便考生的志愿填報工作,而不能改變考試成績在全省的排位。
首先,等位分數(shù)并不真正具有等值分數(shù)的特性。在教育測量學領域,等值分數(shù)一般需要滿足下述條件:(1)新測驗與標桿試卷(或基準試卷)必須測量相同的內容或結構;(2)新測驗與標桿試卷必須具有相同或非常接近的測量信度;(3)新測驗與標桿試卷之間的分數(shù)具有對稱關系;(4)考生選考任何一次測驗所得量表分數(shù)必須是等價公平的;(5)等值關系在同一個總體上是不變的;(6)等值樣本的能力分布與考生總體的能力分布非常接近;(7)等值設計中的錨測驗必須與標桿試卷完全一致。[5]十分遺憾的是,目前的高考總分構成并不唯一。部分省、市實施的“3+1+2”高考模式可以有12 種科目組合方式,早期試點的“3+3”高考模式可以有20 種(上海市、山東省等采用6 選3 模式)或35 種(浙江省采用7選3 模式)科目組合方式,因此,目前流行的這種等位分數(shù)在本質上無法滿足“測評內容或結構相同”的前提條件,不同選考科目組合的總分無法達到“等價”的條件,只能算是一種“準等值分數(shù)”,并不具備等值分數(shù)的全部特性。
其次,等位分數(shù)的計算方法有待規(guī)范。民間流行的等位分數(shù)是根據(jù)考生原始成績在全省的排名次序計算的,其表現(xiàn)形式與原始分十分接近,但存在著分數(shù)范圍不確定、分數(shù)含義不清晰等問題。比如,等百分位等值的分數(shù)一般被設定為1~99,量表分數(shù)的均值通常為500,標準差為100,范圍為200~800 分,而等位分數(shù)目前沒有一個統(tǒng)一的設計。等位分數(shù)的得分范圍該如何設定,可能需要有一個全面的考慮。
再次,等位分數(shù)的表達形式需要兼顧大眾習慣。由于目前的“3+1+2”高考方案的高考總分是750 分,等位分數(shù)的設計范圍只能接近或略大于這個范圍。一般來說,大眾樂意見到“高考總分被調高”的結果,而不能接受“高考總分被調低”的賦分方法。
最后,等位分數(shù)的計算需要盡可能利用更多信息。目前,等位分數(shù)的計算只能依靠各?。▍^(qū)、市)公布的全體考生的“一分一段表”,無法得知每個學科的考試信度和效度等信息。因此,高考志愿填報服務機構所計算的等位分數(shù)很可能存在較大偏差。假若這個工作由各?。▍^(qū)、市)教育考試機構,或者委托某個獨立第三方考評機構來完成,則可以得到具有中國特色的接近等值分數(shù)的等位分數(shù)。
高考志愿填報工作的重要性毋庸置疑,考生想用好考試分數(shù)進入理想的高?;驅I(yè),就需要了解目前正在實行的“分數(shù)優(yōu)先、遵循志愿”的平行志愿模式。[13]無論是“大文/大理”的傳統(tǒng)高考模式,還是“3+3”或“3+1+2”的新高考模式,普通批次的高考志愿投檔規(guī)則主要是平行志愿投檔模式,即某個錄取批次的考生可填報若干個平行設置的志愿。平行志愿投檔時,所有符合報考類別招生資格的考生按“分數(shù)優(yōu)先、遵循志愿”的原則進行投檔錄取,只是平行志愿填報的“單位”不同,如陜西省、江西省等是以“院校”為單位;上海市、湖南省等是以“院校專業(yè)組”為單位;浙江省、山東省等是以“專業(yè)”為單位。[14]
平行志愿投檔規(guī)則的主要特征是:(1)某一錄取批次考生可以填報若干個平行設置的志愿“單位”(如湖南高考普通類最多可以填報45個院校專業(yè)組志愿,山東高考最多可以填報96個專業(yè)志愿);(2)投檔過程全憑高考總分由高到低順序投檔(如遇到總分相同時,依據(jù)各省制定的同分排序規(guī)則執(zhí)行,比如,總分相同時先比較語文,語文也相同時再比較數(shù)學等,各省排序規(guī)則略有不同);(3)按照考生排列順序,依次瀏覽不同考生的志愿,只有排序在前的考生電子檔案完成志愿院校的投檔后,才會啟動后一位考生的志愿檢索和投檔程序。
平行志愿投檔規(guī)則的具體步驟[15]如下。第一步,從總分排名最前面的學生開始檢索,首先考慮其第一志愿,如果第一志愿“單位”(學校、院校專業(yè)組或專業(yè))還剩有錄取名額,則將其投檔第一志愿“單位”;否則考慮投檔其第二志愿“單位”……以此類推,直到將該生電子檔案投檔到其中某一志愿“單位”為止,否則落榜?!贜 步:分數(shù)排名第N 的學生,首先考慮其第一志愿,如果第一志愿“單位”還有剩余錄取名額,則將其投檔第一志愿“單位”;否則考慮其第二志愿“單位”……以此類推,直到將該生電子檔案投送到其中某志愿“單位”為止,否則落榜。當所有學生的志愿都被依次檢索并完成投檔時,本次平行志愿投檔工作結束。
顯然,這種“分數(shù)優(yōu)先、遵循志愿”的錄取模式與傳統(tǒng)的“志愿優(yōu)先、梯度投檔”的錄取模式有較大區(qū)別。例如,假設有考生A(高考總分658 分)的第一、第二志愿分別為高校BD 和FD,考生B(高考總分660 分)的第一、第二志愿分別為高校QH 和BD,并假定BD 和QH 的投檔線分別是657 分和661 分。這時,若使用傳統(tǒng)的“志愿優(yōu)先、梯度投檔”規(guī)則,在第一輪投檔過程中,考生A 會被投檔給BD,而考生B 沒有資格被投檔給QH。第一輪錄取過后,若BD 已經(jīng)完成了招生計劃,考生B 的第二志愿(BD)會自動作廢,從而出現(xiàn)“低分(658 分)被錄取、高分(660 分)卻落榜”的爭議結果。若采用平行志愿投檔規(guī)則,則BD,QH,F(xiàn)D 等高校志愿是平行的,分數(shù)較低者只能等分數(shù)較高者被其眾多平行志愿中的某所高校錄取之后才有機會被投檔。也就是說,根據(jù)“分數(shù)優(yōu)先”原則,考生B會被首先推送給BD;待全省所有659 分及以上分數(shù)的考生都被BD 挑選過后,若BD 還有招生指標,考生A 仍有上BD 的機會;否則,考生A就無緣BD,這時,他只能去參與FD 等其他平行志愿院校的競爭。
由于平行志愿投檔規(guī)則具有“分數(shù)優(yōu)先”的特點,因此準確分析每所大學歷年錄取分數(shù)線的等位分數(shù)就很有意義。比如,假設某高校RD 在2015 年的高考錄取線為399 分,由表2 可知其2016 年的等位分數(shù)為392 分,2017 年的等位分數(shù)為372 分(三者所對應的全省千分位等級都是356.3 左右)。因此,在2017 年填報高考志愿時,只要考生的高考總分在372 分以上,則自己有很大的可能被RD 這所高校錄取。若直接比較原始分數(shù)總分,則會誤以為總分要在399 分以上才有機會被RD 錄取,造成“高分低錄”的遺憾。
表3 是兩所高校的投檔案例。由表3 可知:若只看高考總分,則看不出太大規(guī)律;若考察高考總分的全省排位,則可以得到較多有益信息,但梳理起來十分復雜;假若比較千分位等級,則規(guī)律明顯。例如,假若2022 年的一名物理類考生的全省千分位等級在977 左右(即全省最優(yōu)的23‰以內),則他有較大機會被ZN 大學錄??;若其千分位等級在966 左右(全省最優(yōu)的34‰以內),則他有較大機會被HN 大學錄取。特別有意思的現(xiàn)象是,這兩所大學均以理工學科見長,人文社會科學并不突出,但他們所招收的歷史類考生水平一般在千分位等級994 左右(即全省歷史類考生中最優(yōu)的6‰以內)。因此,“文科天才是否值得去報考理工科水平很高而人文社會學科水平并不拔尖的高?!钡膯栴}值得深思。
表3 兩所高校在某省最近3 年的高考錄取分數(shù)線及其全省排位和千分位等級
若大眾不習慣千分位等級,則可選定某個年份的分數(shù)度量系統(tǒng)為高考總分的基準系統(tǒng),再通過等千分位等值的方法把新一年的高考總分轉換為基準量表上的分數(shù),從而直接使用等位分數(shù)填報志愿或開展增值評價工作。當然,對于北京大學和清華大學等少數(shù)高校而言,等位分數(shù)的用處不大,因為他們通常只關注全省排位在前30 位或前50 位或前80 位以內的考生。
特別值得說明的是,為了避免“唯分數(shù)論”,現(xiàn)行的平行志愿投檔規(guī)則最好能結合高考新方案,構建出基于總分和專業(yè)等多種指標的等位分數(shù),實行“多指標多階段”錄取模式。[16]“多指標多階段”錄取模式指的是“設置欄桿、逐級淘汰、優(yōu)中選優(yōu)”的錄取模式,其主要特點是在招生錄取的初級階段設置若干門檻淘汰不合格者或不匹配者,在后期繼續(xù)使用目前的平行志愿規(guī)則實現(xiàn)優(yōu)中選優(yōu)的目的。其具體操作步驟是:(1)根據(jù)招生政策,設定各高校各專業(yè)對學生基礎知識、思維能力以及德智體美勞等方面的多種指標;(2)把錄取過程分為2~4 個階段,在1~3 階段重點設置不同的門檻,淘汰具有某種短板或不符合專業(yè)要求的不合格者;(3)在最終階段,使用與相關專業(yè)最密切的重要指標,再按照“分數(shù)優(yōu)先、遵循志愿”的平行志愿規(guī)則優(yōu)中選優(yōu)。其中,前期各階段各指標的功能旨在淘汰不合格者,最終階段各指標的功能旨在優(yōu)中選優(yōu)。
總之,等位分數(shù)是一種接近等值分數(shù)的“準等值分數(shù)”,它在指導高考志愿填報方面具有較大實用價值。各?。▍^(qū)、市)教育考試機構若能在現(xiàn)有的分數(shù)報告系統(tǒng)中,添加一個基于某個特定年份的等千分位的等位分數(shù)或多種“單位”等位分數(shù),并使用“多指標多階段”的改進版平行志愿規(guī)則,則會大大提升考試機構的服務水平和質量,增加高校在規(guī)則范圍內的招生話語權,減輕“唯分數(shù)論”的弊端。