張家勇 朱玉華
摘 要:英國普通中等教育證書考試具有很多優(yōu)勢的同時存在改進空間:模塊化考試很難做到等值,考試難度偏低不利于甄別優(yōu)秀人才,受控評價的信度和效度不高,等級分制度難以有效區(qū)分學(xué)生全部成績序列,分卷模式可能導(dǎo)致地板效應(yīng)和天花板效應(yīng)。2013年2月,英國宣布啟動普通中等教育證書考試綜合改革,2017年9月所有普通中等教育證書考試科目全面實施新內(nèi)容。改革后,考試難度有所增加;絕大多數(shù)科目的考試安排在夏季,重考次數(shù)大幅減少;統(tǒng)一卷是首選,保留下來的分卷模式更具彈性;筆試是絕大多數(shù)科目的唯一評價方式;評分制度保留等級制,但等級用1~9表示。英國普通中等教育證書考試改革強調(diào)分工合作、科學(xué)決策、民主決策,并持續(xù)回應(yīng)社會關(guān)切的問題。
關(guān)鍵詞:綜觀評價;受控評價;分卷;模塊化考試
自1986年英國普通中等教育證書(GCSE)推出以來,教育內(nèi)外部環(huán)境發(fā)生了比較大的變化:教育發(fā)展階段、考試服務(wù)的目的、中學(xué)績效考核制度均已改變,國家課程、普通中等教育證書考試高級水平課程(A-Level)考試相繼改革。GCSE必須進行改革以適應(yīng)這些新變化。2013年2月,英國宣布啟動GCSE綜合改革,2017年9月所有GCSE科目全面實施新內(nèi)容。原有GCSE存在哪些問題?改革后的GCSE有哪些新變化?這些改革有哪些基本特點?本文擬就這些問題作出簡要回答。
一、改革的緣由
(一)模塊化考試很難做到等值
2009年9月以前,GCSE科目考試都是采用線性評價(linear assessment),所有考試都安排在學(xué)生兩年學(xué)習(xí)結(jié)束時進行。此后,絕大多數(shù)GCSE科目增加了模塊評價(modular assessment),允許同一科目的不同模塊分散在不同時段教學(xué),每個模塊單獨測試并獲得統(tǒng)一量表分?jǐn)?shù)(UMS)①及等級分,如果某一模塊成績達(dá)不到及格等級,將不予計分,完成全部課程后綜合三個模塊得分得到最終等級分,學(xué)生可以重復(fù)參加模塊考試以提高最終等級分,但最多可重考一次。例如,GCSE數(shù)學(xué)B由三個模塊組成:統(tǒng)計及概率占30%,算術(shù)、代數(shù)及幾何I占30%,算術(shù)、代數(shù)及幾何II占40%,學(xué)生可以在中學(xué)三至五年級(13~16歲)期間分三次完成考試。如果模塊考試成績不理想,可改為最后一年參加線性考試。這種模塊化設(shè)計難免干擾學(xué)校的正常教學(xué)計劃,妨礙學(xué)生對一門課程建立完整的理解,考試機構(gòu)很難確保資格證書年度標(biāo)準(zhǔn)的一致性。學(xué)生何時參加考試、學(xué)生擁有的重考次數(shù)等因素都會影響最終結(jié)果。僅僅因為他們選擇的路徑不同,部分學(xué)生就能夠比其他同學(xué)考得更好,這就可能對考生不公平。
(二)考試難度低不利于甄別優(yōu)秀人才
證書及考試監(jiān)管辦公室(Ofqual)調(diào)查發(fā)現(xiàn),GCSE科學(xué)和地理試題過于簡單且要求太低、多項選擇題太多,科學(xué)試題偏少。GCSE生物考試標(biāo)準(zhǔn)逐年降低,短篇論文、簡答題和多項選擇題增多,不能有效檢測學(xué)生的知識深度和廣度。此外,考試機構(gòu)為了爭奪市場份額、獲得更高收益,漠視行業(yè)職業(yè)道德,違規(guī)為授課教師舉辦講座和考前輔導(dǎo),提供考題信息,圈定考試范圍,幫助學(xué)生獲得高分。此外,GCSE考試更加公式化且更易預(yù)測,GCSE課程教學(xué)傾向于應(yīng)試教育,不利于學(xué)生真正學(xué)習(xí)和掌握知識,不能為學(xué)生成功提供最佳機會?,F(xiàn)行制度導(dǎo)致逐底競爭(race to the bottom),難以甄別拔尖人才。為選拔優(yōu)秀的生源,很多大學(xué)增設(shè)入學(xué)考試,特別是醫(yī)學(xué)、法律等熱門專業(yè)。2013年牛津大學(xué)要求65%的報考者參加自己學(xué)校組織的入學(xué)考試。學(xué)生獲得更高等級分的比例不斷上升,但是更多的雇主不滿意中學(xué)畢業(yè)生的讀寫算能力,大約42%的雇主因此為中學(xué)或大學(xué)畢業(yè)的雇員增加培訓(xùn)。
(三)受控評價的信度和效度備受質(zhì)疑
內(nèi)部評價(internal assessment)是GCSE考試的重要特色,早期是通過課程作業(yè)評價,現(xiàn)在采用受控評價(controlled assessment)②。首先,受控評價有時并沒有評價應(yīng)該評價的內(nèi)容,不能像筆試那樣有效地對學(xué)生的不同能力水平做出區(qū)分。例如,考生通過背誦范文備考外語寫作,受控評價即評價考生記憶力而非外語寫作能力。在備考壓力下,往往最終成果也不能代表學(xué)生的真實水平。其次,受控評價很難組織和實施。部分科目的受控評價比例太高,高級監(jiān)管措施增加了教師負(fù)擔(dān),很有可能干擾正常教學(xué)或打亂教學(xué)時間安排。學(xué)校之間也彼此不信任,因為各校對考試機構(gòu)評價指導(dǎo)的使用方式不同。提高師生一致性的具體控制措施往往沒有發(fā)揮作用。最后,受控評價很難保持連貫性和一致性。部分受控評價剝奪了學(xué)生反思和改進的機會,考試機構(gòu)設(shè)定的任務(wù)限制了考生的創(chuàng)造性。教師還反映考試機構(gòu)編寫的評價指導(dǎo)解讀空間較大,容易讓人產(chǎn)生困惑且存在一致性缺陷。
(四)等級分不能均衡有效地呈現(xiàn)全部成績序列
學(xué)生得分分布過于集中在A~D等級,增加A*等級后區(qū)分度仍顯不足,C以下設(shè)置太多等級顯得區(qū)分過度。獲得A等級考生之間的成績差距比E和F等級之間的差距更大。2012年,所有科目考試獲得D等級的學(xué)生占16%,高于E~G等級學(xué)生所占比例(14%),獲得B~D三個等級的考生更是高度集中,為63%[1]。同時,不同科目的等級分難易程度相差甚遠(yuǎn),量化并處理不同科目等級分成為難題。例如,21%選擇化學(xué)的學(xué)生獲得A*,只有6%選擇英語文學(xué)的學(xué)生獲得A*。此外,單純等級分不能很好地滿足學(xué)校招生需求,部分考試機構(gòu)將考生試卷各單元得分也反饋給學(xué)校。等級分并不絕對可靠,較易受到時間、試卷和考官等因素的影響。
(五)分卷可能導(dǎo)致地板效應(yīng)和天花板效應(yīng)
現(xiàn)有GCSE科目考試一般分為基礎(chǔ)卷和高級卷,C~E等級在兩卷中都有出現(xiàn)。分卷模式很難通過確定合理邊界為擁有不同知識水平的考生設(shè)計不同試卷。分卷難以確保不同途徑獲得的同一等級分等值,目前主要依據(jù)統(tǒng)計信息進行專業(yè)判斷。同時,考生可能因為選擇錯誤導(dǎo)致零分,即地板效應(yīng)(floor effect)③;也可能導(dǎo)致被低評,即天花板效應(yīng)(ceiling effect)④。此外,分卷可能限制考生的發(fā)展?jié)摿捅ж?fù)水平。因為基礎(chǔ)卷最高等級是C,如果被錯誤地編入基礎(chǔ)卷教學(xué)組,即便學(xué)生水平再高也不能升到A-level或其他同級資格證書水平。最后,如果與學(xué)??冃Э己死?,分卷也存在負(fù)面效應(yīng)。等級C是學(xué)??冃Э己说拈T檻,因為基礎(chǔ)卷獲得C等級更容易,學(xué)校更傾向于安排中等水平學(xué)生參加基礎(chǔ)卷考試。endprint
二、改革的基本內(nèi)容
(一)重考次數(shù)將大幅減少
2016年5月,Ofqual出臺《關(guān)于正式規(guī)則的決定》(Decisions on Formal Rules),對重考等事項作出了新的規(guī)定。除了英語語言和數(shù)學(xué)外,其他科目不再有分期、分批的重考機會。對于尚未改革的模塊化科目,不再允許考生重考某個模塊,但是考生可以選擇重考所有模塊,大部分科目重考要等一年之后,受控評價材料重新提交則因科目不同要求會有不同。改革后,兩年課程不再分模塊,幫助學(xué)生融合主題的不同方面形成對一門課程的整體認(rèn)識,所有科目的綜觀考試⑤都安排在課程修完之后的夏季學(xué)期(5~6月)舉行,以減少考試對正常教學(xué)的影響,保證標(biāo)準(zhǔn)的公平性和一致性。因為英語語言和數(shù)學(xué)兩科的資格證書對于學(xué)生升學(xué)或求職至關(guān)重要,故每年11月繼續(xù)安排重考,但考生必須在當(dāng)年8月底年滿16周歲。
(二)考試難度將有所提高
Ofqual要求重新設(shè)計英語文學(xué)、數(shù)學(xué)、歷史、地理等科目的教學(xué)內(nèi)容,增加課程深度和廣度;取消GCSE職業(yè)教育課程;增加核心科目的考試難度,覆蓋完整的課程內(nèi)容;考試重點考查學(xué)生知識能力的深度和廣度,提高合格等級難度。英語語言要求更高的閱讀技能和更好的寫作能力;英語文學(xué)將鼓勵學(xué)生批判性閱讀、寫作和思考;英語、歷史等科目將減少碎片化和過于結(jié)構(gòu)化的問題,同時增加擴寫內(nèi)容;數(shù)學(xué)和科學(xué)等科目更加重視量化問題處理;數(shù)學(xué)將覆蓋比率、比例、變率等內(nèi)容,要求所有學(xué)生掌握基礎(chǔ)知識和技能,加大最高等級分難度;科學(xué)將增加人類基因、生命周期分析、太空物理等內(nèi)容,更加具有挑戰(zhàn)性。2017年所有GCSE科目將按新標(biāo)準(zhǔn)更新,目前已經(jīng)更新了35個科目。新課程考試評價結(jié)構(gòu)更加嚴(yán)謹(jǐn),核心內(nèi)容更具挑戰(zhàn)性,學(xué)時數(shù)將基本保持不變(少數(shù)科目教學(xué)時間變長)。新課程更加重視拼寫、標(biāo)點和語法、專業(yè)術(shù)語,其分值將占英語語言科目總分的20%,其他科目的占比將根據(jù)需要逐一確定。
(三)重疊型分卷將更具彈性
一般而言,分卷有重疊型、主卷+附加卷、連續(xù)型三種設(shè)計。Ofqual提出4條篩選標(biāo)準(zhǔn):是否影響學(xué)生抱負(fù)水平,是否能夠有效管控,技術(shù)上是否可行(設(shè)置標(biāo)準(zhǔn)的難度),是否透明且易于理解。相比而言,重疊型對學(xué)生的負(fù)擔(dān)更輕,更具有易控性,技術(shù)要求更低,更易于理解。改革后,分卷科目將繼續(xù)采取重疊型模式,提高透明度并吸取其他模式的優(yōu)點,但重疊點及重疊幅度將更加靈活,鼓勵適當(dāng)比例的學(xué)生選擇分卷相應(yīng)的課程學(xué)習(xí)路徑,降低天花板效應(yīng)的影響,提高不同試卷之間的可比性。如果重疊幅度太小,無法獲得與發(fā)展?jié)摿ο鄳?yīng)等級的考生比例會上升;如果重疊幅度過大,設(shè)計有效試題的幾率將會降低。新的數(shù)學(xué)科目基礎(chǔ)卷設(shè)1~5等級、高級卷設(shè)4~9等級,其他科目將根據(jù)需要采用新的重疊設(shè)計。
(四)受控評價將全面調(diào)整
筆試將作為默認(rèn)評價手段,受控評價等其他輔助形式只用于測試關(guān)鍵技能。Ofqual提出采用受控評價要遵循以下原則:必須是評價科目關(guān)鍵部分的唯一有效途徑,必須在效度、信度、可控性和合理評價實踐之間取得平衡,必須符合具體科目的評價需要,必須確保資格證書不會受到外部壓力的影響。受控評價將改進任務(wù)設(shè)定的控制,改進學(xué)生完成作業(yè)的方式,改進授課教師評分和考試機構(gòu)審核。絕大多數(shù)科目受控評價將由考試機構(gòu)的考官評分,減少受控評價對教學(xué)的影響,讓授課教師擁有更多時間專注教學(xué),減輕教師為自己學(xué)生評分的壓力,特別是評分還與自己及所在學(xué)??冃Э己嗣芮邢嚓P(guān)的時候。如果學(xué)生成績用于學(xué)校績效考核,受控評價部分將在資格證書上單獨報告,不再計入總分??荚嚈C構(gòu)將根據(jù)不同科目特點制定評價策略、選擇試題類型、決定考評時間、確定筆試比重,保證評價的信度、效度、可比性和可控性。
(五)考試評價方式將有改進
統(tǒng)一卷將是首選,分卷科目將大幅減少。如果統(tǒng)一卷不能讓所有考生充分展示學(xué)習(xí)成果,并且高級卷涉及的課程內(nèi)容能夠有效識別,這樣的科目將繼續(xù)采取分卷。同時,成績呈現(xiàn)方式將繼續(xù)采用等級制,將探索使用標(biāo)準(zhǔn)分作為等級制的補充。新的分級量表將使用數(shù)字1~9標(biāo)明不同等級,9是最高等級。GCSE新科目采用數(shù)字等級便于與尚未改革的科目評分相區(qū)別,避免與原有8個字母等級混淆,同時讓處于下游的考生也有機會展示進步并得到認(rèn)可。數(shù)字等級制與字母等級制并不一一對應(yīng),英格蘭還可以借此與北愛爾蘭、威爾士授予的GCSE證書相區(qū)別。
三、改革的特點
(一)強調(diào)分工合作與科學(xué)決策
英國GCSE改革強調(diào)相關(guān)部門的分工合作,教育部與Ofqual、考試機構(gòu)密切合作,共同完成改革的設(shè)計和落實工作。教育部全面負(fù)責(zé)GCSE改革,提出改革的主要框架設(shè)想,對改革的重要方面提出主導(dǎo)性建議,包括改革時間表和路線圖、提高科目內(nèi)容難度、嚴(yán)格考試評價結(jié)構(gòu)、改革評分方式、豐富試題類型、確定命題重點、細(xì)化成績報告等。教育部對每門科目的核心內(nèi)容開發(fā)過程負(fù)有全面責(zé)任。教育部還主持GCSE核心科目內(nèi)容改革和評價目標(biāo)的社會公眾咨詢工作[2],隨后向社會公布最終達(dá)成共識的相關(guān)科目內(nèi)容的改革決定。
Ofqual負(fù)責(zé)改革GCSE監(jiān)管要求,確保國家標(biāo)準(zhǔn)準(zhǔn)確:決定新GCSE的具體設(shè)計特色,出臺獲得考試機構(gòu)認(rèn)證的標(biāo)準(zhǔn),決定如何制定并保持資格證書標(biāo)準(zhǔn),確??荚嚈C構(gòu)設(shè)計、實施和授予證書時契合改革目標(biāo),審核考試機構(gòu)提交的科目內(nèi)容開發(fā)提議。2013年12月以來,Ofqual就很多改革內(nèi)容提出建議并征求社會意見。例如,GCSE改革對利益相關(guān)者的風(fēng)險控制(2013年),新GCSE資格證書的基本設(shè)計(2013年),考試機構(gòu)開發(fā)、實施和授予GCSE證書的技術(shù)規(guī)則(2013年),新GCSE資格證書科目的結(jié)構(gòu)和評價(2014年),如何制定并完善新GCSE證書標(biāo)準(zhǔn)(2014年),任一科目納入GCSE證書的原則(2015年)等。2014年,Ofqual開始對考試機構(gòu)進行認(rèn)證,2015年底完成所有資格證書認(rèn)證工作。endprint
考試機構(gòu)負(fù)責(zé)制定改進措施,確保GCSE 考試的質(zhì)量。考試機構(gòu)吸收自身、全國、國際評價研究成果及優(yōu)秀評價實踐案例,提升評價信度、效度、可控性和可比性,確保資格證書的有效性和公信力。在適當(dāng)?shù)牡胤皆黾訑U寫類(extended writing)考題和問題解決類(problem solving)考題,減少不必要的過于結(jié)構(gòu)化或細(xì)碎的試題。考試機構(gòu)負(fù)責(zé)開發(fā)每個科目的核心內(nèi)容,向Ofqual提交2017年新開設(shè)科目提議。
(二)重視社會參與和民主決策
英國教育改革公開透明,建立了完善的信息公開及意見反饋機制,每一次改革甚至改革的每一項舉措都會由相關(guān)責(zé)任部門提出框架建議,面向社會公開征集反饋意見,并組織專門人員對社會反饋進行分析整理,再向社會公布反饋意見和采納情況。改革框架通常是由教育大臣任命的、由大學(xué)學(xué)者組建的專家組在深入調(diào)查研究的基礎(chǔ)上完成。據(jù)不完全統(tǒng)計,GCSE改革60余次公開征求社會意見,其中教育部主持7次,Ofqual主持53次[3]。例如,Ofqual在研究改革風(fēng)險防控的時候,專門組織與學(xué)校面對面的討論,與考試機構(gòu)召開一對一座談會,面向就業(yè)與教育機構(gòu)協(xié)會、學(xué)院學(xué)會、考官協(xié)會、學(xué)院和學(xué)校財務(wù)代表等發(fā)放問卷,廣泛收集社會意見和建議。任何社會機構(gòu)或個人都可以通過教育部或Ofqual開發(fā)的在線反饋表格、電子信箱、在線問答,以及其他方式反饋意見。政府對這些反饋意見必須做出公正公開的反饋,公開對意見和建議的采納情況。Ofqual還委托獨立的市場調(diào)查公司輿觀調(diào)查網(wǎng)(YouGov)、BMG調(diào)查公司(BMG Research)等通過電話訪談、在線問答、面對面座談等途徑收集社會反饋意見并進行深度分析,公開發(fā)表調(diào)研報告。Ofqual也關(guān)注與改革相關(guān)的學(xué)術(shù)研究成果,召開與改革主題相關(guān)的研討會等。通過征求社會反饋使改革措施更加完善可行。例如,推遲到2017年完成所有GCSE科目改革、讓考試機構(gòu)自行決定考試評價時間、將8個等級改為9個等級等改革措施都是社會反饋建議的結(jié)果。
(三)回應(yīng)社會關(guān)切,改革從不停步
英國是西方民主自由價值觀的策源地,卻至今保留著君主立憲制度,因此一直被認(rèn)為是保守主義思想主導(dǎo)的國家。最近幾十年,英國教育改革十分活躍,無論是聯(lián)邦教育行政部門頻繁改名重組,中小學(xué)課程與考試評價監(jiān)管機構(gòu)的分分合合,中小學(xué)辦學(xué)體制不斷改革以至于新學(xué)校類型繁多,還是考試招生制度反復(fù)調(diào)整,都一反保守常態(tài),讓世界刮目相看。為了應(yīng)對教育實踐中出現(xiàn)的難題,英國政府堅持改革不停步。自1911年設(shè)立中學(xué)考試機構(gòu)到2010年Ofqual獲得法律地位,中學(xué)考試評價監(jiān)管機構(gòu)11次重組易名,中學(xué)考試名稱變更5次,課程與考試監(jiān)管職能也是時分時合。
雖然GCSE是英國十分成熟且受到廣泛認(rèn)可的資格證書,但圍繞GCSE的改革的動議時時出現(xiàn)。考試機構(gòu)組織的外部評價與學(xué)校組織的內(nèi)部評價相結(jié)合,這種安排在幾十年內(nèi)經(jīng)歷了多次改革調(diào)整。1988年英國推出課程作業(yè)作為GCSE內(nèi)部評價的主導(dǎo)方式,2009年開課的GCSE科目改用受控評價替代課程作業(yè),2013年出臺受控評價改革措施。2010年底,英國政府推出英國文憑考試(EBacc),以學(xué)校為單位計算學(xué)生在GCSE考試中英語、數(shù)學(xué)、2門科學(xué)、1門外語、歷史或地理科目成績獲得A*~C等級的比例,目的是讓更多學(xué)生選修科學(xué)和外語。2012年,時任教育大臣邁克爾·戈夫(Michael Gove)提議在英格蘭地區(qū)推出英國文憑證書(EBC),遭到教師協(xié)會和議員的激烈批評后于2013年宣布取消,但全面深化GCSE改革最終被提上議事日程。[4]
注釋:
①模塊考試統(tǒng)一量表分?jǐn)?shù)由原始分轉(zhuǎn)換而來,用于表示考生的模塊測試成績。因為考生參加各模塊考試時間不同,每年試題和受控評價難度有細(xì)微差別,不同模塊相同原始分?jǐn)?shù)所代表的成就水平并不等值,統(tǒng)一量表分?jǐn)?shù)能夠確保成就水平相當(dāng)?shù)脑挤謹(jǐn)?shù)折算為最終等級分時等值。
②內(nèi)部評價是GCSE科目評價的重要特色,1988~2009年采用課程作業(yè)方式,2009年以來采用受控評價方式,受控評價是授課教師監(jiān)管的內(nèi)部評價。目前,絕大多數(shù)GCSE評價除了考試機構(gòu)組織的筆試外還有受控評價,二者按一定比例折合為最終等級分。根據(jù)科目性質(zhì),受控評價按0%、25%和60%三種比例計入總評,相應(yīng)地在任務(wù)布置、任務(wù)完成和任務(wù)評分三個步驟中有低級、中級和高級不同層次的監(jiān)管,高級監(jiān)管條件下任務(wù)布置由考試機構(gòu)負(fù)責(zé),任務(wù)完成過程有人監(jiān)督,考試機構(gòu)的審核官有權(quán)更改教師評分以符合國家標(biāo)準(zhǔn)。
③地板效應(yīng)指在分卷模式下學(xué)業(yè)水平偏低的考生錯誤地選擇高級卷參評,可能因無法達(dá)到高級卷最低評分要求而不能獲得任何等級分。
④天花板效應(yīng)指在分卷模式下學(xué)業(yè)水平較高的考生錯誤地選擇基礎(chǔ)卷參評,可能因基礎(chǔ)卷最高等級限制而無法展現(xiàn)最高水平。
⑤綜觀考試指綜合兩個或更多模塊進行一次性評價,幫助學(xué)生在不同模塊之間建立聯(lián)系,提高學(xué)生參與度,促使教師采用整體方法進行模塊教學(xué),避免課程碎片化和離散化。
參考文獻(xiàn):
[1]Ofqual.GCSE Reform Consultation June 2013[EB/OL].https://www.gov.uk/government/consultations/gcse-reform-consultation-june-2013,2017-04-16.
[2]Department for Education.Statistical First Release 2013[EB/0L].https://www.gov.uk/government/uploads/system/uploads/attachment_data/file/251184/SFR40_2013_FINALv2.pdf,2017-04-16.
[3]Department for Education. Publications: All Consultations[EB/OL].https://www.gov.uk/government/publications?departments%5B%5D=all&from_ date=&keywords=GCSE&official_document_status=all&page=2&publication_filter_option=consultations& to_date=&topics%5B%5D=all,2017-02-16.
[4]Wikimedia Foundation. English Baccalaureate[EB/OL].http://en.wikipedia.org/wiki/English_Baccalaureate, 2017-04-16.
編輯 朱婷婷 校對 許方舟endprint