張林靜
(河北省教育科學(xué)研究所 評價部,河北 石家莊 050061)
基礎(chǔ)教育決定著一個國家的公民素質(zhì),人才質(zhì)量是國家競爭力的核心要素。世界各國政府及國際組織都高度重視基礎(chǔ)教育,并通過國際測評項目來了解各國的基礎(chǔ)教育質(zhì)量情況,如經(jīng)濟合作與發(fā)展組織(簡稱OECD),為了監(jiān)控各成員國的基礎(chǔ)教育質(zhì)量實施的國際學(xué)生評價項目(簡稱PISA);國際教育成就評價協(xié)會(IEA)主持的“國際數(shù)學(xué)與科學(xué)研究趨勢”簡稱TIMSS。世界各國和地區(qū)也將建立基礎(chǔ)教育質(zhì)量監(jiān)測體系作為提高基礎(chǔ)教育質(zhì)量的重要舉措,如美國、日本、法國、加拿大、新西蘭、芬蘭、中國香港等。改革開放以來,我國基礎(chǔ)教育得到快速發(fā)展,“兩基”攻堅的基本完成,基礎(chǔ)教育進入內(nèi)涵發(fā)展階段,由注重規(guī)模轉(zhuǎn)向注重質(zhì)量,教育質(zhì)量在我國引起了高度重視,胡錦濤總書記在2010年全國教育工作會議上講到“全面提高教育質(zhì)量,對建設(shè)教育強國、人力資源強國意義重大。要把提高質(zhì)量作為教育改革和發(fā)展的核心任務(wù)……樹立以提高質(zhì)量為核心的教育發(fā)展觀”?!鞍烟岣哔|(zhì)量作為教育改革和發(fā)展的核心任務(wù)”被正式寫入《國家中長期教育改革和發(fā)展規(guī)劃綱要》。
2007年9月,由中央編辦批準,教育部依托北京師范大學(xué),成立了基礎(chǔ)教育質(zhì)量監(jiān)測中心(以下簡稱中心),負責我國的基礎(chǔ)教育質(zhì)量監(jiān)測工作。中心依靠北京師范大學(xué)的優(yōu)勢資源,整合全國各優(yōu)秀師范院校、科研機構(gòu)的知名專家和專業(yè)技術(shù)力量,組成了一支包括心理學(xué)、課程與教學(xué)、管理與評價、教育與心理測量等眾多國際、國內(nèi)專家組成的專兼職相結(jié)合的專家團隊,在全國開展基礎(chǔ)教育質(zhì)量監(jiān)測工作。
基礎(chǔ)教育質(zhì)量監(jiān)測工作依據(jù)科學(xué)發(fā)展觀的要求,堅持依法監(jiān)測、服務(wù)決策,科學(xué)評價、重在導(dǎo)向,準確診斷、探求規(guī)律的原則,對基礎(chǔ)教育階段學(xué)生的學(xué)習(xí)質(zhì)量和身心健康狀況以及影響學(xué)生發(fā)展的相關(guān)因素進行全面、系統(tǒng)、深入的監(jiān)測,準確地向國家報告基礎(chǔ)教育質(zhì)量的現(xiàn)狀,為教育決策提供信息、依據(jù)和建議?,F(xiàn)階段對學(xué)生的思想品德和公民素養(yǎng)、身體和心理健康水平、學(xué)業(yè)水平和學(xué)習(xí)素養(yǎng)、藝術(shù)素養(yǎng)、實踐精神、創(chuàng)新能力六個方面進行監(jiān)測。
監(jiān)測工作的主要程序包括:監(jiān)測標準研制、監(jiān)測工具研發(fā)、抽樣、監(jiān)測實施、評卷與數(shù)據(jù)分析、撰寫發(fā)布報告。
監(jiān)測標準的制定依據(jù)國家的各項方針、政策、法律;義務(wù)教育階段各科課程標準和中小學(xué)心理健康教育指導(dǎo)綱要;國際、國內(nèi)在學(xué)科成就和心理健康監(jiān)測方面的成功經(jīng)驗與先進技術(shù);考慮不同版本教材、各地師資水平、教學(xué)條件、學(xué)生個體差異、家庭狀況等因素;符合教育與心理測量學(xué)的專業(yè)要求。
監(jiān)測工具研發(fā)包括監(jiān)測工具目標的制定、監(jiān)測工具設(shè)計、監(jiān)測內(nèi)容確定(即題目開發(fā))、監(jiān)測工具的技術(shù)分析。監(jiān)測標準的研制和監(jiān)測工具的研發(fā)均需經(jīng)過嚴謹、科學(xué)的程序和方法,以保證工具的權(quán)威性與代表性。監(jiān)測工具包括試卷和問卷兩種類型。試卷即各學(xué)科知識測試卷,衡量學(xué)生學(xué)習(xí)的結(jié)果,用分數(shù)來表示。調(diào)查問卷用于了解與學(xué)生學(xué)習(xí)相關(guān)的、有意義的、穩(wěn)定的影響因素,以進行不同群體學(xué)生的特點分析。每份監(jiān)測工具均由指導(dǎo)手冊、測試卷、答題卷組成。組卷采取矩陣取樣技術(shù),將一套完整的測試劃分為幾套測試卷,每個學(xué)生完成一個測試卷即可。
對被試學(xué)生樣本采取分階段、分層不等概率隨機抽取。以2010年八省基礎(chǔ)教育質(zhì)量監(jiān)測抽樣方案為例,確定八省四年級、八年級學(xué)生為樣本總量。第一階段,將八省的所有區(qū)縣城市學(xué)生所占比例作為分層PPS進行抽樣;第二階段,將各區(qū)縣的學(xué)校以教學(xué)條件綜合指標為分層PPS進行抽樣;第三階段,在各學(xué)校內(nèi)簡單隨機抽樣。
監(jiān)測實施也稱現(xiàn)場數(shù)據(jù)采集,是整個監(jiān)測工作中極為重要的一個環(huán)節(jié),要求監(jiān)測數(shù)據(jù)真實客觀、監(jiān)測工具嚴格保密、實施程序規(guī)范標準。全國統(tǒng)一測試時間,并由教育部基礎(chǔ)教育質(zhì)量監(jiān)測中心向每個樣本縣派出國家視導(dǎo)員,負責督察和指導(dǎo)測試工作。
各樣本縣的監(jiān)測工具全部匯總至教育部基礎(chǔ)教育質(zhì)量監(jiān)測中心,進行統(tǒng)一的數(shù)據(jù)清理與閱卷,閱卷結(jié)束后將對結(jié)果進行數(shù)據(jù)分析。數(shù)據(jù)分析密切跟蹤世界測評理論和技術(shù)發(fā)展,充分利用新的技術(shù)手段和方法,提高數(shù)據(jù)的利用率和科學(xué)性。數(shù)據(jù)呈現(xiàn)包括統(tǒng)計圖、統(tǒng)計表兩種方式。
監(jiān)測報告以文字、圖表等形式把監(jiān)測的過程、方法與結(jié)果表現(xiàn)出來。監(jiān)測報告要求格式規(guī)范、數(shù)據(jù)準確、結(jié)果推論慎重,文字表述通俗、嚴格遵守監(jiān)測保密要求。根據(jù)閱讀監(jiān)測報告者的需求不同,可以將監(jiān)測報告分為綜合性報告、專題類報告和基礎(chǔ)類報告。綜合性報告包括學(xué)科報告、結(jié)果摘要報告,例如,《2008年學(xué)生數(shù)學(xué)學(xué)習(xí)質(zhì)量報告》。專題類報告包括專項報告、專項結(jié)果簡報、咨詢報告,例如《學(xué)生課業(yè)負擔報告》?;A(chǔ)類報告包括基礎(chǔ)數(shù)據(jù)報告、論證報告、技術(shù)報告,例如《學(xué)生數(shù)學(xué)學(xué)習(xí)質(zhì)量監(jiān)測工具論證報告》。
建立了政府支持、獨立運轉(zhuǎn)的基礎(chǔ)教育質(zhì)量監(jiān)測實施機制?;A(chǔ)教育質(zhì)量監(jiān)測工作具有很強的專業(yè)性、獨立性,借鑒國外經(jīng)驗結(jié)合我國國情,確立了國家教育督導(dǎo)團行政聯(lián)系、教育部基礎(chǔ)教育質(zhì)量監(jiān)測中心具體實施的方式,監(jiān)測中心享有較獨立的專業(yè)自主權(quán)。
監(jiān)測標準的重要依據(jù)即義務(wù)教育階段各科課程標準,課程標準就是對學(xué)生在經(jīng)過一段時間的學(xué)習(xí)后應(yīng)該知道什么和能做什么的界定和描述,是國家對學(xué)生學(xué)習(xí)結(jié)果的統(tǒng)一的、基本的要求,是學(xué)生學(xué)業(yè)成就評價的依據(jù)。
測試目的即評估學(xué)生獲得的學(xué)習(xí)能力,診斷其長處和弱點。因此在學(xué)科領(lǐng)域測評中不僅重視學(xué)科課程目標的達成,更重視學(xué)生對學(xué)科知識與現(xiàn)實的聯(lián)系與應(yīng)用能力。
包括學(xué)業(yè)成績、德智體美發(fā)展以及相關(guān)影響因素等內(nèi)容,不僅注重對學(xué)業(yè)成績的分析,更重視對影響學(xué)業(yè)成績的各因素進行歸因分析、相關(guān)分析。
在參照國際知名評價項目PISA、TIMSS和世界各國基礎(chǔ)教育質(zhì)量監(jiān)測的基礎(chǔ)上,遵循教育與心理測量學(xué)專業(yè)要求,采用試卷與問卷相結(jié)合的方式,既重視測試結(jié)果的呈現(xiàn)方式,又重視結(jié)果背后的歸因分析。
質(zhì)量監(jiān)測不是統(tǒng)考統(tǒng)測,而是通過對全國所有目標學(xué)生進行科學(xué)抽樣,隨機抽取學(xué)生樣本,以獲得有代表性的結(jié)果。由前幾年的工作經(jīng)驗看,每個省約有10個樣本縣,每個樣本縣有720名學(xué)生參加測試,以此標準,全國31個?。ㄊ小⒆灾螀^(qū))參加測試,樣本學(xué)生量將達到22.32萬人。
一般的學(xué)科均以學(xué)生紙筆測試的形式進行,部分學(xué)科會有小樣本現(xiàn)場測試。如2011年的英語有小樣本的口語測試,體育有小樣本的學(xué)生體質(zhì)健康和體育學(xué)力現(xiàn)場測試。
從監(jiān)測標準的制定、監(jiān)測工具的研發(fā)、抽樣、實施到數(shù)據(jù)分析與報告撰寫,均由國家監(jiān)測中心負責,在監(jiān)測實施階段,各省負責協(xié)助、配合中心做好本省的具體組織管理工作,包括前期的各類數(shù)據(jù)報送和現(xiàn)場數(shù)據(jù)采集?,F(xiàn)場數(shù)據(jù)采集時中心派出國家級視導(dǎo)員到樣本縣負責監(jiān)測工作的實施。
目前對監(jiān)測結(jié)果只在一定層面進行反饋,不對社會公布,即使公布也只會是全國整體情況和一些熱點難點問題,不會根據(jù)監(jiān)測結(jié)果對省、縣的教育工作進行排名排序、評優(yōu)評級,不允許學(xué)校在監(jiān)測前進行操練和應(yīng)對。以此來解除參加監(jiān)測工作單位的顧慮,獲得真實數(shù)據(jù)。
監(jiān)測工具的開發(fā)動用了大量國家資源,開發(fā)成本很高,同時為了保證監(jiān)測數(shù)據(jù)的真實性和客觀性,監(jiān)測工具被定為國家“機密”,在監(jiān)測工具啟用前和使用后均為保密文件,數(shù)據(jù)采集過程嚴格控制。
通過對前期的試點監(jiān)測研究發(fā)現(xiàn):
第一,為國家評估基礎(chǔ)教育質(zhì)量進行教育決策提供信息、依據(jù)和建議。如在課程標準達成度方面,監(jiān)測發(fā)現(xiàn):大部分學(xué)生在學(xué)科學(xué)習(xí)上達到了課程標準的基本要求,但優(yōu)秀學(xué)生的比例不高,學(xué)生的實際應(yīng)用能力、問題解決能力比較弱。第二,為促進教育公平、制定教育政策提供科學(xué)依據(jù)。如監(jiān)測結(jié)果發(fā)現(xiàn):流動和留守兒童學(xué)業(yè)成績落后、學(xué)校感受和自我感受消極、欺負行為和網(wǎng)絡(luò)成癮嚴重、人際關(guān)系差。其中,隨單親流動的兒童和母親外出的留守兒童以上問題尤為突出。第三,可以揭示影響學(xué)生發(fā)展的相關(guān)因素,為探尋促進教育發(fā)展的途徑提供參考,為精細化的內(nèi)涵管理提供依據(jù)。如監(jiān)測結(jié)果發(fā)現(xiàn):課程、師資狀況及學(xué)校的硬件設(shè)施是影響學(xué)生學(xué)業(yè)表現(xiàn)的重要因素。第四,為教育督導(dǎo)提供依據(jù),為教育決策提供參考。如對課業(yè)負擔的監(jiān)測發(fā)現(xiàn):課程及考試內(nèi)容過深、過廣,學(xué)校和學(xué)生加班加點、周末補課、作業(yè)量超標現(xiàn)象普遍。
基礎(chǔ)教育質(zhì)量監(jiān)測作為的一項新舉措,已經(jīng)初步顯示了它對國家教育管理和改革發(fā)揮的重要作用,盡管還有一些需要不斷完善和改進的地方,但不可否認,它已成為改善與提高基礎(chǔ)教育質(zhì)量的重要途徑之一。
[1]胡錦濤.在2010年全國教育工作會議上的講話.2012-09-08.
[2]教育部基礎(chǔ)教育質(zhì)量監(jiān)測中心網(wǎng)站[EB/OL].http://www.eachina.org.cn/eac/zxjj.htm.
[3]張愛蘭.構(gòu)建政府支持、獨立運轉(zhuǎn)的基礎(chǔ)教育質(zhì)量監(jiān)測與保障機制[J].學(xué)校管理與發(fā)展,2010,(8).
[4]辛濤,李峰,李凌艷.基礎(chǔ)教育質(zhì)量監(jiān)測的國際比較[J].北京師范大學(xué)學(xué)報(社會科學(xué)版),2007,(6).
[5]陳效民.基礎(chǔ)教育質(zhì)量監(jiān)測的實踐要素探析[J].考試研究,2011,(6).
[6]張斌.基礎(chǔ)教育質(zhì)量監(jiān)測和評價解決方案[J].中國教育信息化,2011,(18).