羅文蔚
摘要 NAEP(National Assessment of Educational Progress)即教育質(zhì)量評(píng)價(jià)體系,是美國(guó)目前最具引導(dǎo)性的教育評(píng)價(jià)體系,這一體系為學(xué)生受到科學(xué)教育提供了可靠保證。通過(guò)對(duì)該評(píng)價(jià)體系進(jìn)行梳理、剖析,對(duì)我國(guó)建立科學(xué)、有效的教育評(píng)價(jià)體系具有良好的啟示作用。
關(guān)鍵詞 NAEP 教育質(zhì)量評(píng)價(jià)體系 啟示
美國(guó)教育質(zhì)量評(píng)價(jià)體系(NAEP)被喻為“皇家成績(jī)通知單”,是美國(guó)極具代表性、權(quán)威性和影響力的教育評(píng)價(jià)體系,在美國(guó)教育界擁有不可替代的地位,在各國(guó)建立教育質(zhì)量體系時(shí)具有標(biāo)桿式作用,是各國(guó)爭(zhēng)相借鑒和模仿的榜樣,在全球范圍內(nèi)擁有極高的影響力。
一、美國(guó)教育質(zhì)量評(píng)價(jià)體系概述
1.NAEP簡(jiǎn)介
美國(guó)是一個(gè)教育高度自治的國(guó)家,聯(lián)邦政府對(duì)教育的干預(yù)也是建立在民主的基礎(chǔ)上,NAEP是美國(guó)民主教育的典型代表,已形成國(guó)內(nèi)、州內(nèi)聯(lián)動(dòng)的有機(jī)體系。NAEP是一個(gè)多維度的、立體全方位的評(píng)價(jià)體系,能夠?qū)逃|(zhì)量給予最客觀、中肯、有效的評(píng)價(jià)。
NAEP由主要評(píng)價(jià)、長(zhǎng)期趨勢(shì)評(píng)價(jià)和專項(xiàng)評(píng)估三個(gè)層次構(gòu)成。主要評(píng)價(jià)重在評(píng)估學(xué)生當(dāng)前的學(xué)習(xí)成果,目的是對(duì)國(guó)內(nèi)、州內(nèi)的學(xué)生在核心領(lǐng)域的學(xué)習(xí)情況進(jìn)行評(píng)估。在國(guó)內(nèi)進(jìn)行的主要評(píng)估頻率為一年一次,評(píng)估的對(duì)象為4年級(jí)、8年級(jí)和12年級(jí)的學(xué)生,隨機(jī)抽取reading、maths、science、writing、history、econoIIHCS、civics、geography和an 9個(gè)科目中的三個(gè)科目,抽取兩個(gè)年級(jí)的學(xué)生參加;在州內(nèi)進(jìn)行的主要評(píng)估頻率為兩年一次,樣本群來(lái)自4年級(jí)和8年級(jí)的學(xué)生,評(píng)估科目分為必選科目和自選科目。長(zhǎng)期趨勢(shì)評(píng)價(jià)側(cè)重評(píng)估學(xué)生的未來(lái)發(fā)展趨勢(shì),目的是搜集學(xué)生在學(xué)科成績(jī)方面的未來(lái)發(fā)展信息,其評(píng)估頻率是四年一次,樣本群來(lái)自9歲、13歲和17歲的學(xué)生群體,評(píng)估科目涉及maths、science、reading和writing。專項(xiàng)評(píng)估則具有補(bǔ)充性作用,進(jìn)行輔助性的專題研究,涉及實(shí)驗(yàn)性評(píng)價(jià)、成績(jī)單評(píng)價(jià)、口語(yǔ)研究等等,主要針對(duì)特定的學(xué)生群體,如私立學(xué)校、特許實(shí)驗(yàn)學(xué)校、印第安人、中學(xué)生等。
2.NAEP評(píng)價(jià)系統(tǒng)
第一階段為框架設(shè)計(jì)。主要負(fù)責(zé)機(jī)構(gòu)是美國(guó)國(guó)家評(píng)價(jià)管理委員會(huì)(NAGB),統(tǒng)領(lǐng)整個(gè)評(píng)價(jià)體系的設(shè)計(jì)與實(shí)施。框架設(shè)計(jì)經(jīng)過(guò)各界專家以及公眾的反復(fù)論證,充分考慮學(xué)生的心理測(cè)試標(biāo)準(zhǔn)、教育的公平測(cè)試標(biāo)準(zhǔn)和國(guó)家頒布的統(tǒng)計(jì)標(biāo)準(zhǔn)。
第二階段為工具設(shè)計(jì)。主要負(fù)責(zé)機(jī)構(gòu)是美國(guó)教育考試服務(wù)中心(ETS)。按照標(biāo)準(zhǔn)化流程在評(píng)估體系的框架下進(jìn)行試題開(kāi)發(fā),試題需要經(jīng)過(guò)編寫設(shè)計(jì)、審核、修改、試測(cè)、復(fù)測(cè)、再修改等過(guò)程,形成評(píng)價(jià)試題冊(cè)的最終版本。
第三階段為學(xué)生樣本選取。主要由美國(guó)國(guó)家教育統(tǒng)計(jì)中心(NCES)負(fù)責(zé)。學(xué)生樣本選取的依據(jù)有區(qū)域劃分、城鄉(xiāng)區(qū)別、種族、貧富群體、學(xué)校性質(zhì)等等,按照事先約定的比例從指定的年級(jí)中隨機(jī)抽取學(xué)生。
第四階段為評(píng)價(jià)測(cè)試。由西斯特(Westat)公司負(fù)責(zé)NAEP數(shù)據(jù)采集和實(shí)施評(píng)價(jià)。由于NAEP國(guó)內(nèi)評(píng)價(jià)和州評(píng)價(jià)的工作量大,為了保證樣本數(shù)據(jù)來(lái)源的真實(shí)性和數(shù)據(jù)處理的準(zhǔn)確性,主要評(píng)價(jià)耗時(shí)近2個(gè)月,而長(zhǎng)期趨勢(shì)評(píng)價(jià)會(huì)在春季、秋季、冬季舉行。
第五階段為評(píng)分。主要負(fù)責(zé)機(jī)構(gòu)是美國(guó)國(guó)家計(jì)算機(jī)系統(tǒng)(NcS)??陀^題采取“機(jī)評(píng)”的方式,即使用光電閱讀器評(píng)分;主觀題則邀請(qǐng)有經(jīng)驗(yàn)的專家依據(jù)評(píng)分指南和量表進(jìn)行評(píng)分。為盡量避免評(píng)分者的主觀意向,NCS針對(duì)NAEP創(chuàng)新性地開(kāi)發(fā)了電子圖像識(shí)別評(píng)分系統(tǒng),不僅將主觀題以圖像的形式客觀化,評(píng)分系統(tǒng)還會(huì)給予一個(gè)評(píng)分區(qū)間。
第六階段為成績(jī)輸出。scale score和achievement levels是NAEP中每一個(gè)學(xué)科教學(xué)成果評(píng)估的主要表現(xiàn)方式。scale score依據(jù)項(xiàng)目反映匯總,而achievement levels則以基礎(chǔ)、熟練和高級(jí)三個(gè)等級(jí)體現(xiàn)。
3.NAEP發(fā)展歷程
自美國(guó)成立以來(lái),州政府和地區(qū)學(xué)區(qū)擁有很高的教育實(shí)權(quán),二戰(zhàn)后美國(guó)開(kāi)始重新審視自身的教育地位,美國(guó)聯(lián)邦政府開(kāi)始逐步集中對(duì)教育的主導(dǎo)權(quán),開(kāi)始正式干預(yù)教育,NAEP應(yīng)運(yùn)而生。NAEP主要經(jīng)歷了以下四個(gè)發(fā)展階段。
第一,起步階段(1963-1969)。1963年NAEP的雛形開(kāi)始呈現(xiàn),但遭到諸多教育組織的質(zhì)疑和反對(duì),歷時(shí)6年沖破重重阻礙后,NAEP最終被確定由教育委員會(huì)(ECS)負(fù)責(zé)管理。1969年,第一次全國(guó)性評(píng)估得以實(shí)施,但此時(shí)評(píng)估只涉及國(guó)內(nèi)評(píng)估而非州內(nèi)評(píng)估。
第二,探索階段(1969-1983)。在相對(duì)平穩(wěn)的探索階段,投資比例決定話語(yǔ)權(quán)。美國(guó)聯(lián)邦政府通過(guò)逐年增加對(duì)NAEP的直接投資,于1972年正式成為NAEP的唯一注資者,成功從ECS手中接過(guò)NAEP的管理權(quán),監(jiān)控權(quán)也由國(guó)家教育研究發(fā)展中心平穩(wěn)過(guò)渡給了NCES。
第三,突破階段(1983-2001)。一是管理權(quán)從ECS到ETS的進(jìn)一步轉(zhuǎn)移;二是擴(kuò)大評(píng)估層級(jí),增加州內(nèi)評(píng)估;三是NAGB的建立,標(biāo)志著NAEP有了專門而獨(dú)立的管理機(jī)構(gòu),為NAEP在教育領(lǐng)域的主導(dǎo)地位奠定基礎(chǔ)。
第四,發(fā)展階段(2001至今)。2001年《一個(gè)都不能少》(NCLB)的法案要求所有州必須將NAEP納人州內(nèi)評(píng)估管理。至此,NAEP從一個(gè)自愿參與的評(píng)估體系演變?yōu)楸仨殔⑴c執(zhí)行的評(píng)估體系,開(kāi)啟了美國(guó)教育質(zhì)量評(píng)估的新篇章。
二、美國(guó)教育質(zhì)量評(píng)價(jià)體系的特征
1.基于學(xué)業(yè)標(biāo)準(zhǔn)建立
基于學(xué)業(yè)標(biāo)準(zhǔn)建立是NAEP框架中的亮點(diǎn)之一,通過(guò)樣本群體的劃分以及科目的選擇,有效規(guī)避了學(xué)校和學(xué)生個(gè)人信息的公布,整個(gè)測(cè)試過(guò)程到評(píng)估結(jié)果發(fā)布都有效遵循了低利害性的特征,避免評(píng)估主體——學(xué)校、學(xué)生受到評(píng)估結(jié)果的暗示,規(guī)避引導(dǎo)教育資源的趨利流動(dòng),從而導(dǎo)致教育資源的分配不均。這一特征是NAEP教育質(zhì)量評(píng)估體系得以被大眾接受的重要特性。
2.為國(guó)家教育決策和改革服務(wù)
在NAEP的設(shè)立過(guò)程中,其開(kāi)放性也在逐漸升級(jí),主要體現(xiàn)在形式的公開(kāi),即歷年的評(píng)估框架和試題均公開(kāi),這一方式既增加了NAEP的公信力,又不會(huì)降低NAEP的保密性,使得NAEP的開(kāi)放性和保密性達(dá)到完美平衡。在提高用戶滿意度的同時(shí),更加客觀的反映需要特別關(guān)注的領(lǐng)域和需要重視的問(wèn)題,使教育決策者更直觀地看到問(wèn)題所在,更好地為國(guó)家教育決策和改革服務(wù)。
3.以提升個(gè)體發(fā)展為目標(biāo)
美國(guó)NAEP教育質(zhì)量評(píng)價(jià)體系的初衷是為學(xué)生建立公平、公開(kāi)、透明的教育體系。提升個(gè)體發(fā)展是NAEP的價(jià)值回歸,NAEP評(píng)估制度選擇不同的樣本群體,建立州際之間的橫向?qū)Ρ群蜌v年的縱向比較體系,多維度、全方位的反映教育質(zhì)量的變化。NAEP不僅僅關(guān)心學(xué)生的成績(jī),更關(guān)心在不同環(huán)境下不同受教育群體的成就分布,以及獲得這些成就的公平程度。NAEP提升個(gè)體發(fā)展的特征充分體現(xiàn)了美國(guó)“卓越始于平等”的戰(zhàn)略目標(biāo)。
三、美國(guó)教育質(zhì)量評(píng)價(jià)體系的啟示
1.保障教育質(zhì)量評(píng)估的公平性
教育的公平性一直是我們關(guān)注的問(wèn)題,其中涉及教育質(zhì)量的公平性、教育資源的公平性和教育監(jiān)測(cè)的公平性。一方面,NAEP的樣本群體涵蓋全面。不僅涉及普通學(xué)生,也涉及特殊學(xué)生,而特殊學(xué)生在樣本群體大約占據(jù)10%的比例,這樣的體系建立為教育監(jiān)測(cè)公平性提供了支持;另一方面,NAEP體系的構(gòu)成和實(shí)踐建立在科學(xué)的標(biāo)準(zhǔn)和目標(biāo)之上,能夠在政府、中介機(jī)構(gòu)的保障下實(shí)現(xiàn)檢測(cè)的公平性。NAEP為我國(guó)建立教育質(zhì)量評(píng)價(jià)體系提供重要參考,我國(guó)也應(yīng)堅(jiān)持長(zhǎng)期進(jìn)行、廣泛取樣,充分考慮國(guó)家統(tǒng)一性標(biāo)準(zhǔn)與不同地區(qū)的特殊性標(biāo)準(zhǔn),城市與農(nóng)村地區(qū)、不同學(xué)科、不同時(shí)期之間存在的差異性,協(xié)調(diào)完善新課程標(biāo)準(zhǔn)改革,切實(shí)保障教育質(zhì)量評(píng)估的公平性。
2.國(guó)家層面對(duì)于教育質(zhì)量監(jiān)測(cè)的重要性
追溯NAEP的發(fā)展歷程,美國(guó)聯(lián)邦政府通過(guò)逐年增加對(duì)NAEP的直接投資,正式成為NAEP的唯一注資者,成功從ECS手中接過(guò)NAEP的管理權(quán)。與此同時(shí),其監(jiān)控權(quán)也發(fā)生了轉(zhuǎn)移,由國(guó)家教育研究發(fā)展中心平穩(wěn)過(guò)渡給了NCES。充分體現(xiàn)了國(guó)家層面對(duì)教育質(zhì)量監(jiān)測(cè)的重要性,一個(gè)體系的建立需要諸多專家的參與,一個(gè)體系的維護(hù)更需要國(guó)家機(jī)構(gòu)的支持,因此,美國(guó)聯(lián)邦政府不僅是唯一注資者,更是NAEP最直接的監(jiān)管者。人才的培養(yǎng)是教育的基本內(nèi)容,而促進(jìn)教育事業(yè)的進(jìn)一步發(fā)展,提高教育質(zhì)量,需要國(guó)家層面作為強(qiáng)有力的推手。比如通過(guò)廣泛取樣、全面評(píng)估,制定系統(tǒng)完善的全國(guó)性教育評(píng)估與評(píng)價(jià)方案,為國(guó)家層面的課程決策提供具有操作性的指導(dǎo),并不斷加大科技研發(fā),提升教育質(zhì)量監(jiān)測(cè)和教育評(píng)估體系的技術(shù)手段。
3.教育質(zhì)量監(jiān)測(cè)充分體現(xiàn)實(shí)用性
美國(guó)國(guó)內(nèi)、州內(nèi)之所以能夠持續(xù)改善教學(xué)品質(zhì),是得益于實(shí)證數(shù)據(jù)采集,NAEP持續(xù)數(shù)年收集學(xué)生樣本數(shù)據(jù),已經(jīng)建立一個(gè)強(qiáng)大的隨時(shí)更新的數(shù)據(jù)庫(kù)。這樣NAEP不僅可以為評(píng)估者提供實(shí)時(shí)監(jiān)控的可能,還可以提高數(shù)據(jù)的橫縱向比較,實(shí)現(xiàn)普適性與地方性相結(jié)合,使學(xué)生評(píng)估監(jiān)測(cè)標(biāo)準(zhǔn)高度貼合國(guó)內(nèi)實(shí)際情況,使監(jiān)測(cè)內(nèi)容具有廣泛性和針對(duì)性。如果我國(guó)能夠借鑒NAEP建立起一個(gè)大型的教育數(shù)據(jù)庫(kù),通過(guò)數(shù)年的積累、收集、整理和應(yīng)用,必然能夠通過(guò)豐富的教育研究信息數(shù)據(jù),為教育質(zhì)量的實(shí)時(shí)監(jiān)測(cè)提供強(qiáng)大的即時(shí)學(xué)生數(shù)據(jù)資料,為教育理念創(chuàng)新、教學(xué)方式改革發(fā)展以及改進(jìn)學(xué)生學(xué)業(yè)成就提供系統(tǒng)的數(shù)據(jù)支撐,形成較為科學(xué)可行的高效機(jī)制,將有助于提升我國(guó)教育質(zhì)量評(píng)價(jià)的技術(shù)性和實(shí)用性。
4.評(píng)估標(biāo)準(zhǔn)提高目標(biāo)性
研制評(píng)估標(biāo)準(zhǔn)是實(shí)現(xiàn)教育成效目標(biāo)的關(guān)鍵。NAEP為不同年齡段、不同學(xué)科設(shè)計(jì)了非常具體的評(píng)估標(biāo)準(zhǔn),制定了非常清晰明確的目標(biāo)要求,這樣在進(jìn)行具體的評(píng)估之后,老師、學(xué)生、評(píng)估者以及決策者可以通過(guò)不同學(xué)生的評(píng)估結(jié)果來(lái)充分了解學(xué)生在學(xué)業(yè)及學(xué)習(xí)上的優(yōu)勢(shì)和不足,也進(jìn)一步明確了其加強(qiáng)改進(jìn)的方向及目標(biāo)。結(jié)合我國(guó)的實(shí)際教育教學(xué)情況,新課改的實(shí)施促使中小學(xué)各科的課程標(biāo)準(zhǔn)陸續(xù)頒布,課程標(biāo)準(zhǔn)不僅包含了教材編寫的具體要求和原則,還體現(xiàn)了教師教學(xué)成果及學(xué)生學(xué)習(xí)成果的具體標(biāo)準(zhǔn)。因此,我國(guó)可以參考美國(guó)NAEP的評(píng)估標(biāo)準(zhǔn),在課程標(biāo)準(zhǔn)和學(xué)生學(xué)業(yè)水平測(cè)試上體現(xiàn)更為具體深入的差異性目標(biāo),著重建立一套成熟的學(xué)生水平評(píng)價(jià)主體多元、評(píng)價(jià)內(nèi)容全面、評(píng)價(jià)方式多樣的與科學(xué)課程相配套的評(píng)價(jià)體系,進(jìn)一步完善課程標(biāo)準(zhǔn),強(qiáng)調(diào)學(xué)業(yè)評(píng)價(jià)以標(biāo)準(zhǔn)為依據(jù),并對(duì)評(píng)價(jià)標(biāo)準(zhǔn)的目標(biāo)性作出科學(xué)界定,便于掌握真實(shí)的學(xué)生學(xué)業(yè)水平。
5.評(píng)估結(jié)果提高科學(xué)性
NAEP基于項(xiàng)目反應(yīng)理論,通過(guò)科學(xué)真實(shí)有效的參數(shù)估計(jì)軟件針對(duì)不同的科學(xué)學(xué)業(yè)項(xiàng)目進(jìn)行客觀的參數(shù)估計(jì),并以“基礎(chǔ)、熟練和高級(jí)”三個(gè)等級(jí)來(lái)劃分學(xué)生的科學(xué)學(xué)業(yè)成就,同時(shí)根據(jù)學(xué)生不同的預(yù)測(cè)變量(如性別、年齡、種族等)來(lái)綜合客觀全面地對(duì)學(xué)生的能力值進(jìn)行評(píng)估。這樣的評(píng)估結(jié)果方式對(duì)我國(guó)僅僅以學(xué)期成績(jī)、學(xué)年成績(jī)、中考成績(jī)、高考成績(jī)對(duì)學(xué)生的水平等級(jí)一概而論產(chǎn)生極大的影響,因此,我們可以科學(xué)地細(xì)化當(dāng)前的學(xué)業(yè)水平評(píng)價(jià)標(biāo)準(zhǔn),對(duì)學(xué)生的知識(shí)技能、學(xué)習(xí)方式、學(xué)習(xí)態(tài)度等進(jìn)行全方位地考察,強(qiáng)化對(duì)學(xué)生學(xué)習(xí)結(jié)果的可觀察性。我國(guó)教育部門應(yīng)創(chuàng)新學(xué)生學(xué)業(yè)水平評(píng)價(jià)標(biāo)準(zhǔn),通過(guò)科學(xué)的測(cè)量手段、測(cè)量設(shè)備使各項(xiàng)水平測(cè)試客觀可量,盡量減少主觀人為性。
當(dāng)前我國(guó)的學(xué)業(yè)水平評(píng)價(jià)主要以同年級(jí)對(duì)比為主,而NAEP通過(guò)垂直鏈接來(lái)對(duì)比各年級(jí)學(xué)生的最終成績(jī),有助于形成縱向?qū)Ρ龋纬筛鼮槿媪Ⅲw的評(píng)價(jià)。我們也可以參考這樣的縱向年級(jí)比較方式,承前啟后,互相補(bǔ)充、激勵(lì),提高科學(xué)性。
NAEP教育質(zhì)量評(píng)價(jià)體系可謂全球范圍內(nèi)教育質(zhì)量評(píng)價(jià)體系的典范。項(xiàng)目反應(yīng)理論(IRT)量表在NAEP中的應(yīng)用更加提高了NAEP評(píng)估的精度,評(píng)估報(bào)告的焦點(diǎn)會(huì)繼續(xù)停留在“等距分?jǐn)?shù)”的設(shè)定(用以分析不同成就水平學(xué)生的百分比)。NAEP的框架設(shè)計(jì)、體系構(gòu)造、樣本取樣方式為我國(guó)搭建符合我國(guó)國(guó)情的教育質(zhì)量評(píng)價(jià)體系提供了很好的借鑒,NAEP在評(píng)估過(guò)程中體現(xiàn)出的公平性、開(kāi)放性也為我國(guó)教育評(píng)估起到了很好的啟示作用。
[責(zé)任編輯 郭振玲]