金 艷,孫 杭,2
(1.上海交通大學(xué) 外國(guó)語(yǔ)學(xué)院,上海 200240;2.上海理工大學(xué) 外語(yǔ)學(xué)院,上海 200093)
在教育領(lǐng)域,教師無(wú)時(shí)無(wú)刻不在課堂上評(píng)估學(xué)生的表現(xiàn)。課堂評(píng)估可以包括正式和非正式的測(cè)試以及各種幫助教師評(píng)估學(xué)生課堂學(xué)習(xí)成果的教學(xué)活動(dòng)[1]。近年來(lái),隨著對(duì)評(píng)估與課堂學(xué)習(xí)的互動(dòng)關(guān)系的關(guān)注[2]7,課堂評(píng)估的研究和實(shí)踐掀起了一股改革的熱潮。澳大利亞、加拿大、英國(guó)、美國(guó)和中國(guó)香港在內(nèi)的很多國(guó)家和地區(qū)在近年來(lái)的教學(xué)改革中大力推進(jìn)課堂評(píng)估的實(shí)踐并強(qiáng)調(diào)提高教師在評(píng)價(jià)學(xué)生學(xué)習(xí)活動(dòng)中的參與性[3]393-394。一些關(guān)于課堂評(píng)估的專著也應(yīng)運(yùn)而生[4-5]。
研究者指出,課堂評(píng)估可以獲取一些在標(biāo)準(zhǔn)化考試中無(wú)法測(cè)量的學(xué)生語(yǔ)言能力的信息;其評(píng)估方式可以更加真實(shí)和有意義;師生能夠獲取一手的評(píng)估結(jié)果來(lái)提升教與學(xué)[6]489-490[7]。因此,課堂評(píng)估被認(rèn)為是連接教、學(xué)、考最好的方式之一。盡管課堂評(píng)估具有諸多益處,在外語(yǔ)教育領(lǐng)域其研究仍處于起步階段。目前,尚未有學(xué)者對(duì)外語(yǔ)課堂評(píng)估研究的進(jìn)展和問(wèn)題進(jìn)行較為全面的回顧。鑒于此,本文試圖對(duì)2007—2018年國(guó)內(nèi)外外語(yǔ)類主要期刊發(fā)表的外語(yǔ)課堂評(píng)估文獻(xiàn)進(jìn)行梳理,探討國(guó)內(nèi)外研究的共性和個(gè)性,分析現(xiàn)有研究的發(fā)展?fàn)顩r并對(duì)存在的問(wèn)題提出對(duì)策,以期促進(jìn)課堂評(píng)估未來(lái)的研究和實(shí)踐。
本研究的文獻(xiàn)來(lái)源于2007—2018年國(guó)內(nèi)外14種外語(yǔ)類期刊,包括5種SSCI期刊(1)5種SSCI期刊包括The Modern Language Journal,TESOL Quarterly,Assessing Writing,Language Testing,Language Assessment Quarterly,2017年影響因子分別為2.789、2.256、1.906、1.431和0.868。和9種CSSCI期刊(2)9種CSSCI期刊包括《外語(yǔ)教學(xué)與研究》《外語(yǔ)教學(xué)》《現(xiàn)代外語(yǔ)》《外語(yǔ)界》《中國(guó)外語(yǔ)》《外語(yǔ)與外語(yǔ)教學(xué)》《外語(yǔ)教學(xué)理論與實(shí)踐》《外語(yǔ)研究》和《解放軍外國(guó)語(yǔ)學(xué)院學(xué)報(bào)》?!锻鈬?guó)語(yǔ)》《外語(yǔ)學(xué)刊》等期刊未刊登外語(yǔ)課堂評(píng)估文章,故未列入。。這些期刊具有一定的代表性和權(quán)威性,能較好地反映外語(yǔ)課堂評(píng)估研究的現(xiàn)狀與動(dòng)態(tài)。針對(duì)國(guó)外期刊,筆者進(jìn)行了“classroom/classroom-based assessment”的篇名和關(guān)鍵詞搜索。在對(duì)國(guó)內(nèi)期刊文獻(xiàn)進(jìn)行搜索時(shí),由于所使用的術(shù)語(yǔ)尚未統(tǒng)一,以“課堂評(píng)估/價(jià)”為關(guān)鍵詞的文章只有3篇,因此筆者將篇名和關(guān)鍵詞的搜索范圍擴(kuò)大到“形成性評(píng)估/價(jià)”和“教師評(píng)估/價(jià)”。為了篩選滿足本文研究重點(diǎn)的文獻(xiàn),篇名或關(guān)鍵詞不包含“課堂評(píng)估/價(jià)”的文獻(xiàn)應(yīng)包括發(fā)生在日常課堂環(huán)境的評(píng)估行為,未提及課堂評(píng)估方式的廣義上的形成性評(píng)估不在本研究范疇內(nèi)。筆者通過(guò)對(duì)所獲文獻(xiàn)的逐篇閱讀來(lái)確定相關(guān)文獻(xiàn),并借鑒Black & Wiliam“滾雪球”[2]8的方式利用已獲文獻(xiàn)的參考文獻(xiàn)來(lái)查缺補(bǔ)漏。本研究最終確定有效樣本論文79篇。下文將從研究的總體趨勢(shì)、研究對(duì)象、研究?jī)?nèi)容和研究方法四個(gè)維度對(duì)外語(yǔ)課堂評(píng)估研究的現(xiàn)狀進(jìn)行梳理和分析。
經(jīng)統(tǒng)計(jì),國(guó)內(nèi)外外語(yǔ)類主要期刊2007—2018年共發(fā)表外語(yǔ)課堂評(píng)估論文79篇。其中,國(guó)內(nèi)論文34篇(43%),國(guó)外45篇(57%),國(guó)外論文數(shù)量多于國(guó)內(nèi)??傮w而言,國(guó)內(nèi)外外語(yǔ)課堂評(píng)估研究均呈現(xiàn)出波動(dòng)式的發(fā)展趨勢(shì)(見圖1),并在2009年、2017年和2018年達(dá)到了3個(gè)峰值。國(guó)內(nèi)外期刊12年間年度總發(fā)文量最高12篇,最低2篇。國(guó)內(nèi)期刊年均發(fā)文量2.8篇,國(guó)外期刊3.8篇,數(shù)量較少。一方面原因是與其他普通教育(general education)的學(xué)科如數(shù)學(xué)、科學(xué)相比,外語(yǔ)課堂評(píng)估研究起步較晚,研究尚未大量展開;另一方面原因可能在于現(xiàn)有外語(yǔ)課堂評(píng)估研究的質(zhì)量有待提高,因此CSSCI和SSCI期刊中收錄較少。
圖1 2007—2018年外語(yǔ)課堂評(píng)估研究數(shù)量統(tǒng)計(jì)
2007—2018年國(guó)內(nèi)外外語(yǔ)課堂評(píng)估的研究涵蓋了不同教育階段和類別的研究對(duì)象,包括研究生、本科生、中小學(xué)學(xué)生、其他學(xué)生群體(如高職學(xué)生、語(yǔ)言預(yù)科班學(xué)生)和外語(yǔ)教師等。由于課堂評(píng)估的研究對(duì)象往往同時(shí)包括學(xué)生和教師,因此表1將研究對(duì)象按教育階段和類別進(jìn)行分類統(tǒng)計(jì)。由表1可見,我國(guó)外語(yǔ)課堂評(píng)估的研究對(duì)象較為單一,主要由本科階段的師生組成(占88%),其他研究對(duì)象所占比例很低,而小學(xué)階段更是完全空缺。相比之下,國(guó)外文獻(xiàn)的研究對(duì)象則較為均勻地分布在本科、中學(xué)和小學(xué)階段,所占比例分別為35.3%、38.3%和20.6%。對(duì)于研究生階段和其他類別的群體,國(guó)內(nèi)外研究的關(guān)注均較少。
表1 2007—2018年外語(yǔ)課堂評(píng)估研究對(duì)象分布
參照Black & Wiliam[2]9-10和羅少茜等[8]243-250對(duì)國(guó)內(nèi)外課堂形成性評(píng)估研究的回顧以及通過(guò)對(duì)所獲文獻(xiàn)的研讀,筆者對(duì)近12年外語(yǔ)課堂評(píng)估的研究?jī)?nèi)容進(jìn)行了歸類。由表2可見,國(guó)內(nèi)外外語(yǔ)課堂評(píng)估研究?jī)?nèi)容的范疇相同,具體側(cè)重點(diǎn)則有所差異。國(guó)內(nèi)研究集中在課堂評(píng)估的促學(xué)效果方面,國(guó)外研究在不同研究領(lǐng)域分布較為均衡。下文將重點(diǎn)回顧課堂評(píng)估的促學(xué)效果、教師角色、效度驗(yàn)證、評(píng)估過(guò)程和其他(反饋、教育政策等)五個(gè)方面的研究?jī)?nèi)容。
表2 2007—2018年外語(yǔ)課堂評(píng)估研究?jī)?nèi)容分布
1.促學(xué)效果
與傳統(tǒng)考試用作記錄和報(bào)道學(xué)生成就的目的不同,課堂評(píng)估的主要目的是促進(jìn)教與學(xué)。因此,課堂評(píng)估作為一種促學(xué)評(píng)估的可行性和有效性是推進(jìn)其實(shí)踐的前提和基礎(chǔ)。國(guó)內(nèi)外學(xué)者對(duì)此均進(jìn)行了一系列的探索。唐雄英、章少泉以準(zhǔn)實(shí)驗(yàn)的方式將新型評(píng)價(jià)用于大學(xué)英語(yǔ)教學(xué)情境中,發(fā)現(xiàn)新型評(píng)價(jià)有利于學(xué)生自主學(xué)習(xí)能力和自我效能感的提高,而對(duì)學(xué)生總體英語(yǔ)水平?jīng)]有明顯的促進(jìn)效果[9]。劉芹等針對(duì)理工科大學(xué)英語(yǔ)口語(yǔ)課程構(gòu)建了形成性評(píng)估體系[10]。通過(guò)對(duì)比實(shí)驗(yàn)班與控制班學(xué)生學(xué)期初和學(xué)期末的口試成績(jī),作者發(fā)現(xiàn)形成性評(píng)估可以有效地運(yùn)用于英語(yǔ)口語(yǔ)教學(xué)。上述研究著重探討了課堂形成性評(píng)估在促進(jìn)學(xué)生學(xué)習(xí)方面的有效性。張荔對(duì)學(xué)術(shù)英語(yǔ)交際課程中形成性評(píng)估的實(shí)施效果進(jìn)行了調(diào)查,研究發(fā)現(xiàn)形成性評(píng)估不僅促進(jìn)了學(xué)生論文質(zhì)量的提高,也幫助教師改進(jìn)了課程設(shè)計(jì)和調(diào)整教學(xué)[11]。
與國(guó)內(nèi)研究關(guān)注整個(gè)課堂形成性評(píng)估體系的有效性不同,國(guó)外研究更具體地對(duì)不同的課堂評(píng)估工具或評(píng)估原則的實(shí)施效果進(jìn)行了調(diào)查。Wigglesworth & Storch比較了課堂評(píng)估中小組合作寫作與個(gè)人寫作任務(wù),發(fā)現(xiàn)小組合作對(duì)寫作的準(zhǔn)確性有積極影響,而對(duì)文本的流暢度和復(fù)雜度的影響不明顯[12]。Huang對(duì)在聽力和口語(yǔ)課堂上兩種不同的評(píng)估事件——離散評(píng)估(divergent assessment,即以開放性問(wèn)題探索學(xué)生理解和能做什么)和聚合評(píng)估(convergent assessment,即以封閉式問(wèn)題考察學(xué)生是否能做到某一任務(wù))對(duì)學(xué)生在完成任務(wù)過(guò)程中的學(xué)習(xí)動(dòng)機(jī)和策略的影響進(jìn)行了調(diào)查[13]。Muoz &lvarez報(bào)道了如何通過(guò)推進(jìn)一些具體的評(píng)估原則,如選擇和使用真實(shí)和有意義的評(píng)估任務(wù)、對(duì)教師進(jìn)行持續(xù)的指導(dǎo)和支持等,使大學(xué)口語(yǔ)課堂評(píng)估系統(tǒng)產(chǎn)生積極的反撥效應(yīng)[14]。該研究成果對(duì)如何提高課堂評(píng)估的質(zhì)量有一定的應(yīng)用價(jià)值。
2.教師角色
教師角色研究不僅包括教師的評(píng)估實(shí)踐,也包括教師的知識(shí)、信念和影響教師評(píng)估行為的因素等。國(guó)外學(xué)者對(duì)課堂評(píng)估中的教師角色給予了較為充分的關(guān)注。在教師的評(píng)估實(shí)踐方面,Cheng & Wang通過(guò)對(duì)74名加拿大、中國(guó)大陸和香港的大學(xué)外語(yǔ)教師進(jìn)行訪談,梳理了教師在評(píng)分、反饋和分?jǐn)?shù)報(bào)道方面的評(píng)估實(shí)踐[15]。作者發(fā)現(xiàn)盡管教師評(píng)估呈現(xiàn)出地區(qū)差異,整體上教師的評(píng)估行為符合專業(yè)文獻(xiàn)中優(yōu)秀實(shí)踐的標(biāo)準(zhǔn)。Saito & Inoi調(diào)查了日本初高中英語(yǔ)教師在課堂形成性評(píng)估使用上的差異,包括評(píng)估標(biāo)準(zhǔn)、方法、目的和反饋[16]。針對(duì)教師的決策信念和其影響因素,Yin對(duì)香港兩所大學(xué)學(xué)術(shù)英語(yǔ)課上教師評(píng)估的認(rèn)知過(guò)程進(jìn)行了研究,發(fā)現(xiàn)教師評(píng)估涉及不同方面的認(rèn)知因素,包括策略認(rèn)知和互動(dòng)認(rèn)知等[17]。Cheng & Sun對(duì)影響中國(guó)中學(xué)英語(yǔ)教師課堂評(píng)估評(píng)分決策的因素進(jìn)行了調(diào)查,發(fā)現(xiàn)內(nèi)外部因素共同影響教師的評(píng)分決策,并且教師更看重非成就因素(non-achievement factors),如學(xué)生的努力程度、作業(yè)和學(xué)習(xí)習(xí)慣等[18]。
國(guó)內(nèi)從教師角度研究課堂評(píng)估的文獻(xiàn)相對(duì)較少。許悅婷、劉永燦采用敘事研究的方法解讀了一名大學(xué)英語(yǔ)教師的三個(gè)形成性評(píng)估實(shí)踐的故事,并指出教師的形成性評(píng)估知識(shí)是在其個(gè)人經(jīng)歷、所處的社會(huì)關(guān)系和工作生活場(chǎng)所三者的共同作用下產(chǎn)生和發(fā)展的[19]。劉秀梅等對(duì)大學(xué)英語(yǔ)教師在課堂評(píng)估的典型情景中對(duì)道德問(wèn)題的認(rèn)知水平進(jìn)行了調(diào)查[20]。研究發(fā)現(xiàn)教師對(duì)道德問(wèn)題的整體認(rèn)知水平不理想,并在測(cè)試保密性、成績(jī)?cè)u(píng)定和測(cè)試實(shí)施三個(gè)維度上有較大提升空間。該研究探究了課堂評(píng)估中教師的道德維度和課堂評(píng)估的公平正義性,具有一定的開創(chuàng)意義。
3.效度驗(yàn)證
效度是語(yǔ)言測(cè)試的核心概念,而課堂評(píng)估的效度一直是爭(zhēng)議的焦點(diǎn)和急需攻克的理論高地。李清華、曾用強(qiáng)[21]對(duì)課堂評(píng)估的效度理論進(jìn)行了較為全面的回顧,比較了Brookhart的“課堂計(jì)量學(xué)理論”[22]等四種效度理論。然而,目前國(guó)內(nèi)尚未有實(shí)證研究將這些效度理論應(yīng)用到課堂評(píng)估體系的效度驗(yàn)證中。在實(shí)證研究方面,許悅婷、張仁霞調(diào)查了小組活動(dòng)中評(píng)價(jià)個(gè)人貢獻(xiàn)的必要性和可行性[23]。通過(guò)對(duì)個(gè)人分?jǐn)?shù)和小組統(tǒng)一分?jǐn)?shù)差異的分析和對(duì)師生看法的解讀,研究者發(fā)現(xiàn)個(gè)人分?jǐn)?shù)有利于提高課堂評(píng)估的信效度和公平性。
國(guó)外文獻(xiàn)中,Llosa用多質(zhì)多法模型證明了美國(guó)加州城市學(xué)校中使用的課堂評(píng)估系統(tǒng)與外部標(biāo)準(zhǔn)化大規(guī)??荚嚒又萦⒄Z(yǔ)能力標(biāo)準(zhǔn)測(cè)試測(cè)量了相同的構(gòu)念[6]489-515。因此,作者提出將標(biāo)準(zhǔn)化課堂評(píng)估用作判斷學(xué)生能否進(jìn)入新的學(xué)習(xí)階段的高風(fēng)險(xiǎn)決策具有一定的效度。Llosa進(jìn)一步調(diào)查發(fā)現(xiàn)該課堂評(píng)估體系對(duì)不同年級(jí)的學(xué)生也測(cè)量了相同的構(gòu)念[24]。盡管多數(shù)關(guān)注課堂評(píng)估微觀層面的定性研究發(fā)現(xiàn)教師評(píng)分決策存在很大差異,上述研究則表明宏觀層面上教師對(duì)學(xué)生整體語(yǔ)言能力的評(píng)價(jià)是可靠和穩(wěn)定的。針對(duì)效度驗(yàn)證的框架,Zainal[25]和Becker[26]分別利用社會(huì)認(rèn)知效度驗(yàn)證框架(a socio-cognitive framework)和基于論證(an argument-based approach)的效度驗(yàn)證模式對(duì)課堂寫作評(píng)估進(jìn)行了效度檢驗(yàn)。這些研究為指導(dǎo)教師利用現(xiàn)有的效度驗(yàn)證框架搜集課堂評(píng)估的效度信息,從而提高評(píng)估質(zhì)量提供了可行方案。
4.評(píng)估過(guò)程
課堂評(píng)估既包括課堂測(cè)試等設(shè)計(jì)好的評(píng)估任務(wù),也包括偶然的評(píng)估事件,如教師自發(fā)的、本能的課堂觀察和師生的互動(dòng)對(duì)話[27]。與上文從教師角度回顧其評(píng)估行為不同,課堂評(píng)估過(guò)程研究旨在捕捉自然課堂上更豐富和生動(dòng)的實(shí)時(shí)評(píng)估行為并關(guān)注師生間的互動(dòng)。楊華、文秋芳對(duì)課堂即時(shí)形成性評(píng)估,即發(fā)生在教學(xué)過(guò)程中、以師生間對(duì)話形式出現(xiàn)的評(píng)估方式的相關(guān)研究進(jìn)行了述評(píng)[28]。在此之前,鮮有國(guó)內(nèi)學(xué)者關(guān)注這種短期的課堂形成性評(píng)估模式。楊華、文秋芳基于我國(guó)高校6名英語(yǔ)教師28課時(shí)自然狀態(tài)下的課堂數(shù)據(jù),采用扎根理論和課堂話語(yǔ)分析的方法,對(duì)評(píng)估目標(biāo)的不同類型和變化方式進(jìn)行了概念化描述,并提出了課堂即時(shí)形成性評(píng)估“相倚性”的概念[29-30],深化了課堂評(píng)估的理論。
在國(guó)外文獻(xiàn)中,Hill & McNamara基于對(duì)澳大利亞學(xué)校里印度尼西亞語(yǔ)課堂上評(píng)估過(guò)程的實(shí)證研究,提出了一個(gè)完整的課堂評(píng)估過(guò)程研究的框架[31]395-420。該框架包括三個(gè)維度(證據(jù)、理解和使用)和四個(gè)領(lǐng)域(教師如何評(píng)價(jià)學(xué)生、運(yùn)用哪些評(píng)分標(biāo)準(zhǔn)、基于何種理論或價(jià)值觀以及學(xué)生對(duì)評(píng)價(jià)行為的理解和看法)。該框架為系統(tǒng)、科學(xué)地研究課堂評(píng)估的過(guò)程提供了有力工具。Wang報(bào)道了一名大學(xué)英語(yǔ)教師的口語(yǔ)課堂評(píng)估過(guò)程[32]。研究發(fā)現(xiàn)教師在課堂上的評(píng)估方式不僅包括教師預(yù)先準(zhǔn)備的演講任務(wù)、期末考試等,還包括教師自己沒(méi)有察覺(jué)的評(píng)估行為,如問(wèn)答環(huán)節(jié)等。
5.其他研究
其他方面的研究包括反饋和教育政策等。反饋的概念與課堂評(píng)估密不可分。姚香泓等針對(duì)形成性反饋在課堂展示準(zhǔn)備階段所起的效果進(jìn)行了研究[33]。Chong總結(jié)了課堂評(píng)估的三種范式——學(xué)習(xí)評(píng)估(assessment of learning)、促學(xué)評(píng)估(assessment for learning)和以學(xué)為評(píng)(assessment as learning),并以此為框架對(duì)寫作反饋的研究進(jìn)行了綜述[34]。在教育政策和改革方面,Leung & Rea-Dickins報(bào)道了英國(guó)將課堂評(píng)估作為教育政策實(shí)施工具的使用現(xiàn)狀和影響,并指出教育政策對(duì)評(píng)估實(shí)踐中遇到的問(wèn)題關(guān)注甚少而且對(duì)教師的支持非常有限[35]。同樣,McKay & Brindley回顧了課堂評(píng)估在近年來(lái)澳大利亞教學(xué)改革中逐漸變化的角色,并指出來(lái)自外部的、基于目標(biāo)的管理主義(managerialism)與主觀的、基于經(jīng)驗(yàn)的教師決策之間的矛盾[36]。
根據(jù)文秋芳、任慶梅的分類[37],本文將所獲文獻(xiàn)的研究方法分為實(shí)證研究與非實(shí)證研究,即文章提供了研究對(duì)象和工具、數(shù)據(jù)收集和分析等相關(guān)信息為實(shí)證研究,否則為非實(shí)證研究。表3顯示,國(guó)內(nèi)外外語(yǔ)課堂評(píng)估研究均主要采用實(shí)證研究的方法,實(shí)證研究共56篇(國(guó)內(nèi)25篇,國(guó)外31篇),占文獻(xiàn)總數(shù)的70.9%。在實(shí)證研究中,國(guó)內(nèi)研究以定量和定性相結(jié)合的混合法為主(13篇,占國(guó)內(nèi)實(shí)證研究的52%)。國(guó)外研究則偏重定性法(17篇,占國(guó)外實(shí)證研究的54.8%)。具體而言,定量研究主要包括準(zhǔn)實(shí)驗(yàn)法、探索性和驗(yàn)證性因子分析、相關(guān)和方差分析等。定性研究主要采用民族志研究、行動(dòng)研究、個(gè)案研究、課堂觀察和訪談等方式。定量和定性混合法則主要采用定量研究為主(如準(zhǔn)實(shí)驗(yàn)法),定性研究為輔(如訪談)的方法??傮w而言,國(guó)內(nèi)外外語(yǔ)課堂評(píng)估研究的方法呈現(xiàn)出多元化的趨勢(shì)。
表3 2007—2018年外語(yǔ)課堂評(píng)估研究方法分布
上述文獻(xiàn)回顧表明,近年來(lái)國(guó)內(nèi)外學(xué)者對(duì)外語(yǔ)課堂評(píng)估進(jìn)行了不少的研究和探索,既取得了一定的成果,也存在一些局限和不足。下文將分別從術(shù)語(yǔ)界定、研究對(duì)象、研究?jī)?nèi)容、研究方法和理論構(gòu)建五個(gè)方面說(shuō)明現(xiàn)有研究存在的問(wèn)題和對(duì)策。
對(duì)外語(yǔ)課堂評(píng)估文獻(xiàn)的回顧顯示國(guó)內(nèi)外相關(guān)研究都存在著術(shù)語(yǔ)界定不清、使用混亂的情況,這在國(guó)內(nèi)研究中尤其明顯。在本文回顧的中文文獻(xiàn)中,出現(xiàn)過(guò)的相關(guān)術(shù)語(yǔ)有課堂評(píng)估、形成性評(píng)估、新型評(píng)價(jià)等。形成性評(píng)估是國(guó)內(nèi)期刊中最常用的概念。然而,隨著對(duì)形成性評(píng)估的關(guān)注,對(duì)其概念的誤解也隨之增長(zhǎng)[38],例如認(rèn)為形成性評(píng)估就是平時(shí)成績(jī)或是終結(jié)性評(píng)估的累積。Harlen指出形成性和終結(jié)性概念的區(qū)別在于考試的使用和目的[39]171-183。評(píng)估任務(wù)本身是中性的,只有在使用其數(shù)據(jù)時(shí)才決定它的形成性或終結(jié)性潛能[40]505-520。終結(jié)性評(píng)估是對(duì)學(xué)習(xí)成果進(jìn)行鑒定以完成報(bào)道、認(rèn)證等目的,而形成性評(píng)估是為調(diào)整教和學(xué)提供持續(xù)的反饋信息。從這種意義上講,課堂評(píng)估可以實(shí)現(xiàn)形成性和終結(jié)性兩種目的。課堂評(píng)估強(qiáng)調(diào)評(píng)估情境是自然狀態(tài)下的課堂,而形成性評(píng)估則強(qiáng)調(diào)評(píng)估的目的和用途。
因此,外語(yǔ)課堂評(píng)估研究首先要明確相關(guān)術(shù)語(yǔ)的定義,并對(duì)現(xiàn)有不同術(shù)語(yǔ)的側(cè)重點(diǎn)有所區(qū)分。對(duì)術(shù)語(yǔ)概念理解上的差異和不足,會(huì)導(dǎo)致理論研究難以形成合力,實(shí)踐推廣舉步維艱[8]1,也會(huì)使國(guó)內(nèi)課堂評(píng)估的研究難以與國(guó)際接軌。只有對(duì)課堂評(píng)估的概念進(jìn)行界定,抓住其典型特征,才能提高學(xué)界對(duì)課堂評(píng)估的重視。
國(guó)外課堂評(píng)估的研究涵蓋了處于不同教育階段的研究對(duì)象。這與近年來(lái)美國(guó)、英國(guó)等國(guó)家在基礎(chǔ)教育政策和改革中強(qiáng)調(diào)課堂評(píng)估的研究和實(shí)踐密切相關(guān)。相比之下,國(guó)內(nèi)的研究對(duì)象范圍狹窄,對(duì)中小學(xué)階段鮮有涉及。然而,由于小學(xué)生特殊的心理特征和認(rèn)知水平,其語(yǔ)言能力的發(fā)展更多地受到教師的影響[41],師生的課堂互動(dòng)也更加頻繁。鑒于基礎(chǔ)教育的重要性,以促學(xué)為目的、重視學(xué)習(xí)過(guò)程的課堂評(píng)估可以從小培養(yǎng)和塑造學(xué)生的自主學(xué)習(xí)能力并影響學(xué)生的學(xué)習(xí)動(dòng)機(jī),從而在一定程度上扭轉(zhuǎn)應(yīng)試教育的負(fù)面作用。
因此,未來(lái)國(guó)內(nèi)研究應(yīng)擴(kuò)大研究對(duì)象的范圍,特別應(yīng)關(guān)注中小學(xué)階段。一方面,加強(qiáng)大學(xué)教師和研究人員與中小學(xué)師生間的合作;另一方面,在政策上支持和鼓勵(lì)中小學(xué)教師開展課堂評(píng)估的行動(dòng)研究,從而促進(jìn)中小學(xué)課堂評(píng)估的研究與實(shí)踐。
國(guó)內(nèi)外學(xué)者對(duì)課堂評(píng)估的過(guò)程——自然課堂中師生共建的評(píng)估行為的關(guān)注明顯不足?,F(xiàn)有研究多報(bào)道教師精心設(shè)計(jì)的、明確的評(píng)估事件,而對(duì)非計(jì)劃型的評(píng)估行為關(guān)注較少。這些評(píng)估機(jī)會(huì)由于與教學(xué)行為交織,較難辨認(rèn)和區(qū)分。但是,對(duì)這些評(píng)估行為的界定和分析可以加深對(duì)課堂評(píng)估的構(gòu)念和本質(zhì)的理解。Leung[42]869-888和Rea-Dickins[43]分別從教師和學(xué)生角度探討了評(píng)估過(guò)程研究中值得進(jìn)一步調(diào)查的問(wèn)題,而Hill & McNamara在此基礎(chǔ)上提出了更為全面的研究框架[31]395-420。這些框架可以指導(dǎo)未來(lái)課堂評(píng)估過(guò)程研究的展開。由于課堂評(píng)估的情境特定性(context-specific),了解不同國(guó)家和地區(qū)、不同教學(xué)環(huán)境下的評(píng)估行為極其重要。
此外,近年來(lái)教師發(fā)展,特別是教師測(cè)評(píng)素養(yǎng)越來(lái)越受到國(guó)外學(xué)者的重視。然而,國(guó)內(nèi)文獻(xiàn)中將課堂評(píng)估與教師角色有機(jī)結(jié)合的研究堪稱鳳毛麟角。教師是課堂評(píng)估的實(shí)施者,厘清教師評(píng)估實(shí)踐和其影響因素是提高課堂評(píng)估質(zhì)量的必經(jīng)之路。在今后的研究中,國(guó)內(nèi)學(xué)者需關(guān)注教師在實(shí)踐中的主體性發(fā)展[44],重視在國(guó)內(nèi)特定教學(xué)環(huán)境下外語(yǔ)教師的評(píng)估實(shí)踐和評(píng)估素養(yǎng)。
文獻(xiàn)回顧表明在我國(guó)外語(yǔ)課堂評(píng)估研究中,定量和定性相結(jié)合的研究方法已經(jīng)成為了主流。這類研究大多以定量研究為主(通過(guò)實(shí)驗(yàn)班、控制班成績(jī)對(duì)比來(lái)考察學(xué)生學(xué)習(xí)成果的差異),定性研究為輔(通過(guò)訪談?wù){(diào)查師生的態(tài)度)。這一研究方法在設(shè)計(jì)上存在一定缺陷:課堂評(píng)估存在于教、學(xué)、評(píng)相互作用的復(fù)雜的課堂環(huán)境中,學(xué)生的學(xué)習(xí)同時(shí)受到多種因素的影響——教師的教學(xué)經(jīng)驗(yàn)和風(fēng)格、學(xué)生的學(xué)習(xí)特點(diǎn)以及教學(xué)環(huán)境等。因此,學(xué)生學(xué)習(xí)成績(jī)等的提高能否完全歸結(jié)于課堂評(píng)估的實(shí)施有待商榷。同時(shí),國(guó)內(nèi)研究在報(bào)道評(píng)估體系的可行性和有效性時(shí),對(duì)評(píng)估工具和實(shí)施過(guò)程卻少有著墨。不同的課堂評(píng)估事件、實(shí)施方式和反饋都會(huì)對(duì)學(xué)生產(chǎn)生不同的作用,而這些差異在很大程度上決定了課堂評(píng)估的促學(xué)效果。此外,無(wú)論是學(xué)習(xí)成績(jī)、學(xué)習(xí)策略,還是成就感等方面的提高都是一個(gè)循序漸進(jìn)的過(guò)程?,F(xiàn)有研究往往在一學(xué)期后就對(duì)學(xué)生的成績(jī)等進(jìn)行對(duì)比,其證據(jù)的充足性值得思考。
針對(duì)以上問(wèn)題,未來(lái)我國(guó)相關(guān)研究應(yīng)重視定性法,充分發(fā)揮質(zhì)性研究對(duì)情境性因果關(guān)系的解釋功能[45]。同時(shí),課堂評(píng)估的有效性可以進(jìn)行歷時(shí)研究,并借鑒國(guó)外研究的角度,關(guān)注不同的評(píng)估任務(wù)和原則的影響。課堂評(píng)估體系本身不能保證對(duì)教與學(xué)的積極反撥效應(yīng),需要探索評(píng)估體系中哪些具體的原則和做法可以提高課堂評(píng)估的促學(xué)作用。
與大規(guī)模、標(biāo)準(zhǔn)化考試相比,課堂評(píng)估的研究仍缺乏完整、系統(tǒng)的理論根基。目前國(guó)內(nèi)外學(xué)者對(duì)課堂評(píng)估的促學(xué)效果、教師角色、評(píng)估過(guò)程和效度驗(yàn)證等均有所討論,但尚未形成廣為接受的理論模式和研究體系。以課堂評(píng)估的效度為例,一些測(cè)試專家指出課堂評(píng)估等替代性評(píng)估方式(alternative assessment)的信效度存在種種問(wèn)題,如評(píng)估任務(wù)能否使學(xué)生產(chǎn)出特定的語(yǔ)言信息往往沒(méi)有經(jīng)過(guò)驗(yàn)證,評(píng)分標(biāo)準(zhǔn)的科學(xué)合理性和評(píng)分員評(píng)分的一致性有待考察等[46]。另一些測(cè)試專家則主張傳統(tǒng)心理測(cè)量學(xué)的信度和效度概念不適用于課堂評(píng)估[40]505-520[42]869-888。例如,環(huán)境(context)在傳統(tǒng)考試中是必須被控制的構(gòu)念無(wú)關(guān)因素,評(píng)分員也應(yīng)在考試過(guò)程中保持中立[47]。而在課堂評(píng)估中,其信效度則部分源自于評(píng)估行為存在于日常教學(xué)環(huán)境中,評(píng)分員則是熟悉學(xué)生并在學(xué)生學(xué)習(xí)過(guò)程中扮演重要角色的教師[3]409。在這種情況下,如何重新定義課堂評(píng)估的構(gòu)念和信效度?現(xiàn)有的效度驗(yàn)證方法是否完全適用于課堂評(píng)估?這些問(wèn)題仍亟待解決。
因此,外語(yǔ)課堂評(píng)估研究一方面需要對(duì)現(xiàn)有研究進(jìn)行回顧和總結(jié),從實(shí)踐中提煉理論,以形成系統(tǒng)的研究體系;另一方面,課堂評(píng)估研究更需要進(jìn)行理論的創(chuàng)新。只有發(fā)展一套符合課堂評(píng)估內(nèi)在規(guī)律和特色的評(píng)估理論,才能引導(dǎo)研究方向,最終提高課堂評(píng)估的促學(xué)作用。
本文對(duì)2007—2018年CSSCI和SSCI代表期刊上的外語(yǔ)課堂評(píng)估論文進(jìn)行了定量統(tǒng)計(jì)和內(nèi)容分析。研究結(jié)果顯示:研究數(shù)量呈波動(dòng)式發(fā)展趨勢(shì),國(guó)外文獻(xiàn)數(shù)量高于國(guó)內(nèi);國(guó)內(nèi)研究對(duì)象集中在本科階段,國(guó)外則涵蓋大、中、小學(xué)階段;國(guó)內(nèi)外研究?jī)?nèi)容主要包括課堂評(píng)估的促學(xué)效果、教師角色、效度驗(yàn)證和評(píng)估過(guò)程等;國(guó)內(nèi)外研究方法均以實(shí)證研究為主,混合法是國(guó)內(nèi)研究的主流方法,而國(guó)外則偏重定性法。
上述結(jié)果表明,國(guó)內(nèi)外外語(yǔ)課堂評(píng)估研究既有共性又有差異。未來(lái)我國(guó)外語(yǔ)課堂評(píng)估研究應(yīng)擴(kuò)大研究對(duì)象的范圍,關(guān)注中小學(xué)課堂;拓寬研究?jī)?nèi)容,探索課堂評(píng)估的過(guò)程和教師角色;重視質(zhì)性研究,推動(dòng)多元化的研究方法。在今后的研究中,一方面應(yīng)立足于我國(guó)國(guó)情,尋求符合我國(guó)外語(yǔ)教學(xué)環(huán)境的課堂評(píng)估實(shí)踐和研究;另一方面,借鑒國(guó)外先進(jìn)的研究方法和視角,力求本土化與全球化的有益結(jié)合。
東北師大學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版)2020年5期