鄭東輝 葉盛楠
中小學(xué)生每天都經(jīng)歷著課堂評(píng)價(jià),他們對(duì)課堂評(píng)價(jià)的感知與行為直接影響他們的學(xué)習(xí)生活。利用問(wèn)卷來(lái)了解學(xué)生關(guān)于課堂評(píng)價(jià)的真實(shí)感受和實(shí)際行動(dòng),把握課堂評(píng)價(jià)的現(xiàn)實(shí)狀況,采取適切的改善或優(yōu)化策略,發(fā)揮評(píng)價(jià)的育人功能,成為新時(shí)代學(xué)生評(píng)價(jià)改革的重要議題。為此,從學(xué)生視角出發(fā),按照問(wèn)卷編制的基本程序,開(kāi)發(fā)課堂評(píng)價(jià)行為問(wèn)卷,了解課堂評(píng)價(jià)行為的現(xiàn)實(shí)狀況,為挖掘?qū)W生評(píng)價(jià)改革所需要的數(shù)據(jù)提供研究工具和分析視角。
美國(guó)學(xué)者杰克遜(P. W. Jackson)在《課堂生活》一書(shū)中這樣描述課堂評(píng)價(jià):“課堂評(píng)價(jià)明顯來(lái)源于教師。他要不停地對(duì)學(xué)生的作業(yè)和行為做出判斷,然后把自己的判斷告訴學(xué)生和其他人?!?教師不是唯一傳遞判斷的人。同學(xué)們也經(jīng)常參與到評(píng)價(jià)這件事情上來(lái)?!淌依镞€有第三個(gè)評(píng)價(jià)來(lái)源,比教師和學(xué)生的正面評(píng)價(jià)、負(fù)面評(píng)價(jià)更加難以描述。這類(lèi)評(píng)價(jià)包含自我判斷,是在沒(méi)有任何外部評(píng)價(jià)干擾的情況下出現(xiàn)的?!盵1]盡管他以此強(qiáng)調(diào)課堂評(píng)價(jià)的復(fù)雜性、多樣性和隱秘性,但課堂評(píng)價(jià)的三類(lèi)行為主體是清晰的,即教師、學(xué)生同伴和自我。仔細(xì)考察當(dāng)下的日常課堂評(píng)價(jià)活動(dòng),也有類(lèi)似發(fā)現(xiàn),如教師對(duì)作業(yè)的講評(píng)、學(xué)生之間圍繞作業(yè)互評(píng)、學(xué)生針對(duì)作業(yè)結(jié)果的自我評(píng)價(jià)。近些年來(lái),有關(guān)課堂評(píng)價(jià)主體的學(xué)術(shù)討論也越來(lái)越傾向于師生多主體,如具有廣泛影響力的《課堂評(píng)價(jià)研究手冊(cè)》就將課堂評(píng)價(jià)視為“教師和學(xué)生收集、評(píng)估和使用學(xué)生學(xué)習(xí)的證據(jù),用于各種目的(諸如診斷學(xué)生的優(yōu)缺點(diǎn)、監(jiān)測(cè)學(xué)生達(dá)到所需熟練水平的進(jìn)展、向家長(zhǎng)提供反饋)的過(guò)程”[2]。問(wèn)題在于怎樣將他們各自發(fā)生的課堂評(píng)價(jià)行為分門(mén)別類(lèi),以指導(dǎo)問(wèn)卷題目的設(shè)計(jì)?;诓煌暯?會(huì)有不同的行為分類(lèi)與表現(xiàn)。有關(guān)課堂評(píng)價(jià)行為的研究視角卻很單一,大多是從教師視野看待課堂評(píng)價(jià)行為,由此考察教師及其引導(dǎo)下的課堂評(píng)價(jià)行為,即使將“學(xué)生參與”作為高質(zhì)量課堂評(píng)價(jià)要素的斯蒂金斯(R. Stiggins)也只是將學(xué)生納入教師的指導(dǎo)范疇:“讓學(xué)生參與評(píng)價(jià)”[3]。課堂評(píng)價(jià)作為一種日常的非正式評(píng)價(jià),不同于旨在測(cè)量學(xué)生學(xué)業(yè)水平的外部評(píng)價(jià),它關(guān)注學(xué)生的學(xué)習(xí),并助推學(xué)習(xí)發(fā)生積極的變化。是否發(fā)生了變化、發(fā)生了怎樣的變化,作為課堂評(píng)價(jià)實(shí)際感受者和行動(dòng)者的學(xué)生是最有發(fā)言權(quán)的。為此,本文嘗試從學(xué)生視角來(lái)解析課堂評(píng)價(jià)行為,把握各類(lèi)主體的行為表現(xiàn)及其水平,洞察服務(wù)學(xué)生高質(zhì)量學(xué)習(xí)所需要的行為改進(jìn)空間。所謂“學(xué)生視角”,就是學(xué)生對(duì)教師課堂評(píng)價(jià)的具身感知與體驗(yàn),以及對(duì)自我和同伴學(xué)習(xí)的評(píng)價(jià)行動(dòng)。
對(duì)于教師的課堂評(píng)價(jià)行為,主要從形式與方法兩個(gè)角度來(lái)解析。從實(shí)踐形式來(lái)看,“課堂評(píng)價(jià)包括了課堂問(wèn)答、課堂測(cè)驗(yàn)、課堂觀察、課后練習(xí)和作業(yè),以及與學(xué)生的談話等具體形式”[4]。有學(xué)者將此簡(jiǎn)化為“考試或測(cè)驗(yàn)、課堂作業(yè)或家庭作業(yè)、提問(wèn)、觀察”[5],也有進(jìn)一步豐富為“運(yùn)用選擇和簡(jiǎn)答任務(wù)評(píng)價(jià)、運(yùn)用擴(kuò)展反應(yīng)和表現(xiàn)性任務(wù)評(píng)價(jià)、觀察、評(píng)分、解釋與交流評(píng)價(jià)結(jié)果”[6]等形式。這些形式均以任務(wù)為載體開(kāi)展評(píng)價(jià)實(shí)踐,有些也包含某些方法的成分,如測(cè)驗(yàn)、表現(xiàn)性評(píng)價(jià)。從方法的角度,有歸為四類(lèi)的,“選擇性反應(yīng)評(píng)價(jià)、論述式評(píng)價(jià)、表現(xiàn)性評(píng)價(jià)、交流式評(píng)價(jià)”[7];也有歸為五類(lèi)的,分別是“課堂觀察、課堂測(cè)驗(yàn)、課堂師生對(duì)話、課堂問(wèn)卷調(diào)查以及課堂表現(xiàn)性評(píng)價(jià)”[8];還有六類(lèi)的,即“選擇反應(yīng)與簡(jiǎn)單的建構(gòu)反應(yīng)評(píng)價(jià)、論述評(píng)價(jià)、表現(xiàn)性評(píng)價(jià)、口頭提問(wèn)、教師觀察”[9]。這些方法不只是基于心理測(cè)量的測(cè)驗(yàn)類(lèi)方法,還包括基于表現(xiàn)建構(gòu)的新型評(píng)價(jià)方法,如表現(xiàn)性評(píng)價(jià)、交流式評(píng)價(jià)等。從學(xué)生可感知的角度來(lái)看,形式角度的分類(lèi)可能更合適,因?yàn)閷W(xué)生能夠直接體驗(yàn)到教師給予的評(píng)價(jià)任務(wù)。然而在這些形式中,也有學(xué)生無(wú)法知曉的,如教師的觀察,因?yàn)閷W(xué)生很難察覺(jué)教師是否在觀察自己,除非接受到某種評(píng)價(jià)任務(wù),但這又屬于觀察之后做出的其他形式的評(píng)價(jià)行為了。為此,以實(shí)踐形式為依據(jù),參考其中涉及的學(xué)生可感知的方法,將教師的課堂評(píng)價(jià)行為分成課堂提問(wèn)、課堂練習(xí)、課外作業(yè)、測(cè)驗(yàn)、表現(xiàn)性評(píng)價(jià)等五類(lèi)。其中,表現(xiàn)性評(píng)價(jià)作為新型方法的代表,已廣泛應(yīng)用于課堂教學(xué)。它是指在盡量合乎真實(shí)的情境中,運(yùn)用量規(guī)對(duì)學(xué)生建構(gòu)的答案或創(chuàng)作的作品進(jìn)行判斷、建議與改進(jìn),要求學(xué)生主動(dòng)建構(gòu)意義,而不是被動(dòng)地重復(fù)孤立的事實(shí)。具體來(lái)說(shuō),表現(xiàn)性評(píng)價(jià)是給學(xué)生一個(gè)復(fù)雜的學(xué)習(xí)任務(wù),協(xié)商形成評(píng)價(jià)任務(wù)表現(xiàn)的量規(guī),師生依據(jù)量規(guī)對(duì)任務(wù)表現(xiàn)進(jìn)行形成性評(píng)價(jià)。之所以要把課堂練習(xí)從作業(yè)中獨(dú)立出來(lái),是因?yàn)樗煌谙鄬?duì)正式的課外作業(yè),它的任務(wù)不太復(fù)雜,耗時(shí)短,需要師生即時(shí)性的互動(dòng)。另外,它在課堂上的運(yùn)用頻率比較高,也很容易被學(xué)生識(shí)別。
在自我評(píng)價(jià)活動(dòng)中,主體把自身作為評(píng)價(jià)對(duì)象,形成主客體之間的“自反性結(jié)構(gòu)”,發(fā)揮主體的能動(dòng)性,以揭示主體與作為客體的主體之間的價(jià)值關(guān)系的本質(zhì)和規(guī)律。[10]落實(shí)到學(xué)生學(xué)習(xí)上,就是學(xué)生對(duì)自我學(xué)習(xí)的一種自反性認(rèn)知,揭示學(xué)習(xí)對(duì)于自我成長(zhǎng)的意義。從寬泛意義上說(shuō),學(xué)習(xí)領(lǐng)域的自我評(píng)價(jià)是學(xué)生對(duì)自己學(xué)習(xí)和學(xué)習(xí)能力的描述與評(píng)估。[11]它不僅評(píng)估自己的學(xué)習(xí)工作,還包括學(xué)生為評(píng)估做出的各種努力,比如“主動(dòng)從各個(gè)來(lái)源收集關(guān)于他們工作質(zhì)量的反饋,以評(píng)估他們自己的表現(xiàn)”[12],為評(píng)估做好準(zhǔn)備與計(jì)劃。可以說(shuō)自我評(píng)價(jià)是“學(xué)生收集關(guān)于自己表現(xiàn)的信息,根據(jù)他們選定的標(biāo)準(zhǔn)來(lái)評(píng)估和反思學(xué)習(xí)過(guò)程和結(jié)果的質(zhì)量,進(jìn)而明確自己的長(zhǎng)處和短處”[13]。它不是一個(gè)線性過(guò)程,而是不斷循環(huán)的。學(xué)生先要明確評(píng)估自己表現(xiàn)的標(biāo)準(zhǔn),然后主動(dòng)尋求基于標(biāo)準(zhǔn)的各個(gè)方面(如教師、同伴、自我)的反饋,進(jìn)而根據(jù)這些反饋反思自己的學(xué)習(xí)表現(xiàn),明晰可改進(jìn)之處,最后調(diào)整自己的學(xué)習(xí)內(nèi)容與方向,進(jìn)一步優(yōu)化自己的學(xué)習(xí)目標(biāo)與計(jì)劃。也就是說(shuō),“評(píng)價(jià)過(guò)程中的自我判斷和自我監(jiān)控指向?qū)W生學(xué)習(xí)目標(biāo)改進(jìn),而學(xué)生學(xué)習(xí)目標(biāo)的改進(jìn)可以促進(jìn)學(xué)生自我判斷和自我監(jiān)控的發(fā)展”[14]。在這個(gè)循環(huán)過(guò)程中,學(xué)生需要回答“我現(xiàn)在在哪里”“我如何去那里”“下一步該去哪里”等問(wèn)題,也就是要經(jīng)歷“預(yù)先計(jì)劃、表現(xiàn)和控制、反思等階段”[15]。由此,與這三個(gè)階段相匹配的自我評(píng)價(jià)行為也變得清晰起來(lái),學(xué)生首先要對(duì)自己的學(xué)習(xí)進(jìn)行自我計(jì)劃,如明確自己的學(xué)習(xí)目標(biāo)和評(píng)價(jià)標(biāo)準(zhǔn)以及需要采取哪些行動(dòng)來(lái)達(dá)成目標(biāo)。其次,在實(shí)施過(guò)程中不斷反思自己的行動(dòng),如尋找來(lái)自內(nèi)外部的學(xué)習(xí)反饋、基于評(píng)價(jià)標(biāo)準(zhǔn)進(jìn)行自我判斷、審思自己的進(jìn)步與不足等。最后,基于反思結(jié)果及時(shí)調(diào)整學(xué)習(xí)計(jì)劃與行動(dòng)。以課后作業(yè)任務(wù)為例,學(xué)生首先“對(duì)作業(yè)應(yīng)達(dá)到什么目標(biāo)有清晰的認(rèn)識(shí)與規(guī)劃,然后能對(duì)作業(yè)質(zhì)量進(jìn)行判斷和改善”[16],最后能對(duì)作業(yè)的時(shí)間安排或錯(cuò)題進(jìn)行自我修正與調(diào)整。
在學(xué)習(xí)領(lǐng)域,同伴評(píng)價(jià)通常是指讓學(xué)生去評(píng)估跟他們地位相似的同伴的學(xué)習(xí)成果。[17]在早期,主要聚焦學(xué)習(xí)結(jié)果的同伴評(píng)價(jià),“將同伴評(píng)價(jià)看作一種成就或表現(xiàn)的評(píng)價(jià)形式,包括同伴提名或推薦(peer nomination)、同伴評(píng)定(peer rating)和同伴分等(peer ranking)三種方式”[18]。20世紀(jì)末以來(lái),學(xué)界越來(lái)越將同伴評(píng)價(jià)看作一種學(xué)生參與學(xué)習(xí)的方式,[19]不僅評(píng)價(jià)結(jié)果和過(guò)程,方式也不再局限于量化,而是更多地運(yùn)用質(zhì)性反饋。在長(zhǎng)期研究同伴評(píng)價(jià)的著名學(xué)者托平(K. J. Topping)看來(lái),同伴評(píng)價(jià)可以是定量的,即根據(jù)一個(gè)等級(jí)分配一個(gè)數(shù)字,也可以是定性的,即對(duì)積極和消極的方面以及改進(jìn)的可能性給予豐富的口頭反饋,或者兩者兼而有之。[20]通常而言,同伴評(píng)價(jià)是相互的,特別是質(zhì)性的反饋,存在相互學(xué)習(xí)的可能與機(jī)會(huì)。同伴評(píng)價(jià)還可以是學(xué)生之間相互鼓勵(lì),即同伴鼓勵(lì)。綜合起來(lái),同伴評(píng)價(jià)方式主要有三類(lèi):定量的同伴評(píng)定或分等、定性的同伴建議(口頭反饋)、質(zhì)量融合的同伴鼓勵(lì)。如果考察中小學(xué)生的日常同伴評(píng)價(jià)行為,就會(huì)發(fā)現(xiàn)這些評(píng)價(jià)方式是比較普遍的,而且也是學(xué)生日常行動(dòng)的表現(xiàn)形式。為此,我們將同伴評(píng)價(jià)行為區(qū)分為同伴評(píng)級(jí)、同伴建議、同伴鼓勵(lì)?!巴樵u(píng)級(jí)”是學(xué)生依據(jù)某個(gè)標(biāo)準(zhǔn)或答案,對(duì)同伴的學(xué)習(xí)表現(xiàn)做出量的判斷,如排名、評(píng)分、分等。“同伴建議”是學(xué)生為同伴的學(xué)習(xí)表現(xiàn)提供詳細(xì)的反饋,與同伴討論進(jìn)一步學(xué)習(xí)的各種可能,如基于評(píng)價(jià)量規(guī)的描述性反饋[21]。同伴鼓勵(lì)是同伴之間圍繞某項(xiàng)任務(wù)進(jìn)行相互鼓勵(lì)與學(xué)習(xí),源于學(xué)生之間的自發(fā)行為。
綜合上述分析,基本理清了學(xué)生視角下的課堂評(píng)價(jià)行為類(lèi)型。從上面的某些行為表征來(lái)看,這些行為類(lèi)型不是價(jià)值中立的,而是基于“促進(jìn)學(xué)習(xí)的評(píng)價(jià)”理念的一種指向育人的積極向善的評(píng)價(jià)。促進(jìn)學(xué)習(xí)的評(píng)價(jià)是“發(fā)現(xiàn)和解釋證據(jù)的過(guò)程,這些證據(jù)被學(xué)習(xí)者和教師用來(lái)決定學(xué)習(xí)者在哪個(gè)階段學(xué)習(xí)、需要達(dá)到什么目標(biāo)以及如何最有效地實(shí)現(xiàn)目標(biāo)”[22]。在這個(gè)過(guò)程中,評(píng)價(jià)不是對(duì)學(xué)習(xí)做出判斷,而是融入、支持、引發(fā)學(xué)習(xí),甚至成為一種學(xué)習(xí)過(guò)程,變成學(xué)生“實(shí)現(xiàn)自我監(jiān)控、自我糾正或調(diào)節(jié)的過(guò)程”[23]。評(píng)價(jià)不是目的,而是實(shí)現(xiàn)學(xué)習(xí)增值的工具,“讓學(xué)生在增強(qiáng)學(xué)習(xí)動(dòng)力、學(xué)會(huì)新的方法、達(dá)成學(xué)習(xí)目標(biāo)和實(shí)現(xiàn)有意義的學(xué)習(xí)等方面有所收獲”[24],最終指向?qū)W生的成人。
依據(jù)課堂評(píng)價(jià)行為框架,通過(guò)四個(gè)步驟收集數(shù)據(jù)和編寫(xiě)問(wèn)卷題項(xiàng)。一是學(xué)生開(kāi)放性訪談。本研究在寧波市選取小學(xué)、初中、高中各一所,訪談小學(xué)一年級(jí)至高中三年級(jí)60人(每個(gè)年級(jí)5人),收集有關(guān)教師的課堂評(píng)價(jià)、學(xué)生自我評(píng)價(jià)、學(xué)生同伴評(píng)價(jià)方面的自我陳述條目216條。通過(guò)對(duì)這些條目的編碼、歸類(lèi),提取出含義清晰且荷載單一的條目136條。
二是收集與課堂評(píng)價(jià)行為三個(gè)維度相關(guān)的問(wèn)卷,主要是“中小學(xué)教師課堂評(píng)價(jià)知識(shí)調(diào)查問(wèn)卷”[25]“學(xué)生自我評(píng)價(jià)實(shí)踐量表”(SaPS)[26]“同伴評(píng)價(jià)問(wèn)卷”(PAQ)[27],選取問(wèn)卷的相關(guān)題目,作為題目編寫(xiě)的原始素材。從這些問(wèn)卷中摘取出56條,其中教師的課堂評(píng)價(jià)行為26題、學(xué)生自我評(píng)價(jià)行為20題、學(xué)生同伴評(píng)價(jià)行為10題。
三是學(xué)生認(rèn)知訪談與調(diào)查。綜合第一、二階段兩方面結(jié)果,形成初步的課堂評(píng)價(jià)行為題目,邀請(qǐng)中小學(xué)教師和學(xué)生逐條討論,初步確定97道題目。為了檢測(cè)學(xué)生能否讀懂題目意思以及對(duì)題目的理解是否與設(shè)計(jì)者的理解一致,研究者訪談了15位小學(xué)生、18位初中生和11位高中生,并根據(jù)訪談結(jié)果刪減至69題。另外,訪談發(fā)現(xiàn)小學(xué)生有許多讀不懂的字詞句。為了進(jìn)一步確認(rèn)正式問(wèn)卷調(diào)查對(duì)象的起始年級(jí),研究者選擇寧波市江北區(qū)一所小學(xué),在一至六年級(jí)中各選擇一個(gè)班級(jí)進(jìn)行題目閱讀測(cè)試。通過(guò)測(cè)試,發(fā)現(xiàn)兩個(gè)問(wèn)題:一是讀不懂的地方主要集中在行為動(dòng)詞及其修飾詞上,如輔導(dǎo)、提煉、提醒、咨詢、挑戰(zhàn)性、針對(duì)性、憑直覺(jué)等。二是讀不懂地方的數(shù)量表現(xiàn)出明顯的年級(jí)差異,四年級(jí)是一個(gè)分界線,四年級(jí)及以上的學(xué)生讀不懂的地方顯著減少,諸如“評(píng)價(jià)標(biāo)準(zhǔn)”“表現(xiàn)行為”“情緒”之類(lèi)在四年級(jí)學(xué)生看來(lái)易懂的詞在低年級(jí)學(xué)生那里卻成了難懂的詞。為此,研究者將調(diào)查對(duì)象限定在小學(xué)四年級(jí)至高中三年級(jí),并對(duì)個(gè)別詞句進(jìn)行修改,刪除部分題目,形成59道題目。
四是征求專(zhuān)家意見(jiàn)。設(shè)計(jì)含有問(wèn)卷維度結(jié)構(gòu)與對(duì)應(yīng)題目的專(zhuān)家咨詢表,請(qǐng)五位專(zhuān)家(三位是研究課堂評(píng)價(jià)的大學(xué)教授,兩位是中小學(xué)正高級(jí)教師)對(duì)59道題目進(jìn)行內(nèi)容效度的檢測(cè),即對(duì)每個(gè)題目進(jìn)行三個(gè)等級(jí)(必不可少;有用,但不是必需;沒(méi)有必要)的評(píng)估。根據(jù)內(nèi)容效度比(the content validity ratios)[28]要求,只有三位及以上的專(zhuān)家認(rèn)為該題目是“必不可少”才能保留。結(jié)果顯示,8道題目沒(méi)有達(dá)到內(nèi)容效度比要求。
綜合上述,最終確定的初始問(wèn)卷由51道題目構(gòu)成,其中教師的課堂評(píng)價(jià)行為22題、學(xué)生自我評(píng)價(jià)行為20題、學(xué)生同伴評(píng)價(jià)行為9題。這些題目都是正向的表述,即反映了促進(jìn)學(xué)習(xí)的評(píng)價(jià)理念,使用李克特等級(jí)量表設(shè)置選項(xiàng),分別為“很不符合”“不太符合”“有些符合”“比較符合”和“非常符合”。
1. 預(yù)測(cè)的對(duì)象
為了考察問(wèn)卷的結(jié)構(gòu)和篩選項(xiàng)目,研究者在寧波市3所學(xué)校(小學(xué)、初中和高中各一所)進(jìn)行預(yù)測(cè)。以班級(jí)為單位,在3所學(xué)校的每個(gè)年級(jí)隨機(jī)整群抽取2個(gè)班級(jí)的學(xué)生作為預(yù)測(cè)樣本,共發(fā)放問(wèn)卷714份,有效收回678份。在有效問(wèn)卷中,小學(xué)四年級(jí)至高中三年級(jí)分別有85人、88人、63人、78人、63人、63人、83人、80人、75人,其中女生336人,男生342人。
2. 正式試測(cè)的對(duì)象
研究者在寧波市選擇普通小學(xué)、初中、高中各一所,以班級(jí)為單位,在3所學(xué)校的每個(gè)年級(jí)隨機(jī)整群抽取2個(gè)班級(jí)的學(xué)生作為試測(cè)樣本,共發(fā)放問(wèn)卷700份,有效收回652份。在有效問(wèn)卷中,小學(xué)四年級(jí)至高中三年級(jí)的人數(shù)分別為68人、59人、68人、79人、85人、76人、77人、70人、70人,其中女生303人,男生349人。
利用臨界比值法進(jìn)行項(xiàng)目分析。首先,計(jì)算問(wèn)卷總分并排序,以最高的27%和最低的27%作為高分組與低分組界限,對(duì)高、低兩組的各項(xiàng)目得分進(jìn)行獨(dú)立樣本t檢驗(yàn),其區(qū)分度均高于顯著性水平(p<0.001),無(wú)刪除項(xiàng)目。其次,計(jì)算每個(gè)項(xiàng)目與問(wèn)卷總分之間的相關(guān)系數(shù),結(jié)果顯示,項(xiàng)目13與總分的相關(guān)系數(shù)為0.385,相關(guān)度低,故刪去該項(xiàng)目,其他項(xiàng)目與總表相關(guān)程度在0.442—0.814,且均呈顯著性差異(p<0.01)。經(jīng)過(guò)項(xiàng)目分析,共剔除不合格項(xiàng)目1個(gè),保留項(xiàng)目50個(gè)。
首先,對(duì)問(wèn)卷進(jìn)行探索性因素分析的適當(dāng)性考察,得到KMO值為0.977, Bartlett球形檢驗(yàn)結(jié)果χ2=24503.754(p<0.001),表明該問(wèn)卷適合進(jìn)行探索性因素分析。
其次,通過(guò)主成分分析法進(jìn)行因素抽取得到初始負(fù)荷矩陣,特征值大于1的因素共有5個(gè),解釋總變異的60.280%。結(jié)合使用碎石檢驗(yàn)確定因子個(gè)數(shù),根據(jù)第一個(gè)碎石點(diǎn)開(kāi)始的陡峭程度,從第一個(gè)點(diǎn)到第二個(gè)點(diǎn)非常陡峭,第二個(gè)點(diǎn)到第三個(gè)點(diǎn)略有陡峭,第三個(gè)點(diǎn)之后基本趨于一致性平緩,即第3個(gè)因素以后的因素對(duì)解釋原始變量的貢獻(xiàn)較小,故選取三個(gè)因子更為合適。
隨后,采用指定因子法和最大方差旋轉(zhuǎn)再次進(jìn)行因子分析(見(jiàn)表1)。對(duì)分析結(jié)果進(jìn)行題項(xiàng)純化,純化的標(biāo)準(zhǔn)是刪除旋轉(zhuǎn)后因子負(fù)荷值小于0.4,或者同時(shí)在兩個(gè)及兩個(gè)以上因子上有載荷且載荷之間的差值小于0.1的項(xiàng)目。初始因子載荷矩陣經(jīng)過(guò)3次迭代后得到旋轉(zhuǎn)后因子載荷矩陣,結(jié)果符合分析框架與統(tǒng)計(jì)學(xué)要求,最終剔除項(xiàng)目共13個(gè)。對(duì)剩余37個(gè)項(xiàng)目再次進(jìn)行因素分析,發(fā)現(xiàn)3個(gè)因子的特征值均大于1,可解釋的方差累積貢獻(xiàn)率為58.890%,旋轉(zhuǎn)后的各項(xiàng)目負(fù)荷均在0.550以上,表明因子分析效果很好。
表1 課堂評(píng)價(jià)行為的因子負(fù)荷分析表
最后,根據(jù)課堂評(píng)價(jià)行為框架以及項(xiàng)目本身的內(nèi)涵,對(duì)個(gè)別項(xiàng)目的因子歸屬進(jìn)行了微調(diào),將項(xiàng)目29、項(xiàng)目51調(diào)整至因子三,并針對(duì)每個(gè)因子所包含的項(xiàng)目意義進(jìn)行命名。因子一:教師的課堂評(píng)價(jià)行為,有17個(gè)項(xiàng)目;因子二:學(xué)生自我評(píng)價(jià)行為,有12個(gè)項(xiàng)目;因子三:學(xué)生同伴評(píng)價(jià)行為,有8個(gè)項(xiàng)目。
使用正式試測(cè)的樣本數(shù)據(jù),對(duì)探索性因素分析后形成的37題初始問(wèn)卷進(jìn)行KMO和Bartlett球形檢驗(yàn),得到KMO值為0.971,Bartlett球形檢驗(yàn)結(jié)果χ2=15663.004(p<0.001),表明數(shù)據(jù)適合進(jìn)行驗(yàn)證性因素分析。利用AMOS20.0分析工具,運(yùn)用驗(yàn)證性因素分析方法(CFA)對(duì)問(wèn)卷結(jié)構(gòu)進(jìn)行擬合性檢驗(yàn)。
根據(jù)探索性因素分析結(jié)果,設(shè)定3因子為潛在變量,37個(gè)題項(xiàng)為觀察變量,e1—e37為誤差項(xiàng),采用最大似然法對(duì)結(jié)構(gòu)模型進(jìn)行驗(yàn)證擬合,在初步結(jié)果的基礎(chǔ)上,利用修正指標(biāo)(Modification Indices,簡(jiǎn)稱(chēng)MI)優(yōu)化擬合模型,在若干誤差項(xiàng)之間建立相關(guān)關(guān)系,最后得到各項(xiàng)擬合指數(shù)(見(jiàn)表2)。各項(xiàng)模型擬合指標(biāo)符合整體模型適配度檢驗(yàn)指標(biāo)。
表2 驗(yàn)證性因子分析中擬合指標(biāo)分析結(jié)果
通過(guò)進(jìn)一步的模型分析,各因素負(fù)荷在0.54~0.87之間,表明模型結(jié)構(gòu)設(shè)計(jì)合理,具有良好的構(gòu)想效度,驗(yàn)證了理論假設(shè)。具體見(jiàn)圖1。
圖1 問(wèn)卷驗(yàn)證性因素分析模型
經(jīng)過(guò)探索性與驗(yàn)證性因素分析,對(duì)總問(wèn)卷與各因子進(jìn)行Cronbach’s α信度和分半信度檢驗(yàn),結(jié)果顯示:總問(wèn)卷Cronbach’s α信度為0.961,分半信度為0.871,各因子的信度分布在0.839—0.947(見(jiàn)表3),表明該問(wèn)卷具有較高的內(nèi)部一致性及評(píng)估穩(wěn)定性。同時(shí),通過(guò)以上探索性因素分析與驗(yàn)證性因素分析,得到良好的擬合數(shù)據(jù),證明問(wèn)卷具有較為理想的內(nèi)部結(jié)構(gòu)效度。
表3 問(wèn)卷及其因子信度系數(shù)
本研究利用正式問(wèn)卷,在寧波市某縣進(jìn)行抽樣調(diào)查。以該縣39992名小學(xué)四年級(jí)至高中三年級(jí)學(xué)生為總體進(jìn)行分層整群抽樣,分層主要考慮學(xué)校所在地和學(xué)段,并兼顧學(xué)校水平,把所抽到的班級(jí)作為群?jiǎn)挝?。?duì)于所抽到的學(xué)校,所有班級(jí)的全體學(xué)生均參與問(wèn)卷調(diào)查。通過(guò)分層抽樣,最后隨機(jī)抽取了11所小學(xué)(4所城區(qū)、7所鄉(xiāng)鎮(zhèn))、8所初中(3所城區(qū)、5所鄉(xiāng)鎮(zhèn))、2所高中(1所城區(qū)、1所鄉(xiāng)鎮(zhèn))。本次調(diào)查向上述樣本地區(qū)發(fā)放18585份問(wèn)卷,回收問(wèn)卷18196份,剔除不合格問(wèn)卷后,獲得16758份有效問(wèn)卷,有效率為92.10%。具體樣本情況如下:男生8387名(占50%),女生8371名(占50%);四年級(jí)學(xué)生2472名(占14.8%),五年級(jí)學(xué)生2433名(占14.5%),六年級(jí)學(xué)生2426名(占14.5%),七年級(jí)學(xué)生2372名(占14.2%),八年級(jí)學(xué)生2365名(占14.1%),九年級(jí)學(xué)生1258名(占7.5%),高一學(xué)生1399名(占8.3%),高二學(xué)生1252名(占7.5%),高三學(xué)生781名(占4.7%);城區(qū)學(xué)生7730名(占46.1%),鄉(xiāng)鎮(zhèn)學(xué)生9028名(占53.9%)。調(diào)查于2022年5月完成,有效問(wèn)卷數(shù)據(jù)經(jīng)編碼后輸入電腦,運(yùn)用SPSS 22.0軟件統(tǒng)計(jì)處理。
以平均水平3作為檢驗(yàn)值進(jìn)行單樣本T檢驗(yàn),結(jié)果如表4所示,課堂評(píng)價(jià)的總體行為均分及其三因子均分全部顯著高于平均水平。其中,課堂評(píng)價(jià)的總體行為均分為3.84,超過(guò)3.50,接近“比較符合”的上限,達(dá)到“中等偏上”水平。學(xué)生能感知到的“教師的課堂評(píng)價(jià)行為”得分為4.00,明顯高于學(xué)生自我評(píng)價(jià)與同伴評(píng)價(jià),達(dá)到“高”的水平,學(xué)生同伴評(píng)價(jià)相對(duì)弱一些,但得分也超過(guò)3.50??梢钥闯?盡管存在一些內(nèi)部差異,課堂評(píng)價(jià)行為總體表現(xiàn)出比較積極的狀態(tài)。
表4 課堂評(píng)價(jià)行為的具體表現(xiàn)
進(jìn)一步對(duì)課堂評(píng)價(jià)行為三因子下屬的各項(xiàng)指標(biāo)進(jìn)行單樣本T檢驗(yàn),結(jié)果如表5所示,所有指標(biāo)均分全部顯著高于中等水平3。其中,教師課堂評(píng)價(jià)行為中的測(cè)驗(yàn)、課堂提問(wèn)得分達(dá)到“高”水平,學(xué)生同伴評(píng)價(jià)行為中的同伴評(píng)級(jí)、同伴建議得分相對(duì)偏低,屬于“中等偏下”水平,同伴鼓勵(lì)卻接近“高”水平??梢?jiàn),教師的課堂評(píng)價(jià)行為和學(xué)生同伴評(píng)價(jià)行為內(nèi)部還存在較大的差異。
表5 課堂評(píng)價(jià)行為各指標(biāo)的具體表現(xiàn)
1. 性別差異
分別以課堂評(píng)價(jià)總體行為及其內(nèi)部三因子的得分為因變量,性別為自變量,進(jìn)行獨(dú)立樣本T檢驗(yàn)(見(jiàn)表6),結(jié)果顯示:在課堂評(píng)價(jià)總體行為、教師的課堂評(píng)價(jià)行為和學(xué)生自我評(píng)價(jià)行為上,女生平均得分均高于男生,且存在顯著差異。總得來(lái)說(shuō),女生對(duì)課堂評(píng)價(jià)行為的感知以及自我評(píng)價(jià)行為強(qiáng)于男生。這可能與女生對(duì)課堂評(píng)價(jià)更投入,或者對(duì)課堂評(píng)價(jià)有著更為細(xì)膩的情感體驗(yàn)有關(guān)。
表6 課堂評(píng)價(jià)行為的性別差異
2. 學(xué)段差異
因變量同上,以學(xué)段為自變量作單因素方差分析,結(jié)果顯示:小學(xué)四年級(jí)至高中三年級(jí)在4個(gè)因變量上的得分均存在顯著差異,而且課堂評(píng)價(jià)行為得分隨年級(jí)升高而遞減(見(jiàn)圖2)。其中小學(xué)生與中學(xué)生的得分存在質(zhì)的差異,即小學(xué)生的課堂評(píng)價(jià)行為達(dá)到“高”的水平,而中學(xué)生處于“較高”水平。在有關(guān)“不同學(xué)段、年級(jí)學(xué)生對(duì)教師評(píng)價(jià)行為知覺(jué)”的研究中也有同樣的發(fā)現(xiàn),“小學(xué)生的知覺(jué)得分顯著高于初中生”[29]。由此看來(lái),年級(jí)越低,對(duì)課堂評(píng)價(jià)的敏感度和行動(dòng)力越強(qiáng)。但學(xué)生在自我評(píng)價(jià)能力上的表現(xiàn)與我們對(duì)“年齡越大自我評(píng)價(jià)水平越高”的傳統(tǒng)認(rèn)識(shí)不一致,這可能與年齡越大自我評(píng)價(jià)越理性或謹(jǐn)慎有關(guān)。
圖2 課堂評(píng)價(jià)行為的學(xué)段差異
3. 城鄉(xiāng)差異
因變量同上,以城鄉(xiāng)為自變量作獨(dú)立樣本T檢驗(yàn)(見(jiàn)表7),結(jié)果顯示:城區(qū)學(xué)生在4個(gè)因變量上的得分均高于鄉(xiāng)鎮(zhèn),且存在顯著差異。這可能與城區(qū)良好的教師資源有關(guān),城區(qū)的學(xué)生可能有更多的機(jī)會(huì)接觸和實(shí)施新型評(píng)價(jià)形式,而且能得到教師在評(píng)價(jià)上的指導(dǎo)。
表7 課堂評(píng)價(jià)行為的城鄉(xiāng)差異
4. 成績(jī)差異
因變量同上,以學(xué)生期末考試成績(jī)(將學(xué)生語(yǔ)文、數(shù)學(xué)、英語(yǔ)三科期末考試成績(jī)折算成Z分?jǐn)?shù),從高到低排序,前1/3為高分組,中間1/3為中等組,后1/3為低分組)為自變量作單因素方差分析。結(jié)果顯示:學(xué)生成績(jī)分?jǐn)?shù)越高,課堂評(píng)價(jià)行為各項(xiàng)得分就越高,且不同成績(jī)組之間呈現(xiàn)顯著性差異(如圖3所示)。這可能與成績(jī)較好的學(xué)生更會(huì)利用課堂評(píng)價(jià)來(lái)改善學(xué)習(xí)有關(guān),因?yàn)椤罢n堂中的形成性評(píng)價(jià)能提高學(xué)習(xí)成績(jī)”[30],而且有關(guān)影響學(xué)業(yè)成就的800多項(xiàng)元分析也發(fā)現(xiàn)“教學(xué)中的形成性評(píng)價(jià)對(duì)學(xué)業(yè)成就的效應(yīng)值高達(dá)0.90”[31]??梢哉f(shuō),學(xué)習(xí)成績(jī)與課堂評(píng)價(jià)互為促進(jìn)。
圖3 課堂評(píng)價(jià)行為的成績(jī)差異
對(duì)課堂評(píng)價(jià)總體行為及其內(nèi)部三因子進(jìn)行相關(guān)分析(見(jiàn)表8),結(jié)果顯示:課堂評(píng)價(jià)總體行為與教師的課堂評(píng)價(jià)行為的相關(guān)系數(shù)為0.890,與學(xué)生自我評(píng)價(jià)行為的相關(guān)系數(shù)為0.897,與學(xué)生同伴評(píng)價(jià)行為的相關(guān)系數(shù)是0.834,課堂評(píng)價(jià)三類(lèi)行為之間的相關(guān)系數(shù)均超過(guò)0.50,且均在0.01水平上呈顯著性差異。如此高的相關(guān)性,可以進(jìn)一步說(shuō)明課堂評(píng)價(jià)行為內(nèi)部結(jié)構(gòu)具有很好的擬合性。
表8 課堂評(píng)價(jià)總體行為各因子的相關(guān)關(guān)系
經(jīng)過(guò)規(guī)范而嚴(yán)格的編制過(guò)程,又通過(guò)大樣本調(diào)查的檢驗(yàn),最終形成的問(wèn)卷質(zhì)量得到了充分的保證。問(wèn)卷由37道題目構(gòu)成,以5點(diǎn)等級(jí)量表形式記分,從很不符合到非常符合,依次記1—5分,具體見(jiàn)表9。下面就該問(wèn)卷的適用性與調(diào)查結(jié)果對(duì)于研究與實(shí)踐的啟示作進(jìn)一步討論。
表9 正式問(wèn)卷結(jié)構(gòu)與題目
任何問(wèn)卷均有其適用性和局限,本問(wèn)卷也不例外。由于需要學(xué)生能對(duì)自我和同伴做出評(píng)價(jià),且能感知到和自我報(bào)告教師的課堂評(píng)價(jià)行為,故本課堂評(píng)價(jià)行為問(wèn)卷用于測(cè)評(píng)小學(xué)四年級(jí)至高三年級(jí)學(xué)生的課堂評(píng)價(jià)行為狀況,不適合用于小學(xué)低段和幼兒園學(xué)生。正因?yàn)樾枰獙W(xué)生感知和報(bào)告,某些學(xué)生無(wú)法接觸與體驗(yàn)到的教師課堂評(píng)價(jià)行為就不能納入問(wèn)卷題項(xiàng),如教師的觀察,教師對(duì)提問(wèn)、練習(xí)、作業(yè)、測(cè)驗(yàn)以及表現(xiàn)性評(píng)價(jià)上的設(shè)計(jì)行為,這使得課堂評(píng)價(jià)行為是不完全的。要想呈現(xiàn)課堂評(píng)價(jià)的全部行為,就需要開(kāi)發(fā)適用教師和學(xué)生的兩份問(wèn)卷,教師的課堂評(píng)價(jià)行為在教師問(wèn)卷那里更完整,學(xué)生的自我評(píng)價(jià)和同伴評(píng)價(jià)在學(xué)生問(wèn)卷那里更充分,這也是后續(xù)問(wèn)卷開(kāi)發(fā)的新方向??傊?基于學(xué)生視角的問(wèn)卷呈現(xiàn)了課堂評(píng)價(jià)行為的完整結(jié)構(gòu),消除了三類(lèi)行為需要分別開(kāi)發(fā)問(wèn)卷的困擾,還原了課堂評(píng)價(jià)的基本面貌,為教師反思與改進(jìn)自己的課堂評(píng)價(jià)行為提供參考,有利于整體洞察鮮活而真實(shí)的課堂評(píng)價(jià)狀況。
通過(guò)問(wèn)卷編制與調(diào)查,可以得出一個(gè)重要結(jié)論,即由三因子構(gòu)成的課堂評(píng)價(jià)是不可分割的整體。通過(guò)因素分析,發(fā)現(xiàn)教師、學(xué)生自我和同伴的評(píng)價(jià)行為之間有著非常好的擬合性,大樣本數(shù)據(jù)的相關(guān)分析也進(jìn)一步證實(shí)了這一點(diǎn)。也就是說(shuō),不能把課堂評(píng)價(jià)理解為三類(lèi)主體的行為組合,它們是互為支持的有機(jī)體,因?yàn)橐恍┳晕液屯樵u(píng)價(jià)行為往往源于教師的引導(dǎo)與提示,而學(xué)生作為主體的評(píng)價(jià)又會(huì)反哺教師的課堂評(píng)價(jià)。可以說(shuō),課堂評(píng)價(jià)不是單向度的教師對(duì)學(xué)生學(xué)習(xí)的評(píng)價(jià),而是多維立體的師生共同參與的學(xué)習(xí)評(píng)價(jià)。美國(guó)教育評(píng)估標(biāo)準(zhǔn)聯(lián)合委員會(huì)(Joint Committee on Standards for Educational Evaluation)于2015年發(fā)布的《課堂評(píng)價(jià)標(biāo)準(zhǔn)》就強(qiáng)調(diào)了教師的課堂評(píng)價(jià)以及鼓勵(lì)學(xué)生自我和同伴評(píng)價(jià)作為一個(gè)整體對(duì)于促進(jìn)學(xué)生學(xué)習(xí)的重要性。[32]國(guó)內(nèi)有關(guān)促進(jìn)學(xué)習(xí)的課堂評(píng)價(jià)研究也將“學(xué)生參與評(píng)價(jià)”作為課堂評(píng)價(jià)的重要策略進(jìn)行討論。[33]問(wèn)題在于人們對(duì)課堂評(píng)價(jià)的理解與實(shí)踐往往將三因子割裂開(kāi)來(lái)對(duì)待,強(qiáng)化教師的課堂評(píng)價(jià)行為,弱化學(xué)生作為主體的評(píng)價(jià),這在一定程度上削弱了課堂評(píng)價(jià)作為整體能夠發(fā)揮的“促學(xué)”“育人”功用。調(diào)查結(jié)果所顯示的學(xué)生自我評(píng)價(jià)與同伴評(píng)價(jià)水平顯著低于教師的課堂評(píng)價(jià)水平,就與上面的認(rèn)識(shí)與實(shí)踐有關(guān)。如何扭轉(zhuǎn)此種困局,凸顯課堂評(píng)價(jià)的“學(xué)生參與”[34]、“整合性學(xué)本評(píng)估”[35]、“學(xué)為中心”[36]、“對(duì)人的關(guān)懷”[37],就變得緊迫與重要起來(lái)。
調(diào)查結(jié)果顯示:課堂評(píng)價(jià)行為的整體水平處于“中等偏上”,內(nèi)部存在水平差異。學(xué)生的同伴評(píng)價(jià)水平最低,處于“中等”水平;學(xué)生的自我評(píng)價(jià)居中,處于“中等偏上”水平;教師的課堂評(píng)價(jià)最高,處于“高”水平。細(xì)究三個(gè)因子下屬各個(gè)指標(biāo),教師課堂評(píng)價(jià)的五個(gè)指標(biāo)內(nèi)部有較大差異,課堂提問(wèn)與測(cè)驗(yàn)顯著高于其他三種行為,學(xué)生同伴評(píng)價(jià)內(nèi)部也很不平衡,學(xué)生自發(fā)的同伴鼓勵(lì)顯著高于需要教師引導(dǎo)或指導(dǎo)的其他兩種行為。為什么會(huì)有這樣的差異?這可能與現(xiàn)實(shí)中教師過(guò)于關(guān)注自己的課堂評(píng)價(jià),沒(méi)有很好地引導(dǎo)或指導(dǎo),甚至忽視學(xué)生進(jìn)行自我評(píng)價(jià)和同伴評(píng)價(jià)有關(guān),畢竟學(xué)生發(fā)出的評(píng)價(jià)直接受教師的影響。此外,對(duì)于教師的課堂評(píng)價(jià)行為來(lái)說(shuō),不同于傳統(tǒng)評(píng)價(jià)方式的表現(xiàn)性評(píng)價(jià)行為得分相對(duì)較低,這說(shuō)明不只是教師的認(rèn)識(shí)問(wèn)題,還存在教師想改善卻不知道如何做的問(wèn)題。如“同伴評(píng)價(jià)需要對(duì)評(píng)價(jià)者和被評(píng)價(jià)者進(jìn)行必要的培訓(xùn),才能有實(shí)際效果”[38],教師卻不知道從何入手,只是讓學(xué)生根據(jù)教師的意見(jiàn)進(jìn)行簡(jiǎn)單的評(píng)價(jià)。為此,需要認(rèn)真思考如何有效提升教師課堂評(píng)價(jià)能力的問(wèn)題,特別是那些非傳統(tǒng)的、學(xué)生參與式的評(píng)價(jià)技能的培養(yǎng)與提升。當(dāng)然,提升不只是簡(jiǎn)單的培訓(xùn)式“補(bǔ)差”,而應(yīng)該是全面而系統(tǒng)的,并予以制度上的保障。[39]
從調(diào)查結(jié)果來(lái)看,課堂評(píng)價(jià)行為在性別、學(xué)段、城鄉(xiāng)和成績(jī)上存在顯著差異。這意味著課堂評(píng)價(jià)行為受學(xué)生某些特征的影響,需要在課堂評(píng)價(jià)實(shí)踐中因應(yīng)不同類(lèi)型的學(xué)生采取與之匹配的評(píng)價(jià)行為,并有針對(duì)性地優(yōu)化課堂評(píng)價(jià)行為,使這些影響發(fā)揮正向作用。這就告訴我們課堂評(píng)價(jià)不能對(duì)學(xué)生“一視同仁”,而要“區(qū)別對(duì)待”,要堅(jiān)持“評(píng)價(jià)的機(jī)會(huì)公平原則”[40]。同樣是課堂提問(wèn),不同性別、年級(jí)、學(xué)校、成績(jī)的學(xué)生的感知與要求不同,反饋方式與內(nèi)容也應(yīng)有所側(cè)重,“應(yīng)考慮適合學(xué)生的背景、以往經(jīng)驗(yàn)和學(xué)習(xí)經(jīng)驗(yàn)”[41],給予學(xué)生不同的參與評(píng)價(jià)的機(jī)會(huì)。特別是在引導(dǎo)學(xué)生自我評(píng)價(jià)和同伴評(píng)價(jià)方面,年齡越小的學(xué)生越需要教師指導(dǎo)他們客觀理性對(duì)待自己的學(xué)習(xí),因?yàn)椤靶W(xué)生從教師那里得到的反饋影響他們作為學(xué)習(xí)者的自我感知、他們?cè)趯W(xué)校取得成功的動(dòng)機(jī)以及他們完成復(fù)雜任務(wù)的愿望”[42]。如是,才能使課堂評(píng)價(jià)服務(wù)于每一個(gè)學(xué)生的高質(zhì)量學(xué)習(xí)和健康成長(zhǎng)。