韓綺琪,袁 靖
(浙江大學(xué)外國語言文化與國際交流學(xué)院,浙江杭州 310058)
近幾年,我國不斷加強(qiáng)高校的英語教學(xué)質(zhì)量,自《高等學(xué)校英語專業(yè)本科教學(xué)質(zhì)量國家標(biāo)準(zhǔn)》頒布后,我國開始形成“以評促教”“以評促學(xué)”的教學(xué)改革。大學(xué)生的自評作為一種形成性評價(jià),能夠有效提高學(xué)習(xí)者的學(xué)習(xí)動機(jī),增強(qiáng)其學(xué)習(xí)能動性。但大量研究表明,自評雖有促學(xué)的作用,但大多數(shù)學(xué)習(xí)者很難準(zhǔn)確評估自身的英語能力,在評估過程中難免有所偏差。因此,英語教學(xué)研究領(lǐng)域亟需尋求一種方法來推動大學(xué)生的英語有效自評,而在此之前,學(xué)界需要明確大學(xué)生目前進(jìn)行英語自評的現(xiàn)狀,并從根本上了解影響大學(xué)生自評的因素有哪些,從而為推動高校英語教學(xué)改革奠定基礎(chǔ)。
作為一種形成性評價(jià)方式,自評在學(xué)習(xí)者的學(xué)習(xí)過程中發(fā)揮著重要的作用。Hargreaves[1]認(rèn)為自評有助于培養(yǎng)學(xué)生的元認(rèn)知能力和批判性思維能力,幫助學(xué)習(xí)者發(fā)現(xiàn)以及了解自己學(xué)習(xí)中的長處與不足。同時(shí),Wolf[2]認(rèn)為自評能夠提高學(xué)習(xí)者自主學(xué)習(xí)的能力,幫助學(xué)習(xí)者設(shè)定學(xué)習(xí)目標(biāo),制定學(xué)習(xí)計(jì)劃以完成目標(biāo)。Little[3]認(rèn)為自評能夠提高學(xué)生的學(xué)習(xí)自主性,從而減少教師的負(fù)擔(dān)。教師每項(xiàng)作業(yè)都給予班上每位同學(xué)(大約40-50名學(xué)生)即時(shí)反饋是一項(xiàng)費(fèi)時(shí)費(fèi)力的工作。
鑒于自評在教學(xué)中的諸多優(yōu)點(diǎn),許多研究者對自評進(jìn)行了相關(guān)的研究。一類研究關(guān)注自評的信效度,通過研究自評與外部評價(jià)的相關(guān)性來判斷學(xué)習(xí)者能否準(zhǔn)確地對自己的能力做出評價(jià)。根據(jù)相關(guān)領(lǐng)域的最新研究,Ashton[4]發(fā)現(xiàn)自評與語言測試結(jié)果之間存在正相關(guān)。作為拓展,Liu和Brantmeier[5]發(fā)現(xiàn)學(xué)生自評與教師的評價(jià)呈現(xiàn)比較明顯的正相關(guān)。Ross[6]通過元分析發(fā)現(xiàn),聽力是學(xué)生自評最準(zhǔn)確的能力,閱讀則次之,而學(xué)生對寫作的自評最不準(zhǔn)確,并認(rèn)為在自評的準(zhǔn)確性方面,接受型技能比產(chǎn)出型技能的評價(jià)更準(zhǔn)確。另一類研究關(guān)注影響自評準(zhǔn)確性的因素,Wolf[2]的研究發(fā)現(xiàn)年齡、性別、自評訓(xùn)練和經(jīng)歷、二語能力、目標(biāo)語言對自評的準(zhǔn)確性均有影響;與低年級學(xué)生相比,高年級學(xué)生在自評方面表現(xiàn)得更好。同時(shí),Goral和Bailey[7]發(fā)現(xiàn),女生的自評與研究人員的評價(jià)更一致,此外他們還認(rèn)為二語能力以及目標(biāo)語言對自評都有影響。
以往大多數(shù)研究中的自評量表大多參考《歐洲語言共同參考框架》(CEFR)或由研究者自編,這些自評量表不一定適合中國英語學(xué)習(xí)者。Liu和Brantmeier[5]認(rèn)為評價(jià)應(yīng)適應(yīng)具體的教學(xué)環(huán)境和背景。Wolf[2]也認(rèn)為對特定群體的評價(jià)應(yīng)根據(jù)該群體的發(fā)展階段和背景進(jìn)行相關(guān)的調(diào)整?!吨袊⒄Z能力等級量表》(CSE,以下簡稱《量表》)于2018年頒布,《量表》將英語能力分為三個(gè)階段(初級、中級和高級)和九個(gè)等級。其中自評表包括組構(gòu)知識運(yùn)用能力、聽力理解能力、書面理解能力、口頭表達(dá)能力、書面表達(dá)能力、語用能力、口譯能力和筆譯能力八個(gè)方面,幫助學(xué)習(xí)者評價(jià)自身英語水平[8]。
總體而言,盡管以往的研究對影響自評結(jié)果的諸多因素進(jìn)行了探討,但很少有研究涉及到學(xué)習(xí)者自評與教師評價(jià)的相關(guān)性研究,同時(shí)由于缺少專業(yè)化的自評手段,許多學(xué)習(xí)者無法完成科學(xué)化的能力自評,這就造成自評結(jié)果的精準(zhǔn)度不高。為了彌補(bǔ)研究的不足,本文采用《量表》中的自評量表,研究英語學(xué)習(xí)者的自評和教師評價(jià)之間的關(guān)系并進(jìn)一步挖掘影響學(xué)習(xí)者自評的因素。
本研究擬解決以下問題:
(一)在校大學(xué)生英語水平、性別、性格特質(zhì)等因素如何影響其自評?
(二)在校大學(xué)生在不同子能力(聽、說、讀、寫)上的自評準(zhǔn)確性是否有差異?
該研究對象被試均來自浙江大學(xué)大學(xué)英語三級班的大學(xué)一年級學(xué)生,共85人,其中男生48人,女生37人。剔除不完整數(shù)據(jù),實(shí)際參與人數(shù)為80人(M=18.325,SD=0.59),其中男生46人,女生34人。一位具有20年教學(xué)經(jīng)驗(yàn)的老師參與了本實(shí)驗(yàn),她教授該85名學(xué)生一個(gè)學(xué)期(16周)的大英課程。80名學(xué)生英語期末考試成績?yōu)?6至91分(總分=100分,M=74.66分,SD=9.6分)。
1.自評問卷
本研究所用的自評問卷由基本信息以及《量表》中自評量表的5級描述語兩部分構(gòu)成?;拘畔▽W(xué)生姓名、專業(yè)、性別和聯(lián)系方式。CSE中級階段(4-6級)描述了中國大學(xué)英語學(xué)習(xí)者的狀況。由于該校被試學(xué)生英語水平處于中國大學(xué)英語學(xué)習(xí)者的中等偏上水平,因此采用的是CSE5級的自評量表。該量表包括18條描述語,涵蓋了聽力理解能力、書面理解理解、口頭表達(dá)能力和書面表達(dá)能力四個(gè)方面。在該問卷中,選項(xiàng)采用了李克特5級量表,“1”表示“完全不一致”,“5”表示“完全一致”。
2.艾森克人格問卷
為了研究學(xué)習(xí)者的個(gè)性特征對學(xué)生自評表現(xiàn)的影響,本研究采用倫敦大學(xué)心理系和精神病學(xué)研究所艾森克教授開發(fā)的艾森克人格問卷進(jìn)行收集。艾森克提出了人格的三維模型,在西方心理學(xué)界也被稱為“三大人格”,即外向型(E)、神經(jīng)質(zhì)(N)和精神質(zhì)(P),該問卷專門用來測量這三個(gè)維度的個(gè)體差異。EPQ是目前國際上廣泛使用的人格量表之一。
3.大學(xué)英語三級期末考試
在為期16周的課程結(jié)束后,被試將進(jìn)行大學(xué)英語三級期末考試,包括口試和書面兩部分??谠囋谡n程的最后一周(第16周)進(jìn)行。口試采用小組形式,每組包括4-5個(gè)學(xué)生,要求學(xué)生在抽取話題之后進(jìn)行自由討論,考官就每位學(xué)生表現(xiàn)進(jìn)行整體評分。書面考試包括聽力理解、閱讀理解、詞匯、復(fù)合式聽寫、完形填空、拼寫和寫作。由于詞匯、復(fù)合式聽寫、完形填空和拼寫都是從教科書中改編的,所以研究者剔除了該部分的分?jǐn)?shù)。
在本學(xué)期第15周時(shí),研究者在兩個(gè)班分發(fā)了自評問卷和艾森克人格問卷。研究者向?qū)W生詳細(xì)介紹了《量表》的基本信息和本研究的研究目的,解釋了問卷中選項(xiàng)含義。研究者向?qū)W習(xí)者表明所收集的數(shù)據(jù)僅供研究分析,與期末考試成績無關(guān),并保證對學(xué)生的數(shù)據(jù)保密。研究者也向教師發(fā)放了相同的評價(jià)問卷,分別對其所教授的85名學(xué)生的英語能力進(jìn)行評價(jià)。在大學(xué)英語三期末考試結(jié)束后,學(xué)習(xí)者的書面成績和口試成績一并收集。剔除不完整數(shù)據(jù),實(shí)際參與人數(shù)為80人,有效問卷回收率為94.1%。
本文采用描述性和推斷性統(tǒng)計(jì)方法進(jìn)行實(shí)驗(yàn)數(shù)據(jù)的處理。為了解決第一個(gè)研究問題,本研究使用Spearman相關(guān)分析來研究學(xué)生自評和教師評價(jià)之間的相關(guān)性。為了解決第二個(gè)研究問題,研究者根據(jù)期末考試分?jǐn)?shù)將學(xué)生英語能力分為高和低兩個(gè)等級。期末考試分?jǐn)?shù)前33%的學(xué)生為較高英語能力水平者,后33%為較低英語能力水平者。本研究使用散點(diǎn)圖來顯示英語能力和兩類評價(jià)相關(guān)性的關(guān)系。然后根據(jù)性別對學(xué)生進(jìn)行分組,并對每組師生評價(jià)相關(guān)性進(jìn)行方差分析。此外,通過偏相關(guān)分析,本研究分析了學(xué)生人格特質(zhì)與學(xué)生自評的關(guān)系。
考慮到學(xué)生之間的個(gè)體差異性,本研究需分別對80名被試學(xué)生的自評和教師對其的評價(jià)做相關(guān)性分析。以被試學(xué)生1為例,表1是學(xué)生1的自評和教師對其評價(jià)。本研究把學(xué)生1和其教師在量表上的18項(xiàng)問題各自做出的評價(jià)視作18次獨(dú)立試驗(yàn),從而計(jì)算學(xué)生1的自評與教師對其評價(jià)的相關(guān)性。因?yàn)?8項(xiàng)題目的選項(xiàng)是從1到5的有序等級變量,所以本研究采用Spearman相關(guān)系數(shù)來計(jì)算兩類評價(jià)的相關(guān)性,得到以下結(jié)論,學(xué)生1的自評與教師對其評價(jià)存在正相關(guān)關(guān)系(R=0.5873,p=0.0104)。
表1 學(xué)生1的自評與教師對其評價(jià)
本研究同時(shí)采用同樣的Spearman方法對每位學(xué)生做相關(guān)性分析,匯總其結(jié)果。為了更全面的刻畫全體學(xué)生其自評與教師評價(jià)的相關(guān)性情況,圖2為學(xué)生自評與教師評價(jià)相關(guān)性的分布,即80名學(xué)生自評與教師評價(jià)相關(guān)性的分布,大多數(shù)學(xué)生兩類評價(jià)的相關(guān)性在0.3-0.6之間。而在0.05置信水平下,80名學(xué)生中有21名學(xué)生的自評與教師評價(jià)存在顯著的正相關(guān)關(guān)系,占被試學(xué)生總體的26.25%。圖1表明,學(xué)生在準(zhǔn)確評價(jià)自己英語能力方面仍表現(xiàn)出很大的差異。
圖1 學(xué)生自評與教師評價(jià)相關(guān)性的分布
圖2 學(xué)生個(gè)體英語成績與兩類評價(jià)相關(guān)系數(shù)的散點(diǎn)圖
如圖1所示,多數(shù)學(xué)生自評與教師評價(jià)呈正相關(guān),但是學(xué)生自評和教師評價(jià)之間的相關(guān)性存在較大的個(gè)體差異。Wolf[2,P13]認(rèn)為,這種相關(guān)性的差異意味著學(xué)生在準(zhǔn)確評價(jià)自己英語能力方面存在較大差異,而學(xué)生對自評的熟悉程度、自尊等可能是造成這種差異的原因。
研究問題二回答了學(xué)生的英語能力、性別和人格特征如何影響學(xué)生自評和教師評價(jià)之間的相關(guān)性。
1.學(xué)生自評和教師評價(jià)的相關(guān)性與學(xué)生個(gè)體英語能力的關(guān)系
圖2為學(xué)生個(gè)體英語成績與兩類評價(jià)相關(guān)系數(shù)的散點(diǎn)圖,X軸代表80名學(xué)生在英語期末考試中的得分,Y軸代表80名學(xué)生自評和教師評價(jià)的相關(guān)系數(shù)。隨著分?jǐn)?shù)的增加,相關(guān)系數(shù)穩(wěn)定在0.46附近。結(jié)果表明,具有較高英語能力的學(xué)生比其他學(xué)生具有更高的同質(zhì)性,即英語能力水平較高的學(xué)生在評價(jià)其英語能力水平方面似乎具有更相近的觀點(diǎn)。更準(zhǔn)確地說,英語能力水平較低的學(xué)習(xí)者的自評與教師評價(jià)的相關(guān)性差異很大,而英語能力水平較高的學(xué)習(xí)者則相反。
2.學(xué)生自評和教師評價(jià)的相關(guān)性與學(xué)生性別的關(guān)系
圖3為性別與學(xué)生自評和教師評價(jià)的相關(guān)系數(shù)內(nèi)核密度圖,如圖所示,男性和女性之間的差異并不明顯。本研究進(jìn)而采用方差分析以研究男性和女性的學(xué)生自評和教師評價(jià)相關(guān)性差異。
圖3 性別與學(xué)生自評和教師評價(jià)的相關(guān)系數(shù)內(nèi)核密度圖
表2中列出的方差分析結(jié)果表明,性別幾乎對學(xué)生自評和教師評價(jià)的相關(guān)性沒有影響。這項(xiàng)研究與Goral[7]的研究相悖,他們認(rèn)為女孩的自評與研究員評價(jià)更一致。
表2 男女相關(guān)性的方差分析
3.學(xué)生自評與學(xué)生人格特質(zhì)的關(guān)系
為了避免英語能力水平的影響,本研究通過控制英語期末考試成績,使用了偏相關(guān)分析來研究人格特質(zhì)如何影響學(xué)生自評。
表3表明,外向型(E)與學(xué)生自評呈正相關(guān)(R=0.368,p=0.000)。神經(jīng)質(zhì)(N)與學(xué)生自評呈負(fù)相關(guān)(R=-0.213,p=0.05)。精神質(zhì)(P)與學(xué)生自評無關(guān)。
表3 人格特質(zhì)與學(xué)生自評的偏相關(guān)系數(shù)
本研究發(fā)現(xiàn)外向型與學(xué)生自評均呈正相關(guān)。外向的學(xué)生傾向于從樂觀的角度進(jìn)行自評,因此往往自評更高。同時(shí),本研究還發(fā)現(xiàn)神經(jīng)質(zhì)與自評呈負(fù)相關(guān)。一個(gè)合理的解釋是神經(jīng)質(zhì)可能與低出勤率、不佳的健康狀況、焦慮和不良的學(xué)習(xí)習(xí)慣有關(guān),神經(jīng)質(zhì)(N)越高的人,反而對自己的評價(jià)越低。
本研究還采用Pearson相關(guān)分析,探究了學(xué)習(xí)者在不同子能力(聽、說、讀、寫)的分項(xiàng)總分評價(jià)與教師評價(jià)的相關(guān)性是否有差異,結(jié)果如表4所示。
表4 四種技能自評的相關(guān)分析
結(jié)果發(fā)現(xiàn),聽力,閱讀和口語技能的相關(guān)性顯著且相似,而寫作方面的相關(guān)性則相對較低。Ross[6,P1-20]和Goral[7,P391-417]發(fā)現(xiàn),學(xué)生在接受型技能上的自評比產(chǎn)出型技能的相關(guān)性更高。該研究結(jié)果也驗(yàn)證了前人的發(fā)現(xiàn),但此處必須指出本文研究具有一些局限性。學(xué)生在第15周進(jìn)行了自評,但為了應(yīng)對第16周的英語期末口試,學(xué)生在第15周時(shí)花費(fèi)時(shí)間與精力準(zhǔn)備即將到來的考試。先前Wolf[2,P8-10]的研究發(fā)現(xiàn),在完成特定任務(wù)后進(jìn)行自評,學(xué)生往往將重點(diǎn)放在特定的情境下,他們更容易判斷自己的實(shí)際能力。這也解釋了為什么本研究中口語技能與其他接受型技能的相關(guān)性是接近的。除了口語技能,該研究也顯示了接受型技能的相關(guān)性高于產(chǎn)出型技能的相關(guān)性。
本研究對我國大學(xué)英語教學(xué)有著重要的啟示。首先,英語學(xué)習(xí)者可以通過使用《量表》中的自評量表對自己的英語水平進(jìn)行自評,了解自身英語學(xué)習(xí)的長處和不足。教師可以在教學(xué)的過程中運(yùn)用自評量表來了解學(xué)習(xí)者英語學(xué)習(xí)情況。教師在運(yùn)用CSE自評量表時(shí),應(yīng)理解和熟悉CSE自評量表的描述語,并在課堂上指導(dǎo)學(xué)生進(jìn)行自評。其次,應(yīng)該給學(xué)習(xí)者更多的實(shí)踐機(jī)會,特別是對產(chǎn)出型技能的自評。從而促進(jìn)學(xué)習(xí)者自主學(xué)習(xí),成為獨(dú)立學(xué)習(xí)者。第三,教師應(yīng)關(guān)注影響學(xué)生自評的因素,在使用自評時(shí)要更加關(guān)注英語水平較低的學(xué)習(xí)者,為學(xué)生的自評實(shí)踐提供幫助。教師應(yīng)給予支持和反饋,以減少學(xué)習(xí)者的自評與教師評價(jià)的不匹配。