林椿 肖云南
摘要: 我國高校課程考試很少采用標(biāo)準(zhǔn)分來報道分?jǐn)?shù)。通過在高校師生中開展“關(guān)于在高校大學(xué)英語課程考試中采用標(biāo)準(zhǔn)分來報道分?jǐn)?shù)的可行性”的問卷調(diào)查,發(fā)現(xiàn)師生對標(biāo)準(zhǔn)分的總體評價普遍較高,支持利用標(biāo)準(zhǔn)分推斷學(xué)生原始分?jǐn)?shù)在團(tuán)體中所處位置,使用標(biāo)準(zhǔn)分的意愿也較強(qiáng)烈,并且支持對傳統(tǒng)原始分制進(jìn)行改革。同時發(fā)現(xiàn),師生在實(shí)際的教/學(xué)的過程中不知如何根據(jù)標(biāo)準(zhǔn)分提供的信息來調(diào)整教/學(xué)的方法與內(nèi)容,師生對原始分與標(biāo)準(zhǔn)分的感知在三個問題上存在顯著性差異。本文通過調(diào)查結(jié)果分析了標(biāo)準(zhǔn)分難以在高校課程考試中推廣的原因,從而提出可行的解決策略,藉此為進(jìn)一步改革原始分制與完善標(biāo)準(zhǔn)分制提供一些參考。
關(guān)鍵詞:課程考試;學(xué)生評價;原始分;標(biāo)準(zhǔn)分;描述性統(tǒng)計;獨(dú)立樣本t檢驗(yàn)
中圖分類號:G642.47
文獻(xiàn)標(biāo)識碼:A
文章編號:1672-0717(2017)03-0056-07
收稿日期:2016-10-23
基金項(xiàng)目:湖南省教育廳科學(xué)研究項(xiàng)目“基于動態(tài)評估的英語教育績效研究”(15C1438);湖南省哲學(xué)社會科學(xué)基金項(xiàng)目“基于認(rèn)知診斷理論的ESL分級測試體系研究”(16YBA392)。
作者簡介:林椿(1984-),女,海南??谌?,湖南大學(xué)外國語與國際教育學(xué)院博士研究生,講師,主要從事語言測試研究;肖云南,湖南大學(xué)外國語與國際教育學(xué)院教授、博士生導(dǎo)師。
一、引言
學(xué)生的考試分?jǐn)?shù)可為反映教學(xué)情況、獎懲評比、推薦選拔人才、用人單位考察學(xué)生素質(zhì)等方面提供重要依據(jù)。原始分記分制與標(biāo)準(zhǔn)分記分制是兩種比較常用的記分制。使用哪種記分制公平合理地評價學(xué)生,是語言測試需要認(rèn)真研究的課題。美國2014年版《教育與心理測量標(biāo)準(zhǔn)》繼續(xù)規(guī)定了關(guān)于考試記分、分?jǐn)?shù)可比性、分?jǐn)?shù)報道等方面的標(biāo)準(zhǔn),足以說明其對記分制的一貫重視[1]。Bachman和Palmer在2010年提出了測試使用論證(Assessment Use Argument,AUA),其最大特點(diǎn)是強(qiáng)調(diào)了考試的使用決策和使用影響,并利用使用決策和使用影響來指導(dǎo)考試項(xiàng)目的開發(fā)和效度驗(yàn)證[2]。考試為決策提供依據(jù)[3],而決策的依據(jù)是考試的分?jǐn)?shù),因此科學(xué)合理的記分制極為重要[4]??茖W(xué)合理的教育測量所提供的考試分?jǐn)?shù)能對教育現(xiàn)狀給予精確客觀的描述,為教育提供豐富的反饋信息,供教育者分析教育中的優(yōu)點(diǎn)和不足,改進(jìn)教育方法,提高教育質(zhì)量,從而更好地培養(yǎng)人才。這與“教育是培養(yǎng)人”的理念標(biāo)準(zhǔn)相一致,由此可見科學(xué)合理的記分制的重要性[5]。
在不同記分制對考生排名的影響方面,有的研究顯示考生按原始分和按標(biāo)準(zhǔn)分排列的名次無顯著差異[6];而有的研究顯示考生按原始分和按標(biāo)準(zhǔn)分排列的名次是不相同的[7-9]。在采用哪種記分制來報道學(xué)生成績方面,有的研究者推薦對原始分?jǐn)?shù)進(jìn)行標(biāo)準(zhǔn)轉(zhuǎn)化后再報道學(xué)生的成績[10-13];而有的研究者建議綜合采用原始分和標(biāo)準(zhǔn)分來報道學(xué)生的成績[8]。Mahon提議作文成績單上要同時報道原始分?jǐn)?shù)與相應(yīng)的字母成績等級(Letter grade)[14]。美國學(xué)校是很少直接使用考試原始分?jǐn)?shù)來報道學(xué)生分?jǐn)?shù)的,他們大量使用量表分?jǐn)?shù),其中最常用的是標(biāo)準(zhǔn)分?jǐn)?shù)和百分位等級,此外還有標(biāo)準(zhǔn)九分?jǐn)?shù)、四分位等級等[15]。國內(nèi)外著名的大規(guī)模標(biāo)準(zhǔn)化英語能力考試采用標(biāo)準(zhǔn)分記分制的有:中國大學(xué)英語四六級考試、中國漢語水平考試、美國研究生入學(xué)考試、美國大學(xué)水平考試、托福、雅思等。為保證考試的信度和效度,大規(guī)模標(biāo)準(zhǔn)化考試采用標(biāo)準(zhǔn)分或者轉(zhuǎn)換后的標(biāo)準(zhǔn)分來報道分?jǐn)?shù),確保了測量的精度和公平性。這使得考試的分?jǐn)?shù)不但可以解釋,而且可以準(zhǔn)確地推論出考生的語言水平[16]。
科學(xué)合理的記分制是確保測試可靠、公平、有效的關(guān)鍵。原始分與標(biāo)準(zhǔn)分優(yōu)點(diǎn)各異,原始分直接反映了考生對教學(xué)內(nèi)容的掌握程度,而標(biāo)準(zhǔn)分反映了一個原始分?jǐn)?shù)在團(tuán)體中所處的位置,使不同科目、不同時間的考試分?jǐn)?shù)具有可比性,并能提供更準(zhǔn)確的統(tǒng)計信息。前人的研究大多是關(guān)于原始分記分制與標(biāo)準(zhǔn)分記分制的對比研究[17-18],關(guān)于師生對原始分與標(biāo)準(zhǔn)分的感知差異的調(diào)查研究很少。盡管標(biāo)準(zhǔn)分有很多優(yōu)點(diǎn),然而現(xiàn)實(shí)中高校課程考試很少采用標(biāo)準(zhǔn)分來報道分?jǐn)?shù)。針對這一現(xiàn)象,本研究在國內(nèi)某一高校的師生中展開了“關(guān)于在高校大學(xué)英語課程考試中采用標(biāo)準(zhǔn)分來報道分?jǐn)?shù)的可行性”問卷調(diào)查,旨在找出教師與學(xué)生對原始分與標(biāo)準(zhǔn)分的感知是否存在差異,希望為進(jìn)一步改革原始分制與完善標(biāo)準(zhǔn)分制提供一些參考。
二、研究方法
1. 研究問題
本研究擬研究以下問題:
第一,教師與學(xué)生對原始分與標(biāo)準(zhǔn)分的感知情況如何?
第二,教師與學(xué)生對原始分與標(biāo)準(zhǔn)分的感知是否存在顯著性差異?
第三,標(biāo)準(zhǔn)分難以在高校課程考試中推廣應(yīng)用的原因是什么?
2. 研究對象
本研究的調(diào)查對象為天津某高校的教師與學(xué)生。我們隨機(jī)邀請120名師生進(jìn)行問卷調(diào)查,在收回的有效問卷中,按照師生1∶1的比例,隨機(jī)選取共100份(教師50份,學(xué)生50份)有效問卷進(jìn)行統(tǒng)計分析。隨機(jī)抽樣對象兼顧到不同院系、不同專業(yè)的教師與學(xué)生。
3. 調(diào)查問卷
進(jìn)行問卷調(diào)查之前,我們對調(diào)查對象進(jìn)行了非正式的、歷時大約5分鐘的簡短培訓(xùn),簡單介紹原始分與標(biāo)準(zhǔn)分的概念,以及這兩種記分制的優(yōu)缺點(diǎn)。調(diào)查問卷總共設(shè)計15個問題,第1~13題為單選題,選項(xiàng)都采用萊克特五級量表(Likert Scale)格式;第14題為多選題,提供四個選項(xiàng);第15題為提供四個選項(xiàng)的半開放式問題。問卷調(diào)查的目的是了解師生對原始分與標(biāo)準(zhǔn)分的看法,找出教師與學(xué)生對原始分與標(biāo)準(zhǔn)分的感知是否存在顯著性差異,以了解在高校大學(xué)英語課程考試中采用標(biāo)準(zhǔn)分來報道分?jǐn)?shù)的可行性。
4. 分析方法
本研究采用SPSS22.0軟件做描述性統(tǒng)計和獨(dú)立樣本T檢驗(yàn)。數(shù)據(jù)分析首先采用SPSS22.0做描述性統(tǒng)計以了解教師與學(xué)生對原始分與標(biāo)準(zhǔn)分各項(xiàng)內(nèi)容的打分的均值,然后做獨(dú)立樣本T檢驗(yàn)以找出教師與學(xué)生對原始分與標(biāo)準(zhǔn)分各項(xiàng)內(nèi)容的打分的均值是否存在顯著性差異。
三 結(jié)果討論
1. 描述性統(tǒng)計結(jié)果
教師與學(xué)生對問卷第1~13題的回答的描述性統(tǒng)計結(jié)果(見表1):
調(diào)查結(jié)果顯示,師/生對標(biāo)準(zhǔn)分的總體評價(M=18.64/17.88)高于對原始分的總體評價(M=16.28/15.48)。教師對原始分、標(biāo)準(zhǔn)分的了解(M=4.08、M=3.48)都比學(xué)生對它們的了解(M=3.86、M=3.20)多,而且?guī)?生對原始分的了解比對標(biāo)準(zhǔn)分的了解都多;師/生都更加支持利用標(biāo)準(zhǔn)分推斷學(xué)生原始分?jǐn)?shù)在團(tuán)體中所處位置(M=4.12/3.82);師/生皆認(rèn)為標(biāo)準(zhǔn)分(M=3.64/3.68)比原始分更具合理性,而且學(xué)生更加認(rèn)可標(biāo)準(zhǔn)分的合理性,不過教師群體對于這一問題的看法差異比較大(SD=0.749)。師/生都更加愿意使用標(biāo)準(zhǔn)分(M=3.80/3.62),師/生支持對傳統(tǒng)原始分記分制進(jìn)行改革并考慮使用標(biāo)準(zhǔn)分(M=3.60/3.56)。
傳統(tǒng)的原始分記分制一般不會出現(xiàn)負(fù)數(shù)或者小數(shù)點(diǎn),但標(biāo)準(zhǔn)分即z分?jǐn)?shù)有正負(fù)值(z分?jǐn)?shù)一般取值大于-3,小于+3,也可能會出現(xiàn)“0”分即代表原始考分為所有原始分的平均分)、且有時候有小數(shù)點(diǎn)。筆者擔(dān)心教師、學(xué)生、家長會誤認(rèn)為標(biāo)準(zhǔn)分為0分“就表示該生一點(diǎn)都不會, 相當(dāng)于交白卷”;擔(dān)心他們會不理解標(biāo)準(zhǔn)分的這些缺點(diǎn), 從而不信任標(biāo)準(zhǔn)分及其理論。為此,針對標(biāo)準(zhǔn)分的這些缺點(diǎn),問卷提出了問題11“傳統(tǒng)原始分一般不會出現(xiàn)負(fù)數(shù)或者小數(shù)點(diǎn),但標(biāo)準(zhǔn)分即z分?jǐn)?shù)有正負(fù)值(z分?jǐn)?shù)大于負(fù)3,小于正3)且有時候有小數(shù)點(diǎn),你能接受標(biāo)準(zhǔn)分這一形式么?”,調(diào)查結(jié)果顯示80%的教師與48%的學(xué)生表示“完全能夠”“能夠”接受標(biāo)準(zhǔn)分的負(fù)值與小數(shù)點(diǎn)形式,沒有人表示“完全不能夠”接受。問題12“你會根據(jù)標(biāo)準(zhǔn)分提供的信息(如平均分、標(biāo)準(zhǔn)差、原始分?jǐn)?shù)所處位置等),調(diào)整教學(xué)(或?qū)W習(xí))的方法與內(nèi)容嗎?”,調(diào)查結(jié)果顯示64%的教師與56%的學(xué)生不知如何根據(jù)標(biāo)準(zhǔn)分提供的信息(如平均分、標(biāo)準(zhǔn)差、原始分?jǐn)?shù)所處位置等)來調(diào)整教學(xué)(或?qū)W習(xí))的方法與內(nèi)容。問題13中“標(biāo)準(zhǔn)分能使學(xué)生了解自己在團(tuán)體中所處的水平。它是否能夠促使學(xué)生做好學(xué)習(xí)計劃以促進(jìn)自己綜合能力的提高呢?”,48%的教師與54%的學(xué)生認(rèn)為,標(biāo)準(zhǔn)分不一定能夠督促他們做好學(xué)習(xí)計劃以促進(jìn)綜合能力的提高。教師與學(xué)生對問卷第11~13題的回答的統(tǒng)計結(jié)果見表2。
調(diào)查表明,相比對原始分的感知,雖然師生對標(biāo)準(zhǔn)分有更高的總體評價,但在實(shí)際的教學(xué)與學(xué)習(xí)的過程中,教師(或?qū)W生)不知如何根據(jù)標(biāo)準(zhǔn)分提供的信息(如平均分、標(biāo)準(zhǔn)差、原始分?jǐn)?shù)所處位置等)來調(diào)整教學(xué)(或?qū)W習(xí))的方法與內(nèi)容。同時,他們對標(biāo)準(zhǔn)分是否能夠督促他們做好學(xué)習(xí)計劃以促進(jìn)綜合能力的提高存在一些質(zhì)疑。非正式訪談發(fā)現(xiàn),師生都承認(rèn)標(biāo)準(zhǔn)分能為教師的“教”與學(xué)生的“學(xué)”提供很多信息,但是師生都認(rèn)為教師想要提高教學(xué)質(zhì)量、學(xué)生想要提高綜合能力,教師應(yīng)在教學(xué)方法與內(nèi)容上、學(xué)生應(yīng)在學(xué)習(xí)方法與內(nèi)容上改進(jìn)與調(diào)整。
問題14“以標(biāo)準(zhǔn)分報道分?jǐn)?shù)的形式,你認(rèn)為較難理解的內(nèi)容有哪些?(多選題)”,66%的教師認(rèn)為已知標(biāo)準(zhǔn)分,使用正態(tài)分布函數(shù)表查學(xué)生排名P值比較難;72%的學(xué)生認(rèn)為已知標(biāo)準(zhǔn)分,不需查表,如何使用軟件計算排名P值比較難。問題15“你認(rèn)為,教務(wù)系統(tǒng)采用何種形式來報道學(xué)生分?jǐn)?shù),更加科學(xué)、合理、可行呢?(半開放式問題)”的回答顯示,52%的教師和50%的學(xué)生認(rèn)為教務(wù)系統(tǒng)采用標(biāo)準(zhǔn)分形式來報道學(xué)生分?jǐn)?shù)更加科學(xué)、合理、可行。師生對問題14和15的回答的對比分析見圖1。
2. 獨(dú)立樣本T檢驗(yàn)結(jié)果
上節(jié)統(tǒng)計分析表明,教師與學(xué)生對原始分與標(biāo)準(zhǔn)分這兩種記分制的感知存在差異,但是這種差異是否顯著呢?為回答這一問題,需進(jìn)行獨(dú)立樣本T檢驗(yàn)。教師與學(xué)生對兩種記分制的感知的獨(dú)立樣本T檢驗(yàn)結(jié)果見表3。
研究發(fā)現(xiàn),教師與學(xué)生對原始分與標(biāo)準(zhǔn)分的感知在三個問題(問題4、11、13)上存在顯著性差異(p=0.009、0.001、0.038 <.05)。問題4的回答顯示,教師比學(xué)生更能根據(jù)標(biāo)準(zhǔn)分提供的信息推斷考試分?jǐn)?shù)在團(tuán)體中所處的位置(M=4.12/3.82),而且這種差異很顯著。問題11的回答顯示,教師比學(xué)生更能接受標(biāo)準(zhǔn)分的缺點(diǎn)比如負(fù)值與小數(shù)點(diǎn)形式(M=3.96/3.44),而且這種差異具有顯著性。問題13,關(guān)于標(biāo)準(zhǔn)分對學(xué)習(xí)的積極反饋與促進(jìn)作用,雖然師生存在一些質(zhì)疑,但是教師比學(xué)生更加肯定標(biāo)準(zhǔn)分對學(xué)習(xí)的積極反饋?zhàn)饔茫∕=2.92/2.56),而且這種感知差異具有統(tǒng)計性意義。
3. 標(biāo)準(zhǔn)分記分制難以推廣的原因
問卷調(diào)查了解到高校師生對標(biāo)準(zhǔn)分記分制持肯定態(tài)度,但是在實(shí)際高校課程考試中,標(biāo)準(zhǔn)分仍較難以推廣應(yīng)用。真正影響標(biāo)準(zhǔn)分實(shí)施的問題是什么?調(diào)查結(jié)果顯示,首先,關(guān)于能否接受標(biāo)準(zhǔn)分的缺點(diǎn)比如負(fù)值與小數(shù)點(diǎn)形式(問題11),雖然多達(dá)64%的師生表示“完全能夠”或者“能夠”接受,但是仍然有36%的師生表示“不一定”或者“不能夠”接受;關(guān)于標(biāo)準(zhǔn)分制哪些內(nèi)容較難以理解(問題14),65%的師生認(rèn)為“如何使用軟件計算排名P值比較難”,說明師生對標(biāo)準(zhǔn)分的計算方法不太熟悉。標(biāo)準(zhǔn)分有自身的缺點(diǎn),比如標(biāo)準(zhǔn)分在分?jǐn)?shù)形式上有正值且可能出現(xiàn)負(fù)值、小數(shù)點(diǎn);標(biāo)準(zhǔn)分的計算方法需要學(xué)習(xí)才能掌握且計算過程相對麻煩;標(biāo)準(zhǔn)分不能直接反映教學(xué)目標(biāo)達(dá)成程度。這是影響標(biāo)準(zhǔn)分實(shí)施的內(nèi)因。其次,關(guān)于培訓(xùn)前對標(biāo)準(zhǔn)分的了解程度(問題2),雖然共有58%的師生表示“非常了解”:“了解”“一般了解”,但是仍有42%的師生表示“不了解”“根本不了解”。很多教師和教學(xué)管理人員不理解標(biāo)準(zhǔn)分,這給標(biāo)準(zhǔn)分的推廣增加了難度。標(biāo)準(zhǔn)分的滿分不是100分,這與傳統(tǒng)的記分制很不相同,很多教學(xué)管理人員和教師以標(biāo)準(zhǔn)分不便于記入學(xué)生成績檔案為由而不使用標(biāo)準(zhǔn)分。這是影響標(biāo)準(zhǔn)分實(shí)施的外因。
標(biāo)準(zhǔn)分面臨著難以在高校課程考試中推廣應(yīng)用的問題,那到底還要不要使用標(biāo)準(zhǔn)分?答案是肯定的。標(biāo)準(zhǔn)分有很多優(yōu)點(diǎn),比如:能反映考試分?jǐn)?shù)在團(tuán)體中的位置,使不同科目、不同時間、難度不一的考試分?jǐn)?shù)具有可比性、可加性,無需考慮試卷的難易程度及考分的離散程度;更加穩(wěn)定、科學(xué)、合理;能提供更多、更準(zhǔn)確的統(tǒng)計信息。在百分制中,不同科目考試之間分?jǐn)?shù)可比性較差,而標(biāo)準(zhǔn)分可以比較不同單位分?jǐn)?shù)[20]。大規(guī)模標(biāo)準(zhǔn)化考試一般不采用原始分(即考生的卷面得分)來報道考生成績,因?yàn)檫@樣做分?jǐn)?shù)的信息量太小,而通常進(jìn)行一系列的分?jǐn)?shù)轉(zhuǎn)換,使最后報道的分?jǐn)?shù)不但信息量大且具有可解釋性[16]。標(biāo)準(zhǔn)分給人才選拔與決策提供更多的信息,若我們的課程期末成績用于保送研究生,如果用標(biāo)準(zhǔn)分顯示就可以更精確地比較同年級學(xué)生的考分所處位置,更好地評價學(xué)生,擇優(yōu)推薦。當(dāng)然,標(biāo)準(zhǔn)分也可以通過建立模型,在形式上設(shè)計為百分制,但是意義上不同于百分制的原始分了。
4.討論與建議
針對標(biāo)準(zhǔn)分難以在高校課程考試中推廣應(yīng)用的問題,結(jié)合此次調(diào)查結(jié)果并參考1994年中華人民共和國教育部頒發(fā)的標(biāo)準(zhǔn)分?jǐn)?shù)制度實(shí)施方案[21],本研究提出以下建議:(1)明確告知教學(xué)管理人員、教師、學(xué)生高校課程考試建立標(biāo)準(zhǔn)分制的目的,以及標(biāo)準(zhǔn)分制的基本內(nèi)容,并由教學(xué)管理人員、教師負(fù)責(zé)標(biāo)準(zhǔn)分的實(shí)施。高校課程考試建立標(biāo)準(zhǔn)分制的主要目的有三點(diǎn):實(shí)現(xiàn)考試分?jǐn)?shù)標(biāo)準(zhǔn)化,克服原始分?jǐn)?shù)的局限性,使考試分?jǐn)?shù)更科學(xué)、準(zhǔn)確地反映學(xué)生水平;為高校研究生招生錄取提供更科學(xué)、準(zhǔn)確的依據(jù),方便錄??;為進(jìn)一步開發(fā)利用考試信息,充分發(fā)揮考試的作用,建立標(biāo)準(zhǔn)分制既有利于高校教學(xué)、又有利于用人單位選拔人才。(2)研究制定統(tǒng)一的轉(zhuǎn)換軟件等具體操作細(xì)則。專業(yè)人員需教會教學(xué)管理人員、教師如何更快捷計算標(biāo)準(zhǔn)分、如何更好地使用標(biāo)準(zhǔn)分。由于計算器、計算機(jī)的發(fā)展和普及,教師可借助工具計算得到原始分?jǐn)?shù)的標(biāo)準(zhǔn)分;教學(xué)管理人員可請計算機(jī)專業(yè)人員在教務(wù)系統(tǒng)中編程錄入概率密度函數(shù)積分公式,由計算機(jī)自動生成概率P值,在分?jǐn)?shù)報道單上,教師與學(xué)生只要了解標(biāo)準(zhǔn)分Z值與概率P值的意義即可。已知隨機(jī)變量標(biāo)準(zhǔn)分Z服從正態(tài)分布,計算標(biāo)準(zhǔn)分Z值的概率P(即考分位置)即對標(biāo)準(zhǔn)分Z的概率密度函數(shù)求積分,具體計算公式及公式解釋可參見陶敏力論文[22]。(3)編制宣傳材料,加強(qiáng)宣傳工作,培訓(xùn)各級教學(xué)管理人員、教師。加大對標(biāo)準(zhǔn)分的宣傳力度,能讓教師、教學(xué)管理人員、學(xué)生進(jìn)一步了解標(biāo)準(zhǔn)分的優(yōu)點(diǎn),使得教師、教學(xué)管理人員愿意逐步對傳統(tǒng)原始分(百分制)記分制進(jìn)行改革并科學(xué)合理地使用標(biāo)準(zhǔn)分。(4)采取實(shí)驗(yàn)、總結(jié)、推廣的科學(xué)態(tài)度開展工作。參考全國大學(xué)英語四、六級考試中心給各校反饋的本校所有考生在某次大學(xué)英語四、六級考試中的成績報告單形式,可在教務(wù)系統(tǒng)中同時用兩種記分制來報道高校學(xué)生課程成績。
考試有選拔功能,比如有些高校的教務(wù)部門根據(jù)學(xué)生課程成績排名情況優(yōu)先保送讀研,根據(jù)排名提出推免生名單。采用標(biāo)準(zhǔn)分對學(xué)生課程成績排名更加科學(xué)與合理,當(dāng)然我們不提倡用平時成績排名去打擊成績差的學(xué)生。人才評價,更需要人性的、人文的關(guān)懷。
嚴(yán)格遵循決策程序,靈活運(yùn)用科學(xué)的決策方式方法,是走向科學(xué)化的教育管理決策的途徑之一[5]。高校在人才培養(yǎng)過程中,要更多地利用其教育、激勵功能,以便改進(jìn)教學(xué)。標(biāo)準(zhǔn)分比原始分給人才選拔與決策提供更多的信息,標(biāo)準(zhǔn)分制是保證有效測試與有效決策的關(guān)鍵。
四、結(jié)語
本研究發(fā)現(xiàn)師生對標(biāo)準(zhǔn)分的總體評價都較高,都認(rèn)為標(biāo)準(zhǔn)分記分制比較科學(xué)合理,支持對傳統(tǒng)百分制的改革,愿意并建議使用標(biāo)準(zhǔn)分記分制。我們通過非正式訪談發(fā)現(xiàn):師生都承認(rèn)標(biāo)準(zhǔn)分能提供很多信息,教師認(rèn)為要提高教學(xué)質(zhì)量,仍然得在教學(xué)方法與內(nèi)容上改革與調(diào)整;學(xué)生也認(rèn)為要提高自身綜合能力,仍然得在學(xué)習(xí)方法與內(nèi)容上改進(jìn)與調(diào)整。教育測量與評價研究的目的之一是要給語言教學(xué)與語言學(xué)習(xí)提供反饋與參考[23]。對于一次考試,我們除了關(guān)心試卷本身的質(zhì)量(其信度、效度以及各題的難度、區(qū)分度是否合乎要求),還關(guān)心考試的記分制是否科學(xué)與合理。有經(jīng)驗(yàn)的教師總是根據(jù)考試中學(xué)生反饋的考試分?jǐn)?shù)調(diào)整自己的教學(xué),而有經(jīng)驗(yàn)的學(xué)生也可通過考試分?jǐn)?shù)認(rèn)識自己的水平,改變學(xué)習(xí)方法、努力方向以及努力的程度??梢姡荚嚪答伒目荚嚪?jǐn)?shù)影響著學(xué)生的學(xué)和教師的教,考試的記分制是否科學(xué)直接關(guān)系著教學(xué)質(zhì)量的高低、學(xué)生的發(fā)展方向以及人才的合理選拔培養(yǎng)[22]。
從世界知名大學(xué)的記分制可以看到級別分和標(biāo)準(zhǔn)分被廣泛應(yīng)用[24]。哈佛大學(xué)對學(xué)生成績的打分標(biāo)準(zhǔn)不是按絕對分?jǐn)?shù)值(即原始分?jǐn)?shù))來打“優(yōu)”或打“A、B、C”,而是將學(xué)生考分最為集中的那個分?jǐn)?shù)段列為中等分?jǐn)?shù)段即為B。也就是說,學(xué)生若想超過B,得到B+或是A-,則必須超過大多數(shù)人才行,因而有時候90分可能是A,有時候90分則又可能是B。在哈佛大學(xué),學(xué)校只強(qiáng)調(diào)競爭的客觀存在,卻不強(qiáng)調(diào)學(xué)生的考分及名次,也從來不向?qū)W生公布其所在班上或系里的名次。這樣做是為了使學(xué)生不至于出現(xiàn)自滿或自卑的現(xiàn)象而影響學(xué)習(xí)。學(xué)生每次考試不只看分?jǐn)?shù)高低,而能夠客觀地定位自己,并能夠與以往的成績定位作比較,只有自己的現(xiàn)在比自己的從前進(jìn)步了,才算是真正進(jìn)步[25-26]。哈佛大學(xué)的記分制對學(xué)生的成績觀念有良好的引導(dǎo),這也是標(biāo)準(zhǔn)分的一個優(yōu)點(diǎn)所在[27]??茖W(xué)合理的記分法能對教育產(chǎn)生良好的促進(jìn)作用。在標(biāo)準(zhǔn)化語言測試發(fā)展的今天,因?yàn)閭鹘y(tǒng)的原始分沒有反映題目的難易度、區(qū)分度等重要的質(zhì)量指標(biāo),提供的信息量很小,誤差比較大[4],所以高校應(yīng)該采用更加科學(xué)合理的記分制比如標(biāo)準(zhǔn)分制來記分。
參考文獻(xiàn)
[1] Alderson,J.C.,Clapham,C.,Wall,D..語言測試的設(shè)計與評估[M].楊惠中,導(dǎo)讀.北京:外語教學(xué)與研究出版社,2000:F23.
[2] Bachman,L.F.,Palmer,A.S..Language Assessment in Practice:Developing Language Assessment and Justifying Their Use in the Real World[M].Oxford:Oxford University Press,2010:25.
[3] 李智,肖云南.基于論證的測試效度驗(yàn)證與高考英語效度驗(yàn)證研究[J].教育測量與評價(理論版),2013(11):57-62.
[4] 楊惠中.有效測試、有效教學(xué)、有效使用[J].外國語,2015(1):2-26.
[5] 胡弼成,彭湘韌.論教育管理決策的科學(xué)化[J].湖南師范大學(xué)教育科學(xué)學(xué)報,2014(5):13-17.
[6] Webber,S.A.,Clinton,B.D..Using z-scores to evaluate accounting students:a test of Weinsteins suggestion[J].Journal of Accounting Education,1999(4):407-415.
[7] 宋嶺梅.關(guān)于多科考試成績評定的統(tǒng)計方法問題[J].教育研究與實(shí)驗(yàn),1984(3):33-38.
[8] Weinstein,G.P.Evaluation of accounting students[J].Journal of Accounting Education,1994(3):193-204.
[9] 張菁莉.CET評分標(biāo)準(zhǔn)改革分析[J].河南職工醫(yī)學(xué)院學(xué)報,2010(2):210-212.
[10] Thomas,C.R.Rational standard and ability adjusted standard transformed score models[J].Educational and Psychological Measurement,1985(4):803-809.
[11] Ebel,R.L.,F(xiàn)risbie,D.A..Essentials of Education Measurement(5th ed.)[M].Englewood Cliffs:Prentice Hall,1991:289.
[12] Ornstein,A.C.Grading practices and policies:An overview and some suggestions[J].Nassp Bulletin,1994(561):55-64.
[13] Cross,L.H.Grading students[J].Practical Assessment,Research & Evaluation,1995(8):1-3.
[14] Mahon,R.L.A Grading System for Composition Papers[J].The Clearing House:A Journal of Educational Strategies,Issues and Ideas,2005(3):102-104.
[15] 楊志明.中美教育考試分?jǐn)?shù)的報告與使用之簡要比較[J].教育測量與評價,2008(7):51-53.
[16] 楊惠中,金艷.大學(xué)英語四、六級考試分?jǐn)?shù)解釋[J].外語界,2001(1):62-68.
[17] 石偉,向遠(yuǎn)輝,黃玲娟,唐利強(qiáng).標(biāo)準(zhǔn)分在高校課程考試中的應(yīng)用[J].湘潭師范學(xué)院學(xué)報(自然科學(xué)版),2005(2):130-132.
[18] 李國英.標(biāo)準(zhǔn)分與CET考試新記分方式[J].長春大學(xué)學(xué)報,2006(10):105-106.
[19] 秦曉晴.外語教學(xué)研究中的定量數(shù)據(jù)分析[M].武漢:華中科技大學(xué)出版社,2003:19.
[20] 黃玉石.使用標(biāo)準(zhǔn)分合理評定學(xué)生學(xué)業(yè)質(zhì)量[J].遼寧工業(yè)大學(xué)學(xué)報(社會科學(xué)版),2004(4):34-35.
[21] 中華人民共和國教育部.普通高等學(xué)校招生全國統(tǒng)一考試建立標(biāo)準(zhǔn)分?jǐn)?shù)制度實(shí)施方案(教試廳[1994]1號)[OL].http://www.chinalawedu.com/falvfagui/fg22598/34504.shtml,1994.
[22] 陶敏力.考試分?jǐn)?shù)的解釋[J].重慶師范學(xué)院學(xué)報(自然科學(xué)版),1986(3):99-103.
[23] Bailey,K.M.Washback in language testing(TOEFL Monograph Series)[M].Princeton,NJ:Educational Testing Service,1999.
[24] 王建平.從分?jǐn)?shù)制到等級制:中考評價制度改革的審思[J].湖南師范大學(xué)教育科學(xué)學(xué)報,2014(5):24-27.
[25] 肖云南,羅曉英.關(guān)于英語測試的改革[J].外語教學(xué)與研究,2002(4):294-299.
[26] 肖云南.標(biāo)準(zhǔn)分的意義[OL].http://blog.sina.com.cn/xiaoyunnan,2010.
[27] 別敦榮,賈杰靜.哈佛大學(xué)的發(fā)展歷程、教育理念及啟示[J].大學(xué)教育科學(xué),2011(6):76-81.