摘 要: 本文以統(tǒng)計學(xué)中的差異數(shù)量——標(biāo)準(zhǔn)分在科學(xué)、合理地評價和解釋考試分?jǐn)?shù)方面的應(yīng)用為例,分析和闡述了標(biāo)準(zhǔn)分在考試成績評價中的作用和意義,旨在為學(xué)校教育評價和教學(xué)改革提供參考。本文認(rèn)為用標(biāo)準(zhǔn)分比用原始分?jǐn)?shù)評價學(xué)生成績更科學(xué)、更合理和公正,更能客觀地反映學(xué)生的學(xué)習(xí)動態(tài),使教師做到有的放矢、因材施教。
關(guān)鍵詞: 原始分 標(biāo)準(zhǔn)分 意義 作用 考試成績評價
一、引言
考試是學(xué)校教育的一個極為重要的組成部分,是檢查教學(xué)質(zhì)量、評價教師教學(xué)水平、檢驗學(xué)生知識掌握及能力結(jié)構(gòu)的主要環(huán)節(jié)。過去評價學(xué)生成績時,常常使用原始分?jǐn)?shù),如認(rèn)為語文得90分的學(xué)生語文學(xué)得好,而外語得70分的學(xué)生則外語能力較低;再有,同一名學(xué)生期末數(shù)學(xué)得80分,語文得65分,于是認(rèn)為該生是學(xué)理科的材料,文科不好。這些認(rèn)識是不夠科學(xué)的,因為試題的難易程度是決定學(xué)生分?jǐn)?shù)的主要因素,題目難,原始分?jǐn)?shù)就偏低;題目容易,原始分?jǐn)?shù)就偏高,從而導(dǎo)致了原始分?jǐn)?shù)之間的不可比性。試題還受區(qū)分度大小的影響,因而造成考試的內(nèi)容不同質(zhì)、不等效、不可加。由于考試分?jǐn)?shù)或原始分?jǐn)?shù)沒有絕對的零點,也沒有統(tǒng)一的單位,因而不能將一個學(xué)生前后多次考試的成績進(jìn)行比較,不能對不同科目的成績進(jìn)行比較,難以判斷學(xué)生成績的變化趨勢。因此,原始分?jǐn)?shù)得到的信息不夠準(zhǔn)確,不科學(xué),用原始分來評價學(xué)生的成績?nèi)笔Ч院秃侠硇?。采用?biāo)準(zhǔn)分?jǐn)?shù)對考試成績進(jìn)行分析,就可以克服以上缺點,因此,用標(biāo)準(zhǔn)分比用原始分?jǐn)?shù)評價學(xué)生成績更科學(xué)、更合理和公正。
二、標(biāo)準(zhǔn)分的定義及計算方法
標(biāo)準(zhǔn)分是由均數(shù)和標(biāo)準(zhǔn)差規(guī)定的相對地位量。它是統(tǒng)計學(xué)中最重要、用途最廣的統(tǒng)計量,標(biāo)準(zhǔn)分的定義為:以標(biāo)準(zhǔn)差為單位標(biāo)定某一分?jǐn)?shù)離開團(tuán)體均數(shù)的距離。公式為:
z==
式中X為某一原始分?jǐn)?shù),為N個原始分?jǐn)?shù)的平均數(shù),x-是離均差,即某一分?jǐn)?shù)離開均數(shù)的差數(shù),S為標(biāo)準(zhǔn)差,Z即為標(biāo)準(zhǔn)分?jǐn)?shù),因此標(biāo)準(zhǔn)分?jǐn)?shù)常稱為Z分?jǐn)?shù)。Z分?jǐn)?shù)有正值和負(fù)值。當(dāng)Z為正數(shù)時,則X>;當(dāng)Z為負(fù)數(shù)時,則X<;當(dāng)Z=0時,則X=。Z分?jǐn)?shù)的絕對值|Z|,表示某分?jǐn)?shù)與在此分布上的平均數(shù)的距離,|Z|越大,表示某分?jǐn)?shù)離開均數(shù)的位置越遠(yuǎn)。計算機(jī)(利用Excel表)可以方便地將原始分轉(zhuǎn)換成標(biāo)準(zhǔn)分。
三、標(biāo)準(zhǔn)分的意義
標(biāo)準(zhǔn)分是一種具有相等單位的量數(shù)。它是將原始分?jǐn)?shù)與團(tuán)體的平均數(shù)之差除以標(biāo)準(zhǔn)差所得的商數(shù),是以標(biāo)準(zhǔn)差為單位度量原始分?jǐn)?shù)離開其平均數(shù)的分?jǐn)?shù)之上多少個標(biāo)準(zhǔn)差,或是在平均數(shù)之下多少個標(biāo)準(zhǔn)差。它是一個抽象值,不受原始測量單位的影響,并可接受進(jìn)一步的統(tǒng)計處理。其意義在于:
1.標(biāo)準(zhǔn)分的分布與原始數(shù)據(jù)的分布相同。
2.各科標(biāo)準(zhǔn)分的單位是絕對等價的。無論各科的平均分、標(biāo)準(zhǔn)差怎樣不同,一經(jīng)轉(zhuǎn)換成標(biāo)準(zhǔn)分,就形成以平均數(shù)為0、標(biāo)準(zhǔn)差為1的統(tǒng)一的、固定不變的標(biāo)準(zhǔn)形式。
3.標(biāo)準(zhǔn)分?jǐn)?shù)值的大小、正負(fù),反映某一考分在全體中所處的位置,它是相對分?jǐn)?shù)。
4.當(dāng)總體均服從同一分布時,總體的標(biāo)準(zhǔn)分之間具有可比性。
5.用標(biāo)準(zhǔn)分表示的樣本間可以進(jìn)行算術(shù)運算。
因此,標(biāo)準(zhǔn)分在考試成績評價中具有重要作用。
四、標(biāo)準(zhǔn)分的作用
標(biāo)準(zhǔn)分在考試成績評估中的用途很多,一是能夠明確各個分?jǐn)?shù)在總體中的位置;二是能客觀地比較不同學(xué)生不同學(xué)科的總成績及其優(yōu)劣;三是可以比較某學(xué)生不同學(xué)科、與階段的考試成績,正確評價其學(xué)習(xí)的發(fā)展。
?。ㄒ唬┠苊鞔_各個分?jǐn)?shù)在總體中的位置。
標(biāo)準(zhǔn)分是按正態(tài)分布原理而建立的分?jǐn)?shù)制度,其主要特點是:分?jǐn)?shù)不但可以反映考生的水平高低,而且可以直接反映出該分?jǐn)?shù)在全體考生中的位置。
依據(jù)Z標(biāo)準(zhǔn)分?jǐn)?shù)的意義,Z分?jǐn)?shù)為0的原始成績是全班的平均分。Z分?jǐn)?shù)大于0的原始成績高于全班的平均分;Z分?jǐn)?shù)小于0的原始成績則低于全班的平均分。也就是說,標(biāo)準(zhǔn)分?jǐn)?shù)值的大小、正負(fù),反映某一考分在全體中所處的位置。以表1為例。
表1是某高校10級商英2班第一學(xué)期外語三科期末考試的成績統(tǒng)計。表1中學(xué)生01的泛讀得分為34,其泛讀標(biāo)準(zhǔn)分為-1.690,這表明學(xué)生01所得的泛讀分?jǐn)?shù)低于全體考生平均數(shù)1.690個標(biāo)準(zhǔn)差,在總體的位置靠后;學(xué)生02的泛讀得分為65,泛讀標(biāo)準(zhǔn)分為0.158,這表明學(xué)生02的泛讀分?jǐn)?shù)高于全體考生平均數(shù)0.158個標(biāo)準(zhǔn)差,在總體的位置則靠前。
再如,學(xué)生32的精讀和泛讀的原始分?jǐn)?shù)都是73分,這個分?jǐn)?shù)是高還是低?該學(xué)生在全體考生中的位置靠前還是靠后?單從原始分?jǐn)?shù)看不出來,因為沒有一個穩(wěn)定的參照點。若把原始分?jǐn)?shù)轉(zhuǎn)換成標(biāo)準(zhǔn)分后,該學(xué)生在全體考生中的位置則一目了然:該生精讀原始分?jǐn)?shù)為73分,標(biāo)準(zhǔn)分為1.211,高于全體考生平均數(shù),原始分?jǐn)?shù)73分應(yīng)算較高的成績了;而泛讀的標(biāo)準(zhǔn)分為0.635,接近全體考生平均數(shù),原始分?jǐn)?shù)73分則只算中等成績,由此可見,原始分?jǐn)?shù)很難準(zhǔn)確說明分?jǐn)?shù)所反映的考生實際水平,也不能確定分?jǐn)?shù)在群體中的位置。而標(biāo)準(zhǔn)分則可以直接反映出該分?jǐn)?shù)在全體考生中的位置。|Z|越大,表示某分?jǐn)?shù)離開均數(shù)的位置越遠(yuǎn)。
?。ǘ┠芸陀^地比較不同學(xué)生不同學(xué)科的總成績及其優(yōu)劣。
從表1可以看到,若按原始分累計總分,學(xué)生09、學(xué)生10和學(xué)生22的總分都是140,三者學(xué)習(xí)成績處于并列的位置,沒有優(yōu)劣或高低之分;但將原始分?jǐn)?shù)轉(zhuǎn)換成標(biāo)準(zhǔn)分?jǐn)?shù)后,以Z值的總和相比較,學(xué)生09的Z總為-1.013,學(xué)生10的為-1.189,學(xué)生22的為-0.777,則可以看出學(xué)生22的成績要比學(xué)生09的高,而學(xué)生09的成績又比學(xué)生10的要高。從“Z總”這一欄,我們可以明確地看到學(xué)生22、學(xué)生09和學(xué)生10在班級成績中的排名分別為第26、第29和第31。三者原始總分相等,沒法比較,但按標(biāo)準(zhǔn)分來分析,他們這幾科的總成績卻有高低之分。
從表1還可以看到,學(xué)生07的總分為189,學(xué)生28的總分為195,以三科的總分來判定成績的優(yōu)劣,學(xué)生28排第8名,學(xué)生07則排第12名。表面上學(xué)生28的成績似乎要比學(xué)生07的成績好。但是,按原始總分計算只考慮了分值,并沒有考慮各分值在各自總體(即各自科目的分?jǐn)?shù)總體)中的價值,這種考慮是欠妥的。分?jǐn)?shù)的價值應(yīng)用最佳地位量標(biāo)準(zhǔn)分?jǐn)?shù)來表示。那么將學(xué)生07和學(xué)生28的三科考分都換成Z值(見表1),以Z值的總和相比較,Z為1.748,而Z為1.433,則可看出學(xué)生07的分?jǐn)?shù)價值要比學(xué)生28的高。學(xué)生07的成績優(yōu)于學(xué)生28,兩者的排名恰與原始分?jǐn)?shù)的排名截然相反。若要推薦優(yōu)秀生,推薦學(xué)生07更為合理。其道理從學(xué)生08的泛讀為84分,其Z值為1.291,與學(xué)生30的聽力為84分,其Z值為1.775的比較分析可以顯示出來。從原始分?jǐn)?shù)看,同是84分,但由于分別位于不同科目的不同分布中,其價值是不同的。受試題難度和區(qū)分度大小的影響,導(dǎo)致了泛讀的“1分”與聽力的“1分”不等值,便造成了這樣的現(xiàn)象:同樣是84分的兩科成績卻反映出兩種高低不同的水平。
上述例子表明,使用原始分?jǐn)?shù)難以對學(xué)生的水平進(jìn)行科學(xué)的比較。將原始分?jǐn)?shù)相加得到總分的方法,就好比將100元人民幣加上100元港幣再加上100元美元得到300元一樣,是不能反映三種貨幣在總額中的真實價值的。由此可見,原始分?jǐn)?shù)不具有簡單的可加性,幾門原始成績的總分并不能說明個體在團(tuán)體中的實際排名,不能確切評價學(xué)生成績的優(yōu)劣,甚至?xí)a(chǎn)生與學(xué)生實際水平截然不同的結(jié)果。而標(biāo)準(zhǔn)分是以群體的平均分為參照、以標(biāo)準(zhǔn)差為度量單位的一種分?jǐn)?shù),是在消除考試難度、考生不確定因素產(chǎn)生的抽樣誤差影響,將考試成績(分?jǐn)?shù)制)通過某種變換而得到的具有明確區(qū)分、比較特性的考試成績。所以標(biāo)準(zhǔn)分能夠直接比較不同學(xué)生不同學(xué)科的總成績,能夠客觀、公正地反映各個學(xué)生的成績在群體成績中的實際地位或?qū)嶋H排名。
(三)可比較某學(xué)生不同學(xué)科與階段的成績,正確評價其學(xué)習(xí)的發(fā)展。
我以某高校某學(xué)生第一學(xué)年(兩個學(xué)期)大學(xué)語文與大學(xué)英語成績?yōu)槔齺碚f明這個問題,見表2。
按表2中的原始分?jǐn)?shù)評價,有人認(rèn)為該生的語文成績有進(jìn)步,而英語學(xué)習(xí)有退步。而若將該生的成績標(biāo)準(zhǔn)化后,不難發(fā)現(xiàn),該生的語文成績在班上的相對位置沒有變化,而英語成績第二學(xué)期雖比第一學(xué)期低7分,但標(biāo)準(zhǔn)分?jǐn)?shù)提高了,說明該生在班上的相對成績有所提高。同樣,若僅看該生的第二學(xué)期成績:語文86分,英語80分,不少人會認(rèn)為該生的語文比英語學(xué)得好。但我們從表2中可知,該生的語文成績高于平均成績0.96個標(biāo)準(zhǔn)差,英語成績高出平均成績1.16個標(biāo)準(zhǔn)差,英語成績比語文成績在班上的相對位置高,因而相對來說該生的英語學(xué)得較好。所以只憑借原始分?jǐn)?shù)盲目評價學(xué)生是不恰當(dāng)?shù)摹H绻處煵捎脴?biāo)準(zhǔn)分?jǐn)?shù),就可以掌握每個學(xué)生學(xué)習(xí)某科成績發(fā)展趨勢,了解學(xué)生知識的掌握程度。
五、結(jié)語
無論用原始分?jǐn)?shù)比較單科成績還是比較總成績都是不科學(xué)的,因為各原始分?jǐn)?shù)分別位于不同科目的不同分布中,價值不同,沒有同一的測量尺度,因而不可加與不可比。標(biāo)準(zhǔn)分是采取統(tǒng)計學(xué)的計算方法計算出的一種數(shù)據(jù),利用這種計算方法可以避免多次考試因試題量不同及試題難度不同而造成的前面提到的對學(xué)生的學(xué)習(xí)情況評價不確切的情況發(fā)生,使課程之間、學(xué)生之間、班級之間、年級之間和學(xué)校之間具有可比性,可對同一考試各科進(jìn)行橫向比較,也可對同一學(xué)科不同時期的考試縱向比較,找到個體在總體內(nèi)的位置,從而對全校教學(xué)情況一目了然,教學(xué)管理也可以做到心中有數(shù)。
當(dāng)前,仍有相當(dāng)一部分教師用原始分?jǐn)?shù)作為考試成績評價的依據(jù),尚未認(rèn)識到原始分?jǐn)?shù)的局限性。因而,我認(rèn)為對標(biāo)準(zhǔn)分?jǐn)?shù)的認(rèn)同需要宣傳,讓教師更了解標(biāo)準(zhǔn)分的意義和作用,盡快地接受標(biāo)準(zhǔn)分,并運用標(biāo)準(zhǔn)分更好、更科學(xué)和更合理地評價學(xué)生的考試成績,客觀地了解學(xué)生的學(xué)習(xí)動態(tài),做到有的放矢、因材施教。
參考文獻(xiàn):
?。?]羅玉蓮等.標(biāo)準(zhǔn)分及其應(yīng)用[J].吉安師專學(xué)報,1998,VOL19,(5).
?。?]劉曉莉.標(biāo)準(zhǔn)分與考試成績評估[J].佛山科學(xué)技術(shù)學(xué)院學(xué)報(自然科學(xué)版),1999,VOL17,(4).
?。?]廖平勝等.考試學(xué)[M].武漢:華中師范大學(xué)出版社,1988.
?。?]張玉田等.學(xué)校教育評價[M].北京:中央民族大學(xué)出版社,1998.
?。?]將慶偉等.教育科研中的量化方法[M].北京:中國科學(xué)技術(shù)出版社,1997.
?。?]唐小杰等.課堂教學(xué)與學(xué)習(xí)成績評價[M].南寧:廣西教育出版社,2000.
注:“本文中所涉及到的圖表、公式、注解等請以PDF格式閱讀”