姚春艷 張勇
2013年教育部《關(guān)于推進中小學(xué)教育質(zhì)量綜合評價改革的意見》(以下簡稱《意見》)中明確了若干個需要完成的實驗任務(wù),“健全評價標準”是其中之一。所謂評價標準,是指在評價活動中應(yīng)用于對象的價值尺度和界限,是對評價結(jié)果做出有意義解釋的依據(jù)。如何健全中小學(xué)教育質(zhì)量綜合評價標準呢?
根據(jù)評價指標的特點,確定指標適合絕對評價還是相對評價
以評價標準分類,教育評價可以分為絕對評價和相對評價兩大類。絕對評價(absolute evaluation)是指在評價對象的群體之外,以預(yù)先制定的目標為評價基準,把評價對象與之比較,確定評價對象達到目標基準絕對位置的評價。相對評價(relative evaluation)是在被評價對象的集合中選取一個或若干個作為基準,然后把各個評價對象與基準進行比較,從而評出其在團體中的相對位置的評價。絕對評價的優(yōu)點是:為評價對象提出了明確的努力方向和應(yīng)達到的目標,有利于引導(dǎo)評價對象克服盲目性,增強自覺性,排除干擾,從而提高工作、學(xué)習效益;在準確的評價之后,每個被評者可以明確自己的實際水平及與客觀標準的差距,有利于創(chuàng)設(shè)一種積極向上的氛圍。絕對評價的缺點則表現(xiàn)為:評價標準的制定對人員的專業(yè)性要求極高;評價對象由于欠缺橫向比較容易產(chǎn)生自我滿足,不利于形成競爭氛圍。
相對評價的優(yōu)點有:適應(yīng)性強,應(yīng)用面廣,不管團體狀況如何,都可以進行比較,都能評出個體在集體中的相對位置;用建立在對評價對象群體測評基礎(chǔ)之上的標準進行評價,可以發(fā)現(xiàn)其個別差異,從而對被評個體做出較為客觀、公正和確切的判斷;有利于激發(fā)評價對象的競爭意識。相對評價的局限性在于:因缺乏外在的客觀標準,評選出來的優(yōu)秀者未必就是真正的高水平、高質(zhì)量者,未被選上的也不一定水平低、質(zhì)量差,故容易降低客觀標準;評價的結(jié)果所反映的只是評價對象在一定范圍內(nèi)的相對位置,不一定反映他們的實際水平;易忽視教育目標的完成情況;易導(dǎo)致激烈的、無休止的競爭,從而挫傷一部分人的積極性。
由于絕對評價與相對評價各有利弊,因此,自20世紀80年代以來,將絕對評價與相對評價結(jié)合在一起,使雙方形成相容的互補關(guān)系的思想,代表了教育評價理論的發(fā)展趨勢。目前,美國和日本等國家采取絕對評價和相對評價并用的辦法。
中小學(xué)教育質(zhì)量綜合評價改革給出了20項關(guān)鍵指標,有些指標是可以建立明確的客觀標準的,如學(xué)業(yè)發(fā)展水平中的知識技能以及學(xué)科思想方法。由于國家已經(jīng)頒布了學(xué)科課程標準,對各個學(xué)科的學(xué)生在不同的學(xué)段應(yīng)該掌握的知識、技能以及學(xué)科思想方法做出了較為明確的規(guī)定,因此可以采用絕對評價。而另外一些指標,如興趣特長養(yǎng)成中的潛能發(fā)展,則只適宜采用相對評價。因此,若要為中小學(xué)教育質(zhì)量綜合評價改革各指標健全評價標準,需要先明確各個指標適用的評價標準。
查考各種相關(guān)文件,為適合絕對評價的指標建立客觀評價標準
依據(jù)絕對評價的定義可知,絕對評價是在被評價對象之外,存在一個預(yù)先制定的評價標準,這種標準是不依賴于被評價對象的客觀標準。客觀標準的制定,必然要參考已有的規(guī)定、要求、標準等。2013年《意見》文件附帶的《中小學(xué)教育質(zhì)量綜合評價指標框架(試行)》(以下簡稱《指標框架》)給出了各評價指標的主要評價依據(jù)。相關(guān)人員需要做的,就是查考這些文件,將散落在各個文件中的、與同一指標有關(guān)的要求整合在一起,即可形成某一指標的客觀評價標準。下表中給出的是2013年《指標框架》中適宜采用絕對評價、可以健全客觀標準的評價指標以及建立客觀標準可以參考的依據(jù)。
以統(tǒng)計學(xué)知識與方法為依據(jù),為適合采用相對評價的指標建立相對評價標準
對于那些僅適合相對評價的指標,需要通過一定的方法,在評價對象群體中確立一些基準,即相對評價的標準,使得各個評價對象可以與之相比較,進而獲得關(guān)于被評價個體的認識和理解。現(xiàn)代統(tǒng)計學(xué)知識及方法在設(shè)立這類相對評價標準方面可以提供非常有益的幫助。一般而言,同時采用反映數(shù)據(jù)集中趨勢和離散趨勢的兩類統(tǒng)計指標,能更有效地幫助數(shù)據(jù)使用者做出判斷。
傳統(tǒng)評價中,應(yīng)用最為廣泛的,用于反映數(shù)據(jù)集中趨勢的統(tǒng)計量是平均分。但平均分在代表一組數(shù)據(jù)的集中趨勢時,容易受到極端值影響,從而使其對總體的代表性降低。因此,為了更為客觀地反映一組數(shù)據(jù)的集中趨勢,可以在平均數(shù)(分)基礎(chǔ)上,引入中位數(shù)(分)。中位數(shù)不受數(shù)列的極大或極小值影響,從而在一定程度上提高了數(shù)列分布的代表性。和平均數(shù)(分)相比,中位數(shù)(分)在反映數(shù)據(jù)集中趨勢時的優(yōu)勢可以從表2的例子中看出。
從上表中可以看出,雖然A學(xué)校和B學(xué)校的平均成績相同,但B學(xué)校的中位分卻顯示,B學(xué)校有50%的學(xué)生的成績高于69.5分,而A學(xué)校50%的學(xué)生的成績只是高于68.06分。使得兩所學(xué)校的平均分相等的原因在于,同B學(xué)校相比,A學(xué)校中存在極高值(100)和極低值(10),因此,雖然兩所學(xué)校的平均分相同,但B學(xué)校的平均分的代表性要優(yōu)于A學(xué)校。如果沒有中位分作為參考,僅從平均分來判斷,我們會得出A學(xué)校和B學(xué)校情況差不多的結(jié)論。引入中位分,就會使評價結(jié)果的可解釋性進一步增強。
在教育評價中,我們經(jīng)常會遇到需要進行多組數(shù)據(jù)之間的比較,如一個班級的語文、數(shù)學(xué)、英語三科同時比較,希望獲得學(xué)生在哪一個學(xué)科上表現(xiàn)更好的信息。如果每一科的滿分都是100分,則使用平均分進行比較可以獲得一定的信息。然而,當每科的滿分不同時,采用平均分將無法比較。此時需要引入平均得分率(比值),比較才有意義。表3是一個關(guān)于平均得分率在多組數(shù)據(jù)比較中的優(yōu)勢的例子。
在教育評價中,除了用反映集中趨勢的統(tǒng)計指標了解學(xué)生群體的整體特征外,有時也需要了解數(shù)據(jù)的離散情況,即每個數(shù)據(jù)偏離指定的基準的程度。平均數(shù)相同的兩組數(shù)據(jù)其離散程度完全有可能不同。如果一組數(shù)據(jù)的分布比較集中,差異較小,則平均數(shù)的代表性較好,如表2中的B學(xué)校的學(xué)生成績;若另一組數(shù)據(jù)比較分散,差異較大,則平均數(shù)的代表性就較差,如表2中的A學(xué)校的學(xué)生成績。一組數(shù)據(jù)或成績的離散情況反映的是被評價對象之間的均衡性,離散程度越高,表明均衡性越差,反之,則均衡性越好。良好的教育質(zhì)量,應(yīng)該是在平均分高的同時,學(xué)生的均衡性也較好。因此反映數(shù)據(jù)離散趨勢的統(tǒng)計指標應(yīng)該成為相對評價的另外一個標準。
以往教育評價中常用的反映數(shù)據(jù)離散趨勢的統(tǒng)計指標是標準差。然而,標準差只能度量一組數(shù)據(jù)對其均值的偏離程度。若要比較兩組以上數(shù)據(jù)的離散程度,用兩個標準差直接進行比較有時就顯得不合適了。在這種情況下,可以引入另外一個統(tǒng)計量:變異系數(shù)。變異系數(shù)的公式為:SD/MN*100,其中SD為每組數(shù)據(jù)的標準差,MN為每組數(shù)據(jù)的平均值。變異系數(shù)使得不同數(shù)據(jù)組的離散程度變得可比,用在學(xué)校教育質(zhì)量評價中,能夠更有效地發(fā)現(xiàn)不同學(xué)校之間的差異。
表4、5是關(guān)于集中趨勢與離散趨勢統(tǒng)計數(shù)據(jù)在教育評價中的應(yīng)用案例。
從表4中可以看出,學(xué)校B是三所學(xué)校中不僅平均成績最高,同時學(xué)生成績的均衡性也是相對較好的一所學(xué)校,而學(xué)校A不僅平均成績最低,且學(xué)生成績的均衡性也是較差的一個,是需要我們重點關(guān)注的學(xué)校;而學(xué)校C,雖然平均成績處于中等,但學(xué)生成績的均衡性也相對較差。各個學(xué)校的特點通過這些數(shù)據(jù)表現(xiàn)得更為清晰,學(xué)校后期改進的方向也會更為明確。
而從表5中則可以看出,在這次測試中,“四則運算”是學(xué)生掌握較好,同時成績的均衡性也相對較高的一個知識點,而“單名數(shù)復(fù)名數(shù)的互換”則是學(xué)生掌握相對較差,且學(xué)生間的均衡性也較差的一個知識點,但由于中位數(shù)得分率為100,表明有一半學(xué)生是已經(jīng)完全掌握了該知識點的,而導(dǎo)致平均成績低的原因,必然是后50%的學(xué)生中存在極低值,不僅影響了平均分,也使成績的均衡性受到較大影響。通過分析這些數(shù)據(jù),學(xué)校后續(xù)教學(xué)中應(yīng)關(guān)注的學(xué)生群體以及關(guān)注的重點就非常清楚了。
通過上述兩個應(yīng)用案例可知,恰當?shù)卦O(shè)定相對評價的標準,將有助于更為精準地診斷學(xué)校、教學(xué)中存在的各類問題。