劉長虹 郝杰 楊晨 陳凱倫
摘 要: 根據(jù)教育統(tǒng)計學理論,考試數(shù)據(jù)的前四階矩,即均值、標準差、偏度、峰度,用于分析學生的學習狀態(tài)。通過對不同年級、專業(yè)的考試數(shù)據(jù)所做的前四階矩計算分析,提出考試數(shù)據(jù)的前四階矩可以分別反映出班級學生的學習情況。因此,可以根據(jù)各個班級考試成績數(shù)據(jù)分布特征量,有針對性地提出改善班風、學風的建議。
關(guān)鍵詞: 學風建設(shè) 考試數(shù)據(jù)分布 統(tǒng)計分析 前四階矩
在高校教學過程中,各門課程的考試成績是衡量教學質(zhì)量、學生知識掌握程度、學習能力、保研出國深造及就業(yè)的重要評價指標之一。實際上,教育統(tǒng)計學對于學生考試成績的分析研究早已成為一門專門的學科,在教育學領(lǐng)域中得到了廣泛應(yīng)用[1,2]。隨著數(shù)據(jù)挖掘技術(shù)的發(fā)展和應(yīng)用,將考試數(shù)據(jù)挖掘研究應(yīng)用于對教學質(zhì)量分析上,取得了很大的進展[3]。但是如何將考試成績的統(tǒng)計分析,應(yīng)用于指導學生學習和學風建設(shè)中,目前還少有論述。下面試著對上述問題進行討論。
1.考試成績數(shù)據(jù)分布的特征量
考試成績數(shù)據(jù)分布的特征量,指數(shù)據(jù)統(tǒng)計中的前四階矩[2,4,5]。由于考試成績數(shù)據(jù)服從概率分布已是公認的事實,通常各個教學部門都會統(tǒng)計考試數(shù)據(jù)的前兩階概率矩,即考試成績的均值、標準差。但是從事教學工作的教師都清楚,各門學科的考試成績并不一定服從正態(tài)分布。因此,考試成績的前兩階矩無法全面評價學生成績的情況。根據(jù)概率統(tǒng)計理論,一般采用前四階概率矩就可以近似逼近任意概率分布函數(shù)[6]。
描述考試數(shù)據(jù)前四階矩,也就是均值、標準差、偏度和峰度的計算公式如下[6],
是偏倚度,如果概率密度函數(shù)對稱時,其值為零。而α4g是峰度,在正態(tài)分布情況下,其值為3。
2.考試成績的前四階矩
考試成績的前四階矩分別是均值、標準差、偏度和峰度。其中,均值表示考試成績的平均分數(shù),標準差表示考試成績的分散程度。偏度衡量實數(shù)隨機變量概率分布的不對稱性,當偏度為負(稱為負偏態(tài)),意味著在概率密度函數(shù)左側(cè)的尾部比右側(cè)的長,絕大多數(shù)的考試分數(shù)值(包括中位數(shù)在內(nèi))位于平均分數(shù)的右側(cè);偏度為正(正偏態(tài))就意味著在概率密度函數(shù)右側(cè)的尾部比左側(cè)的長,絕大多數(shù)的值(包括中位數(shù)在內(nèi))位于平均值的左側(cè);偏度為零,表示考分相對均勻地分布在平均分數(shù)的兩側(cè),但不一定意味著是對稱分布。峰度是描述考試分數(shù)概率密度函數(shù)分布形態(tài)陡緩程度的統(tǒng)計量,是和正態(tài)分布相比較的量,當峰度值是3,其考試數(shù)據(jù)服從正態(tài)分布。
下面分別對不同年級、專業(yè)班級的考試數(shù)據(jù)進行計算,根據(jù)上述公式,得到相應(yīng)考試數(shù)據(jù)的前四階距。為了舉例說明,表1列出其中三個班級的三門基礎(chǔ)理論課程考試成績的前四階矩。為方便起見,分別稱三個班為A、B、C。
由表1可以看出,各個班級的考試成績分布并不全是服從于正態(tài)分布和對稱分布的,在9個項目的考試成績峰度值中,只有A班大學物理、C班線性代數(shù)和電工技術(shù)三項成績的峰度值接近3,近似于正態(tài)分布的峰態(tài)屬于常峰態(tài)。B班偏度接近于0為0.0113,即考分分布近似對稱分布于平均分數(shù)兩側(cè)。
其次,如果均值和標準差很接近,就不能保證考試成績分布一致。以大學物理考試成績?yōu)槔齻€班級的均值在75分上下,方差在11到15分之間,盡管三個班考試成績的均值和方差均相差不大。但是三個班的偏度和峰度卻相差較大。三個班級中只有班級A的大學物理考試分布近似為正態(tài)分布,其余兩個班的考試成績則不服從正態(tài)分布。
在表1中,只有B班線性代數(shù)的偏度大于零,偏度大于零表示該班大于平均分數(shù)的人數(shù)多于小于平均數(shù)人數(shù)。如果假設(shè)線性代數(shù)考試難度一致無差異的前提下,與其他兩個班級的成績相比,說明B班大部分同學對這門課程掌握程度最好,A班次之,C班最差。
在電工技術(shù)考試成績中,B班偏度最小為-2.09,標準差也是最小為7.74,而峰度為最大值8.39,結(jié)合上述三個指標,說明有較多同學低于平均分數(shù),但是多數(shù)學生分數(shù)的差距不大。如同一個陡峭山峰一樣,分數(shù)緊密靠在一起,說明盡管B班總體上不如其他兩個班對這門課程掌握得好,但是在班級內(nèi)對該門課知識掌握的差距不大。通過進一步的調(diào)查發(fā)現(xiàn),B班通常采取集體復習方式,所以大部分同學復習充分得分較高,導致最大峰度值。
在表1中,A班是標準差最大的班級,該班分數(shù)分散性最大,結(jié)合峰度情況,表示該班級同學們學習成績分散性較強。事實證明,該班級在學習方面,同學之間協(xié)作少、獨立性最強。因此,在班風建設(shè)時,應(yīng)鼓勵同學們在學習中相互幫助,有意識地培養(yǎng)全班同學集體自習的習慣。
除了大學物理成績外,B班考試的平均分數(shù)最高,標準差是三個班中最小的。標準差小即分數(shù)離散程度低,說明該班級同學對知識掌握差異性較小,或者在學習方面團結(jié)性最強。調(diào)查表明,B班是在各科學習時相互幫助、協(xié)作性最強的班級。
盡管C班各科平均成績均處于中間水平,而且峰度值較大。但是標準差也較大,偏度為較大的負值,說明盡管大部分同學在平時學習上相互協(xié)助較好,特別是物理成績峰度為6.2,體現(xiàn)該班大部分同學能夠參加集體自習,但是由于有少數(shù)同學學習狀態(tài)差距較大,為此拉低了全班成績,使得考分標準差較大。因此,應(yīng)該提倡班里采取成績優(yōu)秀的和成績差的同學“結(jié)對子”,以提高全班平均成績,降低成績的標準差。
3.結(jié)語
通過上述對于各個年級、班級考試成績的前四階矩計算分析,得出以下結(jié)論:考試平均分代表整體學生學習的平均水平;成績的標準差代表考試分數(shù)的離散程度,與學生對知識掌握程度的差異有關(guān),班級中好和差成績相距較大;偏度則表示考試分布是否高于或低于平均水平的程度。當峰度為負值時,表示有較多同學考試成績高于班平均分,該班學風較好;峰度則表示考試分數(shù)是否像陡峭山峰聚集在一起的程度,體現(xiàn)出班級在學習中團結(jié)程度。因此,通過綜合分析考試成績的前四階矩,可以了解學生的學風和班風情況,從而對癥處理,在班風、學風建設(shè)中取得更好的效果。
參考文獻:
[1]劉新平,劉存?zhèn)b.教育統(tǒng)計與測評導論[M].北京:科學出版社,2003.
[2]王孝玲,趙必華.教育統(tǒng)計學[M].北京:北京師范大學出版集團,2008.
[3]劉小桃,林延慶.數(shù)據(jù)挖掘技術(shù)在高校學生學習成績分析中的應(yīng)用[J].考試周刊,2014,41:108-109.
[4]常振江.學生成績分布與一種簡便的評估試卷命題質(zhì)量的方法[J].遼寧師范大學學報(自然科學版),2003,26(1):109-112.
[5]許年春,劉東燕,夏文靜,黃林青.高校學生課程考試成績的正態(tài)化換算方法研究[J].重慶科技學院學報(社會科學版),2014,7:143-146.
[6]李超,劉長虹.蠕變損傷概率的Edgeworth級數(shù)近似分布函數(shù)的研究[J].機械設(shè)計與制造,2013,9:124-129.