◇謝家發(fā)
在描述一組數(shù)據(jù)時我們常常用一些特征量來表示這組數(shù)據(jù)的集中趨勢或典型水平。這些特征量代表這組數(shù)據(jù)的頻數(shù)分布中大量數(shù)據(jù)向某一點集中的情況,從而反映數(shù)據(jù)資料的典型水平。例如:要對某學(xué)院2012屆會計與統(tǒng)計核算專業(yè)所有畢業(yè)生各科成績的集中趨勢進(jìn)行分析比較時,顯然不能是各個畢業(yè)生之間的比較,而必須先計算出一個(或幾個)代表本屆該專業(yè)畢業(yè)生各科成績水平的統(tǒng)計量,然后再對各科成績的集中趨勢進(jìn)行比較分析。因為這些統(tǒng)計量既是表明本屆該專業(yè)畢業(yè)生各科成績中心點的統(tǒng)計量,又是表明本屆該專業(yè)畢業(yè)生各科成績最中間一點的統(tǒng)計量,還是表明本屆該專業(yè)畢業(yè)生各科成績出現(xiàn)最多的統(tǒng)計量,更是表明本屆該專業(yè)畢業(yè)生成績分布范圍的統(tǒng)計量。
這些統(tǒng)計量之所以能代表本屆該專業(yè)畢業(yè)生各科成績進(jìn)行相互比較,是因為它們從不同角度度量了本屆該專業(yè)畢業(yè)生各科成績集中于哪一點或哪些范圍,因而通常稱為集中趨勢的度量。常用度量集中趨勢的特征值有均值、中位數(shù)、眾數(shù)和分位數(shù)等。均值又叫算術(shù)平均數(shù),算術(shù)平均數(shù)是總體標(biāo)志總量與總體單位總數(shù)之比值,是一種表示集中趨勢最常用的統(tǒng)計量。位置平均數(shù)有眾數(shù)和中位數(shù),四分位數(shù)有下四分位數(shù)和上四分位數(shù)。現(xiàn)對某學(xué)院2012屆會計與統(tǒng)計核算專業(yè)所有畢業(yè)生各科成績分別計算了算術(shù)平均數(shù)、眾數(shù)、中位數(shù)、下四分位數(shù)和上四分位數(shù)等,其結(jié)果如下表所示。
特征值科目 大學(xué)英語最小值下四分位數(shù)平均數(shù)中位數(shù)眾數(shù)上四分位數(shù)最大值34.0 71.0 77.4 79.0 85.0 85.0 96.0大學(xué)語文1.5 85.0 88.4 88.0 90.0 92.0 98.0高等數(shù)學(xué)33.0 76.0 83.2 88.0 94.0 95.0 100.0基礎(chǔ)會計26.0 76.0 82.8 86.0 91.0 92.0 100.0體育(一)70.0 82.0 84.8 84.0 80.0 87.0 99.0計算機(jī)應(yīng)用基礎(chǔ)65.0 82.0 86.7 89.0 91.0 92.0 100.0體育(二)1.0 83.0 86.4 86.0 80.0 90.0 100.0統(tǒng)計學(xué)原理33.0 73.0 80.7 84.0 88.0 90.0 100.0財務(wù)會計60.0 82.0 87.6 91.0 96.0 96.0 100.0企業(yè)經(jīng)濟(jì)統(tǒng)計46.0 77.0 84.5 87.0 92.0 93.0 100.0
續(xù)表
如果我們將以上這十九門課程的下四分位數(shù)、最大值、最小值、中位數(shù)和上四分位數(shù)五個特征值繪制成箱線圖,結(jié)果如下圖所示。
從圖中不難看出各科成績分布的均勻程度、集中趨勢、分散程度等特點??偟膩砜?,各科成績的上四分位數(shù)與其對應(yīng)的極大值之間距離都比較近,差異不大,說明有25%畢業(yè)生成績分布在這個小范圍內(nèi);而各科成績的下四分位數(shù)與其對應(yīng)的極小值之間的距離卻遠(yuǎn)近不一,差別很明顯,說明還有25%畢業(yè)生成績分布在這個大小不等的范圍內(nèi)。但經(jīng)仔細(xì)觀察和分析,不難發(fā)現(xiàn)各科成績分布存在以下三個特點:第一,體育(一)、收銀與出納技術(shù)、稅法等課程的箱子最短,說明這些課程成績的四分位差小,在上下四分位數(shù)之間云集了50%畢業(yè)生的成績,同時上四分位數(shù)與極大值之間的距離以及下四分位數(shù)與極小值之間的距離也都很短,這也說明另外50%畢業(yè)生的成績離中位數(shù)距離也不遠(yuǎn),對整體均勻程度、集中趨勢影響不大,所以單科成績分布集中、均勻程度高,集中趨勢特別明顯;第二,相比較之下高等數(shù)學(xué)、會計電算化和基礎(chǔ)會計等課程的箱子最長,說明這些課程成績的四分位差大,在上下四分位數(shù)之間包括了50%畢業(yè)生的成績,同時下四分位數(shù)與極小值之間的距離很大,這也說明另外25%畢業(yè)生的成績離中位數(shù)距離很遠(yuǎn),對整體均勻程度、集中趨勢影響較大,所以單科成績分布分散,均勻程度低,離中趨勢十分明顯;第三,還有大學(xué)語文、體育(二)和會計實務(wù)等課程的箱子雖然也很小,并且上四分位數(shù)與極大值之間的距離也很近,但是下四分位數(shù)與極小值之間的距離卻很遠(yuǎn),說明還有25%畢業(yè)生成績分散在這個大范圍之內(nèi),這就影響了單科成績整體的均勻程度和集中趨勢,自然這些課程均值的代表性也就遠(yuǎn)不如其它各科成績了。
當(dāng)單科成績完全處于對稱分布時,那么根據(jù)該科成績計算的算術(shù)平均數(shù)、中位數(shù)和眾數(shù)三者相等,即=Me=M0。這樣上四分位數(shù)與中位數(shù)、均值或眾數(shù)之差也就等于中位數(shù)與下四分位數(shù)、均值或眾數(shù)之差,即 Q3-Me(或、M0)=Me-Q1(或、M0)。但是,當(dāng)單科成績非完全處于對稱分布,而是處于右偏或左偏分布時,那么據(jù)此計算的算術(shù)平均數(shù)、眾數(shù)、中位數(shù)、下四分位數(shù)和上四分位數(shù)之間卻存在著各種不同的數(shù)量關(guān)系。比如,從表中對19門課程所分別計算的算術(shù)平均數(shù)、眾數(shù)、中位數(shù)、下四分位數(shù)和上四分位數(shù)看,其中依據(jù)各科成績計算的中位數(shù)、算術(shù)平均數(shù)均界于對應(yīng)課程成績上下四分位數(shù)之間,即大于下四分位數(shù),小于上四分位數(shù),用公式表示為:Q1<<Q3,Q1<Me<Q3。而眾數(shù)與四分位數(shù)的關(guān)系卻比較復(fù)雜。第一種現(xiàn)象,有的課程成績計算的眾數(shù)是介于對應(yīng)課程成績上下四分位數(shù)之間。比如表中“高等數(shù)學(xué)”這門課程成績的下四分位數(shù)、眾數(shù)和上四分位數(shù)分別是76分、94分和95分;再比如表中“基礎(chǔ)會計”這門課程的情況也是如此。第二種情況,也有的課程成績計算的眾數(shù)是介于對應(yīng)課程成績上四分位數(shù)或下四分位數(shù)之外。比如表中“體育(二)”這門課程,該課程成績的眾數(shù)是80分、下四分位數(shù)是83分,所以該門課程成績的眾數(shù)小于下四分位數(shù);而表中“會計電算化”這門課程情況卻相反,該課程成績的眾數(shù)是95分、上四分位數(shù)是92分,因此該門課程成績的眾數(shù)又大于上四分位數(shù)。第三種情況,還有的課程成績計算的眾數(shù)是與對應(yīng)課程成績上四分位數(shù)或下四分位數(shù)相等。比如表中“大學(xué)英語”這門課程,該課程成績的眾數(shù)是85分、上四分位數(shù)也是85分,所以該門課程成績的眾數(shù)等于上四分位數(shù);又比如表中“收銀與出納技術(shù)”這門課程,該課程成績的眾數(shù)是83分、下四分位數(shù)也是83分,所以該門課程成績的眾數(shù)等于下四分位數(shù)。由此我們不難得出如下結(jié)論:在不同的情況下,眾數(shù)既可以在上下四分位數(shù)之間,即Q1<M0<Q3;也可以在上下四分位數(shù)之外,即M0>Q3或M0<Q1;還可以與上四分位數(shù)或下四分位數(shù)相等,即 Q1=M0,Q3=M0。
同時,在單科成績分布呈現(xiàn)右偏或左偏時,所計算的算術(shù)平均數(shù)、中位數(shù)和眾數(shù)三者之間還分別存在三種情況。當(dāng)單科成績分布右偏時,眾數(shù)始終是最大,算術(shù)平均數(shù)最小,中位數(shù)居中,即<Me<M0。比如表中“基礎(chǔ)會計”這門課程成績的算術(shù)平均數(shù)、中位數(shù)和眾數(shù)分別是82.8分、86分和91分。但也有算術(shù)平均數(shù)等于中位數(shù)而中位數(shù)又小于眾數(shù)的情況,即=Me<M0?;蛘呤撬阈g(shù)平均數(shù)小于中位數(shù)而中位數(shù)又等于眾數(shù)的情況,即<Me=M0,比如表中“稅法”這門課程成績的算術(shù)平均數(shù)、中位數(shù)和眾數(shù)分別是82.77分、84分和84分。當(dāng)單科成績分布左偏時,眾數(shù)始終是最小,算術(shù)平均數(shù)最大,中位數(shù)居中,即>Me>M0。比如表中“收銀與出納技術(shù)”這門課程成績的算術(shù)平均數(shù)、中位數(shù)和眾數(shù)分別是87.5分、86分和83分。但也有算術(shù)平均數(shù)等于中位數(shù)而中位數(shù)又大于眾數(shù)的情況,即;=Me>M0,比如表中“財務(wù)會計”這門課程成績的算術(shù)平均數(shù)、中位數(shù)和眾數(shù)分別是84分、84分和83分?;蛘呤撬阈g(shù)平均數(shù)大于中位數(shù)而中位數(shù)又等于眾數(shù)的情況,即>Me=M0。
綜上所述,算術(shù)平均數(shù)、眾數(shù)、中位數(shù)、下四分位數(shù)和上四分位數(shù)在總體分布不是完全對稱的情況下,它們之間的數(shù)量關(guān)系各有不同,在進(jìn)行數(shù)據(jù)分析時尤其需要重視,否則會得出完全相反的結(jié)論。