袁勝波
【中圖分類號】G633.6 【文獻標識碼】A 【文章編號】2095-3089(2016)34-0167-02
平均分析的方法在整個統(tǒng)計方法體系中占有十分重要的地位,很多統(tǒng)計分析方法都以平均分析為依托。譬如動態(tài)分析,指數(shù)分析,抽樣估計,回歸分析等等,無一不與平均分析相關(guān)聯(lián),具有基礎性作用。而算術(shù)平均數(shù)又是所有平均數(shù)里面最為基本最為重要的一種平均數(shù)。但一直以來,在統(tǒng)計學教科書的編寫上,對于算術(shù)平均數(shù)計算方法的闡述,卻存在較大的弊端,以至于對教學產(chǎn)生了不利影響。
一、算術(shù)平均數(shù)是否存在“基本公式”?
幾乎所有的統(tǒng)計教材都會在具體介紹算術(shù)平均數(shù)的計算方法之前,先給出一個算術(shù)平均數(shù)的基本公式,即:算術(shù)平均數(shù)=標志總量/總體總量。可以舉出許多例子,說明算術(shù)平均數(shù)的計算符合這個基本公式。譬如,三個學生的身高分別為1.7m,1.6m,1.5m,身高的算術(shù)平均數(shù)=總身高/總?cè)藬?shù)=Σx/n=(1.7+1.6+1.5)/3=1.6m。符合“基本公式”。如果在已分組(變量數(shù)列)條件下,譬如有30名學生的身高資料:
身高(m.) 人數(shù)(人)f. 組中值x. 總身高xf
1.5~1.6 10 1.55 15.5
1.6~1.7 18 1.65 29.7
1.7~1.8 2 1.75 3.5
Σ 30 — 48.7
30名學生身高的算術(shù)平均數(shù)=Σxf/Σf=48.7/30=1.62m。不管是未分組或是已分組,不管是簡單算術(shù)平均數(shù)或是加權(quán)算術(shù)平均數(shù),都是用總身高比總?cè)藬?shù),符合“標志總量/總體總量”這一“基本公式”的算法。
但只要稍加推廣,這個“基本公式”并不“基本”,并不具備任何普遍意義,計算上存在很大的局限性,實際上只適用于對絕對數(shù)計算平均數(shù)。比如上面學生身高就是絕對數(shù),平均身高的算法就符合所謂基本公式的算法。如果平均的對象即各單位變量值是對相對數(shù)或平均數(shù),這個基本公式就不適用了。譬如,三個班的學生考同一科的及格率分別為90%,85%,80%,求平均及格率。這是對3個單位的3個相對數(shù)計算平均數(shù),這個時候能不能用“標志總量/總體總量”?回答顯然是否定的。首先,不能計算標志總量。因為三個單位的變量值是相對量,不是絕對量,不具有可加性;其次,總體總量為3,這個3也不能加入計算。即不能把3個百分比相加除以3得到3個班的平均及格率。再譬如,3個班考同一科的平均成績分別為90分,85分,80分,求總平均成績。這是對3個單位的3個平均數(shù)計算平均數(shù)。同樣,不能將3個平均成績相加除以3得到總平均成績。3個單位的變量值是平均量,不是絕對量,不能相加得到標志總量??傮w總量3也不能加入計算。所以,這個所謂基本公式,原本就沒有廣泛的適用性。
二、統(tǒng)計教材未能就算術(shù)平均數(shù)的計算方法闡述清楚
闡述方法先從概念入手。一般教材都把平均數(shù)的概念表述為變量值的一般水平。這固然是正確的。但這還不夠,還應當進一步指出,變量值的數(shù)值形式是多種多樣的,可以是絕對數(shù),也可以是相對數(shù),還可是平均數(shù)本身。平均數(shù)不是基本的統(tǒng)計指標,它是各種各樣的統(tǒng)計指標的代表值。它可以是絕對數(shù)的代表值,如此3個學生的平均身高,也可以是相對數(shù)的代表值,比如3個班的平均及格率,還可以是平均數(shù)的代表值,比如3個班的總平均成績。這正是統(tǒng)計教材闡述算術(shù)平均數(shù)時所缺失的內(nèi)容,從而導致了理解和掌握算術(shù)平均數(shù)的困難。
在統(tǒng)計教材里面,一般都先使用對絕對數(shù)計算平均數(shù)的例子引出簡單算術(shù)平均數(shù)和加權(quán)算術(shù)平均數(shù)的計算公式,然后再舉一個已分組(變量數(shù)列)條件下對相對數(shù)計算平均數(shù)的例子。以下就是最常見的例子:
計劃完成 企業(yè)數(shù) 計劃數(shù). 組中值. 實際數(shù)
(%) (家) (萬元)f. (%)x (萬元)xf
80~90 5 1000 85 850
90~100 15 10000 95 9500
100~110 10 8000 105 8400
Σ. 30 19000 - 18750
30個企業(yè)的平均計劃完成程度=總實際數(shù)/總計劃數(shù)=Σxf/Σf=18750/19000=98.7%。每當編寫到此,編者都要給讀者指出一個“重要問題”,即:“此處存在一個權(quán)數(shù)選擇問題,似乎企業(yè)數(shù)可以作權(quán)數(shù),實際上不能作權(quán)數(shù),只能將計劃數(shù)作權(quán)數(shù)”等等。編者似乎忘記了或者回避了前面已經(jīng)交代過的算術(shù)平均數(shù)的“基本公式”。但到底是什么原因不能用“基本公式”去計算這30個企業(yè)的平均計劃完成程度?為什么這里的企業(yè)數(shù)不能作權(quán)數(shù)加入計算,而要用計劃數(shù)作權(quán)數(shù)加入計算?從來都沒有一個使人信服的說法。這就使讀者產(chǎn)生很大的疑惑,甚至是一頭霧水:到底按不按“基本公式”計算?“基本公式”還有沒有用?這就無形中加大了統(tǒng)計學的教學難度。
縱觀林林總總的統(tǒng)計教材,在闡述算術(shù)平均數(shù)的部分,幾乎都普遍存在幾個奇怪的現(xiàn)象:其一,幾乎所有編者都一成不變的這樣寫,從來沒有花樣翻新;其二,幾乎所有編者都去舉例說明在已分組條件下對相對數(shù)計算平均數(shù),都不去舉例說明在已分組條件下對平均數(shù)計算平均數(shù);其三,幾乎所有編者都不涉及在未分組條件下對相對數(shù)或平均數(shù)計算平均數(shù),比如上面所舉3個班的及格率的平均數(shù),3個班的平均成績的平均數(shù)。似乎原本就不存在這樣的問題,這是很讓人匪夷所思的事情。
三、在統(tǒng)計學中,應當如何闡述算術(shù)平均數(shù)的計算方法?
(一)應當徹底擯棄算術(shù)平均數(shù)的“基本公式”。正是這個所謂基本公式的存在和一直沿襲,產(chǎn)生了嚴重的誤導作用,導致了算術(shù)平均數(shù)計算方法的教學困惑和迷茫。
(二)應當按平均對象的數(shù)值形式(絕對數(shù),相對數(shù),平均數(shù))分別介紹算術(shù)平均數(shù)的計算方法。
先闡述對絕對數(shù)計算平均數(shù)。闡明兩點:其一,對絕對數(shù)計算平均數(shù)的確存在一個統(tǒng)一的計算公式,即:標志總量/總體總量。其二,在未分組條件下使用簡單算術(shù)平均數(shù)的方法,在已分組條件下使用加權(quán)算術(shù)平均的方法,各組次數(shù)(頻數(shù)或頻率)就是權(quán)數(shù)。顯然,開始就用對絕對數(shù)計算平均數(shù)的例子引出簡單算術(shù)平均數(shù)和加權(quán)算術(shù)平均數(shù)的公式,比較淺顯易懂。
再闡述對相對數(shù)或平均數(shù)計算平均數(shù)。闡明兩點:其一,對相對數(shù)或平均數(shù)計算平均數(shù),無論是否已分組,都不能采用簡單算術(shù)平均法,要采用加權(quán)算術(shù)平均法。比如,對前面3個班及格率計算平均數(shù),不能簡單相加除以3,要用3個班的參考人數(shù)作權(quán)數(shù)加權(quán)平均。因為及格率的計算,無論是各個班計算,或是將3個班合起來計算,都是用及格人數(shù)比參考人數(shù)。同理,3個班的總平均成績的計算,同樣要用3個班的參考人數(shù)作權(quán)數(shù)加權(quán)計算。沒有權(quán)數(shù),就不能計算平均數(shù)。其二,對相對數(shù)或平均數(shù)計算平均數(shù),不存在統(tǒng)一的計算公式。由于相對數(shù)和平均數(shù)都是派生指標,要根據(jù)具體的相對數(shù)和平均數(shù)本身的算法去計算。因為平均數(shù)是平均對象的代表值,平均的結(jié)果不能擺脫平均對象的本來屬性。比如上面計算的平均計劃完成程度98.7%,其本身仍然是一個計劃完成相對數(shù),只不過是30個企業(yè)的計劃完成程度的代表值。各個企業(yè)的計劃完成程度是用實際數(shù)比計劃數(shù),把30個企業(yè)合起來計算一個計劃完成程度,也同樣是用總實際數(shù)比總計劃數(shù)。因而,在已分組條件下,必然要用各組計劃數(shù)作權(quán)數(shù)加權(quán)平均。假如給出的是未分組資料,即給出30個企業(yè)的計劃完成百分比,也不能采用簡單算術(shù)平均的方法,把30個百分比相加除以30。所以,作為總體總量的30個企業(yè),原本就不能加入計算。因此,就不存在權(quán)數(shù)的“選擇問題”。再譬如,有30個企業(yè)生產(chǎn)同一種產(chǎn)品,給出的是按單位成本分組的資料,要計算30個企業(yè)的平均單位成本。這是在已分組條件下對平均數(shù)計算平均數(shù)。各組的產(chǎn)量自然是權(quán)數(shù)。因為單位成本的計算,無論是各個企業(yè)計算,或是30個企業(yè)合起來計算,都是總成本比總產(chǎn)量。作為總體總量的30個企業(yè)不能加入計算,同樣不存在“權(quán)數(shù)的選擇問題”。
以這樣的思路去闡述算術(shù)平均數(shù)的計算方法,或許更為合理更為準確,對教學更為方便。
隨著經(jīng)濟快速發(fā)展和社會全面進步,統(tǒng)計學的運用越來越廣泛,尤其是即將到來的大數(shù)據(jù)時代,更需要人們掌握和運用各種各樣的統(tǒng)計方法和技能,以適應時代的要求。同時,統(tǒng)計學也必然迎來前所未有的發(fā)展機遇,統(tǒng)計方法的研究和創(chuàng)新有著更為廣闊的空間,對于統(tǒng)計學里面一些帶基礎性的方法問題更有必要澄清和理順,這正是本文的初衷。