朱紹文
平均數、眾數、中位數都是描述一組數據集中趨勢的量,但它們的定義、求法以及描述的角度和適用的范圍又不盡相同,同學們常常將它們弄混淆.那么在具體問題中,應采用哪個量來描述一組數據的集中趨勢呢?下面對它們的特征及正確的適用范圍進行分析說明.
一、定義不同
平均數:平均數的大小與一組數據里每個數據都有關系,其中任何數據的變動都會引起平均數的變動.因此,平均數能較充分地反映一組數據的“平均水平”,但它容易受極端值的影響.
中位數:中位數的大小僅與數據的排列位置有關,將一組數據按從小到大的順序排列后,最中間的數據或最中間兩個數據的平均數為中位數.因此,部分數據變動對中位數沒有影響,當一組數據中的個別數據變動較大時,一般用中位數來描述“平均水平”.
眾數:眾數著眼于各數據出現的次數,其大小與該組的部分數據有關,求一組數據的眾數既不需要計算,也不需要排列,只要找出該數據中出現次數最多的數據即為眾數.因此,當一組數據中有不少數據重復出現時,一般用眾數來描述“平均水平”.
例1? 現有7名同學測得某大廈的高度如下:(單位:m )
29.8 ?30.0 ?30.0 ?30.0 ?30.2 ?44.0 ?30.0
(1)在這組數據中,中位數是____眾數是____,平均數是____;
(2)憑經驗,你覺得此大廈大概有多高? 請簡要說明理由.
解析:(1)將這組數據按從小到大的順序排列,即 29.8,30.0,30.0,30.0,30.0,30.2,44.0,由于排在中間的數據有一個,即30.0,所以中位數是30.0;出現次數最多的數有一個,即 30.0出現了 4次,所以眾數是30.0.
這組數據的平均數(29.8 + 30.0 +
30.0 + 30.0 + 30.0 + 30.2 + 44.0)=32.0 ;
(2)憑經驗,大廈高約32.0 m.
原因是數據44.0誤差太大或測量錯誤,從而導致平均數的數值偏大,因此按照中位數和眾數來確定.
二、求法不同
1.求平均數
計算平均數,由于數據的情況各不相同,可以分三種方法:
(1)當數據較少或較小,且沒有重復出現時,用公式計算較為簡便.
例2? 數據10,9,8,7,4,2,3,1的平均數是(??? ).
A.4.5??? B.5??? C.5.5??? D.6
解:(10 + 9 + 8 + 7 + 4 + 2 + 3 + 1) = 5.5.
故應選C項.
(2)當一組數據中出現重復數時,用加權平均數公式計算簡便,即 n
其中分別叫做的權,且
例3? 在一次體檢中,測得八年級(1)班第一小組10名同學的身高情況是:有2人是 145cm,3 人是 148cm,4 人是 156cm,1 人是 160cm,則這10位同學的平均身高是(??? ).
A.150.8cm??? B.151cm
C.151.8cm??? D.152cm
解:(145×2 +148×3 +156×4+160) =151.8 cm,
故應選C項.
(3)當數據較大、較多且在某一個常數a,附近擺動時,用公式 a求解比較容易.其中是原數據與a的差組成的新數據的平均數.
例4? 求下列數據的平均數;71,69,72,74,66,65,70,73.
解:取常數a=70,原數據的每一個數減
去 70,得到一組新數據:1,-1,2,4,-4,-5,0,3.
2.求中位數
求一組數據的中位數,應先將這組數據按由小到大(或由大到?。┑捻樞蚺帕?,然后再分數據的個數是奇數還是偶數求出中位數:當數據的個數是奇數時,則處于正中間位置的數就是這組數據的中位數;當數據的個數是偶數時,則正中間兩個數據的平均數就是這組數據的中位數.
例5? 10名工人某天生產同一零件的件數是 15,17,14,10,15,19,17,16,14,12,求這一天10名工人生產零件的中位數.
解:將所給的10個數按從小到大的順序排列得:10,12,14,14,15,15,16,17,17,19,最中間的兩個數據都為15,它們的平均數也是15,則這組數據的中位數是15 (件).
3.求眾數
確定一組數據的眾數,首先找出這組數據中的各數據出現的次數,其中山現次數最多的數據就是眾數.
例6? 在一次數學考試中,10名學生的得分如下;70,90,100,90,80,100,90,50,80,80,求這次數學考試得分中的眾數.
解:在這一組數據中,100分出現2次,90分出現3次,80分出現3次,70分出現1次,50分出現1次,故80分和90分是這組數據的眾數.
三、適用范圍不同
平均數是最常用的一個代表值.它充分利用了全部數據的信息,計算方便,但易受極端值的影響.當數據中有極端值時,平均數的代表性較差.這時,選擇中位數作為“平均水平”的代表要更好,在一組數據中不大于或不小于中位數的數據各占50% .中位數常用來描述“中間位置”或“中等水平”等.它受極端值影響較小,但沒有充分利用所有數據的信息,而且當數據較多時不便于計算.當描述同類產品中哪個品牌錯量最大、同學中哪個年齡的人最多、進行民意調查或選舉時,人們最
關心的是出現次數最多的數據,即眾數.但眾數可能不惟一,而且當各數據出現的次數大致相同時,眾數的意義不太明顯.
1.當用樣本估計總體時,一般采用平均數
例7? 小新家今年6月份頭6天用米量如下表:
請你運用統計知識,估計小新家6月份 (按30天算)用米量為______千克.
解:這6天的平均每天用米量為
≈0.833.
則6月份用米量為
25.0 (千克).
2.當一組數據中有“異常數”(一組數據中值過大或過小的數據通常被稱為“異常數或異常值”)時,一般采用中位數或眾數描述這組數據的一般水平.因為有異常數據,其平均數可能相差較大.
例8? 據報道,某公司的33名職工的月工資(以元為單位)如下:
(1)求該公司職工月工資的平均數、中位數、眾數;(精確到個位數)
(2)假設副董事長的工資從5000元提升到20000元,董事長的工資從5500元提升到 30000元,那么新的平均數、中位數、眾數又是什么?(精確到個位數)
(3)你認為哪個統計量能反映這個公司員工的工資水平?結合此問題談一談你的看法.
解:(1)平均數為
≈1500+591=2091(元).
中位數是1500元,眾數是1500元.
(2)平均數為
≈1500+1788=3288(元).
中位數是1500元,眾數是1500元.
(3)在這個問題中中,位數或眾數均能反映公司員工的工資水平.因為公司中少數人的工資額與大多數人的工資額差別較大,這樣導致平均數與中位數偏差較大,所以中位數或眾數能更準確地反映這個公司員工的工資水平.
例9? 一次科技知識競賽,甲、乙兩組學生成績如下:
已經算得兩組都有50人,平均分都是80
分,請根據你所學過的統計知識,進一步判定這兩個組的學生在這次競賽中的成績誰優(yōu)誰次,請說明理由.
解:我們從多角度來綜合考慮這個問題:
(1)甲組成績的眾數是90分,乙組成績的眾藪是70分,從成績的眾數比較看,甲組成績好些.
(2)甲、乙兩組成績的中位數都是80分,甲組成績在中位數以上(包括中位數)的有33 人,乙組成績在中位數以上的有26人,從這一角度看甲組成績總體較好.
另外,我們還可以從高分段人數進行考慮,從成績統計看:甲組成績高于80分的人數為14+6=20(人),乙組成績高于80分的人數為12+12=24(人),所以,乙組成績集中在高分段的人數多,同時乙組得滿分的人也要多些,從這一角度看,乙組成績較好.