◇史寧中
為什么要強(qiáng)調(diào)數(shù)據(jù)分析觀念
◇史寧中
統(tǒng)計(jì)學(xué)研究的基礎(chǔ)是數(shù)據(jù),是通過(guò)對(duì)數(shù)據(jù)的分析得到數(shù)據(jù)背景的信息。由此可以知道,雖然在數(shù)據(jù)分析的過(guò)程中要用到數(shù)學(xué),但統(tǒng)計(jì)學(xué)與數(shù)學(xué)還是有所不同的,因?yàn)閿?shù)學(xué)研究的基礎(chǔ)是抽象的定義和假設(shè)。因此,在“統(tǒng)計(jì)與概率”的教學(xué)過(guò)程中一定要強(qiáng)調(diào)數(shù)據(jù),強(qiáng)調(diào)數(shù)據(jù)分析觀念。
粗略地說(shuō),數(shù)據(jù)分析大體可以分為兩種情況:一種是不考慮數(shù)據(jù)的隨機(jī)性,稱為描述統(tǒng)計(jì);另一種是考慮數(shù)據(jù)的隨機(jī)性,稱為推斷統(tǒng)計(jì)。當(dāng)然,在推斷統(tǒng)計(jì)中會(huì)用到描述統(tǒng)計(jì)的方法。
1.描述統(tǒng)計(jì)。描述統(tǒng)計(jì)只是針對(duì)調(diào)查了的數(shù)據(jù)本身進(jìn)行表述。比如,調(diào)查了全班同學(xué)身高可以得到一個(gè)表格,為了把這些數(shù)據(jù)表述得更加清晰,可以把身高分段,然后計(jì)算每個(gè)身高段的人數(shù),形成條形統(tǒng)計(jì)圖或者扇形統(tǒng)計(jì)圖。還可以對(duì)這些數(shù)據(jù)進(jìn)一步分析,得到一些特征數(shù)據(jù),比如,最高身高、最低身高、平均身高等,這樣就表述了全班同學(xué)身高的信息。
在上述過(guò)程中,引導(dǎo)學(xué)生對(duì)身高進(jìn)行合理分段是非常重要的,因?yàn)檫@關(guān)系到能否對(duì)數(shù)據(jù)進(jìn)行清晰表達(dá)和有效分析。一般來(lái)說(shuō),合理分段需要強(qiáng)調(diào)兩件事情:一是分段之前要制定準(zhǔn)則,這個(gè)準(zhǔn)則可以是自己設(shè)計(jì)的;二是設(shè)計(jì)的準(zhǔn)則要合理,比如,分段區(qū)間太小就會(huì)導(dǎo)致每一段中的人數(shù)太少,分段區(qū)間太大就會(huì)導(dǎo)致每一段中的人數(shù)過(guò)多。無(wú)論如何,這樣的教學(xué)活動(dòng)是非常重要的,有利于學(xué)生養(yǎng)成良好的思維習(xí)慣,有利于幫助學(xué)生積累基本活動(dòng)經(jīng)驗(yàn),包括思維的經(jīng)驗(yàn)和實(shí)踐的經(jīng)驗(yàn)。
2.推斷統(tǒng)計(jì)。推斷統(tǒng)計(jì)希望推斷調(diào)查數(shù)據(jù)以外的信息。比如,通過(guò)一個(gè)班級(jí)同學(xué)的身高信息推斷全年級(jí)同學(xué)的身高情況。如果認(rèn)為只考慮一個(gè)班級(jí)的情況不具有代表性,那么可以針對(duì)全年級(jí)同學(xué)身高情況進(jìn)行抽樣調(diào)查。之所以要抽樣調(diào)查是因?yàn)槿昙?jí)同學(xué)太多,沒(méi)有必要全部調(diào)查。所謂抽樣調(diào)查,就是抽取這個(gè)年級(jí)的一部分同學(xué)測(cè)量身高,對(duì)這些同學(xué)的身高進(jìn)行數(shù)據(jù)分析,然后推斷全年級(jí)同學(xué)的身高情況。數(shù)據(jù)分析的方法可以與描述統(tǒng)計(jì)的方法完全一樣,但得到的結(jié)論是或然的,是一種估計(jì)。比如,可以估計(jì)全年級(jí)各身高段人數(shù)的比例,可以估計(jì)平均身高等。
在上述過(guò)程中,如何合理地抽取一部分同學(xué)度量身高是非常關(guān)鍵的,通常把這樣的過(guò)程稱為抽樣。針對(duì)研究問(wèn)題的不同,可以有各種抽樣的方法,但在小學(xué)階段主要介紹的是隨機(jī)抽樣。隨機(jī)抽樣是最一般、最有效的抽樣方法,比如,可以事先在“隨機(jī)數(shù)表”中得到一些隨機(jī)數(shù),然后根據(jù)學(xué)生的班級(jí)順序和同學(xué)的學(xué)號(hào)進(jìn)行抽樣;可以事先決定在每個(gè)班抽取相同比例的同學(xué),然后再根據(jù)同學(xué)的學(xué)號(hào)進(jìn)行隨機(jī)抽樣;也可以根據(jù)男女同學(xué)的比例,確定在男生和女生中的抽樣數(shù)量等。
抽樣的重要性,不僅僅是因?yàn)榭傮w的數(shù)量太大,而是因?yàn)樵诖蠖鄶?shù)情況下無(wú)法掌握總體。比如,希望知道某種產(chǎn)品的使用壽命,但不可能把所有產(chǎn)品都拿來(lái)做實(shí)驗(yàn)。
可以看到,推斷統(tǒng)計(jì)的核心就是通過(guò)經(jīng)驗(yàn)過(guò)的事物推斷未曾經(jīng)驗(yàn)的事物,或者說(shuō),是通過(guò)樣本推斷總體。因?yàn)楝F(xiàn)實(shí)世界的大多數(shù)事情都是以隨機(jī)現(xiàn)象出現(xiàn)的,并且不可能完全知道事情的背景(或者說(shuō),不可能完全知道總體的情況),因此,現(xiàn)代統(tǒng)計(jì)學(xué)主要是研究推斷統(tǒng)計(jì)。
在小學(xué)階段,《義務(wù)教育數(shù)學(xué)課程標(biāo)準(zhǔn)(2011年版)》(以下簡(jiǎn)稱《課標(biāo)》)對(duì)數(shù)據(jù)分析觀念的要求主要有兩條:一條是知道數(shù)據(jù)蘊(yùn)含著信息,知道許多事情應(yīng)當(dāng)通過(guò)調(diào)查研究得到結(jié)論;另一條是知道通過(guò)樣本得到的數(shù)據(jù)具有隨機(jī)性,通過(guò)樣本得到的結(jié)論是或然的。顯然,讓小學(xué)生理解上述第二條是困難的,因此在教學(xué)過(guò)程中不能僅僅依靠教師的說(shuō)教,而應(yīng)當(dāng)創(chuàng)設(shè)情境讓學(xué)生感悟其中的道理,對(duì)此可以參考《課標(biāo)》中給出的一些例子。
(節(jié)選自《基本概念與運(yùn)算法則——小學(xué)數(shù)學(xué)教學(xué)中的核心問(wèn)題》一書(shū),有改動(dòng))