廣東省廣州市第十六中學(xué)(510080) 何嘉穎
在新人教A版高中數(shù)學(xué)必修第二冊(cè)中,給出了百分位數(shù)的定義以及一種計(jì)算百分位數(shù)的方法.
高中課本定義(新人教A版)一般地,一組數(shù)據(jù)的第p百分位數(shù)是這樣一個(gè)值,它使得這組數(shù)據(jù)中至少有p%的數(shù)據(jù)小于或等于這個(gè)值,且至少有(100?p)%的數(shù)據(jù)大于或等于這個(gè)值[1].
設(shè)x1,x2,...,xn是取自總體分布函數(shù)為F(x)的樣本,若將樣本觀測(cè)值由小到大進(jìn)行排列為x(1),x(2),...,x(n),則x(1),x(2),...,x(n)稱為有序樣本[2].樣本p分位數(shù)mp定義如下[2]:
挖掘課本內(nèi)容,在課本中提到“分位數(shù)的定義眾多,我們?nèi)∫环N簡(jiǎn)單便于計(jì)算的[1]”,可見百分位數(shù)的定義不止一種.同時(shí)在課本所給引例中提到百分位數(shù)的取值,可以是某個(gè)區(qū)間內(nèi)任意一個(gè)數(shù),該值為便于計(jì)算可取區(qū)間的中點(diǎn)值,為實(shí)際操作的方便樣本百分位數(shù)的取值還可作近似處理等,可見百分位數(shù)的不唯一性.
因此,針對(duì)課本中百分位數(shù)的定義與計(jì)算方法,可從兩方面進(jìn)行探究:一是對(duì)百分位數(shù)定義的探究;二是對(duì)百分位數(shù)的存在性與唯一性以及計(jì)算方式的探究.
課本中百分位數(shù)的定義與計(jì)算方法是與學(xué)生已學(xué)的中位數(shù)概念吻合的,因此為學(xué)生理解與計(jì)算百分位數(shù)提供了方便.基于課本中百分位數(shù)的定義,挖掘教師教學(xué)用書的內(nèi)容,在書中提供了“電子表格軟件和R軟件計(jì)算一組數(shù)據(jù)的百分位數(shù)的方法[3]”.無論是書中提到的電子表格軟件和R軟件還是一些常用軟件,它們計(jì)算百分位數(shù)所使用的的方法為插值法.
線性插值定義已知區(qū)間[xk,xk+1]端點(diǎn)處函數(shù)值yk=f(xk),yk+1=f(xk+1),設(shè)線性插值多項(xiàng)式L1(x),有L1(xk)=yk,L1(xk+1)=yk+1,則L1(x)=
假設(shè)已知百分位數(shù)xp所在位置為t,且已知所在位置為[t],[t]+1的值分別為x[t],x[t]+1,則有
于是,當(dāng)x=t時(shí),xp=x[t]+·(t?[t]).其中,t的值有多種計(jì)算方式,如np(R-4,SAS-1,Maple-3),(n+1)p(R-6,SAS-4,Maple-5,Excel,Python),(n?1)p+1(R-7,Maple-6,Excel,Python)等.
會(huì)出現(xiàn)上述多種的百分位數(shù)計(jì)算方式,究其原因在于對(duì)離散數(shù)據(jù)的百分位數(shù)所在位置的理解.若百分位數(shù)xp落在(x[t],x[t]+1)內(nèi),此時(shí)t∈([t],[t]+1),應(yīng)如何界定t和[t]以及[t]+1的距離,這涉及區(qū)間的連續(xù)性問題.
由此可見,計(jì)算百分位數(shù)的關(guān)鍵為:確定百分位數(shù)的位置,以及計(jì)算百分位數(shù)的值;其中,前者更為關(guān)鍵.同時(shí),通過探究離散數(shù)據(jù)的百分位數(shù),可知離散數(shù)據(jù)的百分位數(shù)不唯一.因此,也可作進(jìn)一步探究:如果把離散數(shù)據(jù)連續(xù)化,那么這些數(shù)據(jù)的百分位數(shù)會(huì)有什么特點(diǎn).
已知百分位數(shù)的值隨著位置的變化而變化,即兩者之間存在函數(shù)關(guān)系.此時(shí)可考慮兩種連續(xù)化:一是位置的連續(xù)化,二是數(shù)值的連續(xù)化.
先挖掘數(shù)值的連續(xù)化,可使用經(jīng)驗(yàn)分布函數(shù).
經(jīng)驗(yàn)分布函數(shù)定義[2]用有序樣本定義如下函數(shù)則是一個(gè)非減右連續(xù)函數(shù),且滿足Fn(?∞)=0,Fn(∞)=1.
通過經(jīng)驗(yàn)分布函數(shù),此時(shí)離散的有序樣本x(1),x(2),...,x(n)在整個(gè)實(shí)數(shù)集內(nèi)均有定義.而數(shù)據(jù)的百分位數(shù)的位置對(duì)應(yīng)頻率,此時(shí)只有有限的取值.即在經(jīng)驗(yàn)分布函數(shù)下,部分百分位數(shù)不一定存在.
再挖掘位置的連續(xù)化,可使用頻率分布直方圖.若以連續(xù)化后的有序樣本作為橫坐標(biāo),選定一定的組距繪制頻率分布直方圖.此時(shí)無論是數(shù)值還是位置都實(shí)現(xiàn)連續(xù)化.因此,利用頻率分布直方圖可計(jì)算任意百分位數(shù)且百分位數(shù)的數(shù)值唯一.挖掘課本,在頻率分布直方圖下有兩種計(jì)算百分位數(shù)的方法.一是插值法,二是面積法(S左=p%).但利用頻率分布直方圖計(jì)算百分位數(shù)的缺點(diǎn)在于所得值只是估計(jì)值,與真實(shí)數(shù)據(jù)之間有一定誤差.
由此可見,僅選擇一定的組距用各個(gè)長(zhǎng)方形來表示對(duì)應(yīng)頻率是不夠的;而是需要各個(gè)長(zhǎng)方形足夠小,小至微元才行.由此作進(jìn)一步探究:如果用極限思想或微積分思想,能否唯一得到對(duì)應(yīng)的百分位數(shù).
根據(jù)上文的探究,可把課本百分位數(shù)的定義拓展至概率統(tǒng)計(jì)中百分位數(shù)的定義.
分位數(shù)定義設(shè)連續(xù)隨機(jī)變量X的分布函數(shù)為F(x),密度函數(shù)為p(x).對(duì)任意p∈(0,1),稱滿足條件F(xp)=的xp為此分布的p分位數(shù),又稱下側(cè)p分位數(shù)[2].同理,滿足條件1?為此分布的上側(cè)p分位數(shù)[2].
由于分布函數(shù)F(x)在實(shí)數(shù)集上單調(diào)非減,因此當(dāng)分布函數(shù)嚴(yán)格單增時(shí)一定有反函數(shù),則對(duì)任意p∈(0,1),存在唯一的xp與之對(duì)應(yīng).此時(shí),任意位置的百分位數(shù)都存在且唯一.
因此,已知分布函數(shù)F(x)計(jì)算百分位數(shù)只需作一一對(duì)應(yīng);已知密度函數(shù)p(x)計(jì)算百分位數(shù)有兩種計(jì)算方法,一是用面積法,二是先求分布函數(shù)F(x)再計(jì)算百分位數(shù).
新課標(biāo)強(qiáng)調(diào)要引導(dǎo)學(xué)生把握數(shù)學(xué)內(nèi)容的本質(zhì),提倡學(xué)生獨(dú)立思考以激發(fā)學(xué)習(xí)數(shù)學(xué)的興趣,同時(shí)要促進(jìn)學(xué)生的創(chuàng)新意識(shí)的發(fā)展;引導(dǎo)學(xué)生會(huì)用數(shù)學(xué)眼光觀察世界,會(huì)用數(shù)學(xué)思維思考世界,會(huì)用數(shù)學(xué)語言表達(dá)世界,探究事物的變化規(guī)律[5].
探究學(xué)習(xí)無疑是一種幫助學(xué)生數(shù)學(xué)學(xué)習(xí)的一種途徑,通過小概念的挖掘?qū)W習(xí),學(xué)會(huì)探究的一般方法,更能幫助學(xué)生去研究大概念大問題.
本文對(duì)百分位數(shù)的挖掘和探究實(shí)際上是對(duì)百分位數(shù)概念的再發(fā)現(xiàn)過程.從課本例題和所給定義以及小提示出發(fā),給學(xué)生提供一些處于“最近發(fā)展區(qū)”的問題與思考;從而可以促進(jìn)學(xué)生對(duì)百分位數(shù)做深入探究,而并非只局限于學(xué)習(xí)課本概念,完成相應(yīng)要求的習(xí)題.
在挖掘和探究的過程中,除了能加深對(duì)百分位數(shù)的認(rèn)識(shí)外,還可以學(xué)到許多的知識(shí)和數(shù)學(xué)思想,如插值法,經(jīng)驗(yàn)分布函數(shù),軟件中的數(shù)學(xué)等知識(shí),如連續(xù)思想,極限思想,積分思想;同時(shí)還能加深其他已學(xué)知識(shí)的理解與聯(lián)系和串聯(lián)整個(gè)概率統(tǒng)計(jì)大單元,如加深對(duì)頻率分布直方圖的理解,抓住概率統(tǒng)計(jì)的主脈絡(luò),如抓住函數(shù)與微積分在概率統(tǒng)計(jì)中存在的合理性必要性并學(xué)會(huì)從數(shù)學(xué)人思考的角度去思考問題.
本文僅對(duì)百分位數(shù)的定義與計(jì)算作了挖掘和拓展,除此以外,還可以對(duì)百分位數(shù)的應(yīng)用進(jìn)行挖掘,如課本專門給出了四分位數(shù)的概念,第1、5、95分位數(shù)的概念,那么他們究竟有什么實(shí)際應(yīng)用;如對(duì)四分位數(shù),可探究五數(shù)概括與箱線圖;對(duì)第1、5、95分位數(shù),可探究獨(dú)立性檢驗(yàn).在教師教學(xué)用書中,提到“第0百分位數(shù)為數(shù)據(jù)組中的最小數(shù),第100百分位數(shù)為數(shù)據(jù)中的最大數(shù)[3]”,可探究最大值、最小值與極差和百分位數(shù)的關(guān)系.更進(jìn)一步,百分位數(shù),極差等都需要把數(shù)據(jù)從小到大排序構(gòu)成有序樣本,可探究有序樣本與次序統(tǒng)計(jì)量的關(guān)系.