張聰 孫莉敏
【摘要】本文從樣本出發(fā),通過繪制散點圖的方式,對樣本峰度和樣本協(xié)方差的統(tǒng)計意義進行討論,最終達到理解總體峰度和協(xié)方差的目的.
【關(guān)鍵詞】峰度;相關(guān)系數(shù);Matlab;教學(xué)探討
【 基金項目】河南省教師教育課程改革研究項目2017-JSJYZD-068;信陽學(xué)院校級教育教學(xué)改革項目2018ZJG02.
數(shù)學(xué)定義是深入學(xué)習數(shù)學(xué)理論的基礎(chǔ),對進一步理解數(shù)學(xué)概念的內(nèi)涵和外延,形成嚴密的數(shù)學(xué)思維,扎實推理能力起著關(guān)鍵作用.峰度和協(xié)方差是概率論中兩個重要的數(shù)字特征,在醫(yī)學(xué)影像、信號處理、金融工程中有廣泛應(yīng)用.如果學(xué)生沒有對定義本身深刻的認識,何談應(yīng)用概率思想和統(tǒng)計手段解決實際問題.
現(xiàn)有的概率統(tǒng)計教材中,借助矩來定義方差和偏度,有效刻畫了“波動”和“偏離”的含義,使其定義清晰易懂.但對峰度和協(xié)方差,為什么借助于二階混合中心距和四階中心矩來定義,這是教學(xué)過程中的一個盲點,且?guī)缀鯖]有教材展開相關(guān)的討論.課堂教學(xué)如果僅僅在給出公式后提供兩個例子計算了事,顯然達不到良好的教學(xué)效果.
本文計劃從一組樣本出發(fā),借助數(shù)學(xué)軟件,討論樣本的峰度、協(xié)方差,直觀展示上述數(shù)字特征的統(tǒng)計意義,進而幫助學(xué)生理解總體數(shù)字特征的含義.
一、峰度的含義
隨機變量(總體)X峰度的定義為
K=E(X-E(X))4[E(X-E(X))2]2-3.
設(shè)x1,x2,…,xn是來自總體X的樣本,若記x=1n∑ni=1xi,v4n=1n∑ni=1(xi-x)4,v2n=1n∑ni=1(xi-x)2,
則樣本峰度可以定義為
kn=v4n(v2n)2-3=n∑ni=1(xi-x)4∑ni=1(xi-x)22-3.
若將X的觀測值從小到大排列后得到
x1=-0.5,x2=-0.4,x3=-0.3,x4=-0.2,x5=-0.1,x6=0.1,x7=0.2,x8=0.3,x9=0.4,x10=0.5,
繪制散點圖1-1.
為討論方便,這里添加的數(shù)據(jù)x11=-1,x12=1關(guān)于原始樣本的均值0對稱,繪制圖1-2.對比圖1-1和圖1-2可知,所添加的數(shù)據(jù)x11,x12,明顯偏離了原始數(shù)據(jù)這個“群”,數(shù)據(jù)添加后,樣本數(shù)據(jù)的離群程度從k10=-1.3818變大到k12=-0.2581.進一步,在均值附近添加x13=-005,x14=0.05后,x11,x12相對x1,x2,…,x14這個數(shù)據(jù)“群”的偏離程度更大且樣本峰度從k12=-0.2581增大到k14=0.1886.在此基礎(chǔ)上,繼續(xù)添加x15=-0.01,x16=001后,x11,x12相對x1,x2,…,x16這個數(shù)據(jù)“群”的偏離程度再次加大且樣本峰度從k14=0.1886增大到k16=0.6436.
從上述演變過程,學(xué)生可以清晰地觀察樣本數(shù)據(jù)對樣本峰度的影響——在均值附近x13,x14或無窮遠(為作圖方便,我們?nèi)×穗x群較遠的孤立數(shù)據(jù)x11,x12)處添加數(shù)據(jù),可以增加樣本峰度.注意到,我們所添加的數(shù)據(jù)x11,…,x16是帶有隨機性的,圖1-3和圖1-4表明總體X在0的附近取值的可能性較大(尖峰情形);圖1-2表明總體在無窮處也有取值可能(重尾情形).樣本峰度kn作為總體峰度K的近似,學(xué)生就很容易通過直觀觀察,理解總體峰度K是刻畫峰值位置尖峭性和尾部粗細程度的一個特征數(shù).
二、相關(guān)系數(shù)的含義
隨機變量(X,Y)的協(xié)方差通常定義為
Cov(X,Y)=E(X-EX)(Y-EY).
設(shè)(xi,yi),i=1,2,…,n是來自(X,Y)的一組樣本,若記x=1n∑ni=1xi,y=1n∑ni=1yi,則樣本協(xié)方差為
cn=1n∑ni=1(xi-x)(yi-y).
若將(X,Y)視為二維平面上的隨機點對,考慮如下一組數(shù)據(jù)(0.2,2.2),(0.6,2.6),(0.9,3.8),(1.5,4),(1.8,5.5),(2.2,6.3),(2.9,7.6),(3.1,7.3),(3.8,8.9),(39,9.1),(4.2,10),(5,11.1),且x≈2.51,y≈6.53.
繪制散點圖2,利用x和y將平面分為四個區(qū)域,不妨記為Ⅰ,Ⅱ,Ⅲ,Ⅳ.容易發(fā)現(xiàn),絕大部分數(shù)據(jù)落在了Ⅰ,Ⅲ兩個區(qū)域,此時(xi-x)>0,(yi-y)>0,cn=4095.這表明,cn>0時,X取值增大的同時,Y的趨勢有增大的趨勢,即X與Y正相關(guān).類似地,可以給學(xué)生展示大部分數(shù)據(jù)落入Ⅱ,Ⅳ區(qū)域時,cn<0,X與Y負相關(guān).由此,我們發(fā)現(xiàn)協(xié)方差是刻畫兩個隨機變量關(guān)聯(lián)程度的一個量.
三、結(jié)?論
我們以峰度和協(xié)方差為例,探討了如何應(yīng)用數(shù)學(xué)軟件直觀展示抽象定義的含義和本質(zhì).學(xué)生不再需要死記硬背抽象的定義式,研究內(nèi)容一目了然.教學(xué)過程中,體現(xiàn)了學(xué)生的主體作用,充分調(diào)動學(xué)生的積極性,在觀察發(fā)現(xiàn)隨機變量的統(tǒng)計規(guī)律的同時,深刻理解了定義本身,課堂內(nèi)容也更形象生動.
【參考文獻】
[1]張微.對數(shù)學(xué)定義教學(xué)的一點思考[J].現(xiàn)代教育科學(xué).2012(12):152-153.
[2]張萍.均值-方差-峰度資產(chǎn)組合優(yōu)化模型[J].科學(xué)技術(shù)與工程.2008(1):16-20.