国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)理統(tǒng)計(jì)直觀教學(xué)的實(shí)驗(yàn)設(shè)計(jì)與R程序?qū)崿F(xiàn)

2016-11-10 08:00呂書(shū)龍劉文麗梁飛豹葉福玲
實(shí)驗(yàn)技術(shù)與管理 2016年10期
關(guān)鍵詞:數(shù)理統(tǒng)計(jì)置信區(qū)間實(shí)驗(yàn)設(shè)計(jì)

呂書(shū)龍, 劉文麗, 梁飛豹, 葉福玲

(福州大學(xué) 數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院, 福建 福州 350116)

?

數(shù)理統(tǒng)計(jì)直觀教學(xué)的實(shí)驗(yàn)設(shè)計(jì)與R程序?qū)崿F(xiàn)

呂書(shū)龍, 劉文麗, 梁飛豹, 葉福玲

(福州大學(xué) 數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院, 福建 福州350116)

針對(duì)數(shù)理統(tǒng)計(jì)中關(guān)于格列汶科定理、正態(tài)抽樣定理、點(diǎn)估計(jì)和區(qū)間估計(jì)在教學(xué)中的常見(jiàn)疑惑和問(wèn)題進(jìn)行討論與分析,通過(guò)實(shí)驗(yàn)設(shè)計(jì)和R程序,以圖形方式加以直觀解決。該實(shí)驗(yàn)設(shè)計(jì)一方面促進(jìn)了學(xué)生對(duì)于數(shù)理統(tǒng)計(jì)理論與方法的理解、提升了教學(xué)效果,另一方面也為R軟件在教學(xué)上的應(yīng)用提供一種思路。

實(shí)驗(yàn)設(shè)計(jì); R軟件; 數(shù)理統(tǒng)計(jì); 直觀教學(xué)

數(shù)理統(tǒng)計(jì)獨(dú)特的思維方式、抽象的理論、多學(xué)科知識(shí)的融合和豐富的應(yīng)用,使得學(xué)生在學(xué)習(xí)這門(mén)課程時(shí)存在著一定的困難[1]。數(shù)理統(tǒng)計(jì)教學(xué)的重點(diǎn)和難點(diǎn)在于如何把統(tǒng)計(jì)思想和統(tǒng)計(jì)方法闡述清楚,并將其應(yīng)用到實(shí)際問(wèn)題中,這一點(diǎn)在文獻(xiàn)[2-3]中有充分闡述。關(guān)于統(tǒng)計(jì)思想和方法論的教育,有很多學(xué)者發(fā)表了富有建設(shè)性的觀點(diǎn),例如在教學(xué)中充分利用統(tǒng)計(jì)軟件[4]和仿真技術(shù)[5],強(qiáng)化實(shí)驗(yàn)教學(xué)[6]和設(shè)計(jì)性實(shí)驗(yàn)[7-10]等。

本文借助R軟件強(qiáng)大的隨機(jī)模擬和繪圖功能[11],針對(duì)數(shù)理統(tǒng)計(jì)教學(xué)中的疑難點(diǎn),特別是對(duì)抽象的統(tǒng)計(jì)思想及原理,提出以實(shí)驗(yàn)設(shè)計(jì)和圖形展示為主的直觀教學(xué)[12]模式,并以格列汶科定理、正態(tài)抽樣定理、點(diǎn)估計(jì)和區(qū)間估計(jì)的教學(xué)為例予以說(shuō)明,目的是促進(jìn)學(xué)生對(duì)課程內(nèi)容的理解、提升教學(xué)效果,同時(shí)也嘗試培養(yǎng)學(xué)生的動(dòng)手能力和創(chuàng)新應(yīng)用能力。

1 格列汶科定理

設(shè)總體X的分布函數(shù)為F(x),經(jīng)驗(yàn)分布函數(shù)為Fn(x),則格列汶科定理可以描述成:

ns=c(30,50,100,200,400,500,800,1000)

y=seq(-4,4,by=0.001)

par(mfrow=c(2,4))

for (i in 1:8)

{plot(y, pnorm(y), type=′l′)

x=rnorm(ns[i])

lines(ecdf(x),cex=0.1)

text(-2.5,0.9,paste(′n=′,ns[i],sep=″′))

}

由圖1可粗略地看出,經(jīng)驗(yàn)分布函數(shù)要較好地逼近分布函數(shù),n不能太小。當(dāng)n為100和200時(shí),從逼近程度看還是可以接受的;若想得到更好的逼近效果,n應(yīng)不小于200。從教學(xué)角度講,直觀地展示定理結(jié)論是一方面,而了解定理的適用條件也是必要的。因此建議把尋找滿足某個(gè)逼近標(biāo)準(zhǔn)的最小樣本容量n的問(wèn)題作為課外探索題,這樣更能增強(qiáng)學(xué)生對(duì)定理的理解程度。

圖1 經(jīng)驗(yàn)分布函數(shù)與分布函數(shù)比較

該定理的特別之處在于它研究的是|Fn(x)-F(x)|變量的偏差上界,雖然理論上已經(jīng)對(duì)它的分布做了證明并能給出相應(yīng)的概率,但還是沒(méi)給出n多大時(shí)才能較可靠地使用這個(gè)定理。不妨通過(guò)抽樣模擬來(lái)刻畫(huà)這個(gè)過(guò)程:以標(biāo)準(zhǔn)正態(tài)分布為例,讓樣本容量n從10變到500,對(duì)每個(gè)n,模擬100次得到100個(gè)樣本,并計(jì)算每個(gè)樣本的經(jīng)驗(yàn)分布函數(shù)與分布函數(shù)偏差的最大值,再計(jì)算最大值序列的極差,最后畫(huà)極差圖(見(jiàn)圖2),R程序如下:

getmax=function(size,n)

{a=numeric(size)

for(i in 1:size){

x=rnorm(n); tmp=ks.test(x,′pnorm′)

a[i]=tmp$statistic} #利用ks檢驗(yàn)得到最大偏差

return(a)

}

n=seq(10,500,by=10);nlen=length(ns)

mat=matrix(0,nrow=2,ncol=nlen)

for(i in 1:nlen) mat[,i]=range(getmax(100, n[i]))

plot(n, mat[1,], ylim=c(0,max(mat[2,])+0.01), cex=0.5)

points(n, mat[2,], cex=0.5)

for(i in 1:nlen) lines(c(n[i], n[i]), mat[,i])

從圖2可直觀看出,極差變化先隨n的變大快速變窄,當(dāng)n≈200時(shí),極差變化趨于平緩,之后基本保持不變??梢?jiàn)n≥200是個(gè)不錯(cuò)的選擇,這也進(jìn)一步肯定了圖1的結(jié)論。

圖2 最大偏差的極差圖

2 正態(tài)抽樣定理的一個(gè)直觀描述

n=100;times=1000;mean=1;sd=2;N1=99; N2=100;sn=numeric(times);tmp=(n-1)/(sd^2)

for(i in 1:times){

set.seed(i); x=rnorm(n,mean,sd);sn[i]=tmp*var(x)}

plot(ecdf(sn),verticals=TRUE,do.point=FALSE)

nx=seq(70,140,by=1)

lines(nx,pchisq(nx,N1),lty=2,lwd=2)

lines(nx,pchisq(nx,N2),lty=4)

legend(130,0.8,c(′經(jīng)驗(yàn)分布函數(shù)′,′chisq(99)′, ′chisq(100)′),lty=c(1,2,4), cex=0.75, lwd=c(1,2,1)

圖3 (n-1)S2/σ2與χ2(99),χ2(100)的比較

3 矩估計(jì)和極大似然估計(jì)的比較

矩估計(jì)方法簡(jiǎn)單易用,但也有明顯的缺點(diǎn),例如估計(jì)量表示不唯一、樣本信息利用不充分等。極大似然估計(jì)能克服矩估計(jì)的缺點(diǎn),在實(shí)際中應(yīng)用更廣泛。相信學(xué)生并不喜歡這樣的比較,而若能配置一個(gè)實(shí)例進(jìn)行直觀展示,將會(huì)收到良好的教學(xué)效果。實(shí)驗(yàn)設(shè)計(jì)為:從總體U(0,θ) (不妨設(shè)θ=10)中抽取容量n=20的一個(gè)樣本,計(jì)算θ的矩估計(jì)和極大似然估計(jì),重復(fù)40次后繪制估計(jì)值(見(jiàn)圖4),R程序如下:

#est1和est2 分別記錄每次的矩估計(jì)和極大似然估計(jì)值

n=20; times=40;est1=rep(0,m);est2=rep(0,m)

for(i in 1:times)

{ x=runif(n,0,10); est1[i]=2*mean(x);est2[i]=max(x)}

plot(1:m,est1,type=″l″, ylim=c(min(c(est1,est2))-0.1,max(c(est1,est2))+0.1) )

points(1:m,est1); lines(1:m,est2)

points(1:m,est2,pch=16);abline(h=10)#畫(huà)出真值直線

圖4 均勻分布參數(shù)兩種估計(jì)的比較

4 參數(shù)的置信區(qū)間

給定置信度1-α,從正態(tài)總體中抽取50個(gè)隨機(jī)數(shù),計(jì)算均值的置信區(qū)間;重復(fù)該過(guò)程N(yùn)次(N=100)得到N個(gè)置信區(qū)間并繪制成空心端點(diǎn)垂線圖,然后繪制真值水平線,將沒(méi)被水平線穿過(guò)的區(qū)間用實(shí)心端點(diǎn)表示(見(jiàn)圖5),R程序如下:

Confidence = function(n=50,times=100,mu=0,sd=1,alpha=0.05)

{interval=matrix(0,nrow=times, ncol=2)

for(i in 1:times){

x=rnorm(n,mu,sd);mx=mean(x)

u_half=qnorm(1-alpha/2,mu,sd)*sd/sqrt(n)

interval[i,]=c(mx-u_half,mx+u_half)}

miny=min(interval)-0.01;maxy=max(interval)+0.01

plot(1:times,seq(miny,maxy,length=times),type=′n′)

abline(h=mu)

for(i in 1:times){

if(prod(interval[i,]-mu)>0) points(c(i,i),interval[i,],pch=16)

else points(c(i,i),interval[i,],pch=1)

lines(c(i,i),interval[i,])}

}

Cofidence(50,100,0,1,0.05)

在置信度為95%的前提下,不包含參數(shù)真值的區(qū)間數(shù)不超過(guò)5次,從圖5可看出:該模擬有3次不包含真值,符合這個(gè)要求。顯然Nα只是不包含真值這個(gè)事件的頻數(shù),受樣本的隨機(jī)波動(dòng)影響,不具有嚴(yán)格的相等性約束。

圖5 置信度的一次模擬圖形

5 關(guān)于最短雙側(cè)置信區(qū)間的討論

ns=c(2,4,6,8,10,15,20,25,30)

alpha=0.05

par(mfrow=c(3,3))

for(n in ns)

{ mat=matrix(0,nrow=200,ncol=2)

standar=c(qchisq(alpha/2,n),qchisq(1-alpha/2,n))

mat[,1]=seq(standar[1]/20,standar[1]*1.2,length=200)

for(i in 1:200)

{ p=pchisq(mat[i,1],n)

mat[i,2]=qchisq(p+1-alpha,n)

}

plot(mat[,2]-mat[,1],type=′l′,xlab=paste(′n=′,n,sep=′′),ylab=′區(qū)間長(zhǎng)度′)

abline(h=standar[2]-standar[1])

}

上述過(guò)程直觀地展示了標(biāo)準(zhǔn)置信區(qū)間的漸進(jìn)收斂性,是對(duì)區(qū)間估計(jì)教學(xué)的直觀補(bǔ)充,更是對(duì)習(xí)慣性使用標(biāo)準(zhǔn)置信區(qū)間的一種直觀解釋。此外,還可以將尋找最短置信區(qū)間留作課后探索性實(shí)驗(yàn)題,讓學(xué)生探討置信區(qū)間的常規(guī)求解方法。

從圖6還看到:當(dāng)自由度n≥20時(shí),標(biāo)準(zhǔn)置信區(qū)間長(zhǎng)度已經(jīng)很接近最短區(qū)間長(zhǎng)度。此處n≥20可作為區(qū)間估計(jì)實(shí)際應(yīng)用的一種參考;其次也說(shuō)明此時(shí)χ2(n)的分布已經(jīng)很接近對(duì)稱(chēng)型分布了。實(shí)際上,從χ2(n)的構(gòu)造定義知其滿足獨(dú)立同分布中心極限定理的條件,于是容易推出χ2(n)的漸進(jìn)分布為正態(tài)分布N(n,2n),而正態(tài)分布就是對(duì)稱(chēng)型分布,這就不難解釋上述的結(jié)論。以下給出不同自由度下χ2(n)的密度函數(shù)比較(見(jiàn)圖7),R程序如下:

ns=seq(10,40,by=10)

par(mfrow=c(1,4))

for(n in ns)

{

x=seq(0.01,n*2,by=0.1)

plot(x,dchisq(x,n),type=′l′,xlab=paste(′n=′,n,sep=″))

}

圖6 χ2(n)不同自由度下置信區(qū)間的比較

圖7 χ2(n)的密度函數(shù)

6 結(jié)語(yǔ)

在數(shù)理統(tǒng)計(jì)教學(xué)中引入R統(tǒng)計(jì)軟件是一種趨勢(shì),利用R強(qiáng)大的隨機(jī)模擬和繪圖功能,通過(guò)設(shè)計(jì)合理的實(shí)驗(yàn)和編寫(xiě)程序,可將數(shù)理統(tǒng)計(jì)的概念、理論和方法演繹得更生動(dòng)、更直觀。這種直觀的處理方式可增強(qiáng)學(xué)生對(duì)課程知識(shí)的理解,也能提升課程內(nèi)容的趣味性和實(shí)用性,更能激發(fā)學(xué)生的探索興趣和創(chuàng)造性?,F(xiàn)在已有越來(lái)越多的學(xué)生主動(dòng)關(guān)注利用R軟件和統(tǒng)計(jì)方法去解決實(shí)際的問(wèn)題。

References)

[1] 王巖.工科專(zhuān)業(yè)數(shù)理統(tǒng)計(jì)實(shí)驗(yàn)教學(xué)的實(shí)踐探索[J].數(shù)學(xué)教育學(xué)報(bào),2007,16(3):95-98.

[2] 劉超,吳喜之.統(tǒng)計(jì)教學(xué)面臨的挑戰(zhàn)[J].統(tǒng)計(jì)研究,2012,29(2):105-108.

[3] 史書(shū)良.統(tǒng)計(jì)思想教育重于統(tǒng)計(jì)方法教育[J].中國(guó)統(tǒng)計(jì),2008(2):56-57.

[4] 吉祖勤,蔡長(zhǎng)安.NS2仿真技術(shù)在網(wǎng)絡(luò)實(shí)驗(yàn)教學(xué)中的應(yīng)用[J].實(shí)驗(yàn)技術(shù)與管理,2011,28(12):96-99.

[5] 關(guān)彥輝.R軟件在《概率統(tǒng)計(jì)》教學(xué)中的應(yīng)用[J].現(xiàn)代計(jì)算機(jī):專(zhuān)業(yè)版,2009(12):87-90.

[6] 顧光同,張香云,徐光輝.統(tǒng)計(jì)實(shí)驗(yàn)寓于概率統(tǒng)計(jì)教學(xué)的探索與實(shí)踐[J].統(tǒng)計(jì)與決策,2007(21):165-167.

[7] 陳懷俠,蔡火操,黃建林,等.設(shè)計(jì)性實(shí)驗(yàn)教學(xué)的實(shí)踐與思考[J].實(shí)驗(yàn)技術(shù)與管理2006,23(11):105-107.

[8] 郝小江,繆志農(nóng),黃昆.基于DSP的數(shù)字信號(hào)處理實(shí)驗(yàn)設(shè)計(jì)[J].2012,29(2):44-47.

[9] Robert C P, Casella G. Monte Carlo Statistical Methods[M].New York:Springer,2004.

[10] Efron B, Rogosa D, Tibshiran R. Resampling Methods of Estimation[M]//International Encyclopedia of the Social & Behavioral Sciences.2001:13216-13220.

[11] 薛毅,陳立萍.統(tǒng)計(jì)建模與R軟件[M].北京:清華大學(xué)出版社,2007.

[12] 呂書(shū)龍,劉文麗,涂淑珍,等.概率論直觀教學(xué)與R統(tǒng)計(jì)軟件實(shí)現(xiàn)的探索[J].龍巖學(xué)院學(xué)報(bào),2015,33(5):98-101.

Experimental design and R program realization of intuitive teaching of mathematical statistics

Lü Shulong, Liu Wenli , Liang Feibao, Ye Fuling

(College of Mathematics and Computer Science, Fuzhou University, Fuzhou 350116. China)

This paper discusses the doubts and problems of the Glivenko-Cantelli theorem, sampling theory, point estimation and interval estimation in mathematical statistics teaching, and puts forward the experimental design and R programs to graphically solve them directly. It not only promotes the students’ understanding of mathematical statistics and improves the teaching effects, but also enhances the application of R software in the teaching fields.

experimental design; R software; mathematical statistics; intuitive teaching

10.16791/j.cnki.sjg.2016.10.036

2016-03-29

福建省本科高校教育教學(xué)改革研究項(xiàng)目(JAS151395);福州大學(xué)研究生優(yōu)質(zhì)課程建設(shè)項(xiàng)目(52004634,52004612);福州大學(xué)高等教育教學(xué)改革工程(52001024,52001069)

呂書(shū)龍(1977—),男,福建閩侯,碩士,副教授,主要研究方向?yàn)楦怕式y(tǒng)計(jì)、統(tǒng)計(jì)計(jì)算和統(tǒng)計(jì)應(yīng)用.E-mail:wujispace@126.com

O212.1;TP311

A

1002-4956(2016)10-0142-05

猜你喜歡
數(shù)理統(tǒng)計(jì)置信區(qū)間實(shí)驗(yàn)設(shè)計(jì)
定數(shù)截尾場(chǎng)合三參數(shù)pareto分布參數(shù)的最優(yōu)置信區(qū)間
不同的溫度
有趣的放大鏡
p-范分布中參數(shù)的置信區(qū)間
多個(gè)偏正態(tài)總體共同位置參數(shù)的Bootstrap置信區(qū)間
哪個(gè)涼得快?
淺談《概率論與數(shù)理統(tǒng)計(jì)》課程的教學(xué)改革
無(wú)字天書(shū)
列車(chē)定位中置信區(qū)間的確定方法
論《概率論與數(shù)理統(tǒng)計(jì)》教學(xué)改革與學(xué)生應(yīng)用能力的培養(yǎng)
河西区| 孟州市| 苗栗市| 林州市| 城固县| 得荣县| 红安县| 从化市| 彭水| 太原市| 会理县| 会宁县| 屯昌县| 江都市| 仁寿县| 尚志市| 上栗县| 汶川县| 峨边| 昔阳县| 肥西县| 乌兰察布市| 甘肃省| 阿勒泰市| 赤水市| 青铜峡市| 扬州市| 沧州市| 三江| 溆浦县| 滨州市| 太仆寺旗| 元江| 什邡市| 淮阳县| 沧源| 屏南县| 黄龙县| 若羌县| 汽车| 中卫市|