国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于隨機數(shù)模擬的概率統(tǒng)計教學(xué)探索與實踐

2021-07-12 08:35:38張亮亮雷英杰解博麗
科技視界 2021年18期
關(guān)鍵詞:假設(shè)檢驗正態(tài)正態(tài)分布

薛 震 王 鵬 張亮亮 雷英杰 解博麗

(中北大學(xué)<理學(xué)院>,山西 太原 030051)

0 引言

黨的十九屆四中全會將數(shù)據(jù)作為一種新型生產(chǎn)要素寫入中央文件中,體現(xiàn)了互聯(lián)網(wǎng)大數(shù)據(jù)時代的新特征。概率統(tǒng)計是理工科院校一門重要的基礎(chǔ)理論課程,也是進行大數(shù)據(jù)處理的入門課程。生成特定分布的隨機數(shù)并對其進行可視化分析,可使學(xué)生直觀理解概率統(tǒng)計的基本概念與原理,掌握數(shù)據(jù)處理和統(tǒng)計分析的過程。R語言因其具有免費、易安裝、資源豐富、代碼簡單、擅長數(shù)據(jù)分析與可視化等優(yōu)點,非常適合在概率統(tǒng)計課程中進行案例教學(xué)和直觀演示[1]。本文結(jié)合長期的教學(xué)和實踐經(jīng)驗,探索使用R語言生成隨機數(shù)并進行參數(shù)估計和假設(shè)檢驗的教學(xué)研究。

1 隨機數(shù)的生成與參數(shù)估計

隨機數(shù)是一種重要的數(shù)據(jù)來源,著名的蒙特卡羅方法在模擬任何一個實際過程時都需要用到大量的隨機數(shù)。使用計算機產(chǎn)生的隨機數(shù)稱為偽隨機數(shù),它們看起來是隨機的數(shù),實際上是通過固定的、可重復(fù)計算的方法產(chǎn)生的,具有類似于隨機數(shù)的統(tǒng)計特征[2]。使用R語言生成時其代碼簡單,利用函數(shù)可快速生成服從二項分布、泊松分布、正態(tài)分布等各種常見分布的隨機數(shù)[3]。

伯努利大數(shù)定律為研究頻率是否穩(wěn)定于概率的問題,是概率統(tǒng)計中比較重要且難以理解的內(nèi)容之一。教材在介紹該部分內(nèi)容時都是直接通過證明給出結(jié)論?!胺€(wěn)定”一詞究竟是什么含義?作為理工科學(xué)生對“依概率收斂”沒有深刻的認識,往往會與高等數(shù)學(xué)中數(shù)列的收斂方式混為一談。因此,在講授該部分內(nèi)容時,若能夠結(jié)合圖形進行展示,則更能體現(xiàn)伯努利大數(shù)定律的本質(zhì)含義。

在教學(xué)中首先使用R語言生成不同數(shù)量服從標(biāo)準(zhǔn)正態(tài)分布的隨機數(shù),然后繪制這些隨機數(shù)對應(yīng)的頻率直方圖,以及正態(tài)分布密度曲線,結(jié)果如圖1所示。由圖1可以看出,隨著隨機數(shù)個數(shù)的增加,直方圖的邊界與標(biāo)準(zhǔn)正態(tài)分布密度曲線越來越接近,即隨機數(shù)落在每個小區(qū)間上的頻率逐漸收斂到它的概率,直觀驗證了伯努利大數(shù)定律的科學(xué)內(nèi)涵。

圖1 正態(tài)分布隨機數(shù)的直方圖與密度曲線

為進一步研究隨機數(shù)的數(shù)量對收斂過程的影響,可以使用MASS中的fitdistr()函數(shù)對前面生成隨機數(shù)的兩個參數(shù)進行最大似然估計,結(jié)果見表1。由表1可以看出,隨著隨機數(shù)數(shù)量的增加,其期望與方差的最大似然估計會逐漸收斂到理想取值0和1。

表1 正態(tài)分布隨機數(shù)參數(shù)的最大似然估計

通過上述圖表展示和相應(yīng)R程序的逐步講解,可以讓學(xué)生對大數(shù)定律和參數(shù)的點估計有更加深刻的認知,展示出概率統(tǒng)計的特殊魅力。

需要說明的是,隨機數(shù)的隨機生成會導(dǎo)致圖1和表1在每次運行程序后的結(jié)果都不相同,實際中有時需要使用相同隨機數(shù)來比較不同方法的計算結(jié)果,可通過R語言中的set.seed()函數(shù)生成可再生的隨機數(shù)來解決這一問題。例如,生成8個服從均勻分布的可再生隨機數(shù),程序如下:

運行程序后的結(jié)果為:

只要將隨機數(shù)種子設(shè)置成某個數(shù)(上例為123),就可以使得每次運行程序后的結(jié)果相同,這樣便于程序的移植和算法的對比分析。

2 基于隨機數(shù)模擬的假設(shè)檢驗

2.1 參數(shù)的假設(shè)檢驗

正態(tài)分布參數(shù)的假設(shè)檢驗是教學(xué)的重點內(nèi)容,教材中一般都先給出一組服從正態(tài)分布的數(shù)據(jù),然后按照假設(shè)檢驗的步驟進行示例介紹[4],學(xué)生對接受還是拒絕原假設(shè)并沒有一個直觀的認識。若通過生成服從正態(tài)分布的隨機數(shù)再對其進行假設(shè)檢驗,不但可以使學(xué)生知道自己檢驗的結(jié)果是否正確,而且可以克服使用了不服從正態(tài)分布的數(shù)據(jù)而導(dǎo)致錯誤判斷的弊端。

在教學(xué)過程中,不妨生成兩組服從正態(tài)分布的隨機數(shù),第一組的數(shù)量為200、均值為2、方差為25,第二組的數(shù)量為300、均值為6、方差為25。由于是在總體參數(shù)均未知的條件下檢驗與的均值是否相同,故使用t檢驗;檢驗方差齊性時使用F檢驗,結(jié)果見表2。由表2可知,t檢驗的P值<0.05,故拒絕均值之差為0的原假設(shè),據(jù)95%的置信區(qū)間可得的均值小于的均值;F檢驗的P值>0.05,不能拒絕方差相等的原假設(shè),即認為與的方差相等。

表2 兩個正態(tài)總體期望和方差的假設(shè)檢驗

通過繪制箱線圖也可以發(fā)現(xiàn)與的平均取值差異較大,但它們的離散程度很相似,與使用t檢驗和F檢驗得到的結(jié)果一致[5]。

2.2 分布的假設(shè)檢驗

分布的假設(shè)檢驗是重要的非參數(shù)假設(shè)檢驗,其中最常見的是正態(tài)性檢驗。正態(tài)性檢驗的方法有很多,包括使用正態(tài)概率圖(Q-Q圖)、Pearson擬合優(yōu)度卡方檢驗、Kolmogorov-Smirnov(K-S)擬合優(yōu)度檢驗、Shapiro-Wilk檢驗(W檢驗)等[6]。在概率統(tǒng)計教材中,這方面的內(nèi)容介紹相對較少,加之每種方法的原理和統(tǒng)計量的計算又非常復(fù)雜,學(xué)生僅僅通過一兩個例子是很難理解的。但若花大量時間去介紹理論,可能會適得其反。因此,若能通過軟件操作演示,不但可以加強學(xué)生對理論的理解,而且可以使學(xué)生快速掌握具體的操作方法,實現(xiàn)了“先會做、再理解”的學(xué)習(xí)過程。

為展示假設(shè)檢驗的操作過程,在教學(xué)中不妨生成700個均值為75、標(biāo)準(zhǔn)差為16的正態(tài)分布隨機數(shù)。使用Q-Q圖判別正態(tài)性比較直觀,但存在主觀性,為了更精確地判別,可以對該數(shù)據(jù)分別使用卡方檢驗、K-S檢驗和W檢驗進行判斷,結(jié)果見表3。由表3可知,三種方法的P值基本相同,遠>0.05,故應(yīng)接受原假設(shè),即認為該隨機數(shù)服從正態(tài)分布,這與生成隨機數(shù)時的分布一致,驗證了三種方法的有效性。

表3 隨機數(shù)的正態(tài)性檢驗

通過R語言生成隨機數(shù)再對其進行假設(shè)檢驗的教學(xué)演示,不但可以使學(xué)生有的放矢地學(xué)習(xí),而且在課程的課時較少、教學(xué)任務(wù)繁重、學(xué)生思考時間有限的情況下,極大地提高了教學(xué)效率。

3 結(jié)論與探討

作為數(shù)據(jù)科學(xué)的重要入門課程,概率統(tǒng)計越來越受到人們的重視。傳統(tǒng)的教學(xué)方式存在重理論、輕應(yīng)用,偏概率、輕統(tǒng)計,阻礙了大數(shù)據(jù)時代發(fā)展的客觀需求。為了使學(xué)生更好地認識和理解概率統(tǒng)計課程中的抽象概念、理論和方法,筆者在總結(jié)實踐教學(xué)經(jīng)驗的基礎(chǔ)上,利用當(dāng)前熱門的數(shù)據(jù)分析軟件——R語言,結(jié)合隨機數(shù)模擬與示例分析,在已知待分析數(shù)據(jù)分布的條件下,對難以理解的理論和統(tǒng)計方法進行直觀演示,不但可以激發(fā)學(xué)生的學(xué)習(xí)興趣,提高他們處理本專業(yè)相關(guān)數(shù)據(jù)的能力,而且可以為他們未來學(xué)習(xí)專業(yè)課程奠定基礎(chǔ),達到了概率統(tǒng)計課程的教學(xué)目標(biāo)和應(yīng)用型人才的培養(yǎng)目標(biāo)。

猜你喜歡
假設(shè)檢驗正態(tài)正態(tài)分布
基于對數(shù)正態(tài)分布的出行時長可靠性計算
統(tǒng)計推斷的研究
時代金融(2017年6期)2017-03-25 12:02:43
雙冪變換下正態(tài)線性回歸模型參數(shù)的假設(shè)檢驗
正態(tài)分布及其應(yīng)用
Primary Question and Hypothesis Testing in Randomized Controlled Clinical Trials
統(tǒng)計學(xué)教學(xué)中關(guān)于假設(shè)檢驗問題探討
基于泛正態(tài)阻抗云的諧波發(fā)射水平估計
正態(tài)分布題型剖析
半?yún)?shù)EV模型二階段估計的漸近正態(tài)性
χ2分布、t 分布、F 分布與正態(tài)分布間的關(guān)系
郓城县| 沙田区| 高碑店市| 柳河县| 本溪市| 海淀区| 西林县| 额济纳旗| 开平市| 太白县| 邯郸市| 郓城县| 南雄市| 南部县| 鄂温| 中阳县| 本溪市| 固阳县| 东丰县| 榆树市| 北京市| 甘孜县| 广昌县| 读书| 绵竹市| 聊城市| 响水县| 长白| 田阳县| 搜索| 清新县| 友谊县| 临潭县| 镇坪县| 五大连池市| 山阳县| 麦盖提县| 辛集市| 涿州市| 库尔勒市| 攀枝花市|