樊亞莉
(上海理工大學 理學院,上海 200093)
隨著我國經濟的快速發(fā)展,對應用數學專業(yè)的人才需求和要求亦有顯著提升。越來越多的實際工作崗位不僅要求應用數學專業(yè)的人才具有較強的邏輯思維和抽象思維能力,更需要具有較強的創(chuàng)新能力和綜合應用能力。概率論作為應用數學專業(yè)的核心課程之一,是專門研究客觀世界中隨機現(xiàn)象的數學分支課程,其突出特點是既有嚴密的數學基礎,又廣泛應用于自然社會人文等眾多領域,與眾多學科具有密切聯(lián)系。因此概率論課程在培養(yǎng)學生理論聯(lián)系實際和創(chuàng)新創(chuàng)造能力等方面,起著非常重要的作用。
但是,筆者在多年的本科教學過程中感到,目前應用數學專業(yè)的教學,普遍存在偏理論輕應用的現(xiàn)象,學生往往分析解決實際問題能力不高,創(chuàng)新創(chuàng)造意識不強。這使得我們培養(yǎng)的應用數學專業(yè)人才很難滿足當前經濟市場的需求。造成這種現(xiàn)象的原因涉及到教學方法、教學觀念和成績評價體系等多方面因素。就概率論課程而言,傳統(tǒng)的教學方法往往偏重理論推理、公式運用以及計算解題等方面,而忽視對概率論在實際問題的應用方面的介紹和訓練,這就使得學生對概率論中眾多思想方法,如大數定律、中心極限定理等,缺乏深刻理解,也難以運用到實際問題中。同時,偏重理論的教學方法也容易使學生失去對概率論的學習興趣。筆者的這些發(fā)現(xiàn)與參考文獻[2-4]中的觀點基本一致。
概率論課程緊密聯(lián)系實踐的特點決定了在教學過程中開設實驗課的可行性,受到參考文獻[5]和[6]中遞進式教學方法的啟發(fā),本文希望通過對概率輪課程中實驗課的設計,來輔助理論教學,將教學過程中難以理解的內容轉化為直觀的、易于理解的內容。學生通過簡單易學的數學軟件,自己設置參數并完成實驗,從而深刻領會概率論的基本思想,逐步提高實踐能力。
熟練掌握幾種常見離散型和連續(xù)型分布的相關函數命令,包括對應分布的隨機數產生、分布函數、密度函數、分位數函數等命令;熟練掌握常用的特征數字的函數命令,例如均值、方差、中位數、協(xié)方差、相關系數、變異系數、峰度系數、偏度系數等;掌握常見的作圖方法,包括繪制分布函數、密度函數、直方圖等;能編寫簡單的程序來驗證大數定律和中心極限定理;能設計簡單的蒙特卡洛試驗,來估計感興趣的數值。
由于實驗課程中的案例的實現(xiàn)需要數學軟件的輔助才能完成,因此在實驗課程實現(xiàn)之前,需要學生熟悉一個合適的軟件。目前數學和統(tǒng)計軟件很多,比如功能強大的綜合性軟件MATLAB,統(tǒng)計學專業(yè)軟件SPSS、SAS等。對于專業(yè)性較強的軟件,往往需要專門的課程來學習。對于概率論這門獨立課程,顯然沒有太多的課時用于軟件學習,因此作為教學輔助,一款簡單易學且容易配置的軟件才能滿足要求。R軟件正是這樣一款符合要求的軟件。首先,R軟件是一個開源項目,在很多操作系統(tǒng)上都可以免費安裝;其次,R軟件功能強大,基本安裝就涵蓋了數以百計的概率統(tǒng)計函數和圖形函數;最后,R的最大優(yōu)點在于可讀性強,簡單易學,學生往往只需要1課時就可以掌握R的基本操作?;谏鲜鲈?本文接下來的案例設計都是基于R軟件進行的。
以56課時的應用數學專業(yè)的概率論課程為例,設計了8課時的實驗課程。
1.重要的概率分布
計劃用3課時使學生深刻理解重要分布的分布特點,參數含義以及密度函數的圖形特征。重要的概率分布有:二項分布B(n,p)、泊松分布P(λ)、幾何分布G(p)、均勻分布U(a,b)、指數分布Exp(λ)、正態(tài)分布N(μ,σ2)等。
實驗Ⅰ內容如下:
(1)給定參數,繪制上述6種常見概率分布的密度函數和分布函數圖,理解參數的大小變化對分布的影響;
(2)給定參數,計算常見概率分布的中位數,并與對應的數學期望進行比較;
(3)給定參數,考察運用泊松定理和中心極限定理對于二項分布下概率計算的近似程度。例如設隨機變量X服從二項分布B(1 000,0.006),則計算概率隨機變量X取值不超過8的概率的精確值,并利用泊松定理和中心極限定理分別計算其近似值,并加以比較。
實驗Ⅰ的設計意圖如下:
(1)希望學生通過實驗理解常見分布的特點。比如通過更改參數λ的大小,可以發(fā)現(xiàn),隨著參數λ的增加,泊松分布的密度函數峰值向右偏移,而且泊松分布總是在參數λ附近取得較大概率值,而在距離λ較遠處,概率值迅速向零衰減。又如對于正態(tài)分布,當參數μ固定時,改變σ的大小,分布的密度函數的陡峭程度發(fā)生改變,σ越小,分布越陡峭,而當參數σ固定時,改變μ的大小,分布的密度函數會左右平移,這樣可以幫助學生理解μ為位置參數,而σ是形狀參數。以正態(tài)分布N(0,1)為例,繪制密度函數和分布函數圖在R中可以用命令
x<-pretty(c(-3,3),50);y<-dnorm(x,mean=0,sd=1);
z<-pnorm(x,mean=0,sd=1)
plot(x,y,type=″l″,xlab=″x″,ylab=″f(x)″)
plot(x,y,type=″l″,xlab=″x″,ylab=″F(x)″)
這里,用f(x)表示密度函數,用F(x)表示分布函數。
(2)希望學生理解各種常見分布與正態(tài)分布比較時的偏度。由于當分布右偏時,中位數小于分布的期望值,當分布左偏時,中位數大于分布的期望值,因此通過比較中位數和期望,可以理解該分布的偏度。以指數分布Exp(0.2)為例,通過命令qexp(0.5,0.2)可以算出指數分布Exp(0.2)的中位數為3.465 736,而期望值為5,因此推出指數分布的分布形狀是右偏的。
(3)希望學生理解并運用泊松定理和中心極限定理求二項分布概率的近似值。在上述例子中,可以用命令pbinom(8,1 000,0.006)算出概率P{X≤8}的精確值為0.847 859 7,用命令ppois(8,6)和pnorm(8,6,sqrt(6×0.994))可分別算出泊松近似值為0.847 237 5,正態(tài)近似值為0.793 594 6,可見泊松近似較好。
2.蒲豐投針問題
用1課時完成蒲豐投針的模擬實驗,要求學生根據課本上講過的蒲豐投針問題設計一個蒙特卡洛實驗,并在具體參數值下估算圓周率π的值。
實驗Ⅱ內容如下:
假設平面上有間隔為d的等距平行線,向平面隨機投擲一根長度為l的針(l 該實驗可以在R中用以下命令來實現(xiàn) A=NULL;n=10 000;d=1;l=0.8; for(iin1∶200){x=runif(n,0,d/2); y=runif(n,0,pi); F=(x<=(l/2)×(siny));F=as.numeric(F); A[i]=mean(F);mean(A)} 2×l/mean(A) 這里,設定平行線距離為1,針長為0.8,重復200次,用上述命令可以求得π的近似值為3.141 816,學生也可以采用其他參數設置。 該實驗的設計意圖是希望學生深刻理解幾何概率的原理方法,并理解蒙特卡洛實驗的作用,為后續(xù)的數學建模和本科畢業(yè)設計打下良好基礎。 3.大數定律 用3課時完成實驗Ⅲ。該實驗的設計主要參考文獻[1],目的是希望學生深刻理解大數定律的含義,同時通過概率實驗來求出一些復雜積分的近似值。 實驗Ⅲ內容如下: 實驗Ⅲ的設計思路如下: 一般情況下,要求函數f(x)在區(qū)間[0,1]上的定積分,如果該函數的取值介于0和1之間,則可以把該積分值看成一個概率值。事實上,設二維隨機變量(X,Y)服從矩形{0≤x≤1,0≤y≤1}上的均勻分布,則可求得邊際分布分別為區(qū)間[0,1]上的均勻分布,則函數f(x)在區(qū)間[0,1]上的定積分等價于隨機變量Y的取值不超過f(X)的概率,因此可以用頻率來估計這個概率值。根據伯努力大數定律,隨著做實驗的總數n趨于無窮大,頻率可以依概率收斂到概率。對于一般的復雜積分,如函數g(x)在區(qū)間[a,b]上的定積分,可以做一個變換,把它變?yōu)樯鲜龅谝活惙e分。另外,也可以從另一個概率論角度來看待,由于假設X服從[0,1]上的均勻分布,可以把函數f(x)在區(qū)間[0,1]上的定積分看作函數f(x)的數學期望,然后可以根據辛欽大數定律,用平均值估計期望值的方法來求改積分的近似值。同樣對于一般的積分,可以通過變量變換變?yōu)樯鲜龅谝活惙e分。 以積分Ⅰ為例,可以通過以下命令來求該積分的近似值 A=NULL;n=10 000; for(iin1∶200){x=runif(n,0,1);y=runif(n,0,1); F=(y<=sinx×cosx×exp(-(x^2)/2)); F=as.numeric(F); A[i]=mean(F)};mean(A) 這個程序運行之后,得到積分Ⅰ約等于0.288 118 5。該實驗也可以使用以下程序 A=NULL;n=10 000; for(iin1∶200){x=runif(1,0,1);A[i]=sinx×cosx×exp(-(x^2)/2)} mean(A) 上述程序運行一次之后可以得到積分Ⅰ約等于0.280 482 3,兩種模擬給出的近似值接近,因此可以推斷積分積分Ⅰ的值介于0.28到0.29之間。 4.中心極限定理 用1課時完成下列實驗Ⅳ。該實驗的設計目的是希望學生通過蒙特卡洛實驗來驗證并深刻理解中心極限定理。 實驗Ⅳ內容如下: 實驗Ⅳ中的參數可以改變,比如可以把隨機變量序列的共同分布改為參數為0.3的指數分布,同時修改相應的Yn的表達式即可。中心極限定理所描述的結論正是,無論隨機變量序列服從什么分布,只要滿足獨立同分布,那么隨著n趨于無窮大,獨立和的標準化變量都趨于標準正態(tài)分布。對于上述實驗,可以通過以下程序實現(xiàn)。 A=NULL;n=10 000; for(iin1∶2 000){x=runif(n,0,1);y=(sum(x)-n×0.5)/sqrt(n/12);A[i]=y} hist(A) 運行該程序一次,可以得到以下直方圖,如圖1所示。 可以看到,模擬出來的Yn近似服從標準正態(tài)分布。 這里需要說明的是,上述實驗Ⅱ、實驗Ⅲ、實驗Ⅳ的結果都依賴于所產生的隨機數,如果沒有固定隨機種子,那么每次運行相同的實驗產生的隨機數雖然分布相同,但具體數值不盡相同,因此每一位同學所得到的結果不完全相同。學生正是在這種對隨機性和規(guī)律性的不斷觀察中可以深刻理解概率論中有關隨機性的基本概念。 圖1 實驗Ⅳ產生的直方圖示例Fig.1 Sample histogram in experiment Ⅳ 針對應用數學專業(yè)本科生,采用緊密聯(lián)系實際的問題設計了8課時的概率論實驗課程。實驗課和理論課相輔相成,互相促進。學生通過對實驗課的學習,能引起對理論學習的興趣,加深對理論學習的理解,增強學生學習的信心,同時理論學習也對學生實驗課程具有指導意義。在理論教學中增設實驗課的教學方式是實現(xiàn)學生自主學習的有效途徑,能夠促進學生養(yǎng)成對問題進行深入研究和思考的良好習慣。在應用型本科教學要求和大數據時代背景下,概率論實驗課作為概率論理論知識和實際問題應用的橋梁,對培養(yǎng)學生的創(chuàng)新意識和創(chuàng)造精神起到十分積極的作用。二、結束語