郭朝會
【摘要】鑒于統(tǒng)計(jì)軟件R具有自由、免費(fèi)、源代碼開放以及回歸分析應(yīng)用性強(qiáng)的特點(diǎn),本文提出利用R軟件向理論教學(xué)滲透的教學(xué)方法,使得理論教學(xué)和實(shí)踐教學(xué)相結(jié)合從而提高教學(xué)效果,同時列舉兩個教學(xué)案例加以分析說明.
【關(guān)鍵詞】回歸分析;R軟件;案例教學(xué)
一、概 述
回歸分析是對具有相關(guān)關(guān)系的兩個或兩個以上的變量進(jìn)行統(tǒng)計(jì)分析的一種常用方法,是統(tǒng)計(jì)學(xué)中的一個非常重要的分支,已廣泛應(yīng)用于社會經(jīng)濟(jì)、自然科學(xué)、管理科學(xué)等多個領(lǐng)域.傳統(tǒng)的教學(xué)方法主要是教師在黑板上講授知識,推導(dǎo)理論性質(zhì)和結(jié)果,煩瑣的矩陣、線性代數(shù)計(jì)算使得學(xué)生產(chǎn)生厭學(xué)的消極心理,這種重理論、輕實(shí)踐的教學(xué)方式使得學(xué)生在運(yùn)用回歸分析理論方法處理生活中的實(shí)際問題時存在不少困難,難以將理論知識應(yīng)用于實(shí)踐解決實(shí)際問題[1,2].隨著科學(xué)技術(shù)的發(fā)展,收集數(shù)據(jù)的能力有了快速地提高,大數(shù)據(jù)的研究已成為當(dāng)今時代的寵兒,高維數(shù)據(jù)是統(tǒng)計(jì)學(xué)領(lǐng)域的一個研究熱點(diǎn)和重點(diǎn)問題.當(dāng)學(xué)生面臨多變量的大數(shù)據(jù)進(jìn)行分析時,學(xué)生不能通過簡單的手工計(jì)算得到結(jié)果,此時需要借助統(tǒng)計(jì)軟件進(jìn)行分析處理,本文將討論如何將免費(fèi)的統(tǒng)計(jì)軟件R應(yīng)用于回歸分析的教學(xué)中,將在實(shí)際案例的分析教學(xué)中,講解R軟件的操作過程,通過這種方式訓(xùn)練學(xué)生利用統(tǒng)計(jì)軟件R解決實(shí)際問題的能力[3,4].
二、案例教學(xué)
本文從回歸分析課程教學(xué)的現(xiàn)狀出發(fā),結(jié)合筆者在實(shí)際教學(xué)過程當(dāng)中發(fā)現(xiàn)的問題,提出了將統(tǒng)計(jì)軟件R和理論教學(xué)同步進(jìn)行,在教學(xué)過程中鏈接統(tǒng)計(jì)R軟件的窗口操作,直觀易懂,不僅使學(xué)生熟悉統(tǒng)計(jì)軟件R的操作,還能培養(yǎng)學(xué)生將理論與實(shí)踐相結(jié)合的能力.本文通過回歸分析中三個重要的知識點(diǎn)加以分析說明.
例1 當(dāng)隨機(jī)誤差存在異方差性時,普通最小二乘估計(jì)β^雖是無偏的,但參數(shù)的顯著性檢驗(yàn)失效[5,6].
在向?qū)W生講授這個重要性質(zhì)時,如果僅僅以文字語言來表達(dá)比較抽象,此時便可以借助隨機(jī)模擬來幫助學(xué)生加以理解.考慮如下多元線性模型
其中y是由響應(yīng)變量構(gòu)成的n維向量,X是n×2維的設(shè)計(jì)矩陣,β是2×1維未知參數(shù)向量,ε是n維誤差向量[5,6].首先利用統(tǒng)計(jì)軟件R模擬產(chǎn)生n=100個來自二元正態(tài)分布N(μ,Σ)的隨機(jī)樣本,組成n×2的數(shù)據(jù)矩陣X,其中β1=1,β2=0.5,μ=32,Σ=10.50.51,采用以下兩種方式產(chǎn)生隨機(jī)誤差:(1)異方差ε=x21+x22ζ;(2)同方差ε=ζ,其中ζ~N(0,25).再由(1)式算出100個y值后計(jì)算每次模擬所得參數(shù)的最小二乘估計(jì)值,隨機(jī)模擬2 000次.通過編寫R程序代碼,可以計(jì)算出2 000次隨機(jī)模擬所得參數(shù)估計(jì)值β^的平均值以及β^的真實(shí)方差和估計(jì)方差,運(yùn)行結(jié)果見表1:
由表1可知,無論誤差來源于同方差還是異方差,最小二乘估計(jì)都是無偏的,因?yàn)閰?shù)的估計(jì)值和真實(shí)值很接近.當(dāng)誤差服從同方差時,β^1和β^2的真實(shí)方差和估計(jì)方差相差不大.此外,由表1的第3列和第6列可知,異方差下β^1和β^2的方差大于在同方差條件下的方差.當(dāng)誤差存在異方差性時,β^1和β^2的估計(jì)方差遠(yuǎn)小于它們的真實(shí)方差,即在異方差下仍用普通最小二乘估計(jì)未知參數(shù),將出現(xiàn)低估β^=(β^1,β^2)T的真實(shí)方差的情況,將導(dǎo)致高估回歸系數(shù)t的檢驗(yàn)值,可能造成本來不顯著的某些回歸系數(shù)變成顯著,從而參數(shù)的顯著性檢驗(yàn)失效,回歸方程的應(yīng)用效果極不理想.通過該實(shí)踐教學(xué)過程,可以讓學(xué)生更好地理解這一抽象概念.
例2 當(dāng)誤差存在序列相關(guān)時,普通最小二乘估計(jì)β^雖是無偏的,但參數(shù)的顯著性檢驗(yàn)失效[5,6].
這里仍然用例1的方法產(chǎn)生X和β,隨機(jī)誤差來源于一階自回歸模型:εt=ρεt-1+ut,其中相關(guān)系數(shù)ρ的值從0到1變化,ut~N(0,1),再由(1)式算出100個y值后計(jì)算每次模擬所得參數(shù)的最小二乘估計(jì)值,模擬2 000次.通過編寫程序,可以計(jì)算出2 000次隨機(jī)模擬所得參數(shù)估計(jì)值β^的平均值以及參數(shù)估計(jì)值β^的真實(shí)方差和估計(jì)方差,運(yùn)行結(jié)果見表2:
由表2可知,當(dāng)誤差存在序列相關(guān)時,參數(shù)向量估計(jì)值β^的估計(jì)方差小于它的真實(shí)方差,隨著相關(guān)程度的增強(qiáng),差距增大,即在序列相關(guān)下用普通最小二乘估計(jì)參數(shù),將出現(xiàn)低估β^的真實(shí)方差的情況,容易導(dǎo)致對t值評價過高,常用的F檢驗(yàn)和t檢驗(yàn)失效.如果忽視這一點(diǎn),可能導(dǎo)致得出回歸參數(shù)統(tǒng)計(jì)檢驗(yàn)為顯著,但實(shí)際上并不顯著的嚴(yán)重錯誤結(jié)論.如果不加處理地運(yùn)用普通最小二乘法估計(jì)模型參數(shù),那么用此模型進(jìn)行預(yù)測和結(jié)構(gòu)分析將會帶來較大的方差,甚至是錯誤的解釋.
由表3可知,自變量x1與x2的相關(guān)程度越高,多重共線性越嚴(yán)重,回歸系數(shù)的估計(jì)值的方差就越大,回歸系數(shù)的置信區(qū)間就變得很寬,估計(jì)的精確性大幅度降低,使得估計(jì)值穩(wěn)定性變得很差,進(jìn)一步使得回歸方程整體高度顯著時,一些回歸系數(shù)不能通過顯著性檢驗(yàn),回歸系數(shù)的正負(fù)號可能出現(xiàn)倒置,使回歸方程無法得到合理的經(jīng)濟(jì)解釋,從而影響最小二乘的應(yīng)用效果,降低回歸方程的應(yīng)用價值[5,6].
三、結(jié) 論
回歸分析課程有很強(qiáng)的理論性與實(shí)踐性,因此,可以利用統(tǒng)計(jì)軟件R將抽象理論性質(zhì)用數(shù)值結(jié)果展示,加深和鞏固學(xué)生對理論知識的理解和認(rèn)識,進(jìn)而去引導(dǎo)、啟發(fā)學(xué)生發(fā)現(xiàn)問題、思考問題、解決問題,進(jìn)而培養(yǎng)學(xué)生的創(chuàng)新能力.因此,教師在上課的過程中可以借助R軟件將理論上難以理解的知識點(diǎn)通過數(shù)值結(jié)果展示出來,進(jìn)而提升教學(xué)質(zhì)量,以期取得較好的教學(xué)效果.為了更好地適應(yīng)大數(shù)據(jù)時代發(fā)展對統(tǒng)計(jì)學(xué)人才培養(yǎng)的要求,注重人才實(shí)踐能力的培養(yǎng)已得到國內(nèi)高校的普遍肯定和重視,因此,在實(shí)際教學(xué)中應(yīng)該將實(shí)踐和理論進(jìn)行有效的結(jié)合[7].
【參考文獻(xiàn)】
[1]姚娟.《應(yīng)用回歸分析》課程的教學(xué)思考.經(jīng)貿(mào)實(shí)踐,2018(22):278-279.
[2]彭娟.課題研究的教學(xué)模式的探索與實(shí)踐——以《實(shí)用回歸分析》課程的教學(xué)為例[J].湖北科技學(xué)院學(xué)報,2015(3):81-83.
[3]薛毅,陳立萍.統(tǒng)計(jì)建模與R軟件[M].北京:清華大學(xué)出版社,2007.
[4]丁新濤,周在瑩,王翠蓮,肖睛.R軟件教學(xué)的一些心得[J].課程教育研究,2013(34):125.
[5]何曉群,閔素芹.實(shí)用回歸分析:第二版[M].北京:高等教育出版社,2014.
[6]何曉群,劉文卿.應(yīng)用回歸分析:第四版[M].北京:中國人民大學(xué)出版社,2015.
[7]李婷婷,郝媛媛,劉洋.多元統(tǒng)計(jì)分析課程中實(shí)踐教學(xué)向理論教學(xué)的滲透[J].西南師范大學(xué)學(xué)報(自然科學(xué)版),2017(12):163-166.