王化琨,李春艷,陳莉莉,周亞晶
(黑龍江大學數(shù)學科學學院,黑龍江 哈爾濱150080)
回歸分析是研究多個變量間的非確定性關(guān)系的一種統(tǒng)計分析方法,它在自然科學、經(jīng)濟學和社會管理學等領(lǐng)域的定量分析中有著廣泛的應用?!皯没貧w分析”是高校統(tǒng)計學本科專業(yè)的必修課程,它的先修課程有高等代數(shù)、數(shù)學分析、概率論與數(shù)理統(tǒng)計等專業(yè)基礎(chǔ)課。“應用回歸分析”的教學目的,是使學生能夠理解和掌握基本的線性回歸模型,并了解其他常用的回歸模型,例如嶺回歸、Logistic回歸等。通過該課程的學習,學生不僅對回歸分析的理論有所了解,而且能夠利用回歸的方法進行數(shù)據(jù)分析、統(tǒng)計建模,解決實際問題。
本文作者是高校數(shù)學學院統(tǒng)計學專業(yè)的專任教師,多年來擔任“應用回歸分析”的主講教師。我們針對該門課程的特點,結(jié)合這些年在教學工作中發(fā)現(xiàn)的問題和積累的經(jīng)驗,對“應用回歸分析”課程的教學內(nèi)容和教學方法做一些有益的探討。
根據(jù)我院統(tǒng)計學本科專業(yè)偏精算方向的實際情況,我們在講授“應用回歸分析”時,既要對回歸分析的重要理論作嚴格的數(shù)學證明、公式推導,使回歸分析的學習不失數(shù)學的嚴謹性。但是,考慮到本科生的實際情況,對一些過于復雜的理論,我們只介紹它們的意義,并不作數(shù)學推導。這樣一來,我們不但降低了回歸分析理論學習的難度,而且保證了回歸理論的完整性。同時,考慮到本科層次的回歸分析的教學目的,重點是教授學生如何利用回歸的方法來研究變量間的數(shù)量關(guān)系。因此,我們在選用教材上著重于回歸分析的應用。綜合考慮這些情況,我們選用了何曉群、劉文卿著的《應用回歸分析》這本書。在實際的講授中,對于作為回歸分析基礎(chǔ)的一元線性回歸和多元線性回歸內(nèi)容,我們?nèi)嫦到y(tǒng)地介紹了它的理論,包括定理證明、公式推導。這樣既訓練了學生的數(shù)學思維能力,又加深了對線性回歸的理解。
另外,對于像自變量的選擇與逐步回歸、多重共線性等內(nèi)容,我們將教學重點放在學生對這些問題的理解上。我們在教學中發(fā)現(xiàn),將這些內(nèi)容與實際問題相結(jié)合,更能加深學生的理解,而且有助于激發(fā)學生的學習熱情。例如,在介紹變量的選擇這部分內(nèi)容時,我們舉了空氣污染研究中的變量選擇。該研究討論了某地區(qū)死亡率與氣候、社會經(jīng)濟和污染變量的關(guān)系。它列舉了15個可能影響死亡率的變量,分別是年平均降水量、一月份平均氣溫、七月份平均氣溫、65歲以上老年人口百分比、每戶人口數(shù)、接受學校教育年限的中位數(shù)、具有合理住宅的百分比、每平方英里的人數(shù)、非白種人的百分比、白領(lǐng)階層的百分比、低收入家庭的百分比、碳氫化合物相對潛在污染、氮氧化合物相對潛在污染、二氧化硫化合物相對潛在污染、相對濕度、各種原因?qū)е碌慕?jīng)過年齡修正的總死亡率等。我們不從流行病學的角度去評論,只是利用數(shù)據(jù)進行變量選擇的示范。又如,在介紹共線性數(shù)據(jù)的變量選擇時,我們探討了槍械在底特律兇殺案件中的作用。根據(jù)Gunst和Mason收集的1961 ~1973年的數(shù)據(jù),響應變量為該城市的兇殺率,預測變量是與兇殺案相關(guān)聯(lián)或?qū)礆⒙噬仙杏绊懙淖兞?,例如,?00 ~1000人中配備的全職警察人數(shù)、失業(yè)人口百分比、制造業(yè)人口百分比等。通過實例的講解,學生對于所學的內(nèi)容的理解更加深刻,同時也接觸到一些利用回歸的方法處理實際問題的技巧。
回歸方法通常處理的變量的觀測數(shù)據(jù)量很大,手工計算回歸模型參數(shù)和檢驗統(tǒng)計量很困難。因此,通常需要統(tǒng)計軟件進行計算。在回歸分析中,常見的軟件有SAS、SPSS等。這些軟件都是收費性質(zhì)的軟件,雖然軟件公司提供面向高等院校的免費版本,但功能較為有限。考慮這樣的實際情況,我們在回歸分析的實驗課教學中采用了免費開源的統(tǒng)計軟件,R軟件。R是用于統(tǒng)計分析、繪圖的語言和操作環(huán)境。R是屬于GNU系統(tǒng)的一個自由、免費、源代碼開放的軟件,它是一個用于統(tǒng)計計算和統(tǒng)計制圖的優(yōu)秀工具。R是一套完整的數(shù)據(jù)處理、計算和制圖軟件系統(tǒng)。其功能包括:數(shù)據(jù)存儲和處理系統(tǒng);數(shù)組運算工具(其向量、矩陣運算方面功能尤其強大);完整連貫的統(tǒng)計分析工具;優(yōu)秀的統(tǒng)計制圖功能;簡便而強大的編程語言:可操縱數(shù)據(jù)的輸入和輸出,可實現(xiàn)分支、循環(huán),用戶可自定義功能。我們在實際的實驗教學中,在講解R軟件的基本操作過程中,將如何利用R語言建立并求解回歸模型融入其中。通過這種方式訓練學生利用統(tǒng)計軟件解決實際問題的能力。同時,我們在選擇回歸模型實例時,盡量考慮社會經(jīng)濟和管理領(lǐng)域的實際問題,選擇和教學內(nèi)容相關(guān),同時又具有啟發(fā)性的案例。這樣,既訓練了學生解決實際問題的能力,又鍛煉了學生對社會經(jīng)濟現(xiàn)象的理解分析能力。
每年一屆的大學生數(shù)學建模競賽,目前已成為全國高校規(guī)模最大的基礎(chǔ)性學科競賽,它通常選擇在實際的社會生產(chǎn)生活或者經(jīng)濟現(xiàn)象中遇到的實際問題為試題,目的是考察大學生運用所學的數(shù)學知識解決實際問題的能力。實際上,很多的競賽試題都可以通過建立合適的回歸模型加以解決。我們的回歸分析開設在每學年的上學期,恰好和數(shù)學建模競賽的時間相吻合,我們在教授回歸分析的同時,鼓勵學生報名參加該項賽事。我們根據(jù)學生的學習情況,將學生適當分組,充分調(diào)動學生的積極性和創(chuàng)造性。同時,學生在數(shù)學建模競賽中也檢驗了所學的理論知識,激發(fā)了他們的學習熱情。例如,針對建筑工程協(xié)會提供的一個由于遺漏了預測變量而造成人工的自相關(guān)現(xiàn)象的例子。該協(xié)會希望了解住房工程開工規(guī)模與人口增長的關(guān)系,其目的是為了預測建筑業(yè)的發(fā)展規(guī)模。由于客觀條件的限制,不可能知道潛在的購房者的準確數(shù)據(jù),只能把當?shù)氐木用駭?shù)量作為反映潛在購房者規(guī)模的變量。收集的數(shù)據(jù)是該地區(qū)25年的資料,包括住房開工數(shù)、人口規(guī)模等。經(jīng)過分析,一元線性回歸可以反映人口規(guī)模和住房需求的關(guān)系。但是,人口規(guī)模與開工數(shù)之間的關(guān)系較為復雜,往往是住房開工數(shù)會影響人口規(guī)模(通過人口遷移),反之不然。通過分析這個實際模型,學生接觸了現(xiàn)實生產(chǎn)生活中的變量更復雜,或許有其他的變量更好地解釋開工規(guī)模,由于忽略了這樣的變量而造成了誤差間的自相關(guān)。這些可能的潛在變量包括失業(yè)率、婚姻和家庭的社會趨向、政府的住房政策、建筑和抵押資金的供給。通過實際分析,在引入了抵押資金后,誤差的自相關(guān)性消失了,模型較好地反映了變量的關(guān)系。
應用回歸分析是一門實踐性比較強的統(tǒng)計學專業(yè)課,在以理論教學為主的前提下,還應與實踐教學和案例教學結(jié)合。針對該課程的特點,我們改變了以期末考試的“一張卷”定分數(shù)的傳統(tǒng)考核方式。我們以期末考試與平時能力測試相結(jié)合的考試方試。其中,期末考試主要考查學生對回歸分析的基本理論和基本方法的理解掌握程度。平時能力測試包括平時作業(yè)的完成情況、上機實踐考核、實踐報告。此外,我們還建立了回歸分析教學網(wǎng)站。我們將很多相關(guān)的參考資料放到網(wǎng)站上,包括教材、參考書、參考文獻、教學大綱、教學計劃、多媒體課件、實驗案例、習題和解答、教學錄像等。這樣,極大地方便了學生在課前預習和課后復習。我們利用這個網(wǎng)站,課后與學生在網(wǎng)上交流學習情況、輔導答疑等。學生的平時測驗也放到網(wǎng)站上,讓學生在網(wǎng)上提交測驗,這樣給學生充分的思考時間。在期末考試結(jié)束后,教師結(jié)合以上幾個方面的分數(shù),給出學生的該門課程的最終成績。
[1]何曉群,劉文卿.應用回歸分析[M].中國人民大學出版社,2011.
[2]Samp rit Chatter jee.例解回歸分析[M].機械工業(yè)出版社,2013.
[3]紀躍芝,王純潔.《應用回歸分析》的課程改革與實踐[J].教育教學論壇,2014,(2).
[4]黃蕊,賀樂平.關(guān)于《回歸分析》課程的教學思考[J].新課程研究,2014,(4).