李傳偉
[摘要] 直線回歸研究的是一個因變量與一個自變量之間的回歸問題,但是,在社會經(jīng)濟(jì)領(lǐng)域的許多實際問題中,影響因變量的自變量往往不止一個,而是多個,比如血壓受年齡、性別、體重、性格、職業(yè)(體力勞動或腦力勞動)、飲食、吸煙、血脂水平等因素的影響,因此需要進(jìn)行一個因變量與多個自變量間的回歸分析,即多元回歸分析。其中最為簡單、常用并且具有基礎(chǔ)性質(zhì)的是多元線性回歸分析,許多非線性回歸和多項式回歸都可以化為多元線性回歸來解決,因而多元線性回歸分析有著廣泛的應(yīng)用。目前,在體育統(tǒng)計學(xué)中大多采用SPSS統(tǒng)計軟件進(jìn)行回歸分析。本文利用Excel的數(shù)據(jù)分析工具,通過建立“最優(yōu)”回歸方程對因變量進(jìn)行預(yù)測或控制。
[關(guān)鍵詞] Excel; 向前增選法; 多元回歸; 體育
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2012 . 05. 049
[中圖分類號]G642;TP317.3[文獻(xiàn)標(biāo)識碼]A[文章編號]1673 - 0194(2012)05- 0089- 02
1引言
很多時候,我們研究的問題是受多個因素影響的,需要建立多元回歸方程,進(jìn)行多元回歸分析。在回歸分析中,如果有兩個或兩個以上的自變量,就稱為多元回歸。事實上,一種現(xiàn)象常常是與多個因素相聯(lián)系的,由多個自變量的最優(yōu)組合共同來預(yù)測或估計因變量,比只用一個自變量進(jìn)行預(yù)測或估計更有效,更符合實際。因此多元線性回歸比一元線性回歸的實用意義更大。
多元線性回歸模型的一般形式:
Y = a + b1X1 + b2X2 + … + bkXk
多元線性回歸預(yù)測的步驟:
第一步,獲得候選自變量和因變量的觀測值;
第二步,采用向前增選法從候選自變量中選擇合適的自變量;
第三步,確定回歸系數(shù),判斷回歸方程的擬合優(yōu)度;
第四步,根據(jù)回歸方程進(jìn)行預(yù)測。
2應(yīng)用實例
采用隨機(jī)抽樣的方式從40個學(xué)生中抽?。玻矀€樣本,記錄其肺活量、體重、速度靈巧項目成績、柔韌力量項目成績、脈搏跳動次數(shù)等。將這些數(shù)據(jù)匯總顯示在工作表A25:F47單元格區(qū)域,如圖1所示。試根據(jù)這些數(shù)據(jù)找到肺活量與體重、速度靈巧項目成績、柔韌力量項目成績、脈搏跳動次數(shù)4個自變量之間的關(guān)系,以便進(jìn)行肺活量預(yù)測。試根據(jù)這些數(shù)據(jù)建立回歸模型。如果某學(xué)生體重、速度靈巧項目成績、柔韌力量項目成績、脈搏跳動次數(shù)分別為:70千克、14秒、18厘米,70次/分,試預(yù)測其肺活量。
3建立模型
3.1采用圖表法判斷各變量與肺活量的線性相關(guān)關(guān)系
分別選中體重與肺活量、速度靈巧項目與肺活量、柔韌力量項目與肺活量,脈搏跳動次數(shù)與肺活量,利用圖表向?qū)Ы、y散點圖,觀察是否是線性相關(guān)。在此基礎(chǔ)上右擊散點圖添加趨勢線,在打開的“添加趨勢線”對話框中作如圖2的設(shè)置。其中在“類型”選項卡中選擇“線性圖”, “選項”選項卡中選中“顯示公式”和“顯示R平方值”。結(jié)果如圖3所示。其他同理。
其中,R2 為擬合系數(shù)(相關(guān)系數(shù)),分別為:0.836 9 、0.601、0.937 4、0.506 6,從中可以看出體重、速度靈巧項目、柔韌力量項目、脈搏跳動次數(shù)都與肺活量高度相關(guān),即它們都對肺活量產(chǎn)生影響。
3.2利用向前增選法進(jìn)行自變量篩選
篩選結(jié)果如圖4所示,其分析過程如下。
第一輪比較:X1、X2、X3、X4分別代表體重、速度靈巧項目、柔韌力量項目、脈搏跳動次數(shù),利用數(shù)據(jù)分析工具—回歸分析報告或添加趨勢線的方法得到相關(guān)系數(shù)R2。
數(shù)據(jù)分析工具—回歸分析報告的操作步驟如下:
首先選擇“工具”菜單 “加載宏”命令,在打開的“加載宏”對話框中選中“分析工具庫”;單擊“工具”菜單 “數(shù)據(jù)分析”命令,在打開的“數(shù)據(jù)分析”對話框中選中“回歸”,作如圖5的設(shè)置。得到的體重回歸分析報告如圖6所示。
其中R為0.836 864,截距為864.753 844 3,斜率為17.229 347 96,與圖表法相吻合。按照同樣的方法分別建立速度靈巧項目回歸分析報告、柔韌力量項目回歸分析報告、脈搏跳動回歸分析報告,經(jīng)比較結(jié)果X3為最優(yōu)。如表1所示。
第二輪比較:自變量分別為X3,X1;X3,X2;X3;X3,X4
其結(jié)果如表2所示。
第三輪比較:自變量分別為X3,X1,X2;X3,X1,X4
其結(jié)果如表3所示。
3.3建立“最優(yōu)”回歸方程
經(jīng)過3輪比較,找出最優(yōu)的自變量分別為:X3,X1,X2,建立回歸分析報告,如圖7所示。
以此建立回歸方程:Y= 220.712 392 2 + 3.479 453 796X1 + 10.443 020 73X2 + 114.664 102X3
從回歸方程也可以看出,肺活量與體重、速度靈巧項目成績、柔韌力量項目成績均有線性正相關(guān)關(guān)系。
3.4進(jìn)行預(yù)測
根據(jù)體重—速度靈巧項目—柔韌力量項目回歸分析報告,已知:回歸方程截距為220.712 392 2,斜率1(對應(yīng)體重)為3.479 453 796,斜率2(對應(yīng)速度靈巧項目)為10.443 020 73,斜率3(對應(yīng)項目柔韌力量項目)為114.664 102,根據(jù)前述已知條件,預(yù)測的肺活量為2674.43毫升。