李欣然
摘? 要:中國體育世界冠軍獲得情況受多種因素影響,本文主要利用線性回歸分析法,研究中國獲體育世界冠軍的主要影響因素。首先,從外部和內(nèi)部兩大方面定性分析了世界冠軍獲得情況的影響因素,初步選取國際級運動健將人數(shù)等7個主要因素作為自變量,選取我國每年體育世界冠軍人數(shù)作為響應(yīng)變量。其次,通過對該經(jīng)典模型的檢驗,發(fā)現(xiàn)模型可能存在多重共線性和異方差性,分別采用對數(shù)線性變換+逐步回歸法、加權(quán)最小二乘法對模型進(jìn)行修正,得到最終的預(yù)測方程。最后,對我國體育事業(yè)的發(fā)展提出了建議,并對體育事業(yè)和體育產(chǎn)業(yè)的進(jìn)一步研究方向進(jìn)行了展望。
關(guān)鍵詞:世界冠軍? 多元線性回歸模型? 最小二乘法? 加權(quán)最小二乘法
中圖分類號:G633.96? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識碼:A? ? ? ? ? ? ? ? ? ? ? ?文章編號:2095-2813(2019)09(c)-0248-09
1? 緒論
1.1 問題的提出
改革開放40年來,隨著我國社會經(jīng)濟(jì)的快速發(fā)展和綜合國力的增強(qiáng),我國體育事業(yè)得到長足發(fā)展,競技體育取得了歷史性突破。國家統(tǒng)計局?jǐn)?shù)據(jù)顯示,我國在國際體育賽事中冠軍人數(shù)從1978年的4人穩(wěn)步增長到2016年的154人[1]。除此之外,在歷屆奧運會中,我國競技體育的影響力也在提升。從20世紀(jì)80年代到21世紀(jì),金牌數(shù)從5~15枚之間增長到25~55枚之間,獎牌數(shù)從30枚左右增長到90~150枚之間[1],金牌榜的排名穩(wěn)定在世界前3,我國競技體育在國際上地位已十分穩(wěn)固。
深入分析我國運動員歷年獲得世界冠軍的情況,應(yīng)用科學(xué)的預(yù)測模型,研究影響競技體育成績的主要因素,可以對我國體育事業(yè)的發(fā)展提出合理、有效的決策意見,并對未來發(fā)展趨勢進(jìn)行客觀的判斷,對我國競技體育的發(fā)展具有重大意義。
1.2 研究動態(tài)
Bernard、Busse和Lui指出人均GDP、人口規(guī)模和主辦方是贏得奧運獎牌的重要因素[2],Johnson和Ali研究了政治因素對奧運會成功的影響[3]。雷桂成以世界上綜合國力強(qiáng)的國家為例,研究了奧運會金牌榜(或獎牌榜) 與綜合國力的關(guān)系[4];鄧運龍、吳殿廷等研究發(fā)現(xiàn),東道主效應(yīng)對奧運會成績有一定的促進(jìn)作用[5];李力研探討了人類種族的差異對運動成績優(yōu)劣的影響,發(fā)現(xiàn)人種特征在一定程度上決定了體育運動成績[6];王宇鵬從國家宏觀角度總結(jié)和分析了6個奧運會獎牌榜的影響因素,即國家經(jīng)濟(jì)實力、人口數(shù)量、東道主效應(yīng)、人種、文化傳統(tǒng)、國家體制[7];趙聶、趙光娟利用時間序列模型對我國年度時間冠軍進(jìn)行了預(yù)測研究[8];張玉華利用灰色關(guān)聯(lián)分析法和回歸分析法分析了影響世界冠軍人數(shù)的4個因素[9];馮興剛等人驗證了技術(shù)進(jìn)步有利于提高我國運動水平[10]。
總體來看,雖然國內(nèi)外的研究成果較多,但是針對我國獲世界冠軍情況的研究較少;定性分析較多,通過科學(xué)模型進(jìn)行的定量研究較為缺乏;在有限的定量研究成果中,同時進(jìn)行分析的影響因素較單一。因此,本文在已有研究成果的基礎(chǔ)上,構(gòu)建多元線性回歸模型,同時分析我國國際級運動健將人數(shù)等7種因素對中國獲體育世界冠軍情況的影響。
1.3 文章結(jié)構(gòu)
中國體育世界冠軍獲得情況受眾多因素影響,本文主要利用回歸分析法,研究中國獲體育世界冠軍的主要影響因素,以便為我國體育事業(yè)發(fā)展提供科學(xué)有效的決策。
首先,定性分析世界冠軍獲得情況的影響因素,選取影響較大的因素進(jìn)行定量分析,建立滿足古典假設(shè)的經(jīng)典回歸模型[11]。其次,利用收集到的數(shù)據(jù)樣本檢驗經(jīng)典模型的基本假設(shè)是否成立,若出現(xiàn)違背基本假設(shè)的情況,則需要對模型進(jìn)行適當(dāng)?shù)男拚?,并再次檢驗,直到模型檢驗通過為止。由此得到優(yōu)化且修正后的最優(yōu)回歸模型。最后,根據(jù)得到的最優(yōu)模型及以上的分析,對我國體育事業(yè)的發(fā)展提出合理有效的決策意見,并對未來發(fā)展趨勢進(jìn)行客觀的預(yù)測和判斷。
2? 模型設(shè)定
2.1 世界冠軍獲得情況的影響因素選擇分析
通過對歷年中國獲體育世界冠軍的情況研究,及文獻(xiàn)資料的整理,我們發(fā)現(xiàn),我國每年世界冠軍獲得的影響因素,大致可分為外部因素和內(nèi)部因素兩大方面。
外部因素主要指非自身的環(huán)境因素。我國每年世界冠軍的獲得情況,在大環(huán)境上與我國當(dāng)年的總?cè)丝跀?shù)、國內(nèi)的生產(chǎn)總值、國際上舉行的賽事等有關(guān),本文篩選出我國當(dāng)年的總?cè)丝跀?shù)和國內(nèi)生產(chǎn)總值作為大環(huán)境中的外部驅(qū)動因素研究指標(biāo)。
從小環(huán)境來說,也和國家對體育事業(yè)政策上的支持以及傾斜度等有關(guān);另外,隨著全民健身的蓬勃發(fā)展,由體育事業(yè)帶動發(fā)展起來的體育產(chǎn)業(yè),也是影響運動員水平的外部因素之一;而體育產(chǎn)業(yè)的優(yōu)質(zhì)資源與條件,較大程度上取決于社會在體育方面的固定投資。因此,本文篩選出體育產(chǎn)業(yè)增加值和全社會在體育方面固定資產(chǎn)投資作為小環(huán)境中的外部驅(qū)動因素研究指標(biāo)。
在上述外部環(huán)境因素的影響下,自身的因素更為重要。自身因素主要體現(xiàn)在兩點:運動員的優(yōu)秀程度和優(yōu)秀教練員的水平,這兩大因素作為內(nèi)部驅(qū)動力可用以下指標(biāo)數(shù)據(jù)量化:國際級運動健將人數(shù)、二級及其以上運動員人數(shù)和各級體育系統(tǒng)職工人數(shù)。其中,二級以上運動員有較大的可能獲得世界冠軍,尤其是國際級運動健將;而健全的體育委員會體系,能為運動健兒們提供更好的訓(xùn)練環(huán)境和更科學(xué)的技術(shù)指導(dǎo)。
綜合以上分析,選取我國當(dāng)年國際級運動健將人數(shù)、二級以上運動員人數(shù)、各級體育系統(tǒng)職工人數(shù)、體育產(chǎn)業(yè)增加值、全社會在體育方面的固定資產(chǎn)投資、全國總?cè)丝跀?shù)、當(dāng)年國內(nèi)生產(chǎn)總值這7個主要因素,分析我國體育世界冠軍的獲得情況。
2.2 模式形式設(shè)計
根據(jù)上文分析,為了研究我國體育世界冠軍獲得情況的主要影響因素,以我國每年獲得體育世界冠軍的人數(shù)Y作為響應(yīng)變量,初步選取我國當(dāng)年國際級運動健將人數(shù)X1、二級以上運動員人數(shù)X2、各級體育系統(tǒng)職工人數(shù)X3、體育產(chǎn)業(yè)增加值X4、全社會在體育方面的固定資產(chǎn)投資X5、全國總?cè)丝跀?shù)X6、當(dāng)年國內(nèi)生產(chǎn)總值X7作為解釋變量。
先通過Y與各因素變量Xi的散點圖對數(shù)據(jù)進(jìn)行初步探索,觀察分析其相關(guān)程度。其散點圖分別如圖1至圖7所示。
觀察圖1,發(fā)現(xiàn)較大部分點近似在一條直線上下波動,說明世界冠軍人數(shù)的函數(shù)Y與國際級運動健將人數(shù)X1近似呈線性關(guān)系。同理觀察發(fā)現(xiàn),Y與變量X1、X4、X5、X6、X7具有較強(qiáng)的線性相關(guān)性。
因此,初步建立我國世界冠軍人數(shù)Y與因素變量Xi之間的多元線性回歸模型:
其中,μ為隨機(jī)擾動項。
為簡化模型便于分析,現(xiàn)假設(shè)模型(1)滿足古典線性回歸模型的基本假設(shè)[11]。
(1)高斯-馬爾柯夫(Gauss-Markov)條件。
隨機(jī)擾動項μ滿足零均值、同方差、無自相關(guān)假定,即:
(2)正態(tài)性假定。
隨機(jī)擾動項μ服從正態(tài)分布,即;且各個μi相互獨立。
(3)隨機(jī)擾動項與解釋變量不相關(guān)假定。
即假定,。
(4)無多重共線性假定。
假定各解釋變量之間不存在線性關(guān)系,即設(shè)計矩陣X滿足:
其中,k為自變量個數(shù),n為樣本容量。
3? 數(shù)據(jù)準(zhǔn)備
根據(jù)上文分析及模型的設(shè)定,從《中國統(tǒng)計年鑒》中的運動員獲世界冠軍情況、分地區(qū)分技術(shù)等級運動員發(fā)展情況、體育系統(tǒng)人員機(jī)構(gòu)情況、按主要行業(yè)分的全社會固定資產(chǎn)投資、人口數(shù)及構(gòu)成、國內(nèi)生產(chǎn)總值[1],以及中國產(chǎn)業(yè)信息網(wǎng)的報告《2017年中國體育產(chǎn)業(yè)發(fā)展近況及產(chǎn)業(yè)的經(jīng)濟(jì)帶動效果》 [12]中獲取了所需的數(shù)據(jù)樣本。
在保證數(shù)據(jù)完整性與正確性的前提下,選擇采用更加完善的數(shù)據(jù)庫,故選用1998—2016年的數(shù)據(jù)樣本。本文獲取的數(shù)據(jù)樣本如表1所示。
4? 模型求解及優(yōu)化研究
首先,估計模型中的未知參數(shù),得到預(yù)測方程;其次,對擬合模型進(jìn)行檢驗,主要包括實際意義檢驗、統(tǒng)計推斷檢驗以及計量經(jīng)濟(jì)學(xué)檢驗(檢驗是否違背古典假設(shè));最后,當(dāng)檢驗未通過或在檢驗中發(fā)現(xiàn)問題時,需要對模型進(jìn)行相應(yīng)的優(yōu)化與修正。
4.1 初步模型的求解
設(shè)定好擬合模型之后,利用序列的樣本觀察值確定該模型的口徑,估計模型中未知參數(shù)的值。利用最小二乘法對初步線性回歸模型(1)進(jìn)行參數(shù)估計,利用Eviews求解得到模型(1)的回歸系數(shù)估計值,結(jié)果見表2。
從而得到模型(1)的預(yù)測方程:
(2)
從表2的回歸結(jié)果來看,國際級運動健將人數(shù)X1對世界冠軍人數(shù)Y的影響較大。在假定其他因素不變的情況下,國際級運動健將人數(shù)X1增加1%,世界冠軍人數(shù)Y平均增加18.45%;在假定其他因素不變的情況下,全社會體育固定資產(chǎn)投資X5增加1%,世界冠軍人數(shù)Y平均增加3.09%。這與理論分析和經(jīng)驗判斷結(jié)果一致。
在確定了擬合模型的口徑之后,還要對該擬合模型進(jìn)行必要的檢驗。以下主要進(jìn)行統(tǒng)計推斷檢驗和計量經(jīng)濟(jì)學(xué)檢驗這兩大方面的檢驗。
4.2 模型的統(tǒng)計推斷檢驗及優(yōu)化
統(tǒng)計推斷檢驗主要包括模型系統(tǒng)的顯著性檢驗和回歸系數(shù)的顯著性檢驗。
4.2.1 模型的顯著性檢驗
選取擬合優(yōu)度檢驗和方程的顯著性檢驗對模型系統(tǒng)進(jìn)行檢驗。
利用Eviews對回歸方程(2)進(jìn)行檢驗,結(jié)果如表3所示。
通常用可決系數(shù)R2度量預(yù)測方程(2)的擬合程度。由表3結(jié)果可得,可決系數(shù)R2=0.795605,調(diào)整的可決系數(shù),反映世界冠軍人數(shù)的79.56%可以由預(yù)測方程(2)確定,說明模型對數(shù)據(jù)樣本擬合得較好。
通常使用F檢驗對模型系統(tǒng)的顯著性進(jìn)行檢驗。建立原假設(shè):
給定顯著性水平α=0.05,構(gòu)造檢驗統(tǒng)計量:
得到拒絕域:
由表3結(jié)果可得F=6.116754,查F分布表可知,由于,且F檢驗的P值 P=0.004237<0.05,因此在0.05顯著性水平下拒絕原假設(shè),認(rèn)為回歸方程顯著,即認(rèn)為我國當(dāng)年國際級運動健將人數(shù)X1、二級及其以上運動員人數(shù)X2、各級體育系統(tǒng)職工人數(shù)X3、體育產(chǎn)業(yè)增加值X4、全社會在體育方面的固定資產(chǎn)投資X5、全國總?cè)丝跀?shù)X6、當(dāng)年國內(nèi)生產(chǎn)總值X7等變量聯(lián)合起來對我國每年獲得體育世界冠軍的人數(shù)Y有顯著影響。
4.2.2 參數(shù)的顯著性檢驗
通常使用t檢驗對回歸系數(shù)的顯著性進(jìn)行檢驗。分別建立原假設(shè)
給定顯著性水平α=0.05,構(gòu)造檢驗統(tǒng)計量:
得到拒絕域
利用Eviews對回歸方程(2)的回歸系數(shù)βi,的顯著性進(jìn)行檢驗,結(jié)果如表4所示。
查t分布表可得。結(jié)合表4中的結(jié)果,發(fā)現(xiàn)所有回歸系數(shù)對應(yīng)的t值的絕對值都小于2.179,不能拒絕其原假設(shè),認(rèn)為模型中的7個變量對我國體育世界冠軍人數(shù)Y都沒有顯著影響。這與實際情況不符,剖析原因,可能是因為沒有進(jìn)行變量篩選,僅通過定性分析的變量選取方法較為主觀,模型中存在不顯著變量等原因。
4.2.3 基于逐步回歸法的優(yōu)化模型
針對以上模型的統(tǒng)計推斷檢驗中出現(xiàn)的變量不顯著的問題,使用逐步回歸法定量地對變量進(jìn)行篩選。篩選得到變量X1、X2、X3、X4、X5和X6,由此建立優(yōu)化后的線性回歸模型:
(3)
對優(yōu)化模型(3)進(jìn)行求解,求解結(jié)果如表5所示。
優(yōu)化模型(3)的回歸方程為:
從回歸方程(4)來看,國際級運動健將人數(shù)X1和全社會體育固定資產(chǎn)投資X5對世界冠軍人數(shù)Y的影響仍然較大。這與理論分析和經(jīng)驗判斷一致,比如在競技體育中,國際運動健將一般相比其他運動員有更大的可能性贏得世界冠軍,因此國際運動健將人數(shù)對世界冠軍人數(shù)具有重要影響?;貧w方程(4)的決定系數(shù),擬合程度較高,且高于回歸方程(2)。
對于模型的檢驗,查表得。由表5可知,F(xiàn)值滿足,方程的顯著性檢驗通過,說明在0.05顯著性水平下回歸方程(4)顯著成立。查表得,對比表4結(jié)果,可知方程(4)回歸系數(shù)的顯著情況也得到了極大的改善。
對比初始模型(2)和優(yōu)化后的回歸方程(4)的求解結(jié)果,發(fā)現(xiàn)相對于初始回歸方程(2),優(yōu)化后的方程(4)的擬合度提高了,F(xiàn)值也提高了,AIC、SC的值都降低了,而回歸方程的標(biāo)準(zhǔn)誤差SE、F檢驗的P值、回歸系數(shù)的標(biāo)準(zhǔn)誤差S、t統(tǒng)計量的P值也普遍降低了,都印證了回歸方程(4)更優(yōu)化了。
4.3 模型的計量經(jīng)濟(jì)學(xué)檢驗及調(diào)整
以上初始模型(1)和優(yōu)化模型(3)都是在滿足基本假設(shè)的前提下進(jìn)行的。但是在實際的計量經(jīng)濟(jì)學(xué)模型中,違背基本假設(shè)的情況時有發(fā)生。因此需要對此進(jìn)行檢驗和修正,并再次檢驗,直到通過為止。通常違背基本假設(shè)的情況主要包括異方差性、序列相關(guān)性、多重共線性。以下主要針對這3個方面進(jìn)行計量檢驗。
4.3.1 多重共線性檢驗
先檢驗是否存在多重共線性,再使用相關(guān)的方法進(jìn)行修正。
(1)識別。
以下分別使用綜合判斷法、簡單相關(guān)系數(shù)檢驗法、判定系數(shù)檢驗法進(jìn)行多重共線性檢驗。
首先,進(jìn)行綜合判斷。由上回歸結(jié)果表5中發(fā)現(xiàn),模型(3)的擬合程度較高,整體效果的F檢驗通過,說明模型對樣本擬合的較好,回歸方程顯著。但有重要變量國際級運動健將人數(shù)X1和體育系統(tǒng)機(jī)構(gòu)人員數(shù)X3的t檢驗不顯著,模型(3)可能存在嚴(yán)重的多重共線性。
其次,用簡單相關(guān)系數(shù)檢驗法檢驗。計算各個解釋變量X1、X2、X3、X4、X5和X6兩兩之間的簡單相關(guān)系數(shù),得到其簡單相關(guān)系數(shù)矩陣:
由相關(guān)系數(shù)矩陣可以看出,1解釋變量X4和X5、X4和X6、X5和X6之間的相關(guān)系數(shù)較高,證實部分解釋變量之間確實存在較為嚴(yán)重的多重共線性問題。
最后,用判定系數(shù)檢驗法檢驗。對模型(3)作輔助回歸,將每個變量分別作為響應(yīng)變量對其余5個變量進(jìn)行線性回歸,分別得到它們的判定系數(shù)及方差擴(kuò)大因子,結(jié)果如表6所示。
方差擴(kuò)大因子(Variance Inflation Factor,VIF)是指解釋變量之間存在多重共線性時的方差與不存在多重共線性時的方差之比。是容忍度的倒數(shù),VIF越大,顯示共線性越嚴(yán)重。經(jīng)驗判斷方法表明:當(dāng)0 (2)修正。 綜合以上3種檢驗的結(jié)果,模型中還是可能存在多重共線性的問題。關(guān)于多重共線性的修正方法一般有變量變換法、先驗信息法、逐步回歸法等,本文選取變量變換法和逐步回歸法對模型(3)進(jìn)行修正。 選取對數(shù)變換法對模型進(jìn)行修正。對模型(3)的各變量進(jìn)行對數(shù)變換,得到對數(shù)變換模型: 其中,ε為隨機(jī)擾動項。對模型(5)求解,求解結(jié)果見表7。 對數(shù)線性模型(5)的回歸方程為: 由表7結(jié)果可知,F(xiàn)值滿足: 方程(6)的顯著性檢驗通過。對比回歸方程(4)的求解結(jié)果,回歸方程(6)的擬合程度R2提高了,AIC、SC的值都降低了,回歸方程的標(biāo)準(zhǔn)誤差SE也降低了。但是,回歸系數(shù)的顯著性大幅降低了,說明對數(shù)變換的方法,對多重共線性的修正效果不太理想。 下面在對數(shù)線性模型的基礎(chǔ)上,使用逐步回歸法對模型(6)進(jìn)行修正。經(jīng)過逐步回歸法篩選后,剔除了變量和。由此建立新的回歸模型: (7) 其中,ε為隨機(jī)擾動項。對逐步回歸修正模型(7)進(jìn)行求解,求解結(jié)果見表8。 得到逐步回歸修正模型(7)的回歸方程: (8) 從回歸方程(8)來看,體育產(chǎn)業(yè)增加值的對數(shù)和全社會體育固定資產(chǎn)投資的對數(shù)對世界冠軍人數(shù)的對數(shù)Y的影響較大。這與理論分析和經(jīng)驗判斷一致,體育產(chǎn)業(yè)的發(fā)展情況作為外部因素,是影響運動員水平的外界環(huán)境之一;而體育產(chǎn)業(yè)增加值和體育方面固定資產(chǎn)的投資情況,反映了我國體育產(chǎn)業(yè)的發(fā)展情況,因此其對世界冠軍的人數(shù)也有較大影響?;貧w方程(8)的決定系數(shù)R2=0.769877,擬合程度較高。 對于模型的檢驗,查表得。由表8可知,F(xiàn)值滿足,方程的顯著性檢驗通過,說明在0.05顯著性水平下回歸方程(8)顯著成立。查表得,對比表7結(jié)果,可知方程(8)回歸系數(shù)的顯著情況得到了極大的改善,且AIC、SC的值都降低了,回歸方程的標(biāo)準(zhǔn)誤差SE、殘差平方和ESS也降低了,說明誤差更小了。 4.3.2 異方差的檢驗 異方差性指對于給定的每一個自變量Xi,隨機(jī)擾動項μi的條件方差不等于同一個常數(shù),違背了隨機(jī)擾動項等方差的基本假定。 (1)檢驗。 異方差的常用檢驗方法有:圖示檢驗法、Goldfeld-Quanadt檢驗法、White檢驗。其中,Goldfeld-Quanadt檢驗法只適合大樣本量的數(shù)據(jù)。因此,本文選取圖示檢驗法和White檢驗法進(jìn)行異方差檢驗。 5.3 研究的不足 本文為了便于分析,對模型進(jìn)行了一定的假設(shè)限定,可能與實際情況有些差異。 本文擬合模型的形式設(shè)定存在一定主觀性,與實際情況不一定相符合。 參考文獻(xiàn) [1] 國家統(tǒng)計局.中國統(tǒng)計年鑒[M]. 北京:中國統(tǒng)計出版社,1999—2017. [2] Bernard A B,Busse M R.Who wins the Olympic games:economics resources and medal totals [J]. Review of Economics and Statictics,2004(86):413-417. [3] Lui Hon-Kwong,Suen Wing.Men,money,and medals: an econometric analysis of the Olympic games[J].Pacific Economic Review,2008,13(1):1-16. [4] 雷桂成.試析奧運金牌榜與綜合國力關(guān)系[J].浙江體育科學(xué),2002,24(1):29-32. [5] 吳殿廷.2008北京奧運會中國金牌趕超美國的可能性[J].統(tǒng)計研究,2008,25(3):60-64. [6] 李力研.人類種族與體育運動[J].中國體育科技,2001, 37(6):3-8. [7] 王宇鵬,許健,張媛媛.奧運獎牌榜影響因素的實證分析[J].統(tǒng)計研究,2008,25(10):57-62. [8] 趙聶.時間序列模型在我國年度世界冠軍預(yù)測中的應(yīng)用[J].成都體育學(xué)院學(xué)報,2008(2): 68-71. [9] 張玉華.基于線性回歸動態(tài)模型的中國第31屆奧運會獎牌數(shù)預(yù)測[J].河南師范大學(xué)學(xué)報:自然科學(xué)版,2015, 43(2):179-184. [10] 馮興剛,李媛,俞培果.技術(shù)進(jìn)步對于提高我國運動水平作用的實證檢驗[J].西南科技大學(xué)學(xué)報:哲學(xué)社會科學(xué)版,2014,31(2):29-32,40. [11] 龐皓.計量經(jīng)濟(jì)學(xué)[M].北京:科學(xué)出版社,2010. [12] 智研咨詢集團(tuán).2017年中國體育產(chǎn)業(yè)發(fā)展近況及產(chǎn)業(yè)的經(jīng)濟(jì)帶動效果[EB/OL].(2018-12-06).https://www.chyxx.com/industry/201811/695635.html.