摘要:OLS逐步回歸等變量刪除法在處理運(yùn)動(dòng)訓(xùn)練領(lǐng)域的共線性數(shù)據(jù)時(shí),會(huì)將一些重要的解釋變量或樣本點(diǎn)排除在模型之外,從而削弱了理論的優(yōu)先地位和導(dǎo)向功能。PCR模型對(duì)系統(tǒng)信息的綜合與篩選能力不佳,擬合與預(yù)測(cè)精度不甚理想。PLS對(duì)系統(tǒng)信息的綜合與篩選能力強(qiáng)、擬合與預(yù)測(cè)精度較高,是目前處理運(yùn)動(dòng)訓(xùn)練領(lǐng)域小樣本多指標(biāo)共線性數(shù)據(jù)的一個(gè)非常有效的統(tǒng)計(jì)方法,并為運(yùn)動(dòng)訓(xùn)練學(xué)理論模型的實(shí)證檢驗(yàn)提供了可能。其不足之處在于較難明確辨識(shí)所提取成分的物理含義。
關(guān)鍵詞:運(yùn)動(dòng)訓(xùn)練學(xué);運(yùn)動(dòng)訓(xùn)練數(shù)理統(tǒng)計(jì);偏最小二乘回歸;回歸建模
中圖分類號(hào):G80-32 文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1006-7116(2009)10-0074-06
Application of deviated least squares regression in sports training
MA Yong-zhan
(Department of Physical Education,Taizhou University,Linhai 317000,China)
Abstract: When such variable deletion methods as OLS stepwise regression are used to process collinear data in the sports training area, they will reject some important explanatory variables or sample points out of the models, thus weakening the theoretical priority position and guidance function. The PCR model is not well capable of integrating and screening system information, and its fitting and predicting precisions are not so ideal. The PLS is well capable of integrating and screening system information, and its fitting and predicting precisions are relatively high; it is currently a very effective statistical method for processing collinear data with a small sample and multiple indexes in the sports training area, and it provides a possibility for the empirical test of theoretical models of sports training science, but it has some difficulty to specifically identify the physical meaning of components abstracted.
Key words: sports training science;sports trainingof mathematical statistics;partial least-square regression;regression modeling
運(yùn)動(dòng)訓(xùn)練領(lǐng)域高維數(shù)據(jù)處理的目標(biāo)主要在于揭示和定量分析影響專項(xiàng)成績(jī)的諸因素、評(píng)價(jià)和控制這些因素的發(fā)展水平、預(yù)測(cè)運(yùn)動(dòng)員專項(xiàng)成績(jī)的發(fā)展趨勢(shì)等3個(gè)方面。一個(gè)常用的統(tǒng)計(jì)處理方法就是多元線性回歸。但只有當(dāng)解釋變量:1)數(shù)目較少;2)無多重共線性;3)各解釋變量與反應(yīng)變量之間的關(guān)系易于解釋時(shí),多元回歸的普通最小二乘(Ordinary Least Square,OLS)估計(jì)才具有優(yōu)良的理論特性[1]。然而,在運(yùn)動(dòng)訓(xùn)練領(lǐng)域的研究中,由于影響運(yùn)動(dòng)員專項(xiàng)成績(jī)的諸因素之間及諸因素與專項(xiàng)成績(jī)之間關(guān)系的復(fù)雜性以及優(yōu)秀運(yùn)動(dòng)員樣本量的限制,研究人員獲得的往往是樣本量較小、自變量指標(biāo)眾多且共線性(Collinearity)非常普遍的高維數(shù)據(jù)。在此條件下采用OLS回歸建模,將會(huì)危害參數(shù)估計(jì),擴(kuò)大模型誤差,使模型出現(xiàn)許多“病態(tài)”,給模型的解釋帶來困難[2]。近年來體育統(tǒng)計(jì)學(xué)科研究的重點(diǎn)一直致力于有關(guān)統(tǒng)計(jì)思想和具體方法的有效應(yīng)用方面[3]。如有作者從自變量共線性的診斷和補(bǔ)救方法[4-5]、自變量系統(tǒng)的選擇以及所需樣本量[6-7]等方面進(jìn)行了探討,對(duì)多元回歸分析應(yīng)用水平的提高起到一定的促進(jìn)作用。但這些研究并未從理論和方法上給出一套相對(duì)完備的方案,以解決小樣本多指標(biāo)共線性數(shù)據(jù)的建模問題,這無疑對(duì)運(yùn)動(dòng)訓(xùn)練理論本身的發(fā)展十分不利。近年來隨著專業(yè)統(tǒng)計(jì)分析軟件的普及,此問題已開始引起研究者的關(guān)注。本文結(jié)合實(shí)例著重從應(yīng)用的角度,討論處理這類數(shù)據(jù)的主要方法以及偏最小二乘回歸法的應(yīng)用效果。
1小樣本多指標(biāo)共線性數(shù)據(jù)的常用處理方法存在的主要問題
1.1運(yùn)動(dòng)訓(xùn)練領(lǐng)域共線性數(shù)據(jù)產(chǎn)生的原因
所謂共線性是指自變量之間存在著線性相關(guān)的現(xiàn)象。從統(tǒng)計(jì)學(xué)角度看,其成因主要有:一是自變量信息的相互重疊;二是樣本量較小。從運(yùn)動(dòng)訓(xùn)練學(xué)角度看,運(yùn)動(dòng)訓(xùn)練學(xué)的很多概念之間本身就存在較高的關(guān)聯(lián)性,從而直接導(dǎo)致對(duì)這些概念的測(cè)度指標(biāo)之間的信息重疊,例如對(duì)力量與速度的測(cè)度;另一方面不同項(xiàng)目的優(yōu)秀運(yùn)動(dòng)員群體本身就是小樣本?;谶@兩方面的原因,運(yùn)動(dòng)訓(xùn)練領(lǐng)域數(shù)據(jù)的共線性問題幾乎無法避免。當(dāng)共線性問題存在時(shí),自變量之間的信息重疊會(huì)導(dǎo)致一系列的數(shù)學(xué)后果,最終會(huì)使回歸系數(shù)的意義變得無法解釋或不可靠。因此,如何消除或減輕它對(duì)模型的不良影響,是許多學(xué)者多年來一直在探討的問題。
1.2處理運(yùn)動(dòng)訓(xùn)練領(lǐng)域共線性數(shù)據(jù)的常用方法
有經(jīng)驗(yàn)的研究者對(duì)共線性產(chǎn)生的不良影響非常熟悉,當(dāng)他們察覺到自變量系統(tǒng)可能存在較嚴(yán)重的共線性時(shí),便會(huì)根據(jù)分析目標(biāo)采用相應(yīng)的方法進(jìn)行處理。這些方法大體可分成兩類:一類是變量刪除法,另一類為變量組合法。
1)變量刪除法。
變量刪除法在實(shí)際操作中有2種具體的做法:一是采用多元回歸分析中的向前選擇法(forward selection)、向后刪除法(backward elimination)和逐步法(stepwise)對(duì)自變量進(jìn)行篩選;二是先對(duì)自變量系統(tǒng)進(jìn)行聚類,根據(jù)取大的原則篩選典型指標(biāo),然后進(jìn)行回歸分析[8]。有些研究者認(rèn)為,既然共線性產(chǎn)生的主要原因是變量之間的信息重疊,篩選并刪除部分相關(guān)性較高的變量,有可能會(huì)減輕或消除共線性的影響。然而,這僅僅是從統(tǒng)計(jì)理論和技術(shù)的角度看待這一問題,若專項(xiàng)訓(xùn)練理論和實(shí)踐都要求該模型中必須包括一些重要的解釋變量,而這些變量又存在著共線性,此時(shí),研究者如何取舍將變得非常困難。例如無論采用逐步回歸還是先聚類來篩選,表1(見第76頁(yè))中的自變量指標(biāo),在獲得最終可解釋的模型之前,研究者事先并不知道要篩選多少個(gè)指標(biāo)。這樣所獲得的模型是由數(shù)據(jù)驅(qū)動(dòng)的,理論所扮演的角色是事后的,而不是事前的。人們有理由質(zhì)疑完全依賴統(tǒng)計(jì)技術(shù)篩選出的變量在理論上能否站得住腳,即使研究者事后給出模型修正的充分理由,也不能掩蓋另一個(gè)質(zhì)疑:為何這種有如此充分理由的修正沒發(fā)生在研究設(shè)計(jì)階段。從科學(xué)研究的邏輯角度講,變量刪除法已使原來的模型喪失了理論假設(shè)的地位,修正后的模型仍需新的樣本來檢驗(yàn)。也就是說,變量刪除法不具備假設(shè)檢驗(yàn)的功能,僅適用于探測(cè)性的研究[9]。研究者應(yīng)該清醒地認(rèn)識(shí)到變量刪除法意味著對(duì)原有理論模型的修改,而完全基于數(shù)據(jù)資料的模型修改,會(huì)將本應(yīng)保留的系統(tǒng)信息舍棄,給模型的解釋帶來困難,增加了錯(cuò)誤決策的風(fēng)險(xiǎn)。換言之,這種“后見之明”的作法,會(huì)嚴(yán)重削弱理論的優(yōu)先地位和導(dǎo)向功能,進(jìn)而威脅到理論本身的發(fā)展。
2)變量組合法。
變量組合法的實(shí)質(zhì)是將多個(gè)相關(guān)性很高的自變量視為潛變量(也稱因子或成分)的顯性測(cè)度,然后尋找潛變量與各顯性測(cè)度指標(biāo)之間的線性組合關(guān)系,再用潛變量進(jìn)行回歸分析。變量組合法可保留系統(tǒng)中的所有自變量,而無需改動(dòng)事先建構(gòu)好的理論模型,這樣從研究的邏輯角度看,為假設(shè)檢驗(yàn)提供了可能。主成分回歸(principle component regression,PCR)和偏最小二乘(partial least square,PLS)回歸可以說是最典型的變量組合法,不過兩者提取成分的工作原理并不相同。在主成分回歸時(shí),首先抽取自變量集合中的主成分,這些主成分均可表達(dá)為自變量的線性組合。由于主成分之間不存在相關(guān)現(xiàn)象[10],用主成分對(duì)因變量進(jìn)行回歸建模,這就有可能避免直接使用最小二乘法在參數(shù)估計(jì)時(shí)的困難。但這種方法在主成分提取的過程中,并沒有考慮與因變量的關(guān)系,提取的幾個(gè)主成分雖然對(duì)自變量系統(tǒng)有很強(qiáng)的解釋力,但對(duì)因變量的解釋能力很差,況且提取多少個(gè)主成分也頗受爭(zhēng)議。因此,利用主成分回歸的效果未必理想。例如,對(duì)表1中的數(shù)據(jù)提取2個(gè)主成分,其方差累積貢獻(xiàn)率為79%左右。但當(dāng)把這2個(gè)主成分與原來的11個(gè)自變量平等放在一起,無論采用何種方法篩選變量,這2個(gè)主成分都無法進(jìn)入方程。該結(jié)果直觀地說明,這2個(gè)主成分并不比原有的11個(gè)自變量對(duì)因變量的解釋能力強(qiáng)。所以,在實(shí)際應(yīng)用中對(duì)利用主成分回歸消除高維數(shù)據(jù)中自變量之間的共線性問題要非常慎重,不要輕易舍棄對(duì)自變量系統(tǒng)解釋力較小的成分,也許那些對(duì)自變量系統(tǒng)解釋力較小的主成分,反而對(duì)因變量具有更強(qiáng)的解釋作用。
為了彌補(bǔ)主成分回歸在提取成分上的缺陷,偏最小二乘回歸法分別在自變量集合X和因變量集合Y中提取成分t1和u1。但提取這兩個(gè)成分時(shí),要同時(shí)滿足兩個(gè)條件:1)t1和u1應(yīng)盡可能大攜帶他們各自數(shù)據(jù)表中的變異信息;2) t1和u1的相關(guān)程度能夠達(dá)到最大。這兩個(gè)條件表明,t1和u1應(yīng)盡可能好的代表數(shù)據(jù)表X和Y,同時(shí)自變量的成分t1對(duì)因變量的成分u1又有最強(qiáng)的解釋能力。在第一個(gè)成分t1和u1被提取后,偏最小二乘回歸分別實(shí)施X對(duì)t1的回歸以及Y對(duì)t1的回歸,如果回歸方程已經(jīng)達(dá)到滿意的精度,則算法終止;否則,將利用被解釋后的殘余信息進(jìn)行第二輪的成分提取,直到能達(dá)到滿意的精度為止。具體算法詳見參考文獻(xiàn)[11-12]。
從以上偏最小二乘回歸的工作原理看,它所提取的主成分不僅對(duì)自變量系統(tǒng)具有最強(qiáng)的解釋作用,同時(shí)也對(duì)因變量系統(tǒng)的解釋能力達(dá)到最大。經(jīng)過這樣的信息綜合與篩選后,對(duì)因變量沒有解釋意義的信息就被排除了。與主成分回歸相比,偏最小二乘回歸方法更具先進(jìn)性,計(jì)算結(jié)果也更可靠。它所有的計(jì)算過程均可由專門軟件SIMCA-P、SPSS 16 或SAS 8.0以上版本實(shí)現(xiàn)。因此,近幾年引起了廣泛的重視。
2實(shí)例分析
2.1資料來源和特征
采用曲淑華等[13]對(duì)我國(guó)20名優(yōu)秀鐵餅運(yùn)動(dòng)員專項(xiàng)力量指標(biāo)與專項(xiàng)成績(jī)的測(cè)試數(shù)據(jù),其中以y表示專項(xiàng)成績(jī)(m),x1~x11分別代表原地?cái)S餅(m)、擲重餅(m)、擲輕餅(m)、后拋鉛球(m)、立定跳遠(yuǎn)(m)、定立三級(jí)跳遠(yuǎn)(m)、抓舉(kg)、臥推(kg)、高翻(kg)、深蹲(kg)、半蹲(kg)11項(xiàng)專項(xiàng)力量素質(zhì)指標(biāo)(見表1)。
該資料有11個(gè)自變量,而樣本量只有20個(gè),若使用SPSS統(tǒng)計(jì)分析軟件進(jìn)行共線性診斷,將會(huì)發(fā)現(xiàn)有6個(gè)自變量的方差膨脹因子(VIF)均大于15,表示這些變量之間可能存在較嚴(yán)重的共線性問題。進(jìn)而可根據(jù)條件指數(shù)(condition index)和方差比例(variance proportions)確定自變量x2、x3和x10之間具有很強(qiáng)的線性組合關(guān)系。若此時(shí)采用強(qiáng)行法(enter)進(jìn)行普通最小二乘回歸,決定系數(shù)高達(dá)0.876,方程的F檢驗(yàn)值遠(yuǎn)大于檢驗(yàn)臨界值,也就是說,y與x1,…,x11之間應(yīng)該存在很好的線性關(guān)系。但所有回歸系數(shù)的t檢驗(yàn)在0.05水平上皆通不過,說明該數(shù)據(jù)的多重共線性問題已嚴(yán)重危害到參數(shù)估計(jì)。這種小樣本多指標(biāo)共線性的數(shù)據(jù)正是運(yùn)動(dòng)訓(xùn)練領(lǐng)域的研究中使研究人員感到非常困擾的問題。
2.2自變量共線性條件下變量刪除法與變量組合法建模比較
由于表1數(shù)據(jù)中自變量之間的共線性已危害到最小二乘參數(shù)估計(jì),若研究者使用普通最小二乘逐步回歸法篩選變量,試圖消除或減輕共線性的不良影響,最終只能選取了一個(gè)自變量x3(擲輕餅),而其他重要的變量都被排除于模型之外。若先對(duì)自變量系統(tǒng)聚類篩選典型指標(biāo),然后進(jìn)行回歸也會(huì)得到相類似的結(jié)果。這些結(jié)果無論從專項(xiàng)訓(xùn)練理論和實(shí)踐的角度都很難讓人們接受。所以,用變量刪除法消除共線性并非總是可取的,即使在探測(cè)性的研究中,也不一定能取得滿意的效果。
為了進(jìn)一步比較PLS與PCR回歸在處理自變量共線性問題方面的優(yōu)劣,將表1中的數(shù)據(jù)分成兩個(gè)部分:前15個(gè)作為擬合數(shù)據(jù),后5個(gè)作為預(yù)測(cè)數(shù)據(jù)。在進(jìn)行主成分回歸時(shí),根據(jù)特征值大于1的原則選取了3個(gè)主成分,然后用因變量Y與這3個(gè)主成分回歸,第3個(gè)主成分無法通過t檢驗(yàn)。故只能選取前了2個(gè)主成分。根據(jù)交叉有性Q2≥0.097 5(臨界值)的決策準(zhǔn)則[10-11],偏最小二乘回歸也選取了2個(gè)主成分。它們對(duì)各自變量系統(tǒng)概括的信息大體相同,方差累積貢獻(xiàn)率均為79%左右。以上3種方法的回歸系數(shù)估計(jì)值列于表2。
從表2可見,PCR和PLS回歸方程中自變量抓舉(x7)、臥推(x8)、深蹲(x10)、半蹲(x11)的回歸系數(shù)均為負(fù)值,這與它們和專項(xiàng)成績(jī)(Y)的簡(jiǎn)單相關(guān)系數(shù)的方向是一致的。該現(xiàn)象也可從專項(xiàng)訓(xùn)練理論和實(shí)踐的角度得到很好的解釋。抓舉(x7)、臥推(x8)、深蹲(x10)、半蹲(x11)反映運(yùn)動(dòng)員的最大力量水平。雖然最大力量水平是鐵餅運(yùn)動(dòng)員的主要特征之一,也是提高專項(xiàng)投擲能力的基礎(chǔ),但這并不意味著最大力量與專項(xiàng)成績(jī)之間具有良好的線性關(guān)系,尤其對(duì)高水平的運(yùn)動(dòng)員更是如此[12-13]。因此,這兩個(gè)模型中,抓舉(x7)、臥推(x8)、深蹲(x10)、半蹲(x11)的回歸系數(shù)取了非常小的負(fù)值。值得注意的是,PCR模型中另一個(gè)重要的自變量x9(高翻)沒有包括進(jìn)去??傮w而言,與變量刪除法相比,PCR和PLS回歸模型更符合人們的認(rèn)識(shí)水平。
2.3PCR與PLS回歸模型的精度比較
PCR和PLS模型的精度可從所提取的綜合變量(或成分)對(duì)自變量系統(tǒng)信息的利用率及對(duì)因變量系統(tǒng)的解釋率;方程的擬合和預(yù)測(cè)精度兩個(gè)方面分析。
在PCR和PLS回歸建模中,如果提取的綜合變量對(duì)自變量系統(tǒng)信息的利用率越高且對(duì)因變量系統(tǒng)的解釋率越大,說明它攜帶更多的自變量系統(tǒng)X中的變異信息參與了建模,同時(shí)盡可能多地解釋了因變量Y中的變異信息。這樣,用于分析過程的信息越多,并對(duì)因變量的解釋作用越大,方程的精度就越高,預(yù)測(cè)效果也就越好。PCR和PLS方程精度計(jì)算結(jié)果見表3。
從表3可看出,PCR和PLS提取的2個(gè)主成分對(duì)自變量的信息利用率均為79%左右,但它們對(duì)因變量的解釋量卻不同,PLS對(duì)因變量的解釋量明顯高于PCR,這表明PLS模型的精度要明顯高于PCR。在PLS回歸模型中第1主成分t1解釋了原自變量系統(tǒng)47.0%的變異信息,同時(shí)解釋了因變量系統(tǒng)71.8%的變異信息,第2主成分t2解釋了原自變量系統(tǒng)31.9%的變異信息,同時(shí)解釋了因變量系統(tǒng)16.0%的變異信息。在PLS模型中第一主成分t1既是對(duì)自變量系統(tǒng)信息概括能力最大的成分,也是對(duì)因變量系統(tǒng)最具解釋作用的成分。而PCR模型中最能概括自變量系統(tǒng)信息的第1主成分t1對(duì)因變量的解釋作用僅為26.6%,遠(yuǎn)不及第2主成分t2對(duì)因變量的解釋作用。這與PCR提取主成分的方式有關(guān)。PCR在提取主成分的過程中,只是針對(duì)自變量系統(tǒng)尋找有代表性的主成分,所提取的主成分雖可反映自變量系統(tǒng)的重要信息,但與因變量的關(guān)系極小。而那些與因變量相關(guān)性較大,但在自變量中所占比例小的成分卻有可能被刪除。因此,在應(yīng)用PCR處理高維數(shù)據(jù)自變量之間的共線性問題時(shí),切不可盲目認(rèn)為對(duì)自變量系統(tǒng)解釋作用大的成分,一定會(huì)對(duì)因變量的解釋作用也大,故不可輕易舍棄對(duì)自變量系統(tǒng)解釋力較小的成分,否則會(huì)影響模型的精度。從本實(shí)例中亦可看出,PLS較PCR對(duì)系統(tǒng)信息的綜合與篩選能力更強(qiáng)。
PLS和PCR模型的擬合和預(yù)測(cè)精度,可通過4項(xiàng)綜合指標(biāo)進(jìn)行比較。這4項(xiàng)指標(biāo)分別是:Coef為真值和預(yù)測(cè)值的相關(guān)系數(shù)、SSE為殘差平方和、AveErr為絕對(duì)誤差的平均值、AveErrPer為相對(duì)誤差的平均值。從表4可見,在變量間存在高度共線性,自變量個(gè)數(shù)比較多而觀察例數(shù)較少的情況下,主成分回歸無論是擬合效果還是預(yù)測(cè)效果,均不如偏最小二乘回歸理想。
2.4自變量xj在解釋因變量y時(shí)的作用
考察每一個(gè)自變量xj在解釋因變量y時(shí)的作用,是運(yùn)動(dòng)訓(xùn)練領(lǐng)域數(shù)據(jù)處理的主要任務(wù)之一,也是教練員最為關(guān)心的問題。其目的在于以量化的形式說明各因素對(duì)專項(xiàng)成績(jī)的影響大小,提高運(yùn)動(dòng)訓(xùn)練的科學(xué)化水平。由于自變量之間存在著共線性問題,模型中的某一自變量對(duì)因變量的解釋效應(yīng)要分?jǐn)傆谄渌鼛讉€(gè)變量,回歸系數(shù)已不再是各自變量的邊際效應(yīng)。因此,OLS和PCR模型中的回歸系數(shù)大小無法準(zhǔn)確測(cè)度自變量對(duì)因變量的影響程度。PLS回歸模型在測(cè)度自變量對(duì)因變量影響的重要性程度時(shí),并非直接比較各自變量的標(biāo)準(zhǔn)化回歸系數(shù),而是使用變量投影重要性指標(biāo)VIP(variable importance in projection)。在PLS回歸中自變量對(duì)因變量的解釋是通過各成分傳遞的。如果某成分對(duì)因變量的解釋作用很強(qiáng),而自變量在構(gòu)造該成分時(shí)的權(quán)重系數(shù)很大,則該自變量對(duì)因變量的解釋能力就越大。VIP就是根據(jù)自變量xi在構(gòu)造成分時(shí)的邊際貢獻(xiàn)大小,來反映自變量對(duì)因變量的解釋作用。其取值見表5。
從VIP取值可以看出,對(duì)優(yōu)秀鐵餅運(yùn)動(dòng)員專項(xiàng)成績(jī)具有最大影響力的前3項(xiàng)指標(biāo),其動(dòng)作特征均與擲鐵餅技術(shù)本身緊密關(guān)聯(lián),集中反映了以整體性和綜合性為特征的專項(xiàng)投擲能力。半蹲、深蹲、臥推和抓舉4項(xiàng)指標(biāo)的VIP值較接近,反映運(yùn)動(dòng)員的最大力量水平。立定跳遠(yuǎn)、高翻、立定三級(jí)跳遠(yuǎn)和后拋鉛球主要反映運(yùn)動(dòng)員爆發(fā)力,它們的VIP值相對(duì)小些。該結(jié)果亦提示優(yōu)秀鐵餅運(yùn)動(dòng)員專項(xiàng)素質(zhì)是由專項(xiàng)投擲能力、最大力量和爆發(fā)力3個(gè)遞進(jìn)的層次構(gòu)成。這一結(jié)果與專項(xiàng)訓(xùn)練理論和實(shí)踐十分吻合[13-14],不過,在PLS回歸分析中,研究者很難通過自變量在構(gòu)造成分t1和t2時(shí)的權(quán)重系數(shù),明晰地辨識(shí)出這兩個(gè)成分的確切含義,也就無法清楚地知道究竟什么因素在整個(gè)建模過程中起著主導(dǎo)性的作用。這也是PLS方法在應(yīng)用中有待解決的問題。故有關(guān)小樣本多指標(biāo)共線性數(shù)據(jù)處理方法的應(yīng)用
3結(jié)論
1)OLS逐步回歸變量刪除法在處理運(yùn)動(dòng)訓(xùn)練領(lǐng)域的共線性數(shù)據(jù)時(shí),會(huì)將一些重要的解釋變量或樣本點(diǎn)排除在模型之外,削弱了理論的優(yōu)先地位和導(dǎo)向作用,不利于理論本身的發(fā)展。PCR模型對(duì)系統(tǒng)信息的綜合與篩選能力不佳,擬合與預(yù)測(cè)精度不甚理想。
2)與其他幾種方法相比,PLS回歸方法具有完善的理論體系,對(duì)系統(tǒng)信息的綜合與篩選能力強(qiáng)、擬合與預(yù)測(cè)精度較高,是目前處理運(yùn)動(dòng)訓(xùn)練領(lǐng)域小樣本多指標(biāo)共線性數(shù)據(jù)的一個(gè)非常穩(wěn)健的統(tǒng)計(jì)方法,可同時(shí)實(shí)現(xiàn)高維數(shù)據(jù)處理的主要目標(biāo),并為運(yùn)動(dòng)訓(xùn)練學(xué)理論模型的實(shí)證檢驗(yàn)提供了可能。其不足之處在于較難明確辨識(shí)所提取成分的物理含義。
參考文獻(xiàn):
[1] Rao C R,Toutenburg H. Linear Models[M]. New York:Springer-Verlag Press,1995:67-71.
[2] 何曉群. 回歸分析與經(jīng)濟(jì)數(shù)據(jù)建模[M]. 北京:中國(guó)人民大學(xué)出版社,1997:5.
[3] 陳及治,蔡睿,程致屏,等. 體育統(tǒng)計(jì)學(xué)科進(jìn)展[C]//體育科學(xué)研究現(xiàn)狀與展望. 北京:中國(guó)體育科學(xué)學(xué)會(huì),2000.
[4] 魏登云. 多元共線性分析及其在體育科研中的應(yīng)用[J]. 安徽師大學(xué)報(bào):自然科學(xué)版,1996,24(1):75-79.
[5] 馬勇占. 試論多重共線性對(duì)體育科研中線性回歸模型的危害及其診斷和補(bǔ)救方法[J]. 體育科學(xué),2002,22(6):112-115.
[6] 劉煒. 線性模型在體育科研中應(yīng)用的常見誤區(qū)分析[J]. 上海體育學(xué)院學(xué)報(bào),2001,25(4):23-26.
[7] 劉厚生. 回歸分析方法在體育科研中的應(yīng)用初探[J]. 體育科學(xué),1993,17(3):75-78.
[8] 孫有平. 優(yōu)秀男子鐵餅運(yùn)動(dòng)員競(jìng)技能力某些決定因素綜合評(píng)價(jià)的研究[J]. 成都體育學(xué)院學(xué)報(bào),2002,28(6):64-67.
[9] 張力為. 體育科學(xué)研究方法[M]. 北京:高等教育出版社,2002:348-357.
[10] Stone M,Brooks R J. Continuum regression: Cross-validated sequentially constructed prediction embracing ordinary least squares,partial least squares and principal components regression[J]. Journal of the Royal Statistical Society (series c),1990:237-269.
[11] 王惠文. 偏最小二乘回歸方法及其應(yīng)用[M]. 北京:國(guó)防工業(yè)出版社,2000:178-200.
[12] 蔣紅衛(wèi),夏結(jié)來. 偏最小二乘回歸及其應(yīng)用[J].第四軍醫(yī)大學(xué)學(xué)報(bào),2003(4):280-283.
[13] 曲淑華,孫有平,張英波. 對(duì)我國(guó)優(yōu)秀鐵餅運(yùn)動(dòng)員專項(xiàng)力量訓(xùn)練現(xiàn)狀的研究[J]. 北京體育大學(xué)學(xué)報(bào),2001,24(1):108-123.
[14] 袁作生,南仲喜. 現(xiàn)代田徑運(yùn)動(dòng)科學(xué)訓(xùn)練法[M].北京:人民體育出版社,1997:440-448.
[15] 張景龍. 鐵餅運(yùn)動(dòng)員的力量訓(xùn)練[J]. 田徑,2003(9):16-17.
[編輯:周威]