張 瀅,余思龍
(華中師范大學(xué) 體育學(xué)院,湖北 武漢430079)
隨著信息時代的發(fā)展,數(shù)據(jù)作為基礎(chǔ)性資源,其分析和應(yīng)用為各領(lǐng)域的發(fā)展提供了強有力的支撐,推動了人類社會運轉(zhuǎn)方式、載體和效率的變革?!按髷?shù)據(jù)”自2012年被引入我國以來,熱度持續(xù)升溫。在2018年底召開的中央經(jīng)濟工作會議上,國務(wù)院將“大數(shù)據(jù)”定位為“新型基礎(chǔ)建設(shè)”,將其視為重要的基礎(chǔ)性戰(zhàn)略資源[1]。2020年3月4日,中共中央政治局常委會會議明確表明,將“新基建”作為投資發(fā)力的主要抓手并且逐年增加比重[2]。由此可見,加快數(shù)字基礎(chǔ)建設(shè),推動數(shù)據(jù)資源整合與共享對于促進我國經(jīng)濟建設(shè)發(fā)展和優(yōu)化治理體系有著不可或缺的作用。
2019年籃球世界杯在中國舉行,這是世界上競技水平最高、觀賞性最強的籃球賽事之一,匯聚了世界各國的頂級籃球強隊。但作為東道主,中國隊卻在家門口與進軍奧運會失之交臂,這給處于改革周期內(nèi)的中國籃球沉重一擊。如何充分利用和分析本次世界杯的各項統(tǒng)計數(shù)據(jù),厘清世界各強隊的制勝因素和技戰(zhàn)術(shù)特點無疑能為中國男籃提供技術(shù)層面的幫助。
數(shù)據(jù)分析與體育的深度融合對于測定運動員或運動隊的優(yōu)劣并有針對性地制定和優(yōu)化相應(yīng)訓(xùn)練計劃有著不可或缺的作用。本文運用回歸分析的方法來探討球隊的得分的影響因素,將“球隊得分”視為因變量,將14 項技術(shù)統(tǒng)計指標(biāo)視為自變量,構(gòu)建多元回歸模型,以期得出各技術(shù)統(tǒng)計指標(biāo)對球隊得分的影響程度和作用方式。
1.1.1 文獻資料法
以 “2019 籃球世界杯”“籃球世錦賽”“技術(shù)統(tǒng)計”“回歸分析”等為關(guān)鍵詞在中外文數(shù)據(jù)庫進行檢索查找相關(guān)文獻資料。同時在FIBA 官網(wǎng)下載籃球技術(shù)統(tǒng)計手冊,在圖書館查閱了有關(guān)回歸分析方法的書籍。對搜集的論著、文獻進行仔細(xì)閱讀和分析,為本研究奠定了一定的理論基礎(chǔ)。
1.1.2 錄像觀察法
通過騰訊體育獲得92 場2019 籃球世界杯比賽的錄像資料。針對本文所涉及的各項技術(shù)統(tǒng)計指標(biāo)進行抽樣統(tǒng)計,仔細(xì)觀看錄像,并結(jié)合FIBA 的官方技術(shù)統(tǒng)計標(biāo)準(zhǔn),對所需統(tǒng)計數(shù)據(jù)進行校準(zhǔn),并且對統(tǒng)計數(shù)據(jù)進行多次重復(fù)統(tǒng)計來減少誤差,以確保統(tǒng)計數(shù)據(jù)的準(zhǔn)確有效。
1.1.3 數(shù)理統(tǒng)計法
根據(jù)技術(shù)統(tǒng)計采集與論文需要,本研究采用數(shù)理統(tǒng)計法對2019 籃球世界杯球隊比賽的球隊得分與技術(shù)統(tǒng)計數(shù)據(jù)進行統(tǒng)計,技術(shù)統(tǒng)計標(biāo)準(zhǔn)以FIBA2018 版技術(shù)統(tǒng)計工作標(biāo)準(zhǔn)為依據(jù)。根據(jù)研究問題,運用EXCEL 和SPSS25.0 進行數(shù)據(jù)統(tǒng)計處理,為本研究提供論證依據(jù)。
實際比賽中,影響球隊得分的因素有多種,通過對影響球隊得分的因素進行研究,為球隊得分影響因素模型的建立和分析起到重要作用。本文綜合分析和總結(jié)當(dāng)前國內(nèi)外研究成果,以2019 籃球世界杯獲勝球隊的視角,以國際籃聯(lián)2019 籃球世界杯比賽官方技術(shù)統(tǒng)計標(biāo)準(zhǔn)化面板數(shù)據(jù)為基礎(chǔ)將球隊得分的影響因素劃分為進攻因素、防守因素兩個方面,并結(jié)合比賽技術(shù)統(tǒng)計數(shù)據(jù)特點進行數(shù)據(jù)的整理和校正,最終確定了以球隊得分作為因變量,以14 項技術(shù)統(tǒng)計指標(biāo)作為自變量來研究其對球隊得分的影響機制?;谏鲜龇治?,構(gòu)建球隊得分影響因素模型框架,如圖1。
利用SPSS25.0,運用線性回歸分析,選擇球隊得分為因變量,兩分出手?jǐn)?shù)、兩分命中率等14個技術(shù)統(tǒng)計指標(biāo)作為自變量以“進入”的方法進行多元線性回歸分析,讓所有變量都進入回歸模型中。
圖1 球隊得分影響因素模型
2.1.1 回歸方程擬合優(yōu)度評價
表1 多元線性回歸模型的估計結(jié)果
根據(jù)表1 的估計結(jié)果,回歸模型的相關(guān)系數(shù)為0.940,判定系數(shù)為0.884,表明此回歸模型可以解釋約88.4%的球隊得分變化;調(diào)整的判定系數(shù)為0.863,與0.884 接近;當(dāng)自變量數(shù)量與研究樣本量的比值小于1/5 時,判定系數(shù)大概率會高估擬合度,鑒于本研究的自變量數(shù)目與樣本容量的比值小于1/5,因此傾向于用調(diào)節(jié)后的判定系數(shù)來評價模型的擬合度,即約有86.3%的球隊得分變化可以用該模型解釋。總體來看,此線性回歸模型擬合效果較好。
2.1.2 顯著性檢驗
1)回歸方程的顯著性檢驗
在回歸方程的顯著性檢驗中,F(xiàn)統(tǒng)計量為41.889,相應(yīng)的顯著性檢驗值等于0。當(dāng)P值小于任意顯著性水平 (如0.1、0.05、0.01)時,則認(rèn)為回歸方程通過了總檢驗[3],回歸系數(shù)同時為零的假設(shè)不成立,表明因變量球隊得分與自變量之間存在線性關(guān)系,自變量在預(yù)測球隊得分的多元回歸模型過程中數(shù)據(jù)擬合程度高,可以建立線性回歸方程。
2)回歸系數(shù)的顯著性檢驗
根據(jù)表2 的輸出內(nèi)容可得到未經(jīng)標(biāo)準(zhǔn)化的樣本回歸方程為:
Y=87.435+4.917X1+4.779X2+5.842X3+5.027X4+4.309X5+1.076X6-0.664X7+0.90X8+2.883X9-0.743X10+0.354X11+1.111X12+0.618X13+0.202X14。
公式中,X1 為A2 即兩分出手?jǐn)?shù),X2 為P2 即兩分命中率,X3 為A3 即 三 分 出 手 數(shù),X4 為P3 即 三 分 命 中 率,X5 為FTA 即罰球出手?jǐn)?shù),X6 為FTP 即罰球命中率,X7 為OR 即進攻籃板,X8 為DR 即防守籃板,X9 為AS 即助攻,X10 為TO即失誤,X11 為ST 即搶斷,X12 為BS 封蓋,X13 為FO 即犯規(guī),X14 為FD 即被犯規(guī);通過觀察回歸方程的各項系數(shù)可知,兩分出手?jǐn)?shù)、兩分命中率、三分出手?jǐn)?shù)、三分命中率、罰球出手?jǐn)?shù)、罰球命中率、助攻、封蓋的回歸系數(shù)分別通過了t 檢驗,它們的t統(tǒng)計量分別為6.533、7.266、7.216、8.210、3.735、2.168、2.242,相對應(yīng)的P值依次為0.000、0.000、0.000、0.000、0.000、0.033、0.028,均小于顯著性水平0.05,因此推翻其回歸系數(shù)為零的原假設(shè)。而進攻籃板、防守籃板、失誤、搶斷、犯規(guī)、被犯規(guī)的t統(tǒng) 計 量 分 別 為-1.022、0.148、-1.294、0.668、1.152、0.183,相應(yīng)的P值為0.310、0.883、0.200、0.506、0.253、0.855,大于最大的顯著性水平0.1,以0.05 的顯著性水平作為衡量標(biāo)準(zhǔn),自變量進攻籃板、防守籃板、失誤、搶斷、犯規(guī)、被犯規(guī)可以認(rèn)為無法拒絕其回歸系數(shù)等于零的假設(shè)。
綜合以上分析,通過觀察回歸系數(shù)顯著性中的概率P值,存在顯著性P值大于0.1 的情況,可以考慮除去這些不顯著變量對模型進行優(yōu)化,已獲得更高擬合度的回歸方程。
表2 回歸系數(shù)a 表
2.1.3 回歸模型檢驗
圖2 的球隊得分的標(biāo)準(zhǔn)化殘差直方圖顯示,球隊得分的標(biāo)準(zhǔn)殘差分布狀況近似服從正態(tài)分布,在標(biāo)準(zhǔn)化殘差的正態(tài)P-P 圖(圖3)中,因變量的散點位置基本分布位于直線附近,近似一條直線,表明殘差近乎是正態(tài)的,進而證明誤差也近乎是正態(tài)的。
圖2 標(biāo)準(zhǔn)化殘差直方圖
圖3 標(biāo)準(zhǔn)化殘差的P-P 圖
為了進一步驗證殘差項的正態(tài)性,通過K-S 檢驗以及計算殘差統(tǒng)計量的方式來驗證殘差項的正態(tài)性。運用K-S 檢驗提出一對假設(shè):原假設(shè)H0:樣本殘差服從正態(tài)分布;備用假設(shè)H1:樣本殘差不服從正態(tài)分布。
表3 殘差項的單樣本K-S 檢驗結(jié)果
由表3 中可以看出,樣本殘差項的均值為0,標(biāo)準(zhǔn)差為0.91986621,對應(yīng)的P值等于0.08,大于顯著性水平0.05,因此必須接受原假設(shè),認(rèn)為殘差項服從正態(tài)分布。
在上文的研究中,經(jīng)過多重檢驗,驗證了對于球隊得分的多元回歸模型是合適的。但回歸系數(shù)顯著性概率P 值存在大于給定的最大顯著性0.1 的情況,因此考慮除去這些不顯著變量,進一步優(yōu)化回歸模型,本研究嘗試?yán)弥鸩交貧w法對變量進行篩選。
回歸方程在進行變量篩選過程中,第一個模型由于助攻與球隊得分的相關(guān)性較強,率先進入回歸模型,助攻的t 統(tǒng)計量的觀測值為10.210,對應(yīng)的P值小于給定的顯著性水平為0.05[4],因此,否定回歸系數(shù)檢驗的原假設(shè),助攻與球隊得分之間存在顯著的線性關(guān)系。接著,自變量三分球命中率繼續(xù)加入到之前到一元回歸模型之中,t統(tǒng)計量為3.616,P值為0,在結(jié)合模型中已有的助攻的基礎(chǔ)上,三分命中率與球隊得分偏相關(guān)系數(shù)為0.358,存在顯著的線性關(guān)系。
由此,逐步加入自變量罰球出手、三分出手、兩分出手、兩分命中率、封蓋、罰球命中率到回歸模型中,結(jié)果顯示,t統(tǒng)計量相對應(yīng)的P值均小于給定的顯著性水平0.05,因此拒絕原假設(shè),回歸系數(shù)通過了顯著性檢驗。在去除了進攻籃板、防守籃板、失誤、搶斷、犯規(guī)、被犯規(guī)6個變量之后,球隊得分影響因素模型的自變量篩選過程完成。
根據(jù)標(biāo)準(zhǔn)化系數(shù)得出標(biāo)準(zhǔn)化的樣本回歸方程為:
Y=0.232X1+0.434X2+0.397X3+0.499X4+0.435X5+0.424X6+0.092X7+0.091X8。公式中,助攻、三分命中率、罰球出手?jǐn)?shù)、三分出手?jǐn)?shù)、兩分出手?jǐn)?shù)、兩分命中率、封蓋、罰球命中率的標(biāo)準(zhǔn)化回歸系數(shù)分別為0.232、0.434、0.397、0.499、0.435、0.424、0.092、0.091,Beat 系數(shù)的大小可用來比較自變量對因變量的重要性大小。因此,球隊得分影響因素的重要程度由高到低依次為:A3>A2>P3>P2>FTA>AS>BS>FTP(OR、DR、TO、ST、FO、FD 等變量的重要程度排在FTP 之后)。
通過分析,回歸系數(shù)為正的進攻因素大多出現(xiàn)在了回歸方程中,這也與實際預(yù)期相符。更重要的是,我們得出對球隊得分影響顯著的因素并做出重要性的排序即三分球出手?jǐn)?shù)>兩分球出手?jǐn)?shù)>三分球命中率>兩分球命中率>罰球出手>助攻>封蓋>罰球命中率。從研究結(jié)果我們可以得出以下信息:
1)三分球、兩分球出手?jǐn)?shù)對于球隊得分的影響要大于三分球、兩分球的命中率。在比賽時間固定的背景下,相較于投籃命中率,越多的投籃出手,將會為球隊帶來更多的得分。但如果根據(jù)研究結(jié)果對這些因素做出絕對的強調(diào)與忽略,這種無視教練球員主觀能動性以及比賽實際情況的做法將使比賽朝著不利的方向發(fā)展。因此我們可以理解為實際比賽中,在確保投籃選擇合理的條件下,適當(dāng)增加投籃出手的次數(shù)可帶來更多的球隊得分,同時這也折射出當(dāng)今世界籃球進攻節(jié)奏的加快。
2)三分球重要性突顯。在三分球與兩分球出手?jǐn)?shù)、命中率的對比中,三分球都是更具優(yōu)勢的一方。對球員的投射能力有了更高的要求,三分球與兩分球進攻區(qū)域的不同也反映出當(dāng)今世界籃球潮流下,擴大進攻區(qū)域的覆蓋范圍提升遠(yuǎn)距離投籃把握能力對球隊得分的影響重大。
3)助攻對球隊得分影響顯著。助攻數(shù)的增加說明在比賽過程中,球員在進攻回合積極地傳導(dǎo)球,分享進攻球權(quán),使球到達合理的進攻區(qū)域與進攻球員的手中。與個人能力較強的球員持球單打相比,通過助攻得分的方式更為簡單有效,也充分體現(xiàn)球員之間的相互信任與團結(jié)協(xié)作。
4)罰球與罰球命中率與球隊得分成正相關(guān),即一支球隊的罰球出手次數(shù)越多、罰球名命中率越高,一支球隊的得分也會越高。相較于罰球命中率,罰球出手次數(shù)對于球隊得分的影響更大,這與各支球隊罰球命中率差異較小有一定關(guān)系。對于罰球出手來講,由進攻球員的沖擊力、防守球員的防守能力以及裁判員水平所共同決定。從進攻球隊的角度來看,如何提升球隊進攻的侵略性以及利用對方防守的漏洞來獲得更多的罰球?qū)εc球隊得分乃至最終獲得勝利是有所幫助的。
5) 在2019 籃球世界杯中,通過對勝利球隊得分進行研究,發(fā)現(xiàn)封蓋對球隊得分影響顯著,封蓋作為唯一進入模型的防守因素,佐證了進攻與防守相互聯(lián)系的觀點,與其他防守因素類似,封蓋能最大限度地阻止對方得分并取得本方進攻的機會,與球隊得分成正相關(guān),即越多的封蓋會為球隊帶來更多的得分。
通過對2019 籃球世界杯以球隊得分為因變量進行回歸分析,得出以下結(jié)論:
1)三分球出手?jǐn)?shù)、三分球命中率、兩分球出手?jǐn)?shù)、兩分球命中率、罰球出手、罰球命中率、助攻、封蓋與球隊得分之間線性關(guān)系顯著。對球隊得分影響的重要性排序為: 三分球出手?jǐn)?shù)>兩分球出手?jǐn)?shù)>三分球命中率>兩分球命中率>罰球出手>助攻>封蓋>罰球命中率。
2)在球隊得分回歸模型優(yōu)化過程中,6個自變量沒有通過回歸系數(shù)顯著性檢驗,對于因變量的影響不顯著,即進攻籃板、防守籃板、失誤、搶斷、犯規(guī)、被犯規(guī)對球隊得分的影響不顯著。
3)在當(dāng)今國際籃球的競爭格局下,對于球隊得分來講,三分球比兩分球擁有更重要的戰(zhàn)術(shù)地位。三分球出手?jǐn)?shù)與三分球命中率對于球得分的影響分別高于兩分球出手?jǐn)?shù)與兩分命中率。
4)封蓋作為防守端的技術(shù)統(tǒng)計指標(biāo)仍對球隊得分的影響顯著,并與球隊得分成正相關(guān)。