許佰雁
(長春光華學院基礎教研部, 吉林長春 130033)
中國男子籃球職業(yè)聯(lián)賽創(chuàng)辦于1995年, 是中國最高等級的籃球聯(lián)賽. 球隊的勝率和綜合水平問題是大家所關心和關注的, 本文在借用模型的基礎上對14支隊伍的常規(guī)賽和季候賽進行分析, 估算出每只球隊奪冠概率, 預測出前四名的球隊.
1) 假設比賽是公平的, 且每次比賽球員都盡全力.
2) 假設所有球隊得到的休息時間是一樣的.
3) 假設每個教練的水平都差不多, 能夠合理分配每個球員的時間
4) 假設外界因素的影響為零.
設有n個球隊參與比較, 記為“A,B,C…,n”, 假設球隊i有真實的能力參數(shù)γi, 令pi,j表示球隊i優(yōu)于球隊j的概率,Yij表示球隊比較后的二分變量結(jié)果. 當Yij=1時表明球隊i比j好, 當Yij=0時表明球隊j比i好.
將pi,j表示為Logit模型:
或者
令Nij表示進行比較的總次數(shù), 其中所選擇到球隊i的次數(shù)為nij, 選擇球隊j的次數(shù)為Nij-nij.
當Nij獨立, 且每次的概率都為Pi,j時,nij服從二項分布bin(Nij,Pi,j). 根據(jù)研究對象服從二項分布建立函數(shù)進行估計, 如果有關不同配對的比較也是獨立的, 就可以利用擬合普通的Logit模型的方法來擬合這個模型.
對調(diào)查數(shù)據(jù)表中給出的每隊的數(shù)據(jù)進行分析, 通過一個具有說服性的數(shù)據(jù)來預測出排名. 每隊各給出了100組比賽的歷史評分數(shù)據(jù), 求出各隊的平均值, 如表1所示.
表1 14組隊伍綜合實力水平的平均值
表2 隊伍概率結(jié)果
然后通過平均值求出方差和標準差(見表3), 方差是
表3 14組球隊綜合實力的方差
表4 14組隊伍綜合實力的標準差
通過對z值的比較可以得出前四名的球隊分別是N、L、C、B. 再分析實力估計值、 標準誤值、 擬標準誤值這些數(shù)據(jù)可以得出結(jié)論: 第一名是N隊, 第二名是L隊, 第三名是C隊, 第四名是B隊.
表5 14組隊伍綜合實力水平的擬標準差
表6 14組隊伍綜合實力水平的Z值
用所給出的各隊實力估計值求出平均值, 再運用方差和標準差公式
通過對z值的比較和對實力估計值、 標準誤差值、 擬標準差值這些數(shù)據(jù)的分析可以得出隊伍的排名. 結(jié)果與模型中的公式計算結(jié)果相同.
(1)優(yōu)點
1)該方法下的賽事安排更合理, 計算數(shù)據(jù)較為準確, 進行最后的比較和分析更具說服力. 該模型對數(shù)據(jù)的精確性有較高的要求.
表7 2015~2016賽季CBA聯(lián)賽球隊實力估計結(jié)果
2)本次結(jié)合了大量文獻綜合分析了Bradley-Terry模型的原理和算法, 結(jié)合數(shù)據(jù)分析, 將模型運用到了體育賽事中, 并成功預測了參賽隊伍的排名.
(2) 缺點:
1)該模型對于較少數(shù)量的球隊數(shù)不適用, 適用于求大型比賽的結(jié)果. 別外, 該模型較為繁瑣, 不夠簡便.
2)該模型使用起來的數(shù)據(jù)分析結(jié)果可能只是在此賽季是顯著的, 其他賽季是否顯著, 還需要進一步研究.
3)該模型雖然提出了在體育賽事的實力會發(fā)生變化, 但理論上尚未健全, 未能使用統(tǒng)計軟件結(jié)合數(shù)據(jù)進行實戰(zhàn)分析, 仍有較大提升空間.
該模型可運用于對統(tǒng)計學期刊影響力的估計或者與機器學習搜索引擎相關的文件進行排名, 也可應用于研究人們對某種對象的偏好情況, 通過對模型的拓展可以解決分類數(shù)據(jù)的分析問題. Bradley-Terry模型提高了關于成對比較數(shù)據(jù)的準確性和有效性, 它可以基于過去的對比信息來預測將來事件比對的結(jié)果. 所以Bradley-Terry模型不但有力地推動了成對比較法, 而且在很多研究領域乃至日常生活中, 都有著不可忽視的地位.