[摘要]得分規(guī)則(scoring rules)可以很好地對預(yù)測結(jié)果的“質(zhì)量”進(jìn)行評價,它是一種可以用來衡量和測評預(yù)測結(jié)果好壞程度的方法。它可以通過給定一種“規(guī)則”,對各種預(yù)測方案進(jìn)行賦值打分,選擇其中得分最少的來確定最佳預(yù)測方案,這一方法在諸如天氣、比賽結(jié)果等方面的預(yù)測有著很好的應(yīng)用。
[關(guān)鍵詞]預(yù)測;得分規(guī)則;正規(guī)得分規(guī)則;應(yīng)用
一、正規(guī)得分規(guī)則的定義
“得分規(guī)則”一詞的首次出現(xiàn)是Good在1952年發(fā)表的一篇關(guān)于“合理決策”問題的文章中,而后Winkler于1969年討論了得分規(guī)則在被用來評估概率預(yù)測和被用來推導(dǎo)方面的區(qū)別,而正式的關(guān)于得分規(guī)則被用來做推導(dǎo)的研究可以在Savage和Lindley的文章中看到, Bernardo和Smith于1994年做了相關(guān)的補充[2]。此外,正規(guī)得分規(guī)則還可以用來引導(dǎo)出個人的主觀概率,Savage運用數(shù)學(xué)的方法推導(dǎo)出了可以用來推導(dǎo)出個人主觀概率的正規(guī)得分規(guī)則的一般表達(dá)式,也就是所謂的球形得分規(guī)則。
Giovanni Parmigiani等[1]在《決策理論與方法》中提到針對一件未知事件θ設(shè)定一個賭局,在保證賭局設(shè)定方一定獲利的前提下給出一個賠付比q:(1-q),雙方按照按設(shè)定的賠付比各自支付賭金,賭金之和作為一次賭局的獎金總額S,最終由賭贏的一方獲得獎金。顯然,從賭局制定者的角度考慮,如果θ最終發(fā)生了,即θ=1,那么賣方將有收益-(1-q)S,如果θ最終沒有發(fā)生,收益為qS。而作為賭局的賠付比制定者,他自己也有著對于事件θ是否發(fā)生的一個主觀概率π,那么在這種情況下賭局制定者的期望收益為,顯然,當(dāng)取q=π時,賭局制定者的期望收益為0,此時的q=π是期望收益的一個臨界值,而根據(jù)預(yù)期效用最優(yōu)化原則,此時賭局制定者的預(yù)期效用最大。在這種得分規(guī)則下的賭局制定者的期望得分也達(dá)到最小。因此,正規(guī)得分規(guī)則的定義為當(dāng)且僅當(dāng)存在一個正數(shù)π,使得成立時,我們稱之為正規(guī)得分規(guī)則,且當(dāng)π為唯一值時,此時的得分規(guī)則被稱為嚴(yán)格正規(guī)得分規(guī)則。
二、幾種常見的正規(guī)得分規(guī)則
自Good于1952年首次提出了正規(guī)得分規(guī)則這一概念并給出了第一個正規(guī)得分規(guī)則的數(shù)學(xué)形式以來,諸多學(xué)者根據(jù)不同的統(tǒng)計分析需要不斷提出了一系列的其他的正規(guī)得分規(guī)則,如二次得分規(guī)則、球形得分規(guī)則等。
①對數(shù)得分規(guī)則(logarithmic rule),最早由古德于1952年提出來的,也是最早的一種正規(guī)得分規(guī)則,其數(shù)學(xué)形式為:該得分規(guī)則最初是被用來計算負(fù)熵值對得應(yīng)的一種得分規(guī)則。這種得分規(guī)則的計分方法只與眾多狀態(tài)中最終發(fā)生的狀態(tài)有關(guān),而與其他未發(fā)生的狀態(tài)無關(guān)。實際上,這種得分規(guī)則也是一種較為嚴(yán)格的得分規(guī)則—局部得分規(guī)則的典型代表。
②二次得分規(guī)則(Quadratic scoring rule ),是正規(guī)得分規(guī)則中最著名的一種得分規(guī)則。它最初是由Brier在研究天氣預(yù)測問題中的證明時所提出來的,而它的數(shù)學(xué)形式則是由Savage(1971)推導(dǎo)出來的,具體形式為:,其中,,。這種得分規(guī)則的最大優(yōu)點是可以通過修改系數(shù)A,B的值來實現(xiàn)其靈活應(yīng)用。Selten于1998年對它進(jìn)行了公理化的論證[4]。
③球形得分規(guī)則(Spherical rule),它是由Savage于1971年首次提出的,它是球面得分規(guī)則下的一種特殊情況,其具體數(shù)學(xué)公式為: 。
三、正規(guī)得分規(guī)則在預(yù)測問題上的應(yīng)用
正規(guī)得分規(guī)則在預(yù)測問題上的應(yīng)用非常廣泛。本文選取了NBA2013-2014季后賽總冠軍的歸屬作為預(yù)測事件θ,某博彩公司將為兩支球隊的奪冠可能性設(shè)定賭局,使得博彩公司的盈利最大??倹Q賽的對陣雙方為邁阿密熱隊和圣安東尼奧馬刺隊,這一事件只存在兩種狀態(tài)θ1和θ2(θ1表示熱隊奪冠,θ2表示馬刺隊奪冠)。博彩公司要根據(jù)兩隊的球員實力和狀態(tài)、教練的經(jīng)驗、主場優(yōu)勢、以及個人的偏好等因素給出兩隊的勝率。此處,將每個預(yù)測人員給出的兩隊的勝率預(yù)測表示為q1和q2,而每個預(yù)測者的個人主觀勝率表示為π1和π2,那么博彩公司到底應(yīng)該根據(jù)哪個預(yù)測者的預(yù)測結(jié)果去設(shè)定一個賠付比,才能使期望受益最大呢?而預(yù)測者應(yīng)該怎樣給出自己的預(yù)測概率才能使自己的預(yù)測結(jié)果最為精確呢?我們可以為每個預(yù)測者設(shè)定一個得分(q-θ)2以表示預(yù)測結(jié)果與實際情況的偏差,那么按照這種得分規(guī)則下的每個預(yù)測者的期望得分為:
顯然,取q1=π1時,預(yù)測者的期望得分最少,那么博彩公司到底應(yīng)怎樣從中選取最合理的預(yù)測結(jié)果呢?為此,本文選擇了具有代表性的ESPN部分專家的預(yù)測結(jié)果代替并選擇最具代表性的二次得分規(guī)則作為計算每個預(yù)測者的期望得分的方法。因為事件θ有兩種狀態(tài),因此,并取。那么此處的得分規(guī)則為。
我們不難算出在此得分規(guī)則下的每個預(yù)測專家的期望得分,得分結(jié)果如表1所示:
表1在二次得分規(guī)則下每個專家預(yù)測的兩隊勝率及期望得分
顯然,前后分別有四位專家是預(yù)測熱隊和馬刺隊將會奪得總冠軍,前四位專家中Thorpe得分最低,后四位專家中Torres的得分最低,按照得分最少預(yù)測效果最好的原則,應(yīng)分別取這兩位專家的預(yù)測概率作為設(shè)定兩支球隊是否奪冠的賠付比,而根據(jù)正規(guī)得分規(guī)則的定義,我們認(rèn)為每個專家所給出的預(yù)測概率均為個人的主觀概率,那么博彩公司最終為熱隊和馬刺隊設(shè)定的賠付比應(yīng)為2.45:1和3.17:1。按照這樣的賠付比來設(shè)定賭局能保證博彩公司能夠始終盈利。
四、總結(jié)
得分規(guī)則作為決策理論中的一個重要方法在對未知事件的預(yù)測方面有著廣泛的應(yīng)用。本文將正規(guī)得分規(guī)則的原理運用到NBA等體育賽事結(jié)果的預(yù)測上。在研究過程中,部分假設(shè)合理化了一些因素,且未能考慮到不同預(yù)測者之間的綜合影響,所以可能與實際情況有所偏差,這些也正是今后還需改進(jìn)的地方。
參考文獻(xiàn)
[1]G. Parmigiani., Y. T. Inoue. Decision Theory: Principles and Approaches, pp.191-198
[2]T Gneiting and A. Raftery. Strictly Proper Scoring Rules, Prediction, and Estimation
[3]ESPN中文網(wǎng). http://www.espnstar.com.cn
[4]Stein. Estimation of the mean of a multivariate normal distribution, Annals of Statistic 9: 1135~1151.
作者簡介
錢昆 單位:南京財經(jīng)大學(xué) 省市 :江蘇南京。