王燕飛
(吉林化工學(xué)院 理學(xué)院,吉林 132022)
(Be-Nb)模型下的二行動(dòng)線性決策的抽樣信息期望值
王燕飛
(吉林化工學(xué)院 理學(xué)院,吉林 132022)
二行動(dòng)線性決策問(wèn)題是一類(lèi)比較普遍的決策問(wèn)題。文章討論了兩類(lèi)貝塔分布共軛于負(fù)二項(xiàng)分布的決策模型下的二行動(dòng)線性決策問(wèn)題的抽樣信息期望值的計(jì)算定理。
(Be-Nb)模型;二行動(dòng)線性決策;抽樣信息期望值;完全信息
在企業(yè)經(jīng)營(yíng)過(guò)程中,做出有利于提高經(jīng)濟(jì)效益的決策對(duì)于企業(yè)的發(fā)展是至關(guān)重要的,甚至關(guān)及生死存亡。二行動(dòng)線性決策問(wèn)題是最為常見(jiàn)的決策問(wèn)題。對(duì)于決策者來(lái)說(shuō),通過(guò)抽樣等手段,可以獲得信息以接近完全信息,從而選取最優(yōu)決策,獲得最大利益。但抽樣耗時(shí)、費(fèi)力,那么我們有必要推斷抽樣的價(jià)值,即抽樣信息期望值(EVSI)。就此問(wèn)題,文獻(xiàn)[1][2]研究了正態(tài)分布共軛于正態(tài)分布決策模型下的。文獻(xiàn)[3]討論了分布共軛于普哇松分布模型下的。文獻(xiàn)[4]給出了倒分布共軛于指數(shù)分布模型下的EVSI。文獻(xiàn)[5]得出了倒分布共軛于分布模型下的。文獻(xiàn)[6]得出了貝塔分布共軛于幾何分布模型下的。負(fù)二項(xiàng)分布又名帕斯卡(Pascal)分布,應(yīng)用廣泛。比如醫(yī)學(xué)中的聚集性疾病,保險(xiǎn)精算中的非同質(zhì)性人群的索賠次數(shù),可靠性分析中的導(dǎo)彈飛行試驗(yàn)數(shù)量等,均服從負(fù)二項(xiàng)分布,具有一定的研究?jī)r(jià)值。事實(shí)上,幾何分布是負(fù)二項(xiàng)分布的特例。本文介紹了對(duì)于文獻(xiàn)[6]中更一般的情況,研究了在二行動(dòng)線性決策問(wèn)題中,兩類(lèi)貝塔分布共軛于負(fù)二項(xiàng)分布的決策模型(即(Be-Nb)模型Ⅰ和(Be-Nb)模型Ⅱ)下的的計(jì)算定理。
二行動(dòng)線性決策模型,即行動(dòng)a只有二個(gè):a1,a2;狀態(tài)θ可以是離散或者連續(xù)的;收益函數(shù)對(duì)每個(gè)行動(dòng)都是狀態(tài)參數(shù)的線性函數(shù)。即收益函數(shù)
不妨設(shè) m1>m2,b1 利用收益函數(shù)分別計(jì)算a1,a2的先驗(yàn)期望收益值,由平衡點(diǎn)(2),得: E1-E2=(m1-m2)(Eθ-θ0),根據(jù)先驗(yàn)期望準(zhǔn)則,由 m1>m2,有: (1)當(dāng) Eθ≤θ0時(shí),a2為最優(yōu)行動(dòng);(2)當(dāng) Eθ>θ0時(shí),a1為最優(yōu)行動(dòng)。 (3) 由公式,ai的損失函數(shù) L(θ,ai)=maxQ(θ,a)-Q(θ,ai)及(2),有: a 抽樣信息期望值為先驗(yàn)與后驗(yàn)期望值的差。 其中,a'為先驗(yàn)期望準(zhǔn)則下的最優(yōu)行動(dòng),δ'(x)為后驗(yàn)期望準(zhǔn)則下的最優(yōu)決策函數(shù)。L為損失函數(shù),由此可見(jiàn),EVSI是在抽樣前后使用最優(yōu)行動(dòng)(或最優(yōu)決策函數(shù))而使決策者蒙受期望損失的減少量或者由于抽樣給決策者帶來(lái)的增益。即抽樣帶給決策者的價(jià)值。 負(fù)二項(xiàng)分布有兩種形式:設(shè)伯努力試驗(yàn)中,θ為每次試驗(yàn)成功的概率。 (Ⅰ)X 為恰好成功 r次時(shí)的試驗(yàn)總數(shù),則 P(X=x|θ)=θr(1-θ)x-r,(x=r,r+1,…); (Ⅱ)X 為 r次成功前失敗的次數(shù),則 P(X=x|θ)=θr(1-θ)x,(x=0,1,2,…)。 我們將其分別記為 Nb(r,θ)Ⅰ型和 Nb(r,θ)Ⅱ型。 相應(yīng)的決策模型記為(Be-Nb)模型Ⅰ和(Be-Nb)模型Ⅱ。下面我們只討論第一種形式,對(duì)于第二種形式同理可得。 (Be-Nb)模型Ⅰ:設(shè)總體X服從負(fù)二項(xiàng)分布Nb(r,θ)Ⅰ型,即 P(X=x|θ)=θr(1-θ)x-r,(x=r,r+1,…)。 θ 的共軛先驗(yàn)分布為Be(α,β)。 2.2 (Be-Nb)模型Ⅰ下的先驗(yàn) EVPI=EθL(θ,a'),其中 a'為先驗(yàn)期望準(zhǔn)則下的最優(yōu)行動(dòng) (1)最優(yōu)決策函數(shù)δ'(x) 利用收益函數(shù)(1)分別計(jì)算a1,a2的后驗(yàn)期望收益值,及式(2),有:-=(m1-m2)(E(θ|t)-θ0)。 根據(jù)后驗(yàn)期望準(zhǔn)則,由m1>m2,得:(1)當(dāng) E(θ|t)≤θ0時(shí),a2為最優(yōu)行動(dòng);(2)當(dāng) E(θ|t)>θ0時(shí),a為最優(yōu)行動(dòng)。E(θ|x)==θ0時(shí),a1與 a2等效。 故取x0=-α-β,其作用等同于平衡點(diǎn)。 (2)后驗(yàn) EVPI=E(θ|x)L(θ,δ'(x))。 求法同先驗(yàn) EVPI,得: ②當(dāng)x>x0時(shí),a1為最優(yōu)行動(dòng), (3)后驗(yàn) EVPI期望值 由(11),(12)和(8),用 m(x)對(duì)后驗(yàn) EVPI求期望,得: 綜上,后驗(yàn) EVPI期望值 定理1 (Be-Nb)模型Ⅰ下的二行動(dòng)線性決策問(wèn)題的EVSI 在(Be-Nb)模型Ⅰ下,根據(jù)公式(6),由(9),(10),(13)及平衡點(diǎn)(2),有: 特別地:當(dāng)r=1時(shí),負(fù)二項(xiàng)分布Nb(r,θ)即為幾何分布G(r,θ)。此時(shí)即為文獻(xiàn)[6]中所述的(Be-G)模型下的二行動(dòng)線性決策問(wèn)題的EVSI。 定理2 (Be-Nb)模型Ⅱ下的二行動(dòng)線性決策問(wèn)題的EVSI在(Be-Nb)模型Ⅱ下,方法同定理1,可得到類(lèi)似結(jié)論。 [1]侯文超.經(jīng)營(yíng)管理決策分析[M].北京:高等教育出版社,1987. [2]張雪野.經(jīng)營(yíng)決策方法[M].上海:華東師范大學(xué)出版社,1996. [3]許麗梅,曾林蕊.(Γ-Ρ)模型下二行動(dòng)線性決策問(wèn)題的抽樣信息期望值[J].應(yīng)用概率統(tǒng)計(jì),2003,(2). [4]王燕飛,宋立新.(IGa-Exp)模型下二行動(dòng)線性決策問(wèn)題的抽樣信息期望值[J].運(yùn)籌于管理,2006,(5). [5]李晶,宋立新.(IGa-Ga)模型下二行動(dòng)線性決策問(wèn)題的抽樣信息期望值[J].統(tǒng)計(jì)與決策,2007,(21). [6]陳永勝,李晶.(Be-G)模型下二行動(dòng)線性決策問(wèn)題的抽樣信息期望值[J].河北大學(xué)學(xué)報(bào),2009,(3). [7]茆詩(shī)松.貝葉斯統(tǒng)計(jì)[M].北京:中國(guó)統(tǒng)計(jì)出版社,1999. [8]Berger.A.Statistical Decision Theory and Baysian Analysis(2ndEdition)[M].New York:Springer-Verlag,1985. O212 A 1002-6487(2011)03-0165-02 王燕飛(1981-),女,吉林四平人,碩士研究生,講師,研究方向:統(tǒng)計(jì)學(xué)。 (責(zé)任編輯/亦 民)2 (Be-N b)模型下的EVSI的理論分析
2.1 抽樣信息期望值(EVSI)
2.2 (Be-Nb)模型
2.3(Be-Nb)模型Ⅰ下的后驗(yàn)EVPI期望值
3 結(jié)論