国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

(Be-Nb)模型下的二行動(dòng)線性決策的抽樣信息期望值

2011-10-24 06:34:44王燕飛
統(tǒng)計(jì)與決策 2011年4期
關(guān)鍵詞:決策問(wèn)題二項(xiàng)分布期望值

王燕飛

(吉林化工學(xué)院 理學(xué)院,吉林 132022)

(Be-Nb)模型下的二行動(dòng)線性決策的抽樣信息期望值

王燕飛

(吉林化工學(xué)院 理學(xué)院,吉林 132022)

二行動(dòng)線性決策問(wèn)題是一類(lèi)比較普遍的決策問(wèn)題。文章討論了兩類(lèi)貝塔分布共軛于負(fù)二項(xiàng)分布的決策模型下的二行動(dòng)線性決策問(wèn)題的抽樣信息期望值的計(jì)算定理。

(Be-Nb)模型;二行動(dòng)線性決策;抽樣信息期望值;完全信息

0 引言

在企業(yè)經(jīng)營(yíng)過(guò)程中,做出有利于提高經(jīng)濟(jì)效益的決策對(duì)于企業(yè)的發(fā)展是至關(guān)重要的,甚至關(guān)及生死存亡。二行動(dòng)線性決策問(wèn)題是最為常見(jiàn)的決策問(wèn)題。對(duì)于決策者來(lái)說(shuō),通過(guò)抽樣等手段,可以獲得信息以接近完全信息,從而選取最優(yōu)決策,獲得最大利益。但抽樣耗時(shí)、費(fèi)力,那么我們有必要推斷抽樣的價(jià)值,即抽樣信息期望值(EVSI)。就此問(wèn)題,文獻(xiàn)[1][2]研究了正態(tài)分布共軛于正態(tài)分布決策模型下的。文獻(xiàn)[3]討論了分布共軛于普哇松分布模型下的。文獻(xiàn)[4]給出了倒分布共軛于指數(shù)分布模型下的EVSI。文獻(xiàn)[5]得出了倒分布共軛于分布模型下的。文獻(xiàn)[6]得出了貝塔分布共軛于幾何分布模型下的。負(fù)二項(xiàng)分布又名帕斯卡(Pascal)分布,應(yīng)用廣泛。比如醫(yī)學(xué)中的聚集性疾病,保險(xiǎn)精算中的非同質(zhì)性人群的索賠次數(shù),可靠性分析中的導(dǎo)彈飛行試驗(yàn)數(shù)量等,均服從負(fù)二項(xiàng)分布,具有一定的研究?jī)r(jià)值。事實(shí)上,幾何分布是負(fù)二項(xiàng)分布的特例。本文介紹了對(duì)于文獻(xiàn)[6]中更一般的情況,研究了在二行動(dòng)線性決策問(wèn)題中,兩類(lèi)貝塔分布共軛于負(fù)二項(xiàng)分布的決策模型(即(Be-Nb)模型Ⅰ和(Be-Nb)模型Ⅱ)下的的計(jì)算定理。

1 二行動(dòng)線性決策模型

二行動(dòng)線性決策模型,即行動(dòng)a只有二個(gè):a1,a2;狀態(tài)θ可以是離散或者連續(xù)的;收益函數(shù)對(duì)每個(gè)行動(dòng)都是狀態(tài)參數(shù)的線性函數(shù)。即收益函數(shù)

不妨設(shè) m1>m2,b10。若 m1

利用收益函數(shù)分別計(jì)算a1,a2的先驗(yàn)期望收益值,由平衡點(diǎn)(2),得:

E1-E2=(m1-m2)(Eθ-θ0),根據(jù)先驗(yàn)期望準(zhǔn)則,由 m1>m2,有:

(1)當(dāng) Eθ≤θ0時(shí),a2為最優(yōu)行動(dòng);(2)當(dāng) Eθ>θ0時(shí),a1為最優(yōu)行動(dòng)。 (3)

由公式,ai的損失函數(shù) L(θ,ai)=maxQ(θ,a)-Q(θ,ai)及(2),有:

a

2 (Be-N b)模型下的EVSI的理論分析

2.1 抽樣信息期望值(EVSI)

抽樣信息期望值為先驗(yàn)與后驗(yàn)期望值的差。

其中,a'為先驗(yàn)期望準(zhǔn)則下的最優(yōu)行動(dòng),δ'(x)為后驗(yàn)期望準(zhǔn)則下的最優(yōu)決策函數(shù)。L為損失函數(shù),由此可見(jiàn),EVSI是在抽樣前后使用最優(yōu)行動(dòng)(或最優(yōu)決策函數(shù))而使決策者蒙受期望損失的減少量或者由于抽樣給決策者帶來(lái)的增益。即抽樣帶給決策者的價(jià)值。

2.2 (Be-Nb)模型

負(fù)二項(xiàng)分布有兩種形式:設(shè)伯努力試驗(yàn)中,θ為每次試驗(yàn)成功的概率。

(Ⅰ)X 為恰好成功 r次時(shí)的試驗(yàn)總數(shù),則 P(X=x|θ)=θr(1-θ)x-r,(x=r,r+1,…);

(Ⅱ)X 為 r次成功前失敗的次數(shù),則 P(X=x|θ)=θr(1-θ)x,(x=0,1,2,…)。

我們將其分別記為 Nb(r,θ)Ⅰ型和 Nb(r,θ)Ⅱ型。 相應(yīng)的決策模型記為(Be-Nb)模型Ⅰ和(Be-Nb)模型Ⅱ。下面我們只討論第一種形式,對(duì)于第二種形式同理可得。

(Be-Nb)模型Ⅰ:設(shè)總體X服從負(fù)二項(xiàng)分布Nb(r,θ)Ⅰ型,即 P(X=x|θ)=θr(1-θ)x-r,(x=r,r+1,…)。 θ 的共軛先驗(yàn)分布為Be(α,β)。

2.2 (Be-Nb)模型Ⅰ下的先驗(yàn) EVPI=EθL(θ,a'),其中 a'為先驗(yàn)期望準(zhǔn)則下的最優(yōu)行動(dòng)

2.3(Be-Nb)模型Ⅰ下的后驗(yàn)EVPI期望值

(1)最優(yōu)決策函數(shù)δ'(x)

利用收益函數(shù)(1)分別計(jì)算a1,a2的后驗(yàn)期望收益值,及式(2),有:-=(m1-m2)(E(θ|t)-θ0)。 根據(jù)后驗(yàn)期望準(zhǔn)則,由m1>m2,得:(1)當(dāng) E(θ|t)≤θ0時(shí),a2為最優(yōu)行動(dòng);(2)當(dāng) E(θ|t)>θ0時(shí),a為最優(yōu)行動(dòng)。E(θ|x)==θ0時(shí),a1與 a2等效。 故取x0=-α-β,其作用等同于平衡點(diǎn)。

(2)后驗(yàn) EVPI=E(θ|x)L(θ,δ'(x))。 求法同先驗(yàn) EVPI,得:

②當(dāng)x>x0時(shí),a1為最優(yōu)行動(dòng),

(3)后驗(yàn) EVPI期望值

由(11),(12)和(8),用 m(x)對(duì)后驗(yàn) EVPI求期望,得:

綜上,后驗(yàn) EVPI期望值

3 結(jié)論

定理1 (Be-Nb)模型Ⅰ下的二行動(dòng)線性決策問(wèn)題的EVSI

在(Be-Nb)模型Ⅰ下,根據(jù)公式(6),由(9),(10),(13)及平衡點(diǎn)(2),有:

特別地:當(dāng)r=1時(shí),負(fù)二項(xiàng)分布Nb(r,θ)即為幾何分布G(r,θ)。此時(shí)即為文獻(xiàn)[6]中所述的(Be-G)模型下的二行動(dòng)線性決策問(wèn)題的EVSI。

定理2 (Be-Nb)模型Ⅱ下的二行動(dòng)線性決策問(wèn)題的EVSI在(Be-Nb)模型Ⅱ下,方法同定理1,可得到類(lèi)似結(jié)論。

[1]侯文超.經(jīng)營(yíng)管理決策分析[M].北京:高等教育出版社,1987.

[2]張雪野.經(jīng)營(yíng)決策方法[M].上海:華東師范大學(xué)出版社,1996.

[3]許麗梅,曾林蕊.(Γ-Ρ)模型下二行動(dòng)線性決策問(wèn)題的抽樣信息期望值[J].應(yīng)用概率統(tǒng)計(jì),2003,(2).

[4]王燕飛,宋立新.(IGa-Exp)模型下二行動(dòng)線性決策問(wèn)題的抽樣信息期望值[J].運(yùn)籌于管理,2006,(5).

[5]李晶,宋立新.(IGa-Ga)模型下二行動(dòng)線性決策問(wèn)題的抽樣信息期望值[J].統(tǒng)計(jì)與決策,2007,(21).

[6]陳永勝,李晶.(Be-G)模型下二行動(dòng)線性決策問(wèn)題的抽樣信息期望值[J].河北大學(xué)學(xué)報(bào),2009,(3).

[7]茆詩(shī)松.貝葉斯統(tǒng)計(jì)[M].北京:中國(guó)統(tǒng)計(jì)出版社,1999.

[8]Berger.A.Statistical Decision Theory and Baysian Analysis(2ndEdition)[M].New York:Springer-Verlag,1985.

O212

A

1002-6487(2011)03-0165-02

王燕飛(1981-),女,吉林四平人,碩士研究生,講師,研究方向:統(tǒng)計(jì)學(xué)。

(責(zé)任編輯/亦 民)

猜你喜歡
決策問(wèn)題二項(xiàng)分布期望值
二項(xiàng)分布與超幾何分布的區(qū)別與聯(lián)系
概率統(tǒng)計(jì)中的決策問(wèn)題
創(chuàng)新視角下統(tǒng)計(jì)數(shù)據(jù)的合理決策問(wèn)題
深度剖析超幾何分布和二項(xiàng)分布
概率與統(tǒng)計(jì)(1)——二項(xiàng)分布與超幾何分布
基于改進(jìn)數(shù)學(xué)期望值的瀝青性能評(píng)價(jià)模型
石油瀝青(2018年4期)2018-08-31 02:29:40
作戰(zhàn)方案仿真實(shí)驗(yàn)自動(dòng)指揮決策問(wèn)題研究
二項(xiàng)分布參數(shù)的E-Bayes估計(jì)及其應(yīng)用
重新審視你的期望值
媽媽寶寶(2017年4期)2017-02-25 07:00:58
公路軟基處理決策問(wèn)題智能化技術(shù)探討
商丘市| 灵宝市| 海宁市| 元谋县| 驻马店市| 东阿县| 嘉善县| 祥云县| 巩义市| 连南| 安溪县| 新兴县| 华亭县| 江山市| 公安县| 泸水县| 拜城县| 桦甸市| 广州市| 资源县| 黑水县| 加查县| 靖西县| 邵东县| 桂林市| 临清市| 大冶市| 鄂尔多斯市| 永泰县| 益阳市| 综艺| 宜昌市| 右玉县| 龙门县| 长子县| 蒙山县| 霍州市| 伊川县| 炎陵县| 洛阳市| 亳州市|