王鳳英 (北京物資學(xué)院信息學(xué)院,北京101149)
隨著市場經(jīng)濟的發(fā)展和人們對健康生活方式的追求,市場上出現(xiàn)了越來越多的有關(guān)投資銷售特色農(nóng)產(chǎn)品的企業(yè)。由于農(nóng)產(chǎn)品的價格受氣候、產(chǎn)量、質(zhì)量、運輸、交貨、需求、存儲期和季節(jié)性等諸多因素的影響,導(dǎo)致企業(yè)對農(nóng)產(chǎn)品多采用小額多頻的定購方式,一般不會一次大量訂購。在這樣的定購模式下,投資企業(yè)經(jīng)常面臨著諸多的不確定性因素,對企業(yè)的投資帶來極大的風(fēng)險。為確保投資者的最大收益,制定一個科學(xué)合理的投資決策至關(guān)重要。決策的正確程度與決策后的期望收益直接相關(guān),因而需要有較科學(xué)的方法來為投資決策提供一個風(fēng)險較小的方案。一般地,為了提高決策的正確度,在作決策之前要進行相關(guān)的抽樣實驗,決策者根據(jù)抽樣結(jié)果所提供的信息對影響決策的各種因素(自然狀態(tài))增加了解后再作決策。而解決類似這樣的風(fēng)險型決策問題,貝葉斯方法則是十分適用的。在貝葉斯決策中,通常決策變量有2種類型:離散型和連續(xù)型。筆者以離散型決策變量為例,利用較為成熟的貝葉斯決策理論,對小額多頻的農(nóng)產(chǎn)品投資方式的最優(yōu)決策進行探討,期望為農(nóng)產(chǎn)品企業(yè)的投資決策提供一定的參考。
1.1 貝葉斯決策 貝葉斯決策理論是關(guān)于風(fēng)險條件下或面臨不確定因素的情況下應(yīng)該如何進行抉擇的理論[1-2]。在不完全信息下,對部分未知的狀態(tài)用主觀概率去估計,稱之為先驗概率,然后再利用貝葉斯公式對先驗概率進行修正,得到后驗概率,最后利用期望值和修正概率做出最優(yōu)決策。
貝葉斯屬于風(fēng)險型決策,決策者雖不能控制客觀因素的變化,但卻掌握其變化的可能狀態(tài)及各狀態(tài)的分布概率。一般地,一個投資活動中可能面臨多個自然狀態(tài) θ1,θ2,…,θn,決策者可以根據(jù)以往的投資數(shù)據(jù)統(tǒng)計估算出各種狀態(tài)出現(xiàn)的可能性,即先驗概率 P(θ1),P(θ2),…,P(θn)。決策者所能采取的行動方案也有多個:a1,a2,…,am,記為行動集λ={a1,a2,…,am}。
1.2 收益矩陣和損失矩陣[3]對每個決策方案ai和每個狀態(tài)θj計算一個收益,記為vij,從而形成m行n列矩陣V=(vij),稱為風(fēng)險決策的收益矩陣。
當(dāng)狀態(tài)θj發(fā)生時,由于選擇了決策ai,可能未獲得最大收益。決策ai所得到的收益與可能得到的最大收益之差即為機會損失,記為,從而形成m行n列矩陣L=(lij),稱為風(fēng)險決策的損失矩陣。
1.3 決策函數(shù)[4]在給定的貝葉斯問題中,從樣本空間X={x1,x2,…,xn}到行動集 λ ={a1,a2,…,am}上的一個映射δ(x)稱為該問題的一個決策函數(shù)。
1.4 完全信息期望值EVPI[3]貝葉斯決策的評價準(zhǔn)則一般采用最大期望收益原則或最小期望損失原則。一般地,最小期望損失原則與最大期望收益原則是等價的,且下式成立:
實際上,設(shè)想經(jīng)過市場調(diào)查,對于究竟發(fā)生哪個事件能獲得完全信息,從而可得到相應(yīng)的最大收益因此,在獲得完全信息的條件下,最大期望收益為由式(1),它與沒有獲得該信息的最大期望收益相比,兩者之差恰為最小期望損失:
式(2)被定義為完全信息的期望值EVPI。
在貝葉斯決策中,一般先進行驗前分析。然后通過抽樣增加信息量,根據(jù)新的信息來修正概率進行驗后分析。驗后分析是貝葉斯決策進行統(tǒng)計分析的主要方法。
2.1 先驗分析 首先估計自然狀態(tài) θ1,θ2,…,θn出現(xiàn)的概率 P(θ1),P(θ2),…,P(θn),并確定決策者可采用的行動集λ={a1,a2,…,am}。算出收益矩陣V=(vij)和損失矩陣L=(lij)。根據(jù)最小期望損失原則,計算各行動方案的先驗期望損失值:
相應(yīng)的最優(yōu)決策方案為ak,其中ak滿足(ai)。此時,完全信息期望值EVPI=Eθ(ak)。
2.2 后驗風(fēng)險分析 若存在某一決策函數(shù),使得此決策函數(shù)在全部決策函數(shù)中具有最小的后驗風(fēng)險,則這個決策函數(shù)為后驗風(fēng)險準(zhǔn)則下的最優(yōu)決策函數(shù),也就是貝葉斯決策函數(shù)。根據(jù)后驗風(fēng)險準(zhǔn)則作的貝葉斯決策由補充新信息、修正概率、確定最優(yōu)決策函數(shù)和計算補充信息價值4部分組成。
2.2.1 補充新信息。對可觀察的隨機變量X作s次觀察(或調(diào)查),得到一個樣本 x=(x1,x2,…,xs),這即為從市場活動中搜集到的新信息,同時通過資料獲取各種自然狀態(tài)下取得不同樣本值的條件概率 P(x/θ),其中 θ取值 θ1,θ2,…,θn;x 取值 x1,x2,…,xs。
2.2.2 修正概率。在已知先驗概率 P(θ)及條件概率P(x/θ)的基礎(chǔ)上,利用貝葉斯公式可得,在樣本x給定下,θ的后驗概率(即修正概率)為:
2.2.3 確定最優(yōu)決策函數(shù)。根據(jù)已得的后驗修正概率P(θ/x),計算各行動方案的后驗期望損失:
式(5)即為后驗風(fēng)險。
在所有的決策函數(shù)δ(x)中,若存在決策函數(shù)δ0(x),使得它具有最小的后驗風(fēng)險,則δ0(x)即為后驗風(fēng)險準(zhǔn)則下的最優(yōu)決策函數(shù)。
2.2.4 計算補充信息價值。完全信息期望值EVPI表示決策者在掌握完全信息時的期望損失或期望收益,它是以先驗概率為基礎(chǔ)的。而在獲得樣本信息后,在以后驗概率為基礎(chǔ)的討論中,也可類似得出完全信息后驗期望值,即后驗EVPI。
而后驗EVPI仍是依賴于樣本x的隨機變量,用樣本x的邊緣分布,對后驗EVPI再求一次數(shù)學(xué)期望以消除隨機性,得到后驗EVPI的期望值。
一般情況下,樣本信息的獲得會增加決策者對狀態(tài)θ的了解,決策過程中期望損失會降低,這個減少量就稱為抽樣信息期望值EVSI。
EVSI值就是獲得樣本信息后給決策者帶來的收益,這就是補充新信息的價值。應(yīng)當(dāng)指出的是,補充信息通常具有不確定性,因而這樣的信息是不完全的,也稱為抽樣信息。與完全信息相比,補充信息價值不會大于完全信息價值。
某農(nóng)產(chǎn)品企業(yè)欲增加一個有關(guān)綠色有機農(nóng)產(chǎn)品的投資項目。市場經(jīng)驗表明,一年中每100次投資里失敗次數(shù)θ的概率分布 P(θ)如下 P(5)=0.3;P(6)=0.4;P(7)=0.2;P(8)=0.1。
假定每次投資失敗,企業(yè)平均要付出損失4 000元。為進行該項目,每年的固定成本為10萬元。該企業(yè)預(yù)計每次投資會產(chǎn)生利潤350元,每年可投資1 000次。試求完全信息期望值EVPI。另外,投資者決定從每百次投資中抽取3次進行調(diào)查,根據(jù)投資失敗的次數(shù)x來決定是否繼續(xù)該投資項目,找出最優(yōu)決策函數(shù),并算出抽樣信息期望值EVSI。
3.1 求全信息期望值 由實際情況,該公司面臨2個行動方案的選擇:方案a1,不增加該投資項目;方案a2,增加該投資項目。經(jīng)過計算,容易得到收益矩陣V=(vij)和損失矩陣L=(lij):
方案a1和a2的先驗期望損失分別為:
在先驗期望準(zhǔn)則下,a2是最優(yōu)行動方案,故完全信息期望值EVPI=13 000元/年。
3.2 補充新信息 投資者抽取3次投資行動進行調(diào)查,失敗次數(shù)x的可能取值為0、1、2、3,則x服從二項分布,且:
而從{0,1,2,3}到{a1,a2}上的任一映射 δ(x)都是一個決策函數(shù)。
3.3 修正概率 根據(jù)先驗概率P(θ)可以算出x的邊緣概率 P(x),結(jié)果如下:當(dāng) x 分別為 0、1、2、3 時,對應(yīng)的 P(x)分別為 0.828 186、0.160 871、0.010 699、0.000 235。
由邊緣概率P(x)及公式(4),可計算得出x=xi下的后驗概率 P(θ/x),見表1。
表1 各x值下的后驗概率
3.4 確定最優(yōu)決策函數(shù) 根據(jù)表1,利用公式(5)計算出各行動方案的后驗期望損失,結(jié)果見表2。
表2 各x值下行動方案的后驗期望損失
根據(jù)風(fēng)險最小(期望損失最小)原則,對抽樣結(jié)果x的每個可能制定最優(yōu)結(jié)果,就得到最優(yōu)決策函數(shù):
3.4 計算后驗EVPI和EVSI 由表2的后驗期望損失結(jié)果可計算出后驗EVPI,即為表2中每個x值下的最小后驗期望損失:
x=0時,后驗EVPI=12 406
x=1時,后驗EVPI=15 615
x=2時,后驗EVPI=13 875
x=3時,后驗EVPI=14 785
后驗EVPI的期望值是用x的邊緣概率P(x)和對后驗EVPI求期望而得,即:
后驗EVPI的期望值 =12 406×0.828 186+15 615×0.160 871+13 875 × 0.010 699+14 785 × 0.000 235≈12 938.5
EVSI=13 000 -12 938.5=61.5(元)
這表明,根據(jù)抽樣結(jié)果x定出的最優(yōu)決策函數(shù)δ0(x)要比抽樣前的最優(yōu)行動減少損失61.5元,也就是抽樣給決策者帶來的增益。
在市場經(jīng)濟中許多問題都是難以完全準(zhǔn)確預(yù)測的,投資者經(jīng)常會遇到在不確定狀態(tài)下作決策的問題。投資者總是希望自己的決策更有依據(jù),期望收益更高,期望損失更低。貝葉斯方法則是比較完善的用于解決這類風(fēng)險型決策問題的方法。研究表明,貝葉斯方法充分利用總體信息、樣本信息、先驗信息和損失函數(shù),計算出最優(yōu)決策函數(shù)和最小后驗期望損失,并能算出抽樣為決策者帶來的增益,使得整個決策過程更有說服力,更具科學(xué)性,充分體現(xiàn)出該方法的優(yōu)越性。
[1]張華歆.預(yù)測與決策——理論及應(yīng)用[M].上海:上海交通大學(xué)出版社,2014.
[2]王明輝.貝葉斯決策方法及其應(yīng)用[J].韶關(guān)學(xué)院學(xué)報:自然科學(xué)版,2014(10):8-12.
[3]王鳳英,梁志新.基于數(shù)學(xué)期望的采購風(fēng)險管理決策分析[J].物流技術(shù),2012(9):228-230.
[4]朱震峰,苗敬毅.貝葉斯決策法的應(yīng)用[J].太原大學(xué)學(xué)報,2007,8(3):74-76.