潘素娟, 李時(shí)銀, 趙佩
( 1.福建商學(xué)院 信息工程學(xué)院, 福州 350012; 2.廈門大學(xué) 數(shù)學(xué)學(xué)院, 福建 廈門 361005 )
在現(xiàn)實(shí)的博弈決策中,由于時(shí)間是不間斷的,因此博弈的參與者必須時(shí)刻作出決策.研究表明,可應(yīng)用確定性微分博弈來分析連續(xù)時(shí)間的決策行為.例如: Dominika等[1]針對競爭細(xì)分市場給出了一種商譽(yù)模型的開環(huán)均衡解存在的充分條件; Zhou等[2]將Pontryagin最大值原理作為最優(yōu)性條件,研究了參與者不斷更新的合作微分對策; Puduru等[3]在事件樹上給出了約束線性二次動(dòng)態(tài)博弈的反饋和開環(huán)納什均衡解;程粟粟等[4]利用動(dòng)態(tài)博弈的方法研究發(fā)現(xiàn),在戰(zhàn)略合作下博弈參與國捕獲和封存的二氧化碳數(shù)量最多; Abraham等[5]根據(jù)廣義納什博弈理論,給出了在離散時(shí)間動(dòng)態(tài)博弈(DTDG)中存在開環(huán)納什均衡條件的一種新的求解方法.眾所周知,在證券市場中莊家和散戶的博弈對證券市場的走勢具有重要的影響.但目前為止,尚未見到將確定性微分博弈理論應(yīng)用于莊家和散戶間的連續(xù)時(shí)間博弈的研究中.為此,本研究運(yùn)用動(dòng)態(tài)博弈理論中的確定性微分博弈對專家和散戶之間的博弈行為進(jìn)行分析,得到了莊家和散戶博弈的開環(huán)納什均衡策略和反饋納什均衡策略.
1) 假設(shè)在一個(gè)微分博弈中,每位參與者的目標(biāo)函數(shù)為:
(1)
其中n為總?cè)藬?shù),gi(·)≥0,φi(·)≥0.目標(biāo)函數(shù)(1)的值取決于如下的確定性動(dòng)態(tài)系統(tǒng)[6]:
(2)
2)將ηi(·) (i∈N)定義為一個(gè)集合函數(shù),并表示為:
(3)
(4)
1.2.1開環(huán)資訊結(jié)構(gòu)(OLIS) 如果在博弈的開始時(shí)刻即可確定整個(gè)博弈過程的策略,則該資訊結(jié)構(gòu)是開環(huán)的[9].開環(huán)資訊結(jié)構(gòu)下每個(gè)參與者i的資訊結(jié)構(gòu)為ηi(s)={x0},s∈[t0,T].參與者的策略是由當(dāng)前時(shí)間點(diǎn)s和開始狀態(tài)所決定的,即{ui(s)=ψi(s,x0),?i∈N}.由上述可知,開環(huán)資訊結(jié)構(gòu)存在一旦選定策略就無法做出改變的局限.
1.2.2閉環(huán)完美狀態(tài)(CLPS) 如果每個(gè)參與者的策略是由開始到當(dāng)前的狀態(tài)和時(shí)間確定的,則可將該資訊結(jié)構(gòu)視為閉環(huán)完美狀態(tài).閉環(huán)完美狀態(tài)下參與者在博弈的過程中所采用的策略為ηi(s)={x(t),t0≤t≤s}, 現(xiàn)實(shí)中大部分的資訊結(jié)構(gòu)都屬于這一類.
1.2.3無記憶完美狀態(tài)(MPS) 如果每位參與者的策略都是由開始狀態(tài)、當(dāng)前時(shí)間和當(dāng)前狀態(tài)所決定,則可將該資訊結(jié)構(gòu)視為無記憶完美狀態(tài)[10].無記憶完美狀態(tài)下每個(gè)參與者i的資訊結(jié)構(gòu)為ηi(s)={x0,x(s)},s∈[t0,T].此時(shí)參與者的策略是當(dāng)前時(shí)間點(diǎn)s、開始狀態(tài)x0和當(dāng)前狀態(tài)x(s)的函數(shù),即{ui(s)=ψi(s,x(s)x0),?i∈N}.在無記憶完美狀態(tài)下,參與者的策略與過去的資訊(開始時(shí)刻除外)無關(guān),只與開始時(shí)刻和當(dāng)前的資訊有關(guān).
1)將股票市場中的散戶投資者作為一個(gè)整體與莊家進(jìn)行博弈,即博弈參與雙方為莊家和散戶.
2)莊家和散戶均為理性人,每個(gè)博弈參與者都能對自己和其他人的行為有正確的預(yù)期.莊家和散戶在采取任何策略之前,都會(huì)考慮截至目前的歷史股價(jià)走勢,并預(yù)期自己的行為對隨后決策所造成的影響.
3)博弈的結(jié)構(gòu)和完全理性對每個(gè)參與者而言都是常識(shí),博弈中一方的增持必然意味著另一方的減持.
4)莊家和散戶間的博弈信息是不完全和非對稱性的.由于莊家能夠密切了解上市公司的動(dòng)態(tài)和宏觀政策的變化,所以在預(yù)測股票價(jià)格的變動(dòng)時(shí),莊家通常比散戶具有更及時(shí)、準(zhǔn)確的信息.
由于莊家和散戶都希望最大化一段時(shí)間內(nèi)的投資回報(bào),因此莊家和散戶的目標(biāo)函數(shù)可分別表達(dá)為:
(5)
(6)
其中:T表示莊家在這只股票上的持股時(shí)間;狀態(tài)x(t)表示莊家在時(shí)間點(diǎn)t的持股率,即該股票在時(shí)間點(diǎn)t的莊家控盤系數(shù); 1-x(t)為散戶投資者在時(shí)間點(diǎn)t的持股率;qi表示持股率對投資者i收益的短期邊際影響,即股票瞬時(shí)收益率;ci是交易成本率;r為貼現(xiàn)利率;Si是持股結(jié)束時(shí)持股率對股票收益的邊際影響;ui(t)為t期莊家或散戶凈買賣股票的數(shù)量;ui(t)>0表示凈買進(jìn)的股票數(shù)量;ui(t)<0表示凈賣出的股票數(shù)量;r、qi、ci和Si對于i∈{1,2}都是正常數(shù).
在莊家的決策中,假設(shè)每個(gè)時(shí)間點(diǎn)的凈買賣股票數(shù)量就是莊家的策略空間,由此莊家持股率的變化(博弈的動(dòng)態(tài)系統(tǒng))可表示為
(7)
將式(5)—(7)聯(lián)立即可構(gòu)成莊家與散戶間的確定性微分博弈模型.莊家和散戶根據(jù)當(dāng)前時(shí)間和持股率決定最優(yōu)策略.在每個(gè)時(shí)間點(diǎn)t, 如果一方的凈買賣股票數(shù)量已經(jīng)確定,則另一方在確定最優(yōu)策略時(shí),不僅需要考慮持股率變化對自己在當(dāng)前時(shí)刻的瞬時(shí)支付(收益)的影響,還要考慮持股率變化對將來收益的各種影響.
應(yīng)用開環(huán)納什均衡和反饋納什均衡的方法即可求解由公式(5)—(7)聯(lián)立所構(gòu)成的確定性微分博弈模型.
根據(jù)開環(huán)納什均衡的解法,對上述確定性微分博弈模型進(jìn)行求解可得如下定理1:
定理1在確定性微分博弈中,莊家和散戶的開環(huán)納什均衡策略為:
(8)
其中A1(t)和A2(t)的值不僅取決于市場利率、交易成本、持股率對投資收益的短期和長期邊際影響,而且還受到A1(t)和A2(t)的互動(dòng)影響.A1(t)和A2(t)依賴如下的動(dòng)態(tài)系統(tǒng)和邊際條件:
A1(T)=S1,A2(T)=-S2
(9)
證明由于定理1的證明屬于標(biāo)準(zhǔn)最優(yōu)控制問題,因此可用Pontryagin的最大化原理[11]來證明.根據(jù)開環(huán)納什均衡解法可得:
Λ1(T)=exp(-rT)S1,Λ2(T)=-exp(-rT)S2.
(10)
由式(10)可知,莊家和散戶根據(jù)各自的持股率和交易成本,在保證理性的最優(yōu)化收益的情況下,其在每個(gè)時(shí)間點(diǎn)凈買賣的股票數(shù)量分別為:
(11)
(12)
Λ1(T)=S1exp(-rT),Λ2(T)=-S2exp(-rT).
(13)
求解式(12)和式(13)所組成的微分方程組可得
Λ1(t)=A1(t)exp(-rt),Λ2(t)=A2(t)exp(-rt).
(14)
將式(14)代入式(11)即可證得定理1.
由上述開環(huán)納什均衡策略可以得到以下結(jié)論:
1)在最初開始時(shí)刻,最優(yōu)狀態(tài)與博弈的開始狀態(tài)相同,而最優(yōu)狀態(tài)在當(dāng)前的變化取決于當(dāng)前的狀態(tài)、時(shí)間以及專家和散戶的最優(yōu)策略;
2)如果專家和散戶中的一方采用自己的最優(yōu)策略,則另一方在選擇最優(yōu)策略時(shí),除了要考慮自己在當(dāng)前狀態(tài)的瞬時(shí)支付,還要考慮自己在未來狀態(tài)的所有支付;
3)假設(shè)專家和散戶都采用自己的最優(yōu)策略,且他們的最優(yōu)策略都只依賴于開始狀態(tài)和當(dāng)前時(shí)間,則專家和散戶的共態(tài)函數(shù)就可以反映出最優(yōu)狀態(tài)給他們的未來支付所帶來的影響.
為了避免在推導(dǎo)納什均衡時(shí)能夠碰到資訊非唯一性的問題,本文假設(shè)專家和散戶的資訊結(jié)構(gòu)都為無記憶完美狀態(tài)(MPS)或閉環(huán)完美狀態(tài)(CLPS).根據(jù)反饋納什均衡解法,對上述確定性微分博弈模型進(jìn)行求解可得如下定理2:
定理2在連續(xù)時(shí)間下,莊家和散戶在確定性微分博弈中的反饋納什均衡策略為:
(15)
證明根據(jù)Bellman的動(dòng)態(tài)規(guī)劃,微分博弈的反饋納什均衡解應(yīng)滿足以下Issacs - Bellman偏微分方程組:
V1(T,x)=exp(-rT)S1x,V2(T,x)=exp(-rT)S2(1-x).
(16)
其中Vi(t,x)是參與者i的價(jià)值函數(shù),Vi t(t,x)、Vi x(t,x)分別是Vi(t,x)對t和x的一階偏導(dǎo).
1)求解公式(4)—(9)中的最大值,由此得到如下最優(yōu)策略:
(17)
V1(T,x)=exp(-rT)S1x,V2(T,x)=exp(-rT)S2(1-x).
(18)
3)求解方程組(18),得如下莊家和散戶的價(jià)值函數(shù):
V1(t,x)=exp(-rt)[A1(t)x+B1(t)],V2(t,x)=exp(-rt)[A2(t)(1-x)+B2(t)].(19)
其中:A1(t)和A2(t)的值不僅取決于市場利率、交易成本、持股率對投資收益的短期和長期的邊際影響,而且還受A1(t)和A2(t)互動(dòng)的影響;而B1(t)和B2(t)的值不僅取決于市場利率和交易成本,還取決于A1(t)和A2(t)的值.A1(t)、A2(t)、B1(t)和B2(t)依賴如下動(dòng)態(tài)系統(tǒng):
(20)
A1(t)、A2(t)、B1(t)和B2(t)的邊際條件為:
A1(T)=S1,B1(T)=0,A2(T)=S2,B2(T)=0.
(21)
4)用式(19)中的價(jià)值函數(shù)V1(t,x)和V2(t,x)分別對x求偏導(dǎo),將所得結(jié)果代入式(17)即可求得莊家和散戶的反饋納什均衡策略.
由上述反饋納什均衡策略可知,莊家和散戶根據(jù)當(dāng)前狀態(tài)和時(shí)間選定最優(yōu)策略時(shí),專家和散戶的價(jià)值函數(shù)將隨著時(shí)間的改變而改變,其中價(jià)值函數(shù)在每一瞬間的改變量相當(dāng)于狀態(tài)的最優(yōu)變化為價(jià)值函數(shù)所帶來的轉(zhuǎn)變與它的瞬時(shí)支付之和.另外,莊家和散戶在最后時(shí)間點(diǎn)T時(shí)的支付(收益)等于其在博弈的終點(diǎn)支付.
本文利用動(dòng)態(tài)博弈的方法和多種資訊結(jié)構(gòu)類型,針對證券市場建立了一種莊家與散戶在證券市場中的確定性微分博弈模型,并分別運(yùn)用開環(huán)納什均衡和反饋納什均衡的方法求解出了博弈雙方較為完美的反饋納什均衡策略和開環(huán)納什均衡策略.本文研究結(jié)果可以為金融監(jiān)管部門監(jiān)管證券市場和證券市場投資者買賣股票提供參考.本文在研究過程中未能考慮到隨機(jī)因素對博弈模型的影響,因此在今后的研究中我們將用隨機(jī)微分方程理論描述國內(nèi)外機(jī)構(gòu)投資者和散戶群體所參與的博弈,以此進(jìn)一步提高本文模型的適用性.