国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

非對(duì)稱不確定策略下合作對(duì)偶均衡研究

2022-05-10 00:03:18羅桂美
關(guān)鍵詞:混合策略對(duì)偶范數(shù)

羅桂美

(廣東金融學(xué)院金融數(shù)學(xué)與統(tǒng)計(jì)學(xué)院, 廣州 510521)

若參與者在博弈活動(dòng)中能達(dá)成合作均衡,從互惠互利的原則出發(fā),則雙方都可以降低成本或增加利潤,都能從合作博弈中獲得最大利益。 然而現(xiàn)實(shí)生活中,人的非完全理性行為經(jīng)常與假定模型有分歧,如:NOWAK等[1]認(rèn)為自私行為與博弈結(jié)果相矛盾;POUNDSTONE[2]發(fā)現(xiàn)在最后通牒實(shí)驗(yàn)中,響應(yīng)者并不會(huì)按理性人的行為假設(shè)去做出符合提議者的決策。為克服非理性行為對(duì)決策的影響,CORLEY和KWAIN[3]提出合作博弈概念并研究了相應(yīng)的合作對(duì)偶均衡:該模型從競(jìng)爭(zhēng)對(duì)手利益出發(fā),提出每個(gè)競(jìng)爭(zhēng)者都是無私的;從對(duì)手利益出發(fā),雙方同時(shí)給出使得對(duì)方利益最大或成本最低的策略。合作對(duì)偶均衡模型克服了人的自私行為,已被應(yīng)用于經(jīng)濟(jì)、決策、保險(xiǎn)和供應(yīng)鏈等領(lǐng)域[4-7]。

現(xiàn)實(shí)生活中出現(xiàn)的博弈活動(dòng)經(jīng)常包含信息不確定性,如:博弈的結(jié)構(gòu)不可能準(zhǔn)確獲知;博弈雙方的支付函數(shù)或成本矩陣、混合策略集無法精確獲得等。 而處理不確定性問題的常用方法有敏感性分析、隨機(jī)規(guī)劃法和魯棒優(yōu)化法。其中,線性規(guī)劃的魯棒可行性思想由SOYSTER[8]提出,隨后EBN-TAL和NEMIROVSKI[9-10]及EL GHAOUI[11-12]提出了處理含不確定性的魯棒優(yōu)化模型。由于魯棒優(yōu)化法不需要事先知道參數(shù)的概率分布,又克服了敏感性分析滯后的缺點(diǎn),而且在處理信息不確定的優(yōu)化問題時(shí)非常有效[13],有學(xué)者將該方法用于非合作博弈領(lǐng)域,提出從競(jìng)爭(zhēng)者自身利益出發(fā),尋求最佳策略。 如:AGHASSI和BERTSIMAS[14]提出了用魯棒優(yōu)化法考察不確定信息分布未知時(shí)的處理方法,研究了不含私人信息且不確定的成本矩陣集為有界集時(shí)的N-人博弈問題;YAMASHITA等[15]提出了雙人博弈的魯棒優(yōu)化均衡概念,并在對(duì)手策略集或自身成本矩陣集為橢球?qū)ΨQ時(shí),得到該均衡可轉(zhuǎn)化成一個(gè)二階錐互補(bǔ)(SOCCP)問題的解。

由于非合作博弈并非總是合適的,且非理性現(xiàn)象和不確定性都客觀存在,而CORLEY和KWAIN[3]從合作角度出發(fā)提出的對(duì)偶博弈模型僅考慮了最基本的混合策略,未對(duì)自身策略集進(jìn)行合理估計(jì);AGHASSI和BERTSIMAS[14]、YAMASHITA等[15]提出的魯棒優(yōu)化均衡雖考慮了非確定性,但未考慮合作及非理性情形?;诖耍疚膹幕旌喜呗约淖蛹胧?,同時(shí)將非理性現(xiàn)象及不確定性納入研究范圍,假設(shè)博弈雙方在做決策時(shí),其自身支付矩陣能準(zhǔn)確獲知,而自身策略假設(shè)落在一個(gè)非對(duì)稱有界閉集(混合策略集的子集)中?;诤献骼砟睿紫忍接憣?duì)手成本最低的問題;然后分析雙方同時(shí)做決策,使博弈雙方成本同時(shí)最低的問題,提出合作對(duì)偶博弈模型;最后利用對(duì)偶理論和魯棒優(yōu)化技術(shù),研究合作對(duì)偶博弈的均衡問題。

1 預(yù)備知識(shí)

本文考察如下雙人博弈問題:參與者自身成本矩陣可以準(zhǔn)確獲知,其自身混合策略可以進(jìn)一步估計(jì)落在某一有界閉集內(nèi),雙方同時(shí)做出決策,使對(duì)手成本最低。 用模型表示為:

(1)

(2)

其中,A,Bn×m分別表示參與者甲、乙的支付矩陣;Y∶={y分別表示甲、乙的混合策略集,策略集中的每個(gè)分量表示該策略的概率;Yu(y)?Y、Zu(z)?Z分別表示包含策略y、z的非對(duì)稱有界閉集。特別地,若Yu(y)={y}、Zu(z)={z}且對(duì)手從自身利益出發(fā)使各自成本最低,則問題(1)和問題(2)退化成如下Nash博弈模型:

(3)

(4)

s.t.zZ,

(5)

s.t.yY。

(6)

如果z是問題(5)的最優(yōu)解且y是問題(6)的最優(yōu)解,則稱策略對(duì)(z,y)是問題(5)和問題(6)的Nash均衡,也稱作是問題(1)和問題(2)的合作對(duì)偶均衡。

易知,為了得到問題(1)和問題(2)的合作對(duì)偶均衡,或者說問題(5)和問題(6)的Nash均衡,需要獲知不確定集Yu和Zu中元素范數(shù)及其對(duì)偶范數(shù)的表達(dá)形式。文中用‖·‖表示向量的一般范數(shù),滿足:對(duì)?xn,‖x‖=‖|x|‖,如‖·‖2、‖·‖1∩∞等;其對(duì)偶范數(shù)‖·‖*由確定。 為得到問題(5)和問題(6)的可計(jì)算表達(dá)式,本文進(jìn)一步假設(shè)不確定集Yu和Zu中元素取l1∩∞-范數(shù),其定義為:‖|x|‖1∩∞=max{‖x‖1/p,‖x‖∞},其中p>0為常數(shù)。為計(jì)算l1∩∞-范數(shù)的對(duì)偶范數(shù),BERTSIMAS等[13]定義了D-范數(shù),即對(duì)任意的x=(x1,…,xn)Tn,p[0,n],令

(7)

其中,N表示由x=(x1,…,xn)T分量中所有下標(biāo)構(gòu)成的集合,?p」表示p的整數(shù)部分,S表示維數(shù)不超過?p」的N的子集。

進(jìn)一步地,BERTSIMAS 等[13]利用式(7),得到了D-范數(shù)和l1∩∞-范數(shù)的關(guān)系:

即D-范數(shù)‖|·|‖p的對(duì)偶范數(shù)為l1∩∞-范數(shù);

(2)對(duì)任意的x≥0,‖|x|‖p≤γ等價(jià)于

下面給出本文定理證明需用的2個(gè)引理。

引理2[16]假設(shè)f1和f2均是n×m→上的連續(xù)函數(shù),且f1(·,z)、f2(y,·)分別是n、m上的凸函數(shù),并假設(shè)Y、Z是非空緊凸集,則問題(3)和問題(4)存在Nash均衡。

引理3[17]令π*=max{aTv+bTw:‖v+w‖≤Ω,v,w則Ω‖t‖*=π*,其中,t=(t1,…,tJ)T,tj=max{aj,bj,0},j=1,2,…,J。

2 策略非對(duì)稱不確定性下的合作對(duì)偶均衡

首先研究問題(1)和問題(2)中均衡的存在性。易知Yu(·)、Zu(·)可分別看成是n、m上的集值映射。利用引理2,可以證明以下定理:

定理1假設(shè)集值映射Yu(·)和Zu(·)是連續(xù)的,Yu(y)、Zu(z)分別是包含y、z的非空緊集,且Y和Z是非空緊凸集,則問題(1)和問題(2)存在合作對(duì)偶均衡。

接下來探究問題(1)和問題(2)的合作對(duì)偶均衡,即問題(5)和問題(6)的Nash均衡問題。 由定理1可知,目標(biāo)函數(shù)是凸的,因此接下來只需尋求同時(shí)滿足問題(5)和問題(6)的KKT條件,這一問題又可以等價(jià)轉(zhuǎn)化為一個(gè)混合互補(bǔ)問題。

(8)

(9)

其中,ΔY=(ΔY1,ΔY2,…,ΔY)n×1為擾動(dòng)方向矩陣;Ω[0,1]為兼顧魯棒性和最優(yōu)性的控制參數(shù);和y+ΔY(h1-h2)≥0為確保是混合策略的條件。

利用引理3,類似文獻(xiàn)[18]中定理2.1的證明,可得如下定理:

定理2若Yu由式(9)給出,則問題 (5)等價(jià)于以(z,β,s,ζ,g)m××××n為決策變量的優(yōu)化問題:

minyTAz+yTg+Ωζ

s.t. ‖s‖*≤ζ,

s≥P1(ΔYTATz+ΔYTg+ΔYTenβ),

s≥-Q1(ΔYTATz+ΔYTg+ΔYTenβ),

(10)

t=(t1,t2,…,t)T

(11)

結(jié)合式(11),問題(10)在l1∩∞-范數(shù)下可轉(zhuǎn)化成以(z,β,s,ζ,g,t,σ)m××××n××為決策變量的線性規(guī)劃問題:

minyTAz+yTg+Ωζ

s≤t+eσ,-s≤t+eσ,

s≥P1(ΔYTAz+ΔYTg+ΔYTenβ),

s≥-Q1(ΔYTAz+ΔYTg+ΔYTenβ),

(12)

接下來考察問題(6)。類似Yu的構(gòu)造,Zu可以表示為

(13)

其中,ΔZ=(ΔZ1,ΔZ2,…,ΔZ)2;?[0,2]為兼顧魯棒性和最優(yōu)性的控制參數(shù)。

于是,當(dāng)Zu由式(13)給出時(shí),問題(6)等價(jià)于以(y,γ,r,α,f)n××××m為決策變量的優(yōu)化問題:

minyTBz+zTf+?γ

s.t. ‖r‖*≤γ,

r≥P2(ΔZTBy+ΔZTf+ΔZTemα),

s≥-Q2(ΔZTBy+ΔZTf+ΔZTemα),

(14)

類似地,問題(14)在l1∩∞-范數(shù)下可轉(zhuǎn)化成以(y,α,r,γ,f,w,δ)n××××m××為決策變量的線性規(guī)劃問題:

minyTBz+zTf+?γ

r≤w+eδ,-r≤w+eδ,

r≥P2(ΔZTBTy+ΔZTf+ΔZTemα),

r≥-Q2(ΔZTBTy+ΔZTf+ΔZTemα),

(15)

由此可知,從合作角度出發(fā),甲、乙成本最低的問題分別可轉(zhuǎn)化為形如式(12)、(15)的線性規(guī)劃問題。下面探究雙方同時(shí)做決策,使對(duì)方成本同時(shí)最低的問題,即同時(shí)求解問題(1)、(2)。結(jié)論如下:

定理3假設(shè)參與者甲、乙自身的策略集分別由式(9)、(11)給出, 則求解問題(1)、(2)的合作對(duì)偶均衡可以轉(zhuǎn)化成尋求一個(gè)混合互補(bǔ)問題(MCP)的解:

(16)

其中,G、Hζ×(ζ+τ),Cτ×(ζ+τ),q,rζ,d=(0,Ω,0,1,0,?,0,1)Tτ,且G、H、C表示如下:

證明甲、乙從對(duì)方利益出發(fā),雙方同時(shí)做決策,使對(duì)方成本最低的問題可轉(zhuǎn)化成尋求同時(shí)滿足問題(12)、(15)中KKT 條件的策略對(duì)(z,y)。易知,問題(12)的KKT條件為:

+

+

,

+

+

,

(17)

其中,λ1,λ2,vi(i=1,…,4)為拉格朗日乘子。

類似地,問題(15)的KKT條件為:

+

?

+

,

+

δ

?

+

,

(18)

其中,ξ1,ξ2,ui(i=1,…,4)為拉格朗日乘子。

G1=

G3=

H5和H3結(jié)構(gòu)相同,只需將H3中非零元素AT、In分別換成B、Im;H6和H2結(jié)構(gòu)相同,只需將H2中AT、ΔY、P1、Q1分別換成B、ΔZ、P2、Q2。證畢。

3 算例分析

本節(jié)通過一個(gè)算例,采用文獻(xiàn)[19]的算法,利用定理3,尋求合作對(duì)偶均衡。

例1設(shè)博弈雙方甲、乙的混合策略集均由3種策略組成,即m=n=3;設(shè)甲、乙每種策略都互相獨(dú)立且每個(gè)策略都具有不確定性,即1=2=3。設(shè)甲、乙的成本矩陣分別為

對(duì)應(yīng)不確定集由式(9)和式(13)給定。設(shè)甲、乙的擾動(dòng)方向矩陣分別為:

令甲的對(duì)角偏度矩陣為P1=diag(2,4,1)、Q1=diag(4,2,1);乙的對(duì)角偏度矩陣為P2=diag(2,4,1)、Q2=diag(3,3,2)。試分析當(dāng)參數(shù)Ω、?變化時(shí),甲、乙混合策略及對(duì)應(yīng)成本的變化情況。

由甲、乙的合作對(duì)偶均衡及相應(yīng)成本隨Ω、?的變化(表1)可知:(1)當(dāng)Ω、?的取值從0.1增大到2時(shí),甲的成本變化比乙的收入變化要快;(2)當(dāng)Ω和?逐漸增加時(shí),甲方成本和乙方收入是波浪式變化的,同時(shí)甲方成本增加伴隨著乙方收入增加,但并不完全相同,雙方并非零和博弈;(3)當(dāng)Ω和?均取0.9時(shí),甲方達(dá)到最大成本而乙方獲得最大收入,隨后都開始遞減,這表明有必要同時(shí)考慮魯棒性與最優(yōu)性;(4)控制參數(shù)Ω、?,方向矩陣ΔZ、ΔY及偏度矩陣在模型中起著非常重要的作用,但其選擇非常復(fù)雜;而如何做好魯棒性與最優(yōu)性之間的權(quán)衡,也是魯棒優(yōu)化法需要進(jìn)一步探討的問題。

表1 策略非對(duì)稱不確定性下的魯棒合作對(duì)偶均衡Table 1 Robust cooperative dual equilibria with asymmetric strategy uncertainty

4 小結(jié)

傳統(tǒng)的非合作博弈研究的是參與者均從自身角度出發(fā),追求利潤最大化或者成本最小化,本文討論了合作情形下的雙人博弈活動(dòng)。文中首先同時(shí)將非理性現(xiàn)象和不完全信息納入考察范圍,假設(shè)對(duì)手策略落在一混合策略集但競(jìng)爭(zhēng)者自身策略落在一非對(duì)稱有界估計(jì)集(混合策略的子集),分析了每個(gè)競(jìng)爭(zhēng)者成本最優(yōu)問題;然后利用魯棒優(yōu)化技術(shù)和對(duì)偶理論,在目標(biāo)函數(shù)是凸函數(shù)的情形下,將魯棒合作對(duì)偶均衡的求解等價(jià)轉(zhuǎn)化成一個(gè)混合互補(bǔ)問題的求解;最后算例表明,模型(1)、(2)是合理可行的,且可以應(yīng)用到最優(yōu)再保險(xiǎn)領(lǐng)域。

猜你喜歡
混合策略對(duì)偶范數(shù)
基于加權(quán)核范數(shù)與范數(shù)的魯棒主成分分析
混合策略的漢維輔助翻譯系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
矩陣酉不變范數(shù)H?lder不等式及其應(yīng)用
注冊(cè)制背景下上市公司與投資者的博弈分析
對(duì)偶平行體與對(duì)偶Steiner點(diǎn)
對(duì)偶均值積分的Marcus-Lopes不等式
一類具有準(zhǔn)齊次核的Hilbert型奇異重積分算子的范數(shù)及應(yīng)用
對(duì)偶Brunn-Minkowski不等式的逆
基于混合策略博弈的我國工業(yè)碳減排分析
已有薪資激勵(lì)背景下股票期權(quán)的推行前景和條件
米泉市| 建始县| 大悟县| 武夷山市| 襄汾县| 邻水| 巴彦县| 于田县| 济南市| 美姑县| 长春市| 天等县| 鄯善县| 五寨县| 石楼县| 左云县| 建平县| 宝应县| 新巴尔虎左旗| 治县。| 南靖县| 左云县| 天水市| 勐海县| 商丘市| 扎鲁特旗| 镇原县| 泰宁县| 镇巴县| 安吉县| 白朗县| 海门市| 乐业县| 长阳| 老河口市| 府谷县| 同仁县| 英吉沙县| 资阳市| 云阳县| 乐昌市|