建晶晶,洪世煌,陳 吉
(杭州電子科技大學(xué)理學(xué)院,浙江 杭州 310018)
量子博弈論是近20年來興起的以量子信息論為工具研究博弈論的一門新興交叉學(xué)科[1],為量子計算的一個重要發(fā)展分支,拓展了經(jīng)典博弈論。首先,在某些程度上,經(jīng)典博弈建立在概率體系的基礎(chǔ)上,可以被量子化,因此可以被拓展;其次,量子力學(xué)的基本規(guī)律如疊加、相干、糾纏等,對經(jīng)濟學(xué)上一些明顯的經(jīng)典而非量子的領(lǐng)域也有一定的影響。
在量子博弈論研究方面,D.A.Mayer[2]首先提出研究“PQ”問題的量子化,發(fā)現(xiàn)博弈的一方可通過采用量子策略戰(zhàn)勝他的“經(jīng)典”對手;隨后,J.Eisert等[3]提出兩人量子模型,找到一個不同于經(jīng)典博弈的納什均衡并完美解決了經(jīng)典博弈中存在的“困境”。Du J.F.等[4]還研究了三人量子囚徒困境,找到一個新的納什均衡,在此均衡下,博弈者的收益隨著糾纏度的增強而增大。此外,Chen L.K.等[5]研究了量子消相干對量子囚徒困境的影響,發(fā)現(xiàn)在引入量子噪聲后,納什均衡并不受影響,而博弈體的收益受影響。在現(xiàn)實研究中,博弈不單單涉及兩人博弈,更多的是多人博弈,所以對多人量子博弈的研究更具有實際的應(yīng)用價值。本文推廣文獻[3]兩人量子模型,討論4個企業(yè)定價的量子博弈,及量子噪聲對博弈中決策者最佳策略與收益的影響。
表1 企業(yè)A與其他3個企業(yè)的收益矩陣
假設(shè)4個企業(yè)均有2個價格策略,即競爭性低價和串謀高價。當(dāng)高價企業(yè)數(shù)量分別為0,1,2,3,4時,低價企業(yè)的收益分別為100,200,300,400,0;高價企業(yè)的收益分別為400,0,100,200,300。再以企業(yè)A為分析對象,給出其與其他3個企業(yè)的收益矩陣,具體如表1所示。其中,H0,H1,H2,H3分別表示其他3個企業(yè)采取高價的企業(yè)數(shù)量。
由表1可知:“低價”是一個嚴格優(yōu)勢策略,此經(jīng)典博弈有唯一Nash均衡。若所有企業(yè)都選擇“低價”策略,則各企業(yè)都只得到100的收益;若所有企業(yè)都選擇“高價”策略,則各企業(yè)的收益都將提高到300,情況大為改善。但是,理性思維促使企業(yè)不會這樣選擇,從而陷入兩難困境。本文將此博弈量子化,使困境得到解決。
參照兩人“囚徒困境”的量子模型[3]建立四企業(yè)“囚徒困境”的量子博弈模型(稱為模型1)如圖1所示。
圖1 四企業(yè)囚徒困境的量子化模型
圖1中,給各企業(yè)分配1個比特源,企業(yè)可局部操作自己的比特源。將經(jīng)典策略的高價和低價的可能收益分配給二維Hilbert空間的2個基|0〉和|1〉,則各企業(yè)都有2個本征態(tài)|0〉(合作)和|1〉(對抗),系統(tǒng)有16個本征態(tài)|ijkl〉,i,j,k,l∈{0,1},其中i,j,k,l分別指企業(yè)A,B,C和D的比特[3]。具體量子化過程如下:
提高收益是博弈的最終目的,根據(jù)表1可得企業(yè)A的期望收益為:
$A=300P0000+200P0001+200P0010+100P0011+200P0100+100P0101+100P0110+400P1000+
300P1001+300P1010+200P1011+300P1100+200P1101+200P1110+100P1111
(1)
當(dāng)糾纏度不再取最值時,求得系統(tǒng)存在一個閾值γth=π/6,量子博弈在不同的取值范圍內(nèi)會表現(xiàn)出不同的性質(zhì),具體如下:
在很多博弈中,量子策略總顯示出自己的獨特優(yōu)勢,其根本原因在于量子本身的糾纏性和相干性。本節(jié)討論了博弈者在最大糾纏態(tài)的情況下,量子噪聲對量子博弈產(chǎn)生的消相干現(xiàn)象是如何改變博弈結(jié)果的。
一般地,量子噪聲信道有去極化信道(Depolarizing Channel)、相位阻尼信道(Phase-damping Channel)和振幅阻尼信道(Amplitude-damping Channel)[5],對應(yīng)的超算符分別為。
帶有消相干系數(shù)的量子博弈模型(稱為模型2)如圖2所示。此型的量子化過程如下:
圖2 量子噪聲下的量子博弈模型[5]
表2 p2=1時,噪聲信道1對量子博弈收益的影響
本文以企業(yè)A的收益為例來討論噪聲信道對量子博弈收益的影響。引入2個噪聲參數(shù)p1,p2(p1,p2∈[0,1])(pi(i=1,2)值的大小反映了信道的嘈雜程度)。p2=1時,噪聲信道1對量子博弈收益的影響如表2所示。p1=1時,噪聲信道2對量子博弈收益的影響如表3所示。
表3 p1=1時,噪聲信道2對量子博弈收益的影響
表3中,F(xiàn)=sinθ1sinθ2sinθ3sinθ4,G=-sin(φ1+φ2+φ3+φ4)-2sin(φ1-φ2-φ3-φ4)+sin(φ1-φ2+φ3-φ4)-sin(φ1-φ2-φ3+φ4)。
分析表2和表3可知,量子博弈的收益只受消相干信道2的影響。因此,假設(shè)p1=p2=p∈[0,1],信道2中的噪聲參數(shù)p對量子博弈收益的影響如表4所示。
表4給出了企業(yè)A的量子策略取任意值時,以噪聲參數(shù)p為變量的收益函數(shù)圖像。當(dāng)參數(shù)p趨于1時,企業(yè)A的收益漸進值是200,與表2一致。通過研究漸進值,可發(fā)現(xiàn)第2信道似乎控制了博弈的行為。直觀地說,這種行為是合理的,因為第2個解碼信道發(fā)生在博弈者已經(jīng)做出自己的決策之后,而第1信道是在博弈者做出他們的決策之前對狀態(tài)起作用,但消相干量子博弈的總體結(jié)果仍然優(yōu)于經(jīng)典博弈。
類比文獻[4]研究的三人量子囚徒困境博弈,本文將四人經(jīng)典博弈量子化,討論了糾纏和消相干對四人量子博弈納什均衡以及收益的影響,研究結(jié)果與文獻[4]研究結(jié)果雷同。量子博弈可通過疊加、糾纏、干涉等途徑擴大博弈主體的策略空間,從而得到優(yōu)于經(jīng)典博弈的結(jié)果。因此,可以用量子博弈來分析某些特定環(huán)境下(如量子噪聲)的復(fù)雜物理系統(tǒng),也可用量子博弈手段來實現(xiàn)某些量子計算的問題。但是,本文未對四人量子博弈納什均衡的演化穩(wěn)定性進行分析,系統(tǒng)的初始狀態(tài)比較單一,有待進一步深入研究。