魏 鵬,王世練,陸銳敏,駱俊杉
(1. 國(guó)防科技大學(xué) 第六十三研究所, 江蘇 南京 210007; 2. 國(guó)防科技大學(xué) 電子科學(xué)學(xué)院, 湖南 長(zhǎng)沙 410073)
隨著人工智能的飛速發(fā)展和軟件無線電能力的不斷提升,無線通信面臨的智能化干擾威脅越來越嚴(yán)重。傳統(tǒng)以寬帶高速跳頻和非協(xié)調(diào)跳頻等擴(kuò)頻技術(shù)為主的抗干擾通信技術(shù),每次只使用一個(gè)信道,頻譜利用率低[1],且難以有效應(yīng)對(duì)跟蹤干擾和超出擴(kuò)頻增益的寬帶干擾。如何在干擾條件下通過功率控制提升通信系統(tǒng)效能,一直是通信領(lǐng)域關(guān)注的重要方面,特別是在通信對(duì)抗雙方日益智能化的條件下,通過博弈論來解決雙方的最優(yōu)功率分配問題得到越來越多的研究。根據(jù)通信對(duì)抗雙方可用信道數(shù),基于功率分配的對(duì)抗博弈可分為單信道模型和多信道模型。對(duì)通信方而言,可用信道數(shù)定義為一次通信過程中用戶不受其他用戶干擾而獨(dú)占的頻分信道數(shù),可以由連續(xù)或不連續(xù)的多個(gè)頻段組成;對(duì)干擾方而言,可用信道數(shù)定義為一次干擾過程中可不受限制自由干擾的信道數(shù),通常與通信方可用信道一致。
單信道模型的功率分配通常為對(duì)抗雙方引入功率開銷代價(jià),以最大化、最小化通信容量或信噪比為目標(biāo),將對(duì)抗雙方建模為非合作博弈[2-5]、二人零和博弈[6]、Stackelberg博弈[7-8]等,然后求解博弈的納什均衡[2-5,9]或Stackelberg均衡[8]。在存在用戶間互干擾的情況下,也可能進(jìn)一步追求帕累托最優(yōu)[10]。對(duì)模型中存在的某些未知參數(shù),通常使用Q-Learning[6]等強(qiáng)化學(xué)習(xí)算法獲取。其中,文獻(xiàn)[2]將無線網(wǎng)絡(luò)中的功率控制問題建模為一個(gè)廣義非合作博弈,聯(lián)合優(yōu)化無線網(wǎng)絡(luò)中的能效和延時(shí),分別提出了分布式和集中式功率控制算法,并采用最大塊改進(jìn)方法解決了非凸集中功率控制問題,保證了功率控制算法收斂到較好的候選解,且復(fù)雜度適中。文獻(xiàn)[3]將分布式無線傳感器網(wǎng)絡(luò)中的傳感器功率分配建模為非合作博弈,提出了一種非協(xié)作功率控制算法,使節(jié)點(diǎn)能夠快速收斂到使網(wǎng)絡(luò)性能穩(wěn)定的納什均衡點(diǎn)。文獻(xiàn)[4]將認(rèn)知無線電中的功率控制問題建模為非合作功率控制博弈,提出了一種自適應(yīng)非合作功率控制算法,證明了該算法存在唯一納什均衡,并且能夠降低功耗,克服遠(yuǎn)近距離效應(yīng)。文獻(xiàn)[5]考慮干擾溫度,將認(rèn)知傳感器網(wǎng)絡(luò)中的節(jié)能功率分配問題描述為非合作耦合約束博弈,設(shè)計(jì)了基于效率的集中式和分布式功率分配算法并得到納什均衡,具有良好的能量效率、收斂速度和公平性。文獻(xiàn)[6]將認(rèn)知無線電與干擾機(jī)之間的功率分配交互建模為二人零和博弈,提出了一種基于Q-Learning的多通道功率分配算法,該算法在固定干擾策略下,學(xué)習(xí)解與平坦衰落信道下常見的顯式注水解相等,選擇性信道下略有不同;在智能干擾策略下,學(xué)習(xí)到的策略幾乎等于完全信息博弈的均衡策略。文獻(xiàn)[7]將DoS攻擊下無線通信網(wǎng)絡(luò)的最優(yōu)功率調(diào)度問題建模為不完全信息Stackelberg博弈,將自適應(yīng)懲罰函數(shù)方法和微分進(jìn)化算法相結(jié)合,處理相應(yīng)的非線性和非凸優(yōu)化問題。文獻(xiàn)[8]將智能干擾機(jī)存在下的單通道功率控制抗干擾建模為Stackelberg博弈,給出了Stackelberg均衡策略的閉式表達(dá)式,證明了Stackelberg均衡的存在性和唯一性。文獻(xiàn)[9]分別采用非合作純策略博弈和混合策略博弈對(duì)蜂窩網(wǎng)絡(luò)中設(shè)備間功率控制問題進(jìn)行了研究和探討,針對(duì)每一種博弈,導(dǎo)出了功率受限的納什均衡封閉表達(dá)式,并研究了納什均衡的存在性和唯一性。文獻(xiàn)[10]研究了多用戶中繼網(wǎng)絡(luò)單流傳輸(single-stream transmission)中的功率分配問題,采用可行點(diǎn)跟蹤逐次凸逼近和多目標(biāo)分析方法來計(jì)算一組近似帕累托最優(yōu)的信噪比,仿真結(jié)果證明提出的算法優(yōu)于比較方案。
多信道模型的功率分配根據(jù)優(yōu)化目標(biāo)不同,求解方法差異很大。當(dāng)優(yōu)化目標(biāo)為通信容量時(shí),文獻(xiàn)[8]引入了功率開銷代價(jià),證明了Stackelberg均衡的存在性,設(shè)計(jì)了計(jì)算干擾機(jī)的最佳響應(yīng)策略和用戶近似最優(yōu)策略的算法。文獻(xiàn)[11]證明了在白噪聲信道下,通信對(duì)抗雙方的納什均衡策略是雙方均在所有可用信道上平均分配功率,而在頻率選擇性衰落信道下,通信對(duì)抗雙方的納什均衡策略可用迭代注水算法求解。文獻(xiàn)[12]以信干噪比(signal to interference plus noise ratio,SINR)作為優(yōu)化目標(biāo),將中繼網(wǎng)絡(luò)多個(gè)合法中繼節(jié)點(diǎn)與智能干擾器之間的功率對(duì)抗過程建模為一個(gè)兩層Stackelberg博弈,分別研究干擾者與合法節(jié)點(diǎn)之間的敵對(duì)關(guān)系及合法節(jié)點(diǎn)之間的協(xié)作關(guān)系,并求得了Stackelberg均衡。這種以通信容量或SINR為優(yōu)化目標(biāo)的多信道功率分配方法雖然有完備的理論支撐,但在實(shí)際通信系統(tǒng)中并不適用。因?yàn)閷?shí)際通信系統(tǒng)均以特定的速率傳輸信息,當(dāng)接收信號(hào)不低于解調(diào)門限時(shí),一包數(shù)據(jù)接收成功;反之,該包數(shù)據(jù)接收失敗。而當(dāng)SINR達(dá)到解調(diào)門限后,更大的通信功率并不能進(jìn)一步提高通信容量。因此,通信對(duì)抗雙方最大化或最小化的目標(biāo)應(yīng)為傳輸成功的信道數(shù)。這種以特定通信速率下傳輸成功的信道數(shù)為優(yōu)化目標(biāo)的多信道功率分配方法通常建模為Colonel Blotto博弈[13-15]。其中,文獻(xiàn)[13]研究了認(rèn)知無線電網(wǎng)絡(luò)中的次級(jí)用戶與攻擊者之間的博弈,在次級(jí)用戶與攻擊者均可以訪問多個(gè)信道場(chǎng)景下,將次級(jí)用戶與攻擊者之間的功率分配問題建模為Colonel Blotto博弈,通過構(gòu)造一種匹配期望邊際分布且滿足總功率約束的聯(lián)合分布,最終獲得了納什均衡策略,以最小化通信方最壞情況下的損失,但如何找到由聯(lián)合概率分布確定的納什均衡策略仍然是一個(gè)難題。文獻(xiàn)[14]提出了一種基于Blotto博弈的多維拍賣子載波分配方案,主要用以解決兼顧效率和公平的多載波分配問題,其效用函數(shù)是加權(quán)的香農(nóng)容量公式。文獻(xiàn)[15]將認(rèn)知無線電中二級(jí)用戶與干擾者之間的多信道功率分配問題建模為雙人Blotto博弈,并采用迭代納什議價(jià)解對(duì)模型求解,其效用函數(shù)是信干噪比的偏置加權(quán),等效于以通信容量為優(yōu)化目標(biāo)。
綜上所述,單信道功率博弈問題和以通信容量為優(yōu)化目標(biāo)的多信道功率博弈問題已經(jīng)得到了很好的解決,而以特定速率下傳輸成功的信道數(shù)為優(yōu)化目標(biāo)的多信道功率分配博弈仍有待深入研究。此外,隨著通信對(duì)抗雙方信號(hào)處理能力的提升,同時(shí)處理多個(gè)信道將變得越來越容易。通信方通過在多個(gè)信道上以某種優(yōu)化策略分配通信功率,可作為一種智能抗干擾手段,在智能干擾條件下最大化通信方收益。
本文以文獻(xiàn)[13]的多信道功率分配模型為基礎(chǔ),結(jié)合實(shí)際系統(tǒng)中數(shù)字化功率控制特點(diǎn),針對(duì)非對(duì)稱Colonel Blotto博弈模型以及該模型下的多信道功率分配抗干擾問題,首先建立了一種非對(duì)稱Colonel Blotto博弈模型,將Colonel Blotto博弈應(yīng)用范圍推廣至戰(zhàn)場(chǎng)對(duì)博弈雙方不公平的場(chǎng)景;然后基于所提模型,針對(duì)通信對(duì)抗雙方數(shù)字化功率控制場(chǎng)景,提出了通信對(duì)抗雙方不同功率約束下的最優(yōu)混合策略及納什均衡相關(guān)定理,并通過求解等效單信道最優(yōu)功率分配策略進(jìn)行了證明;最后基于等效單信道最優(yōu)功率分布,設(shè)計(jì)了一種線性規(guī)劃方法求解多信道混合功率分配矩陣,并針對(duì)該方法難以適應(yīng)較多信道數(shù)和較廣功率分布范圍的不足,提出了一種多重掃描直接列元素交換算法,可快速構(gòu)建多信道混合功率分配矩陣,并且具有更廣的適用范圍。
Colonel Blotto博弈是一種二人零和博弈,又稱Divide Dollar博弈,博弈雙方分別記為B(Blotto)和E(Enemy)。博弈的規(guī)則為B和E在K個(gè)獨(dú)立的戰(zhàn)場(chǎng)上同時(shí)分配各自有限的兵力,但均不知道對(duì)手某一次的具體分配策略。若一方在某戰(zhàn)場(chǎng)上分配了比對(duì)方更多的兵力,則在該戰(zhàn)場(chǎng)上獲勝,收益記為1。博弈的收益為贏得戰(zhàn)場(chǎng)的總數(shù),贏得大部分戰(zhàn)場(chǎng)的一方最終獲勝[16]。
(1)
sign(z)表示取z的符號(hào),即
(2)
對(duì)該博弈問題的大量深入研究[16-20]表明,該博弈不存在純策略納什均衡,因此重點(diǎn)研究在各種約束下的混合策略納什均衡。其中,與本文研究最相關(guān)的是文獻(xiàn)[17]所做的工作。該文獻(xiàn)首先將Colonel Blotto博弈等價(jià)為General Lotto博弈,即在單個(gè)戰(zhàn)場(chǎng)上滿足平均兵力約束的博弈,然后將其結(jié)果推廣至K個(gè)戰(zhàn)場(chǎng)完成Colonel Blotto博弈。遺憾的是,雖然General Lotto博弈得到完美的解決,但將其結(jié)果推廣至K個(gè)戰(zhàn)場(chǎng)時(shí),并不總是存在可行解,因此并沒有完全解決Colonel Blotto博弈問題。
受該文獻(xiàn)思路的啟發(fā),本文提出了一種非對(duì)稱Colonel Blotto博弈,用于解決數(shù)字化功率控制條件下通信對(duì)抗雙方的多信道功率分配問題。不同于傳統(tǒng)Colonel Blotto博弈中每個(gè)戰(zhàn)場(chǎng)對(duì)博弈雙方公平的假設(shè),多信道功率分配博弈中,干擾方在每個(gè)信道上都有噪聲進(jìn)一步加強(qiáng)其干擾效果,這可等效為Colonel Blotto博弈中每個(gè)戰(zhàn)場(chǎng)對(duì)博弈對(duì)抗雙方不公平,也即一方占有主場(chǎng)優(yōu)勢(shì),能夠以相同或更少的兵力獲勝。
圖1 多信道功率分配示意圖Fig.1 Diagram of multi-channel power allocation
需要說明的是,即使通信方具有更小的功率分配粒度,也不能進(jìn)一步增加其收益。因?yàn)楫?dāng)SINR等于門限τ時(shí),通信成功,高于門限的功率不能帶來額外的收益;同理,當(dāng)S不能夠被τd整除時(shí),剩余不足τd的功率增加到任一信道上均不能改變對(duì)應(yīng)信道上的收益。因而假定通信方總功率控制精度為τd,且總功率S能夠被τd整除對(duì)通信方來說是最優(yōu)的。此外,若干擾方能夠進(jìn)一步細(xì)化功率分配粒度d,使得通信方功率分配粒度達(dá)不到τd,則在某些干擾功率下,通信方無法使SINR等于門限τ,因此,通信方為正確接收數(shù)據(jù),需付出比達(dá)到解調(diào)門限所需功率更大的功率代價(jià),也即提升了干擾方收益。本文暫不考慮這種情況,均假定通信方具有較強(qiáng)的功率控制能力,使功率分配粒度達(dá)到τd。
(3)
其中,gte(z)表示判斷z是否大于等于0,即
(4)
將式(1)~(4)給出的Colonel Blotto博弈模型進(jìn)行對(duì)比,可見,因受白噪聲影響,信道對(duì)通信對(duì)抗雙方不再公平,即非對(duì)稱。相比于Colonel Blotto博弈模型戰(zhàn)場(chǎng)對(duì)博弈雙方公平的假設(shè),本文所提非對(duì)稱Colonel Blotto博弈模型具有更廣的適用范圍,不僅適用于多信道功率分配,同樣也可應(yīng)用于非對(duì)稱戰(zhàn)場(chǎng)兵力分配。例如,當(dāng)作戰(zhàn)雙方B和E中的某一方通過修筑防御工事或可更充分利用地形而占據(jù)主場(chǎng)優(yōu)勢(shì)時(shí),戰(zhàn)場(chǎng)對(duì)雙方不再對(duì)稱,占據(jù)主場(chǎng)優(yōu)勢(shì)的一方能以相同或更少的兵力獲勝。
定義1通信方全信道功率均勻分布。若通信方同時(shí)有K個(gè)信道可用,第k信道上的功率分配服從u至2m-u之間的均勻分布,且任一純策略i在K個(gè)信道上分配的功率滿足總功率約束,即
則稱之為通信方全信道功率均勻分布策略。 其中,u=「n0?為受功率分配粒度τd約束的大于等于歸一化白噪聲n0的最小整數(shù),「·?表示上取整。
則稱之為通信方以ΓS(ΓS>2m-u)為上限的部分信道功率均勻分布策略。 其中,O表示功率為0的集合。
定義3干擾方全信道功率均勻分布。 若干擾方可同時(shí)干擾K個(gè)信道,在第k個(gè)信道上分配的功率服從0至2n之間的均勻分布,且任一純策略j在K個(gè)信道功率之和滿足總功率約束,即
則稱之為干擾方全信道功率均勻分布策略。
則稱之為干擾方以ΦJ(ΦJ>2n)為上限的部分信道功率均勻分布。
假定通信對(duì)抗雙方均能根據(jù)對(duì)方的混合策略分布,選擇己方的最優(yōu)功率分布策略,則根據(jù)上述定義,提出如下通信對(duì)抗雙方多信道最優(yōu)功率分配策略相關(guān)定理。
推論1干擾方的最優(yōu)功率分配策略一定是以Φ(Φ>2n)為上限的部分信道功率分配策略。
對(duì)上述定理的證明利用了文獻(xiàn)[17]的結(jié)論,即Colonel Blotto博弈具有與General Lotto博弈相同的值(value),然后取消K個(gè)戰(zhàn)場(chǎng)的限制將其等效為單個(gè)戰(zhàn)場(chǎng)的General Lotto博弈。結(jié)合本文多信道功率分配模型,可等效為通信方和干擾方在單個(gè)信道上滿足平均功率約束的功率分配博弈,即任意第k信道服從的最優(yōu)功率分布一致,期望收益均等于K信道Colonel Blotto博弈的期望收益。對(duì)該等效的合理性可直觀理解為:既然在每個(gè)無差別信道上的功率分配都是最優(yōu)的,則在所有信道上必然也是最優(yōu)的。于是,從通信方角度出發(fā),通信方收益可表示為:
RS(X,Y)=RS(xk,yk)
=P(xk≥yk+u)-P(xk (5) (6) 設(shè)通信方在第k個(gè)信道上分配的最大功率值為Γ。當(dāng)?!?m-u時(shí),滿足平均功率約束的通信方全信道功率均勻分配策略為xk=[2m-Γ,2m-Γ+1,…,Γ]。根據(jù)式(5),最壞情況下(因?yàn)楦蓴_方可根據(jù)通信方混合策略分布選擇使通信方收益最小的功率分配策略),通信方在第k個(gè)信道上的收益為: (7) (8) 綜合式(7)和式(8)可得通信方收益隨Γ變化的函數(shù)為: (9) 式中,當(dāng)Γ≤2m-u時(shí),通信方收益RS(xk,yk)隨Γ增加而單調(diào)遞增,因此通信方應(yīng)使Γ=2m-u,即通信方全信道功率分配策略是通信方最優(yōu)功率分配策略;當(dāng)Γ>2m-u時(shí),RS(xk,yk)對(duì)Γ求導(dǎo)可得: (10) 此結(jié)果證明了定理1和定理2中通信方的最優(yōu)功率分配策略。 (11) (12) 式中,通信方可通過調(diào)整自身功率分配使ΓS≤Φ+u,使得等號(hào)成立。 綜合式(11)、式(12)可得 RJ(xk,yk) (13) 當(dāng)Φ>2n時(shí),RJ(xk,yk)對(duì)Φ求導(dǎo)可得: (14) 上述結(jié)果證明了定理1和定理2中干擾方最優(yōu)功率分配策略,以及推論1。 圖 2給出了分別與式(9)、式(13)對(duì)應(yīng)的通信對(duì)抗雙方的收益變化曲線,兩個(gè)橫軸Γ和Φ分別表示通信方、干擾方的最大功率分布值,對(duì)應(yīng)式(9)、式(13)中的自變量??v軸對(duì)應(yīng)式(5)和式(6)給出的從通信方角度和干擾方角度得到的通信方收益RS(xk,yk)和RJ(xk,yk)。可見通信方在Γ=ΓS=2m-u=14處使收益取得了極大值0.384 6,干擾方在Φ=ΦJ=2m-2u=12和Φ=ΦJ=2m-2u+1=13處使通信方收益取得極小值0.384 6,也即通信方對(duì)抗雙方達(dá)到了納什均衡,且納什均衡收益為0.384 6。 圖2 通信方收益隨通信方、干擾方功率分布變化曲線1Fig.2 Payoff curve 1 of the communication system with the power distribution 圖3 通信方收益隨通信方、干擾方功率分布變化曲線2Fig.3 Payoff curve 2 of the communication system with the power distribution 由圖 2、圖 3納什均衡點(diǎn)對(duì)應(yīng)的通信對(duì)抗雙方的歸一化功率分布,可方便地得到實(shí)際功率分布,而由納什均衡收益和信道數(shù)K容易求出可成功通信的信道數(shù)Ksuc,如式(15)所示。 (15) 另外還有兩點(diǎn)需要說明:首先,上述納什均衡點(diǎn)及其收益都是在通信方與干擾方均勻分布其功率的條件下求得的。事實(shí)上,若某一方不服從均勻分布,而更加偏好某些策略,則其對(duì)手總可以找到針對(duì)性策略,使得通信收益高于或低于納什均衡收益,后續(xù)的數(shù)值仿真結(jié)果也驗(yàn)證了這一點(diǎn)。其次,上述納什均衡是基于完全信息條件推導(dǎo)的,即對(duì)抗雙方均已知對(duì)方總功率、功率分配粒度、可用信道數(shù)及通信方正確接收一包數(shù)據(jù)所需的門限信干噪比。實(shí)際應(yīng)用過程中,干擾方可通過前期偵察獲得所需的通信方參數(shù),通信方也可通過干擾認(rèn)知學(xué)習(xí)到所需的干擾方參數(shù)。 上述通信對(duì)抗雙方最優(yōu)功率分配策略及納什均衡的求解是通過將K個(gè)信道上的功率分配博弈等效到單個(gè)信道上滿足平均功率約束的功率分布求得的,而將求得的單個(gè)信道上的功率分布推廣到K個(gè)信道,構(gòu)建滿足總功率約束的K信道混合策略功率分配矩陣,仍然是一項(xiàng)困難的任務(wù)。本文首先提出一種線性規(guī)劃求解方法,可以對(duì)信道數(shù)少、功率分布范圍小的混合策略功率分配矩陣進(jìn)行快速構(gòu)建。但當(dāng)信道數(shù)較多或功率分布范圍較大時(shí),則求解速度過慢,甚至得不到可行解。為此,提出了一種多重掃描直接列元素交換算法,可以快速構(gòu)造功率分布范圍較大的K信道混合策略功率分配矩陣。以通信方K信道混合策略功率分配矩陣的構(gòu)建為例介紹兩種方法。 (16) (17) 其中,Pk為L(zhǎng)×L行置換矩陣,其元素為pk(i,j),k∈{1,2,…,K},Pk的每行每列只有一個(gè)元素為1,其余元素均為0,A為通信方歸一化總功率。 則X中各列元素的調(diào)整可通過求解K個(gè)列置換矩陣Pk實(shí)現(xiàn),而Pk的求解可轉(zhuǎn)化為標(biāo)準(zhǔn)的線性規(guī)劃模型,具體步驟如下: 步驟2:確定約束矩陣方程CV=b。 約束矩陣方程由式(17)中的3個(gè)等式約束轉(zhuǎn)換得到,C矩陣共(2K+1)L行、KL2列,滿足 (18) 步驟4:求解整數(shù)線性規(guī)劃。 綜合步驟1~3,該線性規(guī)劃問題的標(biāo)準(zhǔn)表達(dá)式如下: (19) 任意滿足式(19)約束的整數(shù)解均能使優(yōu)化目標(biāo)f達(dá)到其極小值KL,該解可通過MATLAB、LINGO等工具軟件中的線性規(guī)劃工具箱求得。 步驟5:構(gòu)建K信道混合策略功率分配矩陣。求得未知向量V后將其等分為K個(gè)列向量,并分別轉(zhuǎn)換回Pk,即 Pk=reshape([v(k-1)KL+1,v(k-1)KL+2,…,vkKL],K,L) 最后,再利用式(16)求得X*。 使用該線性規(guī)劃方法構(gòu)造K信道混合策略功率分配矩陣所求解的未知數(shù)為KL2個(gè),當(dāng)KL2較小時(shí)(KL2<1 000),使用MATLAB可快速求解;但當(dāng)KL2較大時(shí),求解該線性規(guī)劃耗時(shí)急劇增加,甚至難以找到可行解。 針對(duì)線性規(guī)劃方法的不足,提出了多重掃描直接列元素交換算法來構(gòu)造混合策略功率分配矩陣,算法流程如圖4所示。 圖4 多重掃描直接列元素交換算法流程Fig.4 Flowchart of the Multi-scan direct column element exchange algorithm 算法1中,row(Fr)表示矩陣Fr的行數(shù),length(chx_n)表示向量chx_n的元素個(gè)數(shù),find(X(Fr,k)==X(Fr(i),k)-sum(X(Fr(i),:)-A))為在Fr中所有不滿足功率約束的行的第k列尋找能夠使第i行之和為A的元素,并記其集合為向量chx_n,chx_n(randi(length(chx_n)))為在向量chx_n中隨機(jī)選擇一個(gè)元素,exchange(X(i,k),X(j,k))表示將矩陣X中第i行k列的元素與第j行k列的元素互換位置,rem(i,length(Fr))表示i對(duì)向量Fr的長(zhǎng)度求余。 算法1 多重掃描直接列元素交換算法Alg.1 Multi-scan direct column element exchange algorithm 算法1(續(xù)) 使用算法1,可根據(jù)單信道功率分布快速構(gòu)建通信對(duì)抗雙方的功率分配矩陣,對(duì)于本文用于數(shù)值試驗(yàn)的4信道、每信道78種分布的功率分布矩陣構(gòu)造,多數(shù)情況下在20次循環(huán)內(nèi)可完成,耗時(shí)僅需數(shù)秒。而用線性規(guī)劃方法,運(yùn)行1 h以上仍得不到可行解。 選擇2組參數(shù)對(duì)所提定理進(jìn)行仿真驗(yàn)證,2組參數(shù)分別對(duì)應(yīng)定理1和定理2所提的2種功率分布,且與圖2、圖 3所用參數(shù)保持一致。 圖5 第1組參數(shù)下通信方最優(yōu)混合策略功率分配矩陣Fig.5 Optimal mixed strategy power allocation matrix of the communication system under the first set of parameters 圖6 第2組參數(shù)下干擾方最優(yōu)混合策略功率分配矩陣Fig.6 Optimal mixed strategy power allocation matrix of the jammer under the second set of parameters 圖7 第1組參數(shù)下各種策略組合的通信方收益Fig.7 Payoff of the communication system with various strategies combinations under the first set of parameters 圖8 第2組參數(shù)下通信方最優(yōu)混合策略功率分配矩陣Fig.8 Optimal mixed strategy power allocation matrix of the communication system under the second set of parameters 圖10 第2組參數(shù)下各種策略組合的通信方收益Fig.10 Payoff of the communication system with various strategies combinations under the second set of parameters 圖11 第2組參數(shù)下通信方或干擾方純策略與對(duì)方最優(yōu)混合策略組合下的通信方收益Fig.11 Payoff of the communication system with the combinations of a pure strategy and the optimal mixed strategy of the opponent under the second set of parameters 本文提出一種非對(duì)稱Colonel Blotto博弈并將其應(yīng)用于通信對(duì)抗雙方多信道功率分配博弈,推導(dǎo)出了不同功率約束下通信對(duì)抗雙方的最優(yōu)功率分配策略,并證明了混合策略均衡的存在性和唯一性。提出了基于多重掃描直接列元素交換算法,使得通信對(duì)抗雙方可根據(jù)各自等效單信道最優(yōu)功率分布構(gòu)建多信道混合策略功率分配矩陣。最后仿真驗(yàn)證了所提理論的正確性及算法的有效性。不足之處在于,本文僅考慮了通信對(duì)抗雙方總功率均能夠被信道數(shù)整除的情況,且信道均為一致的白噪聲信道。因此,進(jìn)一步研究方向包括通信對(duì)抗雙方總功率不能被信道數(shù)整除以及各信道狀態(tài)不一致時(shí)的功率分配博弈。這些條件下,博弈模型的建立和求解將變得更加困難,因而擬采用對(duì)抗學(xué)習(xí)的方法來解決該問題。2.2 通信方最優(yōu)策略證明
2.3 干擾方最優(yōu)策略證明
2.4 納什均衡策略證明
3 混合策略功率分配矩陣的構(gòu)造
3.1 線性規(guī)劃方法
3.2 多重掃描直接列元素交換算法
4 數(shù)值仿真驗(yàn)證
4.1 第1組參數(shù)仿真驗(yàn)證結(jié)果
4.2 第2組參數(shù)仿真驗(yàn)證結(jié)果
5 結(jié)論