董玉浩,趙學(xué)軍,袁修久,賀 剛,王明芳,李嘉林
(1.空軍工程大學(xué) 研究生院, 西安 710038; 2.中國人民解放軍9272部隊, 上海 210406)
在無人機協(xié)同作戰(zhàn)的過程中,機間需要高效手段來實現(xiàn)通信,而數(shù)據(jù)鏈(Data Link)可以為這些機間通信提供技術(shù)支持,提高數(shù)據(jù)鏈網(wǎng)絡(luò)的吞吐量,優(yōu)化發(fā)射功率是主要選擇之一。
文獻[1]提出了一種新的功率控制手段,并給出了選擇信道的方法。為了可以在滿足QoS需求的同時提高網(wǎng)絡(luò)的吞吐量[2],各方面的研究都在進行,本文的研究基于功率優(yōu)化。功率優(yōu)化與節(jié)點的動態(tài)博弈緊密相關(guān),為了得出各博弈方在信干比固定時所采用的發(fā)射功率的分布情形,Stefano Buzzi等[3]定義了一個效用函數(shù),用來量化模型的優(yōu)化結(jié)果。在文獻[4-5]中,Yun Zhu等選擇適當(dāng)?shù)陌l(fā)射功率來實現(xiàn)沖突的減少和網(wǎng)絡(luò)連通性的鞏固,改進了優(yōu)化網(wǎng)絡(luò)的拓撲結(jié)構(gòu),整體增強了功率優(yōu)化的互聯(lián)和相關(guān)性。Giacomo Bacci等在文獻[6-7]中提出自適應(yīng)調(diào)整發(fā)射功率的方法實現(xiàn)吞吐量的最大化,以輕微的代價換取了算法的快速收斂。文獻[8]采用一個適當(dāng)?shù)姆椒ǜ淖兇鷥r因子的值。文獻[9]中的結(jié)論顯示,選擇合適的效用函數(shù)能使功率水平更低,同時達到更高的吞吐量。在文獻[10]中,賀剛采用組合代價函數(shù)的形式,提出了一種基于博弈論的功率控制方法,保證了無人機之間數(shù)據(jù)鏈系統(tǒng)的低截獲,并有效地提高了其抗干擾能力。
針對博弈方參與博弈進行功率更新時的次序,本文提出了基于動態(tài)博弈模型的功率控制方案,該算法在更新功率值時考慮了更新次序,以獲取的其他博弈方的當(dāng)前信息,有效提高了算法的收斂速度,有利于提高數(shù)據(jù)鏈系統(tǒng)的公平性和穩(wěn)定性。
在AWGN信道下建立無人機作戰(zhàn)編隊的信道模型,對于接收節(jié)點終端,其信干比SIR可表示為:
(1)
其中:擴頻增益G=W/Ri,W表示chip速率;Ri表示節(jié)點i的信息傳輸速率;N表示編隊中共享無線信道的節(jié)點數(shù),hi表示節(jié)點i的信道增益,pi表示節(jié)點i的發(fā)射功率水平,σ2表示AWGN信道下的接收機背景噪聲。
(2)
當(dāng)節(jié)點i的功率大于最優(yōu)功率時,可以定義懲罰函數(shù)模型如下:
(3)
其中,未施加懲罰的效用函數(shù)為
ui(p)=uiarctan(1+γi)
(4)
式中,ci(p)是代價函數(shù)或稱懲罰函數(shù)。
采用鏈路增益代價函數(shù):
ci(p)=δhipi
(5)
加入代價函數(shù)后的實際效用函數(shù)模型:
(6)
其中,δ為實比例系數(shù),該模型將會主要懲罰功率大的節(jié)點。
(7)
(8)
由式(7)與式(8)可以看出,節(jié)點i在博弈過程中每次進行信息迭代更新時,采用的信息是上一輪迭代的信息,而不是當(dāng)前最新的信息,故而最終結(jié)果不是當(dāng)前的最佳值。
為解決這個問題,必須及時更新其他節(jié)點的功率干擾信息,因此,在這里提出基于動態(tài)博弈的功率控制,當(dāng)節(jié)點更新自身功率時,可獲取其他節(jié)點對其最新的動態(tài)干擾信息,節(jié)點i第k+1次更新時掌握的動態(tài)信息可以被表示為:
(10)
(11)
由式(10)、式(11)可知,由于每個節(jié)點在更新當(dāng)前功率值時,所采用的其他節(jié)點的信息值是離當(dāng)前時間最近的干擾信息,效益函數(shù)的優(yōu)化效果更好。
完美均衡的概念在文獻[11]中被提出,根據(jù)動態(tài)博弈理論,子博弈完美納什均衡是由完美信息動態(tài)博弈得到的均衡解。子博弈指每個當(dāng)前需更新功率的節(jié)點與在它之后將更新的節(jié)點構(gòu)成的一個博弈組合。換句話說,系統(tǒng)中的N個節(jié)點構(gòu)成N個子博弈,若存在一組功率向量p′,它對每個節(jié)點構(gòu)成的子博弈都達到納什均衡,p′即為該博弈的子博弈完美納什均衡。各個子博弈采用相同的效益函數(shù)時,所對應(yīng)節(jié)點的策略空間也保持相同。
下面將通過仿真證明其具有更快的收斂速度,即在數(shù)據(jù)鏈的應(yīng)用當(dāng)中,能使戰(zhàn)機編隊的通信在更短的時間內(nèi)達到穩(wěn)定。
在動態(tài)博弈模型下,得到應(yīng)用于數(shù)據(jù)鏈系統(tǒng)的分布式功率控制算法,其流程如下:
步驟2:當(dāng)k=k+1時,每個節(jié)點依次計算兩式的值:
步驟3:判決是否終止迭代。終止的條件是p(tk)=p(tk-1),此時的發(fā)射功率為p(tk)不滿足終止條件則令k=k+1,并返回步驟2,直至滿足終止條件。
圖1 靜態(tài)博弈與動態(tài)博弈不同距離節(jié)點達到均衡時的功率曲線
圖2 靜態(tài)博弈與動態(tài)博弈功率控制收斂曲線
圖3 靜態(tài)博弈與動態(tài)博弈SIR(信干比)收斂曲線
圖1所示為不同距離的節(jié)點達到均衡時的發(fā)射功率,其中圖1 (a)為靜態(tài)博弈功率控制下用戶達到均衡時的最終發(fā)射功率,圖1 (b)為動態(tài)博弈功率控制下用戶達到均衡時的最終發(fā)射功率,由圖所示可知,兩種博弈情形的均衡狀態(tài)下,動態(tài)博弈無需犧牲發(fā)射功率。
圖2、圖3所示分別為各節(jié)點發(fā)射功率和信干比SIR(歸一化)收斂到穩(wěn)定值時的迭代次數(shù)曲線,其中圖2 (a)與圖3(a)分別為靜態(tài)博弈情形下發(fā)射功率和信干比SIR達到穩(wěn)定值時的迭代次數(shù)曲線,其中圖2 (b)與圖3(b)分別為動態(tài)博弈情形下發(fā)射功率和信干比SIR達到穩(wěn)定值時的迭代次數(shù)曲線,比較圖2、圖3所示的兩種博弈模型,兩種情況下同一個節(jié)點發(fā)射功率和信干比SIR都能收斂到同樣的均衡值,與靜態(tài)博弈相比,動態(tài)博弈中功率從初始值達到收斂需要的迭代次數(shù)明顯減少,即功率的收斂速較快,原因在于動態(tài)博弈情形下,各節(jié)點所獲得的信息是最新更新的信息,所以能更快地達到均衡點。這對于要求快速、準確的數(shù)據(jù)鏈通信系統(tǒng)而言,是非常好的解決方案。
表1列出了每個節(jié)點達到收斂需要的迭代次數(shù)。由表可知,動態(tài)博弈算法達到均衡時所需迭代次數(shù)大幅減少,如節(jié)點1、節(jié)點2、節(jié)點3靜態(tài)博弈算法下需要的次數(shù)為15次,而在動態(tài)博弈算法下只需9次,節(jié)點4、節(jié)點5降低的次數(shù)近1/2,所有節(jié)點的平均迭代次數(shù)除低了42.5%。由此可知,動態(tài)博弈算法可以大幅度改善功率控制的收斂性能。
表1 動態(tài)博弈與靜態(tài)博弈模型性能對比
針對CDMA通信系統(tǒng)的功率控制問題,本研究在靜態(tài)博弈功率控制模型的基礎(chǔ)上,引入動態(tài)博弈,讓每個參與博弈的通信節(jié)點獲取最新的信息,使各節(jié)點更加理性。通過理論分析和仿真對比都表明,在不犧牲其他性能的情況下,基于動態(tài)博弈的功率控制算法比靜態(tài)博弈功率控制算法的平均收斂速度提升了42.5%,這對于要求快速、準確的數(shù)據(jù)鏈通信系統(tǒng)有一定的價值。