崔方宇,蔡云龍,趙民建
(浙江大學(xué)信息與電子工程學(xué)院,浙江 杭州 310027)
由于無(wú)人機(jī)的靈活、可移動(dòng)和低成本的特性,無(wú)人機(jī)通信系統(tǒng)得到廣泛關(guān)注[1]。無(wú)人機(jī)在通信系統(tǒng)中可作為基站來(lái)服務(wù)地面用戶。起初,研究者們將無(wú)人機(jī)用作可靈活部署的準(zhǔn)靜態(tài)基站或中繼,通過(guò)優(yōu)化其高度和位置,以有限的無(wú)人機(jī)覆蓋最多的用戶[2]。而移動(dòng)無(wú)人機(jī)網(wǎng)絡(luò)則是利用無(wú)人機(jī)的可移動(dòng)性,將其視為移動(dòng)的基站。這樣一來(lái),無(wú)人機(jī)的移動(dòng)軌跡也可被當(dāng)作一個(gè)新的維度來(lái)優(yōu)化系統(tǒng)性能[3]。為了進(jìn)一步提高無(wú)人機(jī)通信系統(tǒng)的傳輸速率,研究者們開(kāi)始嘗試將非正交多址接入技術(shù)(Non-Orthogonal Multiple Access, NOMA)應(yīng)用于其中[4-7]。然而,這方面的研究仍以靜態(tài)或固定軌跡的無(wú)人機(jī)通信系統(tǒng)為主[6-7]。主要原因在于,在NOMA中串行干擾消除(Successive Interference Cancellation, SIC)檢測(cè)順序是由信道增益大小決定的[4-5],而在移動(dòng)無(wú)人機(jī)網(wǎng)絡(luò)中,信道增益隨著無(wú)人機(jī)的移動(dòng)而改變。這樣一來(lái),無(wú)人機(jī)軌跡會(huì)和信號(hào)檢測(cè)順序相耦合,使得優(yōu)化問(wèn)題更加復(fù)雜。針對(duì)這個(gè)問(wèn)題,本文首先建模并描述基于NOMA的移動(dòng)無(wú)人機(jī)系統(tǒng)的軌跡與功率聯(lián)合優(yōu)化問(wèn)題,即在無(wú)人機(jī)的起點(diǎn)與終點(diǎn)、飛行時(shí)間、飛行速度和發(fā)送功率等約束的情況下,通過(guò)對(duì)無(wú)人機(jī)的飛行軌跡與功率分配進(jìn)行聯(lián)合優(yōu)化,最大化用戶的最小可達(dá)平均速率。為了求解這個(gè)非凸的問(wèn)題,本文將其等價(jià)轉(zhuǎn)化為一個(gè)符合懲罰對(duì)偶分解(Penalty Dual Decomposition, PDD)算法框架[8]的形式,然后提出一種基于PDD的雙層迭代算法,以求得優(yōu)化問(wèn)題的一個(gè)穩(wěn)態(tài)解。
圖1 基于NOMA的移動(dòng)無(wú)人機(jī)通信系統(tǒng)
假設(shè)下行移動(dòng)無(wú)人機(jī)通信網(wǎng)絡(luò)如圖1所示,用1個(gè)無(wú)人機(jī)作為空中基站服務(wù)K個(gè)地面用戶。該無(wú)人機(jī)花費(fèi)時(shí)間T從起始位置q0飛行到終點(diǎn)位置qT,且其與地面的距離固定為dh。由于無(wú)人機(jī)在飛行一段時(shí)間后需要到固定站點(diǎn)進(jìn)行充能補(bǔ)給,因此,假設(shè)無(wú)人機(jī)的起始位置與終點(diǎn)位置是固定的。無(wú)人機(jī)的最大飛行速度為Vmax。所有的用戶利用同樣的頻帶進(jìn)行信號(hào)傳輸,無(wú)人機(jī)利用NOMA技術(shù)對(duì)這些用戶進(jìn)行功率域上的復(fù)用。接收端使用SIC技術(shù)進(jìn)行多用戶信號(hào)檢測(cè),且SIC隨信道增益升序進(jìn)行。
將用戶k的水平坐標(biāo)表示為wk∈R2,k∈K{1,…,K},移動(dòng)無(wú)人機(jī)基站的時(shí)變的水平坐標(biāo)表示為q(t)∈R2,0≤t≤T。為了使問(wèn)題更容易處理,將飛行時(shí)間T離散成N個(gè)時(shí)隙,則無(wú)人機(jī)的飛行軌跡坐標(biāo)可表示為q(n)∈R2,n∈N{1,…,N}。此外,軌跡坐標(biāo)點(diǎn)還需要滿足由最大飛行速度、起始位置和終點(diǎn)位置決定的約束條件:
(1)
q(1)=q0,q(N)=qT
(2)
式中,δt表示時(shí)隙長(zhǎng)度。時(shí)隙長(zhǎng)度δt需要足夠小,使得在每個(gè)時(shí)隙中無(wú)人機(jī)的位置近似不變。另一方面,為了避免復(fù)雜度大幅提升,δt也不能過(guò)小。在時(shí)隙n中,無(wú)人機(jī)與用戶k的距離表示為:
(3)
由于空中沒(méi)有障礙物,故假設(shè)無(wú)人機(jī)與用戶間的鏈路以視距傳輸為主。這樣一來(lái),信道增益遵循自由空間模型,僅由無(wú)人機(jī)與用戶間的距離決定。假設(shè)路徑損耗的指數(shù)因子為2,則在時(shí)隙n中,用戶k的信道增益表示為:
(4)
式中,ρ0表示在1 m的參考距離下信道的功率增益。
在進(jìn)行多用戶信號(hào)檢測(cè)時(shí),SIC是隨信道增益升序進(jìn)行的。信道增益高(距離無(wú)人機(jī)近)的用戶信號(hào)會(huì)干擾信道增益低(距離無(wú)人機(jī)遠(yuǎn))的用戶信號(hào)。因此,引入二進(jìn)制輔助變量βk,l(n)∈{0,1}來(lái)表示用戶k和l的相對(duì)遠(yuǎn)近。若用戶k與無(wú)人機(jī)的距離相較于用戶l更遠(yuǎn),則βk,l(n)=1,否則βk,l(n)=0。然后,用戶k在時(shí)隙n的信干噪比(Signal-to-Interference-plus-Noise power ratio, SINR)表示為:
(5)
式中,Pk(n)表示在時(shí)隙n中分配給用戶k的下行發(fā)送功率,并且需要滿足以下約束:
(6)
本文設(shè)計(jì)的目標(biāo)是通過(guò)聯(lián)合優(yōu)化無(wú)人機(jī)飛行軌跡{q(n)}與功率分配{Pk(n)},來(lái)最大化所有用戶中的最小可達(dá)平均速率。這個(gè)優(yōu)化問(wèn)題可以描述為:
(7)
(8)
βk,l(n)+βl,k(n)=1,?n,k,l
(9)
式(1),(2),(6)
(10)
(11)
(12)
則原問(wèn)題(7)可以轉(zhuǎn)化為
(13)
(14)
(15)
γk(n)≥θk(n),?n,k
(16)
式(1),(2),(6),(8),(9)
(17)
πk(n)θk(n)≤ρ0Pk(n),?n,k
(18)
(19)
(20)
(21)
(22)
(23)
綜合以上轉(zhuǎn)化,把復(fù)雜的原問(wèn)題(7)等價(jià)轉(zhuǎn)化為
(24)
s.t. 式(1),(2),(6),(9),(14),(15),(18)—(23)
(25)
2.2.1 增廣拉格朗日問(wèn)題
在PDD算法框架中,等式約束作為增廣拉格朗日項(xiàng)添加到目標(biāo)函數(shù)中,得到對(duì)應(yīng)的增廣拉格朗日問(wèn)題,然后再進(jìn)行求解。問(wèn)題(24)的增廣拉格朗日問(wèn)題表示如下:
(26)
s.t. 式(1),(2),(6),(14),(15),(18),(19),(22),(23)
(27)
0≤βk,l(n)≤1,?n,k,l
(28)
其中約束(28)的引入可以加快收斂速度且不影響問(wèn)題的最優(yōu)解。
2.2.2 非凸約束的近似
由于約束(18)、(19)和(23)非凸,問(wèn)題(26)難以直接求解。然而,根據(jù)凹凸過(guò)程(Concave-convex Procedure, CCCP)理論[9],在每一次內(nèi)循環(huán),可以利用一階泰勒展開(kāi)對(duì)這些非凸約束進(jìn)行近似。以約束(18)為例,首先將其改寫(xiě)為如下凸減凸的形式:
(29)
利用一階泰勒展開(kāi)對(duì)減去的凸函數(shù)進(jìn)行線性化,得到如下凸約束:
(30)
(31)
采用同樣的步驟,將非凸約束(19)和(23)分別近似為以下凸約束:
(32)
(33)
(34)
綜上,在第i+1次內(nèi)層迭代,問(wèn)題(26)可以近似為
(35)
s.t. 式(1),(2),(6),(14),(15),(28),(31)—(34)
(36)
2.2.3 內(nèi)循環(huán)算法
(37)
(38)
s.t. 式(1),(2),(6),(14),(15),(28),(31)—(34)
(39)
綜上,內(nèi)循環(huán)算法即迭代執(zhí)行步驟1和步驟2,直到目標(biāo)函數(shù)值在相繼的兩次迭代中的差值小于內(nèi)循環(huán)容錯(cuò)精度δ,或者迭代次數(shù)達(dá)到最大值Nmax。
2.2.4 整體算法
算法1 對(duì)問(wèn)題(24)的基于PDD的優(yōu)化算法 (1)以一個(gè)可行解對(duì)算法進(jìn)行初始化。設(shè)迭代次數(shù)r=0。并且設(shè)c<1和0>0。 (2)Repeat (3) 迭代執(zhí)行步驟1和步驟2,直到目標(biāo)函數(shù)值在相繼的兩次迭代中的差值小于內(nèi)循環(huán)容錯(cuò)精度δ,或者迭代次數(shù)達(dá)到最大值Nmax (4) Ifgr(Z)∞≤ηrthen (5) λr+1=λr+1rgr(Z), r+1=r (6) Else (7) λr+1=λr,r+1=cr (8) End if (9) 更新迭代次數(shù):r=r+1 (10)Until gr(Z)∞≤δO
圖2 基于PDD的算法收斂性
圖2展現(xiàn)了本文算法的收斂性。從圖2可以看出:最大化的最小可達(dá)平均速率隨著外循環(huán)迭代次數(shù)的增加而增加,且可以在10次迭代以內(nèi)收斂。此外,等式約束的違反程度可以在25次迭代以內(nèi)下降到10-6以下,證明了所提的基于PDD的算法可以有效地處理優(yōu)化問(wèn)題中的復(fù)雜約束。
圖3展現(xiàn)了優(yōu)化后的無(wú)人機(jī)的飛行軌跡。從圖3中可以看出:當(dāng)飛行時(shí)間足夠長(zhǎng),即T=50 s時(shí),無(wú)人機(jī)相繼飛過(guò)每一用戶以實(shí)現(xiàn)公平性;而當(dāng)飛行時(shí)間比較短,即T=25 s時(shí),無(wú)人機(jī)難以飛到距離較遠(yuǎn)的用戶處,則通過(guò)為遠(yuǎn)處用戶分配更多的發(fā)送功率來(lái)實(shí)現(xiàn)公平性。這樣一來(lái),無(wú)人機(jī)會(huì)在近處用戶處停留一段時(shí)間。采用NOMA后,無(wú)人機(jī)既可以通過(guò)優(yōu)化自身位置,也可以通過(guò)優(yōu)化功率分配來(lái)提高遠(yuǎn)處用戶的傳輸速率,資源分配更加靈活。
圖4比較了不同方案下最大化的最小可達(dá)平均速率與飛行時(shí)間T的關(guān)系,包括以下方案進(jìn)行比較。
?聯(lián)合優(yōu)化:本文提出的聯(lián)合優(yōu)化無(wú)人機(jī)軌跡與功率分配的算法。
?無(wú)軌跡優(yōu)化:無(wú)人機(jī)以直線軌跡勻速飛行,僅優(yōu)化功率分配。
?基于正交多址接入技術(shù)(Orthogonal Multiple Access, OMA)的聯(lián)合優(yōu)化:使用基于OMA的多址接入方式,聯(lián)合優(yōu)化無(wú)人機(jī)軌跡與用戶調(diào)度。
從圖4中可以看出:本文提出的聯(lián)合優(yōu)化算法性能強(qiáng)于僅對(duì)功率分配進(jìn)行優(yōu)化的方案。而且,隨著飛行時(shí)間T的增長(zhǎng),軌跡優(yōu)化方案相較于固定直線軌跡方案的性能優(yōu)勢(shì)更加明顯,并在T=70 s時(shí)增益達(dá)到0.7 bit·s-1·Hz-1。此外,本文提出的基于NOMA的聯(lián)合優(yōu)化方案性能優(yōu)于基于傳統(tǒng)OMA的聯(lián)合優(yōu)化方案,尤其是在飛行時(shí)間T比較短的時(shí)候,增益可以超過(guò)0.1 bit·s-1·Hz-1。其原因在于,當(dāng)無(wú)人機(jī)沒(méi)有足夠時(shí)間飛到遠(yuǎn)距離用戶處時(shí),NOMA能夠通過(guò)功率分配來(lái)增加遠(yuǎn)處用戶的傳輸速率,從而達(dá)到比傳統(tǒng)OMA更好的性能。
圖3 優(yōu)化后的無(wú)人機(jī)飛行軌跡
圖4 不同方案下的系統(tǒng)傳輸速率
本文研究了基于NOMA的移動(dòng)無(wú)人機(jī)系統(tǒng)的優(yōu)化設(shè)計(jì)。在NOMA中,接收端串行干擾消除檢測(cè)的順序由信道增益大小決定,而在移動(dòng)無(wú)人機(jī)系統(tǒng)中,用戶的信道增益隨著無(wú)人機(jī)基站的位置而變化,因此,將NOMA技術(shù)應(yīng)用于移動(dòng)無(wú)人機(jī)系統(tǒng)后,軌跡優(yōu)化與功率分配優(yōu)化互相耦合,使得優(yōu)化設(shè)計(jì)十分復(fù)雜。本文提出一種基于PDD的優(yōu)化算法,通過(guò)聯(lián)合優(yōu)化無(wú)人機(jī)軌跡與功率分配來(lái)最大化用戶的最小可達(dá)平均速率,更靈活地進(jìn)行資源分配,獲得了比其他基準(zhǔn)算法更好的性能。本文旨在研究NOMA技術(shù)與移動(dòng)無(wú)人機(jī)系統(tǒng)的結(jié)合,只研究比較簡(jiǎn)單的單無(wú)人機(jī)系統(tǒng)。下一步將研究多無(wú)人機(jī)系統(tǒng)以提高系統(tǒng)的覆蓋能力。