張冬雪,杜潔汝,何世彪,廖 勇
(1.重慶工程學院 電子信息學院,重慶 400056;2.重慶大學 微電子與通信工程學院,重慶 400044)
近年來,新興智能業(yè)務對更快的無線通信接入速率和時延需求大幅增加。大規(guī)模多入多出(Multiple-Input Multiple-Output,MIMO)是蜂窩無線通信的關鍵技術,能夠實現(xiàn)更高的頻譜效率和能量效率,因此被第五代移動通信系統(tǒng)(5G)標準采納,但同時部署大規(guī)模MIMO系統(tǒng)也帶來了不同用戶和不同數(shù)據(jù)流之間的干擾。
預編碼是提高系統(tǒng)頻譜效率和鏈路可靠性的關鍵技術,根據(jù)下行信道狀態(tài)信息(Channel State Information,CSI)設計預編碼矩陣,用于基站(Base Station,BS)對發(fā)送數(shù)據(jù)的預處理,能降低干擾的影響,提高鏈路通信質量。預編碼有多種分類方式,根據(jù)鏈路結構分為數(shù)字預編碼、模擬預編碼和混合預編碼。在傳統(tǒng)的MIMO系統(tǒng)中,預編碼通常在數(shù)字域中實現(xiàn)。但是,數(shù)字預編碼需要為每個天線搭載一個專用的射頻(Radio Frequency,RF)鏈。由于天線數(shù)目過于龐大并且RF鏈能量消耗非常高,對于毫米波大規(guī)模MIMO系統(tǒng)而言,能耗、硬件成本和實現(xiàn)復雜度都太高。而傳統(tǒng)的模擬預編碼架構共享一個RF鏈,只能支持單流傳輸,對于多流或多用戶場景而言是不可行的,并且通過移相器實現(xiàn)的模擬射頻處理只能控制信號的相位,這將導致相當大的性能損失。為了提高頻譜利用率和空間復用增益,不能通過傳統(tǒng)的模擬預編碼架構來實現(xiàn),為此混合預編碼被提出[1]。
根據(jù)預編碼設計過程中是否包含非線性運算,可以分為線性預編碼和非線性預編碼。文獻[2]指出臟紙編碼(Dirty Paper Coding,DPC)算法是能夠達到大規(guī)模MIMO系統(tǒng)的最高容量極限,由于這種預編碼算法是非線性的,因此其算法復雜度巨大。湯姆林森-哈拉?,旑A編碼(Tomlinson-Harashima Precoding,THP)[3]以及基于矢量擾動(Vector Perturbation,VP)的預編碼[4]都是基于DPC算法進行了一些降低算法復雜度的工作,然而非線性預編碼的算法復雜度仍然過高,其在實際工程中的可行性不高。因此,更多的較低復雜度的線性預編碼算法被提出。文獻[5]指出,在大規(guī)模MIMO系統(tǒng)中,隨著天線數(shù)目的增大,在天線數(shù)目趨于無窮時,簡單的線性預編碼算法如迫零(Zero-Forcing,ZF)預編碼[6]、基于最小均方誤差(Minimum Mean Square Error,MMSE)的預編碼[7]等就可以達到接近 DPC 預編碼的性能。除此之外,典型的線性預編碼算法還有基于信漏噪比(Signal to Leakage and Noise Ratio,SLNR)的預編碼[8]、基于信道矩陣奇異值分解(Singular Value Decomposition,SVD)的預編碼[9],以及塊對角化(Block Diagonalization,BD)預編碼[10]。
文獻[11-15]討論了大規(guī)模MIMO系統(tǒng)的一些關鍵問題,但尚沒有詳細介紹線性和非線性預編碼及其算法復雜度、優(yōu)缺點在內的綜述。為此,本文針對現(xiàn)有大規(guī)模MIMO系統(tǒng)中線性預編碼和非線性預編碼展開深入研究與分析。
本文首先回顧了大規(guī)模MIMO系統(tǒng)預編碼模型,然后總結描述了線性和非線性預編碼中目前具有代表性的算法,并對算法的復雜度和優(yōu)缺點進行了比較全面的歸納與對比,彌補了現(xiàn)有綜述文獻的不足;最后對下一代無線通信系統(tǒng)的大規(guī)模MIMO預編碼技術的發(fā)展趨勢進行了探討,以期為同行學者提供一定的參考。
大規(guī)模MIMO下行系統(tǒng)預編碼模型如圖1所示。
圖1 大規(guī)模MIMO系統(tǒng)預編碼模型
假設BS和用戶端分別部署Nt根發(fā)射天線和單根接收天線,其中,F(xiàn)表示預編碼矩陣,用戶數(shù)為K,用戶數(shù)和發(fā)射天線滿足K≤Nt,信號空間傳輸?shù)男诺谰仃嘓∈Nt×K表示為
(1)
式中:H的每個元素表示對應子信道的增益,并且服從復高斯分布CN(0,1)。
對于下行鏈路傳輸,待發(fā)送信號s=[s1,s2,…,sK]T在BS端進入預編碼階段,通過預編碼器F得到預編碼矢量x=[x1,x2,…,xNt]T,然后通過信道分別發(fā)送到用戶端的接收天線。在假設完美CSI與BS同步的情況下,可以通過預編碼矩陣將發(fā)射信號指向其特定的接收終端。
接收端接收到的信號y∈K×1表示為
y=HHFs+n=HHx+n。
(2)
如圖2所示,在大規(guī)模MIMO系統(tǒng)中,預編碼技術可以分為線性預編碼和非線性預編碼兩類。線性預編碼根據(jù)求解方法分為基于基本線性預編碼、基于迭代的預編碼算法和基于矩陣的預編碼算法。非線性預編碼分為DPC預編碼、THP預編碼和VP預編碼。
圖2 大規(guī)模MIMO預編碼技術分類
下行鏈路傳輸中所有用戶的傳輸信號x∈Nt×1可以表示為
(3)
式中:F∈Nt×K為線性預編碼矩陣;s∈K×1為發(fā)送信號向量;表示信道分配功率。預編碼矩陣F的獲取取決于矩陣H,接收端的向量表示為
(4)
可以看出,預編碼矩陣F包含了求逆運算,該操作導致了較高的預編碼算法復雜度。尤其當K≤Nt時,根據(jù)信道矩陣求逆過程,將線性預編碼技術分為基本線性預編碼、基于迭代的線性預編碼和基于矩陣分解的線性預編碼。
2.1.1 基本線性預編碼算法
基本線性預編碼主要是將發(fā)射信號s與預編碼矩陣F相乘,基本線性預編碼的計算復雜度為O(N3),與直接進行矩陣求逆的復雜度相當。以下給出典型的基本線性預編碼算法。
最大比例傳輸(Maximum Ratio Transmission,MRT)預編碼算法[16]的目標是使信號達到特定接收端的增益最大化。MRT預編碼矩陣是通過對信道矩陣求共軛轉置來得到的,因此,MRT預編碼矩陣可以表示為
(5)
式中:γ表示功率控制因數(shù)。接收端的信號可以被表示為
(6)
當K< ZF預編碼算法是基本線性預編碼中最常用的一種算法[6]。該算法是對信道取偽逆,將信號波束直接指向預定用戶,其他用戶的信號波束為空,以此來減少其他用戶的干擾。ZF預編碼矩陣可以表示為 (7) 式中:矩陣P是Gram矩陣,其對角線分量表示信道功率的分配,而非對角線分量表示信道之間的相互關系。當系統(tǒng)發(fā)射端天線數(shù)Nt趨于無窮時,矩陣P將會變成單位矩陣。ZF算法的接收端信號被表示為 (8) ZF算法并沒有考慮噪聲的影響,因此,在噪聲很小的情況下算法性能夠取得最優(yōu)。然而,在實際情況下噪聲不可忽略,在大規(guī)模MIMO系統(tǒng)中使用ZF算法不能達到最優(yōu)解,在高信噪比的情況下可以獲得比較準確的結果。 MMSE算法充分利用了MRT算法和ZF算法的優(yōu)點,在兩者之間取得平衡[17]。因此,它在存在噪聲和干擾的系統(tǒng)中具有可接受的性能。MMSE算法設計的預編碼矩陣是以最小化均方誤差為準則,使得接收端和發(fā)射端信號之間的誤差最小。MMSE算法的預編碼矩陣表示為 (9) 式中:λ=σ2/Es,Es為每個符號的能量。MMSE算法的接收端信號表示為 (10) 文獻[18]針對具有增強接收處理能力(Enhanced Receive Processing,ERP)的單天線和多天線移動臺提出了一種新的MMSE預編碼器,還提出了一種近似最大似然檢測器與MMSE-ERP預編碼器協(xié)作,通過仿真表明MMSE-ERP 預編碼器可以利用所考慮的通用系統(tǒng)模型中的額外自由度。但是MMSE預編碼矩陣的計算包含了一個非常大的維度矩陣求逆操作,因此,提出一種降低基本預編碼算法復雜度的方法就顯得尤為重要。 2.1.2 基于迭代的預編碼算法 通過上述分析可知,基本線性預編碼算法涉及到矩陣求逆。但是在大規(guī)模MIMO系統(tǒng)中,信道矩陣的維度非常大,如果每次都是進行高維度的矩陣求逆,造成的計算復雜度和成本開銷是十分巨大的,因此,有不少研究學者提出使用數(shù)值分析中的迭代算法求解線性預編碼方程Px=s來獲得x,以此進行算法設計。下面介紹典型的基于迭代的預編碼算法。 高斯-賽德爾(Gauss-Seidel,GS)算法利用迭代方法求得的逆矩陣和直接進行逆矩陣求解的結果能夠完全類似[19]。當發(fā)射天線數(shù)Nt非常大并且滿足Nt>>K時,矩陣P成為對角占優(yōu),能夠滿足收斂條件。將P矩陣分解為對角矩陣D、下三角矩陣L和上三角矩陣U,因此,P=L+D+U,基于GS預編碼的過程可以表示為 x(i)=(D+L)-1(s-Ux(i-1)),i=0,1,2…。 (11) 式中:x(0)表示GS迭代的初始解向量即迭代的初始值,一般可以設置為零向量;i表示迭代次數(shù)。在一定的迭代次數(shù)之后,x(i)的值逼近P-1s。 Xie等[20]提出了基于逐次超松弛(Successive Over-relaxation,SOR)迭代的低復雜度線性預編碼算法。SOR算法是在GS算法的基礎上進行改進的,通過添加松弛因子提高GS算法的收斂速度。因此,SOR算法同樣將矩陣P分解為對角矩陣D、下三角矩陣L、上三角矩陣U。SOR算法可以表示為 x(i)=(D+?L)-1(?s+((1-?)D-?U)x(i-1)), i=0,1,2…。 (12) 式中:?表示迭代方法的松弛參數(shù)。SOR的收斂速度取決于?:0<2可以收斂;?>1稱為過松弛迭代;?<1表示低松弛迭代;當?=1時SOR算法就轉換為GS算法。 松弛參數(shù)的理論最優(yōu)解為 (13) 式中:ρ(A)表示矩陣A的譜半徑。 雅可比迭代(Jacobi Iteration,JI)算法一種簡單的迭代算法[21]。不同于上述兩種迭代算法,JI算法將矩陣分解為對角矩陣D和非對角矩陣G,估計出的信號可以表示為 x(i)=D-1(s+(D-G)x(i-1)),i=0,1,2… , (14) 并且滿足 (15) 基于JI算法的預編碼矩陣初始解可以表示為 x(0)=D-1s。 (17) 經過分析可知,JI算法的復性能和收斂速度低于GS算法和SOR算法。相反,JI算法具有并行性。 Liu等[22]提出了基于加權兩階段(Weighted Two-stage,WTS)迭代的低復雜度線性預編碼算法,利用加權兩階段迭代避免矩陣求逆過程從而降低了復雜度。與GS迭代相同,WTS迭代將矩陣P分解為對角矩陣D、下三角矩陣L和上三角矩陣U?;赪TS的預編碼過程可以分為兩個半迭代,前向迭代(式(18))和后向迭代(式(19)),最后再通過加權系數(shù)將兩個半迭代的結果合在一起作為本次迭代的結果(式(20))。 (18) (19) (20) 式(20)中:x(0)表示W(wǎng)TS迭代的初始解向量即迭代的初始值;θ為加權系數(shù),可以按經驗設置為 (21) 大規(guī)模MIMO下行系統(tǒng)中,BS天線數(shù)目遠大于接收端天線數(shù),因此主要是后半迭代的值,前半部分的值做小的修正,當θ=0時WTS迭代方法等價于 GS迭代方法。 2.1.3 基于矩陣分解的預編碼算法 本小節(jié)給出幾種常用的矩陣求逆方法,因為Gram矩陣P是方陣,所以后續(xù)求逆矩陣都默認為方陣。 QR分解是在信號處理應用最廣泛的一種矩陣分解[23]。將矩陣HH分為一個下三角矩陣Q和一個上三角矩陣R,進一步將QR分解推廣到MMSE準則上。首先,基于MMSE準則的擴展信道矩陣被定義為 (22) 式中:Q∈K×K為酉矩陣。 顯然有 (23) (24) 基于幾何均值分解(Geometric Mean Decomposition,GMD)預編碼算法[24]將信道矩陣HH進行GMD分解: HH=QRWH。 (25) 式中:Q和W矩陣都是酉矩陣;R為上三角矩陣,主對角線上的元素表示為 (26) 式中:K為空間信道矩陣秩的大小。 根據(jù)基于矩陣分解的預編碼算法的基本構造原理,取預編碼矩陣F為酉矩陣W,為了消除信道矩陣HH,顯然均衡矩陣G應取QH,而矩陣R可以看作信道矩陣的等效信道矩陣。因此,基于GMD分解的系統(tǒng)模型可以表示為 r=Fx+n。 (27) 經過均衡處理器處理后,接收端的信道表示為 (28) 經過上述分析可知,可以將GMD的分解方法近似看作一種擴展的QR分解。這種方案對信噪比較差的子信道進行了改進,通過信道矩陣進行幾何均值分解,使各個MIMO子信道就具有相同的功率,不需要對不同信道指定特定的調制解調方案,從而降低了系統(tǒng)的計算復雜度。 基于均勻信道分解(Uniform Channel Decomposition,UCD)的預編碼算法是對GMD算法的改進[25],能夠在低信噪比下取得良好的系統(tǒng)容量。 定義UCD分解的預編碼矩陣為 (29) 式中:W矩陣是酉矩陣。 定義經過預編碼之后的等效信道矩陣Heq表示為 (30) 對于任意一個增廣矩陣,可以找到一個酉矩陣,使得該增廣矩陣經過分解后變成一個對角線元素均相同的上三角矩陣。由此,由此定義一個增廣矩陣: (31) 式中:α表示噪聲與信號之比,即信噪比的倒數(shù);M表示數(shù)據(jù)流數(shù);矩陣是由半正定矩陣W0的前L列元素組成。 對矩陣J進行GMD分解: (32) 根據(jù)上述分析,表1給出了線性預編碼的復雜度比較,表2對其優(yōu)缺點進行了總結。 表1 線性預編碼算法復雜度比較 表2 大規(guī)模MIMO系統(tǒng)中經典線性預編碼算法的優(yōu)缺點 表2(續(xù)) 線性預編碼雖然較為簡單,但是性能較差。非線性預編碼以一定的復雜度為代價,使發(fā)送數(shù)據(jù)更好地適應信道的時變特性和消除數(shù)據(jù)流之間的干擾帶來的影響,大幅提升了系統(tǒng)性能。常見的非線性預編技術包括DPC預編碼、THP預編碼和VP預編碼。 2.2.1 DPC預編碼算法 DPC預編碼對第k個用戶的信號進行預編碼時,能夠刪除第1個到k-1個用戶信號所造成的干擾。系統(tǒng)容量可以表示為 (33) 式中:Px為信道功率;Pz表示噪聲的方差。 根據(jù)矩陣論可知,信道矩陣可以被分解為一個上三角矩陣和一個正交陣的乘積,這種分解可以將低增益的信道對高質量的信道干擾完全消除。信道矩陣HH=ZHS,其中S為下三角矩陣,Z為正交矩陣,則有 (34) DPC算法給出了信道容量的理論極限值,但是實現(xiàn)起來復雜度較高,在實際中一般采用次優(yōu)的THP算法。 2.2.2 THP預編碼算法 THP[3]是接收端判決反饋均衡的逆過程,將反饋部分移到發(fā)射端進行,在發(fā)射端添加求模操作來解決使用判決反饋均衡導致的發(fā)射信道能量增大問題,以發(fā)射信號星座圖邊界為模值進行取模,再重新將信號映射到規(guī)則星座圖上。以上所述的THP算法可以克服誤差傳播效應,直接進行信道編碼,逐一消除信道間的干擾。 接收端的信號可以表示為 (35) 基于ZF的THP預編碼是在不考慮加性噪聲影響的同時,完全消除信道造成的干擾,即滿足 GHHFB-1=I。 (36) 對矩陣HH進行QR分解: HH=QR。 (37) 取三角矩陣R對角線上的元素,取對數(shù)得到加權矩陣G對角線上的元素: (38) 將加權矩陣G與上三角矩陣R進行乘積,得到反饋矩陣B表示為 B=GR。 (39) 因此,預編碼矩陣F可以表示為 F=QH。 (40) 2.2.3 VP預編碼算法 VP算法[4]是在原始發(fā)射信號矢量上加上一個擾動矢量,使得擾動后得發(fā)送信號矢量的模值小于擾動前的發(fā)送信號矢量的模值,從而降低發(fā)射信號的功率,提高系統(tǒng)性能。 (41) 式中:τ表示取模間隔,其值是一個正實數(shù),大小由發(fā)送符號的調制方式決定,通常定義為 τ=2|a|max+ε。 (42) 式中:|a|為調制符號實部或虛部的最大幅值;ε為調制符號間的最小歐氏距離。l是一個元素均為復數(shù)的擾動矢量,其實部和虛部都是正數(shù)。經過擾動以后,實際的發(fā)射信號矢量為 (43) VP算法的關鍵就在于選擇合適的擾動矢量,使得信號的發(fā)送功率最小,求解最佳擾動矢量的問題等效為一個最小二乘問題,目標函數(shù)為 (44) 式(43)的優(yōu)化問題是一個經典的最小二乘問題,典型求解方法是采用球形譯碼獲取最優(yōu)解。 接收端的信號可以表示為 (45) 表3給出了非線性預編碼算法復雜度比較,表4總結了大規(guī)模MIMO系統(tǒng)中經典非線性預編碼算法的優(yōu)缺點。 表3 非線性預編碼算法復雜度比較 表4 大規(guī)模MIMO系統(tǒng)中經典非線性預編碼算法的優(yōu)缺點 3.1.1 太赫茲通信系統(tǒng) 在未來的6G無線通信中,相較5G太赫茲(Tera Hertz,THz)通信可以提供十倍的帶寬增長,被認為是一種有前景的技術。目前,混合預編碼被考慮用于太赫茲超大規(guī)模MIMO系統(tǒng),以減輕太赫茲RF鏈的大量功耗[50]。由于THz通道的稀疏性,在THz大規(guī)模MIMO系統(tǒng)中,少量的RF鏈仍然足以充分實現(xiàn)復用增益。 3.1.2 去蜂窩網(wǎng)絡 下一代無線通信系統(tǒng)對網(wǎng)絡容量的需求越來越大,針對此問題,以用戶為中心的去蜂窩網(wǎng)絡被提出。由于分布式基站之間的高效協(xié)作,可以有效緩解小區(qū)間的干擾,進一步提升系統(tǒng)容量。但是不同用戶之間、不同天線之間仍然存在干擾問題,因此,基于混合預編碼的無蜂窩MIMO成為一種創(chuàng)新技術[51],可以進一步消除傳輸過程中存在的干擾信息,顯著提高毫米波網(wǎng)絡容量通信系統(tǒng)。 3.1.3 智能反射面 雖然大規(guī)模 MIMO 技術能有效解決毫米波傳輸問題,并且提高了毫米波無線通信系統(tǒng)的頻譜效率,但其要求的高復雜度、高能耗以及高硬件成本仍然在實際應用中很難實現(xiàn)。最近,智能反射面(Intelligent Reflecting Surface,IRS)被提出作為一種新的經濟有效的解決方案,通過成本低廉的反射元件可為無線通信系統(tǒng)提供高的頻譜效率[52]。IRS由大量低成本和高能效的無源天線元件組成,每個無源元件接收由有源天線傳輸信號的疊加,并將期望的相移添加到整個信號。因此,基于IRS輔助天線的預編碼成為一種新的研究趨勢[53]。 3.2.1 深度學習 近幾年,深度學習成為一種處理海量數(shù)據(jù)和解決復雜非線性問題的優(yōu)秀技術。基于深度學習的混合預編碼優(yōu)化算法能降低優(yōu)化處理的復雜性并提升頻譜效率[54-55]。 3.2.2 強化學習 強化學習(Reinforcement Learning,RL)算法相較于一些傳統(tǒng)優(yōu)化算法,除了可以應用于基于模型的場景,還可以用于無模型的場景中。因此,針對無線環(huán)境的動態(tài)變化性,可以考慮采用強化學習設計預編碼算法[56],以尋求毫米波大規(guī)模MIMO系統(tǒng)可實現(xiàn)的數(shù)據(jù)率最大化。 3.2.3 深度強化學習 深度強化學習(Deep Reinforcement Learning,DRL)針對非凸問題具有強大的處理能力,可以有效地學習最優(yōu)的行為策略來處理復雜的問題,在離線訓練不需要大量的數(shù)據(jù)。因此,可以采用DRL研究毫米波系統(tǒng)的混合波束形成[57],獲得更高的系統(tǒng)性能。 大規(guī)模MIMO在移動通信系統(tǒng)的應用極大地改善了用戶體驗,本文對大規(guī)模MIMO系統(tǒng)中線性和非線性預編碼技術進行了綜述。盡管線性預編碼在某些情況下會出現(xiàn)性能下降,但由于其相對簡單,仍然在BS設計中發(fā)揮著至關重要的作用。本文歸納和對比了線性預編碼和非線性預編碼中典型算法的性能優(yōu)劣及其時間復雜度,根據(jù)理論和實驗結果指出相較線性預編碼,非線性預編碼具有更高的算法性能和計算復雜度。此外,本文還對預編碼技術的發(fā)展趨勢進行了展望。2.2 非線性預編碼
3 發(fā)展趨勢
3.1 新型應用場景
3.2 新型處理技術
4 結束語