楊 愷 陳曉寧
1(東莞職業(yè)技術(shù)學院電子與電氣工程學院 廣東 東莞 523808)2(西北工業(yè)大學電子信息學院 陜西 西安 710072)
傳統(tǒng)的時分復用、波分復用和偏振復用等技術(shù)成功提高了光通信系統(tǒng)的信道利用率和傳輸效率[1]。隨著通信技術(shù)的發(fā)展,模分復用[2]技術(shù)進一步地提高了光通信的信道利用率,漸變型光信道的出現(xiàn)使得單個信道支持的模式數(shù)量日益升高,通過多輸入多輸出技術(shù)[3]能夠有效地提升光通信系統(tǒng)的性能。多模傳輸雖然提高了光通信的效率和速度,但是在光傳輸過程中每個模式內(nèi)和多個模式之間會發(fā)生非線性耦合的現(xiàn)象[4]。傳統(tǒng)的光通信系統(tǒng)采用信道均衡化技術(shù),在發(fā)送端發(fā)送訓練信號,在接收端計算傳輸產(chǎn)生的誤差,然后根據(jù)這些誤差結(jié)果搜索均衡器的最佳參數(shù)集[5]。
許多專家學者對MIMO的均衡技術(shù)進行了深入研究,并且取得了卓越的成果。文獻[6]提出基于自適應濾波算法的自適應均衡方法,該算法將信道均衡模型建模成濾波模型,濾波模型使MIMO系統(tǒng)均衡問題中均衡器的設(shè)計問題轉(zhuǎn)化為自適應濾波中最優(yōu)濾波器的設(shè)計問題。該算法具備較好的自適應學習能力,并且對非線性MIMO系統(tǒng)也具備一定的擬合能力。文獻[7]將迫零均衡化(Zero Forcing, ZF)和最小均方誤差 (Minimum Mean Square Error, MMSE)結(jié)合設(shè)計了自適應的MIMO均衡化算法,該算法對于不同形式的MIMO均表現(xiàn)出較好的性能,并且也實現(xiàn)了較好的非線性均衡效果。隨著深度學習技術(shù)的發(fā)展,許多研究人員將深度學習技術(shù)應用于MIMO系統(tǒng)中,以期提高MIMO的學習效果。文獻[8]將MIMO通信系統(tǒng)的發(fā)射端和接收端視為自編碼器(Auto-Encoder)的編碼和譯碼部分,利用交叉熵損失加權(quán)函數(shù)進行訓練學習,從而解決MIMO的聯(lián)合優(yōu)化問題。雖然許多研究人員將深度學習技術(shù)成功運用于MIMO檢測系統(tǒng)中,但是所支持的模式輸入數(shù)量和輸出數(shù)量較少,如文獻[8]主要支持2個用戶和4個用戶的情況。
MIMO系統(tǒng)的規(guī)模越大,對應的深度神經(jīng)網(wǎng)絡規(guī)模隨之擴大,而漸變型光信道現(xiàn)已支持較多的模式,需要建立大規(guī)模的神經(jīng)網(wǎng)絡才能較好地解決光通信MIMO檢測問題。本文采用演化合成技術(shù)訓練深度神經(jīng)網(wǎng)絡,將光通信系統(tǒng)MIMO的監(jiān)督信息作為演化合成的先驗信息,引導神經(jīng)網(wǎng)絡的演化,縮小神經(jīng)網(wǎng)絡的規(guī)模,提高網(wǎng)絡的結(jié)構(gòu)效率,避免在檢測過程中花費過長的時間,有助于提高光通信的傳輸效率。最終采用40個模式的MDM光通信系統(tǒng)建立了實驗,在模式耦合嚴重的情況下測試了本文MIMO檢測算法的性能,本文算法的性能優(yōu)于傳統(tǒng)的ZF檢測器和半正定松弛(Semi Definite Relaxation, SDR)等MIMO檢測技術(shù)。
圖1所示為光通信系統(tǒng)的MIMO模型圖。
圖1 光通信系統(tǒng)的MIMO模型圖
將N-模分復用的光通信系統(tǒng)表示為一個N×N的MIMO系統(tǒng),MIMO的輸入表示為d(t)=[d1(t),d2(t),…,dN(t)]T∈BN,其中:BN表示調(diào)制器產(chǎn)生的信號范圍;N表示調(diào)制器數(shù)量。對應的MIMO輸出設(shè)為d′(t)∈BN,其數(shù)學式為:
d′(t)=H-1Hd(t)
(1)
式中:H∈CN×N為信道矩陣,C表示復數(shù)集;H-1表示深度神經(jīng)網(wǎng)絡(DNN)的輸出。圖1中副載波復用模塊包含N個正交相移鍵控(Quadrature Phase Shift Keying, QPSK)調(diào)制器,副載波頻率設(shè)為fc。TXi模塊包含一個馬赫-曾德爾調(diào)制器(Mach-Zehnder Modulator, MZM)和一個光學載波。假設(shè)din為第i個信道的第n個輸入比特。第i個QPSK調(diào)制器的輸出為:
ai(t)=qiej2πfct
(2)
式中:qi=(di2n+jdi2n+1)表示一個QPSK符號。通過QPSK調(diào)制符號來控制光信號的強度(由馬赫-曾德爾光調(diào)制器實現(xiàn)),所有光載波的波長相等。光調(diào)制器的輸出為:
ri(t)=Pbias+PiRe[ai(t)]
(3)
式中:Pbias表示偏壓所產(chǎn)生的光功率;Pi為光載波放大器;Re[ai(t)]表示ai(t)的實部。偏壓控制通過調(diào)節(jié)MZM的工作點來維護電信號和調(diào)制光功率之間的線性關(guān)系,使用光纖耦合器將調(diào)制的光功率耦合成漸變型多模光纖的不同模式,光纖耦合器具備模分復用功能,其輸出的所有光信號通過光纖傳輸,在傳輸過程中不同模式之間會發(fā)生耦合的現(xiàn)象。
接收端通過光纖耦合器將接收的光信號分為N個光束,光纖耦合器第i個輸出端口的信號表示為:
(4)
式中:hij(t)表示信道矩陣H位置(i,j)的元素,hij(t)是一個復數(shù)。hij(t)的絕對值為耦合功率,hij(t)的相位表示副載波的時間偏差。因為在傳輸過程中發(fā)生模式耦合的現(xiàn)象,所以式(4)包含了TXi發(fā)送的信號和其他信號。第i個光探測器輸出的電流為:
(5)
該電流產(chǎn)生一個電壓信號gi(t),信號的計算式為:
(6)
式(3)的Pbias是一個直流值,接收端的帶通濾波器將該直流信號過濾,所以式(6)中移除了該項。將該信號和副載波的頻率fc相乘,最終輸出的信號ki(t)變?yōu)椋?/p>
(7)
采用低通濾波器處理第i個端口的信號,濾波后的信號變?yōu)椋?/p>
(8)
式中:rxi(t)為N個傳輸信號的總和。N個端口的總輸出為Rx(t)=[rx1(t),rx2(t),…,rxN(t)]T∈CN。
圖2所示是本文DNN的結(jié)構(gòu)。
圖2 深度神經(jīng)網(wǎng)絡的結(jié)構(gòu)
DNN的輸入向量為:
x0=[Re(rx1(t)),lm(rx1(t)),Re(rx2(t)),
lm(rx2(t)),…,Re(rxN(t)),lm(rxN(t))]
(9)
式中:x0的長度為D=2N,假設(shè)R表示實部集,將一個M層的前饋神經(jīng)網(wǎng)絡表示為一個映射函數(shù)f(x0;θ):RD0→RDM,該函數(shù)經(jīng)過M次迭代最終將輸入向量x0∈RD0變換為輸出向量xM∈RDM,迭代過程定義為:
xm=fm(xm-1;θm)
式中:fm(xm-1;θm):RDm-1→RDm為第m層的映射函數(shù);θm為神經(jīng)網(wǎng)絡的參數(shù);xm-1為前一層的輸出向量。將神經(jīng)網(wǎng)絡的參數(shù)集表示為θ={θ1,θ2,…,θM}。首先訓練完全連接的神經(jīng)網(wǎng)絡模型,網(wǎng)絡的第m層表示為:
fm(xm-1;θm)=σ(Wmxm-1+bm)
式中:Wm∈RDm-1×Dm;bm∈RDm;σ()為激活函數(shù)。激活函數(shù)對輸入向量的每個元素進行處理,記為[σ(u)]i=σ(ui),第m層的參數(shù)集表示為θm={Wm,bm}。
將DNN的訓練集表示為(x(i),y(i)),i=1,2,…,S,其中y(i)為輸入x(i)的期望輸出,S為訓練樣本的總數(shù)量。將訓練集經(jīng)過光通信系統(tǒng)傳輸,接收不同信道條件下的Rx,設(shè)CN表示給定信道的相關(guān)屬性,通過CN可觀察出還原該信道MIMO信號的難度。信道矩陣H的CN矩陣表示為20log10(‖H‖‖H-1‖)≥0(dB),其中‖·‖表示求范數(shù)的運算。CN越接近0(dB),說明MIMO信道的質(zhì)量越高。矩陣H反映了光纖耦合器和多模光纖的特性,光纖的特性包括模式色散、模式相關(guān)效應和模式耦合串擾等因素。首先采用不同CN數(shù)據(jù)對神經(jīng)網(wǎng)絡進行訓練,訓練的目標函數(shù)定義為:
(10)
式中:L(·,·)為每個樣本的成本函數(shù);x(i)為神經(jīng)網(wǎng)絡的輸入;f(x(i);θ)為神經(jīng)網(wǎng)絡的輸出。采用MSE作為成本評價函數(shù),將式(10)改寫為:
(11)
采用一階優(yōu)化算法Adam[9]基于成本函數(shù)的梯度完成訓練過程,Adam[9]是一種自適應調(diào)節(jié)學習率的算法,能夠動態(tài)地更新參數(shù)θ。Adam采用梯度一階矩和二階矩的估計來計算每個參數(shù)的自適應學習率。成本函數(shù)J(θ)含有噪聲,其目標是最小化J(θ)的期望值。首先,隨機初始化參數(shù)θ=θ0,一階矩、二階矩分別初始化為s=0和β=0。一階矩和二階矩的指數(shù)衰減率ρ1和ρ2分別初始化為缺省值0.9和0.999,步長設(shè)為缺省值ε=0.001。從訓練集采樣的mini-batch表示為{x(1),x(2),…,x(ζ)},對應的期望輸出為{y(1),y(2), …,y(ζ)}。成本函數(shù)的梯度計算式為:
(12)
式中:ξ表示輸出數(shù)量;f()為映射函數(shù);i為輸入序號。一階矩估計的更新方法為:
snew=ρ1s+(1-ρ1)g
(13)
二階矩估計的更新方法為:
βnew=ρ2β+(1-ρ2)g⊙g
(14)
式中:⊙為矩陣的點積運算。
一階矩的實際偏差為:
(15)
二階矩的實際偏差為:
(16)
(17)
更新的參數(shù)θ為:
θnew=θ+Δθ
(18)
重復計算式(12)-式(18),最終參數(shù)θ達到收斂,此時獲得的DNN全連接網(wǎng)絡可以用來檢測MIMO信號。但對于大規(guī)模的MIMO,神經(jīng)網(wǎng)絡的規(guī)模也較大,導致檢測的時間較長,影響光通信系統(tǒng)的傳輸效率。
采用兩個二值隨機變量表示網(wǎng)絡的神經(jīng)元和權(quán)重,對深度神經(jīng)網(wǎng)絡的結(jié)構(gòu)進行編碼,變量取值1和0表示該神經(jīng)元或者權(quán)重是否存在于網(wǎng)絡中。第2.1小節(jié)訓練的完全連接神經(jīng)網(wǎng)絡表示為S,S={sl,i,i=1,2,…,Il,l=1,2,…,L}是一個二值變量集,其中:sl,i表明第l層、第i個神經(jīng)元是否存在;L表示神經(jīng)網(wǎng)絡的最大層數(shù);Il表示第l層的神經(jīng)元最大數(shù)量。
演化合成的目標[10]是通過迭代的方式分析神經(jīng)網(wǎng)絡結(jié)構(gòu)關(guān)于時間的最優(yōu)概率分布,再通過一個演化的形式逐漸合成縮小的深度神經(jīng)網(wǎng)絡。每次迭代基于父代的神經(jīng)網(wǎng)絡隨機合成子代網(wǎng)絡,隨機合成的概率P(Sg)定義為:
P(Sg)=P(Sg|Wg-1)·F
(19)
式中:P(Sg|Wg-1)為合成的概率模型;F表示外部環(huán)境因素。每次迭代訓練子代網(wǎng)絡,以模型準確率為目標,以效率和網(wǎng)絡結(jié)構(gòu)的多樣性為約束條件。環(huán)境因子F作為演化過程的先驗約束條件,用以縮小網(wǎng)絡結(jié)構(gòu)的搜索空間,尋找其中最佳的概率分布來建模最優(yōu)的網(wǎng)絡結(jié)構(gòu),合成概率模型P(Sg)作為神經(jīng)網(wǎng)絡的遺傳編碼。
為了支持多層神經(jīng)網(wǎng)絡,將P(Sg|Wg-1)分解為多變量概率分布,最終合成子代深度神經(jīng)網(wǎng)絡,分解方法為:
P(Sg|Wg-1)=
(20)
圖3 基于演化合成的深度神經(jīng)網(wǎng)絡優(yōu)化算法
在實驗室搭建了仿真實驗的MDM光通信系統(tǒng),圖4是實驗室的光通信系統(tǒng)模型。神經(jīng)網(wǎng)絡的編程環(huán)境為Intel(R) Core(TM) i7-4790 CPU, 3.6 GHz,內(nèi)存為16 GB。
圖4 實驗室的光通信模型
利用MATLAB軟件生成隨機數(shù)據(jù),通過軟件將數(shù)據(jù)轉(zhuǎn)化為并行數(shù)據(jù)形式,將數(shù)據(jù)分為信道1和信道2。使用QPSK將信道調(diào)制為125(Mbaud/s),兩個信道的副載波頻率為250 MHz。使用Mach-Zehnder調(diào)制器進行光學調(diào)制[12],采用兩個1.55 μm的前饋激光器(DFB-LD)產(chǎn)生激光信號。發(fā)送端將兩個光信號耦合,產(chǎn)生不均勻的激光模式,光纖是50 μm芯徑雙包層的光纖。
接收端的光纖耦合器將信號分為兩束,光探測器以2 Gbit/s的速度檢測光信號,然后經(jīng)過模數(shù)轉(zhuǎn)換器獲得數(shù)字信號,解調(diào)后的信號包含兩個信道信號。
采集兩個數(shù)據(jù)集,分別為訓練集和測試集。同步采集通信系統(tǒng)發(fā)送端數(shù)據(jù)集和接收端數(shù)據(jù)集,采集的數(shù)據(jù)集組織成元組形式(x,y),x為輸入數(shù)據(jù),y為x對應的期望輸出數(shù)據(jù)。
首先需確定隱藏層數(shù)量和神經(jīng)元數(shù)量,通過一組實驗觀察不同超參數(shù)的檢測性能。共設(shè)立11個信道條件,信道的信噪比分別為3、5、7、8、10、12、14、16、18、19、19.5 dB,使用ZF技術(shù)來計算信道矩陣。接收端將11個信道條件的數(shù)據(jù)保存為11個數(shù)據(jù)集,每個信道收集了2 000 000個符號,選擇每個信道的200 000個符號作為訓練集。實驗設(shè)備是2×2的MDM光通信系統(tǒng),共有4個輸入符號和4個輸出符號。如果QPSK調(diào)制器1輸出的符號為(+1-j1),QPSK調(diào)制器2輸出的符號為(-1+j1),那么期望的接收符號為(+1-1+1-1),該期望值也是DNN的期望輸出值。
采用誤碼率(Bit Error Rate, BER)[13]評估神經(jīng)網(wǎng)絡實際輸出值和期望輸出值的誤差,不同超參數(shù)對應的實驗結(jié)果如圖5所示。因為多模光纖具有高度非線性的特點,所以單元數(shù)量越多,誤碼率越低,單元數(shù)量達到20,誤碼率達到收斂。隱藏層的數(shù)量越高,誤碼率越低,而7層隱藏層的性能低于6層隱藏層,所以本文的完全連接神經(jīng)網(wǎng)絡超參數(shù)設(shè)為6層隱藏層,每個隱藏層為20個神經(jīng)元。
圖5 完全連接神經(jīng)網(wǎng)絡的超參數(shù)實驗
圖6是6個隱層(20個單元)的收斂曲線,其中mini batch設(shè)為50。神經(jīng)網(wǎng)絡的收斂點為epoch=12,將收斂的模型用于MIMO檢測實驗。
圖6 神經(jīng)網(wǎng)絡的收斂曲線
DNN前向傳播和后向傳播的計算復雜度分別為O(n2m+m3(l-2))和O(I(n3m+m4(l-2))),其中:n為輸入向量的長度;m為隱層的單元數(shù)量;l是DNN的總層數(shù);I為梯度下降的迭代次數(shù)。將收斂網(wǎng)絡放入MDM光通信系統(tǒng)進行MIMO的檢測實驗。
對上文獲得的完全連接神經(jīng)網(wǎng)絡進行演化合成處理,合成的化簡神經(jīng)網(wǎng)絡結(jié)構(gòu)為“4-7-12-5-18-7-7-4”。然后統(tǒng)計兩個神經(jīng)網(wǎng)絡對測試集的平均符號檢測速度,完全連接神經(jīng)網(wǎng)絡大約每秒檢測24.5個符號,而合成神經(jīng)網(wǎng)絡大約每秒檢測134.3個符號,有效地提高了神經(jīng)網(wǎng)絡的檢測效率,見表1。提高MIMO的檢測效率對光通信系統(tǒng)的傳輸速度也是一個極大的提升。
表1 演化合成神經(jīng)網(wǎng)絡的結(jié)構(gòu)
上文訓練的完全連接DNN模型簡稱為FDNN(Full-connected Deep Neural Networks),演化合成DNN模型簡稱為RDNN(Reduced Deep Neural Networks),將兩個網(wǎng)絡分別集成到MDM光通信系統(tǒng)中進行MIMO檢測的實驗。此外選擇經(jīng)典的迫零檢測器(ZF)[14]和半正定松弛檢測器(SDR)[15]作為對比方法,SDR檢測器的迭代次數(shù)設(shè)為10。4個MIMO檢測算法采用相同的輸入數(shù)據(jù)集和期望接收數(shù)據(jù)集,圖7是4個檢測算法在不同信道條件下的誤碼率變化情況。在不同的信道條件下,ZF的誤碼率均最高,SDR的誤碼率明顯低于ZF,本文的兩個神經(jīng)網(wǎng)絡檢測器則明顯優(yōu)于SDR。比較FDNN和RDNN兩個檢測器的誤碼率,雖然RDNN的檢測性能有所衰減,但是其檢測效率明顯高于FDNN,而端到端傳輸時延是通信系統(tǒng)的關(guān)鍵指標。
圖7 4個檢測算法在不同信道條件下的誤碼率值
質(zhì)量參數(shù)Q-factor是另一個評價MIMO檢測性能的指標,Q-factor的計算式為:
(21)
表2為不同信道條件下FDNN和RDNN的Q-factor數(shù)值結(jié)果。結(jié)果顯示,當信噪比為19時,F(xiàn)DNN和RDNN的Q-factor分別為9.78 dB和10.11 dB,根據(jù)光通信系統(tǒng)的相關(guān)文獻[16-17],該指標值也是較為理想的結(jié)果。
表2 神經(jīng)網(wǎng)絡的Q-factor結(jié)果 dB
實驗結(jié)果表明了本文所設(shè)計FDNN的有效性,F(xiàn)DNN提高了光通信MIMO檢測的準確率。在本文的實驗條件下,訓練完全連接神經(jīng)網(wǎng)絡的時間大約為4 min。
本文采用演化合成技術(shù)訓練深度神經(jīng)網(wǎng)絡,將光通信系統(tǒng)MIMO的監(jiān)督信息作為演化合成的先驗信息,引導神經(jīng)網(wǎng)絡的演化,縮小神經(jīng)網(wǎng)絡的規(guī)模,提高網(wǎng)絡的結(jié)構(gòu)效率,避免在檢測過程中花費過長的時間,有助于提高光通信的傳輸效率。最終采用40個模式的MDM光通信系統(tǒng)建立了實驗,在模式耦合嚴重的情況下測試了本文MIMO檢測算法的性能,本文算法的性能優(yōu)于傳統(tǒng)的ZF檢測器和半正定松弛等MIMO檢測技術(shù)。本文設(shè)計了演化合成技術(shù)提高深度神經(jīng)網(wǎng)絡的結(jié)構(gòu)效率,并通過實驗驗證了化簡神經(jīng)網(wǎng)絡的有效性,化簡神經(jīng)網(wǎng)絡犧牲了可忽略的檢測準確率,但是檢測速度得到了極大的提升,在通信系統(tǒng)中,端到端傳輸時延是一個極為重要的考量指標。