劉 軍,李伯中,陳 芳,李子凡,郭 瑩,孫雨瀟,鄧春雪,張儒依,王英旭
(國(guó)家電網(wǎng)有限公司信息通信分公司,北京 100761)
深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network, DNN)作為機(jī)器深度學(xué)習(xí)的基礎(chǔ)網(wǎng)絡(luò)之一,被應(yīng)用于鏈路光信噪比(Optical Signal-to-noise Ratio,OSNR)的監(jiān)測(cè)之中[1-2]。利用經(jīng)過(guò)模/數(shù)轉(zhuǎn)換器(Analog-to-Digital Converter, ADC)后的電信號(hào)數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),輸入到5層DNN中。卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)在圖像處理領(lǐng)域取得了巨大的突破與進(jìn)展,不同的OSNR水平下,信號(hào)的眼圖與星座圖表現(xiàn)不盡相同,因此,信號(hào)的眼圖與星座圖被用作CNN的輸入數(shù)據(jù)[3-5],將OSNR監(jiān)測(cè)由回歸問(wèn)題轉(zhuǎn)變成分類問(wèn)題,實(shí)現(xiàn)了OSNR的監(jiān)測(cè)。另一方面,由于OSNR數(shù)據(jù)是時(shí)間連續(xù)的,所以很適合利用循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network, RNN)與長(zhǎng)短期記憶(Long Short-Term Memory, LSTM)網(wǎng)絡(luò)回歸擬合。相干接收機(jī)的4路信號(hào)作為輸入數(shù)據(jù)直接訓(xùn)練LSTM網(wǎng)絡(luò)對(duì)OSNR進(jìn)行擬合[6-7],能夠獲得不錯(cuò)的效果。
以上基于機(jī)器學(xué)習(xí)的鏈路OSNR監(jiān)測(cè)方案在相干光通信系統(tǒng)中都取得了一定的成果,但在直調(diào)直檢(Intensity-Modulation and Direct Detection,IMDD)系統(tǒng)中還有待進(jìn)一步研究。針對(duì)IMDD系統(tǒng)高效低成本OSNR監(jiān)測(cè)需要,本文提出了基于DNN鏈路的監(jiān)測(cè)方案。將通信數(shù)據(jù)作為溝通物理層和網(wǎng)絡(luò)層的橋梁,通過(guò)大批量樣本訓(xùn)練挖掘鏈路信息。本文采用5層DNN的網(wǎng)絡(luò)結(jié)構(gòu),在5~15 dB范圍內(nèi),成功估計(jì)出了2 GBaud 開(kāi)關(guān)鍵控(On-Off Key,OOK)信號(hào)的OSNR值,平均絕對(duì)誤差(Mean Absolute Error, MAE)小于0.8 dB。該OSNR監(jiān)測(cè)方案具有準(zhǔn)確率高、成本低、運(yùn)行速度快和復(fù)雜度低的特點(diǎn),有助于實(shí)現(xiàn)精準(zhǔn)和動(dòng)態(tài)地鏈路監(jiān)測(cè),輔助光網(wǎng)絡(luò)高效運(yùn)維。
神經(jīng)網(wǎng)絡(luò)由大量神經(jīng)元(Neuron)構(gòu)成。每個(gè)神經(jīng)元的示意圖如圖1所示,圖中,X={x1,x2,x3,…,xn}為神經(jīng)元的輸入向量,W={w1,w2,w3,…,wn}為神經(jīng)元的權(quán)重向量。
圖1 神經(jīng)元示意圖
設(shè)該神經(jīng)元的閾值為φ,則該神經(jīng)元的輸出值y為
(1)
式中,f(x)為激活函數(shù)。激活函數(shù)一般選取Sigmoid函數(shù):
(2)
假設(shè)訓(xùn)練集T={(X1,Y1),(X2,Y2),…,(Xn,Yn)},Xn={x1,x2,x3,…,xa}為神經(jīng)網(wǎng)絡(luò)的輸入向量,a為輸入層神經(jīng)元個(gè)數(shù),Yn={y1,y2,y3,…,yc}為網(wǎng)絡(luò)的輸出向量,c為輸出層神經(jīng)元個(gè)數(shù),搭建含有輸入層、輸出層和隱藏層的3層全連接神經(jīng)網(wǎng)絡(luò),如圖2所示。
圖2 神經(jīng)網(wǎng)絡(luò)示意圖
(3)
反向梯度下降的權(quán)值更新公式為
(4)
反向梯度下閾值更新公式為
(5)
式中:η∈(0,1)為學(xué)習(xí)率(Learning rate),是神經(jīng)網(wǎng)絡(luò)最重要的超參數(shù),決定目標(biāo)函數(shù)收斂到全局最小值的概率以及收斂到全局最小值的速度;?為梯度下降算法,其不斷地調(diào)整權(quán)重至使誤差不斷減小;E為輸出層的輸出誤差,又被稱作損失函數(shù);t為迭代次數(shù)。
DNN是一種含有多個(gè)隱藏層的人工神經(jīng)網(wǎng)絡(luò)(Aritificial Neural Network,ANN),在機(jī)器視覺(jué)、語(yǔ)音識(shí)別和航天航空等領(lǐng)域得到了廣泛的應(yīng)用。DNN的多層隱藏層可以自動(dòng)提取輸入數(shù)據(jù)的深層次特征,增加模型的表達(dá)能力,幫助DNN對(duì)更復(fù)雜的數(shù)據(jù)進(jìn)行建模。本文提出了一種利用DNN預(yù)測(cè)光鏈路中OSNR的方法。光/電探測(cè)器(Photoelectric Detector, PD)將信號(hào)從光域轉(zhuǎn)換到電域后,直接輸入至DNN中。本文將長(zhǎng)度為512的信號(hào)序列送入DNN中進(jìn)行訓(xùn)練,所以DNN的輸入層神經(jīng)元數(shù)量也為512,最后輸出的OSNR 值是單個(gè)數(shù)據(jù),故將輸出層的神經(jīng)元數(shù)量設(shè)置為1。訓(xùn)練好的DNN將不需要預(yù)知系統(tǒng)的結(jié)構(gòu)參數(shù),可通過(guò)接收的數(shù)字信號(hào)預(yù)測(cè)得到鏈路當(dāng)前的OSNR值。
實(shí)驗(yàn)室對(duì)2 GBaud OOK信號(hào)傳輸進(jìn)行了建模仿真,仿真系統(tǒng)設(shè)置如圖3所示。激光光源輸出光入射至馬赫-曾德?tīng)栒{(diào)制器(Mach-Zehnder Modulator, MZM)中接受調(diào)制編碼,信號(hào)碼元由任意波形發(fā)生器(Arbitrary Waveform Generator, AWG)生成。而后,光信號(hào)經(jīng)由光耦合器(Optical Coupler, OC)與摻鉺光纖放大器(Erbium Doped Fiber Application Amplifier, EDFA)連接,引入自發(fā)輻射(Amplifier Spontaneous Emission, ASE)噪聲,可變光衰減器(Variable Optical Attenuator, VOA)用于控制ASE噪聲的大小,測(cè)量不同噪聲水平下的信號(hào)序列。PD將光信號(hào)轉(zhuǎn)換成電信號(hào),并將信號(hào)送入帶通濾波器(Band-Pass Filter, BPF)進(jìn)行帶通濾波,示波器(Digital Storage Oscilloscope, DSO)可以讀取電信號(hào)信號(hào)序列。最后將電信號(hào)序列送入訓(xùn)練好的DNN中,即可計(jì)算出系統(tǒng)的OSNR值。由于仿真的特殊性,我們可以輕松地記錄加入噪聲前后光信號(hào)的功率變化,將光信號(hào)功率代入下面的公式(6)計(jì)算可以求得鏈路的OSNR值。在實(shí)際的測(cè)量過(guò)程中,我們只能讀取到電信號(hào)的幅值,所以需要利用DNN去學(xué)習(xí)電信號(hào)與鏈路OSNR之間潛在的關(guān)聯(lián)。
圖3 監(jiān)測(cè)OSNR的仿真系統(tǒng)示意圖
鏈路的OSNR變化范圍設(shè)置為5~15 dB,步長(zhǎng)為1 dB。為了探究訓(xùn)練網(wǎng)絡(luò)所需要的數(shù)據(jù)集以及學(xué)習(xí)深度,我們選取的數(shù)據(jù)集分別為22 000、110 000和550 000組,網(wǎng)絡(luò)的隱藏層數(shù)目為1、3和5層,一共9種配置[3],并分別觀察了神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)性能。特別地,數(shù)據(jù)集由訓(xùn)練集、測(cè)試集和驗(yàn)證集3部分組成,其數(shù)量的比值為8∶1∶1,每組數(shù)據(jù)是一個(gè)長(zhǎng)度為512的信號(hào)序列。OSNR的計(jì)算公式為
(6)
式中:Psig為光信號(hào)的能量;Pnoise為噪聲的能量;Ew/o·noise為不含噪聲的信號(hào)幅值;Ew·noise為包含噪聲的信號(hào)幅值,|·|為絕對(duì)值函數(shù)。
DNN的結(jié)構(gòu)如圖4所示,輸入層用于接收并處理信號(hào),隨后與1/3/5層隱藏層連接,提取信號(hào)的特征,最終將數(shù)據(jù)送入輸出層,輸出由信號(hào)序列預(yù)測(cè)出的OSNR值。其中,輸入層包含512個(gè)神經(jīng)元,隱藏層每層包含500個(gè)神經(jīng)元,由于輸出的OSNR值只有1個(gè),所以輸出層的神經(jīng)元數(shù)量也為1。輸入和輸出層均采用線性函數(shù)(Linear Function)作為激活函數(shù)(Activation Function),隱藏層的激活函數(shù)選用線性整流函數(shù)(Rectified Linear Unit, ReLU)。網(wǎng)絡(luò)搭建完成后,選取Rmsprop優(yōu)化器針對(duì)訓(xùn)練數(shù)據(jù)的MAE進(jìn)行優(yōu)化處理,訓(xùn)練批次(Epoch)設(shè)置為300,批次大小(Batch size)設(shè)置為1 024。
圖4 DNN結(jié)構(gòu)示意圖
圖5所示為DNN在不同數(shù)據(jù)集數(shù)量和網(wǎng)絡(luò)層數(shù)下的預(yù)測(cè)結(jié)果。通過(guò)對(duì)比圖5(c)、5(f)和5(i)可知,隱藏層數(shù)目為1,即網(wǎng)絡(luò)總層數(shù)為3時(shí),相較于其他兩種網(wǎng)絡(luò),網(wǎng)絡(luò)的學(xué)習(xí)深度不夠,無(wú)法識(shí)別出電信號(hào)幅值與鏈路中OSNR的內(nèi)在聯(lián)系。進(jìn)一步對(duì)比圖5(d)與5(g)、5(e)與5(h)和5(f)與5(i)可知,3層和5層隱藏層對(duì)于網(wǎng)絡(luò)的學(xué)習(xí)性能差異并不明顯,而5層隱藏層需要訓(xùn)練的參量要多于3層隱藏層,訓(xùn)練速度更慢,更容易出現(xiàn)過(guò)擬合情況,所以3層隱藏層相較下是更好的網(wǎng)絡(luò)結(jié)構(gòu)。從數(shù)據(jù)集的角度來(lái)看,數(shù)據(jù)集為22 000組時(shí),3種隱藏層結(jié)構(gòu)的網(wǎng)絡(luò)表現(xiàn)均不佳;數(shù)據(jù)集為110 000組時(shí),3種隱藏層結(jié)構(gòu)的網(wǎng)絡(luò)都已初步學(xué)習(xí)到了信號(hào)幅值與OSNR的內(nèi)在聯(lián)系,但仍處于欠擬合狀態(tài);當(dāng)數(shù)據(jù)集增加至550 000組時(shí),3層和5層隱藏層結(jié)構(gòu)的網(wǎng)絡(luò)預(yù)估的OSNR值與實(shí)際OSNR值誤差已經(jīng)在1 dB以內(nèi),具備了快速、動(dòng)態(tài)和精準(zhǔn)地估計(jì)鏈路OSNR的能力。圖6所示為不同訓(xùn)練集數(shù)量下MAE隨網(wǎng)絡(luò)總層數(shù)的變化圖??偟膩?lái)說(shuō),數(shù)據(jù)集的量太小,神經(jīng)網(wǎng)絡(luò)無(wú)法從訓(xùn)練中學(xué)習(xí)到信號(hào)序列與OSNR值之間的聯(lián)系,網(wǎng)絡(luò)深度不夠,神經(jīng)網(wǎng)絡(luò)沒(méi)有能力提取信號(hào)的特征。
圖5 不同DNN結(jié)構(gòu)與訓(xùn)練集數(shù)量下的OSNR網(wǎng)絡(luò)預(yù)測(cè)圖
圖6 不同訓(xùn)練集數(shù)量下MAE隨網(wǎng)絡(luò)總層數(shù)的變化圖
綜合9種情況下網(wǎng)絡(luò)的表現(xiàn),數(shù)據(jù)集的量應(yīng)選為550 000組,隱藏層數(shù)應(yīng)設(shè)置為3層,即網(wǎng)絡(luò)總層數(shù)為5層,此時(shí)DNN的訓(xùn)練速度和學(xué)習(xí)表現(xiàn)都為較佳狀態(tài)。
網(wǎng)絡(luò)總層數(shù)為5層的DNN在550 000組數(shù)據(jù)集下的訓(xùn)練過(guò)程如圖7所示,隨著網(wǎng)絡(luò)訓(xùn)練輪次的不斷增加,訓(xùn)練集和驗(yàn)證集的MAE都在不斷減小,當(dāng)網(wǎng)絡(luò)經(jīng)歷了50輪次的訓(xùn)練后,驗(yàn)證集MAE變化趨于平緩。最終,神經(jīng)網(wǎng)絡(luò)的訓(xùn)練集MAE為0.31 dB,驗(yàn)證集MAE為0.65 dB。將測(cè)試集數(shù)據(jù)輸入訓(xùn)練好的DNN中,得到OSNR的預(yù)測(cè)MAE為0.67 dB,與驗(yàn)證集的結(jié)果相近。雖然網(wǎng)絡(luò)訓(xùn)練集和驗(yàn)證集的MAE相差較大,存在著一定的過(guò)擬合,但驗(yàn)證集和測(cè)試集的MAE相差較小,說(shuō)明模型具有很強(qiáng)的泛化能力。
圖7 5層DNN在550 000組數(shù)據(jù)集下的訓(xùn)練過(guò)程圖
網(wǎng)絡(luò)預(yù)測(cè)OSNR值與真實(shí)OSNR值之間的關(guān)系如圖8(a)所示,預(yù)測(cè)OSNR與真實(shí)OSNR相差大部分在1 dB以內(nèi)。圖8(b)所示為不同OSNR水平下,預(yù)測(cè)OSNR的MAE。由圖可知,所有OSNR水平下,預(yù)測(cè)MAE均低于0.8 dB,且實(shí)際OSNR為5 dB時(shí),預(yù)測(cè)出OSNR的MAE只有不到0.4 dB,說(shuō)明其預(yù)測(cè)準(zhǔn)確性最高。OSNR處于較低水平時(shí),信號(hào)受噪聲影響較大,故而DNN更能準(zhǔn)確地識(shí)別此時(shí)的OSNR值;當(dāng)鏈路的OSNR處于較高水平時(shí),噪聲對(duì)信號(hào)的影響較小,網(wǎng)絡(luò)對(duì)于OSNR值的識(shí)別誤差逐漸增加。本文所提方案只需將電信號(hào)輸入至1個(gè)DNN中,處理時(shí)延為3 ms,就可以實(shí)現(xiàn)鏈路OSNR的精準(zhǔn)和動(dòng)態(tài)監(jiān)測(cè)。相較于其他神經(jīng)網(wǎng)絡(luò),DNN結(jié)構(gòu)簡(jiǎn)單,運(yùn)算速度更快,并且網(wǎng)絡(luò)的輸入數(shù)據(jù)為電信號(hào)幅值,相較于輸入其他統(tǒng)計(jì)特征參量的方案,省去了數(shù)據(jù)處理步驟,進(jìn)一步降低了系統(tǒng)的復(fù)雜度,因此本文所提電域OSNR監(jiān)測(cè)方案具有成本低、運(yùn)行速度快和復(fù)雜度低等優(yōu)點(diǎn),是未來(lái)智能光網(wǎng)絡(luò)的理想選擇。
圖8 網(wǎng)絡(luò)預(yù)測(cè)性能評(píng)估
本文提出了一種基于DNN的電域信號(hào)處理、精確監(jiān)測(cè)OSNR的方案。該方案從PD接收到的電信號(hào)中提取OSNR的特征,不需要提前預(yù)知光傳輸鏈路的傳輸特性或人為輸入其他參數(shù),就可以準(zhǔn)確、靈活地監(jiān)測(cè)光鏈路的OSNR值。由實(shí)驗(yàn)結(jié)果可知,當(dāng)OSNR在5~15 dB時(shí),監(jiān)測(cè)的MAE<0.8 dB。本文所提基于DNN的電域OSNR監(jiān)測(cè)方案,能根據(jù)實(shí)時(shí)信號(hào)動(dòng)態(tài)反饋鏈路中的OSNR信息,輔助優(yōu)化光鏈路結(jié)構(gòu),有望助力未來(lái)智能光網(wǎng)絡(luò)更加穩(wěn)定和可靠。