孫曉川,李志剛,張明輝,桂冠
(1.南京郵電大學(xué)通信與信息工程學(xué)院,江蘇 南京 210003;2.華北理工大學(xué)人工智能學(xué)院,河北 唐山 063210;3.河北工業(yè)大學(xué)電子信息工程學(xué)院,天津 300401)
第5代移動(dòng)通信系統(tǒng)(5G)的飛速發(fā)展[1-3]不斷促進(jìn)云計(jì)算、遠(yuǎn)程教育、智能城市、自動(dòng)駕駛等高端需求的進(jìn)一步發(fā)展,使終端用戶數(shù)量、網(wǎng)絡(luò)業(yè)務(wù)量和數(shù)據(jù)流量快速增長(zhǎng),支撐數(shù)字通信基礎(chǔ)設(shè)施的廣域光骨干網(wǎng)面臨嚴(yán)峻的挑戰(zhàn)[4]。全球范圍內(nèi),骨干網(wǎng)干線采用的都是光通信傳輸模式。為滿足未來(lái)400 Gbit/s速率的傳輸要求,構(gòu)建高帶寬、大容量、快速響應(yīng)的智能全光網(wǎng)勢(shì)在必行[5]。根據(jù)信道狀態(tài)、系統(tǒng)資源和用戶業(yè)務(wù)需求,未來(lái)智能光網(wǎng)絡(luò)應(yīng)能夠自適應(yīng)地調(diào)整信號(hào)速率、調(diào)制格式、波長(zhǎng)等參數(shù),實(shí)現(xiàn)骨干網(wǎng)資源的最大化利用。作為未來(lái)智能光網(wǎng)絡(luò)的核心技術(shù),系統(tǒng)性能參數(shù)的監(jiān)控、識(shí)別和預(yù)警,尤其是光信道性能分析與預(yù)測(cè),是保障高速骨干網(wǎng)通信質(zhì)量不可或缺的重要組成部分。
眾所周知,骨干網(wǎng)絡(luò)的光層特性決定了網(wǎng)絡(luò)承載流量的效率。光信道傳輸質(zhì)量(QoT,quality of transmission)極易受色度色散、偏振模色散、光纖非線性、噪聲等多種損傷參數(shù)的影響[6-7]。這些因素的波動(dòng)會(huì)導(dǎo)致光信道傳輸?shù)耐话l(fā)性、空間異質(zhì)性和復(fù)雜的非線性關(guān)系,從而給高容量、大帶寬、快響應(yīng)的骨干網(wǎng)可靠通信帶來(lái)巨大的挑戰(zhàn)。通常,質(zhì)量因子(Q因子)是衡量光信道傳輸質(zhì)量最具代表性的度量標(biāo)準(zhǔn)之一。
高效的光通信質(zhì)量預(yù)測(cè)對(duì)管理大規(guī)模的光傳輸和交換系統(tǒng)非常重要[8]。這是因?yàn)槲磥?lái)光骨干網(wǎng)絡(luò)將是一種具備動(dòng)態(tài)重構(gòu)和鏈路級(jí)恢復(fù)功能的網(wǎng)狀網(wǎng)絡(luò),技術(shù)更復(fù)雜,極易受到網(wǎng)絡(luò)故障、錯(cuò)誤配置、信號(hào)質(zhì)量惡化等因素的影響[9]。具體地,一個(gè)短暫的服務(wù)中斷會(huì)影響大量的數(shù)據(jù)通信,且隨著信道數(shù)、數(shù)據(jù)傳送速率以及通信距離增大,光網(wǎng)絡(luò)對(duì)非線性效應(yīng)更敏感。
近年來(lái),機(jī)器學(xué)習(xí)(ML,machine learning)在骨干網(wǎng)通信中的應(yīng)用已成為研究熱點(diǎn),特別是在光信道性能預(yù)測(cè)方面,主要包括支持向量機(jī)、隨機(jī)森林、決策樹和神經(jīng)網(wǎng)絡(luò)等[10-12]。目前,關(guān)于光信道性能預(yù)測(cè)的絕大多數(shù)研究都集中于單信道模式,這顯然無(wú)法為光網(wǎng)絡(luò)管控的智能化決策提供更準(zhǔn)確的信息。而利用多信道性能預(yù)測(cè)輔助光網(wǎng)絡(luò)智能化管控的研究很少。文獻(xiàn)[13]研究了基于人工神經(jīng)網(wǎng)絡(luò)(ANN,artificial neural network)的多信道Q因子預(yù)測(cè)方法,利用實(shí)時(shí)網(wǎng)絡(luò)運(yùn)行和配置信息,在563.4 km的模擬實(shí)驗(yàn)平臺(tái)上進(jìn)行了不同信道開關(guān)模式下的Q因子預(yù)測(cè)。但該方法在處理多信道QoT預(yù)測(cè)問(wèn)題時(shí)受到兩方面制約:1)單一ANN模型實(shí)質(zhì)上是弱學(xué)習(xí)器,很難得到期望的預(yù)測(cè)結(jié)果,大量研究表明,通過(guò)某種策略聯(lián)合多個(gè)學(xué)習(xí)器,性能會(huì)顯著優(yōu)于單個(gè)學(xué)習(xí)器[14];2)模擬光通信數(shù)據(jù)嚴(yán)重影響了ANN在實(shí)際光信道QoT評(píng)估中的有效性,而商用光網(wǎng)絡(luò)的真實(shí)數(shù)據(jù)更能反映光信道的不確定性和未知因素,更有助于構(gòu)建一個(gè)有效而精確的ML模型。
集成學(xué)習(xí)(EL,ensemble learning)是一種應(yīng)用廣泛的機(jī)器學(xué)習(xí)優(yōu)化方法,可以將弱預(yù)測(cè)器集成組合為強(qiáng)預(yù)測(cè)器,提高算法的非線性逼近性能[15]。具體地,集成學(xué)習(xí)分別對(duì)多個(gè)單一學(xué)習(xí)器(同質(zhì)/異質(zhì))進(jìn)行訓(xùn)練,按照某種策略對(duì)學(xué)習(xí)結(jié)果進(jìn)行整合,從而找到每個(gè)學(xué)習(xí)器之間的互補(bǔ)性,獲得更加優(yōu)秀的性能。一方面,集成學(xué)習(xí)中的結(jié)合策略可以減輕由于特征不相關(guān)和冗余而產(chǎn)生的剩余效應(yīng);另一方面,多個(gè)獨(dú)立模型學(xué)習(xí)能力的變化使它們能夠捕獲不同的數(shù)據(jù)特征,為整合結(jié)果提供了附加價(jià)值[16]。利用這些優(yōu)勢(shì),集成學(xué)習(xí)模型可以獲得比模型中任何獨(dú)立模型更好的預(yù)測(cè)性能。目前,集成學(xué)習(xí)算法主要包括Bagging算法、Boosting算法和Stacking算法[17]。其中,Stacking算法常用于提升機(jī)器學(xué)習(xí)模型的預(yù)測(cè)性能。鑒于此,本文將探索基于Stacking的集成學(xué)習(xí)模型在光信道QoT預(yù)測(cè)中的可行性。
本文提出了一種基于集成學(xué)習(xí)的新型廣域光骨干網(wǎng)絡(luò)多信道QoT預(yù)測(cè)方法。結(jié)構(gòu)上,該模型由5個(gè)多層感知機(jī)(MLP,multilayer perceptron)組成的基預(yù)測(cè)器和一個(gè)MLP組成的元預(yù)測(cè)器堆棧而成。訓(xùn)練模式上,分別訓(xùn)練基預(yù)測(cè)器中的MLP,整合其預(yù)測(cè)結(jié)果作為元預(yù)測(cè)器的輸入進(jìn)行二次訓(xùn)練,最終的結(jié)果兼顧多個(gè)預(yù)測(cè)模型的學(xué)習(xí)能力。實(shí)驗(yàn)結(jié)果表明,集成多個(gè)學(xué)習(xí)器使光信道QoT預(yù)測(cè)方法的泛化性能更強(qiáng)和可移植性更優(yōu),避免了單一學(xué)習(xí)器的預(yù)測(cè)精度不足,分散了預(yù)測(cè)誤差的風(fēng)險(xiǎn),提高了光信道性能預(yù)測(cè)的可靠性。
本文構(gòu)建了基于Stacking算法的廣域光骨干網(wǎng)多信道QoT預(yù)測(cè)模型,簡(jiǎn)稱為EL-MLP。特別地,考慮Q因子作為信道通信質(zhì)量的度量標(biāo)準(zhǔn)。結(jié)構(gòu)上,基于EL-MLP的Q因子預(yù)測(cè)模型由數(shù)據(jù)選取、參數(shù)尋優(yōu)和模型構(gòu)建3個(gè)模塊構(gòu)成,如圖1所示。受數(shù)據(jù)采集設(shè)備和不可控因素的影響,每個(gè)信道中的Q因子數(shù)據(jù)量存在差異,通過(guò)數(shù)據(jù)選取模塊,在單信道和多信道情況下選出等量的樣本數(shù)據(jù)集,并根據(jù)多信道選擇模式確定信道狀態(tài),確保后續(xù)的模型訓(xùn)練在相同數(shù)據(jù)量和相同多信道場(chǎng)景下進(jìn)行。采用參數(shù)尋優(yōu)模塊從所有備選參數(shù)中篩選出對(duì)預(yù)測(cè)器預(yù)測(cè)性能最有利的參數(shù)設(shè)置(如迭代次數(shù)、學(xué)習(xí)速率),輸入模型構(gòu)建模塊,確定最優(yōu)的EL-MLP預(yù)測(cè)模型。本文采用格式搜索的方法。
圖1 基于EL-MLP的Q因子預(yù)測(cè)模型
在多信道預(yù)測(cè)的信道選擇中,設(shè)置4種打開或關(guān)閉的信道狀態(tài)以生成4種不同的場(chǎng)景[13]。此外,設(shè)置包含信道狀態(tài)和Q因子特征的組合向量V來(lái)有效地表達(dá)每一條信道中Q因子的狀態(tài)。假設(shè)第1、第3、第5信道處于打開狀態(tài),[1,0,1,0,1,0,0,0]表示當(dāng)前所有信道的狀態(tài),其中,“1”表示對(duì)應(yīng)信道已被光網(wǎng)絡(luò)信號(hào)占用,“0”表示對(duì)應(yīng)信道為開放頻譜信道。8個(gè)信道的相關(guān)Q因子特征λi(i=1,2,…,8)與信道狀態(tài)的組合向量為
根據(jù)組合向量,對(duì)處于信道關(guān)閉狀態(tài)的Q因子進(jìn)行預(yù)測(cè)。一方面為處于打開狀態(tài)的信道減少負(fù)荷;另一方面為已接收的網(wǎng)絡(luò)流量分配合理的信道空間,避免出現(xiàn)負(fù)載過(guò)高、負(fù)載不平衡的現(xiàn)象。
MLP模型可以通過(guò)學(xué)習(xí)樣本集建立輸入與輸出之間的非線性映射。MLP模型的參數(shù)少且結(jié)構(gòu)簡(jiǎn)單,可以快速準(zhǔn)確地處理Q因子時(shí)間序列數(shù)據(jù)之間的非線性關(guān)系[18],因此本文選用MLP作為基預(yù)測(cè)器和元預(yù)測(cè)器的組件。
EL-MLP訓(xùn)練實(shí)際上是利用初始訓(xùn)練集訓(xùn)練出最優(yōu)的基學(xué)習(xí)器,然后對(duì)基學(xué)習(xí)器中的所有MLP的輸出結(jié)果疊加取平均,生成一個(gè)新數(shù)據(jù)集,用于訓(xùn)練元學(xué)習(xí)器。通常,MLP通過(guò)誤差反向傳播方法進(jìn)行訓(xùn)練。首先進(jìn)行前向傳播計(jì)算,任意一層神經(jīng)元對(duì)應(yīng)的輸出為
MLP訓(xùn)練的目的是通過(guò)最小化損失函數(shù)來(lái)確定最優(yōu)的權(quán)重矩陣和偏置。假設(shè)MLP網(wǎng)絡(luò)的最后一層為第k層,則損失函數(shù)為
其中,Lk表示第k層的所有神經(jīng)元,表示第k層第j個(gè)節(jié)點(diǎn)的預(yù)測(cè)值,表示第k層第j個(gè)節(jié)點(diǎn)的真實(shí)值。權(quán)重矩陣和偏置的迭代方程如下。
其中,η為學(xué)習(xí)速率。更新權(quán)重矩陣和偏置,直到損失函數(shù)達(dá)到指定范圍或迭代次數(shù)大于最大迭代次數(shù),MLP訓(xùn)練結(jié)束。EL-MLP訓(xùn)練算法偽代碼如算法1所示。
本節(jié)首先介紹了實(shí)驗(yàn)所采用的數(shù)據(jù)集、模型性能評(píng)估標(biāo)準(zhǔn)和模型參數(shù)選擇。然后利用集成學(xué)習(xí)模型EL-MLP對(duì)單信道內(nèi)Q因子數(shù)據(jù)進(jìn)行預(yù)測(cè)評(píng)估。最后建立了同時(shí)預(yù)測(cè)多信道內(nèi)Q因子的EL-MLP模型,并分別在4種不同場(chǎng)景下進(jìn)行了對(duì)比,檢驗(yàn)了模型的預(yù)測(cè)精度及泛化能力。
本文綜合評(píng)估了在單一光信道和多種場(chǎng)景下不同光信道中EL-MLP模型對(duì)QoT的預(yù)測(cè)性能。特別地,采用Q因子作為光信道QoT的度量標(biāo)準(zhǔn)。本文所使用的數(shù)據(jù)集來(lái)源于2015年2月到2016年4月微軟北美光骨干網(wǎng),廣泛應(yīng)用于研究光信道的時(shí)間行為、信號(hào)質(zhì)量、信道之間的相關(guān)性、段之間的相關(guān)性等[9]。此外,選取了8種光信道Q因子時(shí)間序列數(shù)據(jù)作為樣本集,序列長(zhǎng)度為20 000。
為進(jìn)一步驗(yàn)證該模型良好的非線性逼近性能,考慮了多層ANN進(jìn)行性能對(duì)比[13],實(shí)際上,這是一個(gè)深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。此外,本文采用均方誤差(MSE,mean square error)和平均絕對(duì)值誤差(MAE,mean absolute error)評(píng)估模型的預(yù)測(cè)性能。
其中,yi表示Q因子真實(shí)值,yp表示其預(yù)測(cè)值,N表示時(shí)間序列長(zhǎng)度。實(shí)驗(yàn)中,MSE和MAE的值越小,表明該模型對(duì)Q因子的預(yù)測(cè)精度越高,模型預(yù)測(cè)性能越好。
本文采用的EL-MLP第一層基預(yù)測(cè)器由5個(gè)結(jié)構(gòu)相同的MLP模型構(gòu)成,第二層元預(yù)測(cè)器由一個(gè)MLP模型構(gòu)成。MLP結(jié)構(gòu)包括一個(gè)輸入層、一個(gè)輸出層和2個(gè)隱藏層,每一層神經(jīng)元規(guī)模設(shè)置為(6,6,6,6)。此外,本文使用網(wǎng)格搜索方法和五折交叉驗(yàn)證方法對(duì)EL-MLP的迭代次數(shù)和學(xué)習(xí)速率進(jìn)行優(yōu)化。首先,確定迭代次數(shù)E和學(xué)習(xí)速率η的取值范圍,即E∈{1,51,101,151,201},η∈{1×10-4,2×10-4,3×10-4,4×10-4,5×10-4}。然后,在取值范圍內(nèi)構(gòu)建5×5的網(wǎng)格,從第一個(gè)網(wǎng)格(E1,η1)開始,遍歷網(wǎng)格中所有參數(shù)對(duì)并進(jìn)行五折交叉驗(yàn)證,求得所有的MSE如表1所示。其中,最小MSE對(duì)應(yīng)的參數(shù)組合是最優(yōu)的。
表1 模型參數(shù)設(shè)置
圖2給出了EL-MLP和ANN針對(duì)單信道模式Q因子時(shí)間序列的預(yù)測(cè)趨勢(shì)對(duì)比。從圖2可以看出,EL-MLP可以更有效地?cái)M合Q因子序列的變化趨勢(shì),這意味著該模型具有更好的預(yù)測(cè)性能。圖3給出了不同時(shí)間步下評(píng)估模型對(duì)單信道模式Q因子的預(yù)測(cè)誤差對(duì)比。顯然,在大部分區(qū)域,EL-MLP的誤差值明顯低于ANN的誤差值。
表2從MAE和MSE這2個(gè)方面對(duì)比了EL-MLP和ANN的單信道模式QoT預(yù)測(cè)性能。從表2可以看出,在該度量標(biāo)準(zhǔn)下,EL-MLP對(duì)Q因子時(shí)間序列的非線性逼近性能優(yōu)于ANN一個(gè)數(shù)量級(jí)以上。
圖2 單信道模式Q因子時(shí)間序列預(yù)測(cè)趨勢(shì)對(duì)比
圖3 單信道模式Q因子預(yù)測(cè)誤差對(duì)比
表2 單信道模式模型QoT預(yù)測(cè)性能對(duì)比
本節(jié)考慮4種應(yīng)用場(chǎng)景,構(gòu)建了多輸入多輸出EL-MLP模型,同時(shí)對(duì)多個(gè)光信道通信質(zhì)量進(jìn)行預(yù)測(cè)。具體地,場(chǎng)景1中,光信道3處于開啟狀態(tài),利用EL-MLP與ANN預(yù)測(cè)另外7個(gè)光信道中的Q因子值。場(chǎng)景2中,光信道1、2處于開啟狀態(tài),預(yù)測(cè)剩余6個(gè)光信道的Q因子值。場(chǎng)景3中,光信道1、3和5處于開啟狀態(tài),預(yù)測(cè)剩余5個(gè)光信道的Q因子值。場(chǎng)景4中,光信道1、3、5和7處于開啟狀態(tài),預(yù)測(cè)剩余4個(gè)光信道的Q因子值。
圖4對(duì)比了4種應(yīng)用場(chǎng)景下評(píng)估模型對(duì)光信道Q因子的預(yù)測(cè)性能,即不同光信道Q因子預(yù)測(cè)值與實(shí)際值的對(duì)比。與ANN相比,EL-MLP的Q因子預(yù)測(cè)值更接近實(shí)際值。表3給出了不同的多信道QoT預(yù)測(cè)場(chǎng)景下評(píng)估模型的預(yù)測(cè)性能。特別地,針對(duì)MSE性能度量,EL-MLP的預(yù)測(cè)性能比ANN提高了2個(gè)數(shù)量級(jí)。
圖4 不同應(yīng)用場(chǎng)景下評(píng)估模型對(duì)于各信道Q因子預(yù)測(cè)性能比較
表3 多信道模式下模型預(yù)測(cè)性能對(duì)比
為了驗(yàn)證EL-MLP的預(yù)測(cè)性能,本文針對(duì)光信道8在4種場(chǎng)景下的Q因子預(yù)測(cè)值進(jìn)行了分析,如圖5所示。在不同場(chǎng)景模式中,EL-MLP依然可以更有效地?cái)M合Q因子時(shí)間序列的變化趨勢(shì)。這些結(jié)果說(shuō)明在多信道QoT預(yù)測(cè)任務(wù)中所提模型具有更好的預(yù)測(cè)性能與泛化能力。
綜上所述,相比單一的機(jī)器學(xué)習(xí)模型,采用集成學(xué)習(xí)方法對(duì)光骨干網(wǎng)QoT預(yù)測(cè)更有效。這是因?yàn)榧蓪W(xué)習(xí)組合多個(gè)同態(tài)學(xué)習(xí)器進(jìn)行光信道QoT預(yù)測(cè),不僅能夠有效緩解單一學(xué)習(xí)器的過(guò)擬合問(wèn)題,而且可以顯著減小因參數(shù)選擇不準(zhǔn)確而引起預(yù)測(cè)精度降低的風(fēng)險(xiǎn),極大地提高了算法的泛化性能。
作為未來(lái)智能光網(wǎng)絡(luò)的核心技術(shù),系統(tǒng)性能參數(shù)的監(jiān)控、識(shí)別和預(yù)警,尤其是光信道性能分析與預(yù)測(cè),是保障高速骨干網(wǎng)通信質(zhì)量不可或缺的重要組成部分。本文研究了目前光信道QoT預(yù)測(cè)的機(jī)器學(xué)習(xí)方法,分析了單一預(yù)測(cè)模型存在的瓶頸問(wèn)題和集成學(xué)習(xí)理論的優(yōu)勢(shì),提出了一種基于集成學(xué)習(xí)的廣域光骨干網(wǎng)QoT預(yù)測(cè)方法,實(shí)現(xiàn)了針對(duì)不同光信道QoT的有效預(yù)測(cè),突破了現(xiàn)有解決方案在預(yù)測(cè)精度上的局限性。通過(guò)與深度計(jì)算模型的對(duì)比實(shí)驗(yàn)發(fā)現(xiàn),所提方法能夠極大地提高衡量光通信質(zhì)量的Q因子的預(yù)測(cè)精度(至少一個(gè)數(shù)量級(jí))。實(shí)際上,光信道傳輸質(zhì)量不同程度地依賴多種損失參數(shù),為進(jìn)一步提高QoT預(yù)測(cè)的準(zhǔn)確性,在未來(lái)的工作中擬研究在集成學(xué)習(xí)框架下多參數(shù)融合的多信道性能預(yù)測(cè)方法。
圖5 不同應(yīng)用場(chǎng)景下光信道8中Q因子預(yù)測(cè)趨勢(shì)對(duì)比