谷志群,張佳瑋,紀越峰,于浩,塔里克·塔勒布
(1. 北京郵電大學(xué)信息光子學(xué)與光通信國家重點實驗室,北京 100876; 2. 奧盧大學(xué),芬蘭 奧盧 90570)
通信網(wǎng)絡(luò)的規(guī)模部署不斷升級,寬帶網(wǎng)絡(luò)的流量需要日益劇增,尤其是4K/8K視頻、虛擬現(xiàn)實(vitual reality,VR)游戲、物聯(lián)網(wǎng)、無人駕駛等相關(guān)智能終端和新業(yè)務(wù)的涌現(xiàn),在帶寬、時延、可靠性等方面給網(wǎng)絡(luò)傳輸性能提出了新的差異化需求[1]。作為承載業(yè)務(wù)的光傳送網(wǎng)絡(luò),雖然其在傳輸容量、傳輸質(zhì)量等方面的性能已經(jīng)得到了廣泛的認可,但為應(yīng)對未來新興業(yè)務(wù)的需求,仍面臨著傳輸資源不足等諸多挑戰(zhàn)。因此,如何實現(xiàn)資源的高效整合利用、提供差異化定制化的服務(wù)成為傳輸網(wǎng)絡(luò)發(fā)展亟待解決的難題。
針對上述問題,常規(guī)思路通常在于提升網(wǎng)絡(luò)的“硬實力”。一方面,通過多模式、多纖芯等方式,增大網(wǎng)絡(luò)的傳輸容量。另一方面,由傳統(tǒng)固定柵格轉(zhuǎn)變?yōu)榭伸`活調(diào)整柵格,由剛性管道轉(zhuǎn)變?yōu)槿嵝怨艿?,以此提升光網(wǎng)絡(luò)資源的利用率。但是,傳統(tǒng)形態(tài)下數(shù)學(xué)模型與香農(nóng)定理、摩爾定律等物理規(guī)律所建立起來的寬帶網(wǎng)絡(luò),其傳輸容量和效率已趨于“極限”,導(dǎo)致業(yè)務(wù)需求與網(wǎng)絡(luò)資源適配性弱等難題。近年,軟件定義網(wǎng)絡(luò)、網(wǎng)絡(luò)功能虛擬化、云計算、大數(shù)據(jù)、人工智能等新技術(shù)的涌現(xiàn),驅(qū)動光網(wǎng)絡(luò)朝著自動化、數(shù)字化、智能化變革,因此,需要在不斷提升網(wǎng)絡(luò)“硬實力”的同時,采用新技術(shù)提升網(wǎng)絡(luò)的“軟實力”,即通過物理模型和智能算法實現(xiàn)從軟件和硬件兩方面協(xié)同提升當前網(wǎng)絡(luò)傳輸性能,逐漸成為突破傳統(tǒng)光網(wǎng)絡(luò)技術(shù)瓶頸的關(guān)鍵。目前,提升網(wǎng)絡(luò)“軟實力”主要有模型驅(qū)動和數(shù)據(jù)驅(qū)動兩種方式。
基于模型驅(qū)動[2]的方法,通常建立在光網(wǎng)絡(luò)的物理機制和數(shù)學(xué)原理等經(jīng)驗知識之上,通過建立嚴格的數(shù)學(xué)模型來簡化復(fù)雜的網(wǎng)絡(luò)問題。從光網(wǎng)絡(luò)的發(fā)展歷程上看,網(wǎng)絡(luò)的模型具有比較完備的理論支撐,基于模型驅(qū)動的方法具有較強的算法收斂性和可解釋性,網(wǎng)絡(luò)屬性和狀態(tài)是數(shù)據(jù)和環(huán)境參數(shù)信息的高度凝練,經(jīng)過長期驗證,其算法具有高效性。但是隨著網(wǎng)絡(luò)規(guī)模的不斷升級和新型業(yè)務(wù)應(yīng)用的持續(xù)深化,網(wǎng)絡(luò)的復(fù)雜性和數(shù)據(jù)量逐漸增加,只依靠模型分析的方法難以實現(xiàn)超大規(guī)模網(wǎng)絡(luò)的完備覆蓋和快速響應(yīng)[3],尤其是針對動態(tài)業(yè)務(wù)和網(wǎng)絡(luò)狀態(tài)難以進行實時建模,致使難以建立精準的網(wǎng)絡(luò)模型。
基于數(shù)據(jù)驅(qū)動[4]的方法,通過從歷史數(shù)據(jù)中汲取知識,同時依靠其自我演進的能力,可以做出適配當前業(yè)務(wù)和網(wǎng)絡(luò)狀態(tài)的路由決策。例如人工神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)、強化學(xué)習(xí)等機器學(xué)習(xí)方法以數(shù)據(jù)驅(qū)動為核心,不通過網(wǎng)絡(luò)建模,即可對網(wǎng)絡(luò)參數(shù)狀態(tài)進行大范圍或全局的搜索,通過分析網(wǎng)絡(luò)數(shù)據(jù)之間的潛在關(guān)系進行學(xué)習(xí)泛化,依據(jù)大量的開源模型和數(shù)據(jù)找出網(wǎng)絡(luò)的最佳形態(tài),相對于傳統(tǒng)物理模型刻畫的網(wǎng)絡(luò)狀態(tài),可以有效提升網(wǎng)絡(luò)性能。然而,這種數(shù)據(jù)驅(qū)動的方式在理論分析上存在一定局限性,智能算法的“黑盒性”(“黑盒性”指智能算法模型的內(nèi)部工作機制,以及模型不同特征之間的相互作用關(guān)系難以理解,無法估計每個特征參數(shù)對算法模型性能的重要性)使得網(wǎng)絡(luò)最佳狀態(tài)的可解釋性較差,導(dǎo)致網(wǎng)絡(luò)的分析和運營管理難度加大;此外由于數(shù)據(jù)驅(qū)動方法高度依賴大數(shù)據(jù),在實際的網(wǎng)絡(luò)環(huán)境中,檢測儀器和檢測環(huán)境等現(xiàn)實因素的限制,使得網(wǎng)絡(luò)的真實數(shù)據(jù)難以獲得,嚴重限制數(shù)據(jù)驅(qū)動模型的學(xué)習(xí)和分析效果。
綜上所述,結(jié)合其各自特點采用基于數(shù)據(jù)與模型協(xié)同驅(qū)動[5]的方法,可以打破上述傳統(tǒng)模型驅(qū)動與數(shù)據(jù)驅(qū)動的限制,即:通過以模型驅(qū)動為主,以數(shù)據(jù)驅(qū)動為輔,賦予傳統(tǒng)模型與網(wǎng)絡(luò)實時交互的能力。充分利用現(xiàn)有的硬件系統(tǒng)配置,挖掘傳輸網(wǎng)絡(luò)的內(nèi)在潛力,探索業(yè)務(wù)特征與網(wǎng)絡(luò)狀態(tài)的耦合規(guī)律,尋找光傳輸網(wǎng)絡(luò)的最佳工作狀態(tài)。
隨著通信網(wǎng)絡(luò)技術(shù)的應(yīng)用發(fā)展,全國網(wǎng)絡(luò)流量將呈現(xiàn)持續(xù)爆炸式增長的趨勢[1]。同時,超高清視頻傳輸、自動駕駛和工業(yè)互聯(lián)等新興業(yè)務(wù)的大量增加,在網(wǎng)絡(luò)帶寬、時延和可靠性等方面對承載網(wǎng)絡(luò)提出了更高的差異化服務(wù)要求。傳統(tǒng)網(wǎng)絡(luò)模式形態(tài)難以滿足日益增加的業(yè)務(wù)流量及其差異化的服務(wù)要求,迫切需要借助大數(shù)據(jù)、人工智能等技術(shù)推動光網(wǎng)絡(luò)朝著智能化變革[6]。光網(wǎng)絡(luò)朝著智能化的邁進,對光網(wǎng)絡(luò)的物理層、網(wǎng)絡(luò)層和業(yè)務(wù)層3個層面分別提出了新的發(fā)展需求。
(1)物理層狀態(tài)感知需求
隨著通信技術(shù)的迅速發(fā)展,網(wǎng)絡(luò)承載數(shù)據(jù)業(yè)務(wù)逐漸趨于多樣化,如遠程手術(shù)、自動駕駛等新型業(yè)務(wù),需要光網(wǎng)絡(luò)提供超高可靠性服務(wù)。光網(wǎng)絡(luò)在信息傳輸過程中需要經(jīng)過多個物理器件(如光纖、放大器、光復(fù)用/解復(fù)用器等),這些物理器件的制造工藝、生命周期及其工作環(huán)境具有較強的不確定性,導(dǎo)致經(jīng)過這些物理器件的光路傳輸狀態(tài)存在不確定性;此外,由于不同種類數(shù)據(jù)業(yè)務(wù)的動態(tài)變化,光網(wǎng)絡(luò)資源配置需要不斷進行重置調(diào)整,以保證網(wǎng)絡(luò)的傳輸性能。然而,光路的頻繁拆除和重建會嚴重加劇其傳輸狀態(tài)的不確定性,嚴重影響網(wǎng)絡(luò)傳輸可靠性,因此需要對光路物理層傳輸狀態(tài)進行準確感知,從而實現(xiàn)網(wǎng)絡(luò)資源和傳輸配置的優(yōu)化選擇,以保證網(wǎng)絡(luò)傳輸可靠性。
(2)網(wǎng)絡(luò)層資源聯(lián)動需求
傳輸網(wǎng)絡(luò)的多樣性和異構(gòu)性體現(xiàn)在多種傳輸資源的共存,數(shù)據(jù)信息的傳輸需要經(jīng)過無線設(shè)備、光傳送設(shè)備、信息處理等多種設(shè)備組成的端到端傳輸鏈路,使得光、無線等多種異構(gòu)網(wǎng)絡(luò)相互交織,增加了網(wǎng)絡(luò)的復(fù)雜性和異構(gòu)性,從而導(dǎo)致網(wǎng)絡(luò)資源配置與部署的難度加大。同時,業(yè)務(wù)流量的動態(tài)變化(如時空潮汐效應(yīng)),使得不同地區(qū)不同時間的帶寬資源消耗存在較大差異,這一特性加劇了光網(wǎng)絡(luò)資源配置的復(fù)雜性。僅通過單一的網(wǎng)絡(luò)資源控制方式,依托網(wǎng)管控制和人工干預(yù)的控制方法,難以實現(xiàn)網(wǎng)絡(luò)資源的高效靈活分配,尤其是復(fù)雜環(huán)境下容易使得網(wǎng)絡(luò)陷入局部優(yōu)化“陷阱”,嚴重影響網(wǎng)絡(luò)整體性能優(yōu)化。因此,需要建立更加智能的網(wǎng)絡(luò)資源分配模式,實現(xiàn)光與無線網(wǎng)絡(luò)資源的高效部署與跨域資源的聯(lián)動。
(3)業(yè)務(wù)層切片定制需求
隨著超大連接、超高帶寬、超低時延應(yīng)用技術(shù)的發(fā)展,光網(wǎng)絡(luò)需要承載的業(yè)務(wù)需求種類日益增加。不同應(yīng)用場景下的業(yè)務(wù)對網(wǎng)絡(luò)性能的要求(如傳輸速率、時延、帶寬、安全可靠性、隔離性等)具有較大差異。為了高效地承載差異化業(yè)務(wù)需求,網(wǎng)絡(luò)切片(network slicing,NS)技術(shù)通過在邏輯上相互隔離各個網(wǎng)絡(luò)切片,使得每個網(wǎng)絡(luò)切片可擁有自己獨立的網(wǎng)絡(luò)資源和管控方式,提供不同類型業(yè)務(wù)服務(wù)。隨著通信網(wǎng)絡(luò)應(yīng)用規(guī)模不斷升級優(yōu)化,不同的應(yīng)用網(wǎng)絡(luò)服務(wù)模式、可用帶寬、傳輸速率、安全性及可靠性等差異逐漸增加,對網(wǎng)絡(luò)切片技術(shù)的要求增加,因此需要根據(jù)多樣化業(yè)務(wù)的嚴苛要求,通過將基礎(chǔ)設(shè)施網(wǎng)絡(luò)切分成面向不同業(yè)務(wù)類型,定制得到隔離度不同的多個網(wǎng)絡(luò)切片來實現(xiàn)網(wǎng)絡(luò)差異化服務(wù)。
信息通信網(wǎng)絡(luò)作為萬物互聯(lián)的基礎(chǔ)設(shè)施,是支撐全行業(yè)、全社會運行的主要保障。現(xiàn)有信息通信體系在速率、覆蓋和時延等方面難以支撐未來全行業(yè)多樣化應(yīng)用的需求,亟須在傳輸網(wǎng)理念、架構(gòu)設(shè)計和管理以及服務(wù)智能化等方面進行根本性的技術(shù)變革。
人工智能技術(shù)的快速發(fā)展為信息網(wǎng)絡(luò)的智能化帶來了前所未有的契機,將人工智能引入光網(wǎng)絡(luò),基于硬件設(shè)備可編程控制的前提,設(shè)計智能信息網(wǎng)絡(luò)架構(gòu),研究光與無線資源高效融合和匹配映射算法,可以實現(xiàn)光/無線等傳輸設(shè)備的統(tǒng)一控制和光/無線融合網(wǎng)絡(luò)資源的跨域聯(lián)動。基于數(shù)據(jù)與模型協(xié)同驅(qū)動思想,本文提出數(shù)據(jù)與模型協(xié)同驅(qū)動的“3層3循環(huán)”網(wǎng)絡(luò)架構(gòu),如圖1所示?!?層”指的是物理層、控制層和智能決策層。其中,物理層包含用戶終端、無線傳輸網(wǎng)絡(luò)、光傳輸網(wǎng)絡(luò)和邊緣/核心計算網(wǎng)絡(luò),囊括了信號的編/解碼與調(diào)制/解調(diào)過程??刂茖影W(wǎng)絡(luò)監(jiān)控模塊、傳輸網(wǎng)絡(luò)控制器和計算資源控制器,其中傳輸網(wǎng)絡(luò)控制器包含無線網(wǎng)絡(luò)控制器和光傳輸網(wǎng)絡(luò)控制器;計算資源控制器包含邊緣計算資源控制器和云計算資源控制器。傳輸網(wǎng)絡(luò)控制器與計算資源控制器協(xié)同控制,相互合作。智能決策層包含AI模型庫、業(yè)務(wù)/網(wǎng)絡(luò)數(shù)據(jù)庫和智能算法/模型,AI模型庫包括經(jīng)典的機器學(xué)習(xí)模型(如循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)、長短期記憶(long short-term memory,LSTM)和強化學(xué)習(xí)(reinforcement learning,RL)等),業(yè)務(wù)/網(wǎng)絡(luò)數(shù)據(jù)庫存儲業(yè)務(wù)速率信息和網(wǎng)絡(luò)資源信息,用于智能算法/模型中物理信道、網(wǎng)絡(luò)優(yōu)化等模型的訓(xùn)練與性能評估。
圖1 數(shù)據(jù)與模型協(xié)同驅(qū)動的“3層3循環(huán)”網(wǎng)絡(luò)架構(gòu)
“3循環(huán)”充分體現(xiàn)智能體(如神經(jīng)網(wǎng)絡(luò)模型)在物理層、控制層和智能決策層3層結(jié)構(gòu)中自學(xué)習(xí)、自優(yōu)化的循環(huán)過程。第1個循環(huán)主要包括物理狀態(tài)的智能感知、上報與智能調(diào)控,為實現(xiàn)智能傳輸網(wǎng)絡(luò)的硬件提供基礎(chǔ);第2個循環(huán)包括網(wǎng)絡(luò)層異構(gòu)資源的抽象與統(tǒng)一調(diào)配,為實現(xiàn)智能傳輸網(wǎng)絡(luò)提供軟件保障;第3個循環(huán)包括基于數(shù)模協(xié)同思想的數(shù)據(jù)分析與模型優(yōu)化相結(jié)合,是做出智能決策實現(xiàn)智能傳輸網(wǎng)絡(luò)的關(guān)鍵。
基于“3層3循環(huán)”網(wǎng)絡(luò)架構(gòu),通過智能光網(wǎng)絡(luò)資源的統(tǒng)一調(diào)度和分配,實現(xiàn)網(wǎng)絡(luò)的“3可功能”特性:物理層狀態(tài)可感知、網(wǎng)絡(luò)層資源可聯(lián)動和業(yè)務(wù)層切片可定制。物理層狀態(tài)可感知是指上層的控制層和網(wǎng)絡(luò)決策層可以感知底層物理層設(shè)備和資源的使用情況,用于做出相應(yīng)分析和決策;網(wǎng)絡(luò)層資源可聯(lián)動是指通過對網(wǎng)絡(luò)中光域、無線域和電域等多維資源進行聯(lián)合建模及協(xié)同調(diào)度,打破多種網(wǎng)絡(luò)資源因物理屬性不同而造成分域自治的限制;業(yè)務(wù)層切片可定制是指在同一物理設(shè)施上的基礎(chǔ)上,通過軟隔離/硬隔離的方式切分得到多個虛擬網(wǎng)絡(luò),進而實現(xiàn)對多種差異化業(yè)務(wù)的高效承載。
本文在提出的“3層3循環(huán)”的智能光與無線融合網(wǎng)絡(luò)架構(gòu)基礎(chǔ)上,采用數(shù)模協(xié)同驅(qū)動的研究方法,分別對物理層狀態(tài)智能感知技術(shù)、網(wǎng)絡(luò)層資源智能聯(lián)動技術(shù)和業(yè)務(wù)層切片智能定制技術(shù)展開研究,以實現(xiàn)更加高效的資源部署和分配策略,提升網(wǎng)絡(luò)資源的利用率,實現(xiàn)未來網(wǎng)絡(luò)全生命周期的自動化和智能化。
在“3層3循環(huán)”網(wǎng)絡(luò)架構(gòu)的基礎(chǔ)上,筆者所在研究組提出了數(shù)模協(xié)同驅(qū)動方法[7],結(jié)合模型驅(qū)動對網(wǎng)絡(luò)強大的建模能力和數(shù)據(jù)驅(qū)動對數(shù)據(jù)全面的感知能力,一方面根據(jù)光網(wǎng)絡(luò)的物理機制和數(shù)學(xué)原理等經(jīng)驗知識,構(gòu)建嚴格的數(shù)學(xué)模型(如線性規(guī)劃模型、高斯模型和輔助圖模型等)來簡化復(fù)雜網(wǎng)絡(luò)問題的求解;另一方面利用數(shù)據(jù)驅(qū)動對歷史數(shù)據(jù)的挖掘能力和自我演進能力,學(xué)習(xí)業(yè)務(wù)和網(wǎng)絡(luò)數(shù)據(jù)的內(nèi)在聯(lián)系。數(shù)據(jù)與模型協(xié)同驅(qū)動方法如圖2所示,模型驅(qū)動對網(wǎng)絡(luò)行為進行建模,縮小了數(shù)據(jù)驅(qū)動的探索空間,加快數(shù)據(jù)驅(qū)動的求解過程;數(shù)據(jù)驅(qū)動通過感知和學(xué)習(xí)數(shù)據(jù)中的知識,修正傳統(tǒng)模型中一些不準確的參數(shù),使修正后的模型更適合當前業(yè)務(wù)和網(wǎng)絡(luò)狀態(tài),實現(xiàn)網(wǎng)絡(luò)性能的提升。通過數(shù)據(jù)與模型協(xié)同驅(qū)動的智能化手段,可以進一步挖掘光與無線網(wǎng)絡(luò)的內(nèi)在潛力,在不改變硬件傳輸配置的情況下,僅通過數(shù)模協(xié)同驅(qū)動的智能算法等手段來有效提升傳輸網(wǎng)絡(luò)的資源利用率和網(wǎng)絡(luò)容量,為未來智能傳輸網(wǎng)絡(luò)提供理論與技術(shù)基礎(chǔ)。
圖2 數(shù)據(jù)與模型協(xié)同驅(qū)動方法
面向物理層狀態(tài)的感知需求,本文針對“3層3循環(huán)”網(wǎng)絡(luò)架構(gòu)中第1個循環(huán)實現(xiàn)技術(shù)展開研究。物理層狀態(tài)的智能感知技術(shù)作為實現(xiàn)智能傳輸網(wǎng)絡(luò)的硬件基礎(chǔ),通過對物理層參數(shù)數(shù)據(jù)的智能分析實現(xiàn)對光鏈路和網(wǎng)絡(luò)的性能的評估,從而影響網(wǎng)絡(luò)智能決策。
本文以光路傳輸質(zhì)量(quality of transmission,QoT)預(yù)測為例,對物理層狀態(tài)的感知技術(shù)進行研究。光路QoT作為物理層傳輸狀態(tài)的綜合表征指標之一,其預(yù)測感知方法研究得到了廣泛的關(guān)注。傳統(tǒng)的分布傅里葉法[7-8]QoT預(yù)測方案是基于光信號在光纖中的傳輸理論進行數(shù)理建模從而進行光路QoT預(yù)測,精度較低,難以用于光物理層狀態(tài)的在線感知和預(yù)測。機器學(xué)習(xí)(machine learning,ML)可以通過大量樣本數(shù)據(jù)自動學(xué)習(xí)擬合樣本間的非線性關(guān)系,且訓(xùn)練完成后可快速計算,因此,以數(shù)理模型為指導(dǎo),基于ML的QoT預(yù)測方案可以彌補數(shù)理模型的缺陷。
基于機器學(xué)習(xí)的QoT預(yù)測模型如圖3所示,可以實現(xiàn)高精度快速的QoT預(yù)測[9-13],但光信號在網(wǎng)絡(luò)中傳輸受諸多非平穩(wěn)環(huán)境因素(如業(yè)務(wù)波動、器件損耗、部署環(huán)境變化等)影響,導(dǎo)致光傳輸狀態(tài)呈現(xiàn)較強的不確定性[14]。例如光信號衰減以及信道參數(shù)的不確定變化等因素使得光信道傳輸質(zhì)量難以被準確感知,從而使光路傳輸?shù)目煽啃韵陆礫15-19]。因此,如何實現(xiàn)光物理層狀態(tài)感知與高精度預(yù)測是實現(xiàn)光網(wǎng)絡(luò)高效傳輸?shù)囊粋€關(guān)鍵問題。
圖3 基于機器學(xué)習(xí)的QoT預(yù)測
針對該問題,筆者所在研究組針對數(shù)模協(xié)同驅(qū)動的智能感知技術(shù)進行研究,提出基于深度學(xué)習(xí)的光路QoT智能預(yù)測方法(如圖4所示)[20],該方法依據(jù)大量的光傳輸網(wǎng)絡(luò)歷史數(shù)據(jù),借用機器學(xué)習(xí)強大的數(shù)據(jù)挖掘能力學(xué)習(xí)信道狀態(tài)信息到光物理層狀態(tài)的映射關(guān)系。在真實網(wǎng)絡(luò)場景中采集1024個數(shù)據(jù)集(包括網(wǎng)絡(luò)配置信息、頻譜分布、光放大器實時參數(shù)以及與之對應(yīng)的Q因子),通過在此數(shù)據(jù)集上對神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,以提取網(wǎng)絡(luò)狀態(tài)特征到Q因子的深度映射。同時,設(shè)計一種自動調(diào)參機制,將神經(jīng)網(wǎng)絡(luò)定義為一個函數(shù),神經(jīng)網(wǎng)絡(luò)的超參數(shù)為函數(shù)的變量。根據(jù)初始化參數(shù)和可變超參數(shù)建立神經(jīng)網(wǎng)絡(luò)模型,基于收集的數(shù)據(jù)進行交叉驗證,誤差最小時對應(yīng)的超參數(shù)即神經(jīng)網(wǎng)絡(luò)最佳超參數(shù)。最后通過自適應(yīng)梯度下降法完成神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,實現(xiàn)光路傳輸質(zhì)量的精確預(yù)測。模型均方誤差與迭代次數(shù)的關(guān)系如圖5所示,數(shù)據(jù)預(yù)測值與實際Q-actor值的散點分布圖如圖6所示,模型訓(xùn)練收斂后實現(xiàn)快速準確的光物理層狀態(tài)感知,為光傳輸網(wǎng)絡(luò)可靠高效傳輸提供有力支撐。該研究基于數(shù)模協(xié)同驅(qū)動的多信道傳輸質(zhì)量預(yù)測方案通過自主學(xué)習(xí)信道狀態(tài)與對應(yīng)QoT的映射關(guān)系,實現(xiàn)網(wǎng)絡(luò)物理層狀態(tài)可感知功能,對光網(wǎng)絡(luò)中的光路QoT進行精確預(yù)測,使網(wǎng)絡(luò)控制器獲得精確的物理層感知信息,為網(wǎng)絡(luò)優(yōu)化部署提供基礎(chǔ)。
圖4 數(shù)模協(xié)同驅(qū)動的光路傳輸質(zhì)量智能預(yù)測技術(shù)
圖5 模型均方誤差與迭代次數(shù)的關(guān)系
圖6 數(shù)據(jù)預(yù)測值與實際Q-actor值的散點分布圖
面向網(wǎng)絡(luò)層資源聯(lián)動需求,本文針對“3層3循環(huán)”網(wǎng)絡(luò)架構(gòu)和第2個循環(huán)的實現(xiàn)技術(shù)展開研究??缬蚓W(wǎng)絡(luò)層資源的智能聯(lián)動技術(shù)主要通過控制層對跨域網(wǎng)絡(luò)資源的協(xié)同控制,實現(xiàn)網(wǎng)絡(luò)層異構(gòu)資源的統(tǒng)一調(diào)配,從而實現(xiàn)光與無線等多種融合異構(gòu)網(wǎng)絡(luò)資源優(yōu)化配置。
本文以X-Haul網(wǎng)絡(luò)為例,對光電跨層網(wǎng)絡(luò)資源的聯(lián)動技術(shù)進行研究。X-Haul被認為是未來5G網(wǎng)絡(luò)通用的、靈活的異構(gòu)傳輸網(wǎng)絡(luò)解決方案,將前傳、中傳和回傳及其所有的光與無線技術(shù)整合到一個基于分組的通用傳輸網(wǎng)絡(luò)中。X-Haul采用雙層網(wǎng)絡(luò)架構(gòu),即跨層網(wǎng)絡(luò)架構(gòu),如圖7所示,包含IP層和光層,其中IP層節(jié)點裝配了路由器/交換機等電層設(shè)備,負責(zé)細粒度業(yè)務(wù)流的匯聚;光層包含光纖、光模塊、ROADM等光層設(shè)備,負責(zé)為業(yè)務(wù)提供大容量“剛性”的傳輸通道。X-Haul作為承載網(wǎng)組網(wǎng)方案,其業(yè)務(wù)具有高動態(tài)性的特點。業(yè)務(wù)流量在其生命周期內(nèi)隨時間不斷變化,不同業(yè)務(wù)連接建立(因服務(wù)開始進入網(wǎng)絡(luò))和連接拆除(因服務(wù)結(jié)束離開網(wǎng)絡(luò))的時間具有隨機性,業(yè)務(wù)的到達和離開具有較大的不確定性?;凇癐P+光”雙層架構(gòu)的復(fù)雜特性以及業(yè)務(wù)的高動態(tài)性,如何實現(xiàn)資源高效的跨層網(wǎng)絡(luò)路由配置成為X-Haul中面臨的一項重要問題。
圖7 跨層網(wǎng)絡(luò)架構(gòu)
光電跨層網(wǎng)絡(luò)中的路由設(shè)計作為一個典型的光網(wǎng)絡(luò)資源的聯(lián)動問題,需要聯(lián)合決策業(yè)務(wù)路由波長分配以及節(jié)點間光路的建立與拆除。同時,由于網(wǎng)絡(luò)接入業(yè)務(wù)流量通常表現(xiàn)為“時空潮汐效應(yīng)”,即不同地理位置、不同地區(qū)、不同時間的帶寬資源消耗存在較大的差異,這一特性加劇了光網(wǎng)絡(luò)資源聯(lián)動的復(fù)雜性。在保障接入業(yè)務(wù)高質(zhì)量承載的前提下,傳統(tǒng)網(wǎng)絡(luò)場景中算法對時間維度變化業(yè)務(wù)的感知能力不足,且跨層路由采用固定策略決策模型,導(dǎo)致網(wǎng)絡(luò)波長資源使用利用率低下。采用深度強化學(xué)習(xí)(2eep reinforcement learning,DRL)等數(shù)據(jù)驅(qū)動方法,正逐漸取代傳統(tǒng)的基于整數(shù)線性規(guī)劃(integral linear programming,ILP)方法[21]和啟發(fā)式算法[22]的模型驅(qū)動的資源聯(lián)動方法,成為網(wǎng)絡(luò)層資源智能聯(lián)動的核心技術(shù)。這類“黑箱”方法在理論特性分析上往往存在困難;然而,其高度依賴高質(zhì)量大數(shù)據(jù),隨著網(wǎng)絡(luò)規(guī)模的進一步擴大,規(guī)劃問題的解空間維度災(zāi)難問題為路由決策效率帶來了嚴峻挑戰(zhàn)。
針對上述問題,筆者所在研究組對數(shù)據(jù)與模型協(xié)同驅(qū)動的網(wǎng)絡(luò)資源智能聯(lián)動技術(shù)進行了研究,提出一種數(shù)模協(xié)同驅(qū)動的智能路由策略(collaborative 2ata-2riven an2 mo2el-2riven intelligent routing engine,ADMIRE)[5]。該策略采用的數(shù)學(xué)模型是傳統(tǒng)的輔助圖模型,ADMIRE跨層網(wǎng)絡(luò)路由原理如圖8所示,該模型基于跨層路由的經(jīng)驗知識構(gòu)建(如網(wǎng)絡(luò)架構(gòu)、路由策略等),包含依據(jù)路由策略預(yù)先設(shè)定的輔助圖邊權(quán)重和基于跨層網(wǎng)絡(luò)架構(gòu)構(gòu)建的輔助圖拓撲。ADMIRE將業(yè)務(wù)流量數(shù)據(jù)和網(wǎng)絡(luò)狀態(tài)數(shù)據(jù)作為深度強化學(xué)習(xí)的輸入,深度強化學(xué)習(xí)利用神經(jīng)網(wǎng)絡(luò)提取業(yè)務(wù)數(shù)據(jù)和網(wǎng)絡(luò)數(shù)據(jù)的特征,經(jīng)過不斷的訓(xùn)練,深度強化學(xué)習(xí)會做出決策并修改輔助圖邊權(quán)重,根據(jù)人為經(jīng)驗預(yù)先設(shè)定的輔助圖邊權(quán)重會演進為優(yōu)化的、適配當前業(yè)務(wù)和網(wǎng)絡(luò)狀態(tài)的輔助圖邊權(quán)重。ADMIRE利用該權(quán)重給輔助圖拓撲賦值,更新輔助圖模型,最終修正后的輔助圖模型會為業(yè)務(wù)制定最優(yōu)的路由決策,100條業(yè)務(wù)流使用波長數(shù)量對比如圖9所示,不同子集使用波長數(shù)量對比如圖10所示。該研究通過數(shù)據(jù)與模型協(xié)同驅(qū)動建立跨層網(wǎng)絡(luò)智能路由,實現(xiàn)了光與無線網(wǎng)絡(luò)層資源可聯(lián)動功能,有效提高網(wǎng)絡(luò)資源使用率。研究結(jié)果表明,隨著網(wǎng)絡(luò)數(shù)據(jù)業(yè)務(wù)的大量增加,可有效減少網(wǎng)絡(luò)建設(shè)和運維成本。
圖8 ADMIRE跨層網(wǎng)絡(luò)路由原理
圖10 不同子集使用波長數(shù)量對比
面向業(yè)務(wù)層切片定制需求,本文針對“3層3循環(huán)”網(wǎng)絡(luò)架構(gòu)第3個循環(huán)的實現(xiàn)技術(shù)展開研究。業(yè)務(wù)層切片的智能定制技術(shù)基于數(shù)據(jù)與模型協(xié)同的思想,通過智能決策層對業(yè)務(wù)/網(wǎng)絡(luò)數(shù)據(jù)進行建模,尋找到網(wǎng)絡(luò)切片資源最佳配置方式,從而實現(xiàn)對網(wǎng)絡(luò)性能進行優(yōu)化配置。
不同應(yīng)用場景下的業(yè)務(wù)對網(wǎng)絡(luò)性能的要求差異明顯,比如傳輸速率、時延、帶寬、安全可靠性、隔離性等要求都不一致。為了高效地承載差異化業(yè)務(wù)需求,需要通過網(wǎng)絡(luò)切片(network slicing,NS)技術(shù)為業(yè)務(wù)提供差異化的網(wǎng)絡(luò)服務(wù)。端到端切片全生命周期管理如圖11所示,現(xiàn)有網(wǎng)絡(luò)切片定制化研究可主要分為切片定制化生成、切片實例化部署以及切片動態(tài)調(diào)整和刪除 3個部分。切片定制化生成主要研究如何根據(jù)用戶需求(如可靠性、時延等)定制得到虛擬切片網(wǎng)絡(luò)拓撲,完成網(wǎng)絡(luò)切片服務(wù)的前期準備[23-24]。切片實例化部署階段將考慮當前時刻下物理網(wǎng)絡(luò)資源狀態(tài)和切片業(yè)務(wù)的特殊需求(如隔離性等),將已生成的虛擬切片拓撲結(jié)構(gòu)部署到物理網(wǎng)絡(luò)中,實現(xiàn)切片業(yè)務(wù)的承載和運維[25]。切片動態(tài)調(diào)整和刪除階段將根據(jù)業(yè)務(wù)時變的資源需求,進行動態(tài)調(diào)整所分配的切片資源,直到業(yè)務(wù)請求離去后刪除該切片[26-28]。
圖11 端到端切片全生命周期管理
為滿足多樣化業(yè)務(wù)的嚴苛要求,網(wǎng)絡(luò)切片技術(shù)通過將基礎(chǔ)設(shè)施網(wǎng)絡(luò)切分成面向不同業(yè)務(wù)類型的多個邏輯網(wǎng)絡(luò)來滿足租戶的定制化需求。由于網(wǎng)絡(luò)環(huán)境和數(shù)據(jù)業(yè)務(wù)的動態(tài)變化,如何在保證服務(wù)質(zhì)量的同時,滿足網(wǎng)絡(luò)租戶長期收益的最大化是多維度跨域網(wǎng)絡(luò)切片資源的端到端管理面臨的挑戰(zhàn)。傳統(tǒng)基于模型分析的切片方案對于靈活變化的業(yè)務(wù)和網(wǎng)絡(luò)狀態(tài)的適配能力不足,導(dǎo)致業(yè)務(wù)服務(wù)質(zhì)量下降和網(wǎng)絡(luò)資源利用效率低下等問題。因此,如何通過數(shù)模協(xié)同技術(shù)實現(xiàn)切片資源定制化是實現(xiàn)網(wǎng)絡(luò)自動化與高效服務(wù)提供的關(guān)鍵問題。
針對上述問題,筆者所在研究組對業(yè)務(wù)層切片智能定制技術(shù)進行研究,提出一種基于深度強化學(xué)習(xí)的切片智能配置方法,允許根據(jù)用戶不同的移動模式,定制化不同粒度的切片資源配置,以及切片資源遷移[29]。網(wǎng)絡(luò)切片定制化架構(gòu)如圖12所示,該方案將整體架構(gòu)劃分為兩層,分別為編排層和網(wǎng)絡(luò)層。其中,編排層的決策器是整個方案的核心,其主要組成部分為請求管理器、學(xué)習(xí)模塊、觸發(fā)器選擇器模塊和算法比較器模塊。決策器通過請求管理器模塊與網(wǎng)絡(luò)層交互,通過學(xué)習(xí)網(wǎng)絡(luò)狀態(tài)進行決策選擇,例如擴大/縮小不同類型的資源,例如 RAM、CPU等或遷移虛擬機,并根據(jù)決策產(chǎn)生的效果而獲得獎勵。學(xué)習(xí)過程中的狀態(tài)、動作以及根據(jù)動作效果所產(chǎn)生的獎勵值需要被統(tǒng)籌設(shè)計來建立一個優(yōu)化的學(xué)習(xí)系統(tǒng)。獎勵值比較如圖13所示,準確性比較如圖14所示,經(jīng)驗證,該方案在獎勵值穩(wěn)定性和部署準確性方面有較好的性能。該研究數(shù)據(jù)與模型聯(lián)合驅(qū)動的方式為智能光網(wǎng)絡(luò)的發(fā)展提供了范式,通過對業(yè)務(wù)與網(wǎng)絡(luò)的特性的提取、挖掘、分析和學(xué)習(xí),并結(jié)合網(wǎng)絡(luò)優(yōu)化模型,實現(xiàn)網(wǎng)絡(luò)切片業(yè)務(wù)可定制功能,以滿足網(wǎng)絡(luò)不同業(yè)務(wù)差異化需求,實現(xiàn)網(wǎng)絡(luò)的可持續(xù)發(fā)展。
圖12 網(wǎng)絡(luò)切片定制化架構(gòu)
圖13 獎勵值比較
圖14 準確性比較
基于數(shù)模協(xié)同驅(qū)動的“3層3循環(huán)”網(wǎng)絡(luò)架構(gòu),筆者所在研究組開發(fā)了數(shù)模協(xié)同驅(qū)動的智能傳輸網(wǎng)絡(luò)平臺,如圖15所示,該平臺由智能傳輸網(wǎng)絡(luò)管理系統(tǒng)、智能傳輸網(wǎng)絡(luò)控制器、硬件實驗環(huán)境3部分組成。其中,智能傳輸網(wǎng)絡(luò)管理系統(tǒng)主要用來實現(xiàn)網(wǎng)絡(luò)狀態(tài)的初始化配置及實驗結(jié)果的呈現(xiàn)可視化,有助于對網(wǎng)絡(luò)狀態(tài)和參數(shù)信息進行實時監(jiān)控管理;智能傳輸網(wǎng)絡(luò)控制器部署在高性能服務(wù)器中,用于運行基于數(shù)模協(xié)同驅(qū)動的智能算法以及光和無線傳輸網(wǎng)絡(luò)資源的統(tǒng)一調(diào)配,是網(wǎng)絡(luò)智能化實現(xiàn)技術(shù)的核心模塊,直接影響對網(wǎng)絡(luò)的分析和決策;硬件實驗環(huán)境包括具有感知與可編程能力的白盒光分插復(fù)用裝置、可編程以太網(wǎng)交換機等,用于網(wǎng)絡(luò)流量的轉(zhuǎn)發(fā),為實現(xiàn)網(wǎng)絡(luò)波長和路由等資源配置提供硬件基礎(chǔ)。
圖15 智能傳輸網(wǎng)絡(luò)實驗平臺
智能傳輸網(wǎng)絡(luò)實驗平臺通過智能光傳輸網(wǎng)絡(luò)控制系統(tǒng)與硬件實驗環(huán)境智能化、實時性交互,在“3層3循環(huán)”網(wǎng)絡(luò)架構(gòu)中實現(xiàn)多個功能驗證。
(1)針對傳輸網(wǎng)絡(luò)環(huán)境非平穩(wěn)特征,通過可擴展的南向接口模塊實現(xiàn)對網(wǎng)絡(luò)設(shè)備、業(yè)務(wù)接入的遙測功能,即對于物理層網(wǎng)絡(luò)狀態(tài)與業(yè)務(wù)特征的智能感知,為智能決策提供基礎(chǔ)。
(2)面向光與無線融合傳輸網(wǎng)絡(luò)泛在、異構(gòu)網(wǎng)絡(luò)資,源設(shè)計核心編排模塊,在網(wǎng)絡(luò)層實現(xiàn)跨域資源可聯(lián)動,為資源優(yōu)化提供實現(xiàn)基礎(chǔ)。一方面,面向硬件設(shè)備,實現(xiàn)狀態(tài)信息收集、存儲等功能;另一方面,面向用戶側(cè),實現(xiàn)對于網(wǎng)絡(luò)資源的智能、統(tǒng)一編排。
(3)為解決新興垂直行業(yè)對傳輸網(wǎng)絡(luò)的差異化、多元化需求,通過控制系統(tǒng)內(nèi)置的人工智能算法模塊與核心編排模塊的實時交互,實現(xiàn)業(yè)務(wù)層切片動態(tài)化、智能化可定制,為定制化、精細化服務(wù)提供理論算法、硬件實現(xiàn)支撐。智能光傳輸網(wǎng)絡(luò)平臺測試硬件環(huán)境如圖16所示。
圖16 智能光傳輸網(wǎng)絡(luò)平臺測試硬件環(huán)境
圍繞“3層3循環(huán)”網(wǎng)絡(luò)架構(gòu)及其可感知、可聯(lián)動和可定制的“3可功能”特征,本文所提出的基于數(shù)據(jù)與模型協(xié)同驅(qū)動的光網(wǎng)絡(luò)智能化實現(xiàn)技術(shù)在智能傳輸網(wǎng)絡(luò)實驗平臺上得到驗證?;谏鲜銎脚_,完成了所提智能算法的時延驗證及吞吐量、端到端時延/抖動、丟包率等相關(guān)性能測試。研究方案經(jīng)過第三方機構(gòu)測試,測試結(jié)果驗證了本文所提出的智能算法具有較高的預(yù)測精度、可有效提高網(wǎng)絡(luò)的容量,提升網(wǎng)絡(luò)資源利用率,實現(xiàn)了可感知、可聯(lián)動和可定制的功能。此外,通過智能傳輸網(wǎng)絡(luò)實驗平臺實現(xiàn)了從業(yè)務(wù)接入高質(zhì)量服務(wù)全過程的自動化配置,驗證了業(yè)務(wù)自動化管理及網(wǎng)絡(luò)狀態(tài)實時可視化的功能。
光網(wǎng)絡(luò)作為業(yè)務(wù)承載的基礎(chǔ)網(wǎng)絡(luò),隨著信息網(wǎng)絡(luò)數(shù)字化、智能化的發(fā)展演進,智能化光網(wǎng)絡(luò)逐漸成為研究和創(chuàng)新熱點。網(wǎng)絡(luò)業(yè)務(wù)需求的大量增加、網(wǎng)絡(luò)規(guī)模的逐漸擴大以及超大連接、超高帶寬、超低時延等業(yè)務(wù)的增加對網(wǎng)絡(luò)資源利用和差異化服務(wù)提出了更高要求,傳統(tǒng)模型驅(qū)動下網(wǎng)絡(luò)形態(tài)和網(wǎng)絡(luò)的配置方式將面臨挑戰(zhàn)。本文基于數(shù)據(jù)和模型驅(qū)動協(xié)同思想,提出“3層3循環(huán)”網(wǎng)絡(luò)架構(gòu)及其“3可功能”特征的智能光網(wǎng)絡(luò)技術(shù)方案,并開發(fā)設(shè)計了數(shù)模協(xié)同驅(qū)動的智能傳輸網(wǎng)絡(luò)平臺,對所提出的智能化實現(xiàn)技術(shù)進行評估驗證,為未來實現(xiàn)AI與光網(wǎng)絡(luò)的深度融合、實現(xiàn)智能化光網(wǎng)絡(luò)提供基礎(chǔ)。