劉光毅,鄧娟,鄭青碧,李剛,孫欣,黃宇紅
(中國(guó)移動(dòng)通信研究院,北京 100053)
人工智能技術(shù)的發(fā)展已走過了64年的歷程,其與移動(dòng)通信網(wǎng)絡(luò)的深度融合發(fā)展始于第五代移動(dòng)通信網(wǎng)絡(luò)(5G),人工智能不僅促進(jìn)了5G網(wǎng)絡(luò)自身的智能化發(fā)展,其與5G也被業(yè)界作為通用技術(shù)組合應(yīng)用于各行各業(yè)中,賦能垂直行業(yè)的發(fā)展。
面向2030年,“數(shù)字孿生”和“智能泛在”將成為社會(huì)發(fā)展的目標(biāo)愿景[1]。未來6G網(wǎng)絡(luò)的作用之一就是創(chuàng)造一個(gè)“智慧泛在”的世界,基于無處不在的大數(shù)據(jù),將AI的能力賦予各個(gè)領(lǐng)域的應(yīng)用。為了支持該愿景的實(shí)現(xiàn),6G網(wǎng)絡(luò)提出了“智慧內(nèi)生”的基本特征構(gòu)想,即6G網(wǎng)絡(luò)將在設(shè)計(jì)之初就考慮與人工智能技術(shù)融合的理念,將AI和大數(shù)據(jù)的應(yīng)用融入網(wǎng)絡(luò)的基因當(dāng)中,形成一個(gè)端到端的體系架構(gòu),根據(jù)不同的應(yīng)用場(chǎng)景需求,按需提供AI能力和服務(wù)。同時(shí),6G網(wǎng)絡(luò)還將通過內(nèi)生的AI功能、協(xié)議和信令流程,實(shí)現(xiàn)AI能力的全面滲透,驅(qū)動(dòng)智慧網(wǎng)絡(luò)向前演進(jìn),實(shí)現(xiàn)“網(wǎng)絡(luò)無所不達(dá),算力無處不在,智能無所不及”。
本文聚焦6G網(wǎng)絡(luò)架構(gòu)的關(guān)鍵特征“內(nèi)生智慧”,首先探討了內(nèi)生智慧的需求,分析了6G實(shí)現(xiàn)“內(nèi)生智慧”所面臨的技術(shù)挑戰(zhàn),總結(jié)了當(dāng)前各行業(yè)組織對(duì)AI功能架構(gòu)的研究進(jìn)展和欠缺之處,提出了6G內(nèi)生智慧的端到端功能部署架構(gòu),以及內(nèi)生智慧的三大技術(shù)特征,并對(duì)后續(xù)研究方向進(jìn)行了展望。
近年來,人工智能技術(shù)作為一種IT技術(shù)取得了長(zhǎng)足的進(jìn)步。作為一種工具,它可以很好地幫助運(yùn)營(yíng)商提高網(wǎng)絡(luò)的運(yùn)維效率,以及服務(wù)的效率和能力。移動(dòng)通信網(wǎng)絡(luò)通常由數(shù)百萬個(gè)基站、路由器、核心網(wǎng)元等基礎(chǔ)設(shè)施設(shè)備,以及數(shù)十億用戶組成。海量數(shù)據(jù)在網(wǎng)絡(luò)中產(chǎn)生,包括各網(wǎng)元的運(yùn)行數(shù)據(jù)、通信過程中產(chǎn)生的信令數(shù)據(jù)、事件報(bào)告以及用戶在網(wǎng)絡(luò)中移動(dòng)的相關(guān)信息。如果在這些數(shù)據(jù)上加上標(biāo)簽信息,將為網(wǎng)絡(luò)運(yùn)維的自動(dòng)化、智能化帶來不可估量的價(jià)值。從5G時(shí)代開始,運(yùn)營(yíng)商開始研究基于大數(shù)據(jù)和人工智能的5G網(wǎng)絡(luò)智能化,如海量多輸入多輸出(MIMO)權(quán)重優(yōu)化、網(wǎng)絡(luò)異常分析、用戶體驗(yàn)分析與優(yōu)化等[2]。同時(shí),3GPP也開始研究無線網(wǎng)絡(luò)中的大數(shù)據(jù)采集[3]、網(wǎng)絡(luò)運(yùn)維的自動(dòng)化和智能化[4],以及人工智能在無線資源調(diào)度中的應(yīng)用[5]。5G網(wǎng)絡(luò)智能化的研究可被劃分為應(yīng)用和需求研究(包括5G+AI場(chǎng)景和需求、5G業(yè)務(wù)場(chǎng)景和需求以及應(yīng)用和網(wǎng)絡(luò)資源的智能映射)、無線接入技術(shù)智能化(如基于AI的Massive MIMO設(shè)計(jì)、無線資源調(diào)度、定位技術(shù)、移動(dòng)性管理、信號(hào)檢測(cè)、信道估計(jì)等)、網(wǎng)絡(luò)智能化(如基于聯(lián)邦學(xué)習(xí)的MEC架構(gòu)、智能網(wǎng)絡(luò)切片、多RAT協(xié)作、智能網(wǎng)絡(luò)規(guī)劃、智能節(jié)能等)。
目前,移動(dòng)通信網(wǎng)絡(luò)的智能化工作尚處于初始階段:大量的工作集中在需求的發(fā)掘和對(duì)解決方案的探索上,而成熟的網(wǎng)絡(luò)智能化應(yīng)用非常少。同時(shí),由于5G網(wǎng)絡(luò)架構(gòu)在設(shè)計(jì)時(shí)并沒有考慮到對(duì)AI的支持,現(xiàn)有的場(chǎng)景驅(qū)動(dòng)的網(wǎng)絡(luò)智能化面臨諸多挑戰(zhàn)。首先,數(shù)據(jù)的獲取非常困難,數(shù)據(jù)質(zhì)量難以保證。因?yàn)樵谙惹暗木W(wǎng)絡(luò)架構(gòu)和協(xié)議設(shè)計(jì)中沒有預(yù)定義數(shù)據(jù)收集的接口,而當(dāng)前基于實(shí)現(xiàn)的數(shù)據(jù)收集服務(wù)器/設(shè)備,例如深度包檢測(cè)或數(shù)據(jù)探測(cè)無法及時(shí)提供足夠的數(shù)據(jù)?;诰W(wǎng)管的數(shù)據(jù)收集也存在數(shù)據(jù)種類較少,采集周期較長(zhǎng)(15min)、異廠商數(shù)據(jù)格式、命名、計(jì)算方式不統(tǒng)一,南向網(wǎng)管數(shù)據(jù)難以開放的問題。同時(shí),由于數(shù)據(jù)在設(shè)備內(nèi)部采集的不穩(wěn)定性、傳輸鏈路有損,網(wǎng)管設(shè)備存儲(chǔ)空間有限,標(biāo)簽難獲得,獲取的數(shù)據(jù)常存在缺失、串行、無標(biāo)簽或標(biāo)簽錯(cuò)誤等質(zhì)量問題,在AI模型訓(xùn)練之前,需要花費(fèi)大量的時(shí)間和人力成本對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。其次,AI模型的應(yīng)用效果缺乏有效的驗(yàn)證和保障手段。當(dāng)前智能模型的訓(xùn)練和迭代優(yōu)化均在線下完成,智能模型上線后的效果缺乏直接的驗(yàn)證手段,大多是通過智能化應(yīng)用相關(guān)的網(wǎng)絡(luò)性能評(píng)估指標(biāo)進(jìn)行間接判斷,實(shí)時(shí)性差且缺乏直接關(guān)聯(lián)性;當(dāng)模型上線后,網(wǎng)絡(luò)性能指標(biāo)低于預(yù)期時(shí),僅能通過“回退”機(jī)制來避免AI模型的負(fù)面影響,存在滯后性。第三,AI在5G網(wǎng)絡(luò)中的應(yīng)用是逐案處理的,其中數(shù)據(jù)采集、算法優(yōu)化和處理被打補(bǔ)丁到相應(yīng)的網(wǎng)元或外掛處理單元作為新的網(wǎng)元添加到網(wǎng)絡(luò)中。對(duì)于不同的人工智能用例,可能需要對(duì)網(wǎng)絡(luò)進(jìn)行不同的修改,這給網(wǎng)絡(luò)的管理和運(yùn)營(yíng)帶來了困難。最后,針對(duì)移動(dòng)通信網(wǎng)絡(luò)特征的AI算法研發(fā)和創(chuàng)新尚處于起步階段,AI技術(shù)與通信技術(shù)是以疊加方式融合的松耦合模式。所有這些因素決定了人工智能的性能和效率遠(yuǎn)遠(yuǎn)低于預(yù)期。
未來6G網(wǎng)絡(luò)的作用之一是基于無處不在的大數(shù)據(jù),將AI的能力賦予各個(gè)領(lǐng)域的應(yīng)用,創(chuàng)造一個(gè)“智能泛在”的世界。6G應(yīng)在5G基礎(chǔ)上全面支持整個(gè)世界的數(shù)字化,并通過內(nèi)生AI的網(wǎng)絡(luò)架構(gòu)設(shè)計(jì),實(shí)現(xiàn)智慧的泛在可得、全面賦能萬事萬物[1]。為了實(shí)現(xiàn)“智慧泛在”的愿景,未來6G網(wǎng)絡(luò)需要擁有內(nèi)生智能。6G網(wǎng)絡(luò)架構(gòu)的內(nèi)生智慧將使AI能力在網(wǎng)絡(luò)中無處不在、無孔不入,并像人體的大腦和神經(jīng)網(wǎng)絡(luò)一樣,以分布式或集中的方式按需提供AI能力。同時(shí),通過智能平臺(tái),6G網(wǎng)絡(luò)可以將外部AI能力引入網(wǎng)絡(luò),提供新服務(wù)、新能力,將外部數(shù)據(jù)引入網(wǎng)絡(luò),進(jìn)一步提高數(shù)據(jù)處理效率。此外,網(wǎng)絡(luò)內(nèi)的分析數(shù)據(jù)和人工智能能力也可以開放給第三方,通過智能平臺(tái)為其提供所需的各類智能服務(wù)。
當(dāng)前,AI在各行各業(yè)的應(yīng)用都存在類似的工作流程和技術(shù)挑戰(zhàn)。6G網(wǎng)絡(luò)的內(nèi)生智能需要為這些挑戰(zhàn)提供內(nèi)生的解決方案,由此既能為“AI for Network”的網(wǎng)絡(luò)智能化應(yīng)用提供統(tǒng)一的技術(shù)框架,也能隨時(shí)隨地為垂直行業(yè)提供工作流所需的各類AI能力和工具,創(chuàng)造新的商業(yè)價(jià)值。
對(duì)智能化應(yīng)用研發(fā)團(tuán)隊(duì)進(jìn)行了走訪和調(diào)查[6],提煉出一套通用的AI工作流,如圖1所示。本文對(duì)其中每個(gè)環(huán)節(jié)所需達(dá)到的性能、存在的挑戰(zhàn)和現(xiàn)有解決方案[7-12]進(jìn)行了提煉總結(jié),并對(duì)6G網(wǎng)絡(luò)需提供的內(nèi)生AI能力進(jìn)行了展望。
圖1 通用的機(jī)器學(xué)習(xí)工作流
為了使智能化應(yīng)用獲得較好的效果,AI工作流中各環(huán)節(jié)都需要達(dá)到相應(yīng)的功能和性能要求。首先,數(shù)據(jù)管理方面涉及數(shù)據(jù)采集、預(yù)處理、數(shù)據(jù)分析和數(shù)據(jù)增廣。面向智能化應(yīng)用的數(shù)據(jù)需具備與問題領(lǐng)域的相關(guān)性、樣本空間的完整性、數(shù)據(jù)集內(nèi)部樣本分布平衡性及數(shù)據(jù)本身的準(zhǔn)確性。其次,模型學(xué)習(xí)階段包括模型選擇、模型訓(xùn)練和超參優(yōu)化。這一階段產(chǎn)生的智能模型,其性能應(yīng)可評(píng)估,評(píng)估指標(biāo)包括傳統(tǒng)的ML指標(biāo),例如分類準(zhǔn)確度、ROC和均方誤差,以及考慮模型部署系統(tǒng)和環(huán)境的指標(biāo)。模型需具有穩(wěn)健性,即模型在運(yùn)行時(shí)遇到的輸入與訓(xùn)練數(shù)據(jù)中存在的輸入不同的情況下,也能保持良好的性能。模型需具有可重用性,即模型或模型組件在其預(yù)期之外的系統(tǒng)中應(yīng)用也具有重用的能力。模型需具有可解釋性:即模型可以產(chǎn)生支持對(duì)其輸出或所作決策進(jìn)行分析的依據(jù)。AI工作流中的模型驗(yàn)證階段包括需求編碼、形式驗(yàn)證和基于測(cè)試的驗(yàn)證。這一階段中所要達(dá)到的目標(biāo)包括:
(1)模型驗(yàn)證的綜合、全面性需涵蓋:1)與模型的預(yù)期用途相關(guān)的所有要求和操作條件;2)AI工作流前幾個(gè)階段的所有需求(例如,訓(xùn)練數(shù)據(jù)的完整性和模型的穩(wěn)健性)。
(2)在上下文相關(guān)性方面,模型驗(yàn)證應(yīng)與將使用模型的系統(tǒng)的上下文相關(guān)聯(lián)。
(3)在可理解性方面,驗(yàn)證結(jié)果應(yīng)能被使用驗(yàn)證結(jié)果的人員所理解,驗(yàn)證結(jié)果的使用場(chǎng)景可能涉及數(shù)據(jù)準(zhǔn)備、模型開發(fā)、系統(tǒng)開發(fā)和監(jiān)管批準(zhǔn)等諸多環(huán)節(jié)。
最后,模型部署階段包括模型集成、模型監(jiān)控和模型更新。模型在部署后需要適合特定系統(tǒng)上下文中的預(yù)期用途,且應(yīng)較易更新??紤]AI模型推理的輸出存在一定的錯(cuò)誤概率,系統(tǒng)需具備一定的容錯(cuò)性。
相關(guān)行業(yè)為滿足上述要求而面臨的主要技術(shù)挑戰(zhàn)及解決方案,如表1所示。
表1 各通信行業(yè)應(yīng)用人工智能技術(shù)的主要技術(shù)挑戰(zhàn)與解決方案[7-12]
為了解決上述挑戰(zhàn),6G網(wǎng)絡(luò)在設(shè)計(jì)之初就必須考慮內(nèi)生AI的理念,將AI和大數(shù)據(jù)的應(yīng)用融入網(wǎng)絡(luò)的基因當(dāng)中,形成一個(gè)端到端的體系架構(gòu),根據(jù)不同的應(yīng)用場(chǎng)景需求,按需提供AI能力和服務(wù)。同時(shí),6G網(wǎng)絡(luò)中的算力將從外延走向內(nèi)生,超越5G的邊緣計(jì)算,最終實(shí)現(xiàn)網(wǎng)絡(luò)與計(jì)算的深度融合?;诖诵纬傻幕A(chǔ)設(shè)施,才能為AI提供無處不在的算力,從而實(shí)現(xiàn)無所不及的泛在智能[1]。
具體而言,在數(shù)據(jù)管理方面,6G網(wǎng)絡(luò)的內(nèi)生智能需要解決數(shù)據(jù)結(jié)構(gòu)與格式的規(guī)范化問題,提供包括仿真在內(nèi)的多種數(shù)據(jù)增廣技術(shù)手段,提供支持整個(gè)數(shù)據(jù)管理流程的自動(dòng)、高效的數(shù)據(jù)處理和分析工具,以及提供專家經(jīng)驗(yàn)和領(lǐng)域知識(shí)的導(dǎo)入或交互接口。在模型學(xué)習(xí)方面,建立一套模型的描述機(jī)制及模型的元數(shù)據(jù)庫(kù),建立環(huán)境相似性的度量機(jī)制以支持遷移學(xué)習(xí),構(gòu)建基于環(huán)境上下文動(dòng)態(tài)優(yōu)化的、綜合性能與效率的模型評(píng)估技術(shù)體系,提供模型的局部或全局的可解釋性方法或接口,提供模型導(dǎo)入和重用的機(jī)制與接口,提供分布式模型訓(xùn)練框架,以及基于上下文的自動(dòng)化調(diào)參技術(shù)。為了有效地驗(yàn)證模型,6G網(wǎng)絡(luò)需提供生成測(cè)試數(shù)據(jù)和測(cè)試場(chǎng)景的仿真環(huán)境,提供導(dǎo)入模型驗(yàn)證指標(biāo)及測(cè)試用例的通用接口,提供從模型驗(yàn)證結(jié)果反饋到AI工作流各環(huán)節(jié)的閉環(huán)優(yōu)化流程,提供對(duì)外接口對(duì)模型進(jìn)行形式驗(yàn)證。最后,為支持模型的部署和推理,需建立分布式實(shí)時(shí)協(xié)作推理框架,提供適配底層硬件的模型優(yōu)化工具,建立數(shù)據(jù)與模型的監(jiān)控技術(shù)體系,對(duì)模型推理結(jié)果的應(yīng)用效果進(jìn)行預(yù)判,以及持續(xù)的模型在線更新機(jī)制及相關(guān)接口。
當(dāng)前,面向行業(yè)本地應(yīng)用的智能化標(biāo)準(zhǔn)架構(gòu)很少見,大多數(shù)采用“上云”的模式,企業(yè)租用云服務(wù)提供商的算力和存儲(chǔ),使用云平臺(tái)提供的各類AI工作流工具。在目前的云端AI模式下,海量的設(shè)備數(shù)據(jù)通過5G等無線通信系統(tǒng),跨越多個(gè)網(wǎng)絡(luò)技術(shù)領(lǐng)域,傳輸?shù)皆贫?。這種方式是低效的,并且會(huì)給數(shù)據(jù)安全和隱私帶來相當(dāng)大的風(fēng)險(xiǎn)。另外,智能服務(wù)的實(shí)時(shí)性和高可靠性的保證成本很高。如果僅限于云端AI模式,6G無法實(shí)現(xiàn)智能無處不在的愿景[13]。
與單純的集中式云數(shù)據(jù)中心不同,6G網(wǎng)絡(luò)將是端到端的云原生網(wǎng)絡(luò),這有助于實(shí)現(xiàn)業(yè)務(wù)快速部署、功能軟件版本快速迭代、資源(例如無線電頻譜、計(jì)算和存儲(chǔ))的動(dòng)態(tài)共享、網(wǎng)絡(luò)自動(dòng)化和智能化。在云原生網(wǎng)絡(luò)中,各類AI功能和工具將被服務(wù)化,以AI as a Service(AIaaS)的方式被網(wǎng)絡(luò)內(nèi)部功能調(diào)用或提供給第三方使用。其面臨的技術(shù)挑戰(zhàn)與云服務(wù)供應(yīng)商有所不同:首先,與集中式云平臺(tái)不同,云原生網(wǎng)絡(luò)中的資源分布呈現(xiàn)出分層級(jí),多維度(通信、存儲(chǔ)、計(jì)算)、規(guī)格異構(gòu),分布式與集中式相結(jié)合的形態(tài)。這就給AI功能服務(wù)之間的通信、資源分配和編排帶來了挑戰(zhàn)。其次,由于AI功能服務(wù)與網(wǎng)絡(luò)功能服務(wù)均存在于云網(wǎng)絡(luò)中,且兩者之間有所交互。如何在多云的架構(gòu)下,為他們?cè)O(shè)計(jì)統(tǒng)一的技術(shù)框架,使得該框架既能支持AI全生命周期中各功能的運(yùn)轉(zhuǎn),也能支持不同網(wǎng)絡(luò)功能間的各類交互,還能支持AI功能服務(wù)與網(wǎng)絡(luò)功能服務(wù)間的信息交互,這也是一個(gè)巨大的挑戰(zhàn)。
相比云服務(wù)提供商,傳統(tǒng)運(yùn)營(yíng)商的優(yōu)勢(shì)之一在于既可利用廣泛的邊緣基礎(chǔ)設(shè)施為垂直行業(yè)提供低時(shí)延云服務(wù),保證對(duì)時(shí)延敏感的智能化應(yīng)用的性能,同時(shí)也能利用部署在傳輸網(wǎng)和核心網(wǎng)內(nèi)的多層級(jí)不同規(guī)格的云服務(wù)中心網(wǎng)絡(luò)為客戶提供不同QoS等級(jí)的AI服務(wù),滿足垂直行業(yè)的多樣化需求。這需要運(yùn)營(yíng)商建立起一套評(píng)價(jià)和保障網(wǎng)絡(luò)提供的AI服務(wù)質(zhì)量的技術(shù)體系,同時(shí)需重點(diǎn)研究如何設(shè)計(jì)、建模和對(duì)外開放這些AI服務(wù),以滿足邊緣智能化應(yīng)用的低時(shí)延需求。
由于AI服務(wù)和網(wǎng)絡(luò)功能服務(wù)將共生于6G云網(wǎng)絡(luò)中,對(duì)于以數(shù)據(jù)驅(qū)動(dòng)的網(wǎng)絡(luò)功能服務(wù),在其設(shè)計(jì)之初即應(yīng)考慮與AI服務(wù)的高效交互及聯(lián)動(dòng),將AI作為一項(xiàng)重要的設(shè)計(jì)原則。反之,在AI功能的設(shè)計(jì)、AI服務(wù)的拆解和組合上,也需考慮如何以統(tǒng)一的方式與不同的網(wǎng)絡(luò)功能服務(wù)進(jìn)行交互以獲取或配置數(shù)據(jù),并解決不同數(shù)據(jù)源的數(shù)據(jù)格式兼容性問題,如何在AI服務(wù)之間交互不同格式的數(shù)據(jù)、信息以及智能,業(yè)界針對(duì)數(shù)據(jù)驅(qū)動(dòng)的物聯(lián)網(wǎng)業(yè)務(wù)建立的開源框架如EdgeXFoundry、MUSA、BigClouT等提供了很好的技術(shù)參考[12]。
在端到端的云網(wǎng)絡(luò)中,編排器起著至關(guān)重要的作用。當(dāng)AI服務(wù)內(nèi)生于云網(wǎng)絡(luò)后,編排器不僅需要負(fù)責(zé)AI服務(wù)本身的動(dòng)態(tài)發(fā)現(xiàn)、動(dòng)態(tài)拆解、組合和重定位,更需聯(lián)合考慮網(wǎng)絡(luò)功能服務(wù)和AI功能服務(wù),為滿足其各自的服務(wù)質(zhì)量需求,聯(lián)合進(jìn)行資源的分配、編排,AI與網(wǎng)絡(luò)功能服務(wù)的解耦或組合等,以同時(shí)支持“AI for Network”和“Network for AI”的應(yīng)用場(chǎng)景[13]。
人工智能在通信領(lǐng)域應(yīng)用的研究工作始于2017年[14]。2017年2月,3GPP服務(wù)和系統(tǒng)第二工作組SA2開始研究5G核心網(wǎng)的智能化網(wǎng)元:網(wǎng)絡(luò)數(shù)據(jù)分析功能NWDAF(Network Data Analytics Function)[4]。同月,歐洲電信標(biāo)準(zhǔn)化協(xié)會(huì)ETSI成立了體驗(yàn)式網(wǎng)絡(luò)智能ENI(Experiential Network Intelligence)工作組,專門研究體驗(yàn)式感知網(wǎng)絡(luò)管理架構(gòu)、用例、術(shù)語(yǔ)等[15]。2017年6月,中國(guó)通信標(biāo)準(zhǔn)化協(xié)會(huì)CCSA啟動(dòng)了人工智能在電信網(wǎng)絡(luò)中的應(yīng)用課題研究[16]。2018年6月,3GPP無線接入網(wǎng)第三工作組RAN3開始研究無線側(cè)的數(shù)據(jù)采集機(jī)制[17]。電信管理論壇TMForum(Telecom Management Forum)也開始了與人工智能相關(guān)的研究工作。2018年10月,3GPP SA5開始人工智能研究,定義了一個(gè)新的管理面功能:管理數(shù)據(jù)分析功能MDAF[18]。2019年6月,國(guó)際電信聯(lián)盟電信標(biāo)準(zhǔn)分局第13研究組ITU-T SG13啟動(dòng)機(jī)器學(xué)習(xí)用例的研究[19]。同月,全球移動(dòng)通訊系統(tǒng)協(xié)會(huì)GSMA開始了智能自治網(wǎng)絡(luò)案例的白皮書制定工作[20]。2020年6月,3GPP SA5開始啟動(dòng)網(wǎng)絡(luò)自動(dòng)化分級(jí)課題的研究[21]。2020年7月R16正式凍結(jié)后,3GPP RAN3 SA5針對(duì)新的R17版本繼續(xù)推進(jìn)人工智能相關(guān)的ENDC、NWDAF、MDAS等標(biāo)準(zhǔn)化課題的研究。
3GPP中對(duì)于AI功能架構(gòu)的研究主要集中在網(wǎng)絡(luò)功能層面引入的NWDAF和管理層面引入的MDAS上。NWDAF是數(shù)據(jù)分析網(wǎng)元,根據(jù)網(wǎng)絡(luò)數(shù)據(jù)自動(dòng)感知和分析網(wǎng)絡(luò),參與網(wǎng)絡(luò)規(guī)劃、建設(shè)、運(yùn)維、網(wǎng)絡(luò)優(yōu)化和運(yùn)營(yíng)的全生命周期,使網(wǎng)絡(luò)易于維護(hù)和運(yùn)行。3GPP在R16階段定義了NWDAF的基本框架,R17定義了NWDAF功能的拆解、數(shù)據(jù)采集優(yōu)化、多實(shí)例部署時(shí)NWDAF實(shí)例間的協(xié)調(diào),并未對(duì)AI數(shù)據(jù)集或訓(xùn)練模型進(jìn)行標(biāo)準(zhǔn)化。雖然通過NWDAF有效提升了網(wǎng)絡(luò)性能,但這種AI功能打補(bǔ)丁的集成方式暴露了一些問題:一是海量測(cè)量上報(bào)導(dǎo)致的數(shù)據(jù)安全問題和過高的信令開銷;另一個(gè)是低延遲的挑戰(zhàn),因?yàn)樗袛?shù)據(jù)都必須上傳到中央分析單元進(jìn)行處理,即NWDAF,而它可能部署在遠(yuǎn)離數(shù)據(jù)源的地方。在管理面的MDAS的設(shè)計(jì)上,也存在類似的問題,MDAS對(duì)管理域數(shù)據(jù)進(jìn)行分析,支持RAN或CN域內(nèi)的數(shù)據(jù)分析或跨域的數(shù)據(jù)分析,并支持與NWDAF的接口和交互,但其本質(zhì)還是一個(gè)中央分析處理單元。
2018年1月,ITU面向未來網(wǎng)絡(luò)(包括5G)成立了FGML5G(Focus Group on Machine Learning for Future Networks including 5G),旨在幫助ITU-T研究組和研究實(shí)體在未來網(wǎng)絡(luò)中采用可互操作的 ML overlay,包括架構(gòu)、接口、協(xié)議、安全和信息保護(hù)。截止2020年7月,F(xiàn)G ML5G輸出并向ITU-T第13研究組提交了關(guān)于用例、架構(gòu)框架、智能級(jí)別、數(shù)據(jù)處理、機(jī)器學(xué)習(xí)(ML)功能編排器、服務(wù)框架等的十項(xiàng)技術(shù)規(guī)范。其中一半的規(guī)范已經(jīng)變成了ITU標(biāo)準(zhǔn)。FG ML5G提出了一套針對(duì)機(jī)器學(xué)習(xí)ML的管理子系統(tǒng),其核心功能包括ML意圖的解釋器和ML功能的編排器(MLFO)[22];針對(duì)機(jī)器學(xué)習(xí)生命周期內(nèi)不同階段所需功能,提出了跨多域、多云、不同層級(jí)的多層級(jí)ML工作流,由MLFO進(jìn)行統(tǒng)一編排[23];針對(duì)動(dòng)態(tài)網(wǎng)絡(luò)環(huán)境下,ML模型應(yīng)用效果存在風(fēng)險(xiǎn)的問題,提出了應(yīng)用“沙盒”對(duì)ML工作流或ML模型進(jìn)行預(yù)驗(yàn)證和迭代優(yōu)化[24]。不足之處在于對(duì)ML意圖的定義尚不完善,混淆了ML意圖和手段,且部分意圖指標(biāo)運(yùn)營(yíng)商很難明確給出;在數(shù)據(jù)處理框架部分,缺乏新數(shù)據(jù)源數(shù)據(jù)模型的自動(dòng)生成和注冊(cè)機(jī)制,以及數(shù)據(jù)模型的閉環(huán)優(yōu)化機(jī)制;在沙盒框架部分,缺乏對(duì)仿真環(huán)境的管理機(jī)制,包括仿真準(zhǔn)確度的度量及閉環(huán)優(yōu)化、仿真環(huán)境與真實(shí)網(wǎng)絡(luò)間的數(shù)據(jù)交互、仿真環(huán)境配置的自優(yōu)化等;在編排器部分,未考慮ML與NF的聯(lián)合編排等。
ETSI于2017年定義了ENI系統(tǒng),作為一個(gè)獨(dú)立的人工智能引擎為網(wǎng)絡(luò)運(yùn)維、網(wǎng)絡(luò)保障、設(shè)備管理、業(yè)務(wù)編排與管理等應(yīng)用提供智能化的服務(wù)[15]。ENI系統(tǒng)是一個(gè)將數(shù)據(jù)分析功能集成到閉環(huán)管理和編排過程的系統(tǒng),重點(diǎn)定義了和網(wǎng)絡(luò)自治相關(guān)的功能,ENI引擎內(nèi)部的接口以及面向其他網(wǎng)絡(luò)功能的對(duì)外接口。如通過數(shù)據(jù)處理和正則化對(duì)原始數(shù)據(jù)進(jìn)行清洗和特征分類,將ENI產(chǎn)生的策略或者指令進(jìn)行翻譯,輸出服務(wù)對(duì)象能夠理解的語(yǔ)言。
綜上可見,目前移動(dòng)通信系統(tǒng)與人工智能融合的研究主要集中在利用人工智能技術(shù)使能網(wǎng)絡(luò)自動(dòng)化,提升現(xiàn)有通信系統(tǒng)的性能,改善通信服務(wù)的用戶體驗(yàn)。標(biāo)準(zhǔn)組織中的大部分工作集中在討論智能化應(yīng)用場(chǎng)景案例、所需采集的數(shù)據(jù)、功能實(shí)體間的接口和數(shù)據(jù)分析輸出內(nèi)容上。對(duì)于AI全生命周期工作流在網(wǎng)絡(luò)中的功能架構(gòu)及與網(wǎng)絡(luò)功能的融合編排方面討論較少。
自2019年以來,國(guó)內(nèi)企業(yè)和高校面向無線AI開展了大量的研究,致力于解決無線AI在架構(gòu)、模型、數(shù)據(jù)、算法等方面面臨的諸多挑戰(zhàn)。從這些研究來看,內(nèi)生AI的智能無線網(wǎng)絡(luò)通信系統(tǒng)應(yīng)該由四個(gè)部分組成:智能化數(shù)據(jù)感知模塊,能夠自動(dòng)感知收集各個(gè)網(wǎng)元的數(shù)據(jù);智能化建模模塊,可以減少人工的干預(yù)且網(wǎng)絡(luò)能夠自動(dòng)地建模訓(xùn)練,實(shí)現(xiàn)網(wǎng)絡(luò)自主學(xué)習(xí)能力;智能化AI網(wǎng)絡(luò)架構(gòu)模塊,采用分布式的AI服務(wù)器架構(gòu),各個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)可以作為AI訓(xùn)練/執(zhí)行的一部分,根據(jù)本地收集的數(shù)據(jù)集,通過大量相關(guān)聯(lián)的設(shè)備共同構(gòu)建一個(gè)通用模型;智能化監(jiān)控模塊,采用傳統(tǒng)AI+專家經(jīng)驗(yàn)方法,解決AI模型本身無法做出正確的決策或做出錯(cuò)誤決策造成的成本很高的問題,或者采用強(qiáng)化學(xué)習(xí)算法,改進(jìn)決策策略來適應(yīng)外部環(huán)境。但國(guó)內(nèi)的研究目前還沒有討論架構(gòu)的具體實(shí)現(xiàn)方式等。
2020年12月,由中國(guó)通信學(xué)會(huì)主辦、中國(guó)移動(dòng)研究院聯(lián)合承辦的以“從Cloud AI到Network AI:打造6G網(wǎng)絡(luò)架構(gòu)”為主題的研討會(huì)在成都召開,研討會(huì)發(fā)布了來自運(yùn)營(yíng)商、設(shè)備商、互聯(lián)網(wǎng)服務(wù)商、高校等18家單位共同簽署的6G Network AI論壇倡議書,成立了6GANA(6G Alliance of Network AI)論壇。6GANA定位為全球性論壇,專注于6G網(wǎng)絡(luò)AI相關(guān)技術(shù)、標(biāo)準(zhǔn)化、監(jiān)管和產(chǎn)業(yè)的持續(xù)探索和推廣。它旨在通過整個(gè)生態(tài)系統(tǒng)的聯(lián)合研究,包括ICT(如芯片制造商、網(wǎng)絡(luò)基礎(chǔ)設(shè)施供應(yīng)商、移動(dòng)網(wǎng)絡(luò)運(yùn)營(yíng)商)、垂直行業(yè)、人工智能服務(wù)提供商、人工智能解決方案提供商、人工智能學(xué)術(shù)界和其他利益相關(guān)者,形成業(yè)界共識(shí),推動(dòng)AI能夠成為6G網(wǎng)絡(luò)全新的能力與服務(wù)。
6GANA的首要目標(biāo)是保證6G網(wǎng)絡(luò)對(duì)AI業(yè)務(wù)的最佳適應(yīng)性,保證6G標(biāo)準(zhǔn)和規(guī)范充分考慮AI領(lǐng)域的應(yīng)用和特點(diǎn)。6GANA將引導(dǎo)垂直行業(yè)使用基于高性能無線通信技術(shù)的人工智能服務(wù),幫助各行業(yè)受益于6G網(wǎng)絡(luò)賦能的人工智能計(jì)算能力、開放的人工智能算法和安全的人工智能數(shù)據(jù)生態(tài)系統(tǒng)。通過將整個(gè)生態(tài)系統(tǒng)拉到一起,它將建立一種共同的語(yǔ)言和相互信任。6GANA還可以作為行業(yè)論壇,充分考慮6G網(wǎng)絡(luò)架構(gòu)中的特定行業(yè)需求[13]。
為促進(jìn)內(nèi)生AI與6G通信網(wǎng)絡(luò)的深度融合,6GANA提出產(chǎn)業(yè)界需在如下三個(gè)技術(shù)方向上達(dá)成共識(shí):支持內(nèi)生AI的6G網(wǎng)絡(luò)功能和協(xié)議,支持內(nèi)生AI的6G網(wǎng)絡(luò)架構(gòu),支持內(nèi)生AI的6G網(wǎng)絡(luò)自治框架。前兩個(gè)技術(shù)方向?qū)Φ讓泳W(wǎng)絡(luò)架構(gòu)進(jìn)行改造,最后一個(gè)涉及在新架構(gòu)中構(gòu)建AIaaS,實(shí)現(xiàn)6G網(wǎng)絡(luò)上AI應(yīng)用的使用、開發(fā)、部署、維護(hù)和監(jiān)控。
基于6G網(wǎng)絡(luò)“三層四面”的邏輯架構(gòu)設(shè)計(jì)[25],我們提出一種6G網(wǎng)絡(luò)內(nèi)生AI功能架構(gòu)的設(shè)想。6G網(wǎng)絡(luò)架構(gòu)的內(nèi)生智能將使AI能力在網(wǎng)絡(luò)中無處不在、無孔不入,并像人體的大腦和神經(jīng)網(wǎng)絡(luò)一樣,以分布式或集中的方式按需提供AI能力。同時(shí),通過智能平臺(tái),6G將外部AI能力引入網(wǎng)絡(luò),提供新服務(wù)、新能力,將外部數(shù)據(jù)引入網(wǎng)絡(luò),進(jìn)一步提高數(shù)據(jù)處理效率。此外,網(wǎng)絡(luò)內(nèi)的分析數(shù)據(jù)和人工智能能力也可以暴露給第三方,通過智能平臺(tái)為其提供服務(wù)和所需的支持,如圖2所示。
圖2 6G網(wǎng)絡(luò)內(nèi)生AI功能架構(gòu)
在數(shù)據(jù)面上,內(nèi)生AI架構(gòu)涉及到的功能模塊如圖3所示。既需要全局的數(shù)據(jù)采集、存儲(chǔ)和處理,也需要進(jìn)行本地?cái)?shù)據(jù)的收集和處理。因?yàn)樵诤芏鄳?yīng)用場(chǎng)景下,出于數(shù)據(jù)隱私的考慮,客戶并不希望自己的數(shù)據(jù)被上傳到公共網(wǎng)絡(luò)中,需要網(wǎng)絡(luò)在本地提供處理和存儲(chǔ)這些數(shù)據(jù)的能力,因此需要一種分布式和集中式相結(jié)合的數(shù)據(jù)管理架構(gòu)。訓(xùn)練數(shù)據(jù)管理提供模型訓(xùn)練所需的訓(xùn)練樣本,根據(jù)模型性能要求對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行定制和預(yù)處理。
圖3 數(shù)據(jù)面功能模塊
如圖4所示,在智能面上,人工智能模型的管理包括模型的選擇、生成、存儲(chǔ)、更新、轉(zhuǎn)移和刪除。管理的模型包括網(wǎng)絡(luò)資源層、網(wǎng)絡(luò)功能層和服務(wù)應(yīng)用層的各種模型,用于優(yōu)化這些層級(jí)的相關(guān)實(shí)體。RAN域、TN域、CN域、UE等各個(gè)域也需要集中智能與分布式AI能力相結(jié)合。全局集中的AI平臺(tái)可以對(duì)外部和內(nèi)部數(shù)據(jù)模型進(jìn)行全局處理,并根據(jù)特定用例的要求編排智能能力,然后將結(jié)果分發(fā)到特定子域的AI平臺(tái)執(zhí)行。對(duì)于本地的AI能力,需要盡可能靠近用戶部署,提供實(shí)時(shí)的AI能力支持,包括模型和算法等。知識(shí)倉(cāng)庫(kù)對(duì)人工智能模型的應(yīng)用結(jié)果進(jìn)行匯總和抽象,提取規(guī)則或關(guān)系模式以及外部導(dǎo)入的專家經(jīng)驗(yàn)。
圖4 智能面功能模塊
作為人工智能的三大支柱之一,計(jì)算能力至關(guān)重要。隨著通信、計(jì)算、存儲(chǔ)的融合,計(jì)算能力也是我們需要進(jìn)行管理的。從網(wǎng)絡(luò)部署的角度,必須考慮其經(jīng)濟(jì)性,綜合考慮如何利用這種分布式、集中的計(jì)算能力,我們還需要考慮終端和網(wǎng)絡(luò)之間計(jì)算能力負(fù)載分擔(dān)的方法。
綜合上述功能設(shè)計(jì),完整的內(nèi)生AI架構(gòu)設(shè)計(jì)如圖5所示。該架構(gòu)提出如下創(chuàng)新理念:首先,為支持6G網(wǎng)絡(luò)的自優(yōu)化和自演進(jìn),AI用例將不再由網(wǎng)絡(luò)管理或優(yōu)化團(tuán)隊(duì)提出,而是由網(wǎng)絡(luò)通過AI用例生成器或外部通過API導(dǎo)入。第二,網(wǎng)絡(luò)提供對(duì)AI服務(wù)的性能評(píng)估和保障,這是通過QoAIS(Quality of AI Services)解釋器和評(píng)估器完成的。人工智能用例的性能需求由解釋器導(dǎo)出,轉(zhuǎn)化為人工智能工作流程中對(duì)模型、算法、計(jì)算能力、數(shù)據(jù)和工作模塊的具體需求。然后由編排器聚合網(wǎng)絡(luò)能力,并由硬件資源支持,以滿足人工智能用例的上述要求。當(dāng)然,AI超腦也可以將一些需要全局協(xié)調(diào)的編排結(jié)果交付給各個(gè)子域執(zhí)行,從而保證智能化應(yīng)用得到全局支持。第三,該架構(gòu)為本地用例提供了類似的框架,以支持實(shí)時(shí)用例。由于是端到端的架構(gòu),因此編排時(shí)也考慮了終端的AI能力,支持終端的智能應(yīng)用。最后,AI模型、數(shù)據(jù)和知識(shí)可以重復(fù)使用并共享給第三方。同時(shí),內(nèi)生AI架構(gòu)中的各項(xiàng)功能和服務(wù)也可開放給第三方,提供所需的智能。
圖5 完整的內(nèi)生AI架構(gòu)
除了上述功能架構(gòu)的設(shè)計(jì)外,我們總結(jié)提煉出6G網(wǎng)絡(luò)內(nèi)生AI的三大技術(shù)特征,以應(yīng)對(duì)AI全生命周期工作流和云網(wǎng)絡(luò)AIaaS帶來的技術(shù)挑戰(zhàn)。
第一項(xiàng)技術(shù)特征是基于QoAIS的AI全生命周期服務(wù)編排,這項(xiàng)特征在功能架構(gòu)中已有所體現(xiàn)。為了滿足網(wǎng)絡(luò)本身和各行業(yè)對(duì)智能化服務(wù)質(zhì)量的不同需求,6G網(wǎng)絡(luò)需構(gòu)建一套AI服務(wù)的質(zhì)量評(píng)估和保障體系,并基于AI服務(wù)的目標(biāo)性能,對(duì)其生命周期內(nèi)的功能服務(wù)、相關(guān)數(shù)據(jù)和模型、以及所需資源進(jìn)行編排。為支持該技術(shù)特征,需進(jìn)一步研究AI用例的自生成技術(shù)、QoAIS的解析和評(píng)估技術(shù)、數(shù)據(jù)/模型/資源的API設(shè)計(jì)、自動(dòng)模型搜索和構(gòu)建技術(shù)(如AutoML)、在線學(xué)習(xí)的數(shù)據(jù)處理、模型訓(xùn)練推理和自更新的流程編排等。
第二項(xiàng)技術(shù)特征是內(nèi)生AI計(jì)算與通信的深度融合。這一特征是運(yùn)營(yíng)商區(qū)別于云服務(wù)提供商和其他任何AI服務(wù)供應(yīng)商的關(guān)鍵所在。這種融合既包括將AI用在提升網(wǎng)絡(luò)運(yùn)維智能化和網(wǎng)絡(luò)性能的“AI for Network”場(chǎng)景,也包括為保障AI服務(wù)的性能,網(wǎng)絡(luò)架構(gòu)、協(xié)議和功能所做出的改變,即“Network for AI”場(chǎng)景,同時(shí)還包括為提升整網(wǎng)資源效率、降低成本,而對(duì)AI功能和網(wǎng)絡(luò)功能做出的聯(lián)合優(yōu)化。在這一方向上,當(dāng)前已有較多關(guān)鍵技術(shù)在研究中,如基于數(shù)據(jù)分割或模型分割的分布式模型訓(xùn)練[26-27]、分布式實(shí)時(shí)協(xié)作推理[28]、基于聯(lián)邦學(xué)習(xí)的空口傳輸和資源調(diào)度優(yōu)化[29]、AI模型信源與信道聯(lián)合編碼、二階模型訓(xùn)練算法降低空口訓(xùn)練開銷[30]等。
第三項(xiàng)技術(shù)特征是內(nèi)生AI與數(shù)字孿生的融合。6G網(wǎng)絡(luò)架構(gòu)的特征之一是數(shù)字孿生網(wǎng)絡(luò)[31]。2030年以后的社會(huì)將是數(shù)字孿生社會(huì),數(shù)字孿生技術(shù)也可以應(yīng)用于6G網(wǎng)絡(luò),實(shí)現(xiàn)全數(shù)字化。通過數(shù)字孿生,每個(gè)網(wǎng)絡(luò)實(shí)體和用戶的服務(wù)都可以通過實(shí)時(shí)信息采集實(shí)現(xiàn)數(shù)字化。實(shí)時(shí)狀態(tài)監(jiān)測(cè)、軌跡預(yù)測(cè)和對(duì)可能出現(xiàn)的故障和服務(wù)掉線的預(yù)測(cè)性干預(yù)將成為可能,從而提高整個(gè)網(wǎng)絡(luò)的運(yùn)行效率以及服務(wù)效率;還可以提前驗(yàn)證網(wǎng)絡(luò)新特性部署的效果,加快新特性的改進(jìn)和優(yōu)化,實(shí)現(xiàn)新功能的快速自動(dòng)引入,從而實(shí)現(xiàn)網(wǎng)絡(luò)的自我進(jìn)化[1]。內(nèi)生AI架構(gòu)可利用數(shù)字孿生網(wǎng)絡(luò)提供的仿真功能生成模型訓(xùn)練所需的樣本數(shù)據(jù),提高輸入樣本空間的完整性,也可在孿生網(wǎng)絡(luò)中對(duì)AI工作流或AI模型的效果進(jìn)行預(yù)驗(yàn)證和優(yōu)化,避免AI功能的啟用對(duì)真實(shí)網(wǎng)絡(luò)帶來性能的損傷。反過來,數(shù)字孿生網(wǎng)絡(luò)也可利用內(nèi)生AI架構(gòu)解決其自身的構(gòu)建問題,比如通過收集網(wǎng)絡(luò)功能的相關(guān)數(shù)據(jù)訓(xùn)練出可模擬該功能的AI模型,作為其孿生體、通過GAN生成的數(shù)據(jù)構(gòu)建孿生體,從而降低數(shù)據(jù)傳輸對(duì)網(wǎng)絡(luò)資源的消耗。
本文初步提出了6G內(nèi)生AI功能部署架構(gòu)及其主要技術(shù)特征,后續(xù)仍需從如下方向開展進(jìn)一步研究工作:
首先,在內(nèi)生AI的需求方面,需進(jìn)一步研究統(tǒng)一的內(nèi)生AI需求用例和服務(wù)質(zhì)量的表征方案、閉環(huán)保障架構(gòu)和技術(shù)體系,具體包括內(nèi)生AI需求用例的表征方案、語(yǔ)言、接口;研究?jī)?nèi)生AI需求用例的自生成和管理技術(shù)體系。
其次,在AI服務(wù)質(zhì)量閉環(huán)保障及統(tǒng)一編排管理方面,需基于端-邊-云的多層次網(wǎng)絡(luò)架構(gòu),進(jìn)一步研究AI工作流編排、網(wǎng)絡(luò)資源編排的技術(shù)框架。具體包括QoAIS的解析、評(píng)估和保障技術(shù)體系;高效的通信-計(jì)算-存儲(chǔ)多元異構(gòu)資源的協(xié)同調(diào)度機(jī)制;數(shù)據(jù)、模型、功能和工作流的域內(nèi)和跨域的編排管理。
最后,在內(nèi)生AI基礎(chǔ)網(wǎng)絡(luò)架構(gòu)方面,需進(jìn)一步研究并完善內(nèi)生AI整體技術(shù)框架,進(jìn)一步研究?jī)?nèi)生AI和數(shù)字孿生網(wǎng)絡(luò)的融合架構(gòu),包括基礎(chǔ)網(wǎng)絡(luò)架構(gòu)及功能模塊、接口和流程。
本文聚焦6G網(wǎng)絡(luò)架構(gòu)的關(guān)鍵特征“內(nèi)生智能”,從5G網(wǎng)絡(luò)智能化和6G“智能泛在”愿景兩方面出發(fā)探討了內(nèi)生智能的需求,分析了AI生命周期工作流(包括數(shù)據(jù)管理、模型學(xué)習(xí)、模型驗(yàn)證和模型部署)和云網(wǎng)絡(luò)AIaaS存在的技術(shù)挑戰(zhàn),包括AI服務(wù)質(zhì)量的評(píng)估和保障體系、AI功能服務(wù)和網(wǎng)絡(luò)功能服務(wù)的設(shè)計(jì)以及聯(lián)合編排,總結(jié)了當(dāng)前各行業(yè)組織(包括3GPP、ETSI、ITU、TMForum等)對(duì)AI功能架構(gòu)的研究進(jìn)展和欠缺之處,提出了6G內(nèi)生AI端到端功能部署架構(gòu)及其在6G網(wǎng)絡(luò)“三層四面”邏輯框架上的功能映射關(guān)系,提出了內(nèi)生AI的三大技術(shù)特征:基于QoAIS的AI全生命周期服務(wù)編排、內(nèi)生AI計(jì)算與通信的深度融合、內(nèi)生AI與數(shù)字孿生的融合,以及支持上述特征的關(guān)鍵技術(shù)。最后,從內(nèi)生AI的需求、AI服務(wù)質(zhì)量閉環(huán)保障和基礎(chǔ)網(wǎng)絡(luò)架構(gòu)方面對(duì)后續(xù)研究方向進(jìn)行了展望。