伏玉筍,楊根科,2
(1.上海交通大學(xué)電子信息與電氣工程學(xué)院,上海 200240;2.上海交通大學(xué)寧波人工智能研究院,浙江 寧波 315000)
20世紀(jì)80年代以來,移動(dòng)通信技術(shù)逐步實(shí)現(xiàn)從固定到移動(dòng)、從模擬到數(shù)字、從電路交換到云網(wǎng)融合、從窄帶到寬帶、從人人互聯(lián)到萬物智聯(lián)的演進(jìn),為社會(huì)的發(fā)展不斷注入新的動(dòng)力,帶動(dòng)了整個(gè)生態(tài)產(chǎn)業(yè)的發(fā)展,同時(shí)也提出了更高的生態(tài)系統(tǒng)需求。5G時(shí)代的到來,促使5G與人工智能、云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)/工業(yè)互聯(lián)網(wǎng)、邊緣計(jì)算等融合交織,在各行各業(yè)產(chǎn)生“聚變”反應(yīng)。移動(dòng)通信網(wǎng)絡(luò)正在變得越來越復(fù)雜,這一點(diǎn)可以從如下3個(gè)方面來說明。
網(wǎng)絡(luò)復(fù)雜化。從低頻到高頻(毫米波至太赫茲)的載波越來越多,多載波是一種必然趨勢(shì)。2G、3G、4G、5G多制式共存帶來的協(xié)同和互操作難度增加;從單天線到多天線,甚至Massive MIMO,天線數(shù)越來越多,在商用場(chǎng)景中如何進(jìn)一步提升性能面臨很大挑戰(zhàn);超密的分層網(wǎng)絡(luò)與虛擬化云化網(wǎng)絡(luò)的動(dòng)態(tài)變化所帶來的資源統(tǒng)一調(diào)度非常困難;分層解耦架構(gòu)下的故障定界定位困難;傳輸網(wǎng)絡(luò)異構(gòu)化。
業(yè)務(wù)多樣化。人與人通信的單一模式逐漸演化為人與人、人與物、物與物的全場(chǎng)景通信模式,業(yè)務(wù)場(chǎng)景更加復(fù)雜,帶來對(duì)業(yè)務(wù)級(jí)(SLA,service level agreement)的差異化需求,比如高帶寬、大連接、超高可靠性和低時(shí)延等(數(shù)據(jù)分組大小的差異是107量級(jí),時(shí)延的差異是104量級(jí),吞吐率的差異是105量級(jí))[1-2],以及與之配套的網(wǎng)絡(luò)管理的復(fù)雜性(包括網(wǎng)絡(luò)切片場(chǎng)景等)。
體驗(yàn)個(gè)性化。依托5G 網(wǎng)絡(luò)能力和豐富的業(yè)務(wù)發(fā)展,業(yè)務(wù)體驗(yàn)也將隨之呈現(xiàn)出多元化、個(gè)性化發(fā)展態(tài)勢(shì),比如沉浸式體驗(yàn)、實(shí)時(shí)交互等,網(wǎng)絡(luò)對(duì)于業(yè)務(wù)體驗(yàn)的支撐保障,將顛覆傳統(tǒng)模式,迎來全新挑戰(zhàn),評(píng)價(jià)準(zhǔn)則越來越多元化。
面對(duì)移動(dòng)通信問題建模日益困難,求解復(fù)雜度指數(shù)級(jí)升高,網(wǎng)絡(luò)的運(yùn)維成本越來越高。如圖1所示隨著移動(dòng)通信技術(shù)的演進(jìn)(從2G時(shí)代到5G時(shí)代),網(wǎng)絡(luò)性能在不斷地提升,但同時(shí)實(shí)際性能與理想性能的差距卻在擴(kuò)大,這說明需要深入挖掘新的技術(shù)方法,使實(shí)際性能逼近理想性能,不過基于傳統(tǒng)方法解決這樣的問題遇到了很大的瓶頸,移動(dòng)通信迫切需要引入新的方法論。
人工智能在大數(shù)據(jù)、深度學(xué)習(xí)、計(jì)算與存儲(chǔ)能力提升這三者的共同促進(jìn)下迎來了新的浪潮[3-7]。智能通信被認(rèn)為是5G 之后無線通信發(fā)展的主流方向之一[8-9],其基本思想是將人工智能引入無線通信系統(tǒng)的各個(gè)層面,實(shí)現(xiàn)無線通信與人工智能技術(shù)的有機(jī)融合。學(xué)術(shù)界和工業(yè)界正在開展該領(lǐng)域的研究工作[10-61],目前,該方向的研究正在從高層向低層的物理層推進(jìn),特別在物理層已經(jīng)出現(xiàn)無線傳輸與深度學(xué)習(xí)等結(jié)合的趨勢(shì),然而,各項(xiàng)研究目前尚處于初步探索階段。
圖1 實(shí)際性能與理想性能間的距離
雖然目前人工智能在移動(dòng)網(wǎng)絡(luò)運(yùn)維領(lǐng)域有了一定的應(yīng)用[13-18(]比如智能告警處理與根因分析、關(guān)鍵性能指標(biāo)(KPI,key performance indicators)異常檢測(cè)等),但是在提升無線通信系統(tǒng)性能方面,盡管學(xué)術(shù)界的論文不少,商業(yè)應(yīng)用的成功案例卻屈指可數(shù)。
必須說明強(qiáng)調(diào)的是,與提供“盡力而為”服務(wù)的互聯(lián)網(wǎng)不同,通信網(wǎng)從一開始就是一個(gè)以商業(yè)經(jīng)營(yíng)為目的的網(wǎng)絡(luò),必須確保通信服務(wù)質(zhì)量和服務(wù)安全,對(duì)網(wǎng)絡(luò)的部署、維護(hù)升級(jí)、電信設(shè)備的性能等都有嚴(yán)格的要求。
運(yùn)營(yíng)商通信系統(tǒng)對(duì)KPI的要求很高,對(duì)性能惡化的容忍度很低,而IT系統(tǒng)對(duì)失敗的容忍度則很大。學(xué)習(xí)型算法的可靠性通常面臨著很大挑戰(zhàn):由確定性演變?yōu)椴淮_定性的風(fēng)險(xiǎn)很高,尤其是網(wǎng)絡(luò)升級(jí),KPI在任何應(yīng)用場(chǎng)景下不能有負(fù)增益,這更是嚴(yán)格的高壓線。
可見,雖然有著人工智能在提升無線通信系統(tǒng)性能上發(fā)揮著更大作用的強(qiáng)烈需求,但也面臨突破上的巨大障礙。本文對(duì)人工智能在移動(dòng)通信方面的研究與應(yīng)用現(xiàn)狀進(jìn)行總結(jié),同時(shí)對(duì)人工智能在如何提升無線通信系統(tǒng)性能上進(jìn)行探索與實(shí)踐,從而為相關(guān)領(lǐng)域的研究人員和工程技術(shù)人員起到參考和幫助的作用。
移動(dòng)通信網(wǎng)絡(luò)涉及的主要領(lǐng)域及對(duì)應(yīng)的時(shí)間尺度如圖2所示。一般來說,尺度越小,人工智能的應(yīng)用難度越大。后面將分別介紹每個(gè)領(lǐng)域的研究和應(yīng)用現(xiàn)狀。
圖2 移動(dòng)通信網(wǎng)絡(luò)涉及的主要領(lǐng)域及對(duì)應(yīng)尺度
目前在移動(dòng)通信領(lǐng)域研究中,最常用的人工智能/機(jī)器學(xué)習(xí)方法如圖3所示。由圖3可知,沒有一種方法可以“包打天下”。本文通過分析機(jī)器學(xué)習(xí)方法的特點(diǎn),再結(jié)合移動(dòng)通信系統(tǒng)的需求和特點(diǎn),可以更好地把握人工智能在移動(dòng)通信系統(tǒng)中的研究和應(yīng)用。
應(yīng)該說近年來機(jī)器學(xué)習(xí)本身的進(jìn)步,以及大數(shù)據(jù)和計(jì)算能力的大幅提升共同促使人工智能應(yīng)用取得了長(zhǎng)足的發(fā)展。數(shù)據(jù)驅(qū)動(dòng)智能是其明顯的特征之一。第四范式是指數(shù)據(jù)探索性的研究方式,即基于數(shù)據(jù)密集型的發(fā)現(xiàn),從以數(shù)學(xué)模型計(jì)算為中心到海量數(shù)據(jù)處理為中心。和第一范式、第二范式、第三范式相比,第四范式在業(yè)界還未達(dá)成一致[3],但近年來大數(shù)據(jù)領(lǐng)域的蓬勃發(fā)展,給第四范式注入了強(qiáng)大活力。第四范式可能成為無線通信領(lǐng)域的工作范式:基于大數(shù)定理及概率設(shè)計(jì)大規(guī)模天線無線通信系統(tǒng)、基于大數(shù)據(jù)設(shè)計(jì)通信網(wǎng)絡(luò)是這方面的范例[11-12,23-25]。
圖3 移動(dòng)通信領(lǐng)域中最常用的人工智能/機(jī)器學(xué)習(xí)方法
從控制論的角度來說,可重構(gòu)、可編程無線環(huán)境的概念被延伸提出,圖4展示了無線網(wǎng)絡(luò)與智能無線網(wǎng)絡(luò)的區(qū)別[26]。具體來說,香農(nóng)把通信系統(tǒng)抽象為轉(zhuǎn)移概率(即Pr{y|x});維納從控制論的角度,系統(tǒng)模型仍然是給定的,但輸出要反饋到輸入(如信道狀態(tài)從接收機(jī)反饋給發(fā)射機(jī),以便于信道識(shí)別的波束成型、鏈路自適應(yīng)等);在智能無線環(huán)境中,環(huán)境對(duì)象能夠感知系統(tǒng)對(duì)無線電波(物理世界)的響應(yīng),并將其反饋給輸入(數(shù)字世界)?;诟兄獢?shù)據(jù),通過軟件控制器分別就輸入信號(hào)和環(huán)境對(duì)象對(duì)無線電波的響應(yīng)進(jìn)行聯(lián)合優(yōu)化和配置。例如,輸入信號(hào)是轉(zhuǎn)向一個(gè)給定的環(huán)境目標(biāo),通過適當(dāng)?shù)膬?yōu)化相移將其反射到接收器。反過來,接收器也被引導(dǎo)朝向輸入信號(hào)。
圖4 無線網(wǎng)絡(luò)與智能無線網(wǎng)絡(luò)的區(qū)別
目前人工智能在移動(dòng)通信系統(tǒng)中的研究和應(yīng)用可以分為3類,具體如下。
1)“改進(jìn)”類:物理層研究中的去模塊化、由傳統(tǒng)最優(yōu)化的資源分配到基于深度學(xué)習(xí)的資源分配等。
2)“0到1”類:自組織網(wǎng)絡(luò)或網(wǎng)絡(luò)運(yùn)維中的KPI建模、多參數(shù)性能模型等。
3)“代替”類:通過神經(jīng)網(wǎng)絡(luò)代替多輸入多輸出(MIMO,multiple input multiple output)最大似然檢測(cè)以降低復(fù)雜性等。
3GPP從Rel.8/9正式引入SON的概念,在未來更是扮演重要角色,其內(nèi)涵也會(huì)更加豐富[27]。傳統(tǒng)SON用例如圖5所示,具體如下。
1)自配置(self configuration)?;?網(wǎng)絡(luò)初始啟動(dòng)時(shí),自動(dòng)根據(jù)環(huán)境設(shè)置系統(tǒng)重要參數(shù)。
2)自優(yōu)化(self optimization)。在網(wǎng)絡(luò)運(yùn)行過程中,根據(jù)接收到的系統(tǒng)測(cè)量和反饋信息,優(yōu)化系統(tǒng)。
3)自愈(self healing)。在網(wǎng)絡(luò)運(yùn)行過程中,借助系統(tǒng)測(cè)量與反饋,自動(dòng)修復(fù)故障。
圖5 傳統(tǒng)SON范疇用例
和4G系統(tǒng)相比,5G系統(tǒng)具有更加靈活的頻譜(包括毫米波)和參數(shù)集/時(shí)隙結(jié)構(gòu)、大規(guī)模多天線及以波束為中心的設(shè)計(jì)、分層異構(gòu)的超密集網(wǎng)絡(luò)、多樣化的垂直業(yè)務(wù)和網(wǎng)絡(luò)切片的動(dòng)態(tài)管理與編排、網(wǎng)絡(luò)架構(gòu)對(duì)數(shù)據(jù)驅(qū)動(dòng)的網(wǎng)絡(luò)智能的支持等,因此,5G-SON必將有新的內(nèi)涵和挑戰(zhàn)[28]。目前,5G-SON正在從類似于4G-SON的基本用例(盡管實(shí)現(xiàn)細(xì)節(jié)會(huì)有不同)著手[29-30],依據(jù)緊迫程度,將有節(jié)奏地不斷完善和拓展新的用例和方案。
SON的核心思想與機(jī)器學(xué)習(xí)理論接近,即通過對(duì)未知環(huán)境的感知、交互、學(xué)習(xí),自動(dòng)調(diào)整系統(tǒng)以適應(yīng)環(huán)境,從而達(dá)到最優(yōu)。不同的場(chǎng)景、不同特性的SON需要不同的機(jī)器學(xué)習(xí)方法[20-21,30],沒有“萬能鑰匙”,比如自優(yōu)化類中的移動(dòng)負(fù)載平衡,強(qiáng)化學(xué)習(xí)就是合適的候選技術(shù)[32]。
關(guān)于是在線學(xué)習(xí)還是離線學(xué)習(xí),有些SON的特征適合用在線學(xué)習(xí),比如自優(yōu)化和閉環(huán)SON,需要實(shí)時(shí)采集用戶反饋,進(jìn)行學(xué)習(xí)推斷,獲得新的配置。有些適合用在離線學(xué)習(xí),通過對(duì)相關(guān)的非實(shí)時(shí)數(shù)據(jù)進(jìn)行挖掘來提供指導(dǎo),自配置就是很好的例子。
隨著5G時(shí)代的到來,移動(dòng)通信系統(tǒng)的網(wǎng)絡(luò)運(yùn)營(yíng)/運(yùn)維面臨的挑戰(zhàn)將是全方位的,以專家經(jīng)驗(yàn)為主的運(yùn)營(yíng)運(yùn)維模式同網(wǎng)絡(luò)的先進(jìn)性之間,正逐漸形成差距,自動(dòng)化、智能化的網(wǎng)絡(luò)運(yùn)營(yíng)運(yùn)維能力將成為5G時(shí)代電信網(wǎng)絡(luò)運(yùn)營(yíng)運(yùn)維的剛需。近年來,基于大數(shù)據(jù)與機(jī)器學(xué)習(xí)的人工智能,在移動(dòng)網(wǎng)絡(luò)運(yùn)維領(lǐng)域取得了一定成功的實(shí)際應(yīng)用,如射頻指紋應(yīng)用、參數(shù)自適應(yīng)、負(fù)荷預(yù)測(cè)、性能預(yù)測(cè)、業(yè)務(wù)預(yù)測(cè)、無線感知、智能定位等。未來智能的管理和維護(hù)是準(zhǔn)確理解網(wǎng)絡(luò)需求,進(jìn)行最優(yōu)的網(wǎng)絡(luò)設(shè)計(jì)、部署;實(shí)時(shí)感知網(wǎng)絡(luò)狀況,及時(shí)發(fā)現(xiàn)和解決問題,提高用戶體驗(yàn);當(dāng)網(wǎng)絡(luò)出現(xiàn)故障時(shí),能快速診斷,排除故障。
類比于汽車的自動(dòng)駕駛的內(nèi)涵,“網(wǎng)絡(luò)的自動(dòng)駕駛”也被提出[17-18],這將更具挑戰(zhàn)。目前國(guó)際電信聯(lián)盟已完成了網(wǎng)絡(luò)智能等級(jí)的評(píng)價(jià)框架[33],3GPP開始著手自治網(wǎng)絡(luò)等級(jí)的概念、需求和解決方案的研究[34],提出了大數(shù)據(jù)驅(qū)動(dòng)的網(wǎng)絡(luò)架構(gòu)。該架構(gòu)引入了網(wǎng)絡(luò)數(shù)據(jù)分析功能(NWDAF,network data analytics function),可以從其他5G功能收集數(shù)據(jù),如圖6所示[35-37],本文按照業(yè)務(wù)進(jìn)行分類,以5G信息管理要求上下文挖掘的應(yīng)用場(chǎng)景為例分析原因,具體如下。
圖6 基于服務(wù)化的5G網(wǎng)絡(luò)架構(gòu)
1)5G需要“上下文識(shí)別”能力支持網(wǎng)絡(luò)資源利用效率和網(wǎng)絡(luò)優(yōu)化。
2)基于網(wǎng)絡(luò)功能虛擬化(NFV,network function virtualization)的網(wǎng)絡(luò)功能模塊化要求用戶面和控制面的動(dòng)態(tài)性。
3)垂直業(yè)務(wù)要求端到端的性能保障機(jī)制。
4)網(wǎng)絡(luò)切片要求業(yè)務(wù)部署的動(dòng)態(tài)性,因此要求短的上市時(shí)間(TTM,time to market)和業(yè)務(wù)覆蓋需求,這意味著需要完全自動(dòng)化的閉環(huán)機(jī)制。
RRM/MAC在移動(dòng)網(wǎng)絡(luò)性能管理和提升中起到“大腦”的作用,這種作用非常重要。本文可以基于網(wǎng)絡(luò)的(小區(qū)級(jí))和基于連接的(用戶級(jí))進(jìn)行分類,其分模塊或者分層如圖7所示。小區(qū)間資源管理是優(yōu)化范圍的擴(kuò)大,比如干擾管理就是考慮小區(qū)間的相互影響,從全網(wǎng)最優(yōu)化的角度,考慮干擾的控制、協(xié)調(diào)、抑制、利用等。
RRM本質(zhì)就是一個(gè)最優(yōu)控制問題,如式(1)所示,但影響要素眾多,如圖8所示。需要說明的是,隨著移動(dòng)通信技術(shù)的演進(jìn)以及場(chǎng)景更加多樣化,同樣的類別名稱下,其內(nèi)涵及挑戰(zhàn)的差別是很大的。傳統(tǒng)的方法不足以解決復(fù)雜問題,且缺乏適應(yīng)性。傳統(tǒng)RRM通?;诤芏嗉僭O(shè)的簡(jiǎn)化模型,通過仿真確定算法參數(shù),可能對(duì)于場(chǎng)景A為“好”,但對(duì)于場(chǎng)景B為“壞”。
圖7 RRM/MAC領(lǐng)域總體分類
圖8 RRM/MAC領(lǐng)域典型影響因素總結(jié)
其中,Ui表示用戶i的效用。
RRM有著不同的場(chǎng)景和不同的特性,因此需要不同的機(jī)器學(xué)習(xí)方法。比如強(qiáng)化學(xué)習(xí)用于功率分配與控制、鏈路自適應(yīng)[19,38-39];深度學(xué)習(xí)用于調(diào)度資源分配[40],聯(lián)邦學(xué)習(xí)用于分布式場(chǎng)景[41]。另外,許多傳統(tǒng)的通信模型,如基于聯(lián)合空間復(fù)用的大規(guī)模MIMO模型嚴(yán)重依賴信道狀態(tài)信息,它們的性能在非線性時(shí)變信道下會(huì)發(fā)生惡化,因此準(zhǔn)確獲取時(shí)變信道的信道狀態(tài)對(duì)系統(tǒng)性能至關(guān)重要。通過深度學(xué)習(xí)技術(shù)對(duì)無線信道進(jìn)行預(yù)測(cè)和重構(gòu)[42],有可能使通信系統(tǒng)可以學(xué)習(xí)突變的信道模型,并及時(shí)反饋信道狀態(tài),進(jìn)一步提升多天線系統(tǒng)的無線性能。
需要說明的是,無線場(chǎng)景非常復(fù)雜多樣,不像圍棋,棋盤就是全部環(huán)境。和傳統(tǒng)方法相比,無線場(chǎng)景數(shù)據(jù)集的收集高成本與算法的高復(fù)雜、泛化能力和實(shí)時(shí)性的高要求、網(wǎng)絡(luò)KPI要平滑的高壓線,取得突破性的應(yīng)用成果并不多。同時(shí),研究碎片化問題突出,并沒有像物理層研究人工智能那樣考慮“去模塊化”或者說模塊間的聯(lián)合優(yōu)化,比如控制信道資源和數(shù)據(jù)信道資源分配盡管時(shí)頻資源是共享的(如圖9所示),但分配機(jī)制是獨(dú)立的,這顯然不是最優(yōu)的[63],其原因是控制信道分配的資源多少和能夠支持的調(diào)度用戶數(shù)有關(guān),當(dāng)然也和用戶的位置、受到的干擾大小有關(guān),比如邊緣用戶信干比較差,為保證控制信道的可靠性,則需要占用更多的控制信道資源,不過這更易導(dǎo)致資源分配間的沖突碰撞而失敗。同時(shí),控制信道資源分配得越多,可支持的用戶數(shù)越多,但數(shù)據(jù)信道可分配的資源越少,反而降低了可支持的用戶數(shù)。而數(shù)據(jù)信道的資源分配又和業(yè)務(wù)模型及調(diào)度優(yōu)先級(jí)有關(guān),因此,研究模塊的歸一化或者模塊間聯(lián)合最優(yōu)化的問題非常有意義。
圖9 控制信道和數(shù)據(jù)信道聯(lián)合資源分配
一個(gè)典型的無線通信系統(tǒng)由發(fā)射機(jī)、無線信道和接收機(jī)構(gòu)成,如圖10所示。發(fā)射機(jī)主要包括信源、信源編碼、信道編碼、調(diào)制、射頻發(fā)送等模塊;接收機(jī)包括射頻接收、信道估計(jì)與信號(hào)檢測(cè)、解調(diào)、信道解碼、信源解碼、信宿等模塊。
對(duì)于這種基于模塊設(shè)計(jì)的通信體系結(jié)構(gòu),通信領(lǐng)域的工作者已做了非常多的研究工作來優(yōu)化每個(gè)模塊的性能,但是每個(gè)模塊的性能達(dá)到最佳并不意味著整個(gè)通信系統(tǒng)的性能達(dá)到最佳。一些新的研究表明,端到端優(yōu)化(即優(yōu)化整個(gè)通信系統(tǒng))性能優(yōu)于優(yōu)化單個(gè)模塊。智能通信的無線傳輸研究旨在打破原有的通信模式,獲得無線傳輸性能的大幅提升。由于深度學(xué)習(xí)在面對(duì)結(jié)構(gòu)化信息與海量數(shù)據(jù)時(shí)有巨大優(yōu)勢(shì),因此它可以為實(shí)現(xiàn)端到端性能最大化提供了一種強(qiáng)有力的工具[43-48]。基于深度學(xué)習(xí)的物理層通信技術(shù)主要聚焦在信道估計(jì)、信號(hào)檢測(cè)、信道狀態(tài)信息的反饋與重建、信道解碼及端到端的通信系統(tǒng)。基于端到端的無線通信系統(tǒng)也被稱為自編碼器,用編碼、信道、解碼過程代替原先的無線通信系統(tǒng)結(jié)構(gòu),編碼、信道、解碼部分均用深度學(xué)習(xí)網(wǎng)絡(luò)實(shí)現(xiàn),是一種全新的無線通信系統(tǒng)實(shí)現(xiàn)思路。對(duì)于中射頻,神經(jīng)網(wǎng)絡(luò)被用于功放線性化和數(shù)字預(yù)失真[49-50]。
圖10 移動(dòng)通信系統(tǒng)物理層典型構(gòu)成
目前有2種類型的深度學(xué)習(xí)網(wǎng)絡(luò),一種基于數(shù)據(jù)驅(qū)動(dòng),另一種基于數(shù)據(jù)模型雙驅(qū)動(dòng)?;跀?shù)據(jù)驅(qū)動(dòng)的深度學(xué)習(xí)網(wǎng)絡(luò)將無線通信系統(tǒng)的多個(gè)功能塊看作一個(gè)未知的黑盒子,利用深度學(xué)習(xí)網(wǎng)絡(luò)取而代之,然后依賴大量訓(xùn)練數(shù)據(jù)完成輸入到輸出的訓(xùn)練。然而,訓(xùn)練深度學(xué)習(xí)網(wǎng)絡(luò)需要大量的標(biāo)記數(shù)據(jù),積累和標(biāo)記大量信息的過程不但費(fèi)時(shí)而且成本高昂。除了積累標(biāo)記數(shù)據(jù)的挑戰(zhàn)之外,大多數(shù)基于數(shù)據(jù)驅(qū)動(dòng)的深度學(xué)習(xí)模型泛化性和自適應(yīng)性較弱,即使網(wǎng)絡(luò)部分結(jié)構(gòu)發(fā)生微小變化,也會(huì)導(dǎo)致訓(xùn)練模型的準(zhǔn)確性大大降低。移動(dòng)通信系統(tǒng)從1G 演進(jìn)到5G,其性能的提升離不開功能模塊的建模,基于數(shù)據(jù)驅(qū)動(dòng)的深度學(xué)習(xí)網(wǎng)絡(luò)摒棄這些已有的無線通信知識(shí),需要海量數(shù)據(jù)進(jìn)行訓(xùn)練與學(xué)習(xí),而獲得的性能往往達(dá)不到已有無線通信系統(tǒng)模型的性能。而基于數(shù)據(jù)模型雙驅(qū)動(dòng)的深度學(xué)習(xí)網(wǎng)絡(luò)以物理層已有模型為基礎(chǔ),可以顯著減少訓(xùn)練或升級(jí)所需的信息量。由于已有的模型具有環(huán)境自適應(yīng)性和泛化性,因此數(shù)據(jù)模型雙驅(qū)動(dòng)深度學(xué)習(xí)網(wǎng)絡(luò)也具有這些特性,并且能在原模型基礎(chǔ)上進(jìn)一步提升系統(tǒng)的性能。因此數(shù)據(jù)模型雙驅(qū)動(dòng)的深度學(xué)習(xí)是最具潛力的發(fā)展方向之一,如圖11所示為訓(xùn)練方法分類[26]。
基于人工智能的物理層技術(shù)研究有2個(gè)價(jià)值方向:提升性能或者降低成本(在性能不變的情況下降低計(jì)算復(fù)雜度),不過目前許多技術(shù)的應(yīng)用實(shí)施尚未處于初期探索階段,更談不上商用。使用深度學(xué)習(xí)解決物理層無線通信問題是一條漫長(zhǎng)的道路,而且這條道路上還有許多障礙,比如如何建立通信數(shù)據(jù)集,如何選取或設(shè)計(jì)適用于通信場(chǎng)景的神經(jīng)網(wǎng)絡(luò)及如何將基于深度學(xué)習(xí)的通信技術(shù)運(yùn)用于通信設(shè)備等。但基于深度學(xué)習(xí)的物理層無線通信技術(shù)研究,也可能給基于傳統(tǒng)無線通信的研究、技術(shù)優(yōu)化帶來啟示。
圖12從研究對(duì)象的角度給出了移動(dòng)通信網(wǎng)絡(luò)系統(tǒng)性能提升的全景。從圖12可以看出,一方面,把每個(gè)模塊的性能做到極致;另一方面,從縱向考慮從中射頻到應(yīng)用層的跨層最優(yōu)化設(shè)計(jì),從橫向考慮從小區(qū)內(nèi)到小區(qū)間/載波間的最優(yōu)協(xié)同設(shè)計(jì)。
導(dǎo)致實(shí)際網(wǎng)絡(luò)性能與理想網(wǎng)絡(luò)性能存在大的差距的主要因素有信息的及時(shí)性、信息的確定性、信息的完備性、無法精確求解,因此,人工智能技術(shù)就是要克服這些網(wǎng)絡(luò)性能提升的障礙。在應(yīng)用人工智能進(jìn)一步提升移動(dòng)通信系統(tǒng)性能的算法方案選型、決策技術(shù)路線時(shí),需要考慮7個(gè)關(guān)鍵度量維度,如圖13所示。
1)可擴(kuò)展性。能應(yīng)對(duì)規(guī)模增加(比如更多的數(shù)據(jù)、更多的特征、更多的層數(shù)等)而不無限增加復(fù)雜度。
2)收斂可靠性。算法是否限于局部最優(yōu)或者初始條件嚴(yán)重影響結(jié)果。
3)響應(yīng)時(shí)間。算法訓(xùn)練完成后的生效時(shí)間。
4)訓(xùn)練時(shí)間和數(shù)據(jù)。算法的訓(xùn)練方式為在線或者離線。對(duì)于在線算法,需要有很高實(shí)時(shí)性,訓(xùn)練時(shí)間要短。關(guān)于訓(xùn)練數(shù)據(jù),除了通常標(biāo)注與非標(biāo)注的區(qū)分,更重要的是數(shù)據(jù)的可獲得性、粒度、數(shù)據(jù)量與本節(jié)點(diǎn)的存儲(chǔ)能力、是否需要相鄰節(jié)點(diǎn)、傳輸條件與代價(jià)等。
5)復(fù)雜度。為了實(shí)現(xiàn)期望的結(jié)果所需要的數(shù)學(xué)運(yùn)算量。
圖11 訓(xùn)練方法總結(jié)
圖12 移動(dòng)通信網(wǎng)系統(tǒng)性能提升全景
6)精確度。算法和希望的目標(biāo)之間的偏差極小。
7)收斂時(shí)間。算法抵達(dá)最優(yōu)解或者期望的結(jié)果所需時(shí)間。
圖13 人工智能應(yīng)用時(shí)需考慮的關(guān)鍵度量維度
網(wǎng)絡(luò)越來越復(fù)雜,網(wǎng)絡(luò)實(shí)際性能與網(wǎng)絡(luò)理想性能的差距不斷擴(kuò)大,傳統(tǒng)方法在面對(duì)復(fù)雜問題時(shí)無力,但人工智能方法又有其自身的挑戰(zhàn)與局限性。如何走出困境?除了從人工智能本身突破之外,另一條思路是從理論上提煉出到底什么特點(diǎn)的領(lǐng)域適合人工智能,什么特點(diǎn)的領(lǐng)域并不適合,人工智能的方法和非人工智能的方法如何最佳結(jié)合以逼近性能界。
本文創(chuàng)造性地提出基于性能內(nèi)環(huán)與性能外環(huán)的方式,相互協(xié)作逼近性能上界。有關(guān)性能內(nèi)環(huán)和性能外環(huán)的定義和比較如表1所示。由表1可以看出,性能內(nèi)環(huán)的價(jià)值越大,則性能外環(huán)的價(jià)值越小,反之,性能內(nèi)環(huán)的價(jià)值越小,則性能外環(huán)的價(jià)值越大,如圖14所示。首先分解并解耦一個(gè)問題為性能內(nèi)環(huán)和性能外環(huán)兩部分,用人工智能的方法重構(gòu)性能外環(huán)部分,然后和性能內(nèi)環(huán)部分協(xié)同進(jìn)行性能的最優(yōu)化。表1中,TTI+(transmission time interval,傳輸時(shí)間間隔)指的是時(shí)間的處理粒度為TTI量級(jí),話統(tǒng)+指的是時(shí)間的處理粒度為通常話務(wù)統(tǒng)計(jì)的量級(jí)。
以鏈路自適應(yīng)為例,目前研究中常采用滿灌包(fullbuffer)的業(yè)務(wù)模型或者隱含了滿灌包的業(yè)務(wù)模型的假設(shè),這是有問題的。由于業(yè)務(wù)具有多樣性,有的業(yè)務(wù)在線時(shí)間很短(對(duì)于5G的大帶寬場(chǎng)景,業(yè)務(wù)的在線時(shí)間更短),有的業(yè)務(wù)在線時(shí)間較長(zhǎng)。例如,以即時(shí)通信類業(yè)務(wù)為代表的小包持續(xù)性突發(fā)(burst)實(shí)時(shí)在線業(yè)務(wù),該業(yè)務(wù)包含頻繁的文本、圖像信息和周期性的ping,這導(dǎo)致無線網(wǎng)絡(luò)在連接和空閑狀態(tài)間進(jìn)行頻繁的切換,而每當(dāng)退出一次網(wǎng)絡(luò),之前的用戶上下文信息全無。對(duì)于在線時(shí)間短的業(yè)務(wù),閉環(huán)反饋還沒有使鏈路自適應(yīng)收斂就結(jié)束了,所以初值的選擇就顯得更加重要。因此,采用圖8所示的相關(guān)指標(biāo)作為輸入基于神經(jīng)網(wǎng)絡(luò)對(duì)初始值進(jìn)行訓(xùn)練,作為性能外環(huán),訓(xùn)練方式可離線也可在線。而性能內(nèi)環(huán)在性能外環(huán)的基礎(chǔ)上,為基于確認(rèn)(ACK/NACK,acknowledgement/not-acknowledgement)反饋的閉環(huán)自適應(yīng)算法,比如眾所周知的外環(huán)鏈路自適應(yīng)(OLLA,outer loop link adaptation)算法或者基于吞吐量最優(yōu)化的其他算法,這樣既提升了性能,又降低了神經(jīng)網(wǎng)絡(luò)泛化能力帶來的網(wǎng)絡(luò)KPI風(fēng)險(xiǎn)(因?yàn)樾阅軆?nèi)環(huán)的“糾偏”)。
表1 性能內(nèi)環(huán)與性能外環(huán)比較說明
圖14 性能內(nèi)環(huán)與性能外環(huán)的關(guān)系
就像前文所提到的,盡管人工智能在移動(dòng)網(wǎng)絡(luò)運(yùn)維領(lǐng)域取得了一定成功,但人工智能在如何提升無線通信系統(tǒng)性能方面的商業(yè)用例還很少。由前面的分析及基于人工智能的特點(diǎn),本文著力探索了人工智能在一個(gè)問題的性能外環(huán)部分的應(yīng)用,然后和該問題的性能內(nèi)環(huán)部分進(jìn)行最佳協(xié)同。下面的用例也說明了基于性能外環(huán)理念的有效性。
1)基于AI的大規(guī)模MIMO模式(massive MIMO pattern)自適應(yīng)[14]。
2)基于AI的智能載波匯聚(CA,carrier aggregation),改善用戶體驗(yàn)[14]。
電信網(wǎng)絡(luò)和IT網(wǎng)絡(luò)最大的不同之一是,電信網(wǎng)絡(luò)有著嚴(yán)格的KPI,所以人工智能應(yīng)用到無線網(wǎng)絡(luò)系統(tǒng)性能提升最大的挑戰(zhàn)是:1)如何“穩(wěn)”“準(zhǔn)”“快”;2)如何由“概率性正確”盡可能為“確定性正確”。
為了解決上述挑戰(zhàn),除了盡量使人工智能重構(gòu)的無線資源管理方案本身具有優(yōu)異的性能外,還必須有基于大數(shù)據(jù)分析和模擬系統(tǒng)的反饋閉環(huán)系統(tǒng),如圖15所示,以使能無線網(wǎng)絡(luò)的自動(dòng)化、智能化、智慧化,其中,1)模擬器的構(gòu)建——模擬系統(tǒng)是實(shí)現(xiàn)“穩(wěn)”“準(zhǔn)”“快”的關(guān)鍵路徑;2)大數(shù)據(jù)分析包括“場(chǎng)景聚類”“根因分析”等;3)解決方案集可以是人工智能重構(gòu)的無線資源管理或者各種場(chǎng)景化的解決方案。
圖15 基于大數(shù)據(jù)分析與模擬系統(tǒng)的反饋閉環(huán)系統(tǒng)
上述工作是一個(gè)浩大的工程,不僅涉及對(duì)移動(dòng)通信技術(shù)和移動(dòng)網(wǎng)絡(luò)系統(tǒng)的熟悉理解與深入研究,也有賴于遷移學(xué)習(xí)(transfer learning)、增量學(xué)習(xí)(incremental learning)、聯(lián)邦學(xué)習(xí)(federated learning)或者說共享學(xué)習(xí)(shared learning)等機(jī)器學(xué)習(xí)技術(shù)的突破,以及這兩者之間恰如其分的結(jié)合。技術(shù)決定架構(gòu),反過來架構(gòu)影響技術(shù)。智能化的數(shù)據(jù)訓(xùn)練是需要樣本的,而移動(dòng)通信網(wǎng)絡(luò)樣本的獲取成本是非常高的,尺度越小越是如此,因此,分布式的計(jì)算架構(gòu)至關(guān)重要、增量與存量數(shù)據(jù)的關(guān)系至關(guān)重要、共性模型和個(gè)性模型的關(guān)系至關(guān)重要等。技術(shù)需要和架構(gòu)迭代研究才能最終收斂。
事實(shí)上,有了這樣的閉環(huán)系統(tǒng),也就可以放心地實(shí)現(xiàn)解決方案精準(zhǔn)投放了。
人工智能在提升移動(dòng)通信系統(tǒng)性能上發(fā)揮更大作用,但也面臨著突破上的巨大障礙。下面3個(gè)問題,可以說是當(dāng)下面對(duì)人工智能到移動(dòng)通信領(lǐng)域應(yīng)用前景時(shí)最大的困惑與不確定性,具體如下。
1)在當(dāng)下的傳統(tǒng)網(wǎng)絡(luò)架構(gòu)下,人工智能在移動(dòng)通信領(lǐng)域到底能滲透到什么程度,能發(fā)展的程度如何。
2)未來的智能無線通信(包括其對(duì)應(yīng)的新的網(wǎng)絡(luò)架構(gòu))會(huì)是什么形態(tài)。
3)能否實(shí)現(xiàn)移動(dòng)通信網(wǎng)絡(luò)的“自動(dòng)駕駛”。
本文對(duì)人工智能在移動(dòng)通信領(lǐng)域的研究與應(yīng)用現(xiàn)狀進(jìn)行了總結(jié)分析,進(jìn)行了初步的探索與實(shí)踐,但研究碎片化與實(shí)際應(yīng)用的艱難、理論構(gòu)建不夠、系統(tǒng)架構(gòu)缺失等情況突出,因此在未來將以全景式視角,在研究的系統(tǒng)化、框架化及跨學(xué)科的交叉融合理論構(gòu)建上進(jìn)一步的突破創(chuàng)新。