摘 要:大規(guī)模衛(wèi)星網(wǎng)絡(Mega Satellite Networks,MSNs)是由位于不同軌道高度、不同功能的衛(wèi)星組成的多層衛(wèi)星網(wǎng)絡,可突破現(xiàn)有地面網(wǎng)絡的覆蓋限制,實現(xiàn)未來6G 無縫覆蓋的高質量服務需求。然而,MSNs 中各類衛(wèi)星高動態(tài)移動,致使網(wǎng)絡資源異構且拓撲大時空尺度持續(xù)變化,對海量資源自主管控和保障多樣化業(yè)務需求的實時響應提出了嚴峻的挑戰(zhàn)。針對該挑戰(zhàn),設計了面向MSNs 的立體可重構資源管控架構,通過在空間部署不同功能等級的衛(wèi)星管控節(jié)點實現(xiàn)對MSNs 異構資源的層次化管理,并提出基于深度強化學習(Deep Reinforcement Learning,DRL)的多維資源調度策略對多元業(yè)務需求動態(tài)重構不同管控節(jié)點的資源,以提高資源利用率和保障服務質量。仿真結果驗證了基于所提架構的資源管控方法相較于傳統(tǒng)啟發(fā)式算法,可提升11. 64% 的資源利用率和46. 4% 的任務完成率。
關鍵詞:大規(guī)模衛(wèi)星網(wǎng)絡;軟件定義網(wǎng)絡;可重構管控;深度強化學習
中圖分類號:TN919. 23 文獻標志碼:A 開放科學(資源服務)標識碼(OSID):
文章編號:1003-3114(2024)06-1169-08
0 引言
近些年,衛(wèi)星網(wǎng)絡正在蓬勃發(fā)展,例如“星鏈”計劃的實施和中國北斗導航衛(wèi)星的發(fā)射等,使得目前在軌衛(wèi)星數(shù)量高達數(shù)千顆以上[1],可提供更大的連接容量、更低的延遲、更廣的覆蓋范圍、更強的抗干擾能力等,有效克服了以地面蜂窩網(wǎng)絡為主的二維平面覆蓋結構覆蓋不足、對地面基礎設施強依賴等問題,促進了環(huán)境監(jiān)測、工業(yè)自動化、智慧城市等眾多應用的發(fā)展[2]。隨著各國及企業(yè)衛(wèi)星項目的逐步實施,空間網(wǎng)絡已成為由不同軌道高度、不同功能衛(wèi)星組成的大規(guī)模衛(wèi)星網(wǎng)絡(Mega Satellite Networks,MSNs)[3]。其海量衛(wèi)星節(jié)點高動態(tài)移動,導致星間鏈路高動態(tài)切換,網(wǎng)絡拓撲大范圍、持續(xù)性動態(tài)變化,使得MSNs 自主管控極具挑戰(zhàn)。與此同時,數(shù)據(jù)流量持續(xù)增長且需求快速變化,但不同功能的資源通常只為特定的業(yè)務調度,這些資源受制于其專用硬件基礎設施,且來自不同的制造商,具有不同的通信協(xié)議,對MSNs 衛(wèi)星節(jié)點各類異構資源的協(xié)同調度也提出了難題[4-5]。
在人工智能興起的時代,軟件定義網(wǎng)絡(Software Defined Networking,SDN)、網(wǎng)絡功能虛擬化以及智能學習成為突破這些限制的可能,其中SDN 已成功應用于地面通信系統(tǒng),對網(wǎng)絡設計和優(yōu)化產生了重要的推動作用[6]。通過SDN,可以控制邏輯與底層數(shù)據(jù)轉發(fā)設備分離,并對數(shù)據(jù)平面進行集中控制。而SDN 控制器能夠根據(jù)整個網(wǎng)絡的狀態(tài)制定高效的資源分配策略[7]。由于只有數(shù)據(jù)轉發(fā)功能,支持SDN 的基礎設施不需要冗雜的傳輸協(xié)議,只需執(zhí)行從控制器接收到的指令,進而簡化了不同硬件的耦合以及底層基礎設施的配置,從而降低系統(tǒng)升級成本。大量研究人員為支持SDN 的MSNs開發(fā)了許多新穎的體系結構,這些提出的體系結構大多在地面部署SDN 控制器來集中控制衛(wèi)星,但由于中軌(Medium Earth Orbit,MEO)衛(wèi)星和低地球軌道(Low Earth Orbit,LEO)衛(wèi)星的高移動性和星間鏈路的長傳播延遲,地面控制器難以及時獲取整個網(wǎng)絡的狀態(tài)信息。此外,很少有研究考慮SDN 在涉及多層衛(wèi)星網(wǎng)絡和地面通信網(wǎng)絡中的適用性。
為實現(xiàn)MSNs 的自主管控和保障高質量服務,本文提出了立體可重構的SDN 資源管控架構,通過SDN 和虛擬化技術對多維異構資源進行整合,實現(xiàn)統(tǒng)一化管理,并在不同軌道高度的衛(wèi)星上部署不同等級的管控功能,減少對地面管控節(jié)點的依賴,完成自主化遞階管控?;谠摴芸丶軜嫞岢隽藰I(yè)務驅動的資源管理框架以實現(xiàn)高效的資源分配。在該管理框架中,資源分配策略直接決定資源的利用率。傳統(tǒng)資源分配方法,如數(shù)學規(guī)劃和啟發(fā)式優(yōu)化[8],無法適應大規(guī)模的資源與業(yè)務適配場景,復雜度隨著網(wǎng)絡規(guī)模的增大呈指數(shù)級增長[9-10]。因此,本文采用深度強化學習(Deep Reinforcement Learning,DRL)方法依據(jù)多元業(yè)務的動態(tài)網(wǎng)絡環(huán)境對不同管控節(jié)點的資源進行重構,以顯著提升各類資源的利用率并保障業(yè)務的不同需求。性能評估結果驗證了立體可重構的SDN 架構可以顯著減少管控開銷,基于DRL 的資源分配方法相較于傳統(tǒng)啟發(fā)式方法具有更高的資源利用率。
1 基于SDN 的立體可重構資源管控架構
本節(jié)介紹了SDN 在MSNs 中的應用,并設計了基于SDN 的立體可重構資源管控架構以實現(xiàn)高效的資源協(xié)作。
1. 1 SDN 在MSNs 中的應用
考慮MSNs 中的一個典型多層體系結構,如圖1所示,該體系結構主要由高軌(Geosynchronous EarthOrbit,GEO)、MEO 和LEO 衛(wèi)星及地面通信設備組成。GEO 和MEO 衛(wèi)星通常體積較大,可攜帶更多的載荷,因此SDN 控制器得以在中高軌上部署以實現(xiàn)控制面和數(shù)據(jù)面的分離。由于衛(wèi)星的快速發(fā)展,LEO 衛(wèi)星攜帶載荷能力增強,使控制器部署在一些LEO 衛(wèi)星上成為可能。以北斗三號系統(tǒng)為例,其包含3 顆地球同步軌道衛(wèi)星、3 顆傾斜地球同步軌道衛(wèi)星和24 顆MEO 衛(wèi)星,可在沒有地面站支持的情況下自主運行[11],其中地球同步軌道衛(wèi)星可以提供最大的覆蓋范圍,同時表現(xiàn)出最高的傳播延遲。雖然LEO 衛(wèi)星的傳播延遲最小,但為了提供更大的覆蓋范圍,必須在軌道上部署大量衛(wèi)星,導致了切換和移動管理的復雜性。因此,為減少LEO 衛(wèi)星的管控復雜度,減緩地面的壓力,實現(xiàn)對網(wǎng)絡行為的動態(tài)調節(jié)和網(wǎng)絡資源的管理,以地面網(wǎng)絡管控衛(wèi)星為主,在空間各層部署不同能力的控制器成為未來管控架構設計的趨勢。
SDN 在MSNs 中的運行模式根據(jù)具體目標可以分為兩大類:衛(wèi)星中的SDN、地面網(wǎng)絡管控中心中的SDN。目前越來越多的衛(wèi)星具備了機載處理和路由的能力,因此,可以執(zhí)行來自控制器的切換及資源調度方案。而地面SDN 可作為全局控制中心來宏觀調控空間衛(wèi)星控制器,通過空間上收集空間衛(wèi)星控制器的信息來實時反饋網(wǎng)絡環(huán)境信息,充分利用星間鏈路資源,減緩星地下行鏈路通道擁塞情況,提升星間和星地資源利用率。考慮到衛(wèi)星數(shù)量繁多,可根據(jù)衛(wèi)星節(jié)點之間的傳輸時延以及流量分布進行動態(tài)聚簇,并篩選出簇頭來部署控制器,該控制器需要采集管控區(qū)域內的網(wǎng)絡信息,而部署控制器的成本和用以交互的管控信令傳輸開銷相互制約,部署的控制器越多,受控衛(wèi)星到達最近控制器的傳輸時延越小,反之越大。因此,需要在二者之間權衡,以獲取最優(yōu)的集中-分布式管控架構,實現(xiàn)高效的資源管控。
1. 2 立體可重構資源管控架構
駐留在地面網(wǎng)絡管控中心的主控制器作為主協(xié)調器負責整個網(wǎng)絡的集中管控,通過接口與空間段衛(wèi)星網(wǎng)絡中的其他控制器通信交換聚合的控制信息。在衛(wèi)星網(wǎng)絡中,數(shù)據(jù)平面由LEO 衛(wèi)星組成,它們充當交換機,簡單地執(zhí)行基于流的數(shù)據(jù)轉發(fā)??刂破矫嬗刹渴鹂刂破鞯模牵牛希?MEO/ LEO 衛(wèi)星組成,其中高級控制器集中管理和控制LEO 衛(wèi)星之間的移動切換管理、全局流量統(tǒng)計、服務質量保障和故障管理,低級控制器負責業(yè)務規(guī)劃、路由決策、拓撲更新和資源分配與管理等??刂破魍ㄟ^衛(wèi)星網(wǎng)絡的OpenFlow 通道,將所有控制指令發(fā)送到所屬區(qū)域內的LEO 衛(wèi)星,控制器之間的交互由地面管控中心遞階反饋與傳遞,如圖2 所示,基于SDN 的體系結構中衛(wèi)星網(wǎng)絡將易于配置和更新。
由于大量的信令開銷和不可忽略的控制延遲,僅依靠一個地面SDN 控制器進行全網(wǎng)范圍的資源管控效率非常低。為了可擴展性,多個SDN 控制器被組織成一個立體層次結構來管理多層衛(wèi)星資源,不同層的SDN 控制器針對自己管控區(qū)域內的節(jié)點操作。其中可部署控制器的LEO 衛(wèi)星處于立體結構的最低級,覆蓋面積最小。在距離較近的情況下,LEO 衛(wèi)星的控制器能夠及時管理和調度周邊其他LEO 衛(wèi)星內的資源。MEO 衛(wèi)星控制器可覆蓋更大的區(qū)域,協(xié)調多個LEO 衛(wèi)星控制器進行更高層次的網(wǎng)絡操作。地面網(wǎng)絡管控中心則作為最高級控制,用來定期收集衛(wèi)星與網(wǎng)絡環(huán)境信息,例如軌道位置、覆蓋范圍、資源可用性、業(yè)務請求等,并相應地快速分配資源,對整個網(wǎng)絡進行規(guī)整,協(xié)調各個控制器的操作。
2 業(yè)務驅動的資源管理框架
在MSNs 中,衛(wèi)星的資源種類和使用情況都存在較大差異。本節(jié)在前文基礎上,提出了面向大規(guī)模網(wǎng)絡的資源管控框架,利用SDN 和虛擬化技術實現(xiàn)MSNs 統(tǒng)一的資源管控,如圖3 所示。
框架由4 層組成:基礎設施層、虛擬資源層、控制層和應用層?;A設施層包括各種網(wǎng)絡的通信及管理設備,如衛(wèi)星、地面站和網(wǎng)絡管控中心等,甚至設備單元,如終端有效載荷、天線、傳感器和存儲器等。虛擬資源層包括資源虛擬化管理和虛擬資源池,通過資源虛擬化管理將設備的物理資源映射為虛擬化資源;同時構建虛擬資源池來管理網(wǎng)絡中的多個虛擬化資源,其中感知、通信、計算和存儲資源均被抽象為虛擬化資源。而應用層與業(yè)務相關,通過提取服務的特征和需求對業(yè)務進行分類。由于提取過程適用于各種空間業(yè)務,因此業(yè)務特征管理具有較強的可擴展性,可以適應MSNs 中不斷增加的業(yè)務。最關鍵的是控制層,其通過SDN 實現(xiàn)控制平面與數(shù)據(jù)平面分離,并在地面網(wǎng)絡管控中心以及攜帶計算載荷的部分衛(wèi)星,實現(xiàn)以地面段管控為主、空間段衛(wèi)星為輔的空間分層管控,進而達到更高的資源分配管理效率。資源分配管理策略決定了網(wǎng)絡對不同需求業(yè)務的服務程度以及資源的利用情況,是保障對多樣化業(yè)務高效服務的關鍵。
2. 1 資源虛擬化
資源虛擬化根據(jù)對應的物理資源特性,使用統(tǒng)一的范式進行映射和表達。由于不同衛(wèi)星中同一類別資源存在差異性,可構建虛擬資源池并將預先規(guī)劃好的虛擬資源集合起來,實現(xiàn)MSNs 多維異構資源的統(tǒng)一管理,包括衛(wèi)星坐標、覆蓋范圍、頻帶、天線數(shù)量等參數(shù)可以轉化為時間、頻率和空間上的通信資源。而計算載荷和存儲空間也可以進一步被映射為計算資源和存儲資源,且可見光或紅外光學載荷以及合成孔徑雷達等可被抽象為感知資源,網(wǎng)絡可根據(jù)業(yè)務需求靈活匹配多維資源。因此,資源虛擬化管理在保持物理資源與對應虛擬資源的映射關系方面起著重要作用。通過映射關系,資源虛擬化管理可以實現(xiàn)動態(tài)更新虛擬資源池,根據(jù)物理資源的狀態(tài),定期更新虛擬資源池中的虛擬化資源。例如,因衛(wèi)星之間不可見而導致通信鏈路斷開時,資源虛擬化管理可以將相關的虛擬通信資源從虛擬資源池中移除。同時,資源虛擬化管理可以篩選合適的虛擬資源以服務對應的業(yè)務,即在為業(yè)務分配虛擬資源時,選擇具有相應物理資源的設備來提供服務。
2. 2 業(yè)務特征提取
根據(jù)上述分析可知,不同的任務對各種虛擬資源的需求也不盡相同,而多樣化的業(yè)務也給MSNs帶來了巨大的壓力。常見的業(yè)務包括遙感、導航以及通信任務等,其中遙感任務產生各種光學或雷達圖像等時空高分辨率數(shù)據(jù),造成海量流量,要求網(wǎng)絡提供高帶寬的傳輸鏈路,以獲取指定環(huán)境信息來支撐環(huán)境監(jiān)測等服務。導航任務注重高精度數(shù)據(jù)的提取與快速傳輸,極具時延敏感性且優(yōu)先級高,以支持地面交通等領域的應用。通信業(yè)務主要涉及數(shù)據(jù)傳輸業(yè)務,包括地面用戶的語音業(yè)務和視頻業(yè)務等,通常由Starlink 等LEO 衛(wèi)星來實現(xiàn)數(shù)據(jù)快速地存儲與轉發(fā)。由于需求和約束的不同,各種業(yè)務之間很難實現(xiàn)統(tǒng)一的管理。在應用層中,本文構建了一個業(yè)務特征模型以支撐業(yè)務特征的管理,該模型提取了不同業(yè)務的多個典型的特征,包括流量、優(yōu)先級、時延、速率和分辨率等,這些需要量化的指標可通過人為采集或機器采樣等方式獲取,例如業(yè)務流量的實時人為監(jiān)測可獲取其流量特征和分布等。與此同時,也可以通過自動提取的方式獲取,例如利用深度神經網(wǎng)絡來提取業(yè)務特征。自動提取的方式從智能機器的角度揭示了業(yè)務和特征之間的內在映射關系,包括準確的特征描述,甚至其他更具代表性的隱藏特征。需要注意的是,盡管可以通過自動提取找到更好的特征,但它通常需要更多的計算,對星上載荷的能力要求更高。因此,人為對智能采集進行操控,篩選理想的特征進行業(yè)務特征管理并節(jié)省計算量,是滿足未來日益增長的業(yè)務需求的最佳選擇。
3 面向MSNs 的資源智能管理
傳統(tǒng)的資源管理方法強烈依賴于環(huán)境的先驗知識,例如通過時變圖建模線性規(guī)劃問題對一段周期內的資源進行規(guī)劃[12],或者采用傳統(tǒng)啟發(fā)式方法對大規(guī)模規(guī)劃問題進行快速求解。但面對日益增長的多樣化業(yè)務需求和更加復雜多變的網(wǎng)絡環(huán)境,這類方法不僅需要更多的計算成本,而且需要更多的全局網(wǎng)絡信息。因此,本文引入DRL 來減少對環(huán)境先驗知識的依賴,并根據(jù)網(wǎng)絡和業(yè)務的動態(tài)變化來動態(tài)更新決策。DRL 是一種具有較強學習和計算能力的人工智能方法,基于數(shù)據(jù)的預處理,可以直接響應各種輸入需求。
考慮一個具體的多維資源分配場景,衛(wèi)星拓撲在劃分的每個時隙內視為準靜態(tài),并且LEO 衛(wèi)星在每個時隙內都不斷地產生新的任務數(shù)據(jù),例如時延敏感任務和時延容忍任務,依據(jù)所提的立體可重構架構,計算任務可被傳輸?shù)讲渴鹆丝刂破鞯男l(wèi)星管控節(jié)點上進行卸載,并通過重構這些節(jié)點上的計算資源以保障任務的服務質量,完成最小化任務周期內處理時延和最大化任務完成率等目標。同時,不同類型任務的時延需求,以及不同等級管控節(jié)點攜帶的計算資源、通信資源、能量和卸載選擇等約束,與所設目標共同構成資源分配問題。然而該類問題通常被建模為混合整數(shù)非線性規(guī)劃問題,其變量和約束通常是高維的,傳統(tǒng)啟發(fā)式算法依賴于網(wǎng)絡環(huán)境的先驗知識,且容易陷入局部最優(yōu)解。因此,本文提出了一種基于DRL 的多維資源調度策略來求解該問題。該問題可以用四元組表示的馬爾可夫決策過程,即(S,A,π,R),其中S 表示每個時隙開始時各衛(wèi)星狀態(tài)構成的狀態(tài)空間,包括LEO 衛(wèi)星生成的任務信息,所有管控節(jié)點剩余的計算資源、能量資源和帶寬資源等;A 表示每個時隙開始時管控節(jié)點對資源的分配決策,包括任務在哪顆管控衛(wèi)星(MEO 或GEO 衛(wèi)星)上卸載處理,對任務的計算資源和帶寬資源分配量;π 表示狀態(tài)轉移概率,即當前時隙的衛(wèi)星狀態(tài)和資源分配決策直接決定了下一個時隙的狀態(tài),屬于確定性的狀態(tài)轉移;R 表示獎勵,是直接影響DRL 學習效果的因素[13]。本文獎勵由5 個函數(shù)組成:當前時隙下的所有任務處理時延函數(shù)和任務完成量函數(shù),并設置權重以保障二者的量級統(tǒng)一;懲罰函數(shù),包括任務超時的時延懲罰函數(shù)、計算資源和帶寬資源的過載懲罰函數(shù)以及能量資源的耗盡懲罰函數(shù)。
考慮到所提問題的動作空間是連續(xù)高維的[14],本文應用了演員-評論者(Actor-Critic,AC)框架,并采用深度確定性策略梯度(Deep Deterministic PolicyGradient,DDPG)方法提升算法的學習效率和穩(wěn)定性。如圖4 所示的AC 框架中,Actor 和Critic 分別包含一個策略網(wǎng)絡和一個Q 網(wǎng)絡[15]。策略網(wǎng)絡的功能是對策略進行參數(shù)化,Q 網(wǎng)絡用于對動作進行評估。因此,Actor 可以根據(jù)Critic 的評價優(yōu)化策略梯度并更新策略,而Critic 可以根據(jù)Actor 的策略更新Q 網(wǎng)絡。Actor 和Critic 之間的持續(xù)互動最終使策略收斂,從而獲得LEO 任務每個時隙在哪個管控節(jié)點、管控節(jié)點分配了多少計算資源、需要多少帶寬資源進行任務傳輸?shù)葎幼餍畔?,進而獲取最優(yōu)的資源分配策略來實現(xiàn)最低的任務處理時延和最大的任務完成量。
4 仿真結果與分析
為簡化問題,本文假設了兩個相對距離最遠的地面站,并引入GEO 和MEO 衛(wèi)星、Kuiper 以及StarLink 星座參數(shù)[16],統(tǒng)計了不同規(guī)模和管控模式下的受控節(jié)點到部署了SDN 控制器設備的距離。
如圖5 所示,當網(wǎng)絡規(guī)模較小時,只有地面網(wǎng)絡管控的模式與加入了管控衛(wèi)星的跳數(shù)相差較小,一旦規(guī)模增大到千顆以上時,純地基管控模式的控制器傳輸開銷明顯增大。相比之下,部署了控制器的MEO 和LEO 衛(wèi)星空間管控模式可最大減少約12 跳。與此同時,本文統(tǒng)計了相同控制器數(shù)量下僅MEO 和MEO+LEO 兩種管控模式,來探索分布式管控模式的優(yōu)勢。隨著規(guī)模增大,控制器數(shù)量也在增多,當LEO 衛(wèi)星數(shù)量分別為100、500、1 000 和1 500時,SDN 控制器數(shù)量對應為7、19、38 和45。在相同控制器數(shù)量時可以發(fā)現(xiàn),添加了LEO 控制器的管控模式可進一步減少傳輸跳數(shù),說明當構造空間輔控的立體可重構管控架構時,可充分利用空間資源通過底層控制器輔助管控高層衛(wèi)星管控不到的LEO衛(wèi)星,彌補網(wǎng)絡中的管控空洞。在相同控制器部署開銷的情況下,立體可重構管控架構的傳輸增益可提升約1. 5 倍,是未來管控MSNs 的趨勢。
本文對集中管控架構與所提架構在控制流表開銷方面進行了比較,如圖6 所示。集中管控架構需要地面管控中心對衛(wèi)星網(wǎng)絡中的每一顆衛(wèi)星進行管控,其流表中包含了衛(wèi)星路由的冗余信息,例如相同的下一跳或者重疊的匹配字段,進而導致遠大于所提架構的流表大小。所提架構充分利用了空間的冗余性,在空間段不同等級的控制器內對流表中的冗余信息進行壓縮,可降低至原流表開銷的1 /5。雖然衛(wèi)星控制器部署越多,流表開銷越小,但控制器的部署成本同時也在增加。因此,流表的開銷與控制器部署的成本需要權衡,以最大程度提升所提架構的性能。
本文深入研究了基于DRL 的智能方法和其他啟發(fā)式算法關于資源分配策略性能上的對比,假設每顆LEO 衛(wèi)星在每個時隙隨機產生觀測任務和導航任務,前者通常任務數(shù)據(jù)量較大,屬于時延容忍型(Delay Sensitive,DS),設置為1 ~ 10 s;后者任務數(shù)據(jù)量較小,屬于時延敏感型(Delay Tolerant,DT),設置為50 ~ 100 ms。通過假設可以在本地和不同等級的控制器上(如GEO)對任務進行計算卸載,展示計算資源的協(xié)作對任務完成情況和資源利用情況的影響,具體仿真參數(shù)參考了文獻[17-18]。
如圖7 所示,隨著DS 和DT 任務量的持續(xù)增加,分別統(tǒng)計了兩種業(yè)務的完成率。對于隨機選擇控制器以及貪婪思想的調度策略,當任務數(shù)據(jù)量增大時,DT 任務完成率基本呈線性下降,而基于DRL資源調度策略的兩類任務完成率僅降低約15% ,相比于貪婪和隨機方法,最多可提升46. 4% 的任務完成增益。原因是對于DS 任務,貪婪策略優(yōu)先選擇高級控制器,如GEO 的計算資源,使得傳輸時延成本增加,導致DS 任務時延需求無法滿足,進而任務完成率低;對于DT 任務,貪婪策略優(yōu)先占用本地的計算資源進行計算,但本地計算資源有限,需要占用鄰近的衛(wèi)星對任務進行處理,導致其他衛(wèi)星的任務無法及時處理,惡化任務完成情況。而隨機策略將任務隨機發(fā)送至不同的衛(wèi)星控制器上進行處理,有效減少對鄰近衛(wèi)星的占用。因此在DT 任務量增長后,其任務完成率比貪婪策略高20. 4% 。
圖8 通過統(tǒng)計不同類別的資源使用情況,可以得知算法性能優(yōu)劣?;冢模遥?的資源調度策略通過提高資源利用率來提升任務完成率,相較于貪婪和隨機策略可顯著提升11. 64% 。同時,貪婪策略下的通信資源利用率低于其他兩種策略,這是因為貪婪策略的就近原則導致通信鏈路的開銷明顯小于其他兩種策略。綜上,隨機策略雖然可以利用其他控制器的資源進行計算,但不能最大程度利用;而貪婪算法在每個時隙優(yōu)化得到該時隙下最優(yōu)的分配方法,不具備長期策略性,導致靠后的時隙資源利用不能達到最優(yōu)。引入DRL 的智能資源分配方案可動態(tài)調整策略以應對網(wǎng)絡環(huán)境變化,高效處理大規(guī)模、高維且不確定性的任務規(guī)劃問題。
5 結束語
本文研究了MSNs 中的資源管理問題,討論了SDN 和虛擬化技術在衛(wèi)星網(wǎng)絡中的應用,并依據(jù)不同衛(wèi)星的軌道高度、載荷能力等部署不同的控制器,設計了面向MSNs 的立體可重構資源管控架構,使得控制平面和數(shù)據(jù)平面有效分離,底層基礎設施的升級及配置也更加簡易?;谛碌墓芸丶軜嫞M一步提出了一種資源管控框架,通過SDN 和虛擬化技術整合所有異構資源,以匹配資源和多樣化業(yè)務。為提高匹配效率,DRL 作為智能方法被引入以高效提取業(yè)務與資源特征,進而快速獲取有效匹配決策并顯著提升資源利用率與任務完成率,成為滿足新型網(wǎng)絡需求的關鍵。
參考文獻
[1] WANG C X,YOU X H,GAO X Q,et al. On the Road to6G:Visions,Requirements,Key technologies,and Testbeds[J]. IEEE Communications Surveys & Tutorials,2023,25(2):905-974.
[2] HONG T,ZHAO W T,LIU R K,et al. SpaceAirGroundIoT Network and Related Key Technologies[J]. Mathematical Research Letters,2020,27(2):96-104.
[3] SHI Y P,CAO Y R,LIU J J,et al. A Crossdomain SDNArchitecture for Multilayered Spaceterrestrial IntegratedNetworks[J]. IEEE Network,2019,33(1):29-35.
[4] HAN S,HUANG Y T,MENG W X,et al. Optimal PowerAllocation for SCMA Downlink Systems Based on MaximumCapacity[J]. IEEE Transactions on Communications,2019,67(2):1480-1489.
[5] MALEKI S,CHATZINOTAS S,EVANS B,et al. CognitiveSpectrum Utilization in Ka Band Multibeam Satellite Communications[J]. IEEE Communications Magazine,2015,53(3):24-29.
[6] LIU J J,SHI Y P,ZHAO L,et al. Joint Placement of Controllers and Gateways in SDNEnabled 5GSatellite Integrated Network[J]. IEEE Journal on Selected Areas inCommunications,2018,36(2):221-232.
[7] KIM H,FEAMSTER N. Improving Network Managementwith Software Defined Networking[J]. IEEE Communications Magazine,2013,51(2):114-119.
[8] DING J F,YU R,ZHANG Y,et al. Service Provider Competition and Cooperation in Cloudbased Software DefinedWireless Networks[J]. IEEE Communications Magazine,2015,53(11):134-140.
[9] DENG B Y,JIANG C X,YAO H P,et al. The Next Generation Heterogeneous Satellite Communication Networks:Integration of Resource Management and Deep Reinforcement Learning[J]. IEEE Wireless Communications,2020,27(2):105-111.
[10]ZHANG P Y,WANG C,KUMAR N,et al. SpaceAirGround Integrated Multidomain Network Resource Orchestration Based on Virtual Network Architecture:A DRLMethod[J]. IEEE Transactions on Intelligent TransportationSystems,2022,23(3):2798-2808.
[11]陳雷,裴凌,高為廣,等. 北斗三號系統(tǒng)衛(wèi)星自主完好性監(jiān)測技術[J]. 導航定位與授時,2024,11(1):1-9.
[12]ZHOU D,SHENG M,LI J D,et al. Aerospace IntegratedNetworks Innovation for Empowering 6G:A Survey andFuture Challenges[J]. IEEE Communications Surveys &Tutorials,2023,25(2):975-1019.
[13]SHI Y D,LIAN L X,SHI Y M,et al. Machine Learningfor Largescale Optimization in 6G Wireless Networks[J]. IEEE Communications Surveys & Tutorials,2023,25(4):2088-2132.
[14]ZHU R J,LI G,ZHANG Y D,et al. Loadbalanced VirtualNetwork Embedding Based on Deep ReinforcementLearning for 6G Regional Satellite Networks [J]. IEEETransactions on Vehicular Technology,2023,72 (11):14631-14644.
[15] LETAIEF K B,SHI Y M,LU J M,et al. Edge ArtificialIntelligence for 6G:Vision,Enabling Technologies,andApplications[J]. IEEE Journal on Selected Areas in Communications,2022,40(1):5-36.
[16]CHEN Q,GIAMBENE G,YANG L,et al. Analysis ofIntersatellite Link Paths for LEO Megaconstellation Networks[J]. IEEE Transactions on Vehicular Technology,2021,70(3):2743-2755.
[17]ZHANG H Y,LIU R K,KAUSHIK A,et al. Satellite EdgeComputing with Collaborative Computation Offloading:AnIntelligent Deep Deterministic Policy Gradient Approach[J]. IEEE Internet of Things Journal,2023,10 (10):9092-9107.
[18]TANG Q Q,FEI Z S,LI B,et al. Stochastic ComputationOffloading for LEO Satellite Edge Computing Networks:ALearningbased Approach [J]. IEEE Internet of ThingsJournal,2024,11(4):5638-5652.
作者簡介:
郝 琪 女,(1996—),博士研究生。主要研究方向:衛(wèi)星網(wǎng)絡、資源調度。
(*通信作者)周 笛 女,(1991—),博士,副教授。主要研究方向:大規(guī)模星座、天地一體化網(wǎng)絡、空間信息網(wǎng)絡、衛(wèi)星互聯(lián)網(wǎng)。
盛 敏 女,(1975—),博士,教授。主要研究方向:空間信息網(wǎng)絡、B5G/6G 移動通信網(wǎng)絡、異構網(wǎng)絡融合。
史 琰 男,(1975—),博士,教授。主要研究方向:智能網(wǎng)絡、空間信息網(wǎng)絡、高性能通信與計算協(xié)同。
李建東 男,(1962—),博士,教授。主要研究方向:空間信息網(wǎng)絡、智能無線網(wǎng)絡、大規(guī)模自組織網(wǎng)絡。
基金項目:國家自然科學基金(62371360,62422114,62121001);青年人才托舉工程(2022QNRC001)