黃光平 史偉強(qiáng) 譚斌
摘要:提出一種以IP網(wǎng)絡(luò)為中心的算力網(wǎng)絡(luò)架構(gòu),即在網(wǎng)絡(luò)域創(chuàng)建云池算力資源和服務(wù)的狀態(tài),從而實(shí)現(xiàn)網(wǎng)絡(luò)層的算力編排和調(diào)度。算網(wǎng)一體編排和路由,是該算力網(wǎng)絡(luò)架構(gòu)的核心特征。針對(duì)算力網(wǎng)絡(luò)中的服務(wù)多實(shí)例應(yīng)用場(chǎng)景,所提架構(gòu)方案對(duì)SRv6或基于SRv6的業(yè)務(wù)功能鏈(SFC)做功能增強(qiáng)和擴(kuò)展,以滿足單服務(wù)對(duì)應(yīng)動(dòng)態(tài)多實(shí)例的算力路由需求。控制面架構(gòu)方案采取一種分級(jí)分層狀態(tài)表的維護(hù)機(jī)制,將不同顆粒度的算力資源和服務(wù)狀態(tài)在不同的網(wǎng)絡(luò)域做同步通告,并創(chuàng)建對(duì)應(yīng)的分級(jí)路由表,從而壓縮節(jié)點(diǎn)的狀態(tài)表和邊界網(wǎng)關(guān)協(xié)議(BGP)的通告頻率。轉(zhuǎn)發(fā)面則執(zhí)行算力服務(wù)標(biāo)識(shí)語(yǔ)義封裝,承載網(wǎng)骨干節(jié)點(diǎn)仍然保持無(wú)狀態(tài)轉(zhuǎn)發(fā)。
關(guān)鍵詞:算力網(wǎng)絡(luò);SRv6;算力狀態(tài);分級(jí)路由
Abstract: An IP network-based architecture of computing power network is proposed, which creates the state of cloud pool computing power resources and services in the network domain to realize the computing power arrangement and scheduling of the network layer. Integrated computing network arrangement and routing are the core features of the computing power network architecture. For the service multi-instance application scenario in the computing power network, the proposed architecture scheme enhances and extends SRv6 or SRv6-based service function chaining (SFC) to support the single service routing requirements for dynamic multi-instances. The control surface architecture scheme adopts a maintenance mechanism of hierarchical state tables, which synchronously notifies the computing power resources and service states of different granularity in different network domains, and creates the corresponding hierarchical routing table, to compress the state table of the node and the notification frequency of the border gateway protocol (BGP). Accordingly, a dual-semantic encapsulation with IP topology and computing service identification in the forwarding plane would also be proposed, while the backbone network nodes would remain unaware of computing power metrics.
Keywords: computing power network; SRv6; computing status; classified routing
在互聯(lián)網(wǎng)協(xié)議(IP)承載網(wǎng)絡(luò)域,通過(guò)精細(xì)化動(dòng)態(tài)感知,網(wǎng)絡(luò)控制器或網(wǎng)絡(luò)節(jié)點(diǎn)可以創(chuàng)建基于多云池內(nèi)算力資源及服務(wù)狀態(tài)的算力路由表,并據(jù)此進(jìn)行算力資源和服務(wù)的編排調(diào)度。這是以網(wǎng)絡(luò)為基礎(chǔ)平臺(tái)的算力網(wǎng)絡(luò)架構(gòu)的核心要素。也就是說(shuō),在IP拓?fù)渎酚傻幕A(chǔ)上,新增算力資源和服務(wù)路由,使路由策略約束機(jī)制由當(dāng)前的IP拓?fù)鋯渭s束演變?yōu)镮P拓?fù)浜退懔﹄p約束。這給網(wǎng)元控制面、轉(zhuǎn)發(fā)面和管理面均帶來(lái)新的挑戰(zhàn),也是算力網(wǎng)絡(luò)為IP網(wǎng)絡(luò)引入的全新議題。
當(dāng)前主流的云側(cè)應(yīng)用級(jí)跨云池計(jì)算資源調(diào)度系統(tǒng),如內(nèi)容分發(fā)網(wǎng)絡(luò)(CDN)、AWS(亞馬遜公司的云計(jì)算服務(wù))等,均與特定應(yīng)用或應(yīng)用集群硬綁定。除此之外的其他應(yīng)用無(wú)法接入該系統(tǒng)納管的計(jì)算資源。此外,這種云測(cè)算力調(diào)度系統(tǒng)納管的云池資源是一種典型的封閉調(diào)度平臺(tái),僅限于在服務(wù)商自營(yíng)的資源中,且從技術(shù)和運(yùn)營(yíng)模式上均不兼容多元云池計(jì)算資源。更重要的是,這類云測(cè)調(diào)度系統(tǒng)與網(wǎng)絡(luò)資源無(wú)關(guān),即它的網(wǎng)絡(luò)連接服務(wù)要么適用于公共網(wǎng)絡(luò)的“盡力而為”服務(wù),要么適用于專線租用或業(yè)務(wù)虛擬專用網(wǎng)絡(luò)(VPN)的開(kāi)通。網(wǎng)絡(luò)與計(jì)算業(yè)務(wù)獨(dú)立配置、獨(dú)立編排、獨(dú)立調(diào)度。以網(wǎng)絡(luò)為基礎(chǔ)平臺(tái)的算力網(wǎng)絡(luò),構(gòu)建的是一個(gè)開(kāi)放平臺(tái),即與具體的應(yīng)用和業(yè)務(wù)完全解耦,且兼容多元云池算力資源和服務(wù)。與云測(cè)算力調(diào)度顯著不同的是,在算力網(wǎng)絡(luò)架構(gòu)下,算力和網(wǎng)絡(luò)的狀態(tài)和路由表均由網(wǎng)絡(luò)維護(hù),因此這種算力網(wǎng)絡(luò)架構(gòu)內(nèi)生支持算網(wǎng)一體編排和調(diào)度。
然而,一個(gè)開(kāi)放的算力網(wǎng)絡(luò)平臺(tái),可以創(chuàng)建多元云池算力資源、服務(wù)狀態(tài)、路由表,其前提是算力資源和服務(wù)的標(biāo)準(zhǔn)化度量和標(biāo)識(shí)。SRv6(基于IPv6的源路由技術(shù))中間轉(zhuǎn)發(fā)節(jié)點(diǎn)無(wú)狀態(tài)的優(yōu)良特征,非常適合算網(wǎng)一體路由策略和路由轉(zhuǎn)發(fā),但是需要在轉(zhuǎn)發(fā)面和控制面進(jìn)行功能增強(qiáng)和擴(kuò)展,以滿足算力網(wǎng)絡(luò)場(chǎng)景下的全新需求。同時(shí),根據(jù)應(yīng)用的算網(wǎng)服務(wù)級(jí)別協(xié)議(SLA)需求,網(wǎng)絡(luò)需要進(jìn)行精準(zhǔn)靈活的資源匹配和編排,并需要對(duì)應(yīng)用的算力SLA進(jìn)行更細(xì)顆粒度的感知。
1 算力資源和服務(wù)的顆?;攘?/p>
當(dāng)前,云池算力資源和服務(wù)的運(yùn)行模式是與業(yè)務(wù)強(qiáng)相關(guān),并且高度本地化的,不存在互通和交易,因此尚無(wú)系統(tǒng)的度量和標(biāo)識(shí)方案。但是,云池內(nèi)的算力資源和服務(wù)在網(wǎng)絡(luò)域進(jìn)行應(yīng)用流顆粒度的編排和調(diào)度,涉及算力資源和服務(wù)的跨池跨域調(diào)度,以及平臺(tái)層面的多方資源交易。因此,對(duì)算力資源和服務(wù)進(jìn)行層次化顆粒度的度量和標(biāo)識(shí),是算力網(wǎng)絡(luò)架構(gòu)的關(guān)鍵因素。如圖1所示,從交付和執(zhí)行模式來(lái)看,算力資源可以分為3個(gè)層次,或稱為3種顆粒度。
1.1 算力資源和服務(wù)的層次化顆粒度
(1)基礎(chǔ)設(shè)施即服務(wù)(IaaS)類型算力資源
該類型算力資源屬于裸資源,包括中央處理器(CPU)、圖形處理器(GPU)、現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA)、專用集成電路(ASIC)等。當(dāng)前這些資源的度量顆粒度,比如核數(shù),無(wú)法滿足算力網(wǎng)絡(luò)精細(xì)顆粒度的資源調(diào)度。因此,需要針對(duì)各類異構(gòu)的計(jì)算裸資源進(jìn)行系統(tǒng)的標(biāo)準(zhǔn)度量??煞?wù)計(jì)算資源的標(biāo)準(zhǔn)量化數(shù)據(jù),是網(wǎng)絡(luò)對(duì)算力資源感知并創(chuàng)建狀態(tài)的數(shù)量依據(jù)。
(2)函數(shù)即服務(wù)(FaaS)類型算力服務(wù)
虛擬機(jī)、容器、微內(nèi)核等更細(xì)顆粒度計(jì)算單元的出現(xiàn),讓一些基礎(chǔ)計(jì)算功能或服務(wù)的駐留和運(yùn)行模式發(fā)生根本性的變化。例如,分布式的微服務(wù)架構(gòu),將傳統(tǒng)單一應(yīng)用系統(tǒng)解耦成獨(dú)立的微服務(wù)群組,應(yīng)用層根據(jù)特定的業(yè)務(wù)邏輯調(diào)用不同的微服務(wù),完成特定的業(yè)務(wù)功能。
在這種架構(gòu)下,一些與業(yè)務(wù)無(wú)關(guān)的基礎(chǔ)計(jì)算功能或算法可以實(shí)現(xiàn)分布式靈活部署,更加快速地滿足新型業(yè)務(wù)需求,縮短新業(yè)務(wù)上線周期,大幅降低部署成本。基礎(chǔ)計(jì)算功能是算力裸資源的一種可服務(wù)形態(tài),而算力網(wǎng)絡(luò)需要?jiǎng)?chuàng)建基于其狀態(tài)的路由表,并在網(wǎng)絡(luò)域完成對(duì)這種計(jì)算功能服務(wù)的編排和調(diào)度。
(3)軟件即服務(wù)(SaaS)類型算力服務(wù)
相對(duì)于當(dāng)前增值業(yè)務(wù)的單站點(diǎn)資源部署和服務(wù)模式,在算力網(wǎng)絡(luò)目標(biāo)架構(gòu)下,增值算力服務(wù)的駐留和服務(wù)將由單點(diǎn)變?yōu)槿W(wǎng)虛擬SaaS池的模式。同一類增值算力服務(wù)資源,在上層交易系統(tǒng)的支撐下,可以在算力網(wǎng)絡(luò)域完成跨池編排和調(diào)度。
1.2 算力資源和服務(wù)的度量和標(biāo)識(shí)
如1.1所述,算力資源的標(biāo)準(zhǔn)化度量,需要針對(duì)上述3種顆粒度的資源和服務(wù)進(jìn)行業(yè)務(wù)無(wú)關(guān)的通用度量,以及CPU、GPU等異構(gòu)裸資源的度量。目前,學(xué)術(shù)界和信息技術(shù)(IT)界已經(jīng)開(kāi)始了一些有益的嘗試。資源和服務(wù)標(biāo)準(zhǔn)化標(biāo)識(shí)的實(shí)現(xiàn),首先需要建立一個(gè)結(jié)構(gòu)化的標(biāo)識(shí)體系,對(duì)各種顆粒度的資源和服務(wù)進(jìn)行收斂和標(biāo)定??紤]到網(wǎng)絡(luò)單元的存儲(chǔ)和處理容量限制,網(wǎng)絡(luò)域可感知、可編排、可調(diào)度的資源和服務(wù)標(biāo)識(shí)需要優(yōu)選數(shù)字化標(biāo)識(shí)機(jī)制[1]。
2 基于SRv6的算力網(wǎng)絡(luò)增強(qiáng)控制面技術(shù)
在網(wǎng)絡(luò)域創(chuàng)建、維護(hù)云池算力資源和服務(wù)的狀態(tài),也就是完成對(duì)多資源和服務(wù)顆粒度的精細(xì)化和動(dòng)態(tài)感知,是控制面在算力網(wǎng)絡(luò)架構(gòu)下的首要功能??刂泼嬗屑惺胶头植际絻煞N通用架構(gòu)技術(shù)。
2.1 集中式控制面架構(gòu)增強(qiáng)
目前的控制器主要有3類。第1類是管理與編排(MANO)控制器,負(fù)責(zé)納管移動(dòng)邊緣計(jì)算(MEC)內(nèi)的計(jì)算和存儲(chǔ)資源、側(cè)重占用率之類的宏觀數(shù)據(jù),其顆粒度無(wú)法滿足算力網(wǎng)絡(luò)的精細(xì)化編排和調(diào)度需求。因此,可以基于上述算力資源的標(biāo)準(zhǔn)化度量,對(duì)MANO納管的算力資源顆粒度進(jìn)行擴(kuò)展和增強(qiáng)。第2類是數(shù)據(jù)中心和邊緣計(jì)算中心控制器,負(fù)責(zé)納管云內(nèi)網(wǎng)絡(luò)拓?fù)滟Y源。其顆粒度可達(dá)服務(wù)器對(duì)應(yīng)的端口號(hào),但無(wú)法納管層次化的算力資源和服務(wù)。同樣,它也可以進(jìn)行擴(kuò)展和增強(qiáng),以涵蓋對(duì)算力資源的精細(xì)化納管。第3類是IP承載網(wǎng)控制器,負(fù)責(zé)納管承載網(wǎng)絡(luò)域的拓?fù)滟Y源。
另一種可選方案則是新增算力資源編排器,可與上述3類控制器并列;但也可以居于更上一層,在納管層次化算力資源的同時(shí),統(tǒng)一納管數(shù)據(jù)中心或邊緣計(jì)算中心、IP承載網(wǎng)的網(wǎng)絡(luò)拓?fù)滟Y源,可以實(shí)現(xiàn)單點(diǎn)算網(wǎng)全局資源視圖。
2.2 分布式控制面架構(gòu)增強(qiáng)
跨云池的算力資源和服務(wù)分布式路由協(xié)議,目前主要是基于邊界網(wǎng)關(guān)協(xié)議(BGP)增強(qiáng)和擴(kuò)展。BGP在現(xiàn)網(wǎng)通告的對(duì)象主要是節(jié)點(diǎn)端口、鏈路等拓?fù)滟Y源的狀態(tài)。這些資源的變化周期通常為小時(shí)、天,甚至月的數(shù)量級(jí),網(wǎng)絡(luò)的高并發(fā)拓?fù)渥兏鼤?huì)造成路由震蕩等嚴(yán)重后果。在算力資源和服務(wù)狀態(tài)(尤其是FaaS級(jí)算力服務(wù)的狀態(tài))被通告的情景下,其資源標(biāo)識(shí)種類和通告頻率均遠(yuǎn)大于網(wǎng)絡(luò)拓?fù)滟Y源及其通告頻率。例如,在一些通用計(jì)算功能實(shí)例中,一次服務(wù)執(zhí)行的生命周期最短可達(dá)毫秒級(jí)。大規(guī)模的通告量和高通告頻率,對(duì)算力路由表的穩(wěn)定將造成嚴(yán)重的后果。因此,簡(jiǎn)單地?cái)U(kuò)展BGP通告的資源種類,無(wú)法解決路由表高度不穩(wěn)定的問(wèn)題。本文中,我們提出一種分級(jí)通告分級(jí)路由的機(jī)制,極大地壓縮BGP通告的資源數(shù)據(jù)量和通告頻率;還提出一種獨(dú)立于BGP的全新算力路由協(xié)議雛形。
2.2.1 基于BGP的分級(jí)路由機(jī)制
分級(jí)分域路由通告的算力網(wǎng)絡(luò)路由解決方案,旨在解決兩個(gè)算力網(wǎng)絡(luò)路由的問(wèn)題:多種云內(nèi)算力資源及服務(wù)在路由節(jié)點(diǎn)上引起的超大路由表項(xiàng)問(wèn)題、算網(wǎng)端到端路由問(wèn)題[2]。
我們將算力資源和服務(wù)劃分為兩種顆粒度:
(1)邊緣計(jì)算節(jié)點(diǎn)或數(shù)據(jù)中心的粗顆粒度(顆粒度記為1)算力資源,包括但不限于:
計(jì)算及存儲(chǔ)資源的種類,如CPU、GPU、嵌入式神經(jīng)網(wǎng)絡(luò)處理器(NPU)、ASIC等;
上述資源種類的可用狀態(tài),包括但不限于量化空閑資源值,如使用率、可用核數(shù)目等;
提供的算力服務(wù)種類,包括SaaS/FaaS服務(wù)種類及標(biāo)識(shí),以及服務(wù)對(duì)應(yīng)的忙閑狀態(tài)屬性,并且服務(wù)的忙閑狀態(tài)閥值可配置,如90%及以上為忙的狀態(tài);
(2)邊緣計(jì)算節(jié)點(diǎn)或數(shù)據(jù)中心的細(xì)顆粒度(顆粒度記為2)算力服務(wù),包括但不限于:
算力服務(wù)種類以及其所對(duì)應(yīng)的可服務(wù)實(shí)例數(shù);
每實(shí)例的處理容量;
算力服務(wù)與其實(shí)例之間的標(biāo)識(shí)映射關(guān)系,如一個(gè)任播地址Anycast標(biāo)識(shí)一個(gè)算力服務(wù),關(guān)聯(lián)的群組成員地址為實(shí)例地址。
粗顆粒的算力資源狀態(tài)僅在邊緣計(jì)算節(jié)點(diǎn)或數(shù)據(jù)中心節(jié)點(diǎn)之間通告,并維護(hù)對(duì)應(yīng)的路由表項(xiàng)。首次上線的節(jié)點(diǎn),通告上述粗顆粒度全集數(shù)據(jù),此后根據(jù)可配置的變更門(mén)限值來(lái)觸發(fā)變量更新通告和同步。通告可有兩種方案:BGP擴(kuò)展方案,即將上述粗顆粒度算力資源信息,通過(guò)擴(kuò)展BGP協(xié)議載荷,通告至鄰居網(wǎng)絡(luò)邊緣節(jié)點(diǎn);集中式控制器方案,包括但不限于通過(guò)路徑計(jì)算單元通信協(xié)議(PCEP)、邊界網(wǎng)關(guān)協(xié)議-鏈路狀態(tài)(BGP-LS)等通告同步上述粗顆粒度算力資源相關(guān)信息。
細(xì)顆粒度算力服務(wù)狀態(tài),僅在邊緣計(jì)算或數(shù)據(jù)中心節(jié)點(diǎn)所歸屬的域內(nèi)網(wǎng)絡(luò)邊緣節(jié)點(diǎn)進(jìn)行維護(hù),無(wú)須通告鄰居網(wǎng)絡(luò)邊緣節(jié)點(diǎn)。首次上線的節(jié)點(diǎn),通告或發(fā)布上述全集信息,此后根據(jù)可配置的變更門(mén)限值,觸發(fā)變量更新通告和同步。細(xì)顆粒度的算力服務(wù)通過(guò)如下可選方案通告網(wǎng)絡(luò)邊緣路由節(jié)點(diǎn):發(fā)布訂閱的應(yīng)用消息,并向網(wǎng)絡(luò)邊緣節(jié)點(diǎn)通告狀態(tài)數(shù)據(jù);通過(guò)內(nèi)部網(wǎng)關(guān)協(xié)議(IGP)擴(kuò)展通告,將上述細(xì)顆粒度算力服務(wù)信息通過(guò)擴(kuò)展IGP協(xié)議載荷,向網(wǎng)絡(luò)邊緣節(jié)點(diǎn)通告。
2.2.2 基于BGP的地址路由和算力服務(wù)路由的兩級(jí)路由表機(jī)制
用戶接入網(wǎng)絡(luò)邊緣節(jié)點(diǎn)維護(hù)類型1路由表,即路由節(jié)點(diǎn)僅感知邊緣計(jì)算或數(shù)據(jù)中心節(jié)點(diǎn)的粗顆粒度算力資源信息,并以此創(chuàng)建、維護(hù)對(duì)應(yīng)的算力路由表。類型1的算力資源顆粒度較粗,變更頻率較低,因此網(wǎng)絡(luò)邊緣節(jié)點(diǎn)維護(hù)的類型1路由表的大小與聯(lián)動(dòng)的邊緣路由和數(shù)據(jù)中心節(jié)點(diǎn)數(shù)目成正比,路由表規(guī)??梢缘玫綌?shù)量級(jí)的壓縮。
邊緣計(jì)算或數(shù)據(jù)中心節(jié)點(diǎn)歸屬的域內(nèi)網(wǎng)關(guān)或網(wǎng)絡(luò)邊緣節(jié)點(diǎn)維護(hù)類型2算力服務(wù)路由表,即上述域內(nèi)網(wǎng)關(guān)或網(wǎng)絡(luò)邊緣節(jié)點(diǎn)可以感知本邊緣計(jì)算或數(shù)據(jù)中心節(jié)點(diǎn)內(nèi)的算力服務(wù)狀態(tài),并以此創(chuàng)建、維護(hù)對(duì)應(yīng)的算力服務(wù)路由表或映射表。類型2路由表的大小,與該網(wǎng)絡(luò)邊緣節(jié)點(diǎn)、網(wǎng)關(guān)歸屬的邊緣計(jì)算或數(shù)據(jù)中心提供的算力服務(wù)規(guī)模成正比。由于僅做本地的或有限歸屬邊緣計(jì)算的或數(shù)據(jù)中心節(jié)點(diǎn)的算力服務(wù)信息狀態(tài)維護(hù),類型2路由表規(guī)模得到極大的壓縮。兩級(jí)算力顆粒度類型路由及通告機(jī)制如圖2所示。
2.2.3 新型算力路由協(xié)議
云內(nèi)算力資源和服務(wù)的種類以及狀態(tài)變更頻率均與現(xiàn)網(wǎng)IP拓?fù)渫ǜ嬗兄@著區(qū)別。為了適應(yīng)新型算網(wǎng)一體路由架構(gòu),我們提出一種全新的算力路由協(xié)議。該協(xié)議內(nèi)生支持算力資源和服務(wù)的跨域通告,并將與BGP解耦,從而規(guī)避算力資源的動(dòng)態(tài)對(duì)現(xiàn)網(wǎng)路由收斂的負(fù)面影響。網(wǎng)絡(luò)和算力資源的融合路由策略通過(guò)算法優(yōu)化解決。我們還提出了一種基于網(wǎng)絡(luò)L4的新算力路由協(xié)議架構(gòu),其主要特征是算力資源和服務(wù)在云內(nèi)直接發(fā)布,并由服務(wù)商邊緣路由器(PE)為其創(chuàng)建算力路由表,如圖3所示。
兩種可能的協(xié)議模式為:發(fā)布訂閱機(jī)制和定向通告機(jī)制。
(1)發(fā)布訂閱機(jī)制:作為發(fā)布主體,云池內(nèi)算力網(wǎng)關(guān)對(duì)云內(nèi)層次化算力資源進(jìn)行發(fā)布,并對(duì)云池內(nèi)算力資源狀態(tài)信息進(jìn)行結(jié)構(gòu)化設(shè)計(jì);支持增量發(fā)布,支持高頻率動(dòng)態(tài)更新;發(fā)布對(duì)象為網(wǎng)絡(luò)邊緣節(jié)點(diǎn)以及用戶的接入網(wǎng)關(guān)。
(2)定向通告機(jī)制:云內(nèi)算力網(wǎng)關(guān)向網(wǎng)絡(luò)邊緣節(jié)點(diǎn)以及用戶接入網(wǎng)關(guān)主動(dòng)發(fā)起面向連接的狀態(tài)通告,網(wǎng)絡(luò)邊緣節(jié)點(diǎn)以及用戶接入網(wǎng)關(guān)僅接收通告并據(jù)此創(chuàng)建和更新路由表;支持基于隧道的高頻率更新通告。
3 基于SRv6的算力網(wǎng)絡(luò)增強(qiáng)轉(zhuǎn)發(fā)面技術(shù)
算力網(wǎng)絡(luò)路由是一種集網(wǎng)、云、算為一體的綜合路由。在網(wǎng)絡(luò)入口節(jié)點(diǎn),算力網(wǎng)絡(luò)路由根據(jù)用戶業(yè)務(wù)的算力和網(wǎng)絡(luò)雙SLA約束,制定算網(wǎng)路由策略。和當(dāng)前IP拓?fù)渎酚娠@著不同的是,IP/多協(xié)議標(biāo)簽交換(MPLS)拓?fù)渎酚杀举|(zhì)上解決的是“去哪里”,即明確路由的網(wǎng)絡(luò)目的節(jié)點(diǎn),在參數(shù)上體現(xiàn)為IP地址或標(biāo)簽。在算力網(wǎng)絡(luò)架構(gòu)下,網(wǎng)、云、算綜合路由本質(zhì)上解決的是“去哪里”+“干什么(執(zhí)行何種計(jì)算服務(wù))”,即在IP路由的基礎(chǔ)上,疊加了算力服務(wù)路由。因此,轉(zhuǎn)發(fā)面的報(bào)文頭需要執(zhí)行IP路由+算力服務(wù)路由雙重封裝。算力網(wǎng)絡(luò)的IP和算力服務(wù)雙重路由機(jī)制網(wǎng)絡(luò)流程圖,如圖4所示。
如2.2.2節(jié)所述,在分級(jí)路由表的機(jī)制下,網(wǎng)絡(luò)在入口和出口節(jié)點(diǎn),維護(hù)有兩種不同顆粒度的算力路由表,這對(duì)應(yīng)轉(zhuǎn)發(fā)面的IP拓?fù)浜退懔Ψ?wù)雙重路由封裝。在用戶接入網(wǎng)關(guān)(如BRAS)處,網(wǎng)絡(luò)執(zhí)行上述兩級(jí)封裝,并由用戶接入網(wǎng)關(guān)根據(jù)2.2.2節(jié)所述本地維護(hù)的類型1路由表,計(jì)算生成到選定的邊緣計(jì)算或數(shù)據(jù)中心節(jié)點(diǎn)的路由,并執(zhí)行IP拓?fù)涞刂贩庋b。我們有兩種封裝方案:(1)目的地址封裝方案,即將選定的邊緣計(jì)算或數(shù)據(jù)中心節(jié)點(diǎn)歸屬的網(wǎng)絡(luò)邊緣節(jié)點(diǎn)或網(wǎng)關(guān)地址,作為目的地址,封裝在報(bào)文頭對(duì)應(yīng)的字段中,包括但不限于互聯(lián)網(wǎng)協(xié)議第4版(IPv4)、互聯(lián)網(wǎng)協(xié)議第6版(IPv6)、MPLS等網(wǎng)絡(luò)數(shù)據(jù)平面;(2)源路由地址方案,即以選定的邊緣計(jì)算或數(shù)據(jù)中心節(jié)點(diǎn)歸屬的網(wǎng)絡(luò)邊緣節(jié)點(diǎn)或網(wǎng)關(guān)作為出節(jié)點(diǎn),編排源路由路徑,并封裝在對(duì)應(yīng)的報(bào)文頭中,包括但不限于SR-MPLS、SRv6等網(wǎng)絡(luò)數(shù)據(jù)平面[3]。
用戶接入網(wǎng)關(guān)(如BRAS)根據(jù)用戶算力服務(wù)請(qǐng)求執(zhí)行算力服務(wù)標(biāo)識(shí)封裝,這包括:?jiǎn)我凰懔Ψ?wù)標(biāo)識(shí)封裝、基于SRv6的業(yè)務(wù)功能鏈(SFC)、多算力服務(wù)標(biāo)識(shí)鏈封裝。算力服務(wù)標(biāo)識(shí)的封裝包括兩種方案:(1)增強(qiáng)SRv6算力服務(wù)標(biāo)識(shí)編程擴(kuò)展方案,即在片段識(shí)別(SID)的Locator + Function(定位器+功能) 結(jié)構(gòu)中,算力服務(wù)標(biāo)識(shí)作為Function封裝在SID中,并可選擇擴(kuò)展Argument來(lái)作為算力服務(wù)的必要輸入?yún)?shù);(2)算力服務(wù)標(biāo)識(shí)封裝在IP與L4傳輸層之間的overlay層中,如SFC架構(gòu)下的網(wǎng)絡(luò)業(yè)務(wù)報(bào)文頭(NSH)、三層網(wǎng)絡(luò)虛擬化overlay(NVO3)的Geneve等,還可以在IPv6之上引入一個(gè)全新標(biāo)識(shí)層,用于封裝算力服務(wù)標(biāo)識(shí),從而實(shí)現(xiàn)與IP層完全解耦。在這種IP拓?fù)浜退懔Ψ?wù)雙路由封裝、點(diǎn)到點(diǎn)路由的機(jī)制支持下,網(wǎng)絡(luò)中間轉(zhuǎn)發(fā)節(jié)點(diǎn)無(wú)須識(shí)別算力服務(wù)標(biāo)識(shí),僅做普通路由轉(zhuǎn)發(fā),即平滑繼承當(dāng)前網(wǎng)絡(luò)中間節(jié)點(diǎn)無(wú)狀態(tài)的特征。
類型1路由的出節(jié)點(diǎn)執(zhí)行算力服務(wù)標(biāo)識(shí)解封裝,并查找節(jié)點(diǎn)維護(hù)的所屬邊緣計(jì)算或數(shù)據(jù)中心算力服務(wù)的路由表或映射表,從而將用戶數(shù)據(jù)路由至對(duì)應(yīng)的服務(wù)實(shí)例,并終結(jié)全部端到端算網(wǎng)路由。
特別地,為了保持流粘性,即確保同一應(yīng)用的數(shù)據(jù)流被路由至同一個(gè)算力服務(wù)實(shí)例,出節(jié)點(diǎn)維護(hù)應(yīng)用數(shù)據(jù)流標(biāo)識(shí)與算力服務(wù)實(shí)例的映射關(guān)系,并將后續(xù)應(yīng)用數(shù)據(jù)流路由至同一算力服務(wù)實(shí)例。這種映射關(guān)系的維護(hù)方法包括但不限于5元組方案(源IP地址、目的IP地址、源端口、目的端口、傳輸層協(xié)議類型)。在IP拓?fù)浜退懔Ψ?wù)雙重封裝的機(jī)制下,算力服務(wù)標(biāo)識(shí)僅僅體現(xiàn)了服務(wù)類型的抽象語(yǔ)義,而實(shí)際服務(wù)實(shí)例節(jié)點(diǎn)的映射關(guān)系被維護(hù)在2.2.2節(jié)所述的類型2路由表中。由于路由表具有與業(yè)務(wù)無(wú)關(guān)的中性特征,算力業(yè)務(wù)流粘性的維護(hù)保證,需要在出入口節(jié)點(diǎn)維護(hù)業(yè)務(wù)相關(guān)的狀態(tài)。在兩級(jí)路由、兩級(jí)封裝的全流程下,流粘性也需要維護(hù)對(duì)應(yīng)的兩個(gè)顆粒度的狀態(tài),即在入口節(jié)點(diǎn)維護(hù)業(yè)務(wù)標(biāo)識(shí)和算力服務(wù)標(biāo)識(shí)的狀態(tài),業(yè)務(wù)標(biāo)識(shí)可通過(guò)類似前述5元組的模式實(shí)現(xiàn)。在出口節(jié)點(diǎn)維護(hù)業(yè)務(wù)標(biāo)識(shí)、算力服務(wù)標(biāo)識(shí)和服務(wù)標(biāo)識(shí)實(shí)例的狀態(tài),服務(wù)標(biāo)識(shí)實(shí)例可以是虛擬局域網(wǎng)(VLAN)/虛擬擴(kuò)展局域網(wǎng)(VxLAN)號(hào)、端口號(hào)、IP地址等。
4 網(wǎng)絡(luò)對(duì)算力應(yīng)用的感知
在當(dāng)前數(shù)據(jù)網(wǎng)絡(luò)的轉(zhuǎn)發(fā)和路由機(jī)制中,網(wǎng)絡(luò)資源和策略對(duì)應(yīng)的最小顆粒度是流甚至報(bào)文。也就是說(shuō),從本質(zhì)上看,網(wǎng)絡(luò)路由策略是與業(yè)務(wù)無(wú)關(guān)的。在算力網(wǎng)絡(luò)架構(gòu)下,網(wǎng)絡(luò)感知云池算力資源和服務(wù),并根據(jù)應(yīng)用的算力SLA,在網(wǎng)絡(luò)層對(duì)算力資源和服務(wù)進(jìn)行編排和調(diào)度。與當(dāng)前網(wǎng)絡(luò)策略和路由機(jī)制不同的是,算力資源和服務(wù)對(duì)應(yīng)的最小顆粒度是算力應(yīng)用,且必須與業(yè)務(wù)相關(guān)。當(dāng)前網(wǎng)絡(luò)路由策略的聚合服務(wù)質(zhì)量(QoS)機(jī)制,無(wú)法直接對(duì)標(biāo)算力QoS的顆粒度。算力QoS更加靈活,不便于聚合,因此算力網(wǎng)絡(luò)的另一個(gè)全新技術(shù)挑戰(zhàn)是網(wǎng)絡(luò)層(L3)對(duì)應(yīng)用的算力SLA的感知。
由于ISO層級(jí)解耦的內(nèi)生架構(gòu)原則,當(dāng)前網(wǎng)絡(luò)層沒(méi)有感知接口,對(duì)應(yīng)用無(wú)感知。算力網(wǎng)絡(luò)架構(gòu)下,應(yīng)用的算力SLA的感知主要有兩種方案:一種是控制面方案,即所謂的帶外方案,通過(guò)類似接入控制信令擴(kuò)展向網(wǎng)絡(luò)入口網(wǎng)關(guān)通告特定算力應(yīng)用的SLA,網(wǎng)絡(luò)入口網(wǎng)關(guān)據(jù)此創(chuàng)建算力應(yīng)用顆粒度的會(huì)話??刂泼娣桨傅膬?yōu)勢(shì)是安全、可信、與設(shè)備硬件無(wú)關(guān)。另一種方案是轉(zhuǎn)發(fā)面方案,即所謂的帶內(nèi)方案,通過(guò)在IPv6或SRv6的擴(kuò)展頭中增強(qiáng)封裝應(yīng)用標(biāo)識(shí)及其SLA,網(wǎng)絡(luò)節(jié)點(diǎn)解封裝即可執(zhí)行對(duì)應(yīng)的路由策略。轉(zhuǎn)發(fā)面應(yīng)用感知方案的優(yōu)勢(shì)是網(wǎng)絡(luò)每個(gè)節(jié)點(diǎn)均可做精細(xì)化策略和資源匹配,但這也引入了額外的安全問(wèn)題,以及大量的冗余硬件設(shè)備處理負(fù)荷。
5 結(jié)束語(yǔ)
算力資源和服務(wù)的標(biāo)準(zhǔn)化度量和標(biāo)識(shí)是算力網(wǎng)絡(luò)中一個(gè)重要的支撐要素。層次化資源和服務(wù)顆粒度下的度量和標(biāo)識(shí),帶來(lái)了精細(xì)化的可編排、可調(diào)度算力資源和服務(wù)體系。在網(wǎng)絡(luò)域創(chuàng)建云池算力資源和服務(wù)的狀態(tài),給控制面尤其是路由協(xié)議如BGP等帶來(lái)了挑戰(zhàn)。本文中,我們提出了一種基于聚合原則的分級(jí)分層路由表機(jī)制,即將算力資源和服務(wù)分為粗和細(xì)兩種顆粒度,極大地壓縮了路由協(xié)議的通告頻率和路由表尺寸。同樣,在轉(zhuǎn)發(fā)面引入基于SRv6可編程的增強(qiáng)功能,或擴(kuò)展overlay層的IP拓?fù)浜退懔Ψ?wù)標(biāo)識(shí)雙重語(yǔ)義封裝,都能較好地適應(yīng)IP拓?fù)浜退懔Ψ?wù)雙重路由的全新需求和場(chǎng)景。同樣,當(dāng)前網(wǎng)絡(luò)L3不能感知應(yīng)用的層級(jí)解耦模式,無(wú)法應(yīng)對(duì)算力網(wǎng)絡(luò)的資源匹配和調(diào)度需求。這需要通過(guò)帶外模式,即控制面增強(qiáng)擴(kuò)展方案來(lái)實(shí)現(xiàn)網(wǎng)絡(luò)層對(duì)算力應(yīng)用感知,對(duì)現(xiàn)網(wǎng)架構(gòu)以及設(shè)備的影響最小。
參考文獻(xiàn)
[1] 朱海東. 云網(wǎng)一體使能網(wǎng)絡(luò)即服務(wù) [J]. 中興通訊技術(shù), 2019, 25(2): 9-14. DOI: 10.12142/ ZTETJ.201902002
[2] 劉鐸,楊涓,譚玉娟. 邊緣存儲(chǔ)的發(fā)展現(xiàn)狀與挑戰(zhàn) [J]. 中興通訊技術(shù), 2019(3): 15-22. DOI: 10.12142/ZTETJ.201903003
[3] 馬洪源. 面向5G的邊緣計(jì)算及部署思考 [J]. 中興通訊技術(shù), 2019(3): 77-81. DOI: 10.12142/ ZTETJ.201903011
作者簡(jiǎn)介
黃光平,中興通訊股份有限公司資深架構(gòu)師;主要研究方向?yàn)橄乱淮鶬P網(wǎng)絡(luò)架構(gòu)及關(guān)鍵技術(shù),先后從事增值業(yè)務(wù)消息系統(tǒng)設(shè)計(jì)和開(kāi)發(fā)、確定性網(wǎng)絡(luò)以及遠(yuǎn)程寬帶接入網(wǎng)關(guān)全球標(biāo)準(zhǔn)工作;發(fā)表論文3篇,申請(qǐng)專利20余件。
史偉強(qiáng),中興通訊股份有限公司有線架構(gòu)總經(jīng)理;主要研究方向?yàn)镮P網(wǎng)絡(luò)、光網(wǎng)絡(luò)和SDN系統(tǒng)架構(gòu)與技術(shù),先后從事網(wǎng)管、接入網(wǎng)和SDN控制器等產(chǎn)品的架構(gòu)設(shè)計(jì)和研發(fā)管理工作;獲 2012年國(guó)家科學(xué)進(jìn)步獎(jiǎng)二等獎(jiǎng)等獎(jiǎng)項(xiàng);發(fā)表論文多篇,申請(qǐng)專利3項(xiàng)。
譚斌,中興通訊股份有限公司未來(lái)網(wǎng)絡(luò)技術(shù)研究項(xiàng)目經(jīng)理;主要研究方向?yàn)镮P網(wǎng)絡(luò)、SDN系統(tǒng)架構(gòu)與技術(shù),先后從事有線路由器、接入產(chǎn)品開(kāi)發(fā)、產(chǎn)品規(guī)劃和市場(chǎng)等工作;申請(qǐng)專利2項(xiàng)。