郭鳳仙,孫耀華,彭木根
(1.北京郵電大學(xué) 計(jì)算機(jī)學(xué)院(國(guó)家示范性軟件學(xué)院),北京100876;2.北京郵電大學(xué) 信息與通信工程學(xué)院,北京100876)
隨著智能設(shè)備、物聯(lián)網(wǎng)、人工智能、網(wǎng)絡(luò)技術(shù)等 的發(fā)展,移動(dòng)通信系統(tǒng)與技術(shù)取得了較大進(jìn)步,逐步形成了較為成熟的無(wú)線感知、無(wú)線通信和泛在計(jì)算等多個(gè)功能體系,構(gòu)建了終端采集信息、網(wǎng)絡(luò)傳遞信息、云邊處理信息的煙囪式信息服務(wù)框架。然而,隨著無(wú)人化、浸入式、數(shù)字孿生等通信、感知和計(jì)算高度融合業(yè)務(wù)的演進(jìn)發(fā)展,當(dāng)前的煙囪式信息服務(wù)框架難以滿足其各方面的技術(shù)需求[1-2]。6G通信、感知、計(jì)算(通感算)融合是指在共享頻譜、時(shí)間、空間和能量等資源條件下,利用蜂窩網(wǎng)作為感知和通信基礎(chǔ)設(shè)施,并通過(guò)信號(hào)、通道、信息、平臺(tái)等層面上的統(tǒng)一設(shè)計(jì),實(shí)現(xiàn)一個(gè)信號(hào)、一個(gè)通道、一個(gè)天線、一個(gè)平臺(tái)對(duì)感知和通信信息的統(tǒng)一承載和處理,從而實(shí)現(xiàn) 6G通感算深度融合。通感技術(shù)的發(fā)展與深度融合將帶來(lái)巨量的數(shù)據(jù)處理需求。據(jù)華為發(fā)布的《計(jì)算2030》預(yù)測(cè),2030年人類將進(jìn)入堯字節(jié)(YottaByte,YB)數(shù)據(jù)時(shí)代,全球數(shù)據(jù)每年新增1 YB[3]。海量數(shù)據(jù)處理與分析將消耗大量算力。據(jù)OpenAI分析顯示,從2012—2021年,人工智能算法對(duì)算力的需求增長(zhǎng)了390萬(wàn)倍。作為通感深度融合系統(tǒng)的基石,算力的作用不言而喻。
在上述背景下,云計(jì)算、移動(dòng)邊緣計(jì)算和霧計(jì)算等技術(shù)蓬勃發(fā)展,同時(shí)智能終端算力不斷增強(qiáng),算力沿網(wǎng)絡(luò)由中心延伸至邊緣,形成了網(wǎng)在算中、算在網(wǎng)中的局面。然而,算力在使用方式上大多采用獨(dú)占模式,利用率不高。據(jù)分析,數(shù)據(jù)中心的平均利用率只有55%,許多數(shù)據(jù)中心地利用率甚至不到20%[4]。由此推斷,未來(lái)網(wǎng)絡(luò)必將面臨算力供不應(yīng)求的局面。
面對(duì)上述挑戰(zhàn),盡管邊緣計(jì)算的廣泛部署能夠有效緩解上述問(wèn)題,但是如何更加高效的利用這些分布式泛在算力更具有現(xiàn)實(shí)意義,亦面臨著諸多技術(shù)挑戰(zhàn):① 現(xiàn)有算力節(jié)點(diǎn)從規(guī)模上大到智算中心、超算中心,小到智能終端、gNB加速卡,在能力上囊括了通用算力、并行算力、智能算力、定制化算力,將業(yè)務(wù)調(diào)度至不合適的算力節(jié)點(diǎn)將導(dǎo)致資源的浪費(fèi),難以滿足多樣化業(yè)務(wù)的服務(wù)級(jí)別協(xié)議(Service Level Agreement,SLA)需求。② 算力節(jié)點(diǎn)高度分散且單一算力節(jié)點(diǎn)能力有限,通常將服務(wù)分散至多算力節(jié)點(diǎn)。面對(duì)上述多服務(wù)器場(chǎng)景,當(dāng)前網(wǎng)絡(luò)依賴應(yīng)用層技術(shù),如域名系統(tǒng)(Domain Name System,DNS),應(yīng)對(duì)負(fù)載均衡、重連、服務(wù)遷移等問(wèn)題,等待時(shí)延長(zhǎng)達(dá)數(shù)分鐘,嚴(yán)重影響時(shí)延敏感型業(yè)務(wù)體驗(yàn)。③ 算力和網(wǎng)絡(luò)分屬于彼此獨(dú)立的管控系統(tǒng),動(dòng)態(tài)性差,如傳統(tǒng)的移動(dòng)邊緣計(jì)算仍依賴于中心控制節(jié)點(diǎn),引入了一定的控制時(shí)延,如何實(shí)現(xiàn)邊緣計(jì)算與網(wǎng)絡(luò)共治進(jìn)一步滿足時(shí)延敏感型業(yè)務(wù)需求是邊緣計(jì)算落地的關(guān)鍵。
因此,為高效利用云、邊、端泛在多級(jí)算力,國(guó)內(nèi)外學(xué)者和研究機(jī)構(gòu)依據(jù)“算力+網(wǎng)絡(luò)”深度融合的思想提出了算力網(wǎng)絡(luò)(Computing Force Networks, CFN),旨在基于統(tǒng)一算力建模方法,利用網(wǎng)絡(luò)發(fā)達(dá)的觸角感知業(yè)務(wù)需求和算力狀態(tài),進(jìn)行算網(wǎng)統(tǒng)一管控,從而突破傳統(tǒng)網(wǎng)絡(luò)應(yīng)用層和網(wǎng)絡(luò)層相互隔離所帶來(lái)的調(diào)度固化問(wèn)題,實(shí)現(xiàn)業(yè)務(wù)與算網(wǎng)資源的按需實(shí)時(shí)適配,滿足用戶的SLA需求。本文圍繞算力網(wǎng)絡(luò)的發(fā)展歷程和發(fā)展現(xiàn)狀,介紹了算力網(wǎng)絡(luò)的愿景、架構(gòu)以及關(guān)鍵技術(shù),然后分析了算力網(wǎng)絡(luò)面臨的挑戰(zhàn)和發(fā)展趨勢(shì)。
依據(jù)組織形式,算力可以劃分為4個(gè)層次:芯片級(jí)算力、整機(jī)算力、集約化算力和網(wǎng)絡(luò)化算力[5],算力的提升可以通過(guò)不同的層次實(shí)現(xiàn)。
在單芯片算力方面,20世紀(jì)60年代,半導(dǎo)體技術(shù)的發(fā)展使得計(jì)算機(jī)進(jìn)入芯片時(shí)代。芯片成為算力的主要載體,目前主要包括CPU、GPU、NPU/TPU、FPGA等類型。CPU作為通用基礎(chǔ)算力,軟硬件解耦,具有最高的靈活度,在不考慮性能的前提下幾乎能夠完成所有的計(jì)算任務(wù)。從20世紀(jì)80年代開(kāi)始,在經(jīng)歷了架構(gòu)設(shè)計(jì)、多核并行、提高CPU頻率等各種手段之后,CPU的整體性能提升達(dá)到了一個(gè)瓶頸。現(xiàn)今CPU性能每年提升不到3%。若要實(shí)現(xiàn)CPU性能翻倍,需要20年。面對(duì)上述困境,GPU應(yīng)運(yùn)而生,主要擅長(zhǎng)處理類似圖像處理這類高密度計(jì)算且數(shù)據(jù)相關(guān)性小的并行計(jì)算任務(wù)。不同于CPU,通過(guò)將大量晶體管用于計(jì)算單元,GPU算力得到大幅提升。GPU算力的提升主要通過(guò)增加核數(shù),受限于成本,其性能即將到頂。另一種方式通過(guò)犧牲靈活性換取性能的提升,即軟硬件耦合,代表芯片包括FPGA、TPU、NPU等。FPGA是一種高性能、低功耗的半定制化芯片,在性能上同時(shí)具有CPU和GPU的流水線和并行能力,能夠針對(duì)神經(jīng)網(wǎng)絡(luò)這類算法的特性增加并行度、調(diào)整內(nèi)存訪問(wèn),以更好匹配其需求。而NPU、TPU是專門為機(jī)器學(xué)習(xí)算法定制的ASIC芯片,在處理速度上是CPU、GPU這類芯片的15~30倍,其算力的提升主要依賴于計(jì)算單元MAC的累加。
在整機(jī)算力方面,無(wú)論是智能終端、個(gè)人電腦(Personal Computer,PC)、服務(wù)器甚至是網(wǎng)絡(luò)設(shè)備,大多采用多核CPU或者CPU+xPU(其中,xPU是指GPU、NPU、TPU、FPGA等芯片)的主流架構(gòu)。一方面,可通過(guò)多核并行提升整機(jī)算力,但是由于半導(dǎo)體工藝進(jìn)步放緩、芯片功耗急劇上升,多核架構(gòu)算力性能提升變慢;另一方面,可通過(guò)異構(gòu)計(jì)算架構(gòu),即集成通用算力CPU與硬件加速算力xPU,使得更多處理器能夠并行計(jì)算。特別地,在異構(gòu)計(jì)算架構(gòu)中,xPU均作為CPU的硬件加速器的形態(tài)存在,接受CPU的控制。其中CPU負(fù)責(zé)底層基礎(chǔ)計(jì)算,xPU負(fù)責(zé)上層特定計(jì)算任務(wù)。由于業(yè)務(wù)多樣,算法迭代快,異構(gòu)計(jì)算架構(gòu)在擴(kuò)展性上受限,無(wú)法長(zhǎng)期落地。
集約化算力包括各類計(jì)算中心,如傳統(tǒng)數(shù)據(jù)中心、云計(jì)算中心、新型的智算中心、超算中心以及邊緣計(jì)算機(jī)房等基礎(chǔ)計(jì)算設(shè)施。首先,不同的計(jì)算中心能力不同,例如傳統(tǒng)數(shù)據(jù)中心主要提供存儲(chǔ)能力,云計(jì)算中心主要為多樣化業(yè)務(wù)提供基礎(chǔ)算力,智算中心主要為人工智能應(yīng)用提供智能算力,超算中心主要面向科學(xué)計(jì)算,而邊緣計(jì)算主要提供低時(shí)延算力。其次,不同計(jì)算中心的規(guī)模差別巨大,如我國(guó)神威太湖之光超算中心峰值算力達(dá)125千兆浮點(diǎn)運(yùn)算次數(shù)每秒(peta Floating-point Operations per Seconds, PFLOPS),邊緣計(jì)算機(jī)房由于場(chǎng)地限制通常僅具有數(shù)臺(tái)服務(wù)器。集約化算力的提升主要通過(guò)提升規(guī)模和廣泛部署。
網(wǎng)絡(luò)化算力是指通過(guò)網(wǎng)絡(luò)連接、組織、調(diào)度的分散化算力,是一種分布式網(wǎng)絡(luò)計(jì)算模型,其演進(jìn)歷史如圖1所示。分布式計(jì)算模型可追溯至20世紀(jì)90年代,PC算力的增強(qiáng)促進(jìn)了互聯(lián)網(wǎng)技術(shù)的發(fā)展,同時(shí)PC的普及帶來(lái)了分散化算力。為利用這些閑散的算力,研究者提出了網(wǎng)格計(jì)算,利用網(wǎng)絡(luò)連接閑置的計(jì)算資源形成計(jì)算網(wǎng)格,從而完成需要大量算力的科學(xué)計(jì)算。然而,由于當(dāng)時(shí)網(wǎng)絡(luò)技術(shù)以及計(jì)算技術(shù)的限制,網(wǎng)格計(jì)算效率不高,并未得到大規(guī)模商用。21世紀(jì)初,隨著虛擬化、微服務(wù)、云原生技術(shù)等計(jì)算技術(shù)的發(fā)展,云計(jì)算蓬勃發(fā)展,通過(guò)資源池化,為用戶提供彈性可靠的算力供給。隨著新型業(yè)務(wù)的發(fā)展,傳統(tǒng)云計(jì)算由于集中部署無(wú)法滿足用戶的低時(shí)延需求,移動(dòng)邊緣計(jì)算應(yīng)運(yùn)而生。盡管邊緣算力是分布式部署的,但是在資源供給上仍屬于集中式方式。網(wǎng)絡(luò)的作用僅限于連接算力,算力調(diào)度需要額外的編排調(diào)度系統(tǒng),跨地域算力調(diào)度困難,泛在算力普遍利用率不高。
圖1 網(wǎng)絡(luò)計(jì)算模式演進(jìn)歷程
在網(wǎng)絡(luò)化算力演進(jìn)趨勢(shì)下,算網(wǎng)融合需求明顯。在部署形式上,移動(dòng)邊緣計(jì)算廣泛部署,網(wǎng)絡(luò)云化發(fā)展迅速,形成了網(wǎng)在算中、算在網(wǎng)中的狀態(tài),具備一體化供給的先提條件[6]。在技術(shù)上,軟件定義網(wǎng)絡(luò)(Software-Defined Networking,SDN)和網(wǎng)絡(luò)功能虛擬化(Network Function Virtualization,NFV)賦予了網(wǎng)絡(luò)靈活編排能力,虛擬化、微服務(wù)、云原生、無(wú)服務(wù)器計(jì)算等使云具備了彈性可靠的算力供給能力,二者提供了網(wǎng)絡(luò)和算力靈活編排調(diào)度的可能。在需求上,新型業(yè)務(wù)不斷涌現(xiàn),一方面要求未來(lái)網(wǎng)絡(luò)提供多樣的網(wǎng)絡(luò)和算力供給,另一方面對(duì)時(shí)延、服務(wù)質(zhì)量的變化更加敏感,要求網(wǎng)絡(luò)能夠保障SLA需求。
面對(duì)上述算網(wǎng)融合需求,為高效利用泛在分布式算力,工業(yè)界和學(xué)術(shù)界在算力網(wǎng)絡(luò)方面開(kāi)展了大量工作。本節(jié)將從產(chǎn)業(yè)、網(wǎng)絡(luò)架構(gòu)和關(guān)鍵技術(shù)等方面進(jìn)行介紹。
在產(chǎn)業(yè)方面,2019年,中國(guó)聯(lián)通和中國(guó)移動(dòng)分別發(fā)布了《中國(guó)聯(lián)通算力網(wǎng)絡(luò)白皮書(shū)》《算力感知網(wǎng)絡(luò)技術(shù)白皮書(shū)》[7-8],正式拉開(kāi)了算力網(wǎng)絡(luò)時(shí)代的帷幕。算力網(wǎng)絡(luò)的體系架構(gòu)在邏輯功能上被劃分為算網(wǎng)融合資源層、算力路由層和算力服務(wù)層,以實(shí)現(xiàn)在統(tǒng)一度量和建模下的算力感知、路由和協(xié)同調(diào)度。算力網(wǎng)絡(luò)的核心在于通過(guò)引入業(yè)務(wù)感知網(wǎng)絡(luò)和計(jì)算優(yōu)先網(wǎng)絡(luò),將業(yè)務(wù)信息與資源信息嵌入數(shù)據(jù)包,通過(guò)改進(jìn)路由層協(xié)議,如邊界網(wǎng)關(guān)協(xié)議(Border Gateway Protocol,BGP)和內(nèi)部網(wǎng)關(guān)協(xié)議(Interior Gateway Protocol,IGP),在控制面進(jìn)行業(yè)務(wù)信息和算力資源信息的擴(kuò)散,從而實(shí)現(xiàn)基于算力和網(wǎng)絡(luò)信息的聯(lián)合尋路,實(shí)現(xiàn)算網(wǎng)協(xié)同的資源調(diào)度。此后,三大運(yùn)營(yíng)商聯(lián)合華為、中國(guó)信息通信研究院等組織,先后發(fā)布了數(shù)版算力網(wǎng)絡(luò)白皮書(shū),詳述了算力網(wǎng)絡(luò)體系架構(gòu)、發(fā)展階段以及核心技術(shù)體系。特別地,在中國(guó)移動(dòng)2021年發(fā)布的《算力網(wǎng)絡(luò)白皮書(shū)》闡述了算力網(wǎng)絡(luò)的三個(gè)發(fā)展階段,即泛在協(xié)同、融合統(tǒng)一和一體內(nèi)生[9]。
在算力度量和建模方面,文獻(xiàn)[10]提出了面向業(yè)務(wù)體驗(yàn)的算力建模方法,首先將算力劃分為邏輯運(yùn)算能力、并行計(jì)算能力以及神經(jīng)網(wǎng)絡(luò)加速能力,通過(guò)度量函數(shù)將其映射到統(tǒng)一的量綱,然后以分級(jí)的形式將其劃分為小、中、大、超大型算力。針對(duì)數(shù)據(jù)中心算力,中國(guó)信息通信研究院云計(jì)算與大數(shù)據(jù)研究所提出了綜合衡量算力的五力模型,利用多屬性群決策方法將與計(jì)算能力相關(guān)的通用算力、智能算力、算效、存儲(chǔ)能力、網(wǎng)絡(luò)能力等不同量綱進(jìn)行融合對(duì)比,進(jìn)而對(duì)不同數(shù)據(jù)中心就其能力進(jìn)行定級(jí)[11]。然而上述度量和建模方法由于缺乏對(duì)業(yè)務(wù)的分析建模,仍不能作為業(yè)務(wù)與算力的適配的橋梁。
算力感知主要通過(guò)擴(kuò)展現(xiàn)有路由協(xié)議,將算力節(jié)點(diǎn)信息嵌入數(shù)據(jù)包,使得網(wǎng)絡(luò)能夠?qū)崟r(shí)感知算力節(jié)點(diǎn)的算力信息,其實(shí)現(xiàn)方式與算力路由方法相關(guān),可劃分為集中式和分布式。在統(tǒng)一度量的基礎(chǔ)上,算力網(wǎng)絡(luò)首先進(jìn)行算力信息的采集,進(jìn)行算力信息通告,即將算力信息通告至控制節(jié)點(diǎn),在控制面完成算力感知;然后控制面根據(jù)算力路由協(xié)議生成路由表,轉(zhuǎn)發(fā)面按照其進(jìn)行轉(zhuǎn)發(fā),完成算力節(jié)點(diǎn)和路徑的聯(lián)合選擇。文獻(xiàn)[12]提出了一種基于域名解析機(jī)制的算力網(wǎng)絡(luò)實(shí)現(xiàn)方案,由算力資源管理模塊以集中式方式收集算力資源信息并進(jìn)行統(tǒng)一的分配調(diào)度。該方案利用應(yīng)用層技術(shù)實(shí)現(xiàn)負(fù)載均衡,僅作為算力網(wǎng)絡(luò)的初步實(shí)現(xiàn)方案。中興通訊股份有限公司基于SRv6提出了一種分級(jí)分層的控制面架構(gòu),將不同顆粒的算力資源和服務(wù)狀態(tài)在不同的網(wǎng)絡(luò)域進(jìn)行通告,并創(chuàng)建對(duì)應(yīng)的分級(jí)路由表,轉(zhuǎn)發(fā)面執(zhí)行無(wú)狀態(tài)轉(zhuǎn)發(fā)[13]。
算力網(wǎng)絡(luò)的核心是基于統(tǒng)一的算力度量和建模方法,感知業(yè)務(wù)、網(wǎng)絡(luò)、算力,利用網(wǎng)絡(luò)實(shí)現(xiàn)對(duì)跨地域算力的靈活按需調(diào)度編排,滿足多樣化業(yè)務(wù)對(duì)算網(wǎng)的需求,保障其SLA需求,是云網(wǎng)融合、邊緣計(jì)算向算網(wǎng)融合演進(jìn)的新階段。不同于云網(wǎng)融合,其調(diào)度粒度更細(xì),是算力的標(biāo)準(zhǔn)化技術(shù)。不同于邊緣計(jì)算,網(wǎng)絡(luò)的作用不再僅限于連接,包括了感知、組織、調(diào)度等功能,能夠?qū)崿F(xiàn)分布式算力的深度互聯(lián)和靈活調(diào)度。
算力網(wǎng)絡(luò)愿景如圖2所示,主要由算網(wǎng)基礎(chǔ)設(shè)施和運(yùn)營(yíng)云、管理云組成。
圖2 算力網(wǎng)絡(luò)愿景
在算網(wǎng)基礎(chǔ)設(shè)施中,算力包括承載在接入云、邊緣云、核心云、數(shù)據(jù)中心上不同粒度的算力,即CPU、GPU、ASIC這類硬件算力資源,虛擬機(jī)、容器、微服務(wù)這類封裝化算力資源,以及人工智能(Artificial Intelligence,AI)算法、數(shù)據(jù)等這類頂層算力資源。網(wǎng)絡(luò)包括基礎(chǔ)網(wǎng)絡(luò)(如移動(dòng)網(wǎng)絡(luò)中的承載網(wǎng)絡(luò))、云化網(wǎng)絡(luò)設(shè)施(如云化接入網(wǎng)、核心網(wǎng)等)、算力網(wǎng)絡(luò)(如算力路由等)。算力網(wǎng)絡(luò)以基礎(chǔ)網(wǎng)絡(luò)和云化網(wǎng)絡(luò)為基礎(chǔ)、以算力網(wǎng)絡(luò)為核心,為上層業(yè)務(wù)提供算網(wǎng)融合服務(wù),如電信業(yè)務(wù)、超高清視頻、擴(kuò)展現(xiàn)實(shí)(Extended Reality,XR)、無(wú)人駕駛等業(yè)務(wù)以及智慧城市、智慧電網(wǎng)、工業(yè)互聯(lián)網(wǎng)等業(yè)務(wù)。
具體而言,運(yùn)營(yíng)云是指運(yùn)營(yíng)系統(tǒng),主要有業(yè)務(wù)受理、業(yè)務(wù)建模、業(yè)務(wù)轉(zhuǎn)譯三大功能:① 業(yè)務(wù)受理主要負(fù)責(zé)受理第三方業(yè)務(wù),如XR、無(wú)人駕駛、智慧電網(wǎng)、工業(yè)互聯(lián)網(wǎng)等第三方業(yè)務(wù),獲取其業(yè)務(wù)需求,如業(yè)務(wù)類型、特征、性能需求等信息;② 業(yè)務(wù)建模主要負(fù)責(zé)描述業(yè)務(wù)的網(wǎng)絡(luò)和算力需求,包括空口資源、算力資源、網(wǎng)絡(luò)資源等;③ 業(yè)務(wù)轉(zhuǎn)譯負(fù)責(zé)將業(yè)務(wù)需求映射為業(yè)務(wù)的網(wǎng)絡(luò)和算力需求,從而實(shí)現(xiàn)業(yè)務(wù)需求的感知。算力基礎(chǔ)設(shè)施負(fù)責(zé)承載算力業(yè)務(wù),如AI訓(xùn)練和推理、針對(duì)XR的渲染任務(wù)和編解碼任務(wù)。在基礎(chǔ)網(wǎng)絡(luò)和云化網(wǎng)絡(luò)基礎(chǔ)之上,算力節(jié)點(diǎn)間以算力網(wǎng)絡(luò)為中心進(jìn)行組網(wǎng),負(fù)責(zé)算網(wǎng)感知和隨路算網(wǎng)資源監(jiān)測(cè)以及相應(yīng)的控制功能。依據(jù)上述信息,管理云進(jìn)行智能編排和管理,如業(yè)務(wù)部署/遷移、路由編排決策等,并下發(fā)至算網(wǎng)管理平臺(tái),完成算網(wǎng)管理編排。
算力網(wǎng)絡(luò)架構(gòu)如圖3所示,該架構(gòu)結(jié)合了中國(guó)移動(dòng)所提三層算力網(wǎng)絡(luò)體系架構(gòu)[9]和“四層五面”6G網(wǎng)絡(luò)架構(gòu)[14]的邏輯架構(gòu)設(shè)計(jì)思想,重點(diǎn)突出了與算力面相關(guān)的層與面以及相應(yīng)的功能。具體而言,該架構(gòu)在橫向邏輯上仍劃分為算網(wǎng)基礎(chǔ)設(shè)施層、融合算網(wǎng)功能層、應(yīng)用與服務(wù)層。其中,算網(wǎng)基礎(chǔ)設(shè)施層由算網(wǎng)等基礎(chǔ)設(shè)施組成,為功能層提供傳輸、計(jì)算、存儲(chǔ)等底層資源,功能層形成特定的網(wǎng)絡(luò)功能和計(jì)算功能,提供基本的網(wǎng)絡(luò)和計(jì)算服務(wù),應(yīng)用與服務(wù)層為業(yè)務(wù)提供相應(yīng)的支持。在縱向邏輯上,除了傳統(tǒng)的管理面、控制面、數(shù)據(jù)面外,新增加了算力面。計(jì)算面在底層統(tǒng)一算力度量的基礎(chǔ)上,在功能層提供計(jì)算執(zhí)行功能,在頂層提供算力服務(wù)調(diào)用功能,負(fù)責(zé)向第三方提供算力支持。
圖3 算力網(wǎng)絡(luò)三層四面邏輯架構(gòu)體系
不同于以往網(wǎng)絡(luò)架構(gòu)設(shè)計(jì),控制面和數(shù)據(jù)面不再僅隸屬于功能面,而是作為縱向邏輯功能,貫穿三層;在底層對(duì)算網(wǎng)資源進(jìn)行感知和隨路監(jiān)測(cè),在功能層提供算力路由控制功能和傳輸執(zhí)行功能,在頂層提供相應(yīng)的功能調(diào)用接口,實(shí)現(xiàn)功能開(kāi)放。此外,不同于傳統(tǒng)意義上的控制面和數(shù)據(jù)面是功能層為支持傳輸業(yè)務(wù)提供的控制機(jī)制和業(yè)務(wù)數(shù)據(jù)的傳輸機(jī)制,為支持算力面,控制面和用戶面需要增強(qiáng)其功能,用于算網(wǎng)融合控制和數(shù)據(jù)傳輸。一方面,分布式算力調(diào)度導(dǎo)致算力節(jié)點(diǎn)間數(shù)據(jù)流增多,數(shù)據(jù)面承載的數(shù)據(jù)流量模式發(fā)生了明顯變化;另一方面,控制面是算網(wǎng)融合一種有效的方案。在控制面和數(shù)據(jù)面獲取算網(wǎng)狀態(tài)的前提下,管理面依據(jù)上述信息和業(yè)務(wù)轉(zhuǎn)譯獲取到的業(yè)務(wù)需求信息,結(jié)合底層的資源/服務(wù)模型,對(duì)算網(wǎng)資源進(jìn)行聯(lián)合編排和調(diào)度,調(diào)用控制面功能,實(shí)現(xiàn)算網(wǎng)功能的聯(lián)合編排和調(diào)度,數(shù)據(jù)面和算力面聯(lián)合完成業(yè)務(wù)適配的算網(wǎng)服務(wù)的一體化供給。
基于上述網(wǎng)絡(luò)架構(gòu),本節(jié)簡(jiǎn)要介紹算力網(wǎng)絡(luò)的基本工作流程,主要包括兩大步驟:算力服務(wù)部署和算力服務(wù)處理。
針對(duì)算力服務(wù)部署,其工作流程如下:
① 管理面受理用戶部署需求,并通過(guò)業(yè)務(wù)轉(zhuǎn)譯為業(yè)務(wù)模型,如網(wǎng)絡(luò)帶寬、算力類型、算力大小等需求,完成業(yè)務(wù)感知;
② 算力路由控制面收集算力節(jié)點(diǎn)狀態(tài)信息,如算力負(fù)載、算力類型、算力服務(wù)能力等,并通過(guò)相關(guān)應(yīng)用編程接口(Application Programming Interface,API)向管理面通告其信息,完成算力感知;
③ 管理面依據(jù)業(yè)務(wù)需求和算力資源信息,為其選擇合適的節(jié)點(diǎn)進(jìn)行算力服務(wù)部署,算力路由和管理面更新相應(yīng)的信息。
通常,一個(gè)算力服務(wù)可部署在多個(gè)算力節(jié)點(diǎn)中。面對(duì)多算力服務(wù)場(chǎng)景,潛在解決方案包括以下兩種:基于DNS的負(fù)載均衡技術(shù)和基于任播技術(shù)。基于DNS的負(fù)載均衡技術(shù)與內(nèi)容分發(fā)網(wǎng)絡(luò)(Content Delivery Network,CDN)中的DNS技術(shù)類似,本節(jié)不再贅述。下面簡(jiǎn)要介紹基于任播技術(shù)的算力服務(wù)處理的基本工作流程。
如圖4所示,算力服務(wù)以服務(wù)標(biāo)識(shí)(Service Identification,SID)進(jìn)行標(biāo)識(shí),其中SID是一個(gè)任播地址。在算力網(wǎng)絡(luò)中,一個(gè)SID標(biāo)識(shí)唯一的算力服務(wù)。用戶通過(guò)SID訪問(wèn)算力服務(wù)。用戶請(qǐng)求可能由任意部署有所請(qǐng)求算力服務(wù)的算力節(jié)點(diǎn)響應(yīng)。算力路由保留有該自治域或者算力節(jié)點(diǎn)下所有算力服務(wù)SID所對(duì)應(yīng)的單播IP地址,由算力路由進(jìn)行域內(nèi)外的IP地址轉(zhuǎn)換。
圖4 算力服務(wù)處理過(guò)程
基于上述設(shè)置,算力服務(wù)處理流程如下:
① 算力面向算力路由同步其算力服務(wù)狀態(tài),包括可用性、負(fù)載等信息;
② 控制面收集上述信息,并向相鄰路由通告該信息,并依據(jù)網(wǎng)絡(luò)距離和算力節(jié)點(diǎn)信息多要素更新相應(yīng)路由表項(xiàng);當(dāng)算力服務(wù)或者算力節(jié)點(diǎn)信息發(fā)生改變,管理面進(jìn)行算網(wǎng)聯(lián)合編排,更新路由表和算力服務(wù)部署;
③ 用戶發(fā)出算力服務(wù)請(qǐng)求,目的地址為SID,源地址為用戶IP地址;入口算力路由收到用戶的算力服務(wù)請(qǐng)求,源IP地址分別修改為該算力路由IP地址,目的IP地址修改為出口算力路由,并通過(guò)查找路由表轉(zhuǎn)發(fā)至下一跳;
④ 出口算力路由通過(guò)查找本地SID與BIP綁定信息,確認(rèn)最終算力服務(wù)節(jié)點(diǎn),并執(zhí)行相應(yīng)的計(jì)算任務(wù)。對(duì)于需要流粘性保持的數(shù)據(jù)流,入口算力路由可借助SRv6技術(shù)將后續(xù)數(shù)據(jù)包發(fā)送至綁定的出口算力路由。
基于上述網(wǎng)絡(luò)架構(gòu),算力網(wǎng)絡(luò)需要突破算力度量與建模、算力感知、算力路由和算力調(diào)度等關(guān)鍵技術(shù)瓶頸。
面對(duì)異構(gòu)計(jì)算場(chǎng)景,算力網(wǎng)絡(luò)亟需突破算力度量和建模方法,其目的包括:① 針對(duì)算力使用量,形成統(tǒng)一的可度量、可計(jì)費(fèi)的算力度量單位,為算力交易提供標(biāo)準(zhǔn);② 評(píng)估算力節(jié)點(diǎn)的服務(wù)能力,為業(yè)務(wù)算力適配提供參考信息。
從資源的使用方式來(lái)看,算力網(wǎng)絡(luò)是一種算力的標(biāo)準(zhǔn)化技術(shù)。算力網(wǎng)絡(luò)強(qiáng)調(diào)業(yè)務(wù)邏輯在用戶,即用戶僅開(kāi)發(fā)程序,算力網(wǎng)絡(luò)負(fù)責(zé)進(jìn)行算力資源的管理編排,算力的使用按照使用量進(jìn)行計(jì)費(fèi)。在現(xiàn)今的云計(jì)算和邊緣計(jì)算的模式下,用戶首先選擇算力節(jié)點(diǎn),分配相應(yīng)的計(jì)算資源和存儲(chǔ)資源,然后加載應(yīng)用、執(zhí)行運(yùn)算,并將計(jì)算的結(jié)果存儲(chǔ)起來(lái),在此期間還需要管理資源的釋放和再利用。算力的使用按照占用量進(jìn)行計(jì)費(fèi),即使算力資源空閑時(shí)仍需要支付相應(yīng)的費(fèi)用。這樣粗放的使用方式使得算力資源存在極大的浪費(fèi)。無(wú)服務(wù)器計(jì)算[15]是一種可動(dòng)態(tài)擴(kuò)展的云計(jì)算模型,能夠按需提供計(jì)算資源。函數(shù)即服務(wù)是無(wú)服務(wù)器計(jì)算的典型計(jì)算類型,即將應(yīng)用程序拆解為細(xì)粒度的函數(shù),按照業(yè)務(wù)需求提供計(jì)算資源和執(zhí)行計(jì)算。計(jì)費(fèi)方式依據(jù)函數(shù)的執(zhí)行時(shí)間和次數(shù)進(jìn)行計(jì)算。然而,以函數(shù)進(jìn)行計(jì)費(fèi)的方式面臨著計(jì)費(fèi)方式難以統(tǒng)一、度量粒度較粗、難以衡量等問(wèn)題。以太坊智能合約在執(zhí)行時(shí)被編譯為以太坊虛擬機(jī)的指令,不同的指令以不同的標(biāo)準(zhǔn)進(jìn)行收費(fèi)[16],如表1所示。
表1 計(jì)算量度量方法對(duì)比
盡管上述方式由于應(yīng)用場(chǎng)景不同并不能直接應(yīng)用于算力網(wǎng)絡(luò),但是為算力網(wǎng)絡(luò)的標(biāo)準(zhǔn)化提供了很有益的參考,即從業(yè)務(wù)的需求出發(fā),將其需求拆解為計(jì)算單元的細(xì)粒度操作,即指令/操作。受上述計(jì)算方式啟發(fā),算力使用量可利用算法計(jì)算量來(lái)表示。以兩個(gè)大小為n×n的矩陣相乘為例,其計(jì)算量為N3個(gè)乘法操作。以深度學(xué)習(xí)經(jīng)典模型AlexNet為例,該模型由5個(gè)卷積層和3個(gè)全連接層組成,每層計(jì)算量可由其設(shè)置獲得,總計(jì)算量為1.45 G浮點(diǎn)運(yùn)算數(shù)次數(shù)(Giga Floating-point Operations, GFLOPs),其中包括乘法操作和加法操作。
為實(shí)現(xiàn)業(yè)務(wù)與算力適配,需要評(píng)估算力節(jié)點(diǎn)服務(wù)能力?;谏鲜鲇?jì)算量計(jì)算方法,算力的衡量單位包括浮點(diǎn)運(yùn)算數(shù)次數(shù)每秒(Floating-point Operations per Seconds, FLOPS)和操作數(shù)每秒(Operations per Second),分別表現(xiàn)為對(duì)浮點(diǎn)數(shù)和整數(shù)的操作能力,在數(shù)值上與雙精度浮點(diǎn)數(shù)操作數(shù)相差8倍。因此,可忽略計(jì)算精度,將所有芯片的算力換算為雙精度浮點(diǎn)數(shù)操作數(shù),即FLOPS,由此獲得單算力節(jié)點(diǎn)的總算力?,F(xiàn)有計(jì)算平臺(tái)大多采用異構(gòu)計(jì)算模式,即通用算力+硬件加速算力,其中CPU為通用算力,并行算力(GPU)、智能算力(TPU/NPU)和定制化算力(FPGA)為硬件加速算力。不同算力擅長(zhǎng)不同的業(yè)務(wù),因此僅依靠算力大小無(wú)法完全彰顯算力節(jié)點(diǎn)對(duì)外服務(wù)能力。因此,可采用算力分級(jí)+能力隸屬度的方式評(píng)估算力節(jié)點(diǎn)服務(wù)能力。首先,根據(jù)文獻(xiàn)[8]中的分級(jí)方式,將該算力節(jié)點(diǎn)進(jìn)行分級(jí),對(duì)外展現(xiàn)其處理能力等級(jí)。然后將上述4種算力作為輸入信息,采用文獻(xiàn)[9]中的多屬性群決策算法或者人工智能算法獲得處理能力隸屬度。最后,算力節(jié)點(diǎn)由{算力分級(jí)、算力類型}表示,其中算力大小和算力類型可由數(shù)組或者向量表示。相應(yīng)的,業(yè)務(wù)算力需求可由{算力大小、算力類型}表示。
算力路由是在控制面實(shí)現(xiàn)最優(yōu)算力節(jié)點(diǎn)與最優(yōu)路徑的聯(lián)合決策。依據(jù)信息收集和決策方式,算力路由可分為集中式方案和分布式方案。
圖5為集中式算力路由方案,涉及到SDN、基于IPv6的分段路由(Segment Routing IPv6,SRv6)等技術(shù)。其中,SDN控制器負(fù)責(zé)收集算力信息、網(wǎng)絡(luò)信息和業(yè)務(wù)需求信息,依據(jù)上述信息進(jìn)行路徑和算力節(jié)點(diǎn)的聯(lián)合決策,三個(gè)算力節(jié)點(diǎn)均能為用戶提供算力服務(wù)。首先,基于上述信息,采用算力路由算法(如負(fù)載均衡算法、聯(lián)合最短路徑算法等)獲得最優(yōu)路徑和算力節(jié)點(diǎn)。然后將上述信息下發(fā)至入口路由節(jié)點(diǎn),采用SRv6協(xié)議將路徑信息和目的節(jié)點(diǎn)信息寫(xiě)入IPv6包頭。后續(xù)節(jié)點(diǎn)按照分段路由信息進(jìn)行報(bào)文轉(zhuǎn)發(fā)。該方案能夠?qū)崿F(xiàn)業(yè)務(wù)粒度的路徑編排和節(jié)點(diǎn)決策,能夠更好地滿足業(yè)務(wù)需求,改善網(wǎng)絡(luò)性能。如圖6所示,相較于傳統(tǒng)僅考慮網(wǎng)絡(luò)距離的傳統(tǒng)路由算法,如開(kāi)放式最短路徑優(yōu)先(Open Shortest Path First,OSPF),基于SRv6的算力路由能夠?qū)崿F(xiàn)更低的平均時(shí)延。
圖5 集中式算力路由方案
圖6 傳統(tǒng)路由與算力路由性能對(duì)比
分布式算力路由方案如圖7所示。在算網(wǎng)資源感知方面,可以通過(guò)telemetry實(shí)現(xiàn)網(wǎng)絡(luò)狀況感知,如帶寬、時(shí)延、抖動(dòng)等。算力狀況以探針或者主動(dòng)上報(bào)的形式上傳至算力路由,算力路由匯聚本域所有算力節(jié)點(diǎn)的算力狀況,如節(jié)點(diǎn)服務(wù)能力,并進(jìn)行SID與BIP綁定,將相關(guān)信息存儲(chǔ)至算力路由。為實(shí)現(xiàn)全網(wǎng)算力感知,算力路由可將上述算力狀態(tài)信息通告至鄰近算力路由節(jié)點(diǎn)或者廣播至全網(wǎng)算力路由節(jié)點(diǎn)。為降低算網(wǎng)感知所帶來(lái)的通信開(kāi)銷,亦可將算力狀態(tài)信息打包至數(shù)據(jù)包內(nèi),進(jìn)行隨路算網(wǎng)狀況監(jiān)測(cè)。在計(jì)算服務(wù)執(zhí)行過(guò)程中,根據(jù)獲取到的算網(wǎng)資源信息,算力路由更新其路由表,其中聯(lián)合距離依據(jù)網(wǎng)絡(luò)狀態(tài)和算力狀態(tài)聯(lián)合計(jì)算,下一跳地址依據(jù)最短聯(lián)合距離進(jìn)行修改。當(dāng)用戶請(qǐng)求某項(xiàng)服務(wù)時(shí),按照算力路由表進(jìn)行轉(zhuǎn)發(fā)即可。為降低任播路由對(duì)路由表的影響,入口算力路由可將源IP地址修改為入口算力路由IP地址,目的IP地址修改為出口算力路由地址,此處依據(jù)最短聯(lián)合距離決定出口算力路由節(jié)點(diǎn)。出口算力路由接收到數(shù)據(jù)包后,將目的IP地址修改為SID所對(duì)應(yīng)的單播IP地址,然后將數(shù)據(jù)包轉(zhuǎn)發(fā)至相應(yīng)的算力節(jié)點(diǎn)。
圖7 分布式算力路由方案
在算力網(wǎng)絡(luò)中,計(jì)算節(jié)點(diǎn)具有體量小、能力異構(gòu)、高分散、高動(dòng)態(tài)等特征。業(yè)務(wù)多樣,對(duì)網(wǎng)絡(luò)和算力需求不同。同時(shí),業(yè)務(wù)表現(xiàn)出潮汐、突發(fā)、故障等多種模式,導(dǎo)致算力節(jié)點(diǎn)在時(shí)間和空間尺度上負(fù)載不均衡。因此,對(duì)業(yè)務(wù)進(jìn)行感知,以及算力服務(wù)的部署/遷移和相應(yīng)的編排,并將計(jì)算任務(wù)調(diào)度到合適的算力節(jié)點(diǎn),是改善業(yè)務(wù)服務(wù)質(zhì)量和提高算力利用效率的關(guān)鍵。
業(yè)務(wù)感知的算力調(diào)度流程如圖8所示。區(qū)域內(nèi)的業(yè)務(wù)呈現(xiàn)出明顯的潮汐效應(yīng),比如商業(yè)區(qū)和住宅區(qū)由于用戶的行為模式,造成業(yè)務(wù)負(fù)載隨著時(shí)間周期性地動(dòng)態(tài)變化。在業(yè)務(wù)感知機(jī)制上,管理編排平臺(tái)基于人工智能的業(yè)務(wù)預(yù)測(cè)算法,將歷史信息作為輸入,對(duì)業(yè)務(wù)模型進(jìn)行訓(xùn)練,從而預(yù)測(cè)業(yè)務(wù)行為,比如流量、用戶移動(dòng)性等業(yè)務(wù)信息,用于相關(guān)的服務(wù)部署和遷移。在業(yè)務(wù)預(yù)測(cè)算法上,可將數(shù)據(jù)上傳至管理編排平臺(tái)以集中式方式進(jìn)行訓(xùn)練構(gòu)建出業(yè)務(wù)預(yù)測(cè)模型。考慮到區(qū)域間業(yè)務(wù)流量的差別,統(tǒng)一的業(yè)務(wù)預(yù)測(cè)模型在應(yīng)用時(shí)準(zhǔn)確度會(huì)有所下降。針對(duì)該問(wèn)題,可由局部算力節(jié)點(diǎn)進(jìn)行再訓(xùn)練,對(duì)模型進(jìn)行修正。針對(duì)算力感知機(jī)制,可由上文中的算力感知方法實(shí)現(xiàn)。
圖8 算力調(diào)度流程圖
以算力服務(wù)遷移為例,管理面在獲取到所預(yù)測(cè)業(yè)務(wù)信息和算力信息后,進(jìn)行集中決策,選擇出滿足要求的新算力節(jié)點(diǎn)并部署算力服務(wù),然后進(jìn)行相應(yīng)的網(wǎng)絡(luò)編排,修改相應(yīng)接口和路由,以將后續(xù)相關(guān)業(yè)務(wù)路由至新算力節(jié)點(diǎn),至此完成算力服務(wù)遷移。圖9簡(jiǎn)要描述了管理面進(jìn)行算力服務(wù)遷移的工作流程,描述了在移動(dòng)邊緣計(jì)算網(wǎng)絡(luò)中算力服務(wù)由算力節(jié)點(diǎn)1向算力節(jié)點(diǎn)2遷移的過(guò)程。定義了業(yè)務(wù)預(yù)測(cè)功能和算力服務(wù)遷移決策功能部署方案,并增加了進(jìn)行算力服務(wù)遷移決策的方案/標(biāo)準(zhǔn)。
圖9 算力服務(wù)遷移流程
上述算力調(diào)度決策機(jī)制由管理面通過(guò)控制面應(yīng)用于算力面,是一種集中式調(diào)度機(jī)制。上述算力調(diào)度亦可采用分布式機(jī)制,即控制面基于業(yè)務(wù)預(yù)測(cè)信息和算力信息進(jìn)行服務(wù)部署決策,并將該決策交由管理面進(jìn)行仲裁和相應(yīng)的編排。
當(dāng)前算力網(wǎng)絡(luò)架構(gòu)主要面對(duì)承載網(wǎng),在功能設(shè)計(jì)上聚焦于對(duì)TCP/IP網(wǎng)絡(luò)的改進(jìn)。在算網(wǎng)編排上,算網(wǎng)大腦分別指揮算力資源管理平臺(tái)和網(wǎng)絡(luò)資源管理平臺(tái),并未實(shí)現(xiàn)真正的算網(wǎng)融合。此外,移動(dòng)通信網(wǎng)絡(luò)在網(wǎng)絡(luò)云化、云網(wǎng)融合的趨勢(shì)下,電信云亦可作為算力的提供者。然而,移動(dòng)通信網(wǎng)絡(luò)中的算力并未被納入算力網(wǎng)絡(luò)體系中,如核心網(wǎng)、接入網(wǎng)云化后的算力。移動(dòng)通信網(wǎng)絡(luò)作為通信網(wǎng)絡(luò)的重要組成部分,在算力網(wǎng)絡(luò)驅(qū)動(dòng)下,如何應(yīng)對(duì)算網(wǎng)融合趨勢(shì),是6G移動(dòng)通信網(wǎng)絡(luò)架構(gòu)面臨的一大挑戰(zhàn)。
算力感知是進(jìn)行高效算力調(diào)度的基礎(chǔ),是算力網(wǎng)絡(luò)的基礎(chǔ)。一方面,算力信息高度時(shí)變,大規(guī)模的算力采集和通告將帶來(lái)大量的信令和通信開(kāi)銷;另一方面,大規(guī)模算力通告將帶來(lái)實(shí)時(shí)性問(wèn)題,無(wú)法保障算力信息的準(zhǔn)確性和實(shí)效性。另一種算力信息感知方式是通過(guò)人工智能算法對(duì)算力節(jié)點(diǎn)的負(fù)載進(jìn)行時(shí)空刻畫(huà)。然而,網(wǎng)絡(luò)中存在頻繁的算力調(diào)度,流量錯(cuò)綜復(fù)雜,將對(duì)算力節(jié)點(diǎn)負(fù)載帶來(lái)不可預(yù)測(cè)的影響,基于人工智能的算力感知機(jī)制的準(zhǔn)確性亦無(wú)法保障。因此,如何進(jìn)行實(shí)時(shí)高效的算力感知仍有待深入研究。
集中式算力方案借助SRv6可編程能力能夠?qū)崿F(xiàn)數(shù)據(jù)包級(jí)別的網(wǎng)絡(luò)和算力的聯(lián)合優(yōu)化,由于不需要修改現(xiàn)有路由協(xié)議,是算力路由近期落地的首選方案。然而,算力感知和算力路由決策均依賴于SDN控制器,控制器壓力較大,尤其隨著網(wǎng)絡(luò)規(guī)模增大,該問(wèn)題更加凸顯。分布式算力路由方案需要改進(jìn)現(xiàn)有路由協(xié)議,距離實(shí)際應(yīng)用還有相當(dāng)長(zhǎng)的一段距離。此外,聯(lián)合距離的計(jì)算問(wèn)題以及任播技術(shù)的缺陷仍有待解決。
在算力服務(wù)部署完成后,仍需要相應(yīng)的計(jì)算任務(wù)調(diào)度機(jī)制,保障用戶的服務(wù)質(zhì)量,如時(shí)延、計(jì)算效率等。該機(jī)制需要應(yīng)對(duì)以下兩種情況:① 當(dāng)多個(gè)節(jié)點(diǎn)均部署有所需算力服務(wù)并且可獨(dú)立完成用戶的計(jì)算任務(wù)時(shí),需要選擇最合適的算力節(jié)點(diǎn);② 針對(duì)復(fù)雜業(yè)務(wù),如大規(guī)模人工智能訓(xùn)練任務(wù),單個(gè)算力節(jié)點(diǎn)不足以支撐其算力需求,需要多個(gè)算力節(jié)點(diǎn)協(xié)作完成。針對(duì)情況①:可由算力路由方案以及相應(yīng)的負(fù)載均衡算法解決。針對(duì)情況②:用戶提供算力服務(wù)其服務(wù)流不再具有“端到端”的傳輸模式,一種可能是通過(guò)管理面進(jìn)行編排,一定范圍內(nèi)的算力節(jié)點(diǎn)或者網(wǎng)元節(jié)點(diǎn)按照預(yù)設(shè)的規(guī)則和流程進(jìn)行交互和協(xié)作訓(xùn)練,從而完成人工智能訓(xùn)練任務(wù)。在該過(guò)程中,由于人工智能數(shù)據(jù)的傳輸模式、數(shù)據(jù)類型、對(duì)網(wǎng)絡(luò)鏈路的要求以及參與節(jié)點(diǎn)的計(jì)算性能對(duì)人工智能訓(xùn)練的性能影響與傳統(tǒng)業(yè)務(wù)不同,如何保障人工智能訓(xùn)練的性能需求有待深入探索。
6G通感算融合已成為6G網(wǎng)絡(luò)長(zhǎng)期發(fā)展的方向,且與6G網(wǎng)絡(luò)“內(nèi)生智能、數(shù)融、開(kāi)放、安全”等愿景一致。隨著XR、自動(dòng)駕駛、元宇宙等通感算融合應(yīng)用的發(fā)展,算力網(wǎng)絡(luò)可以為智慧城市、智慧電網(wǎng)、工業(yè)互聯(lián)網(wǎng)提供強(qiáng)有力的性能保障,大力推動(dòng)產(chǎn)業(yè)化升級(jí)和數(shù)字化轉(zhuǎn)型。算力網(wǎng)絡(luò)建設(shè)是一個(gè)長(zhǎng)期、不斷演進(jìn)的過(guò)程,盡管當(dāng)前算力網(wǎng)絡(luò)已有一部分研究,在網(wǎng)絡(luò)架構(gòu)、關(guān)鍵技術(shù)等方面仍面臨著諸多挑戰(zhàn),需要運(yùn)營(yíng)商、設(shè)備提供商、應(yīng)用開(kāi)發(fā)商、科研機(jī)構(gòu)和高校的共同努力,突破網(wǎng)絡(luò)架構(gòu)和關(guān)鍵技術(shù)等方面的瓶頸問(wèn)題。