国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于服務(wù)功能鏈的網(wǎng)絡(luò)功能資源調(diào)度機(jī)制設(shè)計(jì)與實(shí)現(xiàn)*

2023-06-27 08:51陶思言陳光建
火力與指揮控制 2023年5期
關(guān)鍵詞:調(diào)度流量機(jī)制

陶思言,陳光建

(1.四川輕化工大學(xué)物理與電子工程學(xué)院,四川 自貢 643000;2.四川輕化工大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院,四川 自貢 643000)

0 引言

傳統(tǒng)的硬件中間件設(shè)備往往高度定制化,其容量固定且有限,只能夠處理固定量的網(wǎng)絡(luò)負(fù)載。然而,在現(xiàn)實(shí)部署中,入口流量需求會(huì)隨著波峰、波谷時(shí)間以及特殊網(wǎng)絡(luò)時(shí)間產(chǎn)生大規(guī)模的波動(dòng)。傳統(tǒng)硬件設(shè)備不支持動(dòng)態(tài)啟動(dòng)新的硬件設(shè)備以應(yīng)對(duì)突發(fā)增長的流量需求。

網(wǎng)絡(luò)功能虛擬化(network function virtualization,NFV)技術(shù)的核心優(yōu)勢(shì)之一是支持靈活資源調(diào)度,根據(jù)在線實(shí)時(shí)變化的流量負(fù)載按需分配底層資源,在保障系統(tǒng)性能的同時(shí)實(shí)現(xiàn)底層資源利用率最大化。對(duì)于每個(gè)網(wǎng)絡(luò)功能,NFV 通過彈性擴(kuò)展網(wǎng)絡(luò)功能實(shí)例實(shí)現(xiàn)底層資源的動(dòng)態(tài)調(diào)度。目前已經(jīng)有大量的資源調(diào)度機(jī)制被提出,主要分為兩類:基于流量速率的資源調(diào)度機(jī)制以及基于網(wǎng)絡(luò)功能狀態(tài)的資源調(diào)度機(jī)制。然而,上述機(jī)制均將每個(gè)網(wǎng)絡(luò)功能視為獨(dú)立個(gè)體,忽略了鄰居網(wǎng)絡(luò)功能節(jié)點(diǎn)對(duì)資源調(diào)度的影響。

本文提出了一種基于服務(wù)功能鏈的網(wǎng)絡(luò)功能資源調(diào)度機(jī)制(graph-based scaling detection mechanism,GSDM),將鄰居節(jié)點(diǎn)的狀態(tài)信息加入到控制策略中,通過刻畫網(wǎng)絡(luò)功能連接關(guān)系有效地提高資源調(diào)度性能。本文的創(chuàng)新性工作主要有以下4 個(gè)方面:

1)將流量速率信息以及網(wǎng)絡(luò)功能實(shí)時(shí)運(yùn)行信息結(jié)合在一起實(shí)現(xiàn)資源調(diào)度。流量速率信息難以直接對(duì)網(wǎng)絡(luò)功能運(yùn)行狀態(tài)信息進(jìn)行刻畫,并且容易受到流量多樣性的影響,包括數(shù)據(jù)包大小以及類型等。網(wǎng)絡(luò)功能實(shí)時(shí)運(yùn)行狀態(tài)信息則包含許多不可避免的噪音信息,干擾資源調(diào)度結(jié)果。流量速率信息以及網(wǎng)絡(luò)功能實(shí)時(shí)運(yùn)行信息可以互補(bǔ)結(jié)合在一起,有效提高資源調(diào)度機(jī)制的性能。

2)將綜合特征序列信息作為資源調(diào)度策略的輸入信息。相比于單一時(shí)間點(diǎn)的特征信息,特征序列有利于準(zhǔn)確過濾噪音信息,以及實(shí)現(xiàn)擴(kuò)展行為的提前預(yù)測(cè)。通常情況下,網(wǎng)絡(luò)功能實(shí)例啟動(dòng)需要若干秒,基于序列的提前預(yù)測(cè)能夠有效緩解實(shí)例啟動(dòng)過程中的性能下降。GSDM 基于長短時(shí)記憶網(wǎng)絡(luò)(long short-term memory,LSTM)模型進(jìn)行設(shè)計(jì)。LSTM能夠有效捕捉序列信息之間的關(guān)系。

3)考慮到網(wǎng)絡(luò)功能連接關(guān)系對(duì)資源調(diào)度策略的影響,將鄰居網(wǎng)絡(luò)功能的特征序列加入到控制策略中。將鄰居節(jié)點(diǎn)信息也加入到控制策略中,有效刻畫網(wǎng)絡(luò)功能連接信息,提高資源調(diào)度及時(shí)性。

4)考慮到不同鄰居節(jié)點(diǎn)對(duì)最終檢測(cè)結(jié)果的不同影響,設(shè)計(jì)了網(wǎng)絡(luò)功能級(jí)的注意力機(jī)制,為不同鄰居節(jié)點(diǎn)設(shè)置不同的權(quán)重。注意力機(jī)制能夠使得關(guān)鍵鄰居節(jié)點(diǎn)對(duì)最終結(jié)果有更大的影響力,并且忽略不重要的鄰居節(jié)點(diǎn)。

1 關(guān)鍵技術(shù)

GSDM 基于時(shí)間序列信息進(jìn)行擴(kuò)展動(dòng)作預(yù)測(cè)。目前,人工智能領(lǐng)域已經(jīng)有大量的模型用于刻畫時(shí)間序列信息,例如:RNN,LSTM 等。注意力機(jī)制在人工智能領(lǐng)域也得到了廣泛應(yīng)用,能夠?qū)π蛄行畔⑦M(jìn)行處理,抓取其中的關(guān)鍵信息并賦予更高的權(quán)重。本章將對(duì)時(shí)間序列神經(jīng)網(wǎng)絡(luò)模型以及注意力機(jī)制進(jìn)行具體介紹。

1.1 時(shí)間序列神經(jīng)網(wǎng)絡(luò)模型

LSTM 是一種特殊的RNN 網(wǎng)絡(luò)模型,通過引入輸入門、遺忘門以及輸出門,能夠解決RNN 模型存在的長期依賴問題并對(duì)長序列信息進(jìn)行處理。目前,LSTM 模型已經(jīng)成功應(yīng)用到各類人工智能問題中,并取得了顯著的效果,例如:計(jì)算機(jī)視覺[1]、人類活動(dòng)行為分析[2-3]以及自然語言處理[4]等。

圖1 展示了LSTM 神經(jīng)網(wǎng)絡(luò)模型狀態(tài)轉(zhuǎn)換過程,其具體計(jì)算過程如下公式所示。

圖1 LSTM 神經(jīng)網(wǎng)絡(luò)模型Fig.1 LSTM neural network model

1.2 注意力機(jī)制

在GSDM 模型設(shè)計(jì)中,將鄰居節(jié)點(diǎn)的特征序列信息作為輸入信息加入到控制策略中,有效提高資源調(diào)度的及時(shí)性。然而,觀察到不同的網(wǎng)絡(luò)功能對(duì)于最終的擴(kuò)展動(dòng)作影響力是不同的。因此,采用注意力機(jī)制為不同的鄰居節(jié)點(diǎn)設(shè)置不同的權(quán)重,更加有效地?cái)U(kuò)大重要鄰居節(jié)點(diǎn)的影響力以及避免不重要鄰居節(jié)點(diǎn)的干擾,有效提高模型性能。

目前,注意力機(jī)制已經(jīng)大量應(yīng)用到分類任務(wù)中,并取得了顯著的性能提升效果[5-8]。注意力機(jī)制首先計(jì)算各個(gè)輸入向量與輸出向量的匹配程度,匹配程度高的節(jié)點(diǎn)得到高權(quán)重,反之,匹配程度低的節(jié)點(diǎn)得到低權(quán)重。具體來講,基于輸入序列的隱含層表示向量,注意力機(jī)制聚合輸出一個(gè)序列向量s。在最終向量s 中,每個(gè)節(jié)點(diǎn)的內(nèi)部狀態(tài)信息ht被賦予不同的權(quán)重。注意力機(jī)制的計(jì)算過程如下所示:1)根據(jù)ht得到注意力層的隱含狀態(tài)向量ut;2)每個(gè)節(jié)點(diǎn)的影響力表示向量at根據(jù)ut與uw之間的相似度利用softmax 計(jì)算得到,其中,uw作為整個(gè)序列信息的上下文查詢表示向量,起初被隨機(jī)設(shè)定,并在訓(xùn)練過程中不斷得到更新;3)最終輸出向量s 根據(jù)H 向量矩陣的加權(quán)平均獲得。具體計(jì)算過程如下公式所示:

2 GSDM 設(shè)計(jì)

為了實(shí)現(xiàn)資源調(diào)度,GSDM 包括兩個(gè)部分:1)特征采集模塊:在數(shù)據(jù)層實(shí)時(shí)采集所有網(wǎng)絡(luò)功能的綜合狀態(tài)信息;2)GSDM 模型:根據(jù)采集得到的狀態(tài)信息,在控制層利用神經(jīng)網(wǎng)絡(luò)模型計(jì)算每個(gè)網(wǎng)絡(luò)功能對(duì)應(yīng)的擴(kuò)展動(dòng)作。下文將分別對(duì)這兩方面內(nèi)容進(jìn)行具體介紹。

2.1 特征采集模塊

特征采集模塊安裝在數(shù)據(jù)層,用于全面測(cè)試所有網(wǎng)絡(luò)功能的運(yùn)行特征數(shù)據(jù)。本文采用綜合特征作為輸入,包括以下3 個(gè)方面的特征:流量速率特征,硬件層特征和應(yīng)用層特征。以下部分將對(duì)3 種類型特征的采集方式進(jìn)行具體描述。

1)流量速率特征:包括入口流量速率和出口流量速率。目前,大部分的NFV 系統(tǒng)(例如:Open-NetVM),提供了成熟的接口用于準(zhǔn)確獲取入口以及出口的流量速率。在原型系統(tǒng)實(shí)現(xiàn)中,利用NFV 系統(tǒng)提供的接口對(duì)流量速率信息進(jìn)行采集。

2)硬件層特征:GSDM 包含CPU 利用率和內(nèi)存利用率兩個(gè)特征?,F(xiàn)有的NFV 系統(tǒng)在虛擬機(jī)或者容器中對(duì)網(wǎng)絡(luò)功能進(jìn)行實(shí)現(xiàn)。虛擬機(jī)或者容器技術(shù)使得每個(gè)網(wǎng)絡(luò)功能占用單獨(dú)的CPU 以及內(nèi)存區(qū)域,不會(huì)被其他的系統(tǒng)進(jìn)程所調(diào)用。因此,在原型系統(tǒng)實(shí)現(xiàn)中,特征采集模塊以privileged 模式運(yùn)行可以準(zhǔn)確地獲取這些硬件層資源利用率信息。

3)應(yīng)用層特征:將數(shù)據(jù)包處理時(shí)延作為代表有效地反映當(dāng)前網(wǎng)絡(luò)功能的運(yùn)行狀態(tài)。設(shè)計(jì)了一種輕量級(jí)的時(shí)延測(cè)量方法。特征采集模塊自動(dòng)生成樣本流量并發(fā)送到各個(gè)網(wǎng)絡(luò)功能進(jìn)行時(shí)延測(cè)量。對(duì)于網(wǎng)絡(luò)功能而言,它們負(fù)責(zé)接收樣本數(shù)據(jù)包,并執(zhí)行與其他數(shù)據(jù)包一樣的處理操作,最后默認(rèn)轉(zhuǎn)發(fā)到特征采集模塊。網(wǎng)絡(luò)功能的時(shí)延由發(fā)送時(shí)間和接收時(shí)間之間的時(shí)間差值計(jì)算得到。樣本流量的速率可以由用戶自主地進(jìn)行控制,并只占所有處理數(shù)據(jù)包的很小部分,并不會(huì)影響整體系統(tǒng)運(yùn)行。在設(shè)計(jì)的原型系統(tǒng)中,樣本數(shù)據(jù)包采用具有特殊端口的UDP 數(shù)據(jù)包。對(duì)于IPv4 數(shù)據(jù)包而言,8 bit 的ToS 字段用于存儲(chǔ)被測(cè)量的網(wǎng)絡(luò)功能的“Service ID”,從而方便地對(duì)每個(gè)網(wǎng)絡(luò)功能的時(shí)延進(jìn)行計(jì)算。在時(shí)間計(jì)算精度方面,采用CPU 硬件時(shí)間戳的方法進(jìn)行測(cè)量。在原型系統(tǒng)實(shí)現(xiàn)中,采用的CPU 時(shí)鐘頻率是1 200 MHz。因此,計(jì)算的時(shí)延精度在納秒級(jí)別。

2.2 GSDM 模型

GSDM 模型的整體結(jié)構(gòu)主要由4 層組成:特征表示層、LSTM 層、鄰居網(wǎng)絡(luò)功能節(jié)點(diǎn)層以及輸出層。以下部分將對(duì)每一層進(jìn)行具體介紹。

2.2.1 特征表示層

對(duì)于每一個(gè)網(wǎng)絡(luò)功能,將其連續(xù)n 個(gè)時(shí)間點(diǎn)特征組成的特征序列S 作為輸入信息。每一個(gè)特征向量xt由五維特征組成:入口流量速率、出口流量速率、CPU 利用率、內(nèi)存利用率以及數(shù)據(jù)包處理時(shí)延。特征序列信息能夠有效地展示網(wǎng)絡(luò)功能狀態(tài)信息隨時(shí)間的變化,幫助更好地預(yù)測(cè)擴(kuò)展動(dòng)作以及過濾噪音信息。

2.2.2 LSTM 層

利用LSTM 模型對(duì)每個(gè)網(wǎng)絡(luò)功能的特征序列S進(jìn)行計(jì)算,并得到每個(gè)網(wǎng)絡(luò)功能的表示向量。LSTM 模型可以有效地捕捉序列信息之間的關(guān)系,并將其映射到低維向量空間。假設(shè)采用了L 層進(jìn)行訓(xùn)練,將經(jīng)過L 層LSTM 模型計(jì)算輸出的隱含狀態(tài)信息為賦值給,從而得到網(wǎng)絡(luò)功能表示向量。LSTM 模型具體計(jì)算過程已經(jīng)在1.1 節(jié)進(jìn)行了具體介紹。最后,LSTM 層將所有網(wǎng)絡(luò)功能的表示向量反饋到鄰居網(wǎng)絡(luò)功能節(jié)點(diǎn)層作進(jìn)一步處理。

2.2.3 鄰居網(wǎng)絡(luò)功能節(jié)點(diǎn)層

考慮到鄰居網(wǎng)絡(luò)功能節(jié)點(diǎn)狀態(tài)信息對(duì)資源調(diào)度結(jié)果的影響,加入了鄰居網(wǎng)絡(luò)功能節(jié)點(diǎn)層。將鄰居網(wǎng)絡(luò)功能節(jié)點(diǎn)集分為兩個(gè)部分,分別是上流網(wǎng)絡(luò)功能節(jié)點(diǎn)集F 以及下流網(wǎng)絡(luò)功能節(jié)點(diǎn)集B。對(duì)于每一個(gè)在F 或者B 中的鄰居網(wǎng)絡(luò)功能節(jié)點(diǎn),通過上述LSTM 層獲取到其網(wǎng)絡(luò)功能級(jí)別的表示或者。考慮到多種不同鄰居節(jié)點(diǎn)對(duì)資源調(diào)度結(jié)果的不同影響,采用了網(wǎng)絡(luò)功能級(jí)注意力機(jī)制來刻畫影響力大小。最終,上流網(wǎng)絡(luò)功能節(jié)點(diǎn)集表示sF和下流網(wǎng)絡(luò)功能節(jié)點(diǎn)集表示sB通過以下的公式計(jì)算得到。其中,以及全部是注意力機(jī)制的參數(shù)。

2.2.4 輸出層

最終輸出層通過以下兩個(gè)步驟共同完成:

1)向量聚合:將上流網(wǎng)絡(luò)功能節(jié)點(diǎn)集表示sF,下流網(wǎng)絡(luò)功能節(jié)點(diǎn)集表示sB以及當(dāng)前網(wǎng)絡(luò)功能節(jié)點(diǎn)表示sR集合得到了最終的表示向量m。

2)擴(kuò)展動(dòng)作概率計(jì)算:m 向量被反饋到softmax層得到所有擴(kuò)展動(dòng)作的可能性分布。這個(gè)過程通過下面公式計(jì)算得到。其中,是指所有可能擴(kuò)展動(dòng)作的概率分布,C 表示擴(kuò)展動(dòng)作空間大小,以及分別是權(quán)重矩陣以及偏差矩陣。在本文中,設(shè)置C=3,用于表示所有可能擴(kuò)展動(dòng)作的數(shù)目,包括擴(kuò)容、縮容、保持不變3 種類型。

2.3 GSDM 訓(xùn)練方法

3 原型系統(tǒng)實(shí)現(xiàn)

本章對(duì)GSDM 模型訓(xùn)練過程以及原型系統(tǒng)實(shí)現(xiàn)進(jìn)行了具體介紹,并對(duì)其他對(duì)比資源調(diào)度方案進(jìn)行了具體說明。

3.1 GSDM 模型訓(xùn)練

采用深度學(xué)習(xí)框架TensorFlow 對(duì)GSDM 模型進(jìn)行訓(xùn)練。為了實(shí)現(xiàn)模型訓(xùn)練,構(gòu)建了一個(gè)數(shù)據(jù)集,并按照以下結(jié)果對(duì)超參數(shù)進(jìn)行了設(shè)置。

1)數(shù)據(jù)集:為了實(shí)現(xiàn)模型訓(xùn)練,生成了多種不同類型的流量并將其應(yīng)用到NFV 系統(tǒng)中,獲取了大量的網(wǎng)絡(luò)功能運(yùn)行狀態(tài)信息。對(duì)于每一個(gè)網(wǎng)絡(luò)功能,標(biāo)注了35 000 組數(shù)據(jù),其中,80%用作訓(xùn)練集,20%用作測(cè)試集。對(duì)于每一個(gè)標(biāo)注的數(shù)據(jù),為其標(biāo)注了對(duì)應(yīng)的擴(kuò)展動(dòng)作“-1”“0”或者“1”,分別表示“擴(kuò)容”“保持不變”以及“縮容”。

2)超參數(shù)設(shè)置:GSDM 模型的超參數(shù)設(shè)置如下所示:輸入特征序列長度n=20,LSTM 層數(shù)L=2,隱含層維度大小d=200,最大上流網(wǎng)絡(luò)功能集大小,最大下流網(wǎng)絡(luò)功能集大小,學(xué)習(xí)率,正則項(xiàng)系數(shù)以及dropout 率0.5。

3.2 系統(tǒng)實(shí)現(xiàn)

在OpenNetVM 18.05 版本以及dpdk 17.08 版本的基礎(chǔ)上實(shí)現(xiàn)了GSDM 原型系統(tǒng)。該原型系統(tǒng)搭建在若干服務(wù)器上,每一個(gè)服務(wù)器配備有兩個(gè)CPU(Intel(R)Xeon(R)E5-2620 V3)以及兩塊10 G 網(wǎng)卡,運(yùn)行在Linux 操作系統(tǒng),其內(nèi)核版本為3.10.0。在數(shù)據(jù)層,實(shí)現(xiàn)了特征采集模塊,周期性地對(duì)所有網(wǎng)絡(luò)功能的特征信息進(jìn)行采集,周期為1 s。在控制層,將訓(xùn)練完成的GSDM 模型進(jìn)行部署,并將采集得到的特征序列信息輸入到訓(xùn)練完成的GSDM 模型計(jì)算對(duì)應(yīng)的擴(kuò)展動(dòng)作,周期為1 s。

3.2.1 流量生成

采用開源流量生成器MoonGen[9],自動(dòng)生成多種類型流量進(jìn)行性能驗(yàn)證。MoonGen 安裝在一個(gè)單獨(dú)的服務(wù)器上,并且與安裝原型系統(tǒng)的服務(wù)器進(jìn)行直接連接。發(fā)包服務(wù)器發(fā)送以及接收數(shù)據(jù)包,并在時(shí)延和吞吐量兩方面對(duì)GSDM 系統(tǒng)性能進(jìn)行測(cè)量??偨Y(jié)了真實(shí)網(wǎng)絡(luò)中常見的需要擴(kuò)展動(dòng)作的流量類型,包括緩慢增長型、快速短時(shí)型以及快速長時(shí)型3種。圖2(a)~圖2(c)分別對(duì)以上3 種類型流量進(jìn)行了展示。

圖2 3 種不同的流量類型Fig.2 Three different traffic types

3.2.2 流量生成

為了進(jìn)行性能驗(yàn)證,對(duì)以下3 種網(wǎng)絡(luò)功能進(jìn)行了實(shí)現(xiàn),包括虛擬專用網(wǎng)絡(luò),深度包檢測(cè)以及網(wǎng)絡(luò)監(jiān)控器。這些網(wǎng)絡(luò)功能按照順序連接在一起組成服務(wù)功能鏈。

1)虛擬專用網(wǎng)絡(luò):利用IPsec 的AH 模式,實(shí)現(xiàn)了一個(gè)虛擬專用網(wǎng)絡(luò)隧道。具體而言,利用AES算法對(duì)數(shù)據(jù)包進(jìn)行加密,并將其封裝到AH 中進(jìn)行轉(zhuǎn)發(fā)。

2)入侵檢測(cè)系統(tǒng):該網(wǎng)絡(luò)功能基于SnortIDS 進(jìn)行設(shè)計(jì),通過數(shù)據(jù)包特征匹配識(shí)別網(wǎng)絡(luò)攻擊行為。

3)網(wǎng)絡(luò)監(jiān)控器:以數(shù)據(jù)包的五元組為哈希值,將數(shù)據(jù)包劃分為不同的數(shù)據(jù)流。此網(wǎng)絡(luò)功能為每條流計(jì)算對(duì)應(yīng)的數(shù)據(jù)包數(shù)量。

3.2.3 對(duì)比資源調(diào)度方案

現(xiàn)有的資源調(diào)度機(jī)制根據(jù)入口流量速率或者網(wǎng)絡(luò)功能實(shí)時(shí)狀態(tài)信息進(jìn)行資源調(diào)度。為了進(jìn)行性能對(duì)比,對(duì)以下3 種類型的擴(kuò)展機(jī)制進(jìn)行了實(shí)現(xiàn)。

1)基于速率模式:對(duì)網(wǎng)絡(luò)功能的單獨(dú)實(shí)例進(jìn)行處理能力測(cè)量,并假定網(wǎng)絡(luò)功能處理能力與實(shí)例數(shù)目呈線性關(guān)系。一旦發(fā)現(xiàn)輸入流量速率超過網(wǎng)絡(luò)功能處理能力則觸發(fā)擴(kuò)展動(dòng)作,增加一個(gè)實(shí)例保障系統(tǒng)性能。

2)基于狀態(tài)模式:測(cè)量每個(gè)網(wǎng)絡(luò)功能發(fā)生擁塞時(shí)的時(shí)延,并設(shè)置其為狀態(tài)閾值。一旦監(jiān)控得到的數(shù)據(jù)時(shí)延超過了閾值,則采取擴(kuò)展動(dòng)作。

3)基于MLP 模式:此方案將流量速率以及網(wǎng)絡(luò)功能實(shí)時(shí)狀態(tài)信息均作為輸入信息,也即五維特征(包括入口流量速率,出口流量速率,CPU 利用率,內(nèi)存利用率,時(shí)延),并利用多層感知器(multi-layer perceptron,MLP)構(gòu)建一個(gè)全連接神經(jīng)網(wǎng)絡(luò),建立五維綜合特征與擴(kuò)展動(dòng)作之間的對(duì)應(yīng)關(guān)系。

4 驗(yàn)證與評(píng)價(jià)

本章對(duì)GSDM 系統(tǒng)進(jìn)行了性能驗(yàn)證并與其他資源調(diào)度方案進(jìn)行了對(duì)比分析。性能驗(yàn)證包括3 個(gè)方面:

1)離線模型性能:基于生成的數(shù)據(jù)集在精準(zhǔn)率、召回率、F1 值3 個(gè)評(píng)價(jià)指標(biāo)上進(jìn)行性能測(cè)量;

2)在線系統(tǒng)性能:基于實(shí)現(xiàn)的原型系統(tǒng)上在系統(tǒng)總開銷、時(shí)延、吞吐量3 個(gè)評(píng)價(jià)指標(biāo)上進(jìn)行性能評(píng)價(jià)對(duì)比;

3)模型時(shí)間分析:對(duì)模型的離線訓(xùn)練時(shí)間以及在線運(yùn)行時(shí)間進(jìn)行分析,并進(jìn)一步分析該擴(kuò)展檢測(cè)機(jī)制對(duì)NFV 系統(tǒng)性能的影響。

4.1 離線模型性能

將實(shí)現(xiàn)的GSDM 模型與其他3 種資源調(diào)度方案在3 個(gè)性能參數(shù)上進(jìn)行了性能對(duì)比,包括精準(zhǔn)率(precision)、召回率(recall)、F1 值(F1 value)。對(duì)于每種算法而言,將其結(jié)果標(biāo)注為TP(true positives)、TN(true negatives)、FP(false positives)以及FN(false negativess)4 種類型。TP 是指樣本以及預(yù)測(cè)結(jié)果均為+1 的數(shù)據(jù);TN 表示樣本與預(yù)測(cè)結(jié)果均為0 的數(shù)據(jù);FP 是指樣本為0 然而預(yù)測(cè)結(jié)果為+1 的數(shù)據(jù),F(xiàn)N 表示樣本為+1,預(yù)測(cè)結(jié)果為0 的數(shù)據(jù)。根據(jù)上述標(biāo)注數(shù)據(jù),采用以下公式所展示的方法對(duì)精準(zhǔn)率、召回率以及F1 值進(jìn)行計(jì)算。

精準(zhǔn)率是指預(yù)測(cè)為正例的數(shù)據(jù)中預(yù)測(cè)正確的數(shù)據(jù)個(gè)數(shù),能夠有效地表示資源調(diào)度機(jī)制對(duì)噪音信息的過濾程度。高精準(zhǔn)率能夠避免錯(cuò)誤擴(kuò)展動(dòng)作導(dǎo)致的不必要運(yùn)維開銷。召回率指真正為正例的數(shù)據(jù)中預(yù)測(cè)正確的數(shù)據(jù)個(gè)數(shù),能夠有效地表示資源調(diào)度機(jī)制的及時(shí)性。高召回率機(jī)制能夠避免延遲的擴(kuò)展動(dòng)作造成的系統(tǒng)性能下降。通常情況下,精準(zhǔn)率以及召回率此消彼長。F1 值根據(jù)精準(zhǔn)率以及召回率綜合計(jì)算獲得,能夠?qū)C(jī)制性能作出綜合測(cè)評(píng)。

圖3 展示了具體的性能對(duì)比結(jié)果,發(fā)現(xiàn)GSDM同時(shí)實(shí)現(xiàn)了最高的精準(zhǔn)率和召回率,也即同時(shí)實(shí)現(xiàn)系統(tǒng)性能提升以及底層資源利用率提升。將其他3種資源調(diào)度機(jī)制進(jìn)行對(duì)比,發(fā)現(xiàn)最佳方案是基于MLP 模式方案。這也證明了綜合特征相比于單一特征,能夠?qū)崿F(xiàn)不同的特征之間的性能互助,提升檢測(cè)性能。與最佳的基于MLP 模式方案相比較,GSDM 模型在召回率方面提升了2.75%,在精準(zhǔn)率方面提升了1.2%,在F1 值方面提升了2.17%。

圖3 離線系統(tǒng)總開銷對(duì)比Fig.3 Comparison of total overhead of offline system

4.2 在線系統(tǒng)性能

4.2.1 性能指標(biāo)

資源調(diào)度策略的評(píng)價(jià)指標(biāo)必須能夠綜合考量資源調(diào)度的時(shí)間是否準(zhǔn)確,包括過早檢測(cè)造成的高運(yùn)維開銷以及過晚檢測(cè)造成的系統(tǒng)性能下降兩方面。通常情況下,運(yùn)維開銷以及系統(tǒng)性能兩方面的目標(biāo)是此消彼長的關(guān)系。如式(22)所示,將兩者相加得到整體的系統(tǒng)開銷,綜合判斷資源調(diào)度策略的性能。

圖4 展示了在3 種流量場景下,GSDM 與其他資源調(diào)度機(jī)制的系統(tǒng)總開銷對(duì)比結(jié)果。結(jié)果顯示:在所有場景下,GSDM 系統(tǒng)均超過了其他機(jī)制,實(shí)現(xiàn)了系統(tǒng)總開銷的最小化。以下部分將對(duì)每種流量場景下的具體信息進(jìn)行分析說明。

圖4 在線系統(tǒng)總開銷對(duì)比Fig.4 Comparison of total overhead of online system

4.2.2 緩慢增長型流量場景

圖5 和下頁圖6 展示了緩慢增長型流量場景下的時(shí)延以及吞吐量變化過程。以納秒的精度對(duì)時(shí)延進(jìn)行了測(cè)量。為了更好地展示時(shí)延變化過程,對(duì)時(shí)延進(jìn)行取10 的對(duì)數(shù)處理。面對(duì)變化的數(shù)據(jù)包大小以及類型,基于速率模式機(jī)制不能夠應(yīng)對(duì)流量多樣性,導(dǎo)致延遲的擴(kuò)展動(dòng)作、數(shù)據(jù)包丟失懲罰以及系統(tǒng)性能的下降。

圖5 緩慢增長型流量場景下的時(shí)延對(duì)比Fig.5 Delay comparison in slow increase traffic scenarios

圖6 緩慢增長型流量場景下的吞吐量對(duì)比Fig.6 Throughput comparison in slow increase traffic scenarios

相比于基于速率模式機(jī)制,基于狀態(tài)模式機(jī)制依據(jù)網(wǎng)絡(luò)功能的實(shí)時(shí)狀態(tài)進(jìn)行資源調(diào)度,可以有效忽略流量類型的多樣性,提高調(diào)度的及時(shí)性。然而,在系統(tǒng)剛啟動(dòng)的階段,系統(tǒng)的不穩(wěn)定性容易造成噪音信息輸入,導(dǎo)致資源調(diào)度策略的不準(zhǔn)確性。錯(cuò)誤的檢測(cè)結(jié)果使得網(wǎng)絡(luò)功能實(shí)例頻繁增加以及刪減,對(duì)底層資源造成了極大的浪費(fèi)以及不必要高昂運(yùn)維開銷。

基于MLP 模式機(jī)制將綜合特征信息作為輸入,使得兩類特征互補(bǔ),有效地適應(yīng)流量的多樣性以及實(shí)現(xiàn)噪音過濾?;贛LP 模式機(jī)制證明了綜合特征信息相比于單一特征信息的有效性。

與上述機(jī)制相比,GSDM 機(jī)制以高維特征序列作為輸入信息,能夠更好地提前預(yù)測(cè)擴(kuò)展動(dòng)作以及過濾噪音信息。除此之外,GSDM 能夠根據(jù)上流或者下流節(jié)點(diǎn)的狀態(tài)信息,幫助判斷自身節(jié)點(diǎn)是否有擴(kuò)展需求。特征序列信息以及鄰居節(jié)點(diǎn)信息的引入,使得GSDM 有效地提高了準(zhǔn)確性和及時(shí)性。

4.2.3 快速短時(shí)型流量場景

圖7 和圖8 展示了快速短時(shí)型流量場景下的時(shí)延以及吞吐量變化過程圖。在這種類型的流量場景下,基于速率模式、基于狀態(tài)模式以及基于MLP模式方法均立即采取了擴(kuò)展操作保證系統(tǒng)性能。然而,實(shí)例的增加往往需要幾分鐘或者幾秒用于實(shí)例啟動(dòng)。因此,新增加的實(shí)例并沒有服務(wù)于短時(shí)增長的流量,反而造成了系統(tǒng)頻繁的實(shí)例增加或者刪減。與之相比,GSDM 以連續(xù)時(shí)間的特征序列為輸入替代單一時(shí)間節(jié)點(diǎn)特征,能夠有效地對(duì)流量類型進(jìn)行識(shí)別,避免執(zhí)行不必要的擴(kuò)展動(dòng)作。最終,GSDM機(jī)制在系統(tǒng)性能幾乎一致的情況下,避免實(shí)例的頻繁增加和刪減,有效地提高了資源利用率以及降低了系統(tǒng)總開銷。

圖7 快速短時(shí)型流量場景下的時(shí)延對(duì)比Fig.7 Delay comparison in fast short-term traffic scenarios

圖8 快速短時(shí)型流量場景下的吞吐量對(duì)比Fig.8 Throughput comparison in fast short-term traffic scenarios

4.2.4 快速長時(shí)型流量場景

圖9 和圖10 展示了快速長時(shí)型流量場景下的時(shí)延以及吞吐量的變化過程圖。對(duì)于基于狀態(tài)模式方案,在系統(tǒng)剛啟動(dòng)的階段作出了錯(cuò)誤的擴(kuò)展判斷導(dǎo)致了資源的浪費(fèi)。除此之外,基于狀態(tài)模式、基于速率模式以及基于MLP 模式表現(xiàn)基本一致。三者的缺陷在于必須等待上流節(jié)點(diǎn)完成彈性擴(kuò)展,下流節(jié)點(diǎn)才能感應(yīng)到擴(kuò)展需求。與之相比,GSDM 面對(duì)網(wǎng)絡(luò)突發(fā)事情造成的大幅流量增長時(shí),利用鄰居網(wǎng)絡(luò)功能的狀態(tài)信息,能夠?qū)Χ鄠€(gè)網(wǎng)絡(luò)功能同時(shí)啟動(dòng)擴(kuò)展操作。對(duì)于系統(tǒng)整體性能而言,GSDM 有效地提高了資源調(diào)度的及時(shí)性,并進(jìn)一步在時(shí)延和吞吐量兩方面提高了系統(tǒng)性能。

圖9 快速長時(shí)型流量場景下的時(shí)延對(duì)比Fig.9 Delay comparison in fast long-term traffic scenarios

圖10 快速長時(shí)型流量場景下的吞吐量對(duì)比Fig.10 Throughput comparison in fast long-term traffic scenarios

4.3 模型分析

本節(jié)對(duì)神經(jīng)網(wǎng)絡(luò)模型的性能進(jìn)行具體分析,包括時(shí)間開銷以及內(nèi)存開銷兩方面,從而有效說明神經(jīng)網(wǎng)絡(luò)模型運(yùn)行對(duì)NFV 系統(tǒng)整體性能的影響。

4.3.1 離線訓(xùn)練時(shí)間

針對(duì)于離線訓(xùn)練,訓(xùn)練一個(gè)單獨(dú)的網(wǎng)絡(luò)功能需要大概250 個(gè)迭代,每一個(gè)迭代大概花費(fèi)500 ms??傮w而言,GSDM 可以迅速地收斂。傳統(tǒng)方案需要幾個(gè)月甚至幾周的時(shí)間進(jìn)行設(shè)計(jì)。與之相比,GSDM 模型可以有效地降低方案設(shè)計(jì)時(shí)間。

4.3.2 在線運(yùn)行時(shí)間

對(duì)訓(xùn)練好的GSDM 模型在線運(yùn)行時(shí)間進(jìn)行了測(cè)量,運(yùn)行時(shí)間大約在0.12 s~0.14 s 之間。與其他后續(xù)的資源調(diào)度策略相比(例如:實(shí)例啟動(dòng)以及實(shí)例遷移需要幾十秒甚至幾分鐘),GSDM 在線運(yùn)行時(shí)間幾乎可以忽略不計(jì),對(duì)系統(tǒng)整體資源調(diào)度策略影響非常小。

4.3.3 內(nèi)存開銷分析

本文提出的神經(jīng)網(wǎng)絡(luò)模型較為簡單,僅需要對(duì)多個(gè)網(wǎng)絡(luò)功能的特征序列進(jìn)行處理。在實(shí)際應(yīng)用中,相較于在數(shù)據(jù)中心運(yùn)行的大型NFV 系統(tǒng),訓(xùn)練完成的神經(jīng)網(wǎng)絡(luò)模型在線運(yùn)行帶來的內(nèi)存開銷非常微小,幾乎可以忽略不計(jì)。

5 結(jié)論

本文提出了一種基于服務(wù)功能鏈的資源調(diào)度的機(jī)制——GSDM,將鄰居節(jié)點(diǎn)信息加入到輸入信息中,有效地刻畫網(wǎng)絡(luò)功能連接關(guān)系對(duì)資源調(diào)度機(jī)制的影響??紤]到高維輸入信息難以采用傳統(tǒng)數(shù)學(xué)建模方法進(jìn)行有效刻畫,GSDM 利用神經(jīng)網(wǎng)絡(luò)模型構(gòu)建了高維特征序列(自身以及鄰居節(jié)點(diǎn)特征序列)與擴(kuò)展動(dòng)作之間的對(duì)應(yīng)關(guān)系。除此之外,GSDM設(shè)計(jì)了網(wǎng)絡(luò)功能級(jí)的注意力機(jī)制,有效地區(qū)分不同的鄰居節(jié)點(diǎn)并設(shè)立不同的權(quán)重,從而捕捉對(duì)最終結(jié)果影響力更大的鄰居節(jié)點(diǎn)。實(shí)現(xiàn)了GSDM 的原型系統(tǒng),并將其與現(xiàn)有的各類資源調(diào)度機(jī)制進(jìn)行了對(duì)比分析。實(shí)驗(yàn)結(jié)果表明,GSDM 機(jī)制能夠快速準(zhǔn)確地發(fā)現(xiàn)系統(tǒng)運(yùn)行中的瓶頸網(wǎng)絡(luò)功能節(jié)點(diǎn),并為其分配更多的資源保障性能,在多種網(wǎng)絡(luò)流量場景下均超過其他機(jī)制,表現(xiàn)出最好的性能。

猜你喜歡
調(diào)度流量機(jī)制
冰墩墩背后的流量密碼
張曉明:流量決定勝負(fù)!三大流量高地裂變無限可能!
尋找書業(yè)新流量
《調(diào)度集中系統(tǒng)(CTC)/列車調(diào)度指揮系統(tǒng)(TDCS)維護(hù)手冊(cè)》正式出版
一種基于負(fù)載均衡的Kubernetes調(diào)度改進(jìn)算法
虛擬機(jī)實(shí)時(shí)遷移調(diào)度算法
自制力是一種很好的篩選機(jī)制
破除舊機(jī)制要分步推進(jìn)
注重機(jī)制的相互配合
打基礎(chǔ) 抓機(jī)制 顯成效