国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

服務功能鏈中基于機器學習的QoE 評估與預測

2022-01-14 03:02趙季紅張文娟喬琳琳張夢雪
計算機工程 2022年1期
關鍵詞:時延部署樣本

趙季紅,張文娟,喬琳琳,張夢雪

(1.西安郵電大學通信與信息工程學院,西安 710121;2.西安交通大學電子信息工程學院,西安 710049)

0 概述

軟件定義網(wǎng)絡(Software Defined Network,SDN)通過核心技術Openflow 分離網(wǎng)絡設備的控制平面和數(shù)據(jù)平面,實現(xiàn)了網(wǎng)絡可編程化和對網(wǎng)絡流量的靈活控制,使網(wǎng)絡更加智能、動態(tài)和靈活[1]。網(wǎng)絡功能虛擬化(Network Function Virtualization,NFV)將網(wǎng)絡功能與專用硬件解耦,在網(wǎng)絡管理和維護方面獲得更高靈活性,同時減少了網(wǎng)絡運營成本和支出[2-3]。服務功能鏈(Service Function Chains,SFC)是當客戶端的服務請求到達時,網(wǎng)絡服務供應商利用SDN 技術在虛擬網(wǎng)絡上連接的一組鏈式有序的虛擬網(wǎng)絡功能(Virtualized Network Function,VNF),該功能可使數(shù)據(jù)包在指定路由上傳輸[4-5]。

第5 代移動通信網(wǎng)絡旨在提供高速率、低延遲的服務,這些服務通常以特定的順序分發(fā)和訪問。但在部署服務功能鏈時須考慮多種因素,例如計算資源、帶寬等。用戶根據(jù)所定制的業(yè)務,對服務功能鏈的需求有所不同。也正是需求的不同使有效部署服務功能鏈變得更加困難。體驗質(zhì)量(Quality of Experience,QoE)是從用戶角度反映應用或服務質(zhì)量的有效指標,一方面可作為提供者的優(yōu)化目標,表示當前服務與網(wǎng)絡質(zhì)量和用戶體驗之間的關系;另一方面可作為反饋信息用以指導服務功能鏈的部署,在保證應用程序或服務的QoE 的同時優(yōu)化資源使用狀況[6]。與QoE 相 比,服務質(zhì)量(Quality of Service,QoS)從網(wǎng)絡性能方面處理業(yè)務,為用戶提供業(yè)務質(zhì)量的保障,并滿足每個用戶的需求。使用定性的QoE 指標代替定量的QoS 指標,可以為更多用戶優(yōu)化服務功能鏈的部署,提升用戶的體驗質(zhì)量。

為提高用戶的滿意度,以往的文獻通常選取1 個或2 個QoS 指標對服務功能鏈進行優(yōu)化部署。文獻[7]采用神經(jīng)網(wǎng)絡的方法預測所需虛擬網(wǎng)絡功能實例的數(shù)量實現(xiàn)自動縮放,利用整數(shù)線性規(guī)劃進行SFC 部署從而達到最小時延。文獻[8]提出四階段自適應調(diào)度方案以權(quán)衡不同的調(diào)度目標,并提出多項式時間復雜度的最小權(quán)路徑選擇算法以實現(xiàn)實際的SFC 調(diào)度,從而實現(xiàn)了較高的網(wǎng)絡吞吐量和資源利用率,并降低了網(wǎng)絡縮放頻率。文獻[9]設計一種高效能的SFC 算法以滿足客戶的QoS 要求和實現(xiàn)最小化能耗。該算法基于Dijkstra 算法根據(jù)具體需求計算服務的最短路徑,在考慮功耗的前提下沿路徑分配VNFs 到虛擬機。此外,還考慮了閑置服務的能源消耗,當成本超出給定的閾值時將重組服務功能鏈的路徑。文獻[10]研究了具有能量效率和QoS保證的VNFs 動態(tài)布局問題,并提出能耗最小化的VNF-EQ 算法。

傳統(tǒng)的服務功能鏈部署,只選取1 個或2 個QoS指標作為QoE 指標,并未對QoE 進行系統(tǒng)研究。文獻[11]提出在SDN/NFV 支持的5G 切片中基于強化學習的QoS/QoE 感知服務功能鏈,采用IQX 假設和WFL 假設進行QoS 與QoE 之間的映射,并采用強化學習算法進行SFC 的算法編排,但只進行了映射并沒有進行QoE 的預測。文獻[12]提出一種基于延遲預測的QoE 驅(qū)動服務鏈部署算法,該算法顯著提高了用戶的體驗質(zhì)量,但該算法只把時延作為QoE 進行預測并沒有考慮其他參數(shù)的影響。文獻[13]設計了一種基于馬爾科夫鏈的多實例VNF 布局算法,最大程度地降低了時延和成本,保證了不同服務功能數(shù)量下的QoE 要求,使網(wǎng)絡負載均衡。然而該算法只保證了QoE 要求,并沒有對服務功能鏈中的QoE進行研究和預測。文獻[14]提出了ScaRL 算法,該算法利用啟發(fā)式解決方案的試錯機制、獎勵機制和探索開發(fā)能力,以及利用強化學習算法做出最優(yōu)決策,通過降低SFC 請求的平均延遲和阻塞率保證QoE 不降低。但該算法并未對QoE 進行研究。

傳統(tǒng)的QoE 預測模型一般為單維或低維的,其實時性差且準確度不高。近年來,機器學習預測算法受到廣泛關注,被用于從網(wǎng)絡指標中預測QoE。文獻[15]通過對比BP 神經(jīng)網(wǎng)絡和深度置信網(wǎng)絡(Deep Belief Network,DBN)發(fā)現(xiàn)基于DBN 的QoS 到QoE 的映射模型的迭代次數(shù)和收斂效果更好。文獻[16]建立了一種基于機器學習的移動視頻流多維QoE 預測模型,實驗結(jié)果表明基于決策樹的模型性能如預測性能優(yōu)于以往的模型。

本文采用易測可控的網(wǎng)絡層QoS 參數(shù)進行QoE映射、評估與預測,構(gòu)建一種面向SDN/NFV 的服務功能鏈部署模型。利用此模型收集影響服務功能鏈部署的網(wǎng)絡QoS 參數(shù),并提出一種基于層次分析法的多參數(shù)網(wǎng)絡QoS 到QoE(Multi-Parameter Network QoS to QoE,MPNQ2)映射算法。根據(jù)所得數(shù)據(jù)集構(gòu)建基于隨機森林的QoE 預測模型,利用評價指標驗證算法的可行性,并對QoE 進行預測。

1 系統(tǒng)模型

把底層網(wǎng)絡看成一個無向圖GS=(NS,LS)。其中:NS為底層節(jié)點集合,每個節(jié)點均可部署一個或多個VNF;LS是所有底層鏈路的集合。將SFC 看成一個有向圖GV=(NV,LV)。其 中:NV為所有VNF 的集合;LV為連接VNF 的所有虛擬鏈路的集合。服務功能鏈的集合表示為S={Sp|p=1,2,…,K},VNF 節(jié)點的集合表示為V={Vq|1,2,…,N},其中VNF 具有防火墻、深度檢測包、加密、解密等網(wǎng)絡功能。當每個VNF 只能映射到一個底層節(jié)點上時,如式(1)所示,當SFC 上的VNF 需要部署在不同的底層節(jié)點上時,如式(2)所示:

當所有成功映射的虛擬鏈路的帶寬資源小于底層物理鏈路的帶寬資源時,如式(3)所示:

當所有成功部署在底層節(jié)點的VNF 其要求的CPU 資源小于該物理節(jié)點的CPU 資源限制時,如式(4)所示:

當每條虛擬鏈路必須映射到連續(xù)的底層鏈路上時,如式(5)所示:

當每一條虛擬鏈路至少映射到一條或多條底層鏈路時,如式(6)所示:

圖1 所示為服務功能鏈鏈路映射流程,其中SFC1、SFC2 分別有4 個、3 個虛擬網(wǎng)絡功能,SFC1 的部署路徑為(s1,1)→(1,3)→(3,2)→(2,4)→(4,t1)。SFC2 的部署路徑為(s2,2)→(2,5)→(5,4)→(4,t2)或(s1,2)→(2,5)→(5,6)→(6,4)→(4,t2),其中物理節(jié)點6 只負責轉(zhuǎn)發(fā)但不消耗存儲資源。

圖1 服務功能鏈鏈路映射流程Fig.1 Service function chain link mapping process

使用Openflow 協(xié)議進行控制,通過對虛擬交換機下發(fā)控制轉(zhuǎn)發(fā)的流表以控制交換設施的轉(zhuǎn)發(fā)行為。對VNF而言,每一種VNF 分別與Openvswitch 相連并映射到相應的物理節(jié)點上。每個物理節(jié)點有2 個虛擬接口,數(shù)據(jù)包從其中一個接口進入VNF,并從另一個接口離開[18]。通過數(shù)據(jù)包在該網(wǎng)絡拓撲中的傳輸將所采集的特征包括帶寬、時延、吞吐量、抖動、丟包率作為QoE預測訓練的輸入,如表1 所示。平均意見評分(Mean Opinion Score,MOS)是目前使用最廣泛的主觀評價方法,主要分為5 個等級,從1 到5,分別代表很差、差、一般、好、很好,本文用其衡量用戶的QoE。

表1 QoE 預測的輸入特征Table 1 Input feature for QoE prediction

2 基于層次分析法的QoS/QoE 映射模型

2.1 QoS 與QoE

QoE 是對服務和應用滿意程度的一個定性度量指標,其影響因素包括環(huán)境層面、用戶層面、服務層面等[19]。用戶相關因素包括用戶的感知和過去的經(jīng)驗。環(huán)境因素包括服務運行環(huán)境、自然環(huán)境等。從QoS 到以服務為中心的網(wǎng)絡管理,再從網(wǎng)絡到以客戶為中心的架構(gòu),是網(wǎng)絡從4G 網(wǎng)絡到5G 網(wǎng)絡的一步轉(zhuǎn)變。

通常QoS 與QoE 呈現(xiàn)非線性變化,因此,高質(zhì)量的QoS 可以導致高質(zhì)量的QoE,但不能保證高質(zhì)量的QoE,QoS 與QoE 的關系如圖2所示[20]。當QoS擾動小于x1時,QoE 值較高,即用戶的欣賞度不受影響;當QoS 擾動位于x1與x2之間時,QoE 隨著QoS 擾動的增加而減??;當QoS 擾動大于x2時,用戶的感受受到很大影響,極有可能完全停止使用服務。

圖2 QoS 與QoE 的映射關系Fig.2 The mapping relationship between QoS and QoE

在OSI(Open System Interconnection)參考模型中,針對QoS 不同解決方案已被提出。通常QoS 為應用層和網(wǎng)絡層。應用層包括為實現(xiàn)QoS 請求而提供的服務,應用層的QoS 與分辨率、顏色、音視頻編解碼器類型等相關。網(wǎng)絡層由交換機和路由器等設備提供,一般包括時延、抖動、丟包率等QoS 參數(shù)。研究面向終端用戶的QoE 與面向網(wǎng)絡的QoS 參數(shù)十分重要,且網(wǎng)絡QoS 參數(shù)可以用來測量和量化QoE,因此本文提出基于層次分析法的MPNQ2 算法,實現(xiàn)易測可控的網(wǎng)絡層QoS 參數(shù)與QoE 映射。

2.2 MPNQ2 算法

2.1 選取了時延、抖動、流量、吞吐量、帶寬、丟包率作為QoE 評價的主要指標。本文利用層次分析法將QoE 建模如下:

其中:Wi表示對應網(wǎng)絡變量的重要程度;Ci代表對應的QoS 參數(shù);D表示時延;B表示帶寬;Tr表示流量;J表示抖動;P表示丟包率;Th表示吞吐率。

層次分析法分為以下步驟:

步驟1建立層次結(jié)構(gòu)模型。如圖3 所示,第1 層為總評分QoE,反映了用戶的滿意程度,第2 層為網(wǎng)絡層QoS 層,第3 層為各個QoS 影響參數(shù)。

圖3 層次結(jié)構(gòu)模型Fig.3 Hierarchical model

步驟2構(gòu)造判斷矩陣,即采用一致矩陣法對QoS參數(shù)進行比較。判斷比較的標度原則如表2 所示。

表2 判斷矩陣的賦值含義Table 2 The meaning of assignment of judgment matrix

步驟3從QoS 參數(shù)中任意選取2 個參數(shù)i和j,以aij表 示Ci和Cj對QoE 的影響程度,則Cj對Ci的影響之比為1/aij,即aji。所有比較結(jié)果均由矩陣A=(aij)6×6表示。使用一致性檢驗法檢驗矩陣A的合理性。一致性指標CCI計算公式如式(8)所示:

其中:λmax代表所判斷矩陣的最大特征值;n是所判斷矩陣的維數(shù)。

由于傳統(tǒng)的非交互業(yè)務數(shù)據(jù)突發(fā)性大,丟包率成為了其關鍵影響因素,帶寬和吞吐量的影響因素次之。該業(yè)務不需要明顯的流量作為業(yè)務保障,傳統(tǒng)的非交互業(yè)務對時延抖動和傳播時延沒有具體要求,時延抖動和傳播時延對該業(yè)務的影響程度最小,幾乎可以忽略不計。基于上述分析其判斷矩陣如式(9)所示:

一致性指標RRI如表3 所示,判斷矩陣維度為6,通過查表可知RRI=1.24。

表3 一致性檢驗表Table 3 Consistency check list

步驟4計算一致性比例CCR,最后裁剪生成決策樹。CCR的計算公式如式(10)所示:

其中:只有當CCR小于0.1 時,認為判斷矩陣的一致性可以接受,否則需要對判斷矩陣進行適當?shù)男薷模?1]。根據(jù)式(10)計算可得CCR=0.03,因此該判斷矩陣通過了一致性檢查,其對應于最大特征值λmax的判斷矩陣A的特征向量W=(W1,W2,W3,W4,W5,W6),并將特征向量W歸一化:

按照上述步驟計算得到時延、帶寬、流量、抖動、丟包、吞吐量對QoE 的影響權(quán)重值分別為0.035、0.249、0.049、0.066、0.472、0.129,則最終QoS 到QoE的映射表達為:

3 基于隨機森林的QoE 預測模型

隨機森林是一種基于Bagging 集成學習的混合學習方法,用于回歸和分類。其實質(zhì)是將bootstrap方法應用于分類回歸樹算法中,采用bootstrap 方法對隨機森林進行采樣,并使用CART 算法構(gòu)建獨立的決策樹模型,將所有決策樹組合成隨機森林。該方法具有精度高、魯棒性強、應用范圍廣等優(yōu)點,本文選用隨機森林進行QoE 的預測。

隨機森林算法的過程分為決策樹的生長和投票過程2 個主要步驟,其中生長過程分為3 個方面:訓練集的隨機選擇,隨機森林的構(gòu)建和分裂節(jié)點。構(gòu)建過程如圖4 所示。

圖4 隨機森林的結(jié)構(gòu)Fig.4 Structural map of random forests

3.1 訓練集的選擇

基于MPNQ2 算法得到的原始樣本集中共有5 000 個樣本及6 個特征,將原始樣本集按照7∶3 的比例分割成訓練集和測試集。通過Bootstrap 方法連續(xù)獨立地從原始樣本中隨機抽取3 500 個樣本作為訓練集。由于采樣過程使用了隨機替換方法,因此抽取的所有樣本在一定程度上都包含重復樣本。但由于抽取的樣本并不包含所有樣本,因此避免了輸入所有樣本進入模型時而導致的過度擬合。

3.2 分類回歸樹

分類回歸樹(Classification and Regression Tree,CART)算法的基本思想是選擇基尼系數(shù)最小的特征作為分割屬性[22]。根據(jù)節(jié)點的剖分屬性,使用二進制遞歸分割技術將當前樣本集分為2 個子樣本集,以遞歸形式形成一個簡單的二叉樹。Gini 系數(shù)的計算公式如式(13)所示:

其中:F代表樣本集;Pi表示樣本集F包含第i類的概率,i∈{1,2,3,4,5}。

計算分裂節(jié)點的系數(shù)公式如下:

其中:|F|是樣本集F 的樣本數(shù);|F1|、|F2|分別代表子集F1和F2的樣本數(shù)。

3.3 投票過程

隨機森林采用Bagging 方法生成多個決策樹分類器。本文給定一個弱學習算法和一個訓練數(shù)據(jù)集T,進行多次隨機抽樣替換。每次采樣時從原始訓練集T中抽取n個樣本以形成訓練數(shù)據(jù)集的一個子集,訓練的每個子集將得到一個決策樹分類器[23]。將每個決策樹分類器的結(jié)果作為一次投票,通過投票計數(shù)選擇最終樣本分類預測結(jié)果。

4 仿真與性能分析

4.1 評價指標

評估的目的是驗證所獲得的模型能否滿足學習過程中的目標及幫助決定所研究模型的部署[24]。模型預測結(jié)果的混合矩陣如表4 所示,其中:TTP表示實際為正,預測為正;FFP表示實際為正,但預測為負;TTN意味著實際為負,預測為負;FFN意味著實際為正,但預測為負。

表4 混合矩陣Table 4 Mixed matrix

分別采用準確率、查準率、召回率、F1 分數(shù)對結(jié)果進行表征。

1)準確率,如式(15)所示:

準確率反映了對輸入樣本做出正確預測的數(shù)量和總樣本數(shù)的比值。一般來說,準確率越高,分類器越好。

2)查準率,如式(16)所示:

查準率指預測的正比例數(shù)與預測為正例總量之比。

3)召回率,如式(17)所示:

召回率又稱查全率,反映預測對的正比例數(shù)占真正的正例數(shù)的比率。召回率是覆蓋面的度量,召回率越高,覆蓋范圍越廣。

4)F1 分數(shù),如式(18)所示:

其中:F1 分數(shù)是精確度和召回率加權(quán)調(diào)和平均,當F1 較高時,實驗方法更有效。

4.2 實驗結(jié)果分析

表5 所示為在同一數(shù)據(jù)集下不同預測模型的評價結(jié)果。由表5 可知,邏輯回歸的模型最差,線性分類分析和決策樹的模型次之。梯度提升決策樹、隨機森林、支持向量機的結(jié)果非常相似,且均高于80%,但隨機森林的各個評價指標都略高于其他2 個。這是由于隨機森林能對訓練集和特征集隨機進行選擇,且對于缺省值問題也能取得很好的結(jié)果。此外,其抗過擬合能力和泛化能力比較強,預測精度較高,具有較好的魯棒性和容錯性。因此,隨機森林對于QoE 預測而言是較佳的算法。

表5 模型評價Table 5 Model evaluation

如圖5 所示,通過評估分類器的準確性表明隨機森林對服務功能鏈中QoE 進行分類和預測具備可行性。

圖5 分類器準確性比較Fig.5 Comparison of classifier accuracy

圖6 為使用隨機森林法對影響服務功能鏈部署的變量重要性進行評估的結(jié)果,從圖中可以看出,隨機森林與層次分析法中的特征重要性排序相同,但是隨機森林是在大量隨機抽取的樣本數(shù)據(jù)集中進行不同的特征選擇訓練得出,其準確率高于層次分析法。其中,丟包率影響最明顯,達到了62%。帶寬、吞吐量次之,分別為23%和10%,抖動、時延、流量最小,幾乎可以忽略不計。

圖6 基于隨機森林變量的重要性Fig.6 The importance of variables based on random forest

圖7 所示為對預測目標MOS 評分的隨機森林模型。該模型的測試和驗證遵循10 倍交叉驗證標準,以減小潛在的過度擬合和有偏差結(jié)論的影響,提高結(jié)果的可靠性。從圖中可以看出丟包率對用戶體驗質(zhì)量有更直接的影響,當丟包率大于4.4%時,不論其他參數(shù)如何變,MOS 為1,用戶體驗質(zhì)量達到最差。當丟包率越小,帶寬和吞吐量越大時,MOS 達到了5,用戶滿意度達到最大。但是流量的減小在一定程度上會造成用戶體驗質(zhì)量的下降,例如當帶寬大于156.5 Mb/s、丟包率小于0.4%時。MOS 為5;丟包率大于0.4% 時,MOS 為4.5,但是當流量大于48.2 MB 時,MOS 有所下降。時延和抖動對用戶滿意度的影響很小,幾乎可忽略不計。

圖7 MOS 預測的隨機森林模型Fig.7 Random forest model for MOS prediction

5 結(jié)束語

本文針對服務功能鏈中的QoE 評估和預測問題,提出一種基于機器學習的服務功能鏈部署模型。通過SDN/NFV 的服務功能鏈部署模型收集影響服務功能鏈部署的網(wǎng)絡QoS 參數(shù),采用層次分析法建立3 層結(jié)構(gòu)模型,利用MPNQ2 算法計算每個參數(shù)的影響權(quán)重,實現(xiàn)QoS 與QoE 的映射。此外,提出一種基于隨機森林的QoE 預測模型以提高預測結(jié)果的準確性。實驗結(jié)果表明,與梯度提升決策樹、線性判別分析等機器學習算法相比,隨機森林具有較高的準確性。下一步將考慮更多影響服務功能鏈部署的參數(shù),如設備性能、內(nèi)容類型等,以便不斷獲取用戶反饋,從而對用戶感知進行實時、準確的描述。

猜你喜歡
時延部署樣本
一種基于Kubernetes的Web應用部署與配置系統(tǒng)
晉城:安排部署 統(tǒng)防統(tǒng)治
用樣本估計總體復習點撥
5G承載網(wǎng)部署滿足uRLLC業(yè)務時延要求的研究
部署
基于GCC-nearest時延估計的室內(nèi)聲源定位
規(guī)劃·樣本
隨機微分方程的樣本Lyapunov二次型估計
部署“薩德”意欲何為?
簡化的基于時延線性擬合的寬帶測向算法