張 鴻,黃 闖,鄒 虹,王汝言,徐瑞鑫,李職杜
(1.重慶郵電大學 通信與信息工程學院,重慶 400065;2.先進網絡與智能互聯(lián)技術重慶市高校重點實驗室,重慶 400065;3.泛在感知與互聯(lián)重慶市重點實驗室,重慶 400065)
隨著在線、移動和實時社交媒體的快速發(fā)展,以視頻為代表的富媒體逐漸成為互聯(lián)網內容的主流[1]。根據思科視頻網絡指數(shù)預測的結果,2022年全球視頻流量將占全網流量的82%[2]。為了保證用戶觀看視頻的體驗質量,無線網絡傳輸需要具備超高的數(shù)據速率、低時延和大容量的特點[3]。面對上述挑戰(zhàn),采用時波分復用無源光網絡(Time and Wavelength Division Multiplexed Passive Optical Network,TWDM-PON)作為前傳的云無線接入網(Cloud Radio Access Network,C-RAN)被認為是滿足低時延、高數(shù)據速率和大容量的有效解決方案[4]。但是,面對不斷增加的視頻數(shù)據流量,用C-RAN有限的前傳能力和無線資源給用戶提供平滑高質量的視頻體驗質量產生了巨大的挑戰(zhàn)[5]。
對于視頻業(yè)務而言,其最終目的是給用戶提供一個平滑和高質量的視頻播放體驗。在無線域,文獻[6]中提出了一種基于速率的動態(tài)比特率自適應流策略,實現(xiàn)了高效與低成本的視頻流傳輸,但在一些緩沖區(qū)空間較小的設備上,當速率控制沒有及時根據吞吐量調整,此時易造成用戶緩沖區(qū)中斷或溢出。因此,文獻[7]中設計了一種比例-積分-微分策略,通過穩(wěn)定用戶播放緩沖區(qū)的長度來保證視頻的連續(xù)播放。雖然它增強了用戶觀看視頻的連續(xù)性,卻忽略了視頻的質量。為了解決該問題,文獻[8]中提出了雙時間尺度的資源優(yōu)化策略,將軟件定義網絡(Software Defined Network,SDN)引入到無線網絡,利用軟件定義網絡控制器感知網絡中的環(huán)境變化,同時設計了一種李雅普諾夫在線算法,以獲得每個時間尺度的視頻質量和帶寬分配決策來提高用戶的平均視頻質量。然而,上述文獻都是針對無線域的資源分配來增強用戶的體驗質量(Quantity of Experience,QoE)的。采用TWDM-PON作為前傳的C-RAN架構,應充分考慮光域和無線域協(xié)作來提升網絡的性能。因此,文獻[9]中設計了一個基于軟件定義網絡的C-RAN架構,利用軟件定義網絡控制器感知網絡中光域和無線域的資源,并且對C-RAN架構中的無線層和傳輸層進行聯(lián)合調度和管控,但是對波長資源和無線資源無法實現(xiàn)共享,各個服務提供商(Service Provider,SP)獨立運行C-RAN,造成資源利用率不高,無法保證用戶的體驗質量。為了解決該問題,文獻[10]在基于軟件定義網絡的C-RAN架構上,利用網絡虛擬化技術(Network Virtualization,NV)將基礎設施和空閑的頻譜資源形成虛擬化切片,用于無線資源拍賣以保證用戶的服務質量,但是該策略沒有考慮光域資源的虛擬化。因此,在光域與無線域中,文獻[11]中設計了一個C-RAN與NV的聯(lián)合架構,在保證用戶服務質量的前提下,依據負載流量為不同類型的虛擬化云無線接入網(Virtualization C-RAN,V-CRAN)公平地分配資源。然而,該策略并不適用于以用戶為中心的視頻流服務。因此,文獻[12]中設計了一個端邊云協(xié)作的C-RAN架構,考慮用戶簇切換時的零緩沖中斷時間與網絡的頻譜效率構建虛擬無源光網絡(Virtualized Passive Optical Network,VPON),利用網絡虛擬技術有效地降低了光域的波長數(shù)目,同時提高了無線鏈路的頻譜效率,減少了用戶觀看視頻的中斷時間。然而,該技術卻忽略了光網絡單元(Optical Network Unit,ONU)的調諧范圍,過多的簇切換會產生較大的波長調諧開銷。
綜上所述,雖然基于TWDM-PON前傳的C-RAN架構下能夠有效地向用戶提供高質量的視頻傳輸,但仍存在光域和無線域資源分配不平衡的問題,從而影響用戶觀看視頻時的體驗質量。因此,在基于軟件定義網絡的TWDM-PON前傳的C-RAN架構下,筆者提出一種體驗質量感知的虛擬化云無線接入網視頻傳輸資源分配策略(Qoe-Aware Video Transmission Resource Allocation Strategy,QAVTRAS)。首先根據用戶請求的視頻質量、帶寬需求,考慮前傳帶寬分配效率、調諧開銷以及負載均衡性優(yōu)化波長資源的分配,提出基于合并分裂規(guī)則的聯(lián)盟形成博弈構建V-CRAN;進而,建立V-CRAN和用戶之間的Stackelberg博弈模型,通過定價策略優(yōu)化無線帶寬分配,保證用戶體驗質量;最后求解納什均衡,得到雙方各自最優(yōu)的策略。
基于TWDM-PON前傳的C-RAN網絡如圖1所示。TWDM-PON可為C-RAN提供高容量、低時延的前傳支持,以滿足視頻業(yè)務的傳輸需求。在無線域中,每個RRH從小區(qū)中的用戶接收射頻信號之后,傳輸?shù)焦饩W絡單元形成數(shù)字基帶信號。利用公共無線接口(Common Public Radio Interface,CPRI)將數(shù)字化的基帶信號轉發(fā)到基帶單元池[13]。在光域,光線路終端(Optical Line Terminal,OLT)負責分配波長資源[14]。利用TWDM-PON的高容量特性,多個光網絡單元利用波長調諧器調諧到同一波長或波長組形成VPON,以時分復用的方式共享該波長,并通過遠端節(jié)點(Remote Node,RN)將上行/下行數(shù)據流量傳輸?shù)焦饩W絡單元[15]。
圖1 基于TWDM-PON前傳的V-CRAN架構
與現(xiàn)有架構不同的是,基帶單元池虛擬化成若干個虛擬基帶單元(virtualized BaseBand Units,vBBUs)。當小區(qū)處于輕負載或重負載的情況時,虛擬化小區(qū)(Virtualized Cell,VC)動態(tài)地控制vBBU和線卡(Line Card,LC)的關聯(lián)。其中,虛擬化小區(qū)負責管理一組vBBUs,相應地控制一組波長信道連接到RRH。
為了實現(xiàn)光域和無線域的協(xié)同調度和優(yōu)化,筆者提出支持軟件定義網絡的C-RAN網絡為資源和用戶提供了一個資源交易的平臺。軟件定義網絡控制器通過資源調度為不同的VPON分配波長組,并與之相關聯(lián)的虛擬化小區(qū)形成V-CRAN。其中,每個V-CRAN代表一個服務提供商。在資源調度過程中,用戶首先向軟件定義網絡控制器發(fā)送調度請求,請求信息包含用戶請求的視頻質量、播放緩沖區(qū)的大小、信道質量信息以及帶寬需求;其次,軟件定義網絡控制器計算前傳帶寬分配效率、波長調諧開銷以及波長間的負載均衡程度,通過基于合并分裂規(guī)則的聯(lián)盟博弈構建V-CRAN,優(yōu)化波長資源的分配。一旦V-CRAN構建完成,將用戶和V-CRAN建模為兩階段的Stackelberg博弈,根據用戶播放緩沖區(qū)的大小,定義用戶視頻中斷危險程度參數(shù),進一步優(yōu)化無線資源的分配。最后,軟件定義網絡控制器將光域和無線域的資源分配決策通過傳輸控制器和無線控制器向光網絡單元進行廣播,每個光網絡單元只處理與它連接RRH的調度決策。
在基于TWDM-PON前傳網絡的C-RAN網絡中,過多的波長開啟將會導致較大的能耗開銷和較低的資源分配效率。而形成V-CRAN能夠共享波長資源,減少波長的使用量。同時,為了實現(xiàn)波長資源和無線資源的協(xié)同分配,通過考慮用戶請求的視頻比特率和期望的無線帶寬數(shù)量構建波長資源和無線資源的下行帶寬分配效率模型。然而,由于每個光網絡單元的調諧范圍不一樣,在分配波長的時候容易造成較大的波長調諧開銷或較差的波長負載均衡性。因此,為了優(yōu)化激活的波長數(shù)目和波長調度引起的開銷,考慮前傳帶寬分配效率、調諧開銷和負載均衡性,筆者提出基于合并與分裂的聯(lián)盟形成算法。
在V-CRAN構建的過程中,根據用戶請求的視頻比特率大小和所期望得到的帶寬數(shù)量創(chuàng)建V-CRAN。假設G={g1,g2,…,g|G|},|G|是V-CRANs的集合;|W|是波長的數(shù)量,W={w1,w2,…,w|W|}。V-CRANgi是由ni個RRH/光網絡單元組成的,根據文獻[16]定義當前V-CRANgi下的前傳帶寬分配效率E(gi),表示為波長承載每單位無線帶寬所減少的使用數(shù)量:
(1)
(2)
當負載一定時,激活波長的數(shù)目隨波長分配方案的不同而變化。為了均衡不同波長間的負載量,利用均方誤差來衡量當前場景下不同虛擬光網絡間的負載失衡度[18]:
(3)
聯(lián)盟形成是一種基于合作的博弈算法,通過光網絡單元之間相互協(xié)作形成V-CRAN,能夠共享波長資源,實現(xiàn)資源的高效利用。因此,根據前傳帶寬分配效率、波長調諧開銷和負載均衡性將V-CRAN的構建過程轉化成聯(lián)盟博弈問題,并通過合并與分裂規(guī)則得到最優(yōu)的V-CRAN分配方案。
(1) 聯(lián)盟模型
用(I,U)表示聯(lián)盟博弈。I為博弈的參與者,即在任意的Ti和Ti+1之間,波長分配方案的集合I={σ1(o,w),…,σ|O|(o,w)},其中{σj(o,w),o∈O,w∈W}表示波長wj分配給oj用于前傳數(shù)據的傳輸。U表示該集合的效用值,根據前傳帶寬分配效率、波長調諧開銷和負載失衡度建立V-CRANgi的效用函數(shù):
U(gi(Ω))=αE(gi(Ω))-βT(gi(Ω))-γB(gi(Ω)) ,
(4)
其中,gi(Ω)表示V-CRANgi中σ(o,w)的集合。α+β+γ=1,可通過調節(jié)a,β,γ的值來表征網絡的偏好程度。
在V-CRAN形成的過程中,選擇合作的標準是聯(lián)盟中的成員是否能夠獲得最大的個體效用或者該聯(lián)盟能夠達到最大化的網絡效用。為了便于描述聯(lián)盟機制,有如下定義[19]。
定義2(比較(Comparison)?):假設集合I中兩種不同的聯(lián)盟結構A和B,比較?表示A和B的比較關系。若效用函數(shù)U(A)>U(B),則稱A?B。
在聯(lián)盟博弈中,比較關系主要分為兩類:聯(lián)盟價值序列和個體價值序列。聯(lián)盟價值序列(如功利主義序列)追求的是網絡效用的最大化,而個體價值序列(例如帕累托序列)注重個體的效用值。形成V-CRAN是為了共享波長資源,達到資源的最優(yōu)利用,因此不同集合之間選擇聯(lián)盟價值序列作為V-CRAN劃分的合并與分裂規(guī)則。
(2) 聯(lián)盟博弈規(guī)則
由上述定義,根據聯(lián)盟價值序列設計兩種聯(lián)盟規(guī)則。
(5)
(6)
筆者提出基于合并與分裂規(guī)則的聯(lián)盟形成算法,主要思想如下:初始狀態(tài)下每個σ(o,w)都相互獨立;在合并階段中,σ(o,w)向I中的其他σ|O|(o,w)嘗試形成聯(lián)盟。若加入該聯(lián)盟能夠增大整體聯(lián)盟的效用值,則進行合并。重復合并過程,直到遍歷完I且最大聯(lián)盟效用值不能再增加為止。接下來進行分裂,對于當前的聯(lián)盟結構中的每一個聯(lián)盟進行分裂。根據式(6),若分裂能夠增大當前最大的聯(lián)盟效用值,則分裂成互不相交的小聯(lián)盟,直到分裂行為不再增加當前聯(lián)盟的效用為止。至此,一輪合并-分裂過程結束。算法經過多次的聯(lián)盟合并與分裂操作,直到此時的聯(lián)盟結構中所有聯(lián)盟沒有合并與分裂活動,則算法停止。
在某個V-CRAN中,多個用戶共享該V-CRAN的無線資源,通過相互競爭最大化自身觀看視頻時的體驗質量。而每個V-CRAN作為服務提供商通過設置合理的資源價格為用戶提供服務。服務提供商和用戶的交互建模為兩階段的Stackelberg博弈模型。在第1階段,服務提供商公布資源的價格;第2階段,用戶根據服務提供商的價格響應資源需求以保證觀看視頻的體驗質量。因此,如何合理地分配無線資源,最大化服務提供商的效用,同時又能夠保證用戶的體驗質量顯得至關重要。因為每個服務提供商執(zhí)行的都是相同的過程,所以只考慮在單個服務提供商下的無線資源分配。
無線帶寬的分配直接決定著關聯(lián)用戶對視頻質量的感知。當用戶的傳輸速率大于用戶請求的視頻比特率Rm時,此時速率的上升對用戶的體驗影響較為輕微,用戶的體驗質量隨著速率的上升緩慢增加[20]。但當用戶的傳輸速率小于視頻比特率Rm時,用戶對速率的提升有著迫切需求,此時用戶的體驗質量會隨著傳輸速率的下降而急劇減少。用戶的體驗質量與傳輸速率之間存在一種邊際效益遞減的現(xiàn)象[21],用下式表示二者的關系:
(7)
其中,cm表示分配用戶m的帶寬比例,cm∈[0,1];V表示用戶所能達到的最大傳輸速率。V表示為
(8)
其中,C表示該服務提供商的總帶寬大小,δ2為加性高斯白噪聲功率,PRRH表示RRH的發(fā)射功率,gm表示用戶m的信道增益,ζ表示其他RRH對用戶m造成的干擾。
此外,用戶體驗質量中的權重am與用戶的無線帶寬需求有關,表示為用戶的視頻中斷危險程度。視頻中斷危險程度am值越大,表明用戶m對體驗質量的需求越高,對無線帶寬的需求越迫切。為了進一步提高用戶的效用,除了考慮用戶請求的視頻質量,用戶緩沖區(qū)的大小同樣是影響體驗質量的關鍵因素。因此,視頻中斷危險程度am的定義如下:
(9)
用戶在帶寬策略空間定義相應的效用函數(shù),與傳統(tǒng)的最大化用戶加權速率和效用不同。針對視頻業(yè)務的傳輸,用戶的效用函數(shù)必須考慮視頻流的度量指標,因此定義如下的效用函數(shù)。
(1) 用戶的效用函數(shù):用戶的效用函數(shù)由其收益和開銷組成,用戶m的收益定義為用戶觀看視頻時的體驗質量。因為其從服務提供商請求帶寬資源來保證自身的視頻質量,所以用戶m的開銷是用戶向服務提供商請求帶寬的數(shù)量所支付的費用。設p為服務提供商給出的資源單價,cm為第m個用戶所需要的無線帶寬需求量。因此,用戶的效用函數(shù)定義為U(pm,cm),表達式為
Um(pm,cm)=Qm(cm)-pmcm。
(10)
因此,用戶的最優(yōu)化問題為
(11)
(12)
(2) 服務提供商的效用函數(shù):服務提供商的效用函數(shù)等于所有無線帶寬所獲得的收益,因此服務提供商的效用函數(shù)為
(13)
服務提供商的目標就是通過設置合理的無線帶寬價格滿足用戶的需求,以最大化自己的收益。因此,服務提供商的優(yōu)化問題表示為
(14)
(15)
0
(16)
其中,約束式(15)是表示所有用戶的總需求不得大于總帶寬,約束式(16)是為了保證服務提供商的收益為正值。當服務提供商定價過高,將會導致用戶的需求量減少,使得網絡中較多的無線資源被閑置。而當定價過低,則會導致用戶的帶寬需求量過大,超過用戶請求的視頻比特率Rm,對用戶的效用增加不會太明顯。因此,在博弈過程中,服務提供商希望設置合理的價格來最大化自身的收益。
由于服務提供商的無線資源是有限的,所以并不能滿足所有用戶的最大帶寬需求。假設每個用戶都是自私的,都希望獲取更大的收益,支付更少的成本。因此用戶相互競爭無線資源,并通過非合作博弈達到納什均衡。在納什均衡點上,用戶和服務提供商的效用達到最優(yōu)。但并不是所有的非合作博弈都存在唯一的納什均衡解,所以需要證明兩階段納什均衡點的存在性和唯一性[22]。
定理1對于給定的服務提供商的價格策略p*,在M個用戶博弈G={c1,c2,…,cM;U1,U2,…,UM}中,所有的m=1,2,…,M均有以下條件成立:
(1)cm在歐氏空間中是一個非且有界的封閉區(qū)間。
(2)Um是一個連續(xù)的凸函數(shù)。
證明:顯然,對于用戶的資源需求策略{cm},有0≤cm≤1,因此滿足條件1。而且用戶的效用函數(shù)在其策略空間上是連續(xù)的,對任意用戶的效用函數(shù)求其一階偏導為
(17)
其二階偏導為
(18)
逆向歸納法是求解完全信息狀態(tài)下Stackelberg博弈問題領導者和跟隨者最優(yōu)策略的主要方法[23]。但是,需要每個參與者知道其他參與者的相關信息。利用C-RAN集中式架構的優(yōu)勢,通過軟件定義網絡控制器可以獲取其他參與者的相關信息。因此,采取逆向歸納法,求得Stackelberg博弈的納什均衡解。
首先分析第2階段跟隨者的決策。假設在t時刻,服務提供商公布的資源價格為p(t)。這時用戶的資源需求策略通過設置?Um(pm(t),cm(t))/?qm(t)=0,得到服務提供商下用戶m的最佳帶寬大小,使得效用最大化,其表達式記為
(19)
(20)
(21)
0
(22)
此時,服務提供商根據用戶的資源需求策略進一步通過價格迭代調節(jié)自身的價格,獲取更大的收益。服務提供商價格的變化率通過微觀經濟學邊際效用[24]表示。服務提供商的價格迭代方程為
(23)
其中,ω是服務提供商的價格策略調節(jié)系數(shù)。服務提供商的邊際效用可以通過價格的變化量ε(例如ε=10-4)來計算其對效用產生的影響。因此,基于價格的邊際收益[25]可以計算為
(24)
當用戶和服務提供商通過不斷的迭代達到納什均衡時,整個網絡也達到了均衡。
基于上述對V-CRAN的構建和無線資源的進一步優(yōu)化,體驗質量感知的虛擬化云無線接入網視頻傳輸資源分配策略QAVTRAS流程如下:
(1) 初始化。波長分配方案I={σ1(o,w),…,σ|O|(o,w)}中的σ(o,w)相互獨立。
(2) 合并階段。聯(lián)盟基于所選擇的序列對I進行遍歷,若其滿足條件式(5),則進行合并操作。
(3) 分裂階段。若滿足條件式(6),則對該聯(lián)盟進行分裂操作。
(4) 直到聯(lián)盟結構中的所有聯(lián)盟沒有合并與分裂活動為止,輸出V-CRAN的劃分。
(5) 在每個V-CRAN即服務提供商中,根據式(9)計算用戶的視頻中斷危險程度參數(shù)。
(6) 服務提供商在每一個時刻t根據式(23)和式(24)的邊際效用調整價格策略。
(7) 用戶在得知服務提供商的價格策略后,根據式(19)更新自己的無線資源需求策略,直到所有用戶的效用達到均衡為止。
(8) 如果服務提供商的效用達到了均衡,則停止迭代;否則,在下一個t+1時刻,服務提供商根據用戶的無線資源需求調整價格策略,不斷重復(6)過程。
(9) 直到達到均衡,輸出無線資源分配策略。
采用Python仿真平臺對體驗質量感知的虛擬化云無線接入網視頻傳輸資源分配策略QAVTRAS進行驗證,與基于用戶播放緩沖區(qū)感知(Buffer-Aware Resource Allocation algorithm,BARA)的算法[26]、基于速率(Rate-Based Algorithm,RBA)的算法[27]、INLP多目標優(yōu)化以及不考慮調諧開銷(QAVTRAS With No Wavelength Tuning,QAVTRAS-WNWT)、負載均衡(QAVTRAS With No Load Balance,QAVTRAS-WNLB)和用戶緩沖區(qū)大小(QAVTRAS With No Considering Buffer,QAVTRAS-WNCB)算法進行對比。其中,BARA算法是根據用戶播放緩沖區(qū)的大小改變視頻比特率以適應無線信道的變化。RBA算法根據信道狀況的好壞選擇最高可用的視頻比特率版本。為了不失一般性,假設C-RAN網絡中小區(qū)的數(shù)量為32個,TWDM-PON作為前傳的波長數(shù)目為8個。通過數(shù)值仿真的方式從網絡負載的均衡程度、前傳帶寬分配效率、用戶播放中斷次數(shù)以及用戶的效用驗證所提策略的有效性。網絡的系統(tǒng)參數(shù)如表1所示。
表1 仿真參數(shù)設置
此外,視頻的比特率版本設置為{100 kbit/s,200 kbit/s,300 kbit/s,500 kbit/s,700 kbit/s,900 kbit/s,1 100 kbit/s,1 300 kbit/s},其中每個視頻片段的長度設置為2 s。
圖2描述了C-RAN中前傳帶寬分配效率隨網絡中用戶數(shù)目的變化曲線。由圖可知,隨著用戶數(shù)目的增加,筆者提出的QAVTRAS和QAVTRAS-WNWT算法均呈上升趨勢,并且QAVTRAS-WNWT算法相比于INLP多目標優(yōu)化算法的前傳帶寬效率更高。這是因為QAVTRAS算法能夠根據用戶請求的視頻質量和所期望的無線資源數(shù)量合理地劃分V-CRAN。而QAVTRAS算法的帶寬分配效率略低于QAVTRAS-WNWT,這是因為考慮到不同光網絡單元的調諧范圍,在分配波長資源時受到波長調諧的限制,故而形成的V-CRAN的前傳帶寬分配效率低于QAVTRAS-WNWT。在考慮波長調諧開銷和不考慮波長調諧開銷的情況下,隨著用戶數(shù)目的增加,QAVTRAS算法構建的前傳帶寬分配效率最大可分別提升25%和33%。
圖2 不同用戶數(shù)量下的前傳帶寬分配效率
圖3描述了負載均衡性隨不同負載率變化的曲線。在未優(yōu)化的C-RAN網絡場景中,QAVTRAS-WNLB將波長資源固定的分配給不同的小區(qū),并不考慮波長之間的負載情況,從而導致在高負載情況下不同波長承載的業(yè)務量差異性較大,使得前傳網絡中負載波動大。而采用QAVTRAS和QAVTRAS-WNWT算法場景中的負載波動遠低于QAVTRAS-WNLB。這是因為這兩種算法在優(yōu)化過程中,根據用戶請求的視頻質量和無線帶寬數(shù)量動態(tài)地劃分V-CRAN,盡可能地讓每個波長達到均衡,從而使得均衡性在高負載時,隨負載率增加而呈下降的趨勢,并且QAVTRAS算法逐漸向INLP靠近。
圖3 不同負載下光前傳網絡的負載均衡狀態(tài)
圖4描述了在100 s內用戶的中斷次數(shù)隨負載率變化的情況。由圖可以看到,用戶的中斷次數(shù)隨著網絡的負載率增加逐漸上升。顯然,當負載率增加時,網絡中傳輸?shù)臄?shù)據增多,從而導致用戶的中斷次數(shù)隨著網絡的負載率增加而上升。當網絡處于低負載率狀態(tài)時,不同算法用戶的中斷次數(shù)差距不明顯,這是因為網絡中傳輸?shù)臄?shù)據量不大,4種算法都能快速地進行數(shù)據傳輸。然而當負載率增加時,QAVTRAS和BARA算法的中斷次數(shù)小于其他算法的。這是因為所提算法根據用戶請求的視頻質量和播放緩沖區(qū)大小確定用戶的視頻中斷危險程度,能在一定程度上減少視頻中斷的次數(shù);并且在劃分V-CRAN的過程中,考慮了波長之間的調諧時間開銷,減少了視頻傳輸過程中的時間成本。BARA算法是基于用戶的播放緩沖區(qū)大小來選擇視頻比特率傳輸?shù)模斢脩舻牟シ啪彌_區(qū)的長度大于或小于閾值時,選擇相應最高/最低的視頻比特率版本進行分發(fā),因此減少了視頻中斷的次數(shù)。然而,QAVTRAS-WNCB算法沒有考慮用戶實際播放緩沖區(qū)的長度,因此無法保證分配給用戶無線資源的數(shù)量,導致視頻中斷次數(shù)過多。RBA算法隨著負載率的升高,中斷次數(shù)逐漸增加,這是因為低負載率時網絡中有較多的資源能夠傳輸高比特的視頻版本;但當負載率逐漸升高時,網絡中的資源減少使得視頻下載的時間增加,因此用戶的中斷次數(shù)增多。
圖4 不同負載率下用戶的平均中斷次數(shù)
圖5描述了在迭代過程中不同用戶的效用函數(shù)(即具有不同視頻中斷危險程度a值的大小)隨迭代次數(shù)變化的曲線。不同用戶觀看視頻時的播放緩沖區(qū)大小不一樣,根據式(9)計算用戶視頻中斷危險程度的a值。由圖6可知,用戶1的效用大于用戶2的效用。由式(19)可知,視頻中斷危險程度a值越大,分配給用戶的無線資源也就越多,因此能夠保證用戶的視頻質量,故而帶給用戶的效用也就越大。而用戶的效用在迭代開始的時候比較大,是因為服務提供商的價格設定的比較低;隨著迭代次數(shù)的增加,服務提供商不斷地調整價格策略。在迭代的過程中,用戶也不斷調整自己的無線資源需求策略,因此用戶的效用呈下降到上升再到穩(wěn)定的趨勢。在迭代次數(shù)大約200次時,用戶間達到納什均衡。
圖5 不同用戶的效用在迭代過程中的變化
圖6 用戶和服務提供商間的納什均衡
圖6描述了V-CRAN的Stackelberg博弈的納什均衡。在兩階段的博弈中,第1階段,服務提供商給出自己的價格策略,用戶根據其價格策略響應自己的帶寬需求。由于服務提供商為了獲取更多的收益,不斷地提高價格,使得用戶的無線資源需求降低,同時服務提供商的效用降低。第2階段,服務提供商根據用戶的資源需求策略調整價格,價格不斷降低,用戶的無線資源需求量增加,服務提供商的效用增加。經過多次博弈后,大約在迭代200次時,服務提供商的價格策略和用戶的無線資源需求達到穩(wěn)定,說明了該算法的有效性。
為解決云無線接入網絡傳輸中光域和無線域資源分配不平衡、用戶體驗質量差的問題,在基于軟件定義網絡的TWDM-PON前傳的C-RAN架構下,筆者提出了一種體驗質量感知的V-CRAN視頻傳輸資源分配策略。為了保證用戶的體驗質量,在光域提出了一種基于聯(lián)盟博弈的V-CRAN波長資源分配算法,實現(xiàn)光域和無線域資源的聯(lián)合分配。在無線域,將用戶緩沖區(qū)大小、請求的視頻質量作為衡量視頻體驗質量的主要指標,建立用戶和服務提供商(即V-CRAN)兩階段的Stackelberg博弈,進一步優(yōu)化了無線資源的分配,從而減少了視頻播放的中斷次數(shù)。仿真結果表明,所提方案能夠保證用戶體驗質量的同時,合理分配光域和無線域資源,提高了資源的利用率。