陳旭輝 楊紅云
摘 要:HTTP動(dòng)態(tài)自適應(yīng)流技術(shù)利用現(xiàn)有的內(nèi)容分發(fā)網(wǎng)絡(luò)和互聯(lián)網(wǎng)基礎(chǔ)設(shè)施,部署方便、快捷,具有良好的防火墻穿透能力、NAT轉(zhuǎn)換功能,成為網(wǎng)絡(luò)視頻分發(fā)業(yè)務(wù)的主流技術(shù)。為保證媒體傳輸?shù)牧鲿承?,為用戶提供良好的用戶體驗(yàn)質(zhì)量(QoE),需要采用合理的碼率選擇算法,由此碼率自適應(yīng)選擇算法成為研究熱點(diǎn),大量新方法不斷涌現(xiàn)。對(duì)HTTP動(dòng)態(tài)自適應(yīng)流技術(shù)背景和概念進(jìn)行了概述,從流媒體傳輸涉及的服務(wù)端和客戶端兩個(gè)決策實(shí)體出發(fā),對(duì)大量方法進(jìn)行了分類闡述,指出該領(lǐng)域存在的問題,對(duì)研究趨勢(shì)進(jìn)行了展望。
關(guān)鍵詞:HTTP;動(dòng)態(tài)自適應(yīng)流;碼率選擇;算法分類
DOI:10. 11907/rjdk. 182449
中圖分類號(hào):TP301
文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1672-7800(2019)005-0001-05
Abstract: The trend of video streaming, both in industry and academia, has significantly shifted towards HTTP adaptive streaming (HAS), because HTTP packets can travel across firewalls and Network Address Translators without any restrictions. And HAS has become ubiquitous and accounts for a large amount of video delivery over the Internet nowadays. But since the Internet is prone to bandwidth variations, HASs up and down switching between different video bitrates to keep up with bandwidth variations leads to a reduction in Quality of Experience (QoE). HAS solves these problems by applying an adaptation controller which selects the most appropriate video bitrate based on players conditions (e.g. buffer, screen resolution, etc.) and the underlying network conditions. Hence video bitrate selection is the key part to assure the QoE to users. A large number of adaption methods have been provided to support HAS. In this paper, we introduce the state-of-the-art of these methods and classify them into two parts of server-driven and client-driven and list some typical algorithms some researchers have proposed in each category. We hope our work can provide reference for related researchers to study further.
Key Words: HTTP; dynamic adaptive streaming; rate selection; algorithms classification
0 引言
隨著計(jì)算機(jī)網(wǎng)絡(luò)、移動(dòng)通信和電子、微電子技術(shù)的飛速發(fā)展,視頻業(yè)務(wù)產(chǎn)生的流量在整個(gè)互聯(lián)網(wǎng)流量中所占的比重越來越大,思科公司發(fā)布的報(bào)告[1]指出,到2021年,視頻業(yè)務(wù)流量將占據(jù)全球互聯(lián)網(wǎng)數(shù)據(jù)流量的82%。目前,互聯(lián)網(wǎng)視頻流量已經(jīng)占據(jù)互聯(lián)網(wǎng)數(shù)據(jù)流量的主導(dǎo)地位,并以10倍于其它應(yīng)用流量的速度增長(zhǎng)[2]。
HTTP動(dòng)態(tài)自適應(yīng)流技術(shù)(HAS)是一種流化和HTTP漸進(jìn)式下載混合的媒體內(nèi)容分發(fā)方法[3]。由于利用了現(xiàn)有的內(nèi)容分發(fā)網(wǎng)絡(luò)和互聯(lián)網(wǎng)基礎(chǔ)設(shè)施,具有部署方便、快捷、良好的防火墻穿透能力和NAT轉(zhuǎn)換功能,成為視頻分發(fā)業(yè)務(wù)的主流技術(shù)。主流的互聯(lián)網(wǎng)視頻服務(wù)提供商如Netflix、Youtube、Microsoft、Apple、Adobe、Hulu、Vudu、Amazon等均采用該項(xiàng)技術(shù)對(duì)外提供視頻服務(wù)。2012,運(yùn)動(dòng)圖像專家組(MPEG)與3GPP合作,發(fā)布了HTTP動(dòng)態(tài)自適應(yīng)流(MPEG-DASH)國際標(biāo)準(zhǔn)[4]。該標(biāo)準(zhǔn)定義了HTTP服務(wù)端的媒體表示描述(MPD)格式和視頻分片(Segment)格式。然而MPD傳輸策略和分片中包含的媒體編碼格式以及客戶端請(qǐng)求數(shù)據(jù)的方式、客戶端視頻碼率選擇算法等,都不在該協(xié)議的定義范圍內(nèi)。
為使流媒體系統(tǒng)完成流暢的視頻傳輸,同時(shí)達(dá)到更高的傳輸效率和更好的用戶體驗(yàn),不僅需要適當(dāng)?shù)牧髅襟w傳輸協(xié)議,還需要采用合理的碼率自適應(yīng)選擇機(jī)制。碼率自適應(yīng)選擇是近年研究的熱點(diǎn)之一,大量新方法不斷涌現(xiàn)。為了對(duì)該類方法進(jìn)行系統(tǒng)研究,筆者通過Google scholar、Springer、Elsevier以及CNKI等搜索了自2007年以來HAS相關(guān)文章,文獻(xiàn)[3-4]主要是HAS系統(tǒng)介紹,重點(diǎn)闡述DASH標(biāo)準(zhǔn),而目前國內(nèi)還未見專門針對(duì)HAS系統(tǒng)中碼率自適應(yīng)選擇方面的綜述文章。國外的相關(guān)綜述 [5]主要圍繞HAS系統(tǒng)中用戶體驗(yàn)質(zhì)量QoE影響因素進(jìn)行闡述,文獻(xiàn)[6]通過逆向工程,從代碼實(shí)現(xiàn)方面分析、比較了開源系統(tǒng)DASH-IF Player、DASH-Google Player、Bitmovin Player和商業(yè)流媒體系統(tǒng)Netflix Player中碼率自適應(yīng)算法。本文在綜合分析現(xiàn)有文獻(xiàn)及系統(tǒng)基礎(chǔ)上,根據(jù)碼率自適應(yīng)選擇策略實(shí)現(xiàn)主體不同,分別從客戶端驅(qū)動(dòng)和服務(wù)端驅(qū)動(dòng)兩個(gè)方面[7]闡述該領(lǐng)域當(dāng)前主流的算法,特別是針對(duì)2007年以來客戶端驅(qū)動(dòng)的碼率自適應(yīng)選擇方法進(jìn)行了較為系統(tǒng)、全面的研究和分類,對(duì)每類方法中的典型算法進(jìn)行了闡述,最后討論了DASH系統(tǒng)中存在的主要問題。
1 HAS技術(shù)
基于HTTP的動(dòng)態(tài)自適應(yīng)流技術(shù)(HAS)是一種流化和HTTP漸進(jìn)式下載(Progressive Downloaded)的混合分發(fā)方法[3]。在使用HTTP協(xié)議作為流傳輸標(biāo)準(zhǔn)基礎(chǔ)上,原始視頻被編碼為一系列比特率遞增的媒體副本,服務(wù)端或客戶端通過碼率切換技術(shù)[8]動(dòng)態(tài)調(diào)整碼率,選擇與網(wǎng)絡(luò)可用帶寬和終端設(shè)備播放能力相匹配的媒體副本分片進(jìn)行傳輸。這類技術(shù)屬于一種粗粒度自適應(yīng)方法,不同質(zhì)量的媒體副本需占用Web服務(wù)器額外的存儲(chǔ)空間。但由于該技術(shù)編碼為多種碼率的副本,因此在適應(yīng)帶寬變化時(shí)無需要再編碼,具有最小化的處理器代價(jià);同時(shí),該技術(shù)不依賴于所采用的編解碼器特定功能??,具有良好的編解碼器無關(guān)性[9]。
2 服務(wù)端驅(qū)動(dòng)的碼率自適應(yīng)選擇方法
服務(wù)端驅(qū)動(dòng)方法(Server-Driven)由負(fù)責(zé)媒體內(nèi)容分發(fā)的HTTP服務(wù)器作出碼率選擇決策,根據(jù)服務(wù)器端發(fā)送緩沖區(qū)大小[10]或客戶端反饋的播放緩沖區(qū)大小,測(cè)量服務(wù)器端與客戶端之間鏈路的網(wǎng)絡(luò)吞吐量及客戶端分辨率、處理能力等,由服務(wù)端選擇特定碼率媒體副本分片進(jìn)行發(fā)送[11]。
文獻(xiàn)[10]針對(duì)直播應(yīng)用,提出利用服務(wù)端緩沖區(qū)瞬時(shí)大小與預(yù)設(shè)閾值之差作為具有反饋回路的比例積分控制器,輸入質(zhì)量自適應(yīng)控制算法QAC,控制器的輸出為服務(wù)端發(fā)送緩沖區(qū)當(dāng)前容量。該方法通過不斷調(diào)整服務(wù)端的發(fā)送緩沖區(qū)大小確定需要向客戶端發(fā)送的媒體副本的碼率,進(jìn)而選擇相應(yīng)碼率的媒體副本分片進(jìn)行發(fā)送。圖2描述了基于QAC算法的流媒體服務(wù)器體系結(jié)構(gòu)。
服務(wù)端驅(qū)動(dòng)的碼率自適應(yīng)選擇方法是一種“瘦客戶端,胖服務(wù)端”的方法,該方法降低了客戶端軟件開發(fā)的復(fù)雜度,簡(jiǎn)化了客戶端軟件更新過程。然而,該類方法由于需要服務(wù)端單獨(dú)控制每個(gè)客戶端的發(fā)送緩沖區(qū)狀態(tài)信息,收集服務(wù)端與客戶端之間的網(wǎng)絡(luò)連接狀態(tài)信息等確定待發(fā)送的媒體副本碼率,增大了服務(wù)器的處理負(fù)載,導(dǎo)致系統(tǒng)可擴(kuò)展性較差。同時(shí),服務(wù)端驅(qū)動(dòng)的碼率自適應(yīng)方法需要修改Web服務(wù)器功能,需要得到網(wǎng)絡(luò)服務(wù)提供商的支持,增大了系統(tǒng)部署難度。因此,當(dāng)前主流的流媒體分發(fā)系統(tǒng)主要采用基于客戶端驅(qū)動(dòng)的碼率自適應(yīng)選擇方法。
3 客戶端驅(qū)動(dòng)的碼率自適應(yīng)選擇方法
基于客戶端驅(qū)動(dòng)的碼率自適應(yīng)選擇方法(Client-Driven)指由客戶端進(jìn)行碼率選擇決策的一類方法的總稱。在該類方法中,客戶端根據(jù)自身播放設(shè)備能力和網(wǎng)絡(luò)帶寬狀況實(shí)時(shí)調(diào)整請(qǐng)求的媒體質(zhì)量級(jí)別,向服務(wù)器發(fā)送HTTP請(qǐng)求,以下載不同質(zhì)量等級(jí)的文件分片。當(dāng)客戶端播放緩存達(dá)到初始播放閾值時(shí),客戶端開始邊播放邊下載后續(xù)視頻分片。這種允許客戶端根據(jù)播放緩沖區(qū)大小、客戶端與服務(wù)器之間鏈路的可用帶寬,以自身播放能力等作為依據(jù)動(dòng)態(tài)選擇視頻碼率的方法,不僅有效降低了播放過程中出現(xiàn)重緩沖的次數(shù),提升了播放的流暢性,實(shí)現(xiàn)了多媒體內(nèi)容的無縫傳送[3],而且有效降低了服務(wù)器端的處理負(fù)載,更加靈活地為動(dòng)態(tài)網(wǎng)絡(luò)環(huán)境下異構(gòu)設(shè)備用戶提供無間斷視頻流服務(wù)提供了技術(shù)保證,成為當(dāng)前互聯(lián)網(wǎng)視頻傳輸?shù)闹髁骷夹g(shù)。
客戶端驅(qū)動(dòng)的碼率自適應(yīng)選擇方法,一般分為基于吞吐量評(píng)估的方法[12-19]、基于緩沖區(qū)容量控制的方法[10,21-24]、基于吞吐量評(píng)估和緩沖區(qū)容量的混合控制方法[2,8,25,29,32-34]等。
3.1 基于吞吐量評(píng)估的方法
基于吞吐量評(píng)估的方法是一種最自然最直接的方法,在早期系統(tǒng)[12-13]中廣泛采用。基于吞吐量評(píng)估的方法又叫基于速率(rate-based)或基于可用帶寬估計(jì)方法,是客戶端使用已下載的視頻分片估計(jì)服務(wù)器與客戶端之間端到端網(wǎng)絡(luò)吞吐量,進(jìn)而確定下一視頻分片需選擇的碼率。該類方法主要包括端到端網(wǎng)絡(luò)可用帶寬估計(jì)和確定媒體分片碼率兩個(gè)重要組成部分。
端到端可用帶寬估計(jì)方法,通過利用已下載視頻分片的瞬時(shí)吞吐量或采用加權(quán)平均[14],如指數(shù)移動(dòng)加權(quán)平均(EWMA)、Support Vector Regression(SVR),Multi-Layer Perceptron(MLP)、Kaufman自適應(yīng)移動(dòng)平均(KAMA)、調(diào)和平均[15]等方法,將計(jì)算接收到的多個(gè)數(shù)據(jù)分片的平均吞吐量作為網(wǎng)絡(luò)可用帶寬的估計(jì)來表征網(wǎng)絡(luò)狀態(tài),并決定下一個(gè)選擇的數(shù)據(jù)分片比特率。文獻(xiàn)[15]采用調(diào)和平均的方法,使用過去下載的20個(gè)視頻分片的吞吐量預(yù)測(cè)鏈路的可用帶寬進(jìn)而確定視頻分片的碼率。文獻(xiàn)[16]使用已下載的最后一個(gè)視頻分片的瞬時(shí)吞吐量評(píng)估可用帶寬,由于網(wǎng)絡(luò)的短時(shí)抖動(dòng)特征,導(dǎo)致客戶端接收到的視頻質(zhì)量抖動(dòng)問題嚴(yán)重。文獻(xiàn)[17]提出使用媒體分塊時(shí)長(zhǎng)MSD與單個(gè)分塊獲取時(shí)間(SFT)的比值評(píng)估帶寬的變化,并與預(yù)設(shè)的閾值進(jìn)行比較實(shí)現(xiàn)階梯式向上/急速向下切換碼率的選擇算法。文獻(xiàn)[18]在文獻(xiàn)[17]串行分片碼率選擇基礎(chǔ)上,提出并行的分片碼率選擇算法,通過期望分塊獲取時(shí)間(ESFT)與測(cè)量的分塊獲取時(shí)間(MSD)的比值探測(cè)網(wǎng)絡(luò)擁塞和空閑網(wǎng)絡(luò)容量,實(shí)現(xiàn)從多個(gè)CDN代理服務(wù)器同時(shí)獲取不同數(shù)據(jù)分塊的目的,提升系統(tǒng)傳輸效率和媒體服務(wù)質(zhì)量。文獻(xiàn)[19]采用分片碼率和分片持續(xù)時(shí)長(zhǎng)的乘積與分片實(shí)際下載時(shí)長(zhǎng)的比值評(píng)估TCP的吞吐量大小,并將碼率選擇過程建模,提出探測(cè)—自適應(yīng)的PANDA碼率自適應(yīng)算法。通過不斷探測(cè)網(wǎng)絡(luò)吞吐量的變化,采用加性增長(zhǎng)/乘性降低的方式進(jìn)行估計(jì),并經(jīng)過平滑、量化和調(diào)度的過程實(shí)現(xiàn)自適應(yīng)媒體播放。
基于吞吐量評(píng)估的方法主要建立在帶寬估計(jì)基礎(chǔ)上[20]。帶寬評(píng)估準(zhǔn)確性是該類方法面臨的挑戰(zhàn)。而帶寬估計(jì)不準(zhǔn)確會(huì)導(dǎo)致客戶端選擇的速率出現(xiàn)螺旋式下降現(xiàn)象[21],以及用戶緩沖區(qū)下溢導(dǎo)致的緩沖播放中斷問題[17-18]。文獻(xiàn)[21]在分析緩沖區(qū)和視頻碼率相關(guān)關(guān)系基礎(chǔ)上,指出基于帶寬評(píng)估的碼率選擇算法會(huì)導(dǎo)致不必要的重緩沖事件和次優(yōu)的視頻質(zhì)量,而碼率自適應(yīng)選擇的目的是控制播放端緩沖大小,進(jìn)而避免不必要的重緩沖。因此碼率選擇可以完全不用評(píng)估客戶端的可用帶寬,只需要控制緩沖區(qū)占用情況即可。
3.2 基于緩沖區(qū)容量控制方法
為實(shí)現(xiàn)播放過程的平滑性,基于緩沖區(qū)反饋方法將客戶端的播放緩沖區(qū)劃分為幾個(gè)區(qū)域。根據(jù)播放緩沖區(qū)當(dāng)前所處區(qū)域的不同,采取相應(yīng)的控制策略以選擇視頻分片碼率。這類方法的目的是保持播放端緩沖區(qū)占有量在一個(gè)預(yù)先規(guī)定的水平,在降低播放端重緩沖率的同時(shí)提升視頻播放質(zhì)量和用戶體驗(yàn)質(zhì)量。
Akamai HD服務(wù)系統(tǒng)是最早采用客戶端驅(qū)動(dòng)方法的HTTP自適應(yīng)流分發(fā)系統(tǒng)之一[10]。文獻(xiàn)[10]在對(duì)Akamai HD服務(wù)系統(tǒng)性能測(cè)試的基礎(chǔ)上,分析了Akamai HD系統(tǒng)碼率自適應(yīng)方法,指出在Akamai HD系統(tǒng)中,客戶端存在兩類閉環(huán)控制系統(tǒng):基于緩沖區(qū)大小的比例控制器和基于啟發(fā)式算法的流切換邏輯控制器。文獻(xiàn)[22]提出一種基于緩沖區(qū)的碼率切換算法。該算法將緩沖區(qū)劃分為重置區(qū)域、下溢區(qū)域、均衡區(qū)域、上溢區(qū)域4個(gè)區(qū)域,利用滑動(dòng)窗分析窗內(nèi)分片的下載時(shí)間。根據(jù)當(dāng)前的緩存狀態(tài)和網(wǎng)絡(luò)帶寬情況采用不同的選擇策略:當(dāng)碼率上調(diào)時(shí)采用保守策略逐級(jí)增加,當(dāng)碼率下調(diào)時(shí)根據(jù)邏輯斯諦方程決定減少的幅度;如果視頻緩存低于重置閾值時(shí),采用激進(jìn)策略即立刻將碼率調(diào)整至最小質(zhì)量層碼率以保證播放流暢。文獻(xiàn)[26]針對(duì)車載環(huán)境下媒體傳輸,提出根據(jù)緩沖區(qū)占有情況設(shè)置不同帶寬系數(shù),系數(shù)隨著緩沖區(qū)占有量的增加而增加,下一個(gè)視頻分片的碼率由上一個(gè)分片碼率和緩沖區(qū)系數(shù)共同決定。
HTTP自適應(yīng)流技術(shù)需要在降低視頻中斷頻率和提升視頻播放質(zhì)量之間進(jìn)行折中。文獻(xiàn)[23]首次從理論上證明基于緩沖的方法在實(shí)踐中能取得播放流暢性和播放質(zhì)量最優(yōu)的性能。使用平均視頻比特率和播放平滑度作為兩個(gè)評(píng)價(jià)指標(biāo),建模碼率選擇問題為效用最大化問題,提出在線控制BOLA算法。該算法使用Lyapunov優(yōu)化技術(shù),在最小化重緩沖率的同時(shí)最大化優(yōu)化視頻質(zhì)量。文獻(xiàn)[24]提出使用預(yù)先計(jì)算的緩沖映射找到最高可用的視頻分片碼率進(jìn)行下載,避免播放中斷。基于緩沖的方法對(duì)于可用帶寬的變化反應(yīng)遲緩。單純基于緩沖反饋的方法需預(yù)先設(shè)定客戶端播放緩沖區(qū)大小的閾值,而如何確定緩沖區(qū)閾值又較為復(fù)雜。
3.3 混合控制方法
單純基于吞吐量評(píng)估的方法,由于網(wǎng)絡(luò)可用帶寬估計(jì)不準(zhǔn)確,導(dǎo)致頻繁播放停滯[25];而單純基于緩沖區(qū)容量控制的方法,不能根據(jù)帶寬的實(shí)時(shí)變化切換視頻碼率,存在切換滯后問題。同時(shí)基于緩沖區(qū)容量控制的方法中,緩沖區(qū)劃分的閾值很難確定?;旌峡刂频淖赃m應(yīng)方法能夠綜合考慮網(wǎng)絡(luò)帶寬、播放緩沖等多個(gè)參數(shù),及時(shí)、較為準(zhǔn)確地反映當(dāng)前網(wǎng)絡(luò)狀態(tài)和客戶端情況[26]。
文獻(xiàn)[25]在分析基于帶寬評(píng)估的SF算法[27]存在“毛刺”現(xiàn)象和基于緩沖區(qū)算法[26]造成碼率頻繁切換以及緩沖區(qū)閾值難以確定問題后,提出利用過去一組下載的視頻分片的網(wǎng)絡(luò)帶寬標(biāo)準(zhǔn)差計(jì)算SF算法中參數(shù)p的改進(jìn)SF算法。在緩沖區(qū)控制方面,提出加入兩個(gè)閾值qmin和qmax 的緩沖區(qū)控制策略并將二者結(jié)合起來,根據(jù)播放緩沖區(qū)容量處于不同閾值范圍采取不同的控制策略。
文獻(xiàn)[8]在分析文獻(xiàn)[9]PANDA算法和基于帶寬評(píng)估算法[32]的基礎(chǔ)上,提出混合控制算法CBB,通過改進(jìn)文獻(xiàn)[28]的網(wǎng)絡(luò)帶寬預(yù)測(cè)方法,采用“探測(cè)”+歷史視頻分片的方式計(jì)算網(wǎng)絡(luò)吞吐量。同時(shí),將緩沖狀態(tài)作為構(gòu)建平滑因子的關(guān)鍵參數(shù),利用緩沖狀態(tài)和網(wǎng)絡(luò)帶寬的關(guān)系確定調(diào)度時(shí)機(jī),使得緩沖區(qū)處于較為均衡狀態(tài),以在播放平滑性和播放質(zhì)量之間取折中。
文獻(xiàn)[29]指出,當(dāng)前碼率自適應(yīng)算法主要建立在碼率相同的分片及片長(zhǎng)相同的假設(shè)條件下進(jìn)行帶寬估計(jì),而實(shí)際系統(tǒng)由于編碼方式不同,碼率相同的視頻分片其分片長(zhǎng)度一般不同[30],因此,很難預(yù)測(cè)下載下一個(gè)視頻分片的時(shí)長(zhǎng)。為此,作者提出片長(zhǎng)感知的碼率選擇算法SARA。通過綜合考慮分片大小變化、評(píng)估的網(wǎng)絡(luò)路徑帶寬和當(dāng)前緩沖占有情況精確預(yù)測(cè)下一個(gè)分片下載的時(shí)長(zhǎng)。此方法緩沖區(qū)通過3個(gè)閾值劃分為4個(gè)區(qū)域,分別為快啟動(dòng)區(qū),使用最小視頻碼率;加性增長(zhǎng)區(qū),分片碼率增加一個(gè)級(jí)別;快速增長(zhǎng)區(qū),其分片碼率為小于評(píng)估的吞吐量的最大副本碼率;延遲下載區(qū),其分片在延遲一段時(shí)間后下載。
文獻(xiàn)[31]分析指出,當(dāng)前使用緩沖區(qū)控制進(jìn)行碼率選擇的大多數(shù)算法劃分緩沖區(qū)的閾值是固定的。固定數(shù)值在不同的服務(wù)器和客戶端設(shè)置中會(huì)影響算法性能。因此,作者提出根據(jù)分片時(shí)長(zhǎng)、緩沖區(qū)占有大小和可用視頻碼率動(dòng)態(tài)選擇緩沖區(qū)閾值,進(jìn)而確定視頻分片碼率,以確保下載高質(zhì)量視頻的同時(shí)避免播放中斷。
隨著控制理論、人工智能技術(shù)的發(fā)展,碼率選擇過程越來越智能。文獻(xiàn)[2,32]將模糊控制理論、文獻(xiàn)[33]將PID控制器應(yīng)用到碼率決策過程中;文獻(xiàn)[34]使用模型預(yù)測(cè)控制算法選擇碼率以達(dá)到最大的用戶體驗(yàn)質(zhì)量目標(biāo)。文獻(xiàn)[11]提出利用人工智能技術(shù)方案Pensieve,該方案借助增強(qiáng)學(xué)習(xí)方法,收集客戶端播放過程的各種數(shù)據(jù),由服務(wù)端訓(xùn)練一個(gè)神經(jīng)網(wǎng)絡(luò)模型并預(yù)測(cè)視頻分片碼率,以便在多種網(wǎng)絡(luò)狀況下選擇最佳數(shù)據(jù)傳輸比特率。但是該方法采用離線數(shù)據(jù)訓(xùn)練方式,速率選擇模型部署到系統(tǒng)中在單個(gè)周期內(nèi)不會(huì)改變,這種周期性數(shù)據(jù)更新方式難以適應(yīng)客戶端狀態(tài)極端變化的情況。為此,作者提出在客戶端以在線方式進(jìn)行模型訓(xùn)練的方法。
4 碼率選擇方法存在的問題及研究趨勢(shì)
4.1 碼率分配公平性、穩(wěn)定性和有效性問題
HTTP自適應(yīng)流技術(shù)的特點(diǎn)在于能根據(jù)服務(wù)端與客戶端帶寬的動(dòng)態(tài)性,自適應(yīng)調(diào)整服務(wù)端向客戶端發(fā)送媒體的速率。然而,單個(gè)流媒體客戶端獨(dú)立進(jìn)行速率選擇無法獲得全局帶寬使用狀態(tài),當(dāng)多流競(jìng)爭(zhēng)瓶頸帶寬時(shí),現(xiàn)有主流解決方案如微軟的Smoothing Streaming(SS)、Apple的HTTP Living Streaming(HLS)和Adobe的HTTP Dynamic Streaming(HDS)中采用的基于帶寬估計(jì)的方法,由于帶寬估計(jì)不準(zhǔn)確,測(cè)量的TCP吞吐量與網(wǎng)絡(luò)實(shí)際可用容量并不匹配。當(dāng)帶寬估計(jì)過高時(shí),選擇超過帶寬承受能力的速率會(huì)導(dǎo)致傳輸鏈路發(fā)生擁塞,播放端同時(shí)將請(qǐng)求比特率降低,導(dǎo)致速率變化,播放過程不穩(wěn)定;而當(dāng)帶寬估計(jì)過低時(shí),導(dǎo)致網(wǎng)絡(luò)帶寬利用率降低。因此,隨著視頻應(yīng)用的不斷增多,用戶規(guī)模不斷增大,互聯(lián)網(wǎng)上并發(fā)傳輸?shù)淖赃m應(yīng)視頻流數(shù)量激增,多個(gè)自適應(yīng)流播放器共享網(wǎng)絡(luò)瓶頸帶寬(用戶最后一英里的存在,CDN網(wǎng)絡(luò)邊緣服務(wù)器都有可能成為分發(fā)的瓶頸)的情況越來越普遍,如何解決多流帶寬分配的不公平、視頻抖動(dòng)以及帶寬利用率低的問題,成為HTTP自適應(yīng)流媒體技術(shù)大規(guī)模應(yīng)用推廣必須解決的一個(gè)關(guān)鍵且緊迫的問題。
4.2 多服務(wù)器環(huán)境下服務(wù)節(jié)點(diǎn)選擇與碼率決策問題
HTTP自適應(yīng)流媒體系統(tǒng)構(gòu)建在現(xiàn)有的互聯(lián)網(wǎng)基礎(chǔ)設(shè)施之上,充分利用內(nèi)容分發(fā)網(wǎng)絡(luò)(CDN)提供的緩沖、轉(zhuǎn)發(fā)策略協(xié)助Web視頻源服務(wù)器進(jìn)行視頻的分發(fā),加速媒體內(nèi)容的傳輸,降低骨干網(wǎng)流量。因此,動(dòng)態(tài)選擇離客戶端網(wǎng)絡(luò)距離最短且負(fù)載最輕的代理緩沖服務(wù)器,是播放端提升視頻質(zhì)量、降低骨干網(wǎng)流量的關(guān)鍵。然而,現(xiàn)有的HTTP自適應(yīng)流分發(fā)技術(shù)的研究工作主要建立在單服務(wù)器的假設(shè)條件下,屏蔽了CDN網(wǎng)絡(luò)內(nèi)部代理服務(wù)器的選擇問題。文獻(xiàn)[35]通過網(wǎng)絡(luò)主動(dòng)測(cè)量方式,對(duì)美國最大的視頻服務(wù)提供商N(yùn)etflix所使用的體系架構(gòu)和服務(wù)策略進(jìn)行研究,發(fā)現(xiàn)Netflix的客戶端總是從一個(gè)CDN的代理服務(wù)器處獲取數(shù)據(jù),而只有當(dāng)與該CDN代理服務(wù)器的連接無法滿足最低速率要求時(shí),才切換到其它等級(jí)的CDN服務(wù)器。同時(shí),Netflix中每個(gè)CDN代理服務(wù)器的等級(jí)與用戶賬號(hào)進(jìn)行綁定,長(zhǎng)期保持不變,即使用戶地理位置發(fā)生變化也不能激發(fā)CDN等級(jí)的改變。文獻(xiàn)[33]在研究單服務(wù)器下速率選擇策略基礎(chǔ)上,研究了多服務(wù)器環(huán)境下速率選擇問題,指出根據(jù)代理服務(wù)器負(fù)載變化、與用戶網(wǎng)絡(luò)距離動(dòng)態(tài)調(diào)整代理服務(wù)器的必要性。由于不同的CDN代理服務(wù)器的平均帶寬在不同地理位置是不同的,在不同的時(shí)間也不同,因此如何在給定的時(shí)間點(diǎn)選擇服務(wù)性能最好的單個(gè)CDN代理服務(wù)器下載視頻,成為提升HTTP自適應(yīng)流媒體分發(fā)系統(tǒng)服務(wù)質(zhì)量的一個(gè)關(guān)鍵問題。
以上研究主要集中在單服務(wù)器模式下客戶端碼率自適應(yīng)選擇方法研究上。然而,由于網(wǎng)絡(luò)的動(dòng)態(tài)性,單個(gè)服務(wù)節(jié)點(diǎn)失效或性能下降都會(huì)引起客戶端接收視頻質(zhì)量的下降。而分布式DASH系統(tǒng)較好地解決了單點(diǎn)失效或性能下降問題。在分布式DASH系統(tǒng)中,多個(gè)Web服務(wù)器存儲(chǔ)相同的視頻內(nèi)容,客戶端可從多個(gè)服務(wù)器中選擇一個(gè)或同時(shí)向多個(gè)服務(wù)器發(fā)送請(qǐng)求并下載視頻分片。相對(duì)于單服務(wù)器模式,多服務(wù)器模式能夠提供更高的帶寬、更好的鏈路多樣性和可靠性,逐步成為當(dāng)前媒體分發(fā)采用的一種主流方式并逐漸得到內(nèi)容分發(fā)網(wǎng)絡(luò)(CDN)的支持。然而,在這種多服務(wù)器模式下,由于服務(wù)器之間帶寬的異構(gòu)性以及鏈路的動(dòng)態(tài)性,如何從多個(gè)候選Web服務(wù)器中選擇性能優(yōu)良的服務(wù)器作為服務(wù)節(jié)點(diǎn)提供數(shù)據(jù)服務(wù),并根據(jù)網(wǎng)絡(luò)狀態(tài)的變化,及時(shí)、動(dòng)態(tài)調(diào)整數(shù)據(jù)請(qǐng)求的服務(wù)節(jié)點(diǎn),以及如何根據(jù)多個(gè)服務(wù)節(jié)點(diǎn)確定視頻分片碼率,以保證用戶觀看視頻體驗(yàn)質(zhì)量(QoE),是分布式DASH系統(tǒng)亟待解決的問題。
5 結(jié)語
HTTP自適應(yīng)流技術(shù)是互聯(lián)網(wǎng)視頻分發(fā)的主流技術(shù),而碼率選擇算法是該技術(shù)的核心。如何保證流媒體分發(fā)過程的用戶體驗(yàn)質(zhì)量(QoE)一直是研究的重點(diǎn)。本文從碼率決策實(shí)體出發(fā),分別闡述了服務(wù)端和客戶端驅(qū)動(dòng)的碼率選擇算法現(xiàn)狀,特別針對(duì)主流媒體服務(wù)商使用的客戶端驅(qū)動(dòng)算法進(jìn)行了細(xì)化,從帶寬評(píng)估、緩沖區(qū)容量控制等方面介紹了主流研究成果,同時(shí)指出了HAS系統(tǒng)中存在的問題,為進(jìn)一步深化該領(lǐng)域的研究工作提供參考。
參考文獻(xiàn):
[1] CISCO NETWORK. Cisco visual networking index: forecast and methodology[EB/OL]. https://www.cisco.com/c/en/us/solutions/collateral/service-provider/visual-networking-index-vni/complete-white-paper-c11-481360.pdf.
[2] SOBHANI A,YASSINE A,SHIRMOHAMMADI S. A video bitrate adaptation and prediction mechanism for HTTP adaptive streaming[J]. Acm Transactions on Multimedia Computing Communications & Applications,2017,13(2):18-23.
[3] 朱曉晨,沈蘇彬. 基于HTTP 的動(dòng)態(tài)自適應(yīng)流技術(shù)綜述[J]. 系統(tǒng)仿真學(xué)報(bào),2013,25(11):2522-2529.
[4] ISO/IEC. Information technology dynamic adaptive streaming over HTTP (dash) — part 1: media presentation description and segment formats[EB/OL]. http://standards.iso.org/ittf/PubliclyAvailableStandards/c057623_ISO_IEC_23009-1_2012.zip.
[5] SEUFERT M, EGGER S, SLANINA M, et al. A survey on quality of experience of http adaptive streaming[J]. ?IEEE Communications Surveys & Tutorials, 2015, 17(1):469-492.
[6] AYAD I, IM Y, KELLER E, et al. A practical evaluation of rate adaptation algorithms in HTTP-based adaptive streaming[J]. ?Computer Networks, 2018(133):90-103.
[7] AKHSHABI S,NARAYANASWAMY S,CBEGEN A,et al. An experimental evaluation of rate-adaptive video players over HTTP[J]. Image Communication,2012,27(4): 271-287.
[8] 熊麗榮,雷靜之,金鑫. 基于Q-learning的HTTP自適應(yīng)流碼率控制方法研究[J]. 通信學(xué)報(bào), 2017,38(9):18-24.
[9] LIU X,DOBRIAN F,MILNER H,et al. A case for a coordinated internet video control plane[C]. ?Proceedings of the ACM SIGCOMM Conference on Applications, Technologies,Architecture and Protocols for Computer Communication, 2012:359-370.
[10] LUCA DE CICCO,SAVERIO MASCOLO,VITTORIO PALMISANO. Feedback control for adaptive live video streaming[C]. ?Proceedings of the second annual ACM conference on Multimedia systems (MMSys '11),2011:145-156.
[11] MAO H,NETRAVALI R,ALIZADEH M. Neural adaptive video streaming with pensieve[C]. ?Conference of the ACM Special Interest Group on Data Communication, 2017:197-210.
[12] ZAMBELLI A. IIS smooth streaming technical overview. microsoft corporation[EB/OL]. http://download.microsoft.com/download/4/2/4/4247C3AA-7105-4764-A8F9-321CB6C765EB/IIS_Smooth_ Streaming_Technical_Overview.pdf.
[13] LIU C H, IMED BOUAZIZI, MONCEF GABBOUJ. Rate adaptation for adaptive HTTP streaming[C]. ?Proceedings of the second annual ACM conference on Multimedia systems (MMSys '11),2011:169-174.
[14] BOUTEN N,SCHMIDT R D O,F(xiàn)AMAEY J,et al. QoE-driven in-network optimization for adaptive video streaming based on packet sampling measurements[J]. ?Computer Networks, 2015(81):96-115.
[15] JIANG J,SEKAR V,ZHANG H. Improving fairness, efficiency, and stability in HTTP-based adaptive video streaming with festive[C]. IEEE CoNEXT, Nice,F(xiàn)rance,December 10-13,2012:97-108.
[16] ROMERO L R. A dynamic adaptive http streaming video service for Google Android[J]. Communication Systems Cos,2011(2):156-159.
[17] CHENGHAO LIU,IMED BOUAZIZI,MONCEF GABBOUJ. Rate adaptation for adaptive http streaming[C]. Proceedings of the Second Annual ACM Conference on Multimedia Systems (MMSys '11),2011:169-174.
[18] LIU C H,BOUAZIZI I,GABBOUJ M. Parallel adaptive http media streaming[C]. 2011 Proceedings of 20th International Conference on Computer Communications and Networks (ICCCN),2011:1-6.
[19] LI Z,ZHU X Q, JOSH GAHM,et al. Probe and adapt: rate adaptation for HTTP video streaming at scale[J]. IEEE Journal on Selected Areas in Communications,2014(6):33-39.
[20] GRAF M,MUELLER C. Towards bandwidth efficient adaptive streaming of omnidirectional video over HTTP: design, implementation, and evaluation[C]. ?ACM on Multimedia Systems Conference. ACM, 2017:261-271.
[21] TE Y H,JOHARI R,MCKEOWN N. Downton abbey without the hiccups: buffer-based rate adaptation for http video streaming[C]. ?Proceedings of the 2013 ACM SIGCOMM workshop on Future human-centric multimedia networking (FhMN '13),2013:9-14.
[22] 潘鵬程,李國平,王國中. 基于HTTP的流媒體自適應(yīng)碼率切換算法[J]. 電子測(cè)量技術(shù),2017, 40(9):141-145.
[23] SPITERI K,URGAONKAR R, SITARAMAN R K. BOLA: near-optimal bitrate adaptation for online videos[C]. ?IEEE International Conference on Computer Communications (INFOCOM 2016), IEEE, 2016:1-9.
[24] BEBEN A, BATALLA J M, KRAWIEC P. ABMA+: lightweight and efficient algorithm for HTTP adaptive streaming[C]. Klagenfurt:International Conference on Multimedia Systems,2016.
[25] 靳雁霞,馬光遠(yuǎn),雷海衛(wèi). 基于DASH的混合控制碼率算法[J]. ?計(jì)算機(jī)應(yīng)用,2017,37(10):2907-2911.
[26] MULLER C,LEDERER S,TIMMERER C. An evaluation of dynamic adaptive streaming over HTTP in vehicular environments[C]. Movid 2012:Proceedings of the 4th Workshop on Mobile Video,2012:37-42.
[27] THANG T C,HO Q D,KANG J W, et al. Adaptive streaming of audiovisual content using MPEG DASH[J]. ?IEEE Transactions on Consumer Electronics, 2012, 58(1):78-85.
[28] HESSE S. Design of scheduling and rate-adaptation algorithms for adaptive HTTP streaming[C]. SPIE Optical Engineering + Applications,2013.
[29] JULURI P,TAMARAPALLI V,MEDHI D. SARA: segment aware rate adaptation algorithm for dynamic adaptive streaming over HTTP[C]. ?London:Proceedings of IEEE International Conference on Communication Workshop,2015:1765-1770.
[30] HUANG T Y, JOHARI R, MCKEOWN N, et al. A buffer-based approach to rate adaptation: evidence from a large video streaming service[C]. ACM Conference on SIGCOMM. ACM, 2014:187-198.
[31] RAHMAN W U,CHUNG K. A novel adaptive logic for dynamic adaptive streaming over HTTP[J]. Journal of Visual Communication & Image Representation, 2017, 49(1):2214-2220.
[32] VERGADOS D J,MICHALAS A,SGORA A,et al. FDASH: a fuzzy-based MPEG/DASH adaptation algorithm[J]. IEEE Systems Journal, 2016, 10(2):859-868.
[33] TIAN G B, LIU Y. Towards agile and smooth video adaptation in dynamic HTTP streaming[C]. ?Proceedings of the 8th international conference on Emerging networking experiments and technologies (CoNEXT '12), 2012:109-120.
[34] YIN X, JINDAL A, SEKAR V, et al. A control-theoretic approach for dynamic adaptive video streaming over HTTP[C]. ACM Conference on Special Interest Group on Data Communication. ACM, 2015:325-338.
[35] ADHIKARI V K,GUO Y,HAO F,et al. Unreeling netflix: understanding and improving multi-CDN movie delivery[C]. Proceedings of the IEEE INFOCOM,2012:1620-1628.
(責(zé)任編輯:杜能鋼)