姚 良,奚 溪
(中國電信股份有限公司上海研究院 上海 200122)
隨著國務(wù)院正式?jīng)Q定加快推進電信網(wǎng)、有線電視網(wǎng)和互聯(lián)網(wǎng)的三網(wǎng)融合,作為三網(wǎng)融合的重要切入點,電信運營商必將大力發(fā)展IPTV、手機影視等視頻業(yè)務(wù),最終將實現(xiàn)以IP網(wǎng)絡(luò)為統(tǒng)一承載的,語音、數(shù)據(jù)和視頻三重業(yè)務(wù)的捆綁。
目前,電信傳統(tǒng)的語音、數(shù)據(jù)業(yè)務(wù)都有一套完整的質(zhì)量指標(biāo)評估體系,而IPTV等視頻業(yè)務(wù)還缺乏有效的評估手段,因此,當(dāng)前在視頻業(yè)務(wù)運營過程中很難評估用戶對業(yè)務(wù)質(zhì)量的體驗,很難快速判斷故障點。
IP承載網(wǎng)是一個“盡力而為”的網(wǎng)絡(luò),而視頻業(yè)務(wù)是一個需要高帶寬、低傳輸時延和低時延抖動的業(yè)務(wù),任何一個環(huán)節(jié)出現(xiàn)問題都可能導(dǎo)致用戶觀看視頻時出現(xiàn)馬賽克、停頓等現(xiàn)象,甚至無法觀看,因此,視頻業(yè)務(wù)的質(zhì)量評估更具迫切性。
視頻業(yè)務(wù)質(zhì)量評估指標(biāo)體系是構(gòu)建評估手段的重要前提,用以保障業(yè)務(wù)的服務(wù)質(zhì)量,提升用戶的使用體驗。本文在研究國內(nèi)外視頻業(yè)務(wù)質(zhì)量評估方式及方法的基礎(chǔ)上,提出一種基于IP網(wǎng)絡(luò)傳輸?shù)囊曨l業(yè)務(wù)質(zhì)量評估指標(biāo)和監(jiān)測方法。
視頻質(zhì)量的評價方法可以分為主觀視頻質(zhì)量評估和客觀視頻質(zhì)量評估兩種。雖然主觀視頻質(zhì)量評估可以很好地符合客戶對視頻業(yè)務(wù)的主觀感知和體驗,但其存在復(fù)雜、費時、結(jié)果因人而異、無法實現(xiàn)實時的視頻質(zhì)量評估等問題,而客觀視頻質(zhì)量指標(biāo)客觀、可重復(fù)性強、容易實現(xiàn)自動方便的監(jiān)控,并且適合各種應(yīng)用。
主觀視頻質(zhì)量評估方法將用戶體驗以數(shù)據(jù)的方式展現(xiàn)出來。ITU-R BT.500-1制定了主觀測量Video MOS的方法,即將原始圖像及被測圖像交替顯示,讓足夠多的觀察者進行觀察對比,對被測圖像打分[1],然后計算平均值,見表1。
較主觀質(zhì)量評估而言,客觀質(zhì)量評估不需要人參與其中,采用算法自動實現(xiàn),可實現(xiàn)性更強,不易受到外部條件與人為因素影響。根據(jù)由ITU-T和ITU-R聯(lián)合成立的視頻質(zhì)量專家組VQEG(video quality evaluation group)[2,3]的 講義,將視頻客觀質(zhì)量評估主要分為3大類:一是全參考算法FR(full reference),使用原始的視頻參考比較,可以得到每個像素的退化量,F(xiàn)R有很高的精度,并且可重現(xiàn),但是受處理過程影響較大,在測試點可以獲得無損傷的視頻信號時,可以使用全參考(FR)算法,典型的指標(biāo)包括J.144、PSNR、MSE、PEVQ等;二是半?yún)⒖妓惴≧R(reduced reference),半?yún)⒖疾⒉皇褂萌康脑家曨l,而是在發(fā)送端產(chǎn)生一些用于接收端評估視頻質(zhì)量的參數(shù),RR測試產(chǎn)生的結(jié)果精度可能會比FR低,是一種在參考信號傳輸帶寬較小時的折衷方法;三是無參考算法NR(no reference)不使用原始的視頻信號,NR算法是低精度的評估方法,因為原始的視頻信號是完全未知的,通常的NR算法甚至不會分析像素級的視頻畫面,而只是分析IP包級的字節(jié)流,這種測試局限于傳輸流分析。
表1 MOS 5分制評測標(biāo)準(zhǔn)
VQEG專家組已經(jīng)完成對10多家不同機構(gòu)提供的客觀質(zhì)量評價FR模型的測試評估[4],并且不斷完善測試方案和計劃,目前將重點關(guān)注RR和NR的評價模型。國內(nèi)的北京大學(xué)、天津大學(xué)等已經(jīng)從事該領(lǐng)域的研究,但是目前視頻質(zhì)量評價方法并不成熟,始終無法提供一個很完善的客觀視頻評價模型可以完全取代主觀視頻質(zhì)量評價。根據(jù)目前的發(fā)展現(xiàn)狀來看,基于HVS的視覺模型質(zhì)量評估已經(jīng)達(dá)到瓶頸階段,視頻質(zhì)量評估突破點可能是通過對不同的視頻應(yīng)用環(huán)境進行更為細(xì)化的分析,解析出應(yīng)用環(huán)境與主觀評價的關(guān)聯(lián)關(guān)系作為建立客觀評價模型的評估指標(biāo),從而解決客觀評價使用范圍較窄的問題。
考慮到目前大多數(shù)視頻應(yīng)用,端到端的視頻質(zhì)量是衡量系統(tǒng)性能優(yōu)劣的關(guān)鍵指標(biāo),視頻服務(wù)系統(tǒng)必須能及時把握并量化視頻質(zhì)量下降的情況,通過必要的手段進行維護和增強。因此,找到一種有效的評價方法度量視頻質(zhì)量至關(guān)重要。本文根據(jù)三網(wǎng)融合中電信視頻業(yè)務(wù)的實際情況,將視頻的網(wǎng)絡(luò)承載環(huán)境對視頻質(zhì)量的影響和視頻質(zhì)量的客觀評估指標(biāo)相結(jié)合,提出了基于QoE概念的視頻客觀評估模型。
用戶對業(yè)務(wù)質(zhì)量的主觀評估即為QoE(quality of experience)[5],QoE是通信領(lǐng)域的新概念,可理解為用戶體驗或用戶感知,視頻QoE客觀評估是一個非常復(fù)雜的課題,雖然有許多研究機構(gòu)和組織向ITU提交了關(guān)于客觀視頻QoE的評估建議,但I(xiàn)TU目前還沒有定義出統(tǒng)一的關(guān)于客觀視頻QoE評估的國際標(biāo)準(zhǔn)。
客觀評估QoE通常通過一組KQI/KPI進行映射,QoE、QoS和KQI/KPI出自不同的電信組織,面向不同的層面(網(wǎng)絡(luò)、業(yè)務(wù)、用戶),表示不同的概念范疇,見表2。
視頻客觀QoE模型的建立,也即建立QoE與KQI/KPI的關(guān)系。用戶對視頻質(zhì)量的體驗大體上可分為兩類,即可靠性(reliability)和舒適性(comfort):可靠性又可分為業(yè)務(wù)可接入性和業(yè)務(wù)完整性;舒適性又可分為業(yè)務(wù)即時性和業(yè)務(wù)會話質(zhì)量。視頻業(yè)務(wù)QoE與KQI/KPI的映射梳理如圖1所示。
其中,業(yè)務(wù)可靠性取決于網(wǎng)絡(luò)、平臺的可用性、異常掉線率;業(yè)務(wù)請求時延取決于網(wǎng)絡(luò)時延、平臺的響應(yīng)時延和終端緩存的時延;視頻播放的清晰度取決于編碼器、編碼速率、分辨率和幀率;視頻的損傷度取決于網(wǎng)絡(luò)傳輸特性、流媒體的傳輸方式。
表2 質(zhì)量指標(biāo)分類
圖1 視頻QoE與KQI/KPI的映射
業(yè)務(wù)的可用性、完整性和請求時延都相對容易評估,而視頻播放質(zhì)量的評估是難點。目前業(yè)界對視頻播放質(zhì)量的客觀評估可分為基于Payload、基于編碼格式依賴、基于媒體流傳輸和基于IP傳輸?shù)?類。多個視頻質(zhì)量評估方法相互聯(lián)系而又互有側(cè)重,構(gòu)成了一個視頻質(zhì)量評估指標(biāo)群,指標(biāo)間的關(guān)系如圖2所示。
· 基于Payload的指標(biāo)
J.144(全參考圖像下數(shù)字有線電視客觀感知視頻質(zhì)量的測量技術(shù))是一種全參考的有線電視質(zhì)量測試方法,有一系列的客觀評價指標(biāo),如位錯誤、丟包等損傷,可以用來評估編碼質(zhì)量(編碼、解碼的質(zhì)量)以及各種壓縮手段與存儲設(shè)備之間的聯(lián)系。
PEVQ(perceptual evaluation of video quality)由 ITU-T發(fā)布在J.247標(biāo)準(zhǔn)中,基于模擬人的視覺模型有一個綜合的質(zhì)量評分,涵蓋了一系列量化視頻信號的KPI,包括PSNR(peak signal-to-noise ratio),失真因子和音、視頻同步時延等。PEVQ的輸出指標(biāo)有兩大類,即視頻內(nèi)容本身的質(zhì)量和網(wǎng)絡(luò)傳輸對質(zhì)量的影響。
· 基于編碼依賴的指標(biāo)
MOS-V(mean opinion score for video)是ITU FOCUS GROUP on IPTV推薦的重要指標(biāo),是基于VSPQ(video service picture quality)因子的視頻質(zhì)量指標(biāo),VSPQ因子是將視頻根據(jù)編碼類型、編碼速率經(jīng)過復(fù)雜的理論計算得到初始值,該視頻經(jīng)過網(wǎng)絡(luò)傳輸造成損傷后得到最終的VSPQ值,因此,MOS-V指標(biāo)評定時綜合考慮了丟包率、抖動、編碼類型等多種因素。
·基于流媒體傳輸?shù)闹笜?biāo)
基于流媒體傳輸?shù)闹笜?biāo)不關(guān)注視頻編碼細(xì)節(jié),只依賴于網(wǎng)絡(luò)傳輸性能和媒體的封包質(zhì)量。目前主要有針對IP視頻流的IETF RFC4445 的MDI(media delivery index)標(biāo)準(zhǔn)[6]、針對MPEG TS流的TR101-290標(biāo)準(zhǔn)和針對MPEG PES的指標(biāo)。
MDI標(biāo)準(zhǔn)由美國IneoQuest公司提出,已被IETF正式采用,是IP流媒體評估的主要標(biāo)準(zhǔn),適合于大規(guī)模的網(wǎng)絡(luò)監(jiān)控。MDI對 IP視頻流的傳輸質(zhì)量標(biāo)識為DF、MLR:DF值表明被測試視頻流的時延和抖動狀況;MLR數(shù)值表明被測試視頻流的丟包狀況。
圖2 視頻播放質(zhì)量評估指標(biāo)
TR101-290是廣泛使用的視頻傳輸質(zhì)量指標(biāo)[7],主要針對MPEG-2 TS傳輸?shù)馁|(zhì)量制定了三級告警,每層告警針對不同程度的視頻傳輸問題:等級1中定義了會對視頻業(yè)務(wù)造成嚴(yán)重影響的事件,例如TS流同步丟失、同步字節(jié)錯誤、PAT/PMT表格錯誤等;等級2中定義了會對一部分視頻業(yè)務(wù)造成影響的事件,例如PCR時鐘偏離、CAT表格錯誤等;等級3中所定義的事件沒有前兩個等級嚴(yán)重,可能會對一些特定的業(yè)務(wù)或應(yīng)用造成影響。
· 基于網(wǎng)絡(luò)的指標(biāo)
IP層指標(biāo)包括網(wǎng)絡(luò)的帶寬、傳輸速率、丟包率和丟包模式的模型,網(wǎng)絡(luò)抖動、視頻業(yè)務(wù)往往對于網(wǎng)絡(luò)丟包和抖動特別敏感。IP層指標(biāo)的變化會引起上層指標(biāo)的變化,導(dǎo)致視頻業(yè)務(wù)受到影響。
其中,網(wǎng)絡(luò)丟包模型基于RFC3357標(biāo)準(zhǔn)[8],在該標(biāo)準(zhǔn)中定義了丟包距離和丟包周期兩個參數(shù),通過對網(wǎng)絡(luò)上丟包的學(xué)習(xí)統(tǒng)計得到現(xiàn)網(wǎng)上的丟包模型。因為即使在相同的丟包率的情況下,不同的丟包模型對于IP網(wǎng)絡(luò)上承載的業(yè)務(wù)也會有不同的影響。
以電信開展的IPTV業(yè)務(wù)為例,IPTV業(yè)務(wù)的特點是視頻內(nèi)容來自于廣電,質(zhì)量較高且穩(wěn)定,視頻編碼方式固定,并采用固定碼率。因此,根據(jù)圖1所示,視頻的清晰度已是個常量被固化了,視頻播放質(zhì)量的關(guān)注重點應(yīng)該是視頻的損傷度。所以,在視頻質(zhì)量評估和監(jiān)測方面,可以將關(guān)注的重點放在視頻流的傳輸質(zhì)量上。將視頻流傳輸?shù)腗PEG TS TR101-290、MPEG PES 中 I、B、P 丟幀指標(biāo)和 MDI指標(biāo)作為IPTV視頻播放質(zhì)量的特征指標(biāo)。在IPTV實時的監(jiān)測中重點把握,在視頻流的輸出端監(jiān)測TR101-290和MDI等指標(biāo),在網(wǎng)絡(luò)傳輸?shù)闹饕h(huán)節(jié)主要監(jiān)測視頻流的MDI指標(biāo)。
視頻業(yè)務(wù)的KPI指標(biāo),如業(yè)務(wù)可用性、完整性和請求時延都為業(yè)務(wù)端到端的評估指標(biāo),根據(jù)電信級業(yè)務(wù)的要求,一般要求業(yè)務(wù)可用性(接入成功率)≥99%,業(yè)務(wù)的完整性(異常中斷率)≤1%,業(yè)務(wù)請求時延(頻道切換時延)≤2 s。
視頻播放質(zhì)量指標(biāo)一般重點采用RFC 4445 MDI指標(biāo)進行評估,兼顧ETSI TR101-290 MPEG-TS分析和MPEG-PES I、P、B幀丟失分析,該類指標(biāo)不僅是業(yè)務(wù)端到端的指標(biāo),并且還需關(guān)注視頻流傳輸路徑關(guān)鍵節(jié)點的質(zhì)量變化,其指標(biāo)值的確定可參照誤碼秒的概念,實驗驗證,IPTV每丟棄一個視頻報文就會形成一個馬賽克或停頓。以MDI指標(biāo)為例,MDI每1 s監(jiān)測一次DF和MLR值,為保障IPTV業(yè)務(wù)的質(zhì)量,通常要求MLR=0,DF<100 ms。當(dāng)DF和MLR值超過閾值時,認(rèn)為該秒為錯誤秒,簡化視頻播放質(zhì)量的評估可用以下公式。
視頻播放錯誤率=錯誤秒/播放的秒數(shù)×100%,錯誤率不應(yīng)超過0.1%。
業(yè)務(wù)端到端的監(jiān)測可采用機頂盒內(nèi)置質(zhì)量監(jiān)測模塊,目前電信IPTV機頂盒都已支持相關(guān)QoS KPI指標(biāo)的監(jiān)測;關(guān)鍵路徑的監(jiān)測可采用專用儀表,當(dāng)前MDI儀表和TR101-290儀表已經(jīng)非常成熟。
表3 視頻播放質(zhì)量評估指標(biāo)對比
1 李永強,沈慶國,朱江.數(shù)字視屏質(zhì)量評價方法綜述.電視技術(shù),2006,(6)
2 VQEG final report from the video quality experts group on the validation of objective models of video quality assessment,2006
3 VQEG final report from VQEG on the validation of objective models of video quality assessment,2005
4 李彥麗,金東瀚,焦秉立.幾種典型的感知視頻質(zhì)量評價模型.計算機工程與應(yīng)用,2002(13)
5 ITU-T P.10/G.100.Vocabulary for performance and quality of service,2006
6 RFC 4445.A proposed media delivery index(MDI),2006
7 ETSI TR101290 V1.2.1.Digital video broadcasting(DVB);Measurement guidelines for DVB systems,2001
8 RFC 3357.One-way loss pattern sample metrics,2002
9 羅斯青,肖晴,胡源.面向IPTV的H.264高清編碼視頻質(zhì)量評估.電信科學(xué),2008,24(5)
10 姚良.影響IPTV業(yè)務(wù)質(zhì)量的關(guān)鍵因素及質(zhì)量提升措施探討.電信科學(xué),2009,25(3)
11 魏耀都,謝湘,匡鏡明等.移動視頻質(zhì)量評價方法及發(fā)展趨勢.電信科學(xué),2010,26(3)