蔡家常
【摘要】在計算機網(wǎng)絡(luò)中,兩個可實現(xiàn)信息互通的實體要想達到動作的協(xié)同性以及同步性,需要依據(jù)既定的流程來交換信息,這就是我們所說的網(wǎng)絡(luò)傳輸協(xié)議,也可簡稱為傳送協(xié)議。常見的網(wǎng)絡(luò)直播傳輸協(xié)議有很多種,比如RTMP協(xié)議、Web RTC、HLS等。本文選定SRT傳輸協(xié)議作為研究視角,通過對比多種傳輸協(xié)議之間的優(yōu)點和缺點,分析了未來網(wǎng)絡(luò)直播傳輸協(xié)議的發(fā)展方向,并從SRT協(xié)議的原理、SRT協(xié)議的實際應(yīng)用場景入手,剖析了SRT傳輸協(xié)議在廣電行業(yè)中推廣和應(yīng)用的前景以及存在的問題。
【關(guān)鍵詞】網(wǎng)絡(luò)直播傳輸協(xié)議;SRT;廣電行業(yè)
中圖分類號:G212? ? ? ? ? ? ? ? ? ? ? 文獻標識碼:A? ? ? ? ? ? ? ? ? ? ? DOI:10.12246/j.issn.1673-0348.2023.09.066
1. 行業(yè)背景
伴隨著移動技術(shù)的發(fā)展不斷提速,網(wǎng)絡(luò)直播憑借著便捷化、高速化、娛樂化以及互動化等優(yōu)勢,在大眾生活中贏得了一席之地,并且深受廣大消費者的喜愛和青睞,多元化的直播平臺讓人目不暇接,而廣電行業(yè)也緊跟時代的步伐,將網(wǎng)絡(luò)直播作為其發(fā)展的重要一環(huán),在新聞事件播報、視頻會議、電商帶貨、重要晚會與活動中廣泛應(yīng)用了網(wǎng)絡(luò)直播,成為開展媒體服務(wù)最重要的技術(shù)手段和渠道之一,并以此來推動行業(yè)自身的轉(zhuǎn)型升級,促進媒體的深度融合。
傳輸協(xié)議作為網(wǎng)絡(luò)視頻直播技術(shù)系統(tǒng)最基礎(chǔ)的一部分,不僅要適用于電視的播放要求,還需要適用移動終端的使用場景。推流、分發(fā)等環(huán)節(jié)使用不同的傳輸協(xié)議以及參數(shù)設(shè)置的不同,對直播鏈路的影響都非常大。在不同的網(wǎng)絡(luò)環(huán)境和應(yīng)用場景中選擇正確的協(xié)議類型和參數(shù)配置,才能獲得穩(wěn)定的預(yù)期傳輸質(zhì)量和播放效果。
2. 常見的網(wǎng)絡(luò)直播傳輸協(xié)議
目前在網(wǎng)絡(luò)直播中經(jīng)常用到的傳輸協(xié)議有以下幾種:
2.1 RTMP協(xié)議
作為網(wǎng)絡(luò)視頻直播系統(tǒng)、手機直播源碼中最常用的實時傳輸協(xié)議,RTMP是一種設(shè)計用來進行實時數(shù)據(jù)通信的網(wǎng)絡(luò)協(xié)議,主要用于flash/air平臺和支持RTMP協(xié)議的流媒體、交互服務(wù)器之間進行音視頻和數(shù)據(jù)的通信。目前絕大多數(shù)在移動端使用的推流協(xié)議都是RTMP協(xié)議。
RTMP協(xié)議的優(yōu)勢在于支持CDN服務(wù),應(yīng)用于大部分主流CDN廠商。協(xié)議相對簡單,普及程度高,大部分的設(shè)備和推流軟件都有支持,容易在不同系統(tǒng)環(huán)境和平臺上實現(xiàn)。
劣勢在于RTMP協(xié)議的傳輸成本太高,弱網(wǎng)絡(luò)環(huán)境下丟包率會明顯增加,不支持瀏覽器的推送,也就是說,想要通過移動端觀看直播的朋友必須要下載相應(yīng)的軟件。
2.2 web RTC協(xié)議
Web RTC協(xié)議是專門適用于網(wǎng)頁的即時通信工具,網(wǎng)絡(luò)視頻直播系統(tǒng)在PC端的播放就需要用到此協(xié)議,它支持網(wǎng)頁瀏覽器進行實時語音對話或者視頻對話的API。
優(yōu)勢在于,支持主流的瀏覽器,與瀏覽器的契合程度高,同時又能在弱網(wǎng)絡(luò)環(huán)境下有不錯的表現(xiàn),能夠?qū)崿F(xiàn)點對點通信,通信時雙方產(chǎn)生的延遲較低,對有互動環(huán)節(jié)的視頻直播和網(wǎng)絡(luò)視頻會議等實時性要求較高的場景來說這一點非常適合。劣勢也很明顯,即對CDN服務(wù)的支持性差。
2.3 HLS(HTTP Live Streaming)協(xié)議
HLS協(xié)議是由蘋果公司推出的基于HTTP的流媒體網(wǎng)絡(luò)傳輸協(xié)議。延遲較高,一般10~30s。它的工作原理是當采集推流端將視頻流推送到流媒體服務(wù)器時,服務(wù)器將收到的流信息每緩存一段時間就封包成一個新的ts文件,同時服務(wù)器會建立一個m3u8的索引文件來維護最新幾個ts片段的索引。拉流端通過m3u8索引文件獲知需要的ts視頻文件片段,通過HTTP協(xié)議請求這些片段。因為通常一個ts片段為5~10s,在服務(wù)端要“攢夠”足夠長的數(shù)據(jù)才能下發(fā)給拉流端,所以延遲較長。
由于延遲較高,但對CDN支持較好,HLS協(xié)議比較適合做實時性要求不高的直播,特別適合用于回放點播。
2.4 推流協(xié)議的選擇
毫無疑問,目前現(xiàn)存量最大的直播協(xié)議是RTMP,但隨著新技術(shù)的不斷發(fā)展與使用場景的不斷拓展,繼續(xù)使用RTMP會令人感到有些力不從心。RTMP協(xié)議的缺陷主要有以下四個方面:
首先,RTMP協(xié)議太老,且最后一次更新是在2012年,HEVC/H.265/AV1等視頻編碼格式都沒有官方定義,以至于需要國內(nèi)CDN廠商自行定義。其次,RTMP連接過程較長,由于RTMP基于TCP(TCP存在三次握手),而其本身又存在c0/s0到c2/s2的三次握手,再加上connection,createstream,play/publish,總的來說RTMP完成一次建連需要進行9次會話,協(xié)議本身的開銷和效率都不理想。再次,RTMP的擁塞控制完全依賴傳輸層,幾乎沒有什么優(yōu)化。最后,RTMP本身基于TCP傳輸,無法提供帶寬自適應(yīng)的算法。在此背景下,眾多廠商開始著手提供一些基于UDP的新直播協(xié)議供行業(yè)參考,如QUIC、SRT等,尤其是目前在推流領(lǐng)域中具有廣泛應(yīng)用的SRT協(xié)議。下面將對RTMP以及SRT做優(yōu)缺點對比:
從表1可知,SRT連接速度快、可靠性高、延遲低的同時又能支持抗丟包,從這幾項參數(shù)來看,優(yōu)勢不言而喻。
另外,對于傳輸協(xié)議是否支持HEVC編碼也可以納入考慮的因素。在廣電行業(yè)高清和4K環(huán)境下,對傳輸圖像質(zhì)量的要求更高,由于HEVC在壓縮效率方面的優(yōu)勢,用它編碼的視頻流占用的存儲空間、帶寬消耗也更小。由于能使用支持更優(yōu)壓縮算法的HEVC編碼格式視頻流,SRT協(xié)議在傳輸高分辨率尤其是4K超高清圖像數(shù)據(jù)時,在畫質(zhì)相同的情況下使用HEVC編碼能夠比RTMP協(xié)議節(jié)省約50%左右的帶寬。
2.5 造成協(xié)議延時的原因和對直播的影響
延遲是指某一特定視頻幀被設(shè)備(攝像機、播放機、編碼器等)捕獲的時間與該幀在終端用戶顯示器上播放的時間之間的時間差。這個延時大小在不同行業(yè)存在著很大差異,對于廣播電視一般為5~10秒左右,流媒體延時可以有30秒或以上,而實時視頻制作或交互性更強的直播推流(例如比賽和體育博彩)而言,延時往往需要低于1秒。對于廣播電視行業(yè)而言,在不同直播場景下的延時要求也是不同的,延時要求較高的場景包括:體育賽事直播、有互動交流環(huán)節(jié)的電商直播帶貨、網(wǎng)絡(luò)視頻會議等;延時要求不敏感的直播場景包括大型晚會直播、政府發(fā)布會、影視節(jié)目放送、無互動環(huán)節(jié)的講座、直播課堂等。
表2對幾種常見的傳輸協(xié)議的延遲做了對比。
各傳輸協(xié)議存在延遲差異的原因如下:
首先,傳輸方式不同,RTMP、HLS基于TCP傳輸?shù)?,而SRT、Web RTC則是基于UDP傳輸?shù)??;赥CP傳輸?shù)膮f(xié)議有一個自動重傳機制,假如數(shù)據(jù)包丟失了,就會將丟失的數(shù)據(jù)包重新傳,在自動重傳的過程中,直播不會一直進行,而是在等待丟失的數(shù)據(jù)到達后再繼續(xù)播放,延遲也就變長了。而UDP沒有TCP那套復(fù)雜的、高可靠性要求的傳輸控制機制,延時較低。同時也具備一定的數(shù)據(jù)丟包恢復(fù)能力,比如SRT,它運用前向糾正技術(shù)(FEC),將網(wǎng)絡(luò)丟包的可能性降到最低,確保了SRT傳輸?shù)姆€(wěn)定性。
其次,數(shù)據(jù)包處理方式不同。在傳輸數(shù)據(jù)包時需要大量“握手”和錯誤檢查協(xié)議,通常會產(chǎn)生更高的延時,UDP本身沒有連接的概念,所以不需要三次握手,并且UDP的傳輸是不管順序,也不管丟包的,延時自然就更低。
再次,傳輸參數(shù)的設(shè)置會對延時產(chǎn)生較大的影響,最直接的就是緩沖區(qū)大小的設(shè)置。更大的緩沖區(qū)意味著更強的丟包控制修復(fù)能力,傳輸質(zhì)量會更穩(wěn)定,但是會大幅提升延時量,減小緩沖區(qū)則相反。因此,應(yīng)該根據(jù)傳輸質(zhì)量要求、實時性要求和網(wǎng)絡(luò)鏈路質(zhì)量情況來審慎選擇合適的緩沖區(qū)。
最后,還有其他影響因素,比如擁塞控制,多路復(fù)用等都會對傳輸協(xié)議的延遲差異造成影響。由此造成了不同協(xié)議和應(yīng)用場景間延遲特性的差異。
3. SRT傳輸協(xié)議的相關(guān)概念和具體應(yīng)用
3.1 SRT 傳輸協(xié)議原理概述
SRT傳輸協(xié)議指的是安全可靠傳輸協(xié)議,是Haivision聯(lián)手Wowza在UDT的基礎(chǔ)上的針對音視頻實時性提出的傳輸協(xié)議,于2017年成為開源技術(shù)。依賴于其低延遲、可靠和安全等優(yōu)勢,目前已在眾多的視頻傳輸設(shè)備和軟件中得到支持。SRT基于UDT的協(xié)議(UDT協(xié)議是基于UDP的傳輸協(xié)議,在IETF已經(jīng)提交了4個版本),具有非常良好的丟包重傳機制。音視頻流對于時間順序這一點非常在意,而SRT基于時間的報文發(fā)送,使其具有良好的防止流量突發(fā)的能力。SRT對上層提供了豐富的擁塞控制統(tǒng)計信息,包括RTT、丟包率、inflight、send/receive bitrate等。利用這些豐富的信息,我們可以實現(xiàn)帶寬預(yù)測,并根據(jù)帶寬的變化在編碼層做自適應(yīng)動態(tài)編碼與擁塞控制。
3.2 SRT協(xié)議的特性
首先,從安全性角度,SRT協(xié)議可以使用AES對內(nèi)容進行加密傳輸;其次,從可靠性角度,SRT協(xié)議優(yōu)化了分組解碼器接收分組的構(gòu)造,在UDP數(shù)據(jù)包丟失以及排序方面存在的問題都可以有效解決,提升了數(shù)據(jù)傳輸?shù)姆€(wěn)定性以及安全性;最后,從低延遲角度,SRT傳輸協(xié)議以UDP協(xié)議為立足點,延時遠低于TCP協(xié)議,它擁有一個強制的延時量,且這個延時量是固定不變的,但是這個延時在網(wǎng)絡(luò)搭建之前可以由用戶進行調(diào)整。
在SRT中,其報文交互過程如下:握手(Handshake)、重要信息(Capability)、媒體(Media)、控制信息(Control)與關(guān)閉(Shutdown)。相比較RTMP的九次握手,SRT在構(gòu)建的過程中,僅僅需要兩個RTT(往返時延)即可完成,具體而言就是Handshake Request與Capability Announce;在握手之后,信息的交換產(chǎn)生于呼叫方(caller)以及接收方(listener),兩者之間產(chǎn)生信息交流,傳遞延時量以及緩沖區(qū)的大小。在傳輸封裝好的媒體數(shù)據(jù)包以外,還需要傳輸封裝的時間戳。通過同步接收方與呼叫方控制信息,SRT能夠有效克服網(wǎng)絡(luò)中的抖動和丟包。最后,媒體數(shù)據(jù)傳輸完畢,SRT會閉合通道。
4. SRT傳輸協(xié)議的實際應(yīng)用場景
SRT現(xiàn)在開發(fā)了許多新功能,包括傳輸大文件、小的對話數(shù)據(jù)等等,但是SRT的“傳統(tǒng)優(yōu)勢領(lǐng)域”還是實時的視音頻傳輸。SRT目前在廣電行業(yè)中主要還是應(yīng)用于節(jié)目的制作和分發(fā),而不是交付。
4.1 協(xié)議適用場景
SRT在廣電領(lǐng)域內(nèi)的應(yīng)用較早,其本質(zhì)上是一個點對點的傳輸協(xié)議(單播而不是組播)。從攝像機拍攝的視頻信號,在不使用衛(wèi)星或光纖專線等昂貴鏈路的情況下,可以通過互聯(lián)網(wǎng)使用SRT技術(shù),利用HEVC編碼的視頻信號可以在極低的圖像損失下以非常低的開銷進行傳輸。電視節(jié)目在分到CDN地進行網(wǎng)絡(luò)傳播的時候,之前通常是使用RTMP協(xié)議,但現(xiàn)在越來越多的流媒體服務(wù)器使用SRT作為上傳推流的解決方案。
安徽廣播電視臺衛(wèi)星轉(zhuǎn)播車上配備了兩套公網(wǎng)傳輸系統(tǒng),均支持SRT傳輸協(xié)議,其主要完成以下工作任務(wù):
4.1.1 備份重大直播衛(wèi)星和光纖傳輸通道
為省兩會以及全國兩會提供信號傳播,所以,要將信號傳輸?shù)闹攸c放在提升其可靠性以及安全性方面,要有效發(fā)揮衛(wèi)星通道、光纖通道以及公網(wǎng)傳輸通道的數(shù)據(jù)傳輸功能,以最小的成本,達到最高效的數(shù)據(jù)傳輸目的。
4.1.2 緊急狀態(tài)的新聞直播
在實踐中,經(jīng)常要處理緊急性、突發(fā)性的新聞直播工作,而公網(wǎng)傳輸則更具優(yōu)勢,靈活性更強、便捷性更突出。
4.1.3 臺內(nèi)播出信號
實施重大直播活動的時候,導演以及制作人希望可以觀看到臺內(nèi)的播出信號,以便為直播做好準備工作,即便面臨緊急性的事故也可以高效應(yīng)對。
安徽臺早在2019年就完成了首次使用SRT作為主線,通過5G網(wǎng)絡(luò)進行體育賽事活動的直播,同時用于節(jié)目制作的回傳鏈路也是由SRT來實現(xiàn)。
4.2 SRT傳輸網(wǎng)絡(luò)帶寬要求
在5G網(wǎng)絡(luò)逐漸普及的情況下,廣電行業(yè)中利用背包設(shè)備進行無線圖傳的場景越來越多。那么使用SRT協(xié)議進行傳輸?shù)降仔枰啻蟮膸捘??建議的帶寬應(yīng)該由以下幾個部分組成:
⑴數(shù)據(jù)流:主要組成部分是經(jīng)過編碼后封裝好的TS數(shù)據(jù)包。以H.264編碼傳輸高清1080p分辨率的視頻數(shù)據(jù),至少需要10Mbps以上的帶寬,4K超高清則至少需要40Mbps以上的帶寬才能達到廣電播出畫質(zhì)要求。而使用HEVC編碼,傳輸高清視頻只需要6Mbps,超高清達到30Mbps的帶寬就足以滿足播出要求。
⑵帶寬開銷:為了解決網(wǎng)絡(luò)波動和丟包等突發(fā)情況對傳輸造成的影響,SRT需要使用額外的帶寬向接受緩沖區(qū)重傳丟失的數(shù)據(jù),由于需要疊加正常傳輸?shù)膸?,補充重傳數(shù)據(jù)的過程帶寬消耗量將陡增,這部分額外的帶寬需求就是帶寬開銷。帶寬開銷的大小決定了補充丟失數(shù)據(jù)包的速度,設(shè)置越大,則接受緩沖區(qū)中的數(shù)據(jù)可以更快地獲得補充,否則,補充時間大于延時量時,則會發(fā)生圖像數(shù)據(jù)缺失。通常開銷默認值為數(shù)據(jù)流的25%,實際值可以在5%~50%之間設(shè)置。
⑶帶寬冗余量。在實際傳輸過程中,應(yīng)保證帶寬有一定的冗余量,建議為需求帶寬的33%。
因此,假設(shè)使用SRT來傳輸4K超高清視頻,TS數(shù)據(jù)流的帶寬為30Mbps,帶寬開銷為25%,那么傳輸鏈路的建議帶寬應(yīng)高于:
30×(1+25%)×(1+33%)=49.875Mbps,
在這種參數(shù)設(shè)置下,如果延時量設(shè)置為4000ms,那么網(wǎng)絡(luò)發(fā)生1秒鐘以內(nèi)的中斷都不會對SRT傳輸鏈路造成影響。這一特性甚至優(yōu)于衛(wèi)星或是光纖鏈路。
5. SRT協(xié)議在推廣普及上還面臨的問題和瓶頸
SRT傳輸協(xié)議中,優(yōu)勢眾多,應(yīng)用廣泛,但是在實踐中,廣電行業(yè)的工作人員也要注意一些問題:
⑴公網(wǎng)傳輸相較于傳統(tǒng)的專用線路波動性及不確定性突出,因此,應(yīng)用SRT技術(shù)傳輸前需要聯(lián)絡(luò)相關(guān)的工作人員做好預(yù)案,必要時準備多個備用鏈路。
⑵相比傳統(tǒng)的RTMP直播,SRT的抗丟包特性優(yōu)勢確實很大。但是,現(xiàn)在能播放SRT協(xié)議格式的播放器不多。SRT支持的HEVC編碼格式由于在瀏覽器支持、處理器開銷、專利授權(quán)等多方面存在限制,導致目前在廣泛應(yīng)用方面能體現(xiàn)出來的優(yōu)勢還不夠明顯,在推廣使用方面還需要更多的可支持工具。
⑶當前,SRT作為新一代的傳輸協(xié)議,參與的人不多,并且使用驗證的時間不夠長,因此其性能及穩(wěn)定性等方面還有待更多市場驗證,這樣也就導致很多廠家對SRT持觀望的態(tài)度。
6. 結(jié)束語
在廣電行業(yè),網(wǎng)絡(luò)直播的應(yīng)用越來越廣泛,對信號的傳輸質(zhì)量要求也越來越高,而SRT傳輸協(xié)議憑借其優(yōu)勢,得到了越來越廣泛的應(yīng)用。尤其是在公網(wǎng)環(huán)境網(wǎng)絡(luò)波動大、穩(wěn)定性受考驗的情況下,使用較低的成本、以更靈活的形式傳輸高質(zhì)量、低延時的視頻信號,更符合廣電行業(yè)媒體融合業(yè)務(wù)運營的實際需要。通過優(yōu)化配置的SRT傳輸環(huán)境,可以輕松實現(xiàn)跨區(qū)域新聞播報、遠程制作、互動訪談、大型活動直播等業(yè)務(wù)模式,有效助力電視臺節(jié)目制作和媒體服務(wù)部門探索新的網(wǎng)絡(luò)直播新業(yè)務(wù)場景,開發(fā)創(chuàng)新適用于廣電應(yīng)用的新技術(shù)模式,促進廣電傳輸技術(shù)轉(zhuǎn)型升級。
參考文獻:
[1]陶奕惟.5G在廣播電視技術(shù)中的應(yīng)用發(fā)展前景探析[J].IT經(jīng)理世界,2020,23(12):6.
[2]孫寶超,陳曉,井明石.網(wǎng)絡(luò)直播在廣電行業(yè)的應(yīng)用[J].百科論壇電子雜志,2020(7):516-517.
[3]王晨,張樂.安全可靠傳輸協(xié)議在5G環(huán)境下的低延遲視頻傳輸應(yīng)用[C]//.中國新聞技術(shù)工作者聯(lián)合會2021年學術(shù)年會論文集.[出版者不詳],2021:19-24.
[4]杜岳良.廣播電視信號傳輸中的SRT傳輸協(xié)議探討[J].中國傳媒科技,2021(08):158-160.
[5]張博力.淺談SRT傳輸協(xié)議在廣播電視信號傳輸中的應(yīng)用[J].現(xiàn)代電視技術(shù),2019(05):141-143.
[6]胡偉.5G和公網(wǎng)傳輸設(shè)備在電視直播中的應(yīng)用[J].數(shù)字通信世界,2019(09):178,198.