郭遠林
(廣州市迪士普音響科技有限公司,廣東 廣州 510450)
目前,公共廣播工程已經(jīng)普遍采用IP網(wǎng)絡(luò)技術(shù),這種類型的公共廣播系統(tǒng)具備OSI的七個協(xié)議層,能較好地兼容標準化網(wǎng)絡(luò)設(shè)備,可以滿足對音頻延時和質(zhì)量要求不高的場景應(yīng)用,但是由于缺乏同步機制,且延時在數(shù)百毫秒級,對音頻指標要求較高,尤其是有低延時需求的應(yīng)用場景就難以達到要求。針對這一問題提出基于Dante網(wǎng)絡(luò)音頻傳輸協(xié)議的公共廣播系統(tǒng)解決方案,在具有一般網(wǎng)絡(luò)化公共廣播系統(tǒng)應(yīng)備功能的基礎(chǔ)上,引入Dante網(wǎng)絡(luò)音頻傳輸協(xié)議,具備專業(yè)擴聲工程的低延時、同步性等優(yōu)點,可以滿足高標準公共廣播項目的需求。
基于計算機網(wǎng)絡(luò)搭建的公共廣播系統(tǒng)一般稱為網(wǎng)絡(luò)化公共廣播系統(tǒng)(IP公共廣播系統(tǒng)),公共廣播系統(tǒng)中最基本的海量音頻節(jié)目庫、遠距離的傳輸和控制、大范圍的矩陣交互等方面通過計算機和網(wǎng)絡(luò)技術(shù)而化解。網(wǎng)絡(luò)化公共廣播系統(tǒng)將音頻信號數(shù)字化后封裝到IP數(shù)據(jù)包傳輸,相比采用模擬線路的公共廣播系統(tǒng)的音頻信號傳輸,性能顯著提升,傳輸距離即是網(wǎng)絡(luò)所覆蓋的范圍,音頻質(zhì)量可達到CD級別。
早期IP公共廣播系統(tǒng)的硬件是基于x86架構(gòu)的計算機平臺,典型系統(tǒng)如圖1所示,音頻信號傳輸鏈路如圖2所示。由x86架構(gòu)服務(wù)器構(gòu)建的公共廣播系統(tǒng),以x86架構(gòu)服務(wù)器的主機作為系統(tǒng)核心,實現(xiàn)系統(tǒng)邏輯處理、節(jié)目存儲管理、定時管理、系統(tǒng)控制界面交互等功能。終端也是x86架構(gòu)的計算機,分為信號輸入類終端和信號輸出類終端,輸入類終端包括模擬音頻信號輸入、告警信號輸入、控制信號輸入等;輸出類終端包括模擬音頻信號輸出、告警信號輸出、控制信號輸出等,音頻信號輸出的終端就是廣播分區(qū)設(shè)備;此外,還有混合類終端同時具有輸入輸出功能。
圖1 早期網(wǎng)絡(luò)化公共廣播系統(tǒng)原理
圖2 網(wǎng)絡(luò)化廣播的音頻信號傳輸鏈路
早期的網(wǎng)絡(luò)化系統(tǒng)由于主機和終端都采用x86架構(gòu)硬件,本質(zhì)上就是由通用計算機網(wǎng)絡(luò)組成的系統(tǒng),只是主機性能相對于終端更好一些,而終端因為功能單一配置相對低很多,但即便如此,終端成本還是比較高昂,而且體積較大。主機對所有的終端在任何時候都能進行獨立的音頻選擇播放、音量控制、開關(guān)等功能,也可以批量對若干數(shù)量的分區(qū)進行控制,即所謂的分組功能,也可以進行雙向的互動操作,如終端點播服務(wù)器的音頻內(nèi)容,與主機或其他終端進行音頻對講等。系統(tǒng)的分區(qū)數(shù)量規(guī)模取決于服務(wù)器主機的性能和網(wǎng)絡(luò)的帶寬,一般可以很容易實現(xiàn)過千分區(qū)的功能。
得益于ARM架構(gòu)處理器的快速發(fā)展,新一代網(wǎng)絡(luò)化公共廣播系統(tǒng)的終端硬件核心也逐漸改由ARM嵌入式系統(tǒng),產(chǎn)品體積和成本均大幅減小,一個典型的基于ARM架構(gòu)處理器的網(wǎng)絡(luò)化公共廣播系統(tǒng)如圖3所示。主機采用x86架構(gòu)的硬件+Windows/Linux操作系統(tǒng)的服務(wù)器,也有采用ARM架構(gòu)服務(wù)器+Linux操作系統(tǒng)的服務(wù)器,各終端設(shè)備通常采用ARM嵌入式SoC或者其他類型的MCU作為核心。
圖3 新一代網(wǎng)絡(luò)化公共廣播系統(tǒng)原理
該類公共廣播系統(tǒng)涉及的設(shè)備類型較多,本文中不討論完整系統(tǒng),僅討論與音頻相關(guān)部分的功能。從信號源類型來看,通常系統(tǒng)的音頻信號源主要有兩類。
1)從服務(wù)器硬盤播放的音頻文件,格式有MP3、MP4、AAC、WAV、WMA、APE等,通常采用流媒體技術(shù),用UDP協(xié)議由主機發(fā)送到廣播分區(qū)終端,一個文件可以被同時播放到所有分區(qū)終端或者若干個分區(qū)終端,終端接收數(shù)據(jù)后實時解碼成模擬音頻信號,并送往下級信號處理設(shè)備(功率放大器、揚聲器)。
2)由音頻輸入類終端(傳聲器、播放機、線路輸入)實時采集的模擬音頻信號,需要經(jīng)過A/D轉(zhuǎn)換為數(shù)字信號,為保證實時性和音頻質(zhì)量,一般不經(jīng)過壓縮處理,直接封裝成IP數(shù)據(jù)包,并通過UDP協(xié)議發(fā)送到廣播終端,終端處理過程與處理服務(wù)器傳送文件音頻流類似。
網(wǎng)絡(luò)化公共廣播系統(tǒng)具有服務(wù)器向每個分區(qū)終端同時播放不同音頻文件的能力,而采集類信號源則以一對多或多對多的方式完成分區(qū)實時廣播,總體來看類似于網(wǎng)絡(luò)化的音頻交叉矩陣。
公共廣播系統(tǒng)工程本身屬于擴聲工程,除常規(guī)的頻響、失真度、聲壓級等衡量電聲性能指標外,音頻信號的延時和同步指標也非常重要。這里的延時是指信號源進入到系統(tǒng)輸入設(shè)備,再經(jīng)過系統(tǒng)傳輸與處理,最終由輸出設(shè)備輸出,全鏈路整個過程的時間差,如圖4,這個值越小越好。同步是指當兩個以上設(shè)備輸出同一個信號時,彼此之間存在的時間差,如圖5,這個值也是越小越好。
圖4 網(wǎng)絡(luò)化公共廣播的延時
圖5 網(wǎng)絡(luò)化公共廣播的同步
當前廣泛使用的IP公共廣播系統(tǒng)一般基于OSI 7層架構(gòu)及完整的來自操作系統(tǒng)的協(xié)議棧,設(shè)計編程以頂層應(yīng)用為主,具有開發(fā)技術(shù)難度較低,可以廣泛兼容常規(guī)局域網(wǎng)、廣域網(wǎng)的特點,但是由于缺乏網(wǎng)絡(luò)及媒體時鐘同步機制,以及針對時間敏感數(shù)據(jù)傳輸?shù)牡讓觾?yōu)化措施,對于實時傳輸音頻信號而言,延時和同步的問題比較明顯。目前各公共廣播產(chǎn)品都有自己的一套協(xié)議組合,采用不同的技術(shù)路線,如A/D的采樣率、IP數(shù)據(jù)包的載荷長度、緩存的大小等,對于延時和同步的指標會帶來較大差異;除產(chǎn)品本身的硬件與軟件算法、協(xié)議有關(guān)外,還與設(shè)備使用的網(wǎng)絡(luò)環(huán)境有關(guān)。目前,網(wǎng)絡(luò)、系統(tǒng)理想狀態(tài)下,延時普遍能達到的實測值是100~400 ms,在實際項目的應(yīng)用中,很多時候各種網(wǎng)絡(luò)信息設(shè)備混用在一個局域網(wǎng)中,通常延時要大于這個數(shù)值,使公共廣播系統(tǒng)的電聲指標會大打折扣。以網(wǎng)絡(luò)化公共廣播系統(tǒng)中音頻信號源的播放為例,對于直接播放存于播放服務(wù)器的音頻文件,無需信號處理,延時??;對于實時采集的信號源,尤其是傳聲器輸入延時最敏感,其他類型的相對不太敏感,因為聽眾可以同時聽到講話者的直達聲和由傳聲器拾取經(jīng)網(wǎng)絡(luò)廣播還原的電聲信號,如果延時過大將明顯影響聽音質(zhì)量,甚至聽到兩個聲音。而在聲音同步方面,同步性能對所有的信號類型都有影響,同步不好時會劣化聲場分布,降低語音清晰度,不同程度地影響到聽音效果。
為實現(xiàn)IP公共廣播系統(tǒng)低延時的音頻傳輸,一個有效的解決方案是選用專業(yè)擴聲領(lǐng)域使用的網(wǎng)絡(luò)音頻協(xié)議,目前主流的傳輸協(xié)議有CobraNet、EtherSound、Dante、AVB等。其中,Dante具有完備的軟、硬件的解決方案,包括專用芯片和接入模塊(硬件)、控制管理軟件(API接口以及Dante Controller,見圖6)、虛擬聲卡(軟件,見圖7)等。目前,在各種類型的專業(yè)擴聲、會議系統(tǒng)中有著廣泛的應(yīng)用,其延時低、同步性好、支持點對點和點對多點應(yīng)用等特性決定了在公共廣播系統(tǒng)也具備很好的實用性。Dante虛擬聲卡能安裝在通用計算機系統(tǒng)中,通過計算機本地網(wǎng)口,直接將計算機中錄放音文件數(shù)據(jù)流與Dante協(xié)議控制流進行對接,極大方便了IP公共廣播系統(tǒng)的音頻文件播放及傳輸。圖8就是基于Dante數(shù)字音頻傳輸協(xié)議的低延時網(wǎng)絡(luò)化系統(tǒng)方案。
圖6 Dante Controller
圖7 Dante虛擬聲卡
圖8 基于Dante的網(wǎng)絡(luò)化公共廣播系統(tǒng)工作原理
由于Dante協(xié)議是一個實時的網(wǎng)絡(luò)數(shù)字音頻傳輸協(xié)議,與通常意義的網(wǎng)絡(luò)流媒體傳輸機制不盡相同,因此基于Datne網(wǎng)絡(luò)協(xié)議的公共廣播系統(tǒng)必須將系統(tǒng)中的兩類音頻信號源(見前文1.2節(jié))統(tǒng)一到Dante的傳輸方式和協(xié)議格式上。對于傳聲器、線路輸入、調(diào)音臺等輸入類設(shè)備的信號,可以直接采用Dante SoC硬件模塊進行采集。對于服務(wù)器音頻文件庫的輸出則有以下兩種方式。
1)通過服務(wù)器的音頻播放軟件從聲卡輸出音頻信號,再由DanteSoC硬件模塊封裝成Dante協(xié)議數(shù)字音頻數(shù)據(jù)包。這種方式由于采用硬件聲卡,在服務(wù)器信號源通道少的情況下,比較容易實現(xiàn),而當服務(wù)器信號源通道達到幾十上百以上時面臨硬件復(fù)雜、成本高的問題,即使采用USB聲卡也是如此。
2)采用純軟件實現(xiàn)廣播服務(wù)器音頻庫文件轉(zhuǎn)換為Dante網(wǎng)絡(luò)數(shù)據(jù)流。如采用Dante VirtualSoundcard軟件,兼容ASIO驅(qū)動,可以實現(xiàn)多通道虛擬聲卡,音頻播放器輸出的數(shù)據(jù)流可以通過ASIO接口與虛擬聲卡耦合,將虛擬聲卡的音頻信號封包成Dante協(xié)議網(wǎng)絡(luò)數(shù)據(jù)包。這就意味著可以實現(xiàn)多通道Dante協(xié)議數(shù)據(jù)流,具有16×16、32×32、64×64,甚至更多通道。
采用Dante協(xié)議實現(xiàn)低延時網(wǎng)絡(luò)化公共廣播系統(tǒng)的拓撲圖如圖9所示。主機是系統(tǒng)的管理控制中心,自帶音頻文件庫,可根據(jù)終端的播放需求動態(tài)開啟播放器,再由Dante虛擬聲卡封裝成Dante格式音頻數(shù)據(jù)流后進入網(wǎng)絡(luò)。終端設(shè)備分為信號輸入、信號輸出、輸入輸出混合3類,信號輸入類設(shè)備包括尋呼器、CD、收音機、傳聲器等,信號輸出類設(shè)備包括解碼器、有源揚聲器、功率放大器等,輸入輸出混合類設(shè)備主要是有交互功能的對講終端。公共廣播系統(tǒng)除基本的音頻傳輸功能外,還必須具有系統(tǒng)管理和控制的功能,所有的控制功能均由服務(wù)器實現(xiàn),操作界面可以通過服務(wù)器的顯示屏、遠程控制計算機、移動終端APP等方式實現(xiàn)。
圖9 系統(tǒng)拓撲
基于Dante的網(wǎng)絡(luò)化公共廣播系統(tǒng)相較于傳統(tǒng)網(wǎng)絡(luò)化公共廣播系統(tǒng),在硬件構(gòu)成上,只需把各終端核心從ARM SoC替換成DanteSoC模塊,就可實現(xiàn)Dante通信功能;在軟件方面,主機可以沿用傳統(tǒng)網(wǎng)絡(luò)化公共廣播系統(tǒng)的定時管理和分區(qū)管理等基礎(chǔ)功能,只需將原來音頻文件流媒體傳輸方式轉(zhuǎn)換成基于Dante虛擬聲卡的多通道音頻播放方式,分區(qū)管理由服務(wù)器調(diào)用DanteAPI接口進行,通過Dante網(wǎng)絡(luò)發(fā)送指令數(shù)據(jù)來完成流的切換,以及對各終端的DanteSoC芯片的控制。在千兆以太網(wǎng)條件下,系統(tǒng)可以達到1 024通道以上的分區(qū)規(guī)模。
對網(wǎng)絡(luò)化公共廣播系統(tǒng)的音頻延時和同步時差的測量方法如圖10所示,測試信號由音頻播放器產(chǎn)生,內(nèi)容為自行制作的WAV音頻文件,總時長為5 s,前2 s空白,接著10 ms是10 kHz/-10 dB正弦音頻信號,最后是2 900 ms的空白,這樣設(shè)計的測試信號易于示波器捕捉。使用上述方法分別對一套低延時廣播系統(tǒng)和兩套不同品牌的網(wǎng)絡(luò)廣播系統(tǒng)進行測試,結(jié)果顯示:
圖10 第三組吊掛主火炬示意圖
圖10 同步和延時的測試方案
1)基于Dante數(shù)字音頻傳輸協(xié)議的網(wǎng)絡(luò)化公共廣播系統(tǒng),延時低于6 ms,同步時間偏差低于0.5 ms,兩項指標達到比較理想的狀態(tài),詳見圖11;
圖11 基于Dante數(shù)字音頻傳輸協(xié)議公共廣播系統(tǒng)的同步和延時測試結(jié)果
2)普通協(xié)議的網(wǎng)絡(luò)化公共廣播系統(tǒng)1,延時達到415 ms,同步時間偏差5 ms,詳見圖12;
圖12 普通協(xié)議的網(wǎng)絡(luò)化公共廣播系統(tǒng)1的同步和延時測試結(jié)果
3)普通協(xié)議的網(wǎng)絡(luò)化公共廣播系統(tǒng)2,延時達到276 ms,同步時間偏差5 ms,詳見圖13。
圖13 普通協(xié)議的網(wǎng)絡(luò)化公共廣播系統(tǒng)2的同步和延時測試結(jié)果
某音樂學(xué)院因為專業(yè)特點對公共廣播系統(tǒng)的音質(zhì)有尋呼講話低延時、分區(qū)聲音同步、語言清晰度方面的高標準要求,校方對目前的傳統(tǒng)網(wǎng)絡(luò)化公共廣播系統(tǒng)不滿意,經(jīng)綜合對比后選用基于Dante網(wǎng)絡(luò)化公共廣播系統(tǒng),系統(tǒng)拓撲如圖14,設(shè)備安裝調(diào)試后校方非常認可本系統(tǒng)的音頻低延時和聲音質(zhì)量。
圖14 基于Dante的網(wǎng)絡(luò)化公共廣播系統(tǒng)應(yīng)用拓撲圖
公共廣播系統(tǒng)的信號延時是一項重要指標,對于有傳聲器信號輸入需求的現(xiàn)場擴聲系統(tǒng)尤其重要,文中介紹的基于Dante協(xié)議的網(wǎng)絡(luò)化公共廣播系統(tǒng)在音頻延時和同步性等指標上具有明顯優(yōu)勢,同時具備公共廣播系統(tǒng)的應(yīng)備常用功能,可以滿足實際項目的應(yīng)用需求。