李 姝
河北廣播電視臺(tái) 河北省 石家莊市 050031
隨著廣播電視行業(yè)的不斷發(fā)展和技術(shù)進(jìn)步,智慧化調(diào)頻發(fā)射臺(tái)站建設(shè)已經(jīng)成為調(diào)頻發(fā)射系統(tǒng)升級(jí)的重要方向之一,智慧化調(diào)頻廣播發(fā)射臺(tái)建設(shè)可減少調(diào)頻廣播發(fā)射臺(tái)站運(yùn)維過(guò)程中人為干預(yù),可降低運(yùn)營(yíng)成本,提升調(diào)頻廣播發(fā)射臺(tái)站運(yùn)維效率,確保播出安全。其中音頻比對(duì)技術(shù)應(yīng)用是智慧化調(diào)頻發(fā)射臺(tái)站建設(shè)中的重要組成部分,結(jié)合信息技術(shù)、智能控制技術(shù)、互聯(lián)網(wǎng)技術(shù)等,可對(duì)調(diào)頻廣播發(fā)射臺(tái)站發(fā)射信號(hào)實(shí)時(shí)自動(dòng)監(jiān)測(cè)和自動(dòng)分析,及時(shí)發(fā)現(xiàn)發(fā)射信號(hào)中的異常情況,保障發(fā)射信號(hào)的安全性。音頻比對(duì)技術(shù)的應(yīng)用為提升調(diào)頻廣播發(fā)射臺(tái)自動(dòng)化、智能化管理水平提供了技術(shù)保障,是推進(jìn)調(diào)頻廣播發(fā)射臺(tái)站智慧化的關(guān)鍵內(nèi)容。
音頻比對(duì)技術(shù)基于計(jì)算機(jī)科學(xué)和音頻信號(hào)處理技術(shù),可對(duì)音頻進(jìn)行自動(dòng)內(nèi)容比對(duì)和匹配,從而實(shí)現(xiàn)對(duì)音頻內(nèi)容的檢索、識(shí)別和分析。音頻比對(duì)技術(shù)的核心是基于語(yǔ)音識(shí)別和語(yǔ)音分析的算法,通過(guò)對(duì)音頻聲學(xué)特征進(jìn)行分析和提取,對(duì)語(yǔ)音進(jìn)行相似度處理。音頻比對(duì)技術(shù)經(jīng)歷了三個(gè)階段,第一階段音頻信號(hào)是否存在,主要通過(guò)對(duì)音頻信號(hào)進(jìn)行采樣,以及音頻信號(hào)電平的閾值來(lái)完成;第二階段主要通過(guò)比較兩個(gè)音頻信號(hào)電平幅度來(lái)評(píng)估信號(hào)的一致性;第三階段音頻比對(duì)技術(shù)向智能化方向發(fā)展,對(duì)不同的音頻特征參數(shù)進(jìn)行比較。目前音頻比對(duì)技術(shù)實(shí)現(xiàn)方式主要分為以下三類(lèi):
(1)將音頻轉(zhuǎn)換為具有相同時(shí)間軸的波形,用圖像比對(duì)技術(shù)計(jì)算波形的相似度。此音頻比對(duì)實(shí)現(xiàn)方法運(yùn)算量較高,信號(hào)傳輸過(guò)程中音頻的幅度、波形易受到干擾從而導(dǎo)致比對(duì)效果降低。
(2)用大量的音頻來(lái)訓(xùn)練模型,利用機(jī)器學(xué)習(xí)技術(shù)計(jì)算音頻相似度。此方法需要高質(zhì)量、大規(guī)模的訓(xùn)練數(shù)據(jù),且模型訓(xùn)練時(shí)間較長(zhǎng),訓(xùn)練模型影響后續(xù)音頻比對(duì)效果,另外,缺乏公開(kāi)的、可信度高的廣播音頻數(shù)據(jù)集。
(3)提取音頻特征并計(jì)算出相似度,以此來(lái)描述整體音頻的相似度。音頻特征參數(shù)可以很好地表征音頻的特征,能夠很好地區(qū)分、反映音頻的性質(zhì),且穩(wěn)定性較高。目前多數(shù)音頻比對(duì)算法技術(shù)都使用音頻的非語(yǔ)義特征作為比較參數(shù),其中基于人耳聽(tīng)覺(jué)特性的梅爾倒譜系數(shù)MFCC 是應(yīng)用較廣泛的音頻特征參數(shù),目前此音頻比對(duì)技術(shù)的實(shí)現(xiàn)方式應(yīng)用最為廣泛。
基于上述音頻比對(duì)實(shí)現(xiàn)方式,對(duì)音頻比對(duì)結(jié)果進(jìn)行分析,對(duì)音頻相似度進(jìn)行判定,音頻相似度判定方法主要有以下兩種實(shí)現(xiàn)方式:
(1)計(jì)算音頻間距離,音頻間距離越小,音頻相似度越高。
(2)計(jì)算音頻相關(guān)系數(shù),音頻間相關(guān)系數(shù)越大,音頻相似度越高。
圍繞智慧化調(diào)頻發(fā)射臺(tái)站的建設(shè)要求,以提升調(diào)頻發(fā)射臺(tái)站信號(hào)質(zhì)量和穩(wěn)定性、提升調(diào)頻發(fā)射臺(tái)站運(yùn)維效率、加強(qiáng)調(diào)頻發(fā)射臺(tái)站信號(hào)安全監(jiān)測(cè)為目標(biāo),建立一套功能完備的音頻比對(duì)系統(tǒng),智慧化調(diào)頻發(fā)射臺(tái)站建設(shè)對(duì)音頻比對(duì)系統(tǒng)的主要需求如下:
(1)通過(guò)自動(dòng)化監(jiān)測(cè)廣播節(jié)目的音頻特征,包括音量、音調(diào)、音質(zhì)等,可以快速發(fā)現(xiàn)聲音中存在的問(wèn)題,從而提高廣播節(jié)目播出質(zhì)量和穩(wěn)定性。
(2)對(duì)廣播節(jié)目的來(lái)源和內(nèi)容進(jìn)行識(shí)別和比對(duì),通過(guò)音頻比對(duì)技術(shù)的應(yīng)用,可以快速發(fā)現(xiàn)和防止廣播節(jié)目被替換,保障廣播節(jié)目的播出安全。
(3)對(duì)廣播節(jié)目的音頻質(zhì)量進(jìn)行實(shí)時(shí)監(jiān)測(cè)和控制,通過(guò)音頻比對(duì)技術(shù)的應(yīng)用,可以快速發(fā)現(xiàn)和糾正聲音中存在的噪聲和失真等問(wèn)題,對(duì)廣播節(jié)目的音頻進(jìn)行干擾監(jiān)測(cè)和分析,可以快速發(fā)現(xiàn)和解決干擾問(wèn)題,保障廣播節(jié)目的正常播出,提升廣播節(jié)目播出效果。
(4)系統(tǒng)具備實(shí)時(shí)性,對(duì)廣播節(jié)目進(jìn)行的音頻比對(duì)、統(tǒng)計(jì)和分析等具有實(shí)時(shí)性,可以快速發(fā)現(xiàn)和解決存在的問(wèn)題。
(5)系統(tǒng)具備可擴(kuò)展性,系統(tǒng)可以處理多路音頻數(shù)據(jù),音頻比對(duì)系統(tǒng)與調(diào)頻發(fā)射臺(tái)的其他檢測(cè)系統(tǒng)無(wú)縫集成。
結(jié)合智慧化調(diào)頻發(fā)射臺(tái)站對(duì)音頻比對(duì)功能需求,音頻比對(duì)系統(tǒng)框架如圖1 所示,主要有音頻輸入、實(shí)時(shí)同步模塊、音頻比對(duì)模塊三大部分。
圖1 音頻比對(duì)系統(tǒng)框圖
3.1.1 音頻輸入
節(jié)目源原始音頻即為參考音頻,通過(guò)音頻采集設(shè)備在調(diào)頻廣播發(fā)射臺(tái)站采集的節(jié)目音頻或其他音頻即為測(cè)試音頻,參考音頻、測(cè)試音頻等所有音頻可通過(guò)網(wǎng)絡(luò)送入音頻比對(duì)系統(tǒng),音頻比對(duì)系統(tǒng)完成測(cè)試音頻與參考音頻間相似度判定。
3.1.2 實(shí)時(shí)同步模塊
不同的音頻傳輸路徑存在音頻傳輸延時(shí)不一致情況,因此測(cè)試音頻、參考音頻輸入到音頻比對(duì)系統(tǒng)后,需要對(duì)測(cè)試音頻、參考音頻的延時(shí)變化進(jìn)行實(shí)時(shí)測(cè)量并計(jì)算延時(shí)差,調(diào)整測(cè)試音頻的延時(shí),實(shí)現(xiàn)測(cè)量音頻與參考音頻間的實(shí)時(shí)同步調(diào)整。本音頻比對(duì)系統(tǒng)設(shè)計(jì)同步模塊的響應(yīng)時(shí)間為1 秒,即1 秒內(nèi)完成同步調(diào)整,調(diào)整精度為21 微秒左右(1/48kHz)。
3.1.3 音頻比對(duì)模塊
本模塊即為音頻比對(duì)算法的實(shí)現(xiàn)。為了提升音頻比對(duì)系統(tǒng)的可靠性,本音頻比對(duì)系統(tǒng)采用基于改進(jìn)MFCC 余弦相似度的音頻比對(duì)算法,此算法運(yùn)算量相對(duì)較少,能滿(mǎn)足對(duì)多路廣播音頻節(jié)目進(jìn)行實(shí)時(shí)比對(duì)的要求。
音頻采集設(shè)備是音頻比對(duì)輸入的關(guān)鍵設(shè)備,具備空收信號(hào)輸入和模擬/數(shù)字音頻輸入方式,可同時(shí)完成多路音頻的遠(yuǎn)程監(jiān)測(cè)和音頻監(jiān)聽(tīng),針對(duì)調(diào)頻發(fā)射臺(tái)站多部發(fā)射機(jī)的應(yīng)用場(chǎng)景,音頻比對(duì)輸入設(shè)計(jì)如圖2 所示。
圖2 音頻比對(duì)輸入設(shè)計(jì)
(1)對(duì)解碼器輸出音頻進(jìn)行實(shí)時(shí)監(jiān)測(cè)和采集,通過(guò)網(wǎng)絡(luò)輸入音頻比對(duì)系統(tǒng),以此判斷傳輸鏈路及解碼器的音頻狀態(tài)和工作狀態(tài)是否正常。
(2)對(duì)調(diào)頻發(fā)射機(jī)的空收信號(hào)解調(diào),解調(diào)后音頻通過(guò)網(wǎng)絡(luò)輸入音頻比對(duì)系統(tǒng),以此判斷調(diào)頻發(fā)射機(jī)的工作狀態(tài)是否正常。
(3)根據(jù)調(diào)頻發(fā)射臺(tái)站的頻率情況,部署多臺(tái)音頻采集設(shè)備,可對(duì)所有解碼器音頻、調(diào)頻發(fā)射機(jī)的空收信號(hào)進(jìn)行信號(hào)解調(diào),實(shí)時(shí)采集的音頻通過(guò)網(wǎng)絡(luò)輸入音頻比對(duì)系統(tǒng)。
參考音頻與測(cè)試音頻的延時(shí)不同步會(huì)降低音頻比對(duì)算法的性能,為保證音頻比對(duì)的準(zhǔn)確性,首先計(jì)算出測(cè)試音頻和參考音頻間的延時(shí)差,并進(jìn)行音頻實(shí)時(shí)同步調(diào)整。如圖3 所示,音頻比對(duì)的同步調(diào)整主要由靜音段處理模塊、延遲估計(jì)模塊、同步成功判決模塊組成。
圖3 音頻比對(duì)同步設(shè)計(jì)
延時(shí)同步調(diào)整通常依據(jù)參考音頻與測(cè)試音頻的互相關(guān)函數(shù)峰值進(jìn)行調(diào)整,但如果出現(xiàn)靜音段,將導(dǎo)致互相關(guān)函數(shù)計(jì)算值為零,這樣參考音頻與測(cè)試音頻間的同步難以實(shí)現(xiàn),因此在延時(shí)同步調(diào)整前,需要對(duì)音頻片段進(jìn)行選擇,計(jì)算該音頻片段的能量,通過(guò)能量值大小判斷音頻片段是否為靜音,如果是靜音,則此音頻片段不參與延時(shí)估計(jì)。延遲估計(jì)模塊的功能是計(jì)算測(cè)試音頻片段與參考音頻的互相關(guān)函數(shù)峰值,根據(jù)互相關(guān)函數(shù)峰值出現(xiàn)的位置完成測(cè)試音頻的延遲同步調(diào)整。同步成功判決模塊功能為計(jì)算同步參數(shù),并與閥值進(jìn)行比較,實(shí)時(shí)判斷延遲同步調(diào)整是否有效。
完成參考音頻與測(cè)試音頻的同步調(diào)整后,利用音頻比對(duì)算法進(jìn)行相似度計(jì)算,完成比對(duì)判決,并輸出比對(duì)結(jié)果。本系統(tǒng)考慮音頻比對(duì)算法輸出結(jié)果的正確率,選擇能夠反映人耳聽(tīng)覺(jué)特性且具有一定抗噪性能的梅爾倒譜系數(shù)MFCC 特征參數(shù)、并采用余弦相似度算法如圖4 所示。本系統(tǒng)選用的算法計(jì)算量相對(duì)低,適應(yīng)多路廣播音頻節(jié)目進(jìn)行實(shí)時(shí)音頻比對(duì)的場(chǎng)景。實(shí)現(xiàn)步驟如下:
圖4 音頻比對(duì)算法設(shè)計(jì)
(1)對(duì)參考和測(cè)試音頻數(shù)據(jù)進(jìn)行預(yù)處理,并分別提取它們的梅爾倒譜系數(shù)MFCC 特征參數(shù)。
(2)將梅爾倒譜系數(shù)MFCC 特征參數(shù)完成余弦相似度計(jì)算,得到參考音頻與測(cè)試音頻間的相似度,相似度若大于閾值則輸出比對(duì)結(jié)果為相似音頻,否則為不相似音頻。
如表1 所示分別記錄了不同信噪比下,使用改進(jìn)前、后的余弦相似度算法時(shí),系統(tǒng)的準(zhǔn)確率、誤檢率、漏檢率。由表中的數(shù)據(jù)可知,在無(wú)噪聲情況下,使用兩種算法時(shí)系統(tǒng)的準(zhǔn)確率均為100%,誤檢率、漏檢率為0。而當(dāng)音頻中存在噪聲干擾時(shí),使用改進(jìn)后的余弦相似度算法時(shí),系統(tǒng)的準(zhǔn)確率優(yōu)于99.15%,誤檢率均小于0.25%,漏檢率小于1.85%;而使用傳統(tǒng)余弦相似度算法時(shí),系統(tǒng)的準(zhǔn)確率優(yōu)于87.71%,誤檢率均小于4.68%,漏檢率小于5.00%。改進(jìn)后的余弦相似度算法的誤檢率明顯優(yōu)于傳統(tǒng)算法,準(zhǔn)確率、漏檢率也優(yōu)于傳統(tǒng)算法。
表1 音頻比對(duì)算法比較
河北廣播電視臺(tái)調(diào)頻廣播發(fā)射系統(tǒng)存在站點(diǎn)多、分布廣的特點(diǎn),部分為無(wú)人值守站點(diǎn)或無(wú)技術(shù)維護(hù)能力發(fā)射站點(diǎn),存在停播、劣播、錯(cuò)播事故,以及發(fā)現(xiàn)處理不及時(shí)的問(wèn)題。為提高調(diào)頻廣播節(jié)目的傳輸質(zhì)量,對(duì)調(diào)頻廣播發(fā)射臺(tái)站進(jìn)行智慧化建設(shè),利用音頻比對(duì)技術(shù)、智能控制技術(shù)、物聯(lián)網(wǎng)技術(shù),規(guī)劃建設(shè)了一套智慧遠(yuǎn)程管理平臺(tái),該平臺(tái)具備多終端訪問(wèn)功能,可通過(guò)電腦、平板、手機(jī)等終端訪問(wèn),對(duì)發(fā)射臺(tái)站播出音頻、調(diào)頻空收信號(hào)等進(jìn)行遠(yuǎn)程音頻比對(duì)和監(jiān)聽(tīng)監(jiān)測(cè),同時(shí)對(duì)發(fā)射臺(tái)站設(shè)備情況、播出情況、信號(hào)質(zhì)量等進(jìn)行實(shí)時(shí)監(jiān)測(cè),系統(tǒng)配備自動(dòng)報(bào)警功能,方便值守人員調(diào)度。河北廣播電視臺(tái)智慧遠(yuǎn)程管理平臺(tái)系統(tǒng)結(jié)構(gòu)設(shè)計(jì)如圖5 所示。
圖5 智慧遠(yuǎn)程管理平臺(tái)系統(tǒng)結(jié)構(gòu)設(shè)計(jì)圖
調(diào)頻發(fā)射臺(tái)站采用監(jiān)聽(tīng)設(shè)備完成播出音頻、調(diào)頻空收信號(hào)的采集與傳輸,采用監(jiān)測(cè)設(shè)備完成設(shè)備狀態(tài)、信號(hào)狀態(tài)等信息的采集與傳輸;在監(jiān)控中心部署軟件,完成音頻比對(duì)和監(jiān)聽(tīng)監(jiān)測(cè)、設(shè)備狀態(tài)、信號(hào)質(zhì)量監(jiān)測(cè)。
河北廣播電視臺(tái)智慧遠(yuǎn)程管理平臺(tái)音頻比對(duì)結(jié)果如圖6 所示,音頻比對(duì)系統(tǒng)具備如下功能和特點(diǎn):
圖6 音頻比對(duì)結(jié)果展示
(1)能夠識(shí)別在無(wú)功率停播、音頻空播、靜音停播、內(nèi)容錯(cuò)播或插播、聲道丟失、傳輸延時(shí)變化、射頻同頻干擾、射頻臨頻干擾、音頻反相等主要安全播出事故。
(2)系統(tǒng)支持UDP、UDP組播、RTMP、RTP、HTTP 等多種流媒體格式,且支持MP2、MP3、AAC 等壓縮格式,根據(jù)網(wǎng)絡(luò)情況按需配置。可實(shí)現(xiàn)基于音頻內(nèi)容的實(shí)時(shí)比對(duì),比對(duì)顆粒度為1 秒,滿(mǎn)足在5 秒內(nèi)產(chǎn)生報(bào)警的技術(shù)要求。
(3)支持基于音頻文件的定時(shí)比對(duì),用戶(hù)可以配置實(shí)現(xiàn)自動(dòng)化比對(duì)參數(shù),包括時(shí)間間隔、比對(duì)時(shí)長(zhǎng)、節(jié)目信息等參數(shù)。根據(jù)配置信息完成自動(dòng)化比對(duì),推送比對(duì)結(jié)果。
(4) 具備完善的效果展示、報(bào)警及消息推送能力,可將比對(duì)結(jié)果通過(guò)短信、微信、郵件、數(shù)據(jù)接口等多種方式推送給用戶(hù)或上層系統(tǒng)。
(5) 提供音頻實(shí)時(shí)展示(通道及電平)、延時(shí)顯示、相似度柱狀圖、相似度歷史曲線、聲像圖等多種顯示,全面展示系統(tǒng)的安全播出監(jiān)測(cè)情況。
(6) 具有完善的音頻存儲(chǔ)、定位功能,可以根據(jù)比對(duì)結(jié)果回溯音頻節(jié)目。系統(tǒng)具有完善的日志記錄功能,記錄結(jié)果按時(shí)間、站點(diǎn)、異常類(lèi)型等多種參數(shù)組合篩選。
音頻比對(duì)技術(shù)的應(yīng)用是調(diào)頻發(fā)射臺(tái)站智慧化建設(shè)的重要內(nèi)容,提升了發(fā)射信號(hào)的準(zhǔn)確性和穩(wěn)定性,通過(guò)實(shí)時(shí)監(jiān)測(cè)發(fā)射信號(hào),能及時(shí)發(fā)現(xiàn)信號(hào)中的噪聲和失真問(wèn)題,確保發(fā)射信號(hào)的質(zhì)量。其次,音頻比對(duì)技術(shù)可以加強(qiáng)對(duì)發(fā)射信號(hào)的安全性監(jiān)測(cè)。利用音頻比對(duì)技術(shù)對(duì)發(fā)射信號(hào)進(jìn)行實(shí)時(shí)監(jiān)測(cè)和分析,及時(shí)發(fā)現(xiàn)異常信號(hào),避免干擾和攻擊,保障發(fā)射信號(hào)的安全性。綜上所述,音頻比對(duì)技術(shù)在智慧化調(diào)頻發(fā)射臺(tái)站建設(shè)中的應(yīng)用,可以提升信號(hào)質(zhì)量、安全性和智能化程度,是實(shí)現(xiàn)調(diào)頻發(fā)射臺(tái)站智慧化的重要手段。