胡爾西旦
摘 要: 隨著科技的不斷進(jìn)步,音頻產(chǎn)品快速發(fā)展,人們開(kāi)始關(guān)注音頻產(chǎn)品版權(quán)的保護(hù),數(shù)字音頻水印技術(shù)成為了當(dāng)前比較活躍的研究領(lǐng)域。音頻水印具備以下優(yōu)點(diǎn):用戶(hù)體驗(yàn)感好、快速準(zhǔn)確、方便移動(dòng)端采集。使用音頻水印技術(shù),通過(guò)在節(jié)目播出實(shí)時(shí)信號(hào)或離線(xiàn)素材中嵌入音頻水印,在電視節(jié)目播放時(shí),觀眾可通過(guò)手機(jī)等移動(dòng)終端的麥克風(fēng)采集聲音并識(shí)別水印信息,根據(jù)結(jié)果跳轉(zhuǎn)到對(duì)應(yīng)互動(dòng)界面參與節(jié)目互動(dòng)。如何實(shí)現(xiàn)屏幕的擴(kuò)展,將“大屏幕”的視覺(jué)效果和現(xiàn)場(chǎng)感與“小屏幕”的優(yōu)勢(shì)相結(jié)合,延伸電視互動(dòng)應(yīng)用場(chǎng)景,成為了新媒體行業(yè)的熱門(mén)研究方向。
關(guān)鍵詞: 音頻水印;水印嵌入;水印檢測(cè);電視節(jié)目互動(dòng)
【中圖分類(lèi)號(hào)】P301.6 【文獻(xiàn)標(biāo)識(shí)碼】B 【DOI】10.12215/j.issn.1674-3733.2020.25.179
引言:如何保護(hù)數(shù)字內(nèi)容的安全性已成為近年來(lái)法律界和信息產(chǎn)業(yè)界的熱點(diǎn)問(wèn)題。針對(duì)這些問(wèn)題,傳統(tǒng)的解決方式是采用密碼學(xué)技術(shù)。但是,多媒體產(chǎn)品數(shù)據(jù)比較特殊,僅依靠傳統(tǒng)密碼學(xué)技術(shù)無(wú)法解決多媒體信息產(chǎn)生的安全問(wèn)題?;趥鹘y(tǒng)密碼學(xué)技術(shù)的多媒體信息安全保護(hù)具有局限性。這種背景下,能夠解決版權(quán)問(wèn)題的數(shù)字水印應(yīng)運(yùn)而生。
1 電視播出互動(dòng)中的應(yīng)用中音頻水印的技術(shù)特點(diǎn)
(1)適于空氣傳播,在電視互動(dòng)場(chǎng)景中,觀眾使用手機(jī)等移動(dòng)終端設(shè)備識(shí)別電視節(jié)目聲音中的音頻水印,訪問(wèn)互動(dòng)內(nèi)容,聲音在電視播放過(guò)程中通過(guò)空氣傳播至手機(jī)麥克風(fēng),距離、背景聲等周?chē)h(huán)境多種多樣,因此需要考慮到音頻水印的抗干擾能力。
(2)魯棒性高:由于電視信號(hào)從電視臺(tái)播出一直到用戶(hù)機(jī)頂盒的傳輸鏈路復(fù)雜,特別是上星播出的節(jié)目,中間會(huì)經(jīng)歷多次編解碼、信號(hào)格式轉(zhuǎn)換、音頻變換等處理,因此在電視節(jié)目中嵌入的水印需具有較高的魯棒性,避免水印在傳輸鏈路中被干擾破壞,影響終端設(shè)備的正常識(shí)別。
(3)檢測(cè)程序性能,考慮到市場(chǎng)上的手機(jī)檔次不一,音頻水印檢測(cè)算法不能占用太高的手機(jī)資源,基本設(shè)計(jì)目標(biāo)是占用CPU不超過(guò)中檔手機(jī)的20%。
2 數(shù)字音頻水印的評(píng)價(jià)標(biāo)準(zhǔn)
2.1 不可感知性評(píng)價(jià)標(biāo)準(zhǔn)
2.1.1 主觀標(biāo)準(zhǔn)
主觀評(píng)價(jià)一個(gè)水印算法透明性的過(guò)程中,通常應(yīng)用平均觀點(diǎn)分(MeanOpinionScore,MOS),即由測(cè)試者對(duì)含水印的音頻進(jìn)行打分。其主要根據(jù)音頻的音質(zhì)進(jìn)行打分,通常使用5分制規(guī)則,MOS越靠近5,說(shuō)明算法的透明性越好。由于此標(biāo)準(zhǔn)常常因參加測(cè)試人員的個(gè)人因素或者測(cè)試的環(huán)境的不同,導(dǎo)致測(cè)試結(jié)果存在差異,且會(huì)浪費(fèi)大量人力,因此通常不被采用。
2.1.2 客觀標(biāo)準(zhǔn)
評(píng)價(jià)透明性時(shí),使用較多的是信噪比和峰值信噪比(PeakSignaltoNoiseRatio,PSNR),可以定量評(píng)價(jià)算法。雖然音頻發(fā)生的一些較小改變?cè)谥饔^上聽(tīng)不出任何差異,但是會(huì)對(duì)SNR或者PSNR的數(shù)值造成一定影響。
2.2 水印容量評(píng)價(jià)標(biāo)準(zhǔn)
水印容量通常指保證音頻產(chǎn)品具有不可感知性的前提條件下,單位時(shí)間內(nèi)嵌入到宿主音頻產(chǎn)品中的水印大小,單位是bps(bitspersecond)。bps值越大,說(shuō)明嵌入的水印越多;反之,說(shuō)明嵌入的水印較少。對(duì)于不同的應(yīng)用域,嵌入水印序列大小的要求不盡相同,通常要求音頻產(chǎn)品夠針對(duì)不同的場(chǎng)景,嵌入相應(yīng)大小的水印序列。
3 音頻水印互動(dòng)系統(tǒng)中的關(guān)鍵技術(shù)
3.1 音頻水印嵌入
3.1.1 音頻分幀處理
設(shè)原始音頻信號(hào)分段時(shí)每幀音頻信號(hào)的長(zhǎng)度為M,M的取值對(duì)算法性能的好壞有一定的影響。為了提高算法的感知透明性,使嵌入水印后的音頻信號(hào)在聽(tīng)覺(jué)上不被感知,可以說(shuō)M的取值越大越好。本算法中取每幀M=1024,嵌入水印的音頻信號(hào)與原始音頻信號(hào)相比在聽(tīng)覺(jué)上差異不明顯。
對(duì)每一個(gè)窗口進(jìn)行幀結(jié)構(gòu)處理:分幀處理,對(duì)于48kHz采樣頻率的音頻信號(hào),每1024個(gè)時(shí)間采樣點(diǎn)分為1幀,每一個(gè)完整的水印窗口為32幀,對(duì)這32幀在時(shí)域進(jìn)行漢明窗口函數(shù)重疊滾降,在這時(shí)間T內(nèi)要完成16bit信息的嵌入。
3.1.2 嵌入過(guò)程
將一個(gè)二值隨機(jī)序列wm作為待嵌入的信息位,這里記同步碼與信息位之和共N位,選取一段原始音頻作為掩護(hù)音頻F,其長(zhǎng)度為L(zhǎng)。
選取兩段不同的m序列:m1和m2作為擴(kuò)頻序列,其中m1作為對(duì)同步碼的擴(kuò)頻序列,m2作為對(duì)水印信息的擴(kuò)頻序列,對(duì)水印序列S進(jìn)行擴(kuò)頻,選擇的m序列可作為密鑰。擴(kuò)頻序列的長(zhǎng)度M,擴(kuò)頻后的序列為VS,長(zhǎng)度為“N×M”。
3.2 音頻水印檢測(cè)
3.2.1 初始化同步搜索
同步信息是4位的同步頭,嵌入時(shí)采用與水印信息不同的擴(kuò)頻碼序列。具體序列的選擇由密鑰唯一確定,而密鑰在嵌入與檢測(cè)兩端都是相同的。
概述來(lái)說(shuō),解碼時(shí),首先用已經(jīng)知道的同步擴(kuò)頻碼序列提取同步頭,當(dāng)解碼得到同步頭時(shí),用整個(gè)碼本所有的擴(kuò)頻序列分別去做相關(guān),得到相關(guān)最大的碼序列即為同步所使用的擴(kuò)頻碼序列;進(jìn)一步精細(xì)搜索,用這個(gè)同步擴(kuò)頻碼序列在這個(gè)位置的周?chē)瑒?dòng)提取相關(guān)值,得到相關(guān)值最大的位置確定為同步信號(hào)的嵌入位置。
3.2.2 置信度處理
根據(jù)嵌入端在特定子帶嵌入的規(guī)則,在檢測(cè)端可以單獨(dú)對(duì)某些子帶進(jìn)行處理,比如取前10個(gè)相關(guān)檢測(cè)峰值最高的子帶視為有效信息,其他子帶信息丟棄,對(duì)10個(gè)最優(yōu)檢測(cè)相關(guān)值進(jìn)行綜合判定。為可信度量提供充分的數(shù)據(jù)支持。對(duì)于解碼得到的水印數(shù)據(jù),為了確認(rèn)可信度較高的水印信息,同時(shí)丟棄可信度較低的水印信息。
基于冗余嵌入設(shè)計(jì)了可信度度量方法。假設(shè)水印信息在傳輸過(guò)程中沒(méi)有受到任何的干擾,則從兩組水印中解碼得到的水印應(yīng)該具有相同的符號(hào),即使用兩個(gè)擴(kuò)頻序列解碼并重新排列恢復(fù)后得到的水印數(shù)據(jù)應(yīng)該完全相同。隨著干擾的不斷增加,兩組水印數(shù)據(jù)中的不全部相同的位數(shù)開(kāi)始增加,因此兩組水印數(shù)據(jù)中不全部相同的位數(shù)已在一定程度上反映出水印信號(hào)的被干擾情況。此外,同步碼由于進(jìn)行了四倍的冗余,在一定程序上也提供了受干擾程度的反饋,可以作為置信度的一個(gè)參考。
結(jié)語(yǔ):當(dāng)前,數(shù)字音頻水印雖然取得了一些進(jìn)展,但也存在這一些問(wèn)題。一些算法設(shè)計(jì)時(shí)沒(méi)有考慮同步問(wèn)題,該問(wèn)題也是目前音頻水印技術(shù)中所要考慮的問(wèn)題之一。目前關(guān)于能夠同時(shí)進(jìn)行版權(quán)及內(nèi)容認(rèn)證的算法需求越來(lái)越多,因此進(jìn)行雙水印方案的研究很有必要。
參考文獻(xiàn)
[1] 何茜,趙景惠.數(shù)字水印算法研究[J].信息與電腦(理論版),2017,(7):82-83.
[2] 甘蓉.數(shù)字視頻水印技術(shù)淺析[J].電子測(cè)試,2018,390(9):126,128.
[3] 萬(wàn)旭光,劉凡.軍事通信中基于DCT域直流分量的音頻數(shù)字水印技術(shù)研究[J].現(xiàn)代電子技術(shù),2017,40(13):6-8.