蔡詠梅
(新疆財(cái)經(jīng)大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院,新疆 烏魯木齊830012)
數(shù)字水印技術(shù)可以實(shí)現(xiàn)數(shù)字媒體的版權(quán)保護(hù)問題,然而大多都進(jìn)行的是圖像數(shù)字水印研究,且算法成熟。胡青等[1]提出了一種基于小波變換和奇異值分解的水印算法,算法將水印信息量化后嵌入原始圖像小波低頻子帶分塊奇異值分解后的奇異向量中,水印提取無需原始圖像,可在密鑰和量化閾值控制下實(shí)現(xiàn)水印的盲提取。該算法含水印圖像透明性和魯棒性強(qiáng),尤其對(duì)JPEG 壓縮具有優(yōu)異的魯棒性。葉天語[2]提出了DWT-SVD 域全盲自嵌入魯棒量化水印算法。該算法先對(duì)原始圖像進(jìn)行DWT 變換,將變換后低頻子帶分成互不重疊的子塊,對(duì)每個(gè)子塊進(jìn)行SVD,判斷相鄰子塊最大奇異值的大小關(guān)系產(chǎn)生自嵌入特征水印序列,然后將自嵌入特征水印序列奇偶量化嵌入原始圖像小波低頻子帶每個(gè)子塊的最大奇異值,最后進(jìn)行SVD 合成和DWT 逆變換產(chǎn)生含水印圖像。
與靜止圖像水印技術(shù)相比,數(shù)字音頻水印具有更大的挑戰(zhàn)性。目前,數(shù)字音頻水印技術(shù)的研究也進(jìn)一步推進(jìn)。音頻數(shù)字水印算法 一 般 分 時(shí) 域[3,4]和 頻 域[5,6]兩 種,因 在 時(shí)域中嵌入水印,魯棒性較差,所以對(duì)音頻水印的研究大都集中在變換域,尤其以離散小波變換 (DWT)居多[7]。陳寅秋等[7]提出了一種基于SVD 和DWT 的音頻盲水印算法,將原始音頻數(shù)據(jù)進(jìn)行小波變換,提取低頻分量進(jìn)行奇異值分解,將置亂加密處理的水印圖像,嵌入到奇異值中,實(shí)現(xiàn)水印的嵌入過程。利用圖像置亂和奇異值分解方法,提高了水印的不可感知性,另外在水印的檢測與提取過程中不再需要原始載體數(shù)據(jù),是音頻盲水印,實(shí)驗(yàn)中未提及MP3壓縮,回聲攻擊。雷敏等[8]提出了基于DWT-DCTSVD 的音頻盲水印算法,該算法也首先對(duì)原始音頻分段,對(duì)每一段音頻進(jìn)行二級(jí)小波變換,將近似分量進(jìn)行余弦變換后進(jìn)行奇異值分解,將二值水印圖像降維嵌入奇異值矩陣中,算法的魯棒性和透明性較好,實(shí)驗(yàn)中未提及回聲攻擊。
冗余小波變換[9,10]較離散小波變換嵌入容量更大,魯棒性更強(qiáng),但目前國內(nèi)外對(duì)RDWT 在音頻水印中的研究較少。
本文將冗余小波變換引進(jìn)音頻水印處理,結(jié)合離散余弦變換和奇異值分解特性提出了基于RDWT-DCT-SVD 的音頻盲水印算法,并對(duì)該算法進(jìn)行了仿真實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明,該算法的透明性較好,對(duì)于重采樣、低通濾波、MP3壓縮、重量化、回聲、替換攻擊具有很強(qiáng)的魯棒性。
RDWT 冗余離散小波變換可以看作是連續(xù)小波變換的一種近似,是一種非正交的小波變換主要特性:
(1)冗余性,信號(hào)經(jīng)冗余離散小波變換時(shí)信號(hào)本身不進(jìn)行下抽樣處理,而是在每兩個(gè)濾波器系數(shù)間插入零值來實(shí)現(xiàn)濾波器的延展,因此,信號(hào)變換后的逼近信號(hào)和細(xì)節(jié)信號(hào)長度都與原信號(hào)長度相同,所以增加水印嵌入容量。
圖1 2級(jí)RDWT 和DWT 分解比較
(2)平移不變性,冗余離散小波變換各級(jí)分解中保持固定的采樣率,因此具有空間平移不變特性,魯棒性更強(qiáng)。
DCT 作為一種實(shí)數(shù)域變換,其變換核為實(shí)數(shù)的余弦函數(shù),主要特性:
(1)DCT 是一種正交變換,相對(duì)FFT 變換而言DCT變換后不產(chǎn)生虛部,便于水印的嵌入和強(qiáng)度控制。
(2)對(duì)音頻信號(hào)進(jìn)行小的干擾,DCT 的變換系數(shù)將不會(huì)發(fā)生大的變化,抗攻擊能力增強(qiáng)。
(3)能量保持與集中,DCT 變換前后音頻信號(hào)總能量保持不變。DCT 變換對(duì)能量重新分配,信號(hào)的大部分能量集中在少量低頻系數(shù)中。
SVD 是線性代數(shù)中非常有用的工具,能將矩陣對(duì)角化。它具有如下特性:
(1)任何一個(gè)實(shí)矩陣都可以進(jìn)行奇異值分解,分解成兩個(gè)正交矩陣和一個(gè)對(duì)角矩陣的乘積。
(2)矩陣的奇異值發(fā)生較小調(diào)整時(shí),逆變換后原矩陣不會(huì)發(fā)生較大改變。
(3)魯棒性好,當(dāng)矩陣發(fā)生較小變化時(shí),經(jīng)奇異值分解后的奇異值不會(huì)發(fā)生太大變化,對(duì)常規(guī)音頻信號(hào)的攻擊處理S矩陣具有較好的穩(wěn)定性。
RDWT-DCT-SVD音頻盲水印算法的思路是:首先對(duì)載體音頻進(jìn)行分段,對(duì)每一段音頻進(jìn)行二級(jí)RDWT 變換,將RDWT 變換后的逼近分量進(jìn)行一維DCT 變換,再將DCT 變換后的系數(shù)轉(zhuǎn)化為方陣,同時(shí)對(duì)此方陣進(jìn)行SVD 變換,得對(duì)角矩陣,水印圖像降維后嵌入相應(yīng)對(duì)角矩陣。
本算法選用二值水印圖像,載體音頻文件是一維的,為了將水印圖像成功嵌入音頻載體中,需要先對(duì)水印圖像進(jìn)行降維處理。水印圖像大小為N1×N2,水印圖像可以表示為W =Wi,j,0i<N,0j<N2,其中Wi,j∈ {0,1}??梢酝ㄟ^式 (1)完成降維操作
設(shè)原始音頻為A= {A1,A2,…,An},音頻水印嵌入方法如下:
(1)原始音頻分段:將分成N1×N2個(gè)幀,每幀的長度為1024樣點(diǎn),保證選取的音頻長度大于1024 N1×N2。
(2)RDWT 變換:matlab函數(shù)庫中沒有直接可調(diào)用的RDWT函數(shù),需要編寫。調(diào)用編譯成功的mrdwt函數(shù):[Al,Ah,L]=mrdwt(Ai,h,L)對(duì)每一段音頻信號(hào)進(jìn)行二級(jí)RDWT變換,得到低頻逼近分量Al和高頻分量Ah。
(3)DCT 和SVD 變換:對(duì)RDWT 變換后的Al分量進(jìn)行DCT 變換,利用vector2Matrix函數(shù)將變換后的前四分之一系數(shù)轉(zhuǎn)換成方陣,進(jìn)行奇異值分解,得到對(duì)角矩陣S。
(4)嵌入水印圖像:取出每一個(gè)對(duì)角矩陣的第一個(gè)值進(jìn)行判斷嵌入水印。
(5)SVD 逆變換,DCT 逆變換:將Sw逆變換后得到的Sw′轉(zhuǎn)換成一維向量,將一維向量進(jìn)行DCT 逆變換,得A1w。
(6)RDWT 逆變換,matlab函數(shù)庫中沒有直接可調(diào)用的IRDWT 函數(shù),需要編寫。調(diào)用編譯成功的mirdwt函數(shù)[Aiw,L]=mirdwt(Alw,Ah,h,L)進(jìn)行2級(jí)逆變換,得嵌入水印后的音頻分段。
(7)整合各音頻分段,得到嵌入水印的音頻文件Aw,輸出。
提取算法是嵌入算法的逆過程,提取步驟如下:
(1)嵌入水印音頻Aw 分段:將水印音頻分成N1×N2個(gè)幀,每幀的長度為1024樣點(diǎn)。
(2)RDWT 變換:調(diào)用mrdwt函數(shù)對(duì)每一段音頻信號(hào)進(jìn)行二級(jí)RDWT 變換,得到低頻逼近分量和高頻分量。
(3)DCT和SVD變換:對(duì)RDWT變換后的低頻逼近分量進(jìn)行DCT變換,利用vector2Matrix函數(shù)將變換后的前四分之一系數(shù)轉(zhuǎn)換成方陣,進(jìn)行奇異值分解,得到對(duì)角矩陣。
(4)提取水印圖像:取出每一個(gè)對(duì)角矩陣的第一個(gè)值進(jìn)行判斷提 取水印。接近偶數(shù)提取水印0信息,接近奇數(shù)提取水印1信息。對(duì)所有音頻分段進(jìn)行水印信息提取,得到水印信息。
(5)計(jì)算相關(guān)系數(shù)NC 和誤碼率BER:將提取出來的水印信息進(jìn)行vector2Matrix轉(zhuǎn)換,完成相關(guān)系數(shù)和誤碼率的計(jì)算。
本文采用大小為32×32的二值圖像作為水印圖像 (如圖2所示),音頻均選用常用wav格式,單聲道,采樣率為44100kHz,16bit編碼。為了有效驗(yàn)證本算法的透明性和魯棒性,實(shí)驗(yàn)選取了3類音頻文件人物對(duì)話、流行音樂和古典樂曲。
圖2 二值水印圖像
隱藏容量是評(píng)價(jià)水印性能的指標(biāo),即單位時(shí)間傳輸過程中所嵌入水印信息的比特?cái)?shù)。本文音頻文件的采樣頻率是44100Hz,音頻分段后,每幀1024個(gè)采樣點(diǎn),所以隱藏容量為44100/1024=43.07bps
為了檢測含水印音頻的透明性,可以將原始音頻和含水印音頻信號(hào)的波形圖進(jìn)行比較。圖3-圖5分別為人物對(duì)話、古典樂曲、流行音樂原始音頻和嵌入水印后的音頻文件波形圖。單從人眼觀察3類原始音頻和水印音頻波形圖,沒有區(qū)別,這部分透明性的檢測我們通過MOS值和信噪比SNR 進(jìn)行衡量,SNR 通過式 (2)計(jì)算可得。參數(shù)見表1
表1 模板圖像的性質(zhì)示例
主觀分析,MOS平均意見分大于4.5,客觀定量分析SNR 信噪比都大于20db。從實(shí)驗(yàn)數(shù)據(jù)分析可知透明較好。
本文采用常見的歸一化相關(guān)系數(shù)NC 和誤碼率BER 對(duì)水印的魯棒性進(jìn)行評(píng)價(jià)。NC 的計(jì)算式見式 (3),BER 的計(jì)算式見式 (4)
在魯棒性檢測實(shí)驗(yàn)中,對(duì)加載水印的音頻進(jìn)行如下攻擊,NC系數(shù)和BER 值見表2-表4。
(1)下采樣,44100Hz-22050Hz-44100Hz;
(2)高斯白噪聲,加載20dB的白噪聲;
(3)低通濾波,截至頻率為11025Hz;
(4)重量化,將16位音頻變?yōu)?位音頻,再重新量化為16位音頻;
(5)MP3 壓縮,分別對(duì)音頻信號(hào)進(jìn)行比特率為32kbps、64kbps、128kbps MP3壓縮處理;
(6)回聲處理,分別對(duì)音頻信號(hào)進(jìn)行延遲:延遲:0.05s,音量:10%處理;
(7)替換:隨機(jī)選取5段含水印的音頻,用添加高斯噪聲的相應(yīng)位音頻替換含水印音頻。
表2-表4給出了3種類型音頻信號(hào)加載水印攻擊后檢測出的相關(guān)系數(shù)和誤碼率。本文還進(jìn)行了音頻樣點(diǎn)值20%Aw 的攻擊,3種類型音頻文件攻擊后的相關(guān)系數(shù)均為1,誤碼率為0。表2中對(duì)嵌入水印人物音頻對(duì)話進(jìn)行攻擊平均誤碼率為0.0126,平均相似系數(shù)NC 為0.9882;表3中對(duì)嵌入水印古典樂曲進(jìn)行攻擊平均誤碼率為0.0160,平均相似系數(shù)NC為0.9864;表4中對(duì)嵌入水印流行音樂進(jìn)行攻擊平均誤碼率為0.0125,平均相似系數(shù)NC為0.9895;
表5列出了本文算法和現(xiàn)有算法在加載常見水印音頻攻擊后的誤碼率對(duì)照表。表中數(shù)據(jù)顯示該算法具有強(qiáng)魯棒性。
表5 不同算法攻擊后的魯棒性比較BER (%)
音頻數(shù)字水印研究中小波變換多用離散小波變換,本文嘗試將冗余離散小波變換引進(jìn)音頻數(shù)字水印研究中,冗余離散小波變換可以看作是連續(xù)小波變換的近似,是非正交的小波變換。相對(duì)離散小波變換它嵌入水印信息的容量更大,魯棒性更強(qiáng)。本文提出的基于RDWT 變換與DCT變換、SVD 變換相結(jié)合的音頻盲水印算法透明性和魯棒性好,較好的解決了透明性和魯棒性統(tǒng)一的問題。仿真實(shí)驗(yàn)結(jié)果表明,該算法對(duì)常規(guī)音頻攻擊具有較強(qiáng)的魯棒性,尤其是MP3壓縮、回聲和替換攻擊效果更佳。
[1]HU Qing,LONG Dongyang.Singular vector quantization watermarking scheme based on DWT-SVD [J].Computer Science,2011,38 (11):30-33 (in Chinese).[胡青,龍冬陽.基于DWT-SVD的奇異向量量化水印算法 [J].計(jì)算機(jī)科學(xué),2011,38 (11):30-33.]
[2]YE Tianyu.Perfectly blind self-embedding robust quantizationbased watermarking scheme in DWT-SVD domain [J].Journal of Image and Graphics,2012,17 (6):644-650 (in Chinese).[葉天語.DWT-SVD 域全盲自嵌入魯棒量化水印算法 [J].中國圖象圖形學(xué)報(bào),2012,17 (6):644-650.]
[3]Wen Nung Lie,Li Chun Chang.Robust and high-quality timedomain audio watermarking based on low-frequency amplitude modification [J].IEEE transactions on multimedia,2006,8(1):46-59.
[4]Harumi Murata,Akio Ogihara,Motoi Iwata,et al.Multiple embedding for time-domain audio watermarking based on lowfrequency amplitude modification [C]//The 23rd International Technical Conference on Circuits/Systems,Computers and Communications,2008:1461-1464.
[5]Pranab Kumar Dhar,Mohammad Ibrahim Khan,Jong-Myon Kim.A new audio watermarking system using discrete fourier transform for copyright protection [J].International Journal of Computer Science and Network Security,2010,10 (6):35-40.
[6]Kamalika Datta,Indranil Sengupta.A redundant audio watermarking technique using discrete wavelet transformation[C]//The Second International Conference on Communication Software and Networks,2010:27-31.
[7]CHEN Yinqiu,WU Xiangsheng.A blind watermarking based on SVD-DWT [J].Journal of Natural Science of Hunan Normal Uniersity,2009,32 (1):47-55 (in Chinese).[陳寅秋,伍祥生.基于SVD-DWT的音頻盲水印 [J].湖南師范大學(xué)自然科學(xué)學(xué)報(bào),2009,32 (1):47-55.]
[8]LEI Min,YANG Yu.An audio blind watermarking schenm based on DWT-DCT-SVD [J].Journal of Beijing University of Posts and Telecommunication,2011,34 (S1):51-54 (in Chinese). [雷敏,楊榆.基于DWT-DCT-SVD 的音頻盲水印算法 [J].北京郵電大學(xué)學(xué)報(bào),2011,34 (S1):51-54.]
[9]Nasrin M,Makbol Bee,Ee Khoo.Robust blind image watermarking scheme based on redundant discrete wavelet transform and singular value decomposition [J].International Journal of Electronics and Communications,2013,67 (2):102-112.
[10]Vatsa M,Singh R,Noore A.Feature based RDWT watermarking for multimodal biometric system [J].Image and Vision Computing,2009,27 (3):293-304.
[11]Xing s,kim hj,huang j,Audio watermarking robust against time-scale modification and mp3 compression [J].Signal Process,2008,88 (10):2372-2387.
[12]Zezula R,Misurec J.Audio digital watermarking algorithm based on SVD in MCLT domain [C]//Third International Conference on Systems,2008:140-143.
[13]Vivekananda B K,Indranil S,Abhijit D.An audio watermarking scheme using singular value decomposition and dithermodulation quantization [J].Multimedia Tools and Applications,2010,52 (2-3):369-383.