王向陽(yáng) 牛盼盼 楊紅穎 李 麗
作為傳統(tǒng)加密方法的有效補(bǔ)充手段,數(shù)字水印(Digital watermarking)是一種可以在開(kāi)放的網(wǎng)絡(luò)環(huán)境下保護(hù)版權(quán)和認(rèn)證來(lái)源及完整性的新技術(shù),近年來(lái)已引起人們的高度重視,并成為國(guó)際學(xué)術(shù)界研究的一個(gè)熱點(diǎn)[1-3].依據(jù)水印信息所附載的數(shù)字媒體形式,人們習(xí)慣上將數(shù)字水印劃分為圖像水印、音頻水印、視頻水印、文本水印等.本文重點(diǎn)關(guān)注數(shù)字音頻水印技術(shù).
理論上講,數(shù)字水印技術(shù)應(yīng)同時(shí)滿(mǎn)足三項(xiàng)基本要求[4],即不可感知性、魯棒性、水印容量.其中,不可感知性是指嵌入的水印信息不應(yīng)該影響人對(duì)載體的感知效果;魯棒性則是指在對(duì)含水印載體進(jìn)行常規(guī)信號(hào)處理或幾何攻擊后依然能夠檢測(cè)出水印信息的能力;水印容量指的是單位區(qū)域或時(shí)間內(nèi)嵌入的水印比特?cái)?shù),顯然水印容量越大越好.不可感知性、魯棒性、水印容量是衡量一個(gè)數(shù)字水印算法優(yōu)劣的最重要指標(biāo),而這三方面卻又存在著固有的相互矛盾關(guān)系,三者之間的最佳平衡也成為數(shù)字水印算法所共同追求的目標(biāo)[4].
數(shù)字水印技術(shù)發(fā)展到今天,已有大量不同的數(shù)字水印算法.但遺憾的是,現(xiàn)有絕大多數(shù)數(shù)字水印方案往往著重關(guān)注數(shù)字水印的某一單項(xiàng)技術(shù)要求(不可感知性或魯棒性或水印容量),并相繼提出了不可感知水印、魯棒水印、大容量水印等方案[5-8],而沒(méi)有全面充分地考慮不可感知性、魯棒性、水印容量三者之間的最佳平衡問(wèn)題,從而嚴(yán)重影響了數(shù)字水印的隱藏效果.也就是說(shuō),現(xiàn)有絕大多數(shù)數(shù)字水印技術(shù)均無(wú)法有效同時(shí)滿(mǎn)足數(shù)字水印所需的三項(xiàng)基本要求.因此,可有效保持不可感知性、魯棒性、水印容量之間良好平衡的高性能數(shù)字水印算法研究仍然是一項(xiàng)富有挑戰(zhàn)性的工作.
一般說(shuō)來(lái),為全面提高數(shù)字水印的不可感知性、魯棒性和水印容量,應(yīng)該充分結(jié)合人類(lèi)視覺(jué)掩蔽特性與載體自身統(tǒng)計(jì)特性而進(jìn)行數(shù)字水印信息的嵌入與檢測(cè)[9].基于統(tǒng)計(jì)模型的變換域乘性水印較好地體現(xiàn)了上述思想,為有效解決不可感知性、魯棒性、水印容量之間良好平衡問(wèn)題提供了可能的解決方向[9].基于統(tǒng)計(jì)模型的變換域乘性水印工作原理為:在水印嵌入環(huán)節(jié),利用簡(jiǎn)單的乘性策略調(diào)制原始載體信號(hào),以保證水印嵌入強(qiáng)度與載體信號(hào)強(qiáng)度成一定比例變化,讓人更不容易察覺(jué),從而最大程度地平衡魯棒性和不可感知性;在水印檢測(cè)環(huán)節(jié),結(jié)合能夠充分體現(xiàn)載體自身特性的多尺度變換特性(多分辨率性、能量聚集性等),有效利用變換系數(shù)的統(tǒng)計(jì)特性而構(gòu)造數(shù)字水印檢測(cè)器,以檢測(cè)和提取數(shù)字水印信息.
近年來(lái),基于統(tǒng)計(jì)模型的高性能數(shù)字水印算法研究日益受到關(guān)注,并已廣泛應(yīng)用于數(shù)字圖像領(lǐng)域[10-12],但在數(shù)字音頻領(lǐng)域內(nèi)的應(yīng)用研究卻顯得相對(duì)滯后,且僅有的統(tǒng)計(jì)模型音頻水印方案檢測(cè)性能并不理想[13-17].Akhaee 等[14]首先將水印信息直接嵌入到原始載體的音頻樣本內(nèi),然后利用Gaussian 分布和Laplacian 分布對(duì)含水印音頻樣本進(jìn)行統(tǒng)計(jì)建模,同時(shí)結(jié)合極大似然方法估計(jì)統(tǒng)計(jì)模型參數(shù)并構(gòu)造數(shù)字水印檢測(cè)器.由于該算法估計(jì)模型參數(shù)時(shí)需要原始載體部分信息,屬于半盲方案,故不利于實(shí)際應(yīng)用.Majoul 等[15]結(jié)合廣義高斯分布(Generalized Gaussian distribution,GGD)與最大后驗(yàn)(Maximum a posteriori,MAP)參數(shù)估計(jì)理論,提出了一種基于統(tǒng)計(jì)模型的空間域音頻水印方案.然而,其數(shù)字水印檢測(cè)器的抗攻擊能力較弱.唐鑫等[16]利用高斯混合模型(Gaussian mixture model,GMM)刻畫(huà)數(shù)字音頻的DCT (Discrete cosine transform)域Mel 頻率倒譜系數(shù)(Mel-scale frequency cepstral coefficients,MFCC)統(tǒng)計(jì)特性,并使用變分貝葉斯方法估計(jì)GMM 模型參數(shù),同時(shí)結(jié)合最大似然檢驗(yàn)理論構(gòu)造了數(shù)字水印檢測(cè)器.Akhaee 等[17]以樣本累加統(tǒng)計(jì)(Cumulative sums tatistics)理論與中心極限定理為基礎(chǔ),提出了一種與載體音頻信號(hào)分布近似無(wú)關(guān)的極大似然數(shù)字水印檢測(cè)算法,但該檢測(cè)算法的時(shí)間復(fù)雜度很高.
本文以雙樹(shù)復(fù)數(shù)小波變換(Dual-tree complex wavelet transform,DT CWT)及隱馬爾科夫樹(shù)(Hidden Markov tree,HMT)理論為基礎(chǔ),提出了一種基于Weibull 向量HMT 模型的DT CWT域數(shù)字音頻盲水印算法.由于算法結(jié)合局部信息熵自適應(yīng)確定了數(shù)字水印嵌入位置、建立了可全面反映DT CWT 系數(shù)局部統(tǒng)計(jì)特性與多種相關(guān)性的Weibull 混合向量HMT 統(tǒng)計(jì)模型、設(shè)計(jì)了適合于非高斯與小樣本的局部最優(yōu)檢測(cè)器,故可獲得較好的工作性能.
本文結(jié)構(gòu)安排如下:第1 節(jié)全面分析了DT CWT 系數(shù)幅值的統(tǒng)計(jì)特性;第2 節(jié)給出了基于Weibull 混合分布的向量HMT 模型;第3 節(jié)和第4 節(jié)敘述了數(shù)字水印的嵌入和提取過(guò)程;第5 節(jié)給出了本算法的實(shí)驗(yàn)結(jié)果及對(duì)比結(jié)果;第6 節(jié)對(duì)全文進(jìn)行了總結(jié).
Kingsbury 等[18]首次提出了雙樹(shù)復(fù)小波變換(Dual-tree complex wavelet transform,DT CWT)概念,Selesnick 等[19]進(jìn)一步提出了DT CWT 的分解與重構(gòu)算法.由于DT CWT 具有近似平移不變、數(shù)據(jù)冗余有限、可完全重構(gòu)、計(jì)算效率高等優(yōu)良特性,故本文采用DT CWT 進(jìn)行數(shù)字音頻信號(hào)分解,并在此基礎(chǔ)上利用DT CWT 系數(shù)幅值進(jìn)行數(shù)字水印嵌入與水印檢測(cè)器構(gòu)造.
DT CWT 是在DWT 基礎(chǔ)上進(jìn)行了新的改進(jìn),由原來(lái)只使用一個(gè)濾波樹(shù)變?yōu)閮蓚€(gè),對(duì)于一維音頻信號(hào)而言,使用兩個(gè)濾波樹(shù)將獲得雙倍數(shù)量的DWT小波系數(shù).由于DT CWT 擁有近似的平移不變特性,當(dāng)輸入信號(hào)中存在小幅度偏移時(shí),各個(gè)尺度下DT CWT 系數(shù)幅值的能量分布幾乎保持不變.然而實(shí)驗(yàn)結(jié)果表明,絕大多數(shù)DT CWT 高頻系數(shù)幅值接近于零,即其體現(xiàn)了明顯的高峰拖尾特點(diǎn).同時(shí),其峰度值遠(yuǎn)大于高斯分布的峰度值3,表明DT CWT 高頻系數(shù)幅值具有明顯的非高斯分布特性.韋伯(Weibull)分布[20]是上世紀(jì)40 年代Wallodi Weibull 提出的一種具有封閉形式的概率密度函數(shù)(Probability density function,PDF),其PDF 曲線(xiàn)拖尾厚重,沖激特性明顯.對(duì)于隨機(jī)變量,Weibull分布的概率密度函數(shù)一般形式為
其中,x為隨機(jī)變量,且有 0<x <∞;a與b分別表示W(wǎng)eibull 分布中的形狀與尺度參數(shù),并且a >0,b >0.大量研究表明,Weibull 分布非常適合用來(lái)建模具有高尖峰、長(zhǎng)拖尾分布特征的隨機(jī)變量,故在包括圖像檢索、數(shù)字水印在內(nèi)的諸多統(tǒng)計(jì)建模中得到了廣泛應(yīng)用.
鑒于DT CWT 高頻系數(shù)幅值分布具有明顯的高峰拖尾特點(diǎn),而Weibull 分布能夠更加準(zhǔn)確地描述出這種拖尾性質(zhì),因此本文采用Weibull 分布,對(duì)DT CWT 高頻系數(shù)幅值進(jìn)行建模并構(gòu)造數(shù)字水印檢測(cè)器.
近年來(lái),研究者普遍關(guān)注并利用了變換域系數(shù)幅值的高尖峰重拖尾非高斯性,但不同程度忽略了變換系數(shù)幅值之間的強(qiáng)依賴(lài)性(多種相關(guān)性).事實(shí)上,DT CWT 系數(shù)幅值間存在著子帶內(nèi)、尺度間、分解樹(shù)間等多種相關(guān)性.其中,子帶內(nèi)相關(guān)性是指在同一分解子帶內(nèi),每個(gè)DT CWT 系數(shù)幅值與其附近鄰域內(nèi)的DT CWT 系數(shù)幅值密切相關(guān).尺度間相關(guān)性是指某一分解子帶內(nèi)的DT CWT 系數(shù)幅值與其上一尺度對(duì)應(yīng)的DT CWT 系數(shù)幅值密切相關(guān).分解樹(shù)間相關(guān)性是指不同分解樹(shù)(即樹(shù)A和樹(shù)B)相同位置上的DT CWT 系數(shù)幅值間密切相關(guān).為說(shuō)明DT CWT 系數(shù)幅值間所存在的子帶內(nèi)、尺度間、分解樹(shù)間等多種相關(guān)性,以下采用Chi-plot工具[21]分析了DT CWT 域系數(shù)幅值間的相互依賴(lài)關(guān)系.圖1 給出了數(shù)字音頻的DT CWT 域系數(shù)幅值子帶內(nèi)、尺度間、分解樹(shù)間Chi-plot 圖.不難看出,圖1 所示3 幅Chi-plot 圖中的大多數(shù)點(diǎn)都比較集中且較大地偏離水平線(xiàn),其說(shuō)明DT CWT 域系數(shù)幅值之間存在較強(qiáng)的子帶內(nèi)、尺度間、分解樹(shù)間相關(guān)特性.
圖1 DT CWT 域系數(shù)幅值的子帶內(nèi)、尺度間、分解樹(shù)間Chi-plot 圖Fig.1 Chi-plot to illustrate the different degrees of dependence between intraband,interscale and dual-tree,DT CWT coefficient pairs
Crouse 等[22]所提出的小波域HMT 模型是基于樹(shù)結(jié)構(gòu)的概率圖模型,其優(yōu)勢(shì)在于能夠利用簡(jiǎn)單樹(shù)型結(jié)構(gòu)有效捕獲內(nèi)部尺度之間的從屬特點(diǎn),進(jìn)而全面描述小波系數(shù)在尺度間、尺度內(nèi)的統(tǒng)計(jì)相關(guān)性.對(duì)于數(shù)字音頻的DT CWT 而言,不僅其DT CWT系數(shù)幅值與它的父節(jié)點(diǎn)幅值同樣存在樹(shù)狀結(jié)構(gòu)特點(diǎn),而且其不同分解樹(shù)相同位置上的DT CWT 系數(shù)幅值密切相關(guān).受小波域HMT 思想啟發(fā),本文根據(jù)DT CWT 系數(shù)幅值的分布特性與DT CWT系數(shù)幅值的多種相關(guān)性,建立了如圖2 所示的基于Weibull 混合分布的DT CWT 域向量HMT 模型.
圖2 DT CWT 域向量HMT 模型Fig.2 Vector HMT model in DT CWT domain
在圖2 所示的DT CWT 域向量HMT 模型中,實(shí)心點(diǎn)表示DT CWT 系數(shù)幅值,空心點(diǎn)表示DT CWT 系數(shù)幅值所處的狀態(tài).為敘述方便,作如下約定:在具有M種狀態(tài)(m=1,2,···,M,本文選取M=2)的HMT 結(jié)構(gòu)中,i表示任一結(jié)點(diǎn),j表示尺度,xij表示該結(jié)點(diǎn)的DT CWT 系數(shù)幅值,Sij表示該結(jié)點(diǎn)系數(shù)幅值所對(duì)應(yīng)的隱狀態(tài),p(i)表示該結(jié)點(diǎn)的父結(jié)點(diǎn),且該結(jié)點(diǎn)所在樹(shù)結(jié)構(gòu)的根結(jié)點(diǎn)為Np(i),其系數(shù)幅值所對(duì)應(yīng)的隱狀態(tài)為Sp(i).鑒于在Sij=m條件下,xij滿(mǎn)足Weibull PDF,因此有尺度參數(shù)和形狀參數(shù),則DT CWT 系數(shù)幅值的邊緣分布可定義成如下形式
上式的含義是,已知父結(jié)點(diǎn)ρ(i),且其隱狀態(tài)變量Sρ(i)的值為m′,與之相對(duì)應(yīng)的子結(jié)點(diǎn)i,其隱狀態(tài)變量Sij的值為m的條件概率.
不難看出,以上DT CWT 域HMT 結(jié)構(gòu)僅僅利用Weibull 混合模型,描述與刻畫(huà)了DT CWT系數(shù)幅值的非高斯性與尺度相關(guān)性.
其中,p1為初始狀態(tài)概率;A2,···,AJ為狀態(tài)轉(zhuǎn)移概率矩陣;和為Weibull PDF 的尺度參數(shù)和形狀參數(shù);表示用于刻畫(huà)DTCWT 域系數(shù)幅值分解樹(shù)間相關(guān)性的協(xié)方差矩陣.J表示分解尺度數(shù),M表示狀態(tài)數(shù).對(duì)基于Weibull 混合分布的DT CWT 域向量HMT 模型參數(shù),本文擬采用HMT-EM 算法迭代進(jìn)行最優(yōu)估計(jì),其具體計(jì)算過(guò)程如下:
步驟1.初始化模型參數(shù)集 Θ=Θ0,并令迭代計(jì)數(shù)器l=0;
步驟2.E 步驟:對(duì)參數(shù)集 Θl的隱狀態(tài)變量S,計(jì)算其概率質(zhì)量函數(shù)P(Sij|x,Θl)與P(Sij,Sρ(i)|x,Θl);
步驟3.M 步驟:更新HMT 模型的參數(shù);
步驟4.令l=l+1,如果參數(shù)集 Θ 收斂則停止,否則返回步驟 2.
本文選取DT CWT 域分解樹(shù)A的第2 尺度高頻子帶作為水印嵌入?yún)^(qū),并將數(shù)字水印信息嵌入到局部信息熵較大的DT CWT 高頻系數(shù)段內(nèi),以期同時(shí)提高數(shù)字水印的不可感知性和魯棒性.
假設(shè)原始數(shù)字音頻信號(hào)為A={a(i),1≤i ≤L}.其中,L為音頻數(shù)據(jù)的個(gè)數(shù),a(i)∈{0,1,2,···,2p-1}是第i個(gè)音頻數(shù)據(jù)的幅度值,p為表示每個(gè)數(shù)據(jù)所使用的比特?cái)?shù).假設(shè)二值水印圖像為W={w(i,j),1≤i ≤I,1≤j ≤J}.其中,w(i,j)∈{0,1}代表二值水印圖像的第i行、第j列象素值.則數(shù)字水印嵌入過(guò)程可描述如下.
為消除二值水印圖像的像素空間相關(guān)性,提高數(shù)字水印算法的安全性和魯棒性,以確保含水印音頻某一部分受到破壞后仍能全部或部分地恢復(fù)出二值水印圖像,本文首先采用了Arnold 變換對(duì)二值水印圖像進(jìn)行置亂加密.接下來(lái),再對(duì)置亂后的二值水印圖像進(jìn)行降維處理,即將置亂后的二值水印圖像轉(zhuǎn)換為一維二進(jìn)制水印序列:W={wk}(k=1,2,···,N),N=I ×J,以便于將二維的水印圖像嵌入到一維的數(shù)字音頻信號(hào)中.
對(duì)原始載體音頻做二級(jí)DT CWT 分解,以得到分解樹(shù)A和分解樹(shù)B.其中,分解樹(shù)A和分解樹(shù)B均包含有1 個(gè)低頻子帶和2 個(gè)高頻子帶.為了取得不可感知性和魯棒性的良好平衡,本文選取分解樹(shù)A的尺度2 高頻子帶用于水印嵌入與水印檢測(cè).
信息熵是系統(tǒng)有序化程度的一個(gè)度量,Shannon 將其定義為離散隨機(jī)事件的出現(xiàn)概率.本質(zhì)上講,信息熵是一種特征的統(tǒng)計(jì)形式,它反映了信源中所含有信息量的多少.近年來(lái),信息熵理論已廣泛應(yīng)用于物理、數(shù)學(xué)、統(tǒng)計(jì)、計(jì)算機(jī)等眾多領(lǐng)域.在信號(hào)處理方面,信息熵可以估測(cè)信號(hào)所含有的平均信息量,普遍認(rèn)為信號(hào)中熵值越大的區(qū)域,需要獲取的信息量就越大,這種局部區(qū)域通常被認(rèn)作是顯著性局域(即重要區(qū)域).
鑒于數(shù)字音頻樣本(值)具有相互獨(dú)立性,而信息熵能夠從顯著性角度估計(jì)特征位置及其周?chē)畔?進(jìn)而獲得更多的數(shù)字音頻關(guān)鍵內(nèi)容,故本文引入局部信息熵描述數(shù)字音頻的內(nèi)容特征,并據(jù)此確定出適合水印嵌入的重要DT CWT 系數(shù)段.具體步驟如下:
步驟1.構(gòu)造局部DT CWT 系數(shù)段.所謂局部DT CWT 系數(shù)段,是指以分解樹(shù)A尺度2 高頻子帶中的每個(gè)DT CWT 高頻系數(shù)為標(biāo)識(shí),從尺度2高頻子帶中分割出的一部分子系數(shù).為了減少計(jì)算量,本文以每個(gè)DT CWT 高頻系數(shù)為標(biāo)識(shí),選取出其前面D/2 個(gè)高頻系數(shù)和后面D/2 個(gè)高頻系數(shù)組成局部DT CWT 系數(shù)段.
步驟2.計(jì)算每個(gè)DT CWT 系數(shù)段的局部信息熵.首先計(jì)算出局部系數(shù)段中DT CWT 系數(shù)幅值x(i)(i=1,···,D)在整個(gè)局部系數(shù)段中所出現(xiàn)的概率,即
然后計(jì)算出DT CWT 系數(shù)段的局部信息熵,即
由上述定義知,局部信息熵與相應(yīng)DT CWT系數(shù)的鄰域系數(shù)幅值密切相關(guān),其反映了局部系數(shù)段內(nèi)DT CWT 系數(shù)幅值的離散程度.對(duì)于局部信息熵較大的DT CWT 系數(shù)段,其DT CWT 系數(shù)幅值離散小,說(shuō)明DT CWT 系數(shù)幅值分布較均勻.反之,對(duì)局部信息熵較小的DT CWT 系數(shù)段,其DT CWT 系數(shù)幅值散度大,說(shuō)明DT CWT 系數(shù)幅值分布較不均勻.局部信息熵表征了局部音頻所含信息量的多少.局部信息熵越大的DT CWT 系數(shù)段所含信息量越多,CWT 系數(shù)幅值分布無(wú)序程度越低.反之,局部信息熵越小的DT CWT 系數(shù)段所含信息量越少,相應(yīng)的DT CWT 系數(shù)幅值分布無(wú)序程度越高.
步驟3.選取重要局部DT CWT 系數(shù)段.選取局部信息熵較大的前N個(gè)局部DT CWT 系數(shù)段,用以水印嵌入與檢測(cè).
其中,α為水印嵌入強(qiáng)度,xki和yki分別表示原始DT CWT 高頻系數(shù)幅值和含水印DT CWT 高頻系數(shù)幅值,i=1,2,···,D,k=1,2,···,I ×J.
重復(fù)上述數(shù)字水印嵌入步驟,直到分解樹(shù)A的尺度2 高頻子帶中所有局部重要DT CWT 系數(shù)段處理完畢為止.最后,用含水印局部重要DT CWT系數(shù)段替換掉原始的局部重要DT CWT 系數(shù)段,并進(jìn)行逆DT CWT,即可得到含水印數(shù)字音頻信號(hào).
本文將以局部最大勢(shì)(Locally most power,LMP)檢驗(yàn)理論為基礎(chǔ),結(jié)合基于Weibull 混合分布的DT CWT 域向量HMT 模型,首次構(gòu)造出可有效提取水印信息的多相關(guān)局部最優(yōu)水印檢測(cè)器(Locally optimum decoder,LOD).數(shù)字水印檢測(cè)可以看作二元假設(shè)問(wèn)題,在此假設(shè)下,H1和 H0分別表示DT CWT 系數(shù)幅值嵌入“1”及嵌入“0”時(shí)的假設(shè),可以表示為
其中,α為水印嵌入強(qiáng)度,wk表示水印信息位,,且為含水印DT CWT 系數(shù)段,xki和yki分別表示原始DT CWT 高頻系數(shù)幅值和含水印DT CWT高頻系數(shù)幅值.
對(duì)于含水印DT CWT 系數(shù)段中的系數(shù)幅值yki,可根據(jù)最大似然統(tǒng)計(jì)理論,將水印檢測(cè)器設(shè)計(jì)轉(zhuǎn)化為如下決策表達(dá)式
其中,fY(·)表示含水印系數(shù)幅值在兩種假設(shè)下的條件概率.
分別對(duì)上式兩邊取自然對(duì)數(shù),并經(jīng)過(guò)移項(xiàng)后可得到如下對(duì)數(shù)似然比,即LOD 檢測(cè)器勢(shì)函數(shù)
由局部最大勢(shì)(LMP)檢驗(yàn)理論知,LOD 檢測(cè)器將在水印嵌入強(qiáng)度α=0 時(shí),使其勢(shì)函數(shù)(檢測(cè)概率)的斜率達(dá)到最大[23],于是可得到LOD 檢測(cè)統(tǒng)計(jì)量
其中,g1,g0分別表示嵌入函數(shù)y1(x)=x(1+α)和y0(x)=x的反函數(shù).
鑒于數(shù)字水印信息屬于弱信號(hào),且該弱信號(hào)不會(huì)改變?cè)糄T CWT 高頻系數(shù)幅值的統(tǒng)計(jì)特性,即可認(rèn)為含水印DT CWT 高頻系數(shù)幅值仍符合Weibull 向量HMT 分布.于是,將基于 Weibull混合分布的DT CWT 域向量HMT 的PDF(即式(5))代入LOD 檢測(cè)統(tǒng)計(jì)量(即式(13)),可得到式(14).
其中,Zk見(jiàn)式(16).
本文所提出的數(shù)字音頻水印算法屬于盲水印算法,其水印檢測(cè)過(guò)程無(wú)需原始載體、原始水印等輔助信息.整個(gè)數(shù)字水印提取過(guò)程如下:
步驟1.對(duì)含水印數(shù)字音頻做二級(jí)DT CWT分解,并選取分解樹(shù)A的尺度2 高頻子帶用于水印提取.
步驟2.利用分解樹(shù)A和B的尺度2 和尺度1高頻子帶的DT CWT 系數(shù)幅值,構(gòu)造基于Weibull混合分布的DT CWT 域向量HMT 模型并利用EM 算法進(jìn)行模型參數(shù)估計(jì),同時(shí)采納第4.1 節(jié)中的方法構(gòu)造局部最優(yōu)數(shù)字水印檢測(cè)器.
步驟3.采用類(lèi)似于第3.3 節(jié)的工作步驟,在分解樹(shù)A的尺度2 高頻子帶中確定重要DT CWT系數(shù)段.
步驟4.利用步驟2 所構(gòu)造的局部最優(yōu)數(shù)字水印檢測(cè)器,從重要DT CWT 系數(shù)段中提取出水印信息位.
步驟5.重復(fù)步驟4,即對(duì)每個(gè)重要DT CWT系數(shù)段進(jìn)行水印提取,可以得到一維水印序列
步驟6.對(duì)W*做升維與逆Arnold 變換,即可獲得最終的二維水印圖像
為驗(yàn)證本文音頻水印算法的有效性,以下給出了算法的工作性能檢測(cè)、不可感知性檢測(cè)和魯棒性檢測(cè)結(jié)果,同時(shí)與文獻(xiàn)[5,7-8,17]進(jìn)行了對(duì)比.實(shí)驗(yàn)中,本文選取了10 段5 種不同風(fēng)格的數(shù)字音頻信號(hào)進(jìn)行性能測(cè)試,包括Popular、Classical、Speech、Rock、Jazz 等.其中,每段音頻信號(hào)都是波形格式(Wave format)的單聲道音頻,采樣率為44.1 kHz,量化精度為16 bits,樣本長(zhǎng)度為20 s.數(shù)字水印采用大小為32×32 像素的二值圖像.這里,所有測(cè)試數(shù)據(jù)均是在操作系統(tǒng)為64 位Win 7、CPU 為4 核Intel(R)Core (TM)i5-4590、主頻為3.30 GHz、內(nèi)存為16.0 GB 的PC 機(jī)HP Pro 680 G1 TW 上獲得,且所使用的運(yùn)算平臺(tái)為MATLAB 7.12.0.
由數(shù)字水印嵌入原理知,局部DT CWT 系數(shù)段長(zhǎng)度(D)將影響整個(gè)算法的工作性能.為合理選取局部DT CWT 系數(shù)段長(zhǎng)度,本文利用10 段5 種不同風(fēng)格的數(shù)字音頻信號(hào),給出了實(shí)驗(yàn)參數(shù)D與算法平均工作性能的關(guān)系,即在不同局部DT CWT系數(shù)段長(zhǎng)度下,整個(gè)水印系統(tǒng)的平均峰值信噪比(Peak signal to noise ratio,PSNR)(dB)、平均比特出錯(cuò)概率(Bit error ratio,BER)(%)、平均水印嵌入時(shí)間(s)以及平均水印提取時(shí)間(s)等工作性能,如表1 所示.
表1 測(cè)試結(jié)果表明,當(dāng)局部DT CWT 系數(shù)段長(zhǎng)度D設(shè)定為60 時(shí),可以獲得較好的水印算法工作性能.
表1 不同系數(shù)段長(zhǎng)度下整個(gè)水印系統(tǒng)的工作性能 (水印容量為1 024 位)Table 1 Performance of the watermarking system in different coefficient lengths (watermark capacity is 1 024 bits)
本文首次結(jié)合局部最大勢(shì)檢驗(yàn)與DT CWT域Weibull 混合向量HMT 統(tǒng)計(jì)建模理論,構(gòu)造了可有效提取數(shù)字水印信息的多相關(guān)局部最優(yōu)水印檢測(cè)器(Locally optimum decoder,LOD).這里,本文對(duì)LOD 水印檢測(cè)器工作性能進(jìn)行了評(píng)測(cè),并與常用的最大似然(Maximum likelihood,ML)檢測(cè)器進(jìn)行了對(duì)比.實(shí)驗(yàn)中,首先從測(cè)試音頻內(nèi)任意選取一個(gè)局部重要DT CWT 系數(shù)段,并將水印信息位“1”或“0”嵌入到其DT CWT 系數(shù)幅值中.然后分別計(jì)算每個(gè)DT CWT 系數(shù)幅值的LOD、ML檢測(cè)響應(yīng)值及檢測(cè)閾值.由數(shù)字水印檢測(cè)原理知,如果該DT CWT 系數(shù)段的累積響應(yīng)值大于累積閾值(即響應(yīng)曲線(xiàn)與閾值曲線(xiàn)所圍成面積大于0),則判斷該DT CWT 系數(shù)段嵌入了水印信息位“1”;否則(即響應(yīng)曲線(xiàn)與閾值曲線(xiàn)所圍成面積小于0),判斷該系數(shù)段嵌入了水印信息位“0”.同時(shí),響應(yīng)曲線(xiàn)與閾值曲線(xiàn)所圍成面積(絕對(duì)值)越大,則說(shuō)明檢測(cè)響應(yīng)效果越好,即水印檢測(cè)器工作能力越強(qiáng).
圖3 給出兩種假設(shè)下,LOD 檢測(cè)器和ML 檢測(cè)器的水印提取結(jié)果.圖3 評(píng)測(cè)結(jié)果表明,本文所提出的LOD 檢測(cè)器及目前普遍使用的ML 檢測(cè)器均能準(zhǔn)確提取出水印信息,但LOD 檢測(cè)器的靈敏度明顯高于ML 檢測(cè)器.因?yàn)長(zhǎng)OD 檢測(cè)響應(yīng)曲線(xiàn)與閾值曲線(xiàn)所圍成面積(絕對(duì)值)遠(yuǎn)大于ML 檢測(cè)響應(yīng)曲線(xiàn)與閾值曲線(xiàn)所圍成面積.
圖3 兩種數(shù)字水印檢測(cè)器(LOD 和ML)的檢測(cè)響應(yīng)結(jié)果Fig.3 The test results of LOD watermark detector and ML watermark detector under various attacks
表2 利用10 段5 種不同風(fēng)格的數(shù)字音頻信號(hào),給出了水印容量與算法平均工作性能的關(guān)系,即不同水印容量(包括64 位、256 位、1 024 位及4 096 位)下,整個(gè)水印系統(tǒng)的平均PSNR (dB)、平均BER (%)、平均水印嵌入時(shí)間(s)以及平均水印提取時(shí)間(s)等工作性能.從表2 實(shí)驗(yàn)數(shù)據(jù)可以得出,隨著水印容量增大,PSNR 不斷下降,BER 與嵌入提取時(shí)間持續(xù)增加.考慮到原則上應(yīng)該保證理想不可感知性前提下水印容量越大越好,而在數(shù)字水印容量為32×32 時(shí),水印提取效果達(dá)到了比較好的平衡,因此本文選取了32×32 像素的二值圖像水印.
表2 不同水印容量下整個(gè)水印系統(tǒng)的工作性能(局部重要系數(shù)段長(zhǎng)度為60)Table 2 Performance of the watermarking system in different watermark capacities (coefficient length is 60)
為了更加直觀地顯示數(shù)字水印的感知透明性,圖4 給出了原始載體音頻、含水印數(shù)字音頻以及音頻差值波形圖.同時(shí),本文還采用PSNR 和PEAQ(Perceptual evaluation of audio quality)客觀評(píng)價(jià)了原始數(shù)字音頻與含水印數(shù)字音頻信號(hào)之間的差別.其中,PEAQ評(píng)價(jià)模型首先將參考信號(hào)和失真信號(hào)通過(guò)感知聲學(xué)模型模擬人對(duì)音頻信號(hào)的感知,然后認(rèn)知模型將感知聲學(xué)模型輸出值在時(shí)域和頻域進(jìn)行綜合產(chǎn)生一系列模型輸出變量,最后通過(guò)一個(gè)人工神經(jīng)網(wǎng)絡(luò),計(jì)算出最終的客觀差異等級(jí)(Objective difference grade,ODG),其含義如表3 所示.表4 給出了不同風(fēng)格數(shù)字音頻信號(hào)的感知透明性客觀評(píng)價(jià)結(jié)果.
表3 客觀聽(tīng)覺(jué)測(cè)試區(qū)分度ODG Table 3 Objective difference grades
表4 感知透明性與魯棒性客觀評(píng)價(jià)Table 4 Objective evaluation of perceived transparency and robustness
從圖4 不難看出,在保證完全正確提取水印的情況下(原始水印與提取的水印完全一致),嵌入水印前后波形圖改變較小,基本保持一致.而從圖4(e)差值波形中,更可直觀地看出宿主音頻在嵌入水印后,與原始音頻相比變化很小,說(shuō)明本算法具有較好的不可感知性.
圖4 原始音頻、含水印音頻和差值音頻波形圖Fig.4 The waveform of original audio,watermarked audio,and difference audio
為驗(yàn)證本文算法的魯棒性,這里對(duì)含水印音頻進(jìn)行了一系列攻擊實(shí)驗(yàn),包括重新量化(Requantization)、重新采樣(Resampling)、疊加噪聲(Additive of Gaussian noise)、添加回聲(Echo addition)、低通濾波(Lowpass filtering)、MP3 壓縮(MP3 compression)等常規(guī)信號(hào)處理,及隨機(jī)剪切(Random cropping)、幅值改變(Amplitude scaling)、抖動(dòng)(Jittering)等去同步攻擊.圖5 給出了本文算法的魯棒性能測(cè)試結(jié)果,包括所提取出的數(shù)字水印、BER(%)等.
圖5 本文算法的魯棒性能測(cè)試結(jié)果Fig.5 The watermark detection results for various attacks
為充分客觀地評(píng)價(jià)本文算法的有效性,以下對(duì)本文算法與文獻(xiàn)[5,7-8,17]的水印檢測(cè)性能進(jìn)行了對(duì)比.表5~8 給出了10 段5 種不同風(fēng)格的數(shù)字音頻信號(hào)的平均檢測(cè)性能.對(duì)比實(shí)驗(yàn)中,采用了相同大小的數(shù)字水印容量(1 024 位).
表5 不同算法的平均檢測(cè)性能對(duì)比(本文算法和文獻(xiàn)[8])Table 5 Comparison of average detection performance of different schemes (our scheme and [8])
以上實(shí)驗(yàn)結(jié)果表明:本文算法不僅具有較好的不可感知性,而且能夠抵抗大部分常規(guī)信號(hào)處理(如重新量化、重新采樣、疊加噪聲、添加回聲、低通濾波、MP3 壓縮等)及部分去同步攻擊(如隨機(jī)剪切、幅度縮放、抖動(dòng)等),較好地解決了不可感知性、魯棒性、水印容量之間的良好平衡問(wèn)題.這是因?yàn)楸疚乃惴?1)引入局部信息熵描述數(shù)字音頻的內(nèi)容特征,并據(jù)此自適應(yīng)確定了適合水印嵌入的重要DT CWT 系數(shù)段(位置);2)結(jié)合DT CWT 系數(shù)幅值分布及多種相關(guān)特性,建立了預(yù)測(cè)能力更強(qiáng)的基于Weibull 混合分布的DT CWT 域向量HMT統(tǒng)計(jì)模型,并有效估計(jì)了統(tǒng)計(jì)模型參數(shù);3)以局部最大勢(shì)能檢驗(yàn)理論為基礎(chǔ),首次構(gòu)造了適合于非高斯與小樣本的可有效提取水印信息的多相關(guān)局部最優(yōu)水印檢測(cè)器.
本文以雙樹(shù)復(fù)數(shù)小波變換(Dual-tree complex wavelet transform,DT CWT)及隱馬爾科夫樹(shù)(Hidden Markov tree,HMT)理論為基礎(chǔ),結(jié)合DT CWT 系數(shù)幅值分布及多種相關(guān)特性,提出了一種基于Weibull 向量HMT 模型的DT CWT域數(shù)字音頻盲水印算法.該算法利用局部信息熵刻畫(huà)數(shù)字音頻內(nèi)容并依此自適應(yīng)確定水印嵌入位置,同時(shí)將水印信息乘性嵌入到DT CWT 高頻系數(shù)幅值內(nèi).進(jìn)行數(shù)字水印檢測(cè)時(shí),首先根據(jù)DT CWT 系數(shù)幅值的非高斯分布特性及DT CWT 系數(shù)的子帶內(nèi)、方向間、尺度間等多種相關(guān)特性,建立起基于Weibull 混合分布的DT CWT 域向量HMT 統(tǒng)計(jì)模型并估計(jì)出其模型參數(shù),然后根據(jù)局部最大勢(shì)能檢驗(yàn)理論,利用基于Weibull 混合分布的DT CWT 域向量HMT 統(tǒng)計(jì)模型參數(shù),構(gòu)造出多相關(guān)局部最優(yōu)數(shù)字水印檢測(cè)器并盲提取水印信息.仿真實(shí)驗(yàn)結(jié)果表明,本文算法不僅具有較好的不可感知性,而且能夠抵抗大部分常規(guī)信號(hào)處理(如重新量化、重新采樣、疊加噪聲、添加回聲、低通濾波、MP3 壓縮等)及部分去同步攻擊(如隨機(jī)剪切、幅度縮放、抖動(dòng)等),較好地解決了不可感知性、魯棒性、水印容量之間的良好平衡問(wèn)題,其總體性能優(yōu)于現(xiàn)有同類(lèi)方案.
表6 不同算法的平均檢測(cè)性能對(duì)比(本文算法和文獻(xiàn)[5])Table 6 Comparison of average detection performance of different schemes (our scheme and [5])
表7 不同算法的平均檢測(cè)性能對(duì)比(本文算法和文獻(xiàn)[7])Table 7 Comparison of average detection performance of different schemes (our scheme and [7])
表8 不同算法的平均檢測(cè)性能對(duì)比(本文算法和文獻(xiàn)[17])Table 8 Comparison of average detection performance of different schemes (our scheme and [17])