程格平
摘 要: 在高斯指紋系統(tǒng)中,指紋的嵌入與檢測(cè)須服從均方失真限制,以獲得較好的保真度。根據(jù)概率統(tǒng)計(jì)理論,分析了基于閾值相關(guān)檢測(cè)的傳統(tǒng)指紋方案中指紋編碼速率、均方失真限制以及共謀人數(shù)之間的關(guān)系,并指出閾值相關(guān)檢測(cè)方法的缺點(diǎn),即當(dāng)編碼速率大于容量范圍的某個(gè)值時(shí)檢測(cè)器性能較差。為了解決容量限制的問(wèn)題,提出一種在限定均方誤差的條件下取得數(shù)字指紋基本容量的高斯指紋方案。利用互信息游戲理論,提出最大懲罰高斯互信息的指紋檢測(cè)方法,有效地解決了傳統(tǒng)指紋檢測(cè)方法存在的問(wèn)題。根據(jù)指紋容量的數(shù)學(xué)模型,推導(dǎo)出指紋容量的表達(dá)式。
關(guān)鍵詞: 高斯指紋; 互信息理論; 指紋檢測(cè); 指紋容量
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1006-8228(2014)08-40-03
Gaussian fingerprinting scheme based on mutual information
Cheng Geping
(School of Mathematical and Computer Sciences, Hubei University of Arts and Science, Xiangyang, Hubei 441053, China)
Abstract: In Gaussian fingerprinting system, fingerprinting encoder and decoder must obey mean-squared distortion constraints to obtain better fidelity. According to the theory of probability and statistics, the fingerprinting code rate is analyzed with mean-squared distortion on constraint and the number of colluders on account of the normalized threshold decoder. The disadvantage of traditional fingerprinting decoding method by correlation decoder which has poor decoding performance when code rates greater than some value of capacity is introduced. To solve this problem, a Gaussian fingerprint scheme is proposed to achieve the fundamental capacity limits of digital fingerprint under the definite mean-squared distortion. By means of mutual-information game, the decoding method of maximum penalized Gaussian mutual information is presented. In the end, the expression of fingerprinting capacity is derived from the mathematical model.
Key words: Gaussian fingerprint; mutual-information theory; fingerprinting decoder; fingerprinting capacity
0 引言
數(shù)字指紋能夠用于叛逆者追蹤和版權(quán)保護(hù)。發(fā)行商將用戶指紋嵌入在數(shù)字產(chǎn)品中,然后分發(fā)給每個(gè)授權(quán)用戶,然而如果其中一組用戶聯(lián)合起來(lái)進(jìn)行共謀,通過(guò)處理他們的合法拷貝就可以生成一個(gè)包含共謀用戶弱指紋信息的偽本[1]。為了解決這個(gè)問(wèn)題,COX[2]等首先提出使用隨機(jī)選取且服從獨(dú)立同分布的高斯指紋作為用戶指紋,檢測(cè)時(shí)使用不公開的用戶指紋碼來(lái)追蹤共謀者,達(dá)到抵抗共謀攻擊的目的。
在共謀過(guò)程中,共謀者可能對(duì)他們的指紋拷貝采用線性攻擊、高斯噪聲和非線性攻擊策略。因此,共謀者檢測(cè)的基本問(wèn)題是如何優(yōu)化指紋系統(tǒng)的檢測(cè)性能。為了解決這個(gè)問(wèn)題,本文假設(shè)指紋嵌入和共謀引起的失真在一定的限制范圍,有文獻(xiàn)對(duì)基于有限字母表[3]和實(shí)數(shù)值[4]的指紋信號(hào)進(jìn)行了分析,指出高斯指紋對(duì)這些攻擊具有較好的抗共謀能力。文獻(xiàn)[5]利用互信息理論推導(dǎo)了指紋容量的上界,但沒(méi)有具體指出如何在歐幾里德集合中獲取這種界限的編碼方案。
基于互信息理論,本文針對(duì)高斯指紋模型提出一種指紋編碼方案,對(duì)檢測(cè)器性能進(jìn)行優(yōu)化,在可靠檢測(cè)基礎(chǔ)上得到指紋編碼速率的范圍。
1 問(wèn)題模型
假定檢測(cè)器已知宿主信號(hào)內(nèi)容和最大共謀人數(shù)Kmax,但不知道共謀者所采用的策略和共謀用戶人數(shù),檢測(cè)器能夠檢測(cè)出參與共謀的用戶。指紋系統(tǒng)模型可以從以下幾個(gè)方面進(jìn)行描述。
1.1 指紋生成和嵌入
假設(shè)宿主信號(hào)是實(shí)數(shù)空間上長(zhǎng)度為N的一個(gè)序列,即,且宿主信號(hào)對(duì)于共謀者未知。M(M?Kmax)個(gè)長(zhǎng)度為N的用戶指紋形成一個(gè)指紋碼本C={(U1,…,UM),C∈N},其中Ui=(u1,…,uN)是服從N(0,D1)的隨機(jī)序列,指紋碼的嵌入率為。嵌入指紋后第m個(gè)用戶的指紋拷貝可表示為:
Xm=S+Um, m∈{1,…,M} ⑴
碼本C獨(dú)立于宿主信號(hào)S。由此可得,即指紋信號(hào)的均方失真為D1。
1.2 攻擊模型
假定K(K?M)個(gè)共謀者選擇的無(wú)記憶性共謀通道為A(y|xk),以加入均值為0方差為D2的加性高斯噪聲的平均攻擊為例,共謀者聯(lián)合他們的拷貝經(jīng)過(guò)攻擊通道生成的共謀偽本Y可表示為:
⑵
其中W~N(0,D2)。共謀通道A須滿足式⑶兩個(gè)限制條件,即
局部不變限制:A(y|xk)=A(y-s|(x-s)k)
均方失真限制:
⑶
局部不變限制不需要考慮宿主信號(hào)S的統(tǒng)計(jì)模型,排除對(duì)宿主信號(hào)的過(guò)濾攻擊,簡(jiǎn)化了數(shù)學(xué)推導(dǎo)過(guò)程。如果指紋嵌入在分量近似獨(dú)立且與嵌入失真相關(guān)的宿主信號(hào)變換域,則此限定條件更加寬泛。均方失真限制條件表明失真是度量指紋信號(hào)質(zhì)量的標(biāo)準(zhǔn),用線性無(wú)偏估計(jì)量表示,其最大值為D2。另外,最優(yōu)的共謀攻擊須滿足可行性和公平性,即A(y|xπk)=A(y|xk),π為置換不變性因子,這說(shuō)明共謀集合中所有成員必須承擔(dān)同樣的風(fēng)險(xiǎn)。
1.3 檢測(cè)器模型
在指紋檢測(cè)過(guò)程中,宿主信號(hào)對(duì)檢測(cè)器是有效的。指紋檢測(cè)器輸出估計(jì)的共謀者集合,即:
⑷
其中,gN為獨(dú)立于S的檢測(cè)函數(shù)。如果檢測(cè)器輸出的集合為空集,則表明沒(méi)有發(fā)生共謀?,F(xiàn)有文獻(xiàn)的指紋檢測(cè)器多數(shù)采用閾值檢測(cè)統(tǒng)計(jì)量進(jìn)行檢測(cè),但這種檢測(cè)器是次優(yōu)的。
1.4 錯(cuò)誤概率與容量
在共謀攻擊通道,基于局部不變限制和均方失真限制的假設(shè),檢測(cè)器的兩種性能標(biāo)準(zhǔn)錯(cuò)誤肯定概率(控告一個(gè)無(wú)辜用戶)和錯(cuò)誤否定概率(不能抓住共謀者)的定義如下:
⑸
在失真限定條件下,如果存在一個(gè)碼本序列(N,2NR),當(dāng)N→∞時(shí),錯(cuò)誤肯定概率和錯(cuò)誤否定概率的利益成本函數(shù)近似為零,則指紋容量是所有可得指紋碼率R的最小上界,可靠指紋系統(tǒng)的指紋容量由參數(shù)(N,M,K,D1,D2)確定。
基于互信息理論,對(duì)Wang和Moulin[6]提出的碼率公式進(jìn)行改進(jìn),可得到指紋碼率的最大最小值,即:
⑹
其中C1(K)?C(K),當(dāng)且僅當(dāng)共謀人數(shù)K=1時(shí)兩個(gè)值相等。
2 傳統(tǒng)閾值檢測(cè)器
在實(shí)空間N上兩個(gè)隨機(jī)序列的歸一化相關(guān)系統(tǒng)定義為ρ(x,y)=,閾值為η的閾值檢測(cè)器滿足以下條件:
共謀攻擊后指紋信號(hào)和共謀偽本的歸一化相關(guān)系數(shù)概率收斂于:
⑺
假設(shè)對(duì)于任意小的正數(shù)ε,存在η=η1(Kmax)-ε。
下面對(duì)錯(cuò)誤肯定概率和錯(cuò)誤否定概率進(jìn)行分析。
2.1 錯(cuò)誤否定概率
根據(jù)上述條件可以得到隨機(jī)變量和的概率收斂到其期望值,分別為和。在共謀通道A,ρ(Xm,Y)最大值也是概率收斂的,即maxm∈Kρ(Xm,Y)?η1(K)?η+ε。因此,錯(cuò)誤否定概率的概率分布可表示為:
⑻
2.2 錯(cuò)誤肯定概率
對(duì)于任何不在共謀集中的無(wú)辜用戶,Xm和Y相互獨(dú)立。由香農(nóng)公式可得錯(cuò)誤肯定概率的概率分布:
⑼
其中,。
由于ε是任意小的正數(shù),E(η1(Kmax))=C1(Kmax),當(dāng)碼率R
3 基于互信息理論的檢測(cè)器
閾值檢測(cè)器的基本思想是,針對(duì)個(gè)體共謀成員的決策方式,當(dāng)R>C1(Kmax)時(shí),滿足條件ρ(Xm,Y)?η1的用戶指紋數(shù)為,導(dǎo)致虛警率的提高,進(jìn)而影響指紋檢測(cè)的可靠性。因此,實(shí)現(xiàn)對(duì)共謀者集合的聯(lián)合決策是提高指紋系統(tǒng)檢測(cè)性能的有效途徑。
根據(jù)互信息理論,歸一化相關(guān)系數(shù)為ρ的兩個(gè)高斯隨機(jī)變量X和Y的互信息為。如果Xk服從獨(dú)立同分布N(0,D1),W服從N(0,D2)且獨(dú)立于Xk,,其中,則指紋Xk與共謀偽本Y序列之間的高斯互信息表示為:
(10)
定義為指紋信號(hào)Xk的集合,指紋序列Xk的歸一化相關(guān)性滿足以下條件:
(11)
對(duì)于固定的K值和任意小ε的隨機(jī)球形碼,根據(jù)大數(shù)定理,當(dāng)N→∞時(shí),(11)式具有近似為1的概率。
設(shè)τ=C(Kmax)-ε,基于互信息的檢測(cè)器可表示為:
(12)
檢測(cè)器的輸出值對(duì)最大懲罰高斯互信息標(biāo)準(zhǔn)最大化。當(dāng)N→∞時(shí),隨機(jī)變量IG(Xk;Y)收斂于其數(shù)學(xué)期望值,即IG(Xk;Y)?KC(K)。τ的最大值為C(Kmax),因此當(dāng)指紋碼率R小于C(Kmax),檢測(cè)器能夠進(jìn)行可靠檢測(cè)。當(dāng)K→∞時(shí),C1(K)~C(K)~。
結(jié)合上述分析,對(duì)文獻(xiàn)[7]中的定理進(jìn)行改進(jìn)即可以得到指紋容量(即指紋編碼的最大碼率)為KmaxC(Kmax)。
4 結(jié)束語(yǔ)
針對(duì)指紋編碼和檢測(cè)的均方失真限制,本文基于互信息游戲理論,分析了傳統(tǒng)相關(guān)性指紋檢測(cè)方法的缺點(diǎn)。指紋容量是指紋系統(tǒng)的重要性能指標(biāo),針對(duì)傳統(tǒng)閾值檢測(cè)器存在的容量限制問(wèn)題,提出一種基于互信息理論的檢測(cè)方法。通過(guò)理論分析,有效獲得了指紋編碼的可獲得最大碼率,即指紋容量是指紋系統(tǒng)的最大共謀人數(shù)及其互信息值的乘積??梢钥闯觯诨バ畔⒗碚摰臋z測(cè)方法推導(dǎo)出的指紋容量要高于傳統(tǒng)閾值檢測(cè)器的容量界限。在數(shù)字指紋技術(shù)的研究領(lǐng)域,理論分析研究方法通常有一定的條件限制,因此,設(shè)計(jì)更加具有實(shí)效性的抗共謀指紋方案是未來(lái)指紋研究的發(fā)展方向。
參考文獻(xiàn):
[1] 呂述望,王彥,劉振華.數(shù)字指紋綜述[J].中國(guó)科學(xué)院研究生院學(xué)報(bào),
2004.3:289-298
[2] Cox I J, Kilian J, Leighton F T, et al. Secure spread spectrum
watermarking for multimedia[J]. Image Processing, IEEE Transactions on,1997.6(12):1673-1687
[3] Moulin P, O'Sullivan J A. Information-theoretic analysis of
information hiding[J].Information Theory, IEEE Transactions on,2003.49(3):563-593
[4] Kilian J, Leighton F T, Matheson L R, et al. Resistance of digital
watermarks to collusive attacks[C]//IEEE International Symposium on Information Theory. Institute of Electrical Engineers Inc(IEEE),1998:271-271
[5] Somekh-Baruch A, Merhav N. On the capacity game of private
fingerprinting systems under collusion attacks[J]. Information Theory, IEEE Transactions on,2005.51(3): 884-899
[6] Wang Y, Moulin P. Capacity and optimal collusion attack channels
for Gaussian fingerprinting games[C]//Electronic Imaging 2007. International Society for Optics and Photonics,2007:65050J-65050J-9.
[7] Moulin P. Universal fingerprinting: Capacity and random-coding
exponents[C]//Information Theory, 2008. ISIT 2008. IEEE International Symposium on. IEEE,2008:220-224