張 彪楊炳恒陳 強(qiáng)韓 玉
(1.中國(guó)人民解放軍海軍航空工程學(xué)院青島校區(qū)光學(xué)引導(dǎo)與監(jiān)控教研室,山東 青島432400;2.中國(guó)人民解放軍海軍航空工程學(xué)院青島校區(qū)教學(xué)科研辦,山東 青島432400)
網(wǎng)絡(luò)的發(fā)展促使網(wǎng)絡(luò)多媒體業(yè)務(wù)的興起。在圖像傳輸系統(tǒng)中,需要根據(jù)信道條件實(shí)時(shí)調(diào)整壓縮參數(shù),從而提高用戶的可感知質(zhì)量,這就需要獲得壓縮和傳輸后的圖像質(zhì)量,從而自適應(yīng)的控制編碼端參數(shù),達(dá)到提高系統(tǒng)整體質(zhì)量的目的。因此研究對(duì)數(shù)字圖像質(zhì)量進(jìn)行評(píng)估的方法一直備受關(guān)注。
數(shù)字圖像質(zhì)量評(píng)價(jià)方法[1]通常分為兩大類:主觀質(zhì)量評(píng)估(SQA)和客觀質(zhì)量評(píng)估(OQA)。主觀質(zhì)量評(píng)估是直接由觀察者對(duì)圖像質(zhì)量進(jìn)行主觀評(píng)價(jià),此方法最為準(zhǔn)確,但是需要提供嚴(yán)格的測(cè)試環(huán)境,實(shí)現(xiàn)起來步驟復(fù)雜、實(shí)時(shí)性差,不便于實(shí)時(shí)傳輸中圖像質(zhì)量的評(píng)估??陀^質(zhì)量評(píng)估[2]通過對(duì)圖像序列進(jìn)行一定的處理,根據(jù)所得到的信息作出評(píng)價(jià),該類方法相比于主觀質(zhì)量評(píng)測(cè)方法更易于實(shí)現(xiàn)。根據(jù)對(duì)原始圖像的依賴程度,客觀質(zhì)量評(píng)估又可以分為三類:全參考方法、部分參考方法、無參考方法。全參考和部分參考方法需要提供原始圖像的全部或者部分特征和信息作為評(píng)價(jià)參考,而無參考方法則無需原始圖像的任何信息。在圖像的壓縮和傳輸過程中,考慮到信道帶寬,往往無法實(shí)時(shí)獲取原始圖像信息,所以無參考質(zhì)量評(píng)價(jià)方法具有較高的應(yīng)用價(jià)值,對(duì)其的研究也是目前學(xué)術(shù)界研究的熱點(diǎn)之一,利用數(shù)字水印對(duì)圖像質(zhì)量進(jìn)行評(píng)價(jià)正是無參考質(zhì)量評(píng)價(jià)方法的一種。
圖像數(shù)字水印[3]是在原始圖像數(shù)據(jù)中按照一定的規(guī)律嵌入另一種信號(hào)(水?。?。由于圖像數(shù)據(jù)存在的冗余,且人眼對(duì)圖像中不同部分感知能力是不同的,因此可以利用這些特性在圖像中嵌入水印,同時(shí)又不影響人眼對(duì)圖像的主觀感受——不可見性成為衡量數(shù)字水印嵌入算法的一個(gè)重要指標(biāo)。圖像中嵌入信號(hào)量越多,圖像質(zhì)量下降越明顯,水印的不可見性越差;但是經(jīng)過攻擊后提取出來的水印質(zhì)量會(huì)較好,即水印的魯棒性較好。因此水印的不可見性和魯棒性二者是矛盾的,相互制約。如何平衡水印嵌入的強(qiáng)度(魯棒性)和嵌入后圖像質(zhì)量(不可見性)成為數(shù)字水印技術(shù)的關(guān)鍵[4]。
DCT域水印[5]能夠較好地平衡上述問題,是目前數(shù)字水印研究的熱點(diǎn)。DCT變換把空域信號(hào)變換到頻域中一個(gè)DC分量和一系列的AC分量,其中,DC分量表示原始圖像平均亮度,AC分量的每個(gè)系數(shù)均表示原始圖像在某一個(gè)頻率上的能量。經(jīng)過DCT反變換后,DC和AC系數(shù)中的各個(gè)頻率所表征的能量將均勻分配到原始圖像的各個(gè)系數(shù)中。對(duì)單個(gè)DC或AC系數(shù)的修改將會(huì)分散到原始圖像的各個(gè)像素值,從而避免了對(duì)原始圖像的某幾個(gè)像素值進(jìn)行修改所導(dǎo)致的大幅度失真,水印的魯棒性和不可見性都得到保證。但是在DCT域進(jìn)行水印嵌入需要首先對(duì)原始圖像進(jìn)行DCT變換,嵌入水印后再對(duì)圖像進(jìn)行反變換,算法復(fù)雜度較大??紤]到JPEG壓縮[6]時(shí),必須對(duì)圖像進(jìn)行DCT變換后再進(jìn)行量化和熵編碼,因此可以將水印嵌入過程和圖像壓縮過程相結(jié)合,從而節(jié)省計(jì)算量。
本文提出的算法其基本思想為:在圖像壓縮過程中,首先對(duì)圖像進(jìn)行DCT變換,在變換后的系數(shù)中嵌入水印信息;所得到系數(shù)再經(jīng)過量化和熵編碼得到壓縮碼流,通過信道傳輸至解碼端。解碼端獲得壓縮碼流后,經(jīng)過熵解碼,反量化后得到DCT系數(shù),從中提取出水印信息。將提取出的水印與原始水印進(jìn)行比較,得到提取水印的圖像質(zhì)量,再利用水印質(zhì)量與圖像質(zhì)量之間的關(guān)系式得到圖像質(zhì)量。由于嵌入的水印與原始圖像一樣經(jīng)歷了量化和信道誤碼等導(dǎo)致圖像質(zhì)量損失的過程,因此水印信號(hào)與圖像信號(hào)的受損程度之間是有著較大的關(guān)聯(lián)的,可以通過提取出的水印質(zhì)量獲取圖像質(zhì)量。
這里選擇要嵌入的水印為二值水印,二值水印中圖像像素只有“0”和“1”,與數(shù)據(jù)的奇偶性可以相互對(duì)應(yīng)。即“0”表示偶數(shù),“1”表示奇數(shù)。因此,可以通過判斷DCT系數(shù)均值的奇偶性,與水印對(duì)應(yīng)位的奇偶性相同時(shí),則不需要修改DCT系數(shù)。否則,通過對(duì)DCT系數(shù)作相應(yīng)的修改,從而達(dá)到修改均值奇偶性的目的。具體的水印嵌入算法如下:
第一步:將二值水印圖像轉(zhuǎn)變?yōu)槎M(jìn)制串;
第二步:將原始圖像進(jìn)行8×8分塊的DCT變換;
第三步:利用隨機(jī)數(shù)發(fā)生器,生成隨機(jī)數(shù)向量,并將其按從大到小的順序進(jìn)行排序。通過此方式獲得與排序后隨機(jī)數(shù)相對(duì)應(yīng)的位置向量,并選擇與二值水印長(zhǎng)度相同的前n個(gè)位置,作為水印嵌入塊的序號(hào);
第四步,對(duì)每個(gè)8×8的水印嵌入塊分別進(jìn)行DCT變換;接著將DCT系數(shù)按照Zig-Zag(如圖1中Zig-Zag排列圖)排列;求預(yù)先定義的所選頻率系數(shù)和的奇偶性,然后與二值水印(0或1)做比較,如果相同則不做修改;如果不同,則改變DCT系數(shù)值;這樣分別將二值水印二進(jìn)制串嵌入到源圖像的DCT塊中。
圖1 Zig-Zag排列圖
水印的嵌入公式:
其中d為量化因子(通過改變d的大小可以控制水印的嵌入強(qiáng)度),ROUND為取整函數(shù)(四舍五入),I為DCT系數(shù),I′為變換后的DCT系數(shù)。值得注意的是,上述水印嵌入算法僅針對(duì)Y分量進(jìn)行嵌入,對(duì)U,V兩分量是沒有影響的。
第一步:接收壓縮后的載體圖像,讀取載體圖像;
第二步:將二值水印圖像轉(zhuǎn)變?yōu)槎M(jìn)制串;
第三步:利用隨機(jī)數(shù)發(fā)生器,生成隨機(jī)數(shù)向量,并將其按從大到小的順序進(jìn)行排序。通過此方式獲得與排序后隨機(jī)數(shù)相對(duì)應(yīng)的位置向量,并選擇與二值水印長(zhǎng)度相同的前n個(gè)位置,作為水印提取塊的序號(hào);
第四步:對(duì)每個(gè)8×8的水印嵌入塊分別進(jìn)行DCT變換;接著將DCT系數(shù)按照Zig-Zag(如圖2.1中Zig-Zag排列圖)排列;求預(yù)先定義的所選頻率系數(shù)和的奇偶性。如果為偶數(shù),則提取水印對(duì)應(yīng)位為“0”,否則提取水印對(duì)應(yīng)位為“1”。
從上面的水印嵌入和提取算法可以看出,量化因子d控制著水印的嵌入強(qiáng)度,隨著量化因子d的增大,圖像質(zhì)量變差,水印圖像明顯;而當(dāng)d變小時(shí),水印易受到攻擊,提取出的水印無法表征原始圖像質(zhì)量,必須要選擇合適的d值。另一方面,DCT系數(shù)經(jīng)過Zig-Zag掃描后,靠前的系數(shù)屬于中低頻系數(shù),人眼對(duì)其較為敏感,而靠后的系數(shù)屬于高頻系數(shù),人眼對(duì)其不敏感。選擇在低頻系數(shù)中嵌入水印能夠提高水印的魯棒性,提取出的水印也可以較好的表征圖像質(zhì)量,但是將對(duì)圖像質(zhì)量造成較大的影響;而選擇中高頻系數(shù)嵌入水印,水印不可見性較好。但是在圖像量化的過程中,由于中高頻系數(shù)值一般較小,大部分的水印將隨著高頻系數(shù)被量化為0,水印魯棒性降低。因此需要確定合適量化因子d的取值以及在哪些頻率系數(shù)中嵌入水印,在本文后續(xù)章節(jié)中將逐一對(duì)這些問題進(jìn)行分析。
本節(jié)將通過實(shí)驗(yàn)分析量化因子對(duì)圖像質(zhì)量造成的影響,為了屏蔽壓縮所帶來的圖像失真,將不對(duì)圖像進(jìn)行壓縮。通過改變量化因子d,觀察提取水印相對(duì)于原始水印的錯(cuò)誤率(BER)變化情況和圖像峰值信噪比(PSNR)的變化情況;然后比較兩者隨d增大而改變得到的曲線,分析兩條曲線變化趨勢(shì),然后為d選擇合適的取值范圍。由于還未確定具體在DCT哪些系數(shù)中(后面均用range_dct表示要嵌入水印的DCT系數(shù)位置)嵌入的水印下,本實(shí)驗(yàn)在中頻、低頻、中低頻三種情況下嵌入水印。實(shí)驗(yàn)結(jié)果表明,上述三種嵌入策略嵌入水印后的BER曲線和PSNR曲線的變化趨勢(shì)基本都是相同的,因篇幅限制,在此僅給出在DCT低頻嵌入水印時(shí)的實(shí)驗(yàn)結(jié)果。
實(shí)驗(yàn)中所采用的載體圖像為標(biāo)準(zhǔn)測(cè)試圖像Lena,其幅面大小為512×512。圖1(a)表示按照Zig-Zag掃描順序在第2、3、4、5、6、7、8、9、10位嵌入水印,記為range_dct=2:10。(b)圖表示在第4、5、6、7、8位嵌入水印,記為range_dct=4:8。
圖1 DCT低頻位嵌入水印
由圖1可以看出,d的取值在5~6這一范圍時(shí),提取水印的BER是最小的,而PSNR又保持在大于50dB的范圍內(nèi)。因此d的取值為5或6是最可取的,而考慮到在圖像壓縮比較大的情況下會(huì)導(dǎo)致大量的水印由于量化系數(shù)過大而丟失,因此在嵌入水印時(shí),應(yīng)適當(dāng)?shù)募訌?qiáng)水印的嵌入強(qiáng)度,即加大量化因子d的值,以彌補(bǔ)這種損失。通過對(duì)圖1進(jìn)行分析,量化因子在5~20范圍內(nèi)時(shí),各種嵌入方案圖像的PSNR均大于40dB,因此選擇量化因子范圍為5~20。
在2.1節(jié)實(shí)驗(yàn)的基礎(chǔ)上,本節(jié)將通過考慮在取值范圍內(nèi)的各量化因子經(jīng)過圖像壓縮后的表現(xiàn)來確定量化因子的具體值。變化d的值分別為5、6、10、15、20,對(duì)圖像進(jìn)行不同程度的JPEG壓縮,Quality表示為圖像品質(zhì)因子,Quality值越大表明圖像壓縮率越低,經(jīng)過壓縮后的圖像質(zhì)量越高。通過實(shí)驗(yàn)可得到隨著Quality的變化,PSNR和BER的變化曲線。取經(jīng)過Zig-Zag掃描后的DCT系數(shù)的第4、5、6、7、8位嵌入水印,即range_dct=4:8(由于其他各種頻段嵌入策略與此方法所得到結(jié)果基本類似,實(shí)驗(yàn)結(jié)果不失一般性)。實(shí)驗(yàn)結(jié)果表明,當(dāng)d=5時(shí),隨著PSNR逐漸升高,BER逐漸降低,PSNR和BER兩條曲線的擬合程度最好;而當(dāng)d取其他值時(shí),BER的數(shù)據(jù)容易出現(xiàn)反復(fù),不能很好的體現(xiàn)PSNR和BER的關(guān)系,所以量化因子最優(yōu)取值應(yīng)為5。圖2為d取值為5和6時(shí)的BER與PSNR隨著質(zhì)量因子的變化而變化的曲線圖。
在確定了量化因子d的取值的基礎(chǔ)上,本節(jié)將通過實(shí)驗(yàn)確定采用哪些頻段系數(shù)進(jìn)行水印嵌入。
給定量化因子d=5,對(duì)圖像采用有損JPEG壓縮,得到各種嵌入策略的PSNR和BER隨著圖像質(zhì)量因子變化而變化的曲線,通過比較這兩種曲線的近似度,選擇PSNR和BER曲線圖擬合效果最佳的嵌入策略作為最終的嵌入策略。如2.1節(jié)所述,為了能夠使提取的水印表征載體圖像的質(zhì)量,選擇在中低頻系數(shù)中嵌入水印,因此可選的嵌入策略包括在低頻,中頻,中低頻這三個(gè)范圍內(nèi)進(jìn)行嵌入。本實(shí)驗(yàn)選取四種情況進(jìn)行實(shí)驗(yàn),分別是:(a)在DCT系數(shù)的第2、3、4、5、6、7、8、9、10位嵌入水印,(b)在DCT系數(shù)的4、5、6、7、8位嵌入水印,(c)在DCT系數(shù)的第12、14、16、18、20、22、24、26、28位嵌入水印,(d)在DCT系數(shù)的第4、6、8、11、15、21、26、28、32位嵌入水印。分別對(duì)應(yīng)圖3中(a)-(d)圖。
通過圖3可以發(fā)現(xiàn),當(dāng)取第4個(gè)到第8個(gè)DCT系數(shù)時(shí),BER與PSNR之間的擬和度最好,而在其他嵌入策略中,BER會(huì)有不同程度的反復(fù)。因此確定水印嵌入位置為原始DCT系數(shù)經(jīng)過Zig-Zag掃描后的第4個(gè)到第8個(gè)系數(shù)。在8×8大小的塊中的具體位置如圖4中黑色塊區(qū)域所示:
圖4 水印嵌入系數(shù)示意圖
綜合2.2和2.3節(jié)中的分析,最終確定水印嵌入時(shí)量化因子(水印嵌入強(qiáng)度)為d=5、選擇在DCT變換系數(shù)中的低頻系數(shù),即按照zigzag掃描順序的第4個(gè)到第8個(gè)系數(shù)進(jìn)行水印嵌入。
在上一節(jié)中對(duì)文中所提出的算法的幾個(gè)關(guān)鍵系數(shù)的選取進(jìn)行了分析,從而獲得了在保持水印不可見性下,能夠更好的反映圖像質(zhì)量變化的水印嵌入算法。本節(jié)將分析PSNR與BER之間的關(guān)系,并給出兩者具體的關(guān)系表達(dá)式,從而達(dá)到利用BER來估計(jì)圖像PSNR的目的。
由圖3(b),在d取5,DCT系數(shù)選擇4~8區(qū)間系數(shù)情況下,所獲得的PSNR與BER之間的關(guān)系圖可以看出:當(dāng)PSNR增大時(shí),BER會(huì)隨之減小,即PSNR和BER有很強(qiáng)的線性相關(guān)性。因此本算法將利用一階多項(xiàng)式來擬合PSNR與BER之間的關(guān)系,即:
通過線形擬合,計(jì)算得到:a1和a2分別為55.1797和-25.7508。即:
為證明算法可行性和驗(yàn)證實(shí)驗(yàn)結(jié)果準(zhǔn)確性,選取幅面為768×512的標(biāo)準(zhǔn)測(cè)試圖片Bird進(jìn)行算法驗(yàn)證。在Bird圖片中嵌入水印,然后對(duì)其進(jìn)行JPEG壓縮,獲得在不同質(zhì)量因子時(shí),圖像真實(shí)PSNR。從壓縮后的水印圖像中提取水印并得到提取水印的BER。利用式(4)求得預(yù)測(cè)PSNR′,并求得預(yù)測(cè)PSNR′與原始PSNR之間的差值。
圖5中(a)為原始宿主圖像,(b)為實(shí)驗(yàn)采用的幅面為72×44的二值水印圖像,(c)為JPEG壓縮因子(Quality)為60時(shí),嵌入水印后的圖像,(d)為對(duì)應(yīng)的水印提取圖像。對(duì)比(a)(c)兩幅圖像可以發(fā)現(xiàn),水印不可見性非常好,在(c)圖中看不出水印嵌入痕跡。
圖5 提取水印實(shí)驗(yàn)結(jié)果圖
計(jì)算Birds圖片分別在不同壓縮比情況下的PSNR和對(duì)應(yīng)的BER,然后用公式(4)直接得到PSNR′值,比較PSNR和PSNR′誤差δ,從而來判定水印算法的可行性。
表1 JPEG壓縮下的PSNR與估計(jì)值PSNR′
實(shí)驗(yàn)數(shù)據(jù)如表1所示:將實(shí)驗(yàn)數(shù)據(jù)帶入式(5)中求得誤差均值:
由上述結(jié)果可以看出,圖像經(jīng)過JPEG壓縮后,由BER得到的PSNR′可以較精確的估計(jì)圖像PSNR的真實(shí)值。
本文提出了一種提出了一種基于圖像DCT域嵌入水印的方法。該算法考慮DCT域的心理視覺模型和圖像壓縮對(duì)提取水印質(zhì)量的影響,將水印嵌入到分塊DCT域的中低頻段系數(shù)中,保證了水印的不可見性和魯棒性。通過大量實(shí)驗(yàn)和數(shù)據(jù),確定了水印嵌入的量化因子以及具體的中低頻系數(shù)嵌入?yún)^(qū)域,并得到了圖像峰值信噪比(PSNR)與水印的像素錯(cuò)誤率(BER)之間的線性關(guān)系。利用該線形關(guān)系對(duì)經(jīng)過JPEG壓縮后的圖像PSNR進(jìn)行預(yù)測(cè),結(jié)果表明本算法能夠比較準(zhǔn)確的對(duì)圖像質(zhì)量進(jìn)行估計(jì),平均估計(jì)誤差小于4%,可用于實(shí)時(shí)圖像壓縮傳輸系統(tǒng)中的視頻質(zhì)量評(píng)估。
[1]王新岱,楊付正.視頻質(zhì)量的主客觀評(píng)估方法研究[J].電視技術(shù),2003,254(8):81-84.
[2]殷曉麗,方向忠,翟廣濤.一種JPEG圖片的無參考圖像質(zhì)量評(píng)價(jià)方法[J].計(jì)算機(jī)工程與應(yīng)用,2006,18:79-81.
[3]Ingemar J.Cox,Matthew L.Miller,Jeffrey A.Bloom.數(shù)字水印[M].王穎,黃志蓓,譯.北京:電子工業(yè)出版社,2003:17-241.
[4]曹華.圖像和視頻水印嵌入新方法研究[J].武漢:華中科技大學(xué)圖書館,2006.
[5]Campisi Patrizioi,Carli Marco,Giunta Gaetano,et al.Blind quality assessment system for multimedia communications using tracing watermarking [J].IEEE Transaction on Signal Processing,2003,51(4):996-1002.
[6]Sheikh HR,Wang Z,Cormack L,et al.Blind quality assessment for JPEG2000 compressed images.Conference Record of the Asilomar Conference on Signals[J].Systems a nd Computers,2002:1735-1739.