牛亞坤 趙 耀 李曉龍
(1.北京交通大學(xué)信息科學(xué)研究所,北京 100044;2.現(xiàn)代信息科學(xué)與網(wǎng)絡(luò)技術(shù)北京市重點(diǎn)實(shí)驗(yàn)室,北京 100044)
隨著信息技術(shù)的迅速發(fā)展和數(shù)碼產(chǎn)品的普及,以數(shù)字圖像為代表的多媒體已經(jīng)成為人們?nèi)粘I钪兄匾囊曈X信息載體,被廣泛應(yīng)用于新聞報(bào)道、司法鑒定、理賠保險(xiǎn)和科學(xué)發(fā)現(xiàn)等領(lǐng)域。數(shù)字圖像的廣泛應(yīng)用也促進(jìn)了多媒體編輯軟件的蓬勃發(fā)展,例如Photoshop、美圖秀秀、美顏相機(jī)等。利用這些編輯工具,人們對(duì)數(shù)字圖像內(nèi)容修改變得簡便快捷且能達(dá)到以假亂真的效果。然而,這些技術(shù)在給人們生活帶來方便的同時(shí)也會(huì)造成一定的困擾和危害。一些具有不良目的的惡意用戶會(huì)對(duì)圖像內(nèi)容進(jìn)行非法操作,以達(dá)到制造虛假新聞、欺詐勒索、提供司法偽造證據(jù)等一系列違法犯罪活動(dòng)的目的??梢?,數(shù)字圖像所傳遞的信息并不總是真實(shí)可靠、惡意偽造圖像不僅擾亂治安穩(wěn)定而且危害國家安全。因此,對(duì)數(shù)字圖像內(nèi)容真實(shí)性和完整性認(rèn)證已經(jīng)成為多媒體信息安全領(lǐng)域亟需解決的問題。在此背景下,數(shù)字圖像被動(dòng)取證技術(shù)應(yīng)運(yùn)而生,旨在利用圖像的固有屬性認(rèn)證其原始性和真實(shí)性、對(duì)偽造區(qū)域定位以及分析操作歷史[1]。該技術(shù)不需要預(yù)先對(duì)數(shù)字圖像嵌入標(biāo)識(shí)性信息,而是通過直接地分析圖像內(nèi)容本身,從而實(shí)現(xiàn)盲取證的目的,成為多媒體信息安全領(lǐng)域的熱門研究方向。
JPEG作為通用的壓縮標(biāo)準(zhǔn),被廣泛應(yīng)用到數(shù)碼相機(jī)和編輯軟件。大多數(shù)社交平臺(tái),例如微信、Facebook 等也需要對(duì)上傳的圖像進(jìn)行JPEG 壓縮以便存儲(chǔ)和傳輸。因此,對(duì)JPEG 圖像進(jìn)行取證具有現(xiàn)實(shí)意義。另外,對(duì)JPEG 圖像進(jìn)行篡改會(huì)留下特殊的壓縮效應(yīng),分析這些效應(yīng)能夠更好的鑒定圖像真實(shí)性以及定位篡改區(qū)域。本文旨在對(duì)現(xiàn)有JPEG圖像相關(guān)的取證技術(shù)進(jìn)行介紹、歸納和分析,以期為研究人員提供一份詳盡的進(jìn)展報(bào)告,推動(dòng)相關(guān)領(lǐng)域的發(fā)展。
標(biāo)準(zhǔn)的JPEG 壓縮過程包括編碼和解碼階段,如圖1 所示。在編碼階段,一幅圖像首先被分解為不重疊8 × 8 大小的塊X1,然后對(duì)每個(gè)塊進(jìn)行離散余弦變換(Discrete Cosine Transform,DCT)得到DCT系數(shù):
接著使用量化矩陣對(duì)DCT 系數(shù)進(jìn)行量化得到量化系數(shù)[Y1/Q](也稱JPEG 系數(shù))。其中,[?]為四舍五入取整操作,Q為8 × 8 大小的量化矩陣,其包含64 個(gè)量化步長qi∈N,i∈{0,…63}。最后對(duì)量化系數(shù)進(jìn)行熵編碼。量化誤差發(fā)生在編碼階段中,它是JPEG壓縮信息損失的主要原因。在解碼階段,首先從碼流中讀取量化系數(shù),然后對(duì)其反量化,得到
接著對(duì)Z1進(jìn)行逆向的DCT 操作(Inverse DCT,IDCT),得到反變換系數(shù):
由于數(shù)字圖像像素的灰度級(jí)在[0,255]之內(nèi),需要對(duì)U1進(jìn)行取整和截?cái)?,得到解壓縮圖像:
其中RT(?)為取整和截?cái)嗖僮?。解碼過程中會(huì)產(chǎn)生取整誤差和截?cái)嗾`差。JPEG 圖像中的各種誤差、DCT 系數(shù)分布等均屬于自身的“固有指紋”,任何的篡改方式都會(huì)在一定程度上破壞它們的統(tǒng)計(jì)特性并且留下特殊的痕跡,因此可以通過分析這些“固有指紋”的完整性和一致性對(duì)圖像真實(shí)性進(jìn)行鑒別。
對(duì)JPEG 圖像進(jìn)行篡改時(shí),拼接區(qū)域可能來自未壓縮圖像或另一幅JPEG 圖像,完成拼接后篡改圖像還需要第二次壓縮。這樣拼接圖像中原始區(qū)域和拼接區(qū)域會(huì)出現(xiàn)壓縮歷史不一致性,即原始區(qū)域經(jīng)歷兩次壓縮,但拼接區(qū)域卻經(jīng)歷一次壓縮(拼接區(qū)域來自JPEG 圖像時(shí),壓縮期間DCT 網(wǎng)格較大概率是非齊方式,也會(huì)呈現(xiàn)一次壓縮現(xiàn)象)。另外,在隱蔽通信場(chǎng)景中,秘密信息被嵌入后,攜密的JPEG 圖像仍需進(jìn)行第二次壓縮進(jìn)而出現(xiàn)雙重壓縮現(xiàn)象。因此,可以通過檢測(cè)雙重壓縮進(jìn)行篡改區(qū)域定位以及隱寫分析。此外,分別從雙重JPEG 壓縮圖像中估計(jì)初次量化矩陣和從解壓縮圖像中估計(jì)量化矩陣能夠提供更加全面的信息用于進(jìn)一步的取證分析。利用壓縮次數(shù)、JPEG 壓縮中的誤差、DCT 系數(shù)直方圖和量化矩陣等“固有指紋”不一致性還可以對(duì)拼接區(qū)域檢測(cè)和定位。因此,JPEG圖像取證可以劃分為:雙重JPEG 壓縮檢測(cè)、量化矩陣估計(jì)和JPEG圖像拼接檢測(cè)與定位。
根據(jù)兩次JPEG 壓縮使用的量化矩陣是否一致,壓縮可以分為不同量化矩陣和相同量化矩陣的雙重JPEG 壓縮。對(duì)于不同量化矩陣的雙重JPEG壓縮檢測(cè),研究學(xué)者已經(jīng)提出眾多有效的方法,其可以被分為基于手工特征和基于卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)的方法。
對(duì)于基于手工特征的方法,Popescu 和Farid[2]首次發(fā)現(xiàn)雙重壓縮圖像的量化系數(shù)直方圖會(huì)出現(xiàn)周期性的峰值和峰谷現(xiàn)象,稱為雙量化(Double Quantization,DQ)效應(yīng)。通過對(duì)量化系數(shù)直方圖傅里葉變換測(cè)量周期性然后用于檢測(cè)雙重JPEG 壓縮。但當(dāng)?shù)谝淮螇嚎s的質(zhì)量因子較大時(shí),該方法將會(huì)失效。另外,當(dāng)兩次壓縮之間存在裁剪操作時(shí)則不存在DQ 效應(yīng)。Fu 等人[3]觀測(cè)到單次壓縮圖像的交流(Alternating Current,AC)系數(shù)首數(shù)字的分布遵循廣義的Benford定律,然后利用首數(shù)字直方圖用于雙重JPEG 壓縮檢測(cè)。然而,一些AC 通道的系數(shù)分布并不能很好的遵循該定理,Li 等人[4]提出選擇一些特定AC 通道的量化系數(shù)并利用首數(shù)字特征解決該檢測(cè)問題。遺憾的是,上述兩種基于首數(shù)字的方法在質(zhì)量因子大于95時(shí),檢測(cè)性能會(huì)顯著降低。這是因?yàn)閱未螇嚎s和雙重壓縮圖像的首數(shù)字直方圖分布的差異較小。Giudic 等人[5]通過對(duì)DCT 系數(shù)首數(shù)字的深入分析,指出通過1-D 的DCT 變換得到的首數(shù)字特征用于雙重壓縮檢測(cè)要比2D 的DCT 變換更加有效。
不同于上述基于手工特征的方法,一系列基于CNN 的方法近些年被提出,顯著提升了雙重JPEG壓縮檢測(cè)的性能。Park等人[6]對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練時(shí)考慮了不同類型的量化表,并將DCT 系數(shù)直方圖和量化矩陣同時(shí)作為網(wǎng)絡(luò)的輸入,能夠適用于混合質(zhì)量因子的雙重壓縮檢測(cè)。Ahn 等人[7]提出一種端到端包含3D 卷積核的網(wǎng)絡(luò)結(jié)構(gòu),使用反量化系數(shù)直方圖以及利用特征尺度改變策略結(jié)合量化矩陣訓(xùn)練該網(wǎng)絡(luò)。Hussain 等人[8]提出一種兩階段的檢測(cè)小尺寸圖像塊雙重壓縮的方法。第一個(gè)階段采用具有64個(gè)核的DCT輔助層,第二個(gè)階段是由多個(gè)卷積塊組成的深度網(wǎng)絡(luò),能夠更加有效的提取DCT 系數(shù)信息。
目前,現(xiàn)有方法能夠很好解決不同量化矩陣雙重JPEG 壓縮檢測(cè)問題,即使對(duì)小尺寸的圖像塊,也能取得較高精度的檢測(cè)性能。但當(dāng)?shù)谝淮螇嚎s時(shí)的質(zhì)量因子大于第二次或兩次壓縮之間存在縮放、裁剪和旋轉(zhuǎn)操作時(shí),上述兩類方法的檢測(cè)性能會(huì)大幅度降低,甚至失效。
當(dāng)使用相同量化矩陣對(duì)圖像進(jìn)行連續(xù)壓縮時(shí),單次壓縮圖像和雙重壓縮圖像之間圖像內(nèi)容的變化較小,可利用的統(tǒng)計(jì)信息也較少,因此對(duì)相同量化矩陣的雙重JPEG 壓縮檢測(cè)更具有挑戰(zhàn)性。Huang 等人[9]觀察到相鄰兩次壓縮圖像間不同量化系數(shù)的個(gè)數(shù)在連續(xù)的壓縮過程中會(huì)呈現(xiàn)單調(diào)遞減現(xiàn)象。在此基礎(chǔ)上,設(shè)計(jì)了一種隨機(jī)擾動(dòng)策略用于獲得一個(gè)與圖像相關(guān)的閾值。通過比較該閾值和不同量化系數(shù)的個(gè)數(shù)進(jìn)而識(shí)別雙重JPEG 壓縮。盡管該方法簡單有效,但存在兩種問題:1)對(duì)于一些圖像,特別是對(duì)于低質(zhì)量壓縮的圖像,不同量化系數(shù)的個(gè)數(shù)單調(diào)遞減的趨勢(shì)并不明顯,因此很難找到合適的系數(shù)修改比例,進(jìn)而導(dǎo)致檢測(cè)的失效;2)隨機(jī)擾動(dòng)策略只是無差別的對(duì)任意的量化系數(shù)進(jìn)行修改,然而修改不同位置的系數(shù)對(duì)檢測(cè)的結(jié)果影響較大。為了解決上述問題,Niu 等人[10]提出一種增強(qiáng)的隨機(jī)擾動(dòng)策略,首次指出截?cái)嗾`差是該檢測(cè)問題的關(guān)鍵,提出只對(duì)值為1 和-1 的量化系數(shù)進(jìn)行修改,大幅度提升原始隨機(jī)擾動(dòng)策略的性能。以上基于隨機(jī)擾動(dòng)策略的方法的不足是檢測(cè)結(jié)果具有隨機(jī)性且不平衡。Yang等人[11]發(fā)現(xiàn)在JPEG 壓縮過程中,對(duì)于存在取整或截?cái)嗾`差的圖像塊,單次壓縮圖像中誤差的最大值和平均值要大于雙重壓縮圖像。然后,分別利用直流(Direct Current,DC)和AC通道取整和截?cái)嗾`差的方差和均值當(dāng)作13-D 特征進(jìn)行檢測(cè)雙重壓縮。Niu 等人[12]將用相同量化矩陣重復(fù)壓縮的過程簡化為反量化系數(shù)Zk的鏈,如圖2所示。其中Q&D 表示量化和反量化過程,k表示壓縮次數(shù)。通過理論分析得出圖像連續(xù)壓縮時(shí)誤差分量和量化系數(shù)分量隨著壓縮次數(shù)增加趨向于收斂,最后從誤差和量化系數(shù)分量分別提取用于檢測(cè)的15-D 特征。由于對(duì)彩色圖像進(jìn)行JPEG 壓縮時(shí)需要從RGB 空間轉(zhuǎn)換到Y(jié)CbCr空間,在此過程中會(huì)出現(xiàn)轉(zhuǎn)換誤差。Wang 等人[13-14]提出利用顏色轉(zhuǎn)換誤差檢測(cè)彩色圖像相同量化矩陣的雙重JPEG 壓縮檢測(cè)。
若干基于CNN 的方法也陸續(xù)被提出用于相同量化矩陣雙重JPEG 壓縮檢測(cè)任務(wù)。Huang 等人[15]將JPEG 壓縮中的誤差作為CNN 的輸入得到62-D特征,最后合并文獻(xiàn)[11]中的13-D特征用于檢測(cè)雙重JPEG 壓縮。與文獻(xiàn)[10]中的方法不同,Harish等人[16]使用連續(xù)壓縮產(chǎn)生的誤差與其對(duì)應(yīng)的DCT 系數(shù)作為網(wǎng)絡(luò)的輸入。現(xiàn)有相同量化雙重JPEG 壓縮檢測(cè)的方法的匯總?cè)绫?所示??梢钥闯鎏卣骶S度在逐漸增加,分類器由傳統(tǒng)的SVM 逐漸向深度網(wǎng)絡(luò)過度,檢測(cè)的對(duì)象也由灰度圖擴(kuò)展到彩色圖像。雖然相同量化矩陣的雙重壓縮檢測(cè)已經(jīng)取得了較大的進(jìn)展,但現(xiàn)有的大多數(shù)方法并沒有充分利用單次和雙重JPEG 壓縮之間的統(tǒng)計(jì)差異,進(jìn)而限制了雙重壓縮的檢測(cè)性能,特別是對(duì)于低質(zhì)量因子的情況。此外,現(xiàn)有方法缺乏對(duì)JPEG 壓縮中截?cái)嗾`差和量化系數(shù)的理論分析,填補(bǔ)這些空白將有助于進(jìn)一步提升檢測(cè)的準(zhǔn)確率。
表1 相同量化矩陣的雙重JPEG壓縮檢測(cè)方法匯總Tab.1 Summary of detection methods for double JPEG compression with the same quantization matrix
對(duì)JPEG 圖像進(jìn)行解壓縮以及重復(fù)對(duì)JPEG 圖像壓縮時(shí),解壓縮圖像的量化矩陣和雙重JPEG 壓縮圖像中第一次的量化矩陣通常無法從JPEG 頭文件中直接獲取,因此估計(jì)上述兩種情況下的量化矩陣將有助于進(jìn)一步的取證分析。
由于解壓縮JPEG 圖像的DCT 系數(shù)分布與量化步長有關(guān),如圖3 所示。圖中為質(zhì)量因子QF=85 時(shí)通道(1,4)對(duì)應(yīng)量化步長為5的DCT系數(shù)分布,從中看出系數(shù)主要集中于量化步長的整數(shù)倍范圍以內(nèi)。因此,可以從DCT 系數(shù)直方圖中估計(jì)到量化步長。Luo 等人[17]首次對(duì)JPEG 壓縮中的量化誤差、取整和截?cái)嗾`差進(jìn)行分析,得出DCT 系數(shù)主要分布在量化步長倍數(shù)[-1,1]范圍之內(nèi),并指出取整后的DCT 系數(shù)絕對(duì)值的直方圖中對(duì)應(yīng)最大峰值的位置即為量化步長。另外,Luo 等人[17]還發(fā)現(xiàn)使用相同的量化表對(duì)解壓縮圖像進(jìn)行重復(fù)壓縮,圖像像素改變較少,基于這個(gè)發(fā)現(xiàn),通過比較重復(fù)壓縮前后像素的改變量估計(jì)量化矩陣。Yang 等人[18]提出了因子直方圖的概念,并指出量化步長對(duì)應(yīng)的位置因子直方圖出現(xiàn)局部極大值。
Li 等人[19]通過對(duì)連續(xù)JPEG 壓縮中誤差的研究,定義了前向量化誤差并指出該誤差的方差局部極小值的位置對(duì)應(yīng)于真實(shí)的量化步長。不同于上述基于直方圖的方法,Thai 等人[20]提出一種基于數(shù)學(xué)分析的方法。該方法對(duì)不同的圖像尺寸和質(zhì)量因子均具有較好的估計(jì)性能。Yang 等人[21]發(fā)現(xiàn)量化表中不同位置的量化步長存在相同的值,如圖4所示。依據(jù)這種先驗(yàn)知識(shí),提出一種通用的基于聚類的量化矩陣估計(jì)框架,實(shí)現(xiàn)了對(duì)現(xiàn)有估計(jì)方法性能的進(jìn)一步的提升。
對(duì)于從雙重JPEG 壓縮圖像中估計(jì)初次壓縮的量化矩陣問題,F(xiàn)arid[22]通過估計(jì)質(zhì)量因子(Quality Factor,QF)進(jìn)而間接地估計(jì)量化矩陣。然而,這種方法缺失一般性,因?yàn)镼F 不是標(biāo)準(zhǔn)的JPEG 壓縮參數(shù),對(duì)于使用專有量化矩陣的壓縮軟件,例如Photo?shop,QF 可能沒有定義。另外,還有一些基于模型的估計(jì)方法[23-26],該類方法通過利用DCT 系數(shù)分布模型,或者雙重JPEG 壓縮過程中產(chǎn)生特殊的模式進(jìn)行量化矩陣估計(jì)。而另一些方法則是揭示由連續(xù)量化引起的特殊效應(yīng)來估計(jì)量化矩陣。以上大多數(shù)估計(jì)方法在特定的場(chǎng)景下能取得較好的性能。但有些方法只適用于初次壓縮質(zhì)量因子QF1大于第二次壓縮的質(zhì)量因子QF2的情況。還有些方法只適用于第二次壓縮的DCT 網(wǎng)格對(duì)齊或者非對(duì)齊于第一次壓縮。例如,文獻(xiàn)[22]在第一次壓縮的量化步長是第二次壓縮的因子時(shí)將失效。盡管文獻(xiàn)[23]能夠同時(shí)適用于對(duì)齊和非對(duì)齊壓縮方式,但當(dāng)QF1>QF2時(shí),估計(jì)的性能會(huì)大幅度降低。文獻(xiàn)[26]只有在QF1 JPEG 圖像拼接偽造可以分為三個(gè)步驟,如圖6所示。首先對(duì)質(zhì)量因子為QF1的JPEG 圖像B 進(jìn)行解壓縮,然后使用A 中的一部分區(qū)域替換B 的內(nèi)容,最后使用質(zhì)量因子QF2對(duì)偽造圖像C 進(jìn)行壓縮。偽造圖像的真實(shí)區(qū)域和拼接區(qū)域會(huì)呈現(xiàn)出統(tǒng)計(jì)特性不一致性。由于拼接會(huì)在DCT 域,特別是在JPEG 系數(shù)直方圖上留下特殊的痕跡,若干檢測(cè)算法都側(cè)重于分析JPEG 系數(shù)直方圖的統(tǒng)計(jì)量。而在非對(duì)齊的雙重JPEG 場(chǎng)景下,雙重JPEG 檢測(cè)的方法往往從像素域或DCT 域提取特殊的特征。然而這些方法都是用于檢測(cè)整幅圖像是否經(jīng)歷過雙重JPEG 壓縮,不適用于篡改區(qū)域的定位。盡管一些基于CNN 的方法能夠?qū)π〕叽绲膱D像塊檢測(cè)雙重JPEG 壓縮且具有較好性能,但是這些方法都是針對(duì)雙重JPEG VS 單次JPEG 場(chǎng)景。例如,文獻(xiàn)[31]用于對(duì)齊和非對(duì)齊的雙重JPEG 壓縮檢測(cè),文獻(xiàn)[6-7]只用于對(duì)齊的雙重JPEG 壓縮檢測(cè)。也就是說,這些方法假設(shè)篡改區(qū)域經(jīng)歷了單次JPEG 壓縮,而背景則是經(jīng)歷雙重JPEG 壓縮。相反,更具挑戰(zhàn)性的是雙重JPEG VS 雙重JPEG 場(chǎng)景。目前只有少量的工作關(guān)注這個(gè)場(chǎng)景。原則上,估計(jì)雙重JPEG 壓縮圖像中第一次壓縮時(shí)的量化矩陣的方法可以應(yīng)用于此場(chǎng)景。但是,這兩種方法都是針對(duì)整幅圖像,因此它們也不適用于篡改區(qū)域定位。文獻(xiàn)[32]提出了一種檢測(cè)圖像局部是否經(jīng)歷低質(zhì)量因子JPEG 壓縮的技術(shù),但該方法只限制在QF1 其中Xs和Xd分別表示為單次和雙重JPEG 壓縮圖像的DCT 系數(shù)分布,α1和α2(α1+α2=1)分別表示拼接區(qū)域與真實(shí)區(qū)域的比例。通過求解公式(5)可以得到每個(gè)DCT 塊為雙重壓縮的概率。但該方法適用于對(duì)齊方式的雙重JPEG 圖像的場(chǎng)景,對(duì)非對(duì)齊雙重JPEG 壓縮圖像則無效。以上兩種方法在當(dāng)?shù)诙螇嚎s的質(zhì)量因子大于第一次的質(zhì)量因子時(shí),即QF1 JPEG 圖像被動(dòng)取證中使用的數(shù)據(jù)大多是由未壓縮圖像進(jìn)行壓縮、解壓縮、重復(fù)壓縮等生成JPEG解壓縮圖像、雙重JPEG 壓縮圖像等。未壓縮圖像主要來自UCID[38]、RAISE[39]和Bossbase[40]數(shù)據(jù)庫,其中UCID 包含1338幅TIF格式的彩色圖像,RAISE包含8156 幅高分辨率的TIF 格式的彩色圖像,Boss?base 包含10000 幅PGM 格式的灰度圖像。上述數(shù)據(jù)庫中的圖像還需要進(jìn)行裁剪或縮放、拼接等操作生成偽造的JPEG 圖像用于訓(xùn)練和測(cè)試檢測(cè)和定位模型。 雙重JPEG 壓縮檢測(cè)的衡量指標(biāo)包括真正類率(True Positive Ratio,TPR),即雙重JPEG 壓縮圖像被正確識(shí)別的比例、真負(fù)類率(True Negative Ratio,TNR),即單次JPEG 壓縮圖像被識(shí)別的比例和準(zhǔn)確率,即所有正類和負(fù)類被正確檢測(cè)的比例(當(dāng)正負(fù)樣本數(shù)目相等時(shí),準(zhǔn)確率表示為(TPR+TNR)/2)。當(dāng)準(zhǔn)確率高且TPR 和TNR 之間比較均衡時(shí)表明檢測(cè)方法具有較好的性能。 通常評(píng)估量化步長估計(jì)的標(biāo)準(zhǔn)為準(zhǔn)確率和MSE。準(zhǔn)確率為被正確估計(jì)的量化步長所占的比例。MSE的計(jì)算方式如下所示: 其中x為雙重JPEG 壓縮圖像,N為量化步長的維度,qi和分別表示為第i個(gè)真實(shí)的量化步長的值與估計(jì)的值。MSE越小,表明估計(jì)性能越好。 JPEG 圖像篡改區(qū)域定位結(jié)果評(píng)估的指標(biāo)通常為F1分?jǐn)?shù)、馬修斯系數(shù)(Matthews Correlation Coeffi?cient,MCC)和受試者工作特征曲線(Receiver Oper?ating Characteristic Curve,ROC 曲線)。F1分?jǐn)?shù)的計(jì)算方式表示為: 其中precision 為精確度,recall 為召回率。F1分?jǐn)?shù)的范圍為[0,1],分?jǐn)?shù)越大說明定位結(jié)果越好。MCC的計(jì)算方式如下所示: 其中,TP、TN、FP 和FN 分別表示為真正類數(shù)、真負(fù)類數(shù)、假正類數(shù)和假負(fù)類數(shù)。MCC 的范圍為[-1,1],當(dāng)該指標(biāo)取值為1 時(shí)表示能夠完美定位篡改區(qū)域,取值為0 時(shí)表示檢測(cè)的結(jié)果還不如隨機(jī)預(yù)測(cè)的結(jié)果,-1 是指預(yù)測(cè)分類和實(shí)際情況完全不一致。ROC 曲線是反映敏感性和特異性連續(xù)變量的綜合指標(biāo),評(píng)價(jià)其質(zhì)量的一個(gè)重要的特征是曲線下方的面積(AUC)。當(dāng)AUC 為0.5 時(shí)為隨機(jī)分類,表示分類器沒有識(shí)別能力,AUC 越接近于1 表示分類器的判別能力越強(qiáng)。 本節(jié)首先給出了文獻(xiàn)[9-12]中所提方法在UCID(彩色圖像首先轉(zhuǎn)為灰度圖)上的相同量化矩陣的雙重JPEG 壓縮檢測(cè)性能對(duì)比,如表2所示。可以看出當(dāng)質(zhì)量因子大于90 時(shí),四種方法的準(zhǔn)確率均高于92%。當(dāng)質(zhì)量因子低于80 時(shí),各種方法的檢測(cè)性能明顯降低,這是因?yàn)橄喈?dāng)一部分圖像的兩次壓縮之間在空域和DCT 域幾乎沒有統(tǒng)計(jì)差異,因此很難進(jìn)行區(qū)分。而文獻(xiàn)[12]同時(shí)考慮了誤差和DCT 系數(shù)分量,整體性能要優(yōu)于其他三種方法。 表2 相同量化矩陣的雙重JPEG壓縮檢測(cè)方法性能(準(zhǔn)確率)對(duì)比Tab.2 Performance(Accuracy)comparison of detection methods for double JPEG compression with the same quantization matrix 接著,表3 列出了文獻(xiàn)[25-26,29-30]中所提方法在RAISE 數(shù)據(jù)集上初次量化矩陣估計(jì)的性能對(duì)比,其中測(cè)試圖像的大小為64×64,第一次壓縮的質(zhì)量因子QF1={60,65,70,75,80,85,95},第二次壓縮的質(zhì)量因子QF2=90。當(dāng)QF1=95 時(shí),基于模型的傳統(tǒng)方法[25]已經(jīng)失效,而基于CNN 的方法依然具有較好的估計(jì)效果。由于文獻(xiàn)[25]中的模型不依賴于兩次壓縮間質(zhì)量因子而是從量化步長對(duì)中學(xué)習(xí)DCT 系數(shù)分布,因此能夠更好的獲取第一次壓縮時(shí)量化步長的信息。 表3 雙重JPEG圖像中初次量化矩陣估計(jì)性能(準(zhǔn)確率)對(duì)比Tab.3 Performance(Accuracy)comparison of primary quantization matrix estimation in double JPEG compressed images 最后,本節(jié)給出了基于DCT 系數(shù)分布差異性[33-34]和基于異常檢測(cè)方法[37]對(duì)JPEG 圖像拼接檢測(cè)和定位的性能對(duì)比實(shí)驗(yàn),如表4 所示。實(shí)驗(yàn)的數(shù)據(jù)集為文獻(xiàn)[33-34]中使用的部分圖像,分別表示為Db 和Dw。其中,Db 中圖像的分辨率為1024×1024,第一次壓縮的質(zhì)量因子QF1∈{50:5:100},篡改區(qū)域部分為圖像總面積的1/16 且為中心區(qū)域。Dw 是由UCID 中圖像生成,第一次壓縮的質(zhì)量因子QF1∈{55:10:95},篡改區(qū)域部分為圖像總面積的1/10。兩種數(shù)據(jù)集中圖像均為對(duì)齊方式的雙重JPEG 壓縮且第二壓縮的質(zhì)量因子QF2=90,對(duì)比結(jié)果如表4 所示??梢园l(fā)現(xiàn)文獻(xiàn)[34]所提方法要優(yōu)于其他兩種方法,這是因?yàn)樵摲椒ǎ?4]針對(duì)對(duì)齊方式的雙重JPEG圖像而設(shè)計(jì)。另外,兩種數(shù)據(jù)庫中篡改區(qū)域沒有明顯的拼接痕跡,使得文獻(xiàn)[37]中基于異常檢測(cè)方法的優(yōu)勢(shì)并未體現(xiàn)出來。 表4 JPEG圖像篡改定位(MCC)對(duì)比結(jié)果Tab.4 Performance(MCC)comparison of JPEG image tampering localization 在過去的幾十年中,JPEG圖像被動(dòng)取證的研究已經(jīng)取得了一定的進(jìn)展,也體現(xiàn)出很大的發(fā)展?jié)摿蛻?yīng)用前景,但是當(dāng)JPEG 圖像取證技術(shù)在推向?qū)嶋H應(yīng)用中依然面臨一些問題。 (1)彩色雙重JPEG 壓縮圖像檢測(cè)方法缺乏誤差的理論分析。不同于灰度圖像,彩色圖像進(jìn)行JPEG 壓縮時(shí)需要將RGB 空間轉(zhuǎn)換到Y(jié)CbCr 空間,因此壓縮產(chǎn)生的誤差也不同于灰度圖像。另外,顏色轉(zhuǎn)換時(shí)也會(huì)引入一些誤差,如何建立理論模型、有效的分析和利用這些誤差能夠提升雙重壓縮檢測(cè)的實(shí)際應(yīng)用價(jià)值。 (2)量化矩陣估計(jì)方法面臨的主要問題是當(dāng)存在后處理操作時(shí),例如裁剪、縮放等,該類估計(jì)方法的性能會(huì)大幅度降低,甚至失效。這是由于后處理操作能夠破壞JPEG 壓縮痕跡,進(jìn)而很難從DCT 系數(shù)分布中估計(jì)量化矩陣。一種解決思路是首先估計(jì)裁剪的偏移位置或者縮放因子,然后根據(jù)偏移位置估計(jì)第一次壓縮的DCT 系數(shù)分布或者根據(jù)縮放因子逆向的縮放圖像進(jìn)而恢復(fù)第一次壓縮的信息。另一種思路是利用強(qiáng)大的CNN 網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)經(jīng)過后處理操作留下的特殊痕跡,從而獲取更多的壓縮參數(shù)信息。 (3)目前JPEG 拼接圖像定位通??醋鞫诸悊栴}[41],即識(shí)別拼接區(qū)域和真實(shí)區(qū)域,如何區(qū)分多個(gè)拼接區(qū)域的歸屬、追溯其來源[42]等問題需要進(jìn)一步解決。解決的思路根據(jù)量化矩陣不一致性結(jié)合聚類的思想對(duì)拼接區(qū)域進(jìn)行歸屬判別。另外同時(shí)利用拼接邊緣差異性和拼接區(qū)域的統(tǒng)計(jì)特性不一致性能夠進(jìn)一步提升定位性能。 本文對(duì)現(xiàn)有JPEG 圖像被動(dòng)取證方法進(jìn)行了綜述和回顧。首先重點(diǎn)介紹了雙重JPEG 壓縮檢測(cè)、量化矩陣估計(jì)和JPEG 圖像拼接檢測(cè)定位的關(guān)鍵技術(shù)并對(duì)存在的問題給出了解釋說明。其次對(duì)取證技術(shù)驗(yàn)證使用的數(shù)據(jù)集及性能評(píng)測(cè)指標(biāo)進(jìn)行了描述。接著對(duì)JPEG 圖像雙重壓縮檢測(cè)和量化步長估計(jì)等方向現(xiàn)有方法進(jìn)行了對(duì)比和評(píng)價(jià)。最后指出了現(xiàn)有方法面臨的問題并給出了對(duì)應(yīng)的解決思路。由于偽造方式的多樣性,現(xiàn)有的取證方法往往只適用于單一方式下生成的偽造圖像,利用多種取證手段和融合多個(gè)取證方法的結(jié)果能夠進(jìn)一步提升取證方法的精度。雖然基于深度學(xué)習(xí)的方法已經(jīng)成為數(shù)字圖像取證的主流趨勢(shì),但是目前偽造圖像的數(shù)量遠(yuǎn)遠(yuǎn)小于真實(shí)圖像,生成海量多樣性的偽造圖像用于訓(xùn)練深度網(wǎng)絡(luò)能夠增強(qiáng)模型的魯棒性和泛化能力。3.3 JPEG圖像拼接檢測(cè)與定位
4 數(shù)據(jù)集與評(píng)價(jià)指標(biāo)
5 性能對(duì)比
6 存在的問題與解決思路
7 結(jié)論