張 震,蘇白娜,喻 宙
(鄭州大學(xué)電氣工程學(xué)院,河南鄭州450001)
區(qū)域拷貝篡改是圖像篡改的常用手段之一,因此,對于該篡改的檢測已成為圖像真實(shí)性取證的研究熱點(diǎn)[1].筆者研究的對象即為區(qū)域拷貝篡改,其檢測方法主要是依賴于圖像子塊的特征.文獻(xiàn)[2]研究了這種篡改方法并利用塊特征向量的字典排序提取篡改區(qū)域;文獻(xiàn)[3-4]利用PCA變換減少塊特征向量的維數(shù)以減少計(jì)算量,但是,圖像子塊在幾何變換下不具有不變性.因此,對于有幾何變換的拷貝篡改手段,以上算法失效.
基于David G.Lowe提出的SIFT(Scale Invariant Feature Transform)特征點(diǎn)對于圖像的尺度和旋轉(zhuǎn)保持不變性[5],以及對于光照和3D視角的變化也能保持一定的穩(wěn)定性,筆者結(jié)合LPP(Locality Preserving Projection)降維方法,為 SIFT特征點(diǎn)生成低維且有效的特征描述子.通過對描述子進(jìn)行匹配,進(jìn)而提出一種新的檢測算法,即基于LPP-SIFT(Locality Preserving Projection-Scale Invariant Feature Transform)的檢測算法.實(shí)驗(yàn)表明,該算法能夠有效地檢測出拷貝篡改圖像,定位出拷貝源與篡改區(qū)域,且算法對于篡改區(qū)域的旋轉(zhuǎn)、縮放具有不變性,對于噪聲添加、JPEG壓縮等操作具有較好的魯棒性.
區(qū)域拷貝粘貼篡改是數(shù)字圖像篡改的一個常用手段,它是為了覆蓋圖像中的部分內(nèi)容而拷貝同幅圖像中的某一區(qū)域并粘貼到另一不重疊的區(qū)域.這類篡改手段之所以應(yīng)用廣泛,是因?yàn)樵谕环鶊D像中進(jìn)行拷貝粘貼操作并不會導(dǎo)致圖像的亮度、色彩等發(fā)生明顯的變化,一般視覺上是無法察覺到的.
由于大多數(shù)檢測算法對于區(qū)域塊的旋轉(zhuǎn)和縮放沒有魯棒性,所以一般參考文獻(xiàn)中研究的模型只包含區(qū)域塊的位移.而筆者研究的模型不僅包含了區(qū)域間的位移,還包含篡改區(qū)域的尺度變換以及旋轉(zhuǎn).
圖像的特征點(diǎn)是其局部特征,在自然圖像中不會存在相同的特征點(diǎn)[2].因此,如果我們在一幅圖像中檢測到了大量互相匹配的特征點(diǎn),可以判定該圖像不是自然圖像,而是通過區(qū)域拷貝篡改得到的偽造圖像.根據(jù)匹配點(diǎn)對所聚集的區(qū)域,可以定位出拷貝源與篡改區(qū)域.
筆者采用SIFT算法提取圖像特征點(diǎn).SIFT的全稱是尺度不變特征變換,該變換可以將圖像信息用相應(yīng)的局部特征量來表示,旨在描述圖像的局部特征,且對圖像縮放、旋轉(zhuǎn)甚至仿射變換都保持不變性.
SIFT算法包含四個步驟:尺度空間極值的檢測、特征點(diǎn)位置的確定、特征點(diǎn)方向信息的確定、特征點(diǎn)描述子的生成[5].在筆者提出的算法中,只用SIFT的前三個步驟來提取圖像中的特征點(diǎn),然后采用LPP降維算法為SIFT特征點(diǎn)生成低維的特征描述子.
雖然SIFT算法魯棒性強(qiáng),但由于描述器的維數(shù)太大,導(dǎo)致了匹配速度慢.因此,筆者采用LPP降維算法為特征點(diǎn)生成低維有效的特征描述器.
LPP算法相對于其他降維算法能夠更好地保持?jǐn)?shù)據(jù)集間的關(guān)系,以PCA(Principal Components Analysis)算法[6]與LPP對比為例,圖1給出了兩者降維效果的對比(以5維的數(shù)據(jù)樣本集映射到2維空間為例).
圖1 PCA和LPP對高維數(shù)據(jù)的映射效果對比Fig.1 Comparison result of PCA and LPP to map high-dimensional data
LPP是拉普拉斯特征映射算法的一種線性近似,該算法主要是通過求解變換矩陣對原始特征向量進(jìn)行映射[7],映射公式為:
式中:fi為原始的特征向量;f'i為降維后的特征向量.
本文算法中共選擇了12幅圖像來生成變換矩陣.首先,利用SIFT算法前三步生成了4 000個特征點(diǎn);其次,在特征點(diǎn)周圍提取37×37區(qū)域,計(jì)算每個像素的水平和垂直的梯度方向,生成一個高維向量,把它作為特征矩陣的一列;最后采用LPP算法求出變換矩陣.
對于待檢測圖像,同樣利用SIFT算法前三步生成特征點(diǎn).以特征點(diǎn)為中心,選取37×37的區(qū)域,計(jì)算每個像素的水平和垂直的梯度方向,于是每個特征點(diǎn)生成一個2×35×35=2 450維的梯度向量,用fi表示.依據(jù)上述求出的變換矩陣A及公式(1)把梯度向量映射到低維的流形中,映射后的向量f'i作為特征點(diǎn)的描述器,本文實(shí)驗(yàn)中映射后向量維數(shù)為20.
最常見的特征點(diǎn)匹配方法是依據(jù)特征點(diǎn)描述子間的歐氏距離,但在Matlab中,計(jì)算向量間的點(diǎn)乘(內(nèi)積)要比計(jì)算它們的歐式距離更有效.因此,本文實(shí)驗(yàn)中把向量角度比率的大小作為特征點(diǎn)匹配的判別準(zhǔn)則,對滿足最近鄰域點(diǎn)和次近鄰域點(diǎn)的向量角度比率小于設(shè)定值R的特征點(diǎn)進(jìn)行匹配,得到匹配對.實(shí)驗(yàn)中可以改變參數(shù)R的大小以獲取最佳匹配結(jié)果.
利用LPP-SIFT描述子找出匹配對需要兩個特征向量集,所以對于一幅待檢測圖像,需要對生成的特征向量集進(jìn)行劃分,然后進(jìn)行匹配運(yùn)算,具體的步驟如下:
(1)設(shè)特征向量集包含M個特征點(diǎn),如果M=1,則停止匹配;否則,在特征向量集中隨機(jī)選取M/2個特征向量,定義為子集S1,余下的M/2個定義為子集S2;
(2)對S1和S2按照上述匹配準(zhǔn)則進(jìn)行匹配,對匹配的特征點(diǎn)對做出記號(本文中是用直線將其連接);
(3)對特征向量子集S1,遞歸執(zhí)行上兩步;對特征向量子集S2,也遞歸執(zhí)行上兩步;
(4)根據(jù)上述匹配,得到所有的匹配點(diǎn)對.
本文實(shí)驗(yàn)中,對于待檢測圖像中存在的匹配點(diǎn)對,用直線段將其標(biāo)記出來.因此,如果標(biāo)記的線段明顯集中于某兩個區(qū)域之間,則可以判定該圖像被拷貝粘貼篡改過,匹配點(diǎn)對集中的兩個區(qū)域,即為拷貝粘貼區(qū)域.
本文所有實(shí)驗(yàn)都是在Matlab2008中實(shí)現(xiàn)的,實(shí)驗(yàn)所選的圖像部分是來自于網(wǎng)絡(luò),另一部分是由作者自己拍攝的.本文算法對拷貝粘貼篡改圖像的檢測結(jié)果如下:
(1)對經(jīng)歷了尺度縮放的篡改圖像進(jìn)行檢測.本組實(shí)驗(yàn)圖2、圖3中篡改圖像的拷貝篡改區(qū)域分別經(jīng)歷了放大、縮小操作.
采用本文算法對圖2中拷貝區(qū)域經(jīng)歷了放大的篡改圖像進(jìn)行檢測時(shí),實(shí)驗(yàn)發(fā)現(xiàn)參數(shù)R的最佳取值為0.65,正確匹配點(diǎn)對的數(shù)目是29,檢測結(jié)果如圖4(a)所示,此時(shí)的匹配點(diǎn)對數(shù)目比之前都大,且不存在誤判點(diǎn).表1給出了不同R值對圖2(b)進(jìn)行檢測時(shí)的匹配點(diǎn)對數(shù)目的變化情況.對圖3中拷貝區(qū)域經(jīng)歷了縮小的篡改圖像進(jìn)行檢測時(shí),R的最佳取值為0.4,此時(shí)匹配點(diǎn)對的數(shù)目是16,檢測結(jié)果如圖4(b)所示.表2給出了不同R值對圖3(b)進(jìn)行檢測時(shí),匹配點(diǎn)對數(shù)目的變化情況.實(shí)驗(yàn)表明,本文算法能夠有效地檢測定位拷貝區(qū)域經(jīng)歷了尺度縮放的篡改圖像.
表1 R值變化時(shí)尺度放大圖像的檢測結(jié)果Tab.1 Detection results with different R
(2)對經(jīng)歷了旋轉(zhuǎn)、JPEG壓縮的篡改圖像進(jìn)行檢測.本組實(shí)驗(yàn)的原圖像是由作者自己拍攝的自然圖像,篡改圖像中的拷貝篡改區(qū)域經(jīng)歷了旋轉(zhuǎn)操作,且圖像經(jīng)歷了壓縮因子Q=30的JPEG壓縮操作,采用本文算法對篡改圖像的檢測結(jié)果如下:
采用本文算法對圖5(b)進(jìn)行檢測時(shí),參數(shù)R的最佳取值為0.7,此時(shí)匹配點(diǎn)對的數(shù)目是12,檢測結(jié)果如圖6所示.表3給出了不同R值對圖5(b)進(jìn)行檢測時(shí),匹配點(diǎn)對數(shù)目的變化情況.實(shí)驗(yàn)表明,本文算法對于旋轉(zhuǎn)和JPEG壓縮具有很好的魯棒性.
表2 R值變化時(shí)尺度縮小圖像的檢測結(jié)果Tab.2 Detection results with different R
表3 R值變化時(shí)旋轉(zhuǎn)壓縮后圖像的檢測結(jié)果Tab.3 Detection results with different R
(3)對經(jīng)歷了旋轉(zhuǎn)、JPEG壓縮、加噪的篡改圖像進(jìn)行檢測.本組實(shí)驗(yàn)的目的是驗(yàn)證本文所提出的算法對于噪聲是否具有魯棒性.為了對比效果,本組實(shí)驗(yàn)依然選用第二組實(shí)驗(yàn)中的圖像,即對圖5(b)所示的篡改圖像添加了PSNR(Peak Signal to Noise Ratio)=30 dB的高斯白噪聲,然后檢驗(yàn)本文算法的檢測效果.
經(jīng)實(shí)驗(yàn)檢測,發(fā)現(xiàn)本組實(shí)驗(yàn)中參數(shù)R的最佳取值依然為0.7,此時(shí)匹配點(diǎn)對的數(shù)目是12,沒有誤判匹配對.表4給出了對加噪圖像進(jìn)行檢測時(shí),不同R值的特征點(diǎn)匹配情況.
表4 R值變化時(shí)對加噪圖像的檢測結(jié)果Tab.4 Noised image detection results with different R
將本組實(shí)驗(yàn)的檢測結(jié)果與第二組中的檢測結(jié)果進(jìn)行對比,可以看出,本文算法對于加噪后的篡改圖像依然有效,而且檢測效果與第二組的檢測效果相差很小.從實(shí)驗(yàn)結(jié)果可以看出,本組中參數(shù)R的最佳取值與第二組相同,即R=0.7,此時(shí)匹配點(diǎn)對的數(shù)目也是12.通過表4與表3的對比可以證明:本文算法對于噪聲具有較好的魯棒性.
筆者提出的基于LPP-SIFT的拷貝篡改檢測方法,能夠有效地檢測出同幅圖像間的拷貝篡改區(qū)域.相對于SIFT的128維特征描述子,本算法的描述子只有20維,維數(shù)有了大幅度的減少,因而在很大程度上減少了特征點(diǎn)匹配時(shí)的運(yùn)算量,提高了檢測速度.筆者提出的區(qū)域拷貝篡改圖像檢測方法,不僅能夠有效地檢測拷貝篡改圖像,還能準(zhǔn)確地匹配出拷貝源和篡改區(qū)域.實(shí)驗(yàn)證明,該算法對于尺度縮放、旋轉(zhuǎn)、縮放、噪聲添加以及JPEG壓縮操作具有很好的魯棒性.
[1] 吳瓊.面向真實(shí)性檢測的數(shù)字圖像盲取證方法研究[D].長沙:國防科學(xué)技術(shù)大學(xué)信息系統(tǒng)與管理學(xué)院,2008.
[2] FRIDRICH J,SOUKAL D,LUKAS J.Detection of copy-move forgery in digital images[C]//Proceedings of Digital Forensic Research Workshop.Cleveland:IEEE Computer Society,2003:5-8.
[3] POPESCU A C,F(xiàn)ARID H.Exposing Digital Forgeries by Detecting Duplicated Image Regions[D].Hanover:Department of Computer Science,Dartmouth College,2004.
[4] JU Sheng-gen,ZHOU Ji-liu,HE Kun.An authentication method for copy areas of images[C]//Proceedings of the 4th International Conference on Image and Graphics.Chengdu:IEEE press,2007:303-306.
[5] LOWE D G.Distinctive image features from scale-invariant key points[J].International Journal of Computer Vision,2004,60(2):91-110.
[6] YE K,SUKTHANKAR R.PCA-SIFT:a more distinctive representation for local image descriptors[C]//Proceedings of the 18th International Conference on Pattern Recognition.Washington:IEEE press,2004:506-513.
[7] HE Xiao-fei,NIYOGI P.Locality Preserving Projections[DB/OL].http://wenku.baidu.com/view/d6c 659bd960590c69ec376e9.html.2011-03-11.