黃榮梅,王婷婷
(四川職業(yè)技術(shù)學(xué)院 計(jì)算機(jī)科學(xué)系,四川 遂寧 629000)
近年來(lái),數(shù)字圖像被廣泛應(yīng)用在不同領(lǐng)域,同時(shí)有非常重要的作用,在信息采集與發(fā)布領(lǐng)域,數(shù)字圖像有很大的優(yōu)勢(shì),為人們的工作學(xué)習(xí)提供重要信息[1,2]。特別是在網(wǎng)絡(luò)中,數(shù)字圖像作為多媒體信息被廣泛應(yīng)用,但與此同時(shí),也出現(xiàn)了一些不足。數(shù)字圖像可提高信息資源的質(zhì)量,然而容易被篡改,利用常用的圖像編輯軟件與圖像處理裝置即可進(jìn)行,通常在數(shù)字圖像中無(wú)法發(fā)現(xiàn)篡改痕跡,無(wú)法有效判斷圖像的真?zhèn)蝃3,4]。通過(guò)不正當(dāng)方式對(duì)數(shù)字圖像進(jìn)行篡改,會(huì)對(duì)社會(huì)正常發(fā)展秩序產(chǎn)生不好的影響。恰恰因?yàn)闊o(wú)法判斷數(shù)字圖像中是否有編輯與篡改的痕跡,其真實(shí)性往往很難確定,對(duì)圖像的取證有很大難度[5]。
采用智能取證技術(shù)能夠?qū)崿F(xiàn)圖像防偽,通過(guò)先進(jìn)技術(shù)完成對(duì)數(shù)字圖像的取證,找到數(shù)字圖像被編輯與篡改的痕跡,真實(shí)可靠的數(shù)字圖像可被當(dāng)作關(guān)鍵證據(jù)信息,很好地解決數(shù)字圖像取證面臨的問(wèn)題[6,7]。
當(dāng)前有關(guān)數(shù)字圖像取證的研究大部分是檢測(cè)幾何變換、對(duì)比度增強(qiáng)、JPEG壓縮、中值濾波等[8]。中值濾波為常見(jiàn)的圖像濾波器,這主要是因?yàn)槠渚哂泻芎玫钠交瑸V波性,可保持邊緣特征,攻擊者可以把中值濾波技術(shù)應(yīng)用于反取證技術(shù)中,令中值濾波檢測(cè)取證被廣泛關(guān)注[9]。
現(xiàn)階段已有的中值濾波取證方法更多針對(duì)沒(méi)有被壓縮圖像是否經(jīng)中值濾波處理,部分方法對(duì)有損壓縮或較小圖像塊的魯棒性較差。為此,提出一種基于濾波殘差多方向差分的數(shù)字圖像取證方法。經(jīng)驗(yàn)證,所提方法可有效檢測(cè)不同種類(lèi)空域?yàn)V波操作,對(duì)有損圖像壓縮魯棒性高。
濾波處理是常用的數(shù)字圖像編輯方式,其基本思想為對(duì)數(shù)字圖像局部鄰近像素值進(jìn)行加權(quán)操作從而完成數(shù)字圖像處理,濾波過(guò)程可通過(guò)下式進(jìn)行描述:
式中,f(x ,y)用于描述濾波數(shù)字圖像像素值,s(x ,y)用于描述原始數(shù)字圖像像素值,r(x ,y)用于描述空域平滑濾波模板,*代表卷積操作,n代表濾波器窗口大小。
常見(jiàn)的濾波模板包括均值濾波模板、高斯濾波模板以及中值濾波模板,前兩種濾波模板是線性濾波器,中值濾波模板為非線性濾波器,通過(guò)像素鄰域中值對(duì)該像素值進(jìn)行替代,降噪效果優(yōu),模糊程度低[10,11]。
在頻域中能夠有效反映出濾波器特性,所以本節(jié)在頻域中對(duì)濾波數(shù)字圖像的特征進(jìn)行分析,上式頻域描述如下:
式中,F(xiàn)(x ,y)、S(x ,y)依次用于描述濾波數(shù)字圖像頻譜與原始數(shù)字圖像頻譜,R(x ,y)用于描述濾波處理的頻率響應(yīng)。
若濾波數(shù)字圖像再經(jīng)濾波器Rd(i , j)處理,那么其濾波殘差可描述如下:
假設(shè)復(fù)合濾波器頻率響應(yīng)有自己獨(dú)特的性質(zhì),那么被濾波處理后的數(shù)字圖像即可和原始數(shù)字圖像區(qū)分,所以選擇合理的特征提取域?yàn)閷?shí)現(xiàn)魯棒數(shù)字圖像取證的重要環(huán)節(jié)。數(shù)字圖像多樣性以及后處理操作對(duì)數(shù)字圖像取證性能和魯棒性會(huì)產(chǎn)生很大影響,例如JPEG壓縮等處理[12]。由于數(shù)字圖像空域高頻分量?jī)?nèi)容信息相對(duì)較少,同時(shí)受后處理的影響相對(duì)較小,因此可被當(dāng)成特征提取域,從而降低不利因素產(chǎn)生的影響,本節(jié)將濾波殘差作為特征提取域。
殘差濾波存在下述特性:
(1)濾波殘差僅含有較少的數(shù)字圖像內(nèi)容,分析圖1(b)和圖 1(c)可知,原始數(shù)字圖像濾波殘差和濾波數(shù)字圖像的濾波殘差絕大多數(shù)是黑色,說(shuō)明部分濾波殘差值為0或趨近于0。
(2)濾波殘差能夠有效體現(xiàn)原始數(shù)字圖像和濾波數(shù)字圖像之間的統(tǒng)計(jì)差異。分析圖1(b)和圖1(c)可知,濾波數(shù)字圖像濾波殘差0像素值明顯更多,表明濾波殘差能夠反映出模糊濾波的低通性質(zhì)。除此之外,分析數(shù)字圖像的邊緣細(xì)節(jié)可以看出,濾波數(shù)字圖像濾波殘差過(guò)渡較為平緩,這主要是由于模糊濾波令數(shù)字圖像更加平滑。
圖1 原始數(shù)字圖像和濾波殘差
為了提高數(shù)字圖像取證的準(zhǔn)確性,下面依據(jù)濾波殘差提取小波空間特征譜熵以及自回歸系數(shù)特征,小波空間特征譜熵用于采集模糊濾波處理在數(shù)字圖像濾波殘差紋理部分遺留的痕跡,自回歸系數(shù)特征用于對(duì)濾波殘差進(jìn)行多方向差分特征提取。
模糊濾波是一種低通濾波方式,會(huì)造成濾波前后數(shù)字圖像在高頻部分有明顯的不同[13]。小波空間特征譜熵能夠有效識(shí)別數(shù)字圖像濾波殘差紋理,本節(jié)通過(guò)小波空間特征譜熵獲取模糊濾波處理在濾波殘差紋理區(qū)域留下的痕跡。
小波分析理論近年來(lái)逐漸發(fā)展,其可被看做是一個(gè)數(shù)學(xué)顯微鏡,能夠放大、縮小以及平移。利用檢查不同放大倍數(shù)的改變情況對(duì)信號(hào)動(dòng)態(tài)特征進(jìn)行分析,所以小波分析被應(yīng)用在較多領(lǐng)域,有很好的可行性。通常數(shù)字圖像特征提取均是對(duì)區(qū)域特征或時(shí)域特征進(jìn)行提取,在數(shù)字圖像性質(zhì)與拍攝環(huán)境相對(duì)一致的情況下,上述特征無(wú)法有效區(qū)分圖像。為此,依據(jù)小波變換在時(shí)頻域中聯(lián)合,提取小波空間特征譜熵,對(duì)數(shù)字圖像濾波殘差紋理區(qū)域留下的痕跡進(jìn)行提取分析。
小波變換前后,有限能量函數(shù)的能量是守恒的,也就是:
在上述分析中,Wf( )a,b用于描述小波變換幅值,Cv用于描述小波函數(shù)的允許條件,P()a用于描述尺度是a的情況下函數(shù)e()t的能量值。
小波變換實(shí)際上就是把一維信號(hào)映射至二維小波空間中,用下述矩陣描述二維小波空間小波能量分布矩陣:
將W當(dāng)成模式矩陣,完成對(duì)其的奇異值分解處理,得到的結(jié)果用σi進(jìn)行描述。那么奇異值譜即為對(duì)原始數(shù)字圖像在時(shí)頻域中的分割,所以時(shí)頻域中數(shù)字圖像小波空間特征譜熵可描述如下:v
小波空間特征譜熵可有效體現(xiàn)數(shù)字圖像濾波殘差能量在時(shí)頻域中的分布狀態(tài),從而體現(xiàn)數(shù)字圖像紋理特征,數(shù)字圖像濾波殘差不同紋理特征對(duì)應(yīng)的小波空間特征譜熵存在很大差異,利用比較數(shù)字圖像濾波殘差小波空間特征譜熵即可完成對(duì)其紋理特征的有效提取。
數(shù)字水印與多媒體取證為常用的多媒體安全技術(shù),均值濾波、高斯低通濾波以及中值濾波都屬于局部鄰域操作,一定會(huì)對(duì)想理你像素局部統(tǒng)計(jì)關(guān)系產(chǎn)生一定的影響,采用小波空間特征譜熵對(duì)鄰域較大的局部統(tǒng)計(jì)關(guān)系進(jìn)行描述,在很大程度上會(huì)導(dǎo)致特征維數(shù)過(guò)大,本節(jié)通過(guò)自回歸系數(shù)對(duì)濾波殘差多方向差值特征進(jìn)行提取,從而描述數(shù)字圖像的局部統(tǒng)計(jì)關(guān)系[14],通過(guò)自回歸系數(shù)得到的特征利用Lar進(jìn)行描述。
在對(duì)濾波殘差多方向差值特征進(jìn)行提取的過(guò)程中,自回歸系數(shù)依次按水平與垂直兩個(gè)方向進(jìn)行提取,二者的均值就是Lar。
針對(duì)水平方向提取自回歸系數(shù)的過(guò)程分析如下:逐行把濾波殘差數(shù)字圖像轉(zhuǎn)變成一維序列,然后把序列輸入自回歸模型中對(duì)自回歸系數(shù)進(jìn)行計(jì)算。
自回歸模型可通過(guò)下式進(jìn)行描述:
對(duì)濾波殘差數(shù)字圖像進(jìn)行轉(zhuǎn)置處理,利用相同方式對(duì)垂直方向自回歸系數(shù)進(jìn)行計(jì)算,得到的水平方向與垂直方向自回歸系數(shù)的均值即為濾波殘差多方向差分自回歸系數(shù)Lar。
本研究最終提取特征由小波空間特征譜熵與自回歸系數(shù)特征組成,也就是
本節(jié)分類(lèi)器選擇支持向量機(jī),支持向量集是一種利用統(tǒng)計(jì)學(xué)理論實(shí)現(xiàn)的分類(lèi)器,一般被應(yīng)用在模式識(shí)別上。其基本原理為利用已經(jīng)選擇好的非線性映射,也就是核函數(shù)把輸入向量映射至高維特征空間,同時(shí)在該空間中建立最優(yōu)分類(lèi)超平面。本節(jié)核函數(shù)選擇高斯函數(shù):
利用多次交叉檢驗(yàn)得到最優(yōu)和參數(shù)。通過(guò)支持向量機(jī)對(duì)多分類(lèi)問(wèn)題進(jìn)行解決之前,首先需把多分類(lèi)問(wèn)題轉(zhuǎn)變成多重二元分類(lèi)問(wèn)題。通常選擇一對(duì)多策略,也就是在任意兩種樣本間建立支持向量機(jī)分類(lèi)器,在對(duì)某未知樣本進(jìn)行分類(lèi)的過(guò)程中,得票最多的就是該樣本的所屬類(lèi)別。
利用分類(lèi)器實(shí)現(xiàn)數(shù)字圖像取證的基本過(guò)程如下:
(1)得到數(shù)字圖像濾波殘差。
(2)對(duì)濾波殘差小波空間特征譜熵進(jìn)行提取,通過(guò)自回歸系數(shù)得到濾波殘差多方向差分特征,將兩種特征構(gòu)成總特征。
(4)利用分類(lèi)器對(duì)數(shù)字圖像進(jìn)行分類(lèi)處理,檢測(cè)數(shù)字圖像是否經(jīng)篡改處理,從而實(shí)現(xiàn)數(shù)字圖像取證。
實(shí)驗(yàn)將文獻(xiàn)[5]方法和文獻(xiàn)[8]方法作為對(duì)比進(jìn)行分析,驗(yàn)證本文方法對(duì)數(shù)字圖像取證的有效性。
實(shí)驗(yàn)在非壓縮數(shù)字圖像數(shù)據(jù)庫(kù)中進(jìn)行相關(guān)實(shí)驗(yàn)分析,該數(shù)據(jù)庫(kù)中一共包含1800幅數(shù)字圖像,在進(jìn)行實(shí)驗(yàn)時(shí)隨機(jī)從數(shù)據(jù)庫(kù)中選擇150幅數(shù)字圖像。實(shí)驗(yàn)過(guò)程中,對(duì)數(shù)字圖像進(jìn)行濾波篡改處理,同時(shí)對(duì)篡改數(shù)字圖像添加信號(hào)處理攻擊,攻擊處理主要有加入噪聲、對(duì)數(shù)字圖像進(jìn)行JPEG壓縮處理以及對(duì)數(shù)字圖像進(jìn)行高斯模糊處理。
實(shí)驗(yàn)衡量指標(biāo)為整個(gè)篡改數(shù)字圖像像素點(diǎn)的準(zhǔn)確檢測(cè)率以及錯(cuò)誤檢測(cè)率,兩個(gè)衡量指標(biāo)的計(jì)算公式分別如下:
其中,I1用于描述處理部分,O1用于描述篡改部分,I2與O2依次用于描述檢測(cè)到的處理部分與篡改部分。
表1描述的是采用本文方法、文獻(xiàn)[5]方法以及文獻(xiàn)[8]方法對(duì)數(shù)字圖像進(jìn)行取證處理時(shí),準(zhǔn)確檢測(cè)率與錯(cuò)誤檢測(cè)率的比較結(jié)果,其中的值均為150幅圖像的處理均值。
由表1中得到的數(shù)據(jù)可知,和JPEG壓縮攻擊比較,噪聲攻擊與高斯模糊攻擊對(duì)本文方法的檢測(cè)率沒(méi)有很大的影響,準(zhǔn)確檢測(cè)率均超過(guò)99%。而在JPEG質(zhì)量因子逐漸升高的情況下,本文方法準(zhǔn)確檢測(cè)率提升,錯(cuò)誤檢測(cè)率減少,在JPEG質(zhì)量因子是30的情況下,本文方法準(zhǔn)確檢測(cè)率也可達(dá)到91%,錯(cuò)誤檢測(cè)率較低,在實(shí)際應(yīng)用中,JPEG質(zhì)量因子一般取50,所以采用本文方法可很好地處理JPEG壓縮攻擊。準(zhǔn)確檢測(cè)率均更高,有很大的優(yōu)勢(shì)。
表1 三種方法檢測(cè)結(jié)果比較
本文提出一種基于濾波殘差多方向差分?jǐn)?shù)字圖像取證方法。對(duì)數(shù)字圖像進(jìn)行濾波殘差分析,對(duì)濾波殘差小波空間特征譜熵進(jìn)行提取,通過(guò)自回歸系數(shù)得到濾波殘差多方向差分特征,將兩種特征構(gòu)成總特征。依據(jù)提取的總特征,通過(guò)支持向量機(jī)進(jìn)行檢測(cè),實(shí)現(xiàn)數(shù)字圖像取證。實(shí)驗(yàn)結(jié)果表明,所提方法有很高的準(zhǔn)確檢測(cè)率,可檢測(cè)出有多個(gè)攻擊的篡改圖,有較高的性能,實(shí)用性強(qiáng)。
四川職業(yè)技術(shù)學(xué)院學(xué)報(bào)2020年4期