国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)字圖像取證技術(shù)研究進展綜述

2021-10-11 08:12孫建德
關(guān)鍵詞:數(shù)字圖像光源一致性

郭 欣 孫建德

(1)中國人民大學(xué)統(tǒng)計學(xué)院,100872,北京; 2)山東師范大學(xué)信息科學(xué)與工程學(xué)院,250358,濟南 )

1 引 言

自從發(fā)明了成像設(shè)備,人們便可記錄很多事情發(fā)生的瞬間,圖像在提供證據(jù)和支撐歷史紀錄等方面得到了越來越廣泛的應(yīng)用,例如:新聞報道、刑事調(diào)查、法庭辯護等方面,因此,照片的真實性至關(guān)重要.然而,隨著圖像處理軟件、程序方法的快速發(fā)展,圖像的處理變得越來越簡單且多樣化,出現(xiàn)了大量的偽造圖像.

在圖像處理技術(shù)尚沒高度發(fā)達的時候,人們對數(shù)字圖像的篡改大多是通過圖像的復(fù)制-移動、剪切-拼接等操作來進行,這些操作也會產(chǎn)生人眼無法識別的篡改圖像.近幾年來,隨著AI(Artifical Intelligence)技術(shù)的飛速發(fā)展,圖像篡改的技術(shù)越來越高超,可以由噪聲生成不存在的圖像,也可以根據(jù)自己想要的效果對圖像的某個部位進行偽造,出現(xiàn)了越來越多的篡改圖像.2017年,“Deepfake”(深度換臉技術(shù))一詞風(fēng)行全球,并取得了非常逼真的效果,給政治界、娛樂圈以及人們的日常生活帶來了很大的影響.如圖1所示,“Deepfake”把希拉里·克林頓換成了美國總統(tǒng)特朗普的樣子,并且可以完美地實現(xiàn)動態(tài)視頻中的“表情變化”.在圖像生成方面,生成的圖像質(zhì)量也越來越高.2018年,Huang H等人[1]提出了IntroVAE模型,能夠生成1 024×1 024高分辨率的自然圖像;2018年,Deep Mind公司[2]提出了基于ImageNet的BigGANs模型生成高分辨率、逼真的自然圖像(如圖2所示),可以生成非常清晰的多種類圖像.由此可見,圖像的篡改技術(shù)越來越高明,由起初對圖像的小修小改到現(xiàn)在輸入噪音生成不存在的圖像或視頻,給人們研究圖像的真實性帶來了更大的挑戰(zhàn).

圖1 Deepfake 偽造的視頻截圖

圖2 BigCANs生成的圖像

為了應(yīng)對上述問題,數(shù)字圖像取證技術(shù)成為研究的熱點問題,是檢測圖像是否被篡改的主要方法[3-5].數(shù)字圖像取證技術(shù)可以分析數(shù)字圖像的某些特性,因此可以用于識別、鑒定數(shù)字圖像是否被篡改,保證數(shù)字圖像內(nèi)容的完整性、真實性和原始性[6].研究人員通過提取圖像的各類統(tǒng)計特征,或者是相機的一些成像函數(shù)特征,將自然圖像和篡改圖像進行區(qū)分,實現(xiàn)篡改圖像的檢測.這種傳統(tǒng)的圖像取證技術(shù)能夠?qū)崿F(xiàn)的精度比較高,但是產(chǎn)生了高計算成本以及人工操作的成本.隨著深度學(xué)習(xí)方法的發(fā)展,研究人員將卷積神經(jīng)網(wǎng)絡(luò)(CNN,Convolution Neural Networks)用于圖像取證技術(shù),能夠提取圖像更多的特征,高效地完成偽造檢測.

本文致力于數(shù)字圖像取證技術(shù)的研究,將對數(shù)字圖像取證技術(shù)做出介紹,并從傳統(tǒng)圖像取證技術(shù)和基于深度學(xué)習(xí)的圖像取證技術(shù)兩個方向?qū)鼛啄陙韴D像被動取證方面的主要進展做出綜述,對經(jīng)典的圖像取證方法進行分析研究,概括現(xiàn)在圖像取證技術(shù)依然存在的挑戰(zhàn),預(yù)測未來圖像取證技術(shù)可能的發(fā)展方向.

2 數(shù)字圖像取證技術(shù)的定義

數(shù)字圖像取證技術(shù)(Digital Image Forensics),是通過對圖像統(tǒng)計特性的分析來判斷圖像內(nèi)容的真實性、完整性和原始性,也就是判斷數(shù)字圖像從被數(shù)碼相機拍攝以后有沒有經(jīng)過篡改的技術(shù)[7].它的出發(fā)點是通過提取數(shù)字圖像周期中留下的固有痕跡進行分析,判斷數(shù)字圖像的操作歷史.數(shù)字圖像取證技術(shù)用來檢測數(shù)字圖像的真實性,根據(jù)主要的解決思路,可以分為主動取證技術(shù)和被動取證技術(shù)[8].

主動取證技術(shù)是將識別的信息嵌入到數(shù)字圖像中,然后再提取識別信息,將提取出的信息與原先嵌入的信息進行比較,從而鑒別圖像是否真實和完整,如數(shù)字水印技術(shù)(Digital Watermarking),是事先在圖像的空域或者頻域中嵌入易碎的水印信息,圖像經(jīng)過傳輸后再提取水印信息,通過判斷水印信息是否完整來判斷圖像是否被篡改[7].

被動取證技術(shù),又稱為盲取證技術(shù),不需要圖像的先驗信息,也不需要發(fā)送端對圖像進行操作,僅僅利用接收到的圖像來判斷其真實性或完整性.被動取證技術(shù)認為,盡管人眼無法識別出圖像偽造的痕跡,但是圖像的基本統(tǒng)計特性和一致性會被篡改操作影響,引起自然圖像各種形式的不一致性.因此,可以利用這些不一致性,通過學(xué)習(xí)分析識別圖像的篡改痕跡以及對這些篡改進行定位.

對偽造的數(shù)字圖像進行被動檢測可以看成一個二分類問題,將被檢測的圖像分為兩類:真實圖像或偽造圖像.盲取證過程(如圖3所示)可以由以下幾個步驟組成:

圖3 被動取證技術(shù)過程圖

1) 圖像預(yù)處理:對圖像進行一些預(yù)處理操作提高檢測的準確率,如,灰度圖轉(zhuǎn)換、離散余弦變換等,這一步不是必須的操作.

2) 特征提取與處理:對(處理后)圖像進行特征提取,對原始圖像和篡改后的圖像分別提取特征,提取的特征要對篡改操作非常敏感且能夠有效地區(qū)分原始圖像和偽造圖像.如果提取的特征維度較大,可以對特征進行降維處理,這樣可以在準確率高的同時達到降低計算成本的目的.

3) 訓(xùn)練分類器:利用處理好的特征,可以對分類器進行訓(xùn)練.

4) 分類與后處理:將要檢測的圖像,也像訓(xùn)練圖像一樣執(zhí)行1)、2)步操作,然后將得到的特征輸入到分類器中,判斷圖像是自然圖像還是偽造圖像,根據(jù)判斷結(jié)果可以對圖像進行一些后續(xù)處理,如,篡改定位等操作.

3 基于內(nèi)在一致性的傳統(tǒng)圖像取證技術(shù)

基于內(nèi)在一致性的傳統(tǒng)數(shù)字圖像取證技術(shù)主要是對圖像提取不同的特征,然后用這些特征訓(xùn)練分類模型,實現(xiàn)對被檢測圖像的分類.常常被考慮到的內(nèi)在一致性主要包含:光學(xué)規(guī)律的一致性、傳感器規(guī)律一致性、圖像篡改時的痕跡所做以及統(tǒng)計特征的一致性.

3.1光學(xué)規(guī)律一致性數(shù)字圖像取證技術(shù)利用光學(xué)規(guī)律主要體現(xiàn)在利用光照的一致性或圖像的色差來完成.對一張圖像進行修改后,很難準確地匹配原始圖像的光照條件,圖4是由電影明星Cher和Brad Pitt的兩張個人圖像合成的圖像[9],Cher拍照時的光源方向是不確定的,而Pitt拍照時的光源方向位于他的左側(cè),由此可以判斷這是一幅偽造圖像.因此,光照的不一致性可以成為檢測圖像是否被篡改的工具.

圖4 電影明星Cher和Brad Pitt的合成圖像

近年來,有很多檢測工作是利用光源的方向進行的.Micah K Johnson等人[9]認為,只要能夠估計出一幅圖像中不同的人或者物體的光源方向,則可以根據(jù)光源一致性來判斷該圖像是否為偽造圖像.因此,他們提出了一種使用單張圖像估計光源方向的方法,在P Nillius等人[10]提出的對于光源方向自動預(yù)測的模型的基礎(chǔ)上,將模型的一些必須假設(shè)放寬松,對物體對光線的反射進行分析,并且添加了周圍環(huán)境因素對于光線的影響,提出了更一般的光源方向預(yù)測模型.同時,他們考慮了3-D光源與2-D光源、整體光源與局部光源的情況,取得了不錯的實驗效果.這個方法可以適用于任何圖像確定其光源方向,但是只能在一定模糊度內(nèi)確定光源的方向.

Micah K Johnson等人[11]在另一個工作中提出,場景中的光源會在眼睛上產(chǎn)生高光,可以借助眼睛中高光的位置判斷光源的3-D方向.高光的位置由光源、反射面以及觀察者(或相機)的相對位置決定的.當觀察者的方向為高光能被看到的方向時,可以從眼睛高光處的表面反射法線和觀察者的方向估計出光源的方向.判斷出光源的方向后,就可以用來檢測圖像是否是偽造圖像.由于這個方法是從眼睛中高光來判斷光源方向的,因此只能用于眼睛分辨率比較高的圖像,存在一定的局限性.

上面這兩種方法對單一光源為主的圖像判斷非常有效,但是不適用于包含多個光源或非定向照明的復(fù)雜照明環(huán)境(如陰天的天空).Micah K Johnson等人[12]提出了在復(fù)雜的照明環(huán)境中使用光照不一致性檢測篡改的方法.基于照明是遠距離的、拍攝場景中的表面是凸的、表面的反射率是恒定的以及相機的響應(yīng)是線性的假設(shè),他們利用Ravi Ramamoorthi等人[13]的工作,將復(fù)雜的光照環(huán)境進化成一個低維模型(9-D),并且刻畫了如何從單個圖像估計模型中參數(shù)的方法以及如何簡化成5-D模型.然而,不同的光照環(huán)境有時會產(chǎn)生近似的模型系數(shù),此時,模型無法區(qū)分光照差異.

除了利用光源方向,圖像的色差也可用于檢測偽造圖像.橫向色差在一階近似下表示為彩色通道相對于其它通道的膨脹/收縮,在對圖像進行篡改時,橫向色差經(jīng)常受到干擾,不能保持一致性.Micah K Johnson等人[14]分析了色差產(chǎn)生的原因,并對色差的產(chǎn)生建立模型,同時考慮了1-D成像系統(tǒng)和2-D成像系統(tǒng),然后利用最大化顏色通道之間的相互信息算法對色差進行估計,使用估計得到的色差計算其一致性,對偽造圖像進行檢測.

3.2傳感器規(guī)律一致性基于傳感器特性的數(shù)字圖像取證技術(shù)主要檢測相機模式噪聲的存在.相機模式噪聲是成像傳感器中的一個隨機特征,而在偽造的圖像區(qū)域是沒有這種模式噪聲的,并且對于被抑制的噪聲缺少合理的解釋,因此,相機的模式噪聲可以用來檢測偽造圖像.

Jan Luká?等人[15]在假設(shè)拍攝圖像的相機可用或由該相機拍攝的其它圖像可以獲得的情況下,提出了基于相機模式噪聲的偽造數(shù)字圖像檢測方法.他們主要回顧了模式噪聲的特性和近似求解方法,對于給定的相機,通過對由此相機拍攝的多幅圖像求平均得到相機的模式噪聲參考值.對于給定的檢測圖像,為了確定其選中區(qū)域是否與相機模式噪聲兼容,首先計算該區(qū)域的噪聲殘差與相機參考模式的相關(guān)性,在相關(guān)性超過閾值時,說明該區(qū)域是被篡改的.除此之外,他們還介紹了一種偽造區(qū)域的自動識別算法,偽造區(qū)域被確定為一幅圖像中模式噪聲最低的區(qū)域.通過在一幅圖像中滑動一組不同的基本形狀,計算每個形狀之間噪聲的相關(guān)性,積累最低的相關(guān)值,判斷偽造區(qū)域.這個方法適用于任何的偽造方法,但是也存在一定的局限性,因為它要求能夠有和檢測圖像同相機拍攝的照片.

Chen Mo等人[16]提出了一個統(tǒng)一的框架,用于從圖像中識別源數(shù)碼相機,并使用光響應(yīng)非均勻噪聲(PRNU,Photo Response Non-uniformity)來顯示經(jīng)過處理的圖像.從傳感器輸出的簡化模型出發(fā),利用最大似然原理,估計PRNU,然后通過檢測所研究圖像的特定區(qū)域中的傳感器PRNU的存在來實現(xiàn)識別源數(shù)碼相機以及檢測偽造兩個取證任務(wù).檢測被公式化為假設(shè)檢驗問題,是使用小圖像塊的測試統(tǒng)計的預(yù)測器獲得最佳測試統(tǒng)計的統(tǒng)計分布.此方法是在Jan Luká?等人的工作[15]的基礎(chǔ)上提出來的,能夠使用更少的數(shù)據(jù)獲得更準確度估計.

3.3圖像篡改痕跡或生成痕跡人們對圖像進行篡改時,通常會留下各種人眼不可見的內(nèi)在篡改痕跡,因此,有很多研究工作通過檢測這些痕跡對圖像進行篡改檢測.通常這類篡改檢測方法包括對解碼、白平衡以及伽馬校正的檢測.當圖像成像時,也會有很多相機產(chǎn)生的痕跡,如果對圖像進行篡改,這些痕跡是不存在的或者比較弱,因此也可使用這些痕跡對偽造圖像 進行檢測.

基于這樣一個事實,即通常一個圖像的篡改操作會以一種可測量的方式改變相機顏色濾波陣列(CFA,Color Filter Array)的解碼工件,缺少CFA工件或檢測到較弱的CFA工件可能表明存在全局或局部篡改.Ahmet EmirDirik等人[17]提出了一種基于CFA解碼的篡改檢測技術(shù),通過對CFA模式數(shù)估計和CFA噪聲的分析,將計算出來的結(jié)果與一個經(jīng)驗閾值進行比較,確定圖像是否被篡改.

Ashwin Swaminathan等人[18]提出了一種基于內(nèi)在指紋的圖像取證技術(shù),內(nèi)在指紋是指各種圖像處理操作,包括內(nèi)部和外部采集設(shè)備,在數(shù)字圖像上留下的痕跡.他們通過對相機模型及其組成分析,估計出各種相機內(nèi)處理操作的內(nèi)在指紋.將相機捕獲的圖像進一步處理建模為操作濾波器,采用盲反卷積技術(shù)獲得線性時不變估計,并估計與這些后置相機操作相關(guān)的內(nèi)在指紋.通過對被檢測的圖像進行分析,與相機施加的指紋出現(xiàn)變化或者不一致,或出現(xiàn)了新的類型的指紋,表明圖像經(jīng)過了篡改.

大多數(shù)數(shù)碼相機使用一個傳感器和一個顏色濾波陣列,然后插值缺失的顏色樣本,得到一個三通倒的彩色圖像.這種插值引入了特定的相關(guān)性,當對圖像進行篡改時,這些相關(guān)性很可能被破壞.Alin C Popescu and Hany Farid[19]量化了CFA插值引入的特定關(guān)聯(lián),并通過構(gòu)建算法能夠在圖像的任何部分自動檢測到這些關(guān)聯(lián),如果一幅圖像被檢測到缺失這些關(guān)聯(lián),則是被篡改的圖像.

3.4統(tǒng)計特征一致性篡改圖像和原始圖像的統(tǒng)計特征是存在差異的,基于統(tǒng)計特征的圖像取證技術(shù)是對兩種不同的圖像進行特征提取,然后用提取到的特征訓(xùn)練分類器,對測試圖像進行檢測.

Wang Wei等人[20]提出了一種從圖像的色度通道進行邊緣信息的提取,建模為一個有限狀態(tài)的馬爾可夫鏈,從馬爾可夫鏈的平穩(wěn)分布中提取低維特征向量用于圖像篡改檢測.首先通過一個掩模與圖像的色度分量進行卷積得到此色度分量的邊緣圖像,然后對此邊緣圖像進行閾值化,得到閾值化后的邊緣圖像.由于此圖像的像素值為0-T之間的整數(shù),因此可以建模為有限狀態(tài)的馬爾可夫鏈,隨后用一步轉(zhuǎn)移概率矩陣來表征此圖像,通過對轉(zhuǎn)移概率矩陣進行操作,得到馬爾可夫鏈的平穩(wěn)分布,作為特征向量.然后用這些特征向量訓(xùn)練SVM(Support Vector Machines),進行篡改檢測.該方法的優(yōu)點是提取了低維的特征向量,降低了計算復(fù)雜度.

Hsu Yufeng和Chang Shihfu提出了一種基于圖像中不同區(qū)域相機特征一致性檢測的自動拼接圖像檢測方法.首先將測試圖像分割成不同的區(qū)域,利用平面區(qū)域輻照度點(LPIPs)的幾何不變量,從每個區(qū)域中估計一個相機響應(yīng)函數(shù)(CRF),計算CRF交叉擬合分數(shù)和區(qū)域強度特征,訓(xùn)練SVM分類器,用來確定兩個區(qū)域之間的邊界劃分是否為真實的或者拼接的,進而判斷整個圖像是否是被篡改的[21].

Hsu Yufeng等人[22]提出了一個基于判別隨機場(DRF,Discriminative Random Fields)的統(tǒng)計融合框架來集成適合于篡改檢測的多個線索的圖像取證方法.進行線索融合檢測篡改圖像主要有兩方面的優(yōu)勢:處理不同類型的篡改圖像以及通過不同模塊的分工合作提高檢測精度.現(xiàn)有的檢測方法主要基于檢測的輸出分為局部真實性檢測和空間不一致性檢測.本文以雙量化(DQ,Double Quantization)作為局部真實性檢測的線索,以相機響應(yīng)函數(shù)(CRF,Camera Response Function)作為相鄰區(qū)域一致性檢測的線索,將兩個線索的融合看成標注問題,利用DRF進行融合.將圖像劃分為一個個8×8的塊,然后將這些塊隨機劃分為不同的區(qū)域,對每一個塊計算其DQ得分,對每個區(qū)域中的塊之間計算CRF一致性得分,對不同區(qū)域的塊之間計算CRF一致性得分,通過DRF計算其最大后驗概率,來估計其相應(yīng)的標簽,判斷是否被篡改.

Kaur等人[23]提出了一種無源混合方法檢測復(fù)制-移動和拼接進行的圖像偽造.該方法基于離散分數(shù)余弦變換(DFCT,Discrete Fractional Cosine Transform)和局部二值模式(LBP,Local Binary Patterns)實現(xiàn).其中,離散分數(shù)余弦變換的分數(shù)參數(shù)可以提高檢測的精度,局部二值模式可以有效地突出偽影.同時,利用支持向量機(SVM)對圖像進行分類,分為真實圖像、復(fù)制移動圖像和拼接圖像.接下來,對復(fù)制移動圖像和拼接圖像進行定位,定位圖像中的篡改區(qū)域.

Shah等人[24]致力于圖像復(fù)制-移動偽造檢測,提出一種有效的檢測方法.該方法首先將離散小波變換應(yīng)用于輸入圖像,所得到的最低頻率近似子帶被分割成具有固定大小的重疊小塊,滑動因子為一個像素.然后計算每個固定大小塊的二維離散余弦變換,然后通過Zigzag掃描存儲為單行向量,用于偽造檢測.混合變換和快速K-means聚類技術(shù)的使用有助于提高處理速度,減少整體偽造檢測時間.

4 基于深度學(xué)習(xí)的圖像取證技術(shù)

隨著深度學(xué)習(xí)的興起,圖像取證方向的研究人員也將目光轉(zhuǎn)移到深度學(xué)習(xí)的方法上[25-28].基于深度學(xué)習(xí)的圖像取證技術(shù)與上文中描述的傳統(tǒng)的圖像取證技術(shù)不同,類似于其它基于深度學(xué)習(xí)算法的任務(wù),將圖像的特征提取的分類結(jié)合在一起,構(gòu)造一個統(tǒng)一的網(wǎng)絡(luò),實現(xiàn)了end-to-end的圖像取證技術(shù).同時,也有研究者將深度網(wǎng)絡(luò)與信息論相結(jié)合完成圖像取證工作[29-30].基于深度學(xué)習(xí)的圖像取證領(lǐng)域的研究工作主要涉及到了三個方面:一是簡單的遷移;二是對網(wǎng)絡(luò)輸入進行修改;三是對網(wǎng)絡(luò)結(jié)構(gòu)進行修改.

4.1簡單的遷移由于圖像取證問題可以看成是分類問題,因此可以將已經(jīng)在計算機視覺領(lǐng)域經(jīng)常用于分類的卷積神經(jīng)網(wǎng)絡(luò)(CNN)結(jié)構(gòu)直接應(yīng)用于圖像取證領(lǐng)域,這可以看成是對卷積神經(jīng)網(wǎng)絡(luò)在圖像取證問題上的簡單遷移.相機源取證是可以解決圖像取證的一個關(guān)鍵思路,判斷出圖像是否符合某種相機拍攝的特點,就可以確定圖像是哪款相機拍攝的,進而判斷其是否被偽造.在傳統(tǒng)的方法中,已經(jīng)有根據(jù)不同相機在管道中留下的特征軌跡對圖像的相機源進行取證.Luca Baroffio等人[31]首次提出將卷積神經(jīng)網(wǎng)絡(luò)用于判斷圖像相機源問題,與傳統(tǒng)的相機源取證方法不同,該方法直接從每個相機拍攝的大量圖片中學(xué)習(xí)每個相機的特征,利用學(xué)習(xí)到的特征對測試圖像進行分類.他們提出的網(wǎng)絡(luò)結(jié)構(gòu)使用了三個卷積層和兩個全連接層,包含了濾波、池化和非線性激活等一系列簡單的操作,對于27種相機模型的識別準確率均大于94%.

4.2對網(wǎng)絡(luò)輸入進行修改雖然圖像取證問題可以看成是分類問題,但是它和分類問題是有區(qū)別的.由于造假技術(shù)越來越高超,真?zhèn)螆D像之間的差異越來越小,多數(shù)情況下是人眼無法識別的,如圖5所示,BBC新聞上報道的伊朗導(dǎo)彈圖片中顯示了四枚,但實際上只有三枚導(dǎo)彈是真的,其中一枚是通過其它導(dǎo)彈復(fù)制移動過去的,這是人眼無法識別的[32].而對于計算機視覺領(lǐng)域的分類問題,類別之間的差異還是比較明顯的,多數(shù)情況下是人眼可以識別的.因此,研究人員將計算機視覺領(lǐng)域中用于分類任務(wù)的深度學(xué)習(xí)模型遷移到圖像取證領(lǐng)域時,通常在模型之前對網(wǎng)絡(luò)的輸入進行處理,以達到放大類間差異的效果.

圖5 伊朗導(dǎo)彈偽造圖片

Chen Jiansheng和Kang Xiangui等人[37]提出的基于卷積神經(jīng)網(wǎng)絡(luò)的中值濾波取證模型,與傳統(tǒng)的CNN模型不同,這個CNN框架的第一層為濾波層,將圖像作為輸入,然后輸出其中值濾波殘差(MFR,Median Fitering Residuals),通過這步預(yù)處理操作,圖像內(nèi)容被去掉,同時圖像噪聲信號也被放大.然后,通過卷積層和池化層學(xué)習(xí)圖像噪聲的特征表示,最后對圖像進行分類.實驗結(jié)果顯示,該文章中的取證模型取得了顯著的性能改進,特別是在復(fù)制粘貼偽造檢測方面.通過對比實驗,添加了濾波層的模型,檢測結(jié)果優(yōu)于未添加濾波層的模型7.22%.

Paolo Rota等人[34]認為,為了能夠直接從數(shù)據(jù)中學(xué)習(xí)到原始圖像和篡改圖像的特征,需要一組一致的標記圖像,而很多篡改圖像只是圖像中的小部分被篡改,圖像的其它內(nèi)容會對其特征提取產(chǎn)生影響.因此,他們提出了一種基于補丁(Patch)的卷積神經(jīng)網(wǎng)絡(luò)模型去檢測篡改圖像,對于篡改的圖像,從篡改區(qū)域的邊界提取Patch,對于真實圖像,從圖像中隨機抽選Patch,使用提出的Patch學(xué)習(xí)特征訓(xùn)練網(wǎng)絡(luò).這種方法不僅使學(xué)習(xí)到的特征更加精確,而且還能達到擴充數(shù)據(jù)集的效果.

Luca Bondi等人[35]基于不同相機模型在圖像上留下不同的特征痕跡,利用圖像補丁的方法訓(xùn)練CNN模型,進行篡改檢測.如果圖像是原始圖像,則所有像素都應(yīng)該被檢測為一個設(shè)備的痕跡,如果圖像是偽造的,則可以檢測到多個設(shè)備的痕跡.通過CNN模型學(xué)習(xí)特征后,利用迭代聚類技術(shù)對這些特征進行分析,檢測圖像是否偽造.

4.3對網(wǎng)絡(luò)結(jié)構(gòu)進行修改通過4.2節(jié)的分析,可以看出取證問題與分類問題存在一定的差異,很多研究人員也意識到了這些差異,有關(guān)學(xué)者嘗試對深度學(xué)習(xí)中的模型進行修改,結(jié)合圖像取證的實際問題提出相應(yīng)的網(wǎng)絡(luò)模型.

Belhassen Bayar等人[36]提出了一種使用深度學(xué)習(xí)模型檢測篡改圖像的方法,使用一種新的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),直接從大量的訓(xùn)練數(shù)據(jù)中自動學(xué)習(xí)不同操作的不同特性.與以往的學(xué)習(xí)圖像內(nèi)容特征的卷積網(wǎng)絡(luò)不同,在新的模型中,他們開發(fā)了一種新的卷積層,用來抑制圖像內(nèi)容對檢測的影響,并且能夠自適應(yīng)地學(xué)習(xí)篡改操作的特性,而不需要預(yù)先選擇特征或其它的預(yù)處理.通過對圖像內(nèi)容的抑制,對于圖像的篡改檢測準確率能達到99.10%.

Peng Zhou等人[37]提出了一種雙流的Faster Region-CNN網(wǎng)絡(luò),可以學(xué)習(xí)更豐富的特征,實現(xiàn)端到端的訓(xùn)練.兩個特征流之一是RGB流,其目的是從RGB圖像輸入中提取特征,以發(fā)現(xiàn)篡改痕跡,如強度對比差異、非自然篡改邊界等;另一個特征流是噪聲流,利用隱寫分析模型中提出的SRM濾波層提取原始圖像和篡改圖像的噪聲特征.然后,通過一個雙線性池化層融合這兩種特征,進一步合并這兩種特征的空間共現(xiàn).兩種特征融合在一起進行篡改檢測,提高了準確率,不僅能夠檢測篡改痕跡,還能夠區(qū)分各種篡改技術(shù).

DariusAfchar等人[38]提出了一種自動有效檢測視頻中人臉偽造的方法,主要是針對目前偽造視頻的兩種新技術(shù):Deppfake和Face2Face.他們提出了兩種不同的MesoNet模型,網(wǎng)絡(luò)結(jié)構(gòu)主要由卷積層、最大池化層以及全連接層組成,能夠很好地學(xué)習(xí)圖像的細觀特性,在Deppfake數(shù)據(jù)集上能夠達到98%的檢測準確率,在Face2Face數(shù)據(jù)集上能夠達到95%準確率.

Liu等人[39]的研究不同于以往經(jīng)典的檢測篡改解決方案,提出一種新型端到端生成對抗網(wǎng)絡(luò)(CD-GAN)解決圖像的復(fù)制-移動偽造檢測問題.該模型不需要具體的提取特征,只需要真實圖像的樣本和偽造圖像的樣本輸入網(wǎng)絡(luò)進行訓(xùn)練.與傳統(tǒng)的基于卷積神經(jīng)網(wǎng)絡(luò)的偽造檢測方法對比,該網(wǎng)絡(luò)的檢測精度大大提高.

Elaskily等人[40]提出了一種檢測圖像是否有復(fù)制-移動篡改的深度網(wǎng)絡(luò)模型(CMFD).該模型的主要結(jié)構(gòu)為卷積神經(jīng)網(wǎng)絡(luò)(CNN)和卷積長短時記憶網(wǎng)絡(luò)(CovLSTM).該方法通過卷積(Convolutions, CNVs)層、ConvLSTM層和pooling層提取圖像特征,然后進行特征匹配,檢測復(fù)制移動偽造.

5 展 望

由于深度學(xué)習(xí)的快速發(fā)展以及良好效果的取得,圖像偽造效果也越來越好,人們也慢慢地把目光轉(zhuǎn)移到對視頻進行篡改.因此,在對圖像取證提高準確率的同時,對視頻的取證也是一個有待解決的問題.傳統(tǒng)的圖像取證技術(shù)雖然能夠取得不錯的效果,但是需要人工操作的地方比較多,而深度學(xué)習(xí)的取證方法能夠?qū)崿F(xiàn)端到端的效果,并且是自動提取特征,不需要過多的人工干預(yù),在數(shù)據(jù)集充足的情況下,也能取得很好的效果.基于深度學(xué)習(xí)的取證技術(shù)也是未來的主流研究方向,將傳統(tǒng)方法和深度方法進行結(jié)合能否取得更好的效果,也是一個值得討論的問題.

6 結(jié) 語

本文主要介紹了數(shù)字圖像取證技術(shù),并對傳統(tǒng)的數(shù)字圖像取證技術(shù)和基于深度學(xué)習(xí)方法的取證技術(shù)分類概述.在傳統(tǒng)的數(shù)字圖像取證方面,本文重點概述了基于光照統(tǒng)一性、傳感器規(guī)律統(tǒng)一性、圖像篡改痕跡或成像痕跡以及統(tǒng)計特征四個方面的經(jīng)典方法;在深度學(xué)習(xí)用于圖像取證方面,本文重點從簡單的模型遷移、對網(wǎng)絡(luò)輸入層的修改以及對網(wǎng)絡(luò)結(jié)構(gòu)的修改三個方面進行介紹.由于篡改技術(shù)越來越高超,對視頻的篡改檢測也是取證領(lǐng)域面臨的一大挑戰(zhàn).深度學(xué)習(xí)在計算機視覺領(lǐng)域取得了重大進展和良好的效果,基于深度學(xué)習(xí)的圖像取證方法將是主要的研究方向.

猜你喜歡
數(shù)字圖像光源一致性
數(shù)字圖像水印技術(shù)綜述
注重教、學(xué)、評一致性 提高一輪復(fù)習(xí)效率
對歷史課堂教、學(xué)、評一體化(一致性)的幾點探討
IOl-master 700和Pentacam測量Kappa角一致性分析
光源改變光環(huán)境
享受LED光源的卓越色彩 Acer(宏碁)PD1530i
ARGUS-100 藝術(shù)品鑒證數(shù)字圖像比對系統(tǒng)
LED照明光源的溫升與散熱分析
基于變分水平集方法的數(shù)字圖像分割研究
基于事件觸發(fā)的多智能體輸入飽和一致性控制