劉 婷,梁文龍
(湖南信息職業(yè)技術(shù)學(xué)院,湖南 長(zhǎng)沙 410200)
隨著科技的不斷進(jìn)步與多媒體技術(shù)的快速發(fā)展,人類社會(huì)已經(jīng)步入高速發(fā)展的時(shí)代。多媒體技術(shù)的快速發(fā)展在很大程度上改變了人們的生活方式,眾多的多媒體資源豐富著人們的生活。對(duì)于數(shù)字圖像的研究也越來越多,大家對(duì)圖像的質(zhì)量的要求也越來越高。但在介紹圖像壓縮編碼之前,首先考慮壓縮的原因。因?yàn)閳D像信息量驚人,舉例來說:一張A4大小的照片用中分辨率掃描儀進(jìn)行真彩色掃描,可以得到數(shù)據(jù)量為30兆左右,一般比較大。如今,在互聯(lián)網(wǎng)上,基于字符界面的傳統(tǒng)應(yīng)用逐漸可以被瀏覽圖像信息的互聯(lián)網(wǎng)所取代?;ヂ?lián)網(wǎng)雖然方便,但也帶來了一些問題:圖像信息數(shù)據(jù)量過大,本就緊張的網(wǎng)絡(luò)帶寬變得更加不堪重負(fù)。因此,大量的圖像信息會(huì)對(duì)內(nèi)存的存儲(chǔ)容量、通信干線通道的帶寬和計(jì)算機(jī)的處理速度造成很大的壓力[1-2]。而且,僅僅通過增加內(nèi)存容量、提高通道帶寬和計(jì)算機(jī)處理速度是無法解決這類問題的。這時(shí)候需要考慮使用圖像壓縮了。壓縮的理論基礎(chǔ)是信息論。從信息論的角度來看,壓縮就是去除圖像信息中的冗余,從而保留不確定的信息,去除確定的信息,即用更接近信息本質(zhì)的描述代替對(duì)圖像的描述。原始冗余圖像信息,圖像壓縮通常是通過改變圖像的表示來實(shí)現(xiàn)的,所以壓縮和編碼是密不可分的[3-4]。
在圖像壓縮中,至少有兩個(gè)篡改研究的理由對(duì)檢測(cè)二次壓縮的注意,一是二次壓縮常常造成圖片篡改,例如圖片中的一小塊圖片被復(fù)制到一個(gè)目標(biāo)圖片中產(chǎn)生一個(gè)新的組合圖片,如果原始圖以及目標(biāo)圖是JPEG圖片,分割的圖片應(yīng)該要進(jìn)行圖片壓縮處理,因此追蹤二次壓縮的途徑;二是一些JPEG隱寫的片段可能產(chǎn)生二次壓縮圖片[5-6]??梢詫⒚總€(gè)區(qū)塊進(jìn)一步分割,稱為像素或像點(diǎn),像素是構(gòu)成圖像的最小單位。對(duì)于數(shù)字圖像來說,每一個(gè)像素作為一個(gè)取樣點(diǎn),有一個(gè)對(duì)應(yīng)的取樣數(shù)值。這樣可以看出,圖像分割越細(xì),像素?cái)?shù)越多,取樣點(diǎn)越多,圖像清晰度越高;反之,像素?cái)?shù)越少,圖像清晰度越低。實(shí)際上,對(duì)圖像壓縮處理,就是對(duì)圖像區(qū)塊的數(shù)據(jù)、像素的數(shù)據(jù)進(jìn)行壓縮處理[7-8]。
在本論文中,研究了一種使用相同量化表壓縮檢測(cè)雙壓縮的方法;由于在JPEG壓縮與解壓縮過程中,會(huì)產(chǎn)生量化誤差,截?cái)嗾`差以及取整誤差,一些JPEG的DCT系數(shù)將可能會(huì)被修改,得到的二次壓縮圖片可能與單次壓縮圖片的系數(shù)有些不同。而且,當(dāng)JPEG圖片一次又一次的重壓縮,兩次壓縮階段中的不同DCT系數(shù)的數(shù)量會(huì)單調(diào)性的減少;測(cè)試方法是基于采取一個(gè)隨機(jī)策略,隨機(jī)對(duì)一個(gè)壓縮測(cè)試圖片的DCT系數(shù)進(jìn)行任意的加1或減1,通過使用這種策略,一個(gè)適當(dāng)?shù)谋嚷蕬?yīng)當(dāng)會(huì)被發(fā)現(xiàn)。對(duì)于不同的圖片,這種普遍的適當(dāng)比率將會(huì)產(chǎn)生一個(gè)動(dòng)態(tài)的值域,可以用來區(qū)分一次壓縮還是二次壓縮,而且如果選擇了一個(gè)適當(dāng)?shù)谋嚷剩瑢?duì)于檢測(cè)三次壓縮或四次壓縮也是有效的。
在本文開始部分分析了在使用相同量化表壓縮時(shí)的一些特征。
(1)相同量化表壓縮,Dn>Dn+1,呈現(xiàn)下降趨勢(shì);其中Dn是圖片A與從A壓縮成B的圖片中對(duì)應(yīng)位置的DCT系數(shù)的數(shù)量統(tǒng)計(jì)。
(2)如不同量化表C1相對(duì)會(huì)大(實(shí)驗(yàn)中相同量化表C1為 0.036 8,其中使用的質(zhì)量因子為90,不同量化表C1為0.247 6,其中一次壓縮使用的質(zhì)量因子為90,再次壓縮使用的因子為75;其中C1=Dn/Sn;Sn為原始圖片中非零DCT系數(shù)的值的統(tǒng)計(jì)。
(1) 在進(jìn)行解壓縮圖片J到空間域,然后用相同的量化矩陣壓縮成J′,D為J與J′中不同JPEG系數(shù)的數(shù)量統(tǒng)計(jì)。
統(tǒng)計(jì)的MATLAB算法如下:
function DnNumber=Dn(J1,J2)
DnNumber=0;
[m,n]=size(J1);
for i=1:m
for j=1:n
if J1(i,j)~=J2(i,j)
DnNumber=DnNumber+1;
end
end
end
(2)隨機(jī)選取J′的DCT系數(shù)的修改比例,針對(duì)每個(gè)隨機(jī)選擇的系數(shù)任意的增加或減少1,然后熵編碼修改的JPEG系數(shù)生成圖片Jm′
把修改比例稱為mpnc,(每個(gè)非零JPEG系數(shù)的修改系數(shù)的個(gè)數(shù));如mpnc為0.02,圖片總的像素點(diǎn)為10 000,則修改的像素為10 000×0.02=200個(gè)點(diǎn)會(huì)隨機(jī)加1或減1。
(3)解壓縮Jm′為空間域,用相同的量化表壓縮,我們得到JPEG圖片Jm′′,Dm為Jm′與Jm″中不同DCT系數(shù)對(duì)應(yīng)位置的統(tǒng)計(jì)。
(4)重復(fù)第2—3步驟K次,注意在每次J’的JPEG系數(shù)被隨機(jī)的隨機(jī)選擇修改,但是應(yīng)當(dāng)修改的JPEG系數(shù)比例仍然是相同的。
本文中mpnc修改比例的選擇主要通過實(shí)驗(yàn)來得到的,從0開始,步長(zhǎng)為0.01,一直到0.12的值,求出此范圍中AR的值,可以得出AR最高一般出現(xiàn)在mpnc為0.018的時(shí)候最高。找到一個(gè)適當(dāng)?shù)男薷谋壤?,使其單次壓縮時(shí)Dm的平均值會(huì)小于D,二次壓縮時(shí)不小于D。
通過相關(guān)實(shí)驗(yàn),主要是根據(jù)實(shí)際圖片進(jìn)行壓縮來進(jìn)行測(cè)試,當(dāng)Dm大于等于D時(shí),判斷為二次壓縮圖片,當(dāng)Dm小于D時(shí),判斷為一次壓縮圖片。
測(cè)試數(shù)據(jù)以及測(cè)試場(chǎng)景:
(1)測(cè)試數(shù)據(jù)為447張ucid的圖;
(2)橫坐標(biāo)為相同量化表壓縮冊(cè)數(shù);
(3)縱坐標(biāo)為不同次數(shù)壓縮之間對(duì)應(yīng)位置DCT系數(shù)的不同值的統(tǒng)計(jì)數(shù)目的平均值;質(zhì)量因子為70∶5∶90進(jìn)行對(duì)應(yīng)的選取。
檢測(cè)使用相同量化矩陣的二次壓縮,本文設(shè)計(jì)了一種基于觀察的方法,在重壓縮過程中使用相同的量化矩陣進(jìn)行多次壓縮操作,連續(xù)兩次壓縮版本之間的DCT系數(shù)不同數(shù)量呈單調(diào)遞減狀態(tài);通過實(shí)驗(yàn)可以得出本文檢測(cè)的方法可能不是統(tǒng)計(jì)效應(yīng);本文的檢測(cè)無法提示二次壓縮的圖片是否被篡改。
預(yù)估JPEG壓縮歷史在圖像過程、圖像篡改的應(yīng)用已經(jīng)越來越受到關(guān)注。在本文中,主要采用了直方圖因子的統(tǒng)計(jì)特性來估計(jì)JPEG圖像壓縮歷史。在統(tǒng)計(jì)場(chǎng)景中,對(duì)于沒壓縮的圖片,隨著直方圖bin索引的增加,直方圖因子統(tǒng)計(jì)的值反而減少。然而,它限制了一個(gè)本地的最大值,從而使它不在增加;基于這特性,也可以估計(jì)每次壓縮的量化步長(zhǎng)。
該方法主要是通過對(duì)直方圖因子的處理來估計(jì)量化步長(zhǎng)。直方圖因子估計(jì)JPEG壓縮情況,其步驟如下:
(1)原圖的序列an,經(jīng)過步長(zhǎng)為q量化后的序列為bn,bn= [an/q] ×q;
(2)定義求模的公式F(v) = {u|u∈ N, mod(v,u)=0}
(1)
其中g(shù)(x,F(bn))=1 (當(dāng)x屬于F(bn)集合時(shí),其他為0);
步長(zhǎng)的估計(jì):
(2)
在進(jìn)行本實(shí)驗(yàn)時(shí),所需實(shí)驗(yàn)條件:使用圖片大小為512×512/256×256;圖片使用灰度圖、彩色圖;設(shè)定質(zhì)量因子設(shè)為80/90/100。
當(dāng)?shù)玫降闹狈綀D為遞減且前后柱子的相差趨近為0,那么圖片未被壓縮過;如果得到的直方圖從q等于某個(gè)值開始,開始比較紊亂的變化,那說明圖片已被壓縮過,且q為h(f(x))==1時(shí)的最大值處;圖中的q為4時(shí),達(dá)到最大值。
隨著數(shù)字應(yīng)用的快速發(fā)展,信息傳播迅速增長(zhǎng),圖像傳播的數(shù)量不容低估。隨著不同類型數(shù)碼相機(jī)和各種圖像編輯軟件的不斷出現(xiàn),數(shù)字圖像的應(yīng)用非常廣泛,且作為信息的載體,它被廣泛應(yīng)用于各個(gè)領(lǐng)域。經(jīng)過對(duì)JPEG圖像壓縮理論及相關(guān)算法的學(xué)習(xí),可以對(duì)圖片處理有了很深的理解,從壓縮操作讀取圖片像素→DCT操作→量化處理到解壓縮操作反量化→反IDCT的操作的理解。本文主要提出了一種方法能檢測(cè)使用相同量化表壓縮的二次圖片,其中算法主要是基于用相同量化表經(jīng)過一次又一次的壓縮的過程以及不同JPEG系數(shù)的數(shù)量,并在一定程度上恢復(fù)圖像在壓縮過程中丟失的細(xì)節(jié)信息,通過實(shí)驗(yàn)表明,本文提出的方法是一種有效的JPEG圖像檢測(cè)二次壓縮的方法。