關(guān)于檢測(cè)JPEG圖像的二次壓縮算法研究

2022-02-09 12:15梁文龍

無線互聯(lián)科技 2022年21期

劉婷，梁文龍

(湖南信息職業(yè)技術(shù)學(xué)院，湖南長(zhǎng)沙 410200)

0 引言

隨著科技的不斷進(jìn)步與多媒體技術(shù)的快速發(fā)展，人類社會(huì)已經(jīng)步入高速發(fā)展的時(shí)代。多媒體技術(shù)的快速發(fā)展在很大程度上改變了人們的生活方式，眾多的多媒體資源豐富著人們的生活。對(duì)于數(shù)字圖像的研究也越來越多，大家對(duì)圖像的質(zhì)量的要求也越來越高。但在介紹圖像壓縮編碼之前，首先考慮壓縮的原因。因?yàn)閳D像信息量驚人，舉例來說：一張A4大小的照片用中分辨率掃描儀進(jìn)行真彩色掃描，可以得到數(shù)據(jù)量為30兆左右，一般比較大。如今，在互聯(lián)網(wǎng)上，基于字符界面的傳統(tǒng)應(yīng)用逐漸可以被瀏覽圖像信息的互聯(lián)網(wǎng)所取代?；ヂ?lián)網(wǎng)雖然方便，但也帶來了一些問題：圖像信息數(shù)據(jù)量過大，本就緊張的網(wǎng)絡(luò)帶寬變得更加不堪重負(fù)。因此，大量的圖像信息會(huì)對(duì)內(nèi)存的存儲(chǔ)容量、通信干線通道的帶寬和計(jì)算機(jī)的處理速度造成很大的壓力[1-2]。而且，僅僅通過增加內(nèi)存容量、提高通道帶寬和計(jì)算機(jī)處理速度是無法解決這類問題的。這時(shí)候需要考慮使用圖像壓縮了。壓縮的理論基礎(chǔ)是信息論。從信息論的角度來看，壓縮就是去除圖像信息中的冗余，從而保留不確定的信息，去除確定的信息，即用更接近信息本質(zhì)的描述代替對(duì)圖像的描述。原始冗余圖像信息，圖像壓縮通常是通過改變圖像的表示來實(shí)現(xiàn)的，所以壓縮和編碼是密不可分的[3-4]。

1 檢測(cè)相同量化表二次壓縮研究

在圖像壓縮中，至少有兩個(gè)篡改研究的理由對(duì)檢測(cè)二次壓縮的注意，一是二次壓縮常常造成圖片篡改，例如圖片中的一小塊圖片被復(fù)制到一個(gè)目標(biāo)圖片中產(chǎn)生一個(gè)新的組合圖片，如果原始圖以及目標(biāo)圖是JPEG圖片，分割的圖片應(yīng)該要進(jìn)行圖片壓縮處理，因此追蹤二次壓縮的途徑；二是一些JPEG隱寫的片段可能產(chǎn)生二次壓縮圖片[5-6]?？梢詫⒚總€(gè)區(qū)塊進(jìn)一步分割，稱為像素或像點(diǎn)，像素是構(gòu)成圖像的最小單位。對(duì)于數(shù)字圖像來說，每一個(gè)像素作為一個(gè)取樣點(diǎn)，有一個(gè)對(duì)應(yīng)的取樣數(shù)值。這樣可以看出，圖像分割越細(xì)，像素?cái)?shù)越多，取樣點(diǎn)越多，圖像清晰度越高；反之，像素?cái)?shù)越少，圖像清晰度越低。實(shí)際上，對(duì)圖像壓縮處理，就是對(duì)圖像區(qū)塊的數(shù)據(jù)、像素的數(shù)據(jù)進(jìn)行壓縮處理[7-8]。

在本論文中，研究了一種使用相同量化表壓縮檢測(cè)雙壓縮的方法；由于在JPEG壓縮與解壓縮過程中，會(huì)產(chǎn)生量化誤差，截?cái)嗾`差以及取整誤差，一些JPEG的DCT系數(shù)將可能會(huì)被修改，得到的二次壓縮圖片可能與單次壓縮圖片的系數(shù)有些不同。而且，當(dāng)JPEG圖片一次又一次的重壓縮，兩次壓縮階段中的不同DCT系數(shù)的數(shù)量會(huì)單調(diào)性的減少；測(cè)試方法是基于采取一個(gè)隨機(jī)策略，隨機(jī)對(duì)一個(gè)壓縮測(cè)試圖片的DCT系數(shù)進(jìn)行任意的加1或減1，通過使用這種策略，一個(gè)適當(dāng)?shù)谋嚷蕬?yīng)當(dāng)會(huì)被發(fā)現(xiàn)。對(duì)于不同的圖片，這種普遍的適當(dāng)比率將會(huì)產(chǎn)生一個(gè)動(dòng)態(tài)的值域，可以用來區(qū)分一次壓縮還是二次壓縮，而且如果選擇了一個(gè)適當(dāng)?shù)谋嚷剩瑢?duì)于檢測(cè)三次壓縮或四次壓縮也是有效的。

1.1 相同量化矩陣的壓縮的特征

在本文開始部分分析了在使用相同量化表壓縮時(shí)的一些特征。

(1)相同量化表壓縮，Dn>Dn+1，呈現(xiàn)下降趨勢(shì)；其中Dn是圖片A與從A壓縮成B的圖片中對(duì)應(yīng)位置的DCT系數(shù)的數(shù)量統(tǒng)計(jì)。

(2)如不同量化表C1相對(duì)會(huì)大(實(shí)驗(yàn)中相同量化表C1為 0.036 8，其中使用的質(zhì)量因子為90，不同量化表C1為0.247 6，其中一次壓縮使用的質(zhì)量因子為90，再次壓縮使用的因子為75；其中C1=Dn/Sn；Sn為原始圖片中非零DCT系數(shù)的值的統(tǒng)計(jì)。

1.2 隨機(jī)策略的檢測(cè)統(tǒng)計(jì)算法步驟

(1) 在進(jìn)行解壓縮圖片J到空間域，然后用相同的量化矩陣壓縮成J′，D為J與J′中不同JPEG系數(shù)的數(shù)量統(tǒng)計(jì)。

統(tǒng)計(jì)的MATLAB算法如下：

function DnNumber=Dn(J1,J2)

DnNumber=0;

[m,n]=size(J1);

for i=1:m

for j=1:n

if J1(i,j)～=J2(i,j)

DnNumber=DnNumber+1;

end

(2)隨機(jī)選取J′的DCT系數(shù)的修改比例，針對(duì)每個(gè)隨機(jī)選擇的系數(shù)任意的增加或減少1，然后熵編碼修改的JPEG系數(shù)生成圖片Jm′

把修改比例稱為mpnc,(每個(gè)非零JPEG系數(shù)的修改系數(shù)的個(gè)數(shù))；如mpnc為0.02，圖片總的像素點(diǎn)為10 000，則修改的像素為10 000×0.02=200個(gè)點(diǎn)會(huì)隨機(jī)加1或減1。

(3)解壓縮Jm′為空間域，用相同的量化表壓縮，我們得到JPEG圖片Jm′′,Dm為Jm′與Jm″中不同DCT系數(shù)對(duì)應(yīng)位置的統(tǒng)計(jì)。

(4)重復(fù)第2—3步驟K次，注意在每次J’的JPEG系數(shù)被隨機(jī)的隨機(jī)選擇修改，但是應(yīng)當(dāng)修改的JPEG系數(shù)比例仍然是相同的。

1.3 mpnc比例的選取

本文中mpnc修改比例的選擇主要通過實(shí)驗(yàn)來得到的，從0開始，步長(zhǎng)為0.01，一直到0.12的值，求出此范圍中AR的值，可以得出AR最高一般出現(xiàn)在mpnc為0.018的時(shí)候最高。找到一個(gè)適當(dāng)?shù)男薷谋壤?，使其單次壓縮時(shí)Dm的平均值會(huì)小于D，二次壓縮時(shí)不小于D。

通過相關(guān)實(shí)驗(yàn)，主要是根據(jù)實(shí)際圖片進(jìn)行壓縮來進(jìn)行測(cè)試，當(dāng)Dm大于等于D時(shí)，判斷為二次壓縮圖片，當(dāng)Dm小于D時(shí)，判斷為一次壓縮圖片。

測(cè)試數(shù)據(jù)以及測(cè)試場(chǎng)景：

(1)測(cè)試數(shù)據(jù)為447張ucid的圖；

(2)橫坐標(biāo)為相同量化表壓縮冊(cè)數(shù)；

(3)縱坐標(biāo)為不同次數(shù)壓縮之間對(duì)應(yīng)位置DCT系數(shù)的不同值的統(tǒng)計(jì)數(shù)目的平均值；質(zhì)量因子為70∶5∶90進(jìn)行對(duì)應(yīng)的選取。

1.4 相同量化表統(tǒng)計(jì)

檢測(cè)使用相同量化矩陣的二次壓縮，本文設(shè)計(jì)了一種基于觀察的方法，在重壓縮過程中使用相同的量化矩陣進(jìn)行多次壓縮操作，連續(xù)兩次壓縮版本之間的DCT系數(shù)不同數(shù)量呈單調(diào)遞減狀態(tài)；通過實(shí)驗(yàn)可以得出本文檢測(cè)的方法可能不是統(tǒng)計(jì)效應(yīng)；本文的檢測(cè)無法提示二次壓縮的圖片是否被篡改。

2 直方圖因子估計(jì)JPEG二次壓縮

預(yù)估JPEG壓縮歷史在圖像過程、圖像篡改的應(yīng)用已經(jīng)越來越受到關(guān)注。在本文中，主要采用了直方圖因子的統(tǒng)計(jì)特性來估計(jì)JPEG圖像壓縮歷史。在統(tǒng)計(jì)場(chǎng)景中，對(duì)于沒壓縮的圖片，隨著直方圖bin索引的增加，直方圖因子統(tǒng)計(jì)的值反而減少。然而，它限制了一個(gè)本地的最大值，從而使它不在增加；基于這特性，也可以估計(jì)每次壓縮的量化步長(zhǎng)。

該方法主要是通過對(duì)直方圖因子的處理來估計(jì)量化步長(zhǎng)。直方圖因子估計(jì)JPEG壓縮情況，其步驟如下：

(1)原圖的序列an,經(jīng)過步長(zhǎng)為q量化后的序列為bn,bn= [an/q] ×q;

(2)定義求模的公式F(v) = {u|u∈ N, mod(v,u)=0}

(1)

其中g(shù)(x,F(bn))=1 (當(dāng)x屬于F(bn)集合時(shí)，其他為0)；

步長(zhǎng)的估計(jì)：

(2)

在進(jìn)行本實(shí)驗(yàn)時(shí)，所需實(shí)驗(yàn)條件：使用圖片大小為512×512/256×256；圖片使用灰度圖、彩色圖；設(shè)定質(zhì)量因子設(shè)為80/90/100。

當(dāng)?shù)玫降闹狈綀D為遞減且前后柱子的相差趨近為0，那么圖片未被壓縮過；如果得到的直方圖從q等于某個(gè)值開始，開始比較紊亂的變化，那說明圖片已被壓縮過，且q為h(f(x))==1時(shí)的最大值處；圖中的q為4時(shí)，達(dá)到最大值。

3 結(jié)語(yǔ)

隨著數(shù)字應(yīng)用的快速發(fā)展，信息傳播迅速增長(zhǎng)，圖像傳播的數(shù)量不容低估。隨著不同類型數(shù)碼相機(jī)和各種圖像編輯軟件的不斷出現(xiàn)，數(shù)字圖像的應(yīng)用非常廣泛，且作為信息的載體，它被廣泛應(yīng)用于各個(gè)領(lǐng)域。經(jīng)過對(duì)JPEG圖像壓縮理論及相關(guān)算法的學(xué)習(xí)，可以對(duì)圖片處理有了很深的理解，從壓縮操作讀取圖片像素→DCT操作→量化處理到解壓縮操作反量化→反IDCT的操作的理解。本文主要提出了一種方法能檢測(cè)使用相同量化表壓縮的二次圖片，其中算法主要是基于用相同量化表經(jīng)過一次又一次的壓縮的過程以及不同JPEG系數(shù)的數(shù)量，并在一定程度上恢復(fù)圖像在壓縮過程中丟失的細(xì)節(jié)信息，通過實(shí)驗(yàn)表明，本文提出的方法是一種有效的JPEG圖像檢測(cè)二次壓縮的方法。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡