1.白求恩軍醫(yī)學(xué)院 基礎(chǔ)部,石家莊 050081
2.軍械工程學(xué)院 計(jì)算機(jī)工程系,石家莊 050003
1.白求恩軍醫(yī)學(xué)院 基礎(chǔ)部,石家莊 050081
2.軍械工程學(xué)院 計(jì)算機(jī)工程系,石家莊 050003
隱寫分析作為隱寫術(shù)的對(duì)抗技術(shù),目的是揭示出隱密載體中秘密信息的存在,進(jìn)而進(jìn)行提取、篡改或破壞。通用隱寫分析是通過(guò)機(jī)器學(xué)習(xí)和監(jiān)督學(xué)習(xí)實(shí)現(xiàn)待測(cè)對(duì)象的兩分類:載體對(duì)象(不含密對(duì)象)和含密對(duì)象,以達(dá)到隱寫檢測(cè)的目的。盲隱寫分析因其適用范圍較廣,并且在實(shí)現(xiàn)方法上更符合隱寫分析研究的實(shí)情,而成為隱寫分析技術(shù)研究的重點(diǎn)和難點(diǎn)。典型Shi等人算法[1],雖然檢測(cè)性能高于Harmsen方法,但因特征量之間存在較強(qiáng)的相關(guān)性,故誤檢率較高;Farid將JPEG圖像解壓到空域,提取預(yù)測(cè)誤差圖像高階統(tǒng)計(jì)矩作為敏感特征[2],特征間冗余較大,并且因圖像格式的轉(zhuǎn)換,人為改變了圖像本身的屬性,致使隱寫檢測(cè)性能一般;Fridrich基于DCT域邊界不連續(xù)性,提出了多特征JPEG圖像隱寫分析算法[3],算法直接從圖像壓縮域和空域抽取特征,故綜合性能高于Farid,但因其通過(guò)提取空域共生矩陣描述量化DCT系數(shù)之間計(jì)算復(fù)雜度較大;之后,Y.Q.Sh i、DongDong Fu等采用馬爾科夫鏈模型[4-5],通過(guò)捕捉塊內(nèi)、塊間DCT系數(shù)之間的相關(guān)性,并建立水平、垂直兩個(gè)方向MC模型,取得了較好的檢測(cè)效果,但對(duì)整個(gè)DCT系數(shù)之間相關(guān)性的描述上欠全面,某種程度上影響了隱寫檢測(cè)的準(zhǔn)確性。為此,Pevny等人融合Fridrich和Y.Q. Shi兩種方法[6]提取敏感特征量,有效實(shí)現(xiàn)了盲隱寫域的多分類,但因采用空域共生矩陣作為初始敏感特征集的一部分,同樣存在計(jì)算復(fù)雜度較大的問(wèn)題。此后,李卓等人使用相鄰DCT系數(shù)的聯(lián)合概率密度,并將其擴(kuò)展到DWT域和空域[7],提出一種基于多特征的JPEG圖像盲檢測(cè)算法,盡管運(yùn)算時(shí)間有所改進(jìn),但受嵌入率的影響較大。本文在對(duì)典型算法進(jìn)行研究的基礎(chǔ)上,針對(duì)其中的不足,采用“相關(guān)性”和“多特征融合”的思想,改進(jìn)敏感特征生成方法,提取高敏感特征統(tǒng)計(jì)量,然后引入PCA技術(shù),實(shí)現(xiàn)初始特征集的選擇優(yōu)化,生成有效的分類特征矢量集空間。最后,基于Matlab7.0平臺(tái),采用非線性核SVM分類器進(jìn)行仿真實(shí)驗(yàn),給出算法的有效性驗(yàn)證。
JPEG圖像是互聯(lián)網(wǎng)上應(yīng)用非常廣泛的一種壓縮格式,因其壓縮性能優(yōu)良,獲取方便,深受隱寫和隱寫分析研究者的關(guān)注,并且成為研究的重點(diǎn)。JPEG圖像直接壓縮域是YCbCr模型空間的Block-DCT域。通常情況下,秘密信息的隱寫嵌入是通過(guò)改變直接壓縮域的量化DCT系數(shù)來(lái)實(shí)現(xiàn),但此種改變對(duì)空域相鄰像素之間的相關(guān)性也有一定的影響。
馬爾科夫鏈模型(MCM)是用于描述隨時(shí)間進(jìn)化的后效性系統(tǒng)。在圖像處理和模式識(shí)別領(lǐng)域一般采用參數(shù)和狀態(tài)空間均離散化的Markov過(guò)程,此過(guò)程被稱為馬爾科夫過(guò)程或馬氏鏈[8]。設(shè){X(t),t∈T}為時(shí)間t和所對(duì)應(yīng)的狀態(tài) Xt均離散的隨機(jī)過(guò)程,時(shí)間集T為非負(fù)整數(shù),其狀態(tài)空間記為 I={i0,i1,…,in}。若對(duì)任意 m,k,n∈N,N 為非負(fù)整數(shù),iv∈I,v=0,1,…,n+1,有式(1)成立,則稱此過(guò)程{X(t),t∈T}為馬爾科夫鏈,并且具有馬爾科夫性。
若式(1)右端記為Pij(m,m+k),則馬氏鏈轉(zhuǎn)移到狀態(tài)im+k的概率:
當(dāng)轉(zhuǎn)移概率僅與i,j和k有關(guān),則此概率具有平穩(wěn)性:Pij(m,m+k)=(P(m,m+k)),且矩陣每一行元之和為1。自然圖像的隨機(jī)過(guò)程具有無(wú)后效性特點(diǎn),滿足MCM要求,且隨機(jī)變量的概率隨空間狀態(tài)的改變而改變。因此可用MCM模型刻畫(huà)其分布特性。
PCA技術(shù)是將多個(gè)特征映射為少數(shù)幾個(gè)綜合特征的一種統(tǒng)計(jì)方法。對(duì)于一個(gè)n維隨機(jī)變量x,如果各變量之間存在相關(guān)性,x中便存在冗余,則可采用PCA技術(shù)實(shí)現(xiàn)特征壓縮,消除彼此間的冗余。在盲隱寫分析技術(shù)的研究中,“多特征”融合雖然提高了檢測(cè)性能,但因特征數(shù)量的增加,易造成緯數(shù)“災(zāi)難”,并且特征之間存在一定的冗余度。因此采用PCA技術(shù)實(shí)現(xiàn)分類特征矢量集空間的選擇優(yōu)化,有利于提高分類特征的有效性,進(jìn)而提高算法的綜合性能。
3.1 設(shè)計(jì)8鄰域相關(guān)性MCM
JPEG彩色圖像直接壓縮域是Block-DCT域。圖像經(jīng)DCT變換后,DCT系數(shù)矩陣絕對(duì)值,沿左上角到右下角方向依次遞減。其低頻系數(shù)分布于左上角,是圖像的主要信息,反應(yīng)了圖像的主要輪廓;高頻系數(shù)分布于右下角,是人類感覺(jué)最不敏感的信息,并且交流系數(shù)服從廣義高斯分布或拉普拉斯分布。對(duì)于JPEG直接壓縮域而言,每一小塊均具有上述分布特征,因此,不僅塊內(nèi)DCT系數(shù)之間存在較強(qiáng)的相關(guān)性,而且不同塊,但同位置、同方向的DCT系數(shù)之間同樣存在著較強(qiáng)的相關(guān)性,此種相關(guān)性可通過(guò)建立多鄰域MCM理論進(jìn)行描述。
數(shù)字圖像是一個(gè)位置和狀態(tài)都離散的隨機(jī)信號(hào),可被看作一種隨機(jī)信號(hào),并且滿足MCM模型限制條件。為全面而準(zhǔn)確地描述DCT系數(shù)之間的相關(guān)性,算法設(shè)計(jì)8-鄰域相關(guān)性MCM模型,聯(lián)合建立塊內(nèi)、塊間多條馬爾科夫鏈。塊內(nèi)DCT系數(shù)和整個(gè)塊間掃描模式分別見(jiàn)圖1和圖2。整體DCT系數(shù)二維排列方式見(jiàn)圖3。
圖1 塊內(nèi)DCT系數(shù)四種掃描模式
圖2 塊間四種掃描模式
圖3 整體DCT系數(shù)二維排列
因JPEG彩色圖像模型空間為YCbCr,此空間將HVS完全分離,其中Y是亮度分量,類似于RGB空間的灰度分量,含有豐富的圖像信息,在此分量嵌入秘密信息不易引起載體圖像的失真,并且承載嵌入容量較CbCr分量大,并且安全性較高。所以,通常情況下,隱寫分析將秘密信息主要隱藏在Y分量的Block-DCT域。又因?yàn)閅CbCr模型空間分量與RGB模型空間三個(gè)通道相對(duì)應(yīng)。因此,進(jìn)行8-鄰域相關(guān)性MCM模型設(shè)計(jì)時(shí),也要考慮其相應(yīng)的空域像素值之間的相關(guān)性。掃描方式與圖1相同。
3.2 構(gòu)建高敏感有效分類特征向量
高敏感特征是指對(duì)隱寫嵌入數(shù)據(jù)極度敏感,而對(duì)原始載體數(shù)據(jù)不敏感的特征。如果特征提取是在隱寫數(shù)據(jù)嵌入直接操作域進(jìn)行,則有利于提高其敏感性。為進(jìn)一步提高敏感特征的泛化能力,將預(yù)測(cè)誤差圖像的YCbCr模型空間Y分量、Y分量對(duì)應(yīng)的RGB三通道作為隱寫分析域,然后基于8鄰域相關(guān)性MCM模型和PCA技術(shù)構(gòu)建高敏感有效分類特征向量。計(jì)算公式:
式中,J為待測(cè)圖像,J1代表預(yù)測(cè)圖像,F(xiàn)(.)則代表相應(yīng)圖像的特征。F(.)為特征向量。
(1)生成預(yù)測(cè)圖像、確定狀態(tài)空間。首先依據(jù)JPEG圖像壓縮原理和量化Block-DCT系數(shù)分布特性,采用HMT模型生成預(yù)測(cè)圖像[9],然后為提高計(jì)算效率,并且將信息丟失控制在最少,參照文獻(xiàn)[4-5]中方法確定狀態(tài)空間[0 T]。實(shí)驗(yàn)從標(biāo)準(zhǔn)圖像庫(kù)中任意選取20幅圖像,采用不同的量化因子(80~95),計(jì)算DCT系數(shù)絕對(duì)值的百分比,結(jié)果發(fā)現(xiàn)在T等于14時(shí),信息保留百分比為99.05%,當(dāng)T大于14時(shí),信息保留量變化極為緩慢,因此均衡考慮后取T=14。
(2)提取變換域高敏感特征。因空域像素的馬爾科夫狀態(tài)轉(zhuǎn)移矩的值主要集中在主對(duì)角線附近,而DCT變換系數(shù)相應(yīng)值的集中性則相對(duì)弱一些,分別見(jiàn)圖4和圖5。因此,分別在YCbCr模型空間Y分量,抽取量化DCT系數(shù)的的Markov狀態(tài)轉(zhuǎn)移矩作為主特征;在Y分量對(duì)應(yīng)的RGB三通道抽取Markov狀態(tài)轉(zhuǎn)移矩主對(duì)角線鄰域相似熵作為輔助特征,二者進(jìn)行合理“綁定”后,共同組成初始特征集。
圖4 空域狀態(tài)轉(zhuǎn)移矩分布情況
圖5 DCT域狀態(tài)轉(zhuǎn)移矩分布情況
塊間DCT系數(shù)狀態(tài)轉(zhuǎn)移矩計(jì)算公式:
(3)空域高敏感特征提取。Y分量對(duì)應(yīng)于空域RGB三個(gè)通道的狀態(tài)轉(zhuǎn)移矩計(jì)算公式:
(4)計(jì)算最終特征。按照式(3)進(jìn)行最終特征的計(jì)算,特征函數(shù)見(jiàn)表1。
表1 最終特征函數(shù)
(5)構(gòu)建高效分類特征向量。為降低特征維數(shù),消除冗余特征,基于PCA技術(shù)對(duì)特征向量Fvector,jpeg進(jìn)行優(yōu)化處理,然后根據(jù)特征的貢獻(xiàn)率,確定用于實(shí)現(xiàn)通用隱寫檢測(cè)的有效分類特征矢量集F?vector,jpeg。特征向量:
實(shí)驗(yàn)所用自然圖像源于兩部分:一部分是數(shù)碼相機(jī)拍攝圖像;另一部分是互聯(lián)網(wǎng)標(biāo)準(zhǔn)圖像庫(kù)圖。共選取圖像1 000幅,大小為256×256,格式為JPEG。在進(jìn)行實(shí)驗(yàn)時(shí),首先從1 000幅圖像中,選取500幅作為原始載體圖像,分別采用Jsteg、F5、Outguess、MB1、MB2進(jìn)行秘密信息的嵌入,生成500幅隱秘圖像,并采用HMT模型生成500幅預(yù)測(cè)誤差圖像,然后根據(jù)提出方法計(jì)算500幅載體圖像和相應(yīng)預(yù)測(cè)誤差圖像特征矢量集作為訓(xùn)練集樣本,并引入PCA技術(shù)進(jìn)行降維處理,生成有效特征分類子集。按照同樣的方法,生成1 000幅圖像的特征矢量集作為測(cè)試集樣本。最后采用RBF非線性核SVM實(shí)現(xiàn)待測(cè)樣本的分類檢測(cè)。實(shí)驗(yàn)共得到敏感特征706維,應(yīng)用PCA技術(shù)進(jìn)行選擇優(yōu)化處理后,提取前204維特征構(gòu)成分類特征有效特征矢量集,對(duì)不同嵌入量下F5、Outguess、MB1、MB2隱秘對(duì)象實(shí)施檢測(cè),所得結(jié)果見(jiàn)表2,ROC性能曲線見(jiàn)圖6。
表2 不同嵌入率下的檢測(cè)正確率
圖6 典型隱寫檢測(cè)算法ROC性能曲線
從表2和圖6可以看出:提出算法的檢測(cè)正確率優(yōu)于典型Farid、Q.Shi算法,且隨著秘密信息嵌入容量的增加,其檢測(cè)正確率逐漸增高、檢測(cè)錯(cuò)誤率逐漸降低,適用范圍優(yōu)于典型Farid算法。
在對(duì)JPEG彩色圖像特性、隱寫嵌入域及其DCT域相關(guān)性等進(jìn)行全面研究分析的基礎(chǔ)上,基于MCM和HVS提出了一種JPEG彩色圖像盲隱寫分析算法。仿真實(shí)驗(yàn)結(jié)果表明:該算法在實(shí)現(xiàn)對(duì)Jsteg、F5、Outguess、MB1、MB2隱寫攻擊方面,可靠性強(qiáng)、正確率高,并且優(yōu)于典型的Farid、Q. Shi算法。
[1]Shi Y Q,Xuan G R,Zou D,et al.Image steganalysis based on moments of characteristic functions using wavelet decomposition,prediction-errorimage,and neuralnetwork[C]// Proceedings of 2005 IEEE International Conference on Multimedia and Expo,Amsterdam,2005:269-272.
[2]Lyu S,F(xiàn)arid H.Steganalysis using higher-order image statistics[J].IEEE Transactions on Information Forensics and Security,2006,1(1):111-119.
[3]Fridrich J,Peny T.Multi-class blind steganalysis for JPEG images[C]//Proceedings of SPIE Electronic Imaging,Security,Steganography,and Water mark in gof Multimedia Contents VIII,2006.
[4]Shi Y Q,Chen C,Chen W.A Markov process based approach to effective attaching JPEG steganography[C]//Proceedings of the 8th Information Hiding Workshop,2006.
[5]Fu D,Shi Y Q,Zou D.JPEG steganalysis using empirical transition matrix in block DCT domain[J].IEEE,2006.
[6]Pevny T,F(xiàn)ridrich J.Merging Markov and DCT features for multi-class JPEG steganalysis[C]//Proc SPIE,2007.
[7]李卓,陳健,蔣曉宇,等.基于多域特征的JPEG圖像盲檢測(cè)算法[J].浙江大學(xué)學(xué)報(bào):工學(xué)版,2011,45(9):1528-1537.
[8]盛驟,謝式千,潘承毅.概率論與數(shù)理統(tǒng)計(jì)[M].3版.北京:高等教育出版社,2001.
[9]劉曉芹,王嘉禎,徐波,等.基于HMT和ICA的主動(dòng)隱寫分析[J].武漢大學(xué)學(xué)報(bào):信息科學(xué)版,2008,33(10):1059-1060.
[10]馮帆,王嘉禎,馬懿,等.基于HMT的Block-DCT域隱寫圖像移出攻擊[J].計(jì)算機(jī)應(yīng)用與軟件,2009,26(11):274-275.
基于MCM和HVS的彩色圖像盲隱寫分析算法
馮 帆1,2,王建華1,張政保2,王惠萍1,戚紅軍1
FENG Fan1,2,WANG Jianhua1,ZHANG Zhengbao2,WANG Huiping1,QI Hongjun1
1.Foundation Department,Bethune Military Medical College,Shijiazhuang 050081,China
2.Department of Computer Engineering,Ordnance Engineering College,Shijiazhuang 050003,China
Aiming at the problem that comprehensive performance of typical steganalysis isn’t perfect,which is caused by a lack of characterizing relativity in DCT domain,a blind steganalysis algorithm for JPEG color images is proposed fusing MCM and HVS.It devises an 8-neighborhood MCM model to describe comprehensively the distribution characteristics of DCT coefficients.The model is used for extracting sensibility features statistic based on HVS,which are Markov transition probability matrices of the Y component in the model space of YCbCr,and the main diagonal similitude entropy of the corresponding RGB of Y component,then these feature statistics are in reason merged.PCA technology is applied to optimize original features,and construct effective classified features eigenvector.The experimental results show that the presented method can achieve higher reliability and accuracy rate,aiming at Jsteg、F5、Outguess、MB1、MB2 steganography.
Markov Chain Model(MCM);Human Visual System(HVS);color images;steganalysis
針對(duì)典型算法在描述DCT域相關(guān)性方面存在的不足,所引起的隱寫檢測(cè)綜合性能不理想的問(wèn)題,將MCM與HVS進(jìn)行有機(jī)結(jié)合,提出一種JPEG彩色圖像通用隱寫分析算法。設(shè)計(jì)8-鄰域MCM型,全面描述DCT系數(shù)之間的相關(guān)性,基于HVS分別在YCbCr模型空間Y分量抽取Markov狀態(tài)轉(zhuǎn)移矩、在其相應(yīng)RGB三通道抽取Markov狀態(tài)轉(zhuǎn)移矩的主對(duì)角線鄰域相似熵作為特征統(tǒng)計(jì)量,并進(jìn)行合理“綁定”,采用PCA技術(shù)對(duì)其進(jìn)行優(yōu)化選擇,構(gòu)建高效分類特征向量。實(shí)驗(yàn)結(jié)果表明該算法對(duì)于Jsteg、F5、Outguess、MB1、MB2攻擊具有較高的可靠性和檢測(cè)正確率。
馬爾科夫鏈模型(MCM);人類視覺(jué)系統(tǒng)(HVS);彩色圖像;隱寫分析
A
TP393
10.3778/j.issn.1002-8331.1203-0014
FENG Fan,WANG Jianhua,ZHANG Zhengbao,et al.Blind steganalysis algorithm for JPEG color images based on MCM and HVS.Computer Engineering and Applications,2013,49(11):72-75.
河北省基金項(xiàng)目(No.052135,No.11213527D)。
馮帆(1971—),女,博士,主要研究方向?yàn)樾畔踩?;王建華(1977—),女,博士,主要研究方向?yàn)閳D像處理;張政保(1964—),男,博士,主要研究方向?yàn)樾畔踩?。E-mail:fengfan_2357@163.com
2012-03-05
2012-05-28
1002-8331(2013)11-0072-04
CNKI出版日期:2012-08-13 http://www.cnki.net/kcms/detail/11.2127.TP.20120813.1134.004.html