国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于PCA特征距離的圖像哈希算法

2016-02-14 01:11唐振軍黃紫晴
關(guān)鍵詞:拷貝分塊哈希

唐振軍,楊 帆,黃紫晴,勞 歡

(1.廣西師范大學(xué)廣西多源信息挖掘與安全重點實驗室,廣西桂林541004;2.廣西師范大學(xué)計算機科學(xué)與信息工程學(xué)院,廣西桂林541004)

基于PCA特征距離的圖像哈希算法

唐振軍1,2,楊 帆1,2,黃紫晴1,2,勞 歡1,2

(1.廣西師范大學(xué)廣西多源信息挖掘與安全重點實驗室,廣西桂林541004;2.廣西師范大學(xué)計算機科學(xué)與信息工程學(xué)院,廣西桂林541004)

本文將主成分分析(PCA)應(yīng)用于圖像哈希,設(shè)計基于特征距離的感知哈希算法。該算法從規(guī)范化圖像中構(gòu)造適合于數(shù)據(jù)降維的二次圖像,接著對其進行PCA處理,用PCA降維特征的距離生成哈希序列。實驗結(jié)果表明本文算法的接收機操作特性曲線的分類性能優(yōu)于現(xiàn)有的3種哈希算法。大規(guī)模圖像庫的拷貝檢測顯示,本文算法有較好的拷貝檢測性能。

感知哈希函數(shù);主成分分析;數(shù)據(jù)降維;圖像拷貝檢測;圖像檢索

0 引言

在大數(shù)據(jù)時代,人們獲取和使用的圖像日益增多,對圖像的存儲和管理提出許多挑戰(zhàn),亟待研究新的多媒體理論和技術(shù)以實現(xiàn)對圖像大數(shù)據(jù)的高效處理。近年,多媒體領(lǐng)域的研究人員研究了感知哈希函數(shù)[1]。它可將任意圖像映射成較短的數(shù)字序列,即圖像哈希,有效降低了圖像存儲代價和相似計算的復(fù)雜度,目前已被成功應(yīng)用于拷貝檢測、圖像檢索、圖像索引、圖像取證等方面[2]。通常,圖像哈希算法需要具備魯棒性和唯一性[3-4]。魯棒性是指對于視覺相似的2幅圖像,不管其存儲數(shù)據(jù)是否相同,哈希值應(yīng)該相同或非常相似;而唯一性則要求不同內(nèi)容的圖像,其哈希值相同或相似的概率很低。當(dāng)前,研究人員已設(shè)計出多種有效的圖像哈希算法。根據(jù)這些算法的核心技術(shù)分類,可得到如下5大類算法。

①基于離散小波變換(DWT)的哈希算法。例如:Venkatesan等[3]利用DWT系數(shù)統(tǒng)計量、解碼器和線性編碼器生成哈希值;Mogna和Evans[5]提取線狀目標的端點的小波系數(shù)構(gòu)造哈希值;Ahmed等[6]用LL、LH和HL子帶的小波系數(shù)構(gòu)造中間哈希,再用SHA-1函數(shù)壓縮。該類算法能較好抵抗JPEG壓縮,但在旋轉(zhuǎn)變換方面的穩(wěn)健性較差。

②基于離散余弦變換(DCT)的哈希算法。例如:文獻[1]利用DCT系數(shù)構(gòu)造特征點并用點對間的距離構(gòu)造哈希值;Lin和Chang[7]根據(jù)不同圖像塊的相同位置的DCT系數(shù)關(guān)系設(shè)計哈希算法;秦川等[8]提取DCT符號矩陣并用秘密共享機制生成哈希;Tang等[9]提出基于主導(dǎo)DCT系數(shù)的哈希算法,用第一行和第一列的若干DCT系數(shù)生成哈希。該類算法具有較好的唯一性,然而旋轉(zhuǎn)穩(wěn)健性仍然有待提高。

③基于積分變換的哈希算法。該類算法的常用技術(shù)是Radon變換(RT)和扇束(Fan-beam)變換。例如:Lefebvre等[10]最先提出利用RT構(gòu)造圖像哈希;Lei等[11]提取Radon變換域上的矩特征生成哈希值;Ou和Rhee[12]聯(lián)合使用RT 和DCT提取哈希序列;Tang等[13]運用扇束變換提取圖像哈希,該算法的分類性能和運算速度均優(yōu)于常見的基于RT的哈希算法。由于積分變換具有較好的幾何不變性,因此該類算法能較好抵抗旋轉(zhuǎn)變換,但唯一性卻不盡理想。

④基于離散傅里葉變換(DFT)的哈希算法。最早成功運用二維DFT技術(shù)設(shè)計哈希算法的研究人員為Swaminathan等[14],他們提出在極坐標下表示DFT系數(shù),對圓上的系數(shù)均勻采樣并累加幅值,接著對累加結(jié)果偽隨機加密得到中間哈希,最后通過量化壓縮生成哈希。該算法能較好抵抗旋轉(zhuǎn)變換,然而由于特征只依賴幅值而與相位無關(guān),攻擊者容易偽造哈希值。Wu等[15]聯(lián)合使用RT、DWT和DFT,提出抗打印-掃描攻擊的哈希算法,該算法具有較好的魯棒性。Qin等[16]將DFT應(yīng)用于二次圖像,通過對幅值進行非均勻采樣從而構(gòu)造出哈希值。該類算法在旋轉(zhuǎn)穩(wěn)健性和唯一性方面的分類性能還不盡理想。

⑤基于矩陣分解的哈希算法。Kozat等[17]提出基于2次奇異值分解(SVD)的哈希方法,穩(wěn)健性由SVD保證。受Kozat等啟發(fā),Monga等[18]提出用2次非負矩陣分解(NMF)的策略來計算哈希值。該算法對JPEG壓縮、圖像旋轉(zhuǎn)等操作穩(wěn)健,但對水印嵌入脆弱。Tang等[19]提出詞典式圖像哈??蚣苣P?,并設(shè)計基于NMF和DCT的實現(xiàn)方案;在另外一項工作中,Tang等[20]發(fā)現(xiàn)正常處理前后的圖像的NMF系數(shù)具有近似線性變化的性質(zhì),在此基礎(chǔ)上提出了基于環(huán)形分割和NMF的哈希算法。最近,Ghouti[21]將四元數(shù)SVD應(yīng)用于彩色圖像哈希提取,該方法的分類性能優(yōu)于傳統(tǒng)的基于SVD的哈希算法,但仍有較大提升空間。

除上述算法外,研究人員也報道了一些其他哈希技術(shù)。Li等[22]運用Gabor濾波(GF)和格型矢量量化(LVQ)技術(shù)提取圖像哈希;Tang等[23]設(shè)計基于顏色向量角和小波變換的圖像哈希方法;Zhao等[24]綜合利用Zernike矩和顯著區(qū)域的統(tǒng)計特征來構(gòu)造圖像哈希。盡管研究人員已設(shè)計出多種有效的哈希算法,但實際應(yīng)用中還存在諸多問題有待解決。例如,哈希算法在魯棒性和唯一性方面的分類性能還不盡理想,在拷貝檢測應(yīng)用方面的性能仍有待提高。針對這些問題,本文將主成分分析(PCA)技術(shù)引入到圖像哈希計算,設(shè)計基于PCA特征的高效算法。本文哈希算法不但具有較好的分類性能,而且還擁有優(yōu)異的拷貝檢測性能。

1 本文哈希算法

本文算法由預(yù)處理、二次圖像構(gòu)造、PCA特征壓縮及量化3個階段構(gòu)成。預(yù)處理采用雙三次插值法將圖像尺寸調(diào)整為M×M,對于彩色圖像,提取其亮度分量,公式如下:

I=0.114×B+0.587×G+0.298 9×R。

(1)

其中R是像素的紅色分量,G是像素的綠色分量,B是像素的藍色分量,I為像素的亮度分量。下面詳細介紹二次圖像構(gòu)造、PCA特征壓縮及量化和哈希相似測度。

1.1 二次圖像構(gòu)造

考慮到圖像局部像素往往較相似,本文對圖像進行非重疊分塊,將圖像塊看作高維向量,確保向量元素有較好的相關(guān)性。接著把高維向量看作圖像的列元素,隨機排列向量即可生成二次圖像。二次圖像的具體構(gòu)造步驟如下:

第一步,用d1×d2大小的圖像塊對圖像亮度分量進行非重疊分塊。為便于討論,取M為d1和d2的整數(shù)倍,記S=d1×d2,于是圖像塊的像素總數(shù)為S。因此,輸入圖像共有N=M2/(d1×d2)=M2/S個塊。本文的圖像塊按從左到右自上而下次序編號, 將第j個塊記為Bj,其中1≤j≤N。

第二步,依次連接Bj的列元素,于是得到S×1大小的向量xj(1≤j≤N),排列這些向量即可得到二次圖像X:

X=[x1,x2,…,xN]。

(2)

圖1 二次圖像構(gòu)造Fig.1 Construction of secondary image

圖1是二次圖像的構(gòu)造示意圖。與原圖像相比,二次圖像的列數(shù)(向量)較少,但每個列的元素較多(向量維度高)。用PCA對二次圖像進行降維處理時,將有效降低向量維度,但并不改變向量個數(shù),因此如果選定的降維維數(shù)不變,向量越少意味著降維后的數(shù)據(jù)越少,因此二次圖像的構(gòu)造實現(xiàn)初步的數(shù)據(jù)壓縮。

1.2 PCA特征壓縮及量化

PCA是一種高效的數(shù)據(jù)降維技術(shù),已被廣泛應(yīng)用于數(shù)據(jù)挖掘、圖像處理和模式識別等領(lǐng)域??紤]到二次圖像的向量的維數(shù)較高,且向量內(nèi)的元素存在較高的相關(guān)性,因此本文運用PCA去除相關(guān)性,以獲取描述二次圖像的相互獨立的主要成分。用PCA處理二次圖像的詳細過程如下。

(3)

于是X可用公式(4)表示:

(4)

那么用PCA處理X,主要有3個步驟。

(5)

(6)

(7)

第二步,構(gòu)造協(xié)方差矩陣。為了便于討論,仍用X表示第一步計算得到的歸一化矩陣,X的第i列向量(i= 1,2,…,N)用xi表示,于是協(xié)方差矩陣Cx的計算公式如下:

(8)

其中mx為xi的均值向量,定義如下:

(9)

(10)

第三步,用雅可比方法求解Cx的特征值及相應(yīng)特征向量。將Cx的特征向量及其特征值分別記為ai和λi(i=1,2,…,S),并對特征值降序排列,即:λi≥λi+1,其中i=1,2,…,S-1。接著,用Cx的特征向量構(gòu)造S×S大小變換矩陣A,其中λ1的特征向量為A的第一行元素,λ2的特征向量為A的第二行元素,依次類推,λS的特征向量為A的最后一行元素。于是,A乘上X即可得到Y(jié):

YS×N=AS×SXS×N,

(11)

該表達式稱為霍特林變換,也即PCA。實際中主要通過忽略特征值較小的特征向量實現(xiàn)降維。例如,令A(yù)(k)表示取A的前k行數(shù)據(jù)構(gòu)造得到的矩陣,于是A(k)乘上X便可實現(xiàn)降維,具體公式如下:

(12)

其中Y(k)為降維后的數(shù)據(jù)。如果需要從降維數(shù)據(jù)重構(gòu)X,則可通過公式(13)近似重構(gòu):

X(k)=A(k)TY(k)。

(13)

此時重構(gòu)結(jié)果X(k)與X的均方誤差為:

(14)

為了提取較短的哈希序列,對Y(k)進行壓縮和量化。設(shè)Y(k)=[y1,y2,…,yN],則具體計算過程如下。

第一步,計算參考向量y0=[y0(1),y0(2),…,y0(k)]T,其中y0(i)為y0的第i個元素,定義如下:

(15)

其中yj(i)為向量yj的第i個元素。

第二步,計算y0與yj的L2范數(shù)dj:

(16)

第三步,對dj進行取整操作,即:

hj=round(dj+0.5),(j=1,2,…,N),

(17)

其中round(·)表示取整計算。最后,哈希序列h可通過串連hj得到,即:

h=[h1,h2, …,hN]。

(18)

1.3 哈希相似測度

由于生成的哈希序列為N個十進制整數(shù),因此本文算法用相關(guān)系數(shù)作為哈希序列的相似測度。設(shè)h1和h2為2幅圖像的哈希序列,那么它們的相關(guān)系數(shù)計算公式如下:

(19)

其中V(·)代表方差計算,C(·,·)代表協(xié)方差計算。如果ρ大于設(shè)定閾值,那么可判定h1和h2的對應(yīng)圖像是視覺相似的,否則它們是不同內(nèi)容圖像。

2 實驗結(jié)果

實驗的算法參數(shù)設(shè)置如下:M=512、d1=64、d2=64和k=5,因此哈希長度N=64。下面分別討論魯棒性、唯一性、哈希長度和參數(shù)影響。

2.1 魯棒性

為了驗證算法的魯棒性,選取Airplane、Baboon、Girl、House、Lena、Peppers、Sailboat和Splash等8幅512×512的標準測試圖像作為原始圖像。用StirMark 4.0[25]、Photoshop和MATLAB等工具生成這些測試圖像的相似圖像,具體采用的數(shù)字操作包括:JPEG壓縮、高斯低通濾波(3×3大小)、水印嵌入、亮度和對比度調(diào)整、伽瑪校正、圖像縮放和旋轉(zhuǎn)變換等。各種操作的具體參數(shù)設(shè)置如下:JPEG壓縮的質(zhì)量因子為30,40,…,100;高斯低通濾波的均值為0、標準差為0.3,0.4,…,1.0;水印嵌入的強度為10,20,…,100;亮度和對比度調(diào)整的參數(shù)均為10和20;伽瑪校正的γ值為0.75、0.9、1.1和1.25;縮放變換的比例為0.5、0.75、0.9、1.1、1.5和2.0;旋轉(zhuǎn)變換的角度為5°、4°、3°、2°、1°、0.75°、0.5°和0.25°。經(jīng)歷這些操作后,每幅測試圖像擁有60個相似版本,因此一共得到8×60=480幅相似圖像。表1列出不同數(shù)字操作下的魯棒性能,觀察發(fā)現(xiàn),所有操作的相關(guān)系數(shù)的平均值都大于0.940 0,說明本文算法可抵抗上述數(shù)字操作,魯棒性較好。此外,除旋轉(zhuǎn)變換外,其余操作的相關(guān)系數(shù)的最小值均大于0.940 0。因此,當(dāng)閾值為0.940 0時,本文算法可正確識別出89.58%的相似圖像。

2.2 唯一性

唯一性實驗的測試圖像庫共有200幅彩色圖像(用相機拍攝33幅,通過網(wǎng)站下載67幅,從華盛頓大學(xué)的公開圖像庫獲取100幅)。圖2為不同圖像的哈希序列的相關(guān)系數(shù)分布,橫坐標為相關(guān)系數(shù),縱坐標為相關(guān)系數(shù)的出現(xiàn)頻次。計算發(fā)現(xiàn),最大的相關(guān)系數(shù)是0.852 9,最小的相關(guān)系數(shù)是-0.755 6,平均值和標準差分別為0.008 6和0.230 4。當(dāng)閾值設(shè)為0.940 0時,沒有一幅圖像被誤判為相似圖像,說明本文算法的唯一性好。事實上,閾值越小,唯一性越差但魯棒性越好;反之則唯一性提高而魯棒性變差。表2列出不同閾值下的魯棒性(相似圖像的正確識別率)和唯一性(不同圖像的誤判率)。

表1 不同數(shù)字操作的魯棒性能

圖2 不同圖像的哈希序列的相關(guān)系數(shù)的分布圖Fig.2 Distribution of correlation coefficientsbetween hashes of different images

圖3 12 800個哈希元素的分布圖Fig.3 Distribution of 12 800 hash elements

閾值相似圖像的正確識別率/%不同圖像的誤判率/%0.940089.5800.0000.900095.0000.0000.860097.7100.0000.850098.7500.0050.820099.5800.0100.7600100.0000.0800.7300100.0000.120

2.3 哈希長度

為了分析本文哈希序列的長度,即實際存儲所需的比特數(shù),用唯一性實驗的200個圖像哈希作為統(tǒng)計的數(shù)據(jù)源,于是得到200×64=12 800個哈希元素。圖3為這些元素的分布圖,其中橫坐標為哈希元素值,縱坐標為元素值的頻數(shù)。計算發(fā)現(xiàn),哈希元素的取值范圍為0~12 487,而213=8 192<12 487<214=16 384,因此用14 bits即可表示一個哈希元素。因為本文的圖像哈希共有64個元素,所以其長度為896 bits。

2.4 參數(shù)討論

本節(jié)主要討論分塊模式和PCA降維維數(shù)對算法性能的影響,其中分塊模式包括2種情況:不同分塊個數(shù)和相同分塊個數(shù)。實驗過程中,我們僅改變討論參數(shù),測試圖像仍沿用2.1節(jié)和2.2節(jié)的圖像庫。下面依次對這些情況進行討論。

2.4.1 不同分塊個數(shù)對哈希性能的影響

實驗討論的圖像塊大小分別為16×16、32×32和64×64,對應(yīng)于1 024、256和64個圖像塊,即哈希的長度分別是1 024、256和64個整數(shù)。為了直觀比較算法在不同參數(shù)設(shè)置下的分類性能,選取ROC(receiver operating characteristics)圖[26]作為分析工具。在ROC圖中,橫坐標為錯誤接受率,主要反映唯一性,而縱坐標則為正確接受率,體現(xiàn)魯棒性。圖4是不同分塊個數(shù)下的ROC曲線對比圖。觀察圖4發(fā)現(xiàn),圖像塊的個數(shù)較少時(如64和256),ROC曲線靠近左上角。當(dāng)圖像塊的個數(shù)增多(如1 024),ROC曲線開始偏離左上角,整體分類性能下降。這是因為,與大的圖像塊相比,小的圖像塊更容易受局部數(shù)據(jù)變化的影響(數(shù)字操作引起),導(dǎo)致魯棒性下降。實驗發(fā)現(xiàn),選取64×64為圖像塊的大小時,本文算法有較好的整體分類性能。為了比較不同分塊數(shù)的計算復(fù)雜度,分別記錄各自唯一性實驗的總時間(哈希提取),由此計算出一個哈希的平均提取時間。實驗用的CPU主頻為3.20 GHz、內(nèi)存為2.0 GB,算法實現(xiàn)平臺是MATLAB 2012a。結(jié)果發(fā)現(xiàn)分塊個數(shù)為64、256和1 024時(對應(yīng)向量維度分別為4 096、1 024和256),哈希的平均提取時間為7.741、0.505和0.224 s。因此,綜合考慮各方面性能發(fā)現(xiàn),選取64為圖像塊的個數(shù)時,本文算法有較好的整體性能。

圖4 不同分塊個數(shù)的ROC曲線對比Fig.4 ROC curve comparisons underdifferent block numbers

圖5 不同分塊策略的ROC曲線對比Fig.5 ROC curve comparisons underdifferent strategies of block division

2.4.2 相同分塊個數(shù)下的不同分塊策略對性能的影響

實驗中保持圖像塊的總數(shù)64不變,在此基礎(chǔ)上,依次選擇512×8、256×16、128×32和64×64等4種塊尺寸對圖像進行非重疊分塊,分析不同分塊策略對哈希性能的影響。圖5為不同分塊策略的ROC曲線對比。觀察發(fā)現(xiàn),64×64的圖像塊的ROC曲線位于其他曲線的上方。當(dāng)圖像塊的寬高比差異大時,ROC曲線出現(xiàn)下降。這是因為像素在局部小范圍內(nèi)往往較為相似,由相似像素構(gòu)造向量可確保二次圖像的列元素具有較強的相關(guān)性,符合了PCA對輸入數(shù)據(jù)的要求。當(dāng)圖像塊的寬高比差異大時,列元素的相關(guān)性出現(xiàn)降低,因此從數(shù)據(jù)源上降低了PCA的去相關(guān)能力。此外,對不同塊尺寸的哈希提取時間也進行了比較,結(jié)果發(fā)現(xiàn)512×8、256×16、128×32和64×64等4種塊尺寸的運行時間分別為7.001、7.268、7.478和7.741 s,均在同一個數(shù)量級上,差異不明顯。

2.4.3 PCA降維維數(shù)對性能的影響

實驗選取的PCA降維維數(shù)包括k=1、k=2、k=5、k=10和k=20。圖6為本文算法在不同k值下的ROC曲線圖,觀察發(fā)現(xiàn)這些降維維數(shù)均有較好的整體分類性能。此外,k=1時的分類性能要比其他k值的分類性能差;k=2已有較好的整體分類性能;k取5、10和20時的整體分類性能基本相同,并且均比k取1和2時的整體分類性能好。在計算復(fù)雜度方面,這些k值的平均哈希提取時間為7.370~8.100 s,差異較小。因此,綜合考慮各方面指標,本文算法在k=5時的總體性能較好。

圖6 不同維數(shù)的ROC曲線對比Fig.6 ROC curve comparisons under different dimensions

圖7 不同哈希算法的ROC曲線比較Fig.7 ROC curve comparisons among various algorithms

3 算法性能比較

將本文算法與RT-DCT算法[12]、NMF-NMF-SQ算法[18]和GF-LVQ算法[22]作對比,測試圖像仍采用2.1節(jié)和2.2節(jié)的圖像庫。圖7是不同算法的ROC曲線對比結(jié)果,其中本文算法的ROC曲線是選取塊總數(shù)為64、塊大小為64×64和k=5時的結(jié)果。觀察圖7發(fā)現(xiàn),NMF-NMF-SQ算法和本文算法的ROC曲線均靠近左上角,并且在另外2種哈希算法ROC曲線的上方。這說明NMF-NMF-SQ算法和本文算法的分類性能優(yōu)于另外2種哈希算法。為了方便比較,將圖7的左上角區(qū)域放大,于是得到其放大圖(見圖7的右下角區(qū)域)。對比發(fā)現(xiàn),本文算法的曲線比NMF-NMF-SQ算法的曲線更靠近左上角。這說明在分類性能方面,本文算法優(yōu)于NMF-NMF-SQ算法。在運行速度方面,RT-DCT算法、NMF-NMF-SQ算法和GF-LVQ算法的運行時間分別為0.455、1.298和0.285 s。本文算法的時間為7.741 s,速度慢于3種對比算法,這是因為PCA的計算復(fù)雜度較高。此外,RT-DCT算法的哈希長度是240 bits,GF-LVQ算法的長度是120 bits,NMF-NMF-SQ算法的長度是64個浮點數(shù),而本文算法的長度是64個整數(shù)(即896 bits)。由此可見,本文算法的分類性能優(yōu)于3種比較算法,哈希長度適中,不足之處是計算復(fù)雜度略高。

4 圖像拷貝檢測應(yīng)用

為了測試拷貝檢測性能,構(gòu)造了一個較大的實驗圖像庫。該圖像庫一共包含1 200幅圖像,其中200幅圖像是唯一性實驗的圖像集,1 000幅圖像從Web網(wǎng)站下載得到。實驗選取的查詢圖像為一幅中國畫,如圖8(a)所示。用不同數(shù)字操作對查詢圖像實施攻擊以生成一系列拷貝版本,具體操作如下:伽瑪值是0.75的伽瑪校正;質(zhì)量因子等于80的JPEG壓縮;均值是0、標準差為0.8的3×3高斯低通濾波;α等于-4的3×3拉普拉斯濾波;強度是30的水印嵌入;比例是0.75的縮放變換;角度為5°的旋轉(zhuǎn)變換;密度是0.02的椒鹽噪聲污染;添加印章;單元格尺寸等于10的馬賽克濾波;均值是0、方差為0.02的乘性噪聲污染。于是得到如圖8(b)~(l)所示結(jié)果,將這些結(jié)果加入圖像庫,最終形成一個含1 211幅圖像的測試集。

圖8 一幅中國畫及其11個拷貝版本Fig.8 A Chinese painting and its 11 copy versions

序號圖像相關(guān)系數(shù)1圖8(e)1.000002圖8(i)0.999993圖8(l)0.999974圖8(d)0.999965圖8(f)0.999956圖8(c)0.999927圖8(j)0.999608圖8(h)0.999539圖8(k)0.9993810圖8(b)0.9976011圖8(g)0.9199912其他圖像0.5008713其他圖像0.4612214其他圖像0.4592215其他圖像0.45276

表3列出與查詢圖像最相似的15幅圖像(按相似系數(shù)取值降序排列)。由表3知,11個拷貝版本對應(yīng)的相關(guān)系數(shù)的取值均大于0.900 00,而不同圖像對應(yīng)的相關(guān)系數(shù)的取值較小(最大值為0.500 87)。由此可見,拷貝版本與不同圖像之間有較好的區(qū)分度。當(dāng)選擇0.900 00或0.850 00為閾值時,本文算法可準確識別拷貝版本與不同圖像。此時,本文算法能夠正確檢測所有拷貝版本并且誤判率為零,說明拷貝檢測性能較好。

5 結(jié)論

本文設(shè)計了基于PCA特征的高效圖像哈希算法。該哈希算法通過構(gòu)造二次圖像實現(xiàn)數(shù)據(jù)初步壓縮,運用PCA達到數(shù)據(jù)降維,最終用特征距離生成較短的哈希序列。大量實驗表明本文算法在魯棒性和唯一性方面的分類性能較好,優(yōu)于3種文獻的哈希算法??截悪z測結(jié)果顯示,本文算法的識別率高,有較好的應(yīng)用前景。下一步工作將研究快速PCA算法,在確保哈希性能不顯著下降的前提下,有效提高運行速度。

[1] 唐振軍,戴玉敏,張顯全,等.基于DCT特征點的感知圖像Hash函數(shù) [J]. 廣西師范大學(xué)學(xué)報(自然科學(xué)版), 2012, 30(3):135-141.DOI:10.16088/j.issn.1001-6600.2012.03.010.

[2] TANG Zhenjun,WANG Shuozhong,ZHANG Xinpeng,et al.Robust image hashing for tamper detection using non-negative matrix factorization [J]. Journal of Ubiquitous Convergence and Technology, 2008, 2(1):18-26.

[3] VENKATESAN R,KOON S M,JAKUBOWSKI M H,et al.Robust image hashing[C]//Proceedings of 2000 International Conference on Image Processing.Piscataway,NJ:IEEE Press,2000:664-666.DOI:10.1109/ICIP.2000. 899541.

[4] 劉凱,唐振軍,張顯全,等.聯(lián)合壓縮感知和顏色向量角的彩色圖像哈希方法[J].應(yīng)用科學(xué)學(xué)報,2015,33(6):595-603. DOI:10.3969/j.issn.0255-8297.2015.06.003.

[5] MONGA V,EVANS B L.Perceptual image hashing via feature points: performance evaluation and tradeoffs[J]. IEEE Transactions on Image Processing,2006,15(11):3453-3466. DOI:10.1109/TIP.2006.881948.

[6] AHMED F,SIYAL M Y,ABBAS V U.A secure and robust hash-based scheme for image authentication[J]. Signal Processing,2010,90(5):1456-1470. DOI:10.1016/j.sigpro.2009.05.024.

[7] LIN C Y,CHANG S F.A robust image authentication method distinguishing JPEG compression from malicious manipulation[J]. IEEE Transactions on Circuits and Systems for Video Technology,2001,11(2):153-168. DOI:10.1109/76.905982.

[8] 秦川,張真誠,郭成.基于秘密共享的感知魯棒圖像Hash算法[J].計算機研究與發(fā)展,2012,49(8):1690-1698.

[9] TANG Zhenjun,YANG Fan,HUANG Liyan,et al.Robust image hashing with dominant DCT coefficients[J]. Optik-International Journal for Light and Electron Optics,2014,125(18):5102-5107.DOI:10.1016/j.ijleo.2014.05.015.

[10] LEFEBVRE F,MACQ B,LEGAT J D.RASH:Radon soft hash algorithm[C]//Proceedings of 11th European Signal Processing Conference. Piscataway, NJ:IEEE Press, 2002:299-302.

[11] LEI Yanqiang, WANG Yuangen, HUANG Jiwu.Robust image hash in Radon transform domain for authentication [J].Signal Processing:Image Communication,2011,26(6):280-288. DOI:10.1016/j.image.2011.04.007.

[12] OU Yang,RHEE K H.A key-dependent secure image hashing scheme by using Radon transform[C]//Proceedings of the 2009 International Symposium on Intelligent Signal Processing and Communication Systems. Piscataway, NJ:IEEE Press,2009:595-598. DOI:10.1109/ISPACS.2009.5383770.

[13] TANG Zhenjun, HUANG Liyan, YANG Fan,et al.Robust image hashing based on fan-beam transform[J]. ICIC Express Letters,2014,8(8):2365-2372.

[14] SWAMINATHAN A,MAO Yinian,WU Min.Robust and secure image hashing[J].IEEE Transactions on Information Forensics and Security,2006,1(2):215-230. DOI:10.1109/TIFS.2006.873601.

[15] WU Di,ZHOU Xuebing,NIU Xiamu.A novel image hash algorithm resistant to print-scan[J].Signal Processing, 2009,89(12):2415-2424. DOI:10.1016/j.sigpro.2009.05.016.

[16] QIN Chuan,CHANG Chinchen,TSOU Peiling.Robust image hashing using non-uniform sampling in discrete Fourier domain[J].Digital Signal Processing,2013,23(2):578-585.DOI:10.1016/j.dsp.2012.11.002.

[17] KOZAT S S,VENKATESAN R, MIHCAK M K.Robust perceptual image hashing via matrix invariants[C]// Proceedings of 2004 International Conference on Image Processing.Piscataway,NJ:IEEE Press,2004:3443-3446. DOI:10.1109/ICIP.2004.1421855.

[18] MONGA V,MIHCAK M K.Robust and secure image hashing via non-negative matrix factorizations[J].IEEE Transactions on Information Forensics and Security,2007,2(3):376-390.DOI:10.1109/TIFS.2007.902670.

[19] TANG Zhenjun,WANG Shuozhong,ZHANG Xinpeng,et al.Lexicographical framework for image hashing with implementation based on DCT and NMF[J].Multimedia Tools and Applications,2011,52(2/3):325-345.DOI: 10.1007/s11042-009-0437-y.

[20] TANG Zhenjun,ZHANG Xianquan,ZHANG Shichao.Robust perceptual image hashing based on ring partition and NMF[J].IEEE Transactions on Knowledge and Data Engineering,2014,26(3):711-724. DOI:10.1109/TKDE. 2013.45.

[21] GHOUTI L.Robust perceptual color image hashing using quaternion singular value decomposition[C]// Proceedings of 2014 IEEE International Conference on Acoustic, Speech and Signal Processing. Piscataway,NJ: IEEE Press,2014:3794-3798.DOI:10.1109/ICASSP.2014.6854311.

[22] LI Yuenan, LU Zheming, ZHU Ce, et al.Robust image hashing based on random Gabor filtering and dithered lattice vector quantization[J].IEEE Transactions on Image Processing,2012,21(4):1963-1980.DOI:10.1109/TIP.2011.2171698.

[23] TANG Zhenjun,DAI Yumin,ZHANG Xianquan,et al.Robust image hashing via colour vector angles and discrete wavelet transform[J].IET Image Processing,2014,8(3):142-149. DOI:10.1049/iet-ipr.2013.0332.

[24] ZHAO Yan,WANG Shuozhong,ZHANG Xinpeng,et al.Robust hashing for image authentication using Zernike moments and local features[J].IEEE Transactions on Information Forensics and Security,2013,8(1):55-63.DOI: 10.1109/TIFS.2012.2223680.

[25] PETITCOLAS F A P.Watermarking schemes evaluation[J].IEEE Signal Processing Magazine,2000,17(5):58-64. DOI:10.1109/79.879339.

[26] FAWCETT T. An introduction to ROC analysis[J].Pattern Recognition Letters,2006,27(8):861-874.DOI:10.1016/ j.patrec.2005.10.010.

(責(zé)任編輯 黃 勇)

Image Hashing Algorithm Based on PCA Feature Distance

TANG Zhenjun1,2, YANG Fan1,2, HUANG Ziqing1,2, LAO Huan1,2

(1. Guangxi Key Lab of Multi-source Information Mining & Security, Guangxi Normal University, Guilin Guangxi 541004, China;2. College of Computer Science and Information Technology, Guangxi Normal University, Guilin Guangxi 541004, China)

Principal component analysis (PCA) is applied to image hashing algorithm and a perceptual hashing algorithm based on characteristic distance is proposed. In the proposed algorithm, a secondary image suitable for data dimension reduction is first constructed from the normalized image. Then, PCA is used to process secondary image, and the distance between PCA features is finally exploited to form image hash. Experimental results illustrate that classification performance of the proposed algorithm measured with receiver operating characteristics (ROC) curve is better than those of three existing hashing algorithms. Copy detection under a large-scale image database shows that the proposed algorithm has good performance in detecting image copies.

perceptual hash function; principal component analysis (PCA); data dimension reduction; image copy detection; image retrieval

10.16088/j.issn.1001-6600.2016.04.002

2016-06-19

國家自然科學(xué)基金資助項目(61300109, 61363034, 61562007);廣西自然科學(xué)基金資助項目(2015GXNSFDA139040);廣西“八桂學(xué)者”工程專項經(jīng)費資助項目;廣西高等學(xué)校優(yōu)秀中青年骨干教師培養(yǎng)工程資助項目(GXGQ012013059);廣西多源信息挖掘與安全重點實驗室系統(tǒng)性研究基金資助項目(15-A-02-02, 14-A-02-02,13-A-03-01)

唐振軍(1979—),男,廣西桂平人,廣西師范大學(xué)教授,博士。E-mail:tangzj230@163.com

TP391

A

1001-6600(2016)04-0009-10

猜你喜歡
拷貝分塊哈希
鋼結(jié)構(gòu)工程分塊滑移安裝施工方法探討
哈希值處理 功能全面更易用
文件哈希值處理一條龍
分塊矩陣在線性代數(shù)中的應(yīng)用
唐氏綜合征是因為“拷貝”走樣了
文化拷貝應(yīng)該如何“拷”
反三角分塊矩陣Drazin逆新的表示
基于OpenCV與均值哈希算法的人臉相似識別系統(tǒng)
巧用哈希數(shù)值傳遞文件
基于兩級分塊的文件同步方法