常子鵬 宋文廣 顧宮
摘要:傳統(tǒng)的巖心圖像壓縮多采用小波變換,此方法并不利于對(duì)巖心圖像細(xì)節(jié)信息的保留,壓縮后清晰度也無(wú)法滿足巖性分析的需求。提出一種JPEG結(jié)合卷積神經(jīng)網(wǎng)絡(luò)的巖心圖像壓縮模型。首先將待壓縮巖心圖像送入空域冗余去除結(jié)構(gòu)剔除冗余信息,再使用JPEG編碼把圖像變換到DCT域,量化后去除不必要的高頻信息。解碼時(shí)使用JPEG解碼器將圖像從DCT域變換到像素域,為了恢復(fù)巖心圖像在空域、頻域的失真,于解碼端添加了19層的卷積層的神經(jīng)網(wǎng)絡(luò),最終將巖心圖像重構(gòu)。此方法創(chuàng)新點(diǎn)在于首次提出深度學(xué)習(xí)應(yīng)用于巖心圖像的壓縮,并具有比傳統(tǒng)小波變換與離散余弦變換的壓縮方法更高的圖像壓縮比與清晰度,對(duì)巖心圖像研究領(lǐng)域具有較高的參考價(jià)值與實(shí)用前景。
關(guān)鍵詞:巖心圖像壓縮;卷積神經(jīng)網(wǎng)絡(luò);JPEG;深度學(xué)習(xí)
中圖分類號(hào):TP391.41 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2018)24-0173-02
巖心圖像具有豐富的紋理特征,通過(guò)對(duì)其進(jìn)行觀察、研究、分析,可以推測(cè)出地化指標(biāo)與沉積環(huán)境,對(duì)油氣開采具有重大指導(dǎo)意義。隨著科技進(jìn)步,巖心圖像的分辨率和數(shù)量與日俱增,這無(wú)疑對(duì)圖像的存儲(chǔ)、傳輸及管理提出了新要求。目前,巖心圖像的壓縮多采用傳統(tǒng)的Shannon/Nyquist采樣[1]理論,典型算法包括基于離散小波變換的JPEG2000算法[2-4]與基于離散余弦變換的JPEG算法[5]。傳統(tǒng)的JPEG算法在低比特率下,巖心圖像邊緣區(qū)域與紋理出現(xiàn)模糊現(xiàn)象,產(chǎn)生嚴(yán)重塊效應(yīng);在JPEG2000中,DCT變換的不足被離散小波所彌補(bǔ),但由于遵循奈奎斯特采樣定理,仍不利于硬件系統(tǒng)的采集。Chao Dong等人[6]設(shè)計(jì)了ARCNN網(wǎng)絡(luò),首次把深度學(xué)習(xí)應(yīng)用到壓縮圖像的復(fù)原問(wèn)題上。George Toderici等人[7]提出基于長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)的可變比率圖像壓縮算法,圖像在高壓縮比率、非常模糊的條件下,具有比傳統(tǒng)JPEG更好的視覺效果。Fabian Mentzer等人[8]提出了一個(gè)由標(biāo)準(zhǔn)卷積自動(dòng)編碼器和基于3D-CNN的上下文模型組成的系統(tǒng),在ImageNetTest上的MS-SSIM表現(xiàn)皆優(yōu)于JPEG和JPEG2000。Lucas Theis等[9]提出了一種新型自編碼器,此方案在高碼率上效果與JPEG近似。任杰[10]使用JPEG編碼結(jié)合卷積神經(jīng)網(wǎng)絡(luò),提出一種基于深度學(xué)習(xí)的圖像壓縮框架。對(duì)此框架進(jìn)行優(yōu)化,獲得新型巖心圖像壓縮模型,實(shí)驗(yàn)結(jié)果顯示新壓縮模型具有較高壓縮比與清晰度。
1 JPEG與CNN結(jié)合的巖心圖像壓縮模型
1.1 巖心圖像壓縮模型
在任杰[9]設(shè)計(jì)的圖像壓縮框架中,首先把巖心圖像輸入空間冗余剔除模塊,去除圖像在像素域的部分冗余,再把處理的結(jié)果傳入JPEG編碼器中。圖像以8*8的像素塊在JPEG中編碼,每個(gè)塊中存放64個(gè)像素。將圖像中每個(gè)64像素的塊作DCT變換。DCT變換會(huì)把高頻部分集中在64個(gè)像素的塊右下角,低頻部分集中在左上角,通過(guò)特定量化表去除DCT中高頻部分,再通過(guò)熵編碼最終獲得壓縮數(shù)據(jù)。解碼時(shí)先通過(guò)JPEG解碼器將數(shù)據(jù)還原為圖像,再使用SRAR-CNN模型恢復(fù)圖像信息。傳統(tǒng)的JPEG框架只去除頻域上的冗余,提出的框架還去除了圖像在像素域的冗余,并通過(guò)SRAR-CNN結(jié)構(gòu)將圖像頻率域失真與像素域失真一并恢復(fù)。
1.2 Structure Redundancy Remove(SRR)
任杰把SRR模塊用于圖像尺寸縮小到原來(lái)的一半以去除圖像在空間上的冗余,使用雙三次插值來(lái)實(shí)現(xiàn),而巖心圖片存在很強(qiáng)的紋理結(jié)構(gòu)具有結(jié)構(gòu)冗余,但紋理又是研究的重點(diǎn),為了保證縮放后圖像質(zhì)量高,不會(huì)出現(xiàn)像素值不連續(xù)的的情況,采用雙線性插值法把巖心圖像壓縮為原來(lái)的一半。
1.3 DRAR-CNN
為了恢復(fù)并重構(gòu)高質(zhì)量的巖心圖像,提出DRAR-CNN(Deep Resolution and compression Artifact Reduction Convolutional Neural Network)模型,其具體結(jié)構(gòu)如圖2所示。
大小為N*M的巖心圖像首先通過(guò)卷積核大小為3*3、padding為1、步進(jìn)為1的卷積層,在經(jīng)過(guò)relu激活函數(shù)處理后,經(jīng)過(guò)17個(gè)卷積層、batch-normalization歸一化、relu函數(shù)處理,得到的結(jié)果再通過(guò)一個(gè)步進(jìn)為1、卷積核大小3*3、padding為1的卷積層,最后于subpixel處作超分辨處理[10],恢復(fù)并重構(gòu)巖心圖像。
1.4 Batch normalization
2 實(shí)驗(yàn)及結(jié)果
使用500張?zhí)幚砗蟮膸r心圖像作為模型訓(xùn)練集,選取Adam梯度更新方法,迭代50個(gè)epoch,學(xué)習(xí)率從[1e-4]按照對(duì)數(shù)的形式由快到慢逐漸衰減至[1e-6],batch size的大小設(shè)置為128,用于訓(xùn)練的圖像大小為512*512。
測(cè)試集采用500張spL8192-39kc-Basler sprint工業(yè)相機(jī)拍攝的巖心圖像。為展示方便,隨機(jī)取一張巖心圖像100*100大小區(qū)域,分別通過(guò)巖心圖像壓縮模型、JPG2000、JPEG處理后取對(duì)應(yīng)位置與原巖心圖像進(jìn)行對(duì)比,如圖3所示。在高壓縮比下,JPEG巖心圖像(d)出現(xiàn)嚴(yán)重邊緣區(qū)域與紋理模糊的現(xiàn)象,而由巖心圖像壓縮模型(b)處理后的圖像卻很清晰。
3 分析
把DRAR-CNN巖心圖像壓縮模型的實(shí)驗(yàn)效果與JPEG、JPEG2000進(jìn)行對(duì)比,如圖4展示了實(shí)驗(yàn)PSNR對(duì)比結(jié)果。其中,橫坐標(biāo)表示像素深度,縱坐標(biāo)表示峰值信噪比。可以看出,巖心圖像深度從0.2提高至1.2,三種壓縮方式的PSNR也在逐漸增大,提出的DRAR-CNN模型PSNR增長(zhǎng)速率更快,失真更少。這是因?yàn)榫矸e深網(wǎng)經(jīng)網(wǎng)絡(luò)充分利用了圖像信息,通過(guò)深度網(wǎng)絡(luò)大量卷積核提取圖像的多種模糊度、邊緣特征、亮度,最終將圖像清晰得重構(gòu)出來(lái)。
4 結(jié)束語(yǔ)
首次提出深度學(xué)習(xí)應(yīng)用于巖心圖像的壓縮,結(jié)合JPEG與卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)設(shè)計(jì)出巖心圖像壓縮模型。實(shí)驗(yàn)證明,在高壓縮率下,DARA-CNN壓縮模型具有更好的魯棒性,有著較jpeg與jpeg2000更優(yōu)越的壓縮比與清晰度。
參考文獻(xiàn):
[1] 張賢達(dá),保錚.非平穩(wěn)信號(hào)分析與處理[M].北京:國(guó)防部工業(yè)出版社,1998.
[2] Chariloas C,Touradj E.JPEG2000 STILL IMAGE CODING SYSTEM:AN OVER VIEW[J].2000.
[3] 朱鵬.JPEG2000靜態(tài)圖像壓縮標(biāo)準(zhǔn)的研究與實(shí)現(xiàn)[D].國(guó)防科學(xué)技術(shù)大學(xué),2007.
[4] 胡述龍.應(yīng)用JPEG對(duì)巖心圖像數(shù)據(jù)進(jìn)行壓縮處理的方法[J].河南石油,2003,17(5):13-15.
[5] Guo L,Ni J,Shi Y Q.Uniform Embedding for Efficient JPEG Steganography[J].Information Forensics & Security IEEE Transaction on,2016,9(5):814-825.
[6] Dong C,Deng Y,Change Loy C,et al.Compression artifacts reduction by a deep convolutional network[C].Proceedings of the IEEE International Conference on Computer Vision.2015:576-584.
[7] Ioffe S,Szegedy C.Batch normalization:Accelerating deep network training by reducing internal covariate shitft[J].arXiv:1502.03167,2015.
[8] Fabian Mentzer , Eirikur Agustsson, Michael Tschannen et al.Conditional Probability Models for Deep Image Compression[J].arXiv:1801.04260,2018
[9] Theis L,Shi W,Cunningham A,et al.Lossy Image Compression with Compressive Autoencoders[J]. arXiv preprint arXiv:1703.00395,2017
[10] 任杰.基于深度學(xué)習(xí)的圖像壓縮方法研究[D].哈爾濱工業(yè)大學(xué),2017.
[11] Neeraj Kumar,Ruchika Verma,Amit.Convolutional neural networks for wavelet domain super resolution[J].Pattern Recognition Letters,2017,90(15):65-71.
【通聯(lián)編輯:梁書】