姜家濤,謝曉堯,于徐紅
(1. 貴州師范大學(xué)貴州省信息與計(jì)算科學(xué)重點(diǎn)實(shí)驗(yàn)室,貴州 貴陽(yáng) 550001;2. 貴州師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院,貴州 貴陽(yáng) 550001;3. FAST早期科學(xué)數(shù)據(jù)中心,貴州 貴陽(yáng) 550001)
自2016年9月500 m口徑球面射電望遠(yuǎn)鏡在我國(guó)貴州落成[1]以來(lái),脈沖星搜索一直是重要科學(xué)目標(biāo)之一。截至目前,F(xiàn)AST早期科學(xué)數(shù)據(jù)中心已計(jì)算發(fā)現(xiàn)了240個(gè)新脈沖星候選體[2-5],其中123顆脈沖星候選體已經(jīng)證實(shí)為新脈沖星。J1859-0131和J1931-01是我國(guó)射電望遠(yuǎn)鏡首次發(fā)現(xiàn)的兩顆脈沖星。J0318+0253是FAST發(fā)現(xiàn)的首個(gè)毫秒脈沖星[3],是至今發(fā)現(xiàn)的射電流量最弱的高能毫秒脈沖星之一,展示了FAST對(duì)國(guó)際低頻引力波探測(cè)做出實(shí)質(zhì)貢獻(xiàn)的潛力,是FAST的重要成果。巡天觀測(cè)數(shù)據(jù)經(jīng)過計(jì)算處理[5],產(chǎn)生海量脈沖星候選體診斷圖像。以每天處理2 000個(gè)數(shù)據(jù)文件為例,單日產(chǎn)生的圖像達(dá)到300 000張,存儲(chǔ)空間需要20 G。脈沖星候選體診斷圖數(shù)量呈指數(shù)增長(zhǎng),給科學(xué)數(shù)據(jù)管理工作帶來(lái)挑戰(zhàn)。脈沖星候選體診斷圖像是科學(xué)家對(duì)巡天數(shù)據(jù)進(jìn)行檢查、脈沖星搜索判斷的科學(xué)數(shù)據(jù),是探究新搜索技術(shù)方法的數(shù)據(jù)基礎(chǔ),是天文科研科普開放共享的重要資源。脈沖星識(shí)別軟件在專用網(wǎng)絡(luò)中不斷傳輸脈沖星候選體診斷圖像,科學(xué)家基于脈沖星候選體診斷圖像探索新的科研方法,如文[2]提出的PICS方法。FAST云平臺(tái)公布的共享信息包含大量的脈沖星候選體診斷圖,我們迫切需要研究壓縮技術(shù),實(shí)現(xiàn)脈沖星候選體診斷圖像的有效存儲(chǔ),加快網(wǎng)絡(luò)傳輸共享。
傳統(tǒng)主流的圖像標(biāo)準(zhǔn)算法如JPEG[5],JPEG2000[6]和BPG等采用變換編碼。JPEG對(duì)圖像分塊做離散余弦變換(Discrete Cosine Transform, DCT),將圖像信息從空域變換到系數(shù)能量相對(duì)集中的離散余弦變換域,然后量化變換系數(shù)和熵編碼[3];而JPEG2000對(duì)圖像做離散小波變換(Discrete Wavelet Transform, DWT),分層熵編碼。但離散余弦變換和離散小波變換是固定不變的線性變換函數(shù),近似固定卷積核圖像的卷積操作,手工設(shè)計(jì)的變換矩陣對(duì)脈沖星圖像數(shù)據(jù)去相關(guān)性不一定最優(yōu)。近年來(lái)基于神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的圖像壓縮編碼方法[7-10]越來(lái)越受到研究者青睞。文[7]提出基于循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network, RNN)的圖像編碼框架,文[8]提出基于卷積神經(jīng)網(wǎng)絡(luò)的壓縮編碼結(jié)構(gòu),學(xué)習(xí)網(wǎng)絡(luò)瓶頸層數(shù)據(jù)表征的分布熵模型,更好地移除圖像的內(nèi)部冗余。基于神經(jīng)網(wǎng)絡(luò)的圖像壓縮利用大量圖像優(yōu)化學(xué)習(xí),在對(duì)圖像去相關(guān)緊湊化壓縮變換方面比傳統(tǒng)手工設(shè)計(jì)壓縮模塊方法更有效。但是,現(xiàn)有的壓縮方法都是針對(duì)自然圖像,沒有充分考慮脈沖星診斷圖像不同于自然圖像的特性。脈沖星診斷圖像由稀疏的黑白圖像、隨機(jī)分布的灰度圖和彩色圖像組成,簡(jiǎn)單視為彩色圖像用一種變換壓縮算法處理顯然是不合理的。
針對(duì)脈沖星候選體診斷圖的特征,本文提出使用跳白塊編碼和深度網(wǎng)絡(luò)圖像壓縮模型相結(jié)合的壓縮方法。針對(duì)診斷圖像的曲線和文字等黑白圖像,首先二值化圖像,然后使用改進(jìn)的自適應(yīng)分層跳白塊算法壓縮。對(duì)于深度神經(jīng)網(wǎng)絡(luò)壓縮模型的設(shè)計(jì),首先,圖像壓縮模型采用卷積神經(jīng)網(wǎng)絡(luò)自編碼器結(jié)構(gòu),整體結(jié)構(gòu)由正向編碼網(wǎng)絡(luò)、量化器、熵編碼器和反向編碼網(wǎng)絡(luò)組成。其次,將量化特征的編碼率與失真誤差的加權(quán)和作為損失函數(shù),利用大量脈沖星候選體診斷圖像自適應(yīng)學(xué)習(xí)各個(gè)模塊函數(shù)。為了有效利用算術(shù)編碼器算法對(duì)潛在表示特征的分布,算法使用網(wǎng)絡(luò)學(xué)習(xí)非線性函數(shù)逼近實(shí)際的數(shù)據(jù)分布模型。為了驗(yàn)證提出算法的有效性,實(shí)驗(yàn)將近年來(lái)FAST巡天項(xiàng)目生成的脈沖星候選體診斷圖作為數(shù)據(jù)集,分別應(yīng)用JPEG算法、JPEG2000算法、BPG算法和本文提出的深度神經(jīng)網(wǎng)絡(luò)壓縮模型(Deep Neural Compression Model, DNCM)算法比較。結(jié)果表明,深度神經(jīng)網(wǎng)絡(luò)壓縮模型算法的峰值信噪比優(yōu)于JPEG算法,與JPEG2000相當(dāng),但結(jié)構(gòu)相似性遠(yuǎn)遠(yuǎn)超過傳統(tǒng)壓縮算法,特別是在低比特率下重構(gòu)圖像較高的結(jié)構(gòu)相似性保證了圖像的感官質(zhì)量。診斷圖本是目視判斷脈沖星候選體的輔助依據(jù),實(shí)驗(yàn)證明本文算法針對(duì)脈沖星候選體診斷圖壓縮應(yīng)用是有效的。
脈沖星候選體診斷圖(圖1)是觀測(cè)數(shù)據(jù)經(jīng)過消色散、周期折疊處理后得到可能的脈沖星旋轉(zhuǎn)參數(shù)組合和統(tǒng)計(jì)量分布結(jié)果數(shù)據(jù)繪制的圖像[1],用于天文學(xué)家判定是否為脈沖星。
圖1 脈沖星候選體診斷圖像
診斷圖主要包含8個(gè)子圖,直觀上可以粗略分為3類,其中②和③子圖為二維灰度散度圖,包含大量隨機(jī)噪聲點(diǎn);①,④,⑤,⑥和⑦為稀疏的曲線圖或文字表示的黑白圖像;⑧為彩色圖像。觀察可知,子圖特征差異較大,圖像通道數(shù)量不一,數(shù)據(jù)稀疏程度差別較大,使用單一的壓縮算法或一種壓縮模型顯然是不合理的。本文將圖像區(qū)域劃分為3類,采用不同方法壓縮編碼,黑白圖像區(qū)域使用跳白塊編碼,灰度圖和彩色圖分別訓(xùn)練一個(gè)深度網(wǎng)絡(luò)隱變量壓縮模型。3類圖像區(qū)域自動(dòng)定位切割,并分發(fā)到對(duì)應(yīng)編碼器壓縮處理。
跳白塊編碼是一種充分利用二值圖像中單色區(qū)域占大部分位置的特征游程編碼變體。一維跳白塊編碼也稱跳白條,將二值圖像的各掃描行分成若干塊,每塊N個(gè)像素[11]。全白像素塊用1比特字 “0” 表示,對(duì)于至少含有一個(gè)黑像素的塊,用N+1比特碼字表示;含有黑色像素的塊第1個(gè)比特位表示 “1”,稱為前綴碼,其余N比特直接用自身的二值幅值表示,白為 “0”,黑為 “1”。推廣到二維,將整個(gè)圖像分割為M×N像素的塊,若塊為全白像素時(shí)用1比特 “0” 表示;非全白塊用1 +M×N個(gè)比特碼字表示,一個(gè)前綴比特 “1”,其余MN比特直接用自身的二值幅值表示。將脈沖星候選體圖像中的1類區(qū)域分割出來(lái),指定閾值變換為二值圖像,白像素用 “0” 表示,黑像素用 “1” 表示。
如圖2,用跳白塊編碼二值圖像生成二進(jìn)制數(shù)據(jù)流,再送入自適應(yīng)算術(shù)編碼器(QM編碼器),進(jìn)一步壓縮數(shù)據(jù)流中的位流冗余。本文使用跳白塊編碼改進(jìn)的自適應(yīng)分層跳白塊算法。
圖2 跳白塊編碼二值圖像
對(duì)于灰度圖像和彩色圖像,本文分別訓(xùn)練兩個(gè)學(xué)習(xí)型深度網(wǎng)絡(luò)隱變量模型壓縮相應(yīng)的圖像塊。深度網(wǎng)絡(luò)隱變量壓縮模型的整體網(wǎng)絡(luò)結(jié)構(gòu)是一個(gè)自編碼器結(jié)構(gòu),如圖3。壓縮網(wǎng)絡(luò)模型由4部分組成:分析變換網(wǎng)絡(luò)模塊(Encoder)、量化器(Quantizer)、熵編碼模塊(Entropy Coder)和集成變換網(wǎng)絡(luò)模塊(Decoder)。分析變換網(wǎng)絡(luò)模塊由多個(gè)堆疊的卷積層組成,經(jīng)過一系列下采樣、提取特征、去相關(guān)等操作,將輸入圖像映射到弱相關(guān)的緊湊的隱變量。潛在表示保留了圖像的全部必要信息,是待編碼的壓縮信息。集成變換網(wǎng)絡(luò)是分析變換網(wǎng)絡(luò)的逆操作,也是由一系列堆疊的逆卷積層組成,通過上采樣生成圖像信息。熵編碼模塊是依據(jù)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)得到潛在表示分布的參數(shù)估計(jì)的模型,指導(dǎo)算術(shù)編碼器將量化器量化后的潛在表示信息生成可以保存和網(wǎng)絡(luò)傳輸?shù)亩M(jìn)制碼流,即壓縮信息。
圖3 深度神經(jīng)網(wǎng)絡(luò)圖像壓縮模型結(jié)構(gòu)圖
分析變換器Eφ(x)將圖像特征數(shù)據(jù)x映射為潛在表示y,量化器將y量化為y^,y熵模型Q(y^;θ)逼近潛在表示層的統(tǒng)計(jì)分布,指導(dǎo)算術(shù)編碼器將y^編碼為二進(jìn)制流。解碼時(shí)算術(shù)編碼器依據(jù)熵模型將二進(jìn)制流重新譯成量化特征y^,集成變換Dφ(z)根據(jù)y^的信息生成圖像x′。這其中主要模塊為分析變換器Eφ(x)、熵模型Q(y^;θ)和集成變換器Dφ(z)。與傳統(tǒng)的變換編碼方法不同,它們都是利用大量圖像優(yōu)化學(xué)習(xí)得到的,而非手工設(shè)計(jì)。神經(jīng)網(wǎng)絡(luò)基于一個(gè)損失函數(shù),反向傳播誤差梯度,學(xué)習(xí)得到模型的參數(shù)(φ,θ,φ),以權(quán)值和偏置形式保存在神經(jīng)網(wǎng)絡(luò)中。本文采用率失真優(yōu)化(Rate Distortion Optimization, RDO)策略學(xué)習(xí)網(wǎng)絡(luò),即聯(lián)合圖像壓縮損失和碼率函數(shù),拉格朗日乘子β控制碼率與失真率的平衡。用公式表示為
L=D(x,x^)+βH(y^),
(1)
st.H(y^)=-log2p(y^),D(x,x^)=‖x-x^‖2.
1.2.1 量化器
由于壓縮編碼需要對(duì)潛在表示層輸出y量化處理,通常使用取整roundΔ操作。本文采用的量化器量化間隔步長(zhǎng)為1,用間隔的中心表示量化輸出。量化公式為
(2)
然而,我們分析損失函數(shù)(1)式可以發(fā)現(xiàn),損失函數(shù)依賴于量化值,但是取整量化函數(shù)的梯度幾乎總是0,碼率R與失真D組成的損失函數(shù)不可微,導(dǎo)致無(wú)法使用梯度下降優(yōu)化損失。為了能夠繼續(xù)使用隨機(jī)梯度下降優(yōu)化,在訓(xùn)練過程中,我們加入獨(dú)立同分布的隨機(jī)均勻噪聲ε,實(shí)現(xiàn)抖動(dòng)的量化器。ε的分布區(qū)間和量化器量化間隔的寬度都等于1,在測(cè)試和實(shí)際編碼過程中,我們直接使用取整函數(shù)
(3)
1.2.2 分段線性函數(shù)熵模型
圖像壓縮模型需要對(duì)分析變換得到的緊湊的潛在表示信息無(wú)損編碼,生成二進(jìn)制碼流,本文采用算術(shù)編碼實(shí)現(xiàn)熵編碼。算術(shù)編碼是一種基于信源信息統(tǒng)計(jì)的概率分布,將所有編碼信息映射到實(shí)軸[0, 1)內(nèi)小區(qū)間表示的最優(yōu)無(wú)損熵編碼算法。算術(shù)編碼的基礎(chǔ)是潛在表示分布模型的精準(zhǔn)估計(jì),影響碼率R和損失D,即壓縮器的壓縮性能,我們使用一個(gè)網(wǎng)絡(luò)無(wú)參數(shù)分段線性密度函數(shù)模型逼近實(shí)際數(shù)據(jù)的分布。
假定潛在表示空間的數(shù)據(jù)是獨(dú)立同分布,則可以建立一個(gè)完全因子分解模型,其似然函數(shù)為樣本的積分,
(4)
其中,c(*)是先驗(yàn)分布密度模型的累積函數(shù)。由(4)式得到一個(gè)以實(shí)際數(shù)據(jù)yi為中心的單位概率質(zhì)量密度。概率密度模型由潛在表示數(shù)據(jù)先驗(yàn)分布密度函數(shù)卷積一個(gè)標(biāo)準(zhǔn)均勻分布密度函數(shù)得到,將編碼器的輸出特征映射作為輸入,生成潛在表示特征的概率密度。
本文參考文[9]設(shè)計(jì)一個(gè)基于深度神經(jīng)網(wǎng)絡(luò)的無(wú)參數(shù)分段線性密度函數(shù)模型,通過迭代訓(xùn)練優(yōu)化實(shí)現(xiàn)樣本數(shù)據(jù)與模型之間的擬合。使用卷積網(wǎng)絡(luò)構(gòu)建的無(wú)參數(shù)分段線性密度函數(shù)包括K個(gè)階段的非線性變換函數(shù)卷積,第K階段向量映射函數(shù)fK:Rm→Rn,其中fK′為密度f(wàn)K的梯度,是一個(gè)雅克比矩陣,可以將模型的累計(jì)密度鏈?zhǔn)接?jì)算法則表示為
(5)
非線性函數(shù)具體實(shí)現(xiàn)公式為
fk(x)=gk[H(k)x+b(k)] 1≤k (6) fK(x)=sigmoid[H(K)x+b(K)] , (7) gk(x)=x+a(k)·tanh(x). (8) 其中,fk(x)表示量化函數(shù)前面1 ≤k 實(shí)驗(yàn)將近年來(lái)脈沖星搜索巡天的部分結(jié)果數(shù)據(jù)作為圖像壓縮訓(xùn)練集和測(cè)試模型,數(shù)據(jù)源包括脈沖星圖像樣本1 159個(gè)和射頻干擾(Radio Frequency Interference, RFI)圖像樣本998個(gè)8位無(wú)損PNG圖像。網(wǎng)絡(luò)模型在NVIDIA GeForce GTX 1080 GPU上使用Pytorch框架實(shí)現(xiàn)。為了驗(yàn)證本文算法的性能,實(shí)驗(yàn)隨機(jī)從測(cè)試集中抽取5幅脈沖星圖像,測(cè)試壓縮算法。對(duì)黑白圖像處理后使用跳白塊壓縮和PNG壓縮結(jié)果比較;對(duì)灰度圖和彩色圖區(qū)域,將本文的深度壓縮算法與JPEG,JPEG2000和BPG算法比較。其中,JPEG采用開源庫(kù)libjpeg,JPEG2000使用openjpeg實(shí)現(xiàn),BPG使用開源庫(kù)libbpg。 分割候選體診斷圖中1類圖像區(qū)域,此類圖像區(qū)域?yàn)橄∈璧暮诎讏D像,計(jì)算像素幅值直方圖選定閾值為200,將圖像二值化映射為{0, 1};選擇跳白塊尺寸,經(jīng)過大量候選體診斷圖像壓縮試驗(yàn),選取最優(yōu)跳白塊尺寸大小為5 × 4,獲得最優(yōu)壓縮碼流;跳白塊編碼后送入自適應(yīng)算術(shù)編碼器。 自編碼器的輸入與輸出尺寸一致,即輸入圖像的大小通道數(shù)與壓縮模型重構(gòu)圖像大小一致。本文設(shè)計(jì)的壓縮網(wǎng)絡(luò),圖像大小256 × 256,分析變換網(wǎng)絡(luò)模塊包括4個(gè)卷積層和3個(gè)廣義的分裂歸一化(Generalized Divisive Normalization, GDN)層,4個(gè)ResNet層。卷積層2倍下采樣,第1個(gè)卷積層用128個(gè)9 × 9的卷積核,步長(zhǎng)2,填充位4;第2和第3個(gè)卷積層有128個(gè)5 × 5卷積核,步長(zhǎng)為2,填充2。bottleneck層也是卷積層,步長(zhǎng)2,填充2,可調(diào)節(jié)通道數(shù)指定16 × 16特征圖數(shù)量控制碼率。集成變換網(wǎng)絡(luò)模塊與分析變換網(wǎng)絡(luò)模塊參數(shù)相似,Conv2d替換為ConvTranspose2d,順序相反。 本文的網(wǎng)絡(luò)模型基于率失真優(yōu)化,即壓縮損失和碼率聯(lián)合作為目標(biāo)損失函數(shù),針對(duì)灰度圖和彩色圖訓(xùn)練了兩類壓縮模型。其中λ為拉格朗日乘子,用于調(diào)節(jié)不同的壓縮損失和碼率組合,以滿足不同壓縮質(zhì)量要求的場(chǎng)景,即可變碼率壓縮。實(shí)驗(yàn)中,我們訓(xùn)練了10種λ模型,λ 取值16, 32, 64, 128, 512, 1 024, 2 048, 4 096, 6 144和8 192,以自適應(yīng)動(dòng)量估計(jì)算法(Adaptive Moment Estimation, ADAM)優(yōu)化模型,初始學(xué)習(xí)率為10-3,動(dòng)量因子為0.99,權(quán)重衰減率為10-4。迭代優(yōu)化次數(shù)設(shè)置為100 000,每次迭代的訓(xùn)練樣本批次大小為16。首先訓(xùn)練高碼率模型,然后基于這個(gè)模型作為預(yù)訓(xùn)練模型,分別調(diào)整λ值訓(xùn)練其他模型。 2.3.1 跳白塊編碼性能評(píng)價(jià) 將候選體診斷圖中1類圖像區(qū)域,用改進(jìn)的跳白塊編碼壓縮的結(jié)果與跳白塊編碼基本壓縮和PNG壓縮結(jié)果比較,如表1。黑白圖像的PNG和跳白塊編碼無(wú)損壓縮結(jié)果見圖4。由表1可以看出,改進(jìn)的跳白塊編碼壓縮性能是PNG的5倍,加入了QM的跳白塊編碼壓縮性能得到進(jìn)一步提升。從圖4可以看出,PNG和跳白塊編碼的黑白圖像基本相同,PNG圖像邊緣更平滑。 圖4 黑白圖像的PNG和WBS無(wú)損壓縮結(jié)果對(duì)比 表1 跳白碼編碼與PNG編碼比較 2.3.2 網(wǎng)絡(luò)模型客觀評(píng)價(jià) 本文設(shè)置灰度圖像區(qū)域和彩色圖像的神經(jīng)網(wǎng)絡(luò)潛在表示層通道數(shù)分別為N=64, 128,下采樣倍率為16,訓(xùn)練深度網(wǎng)絡(luò)壓縮模型。由于兩類模型方法相同,受篇幅限制,文中僅描述彩色圖像網(wǎng)絡(luò)模型在不同碼率下的峰值信噪比和結(jié)構(gòu)相似性。圖5(a)為峰值信噪比-碼率曲線,反映各種算法在不同碼率下解碼圖像與原圖像像素之間的均方誤差。整體上,深度網(wǎng)絡(luò)壓縮模型算法性能與JPEG2000相近,明顯優(yōu)于JPEG算法,但不及BPG算法。在bpp為0.4時(shí),深度網(wǎng)絡(luò)壓縮模型的峰值信噪比為31 dB,與JPEG2000算法交叉,比JPEG算法高1.4 dB,比BPG算法低8 dB。壓縮效果明顯優(yōu)于JPEG和JPEG2000算法,接近BPG算法。接近無(wú)損壓縮時(shí),傳統(tǒng)壓縮算法超出神經(jīng)網(wǎng)絡(luò)方法,這是卷積神經(jīng)網(wǎng)絡(luò)的過平滑造成的。圖5(b)為結(jié)構(gòu)相似性-碼率曲線,反映各種算法在不同碼率下解碼圖像與原圖像結(jié)構(gòu)相似度。深度神經(jīng)網(wǎng)絡(luò)壓縮模型算法的結(jié)構(gòu)相似性明顯高于JPEG算法和JPEG2000算法,略高于BPG算法。在bpp為0.2時(shí),深度神經(jīng)網(wǎng)絡(luò)壓縮模型算法的結(jié)構(gòu)相似性高于0.99,BPG算法的結(jié)構(gòu)相似性為0.95,而bpp < 0.7時(shí),深度神經(jīng)網(wǎng)絡(luò)壓縮模型算法的結(jié)構(gòu)相似性依然高于0.95,說明在較低比特率高壓縮比情況下,深度神經(jīng)網(wǎng)絡(luò)壓縮模型算法在保持圖像感知質(zhì)量上有絕對(duì)優(yōu)勢(shì)。 圖5 圖像壓縮峰值信噪比和結(jié)構(gòu)相似性率失真曲線比較 2.3.3 網(wǎng)絡(luò)模型主觀評(píng)價(jià) 圖6展示了不同的圖像壓縮算法在相近碼率的視覺結(jié)果。由圖6可以看出,JPEG算法出現(xiàn)塊效應(yīng), 深度神經(jīng)網(wǎng)絡(luò)壓縮模型算法多數(shù)情況下與BPG算法性能相近,比JPEG算法和JPEG2000算法效果好,圖中兩幅診斷圖的彩色圖在相對(duì)小的碼率下取得最好的視覺質(zhì)量。 圖6 可視化結(jié)果比較JPEG, JPEG2000, BPG和DNCM的質(zhì)量 總之,脈沖星診斷圖包含大量稀疏曲線、隨機(jī)噪聲點(diǎn)灰度圖和彩色圖像塊,任何一種傳統(tǒng)的有損壓縮算法都不是最優(yōu)選擇,本文根據(jù)分區(qū)策略,利用跳白塊編碼和神經(jīng)網(wǎng)絡(luò)壓縮模型對(duì)診斷圖像壓縮具有針對(duì)性和專用性。曲線文字圖像塊轉(zhuǎn)化為二值圖像后跳白塊壓縮幾乎沒有損失,卻得到極高的壓縮比,特別是網(wǎng)絡(luò)壓縮模塊的功能函數(shù)是利用大量的診斷圖學(xué)習(xí)得到,最大程度地反映了診斷圖像數(shù)據(jù)的空間特征,進(jìn)一步反映得到模型的專用性。脈沖星診斷圖最重要的作用是輔助人類目視判斷脈沖星候選體,識(shí)圖時(shí)觀測(cè)的重點(diǎn)是曲線圖像和子圖圖像的結(jié)構(gòu)信息,本文提出算法在低比特率下保持較高的結(jié)構(gòu)相似性,反映了視覺感知質(zhì)量的優(yōu)勢(shì)。 脈沖星診斷圖像由稀疏的黑白圖像、隨機(jī)分布的灰度圖和彩色圖像組成,簡(jiǎn)單視為彩色圖像,用一種變換壓縮算法處理顯然是不合理的。為此,本文提出跳白塊編碼和深度網(wǎng)絡(luò)壓縮方法對(duì)診斷圖像分區(qū)壓縮。跳白塊編碼針對(duì)單色區(qū)域占大部分的二值圖像具有較好的壓縮效果,提取脈沖星診斷圖中的曲線子圖和文字描述子圖,選定量化閾值,將圖像二值化為比特位矩陣表示的圖像,選取最優(yōu)跳白塊尺寸,實(shí)現(xiàn)跳白塊編碼后送入自適應(yīng)算術(shù)編碼器進(jìn)一步提升壓縮性能,最終壓縮比是PNG的5倍?;谏疃染W(wǎng)絡(luò)壓縮方法對(duì)灰度圖和彩色圖分別訓(xùn)練模型,深度網(wǎng)絡(luò)壓縮模型是由卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)的自編碼器結(jié)構(gòu),由分析變換編碼網(wǎng)絡(luò)、量化器、熵編碼器和合成變換編碼網(wǎng)絡(luò)組成。各個(gè)壓縮模塊均由學(xué)習(xí)方法利用大量脈沖星候選體診斷圖像優(yōu)化,變換映射能力比傳統(tǒng)手工設(shè)計(jì)模塊更有效,圖像經(jīng)過分析變換映射為潛在表示,是去相關(guān)的更緊湊的圖像信息。學(xué)習(xí)的熵編碼模塊是對(duì)潛在表示空間分布的擬合逼近,是比累積概率直方圖更精準(zhǔn)、更容易操作的概率模型,指導(dǎo)基于統(tǒng)計(jì)分布的算術(shù)編碼器無(wú)損編碼。實(shí)驗(yàn)結(jié)果表明,本文提出的深度網(wǎng)絡(luò)壓縮算法對(duì)近年來(lái)FAST巡天搜索項(xiàng)目脈沖星候選體診斷圖的壓縮性能,峰值信噪比優(yōu)于JPEG算法,與JPEG2000相當(dāng),而結(jié)構(gòu)相似性遠(yuǎn)超過傳統(tǒng)壓縮算法。本文充分利用子圖間特征的顯著差異,制定分區(qū)壓縮策略將圖像分成3類區(qū)域,根據(jù)子圖圖像特征分別使用跳白塊編碼和深度神經(jīng)網(wǎng)絡(luò)壓縮方法,提高了編碼效率。本文利用神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)的熵估計(jì)模型是十分簡(jiǎn)潔易操作的方式,估計(jì)的熵模型是否能夠精準(zhǔn)有效地匹配真實(shí)的潛在分布直接影響損失和碼率,因此,新方法提高熵模型的精準(zhǔn)估計(jì)可以進(jìn)一步改善壓縮性能。2 實(shí)驗(yàn)與結(jié)果分析
2.1 跳白塊編碼過程
2.2 深度網(wǎng)絡(luò)模型結(jié)構(gòu)
2.3 實(shí)驗(yàn)結(jié)果與分析
3 總 結(jié)
——編碼器