于桐,郭利,王威澄
(1.陸軍工程大學(xué)石家莊校區(qū),河北石家莊,050003;2.武裝警察部隊(duì)特種警察學(xué)院,天津,102200)
傳統(tǒng)的野外條件下的裝備維修搶修,對一線維修人員的素質(zhì)要求極高,涉及復(fù)雜系統(tǒng)維護(hù)時(shí),需要后方專家技術(shù)人員依據(jù)現(xiàn)場的視頻圖像,對裝備現(xiàn)場的維修人員進(jìn)行技術(shù)指導(dǎo),但野外條件信號(hào)穩(wěn)定度差,傳輸帶寬小,傳輸效率低,數(shù)據(jù)的穩(wěn)定傳輸有限制,對數(shù)據(jù)壓縮效率提出更高要求,支持系統(tǒng)需要使用射頻(RF)天線將其傳輸?shù)胶蠖嗽品?wù)器中,而傳輸所有RGB 視頻流數(shù)據(jù)信息消耗的功率占總功率的絕大多數(shù),超過60%的功率消耗于射頻天線傳輸數(shù)據(jù)中。
傳統(tǒng)的壓縮算法大多通過圖像頻域或空域[1,2]的各種屬性進(jìn)行壓縮,陳曦在[3]中,提出了基于離散余弦變換(DCT)圖像壓縮算法,其對像素塊適用性較好,但DCT 的固有性質(zhì)破壞了圖像質(zhì)量,使色彩再現(xiàn)變得困難。Kasmeera等在[4]中提出了一種在隸屬度數(shù)據(jù)和霍夫曼編碼的幫助下壓縮加密數(shù)據(jù)的方法,對靜態(tài)JPEG 圖像,壓縮比率較傳統(tǒng)方法更高。Ranjan 在[5]中,提出了一種基于DWT 和熵編碼器的規(guī)范霍夫曼編碼方式,通過標(biāo)準(zhǔn)閾值控制編碼使壓縮體積更小,獲得的碼本尺寸較傳統(tǒng)霍夫曼編碼更小。文獻(xiàn)[6,7]中設(shè)計(jì)了基于具有Hexadata 編碼和算術(shù)編碼的兩級(jí)DCT的圖像壓縮方法,提出的Hexadata 壓縮算法通過減少高頻矩陣中的系數(shù)來提高壓縮效率。
但這些方法的在特定場景下壓縮效率仍不盡如人意,需要開發(fā)新的圖像壓縮方法,為維修輔助設(shè)備增加額外的功能和更長時(shí)間的續(xù)航。
本文中提出了一種針對裝備維修現(xiàn)場的圖像特征特點(diǎn)進(jìn)行優(yōu)化的壓縮方法,使用本文方法可獲得更高的壓縮效率。裝備維修現(xiàn)場圖像與常規(guī)圖像有明顯區(qū)別,具體體現(xiàn)在色彩分布均勻,分布結(jié)構(gòu)具有規(guī)律性。按照傳統(tǒng)的視頻編碼方式,裝備維修現(xiàn)場圖像會(huì)產(chǎn)生大量冗余信息,極為影響壓縮效率,本文使用的圖像壓縮方法如圖1 所示。
圖1 圖像壓縮重構(gòu)方法
方法主體分為兩步:
第一步:顏色空間轉(zhuǎn)換,將圖像從RGB 色彩空間轉(zhuǎn)換至YUV 色彩空間。
第二步:DPCM 編碼,通過差分脈沖編碼來減少數(shù)據(jù)維度,獲得更高的壓縮效率。
由于在維修現(xiàn)場,鏡頭轉(zhuǎn)換基本保持緩慢平穩(wěn),相鄰幀的色彩通道分布具有相似性,選取連續(xù)200 張視頻幀圖像,部分圖像如圖2 所示。
圖2 維修現(xiàn)場圖像
傳統(tǒng)視頻圖像采樣方式均使用基于三維空間的RGB 色彩通道,包括R、G、B 三個(gè)原始光譜分量,這三種原始的混合色基本覆蓋了人類視覺的全部色彩空間。在分析圖像的像素結(jié)構(gòu)式,可以發(fā)現(xiàn),單一色彩通道具有較廣的強(qiáng)度分布,極為影響壓縮效率。相鄰兩幀的圖像像素強(qiáng)度分布直方圖如圖3所示。
圖3 像素強(qiáng)度分布
可以看到,相鄰幀間,圖像的像素分布具有相似性,細(xì)微差別在人眼觀測情況下可忽略不計(jì),兩相鄰幀圖像第500 行的像素值分布如圖4 所示。
圖4 同列像素值
為了獲得更高的壓縮效率,可使用對RGB 轉(zhuǎn)碼YUV 操作,一張圖像尺寸為寬為w,高為h,YUV 顏色空間通過對RGB 空間進(jìn)行計(jì)算獲得色差和亮度分量,Y 為亮度,U 表示色差R-Y 信號(hào),V 表示色差B-Y 信號(hào)。
通過RGB 采用逐點(diǎn)像素r、g、b 通道存儲(chǔ)的存儲(chǔ)方式后,占用w*h*3 內(nèi)存。
使用YUV 逐點(diǎn)記錄亮度Y,奇數(shù)行記錄U,偶數(shù)行記錄V 的方式,共占用w*h*1.5 內(nèi)存,相對于使用傳統(tǒng)編碼方式,yuv 編碼能夠節(jié)約50%數(shù)據(jù)量。
圖5 中所示為兩個(gè)連續(xù)幀的YUV 分量的直方圖??梢杂^察到,由于相鄰幀的Y,U 和V 分量結(jié)構(gòu)具有相似性,故使用合適的編碼方式可節(jié)約更大的空間。
圖5 YUV 強(qiáng)度值
本文使用DPCM 編碼方式,對圖像進(jìn)行再壓縮,DPCM 通過對每個(gè)像素當(dāng)前實(shí)際值和預(yù)測值的差值進(jìn)行提取和編碼,以此消除像素間的冗余,DPCM 原理如圖6。
圖6 DPCM 原理
DPCM 編碼[8]使用線性預(yù)測器,預(yù)測系數(shù)為c,其中為點(diǎn)(i,j)處預(yù)測像素值,s(i,j)為點(diǎn)(i,j)處實(shí)際像素值,m 為預(yù)測級(jí)數(shù),將預(yù)測級(jí)數(shù)m 設(shè)置為4,可得
為求實(shí)際值與預(yù)測值的誤差最小,即求解s(i,j)和的均方差最?。?/p>
最優(yōu)解為系數(shù)方程的解:
c為系數(shù)向量解,Φ 為自相關(guān)系數(shù)矩陣,其中:
自相關(guān)系數(shù)RS(x,y)定義為:
可得均方差最優(yōu)系數(shù)向量解為:
使用兩種經(jīng)典圖像評(píng)價(jià)指標(biāo)峰值信噪比PSNR 和結(jié)構(gòu)相似性SSIM。
(1)峰值信噪比PSNR
由于壓縮重構(gòu)后的圖像相較于原圖像必然存在信息差。評(píng)價(jià)信息質(zhì)量差的公認(rèn)指標(biāo)為PSNR[9],PSNR 越高,壓縮后的信息保持度越高,PSNR 定義為:
其中MSE 為兩張圖像之間的均方誤差,MAX 為圖片像素極值,設(shè)定為255,MSE 定義為:
其中I(i,j)為圖像I 在點(diǎn)(i,j)處像素值,K(i,j)為圖像K 在點(diǎn)(i,j)處像素值。
(2)結(jié)構(gòu)相似度SSIM
SSIM[9]用于度量x 和y 之間的結(jié)構(gòu)信息,SSIM 定義為:
其中μx、μy為x、y 的均值,為x 和y 的方差,σxy為x 和y 的協(xié)方差,c1和c2為常數(shù)。
本文選取了幾種傳統(tǒng)壓縮編碼方式與本文使用的壓縮編碼方式進(jìn)行對比,分別為BMP 編碼、JPEG 編碼、奇異值壓縮(SVD)[10]和本文方法,在lena 標(biāo)準(zhǔn)圖像上對各種方法進(jìn)行測試,圖為各種方法的視覺成像效果,可以看到,本文方法能在節(jié)約大量內(nèi)存情況下,保留更多的圖像細(xì)節(jié),但由于預(yù)測編碼的局限性,誤差不可消除,在眼角處出現(xiàn)了陰影型偽像。
在維修現(xiàn)場的圖像上進(jìn)行測試,圖8 為各種方法的視覺成像效果。
圖8 維修圖像效果
表為各種壓縮編碼方式在維修限產(chǎn)圖像實(shí)驗(yàn)中占用的內(nèi)存、壓縮比以及重構(gòu)效果,本文方法在標(biāo)準(zhǔn)圖像上能獲得更好的壓縮率和重構(gòu)效果。
圖7 各種方法壓縮效果
表1 壓縮率及重構(gòu)效果
本文嘗試了從壓縮算法的改進(jìn)設(shè)計(jì)入手,減少遠(yuǎn)程音視頻系統(tǒng)傳輸?shù)臄?shù)據(jù)量,節(jié)約設(shè)備的整體能源,通過對目標(biāo)圖像像素結(jié)構(gòu)進(jìn)行統(tǒng)計(jì)分析,經(jīng)實(shí)驗(yàn)驗(yàn)證,能夠有效提高壓縮比率,緩解數(shù)據(jù)傳輸壓力,使輔助維修設(shè)備擁有更長的續(xù)航時(shí)間,添加更多功能。