雍延梅,鄭陶冶
(中國電子科技集團(tuán)公司第38 研究所,合肥 230088)
由于合成孔徑雷達(dá)(SAR)具有全天時(shí)、全天候的工作能力,使它成為一種在星載和機(jī)載遙感應(yīng)用中非常有效的科學(xué)設(shè)備,越來越得到世界各國的重視。隨著SAR 技術(shù)向多波段、多極化、高分辨方向發(fā)展,從而使星載SAR 的原始數(shù)據(jù)量變得越來越大。由于受到星上設(shè)備的數(shù)據(jù)處理能力和下行鏈路帶寬的制約,衛(wèi)星的數(shù)據(jù)傳輸和存儲(chǔ)系統(tǒng)的能力是有限的。雖然采取降低雷達(dá)PRF、降低系統(tǒng)帶寬、減少A/D 變換器的位數(shù)等方法可以降低數(shù)據(jù)率,但都會(huì)使系統(tǒng)性能惡化以至不能滿足實(shí)際應(yīng)用的需要。因此必須采取一種能提供較高壓縮比和較低編碼/解碼誤差的高效SAR 原始數(shù)據(jù)壓縮算法,對(duì)SAR的原始數(shù)據(jù)進(jìn)行有效的壓縮處理。
對(duì)BAQ、VQ 和TCVQ 三種算法加以研究,給出了BAQ、VQ 和TCVQ 算法的概述及相應(yīng)的仿真結(jié)果,最后對(duì)以上算法的綜合性能做一個(gè)總結(jié)。
在合成孔徑雷達(dá)中,雷達(dá)接收信號(hào)的幅度滿足瑞利分布,相位是0 ~2π 弧度之間的均勻分布。當(dāng)回波信號(hào)經(jīng)下變頻電路和正交解調(diào)電路解調(diào)變?yōu)橄嗷フ坏腎 和Q 兩路基帶信號(hào)時(shí),兩路信號(hào)為相互獨(dú)立的,并在距離向和方位向具有緩變方差特性的零均值高斯分布信號(hào)??紤]到在方位向或距離向的一小段時(shí)間間隔內(nèi),信號(hào)的動(dòng)態(tài)范圍遠(yuǎn)小于整個(gè)回波數(shù)據(jù)集的動(dòng)態(tài)范圍,所以可以把具有緩慢時(shí)變方差特性的整個(gè)回波數(shù)據(jù)集沿方位和距離向分成若干個(gè)小塊,從而每一小塊數(shù)據(jù)可以認(rèn)為是具有穩(wěn)態(tài)特性的零均值高斯分布,并且其分布可由標(biāo)準(zhǔn)差唯一確定。塊大小的選擇應(yīng)遵循以下原則:塊必須足夠小以保證每一小塊中SAR 數(shù)據(jù)的恒定,同時(shí)塊又必須足夠大以保證能有效估計(jì)出每一塊的σ。以上對(duì)SAR 原始數(shù)據(jù)的分塊處理構(gòu)成了SAR 原始數(shù)據(jù)壓縮的基礎(chǔ)。
數(shù)據(jù)壓縮算法中最早得到實(shí)際應(yīng)用的為分塊自適應(yīng)量化(BAQ)算法[1],其具有計(jì)算簡單、實(shí)施方便的特點(diǎn)。該算法已成功地應(yīng)用于Magellan 任務(wù)和SIR-C 任務(wù),分別實(shí)現(xiàn)了8 位到2 位和8 位到4 位的數(shù)據(jù)壓縮。為了進(jìn)一步提高數(shù)據(jù)的壓縮比和壓縮質(zhì)量,不斷有更多的算法被提出,如基于時(shí)域的矢量量化(VQ)、柵格編碼矢量量化(TCVQ)、Universal TCQ(UTCQ)[2]、變比特率矢量量化(VarVQ),以及基于變換域的FFT-BAQ、DCT-BAQ、WHT-BAQ[3]等,每種方法都有其優(yōu)點(diǎn)和特定的應(yīng)用場合。當(dāng)然,壓縮性能的提高是以計(jì)算量的增大為代價(jià)的。一般來說,基于變換域的算法可以取得更高的壓縮質(zhì)量,但同時(shí)要進(jìn)行大尺寸塊的變換操作,從而導(dǎo)致計(jì)算量的急劇增大,難以用硬件實(shí)時(shí)實(shí)現(xiàn)。考慮到數(shù)據(jù)傳輸?shù)南滦行诺来嬖谛诺涝肼?,變長碼相比于定長碼會(huì)引起更多的信道失真,因此在實(shí)際應(yīng)用時(shí),定長碼具有較強(qiáng)的魯棒性,相對(duì)于信道噪聲不敏感。
BAQ 算法采用一個(gè)自適應(yīng)量化器,根據(jù)估計(jì)出的每一個(gè)小塊輸入數(shù)據(jù)的標(biāo)準(zhǔn)差來控制最優(yōu)量化器以實(shí)現(xiàn)對(duì)輸入信號(hào)的有效壓縮,如圖1 所示。雷達(dá)接收的I和Q 通道模擬信號(hào)先經(jīng)過A/D 變換器轉(zhuǎn)化為每樣本n位(一般為8 位)的數(shù)字信號(hào),然后通過塊自適應(yīng)量化器把每樣本n 位的信號(hào)編碼處理為每樣本m 位的信號(hào),從而實(shí)現(xiàn)原始數(shù)據(jù)壓縮,再把經(jīng)BAQ 壓縮過的數(shù)據(jù)進(jìn)行打包處理,然后下傳到地面或在星上記錄下來。在地面可根據(jù)每一塊數(shù)據(jù)對(duì)應(yīng)的σ,進(jìn)行數(shù)據(jù)解碼操作以恢復(fù)雷達(dá)原始數(shù)據(jù)。一般地,塊的大小取為32×32 或64×64(方位×距離)。BAQ 編碼原理圖,如圖1 所示。
圖1 BAQ 編碼原理圖
矢量量化(VQ)[4]是標(biāo)量量化的自然推廣,具有比標(biāo)量量化優(yōu)越得多的性能,在圖像壓縮中得到廣泛的重視和應(yīng)用。
維數(shù)為k,尺寸為N 的矢量量化器定義為從k維歐幾里德空間Rk到一包括N 個(gè)輸出點(diǎn)的有限集合C 的映射,即Q:Rk→C,其中C = {y0,y1,…,yN-1},yi∈Rk,i∈Γ ={0,1,…,N -1}。集合C 稱為碼書,其尺寸(大小)為N。碼書的N 個(gè)元素稱為碼字,它們均為Rk中的矢量。
輸入矢量空間Rk通過尺寸為N 的量化器Q后,被分割為N 個(gè)互不重疊的區(qū)域或胞腔,這個(gè)過程稱為輸入矢量空間的劃分。對(duì)i∈Γ,胞腔Ri定義為
根據(jù)胞腔的定義,有
顯然標(biāo)量量化就是矢量量化中矢量維數(shù)為1 的退化形式。VQ 的編碼原理圖,如圖2 所示。
圖2 VQ 編碼原理圖
柵格編碼矢量量化利用卷積編碼使量化矢量之間具有相關(guān)性,并利用信號(hào)空間擴(kuò)展來增大量化信號(hào)間的歐氏距離,從而達(dá)到提高量化增益的目的。在同樣的編碼率下,柵格編碼矢量量化可以取得更優(yōu)于矢量量化的壓縮性能[6~8]。
設(shè)矢量維數(shù)為k,編碼率為R,則對(duì)每一個(gè)矢量,需要的編碼比特位數(shù)為kR。不同于矢量量化方法采用大小為2kR的碼本,然后用長度為kR 的碼字索引代表該矢量,柵格編碼矢量量化方法生成大小為2kR+1的碼本,并將其劃分為四個(gè)子集,設(shè)為D0,D1,D2,D3,其大小均為2kR-1。然后,對(duì)每一個(gè)矢量,搜尋每個(gè)子集中與之歐式距離最小的碼字,得到相應(yīng)的碼字索引,用R -1 位來表示,剩下的1 位用于選擇子集號(hào)。為了得到子集號(hào),采用(2,1,3)卷積碼,其狀態(tài)圖如圖3 所示[9]。
圖3 (2,1,3)卷積碼狀態(tài)圖
定義失真度為所選擇碼字與輸入矢量的歐式距離,設(shè)輸入矢量序列長度為l,目的就是要找到一條最佳路徑,使得整條路徑的總失真度最小。如果每個(gè)節(jié)點(diǎn)均有2m條路徑進(jìn)入和離去(其中m 為大于等于1 的整數(shù)),則共有2ml條路經(jīng)可供選擇。編碼采用維特比算法,搜尋最小失真路徑,從而得到編碼序列。解碼采用相同形式的狀態(tài)圖,由編碼序列卷積輸出得到子集號(hào),結(jié)合子集中的碼字索引,查表得到解碼矢量。TCVQ 的原理圖,如圖4 所示。
圖4 TCVQ 框圖
對(duì)一幅大小為1024×1024 的SAR 原始信號(hào)進(jìn)行壓縮所得到的結(jié)果,見表1。原始信號(hào)每個(gè)采樣點(diǎn)采樣位數(shù)為8 位,編碼率為編碼后每個(gè)采樣點(diǎn)的平均比特?cái)?shù),數(shù)據(jù)塊分塊大小為32×32。從中可以看出,在相同的編碼率之下,VQ 的壓縮效果明顯優(yōu)于BAQ,而TCVQ的性能優(yōu)于VQ。表中為對(duì)應(yīng)不同的壓縮算法和編碼率時(shí)的解壓縮信號(hào)的信噪比。因BAQ 算法的特點(diǎn),只能做整數(shù)級(jí)的編碼,編碼率為1 bit 時(shí),因只有0、1 兩個(gè)數(shù)值,不能保持SAR 數(shù)據(jù)的信息,這里不予考慮。
表1 不同壓縮算法性能對(duì)比
壓縮性能的提高是以計(jì)算量的增大為代價(jià)的。如果將矢量的維數(shù)控制在6 以內(nèi),矢量編碼時(shí)碼字的搜索可以通過查表來完成。TCVQ 相比于VQ,需要做維特比搜索操作,計(jì)算量有比較大的增加。設(shè)分塊大小為N ×N,數(shù)據(jù)壓縮比為4(8 位的采樣數(shù)據(jù)壓縮為2 位),以上算法所需計(jì)算量,見表2,VQ與TCVQ 的碼字搜索可采用查表的方法來完成。
表2 不同算法所需計(jì)算量
由表2 可見,VQ 的計(jì)算量與BAQ 的計(jì)算量大體相當(dāng),TCVQ 計(jì)算量有比較大的增加。
在對(duì)硬件的需求方面,VQ 和TCVQ 因?yàn)橐4娲a書,因此需要額外的ROM 存儲(chǔ)單元,其大小取決于碼書的大小。以實(shí)現(xiàn)8 位壓縮到2 位的VQ 編碼為例,首先進(jìn)行一個(gè)8 位壓縮到4 位的BAQ 編碼,輸入矢量維數(shù)為4,則碼書大小為216,所需要的ROM 存儲(chǔ)單元為64 K,對(duì)系統(tǒng)來說,這并不是多大的負(fù)擔(dān)。TCVQ 編碼因?yàn)橐A? 個(gè)碼書,每個(gè)碼書的大小為相同編碼率的VQ 編碼的一半,所以總的ROM 存儲(chǔ)單元需求是VQ 編碼的兩倍。
BAQ 編碼以首位表示符號(hào)位,即為折疊二進(jìn)制碼(FBC),對(duì)應(yīng)于自然二進(jìn)制碼,當(dāng)信道傳輸中有誤碼時(shí),折疊碼由此而產(chǎn)生的失真誤差功率較小。
VQ 編碼輸出的是輸入矢量對(duì)應(yīng)的碼字索引號(hào),如果信道有噪聲,則索引i 經(jīng)過信道傳輸后可能會(huì)變成j,從而在解壓縮時(shí)會(huì)引起額外的失真。為了減小這種失真,可對(duì)碼字索引重新分配,使得由信道所造成的失真最小。
TCVQ 編碼輸出的是輸入矢量對(duì)應(yīng)的序列號(hào)和碼字索引。對(duì)于碼字索引,同樣可以采取適當(dāng)?shù)拇a字索引分配算法以減小信道所造成的失真;對(duì)于因路徑序列錯(cuò)誤而引起的子集選擇錯(cuò)誤所引起的失真,選擇適當(dāng)?shù)臇鸥裥问揭允咕矸e輸出的錯(cuò)誤限制在有限長度,同時(shí)結(jié)合碼字索引分配算法,在減小因碼字索引錯(cuò)誤而造成的失真的同時(shí),使得不同的子集中相同的碼字索引所對(duì)應(yīng)的碼字之間的歐式距離最小,從而在因路徑序列錯(cuò)誤而導(dǎo)致子集選擇錯(cuò)誤時(shí)所引起的失真盡可能減小。
以上壓縮算法在不同的信道誤比特率時(shí)相應(yīng)的解壓縮信號(hào)信噪比,如圖5 所示。其中VQ 編碼和TCVQ 編碼已經(jīng)過碼字索引優(yōu)化。從中可以看出,當(dāng)信道誤比特率小于0.001 時(shí),信道誤比特率對(duì)解壓縮信號(hào)信噪比的影響很小,同時(shí)相對(duì)于BAQ 編碼,TCVQ 編碼和VQ 編碼對(duì)信道誤比特率較為敏感。
圖5 解壓縮信號(hào)信噪比
未壓縮的原始數(shù)據(jù)和經(jīng)BAQ、VQ 和TCVQ 三種壓縮算法壓縮后的數(shù)據(jù)的成像結(jié)果,如圖6 所示。原始數(shù)據(jù)每個(gè)采樣點(diǎn)采樣位數(shù)為8 位,壓縮后每個(gè)采樣點(diǎn)的比特?cái)?shù)為2 位,數(shù)據(jù)塊分塊大小為32×32。
圖6 同一壓縮比下不同壓縮算法所得數(shù)據(jù)成像結(jié)果
總體來說,相同的編碼率之下,VQ 的壓縮效果明顯優(yōu)于BAQ,而TCVQ 的性能優(yōu)于VQ。針對(duì)VQ算法的編碼特點(diǎn),采取適當(dāng)?shù)拇a字索引分配算法以減小信道所造成的失真;對(duì)于TCVQ 算法,選擇適當(dāng)?shù)木W(wǎng)格形式以使卷積輸出的錯(cuò)誤限制在有限長度。如果通過近似查表完成矢量量化的編碼,考慮到DSP 浮點(diǎn)乘法的實(shí)現(xiàn)代價(jià)與加法相當(dāng),則VQ 的計(jì)算量只是BAQ 的有限倍,算法成熟度高,其硬件實(shí)現(xiàn)的成本也是可以承受的,能夠應(yīng)用于星載SAR 原始數(shù)據(jù)壓縮;隨著VLSI 的飛速發(fā)展及算法成熟度的不斷提高,在硬件允許的情況下,可以應(yīng)用TCVQ 完成星載SAR 原始數(shù)據(jù)的壓縮以取得更優(yōu)的性能。
[1]KWOK R W T K.Johnson.Block Adaptive Quantization of Magellan SAR Data[J]. IEEE Transaction on Geoscience and Remote Sensing,1989,27(2):375-383.
[2]JAMES W O,MICHAEL W M,BOBBY R H,et al.Compression of Synthetic Aperture Radar Video Phase History Data Using Trellis-Coded Quantization Techniques[J].IEEE Transaction on Geoscience and Remote Sensing,1999,37(2):1080-1085.
[3]URSULA BENZ,KLAUS STRODL,ALBERTO MOREIRA.A Comparision of Several Algorithms for SAR Raw Data Compression[J].IEEE Transaction on Geoscience and Remote Sensing,1995,33(5):1266-1276.
[4]孫圣和,陸哲明. 矢量量化及其應(yīng)用[M]. 北京:科學(xué)出版社,2002.
[5]LINDE Y,BUZO A,GRAY R M.An Algorithm for Vector Quantization[J]. IEEE Transaction on Communication,1980,28(1):84-95.
[6]KASNER J H,MARCELLING M W,HUNT B R.Universal Trellis Coded Quantization[J]. IEEE Transaction on Image Processing,1999,8(12):1677-1687.
[7] FISCHER T R,MICHAEL W M,WANG MIN. Trellis-Coded Vector Quantization[J]. IEEE Transaction on Information Theory,1991,37(6):1551-1566.
[8]HONG SHEN WANG,NADER MOAYERI.Trellis Coded Vector Quantization[J]. IEEE Transaction on Communication,1992,40(8):1273-1276.
[9]曹志剛,錢亞生. 現(xiàn)代通信原理[M]. 北京:清華大學(xué)出版社,1992:130-131.