国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

分布式編碼中廣義伽馬分布相關噪聲模型研究

2016-07-18 11:50劉杰平王琴玲何越盛韋崗
通信學報 2016年3期
關鍵詞:伽馬參數(shù)估計解碼

劉杰平,王琴玲,何越盛,韋崗

?

分布式編碼中廣義伽馬分布相關噪聲模型研究

劉杰平,王琴玲,何越盛,韋崗

(華南理工大學電子與信息學院,廣東廣州 510640)

針對現(xiàn)有相關噪聲模型—Laplacian模型不能精確描述相關噪聲,導致分布式視頻編碼(DVC, distributed video coding)系統(tǒng)的率失真性能不高的問題,提出像素域DVC中廣義伽馬分布相關噪聲模型。首先分析了相關噪聲的統(tǒng)計特性,發(fā)現(xiàn)Laplacian分布的峰值比實際相關噪聲分布的低,然后采用廣義伽馬分布對相關噪聲進行擬合,并給出在線估計廣義伽馬分布參數(shù)的方法。實驗結果表明,提出的模型能較精確地描述相關噪聲,且有效地改善了系統(tǒng)的率失真性能,并減少了解碼端計算復雜度。

分布式視頻編碼;相關噪聲模型;廣義伽馬分布;Laplacian分布

1 引言

傳統(tǒng)的視頻編碼標準,如MPEG和H.264/AVC 等,都采用運動估計與運動補償技術消除視頻中的時間冗余,盡管它們都有較高的壓縮效率,但編碼器復雜度非常高。而越來越多的新型視頻應用(如無線視頻、移動攝像電話等)的編碼設備比較簡單,電源、功耗和運算資源受限,這就要求視頻編碼器必須具有低功耗和低運算復雜度的特點。基于Slepian-Wolf理論[1]和Wyner-Ziv理論[2],DVC[3~8]將復雜的運動估計與運動補償技術移到解碼端,具有低編碼復雜度的特點,能很好地適用于“上行(up-link)”的新型視頻應用。典型的像素域DVC系統(tǒng)如圖1所示,將輸入的視頻序列分為關鍵幀(奇數(shù)幀)和WZ幀(偶數(shù)幀),對關鍵幀采用傳統(tǒng)的幀內(nèi)編解碼方式,在解碼端關鍵幀獨立解碼后,除直接輸出外,還通過幀內(nèi)插值生成解碼WZ幀時所需要的邊信息;對WZ幀量化之后進行位平面抽取,然后由Slepian-Wolf編碼器對上述位平面的比特流進行編碼,得到的校驗比特傳輸?shù)降兔芏壤鄯e校驗碼(LDPCA, low-density parity-check accumulate)譯碼器。解碼端為了有效地利用校驗比特糾正邊信息的估計偏差,需要借助原始的WZ 幀與邊信息之間的殘差信息,即相關噪聲。在實際應用中,解碼端無法獲得原始的WZ幀,尋求殘差所服從的概率分布的過程就是相關噪聲建模。相關噪聲模型與殘差的概率分布越接近,且LDPCA的糾錯性能越好,編碼端需要傳輸?shù)絃DPCA譯碼器的校驗位就越少,系統(tǒng)碼率越低,壓縮率越高,同時還可以減少LDPCA迭代譯碼的時間。因此,對相關噪聲的準確建模是DVC系統(tǒng)的關鍵技術之一。

由于解碼端不可能得到原始WZ幀,因此,利用解碼端所估計的邊信息與原始WZ幀之間的相關噪聲離線估計相關噪聲模型參數(shù)不滿足實際應用。目前,許多研究文獻通常利用前后向運動補償幀差在線估計相關噪聲模型參數(shù),且認為相關噪聲模型近似滿足Laplacian分布[7~14],相關的具體研究主要集中在精確的Laplacian模型參數(shù)的估計,Brites等[7]針對像素域DVC提出了幀級、塊級及像素級3種粒度的參數(shù)估計算法,改善了系統(tǒng)整體編碼效率。Deligiannis等[8,9]研究了像素域DVC的相關噪聲模型與邊信息相關性,指出相關噪聲的分布與邊信息的改變密切相關;針對分層Wyner-Ziv編碼系統(tǒng),提出最大似然Laplacian參數(shù)估計方法。王鳳琴等[10]發(fā)現(xiàn)殘差變換后直流系數(shù)帶統(tǒng)計分布相比零均值Laplacian分布存在一定偏差,且系數(shù)帶的相關噪聲分布隨時間和空間變換,提出了一種基于變換域的相關噪聲分布模型自適應參數(shù)估計方法,有效提高了編碼效率。房勝等[11]對影響時域相關噪聲的因素進行了研究,提出了一種基于小波變換域的相關噪聲模型,有效提高了DVC系統(tǒng)的率失真性能。Wang等[12]將相關估計嵌入到Slepian-Wolf解碼器,從而保證相關估計動態(tài)地跟蹤邊信息的方差,提出一種自適應的相關估計方法。Fang[13]提出了一種基于滑動窗置信傳播算法,在解碼端同時實現(xiàn)信源重構和相關噪聲估計。楊春玲等[14]針對子帶級Laplacian 模型不能準確描述相關噪聲殘差子帶不同區(qū)域的變化特性,以及現(xiàn)有算法未將相鄰子帶之間關系利用起來,提出了基于改進FCM 聚類的噪聲模型估計方法。上述研究主要集中在精確的Laplacian分布的參數(shù)估計方面,然而,由于視頻信息固有的非平穩(wěn)特性和解碼端不能獲取當前幀信息等原因,相關噪聲呈現(xiàn)非平穩(wěn)特性。Laplacian不能反映所有的視頻運動,許多學者研究了相關噪聲特性,提出了新的相關噪聲模型。Westerlaken等[15]根據(jù)幀間運動劇烈程度的不同,設定閾值,超過閾值的區(qū)域為沖突區(qū)域,相關噪聲模型采用均勻分布,低于閾值的區(qū)域為非沖突區(qū)域,相關噪聲模型采用Laplacian分布,取得了較好的效果。Maugey等[16]采用冪指數(shù)分布,本文稱為廣義高斯分布(GGD, generalized Gaussian distribution),對相關噪聲建模,實驗結果表明,率失真性能有所提高,在某些情況下在線冪指數(shù)分布參數(shù)估計甚至比離線拉普拉斯分布參數(shù)估計效果更好。尹明等[17]研究了不同運動類型視頻序列的原始幀與相應邊信息之間噪聲系數(shù)的分布情況,發(fā)現(xiàn)相關噪聲信息的分布不滿足某種單峰分布,提出高斯混合相關噪聲模型,有效改善了率失真性能。本文研究發(fā)現(xiàn),Laplacian分布與實際相關噪聲分布擬合時,在相關噪聲零值附近的峰值過低,且在尾部收斂比較緩慢,有較嚴重的拖尾現(xiàn)象;GGD與實際相關噪聲分布擬合時,零值附近具有很高的尖峰;而廣義伽馬(GGA, generalized Gamma)分布擬合相關噪聲時,零值附近不存在很高的尖峰,又無嚴重的拖尾現(xiàn)象,能很好地擬合實際噪聲分布,顯示出廣義伽馬分布比Laplacian分布和GGD更強的擬合相關噪聲的能力。因此,本文提出像素域DVC中廣義伽馬分布相關噪聲模型,采用廣義伽馬分布對像素域DVC中的相關噪聲進行建模,提高了DVC系統(tǒng)的率失真性能,降低了解碼的計算復雜度。

2 Laplacian分布與GGD相關噪聲模型

在像素域DVC系統(tǒng)中,原始WZ幀與邊信息間的殘差稱為相關噪聲,該相關噪聲分布模型常用概率密度函數(shù)描述。

GGD的概率密度函數(shù)為

3 廣義伽馬分布相關噪聲模型

廣義伽馬分布具有高度的靈活性和很強的信號擬合能力,因此受到廣泛關注和研究,并應用于很多領域,但目前還沒有學者將其應用于DVC系統(tǒng)。

3.1 廣義伽馬分布

廣義伽馬分布的概率密度函數(shù)為

3.2 廣義伽馬分布相關噪聲模型參數(shù)估計

從實際應用考慮,解碼端無法獲得原始WZ幀,在線估計相關噪聲模型參數(shù)時,本文采用與文獻[7, 8, 10, 17]一樣的方法,利用前后運動補償幀的殘差對相關噪聲建模,其中,表示像素的位置、和分別表示前后向運動補償幀、和分別表示前后向運動矢量。假設殘差服從廣義伽馬分布,當時,零值樣本會導致式(3)數(shù)值溢出。因此,在進行廣義伽馬分布參數(shù)估計時,需要去除殘差中所有的零值樣本,對于8 bit量化的圖像,殘差的可能取值為[?255, 255],則式(3)可以寫成

可以得到

(5)

本文廣義伽馬分布的參數(shù)估計方法采用最大似然估計法[18],具體步驟如下。

(7)

(9)

3) 解似然方程組。采用Root Isolation算法[19]求解可以得到組似然估計參數(shù)組()。

4 仿真實驗

4.1 相關噪聲擬合實驗

為了比較Laplacian分布、GGD和廣義伽馬分布擬合相關噪聲的性能,實驗對Foreman、Soccer、Hall和Mother 4個視頻序列前100幀,各隨機抽取15幀(共60幀),分別進行卡方擬合檢驗。顯著性水平分別為0.01、0.05、0.10和0.25情況下的卡方擬合檢驗的接受率(擬合檢驗結果為接受的幀的數(shù)目與擬合檢驗的總幀數(shù)之比)如表1所示,表中Lap、GGD和GGA分別表示Laplacian分布、GGD和廣義伽馬分布的卡方擬合檢驗結果,從表1可以看出,對于4種顯著性水平, GGA分布的接受率都高于GGD和Laplacian分布。在顯著性水平0.05下,卡方擬合檢驗的結果是:服從Laplacian分布、GGD和廣義伽馬分布的分別有34幀、52幀和60幀。可見,與Laplacian分布和GGD的卡方擬合檢驗比較,殘差的分布更好地服從廣義伽馬分布,或者說廣義伽馬分布對殘差的擬合能力優(yōu)于Laplacian分布和GGD,這與3.1節(jié)廣義伽馬分布的理論特性是一致的。圖2所示是上述實驗中4個視頻序列某幀的擬合結果。

表1 不同顯著性水平下相關噪聲卡方擬合檢驗接受率

圖2中“Histogram”表示實際相關噪聲的概率分布,“Lap”、“GGD”和“GGA”分別表示Laplacian分布、GGD和廣義伽馬分布對相關噪聲的擬合。從圖2可見,Laplacian分布與實際相關噪聲分布比較,尾部收斂緩慢,有比較嚴重的拖尾現(xiàn)象,且峰值低于實際相關噪聲分布,因此Laplacian分布與實際相關噪聲分布存在較大差距;GGD與實際相關噪聲分布相比,大多數(shù)部分能很好地擬合實際相關噪聲分布,顯示出GGD比Laplacian分布的擬合能力更強,但在零值附近GGD比實際噪聲有更高的尖峰;廣義伽馬分布與實際相關噪聲分布比較,不僅多數(shù)部分能很好地擬合實際相關噪聲分布,而且,在零值附近也不存在很高的尖峰,表現(xiàn)出比Laplacian分布和GGD更強的擬合相關噪聲的能力。

4.2 DVC系統(tǒng)率失真性能實驗結果與分析

為了驗證本文提出的廣義伽馬分布相關噪聲模型對DVC系統(tǒng)率失真性能的影響,采用圖1的DVC系統(tǒng)進行仿真實驗,將其與文獻[7] Laplacian分布和文獻[16]GGD相關噪聲模型進行比較,實驗結果中分別用“GGA”、“Lap”和“GGD”表示。實驗用Foreman、Hall、Soccer和Mother 4個QCIF格式,長度為101幀的視頻序列;幀組長度GOP為2,奇數(shù)幀為關鍵幀,偶數(shù)幀為WZ幀;幀率為30 Hz;邊信息的生成采用Ascenso等[20]提出的空域平滑內(nèi)插算法;殘差幀為前后向運動補償幀差;實驗針對視頻序列的亮度分量進行,且只計算WZ幀的平均碼率和平均峰值信噪比PSNR。

圖3給出像素域Wyner-Ziv系統(tǒng)中相關噪聲模型分別采用Laplacian分布、GGD和廣義伽馬分布時系統(tǒng)的率失真性能。對于每個視頻序列,圖3中的零碼率率失真點是編碼端不對WZ幀進行編碼時邊信息的PSNR、非零碼率的率失真點與WZ幀解碼的最高位平面數(shù){1,2,3,4}相對應,即對應著解碼位平面數(shù)從少到多、壓縮率由大到小的情況。

從圖3可見,與Laplacian分布和GGD相關噪聲模型相比,在相同PSNR的情況下,對于同一視頻序列,本文提出的廣義伽馬分布相關噪聲模型不同程度降低了系統(tǒng)的編碼碼率,改善了率失真性能,且低碼率比高碼率時率失真性能改善更顯著,從表2可見,對于Mother序列,解碼平面數(shù)=1時,本文的廣義伽馬模型比Laplacian分布和GGD模型的碼率分別降低41.55%和21.56%;解碼平面數(shù)=4時,本文的模型比Laplacian分布和GGD模型的碼率分別降低23.91%和17.22%。在相同碼率情況下,隨著碼率增大,PSNR增益越大。此外,對于不同運動程度的視頻序列,本文的廣義伽馬模型對系統(tǒng)率失真性能改善的程度不同,從表2可知,解碼所有4個位平面,對于運動相對劇烈的Soccer序列,本文模型相對Laplacian分布和GGD模型的碼率平均降低49.13%和31.41%;而對于運動相對緩慢的Mother序列,平均降低31.76%和19.46%。因此,對運動劇烈的序列,本文模型對系統(tǒng)率失真性能改善更顯著。其原因是運動緩慢的序列,相關噪聲的非平穩(wěn)性較小,對噪聲模型的依賴相對較??;運動相對劇烈的視頻序列,相關噪聲的非平穩(wěn)性較大,對噪聲模型的依賴也相對較大。

在模型的復雜度方面,圖1中DVC系統(tǒng)的解碼計算量主要集中在邊信息生成和LDPCA迭代譯碼,雖然廣義伽馬模型參數(shù)的估計相對復雜,但采用了最大似然參數(shù)估計方法,使模型參數(shù)估計的計算量增加不大,而且,由于廣義伽馬模型能更精確地描述相關噪聲,LDPCA譯碼器只需較少的校驗位和迭代次數(shù)就可以成功譯碼,顯著地節(jié)省了迭代譯碼的時間。與Laplacian分布和GGD模型相比,表3給出了采用本文廣義伽馬模型的DVC系統(tǒng)解碼時間的節(jié)省率,從表3可見,對不同視頻序列,采用廣義伽馬模型的系統(tǒng)解碼時間都有不同程度的減少,與Laplacian和GGD模型相比,解碼時間最少分別減少38.02%和22.24%、最多分別減少53.57%和26.85%。

表2 3種相關噪聲模型在線率失真性能的比較結果

表3 采用GGA模型系統(tǒng)解碼時間的節(jié)省率

5 結束語

為了提高DVC系統(tǒng)的率失真性能,針對現(xiàn)有Laplacian相關噪聲模型不能精確地描述相關噪聲問題,提出像素域DVC中廣義伽馬分布相關噪聲模型。本文研究了不同運動程度視頻序列相關噪聲的統(tǒng)計特性,分別用Laplacian分布、GGD和廣義伽馬分布擬合相關噪聲,發(fā)現(xiàn)廣義伽馬分布擬合相關噪聲的能力相對最強;并以前后運動補償幀差近似為實際相關噪聲、采用最大似然法在線估計廣義伽馬模型的參數(shù)。仿真實驗結果表明,提出的廣義伽馬相關噪聲模型獲得的系統(tǒng)率失真性能整體優(yōu)于Laplacian分布和GGD模型的DVC系統(tǒng),且因廣義伽馬分布對相關噪聲模型較精確地描述,顯著減少了LDPCA迭代譯碼的時間,從而有效減少了DVC系統(tǒng)解碼端的計算復雜度。

[1] SLEPIAN J D, WOLF J K. Noiseless coding of correlated information sources[J]. IEEE Transactions on Information Theory, 1973, 19(4): 471-480.

[2] WYNER A, ZIV J. The rate-distortion function for source coding with side information at the decoder[J]. IEEE Transactions on Information Theory, 1976, 22(1): 1-10.

[3] AARON A, ZHANG R, GIROD B. Wyner-Ziv coding of motion video[C]//Asilomar Conference on Signals, Systems and Computers. Pacific Grove, CA, USA, IEEE, c2002: 240-244.

[4] WANG A H, ZHAO Y, BAI H H. Robust multiple description distributed video coding using optimized zero-padding[J]. Science in China Series F: Information Sciences, 2009, 52(2): 206-214.

[5] ABOU-ELAILAH A, DUFAUX F, FARAH J, et al. Fusion of global and local motion estimation using foreground objects for distributed video coding[J].IEEE Transactions on Circuits and Systems for Video Technology, 2014,25(6):973-987.

[6] SONG X D, PENG X L, XU J Z, et al. Cloud-based distributed image coding[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2015, 25(12):1.

[7] BRITES C, PEREIRA F. Correlation noise modeling for efficient pixel and transform domain Wyner-Ziv video coding[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2008, 18(9): 1177-1190.

[8] DELIGIANNIS N, MUNTEANU A, CLERCKX T, et al. Correlation channel estimation in pixel-domain distributed video coding[C]//Image Analysis for Multimedia Interactive Services. London, UK, c2009: 93-96.

[9] DELIGIANNIS N, MUNTEANU A, WANG S, et al.Maximum likelihood Laplacian correlation channel estimation in layered Wyner-Ziv coding[J]. IEEE Transactions on Signal Processing, 2014, 62(4): 892-904.

[10] 王鳳琴, 樊養(yǎng)余, 趙炯, 等. 基于變換域Wyner-Ziv 視頻編碼的相關噪聲模型[J]. 數(shù)據(jù)采集與處理, 2009, 24(5): 609-614.

WANG F Q, FAN Y Y, ZHAO J, et al. Correlation noise model for transform domain WynerZiv video coding[J]. Journal of Data Acquisition & Processing,2009, 24(5): 609-614.

[11] 房勝, 李哲,梁永全, 等. 分布式視頻編碼虛擬依賴信道模型研究[J]. 計算機學報, 2009, 32(7):1404-1412.

FANG S, LI Z, LIANG Y Q, et al. Research of the virtual dependency channel in distributed video coding[J]. Chinese Journal of Computers, 2009, 32(7):1404-1412.

[12] WANG S, CUI L J, STANKOVI′C L, et al. Adaptive correlation estimation with particle filtering for distributed video coding[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2012, 22(5): 649-658.

[13] FANG Y. Asymmetric Slepian-Wolf coding of nonstationarily- correlated-ary sources with sliding-window belief propagation[J]. IEEE Transactions on Communications, 2013, 61(12): 5114-5124.

[14] 楊春玲, 吳娟. 分布式視頻編碼中基于改進FCM聚類的相關噪聲模型估計[J]. 中國圖象圖形學報, 2014, 19(2): 0185-0193.

YANG C L, WU J. Correlation noise modeling based on improved fuzzy-means clustering in distributed video coding[J]. Journal of Image and Graphics, 2014, 19(2): 0185-0193.

[15] WESTERLAKEN R P, GUNNEWIEK R K, LAGENDIJK R L. The role of the virtual channel in distributed source coding of video[C]//IEEE International Conference on Image Processing. Genoa, Italy, c2005: 581-584.

[16] MAUGEY T, GAUTHIER J, PESQUET-POPESCU B, et al. Using an exponential power model for Wyner-Ziv video coding[C]//IEEE International Conference on Acoustics, Speech and Signal Processing. Dallax Texas. c2010: 2338-2341.

[17] 尹明, 蔡述庭, 謝云. 基于高斯混合模型的Wyner-Ziv視頻編碼[J]. 計算機學報, 2012, 35(1): 173-182.

YIN M, CAI S T, XIE Y. Wyner-Ziv video coding based on Gaussian mixture mode[J]. Chinese Journal of Computers, 2012, 35(1): 173-182.

[18] WINGO D R. Computing maximum-likelihood parameter estimates of the generalized Gamma distribution by numerical root isolation[J]. IEEE Transactions on Reliability, 1987, R-36(5): 586-590.

[19] JONES B, WALLER W G, FELDMAN A. Root isolation using function values[J]. BIT Numerical Mathematics, 1978, 18(3): 311-319.

[20] ASCENSO J, BRITES C, PEREIRA F. Improving frame interpolation with spatial motion smoothing for pixel domain distributed video coding[C]//5th EURASIP Conference on Speech and Image Processing, Multimedia Communications and Services. Smolenice, Slovak Republic: EURASIP, c2005: 593-598.

Research on correlation noise modeling of a generalized Gamma distribution in distributed coding

LIU Jie-ping, WANG Qin-ling, HE Yue-sheng, WEI Gang

(School of Electronic and Information Engineering, South China University of Technology, Guangzhou 510640, China)

Due to the inaccuracy of modeling the correlated noise (CN)with Laplacian distribution, the rate-distortion performance of DVC is relatively low. CN modeling via generalized Gamma (GGA)distribution was proposed for pixel-domain DVC. Statistical features of the CN modeling were analyzed. It was found that Laplacian distribution peak was lower than actual CN distribution. GGA distribution was exploited to fit CN and the GGA distribution parameters were estimated online. The simulation results indicate that the proposed model can more accurately reflect the statistics features of CN, improve rate distortion performance, and reduce computation complexity.

distributed video coding, correlation noise model, generalized Gamma distribution, Laplacian distribution

TN919.8

A

10.11959/j.issn.1000-436x.2016050

2015-01-15;

2016-01-06

國家自然科學基金資助項目(No. 61327005);國家工程技術研究中心基金資助項目(No. 2013FU125X02)

The National Natural Science Foundation of China (No. 61327005), The National Engineering Technology Research Center for Mobile Ultrasonic Detection(No. 2013FU125X02)

劉杰平(1961-),女,湖南新化人,博士,華南理工大學副教授、碩士生導師,主要研究方向為圖像/視頻信號處理、無線視頻傳輸。

王琴玲(1991-),女,湖南邵陽人,華南理工大學碩士生,主要研究方向為視頻編碼。

何越盛(1988-),男,廣西欽州人,華南理工大學碩士生,主要研究方向為視頻編碼。

韋崗(1963-),男,廣西賓陽人,博士,華南理工大學教授、博士生導師,主要研究方向為通信、信息處理理論與技術。

猜你喜歡
伽馬參數(shù)估計解碼
《解碼萬噸站》
基于新型DFrFT的LFM信號參數(shù)估計算法
誤差分布未知下時空模型的自適應非參數(shù)估計
中子伽馬曲線受到自然伽馬污染影響分析及消除原理
一種GTD模型參數(shù)估計的改進2D-TLS-ESPRIT算法
解碼eUCP2.0
三大抽樣分布的理解與具體性質
NAD C368解碼/放大器一體機
Quad(國都)Vena解碼/放大器一體機
Understanding Gamma 充分理解伽馬