基于AVS標準的熵解碼器設計*

2010-05-18 07:28趙龍輝陳新華任懷魯

網(wǎng)絡安全與數(shù)據(jù)管理 2010年20期

趙龍輝,陳新華,任懷魯

(山東科技大學,山東青島 266510)

AVS標準是《信息技術(shù) 先進音視頻編碼》系列標準的簡稱，是我國具備自主知識產(chǎn)權(quán)的第二代信源編碼標準。AVS標準包括系統(tǒng)、視頻、音頻、數(shù)字版權(quán)管理等四個主要技術(shù)標準和一致性測試等支撐標準。

目前音視頻產(chǎn)業(yè)可以選擇的信源編碼標準有四個：MPEG-2、MPEG-4、AVC(也稱 JVT、H.264)和 AVS。從制訂者分，前三個標準是由MPEG專家組完成的，第四個是我國自主制定的。從發(fā)展階段分，MPEG-2是第一代信源標準，其余三個為第二代標準。從主要技術(shù)指標——編碼效率比較，MPEG-4是MPEG-2的1.4倍，AVS和AVC相當，都是MPEG-2的兩倍以上。

AVC標準中，對預測殘差有兩種熵編碼的方式：基于上下文的自適應變長碼（CAVLC）和基于上下文的自適應二進制算數(shù)編碼(CABAC)；對于非預測殘差，采用指數(shù)哥倫布碼或CABAC編碼，視編碼器的設置而定[1]。

AVS標準所用的熵編碼技術(shù)相比于以前有了很多改進，它的語法元素和殘差系數(shù)是由定長碼和指數(shù)哥倫布碼構(gòu)成的，其中指數(shù)哥倫布碼和語法元素之間存在多種映射關(guān)系。

1 AVS標準熵解碼算法描述

在整個AVS視頻的解碼過程中，熵解碼模塊位于系統(tǒng)的最前端，負責從壓縮后的碼流中解析出宏塊頭信息以及量化系數(shù)，供后續(xù)的幀內(nèi)預測模塊和幀間預測模塊使用。而熵解碼模塊又可以大體分為兩個部分：解析K階指數(shù)哥倫布碼部分和解析語法元素部分。

解析K階指數(shù)哥倫布碼時，首先從比特流的當前位置開始尋找第一個非零比特，并將找到的零比特個數(shù)記為leadingZeroBits，然后根據(jù)leadingZeroBits計算Code-Num。用偽代碼描述如下：

由于AVS視頻中所有的語法元素以及經(jīng)過變換和量化的殘差系數(shù)都是以指數(shù)哥倫布碼的形式映射成二進制碼流的，因此在解析出K階指數(shù)哥倫布碼的CodeNum后，下一步就是要還原出各種語法元素和殘差系數(shù)。

在AVS標準中規(guī)定了四種映射方式：ue(v)、se(v)、me(v)和 ce(v)。其中 ue(v)、se(v)和 me(v)所描述的語法元素采用0階的指數(shù)哥倫布碼，ce(v)用來描述殘差系數(shù)，可以采用0階、1階、2階或者3階指數(shù)哥倫布碼。它們的解析過程如下：

圖1 熵解碼器硬件結(jié)構(gòu)圖

ue(v)：無符號直接映射，語法元素的值等于 Code-Num；

se(v)：有符號映射，映射關(guān)系為：當 CodeNum=k時，語法元素值為(-1)k+1×Ceil(k÷2)

me(v)：分為 MbCBP和 MbCBP422兩種模式，分別根據(jù)CodeNum的值,查找相對應的表來得到語法元素的值。

ce(v)：ce(v)描述的語法元素可以采用 0階、1階、2階或3階指數(shù)哥倫布碼進行解析，還有19個相關(guān)的碼表，對于階數(shù)的確定規(guī)則以及碼表的切換規(guī)則，在AVS標準中都有詳細的說明。解析時,首先語法元素trans_coefficient等于CodeNum,如果trans_coefficient小于59,可以根據(jù)trans_coefficient的值查找相關(guān)的碼表得到殘差系數(shù)；如果 trans_coefficient大于等于 59，解析下一個 ce(v)語法元素，得到一個新的 CodeNum，escape_level_diff等于 CodeNum,然后根據(jù)trans_coefficient和escape_level_diff求得殘差系數(shù)[3]。

2 熵解碼器的硬件設計

由于熵解碼器位于整個解碼結(jié)構(gòu)的最前端，所有后續(xù)模塊中需要用到的數(shù)據(jù)都是熵解碼模塊從原始碼流中解析出來的，因此熵解碼器性能的優(yōu)劣直接影響到整個AVS視頻解碼器的性能。

從前面的介紹中可以了解到，經(jīng)過指數(shù)哥倫布編碼后形成的碼流中，每個碼的碼長不固定，而且前后具有很大的相關(guān)性，這樣在解碼時就必須逐位讀取數(shù)據(jù)，解析完一個碼字后才能解析下一個碼字。這種串行解碼的方式嚴重限制了熵解碼器的性能，所以需要找到一種能夠并行解碼的方式。這里的并行解碼并不是指同時對好幾個碼進行解碼，而是針對一個變長碼的多個位來說的。具體來說就是一次讀入N位數(shù)據(jù)，通過比較操作，得到碼長，使得解碼可以在確定的時間長度內(nèi)進行，而不是隨著碼長的不同而變化。顯然，這將提高硬件的復雜度，但是換來了解碼速度的提高[4]。

整個熵解碼器可以分為四個模塊：數(shù)據(jù)準備模塊、解指數(shù)哥倫布碼模塊、語法元素解析模塊和解碼控制模塊。硬件結(jié)構(gòu)如圖1所示。

下面通過分析碼流數(shù)據(jù)的解析過程來逐個說明各個模塊的功能和實現(xiàn)。

2.1 數(shù)據(jù)準備模塊

這個模塊的功能是為后邊的解指數(shù)哥倫布碼模塊準備好未解碼數(shù)據(jù)，要求解指數(shù)哥倫布碼模塊解完一個碼，數(shù)據(jù)準備模塊就要在碼流中將解完的碼移走，并準備好下一個要解的碼字送給下一模塊。硬件結(jié)構(gòu)如圖 2所示。

圖2 數(shù)據(jù)準備模塊結(jié)構(gòu)圖

RegA和RegB是兩個32位的寄存器，其中RegB直接從未解碼碼流中讀取數(shù)據(jù)，RegA則接收RegB中的數(shù)據(jù)，兩個寄存器共同組成barrelshifter的輸入。

barrelshifter是一個64位輸入、32位輸出的暫存器，每次輸出都將剛解完的一個碼字移出，以保證輸出的32位數(shù)據(jù)中最低位為下一個要解碼的碼字的開始。移位的位數(shù)由輸入的地址Addr來決定，即輸出64位輸入的[Addr,Addr+31]位。

當En信號有效時，更新數(shù)據(jù)，將RegB中的數(shù)據(jù)存到RegA中，再從碼流中讀取新的32位數(shù)據(jù)，存到RegB中。其中Addr和En信號由解指數(shù)哥倫布碼模塊給出。

2.2 解指數(shù)哥倫布碼模塊

這個模塊的功能是接收上一模塊準備好的未解碼數(shù)據(jù)，計算出從最低位開始的一個指數(shù)哥倫布碼的CodeNum,并根據(jù)這個碼的碼長算出筒形移位器的移位地址。模塊結(jié)構(gòu)如圖3所示。

圖3 解指數(shù)哥倫布碼模塊結(jié)構(gòu)圖

由于上一個模塊準備好的未解碼碼流是一個以新的指數(shù)哥倫布碼的開始為最低位的32位碼流,因此要計算出這個碼的CodeNum，首先要算出這個碼的碼長，然后在這32位數(shù)據(jù)中截取出這個碼字，才可以計算它的CodeNum。根據(jù)指數(shù)哥倫布碼的結(jié)構(gòu)，碼長與這個碼的前導零個數(shù)M和階數(shù)K有密切關(guān)系，可以總結(jié)出一個公式：CodeL=2×M+K+1。碼長計算模塊就是根據(jù)這個原理來計算碼長的，首先通過一組比較器檢測從最低位開始有幾個零，然后根據(jù)上述公式得到碼長。對于階數(shù)K，解 ue(v)、me(v)和 se(v)語法元素時，階數(shù) K 為 0。解ce(v)時，當前解碼碼字的階數(shù)在解碼上一個碼字時可以得出。

累加器模塊是一個模為32的加法器，將碼長計算模塊計算出來的碼長CodeL累加到上一次的移位地址上，得到一個新的移位地址，筒形移位器根據(jù)這個新的地址，將本次解碼的碼字移出，準備好下一個未解碼碼流。En為進位輸出，當累加器的En為1時，說明已經(jīng)解完了32位數(shù)據(jù)，這時需要對RegA和RegB進行數(shù)據(jù)更新。

計算碼字的CodeNum時，首先根據(jù)碼長計算模塊算出來的碼字長度，從上一模塊準備好的未解碼碼流中把本次要解碼的碼字截取出來，拋棄無用的位，然后再根據(jù)公式CodeNum=2leadingZeroBits+k-2k+read_bits(leadingZeroBits+k)計算這個碼字的CodeNum。顯然這個公式太過復雜，不適合直接硬件化，但是經(jīng)過分析公式以及指數(shù)哥倫布碼的結(jié)構(gòu)，可以改造一下公式。因為指數(shù)哥倫布碼的結(jié)構(gòu)為前面M個前導0，中間一個 1，后面 M+K位數(shù)據(jù)組成，而 read_bits(leadingZeroBits+k)即為后面 M+K位數(shù)據(jù)的碼字值，2leadingZeroBits+k正好為中間那個1的碼字值，所以一個碼字的CodeNum就等于這個碼字的碼字值減去2k，這樣對CodeNum的計算就大大簡化了。

2.3 語法元素解析模塊

顧名思義，這個模塊就是最終解析出語法元素含義的模塊，它接收上一模塊計算出來的CodeNum值，然后主要通過查表的方式解析出這個碼字所代表的語法元素含義，結(jié)構(gòu)如圖 4所示。

這里主要介紹下最復雜的ce(v)部分的解析過程。

逃逸碼判斷模塊：在解析 ce(v)語法元素時，首先要判斷是否為逃逸碼，即CodeNum＜59時，按照正常 ce(v)語法元素解析規(guī)則解析；CodeNum≥59時，下一碼字為逃逸碼，則按照逃逸碼解析規(guī)則解析。

ce(v)語法元素解析模塊：正常 ce(v)語法元素的解析過程為：以CodeNum的值為索引，查找當前碼表，得到（run、level），然后根據(jù)標準中的碼表切換規(guī)則進行碼表切換，并得到下一碼字的階數(shù)K。解析逃逸碼的解析過程為:令transcoefficient等于CodeNum,得到run=(transcoefficient-59)/2。以當前碼表為索引，查表得到對應的MaxRun，如果 run＞MaxRun，則 RefAbslevel=1，否則以 run為索引查當前碼表，得到RefAbslevel。解析下一個語法元素，得到一個新的Codenum，escape_level_diff等于Code-Num。如果 transcoefficient為奇數(shù)，則 level等于-(RefAbslevel+escape_level_diff);如果transcoefficient為偶數(shù)，則level等于(RefAbslevel+escape_level_diff)。最后再按照標準中的碼表切換規(guī)則進行碼表切換，等待解析下一個語法元素。

3 測試與驗證

將本文提出的熵解碼器結(jié)構(gòu)設計用Verilog HDL實現(xiàn)，用ModelSim在綜合前進行仿真，仿真模型如圖5所示。AVS標準參考軟件產(chǎn)生測試碼流數(shù)據(jù)，將測試碼流數(shù)據(jù)輸入硬件描述語言仿真模型，然后將輸出數(shù)據(jù)與標準輸出對比，實現(xiàn)仿真功能。經(jīng)過測試，硬件熵解碼后的數(shù)據(jù)與軟件熵解碼后的數(shù)據(jù)完全一致。

圖5 仿真模型

整個電路使用Altera的QuartusII 9.0軟件進行綜合，使用的LE總數(shù)為1 906個。變字長解碼器模塊是AVS解碼器的一部分，綜合后與其他部分集成,通過了FPGA驗證，采用 CycloneII系列的 EP2C35型 FPGA,其最高頻率能達到94 MHz,可以實現(xiàn)AVS高清晰度視頻的實時解碼。圖6為ce(v)解碼模塊的功能仿真結(jié)果圖。

本文提出了一種基于AVS標準的熵解碼器的硬件結(jié)構(gòu),從總體設計到各個模塊的設計都使用了流水線、并行處理、可重用設計等硬件設計的思想和方法；采用Verilog硬件描述語言實現(xiàn),并通過FPGA進行了驗證，達到了標準清晰度實時解碼的要求。

[1]王忠平.AVS和H.264雙模解碼器SoC混成架構(gòu)的設計與研究[D].上海：上海交通大學，2008.

[2]AVS聯(lián)合工作組.信息技術(shù)：先進音視頻編碼第2部分：視頻.2006.

[3]徐龍,鄧磊.AVS熵解碼器的VLSI設計[J].計算機研究與發(fā)展，2009.

[4]張楚.AVS和H.264雙標準可變長解碼器設計[D].西安:西北工業(yè)大學，2007.