国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

G.729.1語音編碼算法的改進(jìn)及實(shí)現(xiàn)

2010-07-25 00:33劉麗群寧瑞芳
關(guān)鍵詞:編碼器復(fù)雜度時(shí)延

劉麗群,黃 冰,寧瑞芳

(桂林電子科技大學(xué) 信息與通信學(xué)院,廣西 桂林 541004)

G.729.1是基于分裂帶寬的編碼器,具有靈活的結(jié)構(gòu),通過利用正交鏡像濾波器組分析和合成濾波器組不僅能夠處理采樣率為16 kHz的輸入語音,還可以處理8 kHz采樣率的輸入語音,它是一個基于G.729的帶寬擴(kuò)展(50~7 000 Hz)的、8~32 Kb/s可分級編碼器。 由編碼器產(chǎn)生的比特流具有可分級性,包含了12個嵌入式層。第1層為核心層,其編碼速率為 8 Kb/s,核心層與原有 G.729中的比特流形式相同,這使得G.729.1與G.729之間具有互操作性。第2層為窄帶增強(qiáng)層,每層均在之前一層的基礎(chǔ)上增加2 Kb/s的編碼速率,編碼速率分別為 14 Kb/s、16 Kb/s、18 Kb/s、20 Kb/s、22 Kb/s、24 Kb/s、26 Kb/s、28 Kb/s、30 Kb/s、32 Kb/s。 編碼器的默認(rèn)輸 入為16 kHz采樣,16 bit線性脈沖調(diào)制編碼語音信號,也可對8 kHz采樣的信號進(jìn)行操作。解碼器的輸出可以為16 kHz或 8 kHz采樣的 16 bit線性 PCM語音信號[1]。

G.729.1編解碼器基于三階段結(jié)構(gòu):嵌入式碼本激勵線性預(yù)測(CELP)編解碼、時(shí)域帶寬擴(kuò)展(TDBWE)以及時(shí)域混疊消除(TDAC)的估計(jì)轉(zhuǎn)換編解碼。其中,嵌入式CELP階段產(chǎn)生第1和第2層,生成8 Kb/s和12 Kb/s窄帶合成信號(50~4 000 Hz)。TDBWE階段產(chǎn)生在第3層,生成 14 Kb/s寬帶輸出信號(50~7 000 Hz)。TDAC階段工作在改進(jìn)離散余弦變換域(MDCT),生成第4~12層,將信號從14 Kb/s提高到32 Kb/s。TDAC編解碼同時(shí)代表50~4 000 Hz頻帶加權(quán)CELP編解碼誤碼信號和 4 000~7 000 Hz頻帶輸入信號。算法中處理幀長為20 ms,每幀寬帶信號樣點(diǎn)數(shù)為640[2]。

本文主要對其TDAC部分的MDCT變換進(jìn)行改進(jìn)并用程序?qū)崿F(xiàn)。在G.729.1算法的時(shí)延中,用于MDCT分析(估計(jì))的時(shí)延為20 ms,通過MDCT的快速算法來減少該部分的時(shí)延,從而提高算法的實(shí)時(shí)處理的性能。

改進(jìn)的離散深余弦(MDCT)廣泛應(yīng)用于語音和音頻編碼、分析和研究濾波器的時(shí)域別名取消特性。這是一種最為繁瑣的計(jì)算密集型算法,因此需要一種快速算法來實(shí)現(xiàn),到目前為止,已經(jīng)提出了多種快速算法來實(shí)現(xiàn)MDCT。在這其中許多算法推導(dǎo)變換的長度為N=2m。本文將介紹一種基于長度為N=5×2m的新方法。這種長度的變換已建議在語音和音頻編碼中使用,典型的采樣速率為 8 kHz或 16 kHz, 幀延遲為 10 ms或 20 ms。ITUTG.729.1和3GPP2EVRC-WB以及新興的ITU-TG..EVVBR標(biāo)準(zhǔn)中也提供了這種算法。本文對G.729.1中的MDCT引入了一種新的算法,該算法更簡便和更易于實(shí)際應(yīng)用,非常適合在語音算法中應(yīng)用。

1 算法的基本原理

設(shè){x(n)},n=0,…,N-1代表輸入采樣序列,N 為幀長。在本文中,MDCT和IMDCT的定義如下:

式中,X(k)是 MDCT的系數(shù),x(n)是重建樣點(diǎn)。為了簡便,本文中忽略了定義中的正?;蜃?,將(N/2×N)MDCT定義為矩陣M:

所以MDCT/IMDCT可以記為:

將N點(diǎn)的MDCT/IMDCT映射成為N/2點(diǎn)的DCT-IV如下[3]:

式中P為:

其中 IN/4和 JN/4為 N/4×N/4的單位矩陣及其相應(yīng)的逆轉(zhuǎn)矩陣。

根據(jù)對稱特性可以將DCT-IV矩陣映射成為DCT-Ⅱ矩陣,結(jié)果如下[4]:

式中,D是一個對角線矩陣,其元素為:

通過以上的變換可以看到,矩陣D和窗函數(shù)相乘后所得到的結(jié)果遵循IMDCT,這樣就可以減少做N/2次的乘法,也即可以節(jié)省N/2的存儲空間。MDCT可以通過逆變換從IMDCT中得到。然后進(jìn)行逆DCT-Ⅱ變換。變換需要一種算法可以適合任意長度的序列。因此本文采用了既對頻率狀態(tài)進(jìn)行抽取同時(shí)又可以執(zhí)行遞歸直到DCT的長度為5點(diǎn)的方法。基于5點(diǎn)的DCT-Ⅱ是通過平面旋轉(zhuǎn)的方法來取代系數(shù)x(3)與x(4)之間的3次乘法和3次加法,用同樣的方法對x(0)和x(2)進(jìn)行處理。該方法使處理的路徑變短、結(jié)構(gòu)的規(guī)律性增強(qiáng)、傳輸過程中數(shù)據(jù)的動態(tài)范圍減少。基于5點(diǎn)的DCT-Ⅱ變換的方程如下:

逆DCT的變換方程如下:

由于DCT-IV中的前項(xiàng)和后項(xiàng)乘法可以在MDCT和IMDCT分別合并窗函數(shù),因此在許多應(yīng)用實(shí)例中,MDCT都是使用下面的窗函數(shù):

用該窗函數(shù)和傳輸因子整合成新的改進(jìn)的窗函數(shù),其表達(dá)式為:

由此說明該窗是準(zhǔn)對稱的,與對稱的正弦窗相比較,該窗也使用相同大小的存儲空間。

2 算法的復(fù)雜度分析

設(shè):N=5g2m(m≥2)和 NI=2m,RMF(N)和 RAF(N)分別代表N點(diǎn)MDCT的乘法和加法的復(fù)雜度,RMI(N)和RAI(N)分別代表N點(diǎn)IMDCT的乘法和加法的復(fù)雜度,RMD(5)和RAD(5)分別代表快速 5點(diǎn) DCT-Ⅱ的乘法和加法的復(fù)雜度。進(jìn)一步計(jì)算MDCT和IMDCT的復(fù)雜度用下面的計(jì)算公式:

由式(16)可知,MDCT/IMDCT算法的復(fù)雜度受到快速5點(diǎn)DCT-Ⅱ算法復(fù)雜度的限制。

3 算法的實(shí)現(xiàn)

經(jīng)過改進(jìn)后,新的MDCT變換算法如圖1所示。圖中,加窗所用的窗函數(shù)為一般情況下常使用的窗函數(shù)。

從以上分析可知,該算法的復(fù)雜度受到DCTII算法復(fù)雜度的限制,所以在做DCTII變換時(shí)用的是HEIDEMAN M T的基于5點(diǎn)的DCTII變換的算法。該算法進(jìn)行5點(diǎn)的DCTII變換只需14次加法和4次乘法,而可以提高運(yùn)算速度和節(jié)省運(yùn)算時(shí)間。

圖1 改進(jìn)后新的MDCT變換算法

本文在G.729.1中的TDAC模塊中引進(jìn)了MDCT的快速算法,在G.729.1的默認(rèn)模式下,該部分的時(shí)延為20 ms。通過使用本文中的方法進(jìn)行改進(jìn),可以使該部分的時(shí)延降低約1/3,其存儲空間也可節(jié)省約1/3。從而提高了該算法實(shí)現(xiàn)的實(shí)時(shí)性以及實(shí)際應(yīng)用有了更大的可能性。在原來G.729.1的基礎(chǔ)上實(shí)現(xiàn)了變速率,使該算法可以與G.729實(shí)現(xiàn)互操作,即該算法包含了G.729(因在原來G.729的基礎(chǔ)上引入了TDBMW和TDAC技術(shù))。

本改進(jìn)算法的仿真結(jié)果(默認(rèn)模式)如圖2所示。

由圖2可以看到,該算法的降噪性能并不是很理想,加15 dB白噪聲的語音基本上不可懂,但是解碼后的語音雖然包含一定的噪聲,而人耳基本上可以識別。該算法在降噪方面還有一定改進(jìn)的余地,G.729.1算法的改進(jìn)還有很大的價(jià)值。

[1]ITU-T Rec.G.729.1.An 8-32 Kb/s scalable wideband coder bitstream interoperable with G.729.May.2006.

[2]賈懋珅,鮑長春,李銳.8~64 Kb/s超寬帶嵌入式語音頻編碼方法[J].通信學(xué)報(bào),2009(5).

[3]CHIVUKULA R K,REZNI Y A.Efficient implementation of a class of MDCT/IMDCT filterbanks for speech and audio coding applications[M].ICASSP,2008.

[4]HEIDEMAN M T.Computation of an odd-length DCT from a real-valued DFT of the same length[J].Signal Processing,IEEE Transactions, 1992,40(1):54-61.

猜你喜歡
編碼器復(fù)雜度時(shí)延
融合CNN和Transformer編碼器的變聲語音鑒別與還原
一種低復(fù)雜度的慣性/GNSS矢量深組合方法
基于GCC-nearest時(shí)延估計(jì)的室內(nèi)聲源定位
基于FPGA的同步機(jī)軸角編碼器
求圖上廣探樹的時(shí)間復(fù)雜度
應(yīng)用旋轉(zhuǎn)磁場編碼器實(shí)現(xiàn)角度測量
FRFT在水聲信道時(shí)延頻移聯(lián)合估計(jì)中的應(yīng)用
簡化的基于時(shí)延線性擬合的寬帶測向算法
基于分段CEEMD降噪的時(shí)延估計(jì)研究
某雷達(dá)導(dǎo)51 頭中心控制軟件圈復(fù)雜度分析與改進(jìn)