国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

通用碼本語音矢量編碼算法研究

2019-06-15 03:31:35楊超劉云飛徐向旭劉傳輝朱弘
現(xiàn)代電子技術 2019年12期

楊超 劉云飛 徐向旭 劉傳輝 朱弘

摘 ?要: 基于預測編碼、SOM自主神經(jīng)網(wǎng)絡矢量編碼和Huffman編碼的聯(lián)合編碼算法(PV算法)壓縮效果雖然較好,但它在對每段語音編碼時,都需要利用該段語音信號,通過SOM自主神經(jīng)網(wǎng)絡訓練得到碼本,算法復雜、耗時。為此文中提出從具有一般特征的多段語音信號中通過SOM自主神經(jīng)網(wǎng)絡訓練提取碼本,所有的語音信號段PV編碼都統(tǒng)一用該碼本,不需要對每一段語音信號編碼都做一次提取碼本的運算,這樣不僅節(jié)省了每段語音PV編碼時用于訓練碼本的時間,也節(jié)省了需要編碼的專用碼本的信息,減小了碼率。實驗結果顯示,通用碼本的PV編碼算法在保證一定語音質量的條件下,是可行的。文中提出的編碼算法在語言壓縮編碼方面具有較高的研究價值和很好的應用前景。

關鍵詞: PV編碼; 矢量編碼; 語音信號編碼; 神經(jīng)網(wǎng)絡訓練; 通用碼本; 專用碼本

中圖分類號: TN911.3?34 ? ? ? ? ? ? ? ? ? ? ?文獻標識碼: A ? ? ? ? ? ? ? ? ? ? ? 文章編號: 1004?373X(2019)12?0165?03

Abstract: The joint encoding algorithm based on the predictive coding, SOM autonomous neural network vector coding and Huffman coding (PV algorithm) has a good combination effect, but is complex and time?consuming when used to obtain the codebook by means of the SOM autonomous neural network training since the speech signal segment needs to be used during the encoding of each speech segment. Therefore, the SOM autonomous neural network training is proposed in this paper to extract the codebook from multiple speech signal segments with general features. The codebook is used for PV coding of all speech signal segments. There is no need to perform a codebook extraction operation for encoding of each speech signal segment, which not only saves the codebook training time for PV coding of each speech segment, but also saves the information of specific codebooks that need to encode, and reduces the bit rate. The experimental results show that the PV coding algorithm of the general codebook is feasible under the condition of guaranteeing a certain speech quality, and the coding algorithm proposed in this paper has a high research value and good application prospect in the aspect of language compression coding.

Keywords: PV coding; vector coding; speech signal coding; neural network training; general codebook; specific codebook

0 ?引 ?言

語音編碼的目的是減少表示語音信號的碼元數(shù)量[1],早在1972年,ITU?T發(fā)布A/μ率 64 Kb/s,脈沖編碼調制語音編碼標準G.711 [2]。目前語音編碼的基本算法主要有波形編碼、混合編碼和參數(shù)編碼[3]。一種基于預測編碼、SOM自主神經(jīng)網(wǎng)絡[4?7]矢量編碼[8?10]和Huffman編碼的聯(lián)合編碼算法(以下簡稱PV編碼算法)屬于波形編碼[11],其碼率達到12.8 Kb/s,小于采用ADPCM編碼算法的波形編碼標準G.72的碼率32 Kb/s(波形編碼的最小碼率)。但是PV算法中的SOM自主神經(jīng)網(wǎng)絡矢量的訓練樣本采用的是待傳輸?shù)男盘?,缺點是每傳送一段語音信號,就需要對SOM自主神網(wǎng)絡進行一次訓練,工作量比較大。本文提出PV算法中的SOM神經(jīng)網(wǎng)絡的矢量量化的碼矢(本)采用通用碼矢(本),這樣不需要每傳輸一段語音就對SOM神經(jīng)網(wǎng)絡訓練一次,文中將研究PV編碼算法中矢量量化采用通用碼本的編解碼效果,旨在找到碼率變化范圍較小的條件下,減少PV編碼算法的運算量和運算時間的算法。

1 ?PV算法

圖1為2維PV算法編碼部分程序流程圖。以此類推,n維PV算法是將一列語音信號轉變?yōu)閚列,然后進行線性預測和n維矢量量化。

圖1 ?2維PV算法編碼程序流程圖

2 ?通用矢量碼本PV算法實驗結果與分析

專用碼本PV編碼算法中,對SOM自主神經(jīng)網(wǎng)絡的訓練樣本源自待傳輸?shù)恼Z音信號,這樣的碼本只對待傳輸?shù)男盘柫炕`差小。通用碼本的SOM神經(jīng)網(wǎng)絡訓練樣本源自眾多的常用的語音信號,這樣從統(tǒng)計意義上來說,通用碼本對一般語音信號的矢量量化誤差小。

實驗中,先選取了男聲、女聲和男聲音樂混合聲音3段信號。因為8維64碼矢PV語音編碼具有較小的碼率,這里按照8維PV編碼算法的編碼原理,對3段信號分別進行8列線性預測并計算誤差,得到3個長度分別是5 000,6 017,5 016的8列(維)的誤差矩陣,將三段誤差矢量拼在一起形成了一個16 033的8維矩陣,送入到SOM自主神經(jīng)網(wǎng)絡訓練。為了得到64個碼本,神經(jīng)網(wǎng)絡的輸出設定為64。據(jù)神經(jīng)網(wǎng)絡的訓練結果,得到8維PV編碼算法的64碼矢的通用碼本。壓縮率和信噪比的計算公式為: [壓縮率=編碼后二進制碼總位數(shù)初始信號二進制碼總位數(shù)×100%] (1)

式中:原始信號的功率為[Ps];語音信號的噪聲功率[Pn]。

圖2為用8維PV編碼算法的64碼矢的通用碼本對一段語音信號編譯碼的情況。從圖中可以看出,譯碼恢復信號在時域和頻域都保持了原始語音信號的基本特征和形狀。播放還原聲音,仍能較為清楚地聽清語音內容,音色變化不大,存在少量噪聲。信噪比為6.14 dB,壓縮率為8.58%。

圖2 ?通用碼本語音信號恢復情況

表1為用5段聲音做為訓練樣本,將它們拼接成長度為26 843的8維預測誤差矩陣,通過SOM自主神經(jīng)網(wǎng)絡訓練得到64個通用碼本,并用該通用碼本對10段聲音做8維64碼矢的PS編譯碼后恢復的聲音情況。

表1 ?通用碼本8維64碼矢PV算法譯碼聲音恢復情況

由表1可見,專用碼本恢復的10段聲音質量較通用碼本的好,10段用通用碼本恢復的語音中有8組樣本恢復聲音質量為良,語音內容能清楚辨別,音色變化較小;2組恢復聲音質量較差,內容勉強聽清,音色有變化,噪聲較大較差。所以,雖然通用碼本譯碼恢復的聲音質量較專用碼本差,但仍然可行。

3 ?結 ?論

雖然適當?shù)倪x擇參數(shù)可使PV算法編碼碼率值很小,但是,對每段語音編碼時,都需要利用該段語音信號,通過SOM自主神經(jīng)網(wǎng)絡訓練得到碼本,算法復雜、耗時。本文提出從具有一般特征的多段語音信號中通過SOM自主神經(jīng)網(wǎng)絡訓練提取碼本,所有的語音信號段PV編碼都用該碼本,不需要對每一段語音信號編碼都做一次提取碼本的運算,這樣不僅節(jié)省了每段語音PV編碼時用于訓練碼本的時間,而且節(jié)省了需要編碼的專用碼本的信息,從而減少了碼率。實驗結果顯示,通用碼本的PV編碼算法在保證一定語音質量的條件下,是可行的。

注:本文通訊作者為徐向旭。

參考文獻

[1] 肖東,莫福源,陳庚,等.低碼率語音編碼中過渡幀對合成語音的影響[J].應用聲學,2016,35(1):77?83.

XIAO Dong, MO Fuyuan, CHEN Geng, et al. Effects of transition frame on synthesized speech in low bit rate speech coding [J]. Journal of applied acoustics, 2016, 35(1): 77?83.

[2] 李曉明.語音與音頻信號的通用編碼方法研究[D].北京:北京工業(yè)大學,2014.

LI Xiaoming. Research on universal coding method for speech and audio signals [D]. Beijing: Beijing University of Technology, 2014.

[3] 梁冬蕾.音頻語音聯(lián)合編碼算法研究[D].西安:西安電子科技大學,2010.

LIANG Donglei. Research on joint coding algorithm for audio speech [D]. Xian: Xidian University, 2010.

[4] 錢海軍.基于BP神經(jīng)網(wǎng)絡的圖像壓縮的Matlab實現(xiàn)[J].電腦開發(fā)與應用,2011,24(12):77?79.

QIAN Haijun. Image compression based on neural network using Matlab [J]. Computer development & applications, 2011, 24(12): 77?79.

[5] 王龍,杜敦偉,白艷萍.SOM網(wǎng)絡在雷達目標識別中的應用[J].科技視界,2015(16):52?53.

WANG Long, DU Dunwei, BAI Yanping. Application of SOM network in radar target recognition [J]. Science & technology vision, 2015(16): 52?53.

[6] 楊晨,閆薇.利用SOM網(wǎng)絡模型進行聚類研究[J].網(wǎng)絡安全技術與應用,2014(2):44?45.

YANG Chen, YAN Wei. Research on the clustering by using SOM network model [J]. Network security technology & application, 2014(2): 44?45.

[7] 鄒瑜,帥仁俊.基于改進的SOM神經(jīng)網(wǎng)絡的醫(yī)學圖像分割算法[J].計算機工程與設計,2016,37(9):2533?2537.

ZOU Yu, SHUAI Renjun. Improved segmentation algorithm of medical images based on SOM neural network [J]. Computer engineering and design, 2016, 37(9): 2533?2537.

[8] 楊超,賀一君,任建存,等.碼本均衡矢量編碼算法[J].現(xiàn)代電子技術,2016,39(13):38?40.

YANG Chao, HE Yijun, REN Jiancun, et al. Codebook equilibrium algorithm for vector coding [J]. Modern electronics technique, 2016, 39(13): 38?40.

[9] 楊超,董世錕.矢量量化圖像壓縮方法[J].海軍航空工程學院學報,2011,26(1):11?14.

YANG Chao, DONG Shikun. Image compression method based on vector quantization [J]. Journal of Naval Aeronautical and Astronautical University, 2011, 26(1): 11?14.

[10] MAKHOUL J, ROUCOS S, GISH H. Vector quantization in speech coding [J]. Proceeding of the IEEE, 1985, 73(11): 1551?1588.

[11] 楊超,劉云飛,徐向旭,等.基于預測編碼和矢量編碼的語音信號編碼算法[J].現(xiàn)代電子技術,2018,41(24):128?131.

YANG Chao, LIU Yunfei, XU Xiangxu, et al. Speech signal coding algorithm based on predictive coding and vector coding [J]. Modern electronics technique, 2018, 41(24): 128?131.

合川市| 五莲县| 平遥县| 惠东县| 洛南县| 湄潭县| 夹江县| 贵阳市| 南丰县| 蒙自县| 商丘市| 阿鲁科尔沁旗| 松溪县| 买车| 新龙县| 津南区| 大新县| 鲜城| 依安县| 扎兰屯市| 松滋市| 东乡| 齐齐哈尔市| 临武县| 黔西县| 隆回县| 元谋县| 南宁市| 平顶山市| 玛曲县| 米脂县| 忻城县| 金门县| 托克托县| 房山区| 丰顺县| 乐亭县| 定襄县| 镇平县| 利津县| 确山县|