李亞
摘要:針對PCM編碼的語音信號,提出了一種基于正交矩陣變換的語音處理方法以改變語音信號幅值的分布規(guī)律,從而減小語音信號的動態(tài)范圍與標準差。實驗表明,正交矩陣變換算法可以明顯降低語音信號的幅值范圍,實驗數(shù)據(jù)顯示變換后語音信號的標準差降低20%。同時多人試聽實驗證明解碼后的語音質量沒有降低。此算法縮小了語音信號的幅值范圍和標準差,從而可以用更少的編碼比特完成語音信號的編碼,壓縮效率可以進一步提高。
關鍵詞: 語音;幅值分布;正交矩陣;標準差;熵
中圖分類號:TP391.08 文獻標識碼:A 文章編號:1009-3044(2016)07-0164-02
Statistics and Analysis of Speech Signal Amplitude Distribution
LI Ya
(Department of Computer Science, Tongji University, Shanghai 201804, China)
Abstract: In view of PCM(Pulse Code Modulation) speech signal, this paper puts forward a method of speech processing based on orthogonal matrix transformation to change the amplitude distribution of speech signal, which can reduce the standard deviation of speech signal. Experiments indicate that the orthogonal matrix transformation algorithm can obviously reduce the amplitude range of speech signal, and the results show that and speech signal standard deviation is reduced by 20% through the transformation. At the same time, voice quality after decoding is not decreased according to listening experimenter. The algorithm reduces amplitude range and standard deviation of the speech signal, so speech signal can be coded with less bits and compression efficiency can be further improved.
Key words: speech signal; amplitude distribution; orthogonal matrix; standard deviation; entropy
1 概述
早期的語音信號傳輸和處理都是以模擬方式進行的,自PCM脈沖編碼調制理論提出來后,語音信號處理進入數(shù)字化時代。從最初64kb/s的標準PCM波形編碼器到現(xiàn)在4kb/s以下的參量編碼的聲碼器,語音壓縮編碼在幾十年里得到迅速發(fā)展[1-2]。為了提高通信網(wǎng)中的信息傳輸效率及實現(xiàn)語音的高效存儲,還需要對編碼后的數(shù)字語音進行壓縮,即語音壓縮。
目前,比較成熟的語音信號分析方法[3-4]主要有時域分析、短時傅里葉變換、倒譜以及LPC譜分析。通過對語音信號幅值的相關研究,可以統(tǒng)計得到語音信號的幅值分布。根據(jù)其幅值分布的特點,可以研究其他編碼方案在語音信號中的應用,例如霍夫曼編碼。
2 原始語音信號的分布統(tǒng)計
對原始模擬語音信號采樣,可以得到語音信號的離散數(shù)據(jù)樣點。假設采樣后的語音信號有K=M×N數(shù)據(jù)樣點,記為X=(X1,X2,…,XK),其中K、M、N都是正整數(shù)。則采樣后信號數(shù)據(jù)點的矩陣形式可以表示為
5 結論
本文首先分析了語音信號相鄰樣本間的相關特性,并根據(jù)這種相關性,利用哈達瑪矩陣對原始信號進行變換并統(tǒng)計幅值分布,實驗結果表明此方法明顯減小了語音信號的動態(tài)范圍和標準差,從而提高語音信號的壓縮率。其次,利用哈達碼矩陣的正交特性可以恢復原始信號,同樣可以采用其他類型的矩陣進行變換并統(tǒng)計分析。最后,此算法在語音編碼和無線通信中有一定地參考價值,其具體應用有待進一步討論研究。
參考文獻:
[1] 趙曉群.數(shù)字語音編碼[M]. 北京:機械工業(yè)出版社, 2007.
[2] 時磊, 尚秋峰, 李健宇. 語音壓縮編碼技術研究進展[J]. 聲學技術, 2008, 27(4):553-556.
[3] 張宗念, 黃仁泰, 閆敬文. 壓縮感知信號盲稀疏度重構算法[J]. 電子學報, 2011, 39(1):18-22.
[4] 劉毅強,劉昱,段繼忠,劉亞峰. 壓縮感知處理語音信號的性能分析及比較[J]. 電聲技術, 2012, 36(2):44-47.
[5] 時娟. Walsh-Hadamard變換及其在信源編碼中的應用[J]. 甘肅科學學報, 2005, 17(2):38-40.
[6] Wang Guibao, Huang Hongzhong, Liu Yu, Zhang Xiaoling and Wang Zhonglai. Uncertainty estimation of reliability redundancy in complex systems based on the Cross-Entropy method[J]. Journal of Mechanical Science and Technology, 2009, 23(10):2612-2623.
[7] 傅祖蕓, 趙建中. 信息論與編碼[M]. 北京:電子工業(yè)出版社, 2008.
[8] 常荷. 熵與方差[J].開封教育學院學報, 2001,21(4):43-44.