梅鐵民,付天嬌,朱向榮
(1.沈陽理工大學 信息科學與工程學院,沈陽 110159;2.淄博民通熱力有限公司,山東 淄博 255400)
?
類諧波積譜基音周期檢測算法
梅鐵民1,付天嬌1,朱向榮2
(1.沈陽理工大學 信息科學與工程學院,沈陽 110159;2.淄博民通熱力有限公司,山東 淄博 255400)
摘要:基音周期檢測是語音信號處理的一項重要內(nèi)容。在低信噪比情況下,常用的自相關(guān)函數(shù)法容易出現(xiàn)半周期和倍周期估計錯誤。為解決這一問題,在諧波積譜法的啟發(fā)下提出了基于自相關(guān)函數(shù)的類諧波積譜法。該方法不僅可以有效地克服諧波積譜法由于信號中某次諧波分量為零時所造成的困難,而且可以有效地提高低信噪比下基音周期檢測的可靠性。
關(guān)鍵詞:基音周期;自相關(guān)函數(shù);類諧波積譜
隨著信息科學技術(shù)的不斷發(fā)展,語音信號處理的重要性日益突出。語音信號處理主要研究包括語音編碼、語音識別、說話人識別、語音合成等方向。在這些研究中,均需要對語音信號進行特征參數(shù)分析?;糁芷诠烙嬍钦Z音信號的重要特征參數(shù)之一[1],對它估計的準確性直接影響到語音編碼、語音識別、說話人識別、語音合成的質(zhì)量[2]。
基音周期檢測技術(shù)主要有時域的自相關(guān)法[3]、頻域的倒譜法、諧波積譜法、時頻結(jié)合的小波變換分析方法以及在其基礎(chǔ)上的衍生算法[4]。常用的自相關(guān)基音周期估計方法計算簡單,并且高信噪比下比較可靠,但當信號的信噪比較低時,該方法會出現(xiàn)半周期或多倍周期的估計錯誤。諧波積譜法是通過估計語音信號的基頻來估計基音周期的一種頻域算法,它可以有效地克服半周期或多倍周期錯誤,但是當語音信號某一諧波分量為零時,該方法將遇到困難。為了克服以上兩種方法存在的不足,本文提出基于自相關(guān)函數(shù)的類諧波積譜基音周期估計方法,該方法可以有效地克服以上這些問題。
1諧波積譜法與類諧波積譜法
1.1諧波積譜
在時域中,基音周期檢測的精度受到采樣周期的限制,而在頻域中,利用短時頻譜進行基音周期檢測時則不受這種制約,精度可以高于一個采樣周期。頻域基音檢測方法中,一種常用的有效方法是諧波積譜法。
諧波積譜法(Harmonic Product Spectrum,HPS)是根據(jù)語音信號的短時譜Xn(ejw)檢測基音頻率f0。這種方法通過將多個諧波的能量累積起來,尋找諧波積譜的最大值來確定基音頻率。信號x(n)的諧波積譜定義為
(1)
對上式兩邊取對數(shù),可得x(n)的對數(shù)諧波積譜為
(2)
式中Xn(ejiw)是短時譜Xn(ejw)在頻域壓縮i倍的結(jié)果,它的i次諧波的峰值位置總是與Xn(ejw)的基波頻率對齊。所以,不管原來的頻譜中基波成分是否具有最高的峰,諧波積譜Pn(ejw)都會在基頻處出現(xiàn)最高的峰,這可以有效地降低基音頻率估值落到倍頻或分頻上的可能性。由于噪聲頻譜中沒有相干的結(jié)構(gòu),所以這種技術(shù)特別適用于對抗加性噪聲,能有效地檢測出語音信號基音頻率f0[5]。但它的不足之處是當某一諧波分量為零時將使諧波積譜中基頻處的值為零,給基頻估計造成困難。
1.2類諧波積譜法
受諧波積譜法的啟發(fā),可以把該方法做如下推廣。對任何具有周期性信號頻譜特征的函數(shù)都可以定義一個類似于諧波積譜的函數(shù),以突出該函數(shù)中以坐標原點為始點,以固定周期出現(xiàn)的分量,從而可以準確地估計該周期。周期性信號頻譜的特征就是其諧波分量以零頻(即頻率坐標的原點)為始點,以基頻為周期重復出現(xiàn),因此諧波積譜可以顯著提高基頻處的峰值。
但是,諧波積譜法也存在一定的缺陷,即當信號中某次諧波分量極微弱或不存在時,諧波積譜的基頻位置將不再是最大峰值位置,這將給基頻的估計帶來困難。因此,類諧波積譜算法是將諧波積譜中的累積運算改為累加運算,這樣就可以避免如上所述的困難。
令p(t)表示具有周期性信號頻譜特征的函數(shù),變量t可以是頻率、時間或距離,或任何其它物理量。信號p(t)的類諧波積譜可定義為
(3)
類諧波積譜函數(shù)Q(t)在信號p(t)的第一個周期處的值將是函數(shù)p(t)在前m個周期處的值之和,即將周期性信號p(t)所有峰值疊加到Q(t)的第一個峰值處,使Q(t)在第一周期處形成最大峰值。如果信號p(t)的前m個周期處的峰值中,由于噪聲影響,某個值可能很小,甚至接近零,對Q(t)在第一周期處的峰值影響并不大。因此,這樣定義的類諧波積譜函數(shù)可以有效地克服諧波積譜函數(shù)的不足。
2基于自相關(guān)函數(shù)的類諧波積譜算法
自相關(guān)函數(shù)法是語音信號基音周期估計中的一種常用方法。語音信號中的濁音段具有準周期性,因而其自相關(guān)函數(shù)也具有準周期性。自相關(guān)函數(shù)第一峰值處所對應的時間即為語音的基音周期,因此可以通過檢測自相關(guān)函數(shù)第一峰值來估計基音周期。在信噪比較低的情況下,自相關(guān)函數(shù)第一峰值的位置不易準確估計,給基音周期估計帶來困難。由于準周期語音信號的自相關(guān)函數(shù)的峰值分布規(guī)律與其頻譜中各次諧波分量的分布規(guī)律一致,因此可以定義基于自相關(guān)函數(shù)的類諧波積譜函數(shù)來估計基音周期。
自相關(guān)函數(shù)主要用于衡量信號自身時間波形的相似性,由于清音和濁音的發(fā)聲機理不同,因此在波形上也存在著較大的差異。清音的時間波形呈現(xiàn)出隨機噪聲的特性,雜亂無章,樣點間相似性較差,而濁音的時間波形呈現(xiàn)出一定的周期性,波形之間相似性較好[6]。
對于能量有限的語音信號x(n),其自相關(guān)函數(shù)可定義為
(4)
如果x(n)是隨機的或者周期性的離散語音信號,不是能量有限的,其自相關(guān)函數(shù)定義為
(5)
信號的自相關(guān)函數(shù)具有以下重要性質(zhì):
1)偶函數(shù)性質(zhì):r(k)=r(-k);
2)|r(k)|≤|r(0)|,即零延遲的自相關(guān)函數(shù)值最大;
3)若x(n)為周期性信號,那么r(k)也是周期性信號,并且其周期與x(n)的周期相同。
與信號本身相比,自相關(guān)函數(shù)可以有效地抑制加性白噪聲。因此利用自相關(guān)函數(shù)提取的周期具有較好的噪聲穩(wěn)定性。由于濁音信號具有準周期性,濁音信號的自相關(guān)函數(shù)在基音周期整數(shù)倍的位置上會出現(xiàn)峰值,而清音的自相關(guān)函數(shù)沒有明顯的峰值出現(xiàn),因此檢測是否有峰值可以判斷清音或濁音。對于濁音信號,只要檢測到峰值的位置,就可以估計出語音信號的基音周期值[7]。
為了提高自相關(guān)函數(shù)法檢測基音周期的可靠性和計算效率,需要對原始的語音信號進行預處理:中心削波和三電平量化。中心削波法如式(6)所示。
(6)
式中CL為削波電平,一般取最大信號幅度的60%~70%。中心削波法處理能夠有效減少倍周期和半周期估計錯誤。
為減少計算量,再進一步對信號y(n)進行三電平量化得到
(7)
在基音周期檢測中,用心削波信號y(n)與三電平信號y(n)的互相關(guān)來代替語音信號x(n)的自相關(guān)函數(shù),即
(8)
式中N為語音幀的長度。式(8)所定義的自相關(guān)函數(shù)序列r(k)與式(5)中的自相關(guān)函數(shù)具有類似性質(zhì),即在基音周期整數(shù)倍的位置,r(k)具有峰值。
由r(k)定義類諧波積譜函數(shù):
(9)
通常,可以取M=5。此外,為了保證在對r(k)進行n倍抽取時,不破壞r(nk)的準周期性,可以先對r(k)進行M倍內(nèi)插,然后再計算類諧波積譜函數(shù)R(k)。
基于自相關(guān)的類諧波積譜法基音周期估計步驟如下:
(2)根據(jù)式(8)計算r(k),并對其進行M倍內(nèi)插。
(3)根據(jù)式(9)計算類諧波積譜函數(shù)R(k)。
(4)在[k1,k2]范圍內(nèi)找到R(k)最大值所對應的k0,即
R(k0)=max{R(k),k1≤k≤k2}
則k0即為該幀語音的基音周期。其中k1、k2分別為基音周期的上下限。
(5)如果R(k0) 圖1為一段信噪比為SNR=3.2dB的濁音語音段的類諧波積譜函數(shù)??梢悦黠@看出,在其基音周期處取得最大值(零點處除外)。該段語音由式(8)計算得到的相關(guān)函數(shù)值如圖2所示。在圖2中可以看到,除零點外,r(k)在三倍基音周期處取得最大值(零點處除外),因此該段語音由r(k)估計的基音周期是錯誤的。 圖1 類諧波積譜函數(shù)波形圖 圖2 由式(8)計算得到的相關(guān)函數(shù)值 3與自相關(guān)函數(shù)法比較 仿真實驗所用的原始語音是普通話“媽媽,好嗎,上馬,罵人”,語音信號采樣率為16kHz、量化字長16bit。選用截止頻率為900Hz的低通濾波器進行預處理;采用漢明窗,窗寬度為600采樣點。分別用自相關(guān)函數(shù)法和本文提出的基于自相關(guān)函數(shù)的類諧波積譜算法對語音信號進行基音周期提取,其結(jié)果如圖3所示。 圖3 原始語音信號的基音周期檢測 圖3為高信噪比情況下(未對原始語音另加噪聲)使用傳統(tǒng)自相關(guān)函數(shù)法和本文算法對該段語音進行基音檢測的結(jié)果。圖中橫坐標為幀數(shù),縱坐標為采樣點數(shù)(對應基音周期)。圖3a為連續(xù)無噪的語音信號“媽媽,好嗎,上馬,罵人”的波形圖。圖3b為自相關(guān)方法對原始語音信號進行基音周期檢測的實驗結(jié)果。從它們的基音軌跡可以看出,傳統(tǒng)的相關(guān)函數(shù)進行基音周期檢測,在多處出現(xiàn)明顯的倍周期錯誤,這是由于受以共振峰為主的多種因素的影響,導致相關(guān)函數(shù)法除零點之外的第一最大峰值點并不是真實的基音點,因此檢測結(jié)果并不理想。圖3c為本文的類諧波積譜法對原始語音信號進行基音周期檢測的實驗結(jié)果。這種方法相較于相關(guān)函數(shù)法,克服了多處倍周期錯誤。本文算法對清濁音劃分非常準確,檢測所得的基音曲線光滑規(guī)整,很好地跟蹤了基音周期的變化,并有效地修正了傳統(tǒng)相關(guān)函數(shù)算法中的多處倍周期錯誤。 圖4給出了在信噪比SNR=0dB的情況下,相關(guān)函數(shù)法和本文算法對該段語音進行基音檢測的結(jié)果。由圖4中的曲線對比可見,傳統(tǒng)自相關(guān)函數(shù)法提取的基音軌跡出現(xiàn)了嚴重的不連續(xù)現(xiàn)象,檢測效果不佳,容易出現(xiàn)半周期和倍周期的錯誤。而本文算法所給出的檢測結(jié)果與無噪聲條件下的檢測結(jié)果大體保持一致,語音的基音曲線光滑規(guī)整,沒有明顯的倍周期和半周期錯誤,說明本文所提方法具有很好的噪聲穩(wěn)定性。 圖4 信噪比SNR=0dB的加噪語音信號基音周期檢測結(jié)果 4結(jié)論 以語音信號的基音檢測為研究對象,提出了一種結(jié)合自相關(guān)函數(shù)法和諧波積譜的基音周期估計方法。用Matlab軟件進行仿真實驗,實驗結(jié)果表明,這種新的基音周期檢測方法在不同的信噪比情況下都具有很好的噪聲穩(wěn)定性,明顯優(yōu)于傳統(tǒng)自相關(guān)法。 參考文獻: [1]Mousset Eric,Ainsworth William A,F(xiàn)onollosa Jose A R.Acomparison of seceral recent methods of fundamental frequency and voicing decision estimation[C]//ICSLP 96.Phiadelphia,USA:IEEE,1996:1273-1276. [2]徐敬德,常亮,崔慧娟,等.基于頻域和時域結(jié)合的基音周期提取算法[J].清華大學學報:自然科學版,2012,52(3):26-27. [3]魏旋,黨曉妍,崔慧娟,等.基于動態(tài)規(guī)劃的低延時基音提取算法[J].清華大學學報:自然科學版,2008,48(10):1586-1588. [4]Kumar K,Jain J.Speech pitch shifting using complex continuous wavelet transform[C]//Annual IEEE India Conference.New Delhi,India,2006:1-4. [5]易克初,田斌,付強.語音信號處理[M].北京:國防工業(yè)出版社,2000. [6]李永寧.基于自相關(guān)的語音基音周期檢測方法研究[J].福建電腦,2008(11):92-93. [7]何姣.帶噪語音信號基音檢測技術(shù)研究[D].成都:電子科技大學,2012. (責任編輯:馬金發(fā)) Pitch Detection of Harmonic Product Spectrum-like Function MEI Tiemin1,FU Tianjiao1,ZHU Xiangrong2 (1.Shenyang Ligong University,Shenyang 110159,China;2.Zibo Mintong Heating Co.,Ltd.,Zibo 255400,China) Abstract:Pitch detection is an important researching topic in signal processing.One of the frequently used algorithms is based on autocorrelation function,estimation errors frequently occur for low signal-to-noise ratio (SNR) speech signals.To overcome such problems and motivated by the harmonic product spectrum (HPS) method,a novel pitch estimation method is proposed by defining an HPS-like function of the autocorrelation of speech signal.The novel method can not only overcome the shortcomings of HPS if one of the harmonics has zero amplitude,but also be more robust under low SNR. Key words:pitch detection;autocorrelation;harmonic product spectrum-like function 中圖分類號:TN912 文獻標志碼:A 文章編號:1003-1251(2016)02-0014-04 作者簡介:梅鐵民(1964—),男,教授,博士,研究方向:信號處理。 收稿日期:2014-12-11