国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于短時(shí)平均幅度差函數(shù)的帶噪語(yǔ)音端點(diǎn)檢測(cè)算法

2014-08-31 10:53
關(guān)鍵詞:濁音基音端點(diǎn)

蔡 萍

(閩江學(xué)院 物理學(xué)與電子信息工程系,福建 福州 350108)

基于短時(shí)平均幅度差函數(shù)的帶噪語(yǔ)音端點(diǎn)檢測(cè)算法

蔡 萍

(閩江學(xué)院 物理學(xué)與電子信息工程系,福建 福州 350108)

傳統(tǒng)的基于自相關(guān)函數(shù)的端點(diǎn)檢測(cè)算法有兩個(gè)方面的問題,一是計(jì)算量大,二是要進(jìn)行語(yǔ)音信號(hào)基音周期的提取.提出了一種改進(jìn)的方法,用短時(shí)平均幅度差函數(shù)代替自相關(guān)函數(shù),節(jié)約了計(jì)算量;利用濁音與噪聲平均幅度差函數(shù)的區(qū)別省去了基音周期的計(jì)算,同時(shí)也避免了誤差帶來(lái)的問題.傳統(tǒng)算法與改進(jìn)算法的仿真比較表明,改進(jìn)算法的檢測(cè)曲線噪聲容限大,所以在低信噪比下也表現(xiàn)出了較強(qiáng)的穩(wěn)定性.

端點(diǎn)檢測(cè);自相關(guān)函數(shù);短時(shí)平均幅度差函數(shù);基音周期

語(yǔ)音端點(diǎn)檢測(cè)是在復(fù)雜的應(yīng)用環(huán)境下,在信號(hào)流中找出語(yǔ)音信號(hào)的起始點(diǎn)和結(jié)束點(diǎn),它是數(shù)字語(yǔ)音處理的重要環(huán)節(jié)[1].在通信系統(tǒng)中,一半以上的時(shí)間傳輸?shù)氖庆o默和背景噪聲,所以如何開發(fā)被浪費(fèi)的信道資源就成了大家關(guān)注的焦點(diǎn).端點(diǎn)檢測(cè)主要有以下方法——基于短時(shí)能量和短時(shí)過零率、基于頻帶方差、基于信息熵、基于倒譜特征、基于基音檢測(cè)和自相關(guān)函數(shù)等,但現(xiàn)有的語(yǔ)音端點(diǎn)檢測(cè)技術(shù)仍然存在起始音的丟失或虛檢等不足[2].

1 短時(shí)自相關(guān)函數(shù)

序列自相關(guān)函數(shù)的性質(zhì):

(1)若此序列是周期的,設(shè)周期為Np,則R(k)=R(k+Np);

(2)R(k)=R(-k);

(3)R(0)≥|R(k)|;

(4)R(0)等于確定性信號(hào)序列的能量或隨機(jī)序列的平均功率.

由性質(zhì)(1)和(3)可知濁音的自相關(guān)函數(shù)周期性出現(xiàn)峰值點(diǎn)且周期為基音周期.

短時(shí)自相關(guān)函數(shù)定義為

(1)

公式(1)也可改寫為

(2)

2 短時(shí)平均幅度差函數(shù)

由于乘法運(yùn)算所需的時(shí)間較長(zhǎng),故自相關(guān)函數(shù)的運(yùn)算量很大[4].簡(jiǎn)化計(jì)算自相關(guān)函數(shù)的方法有多種,如快速傅里葉變換等,但都無(wú)法避免乘法運(yùn)算.為了避免乘法運(yùn)算,一個(gè)簡(jiǎn)單的方法就是利用差值,為此常常采用另一種與自相關(guān)函數(shù)有類似作用的參量,即AMDF.

AMDF只需加減法和取絕對(duì)值的運(yùn)算,與自相關(guān)函數(shù)的相加與相乘運(yùn)算相比,運(yùn)算量減少很多,尤其在硬件實(shí)現(xiàn)語(yǔ)音信號(hào)分析時(shí)很有好處.AMDF能夠代替自相關(guān)函數(shù)的原理是如果信號(hào)是完全的周期信號(hào)(設(shè)周期為Np),則相距為周期的整數(shù)倍的樣點(diǎn)上的幅值相等,差值為0:

d(n)=x(n)-x(n-k)=0.

根據(jù)AMDF的定義,其計(jì)算式可由式(2)改進(jìn)為

(3)

對(duì)于周期性的x(n),F(xiàn)n(k)也呈周期性,與Rn(k)相反的是在Rn(k)為峰值時(shí),對(duì)應(yīng)的Fn(k)是谷點(diǎn),如圖1和圖2所示.

圖1 一幀濁音信號(hào)的短時(shí)自相關(guān)函數(shù)Fig.1 ACF of one frame of voiced sound signal

圖2 一幀濁音信號(hào)的短時(shí)平均幅度差函數(shù)Fig.2 AMDF of one frame of voiced sound signal

3 改進(jìn)的快速算法

傳統(tǒng)的基于短時(shí)自相關(guān)函數(shù)或AMDF的端點(diǎn)檢測(cè)算法往往結(jié)合基音周期進(jìn)行[5].一般的方法是通過同態(tài)處理得到基音周期的值,然后判斷在基音周期的整數(shù)倍上是否出現(xiàn)短時(shí)平均幅度差函數(shù)的谷點(diǎn).這種方法會(huì)產(chǎn)生以下幾個(gè)問題:一是基音周期的選取要十分準(zhǔn)確,否則谷點(diǎn)并不出現(xiàn)在整數(shù)倍上而是在這些值附近;二是計(jì)算倒譜的過程十分復(fù)雜,計(jì)算量相當(dāng)大[6];三是只有濁音信號(hào)的AMDF才具有周期性的谷值,清音信號(hào)不具有這種特點(diǎn),而嚴(yán)格地確定清音信號(hào)的起點(diǎn)又需要耗費(fèi)大量的工作.針對(duì)以上問題,提出了一種改進(jìn)的快速算法,步驟如下:

(1)將原始語(yǔ)音信號(hào)以固定語(yǔ)音幀長(zhǎng)度及固定語(yǔ)音幀幀移,轉(zhuǎn)成語(yǔ)音幀,然后用公式(3)計(jì)算每一語(yǔ)音幀的Fn(k).

(2)找出Fn(k)的所有谷點(diǎn),通過計(jì)算y(i)=sgn[Fn(i+1)-Fn(i)]-sgn[Fn(i)-Fn(i-1)],找到所有令y(i)=2的點(diǎn)i構(gòu)成的矢量v(n),sgn(x)是符號(hào)函數(shù),只有在谷底處才滿足y(i)=2.

(3)根據(jù)寬帶噪聲幅度分布的隨機(jī)性可知,噪聲信號(hào)的AMDF也具有隨機(jī)性.計(jì)算v(n)的長(zhǎng)度L,它標(biāo)志著該幀信號(hào)出現(xiàn)谷點(diǎn)的個(gè)數(shù).設(shè)置一個(gè)門限L0,當(dāng)L>L0時(shí)判斷為噪聲幀,當(dāng)L

(4)一般來(lái)說(shuō),濁音總是出現(xiàn)在清音之后.當(dāng)出現(xiàn)噪聲幀到濁音幀的轉(zhuǎn)變時(shí),將該濁音幀的前兩幀設(shè)定為清音幀.過程中也可能出現(xiàn)元音,此時(shí)濁音幀之前無(wú)清音幀.為了簡(jiǎn)單起見,這點(diǎn)開銷是允許的.

4 仿真結(jié)果與分析

仿真在Matlab操作環(huán)境下進(jìn)行.純凈語(yǔ)音的采樣頻率是8 kHz,寬帶噪聲采用白噪聲.首先以0 dB的信噪比將純凈語(yǔ)音與白噪聲混合,再以-5 dB的信噪比將純凈語(yǔ)音與白噪聲混合,分別用傳統(tǒng)的基于短時(shí)平均幅度差函數(shù)的方法和改進(jìn)的算法進(jìn)行仿真,仿真結(jié)果如圖3和圖4所示,圖中純凈語(yǔ)音信號(hào)和帶噪語(yǔ)音信號(hào)均進(jìn)行了幅度歸一化處理.

圖3 信噪比為0 dB時(shí)的端點(diǎn)檢測(cè)結(jié)果Fig.3 Detection results in case of SNR 0 dB

圖4 信噪比為-5 dB時(shí)的端點(diǎn)檢測(cè)結(jié)果Fig.4 Detection results in case of SNR -5 dB

當(dāng)信噪比為0 dB時(shí),即噪聲與語(yǔ)音的平均功率相同時(shí),短時(shí)平均幅度差函數(shù)曲線顯示語(yǔ)音幀與噪聲幀的差幅明顯,此時(shí)判決門限可取50~70 V,對(duì)誤差的容限較大.當(dāng)信噪比為-5 dB時(shí),語(yǔ)音信號(hào)已完全湮沒于噪聲信號(hào)里,但檢測(cè)曲線仍然較清晰,語(yǔ)音幀與噪聲幀的差幅仍較明顯,判決門限可取55~65 V,此時(shí)仍允許一定的誤差.

仿真結(jié)果顯示,不論是在0 dB還是-5 dB的噪聲環(huán)境下,改進(jìn)的算法檢測(cè)的準(zhǔn)確度都要比傳統(tǒng)算法高,特別是在清音部分.在-5 dB的信噪比條件下,傳統(tǒng)算法出現(xiàn)了明顯的不穩(wěn)定性,而改進(jìn)的算法基本沒有太大影響,說(shuō)明后者的抗噪聲能力高于前者.此外,改進(jìn)的算法不依賴基音周期的確切值,避免了基音周期的計(jì)算,再加上用幅度差代替了自相關(guān)計(jì)算,計(jì)算量大大減少.

5 結(jié)束語(yǔ)

傳統(tǒng)的基于自相關(guān)函數(shù)或AMDF的端點(diǎn)檢測(cè)算法要進(jìn)行基音周期的計(jì)算或提取,運(yùn)算量大且準(zhǔn)確度的要求高.改進(jìn)的算法利用噪聲信號(hào)與語(yǔ)音信號(hào)的不同特性,通過計(jì)算AMDF的谷點(diǎn)數(shù),有效地區(qū)分了噪音幀與濁音幀,簡(jiǎn)化了計(jì)算過程且準(zhǔn)確率較高.另外,采用在噪音幀轉(zhuǎn)化為濁音幀時(shí)將前兩幀設(shè)定為清音幀的做法,解決了大部分輔音和元音結(jié)合的清音檢測(cè).雖然對(duì)少量的元音而言會(huì)造成一定的開銷,但與復(fù)雜度高的算法相比也是值得的,仿真結(jié)果也表明改進(jìn)后的算法在低信噪比時(shí)仍可保持較好的穩(wěn)定性.

[1] Siegel L J,Bessey A C.Voiced/unvoiced/mixed excitation classification of speech[J].IEEE Transaction on Acoustics,Speech,Signal Processing,1982,30(3):451-460.

[2] 胡立波.帶噪語(yǔ)音端點(diǎn)檢測(cè)算法的研究[D].南京:南京信息工程大學(xué),2009:1-3.

[3] 席大林,李如瑋,陳海龍.基于自相關(guān)最大值和過門限率的語(yǔ)音端點(diǎn)檢測(cè)[J].語(yǔ)音技術(shù),2010,34(4):53-57.

[4] 劉淑華,胡強(qiáng),覃團(tuán)發(fā),等.基于自相關(guān)函數(shù)最大值的語(yǔ)音端點(diǎn)檢測(cè)方法[J].語(yǔ)音技術(shù),2006,23(12):47-50.

[5] Mrtin A,Mauuary L.Voicing parameter and energy based speech /non-speech detection for speech recognition in adverse conditions [C]∥Proceedings of Euro-Speech 03.Geneva:[s.n.],2003:3069-3072.

[6] 董胡.一種改進(jìn)的基于倒譜距離端點(diǎn)檢測(cè)方法研究[J].計(jì)算機(jī)與數(shù)字工程,2013,41(7):1078-1080.

Analgorithmofend-pointdetectionofspeechwithnoisebasedonshort-timeaveragemagnitudedifferencefunction

CAI Ping

(DepartmentofPhysics&ElectronicInformationEngineering,MinjiangUniversity,Fuzhou350108,China)

Traditional end-point detection algorithms based on auto-correlation function have two major problems. One is large computational efforts, the other is the extraction of pitch period. Put forward an advanced method, which uses short-time average magnitude difference function to replace auto-correlation function and reduces computational amount. Meanwhile, by means of the difference of AMDF of voiced sound and noise, calculation of pitch period is avoided, so is the related problems provoked by inaccurate estimation of pitch period. By simulating and comparison of traditional method and advanced method, it is found that noise margin of detecting curve of the latter is bigger, so it shows high stability even in the low SNR(signal to noise ratio) environment.

end-point detection; auto-correlation function; short-time average magnitude difference function; pitch period

2014-03-12

閩江學(xué)院科技育苗項(xiàng)目(YKY12002)

蔡萍(1981-),女,福建寧德人,講師,主要從事語(yǔ)音信號(hào)處理方面的研究.

TP301.6

A

1674-330X(2014)03-0026-04

猜你喜歡
濁音基音端點(diǎn)
非特征端點(diǎn)條件下PM函數(shù)的迭代根
不等式求解過程中端點(diǎn)的確定
基于基音跟蹤的語(yǔ)音增強(qiáng)研究
日語(yǔ)半濁音的變化規(guī)律研究
清濁音分離抗噪的語(yǔ)音識(shí)別算法的研究
有關(guān)鼻濁音使用實(shí)態(tài)的研究
——以NHK新聞為中心
一種基音周期檢測(cè)中減小中值平滑誤差的方法
基丁能雖匹配延拓法LMD端點(diǎn)效應(yīng)處理
日語(yǔ)與永州方言濁音相似點(diǎn)小議①
一種高效的基音估計(jì)算法