国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

低信噪比下語音端點檢測算法改進(jìn)設(shè)計

2018-03-06 08:06:12謝俊儀
中國刑警學(xué)院學(xué)報 2018年1期
關(guān)鍵詞:波包端點高階

姜 囡 謝俊儀

(中國刑事警察學(xué)院聲像資料檢驗技術(shù)系 遼寧 沈陽 110035)

1 引言

近年來,隨著語音信號的端點檢測技術(shù)的發(fā)展成熟,常用的方法也多種多樣。小波分析(Wavelet Analysis,WA)在時域和頻域都能夠很好的表現(xiàn)信號的局部特征,且時頻分辨率是可變的,能夠滿足語音信號提取特征量的需求,但是在信號的高頻段分辨率較差,利用小波變換去噪的關(guān)鍵就是閾值的選取,閾值過小則重構(gòu)信號中仍有噪聲存在或信號中有效部分濾掉即信號失真[1-4]。小波包變換(Wavelet Packet Transform)突破了小波分析對信號頻帶劃分的局限性,不僅對低通子帶進(jìn)行分析,也對高通分量進(jìn)行分解,可以將頻帶進(jìn)行多層次的劃分,是一種更加精細(xì)的分析方法,但是在最優(yōu)層級的選取上存在困難[5-8]。高階累積量(Higherorder Cumulant)的一個重要特征是服從高斯分布信號的高階累積量恒等于零,而非高斯信號的高階累積量不為零,利用這一特點將非高斯的語音信號從高斯噪聲中提取出來,但在實際應(yīng)用中,也常會遇到非高斯的加性噪聲,僅靠高階累積量來提取語音信號會導(dǎo)致準(zhǔn)確率下降[9-12]。

本文通過提出基于小波包和高階累積量的語音端點檢測技術(shù),幫助提高語音端點檢測的準(zhǔn)確率。改進(jìn)的算法通過結(jié)合小波包變換和高階累積量,避免了小波變換在時間和頻率方面對信號分析不全面以及高階累積量在復(fù)雜噪聲環(huán)境下只考慮高斯噪聲的局限性。實驗表明基于小波包和高階積累的語音端點檢測技術(shù)更具有優(yōu)越性,在法庭科學(xué)實踐領(lǐng)域具有重要的意義[13]。

2 基于小波變換的語音端點檢測

小波變換(Wavelet Transform,WT)是一種時頻分析的數(shù)學(xué)方法,它能夠表征時間和頻率的局部變換,具有振幅正負(fù)相間的振蕩形式。小波變換在時間和頻率兩個方面都有很好的表達(dá)信號局部特征的能力。在語音信號的高頻部分有很好的時間分辨率,在語音信號的低頻部分則有很好的頻率分辨率,窗函數(shù)的寬度能隨著頻率的變化而變化。它能夠提供一個隨頻率改變的“時間-頻率”窗口,使用長寬大小不一的長方形時頻分析網(wǎng)格。適用于分析具有固定比例帶寬的非平穩(wěn)信號,并能夠從原始信號中提取出有價值的部分信號,是進(jìn)行信號時頻分析和處理的理想工具。綜合利用小波變換在時間和頻率上表達(dá)信息的特征,以及在語音信號中含有有用信息的信號與背景音信號的頻譜存在的顯著差異的特點,來進(jìn)行語音信號的端點檢測。

利用小波變換進(jìn)行語音端點檢測的基本流程如下:

(1)將原始語音信號以一定的幀長進(jìn)行預(yù)處理,即分幀處理;

(2)對分幀后的數(shù)據(jù)及端點檢測的門限值進(jìn)行小波變換處理;

(3)計算小波變換后數(shù)據(jù)的均值和方差;

(4)若某一幀的方差大于門限值,則說明在這一幀之后的語音信號中包含有效信息,那么這一幀即為起始幀,而在前面存在起始幀的情況下,若某一幀方差小于門限值則這一幀即為結(jié)束幀。

小波變換在高頻段的頻率分辨率和低頻段的時間分辨率較差的缺點,利用小波變換不能夠準(zhǔn)確、全面地進(jìn)行端點檢測。本文在小波變換的基礎(chǔ)上提出了小波包變換。小波包變換提高了信號的時頻分辨率,是一種更精細(xì)的信號分析方法。

3 高階累積量理論在語音端點檢測中的應(yīng)用

高階累積量是一種常用的高階統(tǒng)計量(Higher-order Statistics),主要應(yīng)用于信號處理和系統(tǒng)理論領(lǐng)域。

設(shè){x(n)}為零均值k階平穩(wěn)隨機(jī)過程,則該過程的k階累積量ck,x(m1,m2,…,mk-1)定義為隨機(jī)變量{x(n),x(n+m1),…,x(n+mk-1)}的k階聯(lián)合累積量,即:

由于{x(n)}是k階平穩(wěn)的,故{x(n)}的k階累積量僅僅是時延m1,m2,…,mk-1的函數(shù),而與時刻n無關(guān),其二階、三階和四階累積量分別為:

可以看出,{x(n)}的二階累積量正好就是其自相關(guān)函數(shù),三階累積量也正好等于其三階矩。而對于{x(n)}的進(jìn)行歸一化處理后的峰度(Kurtosis)K為:

高斯過程的高階累積量恒等于零,而非高斯信號的高階累積量不為零。也就是說含有加性高斯噪聲的非高斯信號的高階累積量理論上等于信號本身的累計量。因此,可以借助高階累積量抑制高斯噪聲,建立非高斯信號模型,從而將非高斯信號從高斯噪聲中提取出來。

在實際語音信號檢測中,背景噪聲很復(fù)雜,高斯噪聲假設(shè)難以成立。在這種情況下,僅利用高階累積量進(jìn)行語音端點檢驗不夠準(zhǔn)確。為了提高語音端點檢測的效率,提出了基于小波包和高階積累的語音端點檢測方法。

4 基于小波包和高階累積量的語音端點檢測

本文提出了一種基于小波包變換和高階累積量的檢測算法。該方法利用小波包的正交性和完備性,提高語音信號高頻段的分辨率;同時結(jié)合基于高階累積量的高斯判別準(zhǔn)則,用于在小波包域進(jìn)行高斯性檢驗,最終得到了語音端點的精確檢測。

4.1 一維離散小波包變換

小波包(Wavelet Packet)是由Coifman、Meyer、Quaker和Wickerhauser(1989)提出的,小波包分解是一種相對精細(xì)的分解方法,它不僅能分解信號的低頻部分,并且還能對高頻部分進(jìn)行分解。

一維小波包分解公式:

小波包對一維時間序列的分解特性[14]示意圖如下:

圖1 小波包對時間序列的分解

4.2 基于峰度的高斯判別準(zhǔn)則

由于高斯性的判斷并不依賴于每個頻帶的信號能量大小,所以選擇峰度作為一個歸一化的四階統(tǒng)計量。理論上,判斷信號是否服從高斯分布就是讓信號的峰度值與0相比。如果等于0,就是高斯性噪聲,反之就是非高斯性噪聲。但由于在實際中存在誤差,信號的峰度是通過與一個置信區(qū)間進(jìn)行檢驗的,如果峰度在這個區(qū)間了,則認(rèn)為信號是服從高斯性分布的高斯性噪聲,否則認(rèn)為非是高斯性的。這里采用了一種基于概率統(tǒng)計理論中經(jīng)典的切比雪夫不等式(Tchebychev Inequality)的高斯判別準(zhǔn)則。

利用切比雪夫不等式,通過隨機(jī)變量X的期望和方差,對X的概率分布進(jìn)行估計。

設(shè)隨機(jī)變量X有數(shù)學(xué)期望E(X),方差D(X),則對任意實數(shù)ε>0,切比雪夫不等式為:

將式(15)代入式(14),可得:

由此可得高斯判別準(zhǔn)則:

4.3 基于小波包和高階累積量的語音端點檢測算法設(shè)計

利用確定的高斯判別準(zhǔn)則對小波包分解系數(shù)進(jìn)行高斯性檢驗。將原始語音信號進(jìn)行小波包分解,由于高階累積量是一種基于統(tǒng)計學(xué)的概念,在處理離散信號時,采集的信號越長,統(tǒng)計的質(zhì)量也就越高,這里通過自下而上的合并準(zhǔn)則將相鄰的4個具有同一節(jié)點高斯性頻帶合并;合并后,利用基于高階累積量的高斯判別準(zhǔn)則計算新的系數(shù),并將高斯性系數(shù)剔除即置為零,同時將分解后最低頻帶上的小波包系數(shù)置為零。這樣去除噪聲之后保留非高斯性系數(shù)重建目標(biāo)。其中,頻帶合并準(zhǔn)則為:

算法流程圖如下:

圖2 基于小波包和高階累積量的語音端點檢測算法流程圖

由圖2可以看出,改進(jìn)的算法是對小波包分解后所有頻帶分析高斯特性,并實施系數(shù)濾波的。其中,選擇小波包分解層數(shù)時,可結(jié)合以下方法:選擇一段沒有信號的時段,分析噪聲在子空間上的小波包變換的峰度與偏差,若不滿足高斯分布要求則繼續(xù)分解,直到滿足高斯分布,并以該層數(shù)作為小波包分解層數(shù)。

5 實驗分析

為了驗證本文提出的語音端點檢測算法的可行性和有效性,在MATLAB環(huán)境下對算法進(jìn)行實驗分析[15-16],實驗的語音樣本來源為全國普通話水平考試指導(dǎo)用光盤中的語音材料,截取不同發(fā)音情況的30段語音。噪聲使用MATLAB生成的高斯白噪聲、隨機(jī)噪聲,以及 Noise - 92 數(shù)據(jù)庫中的 Pink 噪聲與語音信號疊加為不同的信噪比(-5、0、5、10、15 dB)的帶噪語音。分別以基于小波變換的語音端點檢測方法和基于小波包和高階累積量的語音端點檢測方法對語音進(jìn)行端點檢測。

圖3分別給出了小波算法和本算法分別在信噪比為0dB的條件下,原始語音為“藍(lán)天、白云、碧綠的大?!钡募儍粽Z音分別疊加白噪聲和 Pink 噪聲后語音端點檢測的實驗結(jié)果(實線代表語音起點,虛線代表語音終點)。從結(jié)果可以看出,在信噪比為0dB的惡劣條件下,基于小波包和高階累積量的語音端點檢測算法可以有效地檢測出每一段語音的起點和終點,且在多種噪聲條件下都能有效地工作,具有一定的抗噪魯棒性。

圖3 分別疊加不同噪聲的端點檢測結(jié)果

由圖3可見,在信噪比極低的情況下,原始語音信號中幅度小的部分完全被噪聲覆蓋,尤其體現(xiàn)在一個語音段的起始和結(jié)束部分。小波變換方法很容易將處于這種狀態(tài)下的語音信號誤讀,或是連同噪聲部分一起被認(rèn)定為語音段,或是連同語音部分一起被認(rèn)定為噪聲段。且由于閾值選取上的困難,在小波變換中將噪聲段中幅度較小的部分也誤讀成語音段保留在重構(gòu)語音中,可見小波變換的結(jié)果受閾值影響較大,而小波包則改進(jìn)了這一方面的局限性。

為了驗證文中提出的基于小波包和高階累積量的語音端點檢測方法的有效性,將其與基于小波變換的語音端點檢測方法進(jìn)行比較,準(zhǔn)確率的計算公式[17]為:

圖4和圖5分別為在信噪比為-5、0、5、10、15db時,噪聲為白噪聲和pink噪聲的兩種算法的端點檢測的準(zhǔn)確率。

由圖4、圖5和圖6可以清晰地看出本文算法的語音端點檢測準(zhǔn)確率高于傳統(tǒng)的小波算法,尤其是在復(fù)雜噪聲的干擾下,本文算法仍能夠較為準(zhǔn)確的進(jìn)行端點檢測。在白噪聲條件下,本文算法的準(zhǔn)確率遠(yuǎn)高于小波算法,尤其是在信噪比進(jìn)一步減低的情況下,小波算法的檢測效果下降明顯,體現(xiàn)出了高階累積量在抗白噪聲和隨機(jī)噪聲方面突出的準(zhǔn)確性。而在pink噪聲條件下,本文算法的高準(zhǔn)確率則充分說明了改進(jìn)的算法對不同噪聲在低信噪比的干擾下任然具有良好的準(zhǔn)確性和魯棒性。處理后得到的重構(gòu)語音信號在波形上更加清晰,包絡(luò)線更加明顯。

圖4 白噪聲下兩種算法端點檢測準(zhǔn)確率

圖5 隨機(jī)噪聲下兩種算法端點檢測準(zhǔn)確率

圖6 pink噪聲下兩種算法端點檢測準(zhǔn)確率

6 結(jié)論

本文將小波包與高階累積量相結(jié)合,提出一種改進(jìn)的基于小波包和高階累積量的語音端點檢測方法,利用小波包對語音信號進(jìn)行分解,然后利用高階累量實現(xiàn)語音信號的端點檢測。實驗結(jié)果表明,與基于小波變換的語音端點檢測方法相比,該方法能夠較準(zhǔn)確的檢測到語音的起始點和結(jié)束點,具有更好的穩(wěn)定性。改進(jìn)的方法既結(jié)合了小波包能夠完全重構(gòu)信號、提高高頻段分辨率以及利用置信區(qū)間確定高階累積量的判別式準(zhǔn)則的優(yōu)點,克服了小波變換只對低頻進(jìn)行遞歸分解、高頻分辨率低以及高階累積量方法只考慮高斯噪聲的缺點,該方法具有更加優(yōu)越的端點檢測性能。

[1]許開宇,等.基于小波分析的漢語語音識別[J].哈爾濱工程大學(xué)學(xué)報,1996(4):20-26.

[2]黎林,等.基于小波分析與神經(jīng)網(wǎng)絡(luò)的語音端點檢測研究[J].電子測量與儀器學(xué)報,2013(6):528-534.

[3]魯遠(yuǎn)耀,等.強(qiáng)噪聲環(huán)境下改進(jìn)的語音端點測算法[J].計算機(jī)應(yīng)用,2014(5):1386-1390.

[4]張宇波,等.基于小波分析與PSO-ELM的語音端點檢測算法研究[J].中北大學(xué)學(xué)報(自然科學(xué)版),2016(1):33-38.

[5]馮流寶.基于聽覺掩蔽效應(yīng)的小波包語音增強(qiáng)方法研究[J].通信技術(shù),2010(3):139-141.

[6]王鐘斐,等.基于小波包的語音譜熵端點檢測方法研究[J].計算機(jī)與數(shù)字工程,2011(4):1-4.

[7]Ben Messaoud M A, Bouzid A, Ellouze N. Speech enhancement based on wavelet packet of an improved principal component analysis[J]. Computer Speech & Language,2016,(C):58-72.

[8]Islam M T, Shahnaz C, Zhu W P, et al. Rayleigh modeling of teager energy operated perceptual wavelet packet coefficients for enhancing noisy speech[J]. Speech Communication,2017,(C):64-74.

[9]王桂琴,王墨林.用高階累積量提取高斯噪聲中信號的研究[J].數(shù)據(jù)采集與處理,1995(a01):24-27.

[10]陶立,等.基于高階累積量參數(shù)的語音寂聲段和語音段檢測方法[J].語音、通信及信號處理,2007(4):209-211.

[11]羅雅琴.基于獨立分量分析的語音識別系統(tǒng)[D].合肥:安徽大學(xué),2015:7-27.

[12]羅雅琴,等.滑動窗累積量的遞推估計算法及其在語音端點檢測中的應(yīng)用[J].聲學(xué)學(xué)報,2015(5):730-738.

[13]張翠玲.法庭說話人識別語音數(shù)據(jù)的構(gòu)建[J].中國刑警學(xué)院學(xué)報,2016(4):61-64.

[14]宋知用.MATLAB在語音信號分析與合成中的應(yīng)用[M].北京:北京航空航天大學(xué)出版社,2013:44-45.

[15]張雪英.數(shù)字語音處理以及MATLAB仿真[M].北京:電子工業(yè)出版社,2010:22-73.

[16]張賢達(dá).現(xiàn)代信號處理(第3版)[M].北京:清華大學(xué)出版社,2015:400-430.

[17]王洋,等.基于時頻結(jié)合的帶噪語音端點檢測算法[J].黑龍江大學(xué)學(xué)報(自然科學(xué)版)2016(3):410-415.

猜你喜歡
波包端點高階
非特征端點條件下PM函數(shù)的迭代根
有限圖上高階Yamabe型方程的非平凡解
高階各向異性Cahn-Hilliard-Navier-Stokes系統(tǒng)的弱解
滾動軸承壽命高階計算與應(yīng)用
哈爾濱軸承(2020年1期)2020-11-03 09:16:02
不等式求解過程中端點的確定
基于小波包Tsallis熵和RVM的模擬電路故障診斷
參數(shù)型Marcinkiewicz積分算子及其交換子的加權(quán)端點估計
基于小波包變換的電力系統(tǒng)諧波分析
基丁能雖匹配延拓法LMD端點效應(yīng)處理
小波包理論與圖像小波包分解
互助| 洱源县| 襄城县| 梁平县| 米林县| 荔波县| 两当县| 贡嘎县| 汝州市| 安义县| 扶绥县| 绥芬河市| 富源县| 英德市| 梅河口市| 油尖旺区| 元江| 菏泽市| 清河县| 游戏| 盐山县| 大城县| 台南市| 聂荣县| 西城区| 额敏县| 塔河县| 油尖旺区| 大厂| 雷州市| 象山县| 阳高县| 利津县| 平乡县| 通山县| 玛沁县| 宾阳县| 清河县| 鄂尔多斯市| 阆中市| 嘉义市|