国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

改進(jìn)相位補(bǔ)償結(jié)合諧波重構(gòu)的語(yǔ)音增強(qiáng)方法

2022-04-21 08:01馬建芬張朝霞
關(guān)鍵詞:先驗(yàn)信噪比語(yǔ)料庫(kù)

崔 磊,馬建芬+,張朝霞

(1.太原理工大學(xué) 信息與計(jì)算機(jī)學(xué)院,山西 晉中 030600;2.太原理工大學(xué) 物理與光電工程學(xué)院,山西 晉中 030600)

0 引 言

語(yǔ)音增強(qiáng)的目的就是從含噪語(yǔ)音中去除背景噪聲。但是多數(shù)語(yǔ)音增強(qiáng)方法僅關(guān)注幅度譜的優(yōu)化,卻忽視了相位信息對(duì)于語(yǔ)音的重要性。已有學(xué)者對(duì)相位信息的優(yōu)化[1-5]進(jìn)行了研究,其中最具代表性的就是Anthony P.Stark等提出的相位譜補(bǔ)償函數(shù),它將含噪語(yǔ)音幅度譜與優(yōu)化過(guò)的相位譜重新結(jié)合來(lái)產(chǎn)生增強(qiáng)語(yǔ)音。但是這種方法有一個(gè)較大缺陷就是其補(bǔ)償因子是一個(gè)固定值無(wú)法適應(yīng)非平穩(wěn)噪聲的變化情況,這會(huì)對(duì)相位優(yōu)化產(chǎn)生一定的影響。此外多數(shù)語(yǔ)音增強(qiáng)方法在降噪過(guò)程中由于語(yǔ)音的諧波結(jié)構(gòu)遭到破壞會(huì)出現(xiàn)一定程度的語(yǔ)音失真。

針對(duì)傳統(tǒng)相位改進(jìn)方法中補(bǔ)償因子無(wú)法改變以及降噪過(guò)程中出現(xiàn)的語(yǔ)音失真等問(wèn)題,提出改進(jìn)相位補(bǔ)償結(jié)合諧波重構(gòu)的語(yǔ)音增強(qiáng)方法。該方法利用先驗(yàn)信噪比來(lái)動(dòng)態(tài)調(diào)整補(bǔ)償因子。因目前大多數(shù)使用的先驗(yàn)信噪比估計(jì)算法[6-8]如直接判決算法、兩步噪聲消除算法、改進(jìn)型直接判決算法等都存在一定的缺陷[9],而這些缺陷會(huì)導(dǎo)致先驗(yàn)信噪比的估計(jì)值較真實(shí)值存在較大誤差,為解決這一問(wèn)題本文采用深度學(xué)習(xí)模型[10,11]來(lái)估計(jì)先驗(yàn)信噪比。在此基礎(chǔ)上針對(duì)在降噪過(guò)程中出現(xiàn)的語(yǔ)音失真采用諧波重構(gòu)的方式對(duì)語(yǔ)音的諧波結(jié)構(gòu)進(jìn)行恢復(fù),最終實(shí)現(xiàn)語(yǔ)音增強(qiáng)。通過(guò)實(shí)驗(yàn)對(duì)比,進(jìn)一步探討本文方法的性能。

1 傳統(tǒng)相位譜補(bǔ)償函數(shù)

假定x(t)表示純凈語(yǔ)音,z(t)表示噪聲,x(t)和z(t)相互獨(dú)立,t表示離散時(shí)間變量,則含噪語(yǔ)音y(t)可表示為

y(t)=x(t)+z(t)

(1)

對(duì)式(1)兩邊同時(shí)做短時(shí)傅里葉變換即可得含噪語(yǔ)音頻譜Y(n,k),純凈語(yǔ)音頻譜X(n,k),噪聲頻譜Z(n,k),Y(n,k)的極坐標(biāo)形式表示如下

Y(n,k)=|Y(n,k)|exp(j∠Y(n,k))

(2)

其中,|Y(n,k)|表示含噪語(yǔ)音第n幀第k個(gè)頻點(diǎn)的幅度信息,∠Y(n,k)表示含噪語(yǔ)音第n幀第k個(gè)頻點(diǎn)的相位信息。

雖然相位信息可以有效提升語(yǔ)音質(zhì)量,但是由于相位譜的高度非結(jié)構(gòu)化特性,很難對(duì)相位進(jìn)行直接估計(jì),鑒于此Paliwal等提出了相位譜補(bǔ)償方法,該方法可以利用噪聲特性對(duì)含噪語(yǔ)音相位信息進(jìn)行優(yōu)化,相位譜補(bǔ)償函數(shù)如下

(3)

其中,λ為補(bǔ)償因子,φ(k)為如下所示判決函數(shù)

(4)

Y∧(n,k)=Y(n,k)+Λ(n,k)

(5)

其中,Y∧(n,k)表示補(bǔ)償后的第n幀第k個(gè)頻點(diǎn)的含噪語(yǔ)音頻譜,對(duì)Y∧(n,k)取相位即可得到補(bǔ)償后的相位譜

∠Y∧(n,k)=arg[Y∧(n,k)]

(6)

將補(bǔ)償后的相位譜與含噪語(yǔ)音幅度譜結(jié)合即可得到增強(qiáng)語(yǔ)音頻譜S∧(n,k)

S∧(n,k)=|Y(n,k)|exp(j∠Y∧(n,k))

(7)

傳統(tǒng)的相位譜補(bǔ)償函數(shù)中λ是一個(gè)固定值,一般取3.74。但是由于λ的固定性它無(wú)法反應(yīng)噪聲的實(shí)時(shí)變化情況,現(xiàn)實(shí)生活中大多數(shù)噪聲都是非平穩(wěn)噪聲,簡(jiǎn)單的通過(guò)一個(gè)經(jīng)驗(yàn)值無(wú)法很好的根據(jù)噪聲的變化情況來(lái)確定該對(duì)相位譜進(jìn)行何種補(bǔ)償。

分析語(yǔ)譜圖,圖1(a)中的Clean是純凈語(yǔ)音,圖1(b)中的Mixture是含噪語(yǔ)音,圖1(c)中的PSC是使用傳統(tǒng)相位譜補(bǔ)償方法結(jié)合含噪語(yǔ)音幅度譜得到的增強(qiáng)語(yǔ)音。從語(yǔ)譜圖中可以看出傳統(tǒng)的相位譜補(bǔ)償方法可以在一定程度上抑制噪聲,但是整體效果并不理想而且失真現(xiàn)象較為嚴(yán)重,這一定程度上是由于結(jié)合了含噪語(yǔ)音幅度譜導(dǎo)致的,但是也能反應(yīng)出傳統(tǒng)相位譜補(bǔ)償方法對(duì)于語(yǔ)音質(zhì)量提高的局限性。

2 相位改進(jìn)結(jié)合諧波重構(gòu)的語(yǔ)音增強(qiáng)方法

相位改進(jìn)結(jié)合諧波重構(gòu)的語(yǔ)音增強(qiáng)方法主要分為3部分,第一部分是對(duì)相位譜補(bǔ)償函數(shù)進(jìn)行改進(jìn),第二部分是通過(guò)深度學(xué)習(xí)模型估計(jì)先驗(yàn)信噪比,第三部分是對(duì)增強(qiáng)后的語(yǔ)音進(jìn)行諧波重構(gòu)。

2.1 改進(jìn)的相位譜補(bǔ)償函數(shù)

傳統(tǒng)相位譜補(bǔ)償方法的關(guān)鍵在于補(bǔ)償函數(shù)Λ(n,k),而補(bǔ)償因子λ又是補(bǔ)償函數(shù)中較為關(guān)鍵的一環(huán)。傳統(tǒng)相位譜補(bǔ)償方法中補(bǔ)償因子是一個(gè)固定值,這會(huì)帶來(lái)一個(gè)問(wèn)題就是不能很好地根據(jù)噪聲能量的變化情況對(duì)補(bǔ)償因子做出動(dòng)態(tài)調(diào)整,因此傳統(tǒng)相位譜補(bǔ)償方法會(huì)存在一定的不足。針對(duì)傳統(tǒng)相位譜補(bǔ)償方法中出現(xiàn)的問(wèn)題,本文提出一種改進(jìn)的相位譜補(bǔ)償方法,該方法利用含噪語(yǔ)音先驗(yàn)信噪比這一參數(shù)對(duì)補(bǔ)償因子進(jìn)行優(yōu)化,先驗(yàn)信噪比可以很好反應(yīng)純凈語(yǔ)音和噪聲的能量變化情況。將含噪語(yǔ)音先驗(yàn)信噪比與相位譜補(bǔ)償函數(shù)相結(jié)合可以很好地通過(guò)信噪比變化情況動(dòng)態(tài)調(diào)整相位譜補(bǔ)償函數(shù),所提出的改進(jìn)的相位譜補(bǔ)償函數(shù)中補(bǔ)償因子如下

(8)

此外,補(bǔ)償因子λnew中c的取值也會(huì)影響到增強(qiáng)語(yǔ)音的質(zhì)量,經(jīng)多次實(shí)驗(yàn)取c=7.5。將式(8)帶入式(3)中得到新的相位譜補(bǔ)償函數(shù)

(9)

結(jié)合式(9)和式(6)可以得到新的相位譜

∠Y∧new(n,k)=arg[Y∧new(n,k)]=

arg[Y(n,k)+Λnew(n,k)]

(10)

2.2 先驗(yàn)信噪比估計(jì)

傳統(tǒng)的先驗(yàn)信噪比估計(jì)算法大多存在一定的不足,而改進(jìn)的相位譜補(bǔ)償方法對(duì)于相位譜的優(yōu)化主要依賴于對(duì)先驗(yàn)信噪比的準(zhǔn)確估計(jì),為了更好地解決這一問(wèn)題本文將采用Deep XI深度學(xué)習(xí)模型,其中Deep代表深度學(xué)習(xí)而XI代表先驗(yàn)信噪比。Deep XI模型是一種結(jié)合了殘差網(wǎng)絡(luò)[12]和時(shí)域卷積網(wǎng)絡(luò)[13]可以有效針對(duì)先驗(yàn)信噪比估計(jì)的深度學(xué)習(xí)框架。Deep XI模型對(duì)于先驗(yàn)信噪比的估計(jì)主要包括兩個(gè)階段,第一階段是從含噪語(yǔ)音幅度譜中估計(jì)先驗(yàn)信噪比的映射值,第二階段是通過(guò)映射得到的先驗(yàn)信噪比計(jì)算先驗(yàn)信噪比估計(jì)值。Deep XI模型估計(jì)先驗(yàn)信噪比的語(yǔ)音增強(qiáng)方法實(shí)驗(yàn)框架如圖2所示,它包括訓(xùn)練和增強(qiáng)兩個(gè)部分,本文主要對(duì)訓(xùn)練部分的網(wǎng)絡(luò)配置、特征提取、代價(jià)函數(shù)以及增強(qiáng)部分的語(yǔ)音合成進(jìn)行簡(jiǎn)要介紹。

圖2 Deep XI估計(jì)先驗(yàn)信噪比實(shí)驗(yàn)框架

2.2.1 網(wǎng)絡(luò)配置

Deep XI模型的搭建參考了文獻(xiàn)[10,11],模型首先是一個(gè)大小為256維的全連接層,該全連接層包含歸一化層以及整流線性單元(ReLU)激活函數(shù)。全連接層后面跟40層殘差結(jié)構(gòu),每層殘差結(jié)構(gòu)包含3個(gè)一維因果膨脹卷積層,每個(gè)卷積層通過(guò)層歸一化和ReLU激活函數(shù)進(jìn)行預(yù)激活,其中第一層卷積核為1,輸出大小為64維,膨脹率為1;第二層卷積核為3,輸出大小為64維,膨脹率隨殘差塊指數(shù)增加2的冪次,若超過(guò)最大膨脹率,則再次循環(huán);第三層卷積核為1,輸出為256維,膨脹率為1。最后一個(gè)殘差結(jié)構(gòu)后面跟一個(gè)帶有sigmoid單元的全連接層作為輸出層,用來(lái)獲得模型的輸出。模型訓(xùn)練過(guò)程中使用的梯度下降參數(shù)優(yōu)化算法為Adam,初始學(xué)習(xí)率為0.001。

2.2.2 特征提取

將純凈語(yǔ)音和噪聲逐幀相加得到含噪語(yǔ)音,提取分幀后的含噪語(yǔ)音幅度譜|Y(n,k)|作為網(wǎng)絡(luò)的輸入。

2.2.3 代價(jià)函數(shù)

Deep XI模型使用的代價(jià)函數(shù)為sigmoid交叉熵函數(shù),具體定義為

(1-ξ(n,k))ln(1-ξp(n,k))]

(11)

其中,N表示總幀數(shù),K表示每一幀包含的樣本點(diǎn)數(shù),ξp(n,k)如下式所示

(12)

(13)

其中,λz(k)代表噪聲方差,λx(k)代表純凈語(yǔ)音方差。

2.2.4 語(yǔ)音合成

(14)

將含噪語(yǔ)音頻譜Y(n,k)與維納濾波增益函數(shù)G(n,k)相乘,即可得到增強(qiáng)語(yǔ)音頻譜S(n,k),公式如下

S(n,k)=Y(n,k)×G(n,k)

(15)

(16)

其中,|S(n,k)|表示增強(qiáng)語(yǔ)音頻譜S(n,k)的幅度譜,最后通過(guò)傅里葉逆變換得到時(shí)域上的增強(qiáng)語(yǔ)音。

2.3 諧波重構(gòu)

目前通過(guò)單聲道語(yǔ)音增強(qiáng)方法得到的增強(qiáng)語(yǔ)音中都會(huì)存在一定的語(yǔ)音失真,這是因?yàn)檎Z(yǔ)音的濁音中包含了與語(yǔ)音相關(guān)的大部分信息,而濁音的功率是隨著頻率的增加而減小,由于濁音的功率小,它的組成部分會(huì)被視為噪聲而被抑制,特別是在高頻下這種情況尤為嚴(yán)重[14],為了解決這一問(wèn)題,本文采用諧波重構(gòu)的方法,而諧波重構(gòu)的目的就是為了將被抑制的諧波分量重新恢復(fù)。

(17)

(18)

其中,ρ(0≤ρ≤1)是權(quán)重因子,ε是偏置值取0.8,E[|Z(n,k)|2]代表噪聲的功率譜。因?yàn)榫S納濾波增益函數(shù)G(n,k)的取值范圍也是0到1,而且增益函數(shù)G(n,k)是由先驗(yàn)信噪比計(jì)算得到的,可以較好地反應(yīng)噪聲能量的變化情況,因此本文使用增益函數(shù)G(n,k)來(lái)代替權(quán)重因子ρ。則式(18)可以改寫為如下形式

(19)

其中,維納濾波增益函數(shù)G(n,k)是通過(guò)第一步基于相位改進(jìn)的語(yǔ)音增強(qiáng)方法計(jì)算得到的,此外權(quán)重因子ρ的取值越小計(jì)算得到的先驗(yàn)信噪比估計(jì)值越精確,如果直接使用增益函數(shù)G(n,k),當(dāng)信噪比值較高也就是在非噪聲段的時(shí)候增益函數(shù)G(n,k)的取值會(huì)逼近1,這會(huì)影響到最終求得的先驗(yàn)信噪比估計(jì)值的精確度,因此對(duì)式(19)進(jìn)行改進(jìn)得到最終的先驗(yàn)信噪比求解公式

(20)

將增益函數(shù)G(n,k)的取值范圍縮小至0到0.1之間,這樣就可以保證不管信噪比是如何取值,最終得到先驗(yàn)信噪比估計(jì)值的精確度都不會(huì)有較大幅度的波動(dòng)。

(21)

得到增強(qiáng)語(yǔ)音頻譜后通過(guò)傅里葉逆變換即可得到最終的增強(qiáng)語(yǔ)音。

3 實(shí)驗(yàn)和結(jié)果分析

3.1 實(shí)驗(yàn)配置

實(shí)驗(yàn)中訓(xùn)練集和測(cè)試集的純凈語(yǔ)音均來(lái)自TIMIT語(yǔ)料庫(kù),其中TIMIT語(yǔ)料庫(kù)中的訓(xùn)練集共有4620條純凈語(yǔ)音,測(cè)試集中共有1680條純凈語(yǔ)音,一共有6300條純凈語(yǔ)音。訓(xùn)練集和測(cè)試集的噪聲均來(lái)自NOISEX-92語(yǔ)料庫(kù),NOISEX-92語(yǔ)料庫(kù)中共有15種噪聲。在4種信噪比(-5 dB,0 dB,5 dB,10 dB)條件下,通過(guò)將TIMIT語(yǔ)料庫(kù)訓(xùn)練集中選取的3000條純凈語(yǔ)音與NOISEX-92語(yǔ)料庫(kù)中選取的4種噪聲(Pink,F(xiàn)16,Volvo,F(xiàn)actory1)相結(jié)合,可以得到包含48 000(3000×4×4)條含噪語(yǔ)音的訓(xùn)練集,將其中的2400條含噪語(yǔ)音設(shè)置為交叉驗(yàn)證集。為了使實(shí)驗(yàn)更符合真實(shí)情況,在上述4種信噪比條件下,選取在訓(xùn)練集中不匹配的噪聲類型,即NOISEX-92語(yǔ)料庫(kù)中的3種噪聲(Factory2,White,Babble),同時(shí)選取TIMIT語(yǔ)料庫(kù)中測(cè)試集的400條純凈語(yǔ)音結(jié)合得到一個(gè)包含4800(400×3×4)條含噪語(yǔ)音的測(cè)試集。實(shí)驗(yàn)中所有的純凈語(yǔ)音和噪聲的采樣率均為16 KHz。對(duì)信號(hào)分幀,加窗,其中幀長(zhǎng)為32 ms(512個(gè)采樣點(diǎn)),幀移為16 ms(256個(gè)采樣點(diǎn)),并對(duì)分幀后的信號(hào)進(jìn)行短時(shí)傅里葉變換,可將信號(hào)從時(shí)域轉(zhuǎn)換到頻域。

3.2 評(píng)價(jià)方法

語(yǔ)音增強(qiáng)性能評(píng)價(jià)指標(biāo)采用語(yǔ)音質(zhì)量感知評(píng)價(jià)(perce-ptual evaluation of speech quality,PESQ)和語(yǔ)音可懂度評(píng)價(jià)(short-time objective intelligibility,STOI)。語(yǔ)音質(zhì)量感知評(píng)價(jià)代表人在聽(tīng)語(yǔ)音時(shí)的舒適程度,語(yǔ)音可懂度評(píng)價(jià)代表人對(duì)于語(yǔ)音的可理解程度,其中PESQ得分在-0.5~4.5之間,得分越高代表增強(qiáng)語(yǔ)音的質(zhì)量越好。STOI得分在0~1之間,得分越高代表語(yǔ)音的可懂度越好。

3.3 評(píng)價(jià)結(jié)果

為了驗(yàn)證本文所提出的改進(jìn)相位補(bǔ)償結(jié)合諧波重構(gòu)的方法可以進(jìn)一步提高語(yǔ)音增強(qiáng)性能,將本文所提方法與3種對(duì)比方法進(jìn)行比較,含噪語(yǔ)音表示為Mixture,3種對(duì)比方法分別為不對(duì)相位進(jìn)行處理的Deep XI語(yǔ)音增強(qiáng)方法簡(jiǎn)稱為Method_A,該方法通過(guò)Deep XI模型直接估計(jì)先驗(yàn)信噪比,并將估計(jì)得到的先驗(yàn)信噪比用于維納濾波增益函數(shù)并對(duì)含噪語(yǔ)音進(jìn)行增強(qiáng);傳統(tǒng)的相位譜補(bǔ)償方法簡(jiǎn)稱為Method_B;sigmoid型相位譜補(bǔ)償方法[15]簡(jiǎn)稱為Method_C;本文提出的改進(jìn)相位補(bǔ)償結(jié)合諧波重構(gòu)的語(yǔ)音增強(qiáng)方法簡(jiǎn)稱為Method_D。其中傳統(tǒng)的相位譜補(bǔ)償方法和sigmoid型相位譜補(bǔ)償方法結(jié)合的增強(qiáng)語(yǔ)音幅度譜均是通過(guò)Deep XI模型獲取到先驗(yàn)信噪比估計(jì)值后構(gòu)建維納濾波增益函數(shù),將維納濾波增益函數(shù)與含噪語(yǔ)音幅度譜相乘得到的。

表1列出了在3種噪聲(Factory2,White,Babble)以及每種噪聲對(duì)應(yīng)的4種信噪比(-5 dB,0 dB,5 dB,10 dB)下,本文所提方法與3種對(duì)比方法的PESQ得分情況。從表1中可以看出在Factory2噪聲下Method_D比Method_A的PESQ得分提升了13%,比Method_B提升了9%,比Method_C提升了4%;在White噪聲下Method_D比Method_A提升了11%,比Method_B提升了8%,比Method_C提升了3%;同樣在Babble噪聲下Method_D比Method_A提升了11%,比Method_B提升了8%,比Method_C提升了4%。從數(shù)據(jù)中分析可知所提方法在不同的噪聲環(huán)境,不同的信噪比情況下均取得了較其它3種對(duì)比方法更好的PESQ得分,這是因?yàn)楸疚乃岱椒ú粌H僅只針對(duì)含噪語(yǔ)音幅度譜進(jìn)行處理,容易被忽視的相位信息在本文中也得到了相應(yīng)的處理,同時(shí)得益于Deep XI模型強(qiáng)大的學(xué)習(xí)能力能夠更準(zhǔn)確地估計(jì)先驗(yàn)信噪比,本文所提方法對(duì)相位的優(yōu)化要好于對(duì)比方法。

表1 4種方法在不同噪聲不同信噪比情況下的PESQ得分

表2給出了本文所提方法與3種對(duì)比方法的STOI得分情況,分析表2數(shù)據(jù)可知Method_A,Method_B和Method_C的STOI得分相差不大,在某些情況下數(shù)據(jù)甚至相等,這是因?yàn)樵诜茸V保持一致的情況下,增強(qiáng)相位信息并不會(huì)對(duì)可懂度的提升有較大影響,相位信息更多的是在影響語(yǔ)音的質(zhì)量,但是Method_D不僅考慮對(duì)相位進(jìn)行改進(jìn),同時(shí)對(duì)增強(qiáng)后的語(yǔ)音進(jìn)行諧波重構(gòu),盡可能地恢復(fù)在增強(qiáng)過(guò)程中被抑制的諧波分量,有效減少了語(yǔ)音失真,對(duì)語(yǔ)音可懂度的提升有一定幫助。

表2 4種方法在不同噪聲不同信噪比情況下的STOI得分

圖3以柱狀圖的形式更直觀地展示了Method_A,Method_B,Method_C和Method_D的PESQ均值。從圖3中可以明顯看出,Method_D與3種對(duì)比方法相比取得了明顯的提升。結(jié)合表1數(shù)據(jù)可知這種提升在低信噪比下尤為明顯,當(dāng)信噪比較高時(shí)由于相位信息對(duì)語(yǔ)音質(zhì)量的影響較小,對(duì)相位的改進(jìn)不會(huì)帶來(lái)明顯的語(yǔ)音質(zhì)量的提升,但是本文提出的方法在高信噪比下也取得了不錯(cuò)的增強(qiáng)效果。

圖3 各方法PESQ均值

圖4表示TIMIT語(yǔ)料庫(kù)中的一條純凈語(yǔ)音Clean,SNR=5dB的含噪語(yǔ)音Mixture,以及Method_A,Method_B,Method_C和Method_D這4種不同方法得到的增強(qiáng)語(yǔ)音的語(yǔ)譜圖。從圖4的語(yǔ)譜圖中可以看出,相比圖4(a)中的純凈語(yǔ)音,圖4(c)、圖4(d)、圖4(e)中的增強(qiáng)語(yǔ)音雖然殘留噪聲較少,但是語(yǔ)音的諧波結(jié)構(gòu)較圖4(a)有一定差距,同時(shí)可以看到圖4(f)中增強(qiáng)語(yǔ)音的諧波結(jié)構(gòu)較3種對(duì)比方法更接近于圖4(a)。這表明所提方法確實(shí)可以更好地恢復(fù)諧波結(jié)構(gòu)進(jìn)而提高增強(qiáng)語(yǔ)音的可懂度。

圖4 不同增強(qiáng)方法語(yǔ)譜圖對(duì)比

4 結(jié)束語(yǔ)

本文提出一種改進(jìn)相位補(bǔ)償結(jié)合諧波重構(gòu)的語(yǔ)音增強(qiáng)方法。實(shí)驗(yàn)結(jié)果表明,所提出的語(yǔ)音增強(qiáng)方法相比于不對(duì)相位進(jìn)行處理的方法以及其它對(duì)于傳統(tǒng)相位譜補(bǔ)償函數(shù)進(jìn)行改進(jìn)的方法在語(yǔ)音質(zhì)量和可懂度方面有明顯提升。同時(shí)本文所提方法具有普適性,可與任何幅度譜估計(jì)方法相結(jié)合,最終得到的增強(qiáng)語(yǔ)音在質(zhì)量和可懂度方面均會(huì)優(yōu)于單獨(dú)使用幅度譜估計(jì)方法得到的增強(qiáng)語(yǔ)音。

但是本文所提方法也存在一定不足,先驗(yàn)信噪比估計(jì)精確度的提升是通過(guò)深度學(xué)習(xí)模型以大量的訓(xùn)練時(shí)間為代價(jià)。未來(lái)將繼續(xù)尋找一種輕量級(jí)模型,在不降低精確度的前提下縮短訓(xùn)練時(shí)間。

猜你喜歡
先驗(yàn)信噪比語(yǔ)料庫(kù)
BOP2試驗(yàn)設(shè)計(jì)方法的先驗(yàn)敏感性分析研究*
兩種64排GE CT冠脈成像信噪比與劑量對(duì)比分析研究
平行語(yǔ)料庫(kù)在翻譯教學(xué)中的應(yīng)用研究
一種考慮先驗(yàn)信息可靠性的新算法
《語(yǔ)料庫(kù)翻譯文體學(xué)》評(píng)介
基于深度學(xué)習(xí)的無(wú)人機(jī)數(shù)據(jù)鏈信噪比估計(jì)算法
低信噪比下基于Hough變換的前視陣列SAR稀疏三維成像
先驗(yàn)的風(fēng)
基于平滑先驗(yàn)法的被動(dòng)聲信號(hào)趨勢(shì)項(xiàng)消除
不同信噪比下的被動(dòng)相控陣?yán)走_(dá)比幅測(cè)角方法研究
泸州市| 阜新市| 汶上县| 泌阳县| 沁水县| 渭源县| 明溪县| 富蕴县| 杭州市| 黄石市| 祁阳县| 鹤峰县| 旬邑县| 五寨县| 敦化市| 五河县| 南平市| 永泰县| 鹤壁市| 界首市| 奉贤区| 延吉市| 隆化县| 昌都县| 钟祥市| 赤壁市| 秀山| 大冶市| 游戏| 永泰县| 白银市| 中牟县| 西和县| 泰州市| 黄梅县| 武胜县| 徐水县| 安图县| 紫云| 香格里拉县| 清河县|