摘要:針對傳統(tǒng)語音增強(qiáng)方法存在濾除有效信號且增強(qiáng)性能欠佳的問題,提出了一種基于ISD優(yōu)化SSA-VMD算法的自適應(yīng)英文語音信號增強(qiáng)方法。首先利用SSA-VMD算法自適應(yīng)獲取輸入語音信號VMD關(guān)鍵參數(shù)的最優(yōu)組合,再對其進(jìn)行分解得到各模態(tài)分量,基于ISD原理對各模態(tài)分量與輸入信號的相似度進(jìn)行評估,進(jìn)而篩選出噪聲模態(tài)分量,通過小波閣值法對其進(jìn)行降噪,最后重構(gòu)信號得到增強(qiáng)后的語音。實(shí)驗(yàn)結(jié)果表明,利用所提方法處理英文語音信號,信噪比更高,均方誤差更小,語音增強(qiáng)效果也更明顯,具有較好的適用性。
關(guān)鍵詞:SSA-VMD算法;ISD原理;自適應(yīng);語音增強(qiáng)
中圖分類號:TP301.6 文獻(xiàn)標(biāo)識碼:A
語音信號高度不穩(wěn)定,特別是在惡劣噪聲環(huán)境下,對語音的質(zhì)量和可懂度會產(chǎn)生嚴(yán)重影響。語音增強(qiáng)在一定程度上能夠有效減弱或抑制這些環(huán)境噪聲,改善語音質(zhì)量。
目前主流的語音增強(qiáng)方法有譜減法、統(tǒng)計(jì)模型方法、子空間法、神經(jīng)網(wǎng)絡(luò)方法等。早期,Boll提出譜減法,隨后經(jīng)典的維納濾波法、最小均方差估計(jì)法也相繼被提出,這幾種方法在語音增強(qiáng)方面確實(shí)都具有一定的效果,但存在會產(chǎn)生語音失真和音樂噪聲的缺點(diǎn)。近些年,也出現(xiàn)了將循環(huán)神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、生成對抗網(wǎng)絡(luò)等深度學(xué)習(xí)方法用于語音信號增強(qiáng),這類方法對非平穩(wěn)噪聲下的語音增強(qiáng)效果更好,但計(jì)算復(fù)雜,對硬件的內(nèi)存資源要求較高。為了適應(yīng)非線性非平穩(wěn)信號處理的需求,Poovarasan等采用經(jīng)驗(yàn)?zāi)B(tài)分解對語音信號進(jìn)行增強(qiáng),但該方法存在模態(tài)混疊問題,容易產(chǎn)生語音失真,為了解決該問題,由Dragomiretskiy等提出了變分模態(tài)分解(VMD)方法,該方法可以有效避免由于端點(diǎn)檢測而帶來的模態(tài)混疊問題。Ram等隨后基于VMD算法進(jìn)行語音增強(qiáng),也得到了較好的增強(qiáng)效果,但由于VMD的模態(tài)數(shù)目和懲罰因子選擇難度較大,容易產(chǎn)生欠分解或過分解的問題。李宏等采用灰狼優(yōu)化(GWO)算法優(yōu)化VMD算法的參數(shù)組合,該方法能夠有效去除語音中的噪聲,但存在可能陷入局部最優(yōu)解的缺點(diǎn)。另外,現(xiàn)有的語音增強(qiáng)研究多為泛化的語音增強(qiáng)方法,但不同語種的語法、機(jī)理、產(chǎn)生方式等導(dǎo)致發(fā)音存在很大差異,出現(xiàn)了語音增強(qiáng)效果差,自適應(yīng)力不足的情況。