肖剛祥,周妙琪,劉俊,李軍成
(湖南人文科技學(xué)院 數(shù)學(xué)與金融學(xué)院,湖南 婁底 417000)
有關(guān)聲音的處理是一門重要的學(xué)科,涉及到了生活中的方方面面,比如監(jiān)控安保、軍事偵察、人工智能等等。然而在生活中不僅僅有人們感興趣的聲音,還有許許多多的噪聲,因此,通過語音增強(qiáng)技術(shù)來增強(qiáng)特定的聲源信號(即感興趣的聲音),同時(shí)抑制其他的聲源信號(即不想要的噪聲)就成了迫切需求。
在聲源定位中,為了加強(qiáng)聲音采集與運(yùn)用的效率,語音增強(qiáng)是非常關(guān)鍵的一個(gè)環(huán)節(jié)。目前,聲源定位中的語音增強(qiáng)的方法有很多,但總的來說可分為單通道語音增強(qiáng)法和多通道的語音增強(qiáng)法兩類。在單通道語音增強(qiáng)算法中,較為典型的有譜減法[1-3],而在多通道語音增強(qiáng)算法中,較為常用的有維納濾波法[4-6]、子空間法[7-9]等。本文的主要目的是分析譜減法、維納濾波法、子空間法等三種聲源定位中常用的語音增強(qiáng)算法在不同噪聲、不同信噪比情形下的去噪能力,為聲源定位時(shí)選取合適的語言增強(qiáng)算法提供一定的參考。
本文利用MATLAB軟件進(jìn)行仿真實(shí)驗(yàn)。輸入的干凈語音為“多么痛的領(lǐng)悟”(時(shí)間為3秒的男聲),其波形圖和語譜圖如1所示。
圖1 干凈語言信號的波形圖和語譜圖
為了對比分析譜減法、維納濾波法、子空間法等三種語音增強(qiáng)算法的效果,本文分別給干凈語音添加white噪聲、volvo噪聲、babble噪聲等三種不同的噪聲,并在不同輸入信噪比的情形下進(jìn)行語音增強(qiáng)效果的比較。
給干凈語言添加white(白)噪聲后,其波形圖和語譜圖如2所示。
圖2 添加white噪聲后語言信號的波形圖和語譜圖
為了說明三種方法去噪的有效性,將輸入信噪比取為15db,三種方法得到的語言信號波形圖和語譜圖如圖3所示。
圖3 輸入信噪比取為15db時(shí)含white噪聲語言信號去噪后的波形圖和語譜圖
由圖3可知,當(dāng)輸入信噪比為15db時(shí),這三種方法都具有較好的語音增強(qiáng)能力,其中利用譜減法增強(qiáng)后的語音與干凈語音的波形圖和語譜圖最為接近。為了進(jìn)一步對比分析三種方法對含white噪聲語言信號的去噪效果,將輸入信噪比由-50db逐漸增加到50db時(shí),可得輸入信噪比與輸出信噪比的關(guān)系曲線如圖4所示,其中橫坐標(biāo)為輸入信噪比,縱坐標(biāo)為輸出信噪比,黑色線條為譜減法的結(jié)果,紅色線條為維納濾波法的結(jié)果,黃色線條為子空間法的結(jié)果。
圖4 添加white噪聲下三種算法的效果對比
由圖4可知,在添加white噪聲的情形下,
(1) 隨著輸入信噪比的提高,譜減法的輸出信噪比提高的速度比其它兩種方法快很多。
(2) 當(dāng)輸入信噪比高于20db時(shí),譜減法的語音增強(qiáng)效果開始趨于穩(wěn)定;當(dāng)輸入信噪比高于0db時(shí),子空間的語音增強(qiáng)效果開始趨于穩(wěn)定;當(dāng)輸入信噪比高于5db時(shí),維納濾波方法的語音增強(qiáng)效果趨于穩(wěn)定。
(3) 當(dāng)輸入信噪比低于-1db時(shí),子空間法的語音增強(qiáng)效果最好;當(dāng)輸入信噪比高于-1db低于13db時(shí),維納濾波的語音增強(qiáng)的效果最好;當(dāng)輸入信噪比高于13db時(shí),譜減法的語言增強(qiáng)效果最好。
給干凈語言添加volvo噪聲后,其波形圖和語譜圖如5所示。
為了說明三種方法去噪的有效性,將輸入信噪比取為15db,三種方法得到的語言信號波形圖和語譜圖如圖6所示。
圖5 添加volvo噪聲后語言信號的波形圖和語譜圖
圖6 輸入信噪比取為15db時(shí)含volvo噪聲語言信號去噪后的波形圖和語譜圖
由圖6可知,當(dāng)輸入信噪比為15db時(shí),這三種方法都具有較好的語音增強(qiáng)能力,其中利用維納濾波法增強(qiáng)后的語音與干凈語音的波形圖和語譜圖最為接近。為了進(jìn)一步對比分析三種方法對含volvo噪聲語言信號的去噪效果,將輸入信噪比由-50db逐漸增加到50db時(shí),可得輸入信噪比與輸出信噪比的關(guān)系曲線如圖7所示,其中橫坐標(biāo)為輸入信噪比,縱坐標(biāo)為輸出信噪比,黑色線條為譜減法的結(jié)果,紅色線條為維納濾波法的結(jié)果,黃色線條為子空間法的結(jié)果。
圖7 添加volvo噪聲下三種算法的效果對比
由圖7可知,在添加volvo噪聲的情形下,
(1) 隨著輸入信噪比的提高,譜減法的輸出信噪比提高的速度比其它兩種方法快很多。
(2) 當(dāng)輸入信噪比大于20db時(shí),譜減法的語音增強(qiáng)效果開始趨于穩(wěn)定;當(dāng)輸入信噪比大于5db時(shí),維納濾波法的語音增強(qiáng)效果開始趨于穩(wěn)定;當(dāng)輸入信噪比大于0db時(shí),子空間法的語音增強(qiáng)效果開始趨于穩(wěn)定。
(3) 當(dāng)輸入信噪比低于-3db時(shí),子空間法的語音增強(qiáng)效果最好;當(dāng)輸入信噪比高于-3db低于12db時(shí)維納濾波方法的語音增強(qiáng)效果最好;在輸入信噪比高于19db時(shí),譜減法的語音增強(qiáng)效果最好。
給干凈語言添加babble噪聲后,其波形圖和語譜圖如8所示。
圖8 添加babble噪聲后語言信號的波形圖和語譜圖
為了說明三種方法對含babble噪聲語言信號的去噪能力,將輸入信噪比取為15db,三種方法得到的語言信號波形圖和語譜圖如圖9所示。
圖9 輸入信噪比取為15db時(shí)含babble噪聲語言信號去噪后的波形圖和語譜圖
由圖9可知,當(dāng)輸入信噪比為15db時(shí),三種方法都具有較好的語音增強(qiáng)能力,其中利用譜減法增強(qiáng)后的語音與干凈語音的波形圖和語譜圖最為接近。為了進(jìn)一步對比分析三種方法對含babble噪聲語言信號的去噪效果,將輸入信噪比由-50db逐漸增加到50db時(shí),可得輸入信噪比與輸出信噪比的關(guān)系曲線如圖10所示,其中橫坐標(biāo)為輸入信噪比,縱坐標(biāo)為輸出信噪比,黑色線條為譜減法的結(jié)果,紅色線條為維納濾波法的結(jié)果,黃色線條為子空間法的結(jié)果。由圖10可知,在添加babble噪聲的情形下,
圖10 添加babble噪聲下三種算法的效果對比
(1) 隨著輸入信噪比的提高,譜減法的輸出信噪比提高的速度比其它兩種方法快很多。
(2) 當(dāng)輸入信噪比高于20db時(shí),譜減法的語音增強(qiáng)效果開始趨于穩(wěn)定;當(dāng)輸入信噪比高于0db時(shí),子空間法的語音增強(qiáng)效果開始趨于穩(wěn)定;而維納濾波方法的語音增強(qiáng)效果浮動較大,當(dāng)輸入信噪比高于30db時(shí),其語音增強(qiáng)效果才開始趨于穩(wěn)定。
(3) 當(dāng)輸入信噪比低于5db時(shí),子空間算法的語音增強(qiáng)效果最好;當(dāng)輸入信噪比高于5db低于14db時(shí),維納濾波法的語音增強(qiáng)效果最好;當(dāng)輸入信噪比高于14db時(shí),譜減法的語音增強(qiáng)效果最好。
本文利用MATLAB軟件對譜減法、維納濾波算法、子空間等三種聲源定位中常用的語音增強(qiáng)算法進(jìn)行了對比分析。通過給干凈語音添加white噪聲、volvo噪聲、babble噪聲等三種不同的噪聲,在不同輸入信噪比的情形下對三種方法的語音增強(qiáng)效果進(jìn)行了比較,得到了三種語音增強(qiáng)方法的特性,為聲源定位時(shí)語音增強(qiáng)算法的選擇提供了一定的依據(jù)。