馮濤,孫怡然
(南京信息工程大學,江蘇 南京 210044)
麥克風陣列技術在多通道語音去混響中是眾所周知的,它可以通過空間區(qū)分不同方向的聲音,在一定程度上抑制混響。在多通道線性預測的原理是設計一個線性預測器,估計出語音的混響部分,從混響語音中減去被估計出的部分就能估計出期望的語音信號。
RLS算法在矩陣逆變換的過程中條件數(shù)會增多,使該算法存在潛在的不穩(wěn)定問題,以及使用常數(shù)遺忘因子而導致系統(tǒng)突然變化時收斂緩慢等問題。前者可以用QR分解解決,而后者常用自適應遺忘因子來解決
本文提出了一種基于濾波器系數(shù)近似導數(shù)的VFF控制方案。其主要思想是通過權值向量的變化來衡量自適應濾波器的收斂行為。在接近穩(wěn)態(tài)時,權值向量表現(xiàn)出更少的變化,并且可以使用更小的步長。同樣,當權值向量表現(xiàn)出相當大的變化時,可以選擇更大的步長。這種方法也適用于RLS算法。仿真結(jié)果表明,該算法不僅提高了去混響的能力,還提高了穩(wěn)定性。
現(xiàn)在假設在一個密閉的環(huán)境中,有且只有一個聲源,這個聲源產(chǎn)生的語音信號由個麥克風捕捉,而麥克風捕獲的信號不可避免會帶有噪聲,因此,麥克風捕捉到的信號可以表示為:
其中,()表示麥克風捕捉到的信號,()表示語音信號,()是加性噪聲。為了接下來的討論方便,令()=0。
對時域信號采用短時傅里葉變換后,第個麥克風捕獲到的信號可以表示為:
混響信號(,)能表示為:
用L代表MCLP濾波器的長度,作為時域內(nèi)的預測延時,g是線性預測過濾器的預測系數(shù),對每個頻點進行計算后,省略掉,公式可以表示為:
將(3)式帶入(4)式可得需要的估計信號為:
其中:
()用來表示加權系數(shù);的取值介于(0,1),表示為遺忘因子;加權系數(shù)又可以表示為:
是個無窮小的數(shù),用于保證()是一個非負數(shù),代表形狀參數(shù),假設后期混響服從指數(shù)分布,則()的功率譜密度就可以表示為:
其中:
代入公式得出后期混響的估計值為:
若采用最小二乘法遞歸求解 可以表示為:
由于式(17)中矩陣求逆過程的條件數(shù)增大,只用最小二乘法來求解會存在潛在的不穩(wěn)定問題,通過QR分解的方法減少條件數(shù),可以表現(xiàn)出更好的數(shù)值穩(wěn)定性。利用QR分解原理可以對上述式子進行重新整理算法過程具體為:
(1)給定了已擴充的數(shù)據(jù)矩陣:
其在(-1)幀處的QRD為:
(2)形成新的增強的數(shù)據(jù)矩陣:
在QR-RLS算法中加入時變遺忘因子,不僅能提供更好的數(shù)值穩(wěn)定性,還具有快速的瞬態(tài)收斂和跟蹤性能。
與傳統(tǒng)的VFF方案不同,所提出的VFF控制方案是基于濾波器系數(shù)的近似導數(shù)。該方法可以表述為:
將(26)替換(8)中的,便得到了VFF-QR-RLS。
本文的設置了兩個麥克風組成麥克風線性陣列,用于模擬人耳,并對一段11 s的混響信號進行去混響。實驗中的各項參數(shù)如表1所示。
表1 實驗參數(shù)
算法的性能用Mel頻率倒譜系數(shù)距離改善(ΔMFCC)來評估,Mel頻率倒譜系數(shù)(MFCC)把純凈語音作為參考信號,分別計算參考信號與混響信號和去混響信號之間的MFCC失真距離,記作MFCC和MFCC。然后兩者作差便得到Mel頻率倒譜距離改善(ΔMFCC),該值越大時,說明去混響效果越好。
RLS和QR-RLS算法的遺忘因子的取值為0.96,而VFF-QR-RLS的遺忘因子,γ=0.96,γ=0.99。仿真結(jié)果如圖1所示。
圖1 三種算法的ΔMFCC距離改善
由圖2上和圖2中可知,QR-RLS具有和RLS相同的效果,并且通過QR分解的方法減少條件數(shù),還可以表現(xiàn)出更好的數(shù)值性質(zhì)。圖中畫圈的部分進行比較可以發(fā)現(xiàn),VFFQR-RLS算法能夠更快趨于穩(wěn)定,有更好的數(shù)值穩(wěn)定性。
為了進一步評估算法的性能和去混響效果,本文還采用了語音質(zhì)量感知評價對實驗中的去混響語音進行評估,最終得分取的是10組不同的模擬混響樣本實驗結(jié)果的平均值,不同算法去混響信號得分如圖2所示(混響時間=(300 ms,600 ms,900 ms)),從圖中數(shù)據(jù)可以看出,在不同混響程度中,VFF-QR-RLS算法的得分都是最高的,這也驗證了算法的有效性。
圖2 不同方法去混響前后語音信號的平均PESQ得分
本文對基于QR-RLS的多通道線性預測去混響算法進行了改進,加入了時變遺忘因子,該方法提高了算法的去混響能力以及數(shù)值的穩(wěn)定性。仿真的實驗結(jié)果驗證了該算法的有效性。