袁莉芬,劉 輝,程 俊
(湖南師范大學物理與信息科學學院,中國 長沙 410081)
在語音通信與處理控制系統(tǒng)中,信號不可避免地會被噪聲污染,特別在小信號采集和測量中,噪聲干擾顯得尤其嚴重.因此,如何消除實際語音信號中的噪聲,從混有噪聲的信號中提取有用信息一直是現(xiàn)代語音處理學科研究的焦點之一.
語音除噪的目的在于在強噪聲背景環(huán)境下盡量不失真的提取語音信號、提高語音信號的信噪比.較常用的語音除噪技術包括LMS/RLS算法[1]、小波處理[2-5]等.這些技術從本質上來說即濾波技術,如維納濾波[6]、卡爾曼濾波[5,7]以及閥值法去噪等[8].其中維納濾波要求帶噪信號參數(shù)固定,適用于平穩(wěn)的隨機信號,而實際上,語音是非平穩(wěn)信號,因此在具體應用的過程中,受到限制;卡爾曼濾波要求參數(shù)是時變的,適應于非平穩(wěn)信號,但其要求噪聲和信號的統(tǒng)計特性是先驗已知的;閥值去噪的關鍵在于如何選擇閥值并進行閥值量化,閥值選取的好壞直接影響到信號消噪處理的質量.
由于語音信號在傳輸過程中具有一定的未知性,并且語音和噪聲在統(tǒng)計特征上是相互獨立的,本文將以此為依據(jù),從盲源處理的角度,研究基于獨立性特征的ICA(獨立成分分析)語音除噪系統(tǒng).
ICA最先起源于“雞尾酒會”問題[9],經(jīng)過幾十年的不斷發(fā)展,ICA技術的應用領域涉及語音信號處理、機械信號處理、圖形信號處理等.ICA技術能夠成功應用的條件在于系統(tǒng)的物理模型在本質上與ICA數(shù)據(jù)處理模型一致.
假設有某個觀測到的含噪語音變量x,x變量由1條語音信息s0和N個相互獨立的噪聲信號s1,…,sN線性組合得到,由于信號經(jīng)過的信道、時延等的不同,噪聲以及混合系數(shù)都是不確定的,則帶噪語音信號的ICA模型可以描述為:
x=a0s0+a1s1+a2s2+…aNsN,
(1)
式中,aj,j=0,…,N是實向量系數(shù),且式中只有觀測變量x是已知的,語音和噪聲以及他們的混合方式均為待估計的量.
圖1 含噪觀測語音信號濾波預處理框圖
由于ICA處理數(shù)據(jù)時,需要采集多路并行的數(shù)據(jù).假設將采集到的一路觀測數(shù)據(jù)經(jīng)過某一SIMO(單輸入多輸出)濾波系統(tǒng),其傳輸函數(shù)為H,如圖1所示.則信號x經(jīng)過SIMO系統(tǒng)之后的輸出Y為
(2)
現(xiàn)在問題的關鍵轉化為如何尋找到這樣的濾波函數(shù)族H,保證觀測變量經(jīng)過濾波器組之后依然包含所有的獨立源成分.假設各濾波器的響應函數(shù)為:hi(t),i=1,2,…,N.yi代表觀測經(jīng)過第i個濾波器之后的輸出,則
…aNsN(t-τ)}dτ,
(3)
輸出變量yi,yj(i≠j)之間的相關函數(shù)可以表示為
Ryi,yj(t1,t2)=?u,vhi(u)hj(v)E[{a0s0(t1-u)+…+aNsN(t1-u)}{a0s0(t2-v)+…+
由于si,sj之間相互獨立,所以
E[si(t)sj(t)]=E[si(t)]E[sj(t)],
(4)
式中,Rsk為獨立成分sk的自相關系數(shù);Rsi,sj為獨立成分si和sj之間的互相關系數(shù),由于si和sj之間相互獨立,所以肯定不相關,則Rsi,sj=0,式(4)轉化為
(5)
圖2 語音除噪系統(tǒng)處理流程框圖
當hi(t)與hj(t)為正交函數(shù)系時,?u,vhi(u)hj(v)dudv=0,i≠j,從而使得Ryi,yj(t1,t2)=0,意味著此時的輸出yi與yj是不相關的.對于標準正交濾波器,有?hi(u)hi(v)dudv=1,所以系統(tǒng)輸出信號的自相關系數(shù)是對應輸入信號自相關系數(shù)的倍數(shù)關系,即Ryi ,yi(t1,t2) =ai2Rsi,濾波處理之后保留了所有源信號的獨立成分.
以上分析表明,當讓采集到的某單路語音混合信號經(jīng)過一正交濾波器組時,輸出信號將保留所有信號及噪聲的獨立成分,此時濾波器組的輸出信號可以利用ICA數(shù)據(jù)處理模型進行描述.
對具體的語音除噪系統(tǒng)進行設計,其信號處理框圖如圖2所示.采集到的語音觀測信號通過單路輸入多路輸出的標準正交濾波器組之后,得到N路輸出,然后利用ICA技術,以最大化信號的獨立性特征為目標,進行語音與噪聲信號的分離,最后利用多路輸入單路輸出的信號選擇器實現(xiàn)語音信號的除噪.
圖3 語音除噪系統(tǒng)仿真
為了驗證以上系統(tǒng)的除噪性能,對某預先錄制好的純凈語音添加窄帶噪聲,利用以上所提出的語音除噪系統(tǒng)進行處理.在進行具體的信號處理時,濾波器組采用haar正交小波濾波器組進行信號預處理.在進行語音和噪聲信號的分離時,由于其分離判據(jù)是最大化信號的獨立性特征,而信號獨立性特征較常用的度量參數(shù)為信息熵和峭度.本文為了簡化計算,采用最大化信號的峭度進行.各階段的信號波形如圖3所示,圖中(a)為未加噪聲的純凈語音信號,(b)為添加了噪聲的語音信號,(c)為除噪之后的語音信號.比較圖(a)和(c)可知,除噪之后的信息保留了原信號的絕大部分信息,且除噪效果很好.
參考文獻:
[1] 田玉靜,左紅偉,朱周華.LMS與RLS算法仿真消噪對比研究[J].通信技術, 2009,42(12):161-163.
[2] 豐明坤,李曉勇.基于小波變換的語音除噪虛擬儀器系統(tǒng)[J].語音技術,2006,9:54-55.
[3] 劉娟花,李福德.一種改進的小波域語音去噪方法研究[J].西安工程科技學院學報,2006,20(1):92-95.
[4] 任濟生,任鵬,吉愛國.基于正交小波變換的自適應語音消噪改進方法[J].信息與控制,2007,36(4):501-505.
[5] 阮兆文.基于小波-卡爾曼的語音增強方法研究[J].通信技術.2010,43(4):152-154.
[6] 張亮,龔衛(wèi)國. 一種改進的維納濾波語音增強算法[J].計算機工程與應用2010,46(26):129-131.
[7] 尹偉,易本順,沈小豐.有色噪聲下基于Unscented粒子濾波的語音增強方法[J].電波科學學報.2009,24(3):476-481.
[8] 王繼曾,王嬋飛.基于最佳門限消噪語音增強一種新方法的研究與實踐[J].計算機應用與軟件.2009,26(1):253-254.