王心怡
?
基于特定聽覺特征的盲信號提取方法
王心怡
(昆明船舶設(shè)備研究試驗中心,云南昆明 650051)
針對參考信號波形難以構(gòu)造等情況,提出一種利用期望源信號聽覺特征進行信號盲提取的方法,根據(jù)源信號的聽覺特征先驗知識,將提取信號與期望信號聽覺特征向量的接近程度作為度量,使用非線性最小二乘法進行迭代計算分離向量,提取出與期望信號在聽覺特征上最為接近的源信號。對這種方法進行了理論推導(dǎo),并使用不同類型的信號進行了仿真。仿真結(jié)果表明,該方法具有良好的效果,且由于僅利用了信號的聽覺特征,而不需要參考信號的具體波形,對于不同類型的信號,具有廣泛的適應(yīng)性,具有良好的應(yīng)用價值。
盲源分離;盲源提取;聽覺特征;非線性最小二乘
近年來,盲源分離廣泛應(yīng)用于生物醫(yī)學(xué)、無線通信、圖像處理、陣列信號處理等領(lǐng)域[1-3]。在實際應(yīng)用中,感興趣的信號往往只是某一個或幾個源信號,將特定的源信號提取出來,就稱為盲提取。文獻[4]提出了一種將特定頻帶信號提取出來的盲提取方法。文獻[5]提出了首先將具有最大峭度的信號提取出來的盲提取算法。文獻[6-7]提出了一種針對特定峭度信號的盲提取方法,它可以將峭度在某一范圍內(nèi)的源信號提取出來。另一類盲提取方法是參考獨立分量分析(Independent Component Analysis-Reference, ICA-R)方法,將信號的先驗知識以參考信號的形式加以利用,只提取出期望的源信號。在ICA-R中,通過引入一個接近性度量函數(shù),將傳統(tǒng)獨立分量分析(Independent Component Analysis, ICA)問題轉(zhuǎn)化為一個新的約束最優(yōu)化問題,接近性度量函數(shù)常用的有分離輸出信號與參考信號的均方誤差,或分離輸出信號與參考信號的瞬時相關(guān)性,使用這些接近性度量,通常需要根據(jù)源信號的波形構(gòu)建參考信號,如源信號的符號函數(shù)或同頻正弦信號等。
在很多情況下,從混合信號中提取特定的期望源信號存在很大的困難,主要原因有兩個方面:一是難以找到一種合適的度量準則。例如,多個源信號的頻譜有很大重疊,峭度也很接近,在提取期望的源信號時難以確定一個合適的峭度范圍;二是難以根據(jù)期望的源信號構(gòu)建參考信號,限制了ICA-R等方法的使用,例如很多時候只能得到源信號的某些統(tǒng)計特性,而沒有源信號的波形樣本,不具備源信號波形有關(guān)的先驗知識,無法構(gòu)建參考信號;并且有些源信號具有較強的時變性,已有源信號的波形先驗知識與混合信號中的該源信號接近性很差,也無法準確估計出該源信號。
本文提出一種基于源信號聽覺特征的盲提取方法,將提取信號與期望源信號聽覺特征的接近程度作為度量準則,提取出與期望信號在聽覺特征上最接近的源信號,這種方法不需要構(gòu)建參考信號,也不需要源信號波形的先驗知識,對源信號的頻帶、峭度等也沒有限制,只要源信號的聽覺特征是穩(wěn)定的,就能夠以較好的效果提取出期望的源信號。
信號的聽覺特征是保證正確提取源信號的重要因素。聽覺特征有很多種,用于信號盲提取的聽覺特征應(yīng)具有以下特點:(1) 具有很高的區(qū)分能力,能夠充分體現(xiàn)不同的源信號之間的差異,而對同一個源信號在狀態(tài)變化時保持相對穩(wěn)定;(2) 特征參數(shù)在受到環(huán)境噪聲影響和信道變化時能夠保持穩(wěn)健;(3) 易于計算等。
對于聲學(xué)信號,可以使用的特征包括線譜、線性預(yù)測系數(shù)(Linear Prediction Coefficient, LPC)、Mel頻率倒譜系數(shù)(Mel-Frequency Cepstrum Coefficient, MFCC)等。根據(jù)研究,使用MFCC作為特征參數(shù),在不同環(huán)境下可以保持較好的穩(wěn)定性[8-10],對于不同的源信號具有較好的區(qū)分能力,并且對于同一個源信號,MFCC在信號的基頻、相位等參數(shù)發(fā)生較大變化時仍保持穩(wěn)定,因此,本文采用MFCC作為信號的聽覺特征。
MFCC模擬人耳的聽覺機理,人耳在嘈雜的環(huán)境中,以及各種變異情況下仍能正常地分辨出各種語音,具有很高的識別正確率,其關(guān)鍵因素之一就是耳蝸的作用。耳蝸實質(zhì)上相當于一個濾波器組,其濾波作用是在對數(shù)頻率尺度上進行的,在1 000 Hz以下為線性尺度,而1 000 Hz以上為對數(shù)尺度,這就使得人耳對低頻信號比對高頻信號更敏感,因此可以根據(jù)這個特性,構(gòu)造一組類似耳蝸的濾波器來模仿人耳對聲音的特征提取方式。
MFCC參數(shù)的計算過程是將信號通過臨界頻帶濾波器組,然后轉(zhuǎn)換到倒譜域,流程如圖1所示。
其中,為Mel濾波器組的濾波器個數(shù)。
圖1 MFCC參數(shù)提取流程
Fig.1 Flow chart of MFCC parameter extraction
設(shè)有個源信號,觀測到的維混合信號為源信號的瞬時線性混合,即
其中,為維源信號,為×維混合矩陣,為維觀測信號,本文討論=的情況。
仿真使用3個源信號,分別是頻率為500 Hz的方波信號、諧波成分為150、350、550、750、950、1 150、1 350 Hz的多頻正弦信號和粉紅噪聲信號,3個源信號的波形如圖2所示,仿真信號采樣率為10 kHz,橫坐標為采樣點數(shù),縱坐標為波形幅度。將3個源信號:方波、多頻正弦信號和粉紅噪聲信號按照混合矩陣:
進行加權(quán)得到的3通道混合信號,其波形圖如圖3所示。
圖2 源信號
Fig.2 Source signals: 1. square wave signal, 2. multi-frequency sinusoidal signal, 3. pink noise signal
圖3 圖2中源信號的混合信號
使用本文方法對源信號2進行提取,聽覺特征MFCC先驗值是采用與源信號2相同的諧波能量比構(gòu)造的多頻正弦信號,取多個采樣時段計算,再求平均值。這個統(tǒng)計的先驗MFCC向量與任意一段符合該諧波能量比的信號都具有較強的相似性。
真實源信號和使用本文方法提取出的信號如圖4所示,提取的源信號與真實源信號的相關(guān)系數(shù)為0.979 9。
圖4 提取出的期望源信號
圖5是提取信號的聽覺特征MFCC向量與先驗特征的比較。由圖5可以看出,提取信號在聽覺特征上與先驗值很相似,計算出的相關(guān)系數(shù)為0.923 6。
圖5 提取出的源信號的聽覺特征
對峭度相近的信號進行仿真,3個源信號分別為兩種不同樂器的獨奏音樂信號及汽車引擎聲音信號,如圖6所示,源信號的歸一化峭度值分別為-0.343、-0.146、-0.346。將源信號按照混合矩陣
進行加權(quán)得到混合信號,混合信號波形如圖7所示。
使用本文方法提取其中一個音樂信號。使用音色相同的樂器的其他音樂片段信號進行聽覺特征MFCC的計算,對多段信號樣本分別計算MFCC,并取平均值。
提取出的幅度歸一化音樂信號如圖8所示,該樂器的先驗MFCC、提取信號的MFCC如圖9所示,由圖9可以看出,本文方法提取出的源信號與該樂器在聽覺特征上更為接近。
根據(jù)仿真結(jié)果可以看出,提取信號與真實源信號的相似程度較高,聽覺特征接近期望的源信號,當混合的源信號數(shù)目較多、無法獲取當前混合的源信號波形參考信息時,本文方法能夠較好地提取期望的源信號。
圖6 源信號
圖8 提取出的音樂信號
圖9 提取出的音樂信號的聽覺特征
本文提出一種以期望信號聽覺特征作為參考的盲提取方法,使用非線性最小二乘法求解分離向量,提取出特定的源信號。在無法得到參考信號具體波形的情況下,能夠有效地實現(xiàn)信號提取。仿真結(jié)果表明,本文方法對不同類型的信號都有較好的穩(wěn)健性,不受峭度等特性的影響。本文方法具有較為廣泛的適應(yīng)性和良好的應(yīng)用價值。
[1] COMON P. Independent component analysis, a new concept[J]. Signal Processing, 1994(36): 287-314.
[2] CICHOCKI A, AMARI S. Adaptive blind signal and image processing[M]. New York, USA: Wiley, 2002.
[3] 陳晉央, 吳瑛. 基于獨立分量分析的波束空間波達方向估計算法[J]. 聲學(xué)技術(shù), 2012, 31(2): 227-231.
CHEN Jinyang, WU Ying. Beam-space direction of arrival (DOA) algorithm based on independent component analysis[J]. Technical Acoustics, 2012, 31(2): 227-231.
[4] CICHOCKI A, THAWONMAS R, AMARI S. Sequential blind signal extraction in order specified by stochastics properties[J]. Electronics Letters (S0013-5194), 1997, 33(1): 64-65.
[5] CICHOCKI A, RUTKOWSKI T, SIWEK K. Blind signal extraction of signals with specified frequency band [C]//Proceedings of the 2002 12th IEEE Workshop on Neural Networks for Signal Processing, Switzerland. USA: IEEE, 2002: 515-524.
[6] 季策, 王艷茹, 王曉宇. 一種基于標準峭度的新型復(fù)數(shù)盲分離算法[J]. 東北大學(xué)學(xué)報(自然科學(xué)版), 2015, 36(5): 614-617.
JI Ce, WANG Yanru, WANG Xiaoyu. A new complex blind source separation algorithm based on standard kurtosis[J]. Journal of Northeastern University(Natural Science), 2015, 36(5): 614-617.
[7] 陳壽齊, 沈越泓, 馬明, 等. 基于峭度的穩(wěn)健特定信號盲提取[J]. 系統(tǒng)仿真學(xué)報, 2008, 11(22): 6093-6096.
CHEN Shouqi, SHEN Yuehong, MA Ming, et al. Robust extraction of specific signal based on kurtosis[J]. Journal of System Simulation, 2008, 11(22): 6093-6096.
[8] 劉若倫, 張家琦. 乘法模型下西洋樂器音色特征[J]. 聲學(xué)技術(shù), 2009, 28(3): 269-275.
LIU Ruolun, ZHANG Jiaqi. Timbre features of western instrument under multiplication model[J]. Technical Acoustics, 2009, 28(3): 269-275.
[9] 石超雄, 李鋼虎, 何會會, 等. 基于提升小波變換的MFCC在目標識別中的應(yīng)用[J]. 聲學(xué)技術(shù), 2014, 33(4): 372-375.
SHI Chaoxiong, LI Ganghu, HE Huihui, et al. Application of the lifting wavelet transform based MFCC in target identification[J]. Technical Acoustics, 2014, 33(4): 372-375.
[10] 朱知萌, 郭育, 王冠, 等. 水下蛙人呼吸聲Mel倒譜特征的實驗研究[J]. 聲學(xué)技術(shù), 2017, 36(3): 286-292.
ZHU Zhimeng, GUO Yu, WANG Guan, et al. Experimental research on Mel cepstrum feature of the underwater diver breathing-signal[J]. Technical Acoustics, 2017, 36(3): 286-292.
Blind signal extraction based on specific auditory feature
WANG Xin-yi
(Kunming Shipbuilding Equipment Research and Test Center, Kunming 650051, Yunnan, China)
In the case that the reference signal waveform is difficult to provide, a blind extraction method based on auditory feature is proposed in this paper. According to the known auditory feature, the accessibility of auditory features between expected signal and extracted signal is treated as a measure, the nonlinear least square algorithm is used to calculate the separation vector in order to extract the source signal that is closest to the expected signal in auditory feature. The theory of the method is described in this paper, and the simulation is also performed with different kinds of signals. The simulation result shows the effectiveness of the method, which needs no waveform but only the auditory feature of reference signal. And, the method is adaptive to different kinds of signals and has a good performance in practical applications.
blind source separation; blind source extraction; auditory feature; nonlinear least square
TB566
A
1000-3630(2018)-05-0496-05
10.16300/j.cnki.1000-3630.2018.05.015
2017-06-15;
2017-08-20
王心怡(1983-), 男, 內(nèi)蒙古錫林浩特人, 碩士, 高級工程師,研究方向為聲學(xué)信號處理。
王心怡, E-mail: wxy345135@163.com