屈 直,張伯虎
一種改進(jìn)的小波閾值算法在激光偵聽中的應(yīng)用
屈 直1,張伯虎2*
(1.中國人民武裝警察部隊(duì)工程大學(xué)研究生管理大隊(duì),西安710086;2.中國人民武裝警察部隊(duì)工程大學(xué)信息工程系,西安710086)
為了更好地實(shí)現(xiàn)激光偵聽中的語音降噪,采用一種改進(jìn)的小波閾值去噪算法,進(jìn)行了理論分析和實(shí)驗(yàn)驗(yàn)證,取得了一系列仿真數(shù)據(jù)。結(jié)果表明,改進(jìn)后的算法與傳統(tǒng)的降噪算法相比,降噪后的語音信噪比顯著提高,降噪效果明顯,信號波形更加平滑、失真度小。
激光技術(shù);去噪;小波閾值算法;仿真
語言對話是信息傳遞最直接、有效的方式,對被關(guān)注對象談話內(nèi)容的偵聽是刑偵部門十分關(guān)注的話題,激光偵聽因其非接觸性、隱蔽性和抗干擾新性強(qiáng)等特點(diǎn),一直作為獲取情報(bào)的重要手段,但激光偵聽信號中包含的噪聲很多,語音降噪的好壞將直接影響偵聽效果和偵聽設(shè)備的使用范圍。傳統(tǒng)的降噪方法中,維納濾波對信號的平穩(wěn)性要求較高;譜減法適用的信噪比范圍窄,而且會產(chǎn)生音樂噪聲;最小均方誤差估計(jì)(minimum mean-square error estimation,MMSE)算法運(yùn)算量大、實(shí)時(shí)性不好。由于激光偵聽對實(shí)時(shí)性的要求很高,所以上述算法都不適合處理激光偵聽信號。對此,本文中提出了一種改進(jìn)的小波閾值去噪算法,并進(jìn)行了仿真處理。仿真結(jié)果表明,改進(jìn)后的算法與傳統(tǒng)的降噪算法相比,降噪后的語音信噪比顯著提高,降噪效果明顯、失真度小,有利于擴(kuò)大激光偵聽的使用范圍。
閾值函數(shù)法又稱小波閾值去噪法,是目前研究和應(yīng)用廣泛的去噪方法之一。DONOHO等人已經(jīng)證明:小波閾值去噪法的降噪效果明顯優(yōu)于其它的經(jīng)典去噪方法。該方法的理論基礎(chǔ)是:帶噪語音信號經(jīng)過小波變換后,隨尺度的增大,實(shí)際信號的小波系數(shù)增大,而噪聲所對應(yīng)的小波系數(shù)減小,由此可知,通過一個(gè)閾值函數(shù)并設(shè)置一個(gè)合理的閾值,就可以濾除噪聲,最后對估計(jì)系數(shù)進(jìn)行小波逆變換,就可獲得去噪后的語音信號。但當(dāng)信噪比比較低時(shí),容易將原信號的高頻部分當(dāng)做噪聲濾除掉。小波系數(shù)的篩選主要依賴于閾值函數(shù)和閾值,它是閾值函數(shù)法的關(guān)鍵步驟。當(dāng)然選用的閾值函數(shù)不同,降噪效果也會不同[1]。
對于語音信號的去噪,假定其含噪信號模型可以表示為:
式中,f(n)為真實(shí)語音信號,s(n)為含有噪聲的信號,e(n)是一個(gè)標(biāo)準(zhǔn)的高斯白噪聲,ei(n)~N(0,1),σ是噪聲系數(shù),N為離散采樣序列x(n)的長度。
閾值去噪法的基本原理可以概括為:帶噪語音信號中的語音成分在小波域的能量相對集中,其分解后的小波系數(shù)的絕對值比較大,而噪聲信號分解后的小波系數(shù)的絕對值比較小,因此,只要設(shè)置一個(gè)合適的閾值,并將小于閾值的小波系數(shù)置零,就可以將噪聲濾除,達(dá)到降噪的效果[2]。
假設(shè)s(n)是一個(gè)疊加了高斯白噪聲的有限長帶噪信號,其去噪步驟為:(1)分解過程。選定一種小波,對含噪聲信號s(n)進(jìn)行N層分解,得到相應(yīng)的小波系數(shù);(2)作用閾值過程。對分解后得到的各層小波系數(shù)Wj,k選擇一個(gè)閾值,并采用閾值函數(shù)對系數(shù)進(jìn)行處理;(3)重建過程。降噪處理后的小波系數(shù)經(jīng)小波逆變換,得到去噪后的原始語音信號[3]。
信號小波分解后的小波系數(shù)設(shè)為Wj,k,閾值函數(shù)得到的小波系數(shù)估計(jì)值用為W^j,k,λ為閾值。常用的閾值函數(shù)如下[4]所示。
(1)硬閾值函數(shù):
(2)式為硬閾值函數(shù)的數(shù)學(xué)表達(dá)式,由公式可以看出,硬閾值函數(shù)對小波系數(shù)作如下處理:將絕對值小于閾值的小波系數(shù)置零,絕對值不小于閾值的小波系數(shù)則保持不變[5]。
(2)軟閾值函數(shù):
Fig.1 Hard-threshold function and soft-threshold function
(3)式為軟閾值函數(shù)的數(shù)學(xué)表達(dá)式,由公式可以看出,軟閾值函數(shù)對小波系數(shù)作如下處理:對絕對值小于閾值的小波系數(shù)置零,而對絕對值大于等于閾值的小波系數(shù)進(jìn)行收縮處理。硬閾值函數(shù)與軟閾值函數(shù)如圖1所示,其中實(shí)線為硬閾值函數(shù),虛線為軟閾值函數(shù)[6],橫坐標(biāo)表示信號的原始小波系數(shù),縱坐標(biāo)表示閾值化后的小波系數(shù)。
硬閾值函數(shù)和軟閾值函數(shù)是小波閾值去噪算法中最常用的兩種閾值函數(shù)。由于降噪效果較好,這兩種算法已經(jīng)被廣泛應(yīng)用于語音降噪領(lǐng)域,但它們本身存在著一些缺點(diǎn)。
硬閾值法主要有以下3個(gè)缺點(diǎn):(1)小波系數(shù)估計(jì)值在經(jīng)硬閾值函數(shù)處理后,在±λ處不連續(xù),因此利用重構(gòu)所得的信號有可能會出現(xiàn)振蕩;(2)硬閾值法只對絕對值小于閾值的小波系數(shù)進(jìn)行處理,對絕對值大于閾值的小波系數(shù)則不做任何處理,因此,小波系數(shù)比較大的脈沖噪聲將繼續(xù)保留在信號中;(3)硬閾值法在一些地方會產(chǎn)生突變,使處理后的語音信號會伴有音樂噪聲[7]。
經(jīng)過軟閾值方法處理后的小波系數(shù)估計(jì)值雖然整體連續(xù)性好,降噪效果相對平滑,但是當(dāng)≥λ時(shí),小波估計(jì)系數(shù)與含噪聲信號的小波系數(shù)之間一定會存在固定的偏差,這與噪聲分量隨著小波系數(shù)的增大而減小的趨勢不相符合,直接影響到重構(gòu)信號與真實(shí)信號的逼近程度,勢必會給重構(gòu)信號帶來誤差,從而降低語音的清晰度[8]。
當(dāng)<λ時(shí),硬、軟閾值函數(shù)都將置零,因而小波系數(shù)較小的有用信號也會被當(dāng)作噪聲濾除掉。
為了克服硬、軟閾值函數(shù)的缺點(diǎn),作者設(shè)計(jì)了一種改進(jìn)的閾值函數(shù)。通過觀察,軟、硬閾值函數(shù)都是單調(diào)遞增的奇函數(shù),軟閾值函數(shù)的去噪效果和性能比硬閾值函數(shù)的要好。因此,構(gòu)造的改進(jìn)的閾值函數(shù)在滿足上述兩個(gè)要求的前提下,還應(yīng)盡量吸取軟閾值函數(shù)的優(yōu)點(diǎn)。利用指數(shù)函數(shù)構(gòu)建的改進(jìn)的閾值函數(shù)如下:
式中,c>0為一待求常數(shù)。當(dāng)x→+∞時(shí),φc(x,λ)≈x-λ;當(dāng)x=0時(shí),φc(x,λ)=0;當(dāng)x→-∞時(shí),φc(x,λ)≈x+λ;這和軟閾值函數(shù)趨勢相符。令x=-x,代入(4)式得:
因此,改進(jìn)的閾值函數(shù)是奇函數(shù),關(guān)于原點(diǎn)對稱,故只需分析(0,+∞)區(qū)間即可。
首先,函數(shù)φc(x,λ)在(-∞,+∞)應(yīng)滿足單調(diào)遞增這一條件,則有:
對(4)式求偏導(dǎo),并代入(6)式得:
由于
所以,
當(dāng)c≤2/λ時(shí),新的閾值函數(shù)φc(x,λ)在(-∞,+∞)單調(diào)遞增。
其次,為了使改進(jìn)的閾值函數(shù)和軟閾值函數(shù)盡可能相似,充分利用軟閾值函數(shù)的優(yōu)點(diǎn),令δ(c)為改進(jìn)的閾值函數(shù)和軟閾值函數(shù)的差值函數(shù),則η(c)能取得最小值。
令u=ecx,并代入(10)式得:
由數(shù)學(xué)知識可知,當(dāng)η(c)為開口向上的二次函數(shù)時(shí),才可能取得最小值。當(dāng)c≤(4ln2)/λ時(shí),η(c)存在最小值。
綜合以上兩個(gè)條件,取c=2/λ,并代入(4)式,得到改進(jìn)的閾值函數(shù)如下:
改進(jìn)的閾值函數(shù)和硬、軟閾值函數(shù)如圖2所示。實(shí)線為改進(jìn)的閾值函數(shù),虛線為硬閾值函數(shù)和軟閾值函數(shù)。
Fig.2 Threshold function
從圖2中可以看出,改進(jìn)的閾值函數(shù)處于硬、軟閾值函數(shù)之間,是一條單調(diào)遞增的平滑曲線,沒有間斷點(diǎn),因而不會產(chǎn)生振蕩。改進(jìn)的閾值函數(shù)對所有的小波系數(shù)都進(jìn)行處理,克服了硬、軟閾值函數(shù)在小波系數(shù)比較小時(shí)置零的缺點(diǎn),提高了小信號不被濾除的可能性;同時(shí),它克服了軟閾值函數(shù)存在恒定偏差這一缺點(diǎn),符合噪聲系數(shù)的客觀規(guī)律;對絕對值大于閾值的系數(shù)進(jìn)行與軟閾值函數(shù)相同的收縮處理,理論上應(yīng)用前景很好[9]。
閾值的選取是小波閾值去噪算法中的關(guān)鍵因素。主要由噪聲方差的估計(jì)值和子帶系數(shù)的能量分布確定確定閾值,因?yàn)樵肼暿请S機(jī)的,所以對閾值進(jìn)行估計(jì)在去噪過程中是必須首先做的。比較著名的閾值估計(jì)法有:SUREShrink閾值法、VisuShrink閾值法、Minimaxi閾值法和HeurSure閾值法等[10]。
VisuShrink閾值法中閾值統(tǒng)一定義為λ=σn×其中,σn為噪聲的標(biāo)準(zhǔn)差,N為信號的長度。
SUREShrink閾值確定過程為:對于給定的閾值λ,首先得到它的似然估計(jì),然后將似然函數(shù)最小化,得到所需要的閾值[11]。
HeurSure閾值法中閾值由下式確定:
式中,λ1為統(tǒng)一閾值;λ2為SURE閾值;η=;wk為小波去噪后的語音信號。
Minimaxi閾值則由下式確定:
在本節(jié)的仿真圖形中,橫坐標(biāo)均為語音信號的采樣時(shí)間(單位為s),縱坐標(biāo)均為語音信號的幅度。
5.1不同閾值函數(shù)的去噪效果分析
為了說明改進(jìn)的閾值去噪函數(shù)的降噪效果比傳統(tǒng)的硬、軟閾值函數(shù)的去噪效果好,進(jìn)行如下的語音去噪對比試驗(yàn)。實(shí)驗(yàn)中采集的原始語音信號為“陜西省西安市”,采集軟件為WINDOWS自帶的錄音機(jī),采樣頻率為8kHz,數(shù)據(jù)長度為16位,采樣點(diǎn)數(shù)為112000,為單聲道采樣,音頻文件以wav格式保存。添加的噪聲特性為加性高斯白噪聲,將原始語音信號與不同強(qiáng)度的白噪聲進(jìn)行混合,從而產(chǎn)生帶噪語音信號。采用sym8小波基對帶噪的語音信號進(jìn)行處理,然后進(jìn)行6層分解,選取閾值為統(tǒng)一閾值,分別用硬閾值函數(shù)、軟閾值函數(shù)和改進(jìn)后的閾值函數(shù)進(jìn)行去噪實(shí)驗(yàn)。原始語音信號波形如圖3所示[12]。
Fig.3 The original speech signal waveform
Fig.4 The denoised speech signal waveform using different threshold function(Rin=20dB)
(1)輸入信噪比為Rin=20dB時(shí)。分別采用不同閾值函數(shù)對語音去噪,波形如圖4所示。
(2)輸入信噪比為Rin=10dB時(shí)。采用不同閾值函數(shù)對語音信號去噪,波形如圖5所示。
(3)輸入信噪比為Rin=5dB時(shí)。采用不同閾值函數(shù)對語音信號去噪,波形如圖6所示。
Fig.6 The denoised speech signal waveform using different threshold function(Rin=5dB)
(4)輸入信噪比為Rin=0dB時(shí)。采用不同閾值函數(shù)對語音信號去噪,波形如圖7所示。
表1中為采用不同閾值函數(shù)去噪后的信噪比。
Table 1 Signal-to-noise ratio using different threshold function
從圖3到圖7可以看出:與硬、軟閾值函數(shù)相比,去噪后的語音波形說明了本文中改進(jìn)算法的去噪效果明顯優(yōu)于前者。特別是當(dāng)噪聲比較大時(shí),經(jīng)過新的閾值函數(shù)去噪后,基本上無失真地恢復(fù)出了語音波形;而硬、軟閾值去噪后恢復(fù)的波形已經(jīng)產(chǎn)生了畸變,失真現(xiàn)象明顯。從表1可以看出:當(dāng)信噪比比較大時(shí),也就是語音信號和噪聲信號區(qū)分比較明顯時(shí),比較硬閾值函數(shù)、軟閾值函數(shù)和改進(jìn)后的算法,發(fā)現(xiàn)去噪后的信噪比差別不大;但當(dāng)信噪比比較小時(shí),本文中的改進(jìn)算法明顯優(yōu)于硬、軟閾值法。因此,本文中的改進(jìn)算法在去噪后波形和信噪比兩個(gè)指標(biāo)上都要好于傳統(tǒng)的硬、軟閾值法,證明了本文中改進(jìn)的算法是合理的[13]。
Fig.7 The denoised speech signal waveform using different threshold function(Rin=0dB)
5.2改進(jìn)閾值去噪算法與傳統(tǒng)去噪算法的性能比較
為了驗(yàn)證改進(jìn)閾值去噪算法的性能,分別對自己錄制的兩段語音信號進(jìn)行如下處理:選擇sym8小波并進(jìn)行6層分解,采用改進(jìn)的閾值去噪算法對帶噪語音信號進(jìn)行處理,并與傳統(tǒng)的語音去噪算法進(jìn)行比較[14]。
Fig.8 The pure speech signal waveform and the speech signal waveform with noise
Fig.9 The denoised signal waveform using different methods
(1)對錄制的音頻信號“陜西省西安市”進(jìn)行去噪處理。圖8a是純凈語音信號,采樣點(diǎn)數(shù)為112000,采樣頻率為8kHz;圖8b是添加噪聲后的語音信號,信噪比為15dB。不同方法去噪后的波形如圖9所示。去噪后的信噪比如表2所示。
Table 2 Signal-to-noise ratio using different methods(Rin=15dB)
(2)對錄制的音頻信號“我是郴州的”進(jìn)行去噪處理。圖10a是純凈語音波形,采樣點(diǎn)數(shù)為56000,采樣頻率為8kHz;圖10b是添加噪聲后的語音信號,信噪比為20dB。
Fig.10 The pure speech signal waveform and the speech signal waveform with noise
去噪后的信噪比如表3所示。
Table 3 Signal-to-noise ratio using different methods(Rin=20dB)
不同方法去噪后的波形如圖11所示。
(3)下面對本文中改進(jìn)算法和傳統(tǒng)語音降噪算法的運(yùn)算量進(jìn)行比較。為了說明本文中改進(jìn)算法的有效性,選取了一段12s長的帶噪語音信號作為處理對象,各算法的處理時(shí)間如表4所示。
Table 4 Calculation cost of traditional algorithm compared with improved algorithm
Fig.11 The denoised signal waveform using different methods
從圖8到圖11可以看出:經(jīng)過本文中的改進(jìn)算法去噪后的語音波形和純凈語音信號的波形比較相近,與傳統(tǒng)的去噪算法相比,本文中改進(jìn)算法去噪后波形更平滑,幾乎沒有毛刺出現(xiàn)。從表2和表3可以看出:在信噪比指標(biāo)方面,本文中的改進(jìn)算法具有一定的優(yōu)勢,而且魯棒性比較好。從表4可以看出,本文中改進(jìn)算法在運(yùn)算量方面也具有一定的優(yōu)勢。
綜上所述,本文中改進(jìn)算法不但兼顧了降噪效果和運(yùn)算量兩個(gè)指標(biāo),而且在去噪后的波形和信噪比都要好于傳統(tǒng)的語音去噪算法,從而證明了本文中改進(jìn)算法的有效性。
[1] GUO Ch Y,ZHENG K.Denoising optical interferometry signal based on wavelet transform threshold[J].Laser Technology,2009,37(5):506-508(in Chinese).
[2] WANG B,LIJW,WANG Zh F.Threshold de-noising method based on wavelet analysis[J].Computer Engineering and Design,2011,32(3):1099-1102(in Chinese).
[3] GUO Ch X.On the speaker recognition algorithm[J].Journal of Xi’an University of Post and Telecom,2010,15(5):104-106(in Chinese).
[4] ZHENGR,ZHANG Sh W,XU B.Improvement of speaker identification by combining prosodic features with acoustic features[C]//5th Chinese Conference on Biometric Recognition.Guangzhou:Lecture Notes in Computer Science,2004:569-576.
[5] YE H Sh,TAO JX,ZHANGDW.Improve speaker identification performance by integrating characters under noisy conditions[J].Computer Simulation,2009,26(3):325-328(in Chinese).
[6] GAN Zh G.An improved feature extraction method in speaker identification[C]//2011 Third International Conference on Intelligent Human-Machine Systems and Cybernetics.Hangzhou:IEEE,2011:218-222.
[7] McLAREN M,van LEEUWEN D.Source normalised and weighted LDA for robust speaker recognition using I-vectors[C]//IEEE International Conference on Acoustics,Speech and Signal Processing.Prague,Czech Republic:IEEE,2011:5456-5459.
[8] DU J,ZOU X,HAO J,et al.The efficiency of ICA-based representation analysis:application to speech feature extraction[J].Chinese Journal of Electronics,2011,20(2):287-292.
[9] ZHENG JW,WANGW L,ZHENG Z P.Speaker identification approach of hybrid GMM and RVM[J].Computer Simulation,2010,36(15):168-170(in Chinese).
[10] SAASTAMOINEN J,KARPOV E,HAUTAMAKIV,et al.Accuracy of MFCC-based speaker recognition in series 60 device[J].EURASIP Journalon Advances in Signal Processing,2005,37(17):2816-2827.
[11] WOOTERSC,HUIJBREGTSM.The ICSIRT07s speaker diarization system[J].Multimodal Technologies for Perception of Humans,2008,46(25):509-519.
[12] BOLL S.Suppression of acoustic noise in speech using spectral subtraction[J].IEEE Transactions on Acoustics,Speech and Signal Processing,1979,27(2):113-120.
[13] CHEN A M,VASEGHIS,MECOURT P.State based sub-band LP wiener filters for speech enhancement in car environments[J].IEEE Proceedings of International Conference on Acoustics,Speech and Signal Processing,2000,15(1):213-216.
[14] McAULAY R,MALPASS M.Speech enhancement using a softdecision noise suppression filter[J].IEEE Transaction on A-coustics,Speech and Signal Processing,1980,28(2):137-145.
An improved wavelet threshold algorithm applied in laser interception
QUZhi1,ZHANGBohu2
(1.Prostgraduare Brigade,Engineering College of China Armed Police Force,Xi’an 710086,China;2.Department of Communications Engineering,Engineering College of China Armed Police Force,Xi’an 710086,China)
In order to get better denoising result in laser interception,an improved wavelet threshold denoising algorithm was proposed.Through theoretical analysis and experimental verification,a series of simulation data were obtained.The results show that,compared with the traditional denoising algorithm,the speech signal-to-noise ratio after denoising is improved greatly.Denoising effect is obvious,signal waveform is smoother and distortion is less.
laser technique;denoising;wavelet threshold algorithm;simulation
TN249
A
10.7510/jgjs.issn.1001-3806.2014.02.016
1001-3806(2014)02-0218-07
屈 直(1989-),男,碩士研究生,現(xiàn)主要從事軍事通信的研究。
*通訊聯(lián)系人。E-mail:zbh62825@163.com
2013-06-04;
2013-07-06