国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于樣本熵的語(yǔ)音信號(hào)檢測(cè)算法

2021-01-28 03:08:46陳佳琪鄭曉慶
關(guān)鍵詞:背景噪聲子集頻譜

陳佳琪,鄭 強(qiáng),鄭曉慶

(海軍航空大學(xué),山東煙臺(tái)264001)

船舶航行時(shí),語(yǔ)音通訊與交流是必不可少的。但船舶航行過(guò)程中,各種設(shè)備產(chǎn)生的巨大噪聲嚴(yán)重干擾了通訊端語(yǔ)音信號(hào),使得有用的語(yǔ)音不能被正常接收,影響了船舶工作者的正常交流。故削除語(yǔ)音信號(hào)通訊端工作環(huán)境中船舶的噪聲干擾,增強(qiáng)語(yǔ)音信號(hào),對(duì)語(yǔ)音交流的準(zhǔn)確性和舒適性有重要意義。實(shí)現(xiàn)語(yǔ)音信號(hào)增強(qiáng),須從含噪信號(hào)中將語(yǔ)音信號(hào)和船舶背景噪聲正確地檢測(cè)分離,以便進(jìn)一步通過(guò)譜減法等方法實(shí)現(xiàn)語(yǔ)音增強(qiáng)。

為了達(dá)到語(yǔ)音降噪增強(qiáng)的目的,關(guān)鍵是要把源信號(hào)中無(wú)語(yǔ)音的噪聲段與語(yǔ)音段進(jìn)行分離。目前,國(guó)內(nèi)外學(xué)者進(jìn)行了相關(guān)的分析研究,提出的方法有時(shí)域和頻域特征處理方法。如,基于短時(shí)能量、過(guò)零率、譜散度[1],倒譜分析、短時(shí)分形維數(shù)[2],頻帶方差[3],多重線性回歸分析[4]及修正調(diào)制譜估計(jì)[5]等。但這些方法在用于艦船背景噪聲時(shí)遇到了以下困難:①船舶類型多種多樣,運(yùn)行狀態(tài)千變?nèi)f化,因而其噪聲特征各不相同,背景噪聲復(fù)雜多變;②艦船設(shè)備工作時(shí)噪聲巨大,很多時(shí)候在時(shí)域可將語(yǔ)音信號(hào)完全掩蓋,使信號(hào)的信噪比很低;③同背景噪聲一樣,說(shuō)話人的性別與年齡的不同也會(huì)導(dǎo)致語(yǔ)音信號(hào)的巨大差異。船舶背景噪聲和語(yǔ)音信號(hào)的復(fù)雜多變使許多檢測(cè)方法因類內(nèi)特征離散度大而失效。所以,須探索新的噪聲段與語(yǔ)音段的檢測(cè)分離方法,以適應(yīng)船舶背景噪聲特征[6]。

樣本熵是Richman提出的一種時(shí)間序列復(fù)雜性的測(cè)試方法[7],復(fù)雜度代表了信號(hào)序列中出現(xiàn)新信息量的大小[8]。語(yǔ)音信號(hào)與船舶工作噪聲信號(hào)的產(chǎn)生機(jī)理是不同的,語(yǔ)音信號(hào)是由肺部收縮產(chǎn)生的氣流經(jīng)過(guò)聲門(mén)和聲道引起震蕩產(chǎn)生的;船舶工作噪聲與船舶的結(jié)構(gòu)、材質(zhì)和發(fā)動(dòng)機(jī)樣式等有關(guān)。因此,2種信號(hào)時(shí)間序列的信息變化程序存在差別。本文在分析2種信號(hào)復(fù)雜性特征的基礎(chǔ)上,利用2 種信號(hào)在時(shí)間序列中出現(xiàn)新信息量的大小和變化幅度的不同,通過(guò)時(shí)域信號(hào)樣本熵,實(shí)現(xiàn)了含噪信號(hào)中語(yǔ)音段和船舶背景噪聲段的正確分離。通過(guò)實(shí)測(cè)數(shù)據(jù)實(shí)驗(yàn)驗(yàn)證,該方法具有不錯(cuò)的檢測(cè)效果。

1 信號(hào)特征分析

艦船背景噪聲與語(yǔ)音信號(hào)本身都為復(fù)雜多變的信號(hào),類內(nèi)特征皆有較大的離散性,故可以信號(hào)發(fā)聲機(jī)理為基礎(chǔ)研究2 者的不同之處,并利用頻譜的相似性將信號(hào)進(jìn)行分離。

船舶作為一種工作環(huán)境,有其本身的特殊性。船舶背景噪聲主要由船舶發(fā)動(dòng)機(jī)、發(fā)電機(jī)等各種設(shè)備的運(yùn)行產(chǎn)生,對(duì)于實(shí)際的工作環(huán)境,船舶自身的大小、材料、發(fā)動(dòng)機(jī)類型等會(huì)成為其噪聲特性的決定性因素[9]。這說(shuō)明當(dāng)在一個(gè)較短時(shí)間內(nèi),分析其噪聲特點(diǎn)時(shí),由于船舶自身運(yùn)動(dòng)狀態(tài)及發(fā)動(dòng)機(jī)狀態(tài)等通常會(huì)保持一個(gè)較穩(wěn)定的狀態(tài),因而對(duì)其噪聲進(jìn)行頻譜等各種特征分析時(shí),短時(shí)間內(nèi)的頻譜特性會(huì)較為穩(wěn)定[10-11]。圖1 為某船舶背景噪聲相鄰時(shí)間幀信號(hào)的頻譜分布??梢钥闯?,其相鄰幀的頻譜分布表現(xiàn)出較好的相似性,即具有短時(shí)穩(wěn)定性。

圖1 船舶背景噪聲信號(hào)相鄰幀頻譜分布相似性Fig.1 Spectrum distribution similarity of adjacent frames of ship background noise signal

語(yǔ)音信號(hào)由肺部收縮產(chǎn)生的氣流經(jīng)過(guò)聲門(mén)和聲道引起震蕩而產(chǎn)生。語(yǔ)音中有意義的最小單元是單詞,單詞由音素組成[12-14],音素是語(yǔ)音中的最小單位。一段語(yǔ)音信號(hào)中會(huì)選擇不同的單詞來(lái)表達(dá)內(nèi)容,通過(guò)音素引起氣流、聲門(mén)和聲道的不斷變化,從而表現(xiàn)出即使在一個(gè)較短時(shí)間內(nèi),其相鄰時(shí)間幀信號(hào)的頻譜等特征表現(xiàn)出較大的差異,如圖2 所示。為純凈語(yǔ)音信號(hào)相鄰幀信號(hào)的頻譜分布特性,其頻譜計(jì)算方法與圖1相同,且都進(jìn)行了頻譜曲線平滑處理。

圖2 語(yǔ)音信號(hào)相鄰幀頻譜分布特征Fig.2 Spectrum distribution characteristics of adjacent frames of speech signal

綜上所述,不同的發(fā)聲機(jī)理,使語(yǔ)音信號(hào)與船舶背景噪聲信號(hào)的短時(shí)頻譜相似性有較大的差異。對(duì)于背景噪聲信號(hào),其短時(shí)幀間頻譜分布相似性較大,因而其信號(hào)時(shí)間序列中的新信息量較少;而語(yǔ)音信號(hào)由于短時(shí)幀間頻譜的分布相差很大,其信號(hào)時(shí)間序列中的新信息量會(huì)較多[15-18]。因此,通過(guò)樣本熵來(lái)描述含噪聲語(yǔ)音信號(hào)中語(yǔ)音段與噪聲段信號(hào)的新信息量差異,可以實(shí)現(xiàn)2種信號(hào)的判別。

2 含噪語(yǔ)音信號(hào)的樣本熵

2.1 樣本熵的定義和物理意義

樣本熵的定義為:通過(guò)度量信號(hào)中產(chǎn)生新模式的概率大小來(lái)衡量時(shí)間序列復(fù)雜性,新模式產(chǎn)生的概率越大,序列的復(fù)雜性就越大。當(dāng)數(shù)據(jù)向量由m 維增加至m+1 維時(shí),繼續(xù)保持其相似性的條件概率[15],則樣本熵可表示為:

式(1)中:N 為信號(hào)長(zhǎng)度;r 為相似容限;Bm(r) 和Bm+1(r)的定義如式(4)所示。

時(shí)間序列產(chǎn)生新模式的概率越大,序列越復(fù)雜,相應(yīng)的樣本熵越大。樣本熵從統(tǒng)計(jì)的角度來(lái)區(qū)別時(shí)間過(guò)程的復(fù)雜性,表征信號(hào)序列中前后數(shù)據(jù)的差異變化,只須要較短的數(shù)據(jù)就可以估計(jì)出來(lái)。

2.2 樣本熵的計(jì)算

設(shè)每幀長(zhǎng)度為N 的含船舶背景噪聲的語(yǔ)音信號(hào)經(jīng)過(guò)預(yù)處理后為x,其組成m 維向量為:

式(4)中,i,j ∈[ ]1,N-m+1 且i ≠j,對(duì)所有i 值求平均得:

3 基于樣本熵的語(yǔ)音信號(hào)與輻射噪聲判別算法

采樣率為11 025 Hz 的輸入信號(hào),基于樣本熵的信號(hào)判別算法的實(shí)現(xiàn)步驟如下:

步驟1:信號(hào)分幀。對(duì)信號(hào)進(jìn)行預(yù)加重處理并使用漢明窗分幀,每幀512 個(gè)數(shù)據(jù)點(diǎn),幀移點(diǎn)數(shù)為256。實(shí)驗(yàn)中,m=2,容許值r=0.2。

步驟2:對(duì)信號(hào)類別初始判別。首先,根據(jù)式(6)計(jì)算樣本熵SampEn;然后,根據(jù)式(7)計(jì)算自適應(yīng)閾值Thre1。

式(7)中:λ1與λ2的值通過(guò)試驗(yàn)確定,這里取值為λ1=4 和λ2=6;u、δ 為信號(hào)的均值與標(biāo)準(zhǔn)差。

比較SampEn 的值與Thre1的值:

如果SampEn ≤Thre1,信號(hào)為語(yǔ)音信號(hào);

如果SampEn>Thre1,信號(hào)為輻射噪聲。

從而實(shí)現(xiàn)對(duì)每1幀信號(hào)的初始判別。

步驟3:鄰域平滑處理。根據(jù)同一種信號(hào)通道持續(xù)一定時(shí)間的規(guī)律,以當(dāng)前信號(hào)幀及其前2 幀信號(hào)作為當(dāng)前幀類別判斷的鄰域,對(duì)信號(hào)進(jìn)行平滑處理。當(dāng)鄰域幀信號(hào)中有2 幀以上的信號(hào)類別為環(huán)境噪聲,則當(dāng)前幀信號(hào)最終類別判定為環(huán)境噪聲,反之亦然。在對(duì)信號(hào)進(jìn)行平滑處理時(shí),以鄰域幀信號(hào)的初始判別類型為判據(jù)。

4 算法實(shí)驗(yàn)驗(yàn)證

本文使用實(shí)測(cè)數(shù)據(jù)來(lái)驗(yàn)證算法的有效性。其中,船舶工作環(huán)境噪聲數(shù)據(jù)主要為空投浮標(biāo)和被動(dòng)全向聲吶采集的數(shù)據(jù),包括商船、漁船等,數(shù)據(jù)文件共400 min,語(yǔ)音信號(hào)包括采用海泰HTPXI1008 數(shù)據(jù)采集器搭配麥克風(fēng)在實(shí)驗(yàn)室錄制的數(shù)據(jù)、網(wǎng)上公開(kāi)的語(yǔ)音算法驗(yàn)證庫(kù)中的語(yǔ)音數(shù)據(jù)共400 min,數(shù)據(jù)采樣率均調(diào)整為11 025 Hz。實(shí)驗(yàn)中,以1s 時(shí)間長(zhǎng)度為一個(gè)處理片段,片段內(nèi)數(shù)據(jù)劃分成10 幀,按照前面介紹的算法執(zhí)行。

如圖3 所示,為測(cè)試基于頻譜趨勢(shì)相似性的信號(hào)識(shí)別算法的性能及對(duì)不同數(shù)據(jù)的適應(yīng)性,將測(cè)試數(shù)據(jù)分成3個(gè)子集進(jìn)行實(shí)驗(yàn)。

子集1:該數(shù)據(jù)子集主要包括不同說(shuō)話者的語(yǔ)音信號(hào),主要用來(lái)測(cè)試算法對(duì)語(yǔ)音信號(hào)的識(shí)別性能和對(duì)不同說(shuō)話者語(yǔ)音的適應(yīng)性。實(shí)驗(yàn)中,每個(gè)錄制的數(shù)據(jù)取20 s 進(jìn)行實(shí)驗(yàn),其結(jié)果如圖3 a)所示。

子集2:該數(shù)據(jù)子集主要包括不同的水聲目標(biāo)輻射噪聲數(shù)據(jù)。為實(shí)驗(yàn)的需要,采用與子集1 相同的數(shù)據(jù)文件長(zhǎng)度,該數(shù)據(jù)子集主要用來(lái)測(cè)試算法對(duì)水聲目標(biāo)輻射噪聲信號(hào)的識(shí)別性能和適應(yīng)性,其識(shí)別結(jié)果如圖3 b)所示。

子集3:該數(shù)據(jù)子集由不同的語(yǔ)音信號(hào)和水聲目標(biāo)輻射噪聲信號(hào)組成,每個(gè)數(shù)據(jù)文件取20 s 進(jìn)行實(shí)驗(yàn)。該子集主要用來(lái)測(cè)試算法對(duì)語(yǔ)音信號(hào)和水聲目標(biāo)噪聲信號(hào)同時(shí)存在時(shí)的識(shí)別效果。同時(shí),測(cè)試對(duì)語(yǔ)音信號(hào)與水聲目標(biāo)信號(hào)起始位置的識(shí)別精度,實(shí)驗(yàn)結(jié)果如圖3 c)、3 d)所示。其中,圖3 c)為每個(gè)語(yǔ)音數(shù)據(jù)文件與水聲目標(biāo)數(shù)據(jù)文件交替讀取識(shí)別,而圖3 d)為數(shù)據(jù)文件隨機(jī)讀取識(shí)別結(jié)果。

圖3的4個(gè)識(shí)別結(jié)果中都包含4個(gè)子圖,從下到上分別是時(shí)域信號(hào)幅值、在時(shí)域信號(hào)上計(jì)算得到的短時(shí)頻譜Pearson 相關(guān)系數(shù)方差、初始未經(jīng)過(guò)平滑處理的識(shí)別結(jié)果和算法的最終識(shí)別結(jié)果。

每個(gè)圖中,第1 個(gè)和第2 個(gè)子圖的縱坐標(biāo)分別表示實(shí)驗(yàn)對(duì)目標(biāo)的判斷結(jié)果。

子圖縱坐標(biāo)取值中,1 表示識(shí)別結(jié)果為水聲目標(biāo)輻射噪聲信號(hào);2 表示采用多閾值方法但未進(jìn)行結(jié)果平滑時(shí)被識(shí)別為水聲目標(biāo)信號(hào)待定信號(hào);3 表示語(yǔ)音信號(hào)待定信號(hào);4表示識(shí)別結(jié)果為語(yǔ)音信號(hào)。

從圖3 中可以看出,算法對(duì)不同類型和不同工況下的水聲目標(biāo)信號(hào)以及對(duì)不同說(shuō)話者的語(yǔ)音信號(hào)都取得了較好的識(shí)別效果,對(duì)不同組合方式形成的混合信號(hào)也取得了準(zhǔn)確的識(shí)別結(jié)果。

為了量化該算法的判別精度,將正確判別信號(hào)時(shí)間和信號(hào)總時(shí)間進(jìn)行比較,即:

對(duì)所有實(shí)驗(yàn)數(shù)據(jù)信號(hào)處理后的結(jié)果如表1 所示。從表1 中可以看出,基于時(shí)域信號(hào)樣本熵的語(yǔ)音信號(hào)與環(huán)境噪聲信號(hào)判別算法取得了較高的穩(wěn)定精度。

表1 語(yǔ)音信號(hào)與輻射噪聲信號(hào)判別結(jié)果Tab.1 Discrimination results of voice signal and radiated noise signal %

5 結(jié)論

本文通過(guò)分析語(yǔ)音信號(hào)與船舶工作環(huán)境噪聲信號(hào)的不同產(chǎn)生機(jī)理,利用2 種信號(hào)在時(shí)域時(shí)間序列中出現(xiàn)新信息量的大小和變化幅度不同,通過(guò)信號(hào)樣本熵實(shí)現(xiàn)了2種信號(hào)的判別。本文僅使用樣本熵一個(gè)特征,避免了多特征之間的相關(guān)性帶來(lái)的不確定因素以及特征值的計(jì)算帶來(lái)的計(jì)算量較大等不足,通過(guò)大量實(shí)測(cè)數(shù)據(jù)的實(shí)驗(yàn)驗(yàn)證,算法取得了理想的判別結(jié)果。

猜你喜歡
背景噪聲子集頻譜
窄帶電力線通信信道背景噪聲抑制方法
由一道有關(guān)集合的子集個(gè)數(shù)題引發(fā)的思考
拓?fù)淇臻g中緊致子集的性質(zhì)研究
一種用于深空探測(cè)的Chirp變換頻譜分析儀設(shè)計(jì)與實(shí)現(xiàn)
關(guān)于奇數(shù)階二元子集的分離序列
一種基于稀疏度估計(jì)的自適應(yīng)壓縮頻譜感知算法
應(yīng)用背景噪聲成像研究祁連山地區(qū)地殼S波速度結(jié)構(gòu)
地震研究(2017年3期)2017-11-06 23:38:05
認(rèn)知無(wú)線電頻譜感知技術(shù)綜述
海上單道地震勘探中船舶等背景噪聲的影響分析及壓制
每一次愛(ài)情都只是愛(ài)情的子集
都市麗人(2015年4期)2015-03-20 13:33:22
普定县| 资溪县| 安新县| 阿克苏市| 大关县| 湘西| 太仆寺旗| 乾安县| 巴马| 渝北区| 拉孜县| 许昌县| 无极县| 宜州市| 交城县| 天祝| 南康市| 华宁县| 黄冈市| 咸宁市| 毕节市| 秦皇岛市| 彰化市| 辉南县| 界首市| 登封市| 山东省| 宝丰县| 成武县| 安泽县| 合阳县| 正安县| 神农架林区| 宜城市| 丰镇市| 红原县| 湖州市| 西乡县| 杭锦后旗| 黄梅县| 垫江县|