国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于聽覺模型的法庭語音證據(jù)特征量化

2018-03-06 08:06:11王華朋
中國刑警學(xué)院學(xué)報 2018年1期
關(guān)鍵詞:基底膜耳蝸濾波器

王華朋

(1 中國刑事警察學(xué)院聲像資料檢驗技術(shù)系 遼寧 沈陽 110035;2 證據(jù)科學(xué)教育部重點實驗室(中國政法大學(xué)) 北京 100000)

1 引言

目前,隨著司法制度的健全和完善,對證據(jù)的檢驗結(jié)果已經(jīng)由鑒定結(jié)論更改為鑒定意見,這雖然是對證據(jù)使用的一次巨大進(jìn)步,但是,這并不意味著更改一下名稱,證據(jù)就具有了科學(xué)性。越來越多的學(xué)者開始關(guān)注證據(jù)的科學(xué)性[1-4],科學(xué)證據(jù)逐漸成為司法審判中關(guān)注的焦點之一??茖W(xué)證據(jù)的基本要求包括,檢驗過程和檢驗方法是科學(xué)的,結(jié)果是客觀的、可重復(fù)的,證據(jù)強(qiáng)度是可量化的[5]。本文以語言證據(jù)的檢驗過程中遇到的相關(guān)問題,探究語音聽覺量化分析的方法。

在法庭語音證據(jù)檢驗中,主要包括聽覺檢驗和聲學(xué)檢驗[6]。其中,聽覺檢驗主要依靠鑒定人員的雙耳來進(jìn)行,得出的結(jié)果也是基于鑒定人員的主觀判斷,即使是半定量的聽覺分析,也是通過人耳對音高、嗓音品質(zhì)、方言等聽覺特征的相似性進(jìn)行打分來進(jìn)行[7],一直以來,缺少對語音的聽覺特征進(jìn)行全面的量化分析。

聽覺系統(tǒng)是高度精密又具有高度復(fù)雜性的生理系統(tǒng),其很多卓越的聲音分析能力遠(yuǎn)遠(yuǎn)超過了自動說話人識別系統(tǒng)[8]。在噪聲的環(huán)境下,人耳聽覺識別的準(zhǔn)確率比任何自動識別系統(tǒng)更具有可靠性、便捷性[9]。聽覺系統(tǒng)具有很強(qiáng)的聲音識別能力和抗噪聲能力[10],能在復(fù)雜的背景聲中捕捉感興趣的目標(biāo)語音,如雞尾酒會效應(yīng)。研究人類的聽覺生理系統(tǒng)的特性具有重大的意義。

人耳對聲音的感知主要是通過耳蝸,耳蝸的作用是把傳到耳蝸的機(jī)械振動轉(zhuǎn)變成聽神經(jīng)纖維的神經(jīng)沖動。耳蝸中能夠辨別分析聲音最重要的部分是基底膜[11],它的振動使位于上面的毛細(xì)胞受到刺激,引起耳蝸內(nèi)發(fā)生各種過渡性的電變化,最后引起位于毛細(xì)胞底部的傳入神經(jīng)纖維產(chǎn)生動作電位。觀察表明,行波(Traveling Wave)是基底膜的振動方式,即內(nèi)淋巴的振動首先是靠近卵形窗處引起基底膜的振動,此振動波再以行波的形式沿基底膜向耳蝸的頂部傳播,振動頻率愈低的行波傳播越遠(yuǎn),最大行波振幅出現(xiàn)在基底膜頂部,最大振幅出現(xiàn)后,行波很快消失,不再傳播;與低頻聲音振動相反,高頻率的聲音引起的基底膜振動,只局限于卵形窗附近。

不同頻率的聲音引起基底膜以不同的形式進(jìn)行振動,被認(rèn)為是耳蝸能區(qū)分不同聲音頻率的基礎(chǔ)。越靠近基底膜底部,共振頻率愈高,越靠近基底膜頂部,共振頻率越低。因此,基底膜具有對人耳聲音進(jìn)行頻率分析的功能,能夠?qū)⒉煌念l率成分對應(yīng)到基底膜不同的位置,頻率的強(qiáng)度轉(zhuǎn)化為基底膜振幅的幅度。由于Gammatone濾波器能夠模擬耳蝸基底膜的分頻特性,對人類的聽覺感知特征進(jìn)行量化,是把聽覺從主觀判斷轉(zhuǎn)化為量化結(jié)果的有效方法。同時,該濾波器在噪聲環(huán)境中具有優(yōu)越的性能,能夠?qū)β晫W(xué)檢驗中聲譜圖進(jìn)行聽覺方面的補充。

2 描述人耳聽覺特性的Gammatone濾波器

Gammatone濾波器能夠用于描述人耳聽覺頻響特性,建立類耳蝸的聽覺模型,該濾波器時域表達(dá)形式為:

四階的Gammatone濾波器帶寬可以用下式表示,濾波器的帶寬隨著中心頻率的變大而增加。

其中,ERB表示的是等效矩形帶寬(Equivalent Rectangular Bandwidth),是人耳耳蝸聽覺帶寬的心理聲學(xué)測度。此外,ERB 決定了每個濾波器脈沖響應(yīng)的衰減速度。等效矩形帶寬ERB 與頻率f可以近似地

對Gammatone濾波器時域表達(dá)式進(jìn)行傅里葉變換可以得到頻響特性。Gammatone濾波器有N個單獨濾波器組成,一般取N=64,表示該濾波器由64個互相交疊的子濾波器組成,每個子濾波器的中心頻率fi在ERB域以相同的間隔分布。整個濾波器的帶寬設(shè)置為從50Hz到采樣頻率的一半。不同的中心頻率的Gammatone濾波器的響應(yīng)也不同。Gammatone濾波器與Mel濾波器有點類似,它們都是中心頻率間隔越來越大,濾波器的帶寬也越來越寬,如圖1所示。

圖1 子濾波器頻響曲線(僅顯示4的整數(shù)倍)

3 Gammatone譜與聲譜圖的區(qū)別

Gammatone譜與聲譜圖類似,都是對聲音進(jìn)行分幀之后,進(jìn)行FFT變換后獲得的,不同的是Gammatone譜是在進(jìn)行FFT變換之前通過Gammatone濾波器。圖2是同一段音頻的Gammatone譜與聲譜圖。

圖2 聲譜圖與Gammatone譜對比圖

對比聲譜圖和Gammatone譜可以看出,Gammatone譜在低頻區(qū)具有更好的細(xì)節(jié)分辨率,對于高于4KHz的能量,Gammatone譜顯示能力有限。Gmmatone譜中具有與聲譜圖中的共振峰對應(yīng)的特征,其走勢和彎轉(zhuǎn)方向也相同。可以推斷,人耳對于0~5kHz的聲音更敏感,對頻率越低的聲音具有越精細(xì)的分辨率。這與實際案件中經(jīng)常遇到的語音證據(jù)的頻響范圍一致,因此,具有廣泛的應(yīng)用價值。同時,在圖2中的無語聲區(qū)可以看出,噪聲已經(jīng)得到很好的抑制,這與人耳天然的抗噪聲特性相符。圖3是在強(qiáng)噪聲環(huán)境中聲譜圖與Gammatone譜圖。在強(qiáng)噪聲環(huán)境中,聲譜圖高頻特征已經(jīng)淹沒在噪聲中,而Gammatone譜能提供更多的細(xì)節(jié)特征,這說明在有噪聲的語音證據(jù)中,Gammatone譜優(yōu)勢更突出。

圖3 噪聲環(huán)境下聲譜與Gammatone譜對比圖

4 Gammatone譜自身變化性與話者之間的差異

通過語音證據(jù)對說話人身份進(jìn)行鑒別,所用到的特征或特征圖譜要具有較小的自身變化性和較大的話者之間的變化性。圖4是錄制的同一個男性話者在不同時間的語音文件,兩次錄音的Gammatone特征具有很高的相似性,話者自身的變化性較小。

圖4 同一個人Gammatone譜

圖5 不同人Gammatone譜

圖5是3個不同說話人說相同語音內(nèi)容的Gammatone譜圖,可以看出,三者之間具有很大的不同,圖譜重要特征的斜率和彎轉(zhuǎn)方向也具有很大的不同,可以用來鑒別說話人身份,其鑒別方法可以參考使用聲譜圖檢驗的方法。

本文測量了3個不同的說話人和同一個說話人的5次發(fā)音,特征選擇的音節(jié)是“八”中的元音/a/的4個典型特征,測量特征點所在的濾波器中心頻率的大小,得到如表1、表2所示的結(jié)果。根據(jù)其測量值的方差可見,不同人的測量結(jié)果標(biāo)準(zhǔn)差較大,而相同人的測量結(jié)果分布非常穩(wěn)定,測量結(jié)果標(biāo)準(zhǔn)差較小。因此,Gammatone譜話者自身的變化性遠(yuǎn)小于話者之間的差異,是一種適合區(qū)分說話人的圖譜類型。

表1 不同人元音/a/特征點的頻率

表2 同一個人元音/a/特征點的頻率(5次發(fā)音)

5 結(jié)論

從Gammatone譜和聲譜圖的比對結(jié)果分析,Gammatone譜具有良好的低頻分辨能力和抗噪聲能力,并且具有較小的自身變化性和較大的話者之間的變化性,符合司法證據(jù)檢驗的鑒別規(guī)則,是較好的區(qū)分說話人身份的特征。該特征不僅能對聲譜圖檢驗進(jìn)行有力的補充,并且可以進(jìn)行量化分析,用于自動說話人識別,從而量化聽覺特征,變主觀判斷為數(shù)據(jù)支撐的客觀判斷,從而為證據(jù)的科學(xué)化檢驗打下基礎(chǔ)。

[1]Enzinger E, Morrison G S, Ochoa F. A demonstration of theapplication of the new paradigm for the evaluation of forensicevidence under conditions reflecting those of a real forensicvoice-comparison case[J]. Science & Justice,2016(1):42-57.

[2]Rose P. Where the science ends and the law begins:likelihood ratio-based forensic voice comparison in a $150 m illion telephone fraud[J]. International Journal of Speech Language and the Law,2013(2):277-324.

[3]Morrison G S. Distinguishing between forensic science and forensic pseudoscience:Testing of validity and reliability,and approaches to forensic voice comparison[J]. Science & Jus tice,2014(3):245-256.

[4]Rose P, Morrison G S. A response to the UK Position Statement on forensic speaker comparison[J]. International Journal of Speech Language and the Law,2009(1):139-163.

[5]王華朋,許鋒.論法庭證據(jù)評估體系的發(fā)展[J].證據(jù)科學(xué),2014(22):56-63.

[6]王華朋,李寧,許峰,等.基于元音共振峰特征的法庭說話人識別[J].中國刑警學(xué)院學(xué)報,2014(2):43-45.

[7]崔景旭.視聽資料檢驗[M].北京:中國人民公安大學(xué)出版社,2008:86-89.

[8]曹巧玲,余浚灃,趙曉波.音節(jié)音聯(lián)在語音鑒別中的應(yīng)用研究[J].中國刑警學(xué)院學(xué)報,2012(2):45-47.

[9]熊冰峰,曾以成,謝小娟.一種改進(jìn)的聽覺特征參數(shù)應(yīng)用于說話人識別[J].計算機(jī)應(yīng)用,2016(s1):82-85.

[10]王聰,張巧麗,趙地,等.大腦聽覺系統(tǒng)建模研究進(jìn)展[J].計算機(jī)科學(xué),2016(s2):1-5.

[11]陳世雄,宮琴,金慧君.用Gammatone濾波器組仿真人耳基底膜的特性[J].清華大學(xué)學(xué)報(自然科學(xué)版),2008(6):1044-1048.

[12]張曉丹,黃麗霞,張雪英.關(guān)于在噪聲環(huán)境下語音識別優(yōu)化研究[J].計算機(jī)仿真,2016(8):172-176.

猜你喜歡
基底膜耳蝸濾波器
基于無擾濾波器和AED-ADT的無擾切換控制
新生小鼠耳蝸基底膜的取材培養(yǎng)技術(shù)*
耳蝸微音器電位臨床操作要點
從濾波器理解卷積
電子制作(2019年11期)2019-07-04 00:34:38
開關(guān)電源EMI濾波器的應(yīng)用方法探討
電子制作(2018年16期)2018-09-26 03:26:50
豚鼠耳蝸基底膜響應(yīng)特性的實驗測試與分析
振動與沖擊(2018年4期)2018-03-05 00:34:24
Fibulin-2在診斷乳腺基底膜連續(xù)性的準(zhǔn)確性研究
DR內(nèi)聽道像及多層螺旋CT三維重建對人工耳蝸的效果評估
基于TMS320C6678的SAR方位向預(yù)濾波器的并行實現(xiàn)
豚鼠耳蝸Hensen細(xì)胞脂滴的性質(zhì)與分布
尚志市| 万年县| 武安市| 福海县| 剑河县| 芦溪县| 东城区| 耒阳市| 大荔县| 阜新市| 永寿县| 涿州市| 镇平县| 西吉县| 鄂托克旗| 东莞市| 大邑县| 红桥区| 银川市| 格尔木市| 天全县| 九寨沟县| 图木舒克市| 南漳县| 枣阳市| 吉水县| 大安市| 彰武县| 平罗县| 金川县| 西乌珠穆沁旗| 离岛区| 云和县| 都兰县| 哈尔滨市| 绿春县| 大洼县| 建宁县| 公主岭市| 布尔津县| 郓城县|