国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于元音共振峰特征的法庭說話人識別

2014-04-27 09:51:09王華朋李寧許鋒蔡能斌
中國刑警學(xué)院學(xué)報 2014年2期
關(guān)鍵詞:元音共振法庭

王華朋李 寧許 鋒蔡能斌

(1 中國刑警學(xué)院 遼寧 沈陽 110035;2 上海市公安局物證鑒定中心 上海 200135)

基于元音共振峰特征的法庭說話人識別

王華朋1李 寧1許 鋒1蔡能斌2

(1 中國刑警學(xué)院 遼寧 沈陽 110035;2 上海市公安局物證鑒定中心 上海 200135)

在似然比證據(jù)評估體系下研究元音的共振峰特征在法庭語音證據(jù)強(qiáng)度評估中的應(yīng)用,提供了似然比計算方法,并在包含42人語音的數(shù)據(jù)庫中對法庭說話人識別系統(tǒng)的性能及可靠性進(jìn)行了檢驗。結(jié)果表明:使用共振峰特征的法庭說話人識別系統(tǒng),在只使用一個元音的情況下具有良好的識別率。該方法不僅能正確識別說話人,而且能根據(jù)當(dāng)前語音證據(jù)的差異,量化該語音樣本作為證據(jù)的力度,為法庭提供科學(xué)合理的證據(jù)評估結(jié)果。

共振峰 似然比 法庭說話人識別

1 似然比方法概述

法庭科學(xué)家早在20年前就已經(jīng)意識到了簡單的“認(rèn)定/否定”所帶來的負(fù)面問題,因此都在探索更好的評判證據(jù)價值和表述檢驗結(jié)論的方法。目前,使用似然比方法的DNA證據(jù)及分析模式已經(jīng)普遍為世界各國法庭所接受。因此,國外一些專家嘗試效仿DNA技術(shù),將似然比方法應(yīng)用于其他法庭證據(jù),如玻璃、油漆、語音和指紋等,并且進(jìn)行了大量的測試和評估。澳大利亞、英國和歐洲一些國家的學(xué)者提出在鑒定結(jié)論的表述和價值評判上引入了似然比方法。在法庭證據(jù)評價體系中利用似然比方法評判證據(jù)力度是一種科學(xué)有效的評價方法。該方法通過比較檢材和樣本的相似度,計算兩者的似然概率,同時以經(jīng)驗背景數(shù)據(jù)(先驗概率)為參考,最后得到支持起訴假設(shè)(認(rèn)定同一)的后驗概率。似然比方法適用于多種法庭證據(jù),如DNA、玻璃、油漆、語音等,并且各種證據(jù)的似然比還可以合并,進(jìn)行綜合評價。似然比方法有利于更科學(xué)地評判法庭證據(jù)的價值,供法官客觀科學(xué)地判斷和采信證據(jù),對于完善證據(jù)檢驗鑒定體系具有重要意義。

2005年,美國亞利桑那州立大學(xué)的教授M.J.Saks和J.J.Koehler在《Science》上撰文指出,法庭識別科學(xué)正在向一個新的證據(jù)評估體系發(fā)展。2009年,澳大利亞新南威爾士大學(xué)的教授G.S.Morrison在《science& Justice》上撰文指出,在法庭語音比對領(lǐng)域,目前正處于新舊證據(jù)評估模式的轉(zhuǎn)換進(jìn)程中,明確指出了似然比證據(jù)評估體系的科學(xué)性,是未來法庭證據(jù)評估的發(fā)展方向。澳大利亞、英國和歐洲其他一些國家的法庭科學(xué)家也提出在法庭證據(jù)的檢驗和評估上應(yīng)該借鑒DNA檢驗的成功做法,引入基于貝葉斯理論的似然比證據(jù)評估體系。該體系不僅可以對證據(jù)價值進(jìn)行量化評價,還可以測試分析技術(shù)及方法的可靠程度和準(zhǔn)確程度,因此,被科學(xué)界公認(rèn)為是目前最科學(xué)、最正確和最符合邏輯推理的法庭證據(jù)評估方法。

2 似然比在法庭證據(jù)中的解釋

目前,在國際法庭說話人識別研究中,似然比是最重要的組成部分,因為它可以量化證據(jù)對鑒定結(jié)論支持的力度。似然比可以表示成在一個給定的假設(shè)條件下觀測到犯罪證據(jù)(罪犯和嫌疑人樣本間的聲學(xué)差異)的概率和在完全相反的假設(shè)條件下觀測到犯罪證據(jù)概率的比值。因此,它們的比率就是當(dāng)前語音證據(jù)支持同一人的假設(shè)和支持不是同一人假設(shè)的相對強(qiáng)度,強(qiáng)度的大小反映在似然比的幅度上。如果似然比的值等于1,那說明該證據(jù)對兩個相反的假設(shè)支持的力度是一樣的,故不具有證據(jù)意義。似然比和1的大小關(guān)系表明,當(dāng)前的語音證據(jù)支持是同一人的假設(shè)還是非同一人的假設(shè),似然比的值并不是真相的二值表示。也就是說,對于嫌疑人樣本和罪犯樣本是不是由同一人產(chǎn)生的這一問題,似然比并沒有給出“是”或“否”的回答,它只是量化了當(dāng)前語音證據(jù)對鑒定結(jié)論支持的強(qiáng)度。如果用P來表示概率,E表示證據(jù),H代表假設(shè),那么似然比(LR)可寫成下面的形式:

在法庭說話人識別中,似然比的分子量化了罪犯樣本和嫌疑人樣本之間相似的程度,其分母量化了罪犯樣本和嫌疑人樣本在參考人群里的典型性。如果罪犯樣本和嫌疑人樣本越相似,它們來自同一人的可能性就越大,似然比的值也就會越大。然而,這個結(jié)果還需要樣本的典型性來平衡。這兩個樣本越是典型,它們就越可能是從人群中隨機(jī)抽取的,似然比的值就會越低。因此,似然比的值是樣本的相似性和典型性相互作用的結(jié)果,貝葉斯理論明確指明,相似性和典型性對證據(jù)評估來說都是必不可少的。事實上,在實際工作中,我們經(jīng)常會忽視樣本特征的典型性,認(rèn)為僅僅相似性對證據(jù)同一認(rèn)定就足夠了,這是不正確的做法。

如果提取的特征為單個特征,即使用單變量計算似然比,則可采用Lindley提出的公式,詳見參考文獻(xiàn)[11];如果特征為多變量,則可采用Aitken和Lucy提出的多變量核密度的似然比計算方法,詳見參考文獻(xiàn)[12]、[13]。

3 共振峰的概念及其應(yīng)用價值

共振峰是指在聲音的頻譜中能量相對集中的一些區(qū)域,共振峰不但是音質(zhì)的決定因素,而且反映了聲道(共振腔)的物理特征。在語音聲學(xué)中,共振峰決定著元音的音質(zhì),也可以反應(yīng)說話人的個性特征。

在法庭話者鑒別中,共振峰作為話者區(qū)分的最穩(wěn)定的參數(shù),一直都是備受重視的。語音的個體特性更多地體現(xiàn)在高頻區(qū),但是受到實際案件條件下電話等傳輸帶寬的限制,高頻語音成分很難保留,低頻區(qū)元音的F1測量也不太可靠。因此,話者區(qū)分測試往往集中在第二和第三共振峰上。由于男性語音元音/a/的第一共振峰大概分布在800Hz左右,因此,第一共振峰的數(shù)據(jù)也是可以應(yīng)用的。

4 實驗結(jié)果

為了驗證結(jié)果的穩(wěn)定性,本文采用42人電話數(shù)據(jù)庫,是由42人在不同時間段錄制的電話對話錄音,該錄音從磁帶被數(shù)字化以后,以16位的PCM格式聲音文件保存,采樣頻率為11025Hz。對話中采用的是漢語普通話,參與者年齡都在20歲左右。由一位引導(dǎo)人詢問他們相關(guān)的個人信息,由他們依次作答。本文選取了“啊”作為分析的對象,提取元音/a/進(jìn)行分析。選取“a”作為分析對象還有另外一個優(yōu)點,因為人們經(jīng)常對其進(jìn)行重讀,因此其中的元音/a/發(fā)音比較飽滿,能較好地反映個體的聲道特征。

在似然比結(jié)果的討論中,似然比經(jīng)常以10為底的對數(shù)值表示,因為在對數(shù)域,越大的正數(shù)為同一人假設(shè)提供越大的支持力度,越大的負(fù)數(shù)則為不同人假設(shè)提供越大的支持力度。例如,對數(shù)似然比+1表示在當(dāng)前的語音證據(jù)條件下,它們來自同一人的概率是來自不同人概率的10倍;對數(shù)似然比-1表示,在當(dāng)前的語音證據(jù)條件下,它們來自不同人的概率是來自同一人概率的10倍。

圖1為只使用第一共振峰F1作為識別結(jié)果時的Tippett圖,左上較粗的曲線表示不同說話人的對數(shù)10似然比大于等于x軸刻度的樣本所占的比率;右上較細(xì)的曲線表示同一說話人對數(shù)10似然比小于等于x軸刻度的樣本所占的比率。兩曲線相交的點為等誤差點,可以用來判斷該鑒別系統(tǒng)的好壞。圖中的豎線為識別閾值,似然比的識別閾值為1,取對數(shù)后為0,最理想的情況就是粗線和細(xì)線和閾值都沒有交點,同一說話人和不同說話人都達(dá)到100%的識別率。等誤差點的數(shù)值越小,說明該說話人識別系統(tǒng)的性能越高。在圖1中,系統(tǒng)的等誤差率在0.2與0.3之間,使用的似然比計算方法為單變量的似然比計算方法。

如果將F1、F2和F3進(jìn)行融合,即假設(shè)它們之間是相互獨立的,是統(tǒng)計無關(guān)的特征,把F1、F2和F3的單獨的似然比計算結(jié)果進(jìn)行相乘,得到一個使用前三個共振峰特征的似然比的值,結(jié)果見圖2所示。系統(tǒng)的識別性能得到明顯的提高,等錯誤率降到0.1之內(nèi)。

圖1 特征為F1時的Tippett圖

圖2 F1&F2&F3融合的Tippett圖

圖3為使用MVK的方法計算似然比結(jié)果的Tippett圖,系統(tǒng)的識別性能也比單獨使用一個特征時要好,等錯誤率降低到0.1以下。

圖3 基于MVK方法的Tippett圖(F1&F2&F3)

5 結(jié)論及討論

本文通過對42人數(shù)據(jù)庫的測試,使用共振峰特征作為識別參數(shù),取得了較高的正確識別率共振峰作為識別特征,具有很好的魯棒性和穩(wěn)定性,受信道和噪聲的影響較小,具有其他數(shù)字特征所沒有的穩(wěn)定性好的優(yōu)勢,并且具有明確的物理意義。實驗結(jié)果表明,通過分析共振峰的相關(guān)特征進(jìn)行似然比計算的方法是法庭說話人識別的一個科學(xué)有效的方法,能大大提高識別的準(zhǔn)確率,并且量化了證據(jù)的強(qiáng)度。本文僅使用了每個人的元音/a/,我們還可以使用更多數(shù)量的元音和特征,然后融合這些證據(jù),獲得一個全局證據(jù)力度,進(jìn)一步提高識別結(jié)果的可靠度。

[1]Morris on G S, Zhang C, Rose P.An empiricalestimate ofthe precision oflikelihood ratiosfrom a forensic-voice-comparison system[J].Forensic science international,2011,208(1).

[2]Saks M J,Koehler J J.The coming paradigm shift in forensic identification science[J].Science,2005,309(5736).

[3]Morrison G S.Forensic voice comparison and the paradigm shift[J].Science&Justice,2009,49(4).

[4]Rose P, Morrison G.A response to the UK position statement on forensic speaker comparison[J].The international journal of speech,language and the law,2009,16(1).

[5]Zhang C, Morrison G S, Rose P.Forensic speaker recognition in Chinese:a multivariate likelihood ratiodiscriminationon/i/and/y/[A].INTERSPEECH[C]. Brisbane,Australia:The DBLP Computer Science Bibliography,200.

[6]Drygajlo A.Automatic Speaker Recognition for Forensic Case Assessment and Interpretation[M].New York:ForensicSpeakerRecognition.Springer,2012.

[7]Drygajlo A.Statistical evaluation of biometric evidence in forensic automatic speaker recognition[M]. Computational Forensics.Berlin Heidelberg:Springer, 2009.

[8]Gonzalez-Rodriguez J, Ramos D.Forensic automatic speaker classification in the"Coming Paradigm Shift"[M].Speaker Classification I.Berlin Heidelberg: Springer,2007.

[9]CampbellW M,BradyKJ,CampbellJP,et al. Understanding scores in forensic speaker recognition[A]. Speaker and Language Recognition Workshop[C],IEEE Odyssey2006,Puerto Rico:The.IEEE,2006.

[10]DrygajloA,MeuwlyD,AlexanderA.Statistical Methods and Bayesian Interpretation of Evidence in Forensic Automatic Speaker Recognition[A],in Proc. Eurospeech 2003[C],Geneva,Switzerland:Institute for PerceptualArtificialIntelligence,2003.

[11]WangHuapeng,Yang Jun.The comparison of "Idiot's Bayes"and multivariate kernel-density in forensic speaker identification using Chinese vowel/a/[A].3rd InternationalCongressonImageandSignalProcessing[C].Shanghai:The IEEE,2010,v8.

[12]Aitken C G G,Lucy D.Evaluation of trace evidence in the form of multivariate data[J].Journal of the Royal Statistical Society:Series C(Applied Statistics),2004,53(1).

[13]Morrison G S.Matlab Implementation of Aitken &Lucy's(2004)Forensic Likelihood-Ratio Software UsingMultivariate-Kernel-DensityEstimation[software], 2007.[EB/OL].http://geoff-morrison.net.

(責(zé)任編輯:孟凡騫)

TP391.4

A

2014-3-11

遼寧省自然科學(xué)基金資助項目(編號:2013020008);上海市物證鑒定中心重點實驗室開放課題(編號:2013KF030110)。

王華朋(1979-),男,山東鄆城人,中國刑警學(xué)院聲像資料檢驗技術(shù)系副教授,博士,主要從事聲像資料檢驗研究。

猜你喜歡
元音共振法庭
元音字母和元音字母組合的拼讀規(guī)則
元音字母和元音字母組合的拼讀規(guī)則
法庭不需要煽情的辯護(hù)詞
上法庭必須戴假發(fā)?
安然 與時代同頻共振
選硬人打硬仗——紫陽縣黨建與脫貧同頻共振
CTA 中紡院+ 化纖聯(lián)盟 強(qiáng)強(qiáng)聯(lián)合 科技共振
法庭爭孫究竟為哪般?
公民與法治(2016年7期)2016-05-17 04:11:15
消失在法庭的邦博
改革是決心和動力的共振
镇康县| 淳安县| 四川省| 峨山| 两当县| 泸水县| 崇仁县| 南丹县| 济源市| 崇明县| 平舆县| 高阳县| 新蔡县| 白银市| 商城县| 香格里拉县| 巢湖市| 安远县| 凤凰县| 长武县| 阿巴嘎旗| 农安县| 宁河县| 乐东| 库车县| 瑞丽市| 卢氏县| 阿拉善右旗| 新沂市| 柏乡县| 汶川县| 阜南县| 班玛县| 光泽县| 施甸县| 乌拉特前旗| 宿松县| 茂名市| 阳江市| 始兴县| 文昌市|