国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

假聲偽裝語(yǔ)音同一認(rèn)定的可行性分析

2018-05-03 11:45申小虎張長(zhǎng)珍萬(wàn)榮春
關(guān)鍵詞:假聲檢材基頻

申小虎 金 恬 張長(zhǎng)珍 萬(wàn)榮春

(1 江蘇警官學(xué)院刑事科學(xué)技術(shù)系 江蘇 南京 210031;2 江蘇省公安廳物證鑒定中心 江蘇 南京 210031)

近年詐騙侵財(cái)類(lèi)案件高發(fā),錄音材料成為偵查破案有用情報(bào),也是公訴量刑的重要證據(jù)來(lái)源。犯罪嫌疑人為掩蓋其真實(shí)身份,通過(guò)捏鼻子、電子變聲器、假聲發(fā)音等偽裝手段逃避公安機(jī)關(guān)的偵查。捏鼻偽裝手法是鼻音通道受阻形成的語(yǔ)音,雖使語(yǔ)音特征發(fā)生改變,但是不同個(gè)體之間差異仍然大于自身差異,具備鑒定的條件和基礎(chǔ)[1-2]。電聲偽裝語(yǔ)音使語(yǔ)音發(fā)生了畸變,但有的學(xué)者利用聲學(xué)特征變化規(guī)律得到線性回歸模型,通過(guò)逆變換可以得到與原聲聲學(xué)參數(shù)相近的語(yǔ)音[3-4]。假聲發(fā)音有提高基頻、降低基頻、快速發(fā)音、慢速發(fā)音[5]等多種偽裝方式,但從實(shí)際案例得到的偽造語(yǔ)音檢材來(lái)看,犯罪嫌疑人進(jìn)行偽裝發(fā)聲的方式相對(duì)簡(jiǎn)單唯一。因此,針對(duì)相同偽裝方式條件下的假聲語(yǔ)音,分析其基頻參數(shù)、寬帶語(yǔ)譜圖、能量曲線等聲學(xué)參量數(shù)據(jù)并進(jìn)行量化比較,為發(fā)掘假聲語(yǔ)音檢驗(yàn)中的線索與依據(jù)而開(kāi)展此項(xiàng)研究。

1 假聲偽裝手法

根據(jù)發(fā)聲生理學(xué),正常發(fā)音主要通過(guò)人體喉部環(huán)甲肌組織的收縮運(yùn)動(dòng)使聲帶完全振動(dòng),控制聲門(mén)的全方位閉合,進(jìn)而發(fā)出音質(zhì)明亮的聲音。假聲則是喉部披裂肌作收縮運(yùn)動(dòng)使聲帶局部振動(dòng),聲門(mén)閉合呈菱形合縫狀,聲帶邊緣變薄后與空氣流動(dòng)共同發(fā)出的聲音。假聲高于原聲正常音域,且接近正常音域上限一個(gè)8度范圍,例如“海豚音”。假聲發(fā)音機(jī)理的不同改變了發(fā)聲聲音的基頻,同時(shí)由于基頻的改變,元音、濁輔音的語(yǔ)譜圖也會(huì)呈現(xiàn)出一定程度的變化。犯罪嫌疑人經(jīng)常采用假聲發(fā)音的方式偽裝不同角色逃避偵查,給偵查、鑒定工作增加了難度。

2 實(shí)驗(yàn)條件

2.1 實(shí)驗(yàn)設(shè)備

硬件:Gnome-p專(zhuān)業(yè)錄音器(采樣頻率8KHz/16KHz,截止頻率為16KHz)、研華科技610H工控機(jī)(CPU i7-4790 3.60G雙核,內(nèi)存16GB)。

軟件:Adobe Audition語(yǔ)音編輯軟件、俄羅斯法庭語(yǔ)音分析系統(tǒng)OT-Expert 5.1、美國(guó)LVIS自動(dòng)話(huà)者識(shí)別系統(tǒng)。

2.2 實(shí)驗(yàn)樣本

待測(cè)試音頻文件中發(fā)音人共30人,選用江蘇警官學(xué)院大四男女學(xué)生各15人,年齡分布在22~24歲之間,采錄時(shí)采用現(xiàn)場(chǎng)發(fā)生率較高的“提高基頻式”假聲方法發(fā)音。錄音語(yǔ)料為自行設(shè)計(jì)的3分鐘語(yǔ)音對(duì)話(huà)語(yǔ)句。錄制地點(diǎn)選擇于江蘇省公安廳物證鑒定中心的語(yǔ)音采集室。錄音設(shè)備為Gnome-p專(zhuān)業(yè)錄音器,設(shè)置錄音器參數(shù)為11.025KHz采樣率,按照聲紋鑒定語(yǔ)音檢材和樣本提取方法[6]進(jìn)行錄制。錄制過(guò)程為每人正常發(fā)音閱讀1次后再假聲發(fā)音閱

讀4次,依次命名為XXX假聲1,XXX假聲2,…,

XXX假聲4,其中XXX為說(shuō)話(huà)人姓名音節(jié)首字母,共得到150份語(yǔ)音樣本。

2.3 實(shí)驗(yàn)方法

分別利用OT-Expert 5.1的寬帶語(yǔ)譜圖、共振峰/基頻統(tǒng)計(jì)模塊、能量曲線模塊,分析計(jì)算男、女間正常發(fā)音與假聲偽裝樣本的共振峰走勢(shì)形態(tài)、共振峰/基頻參數(shù)、音強(qiáng)等聲學(xué)特性,并在0.05的檢驗(yàn)水平下進(jìn)行成對(duì)T檢驗(yàn),論證正常發(fā)音與假聲間、假聲發(fā)音間差異性與穩(wěn)定性。同時(shí),將此實(shí)驗(yàn)樣本中的30份偽裝語(yǔ)音作為檢材加入自動(dòng)話(huà)者識(shí)別系統(tǒng)LVIS的2500人語(yǔ)音庫(kù)中。再利用30份正常語(yǔ)音與其余120份假聲作為樣本進(jìn)行自動(dòng)識(shí)別測(cè)試,最后對(duì)測(cè)試結(jié)果進(jìn)行分析統(tǒng)計(jì)。

3 實(shí)驗(yàn)結(jié)果

從對(duì)實(shí)驗(yàn)樣本的對(duì)比中我們發(fā)現(xiàn),假聲的發(fā)音特性導(dǎo)致相同個(gè)體的正常發(fā)音與假聲的語(yǔ)譜圖中的共振峰、基頻、音強(qiáng)等各參數(shù)具有明顯的差異,與期待結(jié)果相同,同時(shí)相同個(gè)體的4次假聲間的差異較小。由于篇幅限制,本文中僅列舉了1位男性個(gè)體WDJ的分析對(duì)比實(shí)驗(yàn)結(jié)果。

3.1 基頻參數(shù)

利用MFCC倒譜功能模塊對(duì)實(shí)驗(yàn)樣本的基頻參數(shù)進(jìn)行量化統(tǒng)計(jì)。眾所周知,由于基頻反映聲帶振動(dòng)速度,而假聲是利用聲帶邊緣部分振動(dòng)與空氣流動(dòng)共同發(fā)出的聲音,因此振動(dòng)速度與正常發(fā)音相對(duì)較快。相同個(gè)體情況下,假聲各項(xiàng)基頻參數(shù)均明顯高于正常發(fā)音。同時(shí)實(shí)驗(yàn)發(fā)現(xiàn),相同個(gè)體4次假聲發(fā)音的基頻各聲學(xué)參數(shù)數(shù)值較為接近,差異率較小,如表1所示。從圖1基頻曲線分布對(duì)比圖中也可以看出,假聲語(yǔ)音實(shí)驗(yàn)樣本基頻頻率值明顯高于正常發(fā)音實(shí)驗(yàn)樣本的基頻頻率值,4次假聲的基頻走勢(shì)與區(qū)間分布大體一致,基頻分布與基頻曲線走勢(shì)擬合度較高。同時(shí)實(shí)驗(yàn)結(jié)果中,女性個(gè)體假聲的基頻各項(xiàng)參數(shù)均高于男性個(gè)體。

對(duì)假聲語(yǔ)音與正常語(yǔ)音進(jìn)行成對(duì)T檢驗(yàn)得出:T值為-15.16,顯著概率P值為0.001,結(jié)果表明基頻差異顯著;對(duì)假聲語(yǔ)音進(jìn)行成對(duì)T檢驗(yàn)得出:T值為1.2,顯著概率P值為0.271(遠(yuǎn)大于0.05),即基頻差異不顯著。

表1 WDJ正常發(fā)音與假聲間基頻參數(shù)對(duì)比

圖1 WDJ正常發(fā)音與4次假聲間的基頻分布對(duì)比

3.2 寬帶語(yǔ)譜圖檢驗(yàn)

截取語(yǔ)料中一段語(yǔ)音“我不愿和他一起做大創(chuàng)課題”(包含a、i、u、e、o5個(gè)元音音節(jié))作為示例進(jìn)行語(yǔ)譜圖分析。圖2、圖3分別為WDJ男性個(gè)體的正常發(fā)音與4次假聲間的共振峰寬帶語(yǔ)譜圖、LPC頻譜圖。由于提示基頻式假聲發(fā)音會(huì)導(dǎo)致開(kāi)口度變小、共鳴空間的形狀變化小音強(qiáng)較弱,進(jìn)而帶來(lái)共振峰邊界顯現(xiàn)模糊,共振峰曲線起伏走勢(shì)幅度小[7]51;同時(shí)塞擦音等形成的亂紋與塞音形成的沖直條得到了一定程度的的衰減。

高頻特征的穩(wěn)定性是語(yǔ)音同一認(rèn)定的重要條件,通過(guò)實(shí)驗(yàn)發(fā)現(xiàn),假聲音節(jié)間的高頻共振峰頻率值、共振峰走向、音節(jié)內(nèi)過(guò)渡音征、音節(jié)間過(guò)渡音征相似性遠(yuǎn)大于與正常音節(jié)的對(duì)比。例如圖2中紅色箭頭所示,發(fā)音音節(jié)“愿(yuan)”的寬帶語(yǔ)譜圖對(duì)比中可以看出,正常語(yǔ)音音節(jié)內(nèi)的F3過(guò)渡音征呈升渡,而4次假聲音節(jié)內(nèi)的F3過(guò)渡音征呈降渡。從發(fā)音音節(jié)“一起”的音節(jié)間過(guò)渡形態(tài)對(duì)比可以看出,正常語(yǔ)音音節(jié)為清晰過(guò)渡,而假聲音節(jié)間的過(guò)渡形態(tài)為模糊過(guò)渡。另外,從發(fā)音音節(jié)“大創(chuàng)”的音節(jié)間過(guò)渡形態(tài)對(duì)比可以看出,正常語(yǔ)音音節(jié)為緩沖過(guò)渡,而假聲音節(jié)間的過(guò)渡形態(tài)為暫停過(guò)渡。

共振峰體現(xiàn)了聲道諧振特征,反映了元音的音質(zhì),因此從聽(tīng)覺(jué)檢驗(yàn)上假聲與原聲相比其音質(zhì)要差很多。如圖3所示,本文使用LPC編碼頻譜圖得到各音節(jié)的共振峰頻率曲線,并通過(guò)輔助人工標(biāo)記的方式可以得到各錄音樣本的共振峰端點(diǎn)頻率。為更好的驗(yàn)證假聲是否具有同正常語(yǔ)音一樣的個(gè)體穩(wěn)定性與人際差異性,我們將個(gè)體的正常發(fā)音與假聲按照性別分類(lèi)后,計(jì)算元音端點(diǎn)頻率并進(jìn)行量化統(tǒng)計(jì)分析。表2為將剪切語(yǔ)料中的“大”字的[A]、“一”字的[i]、“不”的[u]、“課”字的、“我”字的[o]元音共振峰端點(diǎn)頻率。限于篇幅,僅列出了女性個(gè)體XYH與男性個(gè)體WDJ正常發(fā)音與假聲發(fā)音間的各項(xiàng)指標(biāo)參數(shù)與相對(duì)偏差。

對(duì)假聲語(yǔ)音與正常語(yǔ)音的F3共振峰進(jìn)行成對(duì)T檢驗(yàn)得出:T值為-4.92,顯著概率P值為0.013,結(jié)果表明F3差異顯著;對(duì)假聲語(yǔ)音與正常語(yǔ)音的F4共振峰進(jìn)行成對(duì)T檢驗(yàn)得出:T值為-1.86,顯著概率P值為0.106(大于0.05),結(jié)果表明F4存在差異但不顯著。對(duì)假聲語(yǔ)音的F3共振峰進(jìn)行成對(duì)T檢驗(yàn)得出:T值為1.2,顯著概率P值為0.469(遠(yuǎn)大于0.05),即F3差異不顯著;對(duì)假聲語(yǔ)音的F4共振峰進(jìn)行成對(duì)T檢驗(yàn)得出:T值為0.35,顯著概率P值為0.776(遠(yuǎn)大于0.05),即F4差異不顯著。

圖2 WDJ正常發(fā)音與4次假聲間的共振峰寬帶語(yǔ)譜圖

圖3 WDJ正常發(fā)音與4次假聲的LPC頻譜圖

從實(shí)驗(yàn)結(jié)果可看出,男女個(gè)體的假聲各音節(jié)的共振峰F1、F2頻率均比正常發(fā)音時(shí)差異較大,已不具備鑒定的條件。相同也發(fā)現(xiàn),個(gè)體提升基頻式假聲間的共振峰數(shù)值差異不明顯,具有一定的穩(wěn)定性。與正常發(fā)音相似,由于女性聲帶較男性更薄,因此假聲發(fā)音的各共振峰頻率也高于男性個(gè)體。本次實(shí)驗(yàn)選用的提升基頻式假聲發(fā)音的音節(jié)聲韻母結(jié)構(gòu)、聲調(diào)未發(fā)生變異,因此仍可依照語(yǔ)音樣本,提取語(yǔ)音檢材中的相同音節(jié)進(jìn)行鑒定。但其他偽裝方式,例如捂嘴、咬物、方言等,聲韻母結(jié)構(gòu)已改變情況下,也不能作為相同音節(jié)比對(duì)。

表2 相同個(gè)體正常發(fā)音與4次假聲間的共振峰各參數(shù)對(duì)比

3.3 音強(qiáng)檢驗(yàn)

語(yǔ)音的能量也稱(chēng)為音強(qiáng),是語(yǔ)音同一鑒定時(shí)的重要參考因素之一,其大小取決于采錄設(shè)備接收處的波幅。正常發(fā)音和假聲的本質(zhì)區(qū)別是聲帶參與(振動(dòng))的面積和類(lèi)型。假聲是由聲帶韌帶邊緣振動(dòng)產(chǎn)生的,聲帶主體是放松的,而正常原聲是全體聲帶振動(dòng)產(chǎn)生的。同時(shí)由于提升基頻式假聲的某些音節(jié)開(kāi)口度小,在相同發(fā)音條件下假聲發(fā)音缺乏力度,因此,其即時(shí)能量要比正常發(fā)音要弱[7]50。由于未經(jīng)過(guò)專(zhuān)業(yè)訓(xùn)練的發(fā)音人的不能很好的控制由聲帶邊緣振動(dòng)時(shí)所產(chǎn)生的假聲,因此很容易產(chǎn)生能量斷裂,在即時(shí)能量曲線上所表現(xiàn)的是突然下降的能量波谷,如圖4所示。本次實(shí)驗(yàn)選用的提高基頻式偽裝語(yǔ)音發(fā)音較耳語(yǔ)、降低基頻式等偽裝方式,聲帶振動(dòng)幅度大、氣流強(qiáng)烈,音強(qiáng)能量均值與正常發(fā)音差異不大。

對(duì)假聲語(yǔ)音與正常語(yǔ)音的能量均值進(jìn)行成對(duì)T檢驗(yàn)得出:T值為-1.27,顯著概率P值為0.261,結(jié)果表明能量差異不顯著;對(duì)4次假聲語(yǔ)音的能量均值進(jìn)行成對(duì)T檢驗(yàn)得出:T值為0.584,顯著概率P值為0.869,即能量差異不顯著。

圖4 正常發(fā)音與假聲間的即時(shí)能量(音強(qiáng))曲線圖

3.4 語(yǔ)音自動(dòng)話(huà)者識(shí)別測(cè)試

在前面的傳統(tǒng)人工圖譜檢驗(yàn)實(shí)驗(yàn)中,我們發(fā)現(xiàn)偽裝手段使語(yǔ)音頻譜的基頻、共振峰、音強(qiáng)都發(fā)生了變異,影響了說(shuō)話(huà)人同一認(rèn)定的判斷。但同時(shí)也發(fā)現(xiàn),相同偽裝方式下的假聲某些語(yǔ)音特性存在一定的穩(wěn)定性。為進(jìn)一步驗(yàn)證此結(jié)論,本文將30名發(fā)音人偽裝假聲語(yǔ)音1作為檢材加入LVIS自動(dòng)辨識(shí)系統(tǒng)的錄音庫(kù),同時(shí)將30名發(fā)音人的正常語(yǔ)音與其余偽裝假聲語(yǔ)音作為待測(cè)試語(yǔ)音樣本,進(jìn)行自動(dòng)話(huà)者識(shí)別測(cè)試。

LVIS自動(dòng)說(shuō)話(huà)人鑒定系統(tǒng)選用UBM-GMM混合模型、隱馬爾可夫模型和神經(jīng)網(wǎng)絡(luò)技術(shù)并結(jié)合Tippet圖結(jié)果驗(yàn)證系統(tǒng),其等錯(cuò)誤率(EER)最低為1.20%,但由于系統(tǒng)限制不能夠調(diào)整閾限值。測(cè)試結(jié)束后LVIS系統(tǒng)將錄音庫(kù)中與待測(cè)試語(yǔ)音樣本似然率數(shù)值(匹配度)依次進(jìn)行降序排列,并列出各錄音庫(kù)語(yǔ)料與待測(cè)試樣本的似然率,如圖5所示。其中似然率0~10-4認(rèn)定為不同一,10-4~1為傾向性不同一,1~104認(rèn)定為傾向性同一,大于104認(rèn)定為同一。

圖5 LVIS自動(dòng)話(huà)者辨別系統(tǒng)

本次測(cè)試假定將待測(cè)試語(yǔ)音樣本與偽裝假聲語(yǔ)音檢材匹配時(shí),系統(tǒng)計(jì)算得到的正確發(fā)音人語(yǔ)音樣本的似然率位列前5名,即為正確辨識(shí)。從實(shí)驗(yàn)結(jié)果來(lái)看,正常語(yǔ)音樣本的正確辨識(shí)率僅為23.3%,而偽裝假聲語(yǔ)音樣本的正確辨識(shí)率則達(dá)到了88.89%,如表3所示,其中★標(biāo)識(shí)為辨識(shí)不成功的樣本例(篇幅所限,僅列出15位發(fā)音人的測(cè)試?yán)?/p>

表3 15位發(fā)音人的語(yǔ)音樣本的自動(dòng)識(shí)別似然率

4 分析與討論

通過(guò)上述分析檢驗(yàn)結(jié)果可以得出下列結(jié)論:

(1)假聲語(yǔ)音檢材與正常語(yǔ)音樣本間不具備同一鑒定條件。從語(yǔ)譜圖與從T檢驗(yàn)量化結(jié)果可以看到,由于假聲發(fā)音時(shí)共振腔的共振作用減弱,使得假聲語(yǔ)譜圖中共振峰的總體分布與走勢(shì)、塞音沖直條、摩擦亂紋、濁音橫杠產(chǎn)生變異;假聲語(yǔ)音與正常語(yǔ)音相比較,共振峰走勢(shì)分布以及持續(xù)時(shí)長(zhǎng),共振峰頻率、基頻數(shù)值均存在差異;音強(qiáng)曲線中易產(chǎn)生能量帶斷裂。同時(shí)上述差異在男性發(fā)音個(gè)體間更為明顯。因此,假聲語(yǔ)音檢材與正常語(yǔ)音樣本間進(jìn)行同一認(rèn)定時(shí)易導(dǎo)致否定結(jié)論,LVIS自動(dòng)語(yǔ)音辨識(shí)系統(tǒng)也正確驗(yàn)證了此結(jié)論。

(2)相同偽裝方式下的假聲語(yǔ)音檢材與樣本間進(jìn)行同一認(rèn)定具備一定的鑒定條件。從語(yǔ)譜圖與從T檢驗(yàn)量化結(jié)果可以看到,相同偽裝方式下語(yǔ)音圖譜的共振峰走勢(shì)形態(tài)、基頻數(shù)值、音強(qiáng)曲線的能量斷裂位置具有一定的穩(wěn)定性。在偽裝發(fā)音檢材與樣本間進(jìn)行同一鑒定時(shí),可利用上述特征作為參考依據(jù)。但本次僅使用了提高基頻式偽裝發(fā)音作為實(shí)驗(yàn)樣本(30例),快慢速、捂嘴、耳語(yǔ)等其它偽裝發(fā)音[8]未作討論,其它相同偽裝方式條件下的假聲是否具備相對(duì)穩(wěn)定性還需在對(duì)假聲錄音樣本進(jìn)行擴(kuò)充后進(jìn)一步加以論證。

(3)語(yǔ)音檢驗(yàn)中,語(yǔ)音檢材與樣本不能滿(mǎn)足同一認(rèn)定條件的情況下,利用方言口音、習(xí)慣用語(yǔ)、贅語(yǔ)、言語(yǔ)缺陷、韻律特征等在偽裝不易改變的信息特征,對(duì)縮小偵查范圍也具有重要參考價(jià)值。

參考文獻(xiàn):

[1] 莊琳. 捏鼻語(yǔ)音的聲紋鑒定研究[J].中國(guó)人民公安大學(xué)學(xué)報(bào)(自然科學(xué)版),2010(4):1-7.

[2] 張翠玲,曹巧玲,張紅兵. 捏鼻偽裝語(yǔ)音的聲學(xué)研究[J]. 中國(guó)刑警學(xué)院學(xué)報(bào),2006(3):46-48.

[3] 張桂清,金怡珠,等. 電子偽裝語(yǔ)音的變聲規(guī)律研究[J]. 證據(jù)科學(xué),2010(4):100-105.

[4] 張翠玲,趙曉波. 電聲偽裝語(yǔ)音的聲學(xué)研究[J]. 中國(guó)刑警學(xué)院學(xué)報(bào),2008(2):53-55.

[5] 張翠玲. 偽裝語(yǔ)音的聲學(xué)研究[D].天津:南開(kāi)大學(xué),2005:4-5.

[6] 王虹. 基層公安機(jī)關(guān)聲紋鑒定語(yǔ)音檢材和樣本提取技術(shù)[J].警察技術(shù),2012(4):57-60.

[7] 金陽(yáng)天,王虹,歐陽(yáng)國(guó)亮. 語(yǔ)音開(kāi)口度對(duì)共振峰頻率的影響[J].中國(guó)刑警學(xué)院學(xué)報(bào),2014(3).

[8] 張翠玲,譚鐵軍,劉昇. 偽裝語(yǔ)音的自動(dòng)話(huà)者識(shí)別研究[J].中國(guó)刑警學(xué)院學(xué)報(bào),2007(2):18-21.

猜你喜歡
假聲檢材基頻
語(yǔ)音同一認(rèn)定中音段長(zhǎng)度對(duì)基頻分析的影響
基于時(shí)域的基頻感知語(yǔ)音分離方法?
橋面鋪裝層對(duì)中小跨徑橋梁基頻影響分析
談聲樂(lè)“真聲”與“假聲”演唱技巧
假聲在民族聲樂(lè)演唱與教學(xué)中的應(yīng)用
指印形成方式鑒定1例
盜竊案件現(xiàn)場(chǎng)生物檢材的發(fā)現(xiàn)與提取
45000kHz基頻晶體濾波器
民族聲樂(lè)演唱與教學(xué)中假聲的有效利用
接觸性生物檢材DNA提取方法的比較