劉世杰,王 虹
(中國刑事警察學(xué)院,遼寧 沈陽 110000)
聲紋,原指通過聲譜儀顯示的作為訴訟證據(jù)的聲音圖譜,現(xiàn)指作為訴訟證據(jù)的聲音特征的集合。在國際上稱其“Voiceprint”,在我國刑事技術(shù)領(lǐng)域則比照指紋,形象的將其稱為聲紋。從另一方面來說,聲音是由人的發(fā)聲器官在大腦語言中樞的指揮下發(fā)出的,成年人的聲紋同指紋、足跡等其他生物特征一樣,具有人各不同的特定性和相對穩(wěn)定性,故亦可將其歸為人體痕跡的一種,稱之為“聲痕”。
聲紋檢驗(yàn),泛指有關(guān)聲音的所有檢驗(yàn)鑒定技術(shù)。具體包括語音真實(shí)性(完整性)檢驗(yàn)、言語內(nèi)容聽辨、語音信號(hào)增強(qiáng)、降噪處理、語音人身分析、說話人鑒定等[1]。
未見其人,先聞其聲。這是我國文學(xué)四大名著《紅樓夢》里的一句描述,可見,用聲音來判斷人的身份這種做法古已有之。正常人成年之后,其聲音便會(huì)長期穩(wěn)定,基本不變,同其他生物特征一樣具有相對穩(wěn)定性和特定性,可以用以個(gè)體識(shí)別。語音鑒別技術(shù)的應(yīng)用歷史悠久,可以追溯到十五世紀(jì),但現(xiàn)代聲紋檢驗(yàn)技術(shù)的發(fā)展則開始于聲譜儀(能夠?qū)⒙曇艮D(zhuǎn)化為可視圖像的儀器)發(fā)明之后。
雖利用聲音來進(jìn)行個(gè)體識(shí)別古已有之,但那多停留在個(gè)人主觀聽覺上的辨認(rèn),在注重客觀證據(jù)的現(xiàn)代社會(huì),個(gè)人主觀感受在審判過程中很難作為證據(jù),這使得聲音這一生物特征很難在審判中發(fā)揮其應(yīng)有的作用。
二戰(zhàn)期間,為滿足戰(zhàn)爭的需要,美國貝爾實(shí)驗(yàn)室(Alcatel-Lucent Bell Labs)接受政府委托,在L.G Kersta的主持下率先展開了對聲紋的研究,并有了早期的動(dòng)態(tài)聲波分析儀,即我們現(xiàn)在所稱的聲譜儀(或稱語圖儀)。20世紀(jì)50年代后期,戰(zhàn)后美國經(jīng)濟(jì)迅猛發(fā)展,通信技術(shù)進(jìn)展迅速,電話這一現(xiàn)代通訊工具進(jìn)入了尋常百姓家,給生活帶來方便的同時(shí),利用電話進(jìn)行犯罪的案件也越來越多。此類案件不同于其他案件,缺少常規(guī)的犯罪現(xiàn)場,留給警方的線索也只有電話錄音,這讓美國警方大感頭痛。而警方則轉(zhuǎn)向求助于貝爾實(shí)驗(yàn)室,希望能提供說話人識(shí)別方面的支持,因此,戰(zhàn)后擱置的聲紋研究作為司法鑒定領(lǐng)域的一項(xiàng)專業(yè)技術(shù)重新登上了歷史舞臺(tái)。
1963年,日本警察研究所開始研究聲紋檢驗(yàn),并成功地利用聲紋相關(guān)知識(shí)協(xié)助了幼童吉展被拐騙案的偵破。1966年,Kersta利用聲譜儀成功地完成了一樁懸案的聲紋檢驗(yàn)。1976年,美國國家科學(xué)院聲譜委員會(huì)發(fā)表了《嗓音鑒別的理論與實(shí)踐》報(bào)告,表明了“嗓音鑒別”的精度極高,誤差僅為1%~2%,可作為一項(xiàng)科學(xué)的成熟技術(shù)。隨后世界各國相繼展開了聲紋檢驗(yàn)的研究工作,并越來越多的將其作為證據(jù)在法庭上被采信。其中最著名的案件當(dāng)屬菲律賓前反對黨領(lǐng)袖阿基諾被殺案[2]。
我國的聲紋檢驗(yàn)研究工作起步相對較晚,這是與我國社會(huì)生產(chǎn)力發(fā)展?fàn)顩r緊密相關(guān)的。建國初期,我國社會(huì)生產(chǎn)力水平相對低下,通信事業(yè)欠發(fā)達(dá),通訊設(shè)備架設(shè)不完善,給犯罪分子加以利用的機(jī)會(huì)也相對較少。1978年底,我國實(shí)施了改革開放,引進(jìn)了大量先進(jìn)技術(shù),極大地解放了社會(huì)生產(chǎn)力。80年代后期,社會(huì)生產(chǎn)力的解放帶來了經(jīng)濟(jì)的騰飛,通訊事業(yè)隨之蓬勃發(fā)展,而移動(dòng)通信也乘著改革開放的浪潮迅速崛起。國民生活水平提高,各式各樣的公用或私人電話迅速普及,這為生活帶來便利的同時(shí)也給了犯罪分子以可乘之機(jī)。
1986年,中國刑事警察學(xué)院收到了沈陽市有關(guān)部門一項(xiàng)關(guān)于說話人鑒定的委托,這時(shí)國內(nèi)在聲紋檢驗(yàn)這一領(lǐng)域還未有人涉足,中國刑警學(xué)院也沒有相關(guān)技術(shù),因而無法接受這項(xiàng)委托[3]。這件事給了公安部門及相關(guān)領(lǐng)域?qū)W者敲響了警鐘:國內(nèi)社會(huì)現(xiàn)狀與公安工作實(shí)踐急需這方面的理論和技術(shù)支持,聲紋檢驗(yàn)技術(shù)的相關(guān)研究必須馬上展開,填補(bǔ)國內(nèi)該領(lǐng)域的空白。
1988年,中國刑事警察學(xué)院文件檢驗(yàn)技術(shù)系從美國KAY公司引進(jìn)了KAY-7800型數(shù)字語圖儀,成立了以岳俊發(fā)、王英利、金陽天、陳祥民為成員的課題小組,建立起了國內(nèi)第一個(gè)聲紋檢驗(yàn)實(shí)驗(yàn)室,率先展開了聲紋檢驗(yàn)技術(shù)相關(guān)的研究工作。一年后,公安部第二研究所(公安部物證鑒定中心)引進(jìn)了KAY Sona Graph 5500型聲譜儀,成立了以崔效義、李敬陽、王莉、馮祖祎等人為成員的課題組,同樣展開了聲紋檢驗(yàn)相關(guān)研究。1989年12月,中國刑警學(xué)院成功地針對沈陽軍區(qū)與閩遼公司的一起財(cái)務(wù)糾紛案中涉及的音頻資料進(jìn)行了聲紋檢驗(yàn),且該鑒定意見被法庭采信作為證據(jù),這是我國第一起聲紋檢驗(yàn)意見被法庭采信的案例。
隨著30年的發(fā)展,我國的聲紋檢驗(yàn)技術(shù)從無到有,從有到精,在幾代人的努力下,逐步建立起一套針對漢語特點(diǎn)的科學(xué)、完善的聲紋檢驗(yàn)體系。聲紋技術(shù)在各個(gè)領(lǐng)域大放異彩,被廣泛應(yīng)用,而聲紋檢驗(yàn)技術(shù)則成功地為大量案件在偵查及訴訟階段提供了有力的幫助,成為公安機(jī)關(guān)打擊犯罪的又一利劍。
聲紋檢驗(yàn)針對的對象是指案件中發(fā)現(xiàn)的能夠證明案件事實(shí)或與案件有關(guān)的一切音頻資料(包括各類錄音設(shè)備或存儲(chǔ)設(shè)備中存儲(chǔ)的音頻資料以及視頻錄像中的音頻)。自1989年起,我國就將“視聽資料”作為證據(jù)寫入《中華人民共和國刑事訴訟法》,這從法律上規(guī)定了聲紋檢驗(yàn)的客體--音頻資料(屬視聽資料的一種)作為證據(jù)的合法性。
在視聽資料作為證據(jù)使用有爭議時(shí),當(dāng)進(jìn)行鑒定。偵查過程中缺少線索,只有有限的音頻資料時(shí) ,應(yīng)進(jìn)行鑒定以獲取線索。聲紋檢驗(yàn)在偵察和訴訟階段均扮演著重要的角色,那么聲紋檢驗(yàn)包含哪些內(nèi)容呢?
3.2.1 錄音真實(shí)性(完整性)鑒定
錄音的真實(shí)性(完整性)鑒定,又稱錄音資料剪輯鑒定,指通過聽覺感知、聲譜分析、元數(shù)據(jù)分析、數(shù)字信號(hào)分析等技術(shù)手段,對錄音資料的原始性、連續(xù)性和完整性所進(jìn)行的科學(xué)判斷,以確定其是否經(jīng)過后期加工處理。
3.2.2 降噪和語音增強(qiáng)
降噪分為可視降噪和自適應(yīng)降噪??梢暯翟胧侵高x擇噪聲譜,對檢材部分或全部進(jìn)行降噪處理。自適應(yīng)降噪是指選擇適當(dāng)?shù)淖赃m應(yīng)參數(shù),對檢材內(nèi)的噪聲在頻域和時(shí)域進(jìn)行降噪處理。
語音增強(qiáng)是指使用語音增強(qiáng)技術(shù),對檢材語音過弱的部分或全部進(jìn)行語音增強(qiáng)處理,提高信噪比。
3.2.3 語音內(nèi)容辨識(shí)
對音頻資料里的語音內(nèi)容進(jìn)行審聽辨識(shí)。
3.2.4 環(huán)境噪聲分析
對音頻里的環(huán)境噪聲進(jìn)行審聽,根據(jù)其中一些特定的聲音來推斷錄音時(shí)所處的環(huán)境,為偵查提供線索。
3.2.5 說話人語音分析
從語音、語調(diào)、發(fā)音習(xí)慣、詞匯和語法習(xí)慣等方面進(jìn)行綜合分析,對說話人的方言、口音、年齡、文化程度、職業(yè)等特征進(jìn)行分析刻畫。
3.2.6 說話人鑒定
這是聲紋檢驗(yàn)的主要內(nèi)容,是指通過對不同的音頻資料中特定說話人的語音聲學(xué)特征與進(jìn)行分析檢測和綜合比對,做出兩者是否為同一人的結(jié)論。
3.2.7 音源同一鑒定
指通過對影音制品中音頻信號(hào)的聲學(xué)特征進(jìn)行綜合分析,做出檢材與樣本的音源是否同一的鑒定過程。
聲紋檢驗(yàn)發(fā)展初期,音頻的載體多是模擬信號(hào)的磁帶,想對這樣的音頻文件做修改,必須對磁帶動(dòng)手,難免會(huì)在磁帶上留下修補(bǔ)痕跡,篡改人的水平不同,痕跡的明顯程度不同,即使利用空磁帶對修改后的磁帶進(jìn)行翻錄,也會(huì)在新的磁帶上記錄下非正常的脈沖條紋(多為多次按壓“暫停/播放”按鈕所致)。但隨著數(shù)碼時(shí)代的到來,各種便攜的數(shù)碼設(shè)備都具有了錄音功能,現(xiàn)在案件中遇到的音頻資料多為數(shù)字化的資料。網(wǎng)絡(luò)上也有各種各樣的音頻編輯工具(如:CoolEdit、Adobe Audition、WaveCN……),而且有免費(fèi)的使用教程,對于別有用心的人來說,大大降低了犯罪成本。利用這些編輯軟件犯罪分子可以很容易的對錄音內(nèi)容進(jìn)行刪減或添加,經(jīng)過軟件的優(yōu)化處理,一般偵查人員很難分辨出涉案錄音的真實(shí)與否。
錄音真實(shí)性檢驗(yàn)是聲紋檢驗(yàn)中十分重要的一環(huán),因?yàn)橐环菀纛l資料能否作為證據(jù)在訴訟中使用,最重要的是該音頻資料應(yīng)為真實(shí)有效且未經(jīng)修改的。同時(shí),錄音真實(shí)性檢驗(yàn)又是法庭科學(xué)中的一項(xiàng)技術(shù)難題,尤其是數(shù)字錄音。對于數(shù)字錄音文件來說,首要的一項(xiàng)檢驗(yàn)就是錄音參數(shù)檢驗(yàn)。數(shù)字錄音文件是由與之對應(yīng)的數(shù)字錄音設(shè)備所錄制的,因此,錄音文件的各項(xiàng)參數(shù)特征必然與該設(shè)備相符。更有“amr編碼檢驗(yàn)”、“波形圖檢驗(yàn)”、“電網(wǎng)頻率檢驗(yàn)”、“頻譜檢驗(yàn)”等多種不同的方法,針對不同類型的錄音進(jìn)行真實(shí)性檢驗(yàn)。在錄音真實(shí)性檢驗(yàn)中, “重翻錄”錄音材料的檢驗(yàn)更是難上加難,但重翻錄操作不僅能做到偽造錄音場景,還能攻擊基于語音特征的安全系統(tǒng),因而針對重翻錄錄音材料檢驗(yàn)的研究極有必有。目前有研究人員從數(shù)據(jù)統(tǒng)計(jì)分析的角度,利用幅度共生向量特征來對重翻錄語音和原始語音進(jìn)行分析。雖然有了成果,但其實(shí)用性,以及在實(shí)戰(zhàn)中的準(zhǔn)確率有待考量,需要進(jìn)一步優(yōu)化與實(shí)踐[4-6]。
語音識(shí)別技術(shù)起始于20世紀(jì)50年代,經(jīng)過半個(gè)世紀(jì)的發(fā)展,在20世紀(jì)末,語音識(shí)別系統(tǒng)走向了實(shí)用化,各種模型和算法極大地提高了識(shí)別準(zhǔn)確率[7]。
在聲紋檢驗(yàn)的前期準(zhǔn)備工作中,需要對檢材、樣本語音進(jìn)行轉(zhuǎn)寫,對檢材、樣本語音中的相同詞進(jìn)行標(biāo)注,人工進(jìn)行往往會(huì)消耗大量時(shí)間,降低效率。加入語音識(shí)別系統(tǒng)后,可對檢材、樣本進(jìn)行自動(dòng)的轉(zhuǎn)寫和標(biāo)注,但目前的系統(tǒng)在識(shí)別方面精度并不高,無法達(dá)到檢驗(yàn)需要的標(biāo)準(zhǔn),仍需人工進(jìn)行核對。目前有不少的研究人員在更新算法、優(yōu)化程序代碼,甚至在嘗試著加入機(jī)器學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí),以期提高語音識(shí)別的準(zhǔn)確率。
聲紋檢驗(yàn)技術(shù)在我國起步較晚,但在幾代人的努力下,迎頭趕上,取得了不俗的成果,為以后的發(fā)展奠定了堅(jiān)實(shí)的基礎(chǔ)。隨著科技的進(jìn)步,社會(huì)的發(fā)展,各種專業(yè)知識(shí)的學(xué)習(xí)成本在信息化時(shí)代都越來越低,犯罪分子的作案手段因而越來越先進(jìn),為了在這正與邪的對抗中不落下風(fēng),我們應(yīng)以開放的心態(tài),以兼容并包之勢,吸收各個(gè)領(lǐng)域的前沿知識(shí),先進(jìn)技術(shù),將其應(yīng)用于聲紋檢驗(yàn)中來,在前輩的基礎(chǔ)之上,進(jìn)行創(chuàng)新,探索更廣闊的的發(fā)展空間。