宋哲
摘要:錄音資料真實(shí)性作為聲像資料的一部分,是司法鑒定領(lǐng)域的一個(gè)熱點(diǎn)研究問(wèn)題,在我國(guó)的司法訴訟證據(jù)鏈中有著非常重要的地位和價(jià)值[1]。音頻文件因錄音設(shè)備來(lái)源多樣,且對(duì)數(shù)字音頻文件的篡改編輯將嚴(yán)重影響錄音資料司法證據(jù)的真實(shí)性。文章主要結(jié)合音頻取證技術(shù)的發(fā)展對(duì)錄音資料真實(shí)性鑒定在實(shí)踐中的應(yīng)用進(jìn)行了詳細(xì)闡述,旨在為聲像資料專業(yè)相關(guān)司法鑒定實(shí)踐提供參考和借鑒。
關(guān)鍵詞:音頻取證;聲像資料;錄音資料真實(shí)性司法鑒定
中圖分類號(hào):TP317.4;TN911.73;TN919.81 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2022)16-0092-03
在法庭證據(jù)中錄音資料由于其具有可信度高的特征,能夠真實(shí)還原當(dāng)事雙方的爭(zhēng)議熱點(diǎn),已經(jīng)和人證、物證、當(dāng)事人陳述、鑒定結(jié)果和證人發(fā)言與現(xiàn)場(chǎng)筆錄具有同樣重要的作用[2]。在2020年5月1日施行的《最高人民法院關(guān)于修改<關(guān)于民事訴訟證據(jù)的若干規(guī)定>的決定》中,也明確了電子錄音證據(jù)可以作為民事訴訟的證據(jù)。
在筆者的司法鑒定實(shí)踐過(guò)程中發(fā)現(xiàn),伴隨著信息化進(jìn)程的發(fā)展,錄音設(shè)備種類也層出不窮,由此帶來(lái)音頻文件的來(lái)源越來(lái)越廣泛;另外隨著計(jì)算機(jī)音頻編輯軟件及手機(jī)App的種類方式日益增加,其音頻編輯合成的功能也越來(lái)越強(qiáng)大,從而間接導(dǎo)致目前關(guān)于錄音資料類的篡改行為也呈現(xiàn)出多樣化的趨勢(shì),嚴(yán)重影響法院司法審判過(guò)程中證據(jù)使用的公平和公正,迫切需要研究新的手段和方法來(lái)輔助支撐對(duì)錄音資料真實(shí)性的鑒定實(shí)踐。
1 音頻取證技術(shù)現(xiàn)狀
音頻取證是法庭取證的重要組成部分,如何保證音頻信號(hào)的合法性、真實(shí)性和關(guān)聯(lián)性[3]也是自20世紀(jì)末以來(lái)音頻取證的一致的研究方向。在我國(guó),手機(jī)早已經(jīng)成為日常生活、娛樂(lè)服務(wù)的重要組成部分,在此過(guò)程中由于手機(jī)便捷的語(yǔ)音通話錄音功能,從維護(hù)自身權(quán)益出發(fā)及避免糾紛致使私錄音頻大量出現(xiàn),特別是自去年最高法再次重申明確電子錄音證據(jù)合法后,私錄音頻現(xiàn)象更是普遍。
1.1語(yǔ)音主動(dòng)取證
通過(guò)計(jì)算機(jī)設(shè)定的算法,人為地將脆弱音頻水印嵌入到原始錄音文件之中,以此達(dá)到對(duì)錄音的完整性和真實(shí)性做出主動(dòng)且明確防范的音頻取證技術(shù)[4]。音頻主動(dòng)取證可以通過(guò)特定方法有效防止合法的音頻文件不被人為篡改或者偽造。該水印應(yīng)當(dāng)具有不可感知、水印的脆弱性、水印算法的安全性、提取水印的盲檢測(cè)性能、嵌入容量小等特點(diǎn),是特定環(huán)境特定設(shè)備下的產(chǎn)物,主要有單變換域及多變換域嵌入法,隨著手機(jī)等便捷錄音功能的出現(xiàn)及計(jì)算機(jī)音頻編輯軟件的普及應(yīng)用,這種取證方法已經(jīng)遠(yuǎn)遠(yuǎn)不能滿足法庭取證的需要。
1.2語(yǔ)音被動(dòng)取證
又稱被動(dòng)篡改語(yǔ)音檢測(cè),在目前的數(shù)字音頻篡改檢測(cè)中主要是利用ENFC的穩(wěn)定性和唯一性進(jìn)行數(shù)字音頻篡改被動(dòng)檢測(cè)[5],其本質(zhì)上是基于電網(wǎng)頻率一致性的檢測(cè)方法,由于錄音設(shè)備在接入電網(wǎng)的情況下錄制語(yǔ)音,音頻信號(hào)中必然會(huì)帶有電網(wǎng)頻率ENF(ElectricNetwork Frequency)信息[6],在過(guò)去十多年中幾乎成為數(shù)字音頻鑒定的公用標(biāo)準(zhǔn)。這種根據(jù)ENF相位變化的一致性作為特征來(lái)檢測(cè)音頻篡改的技術(shù)在應(yīng)用中有很大局限性,畢竟使用環(huán)境中有電網(wǎng)頻率成分的音頻案例有限。特別是隨著語(yǔ)音濾波處理技術(shù)的發(fā)展,在手機(jī)錄音中已經(jīng)不太可能存在有電網(wǎng)頻率的成分,比如手機(jī)廠家研發(fā)部門從保持聽(tīng)覺(jué)的舒適度,網(wǎng)絡(luò)運(yùn)營(yíng)商為了進(jìn)一步提高帶寬使用效率,在手機(jī)通話時(shí),特別是基站在處理手機(jī)通話沒(méi)有輸入信號(hào)的情況下,已經(jīng)杜絕了真實(shí)電網(wǎng)頻率干擾,轉(zhuǎn)而根據(jù)背景特征向用戶發(fā)出一些較為舒適的噪聲。
1.3 錄音來(lái)源識(shí)別
主要通過(guò)對(duì)音頻的錄音設(shè)備、錄音場(chǎng)合、錄音時(shí)間、涉及的說(shuō)話人和采用的音頻編碼方式等方面進(jìn)行客觀分辨。市面上實(shí)際不同品牌的錄音錄像手機(jī)設(shè)備,由于軟硬件版權(quán)及使用發(fā)明專利等原因,在硬件上采用不同的放大電路、濾波電路等設(shè)計(jì),軟件方面對(duì)語(yǔ)音采集算法加以修改,同時(shí)配套不同的降噪和壓縮算法,從而產(chǎn)生了各個(gè)廠家不同的錄音設(shè)備獨(dú)有的自身特征,從而形成不同錄音文件來(lái)源。
2 常用音頻篡改方法
在國(guó)內(nèi),大量私錄的語(yǔ)音文件作為重要且直觀證據(jù)在法庭上提供,但同時(shí)由于音頻編輯工具(計(jì)算機(jī)軟件或手機(jī)App均有)的普及使得一些別有用心的人可以通過(guò)操作,隨心所欲地編輯出自己想要的錄音資料,通常對(duì)原始語(yǔ)音文件進(jìn)行篡改主要表現(xiàn)為以下四種方式[7]。
2.1插入拼接
通常表現(xiàn)為插入不同來(lái)源的來(lái)源達(dá)到音頻偽裝目的,在一段原始音頻中插入來(lái)自其他語(yǔ)音文件或自身復(fù)制文件的語(yǔ)音片段,實(shí)現(xiàn)更改語(yǔ)音要表達(dá)的思想,以達(dá)到混淆視聽(tīng)的目的,從而掩蓋錄音資料中包含的事實(shí)真相。
2.2剪切拼接
剪切目的是在語(yǔ)義上打亂使用者的邏輯關(guān)系,可在原始音頻的任意位置粘貼新的音頻片段或復(fù)制來(lái)自不同位置的音頻,從而在表達(dá)上形成不同的邏輯次序。實(shí)踐中可表現(xiàn)為同一或不同文件的剪切片段一次或多次拼接,形成虛假的事實(shí)認(rèn)定依據(jù)。
2.3刪除拼接
刪除操作是出于自身利益需要,把音頻文件中對(duì)自己不利的片段進(jìn)行抹除,造成語(yǔ)意空白或?qū)φ鎸?shí)表達(dá)進(jìn)行斷章取義的效果,同樣可以造成明顯的與事實(shí)不符合的虛假音頻文件。
2.4音頻翻錄
翻錄是使用新的錄音設(shè)備對(duì)上述使用音頻編輯軟件或手機(jī)App進(jìn)行篡改的音頻進(jìn)行第三方的重新錄制,以尋求獲得法律庇護(hù)支持的行為,翻錄的存在對(duì)法庭語(yǔ)音證據(jù)的真實(shí)性危害最大,是截至目前檢驗(yàn)難度最大的一種音頻篡改方式。
3錄音資料真實(shí)性鑒定實(shí)踐應(yīng)用
在早期的被動(dòng)篡改語(yǔ)音檢測(cè)中,由于語(yǔ)音文件中嵌入的ENF成分作為一種天然嵌入到音頻信號(hào)中的水印信號(hào),不但可以作為時(shí)間戳來(lái)使用,且能通過(guò)帶通濾波提取,將提取出的ENFC與供電部門的電網(wǎng)頻率數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行比對(duì)[8],可確定音頻錄制時(shí)間與當(dāng)事人宣稱是否一致,對(duì)待檢測(cè)音頻中ENF的波動(dòng)和參考年份的數(shù)據(jù)進(jìn)行比對(duì)[9],可判斷音頻是否被篡改過(guò)。而今使用計(jì)算機(jī)軟件或手機(jī)App對(duì)原始錄音文件進(jìn)行編輯修改,這在某種程度上是對(duì)數(shù)字音頻文件本質(zhì)上的篡改,對(duì)錄音資料真實(shí)性鑒定要求也會(huì)更高。
3.1主動(dòng)水印音頻分析
在主動(dòng)音頻取證中,主要是通過(guò)在合法的音頻中嵌入隱藏加密信息等方法來(lái)達(dá)到防止篡改的意圖,大量用于在原始音頻版權(quán)及個(gè)人隱私保護(hù)等場(chǎng)合[10]。具體加密使用原理如圖1所示。
3.2環(huán)境噪聲的分析
音頻文件的噪聲通常包括兩種:聲學(xué)環(huán)境(AE)噪聲、設(shè)備錄制(RD)噪聲[11]。實(shí)驗(yàn)室環(huán)境下錄制的音頻背景噪聲不易分辨,需借助其他特征具體分析,但是在室外或特定環(huán)境氛圍中的環(huán)境噪聲,則明顯帶有環(huán)境特點(diǎn),通過(guò)聲紋鑒定工作站進(jìn)行波形及頻譜分析,會(huì)出現(xiàn)非正常背景噪聲的切換,或者與聲稱錄制環(huán)境有差別,或者與檢材送檢者聲明時(shí)刻不一致的音頻就會(huì)有被篡改的可能。
3.3本底噪聲的分析
本底噪聲主要來(lái)源于錄制音頻設(shè)備本身,是由麥克風(fēng)相關(guān)的電子元件及編碼電路傳輸失真產(chǎn)生的電源噪聲[12]。實(shí)際中表現(xiàn)為無(wú)信號(hào)輸入,即寂音時(shí)的波形噪音。正常情況下,一段原始音頻的本底噪聲應(yīng)該是持續(xù)且規(guī)則的,如果前后噪聲不一致有可能是不同設(shè)備錄制的拼接音頻。
3.4文件屬性的分析
音頻文件在聲紋檢驗(yàn)工作站中進(jìn)行文件屬性查看,文件命名格式及命名規(guī)則、音頻擴(kuò)展名、音頻創(chuàng)建時(shí)間、修改時(shí)間、音頻時(shí)長(zhǎng)、采樣率及是否為立體聲錄制等一目了然。通過(guò)對(duì)聲稱錄制設(shè)備音頻進(jìn)行仔細(xì)比對(duì),就能發(fā)現(xiàn)篡改音頻的真面目。
3.5聽(tīng)覺(jué)的檢驗(yàn)分析
聽(tīng)覺(jué)檢驗(yàn)主要來(lái)自鑒定人的經(jīng)驗(yàn),主要通過(guò)反復(fù)審聽(tīng)語(yǔ)音的整體情況來(lái)判斷是否存在交談過(guò)程的卡頓或違反常理的語(yǔ)意邏輯,對(duì)話語(yǔ)義的關(guān)聯(lián)性和邏輯性是否異常,對(duì)話聲、背景聲音有無(wú)突兀或非正常的變換,錄音中有無(wú)出現(xiàn)脈沖信號(hào)丟失、覆蓋等現(xiàn)象。
3.6采樣直方圖的分析
不同采樣模式錄制的音頻語(yǔ)音,在采樣直方圖中會(huì)有直觀表示,正常音頻呈現(xiàn)高斯分布模式,當(dāng)編輯插入不同音頻編碼片段后,會(huì)有明顯的非均勻量化特征出現(xiàn),如圖2中不同采樣位數(shù)直方圖出現(xiàn)細(xì)密程度不一致的突變。
3.7采樣率量化檢驗(yàn)分析
同一設(shè)備錄制的沒(méi)有經(jīng)過(guò)篡改的音頻,其采樣率量化位數(shù)應(yīng)該是一致的,對(duì)上述采樣直方圖進(jìn)行放大分析對(duì)比,就能使篡改音頻現(xiàn)出本來(lái)面目,如下圖3中這三處顯示出采樣量化位數(shù)明顯不一致的情況。
3.8直流(DC)偏移波形分析
通過(guò)對(duì)直流分量中心偏離位置的分析,可判斷音頻文件是否來(lái)自不同設(shè)備錄制的,或者是否由不相關(guān)的語(yǔ)音片斷進(jìn)行拼接而形成,如圖4所示異常插入其他設(shè)備錄制片段的直流偏移的波形顯示。
3.9頻響范圍的分析
不同設(shè)備的頻響范圍是不盡相同,特別是采用不同采樣率的設(shè)備進(jìn)行翻錄或者編輯音頻的情況下會(huì)有高低的區(qū)別,表現(xiàn)在頻譜圖中會(huì)有人為抹除痕跡或頻響范圍不一致的情況。如圖5中對(duì)提交的檢材和聲稱樣本進(jìn)行平均頻譜的比較后,發(fā)現(xiàn)兩者不管在頻響范圍還是截止頻率方面均存在明顯不同。
3.10頻帶能量的分析
頻帶能量分析主要針對(duì)翻錄音頻的分析,實(shí)踐中翻錄音頻能夠改變特定頻帶范圍內(nèi)能量的強(qiáng)弱,頻譜表現(xiàn)為具有“帶阻濾波”之特征譜圖。
4 國(guó)內(nèi)外研究進(jìn)展
從音頻中提取蘊(yùn)含環(huán)境特征的參數(shù),是目前在聲像資料之錄音真實(shí)性鑒定仍在積極探索的一個(gè)方向。由于錄音環(huán)境參數(shù)一般與說(shuō)話人身份特征、職業(yè)有很大關(guān)系,且覆蓋頻段較寬,在數(shù)碼錄音資料中就表現(xiàn)為說(shuō)話人、錄音設(shè)備特點(diǎn)及背景噪聲等的疊加頻譜。這方面國(guó)內(nèi)外的基礎(chǔ)理論研究有一定的進(jìn)展,比如Mubarak就采用過(guò)零率特征和MPEG-7的包含音頻波形、功率、譜包絡(luò)和譜質(zhì)心等的底層特征作為特征參數(shù),對(duì)不同的錄音場(chǎng)合進(jìn)行分類識(shí)別[13];Hong Zhao還從混響和背景噪聲中提取環(huán)境特征參數(shù),采用SVM作為分類器,對(duì)不同音頻說(shuō)話人及不同麥克風(fēng)種類和不同環(huán)境抽樣比對(duì)作為識(shí)別方法[14],但在當(dāng)前實(shí)踐中仍沒(méi)有配套設(shè)備來(lái)檢測(cè)。目前較為先進(jìn)的研究成果是采用梅爾頻率倒譜參數(shù)MFCC及噪聲功率譜等特征參數(shù)與錄音設(shè)備之間進(jìn)行相關(guān)聯(lián)分析的方法[15]。
5 結(jié)束語(yǔ)
隨著現(xiàn)代人法律、電子物證意識(shí)的提高,法庭中大量私錄音頻證據(jù)的出現(xiàn),作為真實(shí)存在并可以在很大程度上對(duì)當(dāng)事人權(quán)益進(jìn)行保護(hù)的錄音資料,越來(lái)越受到社會(huì)的關(guān)注,同時(shí)使用音頻編輯軟件對(duì)法庭音頻證據(jù)的篡改,使得在法庭庭審過(guò)程中對(duì)涉錄音資料的真實(shí)性、完整性鑒定成為必然趨勢(shì),并呈現(xiàn)日益增長(zhǎng)的勢(shì)頭,使得作為技術(shù)鑒定人員,必須不斷研究音頻取證技術(shù),掌握相關(guān)音頻篡改技術(shù)發(fā)展,正所謂知其然,才能知其所以然,最大限度保證法庭證據(jù)的公平公正。
參考文獻(xiàn):
[1] 最高人民法院.《最高人民法院關(guān)于民事訴訟證據(jù)的若干規(guī)定》法釋〔2019〕19號(hào)[Z].2019.
[2] 廖翔,趙志強(qiáng),龐業(yè)光,等.聲像檢驗(yàn)鑒定技術(shù)概述[J].警察技術(shù),2006(6):45-46.
[3] 司法部.《聲像資料鑒定通用規(guī)范》SF/Z JD0300001-2010[Z].2010.
[4] Kirbiz S,Lemma A N,Celik M U,et al.Decode-time forensic watermarking of AAC bitstreams[J].IEEE Transactions on Information Forensics and Security,2007,2(4):683-696.
[5] Petrovic R.Digital watermarks for audio integrity verification[C]//7 th International Conference on Telecommucations in Modern Satelite,Cable and Broadcasting Services,Serbia and Monrenegro. Yugoslavia: IEEE Computer Society Press,2005:215-220.
[6] Rodriguez D P N,Apolinario J A,Biscainho L W P.Audio authenticity: Detecting discontinuity with high precision phase analysis[J].IEEE Transactions on information Forensics and Security,2010,5(3):534-543.
[7] 王華朋.常見(jiàn)語(yǔ)音被編輯加工痕跡的檢驗(yàn)方法[J].警察技術(shù),2017(3):54-56.
[8] Grigoras C.Digital audio recording analysis:theElectric Network Frequency (ENF) Criterion[J].InternationalJournalofSpeech,Language and the Law,2005,12(1):63-76.
[9] Lee Sang Kwang,HoYo Sung.Digital audio watermarking in the cepstrum domain[J].IEEE Transaction on Consumer Electionics Press,2000,46(3):203-207.
[10] 王英利,李敬陽(yáng),曹洪林.聲紋鑒定技術(shù)綜述[J].警察技術(shù),2012(4):54-56.
[11] 王永全.聲像資料司法鑒定實(shí)務(wù)[M].北京:法律出版社,2013.
[12] 裴安山,王讓定,嚴(yán)迪群.基于設(shè)備本底噪聲頻譜特征的手機(jī)來(lái)源識(shí)別[J].電信科學(xué),2017,33(1):85-94.
[13] Kotropoulos C L.Source phone identification using sketches of features[J].IET Biometrics,2014,3(2):75-83.
[14] Wang Z F,WeiG,He Q H.Channel pattern noise based playback attack detection algorithm for speaker recognition[C]//2011 International Conference on Machine Learning and Cybernetics.July 10-13,2011,Guilin,China.IEEE,2011:1708-1713.
[15] Aggarwal R,Singh S,Roul A K.Cellphone identification using noise estimates from recorded audio[C]//2014 International Conference on Communications and Signal Processing(ICCSP). Melmaruvathur,Tamil Nadu,India;IEEE Press,2014:1218-1222.
【通聯(lián)編輯:光文玲】