国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于設(shè)備本底噪聲頻譜特征的手機(jī)來(lái)源識(shí)別

2017-05-03 07:37:39裴安山王讓定嚴(yán)迪群
電信科學(xué) 2017年1期
關(guān)鍵詞:語(yǔ)譜背景噪聲靜音

裴安山,王讓定,嚴(yán)迪群

(寧波大學(xué),浙江 寧波 315211)

基于設(shè)備本底噪聲頻譜特征的手機(jī)來(lái)源識(shí)別

裴安山,王讓定,嚴(yán)迪群

(寧波大學(xué),浙江 寧波 315211)

隨著手機(jī)錄音設(shè)備的普及以及各種功能強(qiáng)大且易于操作的數(shù)字媒體編輯軟件的出現(xiàn),手機(jī)來(lái)源識(shí)別已成為多媒體取證領(lǐng)域的熱點(diǎn)問(wèn)題。將本底噪聲作為手機(jī)的“指紋”,提出了一種基于本底噪聲的手機(jī)來(lái)源識(shí)別方法。該方法先通過(guò)靜音段錄音的估計(jì)得到本底噪聲;然后計(jì)算本底噪聲的頻譜特征在時(shí)間軸方向上的均值,將其作為手機(jī)來(lái)源識(shí)別的分類特征;最后采用主成分分析(PCA)法對(duì)特征進(jìn)行降維,并采用支持向量機(jī)(SVM)進(jìn)行分類。實(shí)驗(yàn)部分對(duì) 24款主流型號(hào)的手機(jī)進(jìn)行了分類,結(jié)果表明本文方法的平均識(shí)別準(zhǔn)確率(accuracy)和平均召回率(recall)達(dá)到了99.24%,同時(shí)也驗(yàn)證了相比MFCC,本底噪聲有更加優(yōu)越的性能。

多媒體取證;手機(jī)來(lái)源識(shí)別;本底噪聲;頻譜特征

1 引言

如今,隨著移動(dòng)互聯(lián)網(wǎng)和微芯片產(chǎn)業(yè)的發(fā)展,移動(dòng)終端成為人們生活中不可或缺的部分。越來(lái)越多的人開(kāi)始用智能手機(jī)、Pad等便攜設(shè)備捕捉和采集他們看到或聽(tīng)到的情景,而不是用相機(jī)、錄音筆、DV等專業(yè)設(shè)備。大量數(shù)字采集設(shè)備和采集數(shù)據(jù)的可用性帶來(lái)了新的問(wèn)題和挑戰(zhàn)——多媒體的安全問(wèn)題。作為一種檢測(cè)多媒體數(shù)據(jù)獨(dú)創(chuàng)性、真實(shí)性、完整性的技術(shù),多媒體取證技術(shù)是信息安全領(lǐng)域的熱點(diǎn)研究問(wèn)題[1]。

基于語(yǔ)音的手機(jī)來(lái)源識(shí)別是與多媒體取證最相關(guān)的應(yīng)用之一,用來(lái)確定錄制語(yǔ)音文件的手機(jī)型號(hào)。這一研究方向引起了大量取證研究者的關(guān)注,并在近年獲得重大進(jìn)展[2-5]。Hanilci等人[6]通過(guò)提取錄音文件的MFCC(梅爾倒譜系數(shù))特征進(jìn)行手機(jī)品牌和型號(hào)的識(shí)別。在14個(gè)不同型號(hào)手機(jī)的閉集識(shí)別實(shí)驗(yàn)中,識(shí)別率達(dá)到96.42%。此后,又比較了MFCC、LFCC(線性倒譜系數(shù))、BFCC(Bark頻率倒譜系數(shù))和LPCC(線性預(yù)測(cè)倒譜系數(shù))[7]在手機(jī)來(lái)源識(shí)別中效果的優(yōu)劣,實(shí)驗(yàn)得出MFCC特征在手機(jī)來(lái)源識(shí)別中效果最好。在手機(jī)的來(lái)源識(shí)別領(lǐng)域還有很多重要的成果[8-10],Kotropoulos[11]通過(guò)對(duì)不同手機(jī)采集的語(yǔ)音信號(hào)頻譜取對(duì)數(shù),然后沿時(shí)間軸取平均,或者通過(guò)對(duì)每一幀的特征參數(shù)利用高斯混合模型建模得到高維的特征向量,然后映射到低維空間進(jìn)行降維。在7個(gè)品牌21個(gè)型號(hào)的手機(jī)來(lái)源識(shí)別實(shí)驗(yàn)中,識(shí)別率達(dá)到94%。王志鋒等人[12]考慮到語(yǔ)音段中的靜音包含了與正常語(yǔ)音一樣的設(shè)備信息,并且不受說(shuō)話人、文本、情感等因素的影響,因此從靜音段中提出表征錄音設(shè)備的特征。然后利用設(shè)備通用背景模型構(gòu)建設(shè)備模型。最后通過(guò)歸一化似然度得分,對(duì)輸入的錄音設(shè)備的語(yǔ)音樣本特征進(jìn)行分類判決。實(shí)驗(yàn)結(jié)果表明,他們的算法對(duì)于9種不同設(shè)備的平均識(shí)別率為87.42%。鄒領(lǐng)等人[13]提出了一種基于噪聲估計(jì)的錄音設(shè)備源識(shí)別方法,通過(guò)錄音設(shè)備源識(shí)別實(shí)驗(yàn)以及與其他幾種常用的錄音設(shè)備源識(shí)別特征,包括MFCC均值特征、基于MFCC的GLDS kernel超向量特征以及SSF特征做比較,證明了該方法的有效性。

然而,現(xiàn)有大多數(shù)手機(jī)來(lái)源識(shí)別的研究是基于MFCC特征或MFCC的統(tǒng)計(jì)分類特征的。雖然相關(guān)特征在手機(jī)來(lái)源識(shí)別中取得了令人滿意的效果,但是梅爾頻帶近似人類聽(tīng)覺(jué)系統(tǒng)的響應(yīng),分類效果可能受到許多不確定條件的干擾,如說(shuō)話人的性別、情感、語(yǔ)音內(nèi)容等。為了有效捕獲手機(jī)的內(nèi)在“指紋”,將本底噪聲作為相同型號(hào)手機(jī)特有的身份特征。本底噪聲是設(shè)備自身產(chǎn)生的信號(hào),它的特性主要受電路設(shè)計(jì)和電子元器件的影響。因?yàn)椴煌吞?hào)的手機(jī)電路設(shè)計(jì)和電子元器件的使用不一致性,所以不同型號(hào)的手機(jī)沒(méi)有完全相同的本底噪聲。本文提出了一種基于本底噪聲頻譜分布特征的手機(jī)來(lái)源識(shí)別方法。實(shí)驗(yàn)結(jié)果表明,本底噪聲的頻譜分布特征能夠?qū)?shù)據(jù)庫(kù)中的手機(jī)進(jìn)行識(shí)別分類,平均識(shí)別準(zhǔn)確率和平均召回率可以達(dá)到99.24%。

2 本底噪聲

2.1 本底噪聲的定義

手機(jī)的本底噪聲是手機(jī)本身產(chǎn)生的噪聲,是一種在沒(méi)有輸入信號(hào)的情況下也能產(chǎn)生的噪聲。在電子學(xué)中,所有組件的溫度在絕對(duì)零度以上時(shí),都將產(chǎn)生自己的噪聲。而錄音在采集過(guò)程中可能會(huì)受到錄音軟件和系統(tǒng)操作版本的影響,另外,部分手機(jī)可能包含語(yǔ)音壓縮等信號(hào)處理過(guò)程,因此本文研究的本底噪聲是廣義上的本底噪聲。在研究中默認(rèn)使用系統(tǒng)自帶的錄音軟件,對(duì)手機(jī)電子元器件和電路設(shè)計(jì)對(duì)本底噪聲的影響進(jìn)行整體研究,針對(duì)系統(tǒng)版本對(duì)本底噪聲的影響挑選幾款典型的手機(jī)進(jìn)行對(duì)比研究[13-15]。圖1為數(shù)字語(yǔ)音錄音系統(tǒng)的簡(jiǎn)化示意,可以看出,背景噪聲和本底噪聲是獨(dú)立的,本底噪聲主要由與麥克風(fēng)相關(guān)的電子元件及編碼傳輸失真產(chǎn)生的噪聲組成。

圖1 數(shù)字語(yǔ)音錄音系統(tǒng)簡(jiǎn)化示意

表1 實(shí)驗(yàn)中手機(jī)的品牌和型號(hào)以及類名

圖2 不同手機(jī)品牌的本底噪聲語(yǔ)譜

本底噪聲的定義表明,本底噪聲的特性與手機(jī)的電路設(shè)計(jì)和電子元器件的使用密切相關(guān)。由于不同型號(hào)的手機(jī)在電路設(shè)計(jì)和電子元器件的使用上存在部分差異。所以,本底噪聲可以作為手機(jī)的“指紋”進(jìn)行手機(jī)的來(lái)源識(shí)別。

2.2 本底噪聲的性質(zhì)

為了研究本底噪聲的特性,對(duì)現(xiàn)下流行的7個(gè)品牌24個(gè)型號(hào)的25臺(tái)設(shè)備 (其中有兩臺(tái)iPhone 5)進(jìn)行了研究,具體手機(jī)型號(hào)見(jiàn)表1。實(shí)際本底噪聲樣本是在無(wú)回聲的錄音棚的靜音環(huán)境下錄制的。為了避免其他電氣設(shè)備噪聲對(duì)實(shí)驗(yàn)的干擾,當(dāng)手機(jī)在錄音時(shí),關(guān)閉了整個(gè)錄音棚的電源開(kāi)關(guān)。

語(yǔ)譜是語(yǔ)音信號(hào)的頻譜隨時(shí)間變化的直觀展示。為了研究本底噪聲的頻譜特性,圖2給出了其中8個(gè)手機(jī)的本底噪聲語(yǔ)譜。通過(guò)觀察圖2可以看出,不同品牌手機(jī)的本底噪聲語(yǔ)譜存在很大差異。例如,魅族MX4本底噪聲語(yǔ)譜的振幅曲線是隨頻率呈波動(dòng)變化趨勢(shì)的,HTC D610t的本底噪聲語(yǔ)譜在頻率為4 000 Hz附近有大幅下降,三星Galaxy S5本底噪聲的能量在所有的頻點(diǎn)間隔(0~16 kHz)是最弱的,而相同型號(hào)的手機(jī)(如iPhone 5)的語(yǔ)譜比較相似。

圖3以iPhone手機(jī)為例,給出了相同品牌不同型號(hào)手機(jī)的語(yǔ)譜。通過(guò)圖3可以看出,同一品牌手機(jī)的本底噪聲語(yǔ)譜在一定程度上是相似的,不同型號(hào)手機(jī)間的語(yǔ)譜區(qū)別較小,但是在低頻部分的噪聲強(qiáng)度上仍有一定區(qū)別,需要構(gòu)建特征并選用合適的分類算法進(jìn)行區(qū)分?;趫D2和圖3的分析可得,顯示語(yǔ)譜內(nèi)在變化的頻譜分布特征可以作為手機(jī)設(shè)備來(lái)源識(shí)別的特征。

圖3 蘋果品牌手機(jī)的語(yǔ)譜

以HTC D610t、iPhone 5和Mi 4為例,對(duì)3臺(tái)手機(jī)的操作系統(tǒng)版本進(jìn)行了升級(jí),以驗(yàn)證系統(tǒng)版本對(duì)本底噪聲的影響。圖4是升級(jí)后3臺(tái)手機(jī)本底噪聲的語(yǔ)譜,由圖4和圖2中3臺(tái)手機(jī)的語(yǔ)譜對(duì)比可得,HTC D610t和iPhone 5系統(tǒng)升級(jí)前后本底噪聲語(yǔ)譜沒(méi)有明顯變化,Mi 4手機(jī)操作系統(tǒng)升級(jí)前后本底噪聲語(yǔ)譜變化較兩者略大,主要是高頻部分本底噪聲的能量有些許差別。

3 基于本底噪聲的特征提取和來(lái)源識(shí)別

3.1 本底噪聲的估計(jì)

本文將本底噪聲作為手機(jī)來(lái)源識(shí)別的基本特征。因?yàn)楸镜自肼暡坏韧谡Z(yǔ)音的噪聲,所以本底噪聲的估計(jì)是一項(xiàng)具有挑戰(zhàn)性的工作。因此,本文提出兩步實(shí)現(xiàn)本底噪聲估計(jì)的方法。

(1)靜音段提取

靜音段提取原因是:語(yǔ)音的靜音段主要由本底噪聲和背景噪聲構(gòu)成,不會(huì)被語(yǔ)音部分的綜合噪聲中占主導(dǎo)地位的聲電響應(yīng)不一致噪聲所污染[16]。本文采用自適應(yīng)端點(diǎn)檢測(cè)算法進(jìn)行靜音段估計(jì)[17]。如圖5(a)和圖5(b)所示,該方法可以很好地識(shí)別靜音段。從圖5(c)可以看出,經(jīng)過(guò)自適應(yīng)端點(diǎn)檢測(cè)算法得到的靜音段還含有少量語(yǔ)音信息。為了進(jìn)一步消除不必要的語(yǔ)音信息,使用函數(shù)ns(·)對(duì)靜音段進(jìn)行了后處理,如式(1)所示:

式(1)中Thr是ns(i)升序排列后前40%樣本的均值,find(·)的功能是當(dāng)ns(i)的絕對(duì)值小于5倍的Thr時(shí),定位和輸出ns(i)的位置。

經(jīng)步驟1處理后,得到一個(gè)語(yǔ)音樣本的幾段靜音段,將它們拼接起來(lái)得到一個(gè)靜音段信號(hào)。

(2)背景噪聲抑制

為了從靜音段得到實(shí)際的本底噪聲,要盡可能地抑制背景噪聲。首先,采用算法1(改進(jìn)的頻譜減法)的偽代碼抑制背景噪聲。然后根據(jù)式(2)計(jì)算5 760個(gè)語(yǔ)音樣本(24個(gè)手機(jī),每個(gè)手機(jī)240個(gè)樣本)的通用背景噪聲模型。

其中,i是手機(jī)型號(hào)的索引,BNi是背景噪聲的語(yǔ)譜,BNi(k,n)是第k(1≤k≤K)個(gè)頻率點(diǎn)、第n(1≤n≤N)幀在短時(shí)傅里葉變換(short-time Fourier transform,STFT)域的頻譜特征,K表示語(yǔ)音樣本頻率點(diǎn)的個(gè)數(shù),N表示語(yǔ)音樣本的總幀數(shù)。注意,本文語(yǔ)音樣本STFT的點(diǎn)數(shù)為4 096個(gè),由于STFT輸出的對(duì)稱性,所以K的值為2 049(4 096/2+1)個(gè),N隨著語(yǔ)音長(zhǎng)度的變化而變化。k、n、K和N的定義也適用于其他式子。

圖4 操作系統(tǒng)升級(jí)后手機(jī)的語(yǔ)譜

算法1 背景噪聲計(jì)算

輸入 靜音段語(yǔ)譜|NS(k,n)|,本底噪聲的頻譜|SNmean(k)|

圖5 基于端點(diǎn)檢測(cè)的靜音段估計(jì)

輸出 背景噪聲語(yǔ)譜|BN(k,n)|

參數(shù):比例因子α1=3,增益補(bǔ)償因子β1=0.1

if|NS(k,n)|>α1×|SNmean(k)|

|BN(k,n)|=|NS(k,n)|-α1×|SNmean(k)|;

else|BN(k,n)|=β1×|NS(k,n)|;

end

因此,未知來(lái)源手機(jī)的本底噪聲可以通過(guò)靜音段信號(hào)減去通用背景噪聲得到。為了使估計(jì)的本底噪聲不含殘余的背景噪聲,設(shè)計(jì)了一個(gè)濾波方案。本底噪聲估計(jì)的完整過(guò)程的偽代碼如算法2所示。

算法2 本底噪聲估計(jì)

輸入 靜音段語(yǔ)譜圖|NS(k,n)|,背景噪聲的頻譜|BNmean(k)|

第一步的輸出:估計(jì)本底噪聲的語(yǔ)譜|SNestimated(k)|

第二步輸出:估計(jì)的本底噪聲濾波輸出|SNfilter(k)|

參數(shù):比例因子α2=3,φ=3,ω=1,增益補(bǔ)償因子β2=0.9

功能:median(·)計(jì)算每一個(gè)頻率區(qū)間沿時(shí)間軸的中值

ifft(·)逆快速傅里葉變換重構(gòu)時(shí)域信號(hào)

第一步:if|NS(k,n)|>α2×|BNmean(k)|

|SNestimated(k,n)|=|NS(k,n)|-α2×|BNmean(k)|;

else|SNestimated(k,n)|=β2×|NS(k,n)|;

end

第二步:SNmedian(k)=median(|SNestimated(k,n)|);

if|NS(k,n)|≥φ×|SNmedian(k)|

|SNfilter(k,n)|=ω×SNmedian(k);

else|SNfilter(k,n)|=|SNestimated(k,n)|;

end

|SNfilter(n)|=ifft(|SNestimated(k,n)|)

圖6展示了iPhone 6的實(shí)際本底噪聲語(yǔ)譜和它的估計(jì)本底噪聲的語(yǔ)譜。對(duì)比圖3(c)和圖6(b)可以看出,iPhone 6估計(jì)的本底噪聲語(yǔ)譜與實(shí)際的本底噪聲語(yǔ)譜是最相似的,圖6(c)也表明了估計(jì)本底噪聲與實(shí)際本底噪聲的頻譜是很相似的。因此,本文所提出的兩步實(shí)現(xiàn)對(duì)未知來(lái)源手機(jī)語(yǔ)音的本底噪聲估計(jì)的方法是可行的。

圖6 估計(jì)本底噪聲和實(shí)際本底噪聲的對(duì)比

3.2 特征提取和識(shí)別過(guò)程

為了實(shí)現(xiàn)手機(jī)的來(lái)源識(shí)別,需要選擇不同型號(hào)的手機(jī)之間具有差異性的本底噪聲特征。本文選取本底噪聲的頻譜分布特征作為分類特征,如式(3)所示:

特征的構(gòu)建過(guò)程表述如下:首先求出本底噪聲的頻譜特征SNi(k,n),然后對(duì)頻譜特征SNi(k,n)取對(duì)數(shù),最后沿時(shí)間軸按幀取平均,作為一個(gè)樣本的特征。

正如第3.1節(jié)提到的每幀的特征維度是2 049,由于特征維數(shù)太大,可能導(dǎo)致特征不能完全獨(dú)立不相關(guān)。冗余的特征不僅不能提升識(shí)別的準(zhǔn)確率,甚至?xí)绊懱卣飨蛄康淖R(shí)別效果。而PCA(principal component analysis,主成分分析)是一種常用的數(shù)據(jù)分析方法[18,19],通過(guò)線性變換將原始數(shù)據(jù)變換為一組各維度線性無(wú)關(guān)的數(shù)據(jù),可用于提取數(shù)據(jù)的主要特征分量,常用于高維數(shù)據(jù)的降維。因此利用PCA進(jìn)行降維,形成最優(yōu)的頻譜分布特征空間。識(shí)別采用PCA降維和MATLAB自帶的SVM(support vector machine,支持向量機(jī))函數(shù)訓(xùn)練分類,SVM是一種二類分類模型,其基本模型定義為特征空間上的間隔最大的線性分類器,其學(xué)習(xí)策略是間隔最大化,最終可轉(zhuǎn)化為凸二次規(guī)劃問(wèn)題的求解。本文所采用的 SVM函數(shù)使用的是 RBF(radial basis function,徑向基函數(shù)核函數(shù))。實(shí)驗(yàn)中,對(duì)兩個(gè)關(guān)鍵參數(shù)懲罰系數(shù)(C)和Gamma函數(shù)(γ)進(jìn)行尋優(yōu)處理。識(shí)別過(guò)程的步驟為:先將第4.1節(jié)所述的測(cè)試語(yǔ)音庫(kù)中一半樣本用于模型訓(xùn)練,另一半用于測(cè)試。訓(xùn)練集和測(cè)試集樣本按第3.1節(jié)所述進(jìn)行本底噪聲估計(jì),然后進(jìn)行頻譜分布特征提取,將各自所得的頻譜分布特征分別構(gòu)造特征空間。再利用PCA對(duì)訓(xùn)練特征空間進(jìn)行降維,將降維后的特征空間歸一化處理,測(cè)試集的特征空間根據(jù)訓(xùn)練集特征空間降維所采用的映射矩陣進(jìn)行降維,對(duì)降維后的測(cè)試特征空間進(jìn)行歸一化處理。最后對(duì)降維后訓(xùn)練特征空間進(jìn)行模型訓(xùn)練,對(duì)測(cè)試特征空間逐行進(jìn)行SVM分類判別。

4 實(shí)驗(yàn)分析

4.1 實(shí)驗(yàn)設(shè)置

在實(shí)驗(yàn)中,建立了一個(gè)語(yǔ)音數(shù)據(jù)庫(kù)來(lái)有效評(píng)估提出方法的有效性。該數(shù)據(jù)庫(kù)由表1所示的24個(gè)型號(hào)的手機(jī)所采集的語(yǔ)音組成。邀請(qǐng)了12人(6男6女)參與語(yǔ)音采集。每個(gè)人需要錄制兩段語(yǔ)音,一段為用正常的語(yǔ)速朗讀固定的內(nèi)容,另一段為問(wèn)答和主題演講,時(shí)長(zhǎng)均保證5 min以上。錄音環(huán)境是一間相對(duì)安靜的辦公室,25個(gè)手機(jī)由工作人員同時(shí)打開(kāi)和關(guān)閉錄音機(jī),保證錄制較好的同步性。每個(gè)手機(jī)采集了24段語(yǔ)音,對(duì)每段語(yǔ)音取中間固定的長(zhǎng)度進(jìn)行分割,將每段語(yǔ)音分割成5 s的語(yǔ)音片段,每個(gè)手機(jī)得到1 200個(gè)語(yǔ)音樣本,作為原始語(yǔ)音庫(kù)。對(duì)原始語(yǔ)音進(jìn)行靜音段估計(jì)提取,得到靜音段數(shù)據(jù)庫(kù)。由于靜音段語(yǔ)音長(zhǎng)度不一致。為了保證在構(gòu)建特征空間時(shí)特征矩陣長(zhǎng)度保持一致,選取每個(gè)型號(hào)手機(jī)240個(gè)語(yǔ)音幀數(shù)大于40幀的靜音段語(yǔ)音,組成求取本底噪聲頻譜分布特征的測(cè)試語(yǔ)音庫(kù)。對(duì)測(cè)試語(yǔ)音庫(kù)中所有語(yǔ)音進(jìn)行通用背景噪聲模型訓(xùn)練,然后采用改進(jìn)的譜減法得到估計(jì)本底噪聲的語(yǔ)音庫(kù)。構(gòu)造特征空間時(shí),取每段語(yǔ)音的前40幀本底噪聲頻譜分布特征的平均值。此處幀長(zhǎng)為64 ms,幀移為32 ms。按照第3.2節(jié)所述,進(jìn)行基于本底噪聲的頻譜分布特征的手機(jī)設(shè)備來(lái)源識(shí)別實(shí)驗(yàn)。

4.2 實(shí)驗(yàn)結(jié)果與分析

引入平均識(shí)別準(zhǔn)確率Accuracy和召回率Recal作為客觀指標(biāo)評(píng)價(jià)分類特征的識(shí)別性能,如式(4)、式(5)所示:

其中,TP為正樣本預(yù)測(cè)為正樣本的個(gè)數(shù),TN為負(fù)樣本預(yù)測(cè)為負(fù)樣本的數(shù)目,F(xiàn)N為正樣本預(yù)測(cè)為負(fù)樣本的數(shù)目,P為正樣本實(shí)際數(shù),N為負(fù)樣本實(shí)際數(shù),P=TP+FN,式(5)可表示為Recall=TP/P。在實(shí)驗(yàn)中,24類手機(jī)來(lái)源識(shí)別的平均召回率為((TP1+TP2+,…,+TP24)/P)/24=(TP1+TP2+,…,+TP24)/ 24P,由于(TP1+TP2+,…,+TP24)=TP+TN,24P=P+N,則平均召回率即平均識(shí)別準(zhǔn)確率。

表2給出了降維后特征為28維、參數(shù)C和γ分別為30和0.001時(shí),24個(gè)手機(jī)的識(shí)別結(jié)果,從中可算得平均識(shí)別準(zhǔn)確率為99.24%,算法可以較好地完成24個(gè)手機(jī)的分類識(shí)別,iPhone 6識(shí)別率為91.67%,其主要誤判來(lái)自品牌類內(nèi)區(qū)分,將之誤判為iPhone 4s和iPhone 5s。除iPhone 6以外,其他手機(jī)都有較高的識(shí)別準(zhǔn)確率,其中有18個(gè)手機(jī)的識(shí)別率達(dá)到100%,三星、OPPO、魅族等品牌可以做到無(wú)差錯(cuò)分類。

4.3 系統(tǒng)升級(jí)后實(shí)驗(yàn)結(jié)果與分析

對(duì)3臺(tái)操作系統(tǒng)升級(jí)后的手機(jī)按第 4.1節(jié)的實(shí)驗(yàn)設(shè)置進(jìn)行語(yǔ)音錄制和語(yǔ)音處理,每個(gè)手機(jī)得到1 200個(gè)語(yǔ)音樣本,將其作為原始語(yǔ)音。對(duì)原始語(yǔ)音按照試驗(yàn)設(shè)置進(jìn)行后續(xù)操作,每個(gè)設(shè)備取100個(gè)幀長(zhǎng)大于40幀的估計(jì)本底噪聲的語(yǔ)音片段構(gòu)成測(cè)試語(yǔ)音庫(kù),對(duì)該測(cè)試語(yǔ)音庫(kù)中的語(yǔ)音樣本進(jìn)行頻譜分布特征提取,然后以升級(jí)后的測(cè)試樣本代替升級(jí)前3臺(tái)手機(jī)的測(cè)試樣本,以每個(gè)設(shè)備100個(gè)測(cè)試樣本在系統(tǒng)升級(jí)前的24臺(tái)設(shè)備的訓(xùn)練模型上進(jìn)行檢測(cè)。

表2 本底噪聲頻譜分布特征的識(shí)別率

表3是HTC D610t、iPhone 5和Mi 4操作系統(tǒng)升級(jí)后的識(shí)別結(jié)果(實(shí)驗(yàn)中特征為28維、參數(shù)C和γ分別為 30和0.001),平均識(shí)別率為98.04%。從表3中可以看出, HTC D610t、iPhone 5和Mi 4這3臺(tái)設(shè)備的識(shí)別準(zhǔn)確率依次是97%、97%和99%。因此可以得出,手機(jī)操作系統(tǒng)版本的升級(jí)對(duì)手機(jī)本底噪聲的影響較小,實(shí)驗(yàn)結(jié)果也驗(yàn)證了第 2.2節(jié)中圖 2和圖 4對(duì)應(yīng) HTC D610t、iPhone 5和Mi 4手機(jī)系統(tǒng)升級(jí)前后本底噪聲語(yǔ)譜沒(méi)有明顯變化的結(jié)論。

4.4 Hanilci[6]實(shí)驗(yàn)結(jié)果與分析

為了綜合評(píng)價(jià)所提出的方法,對(duì)參考文獻(xiàn)[6]中提出的基于MFCC特征的手機(jī)來(lái)源識(shí)別算法在原始語(yǔ)音數(shù)據(jù)庫(kù)上進(jìn)行了測(cè)試。訓(xùn)練和測(cè)試樣本數(shù)目與實(shí)驗(yàn)所用數(shù)目一致。在該工作中將 12維的 MFCC特征和基于幀間的MFCC一階差分系數(shù)36維作為區(qū)分特征。對(duì)特征沿時(shí)間軸做平均,每個(gè)樣本得到48維的特征。表4為實(shí)驗(yàn)結(jié)果,SVM中的參數(shù)C和γ分別為7和0.004。

從表4可知,與本文所提特征相比,部分手機(jī)的識(shí)別準(zhǔn)確率嚴(yán)重下降,如HTC D820t、iPhone 4s、魅族Meilan Note、紅米Note 2、OPPO find 7、三星Galaxy Note 2等,尤其是HTC D610t識(shí)別率已經(jīng)降到50%。不過(guò)24臺(tái)設(shè)備中有15臺(tái)的識(shí)別正確率超過(guò)90%,平均識(shí)別率為88.23%。本文所提方法的平均識(shí)別率優(yōu)于Hanilci所提算法,其原因是本文所提取的本底噪聲是手機(jī)本身的特征,而Hanilci所提特征是基于語(yǔ)音信號(hào)的,所含的說(shuō)話人信息可能對(duì)分類產(chǎn)生干擾。

表3 操作系統(tǒng)版本升級(jí)后本底噪聲頻譜分布特征識(shí)別率

從上述實(shí)驗(yàn)結(jié)果分析,手機(jī)的本底噪聲可以作為手機(jī)的“指紋”很好地進(jìn)行手機(jī)來(lái)源識(shí)別。在手機(jī)來(lái)源識(shí)別的語(yǔ)音取證領(lǐng)域,手機(jī)的本底噪聲特征是一個(gè)具有區(qū)分性的特征。

5 結(jié)束語(yǔ)

本文提出了一種新的手機(jī)來(lái)源識(shí)別方法,將本底噪聲作為手機(jī)的“指紋”進(jìn)行手機(jī)來(lái)源識(shí)別。由于本底噪聲主要取決于手機(jī)本身的電路設(shè)計(jì)和電子元器件的不同,因此以本底噪聲作為手機(jī)來(lái)源識(shí)別的區(qū)分特征是可行的。實(shí)驗(yàn)結(jié)果驗(yàn)證了所提出的本底噪聲可以作為手機(jī)來(lái)源識(shí)別的特征。而且,較MFCC特征,基于本底噪聲頻譜分布特征的分類識(shí)別效果更好。

然而,本文的方法是應(yīng)用本底噪聲做手機(jī)來(lái)源識(shí)別的初步研究,仍有許多局限性。如估計(jì)本底噪聲的步驟是:先通過(guò)錄音自適應(yīng)端點(diǎn)檢測(cè)處理得到靜音段,然后利用改進(jìn)的譜減法減去背景噪聲得到的。所以,能否準(zhǔn)確地估計(jì)本底噪聲,背景噪聲很關(guān)鍵。在實(shí)際情況中,不同錄音環(huán)境的背景噪聲是不同的,會(huì)影響本底噪聲估計(jì)的準(zhǔn)確性。因此,本底噪聲的估計(jì)是一項(xiàng)具有挑戰(zhàn)性的工作。而綜合基準(zhǔn)數(shù)據(jù)庫(kù)的建立是一項(xiàng)費(fèi)力的工作,將之作為長(zhǎng)遠(yuǎn)目標(biāo)堅(jiān)定地研究下去。

[1]楊銳,駱偉祺,黃繼武.多媒體取證[J].中國(guó)科學(xué):信息科學(xué), 2013,43(12):1654-1672. YANG R,LUO W Q,HUANG J W.Multimedia forensics[J]. Science China:Information Science,2013,43(12):1654-1672.

[2]GUPTA S,CHO S,KUO C,et al.Current developments and future trends in audio authentication [J].IEEE Multimedia, 2012,19(1):50-59.

表4 Hanilci特征的識(shí)別率

[3]BAO Y,LIANG R.Research progress on key technologies of audio forensics[J].Journal of Data Acquisition&Processing, 2016,31(2):252-259.

[4]王昌海,張建忠,徐敬東,等.基于 HMM的動(dòng)作識(shí)別結(jié)果可信度計(jì)算方法[J].通信學(xué)報(bào),2016,37(5):143-151. WANG C H,ZHANG J Z,XU J D,et al.Identifying the confidence level of activity recognition via HMM[J].Journal on Communications,2016,37(5):143-151.

[5]賀前華,王志鋒,RUDNICKYA I,等.基于改進(jìn)PNCC特征和兩步區(qū)分性訓(xùn)練的錄音設(shè)備識(shí)別方法 [J].電子學(xué)報(bào),2014, 42(1):191-198. HE Q H,WANG Z F,RUDNICKYA I,et al.A recording device identification algorithm based on improved PNCC feature and two-step discriminative training[J].Acta Electronica Sinica, 2014,42(1):191-198.

[6]HANILCI C,ERTAS F,ERTAS T,et al.Recognition of brand and models of cell-phones from recorded speech signals[J]. IEEE Transactions on Information Forensics&Security,2012,7(2): 625-634.

[7]HANILCI C,CEMAL I,ERTAS F.Optimizing acoustic features for source cell-phone recognition using speech signals[C]//ACM Workshop on Information Hiding and Multimedia Security,June 20-22,2013,Montpellier,France.New York:ACM Press,2013: 141-148.

[8]JAHANIRAD M,WAHAB A W A,ANUAR N B,et al.Blind source mobile device identification based on recorded call[J].Engineering Applications of Artificial Intelligence,2014(36):320-331.

[9]PANAGAKISY,KOTROPOULOSC.Automatictelephone handsetidentification by sparse representation ofrandom spectral features[C]//MM&Sec’12,September 6-7,2012,Coventry, UK.New York:ACM Press,2012:91-96.

[10]PANAGAKIS Y,KOTROPOULOS C.Telephone handset identification by feature selection and sparserepresentations[C]// IEEE International Workshop on Information Forensics and Security,December 2-5,2012,Costa,CA,USA.New Jersey: IEEE Press,2012:73-78.

[11]KOTROPOULOS C L.Source phone identification using sketches of features[J].Biometrics IET,2014,3(2):75-83.

[12]王志鋒,賀前華,李艷雄.錄音設(shè)備的建模和識(shí)別算法[J].信號(hào)處理,2013(4):419-428. WANG Z F,H Q H,LI Y X.A modeling and identification algorithm of recording devices[J].Journal of Signal Processing, 2013(4):419-428.

[13]鄒領(lǐng),賀前華,鄺細(xì)超,等.基于設(shè)備噪聲估計(jì)的錄音設(shè)備源識(shí)別[J].吉林大學(xué)學(xué)報(bào)(工學(xué)版),2016:1-8. ZOU L,HE Q H,KUANG X C,et al.Source recording device recognition based on device noise estimation[J].Journal of Jilin University(Engineering and Technology Edition),2016:1-8.

[14]AGGARWAL R,SINGH S,ROUL A K,et al.Cellphone identification using noise estimates from recorded audio[C]// IEEE International Conference on Communications and Signal Processing (ICCSP),April 3-5,2013,Melmaruvathur,India. New Jersey:IEEE Press,2014:1218-1222.

[15]ZHAO H,MALIK H.Audio recording location identification using acoustic environment signature[J].IEEE Transactions on Information Forensics&Security,2013,8(11):1746-1759.

[16]LUKAS J,FRIDRICH J,GOLJAN M.Digitalcamera identification from sensor pattern noise[J].IEEE Transactions on Information Forensics&Security,2006,1(2):205-214.

[17]KINNUNEN T,RAJAN P.A practical,self-adaptive voice activity detector for speaker verification with noisy telephone and microphone data [C]//IEEE International Conference on Acoustics,Speech and Signal Processing(ICASSP),May 26-30, 2013,Vancouver,BC,Canada.New Jersey:IEEE Press,2013: 7229-7233.

[18]MALHI A,GAO R X.PCA-based feature selection scheme for machine defect classification [J].IEEE Transactions on Instrumentation and Measurement,2004,53(6):1517-1525.

[19]LU Y,COHEN I,ZHOU X S,et al.Feature selection using principal feature analysis [C]//The 15th ACM International Conference on Multimedia,September 27-29,2007,Baltimore, MD,USA.New York:ACM Press,2007:301-304.

Cell-phone origin identification based on spectral features of device self-noise

PEI Anshan,WANG Rangding,YAN Diqun
Ningbo University,Ningbo 315211,China

With the widespread availability of cell-phone recording devices and the availability of various powerful and easy-to-use digital media editing software,source cell-phone identification has become a hot topic in multimedia forensics.A novel cell-phone identification method was proposed based on the recorded speech.Firstly,device self-noise(DSN)was considered as the fingerprint of the cell-phone and estimated from the silent segments of the speech.Then,the mean of the noise’s spectrum was extracted as the identification.Principal components analysis (PCA)was applied to reduce the feature dimension.Support vector machine(SVM)was adopted as the classifier to determine the source of the detecting speech.Twenty-four popular models of the cell-phones were evaluated in the experiment.The experimental results show that the average identification accuracy and recall of the method can reach up to 99.24%and demonstrate that the self-noise feature has more superior performance than the MFCC feature.

multimedia forensics,cell-phone origin identification,self-noise,spectral feature

TP391

A

10.11959/j.issn.1000-0801.2017019

裴安山(1992-),男,寧波大學(xué)信息科學(xué)與工程學(xué)院碩士生,主要研究方向?yàn)槎嗝襟w通信、信息安全、移動(dòng)終端來(lái)源檢測(cè)等。

王讓定(1962-),男,博士,寧波大學(xué)高等技術(shù)研究院教授,主要研究方向?yàn)槎嗝襟w通信與取證、信息隱藏與隱寫分析、智能抄表及傳感網(wǎng)絡(luò)技術(shù)等。

嚴(yán)迪群(1979-),男,博士,寧波大學(xué)信息科學(xué)與工程學(xué)院副教授,主要研究方向?yàn)槎嗝襟w通信、信息安全、基于深度學(xué)習(xí)的數(shù)字語(yǔ)音取證等。

2016-12-11;

2017-01-10

王讓定,wangrangding@nbu.edu.cn

國(guó)家自然科學(xué)基金資助項(xiàng)目(No.61672302,No.61300055);浙江省自然科學(xué)基金資助項(xiàng)目(No.LZ15F020002,No.LY17F020010);寧波大學(xué)科研基金資助項(xiàng)目(No.XKXL1405,No.XKXL1420,No.XKXL1509,No.XKXL1503);寧波大學(xué)科研創(chuàng)新基金資助項(xiàng)目(No.G16079);寧波大學(xué)王寬誠(chéng)幸?;鹳Y助項(xiàng)目

Foundation Items:The National Natural Science Foundation of China (No.61672302,No.61300055),Natural Science Foundation of Zhejiang Province of China (No.LZ15F020002,No.LY17F020010),Scientific Research Foundation of Ningbo University(No.XKXL1405,No.XKXL1420, No.XKXL1509,No.XKXL1503),Scientific Research Foundation of Graduate School of Ningbo University(No.G16079),K.C.Wong Magna Fund in Ningbo University

猜你喜歡
語(yǔ)譜背景噪聲靜音
圖說(shuō)
窄帶電力線通信信道背景噪聲抑制方法
靜音輪胎、靜音輪胎的質(zhì)量控制方法及控制系統(tǒng)
橡膠科技(2022年11期)2022-03-01 22:55:23
瀝青路面降噪原理及其靜音化設(shè)計(jì)
石油瀝青(2021年3期)2021-08-05 07:41:08
HR-DCGAN方法的帕金森聲紋樣本擴(kuò)充及識(shí)別研究
基于時(shí)頻域特征的場(chǎng)景音頻研究
應(yīng)用背景噪聲成像研究祁連山地區(qū)地殼S波速度結(jié)構(gòu)
地震研究(2017年3期)2017-11-06 23:38:05
語(yǔ)譜圖二次傅里葉變換特定人二字漢語(yǔ)詞匯識(shí)別
為靜音超市點(diǎn)贊
海上單道地震勘探中船舶等背景噪聲的影響分析及壓制
肥西县| 建阳市| 兴业县| 青神县| 新兴县| 台南县| 榕江县| 即墨市| 敦煌市| 江门市| 米林县| 抚顺市| 蒲江县| 沽源县| 武义县| 东明县| 潮州市| 湘乡市| 衡南县| 钦州市| 海南省| 阳西县| 芜湖县| 深泽县| 茶陵县| 乌拉特后旗| 双辽市| 合江县| 汪清县| 志丹县| 依安县| 涟源市| 兴城市| 易门县| 灯塔市| 田林县| 吴堡县| 谢通门县| 尉犁县| 三都| 达拉特旗|