高 楊
(陜西國防工業(yè)職業(yè)技術(shù)學(xué)院,陜西西安,710300)
目前隨著電子產(chǎn)品的流通,音頻和視頻文件獲取的方式越來越簡單,雖然這能夠滿足許多用戶下載的需求,但是這種方式大大損壞了出版商和作者的利益,這對他們都是不公平的,本文以保護出版商和作者的利益為前提。以MP3 音頻為例,解決方法是在數(shù)字音頻中加入數(shù)字水印,這樣如果有用戶想訪問或下載數(shù)字資料,就必須獲取密碼或者安全秘鑰,否則將無法訪問和下載;或者下載的都是一些無意義的亂碼,這就是數(shù)字水印存在的意義。本文涉及的音頻水印屬于數(shù)字水印的一個分支,出現(xiàn)時間比較晚,比較先進,也比數(shù)字圖像水印難度系數(shù)高。此研究就圍繞MP3 音頻數(shù)字水印展開,旨在保障質(zhì)量的前提下,加入水印,以保證出版商和作者的權(quán)利,避免盜版的出現(xiàn)。
目前許多相關(guān)的行業(yè)都在使用數(shù)字音頻水印技術(shù),它的作用有:保護出版商和作者的利益,可以監(jiān)控音頻的廣播,如果存在盜版交易,可以對交易進行歷史追溯,可以判斷此音頻是正版還是盜版,還有就是可以保障音頻的原始性。
現(xiàn)在人們越來越重視保護數(shù)字產(chǎn)品的隱私了,所以音頻水印日趨流行。音頻水印的起源可以追溯到1990 年,當(dāng)時音頻水印技術(shù)一出現(xiàn),立馬受到業(yè)界人士的追捧?,F(xiàn)在科技日益發(fā)達,早期的音頻水印和現(xiàn)在的音頻水印根本不可同日而語,而且現(xiàn)在音頻水印技術(shù)的應(yīng)用也是很先進和流行的。
音頻數(shù)字水印簡單解釋就是給音頻做記號或者進行加密處理,這樣就能在一定程度上保護作者的權(quán)益,同時保持產(chǎn)品的原始性。當(dāng)然,經(jīng)過音頻水印處理過的電子產(chǎn)品,是不會影響其質(zhì)量的,這主要抓住了人類的聽覺系統(tǒng)的某些盲區(qū)。但是國內(nèi)外的專家們對水印的認(rèn)識程度和側(cè)重點都是不同的,所以對水印的釋義也存在差別。但是學(xué)者們對水印的分解還是比較統(tǒng)一的,系列水印的完成需要經(jīng)過三個程序,第一個就是將水印合成,第二個就是將水印加入到需要保護的數(shù)字產(chǎn)品中,最后一步就是在需要的情況下,再將電子產(chǎn)品和水印進行分離。
在數(shù)字水印生產(chǎn)線上有兩個組成成分,其中一個是嵌入器,在這個部分存在的輸入量有兩個,分別是原始信息和數(shù)字產(chǎn)品;還有一個組成成分是檢測器。在對音頻做水印處理的時候,有幾個重點需要注重:①不能影響音頻的質(zhì)量:水印技術(shù)的存在目的是保護音頻不被盜版,但是也不能損害音頻的質(zhì)量,所以說經(jīng)過水印處理前后的音頻不能影響用戶的欣賞質(zhì)量。②水印的抗攻擊能力一定要強:目前市面上眾多不法之徒在利益的驅(qū)使下不擇手段,他們會利用某些手段人為的不合規(guī)矩的將水印和音頻分離,以達到盈利盜版的目的,所以說公司所使用的水印技術(shù)一定要強,避免被惡意分離。③危險系數(shù)要盡可能的低,主要是密碼的使用。④安全的被檢測,檢測程度要達到標(biāo)準(zhǔn)。⑤準(zhǔn)確率一定要高,要確保加入的信息是獨一無二不可復(fù)制的。⑥加入的步驟盡可能的繁瑣,繁瑣的加入步驟可以盡可能的保護數(shù)字產(chǎn)品的安全性。以上6 個方面是水印技術(shù)的出發(fā)點,任何類型的水印技術(shù)一定要符合以上要求,否則就沒有存在的必要。
數(shù)字水印是一個宏觀的比較大的概念,所以在它之下有許多的分支,依據(jù)不同,那么分支的各個線路也是不同的,下述是流傳比較廣的幾種分支線路:
1)如果以水印是否顯現(xiàn)為出發(fā)點,那么水印就是由顯現(xiàn)和不顯現(xiàn)組成。即顯而易見的水印的就是存在,不顯現(xiàn)就是觀察不到,前者對視覺畫面應(yīng)用的較多,后者的應(yīng)用要廣闊的多,視覺和聽覺文件都有涉獵。
2)還有一種分類方法是根據(jù)水印的抗攻擊能力劃分的,有強弱之分。
3)存在部位區(qū)分:加入到的位置不同,水印的類別也不同。
4)根據(jù)檢測方法不同分為盲水印,另一種是明文水印。
5)水印代表含義的劃分,得出的是有意義和無意義兩類,有意義表示此水印的表達內(nèi)容不是亂碼,是由特殊含義的,有代表內(nèi)容的;無意義就代表的是水印內(nèi)容根本就沒有任何的含義,只是隨機產(chǎn)生的亂碼。
還有兩種分類方法是根據(jù)處理對象和用處劃分的,數(shù)字產(chǎn)品涵蓋的種類比較廣泛,有多少種數(shù)字產(chǎn)品就會有多少種數(shù)字水印,還有就是水印存在的意義也是不同的,有的是從出版商的利益出發(fā),有的則會考慮作者的權(quán)益。
以前研究比較廣泛的數(shù)字水印技術(shù)中的時域音頻水印技術(shù),突破較大,目前為止它的反響都很大。
LSB:在時間域水印算法中,它的難度系數(shù)是最低的,又叫做最低有效位法,它有幾個比較明顯的特征就是:難度系數(shù)低,不難掌握,反應(yīng)靈敏,易于操作,信息量比較大,危險系數(shù)也比較低,不足之處就是,比較容易攻破,較容易被破壞。還有一種方法是回聲隱蔽法,考慮到聽覺系統(tǒng)的特點,將水印在音頻中隱形了。
目前科技越來越發(fā)達,水印技術(shù)也越來越先進,現(xiàn)在又新出現(xiàn)幾種比較流行的算法。比如說:離散傅里葉變換與算法、離散余弦變換域算法等,還有某些算法應(yīng)用的范圍是壓縮域。這主要是因為現(xiàn)在的數(shù)字產(chǎn)品為了盡可能的節(jié)省存在空間,一般情況下都會被壓縮處理,那么在壓縮的文件中加入水印就成為了一個研究趨勢。在這一領(lǐng)域內(nèi),壓縮文件的時候適時的加入記號水印,這樣兩者就不會互相排斥了,這種類型的算法有兩類。
第一種:在壓縮文件中加入水印,長處就是速度快,不足就是容易被攻擊。第二種是在解壓后的數(shù)字產(chǎn)品加入水印,然后再壓縮,這種方法的優(yōu)缺點也很明顯,長處就是不容易被攻擊擊破,不足就是耗時太久,效率低。
上述經(jīng)常會提到,音頻領(lǐng)域的攻擊行為,主要攻擊的手段有很多種,本文根據(jù)攻擊情況將攻擊分成了同步攻擊和普通攻擊。普通攻擊主要就是表現(xiàn)為被攻擊的音頻會出現(xiàn)雜音,但是普通攻擊不會對音頻的結(jié)構(gòu)產(chǎn)生影響,這類攻擊比較容易防御,大部分的算法能夠應(yīng)對此類攻擊。同步攻擊要比普通攻擊強得多,這類攻擊所帶來的危害也是比較大的,被同步攻擊“光顧”過的音頻主要表現(xiàn)為水印的結(jié)構(gòu)出現(xiàn)錯亂,同時在檢測的時候也不容易通過。這類攻擊的危害性很大,不容易防御,它主要包含的內(nèi)容為:重新拼接、出現(xiàn)亂碼、擴大或縮小處理、順序錯亂等。有攻擊方法就有防御措施,現(xiàn)在使用頻率較高的防御方式是:窮舉搜索、同步顯示、相關(guān)搜索、永久水印、隱形水印。對水印技術(shù)的評判也有特定的標(biāo)準(zhǔn),方法分為主觀和客觀的兩種。目前存在兩種可以鑒定被攻擊數(shù)字產(chǎn)品正確率的指標(biāo),分別是歸一化相關(guān)系數(shù)和誤比特率。
數(shù)字產(chǎn)品能夠加入的水印信息是有限度的,用水印容量表示為最大程度。提取水印是非常重要的一個步驟,這關(guān)系著音頻受攻擊的程度,也是判定音頻受損程度的一個指標(biāo)。主要有兩種方式判斷提取的水印是否正確,那就是漏警概率,還有一個是虛警概率。在數(shù)字領(lǐng)域內(nèi)虛警概率代表的就是音頻中不存在水印,但是系統(tǒng)卻顯示存在水印,那漏警概率就是音頻中有水印,系統(tǒng)卻表示不存在。
文件被壓縮后所占的空間就變小了,這種特質(zhì)導(dǎo)致MP3 的流行較廣,其最大的一個特點就是不會損害被壓縮的音頻。MP3 主要有以下幾種功能:自帶濾波器組、快速傅里葉轉(zhuǎn)換、修正離散余弦變換、心理聲學(xué)模型、量化信號、編碼和位流格式化等。編碼的逆過程就是解碼,即將壓縮的數(shù)據(jù)進行修復(fù)。主要會歷經(jīng)以下幾個過程:獲得幀邊和幀頭信息、編碼的重要資料、逆量化、霍夫曼解碼、處理立體聲、對數(shù)據(jù)進行再次排序避免將信息混亂、更改逆向離散余弦、反轉(zhuǎn)頻率和合成子帶。分析編碼器也是非常重要的一個環(huán)節(jié),方式主要包括,分析MDCT 模塊和量化模塊。
現(xiàn)在,MP3 的流行區(qū)域是非常廣的,所以也比較注重安全的保護。下面將詳述MP3 的基本情況,在MP3 中文件的格式是非常重要的,一般由frame、tag 等三部分構(gòu)成。這當(dāng)中包含的信息非常的全面,有作者、出版商、時間等的信息,根據(jù)需要會選擇性的加入。主要格式包括:ID3VI 格式、ID3V2 格式、MP3 幀格式。MP3 資料的存在形式就是幀,大小是可變的。幀由三個板塊構(gòu)成,分別是:幀邊信息、幀頭、還有就是數(shù)據(jù)。本研究主要是圍繞MP3展開的,重點針對解決水印的時間問題,并且明確了水印的處理需要在特定的條件下才能進行。首先需要提前對水印進行處理,這一般分為兩個步驟,第一步就是轉(zhuǎn)變格式,接下來就是加密處理,即設(shè)置密碼。在這個算法中有兩點需要著重注意的就是加入和分離水印。核心的水印技術(shù)問題已經(jīng)解決,還有一個大問題就是具體的操作顯示。本研究準(zhǔn)備了特制的軟件界面,這個界面是非常簡潔的,加入和分離部分屬于于上部分,音頻的測試功能就屬于下部分。這個系統(tǒng)是經(jīng)過多次試驗后選擇的系統(tǒng),系統(tǒng)整體的運行狀況良好,安全可行,比較容易理解,操作也很人性化、簡單,能夠滿足本文研究的需要。主要的步驟為:加入水印資料,選擇操作、輸入密碼、選擇格式、完成。
將以上的理論資料進行分析,分析方式有:測試水印的存在感知性、水印的抗攻擊能力、水印的最大容量上限還有就是系統(tǒng)的反應(yīng)靈敏性。在本章中解說了MP3 音頻文件的主要內(nèi)容,并仔細(xì)研究了音頻算式,創(chuàng)新的提出了特色的算式,還將算式進行了實踐模擬,最后利用各種測試驗證,以保證算式的準(zhǔn)確性和可用性。
通過上述分析得出,數(shù)字水印技術(shù)是一個非常龐大的體系,對各個領(lǐng)域都有涉獵,關(guān)聯(lián)到的學(xué)科非常多,比如:密碼設(shè)置、信號處理、資料和數(shù)據(jù)的存儲等。隨著科技和社會的發(fā)展,人們的需求會越來越具體化,對產(chǎn)品安全性的重視程度也越來越高。另外產(chǎn)品生產(chǎn)商和出版商是比較看重自身利益的,所以鉆研數(shù)字水印技術(shù)是非常有必要并且有前景的。其中MP3 音頻文件是數(shù)字產(chǎn)品中一個不可或缺的存在,它的特點使得其非常的受歡迎。譬如,MP3 音頻文件非常的小,只占用較少的空間,能夠滿足人們的需要。在本研究中已經(jīng)取得突破成果的內(nèi)容有:詳述了數(shù)字水印工藝,解析MP3 的編碼流程,創(chuàng)造了音頻水印的算式及完善了計算機的顯示頁面。目前,我國對MP3 的音頻的研究才剛剛開始,還遺留有很多成待解決的難題,這將是后期努力的主要方向。
[1] 鈕心忻,楊義先.基于小波變換的數(shù)字水印隱藏與檢測算法[J].計算機學(xué)報. 2000(01)
[2] 林福宗編著.多媒體技術(shù)基礎(chǔ)[M].清華大學(xué)出版社, 2000
[3] 蔣學(xué)鑫.MP3 實時編解碼系統(tǒng)的研究與開發(fā)[D].電子科技大學(xué) 2007
[4] 周建偉.基于小波變換的音頻水印技術(shù)研究[D].武漢理工大學(xué) 2007