張艷玲, 王允鋒
(1.西安工業(yè)大學 電子信息工程學院, 陜西 西安 710032;2.西安旭泰電氣技術有限公司, 陜西 西安 710054)
基于混沌和離散余弦變換的語音信號隱藏算法
張艷玲1, 王允鋒2
(1.西安工業(yè)大學 電子信息工程學院, 陜西 西安 710032;2.西安旭泰電氣技術有限公司, 陜西 西安 710054)
設計一種基于混沌和離散余弦變換的語音信號隱藏算法。用混沌序列產(chǎn)生隨機的整數(shù)序列對秘密語音信號的采樣點進行加密,再對載體語音信號進行分段離散余弦變換,將加密后的秘密語音信號嵌入到隨機選取的載體中頻系數(shù)中,且使秘密語音信號嵌入過程中段內(nèi)系數(shù)的變化值適應于系數(shù)本身大小,以協(xié)調(diào)隱蔽性與魯棒性。利用兩段語音信號所進行的隱藏仿真實驗表明,所給算法可行,對噪聲攻擊具有魯棒性。
混沌序列;離散余弦變換;語音信號;中頻;隱藏
網(wǎng)絡的開放性影響著語音通信的安全性[1]。語音信息隱藏所使用的載體主要是圖像和視頻文件,以語音,特別是低速率語音作為載體的研究并不多見[2]。以語音為隱藏載體,主要是利用人類聽覺器官對語音信號的感覺冗余,將被傳輸數(shù)據(jù)嵌入某種公開的語音載體[3]。
基于變換域的信息隱藏比時間域的信息隱藏方法有較大的嵌入量及較強的魯棒性。選擇DCT中的高頻系數(shù),可通過量化秘密的音頻信息將其嵌入到捕獲的原始語音中[4],但抗濾波能力較差。采用壓縮感知技術可將隱秘語音壓縮至最低可懂度,再采用DCT幅度調(diào)制方法嵌入秘密語音[5]。載體信號的保密性是信息隱藏的必要條件,而整個系統(tǒng)的安全性主要依賴于隱藏密鑰[6]。
本文擬根據(jù)DCT域系數(shù)的特點,利用人耳對語音信號的中頻不敏感特性,將秘密語音信號嵌入到載體語音信號的中頻系數(shù)中,并通過混沌序列的隨機性對秘密語音信號進行預處理,在最低運算成本下增加信息隱藏的密鑰空間,從整體上提高算法的隱蔽性和安全性。在嵌入過程中同時考慮使段內(nèi)系數(shù)的變化值適應于系數(shù)本身大小,以提高算法的魯棒性。
1.1 秘密語音信號的預處理
為了能對秘密語音信號進行更可靠的秘密傳輸,需要在嵌入公共載體之前進行一些相應處理。
混沌序列對初始條件具有極端敏感性,被廣泛應用于保密通信,不過,大多數(shù)應用混沌序列的保密通信, 進行的都是實數(shù)運算,存在著運算速度慢的問題,這無疑限制了其在密碼通信方面的工程應用[7]。
現(xiàn)采用混沌序列的位置信息對秘密語音信號進行預處理,如此不僅可以提高混沌運算速度,還可增強秘密傳輸?shù)目煽啃浴?/p>
混沌序列具有良好的隨機性[8],Logistic映射雖是一類非常簡單的一維混沌系統(tǒng),但它能產(chǎn)生復雜的運動軌跡。Logistic映射可以描述為
xn+1=μxn(1-xn),
其中μ為分支參數(shù),其取值范圍在0到4之間,變量xn的取值在0到1之間。當μ≥3.57時,Logistic系統(tǒng)的軌跡處于混沌狀態(tài)。
將秘密語音信號表示為
M={mi:i=1,2,…,L},
其中mi為秘密語音信號的樣值,L為秘密語音信號的長度。產(chǎn)生的混沌序列長度也選為L。
設在初值μ和x0的條件下產(chǎn)生的長度為L混沌序列為
X={xn:n=1,2,…,L},
將混沌序列轉(zhuǎn)存為二維矩陣
對矩陣Y的第2行數(shù)據(jù),即對混沌序列進行排序,則其相應的位置信息也被打亂變得隨機,得到
其中xi1≤xi2≤…≤xiL。根據(jù)重新排序后的位置信息,對秘密語音信號進行加密,可得
Xs={mij:j=1,2,…,L}。
1.2 載體音頻信號的預處理
對載體語音信號進行分段,并逐段進行DCT變換,選出適合隱藏信息的DCT系數(shù)。
(1) 載體語音信號的分段
設長度為N的載體語音信號為
Z={zi:i=1,2,…,L1},
將其劃分為長度相等互不重疊的小段。考慮到人耳對頻域的掩蔽現(xiàn)象,每段長度應小于20ms,若段長選為L2,則分段后的載體語音信號可表示為
S={si,j:i=1,2,…,K;j=1,2,…,L2},
其中K為分段個數(shù),L2也表示每段的采樣點數(shù)。
(2) 分段載體語音信號的DCT
通過離散余弦變換,分別可得第i段離散余弦變換的直流系數(shù)
和第i段第u個離散余弦變換的交流系數(shù)
其中u=1,2,…,L2,是廣義頻率變量。
從能量角度分析,語音信號的大部分能量都集中于低頻,因此隱藏信息嵌入一般選在離散余弦變換的中高頻系數(shù)上,這樣,語音信號才可以遮蓋隱藏信息,使其不易被發(fā)現(xiàn)[9]。
信號在一般的處理操作(如濾波,壓縮,變換等)后,影響比較大的是信號的高頻部分,所以將隱藏信息嵌入點選在中頻系數(shù)上是可行的?;謴统鰜淼囊纛l信號在受到一定程度破壞后,只要音頻信號有一定的可懂度,便可以實現(xiàn)秘密傳輸。
2.1 秘密語音信號的嵌入
將載體語音信號的中頻系數(shù)用秘密音頻信號的數(shù)據(jù)來代替,其中秘密語音信號均指預處理后的秘密語音信號,主要的嵌入過程可以描述如下。
步驟1 選擇嵌入載體語音的中頻系數(shù)的起始點和每段的嵌入個數(shù),設選擇嵌入的起始點為第K1點,嵌入秘密語音信息的個數(shù)為L3。
步驟3 選擇開始嵌入的載體段Kb,開始嵌入的秘密語音信號為第1段的采樣點。
步驟4 將載體語音信息中該段的第K1點到第K1+K3-1點依次用秘密語音信號中對應段的采樣點代替。
步驟5 載體語音信號和秘密語音信號均向后移一段,判斷秘密音頻信號是否嵌完,若是,則返回步驟6,若否,則返回步驟4。
步驟6 將混合載體語音信號進行IDCT。
步驟7 將分段的混合載體語音信號再重構成一維時間信號Z′。
通過以上7個步驟,將秘密語音信號嵌入載體語音信號,此時再傳輸混合載體語音信號,秘密語音信號將被一同傳送出去而不被人所覺察。
2.2 秘密語音信號的提取
在提取秘密語音信號前,先對混合載體語音信號Z′進行預處理,即對混合語音信號分段,每段的采樣點個數(shù)仍然選L2,對每個音頻段進行DCT,得到對應的DCT段。
從混合載體音頻信號的第Kb段開始逐段向后移,取出其第K1點到第K1+L3-1點系數(shù),共取K2段,之后將所取系數(shù)乘以N,作為秘密音頻信號被混沌加密后的采樣值,再用加密的混沌序列將秘密語音信號還原,即可得到秘密語音信號。
提取秘密語音信號時不需要原始載體語音信號,故可實現(xiàn)秘密語音信號的盲提取。
3.1 隱蔽性實驗
實驗采用長度為20 s, 采樣頻率為 8 kHz, 分辨率為16 bit 的一段單聲道語音信號作為載體語音信號。 采用長度為1 s, 采樣頻率為 8 kHz, 分辨率為16 bit 的一段單聲道語音信號作為秘密語音信號。段長L2=32 ,混沌序列的長度為8 000, 并取
x0=0.250 1, μ=3.94,
初始嵌入段為520,每段嵌入點數(shù)為第10點到第19點。實驗結果如圖1所示。
實驗結果顯示,采用本算法在語音信號中嵌入秘密語音信號,對原始語音信號的改變很小,再結合人類聽覺系統(tǒng)的頻域掩蔽效應,這種改變是人耳很難感知到的。通過試聽,嵌入秘密語音信號后的混合載體與原始載體幾乎沒有什么差別,達到了信息隱藏的隱蔽性要求。
(a) 秘密語音信號
(b) 混沌加密后的秘密語音信號
(c) 載體語音信號
(d) 混合載體語音信號
(e) 最終提取的秘密語音信號
3.2 魯棒性實驗
通過主觀和客觀兩方面進行魯棒性分析,主觀評價主要通過試聽來分析,客觀評價指標采用信噪比
其中M(i)為原始秘密語音信號,M′(i)為提取的秘密語音信號。
對混合載體語音信號進行加噪攻擊。分別將產(chǎn)生的具有正態(tài)分布的偽隨機噪聲序列的幅度降低到N1倍后疊加到混合載體語音信號中,實驗仿真結果如表1所示。
表1 仿真結果
仿真結果顯示,隨著攻擊噪聲強度的不斷增強,即N1的值不斷增大,信噪比RSN也隨之降低, 語音信號的聽覺效果也越來越差。當N1=0.01時,信噪比RSN能達到53.84 dB,在聽覺效果上,語音信號也沒有多大的影響。當N1=0.1時,信噪比RSN能達到8.077 dB,雖然能夠聽見較明顯的噪聲,但還是可以分辨出語音信息??梢姡o算法對噪聲具有一定魯棒性。
根據(jù)人耳對語音信號中頻信號不敏感的特性,設計出一種結合混沌和DCT的語音信號隱藏算法。利用語音信號進行DCT后能量比較集中的特點,借用混沌序列將秘密語音信號預先加密,在加密的過程中,使用的密鑰具有很大的隨機性,且密鑰空間很大。再將預加密信號嵌入載體語音信號的DCT中頻系數(shù)中即可。實驗及仿真結果表明,所給算法具有較好的隱蔽性和魯棒性。
[1] 葛秀梅,仲偉波,李忠梅.基于DSP的混沌語音加密解密系統(tǒng)[J].實驗室研究與探索,2014,33(9):137-140.
[2] 丁然,王佳偉,馬青玉. 基于DSP 的混沌語音加密[J]. 南京師范大學學報:自然科學版,2014,37(4):59-65.
[3] 嚴亞俊,梁猛,陸蓉,等.一種基于離散余弦變換的數(shù)字水印算法[J].西安郵電大學學報,2013,18(5):41-44.
[4] 王昌達,馬登峰.基于DCT域?qū)崟r語音的信息隱藏方法[J]. 計算機工程與設計,2012,33(2):474-478.
[5] 周云霞,曹冬建,周靖凱,等.基于壓縮感知的語音信息隱藏模型的實現(xiàn)[J].聲學技術,2013,32(4):285-287.
[6] 孫景民.信息安全技術分析與探討[J]. 信息安全與技術,2013(6):5-7.
[7] 呂建平,劉齊.基于混沌理論和量化方法的雙功能水印算法[J].西安郵電大學學報,2014,19(3):54-57.
[8] 李昂,常青.一種高安全性的復合混沌序列的性能研究[J].太赫茲科學與電子信息學報,2014,12(3):362-267.
[9] Wang Hongxia,F(xiàn)an Mingquan. Centroid-based semi-fra-gile audio watermarking in hybrid domain[J]. Science China Information Sciences, 2010,53(3):619-633.
[責任編輯:瑞金]
A speech signal hiding algorithm based on chaos theory and discrete cosine transform
ZHANG Yanling1, WANG Yunfeng2
(1.Electronic Information Engineering College, Xi’an University of Technology, Xi’an 710032, China; 2.Xi’an Xutai Electrical Technology Co., Ltd., Xi’an 710054, China)
A speech signal hiding algorithm based on chaos theory and discrete cosine transform is designed. Use the random integer sequence generated by a chaotic sequence to encrypt the secret speech signal, segment and transfer the carrier speech signal by DCT, embed the encrypted secret speech signal into the random selection intermediate frequency coefficients of the carrier speech signal, coordinate the concealment and robustness by adapting the variation of the coefficients of segment to the coefficients itself, while the secret speech signal is embedded. Simulation experiments are carried out on two segments of a speech signal, and the results show that the proposed algorithm is feasible and has robustness to noise attack.
chaos sequence, discrete cosine transform(DCT), speech signal, intermediate frequency, hidden
2015-06-15
陜西省教育廳科學研究計劃資助項目(14JK1355);西安市科技計劃資助項目(CXY1442-1)
張艷玲(1980-),女,碩士,講師,從事信息處理與信息安全研究。E-mail:zylyanling@sohu.com 王允鋒(1978-),男,碩士,工程師,從事信息管理研究。E-mail:38534158@qq.com
10.13682/j.issn.2095-6533.2015.05.009
TP391
A
2095-6533(2015)05-0048-04