王順業(yè) 杜彥輝 蘆天亮
摘 ?要: 目前基于智能家居的音視頻文件在文件傳輸過程中存在信息泄露等安全問題;此外,智能家居設備普遍受算力和帶寬限制。針對此背景,在網(wǎng)絡數(shù)據(jù)包傳輸理論的基礎上,提出一個音視頻文件安全傳輸?shù)姆椒?。該方法將音視頻文件的特征部分與數(shù)據(jù)部分進行切分,形成編碼的數(shù)據(jù)包序列,并對數(shù)據(jù)包按序列重新排序后傳輸,保證數(shù)據(jù)傳輸?shù)陌踩?。實驗結果表明,該方法傳輸效率高、算力代價低,能夠在受限的環(huán)境下實現(xiàn)音視頻文件的安全傳輸。
關鍵詞: 智能家居; 音視頻文件; 安全傳輸; 文件特征; 數(shù)據(jù)包編碼; 測試分析
中圖分類號: TN915?34 ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼: A ? ? ? ? ? ? ? ? ? ? ? 文章編號: 1004?373X(2020)12?0182?05
Abstract: At present, the audio and video files based on smart home have security problems such as information leakage during the file transmission, and the smart home equipments are generally limited by hashrate and bandwidth. Based on this background, a method of the secure transmission of audio and video files is proposed based on the theory of network packet transmission. In this method, the file signature part and the data part of the audio and video files are divided to form the encoded data?packet sequence. The data packets are reordered and transmitted to ensure the security of data transmission. The experimental results show that this method has high transmission efficiency and low hashrate cost, and can realize the secure transmission of audio and video files in a restricted environment.
Keywords: smart home; audio and video file; secure transmission; file signature; data packet coding; testing analysis
0 ?引 ?言
智能家居作為新興產(chǎn)業(yè)發(fā)展十分迅速,2012年以來,政府工作報告中多次提到智能家居,2017年智能家居市場突破3 000億元,據(jù)預測到2020年,智能家具市場將超過5 000億元。但智能家居安全仍處于發(fā)展初期,系統(tǒng)存在大量風險漏洞;另一方面,智能家居的網(wǎng)絡傳輸多以未加保護的方式進行,容易被攻擊竊聽導致信息泄露。智能家居的應用涉及影音娛樂、家庭智能監(jiān)控、廚衛(wèi)對講、寵物照看與動物管制、幼長關愛等方面,大量具有攝像頭的智能家居設備存在于互聯(lián)網(wǎng)中,這些設備數(shù)量眾多,在線時間長,但是安全防護較差。
具有攝像頭的智能家居設備在傳輸攝取到的音頻、視頻信息時,如果不加保護,容易被監(jiān)聽者截獲分析導致涉密視頻或音頻泄露。智能家居往往涉及到住宅安全、家庭信息安全,一旦攝取到的音視頻信息遭到竊聽,家庭內(nèi)部畫面、生活隱私、個人信息等都會被泄露,造成無法挽回的后果。因此,在智能家居音視頻文件傳輸過程中采用安全傳輸方法十分重要。
1 ?相關工作
現(xiàn)有保護傳輸內(nèi)容安全的傳輸方式大多基于隱蔽信道、隱寫術和文件加密傳輸三種方式,隱蔽信道的定義于1973年由LAMPSON[1]在ACM會議中提出,指在公開信道中建立一種違背系統(tǒng)安全原則的用于傳輸信息的信道,存儲型隱蔽信道通過增加或篡改網(wǎng)絡協(xié)議頭部字段等方式來傳輸隱蔽信息。例如,文獻[2?4]利用TCP協(xié)議、IP協(xié)議的數(shù)據(jù)包頭部字段傳輸隱蔽信息,但是由于協(xié)議字段的限制,傳輸?shù)男畔⒘糠浅S邢?,僅限于少量文本信息傳輸。文獻[5?7]利用視頻作為載體將秘密信息進行嵌入。文獻[8]將隱藏的容量提高到28.1%,但存儲的秘密信息越多,隱蔽性越差,在傳輸體積相對較大的音視頻文件時需要很大的載體,容易對傳輸路徑造成較大的負載。
加密方式分為非對稱加密和對稱加密,非對稱加密,如RSA安全性較高,但是只適用于少量信息加密,文件加密時使用非對稱加密有一定困難;常見對稱加密,如DES,AES,IDEA可適用于文件加密,但加密算法公開且容易遭到破解。加密算法往往導致計算復雜度大,傳輸效率低,智能家居設備算力較低,音視頻文件又相對較大,對整個文件進行加密時有一定的局限。綜上所述,現(xiàn)有隱蔽信道、隱寫術、加密方式應用在智能家居音視頻文件安全傳輸過程有一定局限性,無法很好完成智能家居環(huán)境下音視頻文件安全傳輸。
音視頻文件等較大文件傳輸?shù)倪^程中,不可避免要對文件進行分片,通過冗余分片可以使每個分片失去可讀性,并且可以在某些分片丟失時仍然能夠重組,增強了傳輸?shù)聂敯粜?,但會導致傳輸?shù)據(jù)量增多甚至翻倍。文獻[9]針對MPEG?4文件提出一種基于多媒體邏輯的冗余分片算法RAS,但是對算力要求較高,需大量占用CPU進行計算。文獻[10?11]采用信息分散算法(IDA)對文件進行冗余分片,IDA算法對每個分片進行數(shù)學運算,提升了容錯率,可以保證重要數(shù)據(jù)傳輸,但同樣對算力的要求較高,冗余的部分也增加了傳輸?shù)呢撦d。文獻[12]提出一種基于MQ的文件分片算法,降低了數(shù)據(jù)量并提高了容錯率,但使用該算法進行分片后,即使分片亂序,仍能實現(xiàn)正確重組,可是無法保證文件安全性。
本文提出一種適合智能家居環(huán)境的音視頻文件安全傳輸方法,在資源受限的條件下保證音視頻傳輸?shù)陌踩?。將文件的文件特征和?shù)據(jù)部分進行分離后,對文件特征信息進行編碼變換,在缺失文件特征的情況下,文件將失去可讀性,將文件特征嵌入到傳輸協(xié)議的頭部字段中,在海量數(shù)據(jù)報文的掩蓋下,某一條報文具有很強的隱蔽性。數(shù)據(jù)部分進行分片后,按照編碼序列對分片進行傳輸,按照正常傳輸?shù)闹亟M順序對文件進行重組將無法還原文件,可以防止文件在傳輸過程中遭到截獲并被還原。
2 ?智能家居環(huán)境音視頻文件安全傳輸模型
本節(jié)主要介紹傳輸模型的設計方法、原理以及模型實現(xiàn)。本文的主要目的是提出一種在智能家居設備環(huán)境下保護傳輸音視頻文件安全方法,能夠在不被獲知傳輸內(nèi)容的情況下,對智能家居設備采集的音視頻文件進行傳輸。安全傳輸模型的流程圖如圖1所示。
2.1 ?方法原理
文件特征(File Signature)通常體現(xiàn)在文件頭中,部分文件的文件尾部也包含一定的文件特征信息。文件頭通常是文件開頭的幾個字節(jié),用來標識文件的格式以便能夠正確接收識別,在分片后也會存在于第一個分片頭部,使分片具有可讀性,如圖2所示。部分文件中還會包含一些有關文件及內(nèi)容的數(shù)據(jù),比如文件的格式、大小、分辨率等信息。
根據(jù)文件格式將對應的文件特征信息與數(shù)據(jù)部分分離,文件的相關特征被抹除,剩下的數(shù)據(jù)部分不包含任何特別的特征信息,在不知情的情況下很難進行還原。文件特征信息分離后,將文件的數(shù)據(jù)部分進行分片處理,通常在傳輸過程中,為保證數(shù)據(jù)安全性,對文件進行計算后冗余分片。本文中由于在分片前對文件特征進行了消除,因此可以選擇順序切割的方法,對算力要求低,速度快,并且能夠保護文件不被還原,各種常見的分片方法比較如表1所示。
對文件進行特征消除和分片后進行傳輸,假設TCP協(xié)議中每條報文的最大傳輸容量為Lmax,傳輸文件的大小為Lfile。如果Lfile>Lmax,則文件分為n個小于Lmax的分片序列[{Ln}={L1,L2,…,Ln}]。通常情況下,傳輸?shù)捻樞驈牡谝粋€分片開始,對文件的每個分片依次傳輸。發(fā)送端向接收端發(fā)送一個報文,接收端收到TCP報文后將這個報文的ack作為seq填充,將seq和報文大小的和作為ack填充構造一個包發(fā)送給發(fā)送端,告知發(fā)送端已經(jīng)接收到這個報文,這樣依次進行傳輸直到最后一個分片傳輸結束,分片的順序可以通過TCP協(xié)議中的序列號來確認。
文中,在文件特征信息分離并將數(shù)據(jù)部分分片后,使用Fisher?Yates算法對{Ln}進行隨機排列得到{Rn},每一個元素出現(xiàn)在任何位置[Ri]的概率相等,利用隨機序列{Rn}生成編碼矩陣[G=R1R2...RnR1R2...RnR1R2...Rn]。A為3×3的隨機可逆系數(shù)矩陣,矩陣A滿足條件[?A[i,j]∈[1,9]]且[?A[i,j]∈Z+],將編碼矩陣與系數(shù)矩陣相乘生成新的編碼矩陣[G′=AR1R2...RnR1R2...RnR1R2...Rn],以矩陣A元按順序形成序列{An}。
實際傳輸過程按照{(diào)An}的順序進行傳輸,如圖3所示,同時將該序列作為本次傳輸?shù)某跏夹蛄刑枺↖nitial Sequence Number)。因為A是一個3×3的矩陣,因此可逆矩陣A元的順序與TCP協(xié)議中ISN特征格式相同,具有較強的隱蔽性。如果在不知情的情況下按照TCP協(xié)議規(guī)則對文件分片進行重組,會得到一個錯誤的分片順序,因而無法達到重組的目的。因為分離了文件特征信息,每一個分片都是不可讀的,也無法從分片內(nèi)容中分析傳輸序列。將編碼后的文件特征信息進行ROT18編碼,然后與轉換后的編碼矩陣填充到TCP報文中,作為單獨報文發(fā)送到指定端口。從第二個包開始,將{An}作為ISN進行填充,并按照對應序列將分片內(nèi)容填充到數(shù)據(jù)段,特征信息報文和數(shù)據(jù)分片報文的數(shù)據(jù)段同樣填充相同長度的payload加以混淆。接收端收到文件分片及序列順序后,檢驗是否缺失分片,如果不缺失分片則計算{Rn},得到每個分片的真實序號,與文件特征合并后完成重組,恢復文件。
2.2 ?模型實驗及驗證
模型的傳輸利用libnet進行實現(xiàn),在發(fā)送端對文件進行預處理和分片,然后將數(shù)據(jù)信息填充到TCP協(xié)議的各個部分,在接收端接收后計算校驗和并進行重組,發(fā)送端偽代碼算法如下:
Begin
1) 分離文件特征部分與數(shù)據(jù)部分,得到文件特征部分M與數(shù)據(jù)部分S;
2) 分割數(shù)據(jù)部分[f(S,L,s)=(S1,S2,…,Sn)]且[?Sn∈S:Sn≤Smax];
3) [M′=(ROT18(M))10] ; ? ? ? ? ? ? ? ?//對文件特征進行編碼
4) 定義[L=range(1,s+1),R=Fisher_Yates(L)];
5) 生成編碼矩陣[G=R1R2...RnR1R2...RnR1R2...Rn],A為隨機三階可逆系數(shù)矩陣,[G′=GA];
6) Send (Message): Payload=[G′], TCPseq=[M′]; TCP目的端口=指定端口;
7) For i=1 to i=s , TCPISN={An}
payload = Si ,Send (Message)i ;
End For
接收端接收到數(shù)據(jù)包后,對文件特征內(nèi)容進行解密,通過可逆系數(shù)矩陣還原出文件分片傳輸?shù)恼嬲蛄校⑹褂媚婧瘮?shù)對文件進行重組,相關偽代碼算法如下:
Begin
1) 接收端開啟,指定端口接收到數(shù)據(jù)包后開始捕包;
2) If TCP校驗和=1
[M=(ROT-118(M′)16)];
3) [G=G′A-1=R1R2...RnR1R2...RnR1R2...Rn],還原編碼矩陣,得到序列{Rn},根據(jù)序列進行分片重組;
4) For n=1 to n=s
[S=f-1(S1,S2,…,Ss)];
5) File=M,S;
//文件特征部分與數(shù)據(jù)部分組合,恢復原文件
本文對傳輸模型進行了實驗。網(wǎng)絡環(huán)境為局域網(wǎng),通信雙方的IP分別為192.168.1.100和192.168.1.101,發(fā)送端系統(tǒng)為macOS Mojave 10.14.1,接收端系統(tǒng)為Windows 10,通過C語言編程使用libnet函數(shù)庫完成數(shù)據(jù)報文的構造和發(fā)送過程,以及對數(shù)據(jù)包的重組,并通過Wireshark驗證數(shù)據(jù)包的準確性。Wireshark抓包結果如圖4所示。
實驗結果證明,通過使用該方法,發(fā)送端和接收端能夠正常通信,傳輸速度可以達到140 Kb/s,并且傳輸?shù)臄?shù)據(jù)具有一定的隱蔽性,能夠防止文件在傳輸過程中遭到截獲并被還原。
2.3 ?現(xiàn)有方案比較
在保護傳輸內(nèi)容安全時,面對不同的對象和不同的環(huán)境,現(xiàn)多選擇采用文件加密、時間型隱蔽信道、存儲型隱蔽信道和隱寫術來保護秘密信息不被泄露。
對整個文件進行加密傳輸容量大但計算復雜度大,需要一定的算力支持。隱蔽信道和隱寫術所需算力低但是嵌入容量較小,時間型隱蔽信道每條報文傳輸一個二進制字符0或者1,且容易受到網(wǎng)絡延遲等條件影響,信息容量無法滿足音視頻文件傳輸。存儲型隱蔽信道利用不同的協(xié)議頭部字段進行信息嵌入,嵌入大量信息容易被發(fā)現(xiàn)識別[13]。隱寫術的嵌入容量相對較大,但嵌入信息越多隱蔽性越差;另一方面,針對隱寫術檢測方法比較成熟,一旦被發(fā)現(xiàn)容易被提取還原。綜上所述,隱蔽信道、隱寫術、文件加密應用在保護智能家居音視頻文件的傳輸過程時存在一定的局限性。各種方法比較以及在傳輸同體積文件所需報文個數(shù)的比較匯總如表2和表3所示。
2.4 ?抗檢測性分析
在傳輸?shù)慕邮斩税惭bWindows Defender、火絨防火墻、瑞星防火墻等安全防護防火墻檢測該方法否能夠穿透防火墻,具有一定的抗檢測性,結果如表4所示。
測試結果表明,本文在傳輸秘密信息時能夠穿過防火墻等安全軟件檢測,具有一定的抗檢測性和穿透性。
2.5 ?抗攻擊分析
選擇與協(xié)議字段相似長度、相似特征的系數(shù)矩陣,并且將文件特征部分轉換成協(xié)議頭部字段格式,僅修改一個數(shù)據(jù)包協(xié)議頭部字段,在海量傳輸數(shù)據(jù)包的掩蓋下難以被檢測發(fā)現(xiàn)。
文件分片后按隨機序列順序進行傳輸,并且每個分片都失去了可讀性,假設攻擊者截獲了所有數(shù)據(jù)部分,其通過遍歷的方式猜解數(shù)據(jù)包序列,設遭到暴力破解的可能性為P,則[P=1n!]。如圖5所示,隨著分片數(shù)目的增多,P逐漸下降,當n=50時,P=3.288×10-65。通常情況下,n遠大于50,因此可以抵抗分片序列爆破。
3 ?結 ?論
通信網(wǎng)絡信息竊取主要針對用戶數(shù)據(jù)網(wǎng)絡中傳輸過程進行竊取[14]。傳統(tǒng)隱蔽信道方法容量較小,通過隱蔽信道傳輸較大數(shù)據(jù)時需要數(shù)量十分龐大的數(shù)據(jù)包,可行性較低并且容錯性差,傳統(tǒng)文件加密傳輸方式運算復雜度大并且有一定的消息冗余度。本文提出一種適合智能家居環(huán)境的音視頻文件安全傳輸方法,該方法在分離文件特征,使文件失去可讀性的基礎上,對文件分片以特定的編碼順序傳輸,使實際捕獲到的分片順序與真正數(shù)據(jù)分片的順序并不一致,從而避免在傳輸過程中遭到數(shù)據(jù)竊取,通過隱蔽信道的方式保護可逆系數(shù)矩陣,使可逆系數(shù)矩陣有較強的隱蔽性。信息傳輸過程中,保護傳輸信息不被破解十分重要,同時隱藏傳輸雙方的身份,保證通信雙方的匿名性也是非常重要的一項內(nèi)容。實驗研究的下一步將結合匿名通信流程,建立一個完整的智能家居環(huán)境下的安全傳輸系統(tǒng)。
參考文獻
[1] LAMPSON Butler. A note on the confinement problem [J]. Communications of the ACM, 1973, 16(10): 613?615.
[2] AHSAN K, KUNDUR D. Practical data hiding in TCP/IP [C]// Proceeding of Workshop on Multimedia Security at ACM Multimedia. Piscataway: IEEE, 2002: 101?109.
[3] CAUICH E, C?RDENAS R G, WATANABE R. Data hiding in identification and offset IP fields [C]// International Symposium and School on Advancex Distributed Systems. Heidelberg: Springer, 2005: 118?125.
[4] RAESH H, ANJAN K. Construction of covert channel using data hiding mechanism In Ipv4 [J]. IJRCCT, 2015, 4(6): 387?389.
[5] TIAN H, ZHOU K, HUANG Y F, et al. A covert communication model based on least significant bits steganography in voice over IP [C]// International Conference for Young Computer Scientists. Changsha: IEEE, 2008: 1?6.
[6] XIONG Y. Covert communication audio watermarking algorithm based on LSB [C] // 2006 International Conference on Communication Technology. Guilin: IEEE, 2006: 1?4.
[7] MIAO R, HUANG Y. An approach of covert communication based on the adaptive steganography scheme on voice over IP [C]// 2011 IEEE International Conference on Communications. Kyoto: IEEE, 2011: 1?5.
[8] MSTAFA R J, ELLEITHY K M. A high payload video steganography algorithm in DWT domain based on BCH codes (15, 11)[C]// 2015 Wireless Telecommunications Symposium. ?New York: IEEE, 2015: 1?8.
[9] 董志.MPEG?4文件分片策略及流量控制機制的研究[D].武漢:華中科技大學,2004.
[10] 譚慶豐,劉培朋,時金橋,等.UGC3:一種抵御審查的隱蔽通信方法[J].通信學報,2012,33(8):155?161.
[11] 屈志毅,蘇文洲,趙玲.一種基于信息分散算法的分布式數(shù)據(jù)存儲方案[J].計算機應用,2006,26(5):1102?1105.
[12] 吳成賓,朱彬.基于MQ的文件分片傳輸系統(tǒng)的設計與實現(xiàn)[J].電子科技大學學報,2007,36(3):646?648.
[13] 徐心怡,翟江濤,戴躍偉.一種針對BitTorrent協(xié)議中have消息的隱寫分析方法[J].計算機應用研究,2019,36(3):918?920.
[14] 蘆天亮,王僑,劉穎卿.不安全通信中的用戶隱私泄露問題[J].信息網(wǎng)絡安全,2015(9):119?123.