国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

網(wǎng)絡協(xié)議分類在網(wǎng)絡數(shù)據(jù)分析中的運用

2019-06-25 02:29:30黃春艷范新梅
商情 2019年25期
關鍵詞:網(wǎng)絡協(xié)議加密分類

黃春艷 范新梅

[摘要]介紹了基于網(wǎng)絡數(shù)據(jù)的協(xié)議分類方法,論述了針對未加密/加密的已知協(xié)議、未加密/加密的未知協(xié)議四種不同識別對象的分類方法,指出了協(xié)議分類需要進一步研究的問題。

[關鍵詞]網(wǎng)絡協(xié)議 分類 加密

計算機網(wǎng)絡在人們的日常生活和工作中的作用越來越大,與此同時網(wǎng)絡的安全性也受到了沖擊。網(wǎng)絡通信時總會在網(wǎng)絡協(xié)議中留下痕跡,通過研究網(wǎng)絡協(xié)議的分類方法,可以更好的保證網(wǎng)絡安全。

1、網(wǎng)絡協(xié)議分類的方法

協(xié)議分類的方法從研究手段分可劃為兩類,即指令代碼分析(基于指令代碼的協(xié)議識別)和報文序列分析(基于網(wǎng)絡數(shù)據(jù)的協(xié)議識別)。報文序列分析相比于指令代碼分析通用性更強,它不關心報文所在協(xié)議層次,并且對終端依賴較小。在協(xié)議種類復雜的情況下,如果數(shù)據(jù)量足夠大,它的分析速度優(yōu)于指令代碼分析方式。但是對于加密協(xié)議,由于已經(jīng)破壞了其統(tǒng)計規(guī)律,通過報文序列分析的方式很難得到理想結果,而且這種方法對樣本的要求較高,如果樣本中某類格式的協(xié)議比較少,該類協(xié)議就容易被忽略。

根據(jù)研究對象的不同,報文序列分析可分為四類:未加密已知協(xié)議分類、加密已知協(xié)議分類、未加密未知協(xié)議分類、加密未知協(xié)議分類。傳統(tǒng)的協(xié)議分類方法大都以統(tǒng)計規(guī)律為基礎,通過查找高頻的特征,采用不同的算法來進行分類,包括基于端口的分類、基于特征字段的分類、基于流量特征的分類等。其他方法有基于隱馬爾可夫模型、基于正則表達式的分類等,這些方法多通過提高查找頻繁特征的準確性來提高分類的精度。

2、網(wǎng)絡數(shù)據(jù)分析中的協(xié)議分類

2.1已知協(xié)議分類

(1)未加密的已知協(xié)議分類

目前針對該類協(xié)議的分類方法已經(jīng)比較成熟,網(wǎng)絡上有非常多的協(xié)議解析工具,如sniffer、Wireshark等。由于計算機發(fā)展初期協(xié)議都使用IANA(Internet Assigned Numbers Authority)中的固定端口,早期主要采用基于端口的協(xié)議識別方法對未加密的已知協(xié)議進行分析。隨著計算機的普遍應用和各種應用程序的出現(xiàn),新出現(xiàn)的協(xié)議開始采用動態(tài)端口來進行通信和數(shù)據(jù)傳輸,(動態(tài)端口也就是未被其它協(xié)議固定使用的端口,從1024到65535在傳輸時動態(tài)分配),或者采用端口復用技術,這就使得端口識別技術應用越來越受限。針對這種情況人們提出了基于特征字段匹配的協(xié)議識別方法,對于未加密的已知協(xié)議來說,這種方法大大提升了協(xié)議識別的準確率。

(2)加密的已知協(xié)議分類。

主要采用基于流量統(tǒng)計特征的方法對加密的已知協(xié)議進行分類。該方法利用包特征、間隔時間、報文長度等流特征,判斷其是否為同一類協(xié)議。文獻提出一種通過統(tǒng)計網(wǎng)絡流量的時間間隔、雙向的報文數(shù)、發(fā)報的活躍時間和空閑時間等特征進行分類的方法,該方法利用聚類算法將具有相似或相同特征的網(wǎng)絡流量聚成一簇,最后使用深度包檢測DPI和正則表達式匹配的識別結果來評估聚類效果。

2.2未知協(xié)議分類

(1)未加密的未知協(xié)議分類

對于未加密未知協(xié)議分類的主要研究方法是利用數(shù)據(jù)挖掘查找出比特流的頻繁序列,再據(jù)此進行比特流的分割,將長的比特流分割成多個協(xié)議數(shù)據(jù)包,然后再用聚類的方法對數(shù)據(jù)進行處理,找出關鍵特征,最后形成分類。文獻提出一種頻繁比特序列挖掘算法,該算法首先從大量的比特流數(shù)據(jù)中挖掘出頻繁序列,然后通過設定頻繁閾值來選出所需要的頻繁序列。在協(xié)議的數(shù)據(jù)中,通常幀同步碼和協(xié)議幀中的固定字段會出現(xiàn)在幀頭部,從而可以反映出幀頭部的分布情況,進而有效的去除載荷數(shù)據(jù)的影響。該方法對于短頻繁序列的協(xié)議類型效果較好,但是不能很明確的確定幀的邊界。頻繁序列挖掘算法有很多,比較成熟的算法有AC算法和Wu-Manber算法等。頻繁序列挖掘算法結合模糊串匹配,可以減少頻繁序列的種類從而達到提高精度的效果。

(2)加密的未知協(xié)議分類

針對加密未知協(xié)議的分類,通常是結合對加密已知協(xié)議分析和未加密未知協(xié)議的分類方法綜合使用。通過對流量特征的降維和聚類,找出區(qū)分協(xié)議的關鍵特征從而實現(xiàn)分類,但是效果不太理想。比較好的分析方法是采用指令序列進行分析。文獻提出一種采用動態(tài)污點分析的方法來對未知加密協(xié)議進行分析,該方法通過跟蹤記錄程序執(zhí)行過程中的指令軌跡,采用數(shù)據(jù)流分析構建指令級和函數(shù)級的污點傳播流圖,再根據(jù)解密過程中的特征來定位數(shù)據(jù)包解密后的明文,最后解析協(xié)議明文的格式,但分析的速度較慢。

基于網(wǎng)絡數(shù)據(jù)的協(xié)議分類通過提高查找頻繁序列的準確性來提高精確率,但聚類本身結果難以控制和評價,而且加密的未知協(xié)議由于破壞了統(tǒng)計特性,用統(tǒng)計方法分析難度加大。研究如何在無監(jiān)督的情況下更好的分類將會是協(xié)議逆向分析的一個重點,如何在未知加密協(xié)議中引入先驗知識以降低分析的難度也將是下一步的研究方向。

結束語:

基于網(wǎng)絡數(shù)據(jù)的協(xié)議分類是協(xié)議分析中格式推斷和語義分析的基礎,基本思想是發(fā)現(xiàn)協(xié)議的差異性特征,借此進行分類。文章簡要介紹了基于網(wǎng)絡數(shù)據(jù)的協(xié)議分類方法,根據(jù)協(xié)議分類對象的不同分為了四類進行論述,較為系統(tǒng)地整理了針對不同研究對象的研究方法,并且對其進行了分析。

猜你喜歡
網(wǎng)絡協(xié)議加密分類
計算機網(wǎng)絡理論下的傳播研究結構模型:Communication一詞的兩種翻譯
分類算一算
分類討論求坐標
一種藍牙多跳網(wǎng)絡協(xié)議的設計與研究
電子制作(2018年17期)2018-09-28 01:56:52
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
基于DPI技術的語音視頻流量監(jiān)控系統(tǒng)設計與實現(xiàn)
認證加密的研究進展
芻議局域網(wǎng)中網(wǎng)絡協(xié)議的添加與配置
科技資訊(2015年10期)2015-06-29 18:17:23
基于ECC加密的電子商務系統(tǒng)
布拖县| 玉环县| 阿克陶县| 大城县| 青冈县| 基隆市| 隆回县| 安达市| 徐水县| 峨眉山市| 尚义县| 凤台县| 宣汉县| 满洲里市| 洪湖市| 华蓥市| 布拖县| 浦北县| 陇南市| 共和县| 德令哈市| 达孜县| 芦山县| 遂平县| 微山县| 庆元县| 吉林省| 张掖市| 中江县| 武乡县| 昭觉县| 朔州市| 汝州市| 丰原市| 枝江市| 吴堡县| 蒙城县| 洛阳市| 兴和县| 德清县| 桐庐县|