国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于支持向量機的P2P流量管理模型設計

2015-02-13 07:39杜經緯
關鍵詞:超平面向量流量

杜經緯

(運城學院計算機科學與技術系,山西 運城 044000)

?

基于支持向量機的P2P流量管理模型設計

杜經緯

(運城學院計算機科學與技術系,山西 運城 044000)

對P2P的網絡流量進行識別是P2P研究領域中的一個重大難題,為了實現對其管理,提出了一種基于支持向量機(SVM)的P2P流量分類管理模型.首先獲取P2P網絡流量數據,然后將獲取的樣本數據輸入SVM并對SVM進行訓練,最后將測試樣本數據輸入SVM進行P2P流量分類管理.仿真實驗證明了該方法具有較高的檢測率和較低的漏報率.

支持向量機;流量;P2P;訓練

隨著互聯網的進一步普及,點對點的網絡(peer-to-peer,P2P)[1-3]作為一種全新的互聯網技術目前已經得到飛速發(fā)展,Ipoque在2008—2009年的P2P研究報告中指出,P2P的業(yè)務流量目前在互聯網的業(yè)務應用中占據了主要成分,達到總量的69.95%.[4]不過,P2P的應用雖方便了人們的日常生活,卻也同時造成了巨大的帶寬消費和網絡擁塞,降低了網絡的性能和服務質量.[5]因此,對P2P的網絡流量進行識別成為網絡流量識別中的一個重大難題[2].

薛凱等[6]提出一種基于小波變換和ESN的P2P流量預測模型,將原始的P2P流量分解為不同尺度的高低頻分量,對根據不同分量特征匹配不同參數的ESN模型分別進行預測,并將多路預測的結果整合進行輸出.支持向量機(Support Vector Machine,SVM)是一個淺層的二分類器,能用于解決P2P流量問題.郭偉等[7]提出用時間代價作為標準的雙SVM構造分類器,采用K均值聚類算法來快速生成具有標簽的樣本集,將有標簽的樣本集作為SVM的訓練樣本,通過構造的雙SVM分類方法快速進行P2P流量識別.劉三民等[8]提出了一種基于K均值聚類算法和SVM的P2P流量識別方法,將標簽樣本作為數據集,采用K均值算法訓練聚類器,根據最大后驗概率分配簇標簽,用投票機制集成無標簽樣本標簽信息,并結合原始標簽樣本來訓練SVM.這些研究主要涉及網絡安全預測和防御的相關工作,往往僅根據網絡的物理特性或通信雙方的具體內容來進行安全預測,沒有考慮語義信息,不能準確地對網絡的安全事件進行高效預測.為克服以上方法的不足,筆者設計了一種基于SVM的網絡安全事件預測方法.

1 基于SVM的P2P流量分類管理模型設計

基于SVM的P2P流量分類管理模型如圖1所示.從圖1可以看出,基于SVM的P2P流量分類管理模型的過程為:(1)用網絡信息提取模塊提取網絡數據流中的信息;(2)首先,將網絡數據信息轉換為網絡連接記錄,并經過數據預處理模塊對這些信息進行處理,從而得到網絡P2P流數據;然后,用網絡P2P流數據作為樣本數據訓練SVM;最后,將分類結果作為流量管理的分類結果.

圖1 基于SVM的P2P流量管理模型

2 模型實現

2.1 最小二乘支持向量機

最小二乘支持向量機(Least Squares Support Vector Machine,LSSVM)由最小二乘方法和 SVM相結合而形成,即建立一個類別之間的超平面,并以最大化類別到超平面的距離為目標來訓練分類器.

2.2 基于SVM的流量分類

在獲得P2P的網絡流量數據后,將其作為樣本數據,并輸入SVM進行訓練,得到目標方程的參數值,此時將測試的樣本輸入到訓練好的SVM就能獲得樣本的分類.由于一個SVM僅能進行2類樣本的分類,因此對具有n種類別的樣本,需要構造n(n-1)/2個SVM.

假設樣本數據為{xi,yi}(1≤i≤n),n表示樣本總數,xi∈Rd是維數為d的輸入向量,yi∈R是對應的輸出,yi的值為+1或-1.超平面的形式為wTφ(x)+b=0,使得

(1)

其中:φ(x)表示低維映射到高維空間的非線性變換;w為超平面的法向量;b為偏差.這2類的分類間隔為2/‖w‖,故要使分類間隔最大,就要求‖w‖最小或‖w‖2/2最小,因此滿足(1)式并且與超平面最近的向量為支持向量.

現在,2分類的優(yōu)化問題可以表示為

yi(wTφ(x)+b)-1≥0 i=1,2,…,n.

(2)

要使‖w‖最小或‖w‖2/2最小,就要求最小化‖wTw‖,即目標函數f可以表示為

(3)

將(3)式中c和ξi分別表示懲罰因子和松弛變量,通過拉格朗日乘子法進行求解.假設拉格朗日乘子為λi,(2) 式對應的優(yōu)化問題可以表示為

(4)

LSSVM對函數的估計可以表示為

f(x)=sign(λiyiK(xi,xj)+b),

(5)

其中K(xi,xj)=φ(xi)φ(xj)為核函數,sign為基本符號函數.

2.3 核函數的選擇

3 仿真實驗

將選取的100 000條數據記錄作為實驗數據集,對基于SVM的網絡安全事件預測方法進行驗證.測試數據集一共分為4組.數據集包含訓練樣本數據集和測試樣本數據集,訓練樣本和測試樣本如表1所示.

表1 訓練樣本和測試樣本

將表1所示的樣本數據輸入到SVM模型進行訓練,得到訓練好的SVM模型,然后將測試樣本數據輸入到此SVM模型中,進行分類,最后用檢測精度、誤報率、漏報率來描述檢測性能.檢測精度為分類正確的樣本數與總樣本數的比值,誤報率表示非P2P樣本被認為是P2P的樣本數與非P2P樣本總數的比值,漏報率為P2P樣本錯認為是非P2P的樣本數與P2P樣本總數的比值,實驗結果如表2所示.從表2可以看出,基于SVM的網絡安全事件預測方法具有較低的誤報率和較高的檢測精度,是一種合適的P2P流量管理模型.

表2 實驗結果

4 結語

設計了一種基于SVM的P2P流量管理模型,將P2P網絡流數據作為樣本數據對SVM模型進行訓練,實現對P2P的流量管理,并通過仿真實驗證明了基于SVM的網絡安全事件預測方法的有效性.由于SVM的性能在很大程度上取決于核函數的選擇和參數的設置,因此,下一步的工作就是用自適應的方法選擇核函數和核函數參數,以進一步提高P2P的流量管理性能.

[1] CHEN Zhenxiang,YANG Bo,CHEN Yuehui,et al.Online Hybrid Traffic Classifier for Peer-to-Peer Systems Based on Network Processor[J].Applied Soft Computing,2009,9(2):685-694.

[2] 袁雪美,王 暉,張 鑫,等.P2P流量識別技術綜述[J].計算機應用,2009,29(S2):11-15.

[3] SILVIO VALENTI,DARIO ROSSI,MICHELA MEO,et al.Accurate,Fine-Grained Classification of P2P-TV Applications by Simply Counting Packets[C]∥Proceedings of the First International Workshop on Traffic Monitoring and Analysis.Berlin:Springer-Verlag,2009:84-92.

[4] WEI Yongtao,WANG Jinkuan,WANG Cuirong.Network Traffic Prediction Based on Wavelet Transform and Season ARIMA Model[J].Lecture Notes in Computer Science,2011,6 677:152-159.

[5] 徐周李,姜志宏,莫松海,等.基于應用層簽名的P2P流媒體流量識別[J].計算機應用研究,2009,26(6):2 214-2 216.

[6] 薛 凱,周亞建,平 源,等.基于小波變換和ESN的P2P流量預測模型[J].計算機工程與設計,2013,34(4):1 147-1 152.

[7] 郭 偉,王西闖,肖振久.基于K均值和雙支持向量機的P2P流量識別方法[J].計算機應用,2013,33(10):2 734-2 738.

[8] 劉三民,孫知信,劉余霞.基于K均值集成和SVM的P2P流量識別研究[J].計算機科學,2012,39(4):46-48.

(責任編輯 向陽潔)

Design of P2P Traffic Management Model Based on SVM

DU Jingwei

(Department of Computer Science and Technology,Yuncheng University,Yuncheng 044000,Shanxi China)

Network traffic recognition of P2P is one of the significant problems in P2P research.A classification management model based on SVM for P2P is thus proposed for its management.Firstly,the data is obtained from P2P network traffic;then the obtained sample data is input to the SVM for training;finally,the test sample is input to the SVM to realize its classification.The simulation experiment shows the method in this paper has the high detection rate and low false negative rate.

support vector machine;traffic;P2P;training

1007-2985(2015)04-0026-04

杜經緯(1979—),男,山西芮城人,運城學院計算機科學與技術系講師,碩士,主要從事計算機網絡與信息安全研究.

TP393

A

10.3969/j.issn.1007-2985.2015.04.007

猜你喜歡
超平面向量流量
冰墩墩背后的流量密碼
向量的分解
全純曲線的例外超平面
張曉明:流量決定勝負!三大流量高地裂變無限可能!
涉及分擔超平面的正規(guī)定則
聚焦“向量與三角”創(chuàng)新題
尋找書業(yè)新流量
以較低截斷重數分擔超平面的亞純映射的唯一性問題
向量垂直在解析幾何中的應用
向量五種“變身” 玩轉圓錐曲線
苍南县| 青铜峡市| 岗巴县| 河北省| 乳山市| 沂水县| 麻阳| 金沙县| 婺源县| 嘉义县| 应城市| 库车县| 平陆县| 固阳县| 巴楚县| 庆阳市| 南开区| 博客| 峡江县| 南昌县| 新昌县| 友谊县| 靖宇县| 托克托县| 兴安盟| 宝鸡市| 雷州市| 枣强县| 巴中市| 河南省| 繁昌县| 正宁县| 瑞安市| 资源县| 巴林左旗| 垫江县| 渭源县| 安泽县| 沈阳市| 滨海县| 呼和浩特市|