吳俊,黎云漢
義烏工商職業(yè)技術(shù)學(xué)院,浙江義烏 322000
◎網(wǎng)絡(luò)、通信、安全◎
相空間重構(gòu)和支持向量機(jī)相融合的網(wǎng)絡(luò)流量預(yù)測
吳俊,黎云漢
義烏工商職業(yè)技術(shù)學(xué)院,浙江義烏 322000
針對網(wǎng)絡(luò)流量非線性、突變性和混沌性特點(diǎn),利用相空間重構(gòu)和支持向量機(jī)參數(shù)的天然聯(lián)系,提出一種相空間重構(gòu)和支持向量機(jī)相融合的網(wǎng)絡(luò)流量預(yù)測方法。將網(wǎng)絡(luò)流量預(yù)測精度作為建模目標(biāo),采用粒子群算法對空間重構(gòu)和支持向量機(jī)參數(shù)進(jìn)行組合優(yōu)化,建立最優(yōu)網(wǎng)絡(luò)流量預(yù)測模型。仿真實驗結(jié)果表明,相對于傳統(tǒng)網(wǎng)絡(luò)流量預(yù)測方法,該方法更加能夠刻畫網(wǎng)絡(luò)流量復(fù)雜的變化特點(diǎn),有效提高了網(wǎng)絡(luò)流量的預(yù)測精度。
網(wǎng)絡(luò)流量;預(yù)測模型;相空間重構(gòu);支持向量機(jī);粒子群算法
隨著網(wǎng)絡(luò)規(guī)模日趨龐大,網(wǎng)上信息傳輸越來越頻繁,網(wǎng)絡(luò)流量控制是網(wǎng)絡(luò)擁塞控制的關(guān)鍵技術(shù)之一,高精度的網(wǎng)絡(luò)流量預(yù)測模型對網(wǎng)絡(luò)安全檢測與控制具有十分重要意義[1]。
傳統(tǒng)網(wǎng)絡(luò)流量預(yù)測方法主要有多元回歸、時間序列和貝葉斯網(wǎng)絡(luò)等線性預(yù)測方法,這些方法容易實現(xiàn),針對線性變化網(wǎng)絡(luò)流量建模時,具有較高的預(yù)測精度[2-3]。但實現(xiàn)上網(wǎng)絡(luò)流量是一種復(fù)雜的變化系統(tǒng),具有周期性、多尺度、突發(fā)性,傳統(tǒng)方法難以準(zhǔn)備描述網(wǎng)絡(luò)流量變化趨勢,應(yīng)用范圍受限[4]。近年來,隨著非線性理論迅速發(fā)展,出現(xiàn)基于神經(jīng)網(wǎng)絡(luò)(A rtificial Neural Netw ork,ANN)、支持向量機(jī)(Support Vector Machine)為代表的非線性網(wǎng)絡(luò)流量預(yù)測方法[5-6]。神經(jīng)網(wǎng)絡(luò)是一類基于經(jīng)驗風(fēng)險最小化原則的非線性預(yù)測方法,在大樣本條件下,預(yù)測精度高,當(dāng)樣本比較小時,預(yù)測精度難以得到保證;同時神經(jīng)網(wǎng)絡(luò)存在自身難以克服的缺陷如:網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜、易陷入局部極小值,出現(xiàn)過擬合抽象[7]。SVM很好地克服了像神經(jīng)網(wǎng)絡(luò)等非線性預(yù)測方法存在的缺陷,其基于結(jié)構(gòu)風(fēng)險最小原則,泛化能力優(yōu)異,在相同條件下,一般獲得比神經(jīng)網(wǎng)絡(luò)更優(yōu)的預(yù)測性能[8]。因此本研究考慮采用支持向量機(jī)對網(wǎng)絡(luò)流量進(jìn)行建模。大量研究表明,網(wǎng)絡(luò)流量具有混沌性,因此基于SVM的網(wǎng)絡(luò)流預(yù)測過程中,需要進(jìn)行相空間同構(gòu)和SVM參數(shù)優(yōu)化,傳統(tǒng)上,學(xué)者們忽略了相空間重構(gòu)法和SVM參數(shù)的聯(lián)系,難以獲得整體性能最優(yōu)的網(wǎng)絡(luò)流量預(yù)測模型[9]。
為了提高非線性網(wǎng)絡(luò)流量的預(yù)測精度,提出一種基于相空間重構(gòu)和支持向量機(jī)相融合的網(wǎng)絡(luò)流量預(yù)測方法(PSR-SVM),并通過仿真實驗驗證其有效性。
2.1 混沌理論的相空間重構(gòu)
相空間重構(gòu)可以時間序列的某一分量對非線性動力系統(tǒng)幾何性進(jìn)行分析,恢復(fù)其原始變化規(guī)律,因此相空間重構(gòu)優(yōu)劣直接關(guān)系到模型建立與預(yù)測效果[10]。Takens等人提出了用延遲坐標(biāo)法,該方法通過相空間對一維混沌時間序列x(i),i=1,2,…,n進(jìn)行重構(gòu),得到m維狀態(tài)向量,即
X(i)=(x(i),x(i+τ),…,x(i+(m-1)τ)T,i=1,2,…,N(1)式中,m為嵌入維數(shù),τ為延遲時間;N=n-(m-1)τ為相點(diǎn)的個數(shù)。
從式(1)可知,一維混沌時間序列x(i),i=1,2,…,n在m維相空間重構(gòu)的軌跡可以把系統(tǒng)狀態(tài)隨時間變化軌跡恢復(fù)出來律,因此要準(zhǔn)確地描述混沌時間序列的變化軌跡,必須選擇最優(yōu)的m為嵌入維數(shù),τ為延遲時間。當(dāng)前許多有關(guān)相空間重構(gòu)的方法,但這些方法判斷標(biāo)準(zhǔn)具有主觀隨意性,因此,目前還沒有一個通用性較強(qiáng)相空間重構(gòu)方法來選擇τ和m。
2.2 支持向量機(jī)算法
支持向量機(jī)(SVM)建?;舅枷霝椋簩ふ乙粋€非線性映射函數(shù)φ,把原始樣本映射到高維空間,然后在該空間進(jìn)行計算,通過該方式可以把非線性預(yù)測問題轉(zhuǎn)化成高維度線性預(yù)測問題,不需要進(jìn)行復(fù)雜度高的點(diǎn)積運(yùn)算[11]。
設(shè)有測試樣本集T={{x1,y1},(x2,y2),…,(xn,yn)},i= 1,2,…,n,xi為輸入值,yi為對應(yīng)輸出,那么SVM回歸函數(shù)為:
式中,w是自回歸系數(shù),b為誤差值。
w和b的值根據(jù)風(fēng)險最小化正則函數(shù)訓(xùn)練得到,即有
式中,ε()為不敏感損失函數(shù),C為懲罰因子。
通過引入非負(fù)的松弛變量(ε和ε*)將尋找最優(yōu)超平面的二次規(guī)劃問題轉(zhuǎn)換成:
引入朗格拉日乘子ai和,可以將式(4)轉(zhuǎn)變?yōu)椋?/p>
式中,k(xi,yi)為SVM的核函數(shù),SVM對問題求解結(jié)果取決取核函數(shù)和C。
這樣就可以得到SVM回歸函數(shù)f(x)的表達(dá)示為:
當(dāng)前,SVM的核函數(shù)相當(dāng)?shù)亩?,由于RBF函數(shù)的適用性比較方法,因此本研究選擇其作為SVM核函數(shù),RBF函數(shù)定義如下:
最后SVM回歸模型為:
其中,σ表示RBF函數(shù)寬度。
根據(jù)SVM預(yù)測模型的建立可知,RBF函數(shù)的SVM模型的預(yù)測性能與其參數(shù)c和σ相關(guān),因此要獲得較優(yōu)的網(wǎng)絡(luò)流量預(yù)測結(jié)果,必須對SVM參數(shù)進(jìn)行優(yōu)化。
3.1 網(wǎng)絡(luò)流量預(yù)測的參數(shù)分析
基于PSR-SVM的網(wǎng)絡(luò)流量預(yù)測模型待優(yōu)化參數(shù)包括:相空間重構(gòu)(τ、m)和SVM參數(shù)(c和σ)。采用某一網(wǎng)絡(luò)流量數(shù)據(jù)分析參數(shù)與PSR-SVM預(yù)測性能關(guān)系,具體見表1~4。
表1τ對預(yù)測模型性能的影響
通過對表1~4中各參數(shù)對模型影響可知,τ、m、c和σ均網(wǎng)絡(luò)流量預(yù)測精度有影響,它們之間相互聯(lián)系,為此,要建立預(yù)測精度高的網(wǎng)絡(luò)流量預(yù)測模型,首先獲得最優(yōu)的相空間重(τ、m)和支持向量機(jī)參數(shù)(c和σ)組合。共有4個參數(shù)要優(yōu)化,這顯然一個組合優(yōu)化問題,采用傳統(tǒng)窮舉法搜索最優(yōu)參數(shù)組合,搜索時間長,影響網(wǎng)絡(luò)流量的預(yù)測效率。粒子群優(yōu)化(Particle Swarm Optimization,PSO)算法是一種全局搜索能力強(qiáng)的仿生算法[12]。為此本研究采用PSO算法對網(wǎng)絡(luò)流量預(yù)測模型多參數(shù)組合優(yōu)化問題進(jìn)行求解,以提高網(wǎng)絡(luò)流量的預(yù)測精度。
表2m對預(yù)測模型性能的影響
表3c對預(yù)測模型性能的影響
表4σ對預(yù)測模型性能的影響
3.2 PSR-SVM優(yōu)化設(shè)計
3.2.1 粒子編碼
粒子編碼是求解參數(shù)組合優(yōu)化問題的第一步,每一個粒子位置向量包括τ、m、c和σ共4段,采用二進(jìn)制編方式,粒子長度由4段位串長度總和。
3.2.2 適應(yīng)度函數(shù)
粒子的優(yōu)劣程度由適度函數(shù)確定,且通過適應(yīng)度函數(shù)值引導(dǎo)粒子的飛行方向,而相空間重構(gòu)和SVM參數(shù)組合優(yōu)化目標(biāo)是提高網(wǎng)絡(luò)流量的預(yù)測精度,為此,本研究采用訓(xùn)練樣本預(yù)測結(jié)果的均方要誤差(RMSE)作為粒子的適度函數(shù)。RMSE定義如下:
式中,yi和分別表示網(wǎng)絡(luò)流量實際值和模型預(yù)測值。
由式(9)可知,預(yù)測結(jié)果的RMSE越小,那么粒子更優(yōu),即參數(shù)更優(yōu),有該參數(shù)組合的建立網(wǎng)絡(luò)流量模型預(yù)測精度更高。
3.2.3 初始粒子群產(chǎn)生方式
種群初始化是粒子群算法的關(guān)鍵,優(yōu)良粒子群為算法的求解節(jié)省許多的計算時間,然而傳統(tǒng)粒子種群一般采用隨機(jī)方式產(chǎn)生,易使大量粒子集中于某一局部區(qū)域概率變大,易產(chǎn)生局部最優(yōu)解,因此本研究對初始粒子群產(chǎn)生方式進(jìn)行改進(jìn),具體如下:
首先隨機(jī)產(chǎn)生N個粒子,粒子位串長度為K,然后對兩個粒子間的相似度進(jìn)行比較,相似定義為:
這樣通過比較粒子間相似度,要求規(guī)定能夠入選初始粒子相似度必須滿足如下條件:
其中,c表示調(diào)節(jié)常數(shù),控制期望的相似度。
因此,通過上述方式產(chǎn)生初始粒子群,不僅可以保證各粒子差異比較明顯,而且分布比較均勻,有效降低了陷入局部最優(yōu)概率,提高找到全局最優(yōu)解機(jī)會。
3.2.4 粒子速度更新方式
對于每一個粒子,其速度和位置進(jìn)行更新如下:
式中,vid(i)和vid(i+1)分別表示粒子當(dāng)前速度和更新后速度;xid(i)和xid(i+1)分別表示粒子當(dāng)前位置和更新后位置;w表示慣性權(quán)重;rand()表示隨機(jī)函數(shù),c1、c2表示加速因子。
3.2.5 PSR-SVM網(wǎng)絡(luò)流量預(yù)測流程
PSR-SVM的網(wǎng)絡(luò)流量預(yù)測模型工作流程見圖1。
圖1 網(wǎng)絡(luò)流量的預(yù)測流程圖
4.1 仿真環(huán)境
為了測試PSR-SVM的網(wǎng)絡(luò)流量預(yù)測方法的性能,在雙核CPU 2.8 GHz,RAM 2 GB,W indow s XP的環(huán)境進(jìn)行仿真實驗,采用M atlab 2007工具進(jìn)行編程實現(xiàn)算法。
4.2 數(shù)據(jù)來源
實驗數(shù)據(jù)來源于網(wǎng)絡(luò)流量文庫:http://new sfeed.ntcu. net/~new s/2011/,收集了主節(jié)點(diǎn)路由器Incom ing articles 從2011年3月1日到4月5日的每天網(wǎng)絡(luò)的每小時訪問流量,得到600個數(shù)據(jù),從而形成了一個網(wǎng)絡(luò)流量時間序列。將前500個數(shù)據(jù)作為訓(xùn)練集,建立網(wǎng)絡(luò)流量預(yù)測模型,其余100個數(shù)據(jù)作為測試集,對建立的模型泛化能力進(jìn)行檢驗。數(shù)據(jù)具體如圖2所示。從圖2可知,該網(wǎng)絡(luò)流量具有突發(fā)性、多尺度和混沌性。
圖2 網(wǎng)絡(luò)流量時間序列數(shù)據(jù)
4.3 數(shù)據(jù)預(yù)處理
由于網(wǎng)絡(luò)流量數(shù)據(jù)波動比較大,一些變化較大的數(shù)據(jù)會對SVM訓(xùn)練效率產(chǎn)生不利影響,為了消除該不利影響,在網(wǎng)絡(luò)流量數(shù)據(jù)建模之間,對其進(jìn)行預(yù)處理,將其縮放到[0,1]范圍,即
式中,xi和分別為網(wǎng)絡(luò)流量數(shù)據(jù)原始值和預(yù)處理后的值,xmax和xmin分別為最大值和最小值
4.4 相空間重構(gòu)和SVM參數(shù)的確定
通過PSO算法產(chǎn)生多組模型的參數(shù)初始組合(τ,m,c,σ),然后根據(jù)τ,m對預(yù)處理后網(wǎng)絡(luò)流量數(shù)據(jù)進(jìn)行重構(gòu),并分成訓(xùn)練集和測試集,然后將訓(xùn)練集輸入到SVM訓(xùn)練,參數(shù)c,σ由粒子解碼得到,建立網(wǎng)絡(luò)流量預(yù)測模型,并計算粒子的適應(yīng)度值,最后粒子之間的信息交流和協(xié)作得到最優(yōu)參數(shù):τ=5,m=10,c=20,σ=0.175。采用最優(yōu)τ=5,m=10,對網(wǎng)絡(luò)流量數(shù)據(jù)進(jìn)行重構(gòu),并采用最優(yōu)c=20,σ=0.175建立最優(yōu)SVM的網(wǎng)絡(luò)流量預(yù)測模型。
4.5 結(jié)果與分析
4.5.1 PSR-SVM預(yù)測性能
基于PSR-SVM的網(wǎng)絡(luò)流量預(yù)測結(jié)果見圖3。從圖3可知,PSR-SVM預(yù)測精度相當(dāng)高,其預(yù)測結(jié)果精度達(dá)到96.15%,可以滿足網(wǎng)絡(luò)流量預(yù)測精度的要求。仿真實驗結(jié)果表明,PSR-SVM充分考慮了相空間重構(gòu)和SVM參數(shù)之間的聯(lián)系,并通過全局搜索能力強(qiáng)的PSO算法對兩者進(jìn)行優(yōu)化,可以獲得整體預(yù)測性能好的網(wǎng)絡(luò)流量預(yù)測模型,有效地提高了網(wǎng)絡(luò)流量預(yù)測精度,并進(jìn)一步降低了預(yù)測誤差,準(zhǔn)確刻畫了網(wǎng)絡(luò)流量的非線性、突變性、多尺度等變化特點(diǎn)。
圖3 PSR-SVM的網(wǎng)絡(luò)流量預(yù)測結(jié)果
4.5.2 與其他預(yù)測模型的性能對比
為了比較PSR-SVM模型與其他模型性能的優(yōu)劣,在相同實驗條件下,采用SVM和相空間重構(gòu)分開模型(SVM)和傳統(tǒng)多元線性回歸模型(M LR)進(jìn)行對比實驗,預(yù)測結(jié)果見圖4。SVM和M LR的預(yù)測精度分別為91.77%和85.14%,遠(yuǎn)遠(yuǎn)低于PSR-SVM的96.15%。對比結(jié)果表明,M LR只能對網(wǎng)絡(luò)流量的線性變化規(guī)模進(jìn)行預(yù)測,無法預(yù)測非線性規(guī)律,因此預(yù)測精度最低;而SVM沒有考慮相空間重構(gòu)和SVM參數(shù)之間的聯(lián)系,不能找到全局最優(yōu)的τ,m,c,σ,網(wǎng)絡(luò)流量預(yù)測模型整體性能非最優(yōu),預(yù)測精度有待進(jìn)一步提高,而PSR-SVM更加能夠準(zhǔn)確捕捉網(wǎng)絡(luò)流量的變化趨勢,因此相對于傳統(tǒng)網(wǎng)絡(luò)流量預(yù)測方法,該方法更加能夠刻畫網(wǎng)絡(luò)流量復(fù)雜的變化特點(diǎn),有效提高了網(wǎng)絡(luò)流量的預(yù)測精度。綜上所述本文PSO-SVM預(yù)測方法是一種預(yù)測精度非常高的網(wǎng)絡(luò)流量非線性預(yù)測方法。
圖4 SVM和M LR模型的網(wǎng)絡(luò)流量預(yù)測結(jié)果
針對網(wǎng)絡(luò)流量的混沌性、突變性和非線性,充分考慮相空間重構(gòu)和預(yù)測模型參數(shù)之間的內(nèi)在聯(lián)系,提出一種基于PSR-SVM的網(wǎng)絡(luò)流預(yù)測方法。仿真結(jié)果表明,PSR-SVM能夠準(zhǔn)確描述網(wǎng)絡(luò)流量復(fù)雜的變化規(guī)律,提高了網(wǎng)絡(luò)流量預(yù)測精度,提高網(wǎng)絡(luò)管理效率。
[1]徐喆,王培榮,付沖,等.Internet流量的混沌動力學(xué)模型研究[J].通信學(xué)報,2006,27(11A):199-203.
[2]鄒伯賢,劉強(qiáng).基于ARMA模型的網(wǎng)絡(luò)流量預(yù)測[J].計算機(jī)研究與發(fā)展,2002,39(12):1645-1652.
[3]Shu Yantai,Wang Lei,Zhang Lianfang,et al.Internet traffic modeling and prediction using FARMA models[J].Chinese Journal of Computers,2001,24(1):46-54.
[4]洪飛,吳志美.基于小波的多尺度網(wǎng)絡(luò)流量預(yù)測模型[J].計算機(jī)學(xué)報,2006,29(1):166-170.
[5]馬華林.基于灰色模型和自適應(yīng)過濾的網(wǎng)絡(luò)流量預(yù)測[J].計算機(jī)工程,2009,35(1):130-131.
[6]孫知信,張玉峰.基于多維支持向量機(jī)的P2P網(wǎng)絡(luò)流量識別模型[J].吉林大學(xué)學(xué)報:工學(xué)版,2010,40(5):1298-1303.
[7]曹建華.一種基于灰色神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)流量預(yù)測模型[J].計算機(jī)工程與應(yīng)用,2008,44(5):155-157.
[8]Li Zhu,Yuan Ruixi,Guan Xiaohong.Accurate classification of the Internet traffic based on the SVM method[C]// Proceeding of the 42th IEEE International Conference on Communication(ICC),Glasgow,Sctland,2007:1373-1378.
[9]魏永濤,汪晉寬,王翠榮,等.基于小波變換與組合模型的網(wǎng)絡(luò)流量預(yù)測算法[J].東北大學(xué)學(xué)報:自然科學(xué)版,2011,32(10):1382-1391.
[10]陸錦軍,王執(zhí)銓.一種基于混沌特性的網(wǎng)絡(luò)流量改進(jìn)預(yù)測算法[J].兵工學(xué)報,2007,28(11):1346-1350.
[11]邵信光,楊慧中,陳剛.基于粒子群優(yōu)化算法的支持向量機(jī)參數(shù)選擇及其應(yīng)用[J].控制理論與應(yīng)用,2006,23(5):740-748.
[12]楊耿煌,溫渤嬰.基于量子行為粒子群優(yōu)化-人工神經(jīng)網(wǎng)絡(luò)的電能質(zhì)量擾動識別[J].中國電機(jī)工程學(xué)報,2008,28(10):123-129.
WU Jun,LI Yunhan
Yiwu Iudustrial&Commercial College,Yiwu,Zhejiang 322000,China
The network traffic has nonlinear,mutation and chaos characteristics,so this paper puts forward a network traffic prediction method based on phase space reconstruction and support vector machine using the relation between phase space reconstruction and support vector machine parameters.The network traffic prediction accuracy is taken as the modeling object,and particle swarm optimization algorithm is used to optimize for spatial reconstruction and parameters of support vector machine to establish the optimal network traffic prediction model.The simulation results show that this proposed method can describe network traffic characteristics of complex changes better com pared with the traditional network traffic forecast method,and it effectively improve the prediction accuracy of network traffic.
network traffic;prediction model;phase space reconstruction;support vector machine;particle swarm optimization algorithm
A
TP181
10.3778/j.issn.1002-8331.1209-0044
WU Jun,LI Yunhan.Network traffic prediction model based on phase space reconstruction and support vector regression.Computer Engineering and Applications,2014,50(16):67-71.
浙江省科技創(chuàng)新人才計劃項目(No.2010R30044)。
吳?。?979—),女,副教授,主要從事計算機(jī)網(wǎng)絡(luò)方面的研究;黎云漢(1979—),男,工學(xué)博士,副教授,主要從事電氣自動化技術(shù)方面的研究。E-mail:vutd35@163.com
2012-09-09
2012-11-12
1002-8331(2014)16-0067-05
CNKI網(wǎng)絡(luò)優(yōu)先出版:2012-12-18,http://www.cnki.net/kcms/detail/11.2127.TP.20121218.1520.004.htm l