【摘要】為了提高網(wǎng)絡流量預測精度,提出一種基于遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡的網(wǎng)絡流量預測模型(GA-BPNN)。首先采集網(wǎng)絡流量數(shù)據(jù),并進行相應預處理,然后將網(wǎng)絡流量訓練樣本輸入到BP神經(jīng)網(wǎng)絡進行學習,并采用遺傳算法對BP神經(jīng)網(wǎng)絡參數(shù)進行優(yōu)化,最后采用建立的網(wǎng)絡流量預測模型對網(wǎng)絡流量測試集進行預測,并通過仿真實驗對模型性能進行測試。結果表明,GA-BPNN提高了網(wǎng)絡流量的預測精度,獲得比較理想的網(wǎng)絡流量預測結果。
【關鍵詞】網(wǎng)絡流量;BP神經(jīng)網(wǎng)絡;遺傳算法;參數(shù)優(yōu)化
【中圖分類號 】TP183【文獻標識碼】A
1引言
網(wǎng)絡流量預測對于分析和理解網(wǎng)絡將要發(fā)生的網(wǎng)絡行為、指導網(wǎng)絡安全檢測與控制具有重要的意義,網(wǎng)絡流量具有非線性、多時間和多尺度等變化特性,如何建立高精度的網(wǎng)絡流量預測模型已經(jīng)成為研究熱點之一。
當前網(wǎng)絡流量均基于統(tǒng)計方法進行建模,是通過對預測網(wǎng)絡流量過去的數(shù)據(jù)及資料進行統(tǒng)計和分析,對其未來的網(wǎng)絡流量發(fā)展趨勢進行定量的預測,主要有時間序列法和BP神經(jīng)網(wǎng)絡方法。時間序列預測法因根據(jù)事物過去的變化趨勢預測未來的發(fā)展,突出時間因素,外界因素不計入影響,在短期且沒有相對比較大的變化時預測結果比較理想,但是當外界出現(xiàn)巨變,往往會出現(xiàn)比較大的偏差。因此,時間序列預測法適用于漸進變化的預測對象,沒有明顯波動,而網(wǎng)絡流量受到多種因素影響,具有非線性、多時間和多尺度等變化的特性,因此時間序列法預測精度比較低。BP(Back Propagation)網(wǎng)絡是一種按誤差逆向傳播算法訓練的多層前饋網(wǎng)絡,是目前應用最廣泛的神經(jīng)網(wǎng)絡模型之一,具有自組織、自適應、自學習等特點,具有很強的輸入輸出非線性映射能力,對解決非線性問題有著獨特的先進性,成為當前網(wǎng)絡流量建模與預測主要工具。但是,由于采用了誤差函數(shù)按梯度下降的學習算法,極易陷入局部最小值點。此外,BP神經(jīng)網(wǎng)絡學習算法收斂慢,系統(tǒng)魯棒性差,網(wǎng)絡的性能對初始設置值依賴比較大。因此BP神經(jīng)網(wǎng)絡需要進行改進才能更好地應用到實際中。
為了提高網(wǎng)絡流量預測精度,提出一種基于遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡的網(wǎng)絡流量預測模型(GA-BPNN)。首先采集網(wǎng)絡流量數(shù)據(jù),并進行相應預處理,然后將網(wǎng)絡流量訓練樣本輸入到BP神經(jīng)網(wǎng)絡進行學習,并采用遺傳算法對BP神經(jīng)網(wǎng)絡參數(shù)進行優(yōu)化,最后采用建立的網(wǎng)絡流量預測模型對網(wǎng)絡流量測試集進行預測,并通過仿真實驗對模型性能進行測試。
2BP神經(jīng)網(wǎng)絡和遺傳算法
2.1BP神經(jīng)網(wǎng)絡概述
BP神經(jīng)網(wǎng)絡基本思想是網(wǎng)絡訓練過程由正向傳播與誤差反向傳播兩個過程組成。正向傳播輸入樣本由輸入層傳入經(jīng)隱層單元處理并計算每個單元實際輸出傳向輸出層,若此時實際輸出與期望輸出相符,則網(wǎng)絡訓練成功結束,否則轉入誤差反向傳播。誤差反向傳播從輸出層開始經(jīng)隱層向輸入層逐層返回,根據(jù)實際輸出與期望輸出的誤差修改各層單元連接權值。
BP神經(jīng)網(wǎng)絡正向傳播與反向傳播對各層單元權值修改是一個反復的過程,直到實際輸出與期望相符或達到最大的訓練次數(shù)為止。典型三層BP神經(jīng)網(wǎng)絡的拓撲結構如圖1所示。
設wij為輸入層第i個神經(jīng)元與隱層第j個神經(jīng)元的連接權值。
1)正向傳播。輸入層:神經(jīng)元i的輸出值Oi等于輸入值Ii對隱層,輸出層:
Ij =wijOi-θi(1)
Oj =f(Ij)(2)
作用函數(shù)f為Sigmoid函數(shù),f(Ij) = 。
2)反向傳播。輸出層實際輸出yk與期望dk不一致時,有誤差函數(shù):
E=(dk -yk)2(3)
連接權值的修改按以下公式計算:
wjk(t+1) = wjk(t)+△wjk(4)
BP算法采用梯度下降方向修改連接權值,變化權值為:
△wjk =-η =-η δkOj(5)
其中學習率η取值為0<η<1,即對于輸出層:
△wjk =ηyk(1-yk)(dk-yk) (6)
對于隱層:
△wjk =ηOj(1-Oj) δkwjk(7)
2.2BP神經(jīng)網(wǎng)絡算法實現(xiàn)步驟
(1)初始化,對所有聯(lián)結權w隨機生成任意小的值,閾值θ的初始值及設定訓練次數(shù)。
(2)輸入訓練樣本及期望(xn,dm)。
(3)前向傳播。計算隱層及輸出層j單元輸入
Ij=wijOi-θi ,單元j輸出Oj =;
(4) 輸出層yk與dk不相符按反向誤差傳播調整權值,從輸出到隱層按下式更新權值。
wjk(t+1) = wjk(t)+△wjk(8)
當k為輸出層:△w=ηyk(1-yk)(dk-yk) ,當k為隱層:△w =ηOj(1-Oj) δkwjk計算。
(5) 轉(2)重復執(zhí)行,直到誤差滿足或達到最大訓練次數(shù)為止。
標準BP神經(jīng)網(wǎng)絡用梯度下降算法求解,易陷入局部極小值,在網(wǎng)絡訓練學習中難以避免學習收斂速度慢及訓練過程出現(xiàn)振蕩的問題,為此采用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡的參數(shù)。
2.3遺傳算法
遺傳算法的優(yōu)化原理是從隨機生成的初始群體出發(fā),采用基于優(yōu)勝劣汰的選擇策略選擇優(yōu)良個體作為父代,通過父代個體的復制、雜交和變異來繁衍進化的子代種群。經(jīng)過多代的進化,種群的適應性會逐漸增強。遺傳算法的優(yōu)化是通過遺傳算法中復制、雜交和變異算子的操作來實現(xiàn)的。
(1) 復制是進化個體經(jīng)過輪盤賭選擇,使父代的優(yōu)良個體以較大的概率在子代中得到繼承的遺傳過程。
(2) 雜交是指父代中個體隨機的交換染色體的基因在子代中產生新的個體。endprint
(3) 變異是個體染色體的基因以變異概率發(fā)生隨機質變的過程。
雜交和變異使后代中產生新個體,復制使父代的基因在子代中得以繼承,從而使生物物種在繼承的基礎上不斷進化。它可以避免局部優(yōu)化從而保證收斂的全局搜索性。
3遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡的網(wǎng)絡流量預測模型
(1) 收集網(wǎng)絡流量歷史數(shù)據(jù),并對其進行預處理。
(2) 初始化種群。隨機產生一組個體,每一個個體包括BP神經(jīng)網(wǎng)絡初始連接權值和初始閾值。
(3) 對個體進行解碼,根據(jù)相關聯(lián)函數(shù)法確定τ、m,并對網(wǎng)絡流量數(shù)據(jù)進行重構,并初始連接權值和閾值作為BP神經(jīng)網(wǎng)絡參數(shù)進行網(wǎng)絡流量訓練,根據(jù)預測結果計算個體適應度值。適應度函數(shù)f(x)定義如下:
f(x)=(y-)(9)
式中,y為BP神經(jīng)網(wǎng)絡的預測值,為網(wǎng)絡流量實際值,n表示訓練樣本個數(shù)。
(4) 采用最佳保留策略和輪盤賭選擇較優(yōu)的個體進行下一代。
(5) 根據(jù)交叉概率選擇兩個個體進行交叉操作,選擇最優(yōu)個體進行下一代。
(6) 根據(jù)變異概率選擇兩個個體進行變異操作,選擇最優(yōu)個體進行下一代。
(7) 判斷算法結束條件,若滿足結束條件則返回全局最優(yōu)個體,若不滿足,進化代數(shù)加1,并跳轉至(3)繼續(xù)優(yōu)化。
(8) 將最優(yōu)個體解碼成為BP神經(jīng)網(wǎng)絡的初始連接權值和閾值。
(9) 根據(jù)初始連接權值和閾值建立最優(yōu)網(wǎng)絡流量預測模型。
4仿真實驗
4.1數(shù)據(jù)來源
實驗數(shù)據(jù)來源于某學校網(wǎng)絡中心服務器,從2013年2月1日到2月21日每天網(wǎng)絡的每小時訪問流量,得到480個數(shù)據(jù),以前380個數(shù)據(jù)作為訓練集建立網(wǎng)絡流量預測模型,后100個數(shù)據(jù)作為測試集進行預測檢驗,具體如圖2所示。
4.2數(shù)據(jù)歸一化處理
BP神經(jīng)網(wǎng)絡模型在訓練時對在0-1之間的數(shù)據(jù)最為靈敏,然而實際網(wǎng)絡流量具有突變性,變化幅度較大,為了提高訓練的效率,對其進行歸一化處理,具體為:
x'=(10)
最后對網(wǎng)絡流量預測結果進行反歸一化處理,恢復真實預測值。
x=x'(xmax-xmin) +xmin(11)
式中x表示網(wǎng)絡流量原始數(shù)據(jù),xmin和xmax表示分別最小值和最大值。
4.3模型評價指標
為了說明GA-BPNN模型的有效性,在Matlab2021環(huán)境下進行仿真實驗。同時為了使GA-BPNN模型的預測結果具有可比性,采用標準BP神經(jīng)網(wǎng)絡(BPNN)作為對比模型。模型性能的評價指標為均方根誤差(root mean squared predict error,RMSE)和平均絕對百分誤差(mean absolute percentage error,MAPE),具體定義如下:
RMSE=(12)
MAPE=
×100(13)
式中y表示網(wǎng)絡流量實際觀測值,表示預測值。
4.4結果與分析
4.4.1 不含噪網(wǎng)絡流量的預測結果分析
首先采用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡參數(shù),然后采用最優(yōu)參數(shù)BP神經(jīng)網(wǎng)絡建立網(wǎng)絡流量預測模型,GA-BPNN、BPNN對測試集的預測結果及預測誤差如圖3和4所示。從圖3可知,GA-BPNN的預測結果與實際網(wǎng)絡流量的值相當吻合,十分接近,這表明GA-BPNN可用于現(xiàn)代復雜多變、隨機的網(wǎng)絡流量預測,同時從圖4可知,GA-BPNN的預測誤差相當小,可以滿足網(wǎng)絡流量預測精度的要求。
GA-BPNN與對比模型的預測誤差見表1。根據(jù)表1可知,相對于對比模型,GA-BPNN預測誤差更高,相應的網(wǎng)絡流量預測精度更高,這表明,GA-BPNN通過遺傳算法對BPNN參數(shù)優(yōu)化和選擇,克服BP神經(jīng)網(wǎng)絡等預測精度低的缺陷,GA-BPNN是一種精度高、預測結果可靠的網(wǎng)絡流量預測模型。
4.4.2 含噪網(wǎng)絡流量的預測結果分析
為了測試GA-BPNN的通用性,對一個含噪的網(wǎng)絡流量進行仿真實驗,含噪的網(wǎng)絡流量如圖5所示。GA-BPNN的含噪網(wǎng)絡流量數(shù)據(jù)預測結果及預測誤差如圖6和7所示。從圖6和7可知,對于含噪的網(wǎng)絡流量,GA-BPNN同樣獲得了較理想的預測結果,這表明GA-BPNN采用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡,獲得了較好的網(wǎng)絡流量訓練集,增加了模型的魯棒性和通用性,拓寬了GA-BPNN在網(wǎng)絡流量的應用范圍。
GA-BPNN與BPNN對含噪網(wǎng)絡流量預測誤差見表2。從表2可知,相對于對比模型,GA-BPNN的整體預測性能更優(yōu),建立了誤差更小的網(wǎng)絡流量預測模型,再一次證明了GA-BPNN的優(yōu)越性。
5結束語
為了提高網(wǎng)絡流量預測精度,針對BP神經(jīng)網(wǎng)絡參數(shù)優(yōu)化難題,提出一種遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡的網(wǎng)絡流量預測模型,仿真結果表明,GA-BPNN不僅提高了網(wǎng)絡流量的預測精度,為復雜多變的網(wǎng)絡流量提供了一種新的研究思路。
參考文獻
[1] Nguyen T T, Armitage G. A survey of techniques for internet traffic classification using machine learning [J]. IEEE Communications Surveys and Tutorials, 2008, 10(4):56-76.
[2] 馬華林.基于灰色模型和自適應過濾的網(wǎng)絡流量預測[J].計算機工程,2009,35(1):130-131.
[3] Mao Yongyi, Li Baochun. A factor graph approach to link loss monitoring in wireless sensor networks [J]. IEEE Journal on Selected Areas in Communications, 2006,23(4):820-829.
[4] Callado A, Keu R J, Sadok D, et a1.Better network traffic identification through the independent combination of techniques [J]. Journal of Network and Computer Applications, 2010, 33(4):433-446.
[5] 姚奇富,李翠鳳,馬華林,張森. 灰色系統(tǒng)理論和馬爾柯夫鏈相結合的網(wǎng)絡流量預測方法[J].浙江大學學報(理學版),2007,34(4):396-400.
[6] 劉淵,戴悅,曹建華.基于小波神經(jīng)網(wǎng)絡的流量混沌時間序列預測[J].計算機工程,2008,34(16):105-106.
[7] 陳曉天,張順頤,田婷婷. 基于BP神經(jīng)網(wǎng)絡的IP網(wǎng)絡流量預測[J].南京郵電大學學報(自然科學版),2012, 30(2):16-21.
[8] 李松,羅勇,張銘銳. 遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡的混沌時間序列預測[J].計算機工程與應用,2011, 47(29):52-55.
[9] 趙振江. 基于PSO-BP神經(jīng)網(wǎng)絡的網(wǎng)絡流量預測與研究[J]. 計算機應用與軟件,2009,26(1):218-211.
[10] 張穎路. 基于遺傳算法優(yōu)化支持向量機的網(wǎng)絡流量預測[J].計算機科學,2008,35(5):177-179.
作者簡介:
劉春(1981-),男,碩士,四川建筑職業(yè)技術學院網(wǎng)絡管理中心,講師;主要研究方向和關注領域:計算機網(wǎng)絡管理。endprint
(3) 變異是個體染色體的基因以變異概率發(fā)生隨機質變的過程。
雜交和變異使后代中產生新個體,復制使父代的基因在子代中得以繼承,從而使生物物種在繼承的基礎上不斷進化。它可以避免局部優(yōu)化從而保證收斂的全局搜索性。
3遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡的網(wǎng)絡流量預測模型
(1) 收集網(wǎng)絡流量歷史數(shù)據(jù),并對其進行預處理。
(2) 初始化種群。隨機產生一組個體,每一個個體包括BP神經(jīng)網(wǎng)絡初始連接權值和初始閾值。
(3) 對個體進行解碼,根據(jù)相關聯(lián)函數(shù)法確定τ、m,并對網(wǎng)絡流量數(shù)據(jù)進行重構,并初始連接權值和閾值作為BP神經(jīng)網(wǎng)絡參數(shù)進行網(wǎng)絡流量訓練,根據(jù)預測結果計算個體適應度值。適應度函數(shù)f(x)定義如下:
f(x)=(y-)(9)
式中,y為BP神經(jīng)網(wǎng)絡的預測值,為網(wǎng)絡流量實際值,n表示訓練樣本個數(shù)。
(4) 采用最佳保留策略和輪盤賭選擇較優(yōu)的個體進行下一代。
(5) 根據(jù)交叉概率選擇兩個個體進行交叉操作,選擇最優(yōu)個體進行下一代。
(6) 根據(jù)變異概率選擇兩個個體進行變異操作,選擇最優(yōu)個體進行下一代。
(7) 判斷算法結束條件,若滿足結束條件則返回全局最優(yōu)個體,若不滿足,進化代數(shù)加1,并跳轉至(3)繼續(xù)優(yōu)化。
(8) 將最優(yōu)個體解碼成為BP神經(jīng)網(wǎng)絡的初始連接權值和閾值。
(9) 根據(jù)初始連接權值和閾值建立最優(yōu)網(wǎng)絡流量預測模型。
4仿真實驗
4.1數(shù)據(jù)來源
實驗數(shù)據(jù)來源于某學校網(wǎng)絡中心服務器,從2013年2月1日到2月21日每天網(wǎng)絡的每小時訪問流量,得到480個數(shù)據(jù),以前380個數(shù)據(jù)作為訓練集建立網(wǎng)絡流量預測模型,后100個數(shù)據(jù)作為測試集進行預測檢驗,具體如圖2所示。
4.2數(shù)據(jù)歸一化處理
BP神經(jīng)網(wǎng)絡模型在訓練時對在0-1之間的數(shù)據(jù)最為靈敏,然而實際網(wǎng)絡流量具有突變性,變化幅度較大,為了提高訓練的效率,對其進行歸一化處理,具體為:
x'=(10)
最后對網(wǎng)絡流量預測結果進行反歸一化處理,恢復真實預測值。
x=x'(xmax-xmin) +xmin(11)
式中x表示網(wǎng)絡流量原始數(shù)據(jù),xmin和xmax表示分別最小值和最大值。
4.3模型評價指標
為了說明GA-BPNN模型的有效性,在Matlab2021環(huán)境下進行仿真實驗。同時為了使GA-BPNN模型的預測結果具有可比性,采用標準BP神經(jīng)網(wǎng)絡(BPNN)作為對比模型。模型性能的評價指標為均方根誤差(root mean squared predict error,RMSE)和平均絕對百分誤差(mean absolute percentage error,MAPE),具體定義如下:
RMSE=(12)
MAPE=
×100(13)
式中y表示網(wǎng)絡流量實際觀測值,表示預測值。
4.4結果與分析
4.4.1 不含噪網(wǎng)絡流量的預測結果分析
首先采用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡參數(shù),然后采用最優(yōu)參數(shù)BP神經(jīng)網(wǎng)絡建立網(wǎng)絡流量預測模型,GA-BPNN、BPNN對測試集的預測結果及預測誤差如圖3和4所示。從圖3可知,GA-BPNN的預測結果與實際網(wǎng)絡流量的值相當吻合,十分接近,這表明GA-BPNN可用于現(xiàn)代復雜多變、隨機的網(wǎng)絡流量預測,同時從圖4可知,GA-BPNN的預測誤差相當小,可以滿足網(wǎng)絡流量預測精度的要求。
GA-BPNN與對比模型的預測誤差見表1。根據(jù)表1可知,相對于對比模型,GA-BPNN預測誤差更高,相應的網(wǎng)絡流量預測精度更高,這表明,GA-BPNN通過遺傳算法對BPNN參數(shù)優(yōu)化和選擇,克服BP神經(jīng)網(wǎng)絡等預測精度低的缺陷,GA-BPNN是一種精度高、預測結果可靠的網(wǎng)絡流量預測模型。
4.4.2 含噪網(wǎng)絡流量的預測結果分析
為了測試GA-BPNN的通用性,對一個含噪的網(wǎng)絡流量進行仿真實驗,含噪的網(wǎng)絡流量如圖5所示。GA-BPNN的含噪網(wǎng)絡流量數(shù)據(jù)預測結果及預測誤差如圖6和7所示。從圖6和7可知,對于含噪的網(wǎng)絡流量,GA-BPNN同樣獲得了較理想的預測結果,這表明GA-BPNN采用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡,獲得了較好的網(wǎng)絡流量訓練集,增加了模型的魯棒性和通用性,拓寬了GA-BPNN在網(wǎng)絡流量的應用范圍。
GA-BPNN與BPNN對含噪網(wǎng)絡流量預測誤差見表2。從表2可知,相對于對比模型,GA-BPNN的整體預測性能更優(yōu),建立了誤差更小的網(wǎng)絡流量預測模型,再一次證明了GA-BPNN的優(yōu)越性。
5結束語
為了提高網(wǎng)絡流量預測精度,針對BP神經(jīng)網(wǎng)絡參數(shù)優(yōu)化難題,提出一種遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡的網(wǎng)絡流量預測模型,仿真結果表明,GA-BPNN不僅提高了網(wǎng)絡流量的預測精度,為復雜多變的網(wǎng)絡流量提供了一種新的研究思路。
參考文獻
[1] Nguyen T T, Armitage G. A survey of techniques for internet traffic classification using machine learning [J]. IEEE Communications Surveys and Tutorials, 2008, 10(4):56-76.
[2] 馬華林.基于灰色模型和自適應過濾的網(wǎng)絡流量預測[J].計算機工程,2009,35(1):130-131.
[3] Mao Yongyi, Li Baochun. A factor graph approach to link loss monitoring in wireless sensor networks [J]. IEEE Journal on Selected Areas in Communications, 2006,23(4):820-829.
[4] Callado A, Keu R J, Sadok D, et a1.Better network traffic identification through the independent combination of techniques [J]. Journal of Network and Computer Applications, 2010, 33(4):433-446.
[5] 姚奇富,李翠鳳,馬華林,張森. 灰色系統(tǒng)理論和馬爾柯夫鏈相結合的網(wǎng)絡流量預測方法[J].浙江大學學報(理學版),2007,34(4):396-400.
[6] 劉淵,戴悅,曹建華.基于小波神經(jīng)網(wǎng)絡的流量混沌時間序列預測[J].計算機工程,2008,34(16):105-106.
[7] 陳曉天,張順頤,田婷婷. 基于BP神經(jīng)網(wǎng)絡的IP網(wǎng)絡流量預測[J].南京郵電大學學報(自然科學版),2012, 30(2):16-21.
[8] 李松,羅勇,張銘銳. 遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡的混沌時間序列預測[J].計算機工程與應用,2011, 47(29):52-55.
[9] 趙振江. 基于PSO-BP神經(jīng)網(wǎng)絡的網(wǎng)絡流量預測與研究[J]. 計算機應用與軟件,2009,26(1):218-211.
[10] 張穎路. 基于遺傳算法優(yōu)化支持向量機的網(wǎng)絡流量預測[J].計算機科學,2008,35(5):177-179.
作者簡介:
劉春(1981-),男,碩士,四川建筑職業(yè)技術學院網(wǎng)絡管理中心,講師;主要研究方向和關注領域:計算機網(wǎng)絡管理。endprint
(3) 變異是個體染色體的基因以變異概率發(fā)生隨機質變的過程。
雜交和變異使后代中產生新個體,復制使父代的基因在子代中得以繼承,從而使生物物種在繼承的基礎上不斷進化。它可以避免局部優(yōu)化從而保證收斂的全局搜索性。
3遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡的網(wǎng)絡流量預測模型
(1) 收集網(wǎng)絡流量歷史數(shù)據(jù),并對其進行預處理。
(2) 初始化種群。隨機產生一組個體,每一個個體包括BP神經(jīng)網(wǎng)絡初始連接權值和初始閾值。
(3) 對個體進行解碼,根據(jù)相關聯(lián)函數(shù)法確定τ、m,并對網(wǎng)絡流量數(shù)據(jù)進行重構,并初始連接權值和閾值作為BP神經(jīng)網(wǎng)絡參數(shù)進行網(wǎng)絡流量訓練,根據(jù)預測結果計算個體適應度值。適應度函數(shù)f(x)定義如下:
f(x)=(y-)(9)
式中,y為BP神經(jīng)網(wǎng)絡的預測值,為網(wǎng)絡流量實際值,n表示訓練樣本個數(shù)。
(4) 采用最佳保留策略和輪盤賭選擇較優(yōu)的個體進行下一代。
(5) 根據(jù)交叉概率選擇兩個個體進行交叉操作,選擇最優(yōu)個體進行下一代。
(6) 根據(jù)變異概率選擇兩個個體進行變異操作,選擇最優(yōu)個體進行下一代。
(7) 判斷算法結束條件,若滿足結束條件則返回全局最優(yōu)個體,若不滿足,進化代數(shù)加1,并跳轉至(3)繼續(xù)優(yōu)化。
(8) 將最優(yōu)個體解碼成為BP神經(jīng)網(wǎng)絡的初始連接權值和閾值。
(9) 根據(jù)初始連接權值和閾值建立最優(yōu)網(wǎng)絡流量預測模型。
4仿真實驗
4.1數(shù)據(jù)來源
實驗數(shù)據(jù)來源于某學校網(wǎng)絡中心服務器,從2013年2月1日到2月21日每天網(wǎng)絡的每小時訪問流量,得到480個數(shù)據(jù),以前380個數(shù)據(jù)作為訓練集建立網(wǎng)絡流量預測模型,后100個數(shù)據(jù)作為測試集進行預測檢驗,具體如圖2所示。
4.2數(shù)據(jù)歸一化處理
BP神經(jīng)網(wǎng)絡模型在訓練時對在0-1之間的數(shù)據(jù)最為靈敏,然而實際網(wǎng)絡流量具有突變性,變化幅度較大,為了提高訓練的效率,對其進行歸一化處理,具體為:
x'=(10)
最后對網(wǎng)絡流量預測結果進行反歸一化處理,恢復真實預測值。
x=x'(xmax-xmin) +xmin(11)
式中x表示網(wǎng)絡流量原始數(shù)據(jù),xmin和xmax表示分別最小值和最大值。
4.3模型評價指標
為了說明GA-BPNN模型的有效性,在Matlab2021環(huán)境下進行仿真實驗。同時為了使GA-BPNN模型的預測結果具有可比性,采用標準BP神經(jīng)網(wǎng)絡(BPNN)作為對比模型。模型性能的評價指標為均方根誤差(root mean squared predict error,RMSE)和平均絕對百分誤差(mean absolute percentage error,MAPE),具體定義如下:
RMSE=(12)
MAPE=
×100(13)
式中y表示網(wǎng)絡流量實際觀測值,表示預測值。
4.4結果與分析
4.4.1 不含噪網(wǎng)絡流量的預測結果分析
首先采用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡參數(shù),然后采用最優(yōu)參數(shù)BP神經(jīng)網(wǎng)絡建立網(wǎng)絡流量預測模型,GA-BPNN、BPNN對測試集的預測結果及預測誤差如圖3和4所示。從圖3可知,GA-BPNN的預測結果與實際網(wǎng)絡流量的值相當吻合,十分接近,這表明GA-BPNN可用于現(xiàn)代復雜多變、隨機的網(wǎng)絡流量預測,同時從圖4可知,GA-BPNN的預測誤差相當小,可以滿足網(wǎng)絡流量預測精度的要求。
GA-BPNN與對比模型的預測誤差見表1。根據(jù)表1可知,相對于對比模型,GA-BPNN預測誤差更高,相應的網(wǎng)絡流量預測精度更高,這表明,GA-BPNN通過遺傳算法對BPNN參數(shù)優(yōu)化和選擇,克服BP神經(jīng)網(wǎng)絡等預測精度低的缺陷,GA-BPNN是一種精度高、預測結果可靠的網(wǎng)絡流量預測模型。
4.4.2 含噪網(wǎng)絡流量的預測結果分析
為了測試GA-BPNN的通用性,對一個含噪的網(wǎng)絡流量進行仿真實驗,含噪的網(wǎng)絡流量如圖5所示。GA-BPNN的含噪網(wǎng)絡流量數(shù)據(jù)預測結果及預測誤差如圖6和7所示。從圖6和7可知,對于含噪的網(wǎng)絡流量,GA-BPNN同樣獲得了較理想的預測結果,這表明GA-BPNN采用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡,獲得了較好的網(wǎng)絡流量訓練集,增加了模型的魯棒性和通用性,拓寬了GA-BPNN在網(wǎng)絡流量的應用范圍。
GA-BPNN與BPNN對含噪網(wǎng)絡流量預測誤差見表2。從表2可知,相對于對比模型,GA-BPNN的整體預測性能更優(yōu),建立了誤差更小的網(wǎng)絡流量預測模型,再一次證明了GA-BPNN的優(yōu)越性。
5結束語
為了提高網(wǎng)絡流量預測精度,針對BP神經(jīng)網(wǎng)絡參數(shù)優(yōu)化難題,提出一種遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡的網(wǎng)絡流量預測模型,仿真結果表明,GA-BPNN不僅提高了網(wǎng)絡流量的預測精度,為復雜多變的網(wǎng)絡流量提供了一種新的研究思路。
參考文獻
[1] Nguyen T T, Armitage G. A survey of techniques for internet traffic classification using machine learning [J]. IEEE Communications Surveys and Tutorials, 2008, 10(4):56-76.
[2] 馬華林.基于灰色模型和自適應過濾的網(wǎng)絡流量預測[J].計算機工程,2009,35(1):130-131.
[3] Mao Yongyi, Li Baochun. A factor graph approach to link loss monitoring in wireless sensor networks [J]. IEEE Journal on Selected Areas in Communications, 2006,23(4):820-829.
[4] Callado A, Keu R J, Sadok D, et a1.Better network traffic identification through the independent combination of techniques [J]. Journal of Network and Computer Applications, 2010, 33(4):433-446.
[5] 姚奇富,李翠鳳,馬華林,張森. 灰色系統(tǒng)理論和馬爾柯夫鏈相結合的網(wǎng)絡流量預測方法[J].浙江大學學報(理學版),2007,34(4):396-400.
[6] 劉淵,戴悅,曹建華.基于小波神經(jīng)網(wǎng)絡的流量混沌時間序列預測[J].計算機工程,2008,34(16):105-106.
[7] 陳曉天,張順頤,田婷婷. 基于BP神經(jīng)網(wǎng)絡的IP網(wǎng)絡流量預測[J].南京郵電大學學報(自然科學版),2012, 30(2):16-21.
[8] 李松,羅勇,張銘銳. 遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡的混沌時間序列預測[J].計算機工程與應用,2011, 47(29):52-55.
[9] 趙振江. 基于PSO-BP神經(jīng)網(wǎng)絡的網(wǎng)絡流量預測與研究[J]. 計算機應用與軟件,2009,26(1):218-211.
[10] 張穎路. 基于遺傳算法優(yōu)化支持向量機的網(wǎng)絡流量預測[J].計算機科學,2008,35(5):177-179.
作者簡介:
劉春(1981-),男,碩士,四川建筑職業(yè)技術學院網(wǎng)絡管理中心,講師;主要研究方向和關注領域:計算機網(wǎng)絡管理。endprint