李巧俠
(西安鐵路職業(yè)技術(shù)學院 土木工程學院, 西安 710600)
隨著互聯(lián)網(wǎng)絡(luò)的迅速發(fā)展,網(wǎng)絡(luò)成為人們交流和溝通的一種重要工具,再加上網(wǎng)絡(luò)上業(yè)務(wù)種類不斷增加,網(wǎng)絡(luò)流量值急劇增加,因此網(wǎng)絡(luò)流量的預測引起了人們的廣泛關(guān)注,但網(wǎng)絡(luò)流量受到經(jīng)濟、環(huán)境等因素綜合影響,變化具有隨性、混沌,同時受到上網(wǎng)時間、價格等因素影響,其變化十分復雜,如何提高網(wǎng)絡(luò)流量預測精度是網(wǎng)絡(luò)管理領(lǐng)域研究中重點[1-2]。
針對網(wǎng)絡(luò)流量預測問題,國內(nèi)外學者進行廣泛、深入的研究,提出許多優(yōu)秀的網(wǎng)絡(luò)流量預測模型[3],當前網(wǎng)絡(luò)流量預測值可以分為:基于傳統(tǒng)統(tǒng)計學理論的網(wǎng)絡(luò)流量預測模型[4-5],如線性回歸模型,它們是主要基于線性理論進行建模,假設(shè)網(wǎng)絡(luò)流量是一種單一線性變化規(guī)律,簡單、易實現(xiàn),但是實際網(wǎng)絡(luò)流量變化不是簡單的線性變化特點,同時具有非線性變化特點,如隨機性、時變性,導致該類模型的網(wǎng)絡(luò)流量預測誤差大[6-7]。另一類為基于現(xiàn)代統(tǒng)計學理論的網(wǎng)絡(luò)流量預測模型[8],其中神經(jīng)網(wǎng)絡(luò)應用廣泛,由于神經(jīng)網(wǎng)絡(luò)具有良好的非線性學習能力,獲得較理想的網(wǎng)絡(luò)流量預測結(jié)果[9-11]。神經(jīng)網(wǎng)絡(luò)在訓練過程中,要進行不斷迭代更新權(quán)值,收斂速度慢、大,易出現(xiàn)“過擬合”的網(wǎng)絡(luò)流量預測結(jié)果[12]。極限學習機(extreme learning machine,ELM)是一種學習速度的神經(jīng)網(wǎng)絡(luò),只需要進行一次迭代就可以完成神經(jīng)網(wǎng)絡(luò)的訓練,工作得到了大幅度。由于網(wǎng)絡(luò)流值變化十分復雜,單一模型無法獲得高精度的網(wǎng)絡(luò)流量預測結(jié)果[13]。
為了提高網(wǎng)絡(luò)流量的預測精度,提出了基于組合模型的網(wǎng)絡(luò)流量預測模型(WA-ELM)。首先采用小波分析(wavelet analysis,WA)對網(wǎng)絡(luò)流量進行多尺度分解,并對每一個分解分量進行混沌處理,然后通過極限學習機對混沌處理后的分解量進行預測,對它們的預測結(jié)果進行重構(gòu),最后與其它模型的仿真對比實驗,以驗證WA-ELM的有效性和優(yōu)越性。
相空間重構(gòu)的工作思想為:系統(tǒng)的任一分量演化由與其相互作用的分量決定,相關(guān)分量信息隱藏在該分量演化過程中,因此可通過分析某一分量的時間序列,了解原系統(tǒng)的動力學特性,提取和恢復出原系統(tǒng)的規(guī)律[13]。設(shè)網(wǎng)絡(luò)流量時間序列為:x(t),t=1,2,…,N,選擇嵌入維數(shù)m和延遲時間τ,可進行重構(gòu),得到一個多維向量序列X(t),挖掘隱藏于網(wǎng)絡(luò)流量時間序列的變化規(guī)律,恢復網(wǎng)絡(luò)流量的原動力系統(tǒng),如式(1)。
X(t)=x(t),x(t+τ),…,x[t+(m-1)τ]
(1)
式(1)中,M=N-(m-1)τ,M為相點個數(shù)。
小波分析可對信號進行多尺度細化,包括分解和重構(gòu)兩部分,其中Mallat算法是一種快速小波變換算法,具體為式(2)。
(2)
信號重構(gòu)形式為式(3)。
(3)
(4)
式(4)中,αi為連接權(quán)值;bi為回歸誤差;βi為輸出權(quán)值。
式(4)的矩陣形式為式(5)。
Hkβk=Tk
(5)
式(2)中的βk的值為式(6)。
(6)
ELM的回歸形式為式(7)。
βif(αix+bi)
(7)
ELM的學習步驟為:
(1) 當樣本比較多時,通過Sk得到初始輸出權(quán)值為式(8)。
(8)
(2) 將新數(shù)據(jù)(xk+1,tk+1)融入原始數(shù)據(jù)集中,輸出權(quán)值Pk+1與βk+1的為式(9)。
(9)
式(9)中,hk+1=[f(α1xk+1+b1)f(α2xk+1+b2)…f(αLxk+1+bl)]。
(3) 增加訓練樣本的長度,然后轉(zhuǎn)到(2)繼續(xù)執(zhí)行。
(4) 當全部訓練樣本學習完后,終止學習,建立相應的回歸模型。
(1) 對網(wǎng)絡(luò)流量進行小波分解,得到不同分量,并對不同分量進行相空間重構(gòu);
(2) 利用極限學習機對重構(gòu)后的低頻分量和高頻分量分別建立相應的網(wǎng)絡(luò)流量預測模型,得到低頻分量和高頻分量的預測結(jié)果;
(3) 最后對分量的預測結(jié)果進行重構(gòu)和融合,得到網(wǎng)絡(luò)流量預測結(jié)果。
WA-ELM的網(wǎng)絡(luò)流量預測模型工作流程,如圖1所示。
圖1 WA-ELM的網(wǎng)絡(luò)流量工作流程
為測試WA-ELM的網(wǎng)絡(luò)流量預測性能,采用http://newsfeed.ntcu.net/~news/2016/的主節(jié)點路由器的每小時網(wǎng)絡(luò)流量作為實驗對,收集1000個樣本,選擇100個樣本作為測試樣本,其它樣本作為訓練樣本。如圖2所示。
圖2 實驗數(shù)據(jù)
選擇單一極限學習機(ELM)、小波分析+BP神經(jīng)網(wǎng)絡(luò)(WA-BPNN)作為對比模型,采用平均相對百分比誤差(MPAE)和均方根誤差(RMSE)對預測結(jié)果進行評價,它們?yōu)楣?10)、(11)。
×100%
(10)
(11)
采用小波分析的Mallat算法對網(wǎng)絡(luò)流量進行分解,得到的低頻序列a1和高頻序列d1、d2,然后估計網(wǎng)絡(luò)流量的τ和m,結(jié)果如表1所示。
表1 各分量m和τ的值
根據(jù)表1中的τ和m分別對網(wǎng)絡(luò)流量時間序列的特征分量進行重構(gòu),得到各個分量的學習樣本。
3.3.1 單步預測結(jié)果
采用ELM對網(wǎng)絡(luò)流量的各分量進行學習,建立各分量的預測模型,得到各分量的預測結(jié)果,采用小波重構(gòu)對分量預測結(jié)果進行融合,得到網(wǎng)絡(luò)流量的最終預測結(jié)果,單步擬合和預測結(jié)果,如3所示。
(a) 擬合結(jié)果
(b) 預測結(jié)果
從圖3可知,WA-ELM可以有效擬合網(wǎng)絡(luò)流量變化特點,同時能夠?qū)W(wǎng)絡(luò)流量的變化趨勢進行準確刻畫,是一種擬合和預測精度均很高的網(wǎng)絡(luò)流量預測模型。
ELM、WA-BPNN和WA-ELM的單步預測誤差,如表2所示。
表2 單步預測性能比較
從表2可知,WA-ELM的MAPE和RMSE均小于ELM、WA-BPNN,這是因為采用小波分析可以對網(wǎng)絡(luò)流量進行細分,有助于網(wǎng)絡(luò)流量的建模,同時采用ELM可以更好反映網(wǎng)絡(luò)流量的變化趨勢。
3.3.2 多步預測結(jié)果
網(wǎng)絡(luò)流量建模主要是姨將來網(wǎng)絡(luò)流量變化趨勢進行估計,單步預測的時間提前量過小,常要進行網(wǎng)絡(luò)流量的多步預測,WA-ELM多步擬合和預測結(jié)果,如圖4所示(此處提前3步)。
(a) 擬合結(jié)果
(b) 預測結(jié)果
從圖4可以看出,WA-ELM的多步擬合和預測誤差要大于單步擬合和預測誤差,但是預測精度滿足實際應用要求,具有較好的泛化、推廣性能。
ELM、WA-BPNN和WA-ELM的單步預測誤差,如表3所示。
表3 多步預測性能比較
在表3中,ELM的網(wǎng)絡(luò)流量多步預測結(jié)果的MPAE和RMSE最大,次之為WA-BPNN,而MPAE和RMSE最小為WA-ELM,這表明WA-ELM集成了小波分析和極限學習機的優(yōu)點,構(gòu)建了整體性更優(yōu)的網(wǎng)絡(luò)流量預測模型,明顯改善了網(wǎng)絡(luò)流量的預測效果。
網(wǎng)絡(luò)流量是多種因素的綜合結(jié)果,因此具有隨機性、周期性、混沌性變化特點,再加網(wǎng)絡(luò)業(yè)務(wù)數(shù)量增加,網(wǎng)絡(luò)擁塞頻率日益頻繁,網(wǎng)絡(luò)流量的預測結(jié)果可以幫助管理人員提前了解網(wǎng)絡(luò)流量的變化態(tài)勢,對其進行研究具有重要意義。針對單一模型無法準確描述網(wǎng)絡(luò)流量變化特點,提出了WA-ELM的網(wǎng)絡(luò)流量預測模型,并通過仿真實驗得到如下結(jié)論:
(1) 采用小波分析對網(wǎng)絡(luò)流量數(shù)據(jù)進行分解,得到更加細微的網(wǎng)絡(luò)流量變化特點,有助于挖掘網(wǎng)絡(luò)流量的變化態(tài)勢,提高了網(wǎng)絡(luò)流量的預測精度。
(2) 采用混沌理論對網(wǎng)絡(luò)流量的分解進行相空間重構(gòu),將一維時間數(shù)據(jù)變化多維時間序列,挖掘網(wǎng)絡(luò)流量數(shù)據(jù)之間的時間變化關(guān)系,有利于后續(xù)的網(wǎng)絡(luò)流量建模與預測。
(3) 采用極限學習機對網(wǎng)絡(luò)流量數(shù)據(jù)進行學習,建立了理想的網(wǎng)絡(luò)流量預測模型,獲得了比其它模型更好的網(wǎng)絡(luò)流量預測結(jié)果,具有更高的實際應用價值。