陳衛(wèi)軍,金顯華
(安陽(yáng)師范學(xué)院 軟件學(xué)院,河南 安陽(yáng) 455000)
隨著網(wǎng)絡(luò)的迅速發(fā)展,網(wǎng)絡(luò)上承載的業(yè)務(wù)和應(yīng)用日益豐富.因此加強(qiáng)網(wǎng)絡(luò)管理是運(yùn)營(yíng)商們急需解決的問(wèn)題.有效地提高網(wǎng)絡(luò)運(yùn)行速度和利用率,網(wǎng)絡(luò)峰值起到?jīng)Q定性作用.網(wǎng)絡(luò)峰值預(yù)測(cè)是業(yè)務(wù)管理的關(guān)鍵問(wèn)題,網(wǎng)絡(luò)峰值的精確性、實(shí)時(shí)性和廣譜性直接關(guān)系到業(yè)務(wù)管理的效率和性能.網(wǎng)絡(luò)峰值預(yù)測(cè)就是對(duì)尚未發(fā)生和目前還不明確的網(wǎng)絡(luò)信息,根據(jù)過(guò)去和現(xiàn)在的網(wǎng)絡(luò)信息進(jìn)行預(yù)先的估計(jì)和推測(cè),即在一定的算法模型下對(duì)未來(lái)一段時(shí)間內(nèi)的網(wǎng)絡(luò)峰值信息的發(fā)展趨勢(shì)、方向和可能的狀態(tài)做出合理的、在允許誤差范圍內(nèi)的推斷.網(wǎng)絡(luò)峰值的預(yù)測(cè)涉及網(wǎng)絡(luò)流量、網(wǎng)絡(luò)信號(hào)強(qiáng)度和網(wǎng)路峰值范圍等多種因素,因此研究網(wǎng)絡(luò)峰值預(yù)測(cè)算法,具有重大的理論和實(shí)踐意義,而相關(guān)模型的構(gòu)建和算法研究受到人們的關(guān)注[1].
對(duì)網(wǎng)絡(luò)峰值走勢(shì)的預(yù)測(cè)模型構(gòu)建,根本上是對(duì)一組影響網(wǎng)絡(luò)峰值的樣本數(shù)據(jù)的處理,這個(gè)處理過(guò)程是對(duì)這個(gè)樣本序列進(jìn)行估計(jì)預(yù)報(bào)的過(guò)程.傳統(tǒng)方法中,主要采用線性模型或者等效近似的線性模型對(duì)網(wǎng)絡(luò)峰值影響的樣本序列進(jìn)行處理和分析,并取得了一定的研究成果.文獻(xiàn)[2]提出一種基于改進(jìn)灰色神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)峰值走勢(shì)分析模型,但算法僅僅考慮樣本序列的線性成分,對(duì)灰色關(guān)聯(lián)的非線性成分的處理沒(méi)有納入分析范疇,導(dǎo)致預(yù)測(cè)精度不高.文獻(xiàn)[3]構(gòu)建了一種網(wǎng)絡(luò)流量、網(wǎng)絡(luò)信號(hào)強(qiáng)度和網(wǎng)絡(luò)峰值的關(guān)聯(lián)模型,對(duì)網(wǎng)絡(luò)峰值預(yù)測(cè)精度較好,但是算法模型需要從長(zhǎng)期均衡角度上看網(wǎng)絡(luò)流量對(duì)網(wǎng)絡(luò)峰值的影響,實(shí)踐中操作困難.文獻(xiàn)[4]提出一種基于貝葉斯估計(jì)的動(dòng)態(tài)隨機(jī)一般均衡模型,實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)峰值與網(wǎng)絡(luò)管理者的調(diào)控模型,但算法不能夠準(zhǔn)確地?cái)M合諸多非線性動(dòng)力模型影響下的網(wǎng)絡(luò)峰值預(yù)測(cè),導(dǎo)致對(duì)網(wǎng)絡(luò)峰值預(yù)測(cè)精度不好,且算法開(kāi)銷(xiāo)較大.
針對(duì)上述問(wèn)題,提出一種采用最大共軛梯度連續(xù)泛函的網(wǎng)絡(luò)峰值預(yù)測(cè)算法.算法首先建立簡(jiǎn)單的SVM模型,在SVM模型的基礎(chǔ)上,采用PCA方法實(shí)現(xiàn)對(duì)原始網(wǎng)絡(luò)峰值波動(dòng)序列的加權(quán)平滑處理,采用最大共軛梯度連續(xù)泛函的樣本序列數(shù)學(xué)處理方法實(shí)現(xiàn)預(yù)測(cè)算法的改進(jìn).仿真實(shí)驗(yàn)驗(yàn)證了網(wǎng)絡(luò)峰值預(yù)測(cè)算法的有效性.
首先需要進(jìn)行統(tǒng)計(jì)模型的構(gòu)建,在網(wǎng)絡(luò)峰值預(yù)測(cè)算法設(shè)計(jì)中,需要建立一個(gè)包含網(wǎng)絡(luò)流量、網(wǎng)絡(luò)信號(hào)強(qiáng)度和網(wǎng)絡(luò)峰值的SVM模型,采用SVM模型的主成分分析方法實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)峰值的PCA估計(jì)系統(tǒng)設(shè)計(jì)[5].網(wǎng)絡(luò)峰值估計(jì)和預(yù)測(cè)的SVM模型是基于數(shù)據(jù)的統(tǒng)計(jì)性質(zhì)建立的模型,選取我國(guó)2006年3月到2013年10月的網(wǎng)絡(luò)峰值月度數(shù)據(jù)作為原始數(shù)據(jù)樣本序列,樣本序列數(shù)學(xué)表達(dá)式為
U={U1,U2,U3,…,UN},
(1)
其中Ui為維數(shù)為d維的隨機(jī)變量,各個(gè)隨機(jī)變量Ui之間是相互獨(dú)立的.峰值影響的參量模型中,峰值增長(zhǎng)率選取1~3年短期增長(zhǎng)率數(shù)據(jù)[6-8],增長(zhǎng)率序列的概率密度函數(shù)為:
(2)
(3)
在建模前,對(duì)各變量數(shù)據(jù)進(jìn)行自然對(duì)數(shù)變換,峰值波動(dòng)數(shù)據(jù)X符合穩(wěn)定分布特征,記為X~sα(σ,β,μ),β的最大似然估計(jì)可通過(guò)求各數(shù)列的單位根檢驗(yàn)和協(xié)整檢驗(yàn)得到.當(dāng)V為連續(xù)變量,則特征函數(shù)滿足:
Φ(ω)=E[ejωX]=
(4)
式(4)表示一個(gè)包含網(wǎng)絡(luò)流量、網(wǎng)絡(luò)信號(hào)強(qiáng)度和網(wǎng)絡(luò)峰值3個(gè)內(nèi)生變量的網(wǎng)絡(luò)峰值波動(dòng)模型,其模型的數(shù)學(xué)表達(dá)式為
(5)
式(5)中,n=1,2,…,N;υi(x)為一個(gè)k維內(nèi)生變量.在網(wǎng)絡(luò)峰值關(guān)聯(lián)參數(shù)估計(jì)中,增長(zhǎng)率為m取得一維數(shù)組Xn,它表示約束算法下最大化消耗指數(shù),與之最相關(guān)的網(wǎng)絡(luò)流失率為Xη(n),從而構(gòu)建得到能影響網(wǎng)絡(luò)峰值關(guān)聯(lián)預(yù)測(cè)影響因素的均衡方程:
(6)
式(6)中,通過(guò)最大共軛梯度連續(xù)泛函,在奇異半正定性雙周期性復(fù)分析下,得到迭代對(duì)數(shù)似然函數(shù)sgn(ω)的期望值,由此實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)峰值關(guān)聯(lián)預(yù)測(cè).峰值影響的參數(shù)取值面積示意圖如圖1所示.
圖1 網(wǎng)絡(luò)峰值影響的參數(shù)取值面積示意圖
對(duì)網(wǎng)絡(luò)峰值的研究,首先是把峰值樣本序列當(dāng)作一個(gè)時(shí)間序列,采用信號(hào)處理學(xué)科的理論進(jìn)行.因此,要對(duì)網(wǎng)絡(luò)峰值使用信號(hào)處理方法進(jìn)行原始數(shù)據(jù)的預(yù)處理.
dm(0)=‖Xm-Xk‖.
(7)
式(7)中,Xm和Xk通過(guò)一步發(fā)展演變?yōu)閄m+1和Xk+1,由此為實(shí)現(xiàn)峰值的準(zhǔn)確預(yù)測(cè)提供數(shù)據(jù)基礎(chǔ).采用最大共軛梯度連續(xù)泛函方法,得到n+m+k(k>0)時(shí)刻數(shù)據(jù)的預(yù)測(cè)值,它表示為兩向量增長(zhǎng)變化分類(lèi)的指數(shù):
‖Xm+1-Xk+1‖=‖Xm-Xk‖eλ1.
(8)
式(8)中,Xm+1的最末分量x(tn+1)未知,且唯有它是未知的.其計(jì)算式表達(dá)為:
Xm+1(m)=Xk+1(m)±
(9)
式(9)中:dm(0)表示脈沖響應(yīng)函數(shù)分別分析利率,Xm+1(i)表示網(wǎng)絡(luò)流量對(duì)網(wǎng)絡(luò)峰值的影響貢獻(xiàn)程度,Xk+1(i)表示樣本個(gè)數(shù).由此建立了簡(jiǎn)單的SVM模型,在SVM模型的基礎(chǔ)上,結(jié)合最大共軛梯度連續(xù)泛函,實(shí)現(xiàn)對(duì)原始峰值波動(dòng)序列的加權(quán)平滑處理與準(zhǔn)確預(yù)測(cè).
首先對(duì)初始條件不同的網(wǎng)絡(luò)峰值進(jìn)行在線評(píng)估,峰值波動(dòng)曲線在運(yùn)動(dòng)發(fā)展的過(guò)程中,隨著時(shí)間的進(jìn)程呈現(xiàn)指數(shù)分離.考慮網(wǎng)絡(luò)流量和網(wǎng)絡(luò)信號(hào)強(qiáng)度對(duì)網(wǎng)絡(luò)峰值的貢獻(xiàn),采用輔助矩陣的方法,進(jìn)行最大共軛梯度連續(xù)泛函,最大共軛梯度為:
(10)
在考慮峰值因素和網(wǎng)絡(luò)流失的情況下,采取一次性總付的形式增加的峰值預(yù)算約束化成本,引入網(wǎng)絡(luò)峰值指數(shù)的同比增長(zhǎng)率,得到新的狀態(tài)項(xiàng)為
(11)
最大共軛梯度連續(xù)泛函下的峰值序列的主成分分析結(jié)構(gòu)狀態(tài)項(xiàng)和積分叉積項(xiàng)分別表示為:
(12)
(13)
由于網(wǎng)絡(luò)信號(hào)強(qiáng)度和網(wǎng)絡(luò)峰值互為影響,因此可以對(duì)數(shù)據(jù)的統(tǒng)計(jì)模型進(jìn)行連續(xù)泛函求導(dǎo),得到峰值關(guān)聯(lián)預(yù)測(cè)的目標(biāo)函數(shù)為:
FY(χ;α,λ)=1-
(14)
根據(jù)上述分析,得到本文提出的最大共軛梯度連續(xù)泛函的網(wǎng)絡(luò)峰值預(yù)測(cè)算法實(shí)現(xiàn)的關(guān)鍵步驟描述如下.
(1)分別對(duì)網(wǎng)絡(luò)峰值對(duì)數(shù)hj-1(t)的局部極大值和極小值點(diǎn)進(jìn)行插值擬合,對(duì)數(shù)據(jù)的處理以及模型估計(jì)采用方差分解的方法,對(duì)網(wǎng)絡(luò)峰值進(jìn)行SVM擬合,計(jì)算包絡(luò)線的均值曲線mj-1(t).
(2)考察增長(zhǎng)率波動(dòng)以及網(wǎng)絡(luò)流量對(duì)網(wǎng)絡(luò)峰值的影響貢獻(xiàn)程度,從hj-1(t)中去掉均值曲線得到hj(t),即:
hj(t)=hj-1(t)-mj-1(t).
(15)
(3)考察hj-1(t)和hj(t)是否滿足網(wǎng)絡(luò)峰值對(duì)數(shù)和增長(zhǎng)率的突發(fā)性變化和尺度特性篩選終止條件,即:
(16)
當(dāng)滿足上述條件,依據(jù)協(xié)整檢驗(yàn)結(jié)果,可以得到協(xié)整方程,并利用支持向量機(jī)SVM模型對(duì)網(wǎng)絡(luò)峰值波動(dòng)的關(guān)聯(lián)特征進(jìn)行預(yù)測(cè):
ri(t)=ti-1(t)-ci(t).
(17)
(4)若i=i+1的極值點(diǎn)不少于兩個(gè),則i=i+1,并轉(zhuǎn)到(3),否則分解完成,ri(t)為殘余量.得到預(yù)測(cè)后的協(xié)整向量為:
(18)
(5)估計(jì)AR特征多項(xiàng)式的特征系數(shù),對(duì)峰值關(guān)聯(lián)特征進(jìn)行狀態(tài)信息融合處理,減少預(yù)測(cè)誤差,得到預(yù)測(cè)結(jié)果為:
(19)
(20)
(6)令t=t+1,跳轉(zhuǎn)到步驟(1),重復(fù)計(jì)算下一時(shí)刻樣本數(shù)據(jù),直至結(jié)束.
(7)算法結(jié)束.
為了測(cè)試本文算法對(duì)網(wǎng)絡(luò)峰值預(yù)測(cè)模型的性能,需要進(jìn)行仿真實(shí)驗(yàn),分析工具為Matlab,對(duì)網(wǎng)絡(luò)峰值對(duì)數(shù)、網(wǎng)絡(luò)流量對(duì)數(shù)等參數(shù)進(jìn)行分析比對(duì).上述參數(shù)分別表示為:
表1 網(wǎng)絡(luò)峰值的協(xié)整向量估計(jì)表(104T)
在網(wǎng)絡(luò)峰值影響因素中,網(wǎng)絡(luò)流量具有持續(xù)性,網(wǎng)絡(luò)信號(hào)強(qiáng)度起到關(guān)鍵作用,影響較大[9].根據(jù)上述參數(shù)設(shè)計(jì)和算法處理分析,得到原始峰值數(shù)據(jù)的樣本波形圖如圖2所示.
以此為研究對(duì)象,對(duì)數(shù)據(jù)序列進(jìn)行最大共軛梯度連續(xù)泛函預(yù)處理和平滑處理,然后采用本文算法和傳統(tǒng)方法進(jìn)行峰值關(guān)聯(lián)預(yù)測(cè),得到預(yù)測(cè)結(jié)果如圖3所示.圖3中給出了本文算法模型下對(duì)網(wǎng)絡(luò)峰值預(yù)測(cè)結(jié)果和預(yù)測(cè)誤差.
分析圖3中的結(jié)果可見(jiàn),采用本文算法,預(yù)測(cè)精度較高,預(yù)測(cè)誤差控制在1.5%以內(nèi).采用傳統(tǒng)方法對(duì)網(wǎng)絡(luò)峰值進(jìn)行預(yù)測(cè),誤差較大,對(duì)網(wǎng)絡(luò)峰值的宏觀調(diào)控指導(dǎo)意義受限.本文方法使得預(yù)測(cè)誤差得到有效控制,且能實(shí)現(xiàn)對(duì)各種影響因素的關(guān)聯(lián)性分析,實(shí)現(xiàn)關(guān)聯(lián)預(yù)測(cè).
圖2 原始的網(wǎng)絡(luò)峰值數(shù)據(jù)的樣本波形圖
(a) 預(yù)測(cè)值 (b) 預(yù)測(cè)誤差分析
隨著網(wǎng)絡(luò)的迅速發(fā)展,網(wǎng)絡(luò)上承載的業(yè)務(wù)和應(yīng)用日益豐富.傳統(tǒng)的方法對(duì)網(wǎng)絡(luò)峰值進(jìn)行預(yù)測(cè)只是單一采用線性或者非線性的方法進(jìn)行處理,這種片面性造成預(yù)測(cè)的準(zhǔn)確度和實(shí)時(shí)性難以保證.本文提出一種采用最大共軛梯度連續(xù)泛函的網(wǎng)絡(luò)峰值預(yù)測(cè)算法,實(shí)現(xiàn)對(duì)原始峰值波動(dòng)序列的加權(quán)平滑處理,采用最大共軛梯度連續(xù)泛函的樣本序列數(shù)學(xué)處理方法,實(shí)現(xiàn)預(yù)測(cè)算法的改進(jìn).實(shí)驗(yàn)結(jié)果顯示,本文的預(yù)測(cè)模型和算法設(shè)計(jì),預(yù)測(cè)精度較高,預(yù)測(cè)誤差控制在1.5%以內(nèi),且能實(shí)現(xiàn)對(duì)各種影響因素的關(guān)聯(lián)性分析,性能優(yōu)越,可以有效提高網(wǎng)絡(luò)運(yùn)行速度和利用率.