国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大型IP網(wǎng)絡(luò)流量矩陣分析預(yù)測(cè)的探討研究

2024-11-23 00:00:00韋烜劉志華李青何曉明黃君雅
關(guān)鍵詞:網(wǎng)絡(luò)流量流向流量

摘要: 高效、準(zhǔn)確的網(wǎng)際協(xié)議(internet protocol, IP)網(wǎng)絡(luò)流量流向分析預(yù)測(cè)是網(wǎng)絡(luò)規(guī)劃建設(shè)的基礎(chǔ)。通過(guò)部署流量采集分析系統(tǒng),運(yùn)營(yíng)商可輕松獲取網(wǎng)絡(luò)總流量、節(jié)點(diǎn)流量、節(jié)點(diǎn)分方向流量等較完備的歷史基礎(chǔ)數(shù)據(jù),為流量分析預(yù)測(cè)提供關(guān)鍵的輸入。IP網(wǎng)絡(luò)流量分析預(yù)測(cè)方法主要包括兩類(lèi):傳統(tǒng)統(tǒng)計(jì)模型和神經(jīng)網(wǎng)絡(luò)模型,近年提出的NeuralProphet模型因結(jié)合兩者優(yōu)點(diǎn)而得到廣泛關(guān)注和應(yīng)用。首次基于NeuralProphet模型對(duì)大型運(yùn)營(yíng)級(jí)IP網(wǎng)絡(luò)源節(jié)點(diǎn)到目的節(jié)點(diǎn)的流量流向進(jìn)行直接預(yù)測(cè),并采用改進(jìn)的損失函數(shù)優(yōu)化模型訓(xùn)練,預(yù)測(cè)結(jié)果表明NeuralProphet模型能夠更科學(xué)、準(zhǔn)確地預(yù)測(cè)IP網(wǎng)絡(luò)流量矩陣,整體預(yù)測(cè)精度提升了8.7%,同時(shí)模型擴(kuò)展性和魯棒性也具有更佳的表現(xiàn),可以更好地滿(mǎn)足IP網(wǎng)絡(luò)規(guī)劃建設(shè)和運(yùn)行維護(hù)的實(shí)際需求。

關(guān)鍵詞: 流量矩陣; 源節(jié)點(diǎn)到目的節(jié)點(diǎn)流量流向; 節(jié)點(diǎn)流量; 預(yù)測(cè)模型; 自回歸

中圖分類(lèi)號(hào): TN 915

文獻(xiàn)標(biāo)志碼: A

DOI:10.12305/j.issn.1001-506X.2024.06.35

Research on analysis and prediction of traffic matrix for large-scale IP network

WEI Xuan1, LIU Zhihua1,*, LI Qing2, HE Xiaoming1, HUANG Junya1

(1. Guangdong Research Institute of China Telecom Corporation Limited, Guangzhou 510630, China; 2. Research Institute of China Telecom Corporation Limited, Shanghai 200123, China)

Abstract: Efficient and accurate analysis and prediction of traffic flow direction for Internet protocol (IP) network are the basis of network planning and construction. By deploying a traffic collection and analysis system, operators can easily obtain comprehensive historical data such as network total traffic, node traffic, and node directional traffic, which provides key inputs for traffic analysis and prediction. Methods of traffic analysis and prediction for IP network are generally divided into two categories: traditional statistical model and neural network model. The NeuralProphet model proposed in recent years has been widely applied due to its combination of the advantages of the above models. It is the first time to directly predict the origin-destination traffic flow of large-scale carrier-grade IP network based on the NeuralProphet model, and adopts the improved loss function to optimize model training. The prediction results show that the NeuralProphet model can predict traffic matrix of IP network more scientifically and accurately, and the overall prediction accuracy was improved by 8.7%. Meanwhile, the model has better scalability and robustness, which can better meet the actual needs of IP network planning and maintenance.

Keywords: traffic matrix; origin-destination traffic flow; node traffic; prediction model; auto-regression

0 引 言

隨著大量互聯(lián)網(wǎng)業(yè)務(wù)應(yīng)用的風(fēng)起云涌、層出不窮,運(yùn)營(yíng)級(jí)網(wǎng)際協(xié)議(internet protocol, IP)承載網(wǎng)的業(yè)務(wù)流量也長(zhǎng)期持續(xù)暴漲,目前總體流量仍以約20%的年增長(zhǎng)率高速增長(zhǎng)。為了滿(mǎn)足上層應(yīng)用和業(yè)務(wù)快速發(fā)展的承載需求,運(yùn)營(yíng)商必須提前策劃和布局IP網(wǎng)絡(luò)的整體結(jié)構(gòu)、設(shè)備選型、鏈路帶寬設(shè)計(jì)等重要事項(xiàng),而高效、準(zhǔn)確的IP網(wǎng)絡(luò)流量流向分析預(yù)測(cè)則是以上網(wǎng)絡(luò)規(guī)劃、擴(kuò)容建設(shè)等決策工作的前提和依據(jù),同時(shí)也是及時(shí)發(fā)現(xiàn)網(wǎng)絡(luò)異常情況、處理突發(fā)故障、保障IP網(wǎng)絡(luò)長(zhǎng)期穩(wěn)定、可靠運(yùn)行的關(guān)鍵。

流量數(shù)據(jù)是IP網(wǎng)絡(luò)運(yùn)營(yíng)管理的重要基礎(chǔ)數(shù)據(jù),通過(guò)采集和監(jiān)測(cè)流量數(shù)據(jù),運(yùn)營(yíng)商可以了解整個(gè)網(wǎng)絡(luò)的運(yùn)行態(tài)勢(shì)、網(wǎng)絡(luò)負(fù)載情況等,并為未來(lái)網(wǎng)絡(luò)的規(guī)劃和建設(shè)運(yùn)營(yíng)提供數(shù)據(jù)支持。目前,大型運(yùn)營(yíng)級(jí)IP網(wǎng)絡(luò)流量的常規(guī)監(jiān)測(cè)采集方式主要有兩種:一種基于簡(jiǎn)單網(wǎng)絡(luò)管理協(xié)議(simple network management protocol, SNMP)進(jìn)行流量采集[1-3,一種基于xFlow流技術(shù)進(jìn)行網(wǎng)絡(luò)流量流向的采集[4-6。作為一種最常用的網(wǎng)絡(luò)基本流量采集方法,SNMP通過(guò)采集網(wǎng)絡(luò)節(jié)點(diǎn)或者鏈路的SNMP信息來(lái)獲取網(wǎng)絡(luò)關(guān)鍵點(diǎn)的流量數(shù)據(jù)。SNMP是標(biāo)準(zhǔn)的傳輸控制協(xié)議/IP(transmission control protocol/IP, TCP/IP)網(wǎng)絡(luò)管理協(xié)議,能夠支持所有的網(wǎng)絡(luò)設(shè)備,部署相對(duì)靈活、簡(jiǎn)單,但缺點(diǎn)是功能單一、信息量少,缺少流量的來(lái)源和去向等關(guān)鍵信息,因而只適用于流量大小的采集而無(wú)法進(jìn)行流量流向的分析?;趚Flow流技術(shù)的數(shù)據(jù)采集是利用網(wǎng)絡(luò)設(shè)備中各類(lèi)netFlow、sFlow等網(wǎng)絡(luò)流量采集分析方法,通過(guò)抽樣技術(shù)(按不同需求抽樣比從100到10 000不等)記錄設(shè)備端口或網(wǎng)絡(luò)鏈路中包含五元組、業(yè)務(wù)類(lèi)型、地址池、自治系統(tǒng)(autonomous system, AS)號(hào)或路由信息在內(nèi)的流量大小,從而可為流向、流量及業(yè)務(wù)分布等分析提供詳細(xì)的數(shù)據(jù)素材,適用于各類(lèi)網(wǎng)絡(luò)流量的監(jiān)測(cè)和分析。但xFlow流技術(shù)需要設(shè)備開(kāi)啟xFlow功能,xFlow對(duì)設(shè)備CPU、存儲(chǔ)等資源的占用會(huì)造成轉(zhuǎn)發(fā)性能的部分損失,另外還需要同時(shí)部署較大規(guī)模的流量分析系統(tǒng)。因此,綜合考慮成本代價(jià)和運(yùn)營(yíng)管理目標(biāo)之間的平衡,相對(duì)于SNMP從一開(kāi)始就進(jìn)行地毯式的廣泛部署,xFlow流技術(shù)近十年才開(kāi)始主要在大型運(yùn)營(yíng)級(jí)IP網(wǎng)絡(luò)的網(wǎng)絡(luò)接入點(diǎn)、網(wǎng)絡(luò)出口點(diǎn)等關(guān)鍵節(jié)點(diǎn)進(jìn)行實(shí)施開(kāi)啟。通過(guò)部署SNMP和xFlow技術(shù),運(yùn)營(yíng)商可以方便地獲取到網(wǎng)絡(luò)總流量、節(jié)點(diǎn)總流量、節(jié)點(diǎn)分方向流量等較完備的歷史基礎(chǔ)數(shù)據(jù),為后續(xù)的IP網(wǎng)絡(luò)規(guī)劃和運(yùn)營(yíng)提供了決策依據(jù)。

IP互聯(lián)網(wǎng)本質(zhì)是應(yīng)用驅(qū)動(dòng)型的網(wǎng)絡(luò),在海量、瞬息萬(wàn)變的短尾應(yīng)用與用戶(hù)行為日益復(fù)雜的環(huán)境下,捕捉和分析大量應(yīng)用的總體流量特征并準(zhǔn)確預(yù)測(cè)流量流向分布成為一個(gè)亟需攻克的難題。IP網(wǎng)絡(luò)流量所具有的自相似性、長(zhǎng)相關(guān)性、混沌性、突發(fā)性等新特點(diǎn)也導(dǎo)致傳統(tǒng)泊松流量模型無(wú)法再適用[7-8,因而需要在實(shí)踐中不斷研究探索以尋找更科學(xué)的理論模型和預(yù)測(cè)方法。迄今為止,應(yīng)用于IP網(wǎng)絡(luò)流量分析預(yù)測(cè)的模型大體分為兩類(lèi):傳統(tǒng)統(tǒng)計(jì)方法[9-13和神經(jīng)網(wǎng)絡(luò)模型方法14-20。傳統(tǒng)統(tǒng)計(jì)模型因難以描述流量的非線性而表現(xiàn)欠佳,而神經(jīng)網(wǎng)絡(luò)模型盡管能較好地捕捉非線性特性,但普遍存在“黑盒子”的弊端,且對(duì)數(shù)據(jù)量有較高要求,這對(duì)于具有較少歷史數(shù)據(jù)量(如按月、年采集)的長(zhǎng)期網(wǎng)絡(luò)流量預(yù)測(cè)是一個(gè)較大的挑戰(zhàn)。另外,目前這些方法大多只適用于網(wǎng)絡(luò)總流量、節(jié)點(diǎn)流量大小的預(yù)測(cè),而對(duì)于源節(jié)點(diǎn)到目的節(jié)點(diǎn)(origin-destination, OD)的流量矩陣或OD流量流向的預(yù)測(cè)尚處于起步階段。相對(duì)于網(wǎng)絡(luò)總流量、節(jié)點(diǎn)流量,流量矩陣的研究至關(guān)重要,因?yàn)樗辛髁康姆治鲱A(yù)測(cè)最終都需要轉(zhuǎn)化為明確的流量流向分布,才能在實(shí)際的帶寬規(guī)劃或工程運(yùn)營(yíng)中真正發(fā)揮作用。

在xFlow技術(shù)大范圍部署之前,運(yùn)營(yíng)商只能直接獲取和分析網(wǎng)絡(luò)節(jié)點(diǎn)流量的大小,流量流向分布的獲取必須通過(guò)一些近似方法(如吸引系數(shù)法、矩陣估計(jì)法等[21-22)來(lái)構(gòu)造節(jié)點(diǎn)間的比例關(guān)系,然后再將節(jié)點(diǎn)流量按比例分配到比例矩陣中,從而得到整個(gè)運(yùn)營(yíng)級(jí)IP網(wǎng)絡(luò)的流量矩陣。這些方法通常比較粗糙,流量矩陣的預(yù)測(cè)主要基于節(jié)點(diǎn)流量來(lái)進(jìn)行,人為構(gòu)造的比例矩陣成為模型誤差的主要來(lái)源。而xFlow的部署為基于直接獲取的網(wǎng)絡(luò)流量流向分布來(lái)進(jìn)行探索研究創(chuàng)造了條件,運(yùn)營(yíng)級(jí)IP網(wǎng)絡(luò)流量矩陣的分析預(yù)測(cè)得以進(jìn)入到嶄新的發(fā)展階段。在此基礎(chǔ)上,本文首次基于NeuralProphet模型直接對(duì)中國(guó)電信大型運(yùn)營(yíng)級(jí)IP網(wǎng)絡(luò)的OD流量流向進(jìn)行預(yù)測(cè),并采用改進(jìn)的Huber函數(shù)作為損失函數(shù),從而加快和優(yōu)化了模型的訓(xùn)練過(guò)程。同時(shí),對(duì)比基于傳統(tǒng)時(shí)間序列分析的差分整合移動(dòng)平均自回歸(auto-regressive integrated moving average, ARIMA)模型和Prophet模型預(yù)測(cè)節(jié)點(diǎn)流量、進(jìn)而通過(guò)按比例分配得到預(yù)測(cè)流量矩陣的其他兩種方法,預(yù)測(cè)結(jié)果表明NeuralProphet模型兼具傳統(tǒng)統(tǒng)計(jì)模型的可解釋性和神經(jīng)網(wǎng)絡(luò)的強(qiáng)大擴(kuò)展性,能夠更科學(xué)地預(yù)測(cè)IP網(wǎng)絡(luò)流量矩陣并獲得準(zhǔn)確性、擴(kuò)展性和魯棒性更佳的結(jié)果。

1 預(yù)測(cè)方法

1.1 NeuralProphet模型

NeuralProphet模型是一種結(jié)合了傳統(tǒng)統(tǒng)計(jì)模型和神經(jīng)網(wǎng)絡(luò)模型優(yōu)點(diǎn)的新型混合模型[23,繼承了其前身Prophet模型[24及其他時(shí)間序列模型的模塊化分解的核心思想,模型本質(zhì)上將一個(gè)時(shí)間序列分解為多個(gè)獨(dú)立的不同組成模塊,每個(gè)組成模塊都有各自的輸入和建模過(guò)程,為預(yù)測(cè)模型貢獻(xiàn)相應(yīng)的組成分量。NeuralProphet模型的各個(gè)模塊如下所示:

?(t)=T(t)+S(t)+E(t)+F(t)+A(t)+L(t)(1)

式中:?(t)是所研究的目標(biāo)時(shí)間序列;T(t)是趨勢(shì)分量;S(t)是季節(jié)分量;E(t)是事件和節(jié)假日效應(yīng);F(t)是外生變量在未來(lái)時(shí)間t的回歸效應(yīng);A(t)是基于過(guò)去觀測(cè)的時(shí)間t的自回歸(auto-regressive, AR)效應(yīng);L(t)是t時(shí)刻外生變量滯后觀測(cè)的回歸效應(yīng)。

對(duì)應(yīng)于本文所研究的大型IP網(wǎng)絡(luò)流量矩陣的分析預(yù)測(cè),由于流量采集的周期為月份數(shù)據(jù),且并未考慮其他外生變量的滯后回歸及未來(lái)影響的效應(yīng),因此此時(shí)NeuralProphet模型沒(méi)有節(jié)假日效應(yīng)E(t)、未來(lái)回歸項(xiàng)F(t)及滯后回歸項(xiàng)L(t),式(1)可以簡(jiǎn)化為

?(t)=T(t)+S(t)+A(t)(2)

1.1.1 趨勢(shì)分量T(t)

趨勢(shì)分量的經(jīng)典建模方法可以歸結(jié)為求解偏移量m和增長(zhǎng)率k的問(wèn)題,NeuralProphet模型允許增長(zhǎng)率在多個(gè)位置上發(fā)生變化,這些位置稱(chēng)之為變點(diǎn),此時(shí)趨勢(shì)分量被建模為連續(xù)分段線性函數(shù)系列。如果變點(diǎn)選擇得當(dāng)且數(shù)量充足,理論上任何非線性增長(zhǎng)都可以通過(guò)分段線性進(jìn)行擬合,這使得分段線性增長(zhǎng)趨勢(shì)可以適用于線性或非線性的任何場(chǎng)景,同時(shí)具有很好的解釋性。由于分段線性函數(shù)中的偏移量m和增長(zhǎng)率k其實(shí)是隨著時(shí)間而變化的,因此定義時(shí)間相關(guān)的增長(zhǎng)率δ(t)和偏移量ρ(t),此時(shí)基于分段線性函數(shù)的趨勢(shì)增長(zhǎng)模型如下所示:

T(t)=δ(t)·t+ρ(t)=(δ0+Γ(t)Tδ)·t+(ρ0+Γ(t)Tρ)(3)

式中:δ=(δ1,δ2,…,δnc),ρ=(ρ1,ρ2,…,ρnc),Γ(t)=(Γ1(t),Γ2(t),…,Γnc(t)),Γ(t)為二元向量:

Γj(t)=1, t≥cj

0, 其他

變點(diǎn)集合C={c1,c2,…,cnc},nc為變點(diǎn)的數(shù)量,δ0和ρ0分別為初始增長(zhǎng)率和初始偏移量。

1.1.2 季節(jié)性分量S(t)

傅里葉級(jí)數(shù)是季節(jié)性建模的好工具,因?yàn)樗梢援a(chǎn)生易于解釋且穩(wěn)定的平滑函數(shù),非常適合應(yīng)用于各種不同周期季節(jié)性數(shù)據(jù)的仿真擬合。NeuralProphet中的季節(jié)性正是使用傅里葉級(jí)數(shù)來(lái)實(shí)現(xiàn)的,每一個(gè)具有周期性p的季節(jié)項(xiàng)Sp(t)可由傅里葉項(xiàng)來(lái)定義:

Sp(t)=∑kj=1ajcos2πjtp+bjsin2πjtp (4)

式中:p是時(shí)間序列的周期;k為具有周期性p的季節(jié)性傅里葉項(xiàng)的級(jí)數(shù);aj、bj分別是余弦函數(shù)、正弦函數(shù)的加權(quán)系數(shù);每一個(gè)具有周期性p的季節(jié)分量與 2k個(gè)系數(shù)相關(guān)聯(lián),此時(shí)季節(jié)分量的問(wèn)題轉(zhuǎn)化為確定參數(shù)p、k并求解最優(yōu)系數(shù)β=(a1,b1,…ak,bkT的問(wèn)題。在一個(gè)多周期季節(jié)性的場(chǎng)景中,可以為每個(gè)季節(jié)性定義不同的p值和k值,NeuralProphet模型則根據(jù)數(shù)據(jù)的采集頻率和數(shù)據(jù)長(zhǎng)度自動(dòng)激活每日、每周、每月或每年的周期季節(jié)性。

1.1.3 AR分量A(t)

對(duì)于一個(gè)經(jīng)典的AR時(shí)間序列模型而言,p階AR的建模過(guò)程可以認(rèn)為是若干個(gè)過(guò)去數(shù)據(jù)的線性組合:

yt=c+∑pi=1wi.yt-it (5)

式中:wi為每個(gè)過(guò)去值的權(quán)重系數(shù);c為截距;εt為噪聲。

不同于經(jīng)典AR模型,NeuralProphet模型中引入了AR網(wǎng)絡(luò)(AR network, AR-Net),AR分量A(t)通過(guò)AR前饋神經(jīng)網(wǎng)絡(luò)AR-Net來(lái)實(shí)現(xiàn)。AR-Net不僅可以采用線性建模,也可以采用非線性的深度AR(deep-AR)建模,這使得NeuralProphet模型能夠適用于各種復(fù)雜多變的應(yīng)用場(chǎng)景。如圖1所示,圖1(a)是與經(jīng)典AR等效的線性AR建模的神經(jīng)網(wǎng)絡(luò)架構(gòu),AR模塊不包含隱藏層,而是一個(gè)有著p個(gè)輸入、h個(gè)輸出的單層神經(jīng)網(wǎng)絡(luò),此時(shí)將時(shí)間序列的最后p個(gè)觀測(cè)值yt-1,yt-2,…,yt-p作為輸入,相應(yīng)權(quán)重系數(shù)為w1,w2,…,wp;圖1(b)是受到機(jī)器學(xué)習(xí)模型啟發(fā),選擇了添加l個(gè)尺寸為d的隱藏層的AR-Net架構(gòu),AR-Net第一層模仿了經(jīng)典AR的表達(dá),時(shí)間序列的最后p個(gè)觀測(cè)值作為第一層的輸入,而中間每個(gè)隱藏層的輸出都通過(guò)一個(gè)激活函數(shù)模塊,這里為整流線性單元(rectified linear unit, ReLU),最后一層不經(jīng)過(guò)激活函數(shù)模塊,輸出h個(gè)序列。AR-Net添加隱藏層可以完成非線性動(dòng)力學(xué)的建模并實(shí)現(xiàn)更精準(zhǔn)的預(yù)測(cè),但代價(jià)是降低了模型的可解釋性。

對(duì)于隱藏層尺寸為 d 的l個(gè)隱藏層,AR-Net模塊每層的輸出如下:

第1層:a1=fa(W1x+b1),其中x=(yt-1,yt-2,…,yt-p);

中間隱藏層:ai=fa(Wiai-1+bi),i∈[2,3,…,l];

最后一層:y=Wl+1al。

其中,fa(x)為激活函數(shù),且fa(x)=ReLU(x)=x,x≥0

0,xlt;0,bi∈Rd為隱藏層i的偏移量,除第1層權(quán)重向量W1∈Rd×p及最后一層權(quán)重向量Wl+1∈Rh×d外,其余中間隱藏層的權(quán)重向量W∈Rd×d

1.2 NeuralProphet模型對(duì)Prophet模型的改進(jìn)

NeuralProphet模型與其前身Prophet模型相比,相似的組成部分有趨勢(shì)分量、季節(jié)分量、節(jié)假日特殊事件分量、未來(lái)回歸分量等,不同之處在于增加了AR分量和外生滯后回歸分量。和許多“黑盒子”的神經(jīng)網(wǎng)絡(luò)不同,NeuralProphet保留了 Prophet 的所有優(yōu)勢(shì),而且通過(guò)引入AR-Net和超強(qiáng)的Pytorch后端這兩個(gè)變革式的改進(jìn),將神經(jīng)網(wǎng)絡(luò)的可擴(kuò)展性與傳統(tǒng)AR模型的可解釋性進(jìn)行了完美結(jié)合,推動(dòng)模型整體性能產(chǎn)生了質(zhì)的飛躍。重磅級(jí)全自動(dòng)AR-Net的出現(xiàn),使得AR模塊借助神經(jīng)網(wǎng)絡(luò)并貼合歷史數(shù)據(jù)的基本特征,更快捷精準(zhǔn)地?cái)M合客觀現(xiàn)實(shí),提高了模型準(zhǔn)確性和魯棒性。此外, 由于Pytorch的應(yīng)用,NeuralProphet模型不再局限于線性回歸,而可采用適應(yīng)性更強(qiáng)的ReLU非線性深度回歸并基于隨機(jī)梯度下降(stochastic gradient descent, SGD)進(jìn)行模型參數(shù)優(yōu)化,極大地加快了建模的速度和效率。

2 流量流向分析與預(yù)測(cè)

2.1 流量數(shù)據(jù)集

2.1.1 數(shù)據(jù)來(lái)源

通過(guò)在中國(guó)電信省際IP網(wǎng)絡(luò)的出口節(jié)點(diǎn)大規(guī)模部署xFlow流量采集設(shè)備及采集分析系統(tǒng),得到了大型運(yùn)營(yíng)級(jí)省際IP網(wǎng)絡(luò)的歷史流量流向矩陣報(bào)表數(shù)據(jù),報(bào)表輸出時(shí)間顆粒度為月度數(shù)據(jù),流量采集時(shí)間點(diǎn)為從2015年5月至2023年3月的共計(jì)95個(gè)時(shí)間點(diǎn)。每個(gè)月的流量矩陣報(bào)表共包含了16個(gè)省際節(jié)點(diǎn)之間的16×16(即256個(gè))OD流量流向,原始流量矩陣的數(shù)據(jù)格式如表1所示,表中第i行、第j列元素表示第i個(gè)節(jié)點(diǎn)流出到第j個(gè)節(jié)點(diǎn)的流量,第i行代表了第i個(gè)節(jié)點(diǎn)流出到其他各節(jié)點(diǎn)方向上的流量,第i行流量之和則代表了第i個(gè)節(jié)點(diǎn)的節(jié)點(diǎn)流量。表1中對(duì)角線上的元素表示節(jié)點(diǎn)內(nèi)部的流量,這是由于中國(guó)電信省際節(jié)點(diǎn)除了轉(zhuǎn)發(fā)省際流量外,同時(shí)還需要負(fù)責(zé)轉(zhuǎn)發(fā)省內(nèi)不同城域網(wǎng)之間的流量。

2.1.2 數(shù)據(jù)格式轉(zhuǎn)換

原始?xì)v史流量數(shù)據(jù)為95個(gè)如表1所示的16×16的原始矩陣報(bào)表格式,但這樣的數(shù)據(jù)格式不方便后續(xù)的時(shí)間序列分析和流量預(yù)測(cè),因此考慮先將所有的矩陣報(bào)表進(jìn)行格式轉(zhuǎn)換及數(shù)據(jù)合并,形成如表2所示的數(shù)據(jù)結(jié)構(gòu)。表2中,第1列是時(shí)間,剩余的每列代表了表1中每個(gè)OD對(duì)(即每個(gè)節(jié)點(diǎn)方向?qū)Γ┲g的歷史流量時(shí)間序列,例如表2第4列(“N1~N3”列)表示流向?yàn)楣?jié)點(diǎn)N1到節(jié)點(diǎn)N3的所有歷史采集時(shí)間下(2015年5月~2023年3月)的流量序列。此時(shí),95個(gè)形如表1的16×16的流量矩陣數(shù)據(jù)轉(zhuǎn)換為形如表2的95行(時(shí)間點(diǎn))256(16×16)列數(shù)據(jù)的流量流向時(shí)間序列。

2.1.3 數(shù)據(jù)預(yù)處理

通常而言,在正式進(jìn)行統(tǒng)計(jì)分析和預(yù)測(cè)前需要對(duì)數(shù)據(jù)集進(jìn)行適當(dāng)?shù)臄?shù)據(jù)清洗,即數(shù)據(jù)預(yù)處理工作,主要包括補(bǔ)充數(shù)據(jù)缺失值以及對(duì)異常值進(jìn)行識(shí)別及剔除。

對(duì)于本文的數(shù)據(jù)集,缺失值主要有兩種情況,一種是某個(gè)時(shí)間點(diǎn)的所有流量數(shù)據(jù)的集體缺失,另一種是某個(gè)時(shí)間點(diǎn)的個(gè)別節(jié)點(diǎn)或個(gè)別節(jié)點(diǎn)個(gè)別方向的流量數(shù)據(jù)缺失。第一種情況比較罕見(jiàn),一般是由采集分析系統(tǒng)的整體故障或工程變更而導(dǎo)致;第二種情況則比較常見(jiàn),通常由采集系統(tǒng)局部或單點(diǎn)原因引起。無(wú)論哪種情況的數(shù)據(jù)缺失,目前主要采用傳統(tǒng)的插值法來(lái)補(bǔ)充所缺失的數(shù)據(jù)。圖2展示了用插值法對(duì)節(jié)點(diǎn)N2及節(jié)點(diǎn)N9在時(shí)間點(diǎn)38以及時(shí)間點(diǎn)82、83缺失值的填充。

對(duì)于異常值的識(shí)別和剔除需要非常謹(jǐn)慎,因?yàn)殄e(cuò)誤的判斷可能會(huì)造成正常信息的損失。依據(jù)對(duì)自身網(wǎng)絡(luò)的了解和長(zhǎng)期數(shù)據(jù)統(tǒng)計(jì)的相關(guān)經(jīng)驗(yàn),目前仍建議采用最簡(jiǎn)單有效的拉伊達(dá)準(zhǔn)則(又稱(chēng)3 s準(zhǔn)則)來(lái)進(jìn)行異常值的判斷,即當(dāng)數(shù)值超出標(biāo)準(zhǔn)差3倍時(shí)初步判定為異常值,同時(shí)最好能夠結(jié)合網(wǎng)絡(luò)實(shí)際情況及工程運(yùn)維經(jīng)驗(yàn)來(lái)進(jìn)行輔助判斷。可以看到,圖2中N9節(jié)點(diǎn)在65時(shí)間點(diǎn)流量有一個(gè)極大的躍升,但后續(xù)流量并未回落,而是以此為基點(diǎn)穩(wěn)步增長(zhǎng)。經(jīng)與當(dāng)?shù)剡\(yùn)維部門(mén)核實(shí),這是由于當(dāng)時(shí)網(wǎng)絡(luò)規(guī)模擴(kuò)容調(diào)整導(dǎo)致的真實(shí)流量的暴增,并不屬于異常情況。

通常傳統(tǒng)時(shí)間序列模型(如ARIMA等)容易受歷史數(shù)據(jù)缺失或異常的干擾影響而導(dǎo)致預(yù)測(cè)性能下降,但NeuralProphet模型卻因AR模塊自帶糾偏能力而表現(xiàn)出極強(qiáng)的適應(yīng)性,特別適合這種存在異常波動(dòng)的IP流量數(shù)據(jù)的預(yù)測(cè)建模。

2.2 流量特征分析

2.2.1 節(jié)點(diǎn)流量分布

將每月流量矩陣的每行之和作為每個(gè)節(jié)點(diǎn)的節(jié)點(diǎn)流量,將流量矩陣16行分別求和后得到所有16個(gè)節(jié)點(diǎn)的節(jié)點(diǎn)流量。將95個(gè)月份的流量矩陣做同樣的運(yùn)算,得到16個(gè)節(jié)點(diǎn)的95個(gè)月份的節(jié)點(diǎn)流量,以及每個(gè)節(jié)點(diǎn)的95個(gè)時(shí)間點(diǎn)的平均節(jié)點(diǎn)流量。按節(jié)點(diǎn)流量由大到小排序畫(huà)圖,如圖3所示。

分析16個(gè)節(jié)點(diǎn)的節(jié)點(diǎn)流量,發(fā)現(xiàn)每個(gè)時(shí)間點(diǎn)的節(jié)點(diǎn)流量及平均節(jié)點(diǎn)流量有如下特點(diǎn):排名前3位的節(jié)點(diǎn)流量均超總流量的10%,且前3位的節(jié)點(diǎn)流量之和與總流量的占比高達(dá)49%,而其余13個(gè)節(jié)點(diǎn)的合計(jì)流量?jī)H占總流量的51%。由此可見(jiàn),IP網(wǎng)絡(luò)的流量分布具有區(qū)域匯聚效應(yīng),少量大流量節(jié)點(diǎn)貢獻(xiàn)了全網(wǎng)50%的流量。因此,在進(jìn)行節(jié)點(diǎn)流量預(yù)測(cè)時(shí),應(yīng)盡量保證大流量節(jié)點(diǎn)的預(yù)測(cè)性能,模型超參數(shù)的選取在兼顧公平的同時(shí)適當(dāng)向大流量節(jié)點(diǎn)傾斜。

2.2.2 OD流量流向分布

計(jì)算95個(gè)時(shí)間點(diǎn)的歷史流量矩陣的平均流量矩陣,得到平均流量矩陣各個(gè)元素(即各個(gè)源-目的對(duì))之間的流量。進(jìn)一步計(jì)算每個(gè)元素占網(wǎng)絡(luò)總流量的比例,并按比例由高到低進(jìn)行排列畫(huà)圖,結(jié)果如圖4所示。圖4中,占比總流量大于3%的OD流個(gè)數(shù)為11,11個(gè)OD流合計(jì)流量占比高達(dá)45%,即約有4%(11/256)的OD流的流量占據(jù)全網(wǎng)流量的45%;流量占比大于1%的OD流個(gè)數(shù)為21,而合計(jì)流量占比為60%,即約有8%(21/256)的OD流的流量占據(jù)了全網(wǎng)60%的流量。這種現(xiàn)象表明,該IP網(wǎng)絡(luò)的流量分布是非均衡的,小部分局向間的流量占比較大,對(duì)全網(wǎng)流量起到關(guān)鍵的主導(dǎo)和引領(lǐng)作用。在網(wǎng)絡(luò)規(guī)劃階段及實(shí)際網(wǎng)絡(luò)運(yùn)維中應(yīng)當(dāng)對(duì)這些關(guān)鍵局向給予重點(diǎn)關(guān)注,在流量預(yù)測(cè)過(guò)程中應(yīng)優(yōu)先考慮這些局向預(yù)測(cè)的準(zhǔn)確性,并以此作為模型超參數(shù)優(yōu)化調(diào)整的關(guān)鍵依據(jù)。

2.2.3 OD流量占節(jié)點(diǎn)流量的比例

將原始流量矩陣的每行之和作為每個(gè)節(jié)點(diǎn)的節(jié)點(diǎn)流量,用每一行的每個(gè)流量矩陣元素除以該行之和(即該節(jié)點(diǎn)流量),得到該元素占該節(jié)點(diǎn)流量的比例。經(jīng)過(guò)類(lèi)似計(jì)算,得到一個(gè)原始流量矩陣的16行的OD流相對(duì)節(jié)點(diǎn)流量的占比,以及95個(gè)時(shí)間點(diǎn)的原始流量矩陣的每個(gè)OD流相對(duì)節(jié)點(diǎn)流量的占比。對(duì)不同時(shí)間點(diǎn)的同一行的OD流量占比進(jìn)行分析對(duì)比,可以發(fā)現(xiàn)每個(gè)節(jié)點(diǎn)的16個(gè)OD流的流向流量比例在不同歷史時(shí)間點(diǎn)幾乎保持穩(wěn)定不變。圖5以節(jié)點(diǎn)3為例,顯示了節(jié)點(diǎn)3的16個(gè)OD流占節(jié)點(diǎn)流量的比例,圖中不同時(shí)間的比例曲線基本重疊在一起。而其他節(jié)點(diǎn)也存在相同的特性。利用這個(gè)特性,可以簡(jiǎn)化流量矩陣的預(yù)測(cè)過(guò)程:先通過(guò)恰當(dāng)?shù)姆椒A(yù)測(cè)所有節(jié)點(diǎn)的節(jié)點(diǎn)流量,再將節(jié)點(diǎn)流量按比例分配到各個(gè)源-目的局向中,即可得到預(yù)測(cè)流量矩陣。在下文對(duì)比實(shí)驗(yàn)中,ARIMA方法和Prophet模型均基于此特性對(duì)節(jié)點(diǎn)流量進(jìn)行預(yù)測(cè),在將節(jié)點(diǎn)流量進(jìn)行分配后,獲得最終的流量矩陣。

2.3 分析預(yù)測(cè)過(guò)程

2.3.1 總體流程

首次嘗試?yán)肗euralProphet模型對(duì)大型運(yùn)營(yíng)級(jí)IP網(wǎng)絡(luò)流量矩陣進(jìn)行分析預(yù)測(cè)。此前,主要采用多元回歸趨勢(shì)外推法、ARIMA方法以及Prophet模型對(duì)節(jié)點(diǎn)流量進(jìn)行預(yù)測(cè),而本次與之前不同的是,基于NeuralProphet模型首次對(duì)流量矩陣(即每個(gè)OD流)進(jìn)行了單獨(dú)預(yù)測(cè)。幾種方法相應(yīng)的預(yù)測(cè)結(jié)果將在后文進(jìn)行展示和對(duì)比。流量分析預(yù)測(cè)的完整過(guò)程和具體流程如圖6所示。

流量分析預(yù)測(cè)的完整過(guò)程和具體流程主要分為以下5個(gè)步驟。

步驟 1 數(shù)據(jù)采集

通過(guò)部署xFlow等采集分析系統(tǒng)采集IP網(wǎng)絡(luò)的流量數(shù)據(jù),目前共采集95個(gè)歷史流量矩陣的月數(shù)據(jù)。遵循8∶2原則,選取前77個(gè)時(shí)間點(diǎn)的數(shù)據(jù)集作為訓(xùn)練集,后18個(gè)時(shí)間點(diǎn)的數(shù)據(jù)作為預(yù)測(cè)集,即將經(jīng)過(guò)77個(gè)時(shí)間點(diǎn)的訓(xùn)練集訓(xùn)練后得到的模型用于預(yù)測(cè)后18個(gè)時(shí)間點(diǎn)的預(yù)測(cè)集,以預(yù)測(cè)集的預(yù)測(cè)結(jié)果進(jìn)行預(yù)測(cè)效果的評(píng)估和對(duì)比。

步驟 2 數(shù)據(jù)預(yù)處理

數(shù)據(jù)預(yù)處理主要包括前文提到過(guò)的缺失值補(bǔ)充、異常值去除等數(shù)據(jù)清洗工作,同時(shí)需對(duì)流量數(shù)據(jù)做一些數(shù)據(jù)格式轉(zhuǎn)換的處理,以及按行求和計(jì)算節(jié)點(diǎn)流量,計(jì)算OD流占節(jié)點(diǎn)流量比例等,為后續(xù)的流量預(yù)測(cè)過(guò)程做好相應(yīng)的準(zhǔn)備。

步驟 3 流量預(yù)測(cè)

重點(diǎn)基于NeuralProphet模型對(duì)流量矩陣的256個(gè)OD流進(jìn)行訓(xùn)練和預(yù)測(cè),通過(guò)NeuralProphet模型強(qiáng)大的AR能力更好地?cái)M合歷史流量并得到適用性更強(qiáng)、效果更好的模型。為了與之前使用的方法進(jìn)行對(duì)比,也給出了ARIMA和Prophet模型的預(yù)測(cè)結(jié)果。

3種方法的相同之處在于,都需要經(jīng)歷模型反復(fù)訓(xùn)練、參數(shù)迭代優(yōu)化的過(guò)程才能得到最優(yōu)的模型。不同之處在于,ARIMA主要是對(duì)時(shí)間序列模型p、d、q參數(shù)的確定,Prophet模型主要是對(duì)變點(diǎn)數(shù)量、趨勢(shì)參數(shù)和季節(jié)參數(shù)的選取,而NeuralProphet模型除了Prophet模型的基本參數(shù)外,更多的是對(duì)AR模塊參數(shù)的訓(xùn)練以及神經(jīng)網(wǎng)絡(luò)超參數(shù)的確定。

NeuralProphet模型允許使用者根據(jù)專(zhuān)業(yè)經(jīng)驗(yàn)和研究需要自行定義模型的損失函數(shù)和度量策略。本實(shí)驗(yàn)采用改進(jìn)的Huber函數(shù)[25作為NeuralProphet模型的損失函數(shù):

Lδ(y,?)=12δ(y-?)2, |y-?|lt;δ

|y-?|-δ2, |y-?|≥δ(6)

損失函數(shù)中的超參數(shù)δ的最優(yōu)值可通過(guò)交叉驗(yàn)證法來(lái)選取。在默認(rèn)情況下,δ=1,對(duì)于本次研究的IP網(wǎng)絡(luò)流量流向,經(jīng)反復(fù)迭代仿真后確定δ=3時(shí)具有最優(yōu)的效果。圖7是損失函數(shù)隨迭代次數(shù)變化的曲線,可見(jiàn)δ=3時(shí)損失函數(shù)收斂較快,且收斂后損失值較δ=1及δ=2時(shí)小。

需要指出的是,ARIMA和Prophet模型是基于節(jié)點(diǎn)流量進(jìn)行的,預(yù)測(cè)的工作量由256個(gè)時(shí)間序列縮減為16個(gè),得到節(jié)點(diǎn)預(yù)測(cè)流量后再將其按比例分配到OD流比例中,最終得到預(yù)測(cè)流量矩陣,這是目前實(shí)際工程實(shí)踐中常用的簡(jiǎn)化方法。

步驟 4 結(jié)果分析

將NeuralProphet模型的預(yù)測(cè)結(jié)果與ARIMA、Prophet模型的預(yù)測(cè)結(jié)果進(jìn)行分析對(duì)比,以確定該IP網(wǎng)絡(luò)流量矩陣預(yù)測(cè)的最優(yōu)方案。在預(yù)測(cè)精度滿(mǎn)足要求的前提下,可根據(jù)實(shí)際工程需要,綜合考慮運(yùn)算效率和模型復(fù)雜度而選擇效果次優(yōu)但更簡(jiǎn)單實(shí)用的模型。

步驟 5 后評(píng)估

運(yùn)營(yíng)級(jí)IP網(wǎng)絡(luò)的流量預(yù)測(cè)工作是一個(gè)長(zhǎng)期持續(xù)和不斷修正的過(guò)程,在新數(shù)據(jù)不斷采集擴(kuò)充的情況下,可以通過(guò)新數(shù)據(jù)的反饋和驗(yàn)證來(lái)優(yōu)化原有模型及參數(shù),形成閉環(huán)的預(yù)測(cè)后評(píng)估修正機(jī)制,從而提升IP網(wǎng)絡(luò)規(guī)劃和運(yùn)營(yíng)工作的質(zhì)量。

2.3.2 性能指標(biāo)

通常可采用誤差平方和(sum of square error, SSE)、均方根誤差(root mean square error, RMSE)、平均絕對(duì)誤差(mean absolute error, MAE)或平均絕對(duì)百分誤差(mean absolute percentage error, MAPE)等性能指標(biāo)來(lái)評(píng)價(jià)預(yù)測(cè)模型的效果。為了便于比較,本文主要采用MAPE作為誤差評(píng)價(jià)指標(biāo),MAPE包括節(jié)點(diǎn)流量預(yù)測(cè)誤差和流量矩陣預(yù)測(cè)誤差。t時(shí)刻節(jié)點(diǎn)流量預(yù)測(cè)誤差和流量矩陣預(yù)測(cè)誤差分別定義如下:

MAPEnode=100%×1N×∑Ni=1|yi(t)-?i(t)|yi(t)(7)

MAPETM=100%×1N2×∑Ni=1∑NJ=1|zij(t)-zˇij(t)|zij(t)(8)

式中:N是流量矩陣的節(jié)點(diǎn)數(shù),本文中N=16;?i(t)是t時(shí)刻節(jié)點(diǎn)i的預(yù)測(cè)流量,yi(t)是t時(shí)刻節(jié)點(diǎn)i的實(shí)際流量;zˇij(t)是t時(shí)刻節(jié)點(diǎn)i到節(jié)點(diǎn)j的OD流的預(yù)測(cè)流量,zij(t)是t時(shí)刻節(jié)點(diǎn)i到節(jié)點(diǎn)j的OD流的實(shí)際流量;節(jié)點(diǎn)i、j∈[1,16]。眾所周知,MAPE越小,預(yù)測(cè)性能越好。

3 結(jié)果分析

基于改進(jìn)的損失函數(shù),利用NeuralProphet模型首次對(duì)中國(guó)電信大型運(yùn)營(yíng)級(jí)IP網(wǎng)絡(luò)流量流向進(jìn)行預(yù)測(cè)并取得了較滿(mǎn)意的效果。下面分別從以下幾個(gè)方面對(duì)比ARIMA、Prophet模型的預(yù)測(cè)結(jié)果:節(jié)點(diǎn)預(yù)測(cè)誤差、OD流量流向預(yù)測(cè)誤差、流量矩陣整體預(yù)測(cè)性能。

3.1 節(jié)點(diǎn)流量預(yù)測(cè)誤差隨時(shí)間的變化

圖8是節(jié)點(diǎn)流量預(yù)測(cè)誤差MAPE隨時(shí)間變化的曲線圖。

由圖8可見(jiàn),3種預(yù)測(cè)模型的MAPE隨預(yù)測(cè)時(shí)長(zhǎng)的增加而增大,但傳統(tǒng)ARIMA預(yù)測(cè)誤差的變化相對(duì)另外兩種模型的誤差變化要大得多,ARIMA的預(yù)測(cè)誤差從預(yù)測(cè)時(shí)長(zhǎng)為1個(gè)月的7%,增加為預(yù)測(cè)時(shí)長(zhǎng)為18個(gè)月的48%,而Prophet和NeuralProphet則分別從3%、1%增加到22%、15%。由此可見(jiàn),NeuralProphet模型由于AR模塊的引入和神經(jīng)網(wǎng)絡(luò)的加持,可以較大地提升節(jié)點(diǎn)流量預(yù)測(cè)的準(zhǔn)確性。

3.2 OD流量流向預(yù)測(cè)誤差隨時(shí)間的變化

流量矩陣中OD流預(yù)測(cè)MAPE誤差隨預(yù)測(cè)時(shí)長(zhǎng)從1~18月的變化曲線如圖9所示。與節(jié)點(diǎn)流量誤差類(lèi)似,3種方法的OD流預(yù)測(cè)誤差均隨時(shí)間的增大而增加,其中傳統(tǒng)ARIMA模型的誤差從8%增加到53%,而Prophet和NeuralProphet模型的預(yù)測(cè)誤差隨時(shí)間的變化更加平穩(wěn),分別從4%和2%增加到29%和21%。可見(jiàn),NeuralProphet模型的預(yù)測(cè)誤差較其他兩種模型更小,因此對(duì)于OD流量流向的預(yù)測(cè),NeuralProphet模型具有更好的預(yù)測(cè)效果。

3.3 單個(gè)OD流量流向預(yù)測(cè)結(jié)果的對(duì)比

以一個(gè)OD流量流向的預(yù)測(cè)結(jié)果作為示例,圖10展示了3種模型的預(yù)測(cè)結(jié)果與流量真實(shí)值的對(duì)比。

由圖10可見(jiàn),3種方法對(duì)于訓(xùn)練集數(shù)據(jù)的擬合效果差異不大,都能較好地貼合真實(shí)值,但訓(xùn)練模型在預(yù)測(cè)集的表現(xiàn)卻差異巨大,只有NeuralProphet模型能夠符合真實(shí)流量的趨勢(shì)走向并與真實(shí)值吻合較好;而Prophet模型雖然在訓(xùn)練集上可以通過(guò)分段線性進(jìn)行準(zhǔn)確地?cái)M合,但由于缺乏測(cè)試集的“拐點(diǎn)”信息,容易受到訓(xùn)練集最后一個(gè)變點(diǎn)的影響,導(dǎo)致預(yù)測(cè)集上擬合曲線不可避免地偏離真實(shí)曲線;ARIMA模型也存在類(lèi)似的問(wèn)題,由于訓(xùn)練集最后幾個(gè)數(shù)值的突降跳躍,導(dǎo)致預(yù)測(cè)集上的擬合曲線也一路向下,愈發(fā)遠(yuǎn)離真實(shí)曲線。通過(guò)對(duì)比發(fā)現(xiàn),由于全自動(dòng)AR-Net的引入,NeuralProphet模型對(duì)測(cè)試集的預(yù)測(cè)以歷史數(shù)據(jù)作為“基準(zhǔn)線”,較好地糾正了Prophet模型趨勢(shì)項(xiàng)的缺陷,因此模型對(duì)于流量的異常或突變?nèi)萑潭雀?,容錯(cuò)性和泛化能力表現(xiàn)更為優(yōu)異,模型的魯棒性和穩(wěn)健性也得到進(jìn)一步提升。

3.4 流量矩陣預(yù)測(cè)結(jié)果整體對(duì)比

為了整體評(píng)估流量流向矩陣預(yù)測(cè)的性能和準(zhǔn)確性,畫(huà)出3種模型下預(yù)測(cè)時(shí)長(zhǎng)為18個(gè)月的預(yù)測(cè)結(jié)果與流量矩陣真實(shí)值的對(duì)比圖,如圖11所示。圖11(a)為ARIMA模型的結(jié)果,圖11(b)為Prophet模型的結(jié)果,圖11(c)為NeuralProphet模型的結(jié)果。不難看到,對(duì)于16×16的IP流量流向矩陣而言,NeuralProphet模型的預(yù)測(cè)性能優(yōu)于Prophet和ARIMA模型,NeuralProphet模型的256個(gè)OD流預(yù)測(cè)值與真實(shí)值的吻合程度遠(yuǎn)高于另外兩個(gè)模型。

表3是3種預(yù)測(cè)模型在預(yù)測(cè)時(shí)長(zhǎng)為第18個(gè)月時(shí)的預(yù)測(cè)結(jié)果的評(píng)價(jià)指標(biāo)對(duì)比,NeuralProphet模型的各項(xiàng)性能指標(biāo)都比另兩種模型好,可見(jiàn)NeuralProphet模型更適用于這張大型運(yùn)營(yíng)級(jí)IP網(wǎng)絡(luò)流量流向的預(yù)測(cè)。

4 結(jié)束語(yǔ)

針對(duì)IP網(wǎng)絡(luò)流量快速增長(zhǎng)且隨機(jī)性、突發(fā)性強(qiáng)等特點(diǎn),本文基于NeuralProphet模型對(duì)中國(guó)電信大型運(yùn)營(yíng)級(jí)IP網(wǎng)絡(luò)的流量流向進(jìn)行了詳盡的分析和預(yù)測(cè),同時(shí)也對(duì)比了傳統(tǒng)ARIMA模型和早期的Prophet模型。實(shí)踐結(jié)果表明,NeuralProphet的模型兼具傳統(tǒng)時(shí)間序列分析方法的可解釋性和神經(jīng)網(wǎng)絡(luò)方法的強(qiáng)大高效性,能夠得到準(zhǔn)確性、擴(kuò)展性和魯棒性更佳的預(yù)測(cè)結(jié)果,可以更好地滿(mǎn)足IP網(wǎng)絡(luò)規(guī)劃建設(shè)和運(yùn)行維護(hù)的需求。不過(guò),目前的方法基于單個(gè)OD流時(shí)間序列來(lái)進(jìn)行,對(duì)于超大規(guī)模的網(wǎng)絡(luò)存在的運(yùn)算量急劇擴(kuò)張的問(wèn)題,如全國(guó)31個(gè)省的省際流量流向,需分析預(yù)測(cè)31×31(即961)個(gè)OD流序列,而對(duì)于由全國(guó)300多個(gè)城域網(wǎng)組成的城域網(wǎng)間流量,運(yùn)算量則擴(kuò)大到約10萬(wàn)個(gè)OD流序列,這在對(duì)時(shí)限性要求較高的緊急運(yùn)維調(diào)度等場(chǎng)景中局限性較大,因此降低運(yùn)算量的節(jié)點(diǎn)流量預(yù)測(cè)仍具有實(shí)際工程應(yīng)用價(jià)值,而將流量流向矩陣進(jìn)行整體一次性預(yù)測(cè)、而非轉(zhuǎn)換為N2個(gè)OD流時(shí)間序列的分析預(yù)測(cè)方法也亟需研究,且意義深遠(yuǎn)。

可以預(yù)見(jiàn),隨著各種新型應(yīng)用的不斷涌現(xiàn),未來(lái)IP 網(wǎng)絡(luò)流量的增長(zhǎng)和分布仍具有極大的不確定性,今后的流量流向分析預(yù)測(cè)和網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化將面臨更大的挑戰(zhàn),結(jié)合深度學(xué)習(xí)等人工智能方法且方便現(xiàn)網(wǎng)高效使用的流量分析預(yù)測(cè)模型將成為未來(lái)的主流和重點(diǎn)研究方向[26-33,需要繼續(xù)深入研究和學(xué)習(xí)探索。

參考文獻(xiàn)

[1]SAFRIANTI E, SARI L O, SARI N A. Real-time network device monitoring system with simple network management protocol (SNMP) Model[C]∥Proc.of the 3rd International Confe-rence on Research and Academic Community Services, 2021: 122-127.

[2]SHMELKIN I, SPRINGER T. On adapting SNMP as communication protocol in distributed control loops for self-adaptive systems[C]∥Proc.of the IEEE International Conference on Autonomic Computing and Self-organizing Systems, 2021: 61-70.

[3]董興強(qiáng), 李曉冰. 電信運(yùn)營(yíng)商網(wǎng)絡(luò)流量采集模型研究及應(yīng)用[J]. 移動(dòng)通信, 2020, 44(3): 67-71.

DONG X Q, LI X B. Research and application of telecommunication operator network traffic collection model[J]. Mobile Communications, 2020, 44(3): 67-71.

[4]YANG B W, LIU D. Design of IP network traffic acquisition system based on xFlow[C]∥Proc.of the IEEE 8th Joint International Information Technology and Artificial Intelligence Conference, 2019: 1631-1634.

[5]NIE L S, WANG H Z, JIANG X, et al. Traffic measurement optimization based on reinforcement learning in large-scale ITS-oriented backbone networks[J]. IEEE Access, 2020, 8: 36988-36996.

[6]WANG M, LU Y Q, QIN J C. Source-based defense against DDoS attacks in SDN based on sFlow and SOM[J]. IEEE Access, 2021, 10: 2097-2116.

[7]榮紅佳, 盛虎, 閆秋婷. 基于改進(jìn)R/S估計(jì)算法的網(wǎng)絡(luò)流量長(zhǎng)相關(guān)性分析[J]. 大連交通大學(xué)學(xué)報(bào), 2021, 42(2): 114-119.

RONG H J, SHENG H, YAN Q T. Analysis of network traffic long correlation based on improved R/S estimation algorithm[J]. Journal of Dalian Jiaotong University, 2021, 42(2): 114-119.

[8]ERRAMILLI A, ROUGHAN M, VEITCH D, et al. Self-similar traffic and network dynamics[J]. Proceedings of the IEEE, 2002, 90(5): 800-819.

[9]OLGA V, FERNANDO R, LUIS J H, et al. New developments in time series and forecasting[J]. Engineering Proceedings, 2023, 39(1): 135-148.

[10]王婧, 鮑貴. 貝葉斯統(tǒng)計(jì)與傳統(tǒng)統(tǒng)計(jì)方法的比較[J]. 統(tǒng)計(jì)與決策, 2021, 37(1): 24-29.

WANG J, BAO G. Comparison between bayesian statistics and traditional statistical methods[J]. Statistics amp; Decision, 2021, 37(1): 24-29.

[11]LIU H, ZHANG X Y, YANG Y X, et al. Hourly traffic flow forecasting using a new hybrid modelling method[J]. Journal of Central South University, 2022, 29(4): 1389-1402.

[12]LIAO L C, HU Z Y, HSU C Y, et al. Fourier graph convolution network for time series prediction[J]. Mathematics, 2023, 11(7): 122-131.

[13]XU G Q, XIA C S, QIAN J, et al. A network traffic prediction algorithm based on Prophet-EALSTM-GPR[J]. Journal on Internet of Things, 2023, 4(2): 173-182.

[14]VACCARI I, CARLEVARO A, NARTENI S, et al. Xplainable and reliable against adversarial machine learning in data analytics[J]. IEEE Access, 2022, 10: 83949-83970.

[15]史朝衛(wèi), 孟相如, 康巧燕, 等. 基于混合流量預(yù)測(cè)的虛擬網(wǎng)絡(luò)拓?fù)渲貥?gòu)方法[J]. 系統(tǒng)工程與電子技術(shù), 2021, 43(5): 1382-1388.

SHI C W, MENG X R, KANG Q Y, et al. Virtual network topology reconfiguration approach based on hybrid traffic[J]. Systems Engineering and Electronics, 2021, 43(5): 1382-1388.

[16]YAO E Z, ZHANG L J, LI X H, et al. Traffic forecasting of back servers based on ARIMA-LSTM-CF hybrid model[J]. International Journal of Computational Intelligence Systems, 2023, 16(1): 244-256.

[17]王菁, 文曉東, 王春枝. 基于動(dòng)態(tài)擴(kuò)散卷積交互圖神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)流量預(yù)測(cè)[J]. 計(jì)算機(jī)應(yīng)用研究, 2023, 40(1): 97-101.

WANG J, WEN X D, WANG C Z. Network traffic prediction based on dynamic diffusion convolutional interaction graph neural network[J]. Application Research of Computers, 2023, 40(1): 97-101.

[18]YANG Y G, GENG S P, ZHANG B C, et al. Long term 5G network traffic forecasting via modeling non-stationarity with deep learning[J]. Communications Engineering, 2023, 2(1): 135-142.

[19]ETNGU R, TAN C S, CHEE T C, et al. AI-assisted traffic matrix prediction using GA-enabled deep ensemble learning for hybrid SDN[J]. Computer Communications, 2023, 203(2): 1124-1131.

[20]RAU F, SOTO I, ZABALABLANCO D, et al. A novel traffic prediction method using machine learning for energy efficiency in service provider networks[J]. Sensors, 2023, 23(11): 155-167.

[21]SWETHA K, PRABU U, ANGEL G, et al. A study on traffic matrix estimation techniques in software-defined networks[C]∥Proc.of the 6th International Conference on Electronics, Communication and Aerospace Technology, 2022: 604-611.

[22]JIANG D D, HU G M. A novel approach to large-scale IP traffic matrix estimation based on RBF neural network[C]∥Proc.of the 4th International Conference on Wireless Communications, Networking and Mobile Computing, 2008.

[23]TRIEBE O, HEWAMALAGE H, PILYUGINA P, et al. NeuralProphet: explainable forecasting at scale[EB/OL]. [2023-04-10]. https:∥arxiv.org/pdf/2111.15397.pdf.

[24]TAYLOR S J, LETHAM B. Forecasting at scale[J]. The American Statistician, 2018, 72(1): 37-45.

[25]孫慧慧, 劉強(qiáng). 基于改進(jìn)Huber損失的部分線性模型穩(wěn)健經(jīng)驗(yàn)似然推斷[J]. 系統(tǒng)科學(xué)與數(shù)學(xué), 2022, 42(5): 1330-1343.

SUN H H, LIU Q. Robust empirical likelihood inference of partial linear models based on improved huber loss[J]. Systems Science and Mathematical Sciences, 2022, 42(5): 1330-1343.

[26]WU X Y, FU S D, HE Z J. Research on short-term traffic flow combination prediction based on CEEMDAN and machine learning[J]. Applied Sciences, 2022, 13(1): 1121-1132.

[27]JEBA N, RATHI S. Attention-based multiscale spatiotemporal network for traffic forecast with fusion of external factors[J]. ISPRS International Journal of Geo-Information, 2022, 11(12): 323-330.

[28]LIN L, LI W Z, ZHU L. Data-driven graph filter-based graph convolutional neural network approach for network-level multi-step traffic prediction[J]. Sustainability, 2022, 14(24): 211-219.

[29]DALAL A, IMTIAZ A, EBRAHIM A. Deep learning based network traffic matrix prediction[J]. International Journal of Intelligent Networks, 2021, 2(1): 135-142.

[30]YANG W C, RUI H, ZHAO Q H. A sequence-to-sequence traffic predictor on software-defined networking[J]. International Journal of Web and Grid Services, 2021, 17(3): 1210-1221.

[31]SAYED S A, YASSER H A, AHMED H H. Artificial intelligence-based traffic flow prediction: a comprehensive review[J]. Journal of Electrical Systems and Information Technology, 2023, 10(1): 144-153.

[32]XIONG P P, CHEN S T, YAN S L. Time-delay nonlinear model based on interval grey number and its application[J]. Journal of Systems Engineering and Electronics, 2022, 33(2): 370-380.

[33]LYU S T, LI X H, FAN T, et al. Deep learning for fast channel estimation in millimeter-wave MIMO systems[J]. Journal of Systems Engineering and Electronics, 2022, 33(6): 1088-1095.

作者簡(jiǎn)介

韋 烜(1974—),女,高級(jí)工程師,碩士,主要研究方向?yàn)镮P網(wǎng)絡(luò)規(guī)劃與運(yùn)營(yíng)技術(shù)、下一代互聯(lián)網(wǎng)。

劉志華(1970—),男,高級(jí)工程師,碩士,主要研究方向?yàn)樵凭W(wǎng)融合技術(shù)、下一代互聯(lián)網(wǎng)、網(wǎng)絡(luò)安全。

李 青(1973—),男,高級(jí)工程師,碩士,主要研究方向?yàn)楹诵木W(wǎng)與業(yè)務(wù)平臺(tái)技術(shù)、云計(jì)算/大數(shù)據(jù)運(yùn)營(yíng)技術(shù)。

何曉明(1968—),男,高級(jí)工程師,博士,主要研究方向?yàn)镮P網(wǎng)絡(luò)技術(shù)、移動(dòng)互聯(lián)網(wǎng)技術(shù)。

黃君雅(1993—),女,工程師,碩士,主要研究方向?yàn)橄乱淮ヂ?lián)網(wǎng)、網(wǎng)絡(luò)安全。

猜你喜歡
網(wǎng)絡(luò)流量流向流量
基于多元高斯分布的網(wǎng)絡(luò)流量異常識(shí)別方法
冰墩墩背后的流量密碼
玩具世界(2022年2期)2022-06-15 07:35:36
張曉明:流量決定勝負(fù)!三大流量高地裂變無(wú)限可能!
基于神經(jīng)網(wǎng)絡(luò)的P2P流量識(shí)別方法
小溪??!流向遠(yuǎn)方
井岡教育(2020年6期)2020-12-14 03:04:42
尋找書(shū)業(yè)新流量
出版人(2020年4期)2020-11-14 08:34:26
AVB網(wǎng)絡(luò)流量整形幀模型端到端延遲計(jì)算
十大漲幅、換手、振副、資金流向
流向逆轉(zhuǎn)的啟示
五位一體流量平穩(wěn)控制系統(tǒng)
嘉禾县| 太湖县| 乌苏市| 观塘区| 湘阴县| 四子王旗| 晴隆县| 全椒县| 高清| 彭泽县| 林周县| 昌黎县| 吴江市| 获嘉县| 台山市| 北流市| 邵东县| 铅山县| 兴国县| 额济纳旗| 临海市| 突泉县| 叶城县| 师宗县| 阳新县| 永和县| 思南县| 饶平县| 舟山市| 桂平市| 务川| 乐安县| 千阳县| 成武县| 内丘县| 余干县| 雅安市| 青川县| 石阡县| 海丰县| 宁国市|