国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

<ul id="qqk8c"><tfoot id="qqk8c"></tfoot></ul>

?

基于趨勢擬合法、平滑法和ARIMA 模型的流量預(yù)測

2023-08-11 14:54:30馬政達(dá)中國聯(lián)通研究院北京100048

郵電設(shè)計(jì)技術(shù) 2023年7期

關(guān)鍵詞：誤差率時(shí)序預(yù)測值

馬政達(dá)（中國聯(lián)通研究院，北京 100048）

1 研究背景

隨著寬帶用戶網(wǎng)絡(luò)需求的快速增長和固網(wǎng)數(shù)據(jù)的大幅提升，運(yùn)營商越來越重視寬帶用戶的使用體驗(yàn)，并投入更多的精力用于固網(wǎng)寬帶網(wǎng)絡(luò)設(shè)備的擴(kuò)容和維護(hù)［1?2］，科學(xué)規(guī)劃網(wǎng)絡(luò)容量已成為運(yùn)營商發(fā)展的重要議題。網(wǎng)絡(luò)流量指標(biāo)是評(píng)價(jià)網(wǎng)絡(luò)管理質(zhì)量的重要參數(shù)，對(duì)流量的預(yù)測是指依據(jù)設(shè)備歷史數(shù)據(jù)對(duì)未來一段時(shí)間的流量進(jìn)行建模與估計(jì)，相較于流量達(dá)到告警閾值后再升級(jí)設(shè)備，流量預(yù)測可以幫助網(wǎng)絡(luò)管理員掌握網(wǎng)絡(luò)變化的規(guī)律，更合理地安排預(yù)算、設(shè)備升級(jí)和割接計(jì)劃，也極大地改善了用戶上網(wǎng)體驗(yàn)。此外，隨著運(yùn)營商算力的提升，流量預(yù)測甚至可以應(yīng)用到用戶級(jí)別，為提供個(gè)性化服務(wù)做支撐，因此流量預(yù)測一直是網(wǎng)絡(luò)研究領(lǐng)域的重要研究方向［3?5］。

通常當(dāng)OLT 上聯(lián)口的寬帶利用率峰值到達(dá)70%時(shí)就需要開始考慮流量擴(kuò)容［6］，同時(shí)用戶的下行網(wǎng)絡(luò)流量往往要高于上行網(wǎng)絡(luò)流量，因此對(duì)OLT 上聯(lián)口的下行流量速率峰值進(jìn)行時(shí)間序列的分析、預(yù)測具有重要意義，是OLT擴(kuò)容的主要技術(shù)指標(biāo)。

寬帶設(shè)備的流量速率是網(wǎng)管系統(tǒng)記錄的主要數(shù)據(jù)之一，OLT 下行流量速率峰值數(shù)據(jù)可以看做是一組時(shí)間序列，對(duì)于時(shí)間序列的分析主要包括模型識(shí)別、模型擬合、模型診斷3個(gè)步驟［7］。

在模型識(shí)別階段需要根據(jù)時(shí)間序列的時(shí)序圖特征和統(tǒng)計(jì)量特征選擇合適的模型。時(shí)間序列的統(tǒng)計(jì)學(xué)模型有很多，包括趨勢擬合法、平滑法及ARIMA 等模型。運(yùn)營商積累了大量流量數(shù)據(jù)，但對(duì)這類數(shù)據(jù)的處理往往比較粗獷，經(jīng)常使用到的流量預(yù)測方法有線性擬合法和移動(dòng)平均法，這些方法操作簡單，模型直觀，但也存在擬合度低、預(yù)測效果差的缺點(diǎn)［8］。相比而言，Holt?Winters 模型和ARIMA 模型增加了更復(fù)雜的模型維度和參數(shù)類別，可以更充分地?cái)M合復(fù)雜的流量趨勢及短期的隨機(jī)趨勢。

2 建模及預(yù)測

選取一臺(tái)典型的OLT 的上聯(lián)口，將其周末的下行速率峰值數(shù)據(jù)（以下簡稱流量數(shù)據(jù)）作為研究對(duì)象，時(shí)間跨度為2018年9月到2019年5月，共33周。將前30周數(shù)據(jù)作為訓(xùn)練集，后3 周數(shù)據(jù)作為測試集。圖1 所示為流量數(shù)據(jù)訓(xùn)練集的時(shí)序圖、自相關(guān)系數(shù)圖（ACF）和偏自相關(guān)系數(shù)圖（PACF）。

圖1 流量數(shù)據(jù)訓(xùn)練集的時(shí)序圖和相關(guān)性分析

2.1 趨勢擬合法

趨勢擬合法就是將時(shí)間作為自變量，對(duì)應(yīng)的流量觀察值作為因變量，建立序列值隨時(shí)間變化的回歸模型的方法。依據(jù)觀察值的時(shí)序圖，如果時(shí)序圖中序列表現(xiàn)出線性的長期趨勢，可以考慮使用線性擬合；如果長期趨勢呈現(xiàn)出非線性特征，則可以嘗試使用曲線擬合［9］。

從圖1的流量時(shí)序圖中可以看出流量趨勢平穩(wěn)上升，呈現(xiàn)出線性趨勢，因此進(jìn)行線性擬合，結(jié)果如圖2所示。

圖2 線性擬合模型

該線性擬合模型可以表示為：

依據(jù)式（1），可以計(jì)算出未來3期線性擬合模型的預(yù)測值，如表1所示。

表1 線性擬合模型的3期預(yù)測值與誤差率

2.2 平滑法

平滑法通過對(duì)過去數(shù)據(jù)的加權(quán)平均處理，減少短期波動(dòng)對(duì)序列的影響，盡可能地展示數(shù)據(jù)的直觀趨勢。

移動(dòng)平均法是最常見的數(shù)據(jù)統(tǒng)計(jì)分析方法之一，通過計(jì)算過去n期數(shù)據(jù)的平均值作為預(yù)測值，其表達(dá)式為：

圖3所示為4期平均移動(dòng)法的流量擬合。

圖3 移動(dòng)平均擬合模型

依據(jù)式（2），可以計(jì)算出未來3期移動(dòng)平均模型的流量預(yù)測值和預(yù)測誤差率，如表2所示。

表2 移動(dòng)平均模型的3期預(yù)測值與誤差率

移動(dòng)平均法簡單直觀，以前n期數(shù)據(jù)的平均值作為最后一期的預(yù)測值，往期數(shù)據(jù)的權(quán)重都是1/n，即在移動(dòng)平均法中，n期的每一條數(shù)據(jù)對(duì)預(yù)測值的影響是相同的。但在實(shí)際流量分析中，不同時(shí)間的數(shù)據(jù)對(duì)當(dāng)前流量大小的影響是不同的（一般時(shí)間越近，影響越大），為了更好地反映這種情況，需要調(diào)整往期數(shù)據(jù)的權(quán)重。美國統(tǒng)計(jì)學(xué)家Holt 在簡單指數(shù)平滑法的基礎(chǔ)上，添加了對(duì)長期趨勢擬合，提出了Holt 兩參數(shù)指數(shù)平滑模型，該模型適用于含有遞增趨勢的序列，Holt兩參數(shù)指數(shù)平滑模型的平滑公式為：

式中：

θt——序列每階遞增量

α，β——2個(gè)平滑系數(shù)

該模型后經(jīng)Winters 改進(jìn)，形成了Holt?Winters 三參數(shù)指數(shù)平滑模型，該模型除了可以擬合長期趨勢，還可以擬合周期性變化。

考慮到圖1 流量時(shí)序圖中僅包含遞增趨勢，為其建立Holt 兩參數(shù)指數(shù)平滑模型并進(jìn)行3 期數(shù)據(jù)預(yù)測，結(jié)果如圖4所示。

圖4 Holt兩參數(shù)指數(shù)平滑擬合模型

圖4 中黑色實(shí)線是流量觀測值，藍(lán)色虛線是模型擬合值，藍(lán)色點(diǎn)為預(yù)測值，淺色陰影為95%的預(yù)測值置信區(qū)間，深色陰影為80%的預(yù)測值置信區(qū)間。預(yù)測值和預(yù)測誤差率如表3所示。

表3 Holt兩參數(shù)指數(shù)平滑模型的3期預(yù)測值和預(yù)測誤差率

2.3 ARIMA模型

ARIMA（Autoregressive Integrated Moving Average Model）模型全稱為差分自回歸移動(dòng)平均模型，由美國統(tǒng)計(jì)學(xué)家Box 和英國統(tǒng)計(jì)學(xué)家Jenkins 提出［11］，是在ARMA模型的基礎(chǔ)上增加了差分運(yùn)算的時(shí)間序列分析模型。ARMA模型對(duì)平穩(wěn)序列的分析技術(shù)已經(jīng)非常成熟，如果一個(gè)序列可以通過差分使之變?yōu)槠椒€(wěn)，那么使用ARIMA 模型對(duì)該序列的分析也將是可靠、易行的［12?15］。ARMA 模型是AR 模型和MA 模型的有機(jī)組合，具有如下結(jié)構(gòu)的模型稱為ARMA（p，q）模型：

式中：

φp、θq——AR部分和MA部分的待估參數(shù)

εt——零均值、方差記為的白噪聲

如果一個(gè)序列{X(t),t∈T}可以通過d次差分得到一個(gè)平穩(wěn)的過程，且該過程服從ARMA（p，q）模型，則稱{X(t),t∈T}是ARIMA（p，d，q）過程［16］。

圖1 的流量時(shí)序圖中有明顯的遞增趨勢，且ACF圖中自相關(guān)系數(shù)衰減較慢，在16階延遲附近又落在了2 倍標(biāo)準(zhǔn)差的參考線之外，顯著不為0，因此可以認(rèn)為該流量數(shù)據(jù)為非平穩(wěn)時(shí)間序列。考慮到時(shí)序圖中的遞增趨勢，嘗試使用差分運(yùn)算將其轉(zhuǎn)化為平穩(wěn)時(shí)間序列。

對(duì)流量數(shù)據(jù)進(jìn)行一階差分運(yùn)算，做出其時(shí)序圖、自相關(guān)系數(shù)圖、偏自相關(guān)系數(shù)圖（見圖5）。

圖5 一階差分序列的時(shí)序圖和相關(guān)性分析圖

從圖5可以看出，該差分?jǐn)?shù)列時(shí)序圖的均值穩(wěn)定、波動(dòng)范圍有限且無明顯趨勢或周期，自相關(guān)系數(shù)迅速衰減到0 附近，該差分序列可能為平穩(wěn)時(shí)間序列。進(jìn)一步使用ADF 檢驗(yàn)對(duì)該序列的平穩(wěn)性進(jìn)行統(tǒng)計(jì)檢驗(yàn)，檢驗(yàn)結(jié)果如表4所示。

表4 一階差分序列的ADF檢驗(yàn)

從表4可以看出，3種類型的p值均明顯小于0.05，因此拒絕原假設(shè)，該序列為平穩(wěn)時(shí)間序列。

在平穩(wěn)時(shí)間序列中，若某一時(shí)刻的狀態(tài)對(duì)下一時(shí)刻沒有相關(guān)性，則意味著該序列未來的數(shù)據(jù)無法通過現(xiàn)在及過去的狀態(tài)進(jìn)行推斷，對(duì)這樣的流量數(shù)據(jù)進(jìn)行預(yù)測是沒有價(jià)值的。因此要進(jìn)行純隨機(jī)性檢驗(yàn)，判斷該流量數(shù)據(jù)是否有預(yù)測價(jià)值。

在圖5 中，一階差分序列的ACF 圖中，1、3、4 階自相關(guān)系數(shù)明顯不為零，初步判斷該序列不是純隨機(jī)序列，進(jìn)一步考察該序列的LB統(tǒng)計(jì)量，結(jié)果如表5所示。

表5 一階差分序列的純隨機(jī)性檢驗(yàn)

從表5 可以看出，一階差分序列延遲6 階、12 階的LB統(tǒng)計(jì)量的p值均明顯小于0.05，所以拒絕原假設(shè)，該一階差分序列不是純隨機(jī)序列，可以用來做預(yù)測分析。

通過上面的分析可知，原流量數(shù)據(jù)經(jīng)過一階差分運(yùn)算后是一個(gè)平穩(wěn)的非純隨機(jī)性序列，這樣就可以為差分序列構(gòu)建ARMA 模型。在圖5的ACF圖中可以看出一階差分序列的自相關(guān)系數(shù)呈現(xiàn)逐漸衰減的趨勢，符合拖尾特征；PACF 圖中，只有一階和三階偏自相關(guān)系數(shù)落在了2 倍標(biāo)準(zhǔn)差范圍外，剩下的系數(shù)趨向于0，可認(rèn)為是一階、三階截尾或拖尾。嘗試選擇MA（1）、MA（3）、ARMA（1，1）、ARMA（4，1）模型擬合該差分序列。模型的選取應(yīng)遵從從簡原則，在能充分表示序列的前提下所含參數(shù)個(gè)數(shù)應(yīng)該最少［16］，因此對(duì)4 個(gè)ARMA 模型進(jìn)行最小信息量檢測，檢測結(jié)果如表6 所示。

表6 ARMA模型參數(shù)評(píng)估

從表6 可以看出，無論是AIC 還是BIC，MA（1）模型都是最優(yōu)選擇，結(jié)合該序列為流量數(shù)據(jù)通過一階差分得到，因此使用帶漂移項(xiàng)的ARIMA（0，1，1）模型來擬合原流量數(shù)據(jù)。為考察ARIMA（0，1，1）的有效性，對(duì)其進(jìn)行顯著性檢驗(yàn)，即對(duì)殘差序列的檢驗(yàn)，結(jié)果如圖6所示。

圖6 殘差序的標(biāo)準(zhǔn)化殘差圖、ACF和純隨機(jī)性檢驗(yàn)圖

從圖6 可以看出，殘差序列的各階白噪聲檢驗(yàn)統(tǒng)計(jì)量的p值均大于0.05，原假設(shè)成立，殘差序列是白噪聲，即該擬合模型顯著成立，因此為流量數(shù)據(jù)建立ARIMA（0，1，1）模型，并進(jìn)行3 期流量預(yù)測，圖7 為擬合模型的預(yù)測效果，表7列出了預(yù)測值和預(yù)測誤差率。

表7 ARIMA（0，1，1）模型的3期預(yù)測值、置信區(qū)間與誤差率

圖7 ARIMA（0，1，1）擬合模型的預(yù)測效果

圖7 中黑色實(shí)線是流量觀測值，藍(lán)色虛線是模型擬合值，藍(lán)色點(diǎn)為預(yù)測值，淺色陰影為95%的預(yù)測值置信區(qū)間，深色陰影為80%的預(yù)測值置信區(qū)間。

2.4 模型預(yù)測結(jié)果比較

文章針對(duì)OLT 流量構(gòu)建了線性擬合、平均移動(dòng)、Holt兩參數(shù)指數(shù)平滑和ARIMA（0，1，1）4 種模型，為評(píng)估各模型的預(yù)測性能，采用平均絕對(duì)百分比誤差（MAPE）作為評(píng)價(jià)指標(biāo)，4種模型的平均絕對(duì)百分誤差（MAPE）如表8 所示。從表8 可以看出，ARIMA（0，1，1）和Holt 兩參數(shù)指數(shù)平滑模型的預(yù)測平均誤差率為2.06%、2.68%，誤差相對(duì)都比較小，預(yù)測效果表現(xiàn)較好；而線性擬合和平均移動(dòng)模型的預(yù)測誤差分別為4.43%、4.01%，誤差較大，不適合用來對(duì)精度有較高要求的流量進(jìn)行預(yù)測。

表8 4種模型的平均絕對(duì)百分誤差（MAPE）

3 預(yù)測評(píng)價(jià)

網(wǎng)絡(luò)流量信息具有很大的隨機(jī)性，前一日的流量大小理論上不能影響到當(dāng)日的流量，對(duì)流量預(yù)測的本質(zhì)是對(duì)用戶上網(wǎng)習(xí)慣的推斷，個(gè)人行為具有很大的隨機(jī)性，群體行為表現(xiàn)出的規(guī)律性更大，因此越是靠近北向的端口，對(duì)流量進(jìn)行的統(tǒng)計(jì)學(xué)分析的意義越大，這也是文章對(duì)OLT 上聯(lián)口分析的原因。對(duì)應(yīng)地，越是南向的設(shè)備，流量表現(xiàn)出的隨機(jī)性越強(qiáng)，此時(shí)篩選出有意義的數(shù)據(jù)比逐個(gè)預(yù)測更有價(jià)值。

本文使用到趨勢擬合法和平滑法對(duì)流量數(shù)據(jù)進(jìn)行建模預(yù)測，這些方法具有原理簡單、操作簡便、易于解釋等優(yōu)點(diǎn)，在提取明顯的、確定的信息時(shí)有一定優(yōu)勢，缺點(diǎn)是相關(guān)性信息在加權(quán)平均中丟失，隨機(jī)性信息浪費(fèi)嚴(yán)重，這可能是本文在流量預(yù)測時(shí)ARIMA 模型略優(yōu)于Holt模型的原因，使用ARIMA 模型在處理平穩(wěn)序列、差分平穩(wěn)序列時(shí)可以更加充分地體現(xiàn)流量中的短期相關(guān)關(guān)系。

4 展望

本文以周數(shù)據(jù)進(jìn)行數(shù)據(jù)建模與網(wǎng)絡(luò)流量預(yù)測，預(yù)測獲得了不錯(cuò)的效果。伴隨著運(yùn)營商算力的提升，未來若能夠拿到海量的流量數(shù)據(jù)，則可以考慮使用LSTM 等機(jī)器學(xué)習(xí)來擬合更加復(fù)雜的模型。但并不是所有預(yù)測問題都適合使用機(jī)器學(xué)習(xí)，在多變量的非線性時(shí)間序列預(yù)測時(shí)，特別是在大樣本的情況下機(jī)器學(xué)習(xí)會(huì)獲得更好的表現(xiàn)，針對(duì)平穩(wěn)或差分平穩(wěn)時(shí)間序列，在樣本較少的情況下，使用ARIMA 等統(tǒng)計(jì)建模法更具優(yōu)勢［17?20］。

流量數(shù)據(jù)會(huì)受到多種因素影響，在后續(xù)的研究中應(yīng)該考慮將現(xiàn)有模型與其他預(yù)測模型進(jìn)行組合，構(gòu)建多因素的組合模型，以緩解模型預(yù)測的滯后問題，提高預(yù)測靈敏度和準(zhǔn)確性［21?24］。

猜你喜歡

誤差率時(shí)序預(yù)測值

IMF上調(diào)今年全球經(jīng)濟(jì)增長預(yù)期

企業(yè)界(2024年8期)2024-07-05 10:59:04

基于時(shí)序Sentinel-2數(shù)據(jù)的馬鈴薯遙感識(shí)別研究

中國農(nóng)業(yè)信息(2023年3期)2023-03-18 08:19:04

加拿大農(nóng)業(yè)部下調(diào)2021/22年度油菜籽和小麥產(chǎn)量預(yù)測值

今日農(nóng)業(yè)(2021年19期)2022-01-12 06:16:32

基于Sentinel-2時(shí)序NDVI的麥冬識(shí)別研究

中國農(nóng)業(yè)信息(2021年3期)2021-11-22 06:44:48

±800kV直流輸電工程合成電場夏季實(shí)測值與預(yù)測值比對(duì)分析

環(huán)境保護(hù)與循環(huán)經(jīng)濟(jì)(2021年7期)2021-11-02 08:10:54

法電再次修訂2020年核發(fā)電量預(yù)測值

國外核新聞(2020年8期)2020-03-14 02:09:19

生化檢驗(yàn)全程中質(zhì)量控制管理方式及應(yīng)用意義

健康大視野(2020年1期)2020-03-02 11:33:53

降低評(píng)吸人員單料煙感官評(píng)分誤差率探討

科技創(chuàng)新與應(yīng)用(2019年26期)2019-10-24 08:49:44

無線傳感器網(wǎng)絡(luò)定位算法在環(huán)境監(jiān)測中的應(yīng)用研究

電腦知識(shí)與技術(shù)(2017年2期)2017-04-25 13:32:31

一種毫米波放大器時(shí)序直流電源的設(shè)計(jì)

電子制作(2016年15期)2017-01-15 13:39:08

郵電設(shè)計(jì)技術(shù)2023年7期

郵電設(shè)計(jì)技術(shù)的其它文章: 基于時(shí)空特征融合和圖卷積神經(jīng)網(wǎng)絡(luò)的告警壓縮技術(shù)研究; 基于AI能力的智能運(yùn)維建設(shè)實(shí)踐; 企業(yè)知識(shí)圖譜在通信行業(yè)的應(yīng)用探索; 基于LightGBM 的蓄電池容量預(yù)測方法研究; 基于遷移學(xué)習(xí)的在線鉛酸蓄電池容量預(yù)測方法研究; 基于領(lǐng)域知識(shí)內(nèi)嵌的深度學(xué)習(xí)網(wǎng)絡(luò)流量預(yù)測研究

吉水县| 穆棱市| 清新县| 河北省| 莱西市| 全州县| 启东市| 阜新市| 贵港市| 时尚| 若尔盖县| 东平县| 西盟| 阜新市| 凤冈县| 荔浦县| 信宜市| 板桥市| 林口县| 资溪县| 通江县| 贵阳市| 武宣县| 崇仁县| 赤峰市| 泰来县| 鸡泽县| 阳新县| 漠河县| 满洲里市| 延安市| 齐齐哈尔市| 抚顺市| 崇左市| 滦平县| 元谋县| 论坛| 本溪市| 哈尔滨市| 无为县| 巴林左旗|

<fieldset id="kwagq"><menu id="kwagq"></menu></fieldset>

<fieldset id="kwagq"></fieldset>

<fieldset id="kwagq"><table id="kwagq"></table></fieldset>