陳禮賢,梁 杰,黃一帆,陳哲毅,于正欣,陳 星
1(福州大學 計算機與大數據學院 ,福州 350116)
2(福建省網絡計算與智能信息處理重點實驗室,福州 350116)
3(蘭卡斯特大學 計算與通信學院,英國 蘭卡斯特 LA1 4YW)
作為一種物聯(lián)網(Internet-of-Things,IoT)時代的新興計算范式,邊緣計算可以有效地降低IoT應用的響應時間進而提高用戶的服務體驗[1].邊緣計算將計算與存儲資源部署在更加接近終端設備的網絡邊緣,有效支撐與提升各類IoT應用(如,自動駕駛、AR/VR和智能城市等)的運行性能與效益.根據思科報告[2],到2023年,全球范圍內將部署超過293億臺終端設備.如果將終端設備上所產生的計算任務全部上傳到遠程云數據中心,無疑將消耗大量的帶寬資源并給云數據中心帶來巨大的處理負擔.同時,云數據中心與終端設備之間的長距離數據傳輸也會造成嚴重的響應延遲.相對而言,邊緣計算所提供的計算與存儲資源更加靠近終端設備,可大大減小傳輸數據與處理任務所產生的延遲,進而在一定程度上降低服務提供商的運營成本并提升其服務質量.因此,邊緣計算的出現可有效支持新興IoT應用對實時性的高需求.
作為邊緣計算中一項重要的技術支撐,負載預測可更好地支持邊緣計算服務提供商進行資源的提前配置與分配,進而實現更高效更合理的資源供給.例如,當有大量服務請求同時達到邊緣服務器時,資源的配給不足會增加服務請求的等待時間;當邊緣服務器長時間內僅有少量服務請求到達時,資源的過度配給會導致服務器閑置狀態(tài)的頻繁出現,造成了資源的浪費.因此,若預測未來一段時間內的邊緣負載將處在較低水平時,可相應減少邊緣資源的分配;反之,若預測未來一段時間內的邊緣負載將處在較高水平時,可相應增加邊緣資源的分配.因此,通過邊緣負載預測,可以更好地保證服務級協(xié)議(Service Level Agreement,SLA)并有效提升邊緣計算系統(tǒng)的可靠性[3].不同于云數據中心負載,邊緣服務器部署在靠近終端設備的網絡邊緣,其負載狀況與終端用戶的工作與生活方式息息相關并隨之不斷變化[4].因此,需要高效地利用歷史邊緣負載數據對未來一段時間內的負載情況進行精確預測,為智能化的邊緣資源管理提供有力支撐.例如,可利用邊緣負載預測結果指導虛擬機的分配與遷移,避免邊緣服務器過載或網絡擁塞等情況的出現.此外,通過邊緣負載預測也可有效提升邊緣服務器的資源利用率并降低其能耗.
現有負載預測工作大多是以云數據中心為研究對象,這些工作主要基于傳統(tǒng)的回歸、啟發(fā)式和神經網絡等方法.其中,基于神經網絡的方法展現出了對時序預測問題良好處理能力.但是,傳統(tǒng)的神經網絡一般只包含淺層的網絡結構(如,多層感知機(Multilayer Perceptron,MLP)和徑向基函數(Radial Basis Function,RBF))[5].這類方法通常只能對具有明顯變化趨勢的負載實現精確預測,對于高度變化的邊緣負載并不能取得高預測精度,因為它們無法有效捕捉邊緣負載變化的模式.為了獲得更高的預測精度,需要利用一些更加復雜的神經網絡結構來學習邊緣負載的變化模式.循環(huán)神經網絡(Recurrent Neural Network,RNN)[6]因其在時間序列建模方面的良好表現而經常被用于云負載的預測,但由于梯度消失問題,傳統(tǒng)的RNN難以學習長期記憶依賴.為了彌補這一缺點,一些RNN的改進變體(如,長短期記憶(Long Short-Term Memory,LSTM)[6]和門控循環(huán)單元(Gated Recurrent Neural Network,GRU)[7])被提出,并且展現出了對長期記憶優(yōu)秀的學習能力.
相比集中式管理的云數據中心,邊緣服務器的部署更加分散,且不同邊緣服務器的負載分布高度不平均[4].例如,跨站點的邊緣服務器負載最大差距達19.8倍,而同站點的邊緣服務器負載最大差距也有14.3倍.這種邊緣負載數據樣本的分布不均導致了不同時間序列對于預測模型的影響程度是不同的,同時也給邊緣負載的預測工作帶來的挑戰(zhàn).因此,這種樣本級差異問題有待解決.此外,現有負載預測工作大多都只針對單點實值預測,并不支持負載的概率分布預測.但是,在許多實際邊緣計算場景中,得到未來負載變化的概率分布情況會比直接預測未來負載的實值更具應用價值[8].這是因為邊緣負載的概率分布預測對于把握邊緣負載的未來變化情況更有參考意義也更有助于邊緣計算系統(tǒng)靈活地調配資源供給.
為了解決上述關鍵性難題,本文提出了一種基于深度自回歸循環(huán)神經網絡的邊緣負載預測方法(Edge Load Prediction with Deep Autoregressive Recurrent networks,ELP-DAR).本文的主要貢獻總結如下.
1)設計了一種新型的邊緣負載預測模型,并將精確預測未來邊緣負載的概率分布作為目標.首先,獲取邊緣服務器歷史負載數據,對其進行清洗、重采樣等預處理操作并引入協(xié)變量編碼.接著,通過實現對邊緣負載概率分布的精確預測,以更好支持邊緣計算系統(tǒng)對資源的高效分配.
2)提出了一種新穎的基于深度自回歸循環(huán)神經網絡的邊緣負載預測方法(ELP-DAR).ELP-DAR方法利用LSTM捕捉邊緣負載數據的重要表征,進而實現對未來邊緣負載概率分布的精確預測.特別地,ELP-DAR方法很好地擬合了樣本級差異較大的邊緣負載數據,為邊緣負載建立了統(tǒng)一的預測模型.
3)基于真實的邊緣負載數據集,通過大量仿真實驗對所提出ELP-DAR方法的有效性進行了驗證與分析.實驗結果表明,與其他基準方法相比,ELP-DAR方法可以取得更高的預測精度,并且在不同預測長度下均展現出了優(yōu)越的性能表現.
近年來,許多學者對負載預測問題開展了研究,主要可分為基于回歸的方法和基于學習的方法.在本節(jié)中,本文將從這兩個角度回顧并分析負載預測相關的研究工作.
Hu等人[9]設計了一種基于自回歸的預測模型,利用歷史CPU使用率時序數據對未來負載進行預測.Calheiros等人[10]利用自回歸方法對Web應用程序的未來請求量進行預測.但是,自回歸方法嚴格遵循線性,無法適應復雜邊緣環(huán)境中高度變化的負載.Yang等人[11]提出了一種基于線性回歸的負載預測方法,進而采用自動縮放機制優(yōu)化虛擬資源分配,以滿足SLA并降低擴展成本.Singh等人[12]將線性回歸與支持向量機相結合,用于Web應用程序的負載預測,并設計了一種負載分類器,根據負載特征選擇預測模型.Liu等人[13]提出了一種基于負載分類的自適應負載預測方法,將各種預測模型分配給不同類型的負載.Bi等人[14]將Savitzky-Golay 濾波器和、小波分解與隨機混合網絡相結合,用于負載預測.Kaur等人[15]針對科學應用,將8種基于回歸的預測模型的平均精度作為最終的負載預測結果,但這種方法可能會受限于不同預測模型的訓練時長.Xie等人[16]提出了一種基于ARIMA和三重指數平滑的混合模型,從線性與非線性角度實時預測云計算環(huán)境中容器資源負載的變化.
上述基于回歸的負載預測方法在處理具有明顯規(guī)律或趨勢的負載時可以實現精確的預測.但是,在面對邊緣環(huán)境中高度變化的負載時,這類方法很難學習到負載的重要表征.此外,這些方法通常只適用于小規(guī)模集群的場景,相比于邊緣計算場景,其負載變化所具有的方差更低,預測也更為容易.因此,為了能更好地捕捉到邊緣負載變化的重要表征,許多學者采用了一些更先進的方法(如機器學習和深度學習).
Zhang等人[17]提出了一種基于規(guī)范多元分解的深度學習模型,用于預測云虛擬機負載使用情況.Kumar等人[18]提出了一種基于LSTM的負載預測模型,在降低均方誤差方面表現出良好的性能.Qiu等人[19]引入了一種負載特征提取方法,進而通過深度學習預測虛擬機未來的負載情況.Zhu等人[20]提出了一種基于注意力機制的LSTM網絡模型,通過編碼器網絡提取歷史數據的特征,并將注意力機制集成到解碼器網絡中進行負載預測.Chen等人[21]提出了一種基于深度學習的負載預測方法,該方法先設計了一種改進的稀疏自編碼器用于提取負載的特征,接著通過集成GRU以實現對高變化負載的自適應精確預測.Xu等人[5]提出了一個基于監(jiān)督學習深層神經網絡用于對云環(huán)境下的負載進行預測.利用滑動窗口將多元數據轉化為監(jiān)督學習時間序列,并使用改進的GRU對負載進行預測.Bi等人[22]利用Bi-LSTM預測云環(huán)境下的負載變化與資源消耗,并在谷歌云集群數據集上進行了驗證.Karim等人[23]將RNN與Bi-LSTM相結合,用于預測虛擬機的CPU負載情況.Kim等人[24]設計了一種CloudInsight預測框架,該框架結合了多個基于傳統(tǒng)機器學習的預測器,可支持動態(tài)與周期性優(yōu)化,以實現對云負載變化的準確預測.Singh等人[25]提出了一種基于進化量子神經網絡的云工作負載預測模型,利用了高效的量子計算,將工作負載編碼為量子比特,以提高預測的準確性.Chen等人[26]設計了一種融合注意力機制的卷積神經網絡,通過相關性分析來篩選性能指標以作為云工作負載預測的多維特征輸入.
上述基于學習的負載預測方法大多針對都是云計算環(huán)境.近年來,邊緣計算吸引了來自學術界和產業(yè)界的廣泛關注.作為邊緣計算中的一項重要技術支撐,負載預測可用于更好地支持邊緣資源的提前配置與分配,進而實現更高效更合理的資源供給.此外,現有方法通常是對未來負載進行單點實值預測.但是,在許多實際邊緣計算環(huán)境中,預測未來負載變化的概率分布情況會比單純地得到未來負載的實值更具應用價值.
為了更好地滿足用戶服務請求,邊緣計算系統(tǒng)需要能夠根據當前和未來的負載情況對計算和存儲等資源進行高效調度,從而實現系統(tǒng)的負載平衡.然而,由于邊緣負載的高度變化性,很難快速制定理想的資源調度方案,這會嚴重影響用戶體驗.同時,不合理的資源調度方案也會導致不必要的運維成本或違反SLA[21].針對邊緣計算環(huán)境,本文提出了一種負載預測模型,如圖1所示.
圖1 所提出的邊緣負載預測模型概覽Fig.1 Overview of the proposed edge-load prediction model
在所提出的邊緣預測模型中,本文利用了真實邊緣計算系統(tǒng)中歷史負載數據.其中,CPU使用率被視為一項最關鍵的資源指標,因此本文將CPU使用率視為主要預測指標.在邊緣計算系統(tǒng)中,CPU使用率可能在短時間內急劇變化.同時,不同邊緣服務器的CPU使用率也存在較大的差異[4].例如,一些邊緣服務器的負載在短時間內出現較大起伏,一些邊緣服務器的負載呈現明顯的季節(jié)性,而一些邊緣服務器的負載長期處于較低水平.針對復雜多變的邊緣負載變化模式,所提出的邊緣預測模型將最小化預測負載與實際負載之間的誤差,以提高邊緣計算系統(tǒng)的服務質量.
具體而言,針對一臺邊緣服務器i的負載,zi,t表示邊緣服務器i在一段時間t內的CPU使用率變化情況.那么,該邊緣服務器的歷史負載序列可表示為[zi,1,zi,2,…,zi,t0-1]:=zi,1:t0-1,未來預測負載序列可表示為[zi,t0,zi,t0+1,…,zi,T]:=zi,t0:T.其中,t0表示負載預測的起始點,T為負載序列的總長度,[1,t0-1]表示歷史負載序列的時間范圍,[t0,T]表示未來預測負載序列的時間范圍.由于原始邊緣負載數據集采用了較高的采樣頻率,產生了一定量的噪聲數據.對于無效數據,在數據清洗過程中通過取區(qū)間平均值進行替換.同時,負載數據的高緯度與冗余性會嚴重影響了預測精度,也導致了較高的計算復雜度.針對這一問題,本文通過重采樣對負載數據進行了壓縮,有效提取出負載數據的重要特征.此外,本文將使用邊緣服務器的用戶作為協(xié)變量以提升邊緣負載預測模型的學習效果,因為協(xié)變量的引入可以幫助預測模型更好地捕捉序列之間的關聯(lián)性.具體而言,本文將用戶ID編碼為協(xié)變量,表示為[xi,1,xi,2,…,xi,T]:=xi,1:T.在邊緣計算系統(tǒng)中,跨服務器之間的CPU使用率存在10~20倍的差異.為了應對上述數據跨度差異進而建立精確的邊緣負載預測模型,本文將每條邊緣服務器負載數據的均值作為縮放因子vi(在輸入預測模型時將負載除以vi,在輸出預測模型時將相應的負載乘以vi),其定義為:
(1)
接著,經過數據預處理,縮放后的歷史負載zi,1:t0-1和協(xié)變量xi,t0-1將作為預測模型的輸入,對未來的邊緣負載進行預測.預測模型能夠根據已知的歷史負載對未來的負載情況進行建模,得到未來負載的概率分布,其定義為:
P(zi,t0:T|zi,1:t0-1,xi,1:T)
(2)
最后,邊緣負載預測結果將協(xié)助邊緣計算服務提供商制定合適的資源調度方案,以實現邊緣計算系統(tǒng)的負載均衡.為了從歷史邊緣負載數據中捕捉未來的邊緣負載的變化情況,本文提出了一種新穎的ELP-DAR方法以對時間序列問題實現更精確的概率分布預測,ELP-DAR方法的細節(jié)將在第4節(jié)中給出.為評估邊緣負載預測的精確度,本文引入了RMSE、ND和mean wQuantileLoss等性能指標[8],其具體定義為:
(3)
(4)
(5)
(6)
基于所提出的系統(tǒng)模型與問題定義,本文提出了一種新穎的基于深度自回歸循環(huán)神經網絡的邊緣負載預測方法(ELP-DAR),其關鍵步驟如算法1所示.
算法1.所提出的ELP-DAR方法
1. 輸入:邊緣負載數據[zi,1,zi,2,…,zi,T]:=zi,1:T、協(xié)變量[xi,1,xi,2,…,xi,T]:=xi,1:T
3. 初始化:學習率γ、訓練輪數K、邊緣服務器數N、LSTM神經網絡層數Nl、LSTM每層神經網絡神經元數Nc、負載輸入長度Lc、負載預測長度Lp、訓練批(mini-batch)大小Nbs、分布函數P、編碼器輸入初始化為0
4. 根據Lc和Lp,將時序數據zi,1:T劃分為輸入負載數據[zi,t0-Lc,zi,t0-Lc+1,…,zi,t0-1]:=zi,t0-Lc:t0-1和預測負載數據[zi,t0,zi,t0+1,…,zi,t0+Lp]:=zi,t0:t0+Lp,并同理將協(xié)變量做相應劃分;
5. FORepisode=1,2,…,KDO
6. FORi=1,2,…,NDO
7. 編碼器對zi,t0-Lc:t0-1、xi,t0-Lc:t0-1進行編碼并輸出hi,t0-1;
8. 解碼器hi,t0-1,zi,t0:t0+Lp、xi,t0:t0+Lp對進行解碼;
9. FORt= 1,2,…,Lc+LpZ DO
11. END FOR
12. FORt= 1,2,…,LpZDO
13. 計算每個時間步t的似然函數參數:θi,t=θ(hi,t,Θl);
16. END FOR
17. FORj= 1,2,…,NbsDO
18. 通過Adam訓練LSTM單元的參數Θh(Wc,Wf,Wi,Wo)和似然函數的映射參數Θl(Wμ,Wσ));
19. END FOR
20. END FOR
21. END FOR
所提出的ELP-DAR方法利用LSTM提取時序特征,其輸入是過去一段時間內的邊緣負載數據和協(xié)變量.ELP-DAR方法的目標是預測每個時間步上邊緣負載zi,t的概率分布.基于公式(2),上述概率分布定義為:
(7)
其中,hi,t代表一個LSTM的輸出.將上一時刻的觀察值zi,t-1和LSTM輸出hi,t-1作為輸入,通過計算可得到hi,t為:
hi,t=h(hi,t-1,zi,t-1,xi,t,Θh)
(8)
其中,h表示一個具有多層LSTM結構的神經網絡,Θh為LSTM中參數的集合.上一時刻的邊緣負載數據zi,1:t-1和隱藏層輸出hi,t-1將用于計算當前時刻的網絡輸出hi,t.似然函數l(zi,t|θ(hi,tΘl))為一個概率分布,通過θ(hi,t,Θl)計算得到其參數集合,包括均值μ與方差σ等,而Θl實現了從hi,t到似然函數參數集合的映像.
ELP-DAR方法總體上為一種序列-序列(Sequence-to-Sequence,S2S)架構,包含編碼器與解碼器.具體而言,ELP-DAR方法中的編碼器與解碼器采用了相同的網絡結構且它們之間共享權重.編碼器的初始輸入(hi,t0-1和zi,0)均初始化為0.在時間區(qū)間[1,t0-1]內,編碼器通過計算得到hi,t0-1,并將其作為解碼器的初始輸入.
圖2展示了ELP-DAR方法的訓練與預測過程.訓練與預測過程中的編碼器是相同的.在模型訓練階段,所有負載數據都是已知的,編碼器將[1,t0-1]時間區(qū)間內的負載數據依次輸入到LSTM中,得到最后一層隱藏層的輸出hi,t0-1,并將其作為解碼器的輸入.
圖2 ELP-DAR方法中的S2S架構Fig.2 S2S architecture in the ELP-DAR method
ELP-DAR方法的訓練過程如圖2(a)所示.每一個時間步的輸入包括協(xié)變量xi,t0、前一時刻的負載值zi,t0-1以及前一時刻的網絡輸出hi,t0-1,通過訓練得到當前時刻的網絡輸出hi,t0=h(hi,t0-1,zi,1:t0-1,xi,t0,Θh),進而計算似然函數l(zi,t0|θi,t0)的參數θi,t0=θ(hi,t0,Θl).接著,通過自適應動量的隨機優(yōu)化方法(Adaptive Moment,Adam)優(yōu)化損失函數:
(9)
其中,N為邊緣負載數據序列的總數量,θ(hi,t,Θl)為似然函數的參數集合,zi,t為真實負載值.
(10)
圖3 ELP-DAR 方法中的LSTM單元結構Fig.3 LSTM cell structure in the ELP-DAR method
(11)
其中,Wc表示與前一層隱藏層與輸入zt、xt之間的連接權重,bc表示對應的偏差.
遺忘門定義為:
ft=sig(Wf[zt,xt,ht-1]+bf)
(12)
其中,Wf表示與前一層隱藏層與輸入zt、xt之間的連接權重,bf表示對應的偏差.
更新門定義為:
it=sig(Wi[zt,xt,ht-1]+bi)
(13)
其中,Wi表示與前一層隱藏層與輸入zt、xt之間的連接權重,bi表示對應的偏差.
輸出門定義為:
ot=sig(Wo[zt,xt,ht-1]+bo)
(14)
其中,Wo表示與前一層隱藏層與輸入zt、xt之間的連接權重,bo表示對應的偏差.輸出門ot用于計算t時刻的隱藏層輸出ht,其定義為:
ht=ottanh(ct)
(15)
與現有負載預測相關工作不同的是,所提出的ELP-DAR 方法并不是直接輸出下一時刻的負載實值,而是輸出下一時刻負載預測的概率分布.針對邊緣服務器負載存在的數據特征差異,ELP-DAR方法考慮了基于不同概率分布的似然函數,包括高斯似然函數和T分布似然函數.以高斯似然函數為例,只需要考慮均值和方差這兩個參數,其定義為:
(16)
其中,均值通過將神經網絡最后一層的輸出映射到線性層得到,其定義為:
(17)
而方差則是進一步通過softplus函數進行激活后得到,其定義為:
(18)
在本節(jié)中,首先介紹了數據集與實驗設置.接著,本文對所提出的ELP-DAR方法的性能進行了評估,并于其他基準方法進行了對比.
在實驗中,本文采用了真實的邊緣負載數據集[4].該數據集包含了6870臺邊緣服務器的負載數據,并以1分鐘為采樣頻率記錄了其1個月內的負載變化情況.具體而言,本文將CPU使用率作為采樣的關鍵性能指標,并將邊緣服務器所屬的用戶ID、開始記錄時間、結束記錄時間、采樣頻率等信息作為邊緣負載數據集的組成部分.圖4展示了不同邊緣服務器的CPU使用率,不同邊緣服務器的負載變化模式存在高度差異.例如,負載變化可能會表現出較強的隨機性,也可能會表現出較強的季節(jié)性.
圖4 邊緣負載變化模式的高度差異Fig.4 High variance of edge-load patterns
基于GlounTS[27],本文實現了所提出的邊緣負載預測模型.對于6870條邊緣負載數據,本文將每條負載數據劃分為訓練集(50%)、驗證集(25%)和測試集(25%).其中,訓練集用于模型的訓練(計算神經網絡的權重),驗證集用于模型參數的選擇(選擇超參數并防止過擬合),而測試集則是用于模型性能的評估.在每個數據集中,根據負載輸入長度和負載預測長度生成多個負載實例.其中,本文設置了預測長度為20分鐘、40分鐘、60分鐘、1天、2天、3天等場景.對分鐘級別的預測場景,設置輸入長度為60分鐘;對天級別的預測場景,設置輸入長度為3天.同時,本文對用戶ID進行了編碼并作為協(xié)變量,并與邊緣負載數據一同作為邊緣負載預測模型的輸入.此外,本文設置訓練總輪數為100,學習率為0.001,LSTM層數為3,每層的神經元為120,批大小為32.
為消除噪聲數據以進一步提升預測的精度與效率,本文根據預測長度設置了不同的重采樣頻率.對于分鐘級別的預測場景,由于數據集本身采樣頻率為1分鐘,故沒有進行重采樣;對于天級別的預測場景,重采樣頻率設置為30分鐘,并取區(qū)間上界時間戳作為重采樣后的新時間戳.圖5展示了重采樣前后負載數據的對比,可以發(fā)現,重采樣后的數據保留了原始負載數據的主要特征和變化模式.通過重采樣對數據進行了壓縮并在一定程度上消除了噪聲,因此可減小模型訓練的復雜度并提升其收斂效果.
圖5 重采樣前后負載數據的對比Fig.5 Comparison of load data before and after resampling
基于上述數據集與實驗設置,本文將所提出的ELP-DAR方法與以下3種基準方法進行了對比:
1)MQ-RNN[28]:基于S2S架構,編碼器采用LSTM,解碼器采用MLP,輸出負載的分位數;
2)MQ-CNN[28]:基于S2S架構,編碼器采用CNN,解碼器采用MLP,輸出負載的分位數;
3)SFF(Simple Feed Forward):傳統(tǒng)的前饋神經網絡,各神經元分層排列,輸出負載的分位數.
首先,對于不同預測長度場景,本文評估了不同概率分布函數對所提出ELP-DAR方法預測性能的影響.如表1所示,當預測長度小于等于1天時,ELP-DAR方法采用高斯分布相比于采用T分布可取得更好的性能表現;當預測長度大于1天時,隨著預測長度的增加,采高斯分布的ELP-DAR方法預測精度逐漸下降,而采用T分布的ELP-DAR方法仍保持較高的預測精度.因為高斯分布為T分布的特殊情況,且T分布更加適合方差未知的樣本數據.在預測長度較短的場景中,負載變化模式更易于捕捉,因此采用高斯分布和T分布所產生的預測性能并沒有較大差距.但是,隨著預測長度的增加,負載變化模式變得更加復雜,導致高斯分布擬合性能的下降.相對而言,T分布對方差未知的負載數據具備更好的擬合能力.因此,在接下來的實驗中,對于預測長度小于等于1天的場景,本文采用高斯分布作為擬合的似然函數;對于預測長度大于1天的場景,本文采用T分布作為擬合的似然函數.
表1 不同預測長度下采用T分布與高斯分布的性能對比Table 1 Performance comparison of T and Gaussian distributions with different prediction lengths
接著,本文對比了ELP-DAR方法與其他3種基準方法在不同預測長度下的性能表現.如表2所示,在分鐘級別的預測場景下,ELP-DAR方法在幾項不同的評價指標上都展現出了更好的性能.當預測長度較短時,由于負載變化模式較為簡單,ELP-DAR方法相比于其他3種基準方法在預測精度上沒有體現出較大的優(yōu)越性.例如,在預測長度為20和60分鐘的場景中,SFF和MQ-CNN方法在部分評價指標中展現出比ELP-DAR方法更好的預測性能.在天級別的預測場景中,ELP-DAR方法在預測精度上優(yōu)于其他3種基準方法.隨著預測長度的不斷增加,ELP-DAR方法可以保持比較穩(wěn)定的預測性能,并且與其他方法的性能差異愈發(fā)明顯.基于S2S架構的MQ-RNN和MQ-CNN方法的預測性能優(yōu)于SFF方法,但相比于ELP-DAR方法仍存在不小差距.這是因為ELP-DAR方法的編碼器和解碼器中均采用了LSTM,并且能夠根據不同預測長度擬合出合適的概率分布函數,因此對于不同預測長度場景展現出了更優(yōu)越的預測性能.特別地,在Mean wQuantileLoss這項評價指標上(該評價指標反映了不同分位數的計算誤差),相比于其他3種基準方法,ELP-DAR方法取得了更高的預測精度.這說明ELP-DAR方法不僅在單點預測中具備良好的性能表現,并且在概率分布預測方面,ELP-DAR方法得到的分位數也能更好地涵蓋真實值.這也彌補了在一些預測場景出現單點預測性能不理想的情況,ELP-DAR方法可以通過概率預測給出分位數,更好地判斷負載未來的變化趨勢.
表2 各種方法在不同預測長度下的性能表現Table 2 Performance of various methods with different prediction lengths
圖6展示了當預測長度為3天時不同方法的預測效果.其中,90%預測區(qū)間表示預測的負載值有90%的概率落在該區(qū)間內;50%預測區(qū)間表示預測的負載值有50%的概率落在該區(qū)間內.從圖中可以發(fā)現,ELP-DAR方法能夠較為精準地預測出未來3天內負載的概率分布,且負載真實值大部分也都落在90%預測區(qū)間內.MQ-RNN、MQ-CNN和SFF等方法雖然能夠大致預測出負載在未來3天內的變化趨勢,但無論是對于90%或50%預測區(qū)間都是通過較大的預測范圍來將真實負載值囊括在內.因此,這些方法無法準確地預測真實值可能落在的區(qū)間,并且隨著預測長度的增加,預測區(qū)間范圍也不斷擴大,這說明方法的置信度較低.相比于這些方法,所提出ELP-DAR方法隨著預測長度的增加仍可以保持較高的置信度,其預測區(qū)間能夠精確地反映負載真實值的變化趨勢.
圖6 當預測長度為3天時不同方法的預測效果Fig.6 Prediction effect of different methods when the prediction length is 3 days
在本文中,首先設計了一種新型的邊緣負載預測模型.接著,本文提出了一種基于深度自回歸循環(huán)神經網絡的邊緣負載預測方法(ELP-DAR),高效捕捉邊緣負載變化的重要表征,進而實現對未來邊緣負載概率分布的精確預測.基于真實的邊緣負載數據集,本文進行了大量實驗,驗證了所提出ELP-DAR方法的可行性和有效性.實驗結果表明,ELP-DAR方法可通過選擇不同的概率分布函數從而針對不同預測長度實現更優(yōu)的預測效果.與其他基準方法相比,ELP-DAR方法在不同預測長度下均展現出了更加優(yōu)越的預測精度,并且在不同預測區(qū)間內均取得了更高的置信度.