楊 力,吳 義,魏德賓,2,潘成勝
1.大連大學(xué) 信息工程學(xué)院,遼寧 大連 116622
2.南京理工大學(xué),南京 210094
3.南京信息工程大學(xué),南京 210044
空天地一體化網(wǎng)絡(luò)是通過星間鏈路和星地鏈路將地面、海上、空中和深空中的用戶、飛行器以及各種通信平臺(tái)相聯(lián)合,實(shí)現(xiàn)信息準(zhǔn)確獲取、快速處理和高效傳輸?shù)拇笕萘啃畔⒕W(wǎng)絡(luò)。衛(wèi)星網(wǎng)絡(luò)作為其中的主干部分,具有全球覆蓋、接入簡(jiǎn)單、支持多種業(yè)務(wù)、帶寬按需分配等傳統(tǒng)地面網(wǎng)絡(luò)無法比擬的優(yōu)勢(shì),在全球通信、導(dǎo)航定位、環(huán)境與災(zāi)害監(jiān)測(cè)和軍事應(yīng)用等領(lǐng)域發(fā)揮著越來越重要的作用。
流量規(guī)劃是通信網(wǎng)絡(luò)設(shè)計(jì)中對(duì)流量進(jìn)行科學(xué)分配的方法,經(jīng)過優(yōu)化的流量分配方法可以提升網(wǎng)絡(luò)的利用率,這對(duì)于帶寬資源受限的衛(wèi)星網(wǎng)絡(luò)來說尤為重要[1]。流量預(yù)測(cè)是流量規(guī)劃的前提和重要基礎(chǔ),在衛(wèi)星網(wǎng)絡(luò)中,通過對(duì)各衛(wèi)星下一時(shí)段的流量需求進(jìn)行預(yù)測(cè),可以提前規(guī)劃流量傳輸,計(jì)算路由表,從而主動(dòng)地避免擁塞,提高傳輸效率。近幾年來,基于網(wǎng)絡(luò)流量預(yù)測(cè)的方法層出不窮,預(yù)測(cè)算法在預(yù)測(cè)精度和效率以及算法復(fù)雜度等方面各有優(yōu)劣。但是由于衛(wèi)星網(wǎng)絡(luò)流量呈現(xiàn)時(shí)空相關(guān)性的特點(diǎn),傳統(tǒng)的流量預(yù)測(cè)方法未能達(dá)到較高的預(yù)測(cè)精度和運(yùn)行效率,因此,為了解決這個(gè)問題,就必須快速、準(zhǔn)確地對(duì)未來短時(shí)甚至長(zhǎng)時(shí)的衛(wèi)星網(wǎng)絡(luò)流量進(jìn)行預(yù)測(cè)[2-6]。同時(shí),衛(wèi)星網(wǎng)絡(luò)中的節(jié)點(diǎn)在運(yùn)動(dòng)時(shí),不同節(jié)點(diǎn)會(huì)具有相同或者相似的地面軌跡,而且,受人類工作、生活作息規(guī)律的影響,全球用戶流量又表現(xiàn)出相似的周期特點(diǎn),所以,當(dāng)這兩方面因素同時(shí)影響時(shí),不同衛(wèi)星流量負(fù)載之間就會(huì)出現(xiàn)相關(guān)性,再加上衛(wèi)星網(wǎng)絡(luò)流量的自相似特性[7]和拓?fù)鋾r(shí)變等影響著流量的預(yù)測(cè)精度,因此,在進(jìn)行衛(wèi)星網(wǎng)絡(luò)流量預(yù)測(cè)時(shí),不僅要考慮此顆衛(wèi)星的歷史流量,也應(yīng)考慮與其相關(guān)的衛(wèi)星流量,要兼顧預(yù)測(cè)精度和算法復(fù)雜度,達(dá)到二者的均衡。
目前,地面網(wǎng)絡(luò)流量的預(yù)測(cè)模型已經(jīng)廣泛應(yīng)用,比如時(shí)間序列分析、非線性分析、人工智能等。其中基于人工智能的方法由于簡(jiǎn)單、魯棒性強(qiáng),應(yīng)用于很多的工程中[8]。例如,支持向量機(jī)[9]已經(jīng)在實(shí)際地面網(wǎng)絡(luò)的流量預(yù)測(cè)中應(yīng)用,其預(yù)測(cè)結(jié)果能較好地用于流量分配的策略中,但是,衛(wèi)星網(wǎng)絡(luò)相比較地面,其可用資源有限和拓?fù)鋾r(shí)變,這令傳統(tǒng)地面網(wǎng)絡(luò)流量預(yù)測(cè)算法[10]若是直接應(yīng)用于衛(wèi)星網(wǎng)絡(luò),將不可避免地面臨預(yù)測(cè)精度和運(yùn)行效率的挑戰(zhàn)。以神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的組合模型以其強(qiáng)大的容錯(cuò)性、快速并行的計(jì)算和強(qiáng)大的學(xué)習(xí)能力,在預(yù)測(cè)方面取得不錯(cuò)的效果,但是在參數(shù)選擇上只能依靠經(jīng)驗(yàn),而且算法時(shí)間復(fù)雜度高、訓(xùn)練時(shí)間長(zhǎng)以及收斂速度慢。為此,本文提出了基于奇異矩陣分解的梯度提升回歸樹方法。首先通過相關(guān)系數(shù)來確定衛(wèi)星網(wǎng)絡(luò)流量的時(shí)空相關(guān)性,找到時(shí)空相關(guān)流量[11-13],然后通過對(duì)時(shí)空相關(guān)流量的降維處理,減少存儲(chǔ)空間,降低計(jì)算時(shí)間,最后采用梯度提升回歸樹進(jìn)行訓(xùn)練進(jìn)行平滑參數(shù),通過測(cè)試得到相對(duì)精準(zhǔn)的預(yù)測(cè)值。在對(duì)實(shí)際網(wǎng)絡(luò)流量預(yù)測(cè)的仿真試驗(yàn)中,相比較傳統(tǒng)算法,所提的算法在性能上達(dá)到了訓(xùn)練速度快的優(yōu)點(diǎn),同時(shí)也保證了相對(duì)精準(zhǔn)的預(yù)測(cè)精度,較好地滿足了衛(wèi)星網(wǎng)絡(luò)流量的預(yù)測(cè)要求,為衛(wèi)星網(wǎng)絡(luò)的流量規(guī)劃提供了強(qiáng)有力的決策支持[5]。
在統(tǒng)計(jì)學(xué)中,時(shí)滯Pearson 相關(guān)方程[14]可以用來判斷兩個(gè)時(shí)間序列在一定時(shí)延下的相關(guān)程度。由于這個(gè)特點(diǎn),時(shí)滯Pearson 相關(guān)方程也能夠用來有效地分析衛(wèi)星網(wǎng)絡(luò)流量的時(shí)空相關(guān)性,假設(shè)第i號(hào)衛(wèi)星流量的負(fù)載是由一系列離散觀察值組成的,也就是可以用時(shí)間序列表示為:
其中xi(t)是i號(hào)衛(wèi)星當(dāng)前最新的流量觀察值。則兩個(gè)流量時(shí)間序列Xi和Xj在時(shí)延為d下的時(shí)滯Pearson相關(guān)方程定義為:
ρij(d)為Xj提前于Xi在d時(shí)間下的Pearson 相關(guān)系數(shù),它指第i號(hào)衛(wèi)星的當(dāng)前流量值與第j號(hào)衛(wèi)星歷史流量值之間的關(guān)聯(lián)程度。n是用于比較的流量時(shí)間序列長(zhǎng)度,和是Xi和Xj的均值。當(dāng)ρij(d)越接近+1 或者?1 時(shí),兩個(gè)流量時(shí)間序列存在較大的時(shí)空相關(guān)性;當(dāng)ρij(d)接近于0時(shí),兩個(gè)時(shí)間序列不存在時(shí)空相關(guān)性。當(dāng)i=j,d≠0,時(shí)滯Pearson 相關(guān)系數(shù)也可以反映流量時(shí)間序列在不同時(shí)滯條件下的自相關(guān)程度;當(dāng)i≠j,d=0 時(shí),時(shí)滯相關(guān)系數(shù)也可以表示兩實(shí)時(shí)流量時(shí)間序列的相關(guān)程度。對(duì)于時(shí)間相關(guān)系數(shù),需要設(shè)置一個(gè)相應(yīng)的閾值,當(dāng)一個(gè)待考查流量與目標(biāo)流量之間的時(shí)間相關(guān)系數(shù)的絕對(duì)值大于閾值時(shí),可認(rèn)為它是目標(biāo)流量的時(shí)空相關(guān)流量,反之,則不是目標(biāo)流量的時(shí)空相關(guān)流量。以時(shí)空相關(guān)流量作為預(yù)測(cè)輸入就避免了挑選輸入變量時(shí)的主觀性和盲目性。同時(shí),以時(shí)空相關(guān)流量作為預(yù)測(cè)輸入也可以更加準(zhǔn)確地描述待測(cè)流量的變化規(guī)律、消除不必要的干擾并最終提升訓(xùn)練速度以及預(yù)測(cè)精度。
在對(duì)網(wǎng)絡(luò)流量預(yù)測(cè)的過程中,由于輸入向量的維數(shù)過高,再加上輸入向量之間相互聯(lián)系,導(dǎo)致輸入向量之間在一定程度上存在著信息冗余,尤其是需要考慮的相關(guān)流量數(shù)量較多時(shí),即維度較高時(shí),這種重疊和冗余很可能會(huì)抹殺掉流量的真實(shí)特性和變化規(guī)律。此外,太多的相關(guān)數(shù)據(jù)也會(huì)占用很大的存儲(chǔ)容量,增加信息處理的復(fù)雜度和時(shí)間成本,所以,當(dāng)挑選出的相關(guān)預(yù)測(cè)輸入流量數(shù)量較多時(shí),必須要進(jìn)行壓縮,提取相關(guān)流量間的最主要的變化特征。這里利用奇異矩陣分解法來進(jìn)行降維,從多個(gè)變量中選取較少的重要變量,達(dá)到簡(jiǎn)化數(shù)據(jù)集的目的。通過時(shí)空相關(guān)性的分析,利用時(shí)空相關(guān)流量提取過程找到m個(gè)時(shí)空相關(guān)流量,即離散的流量時(shí)間序列,X1,X2,…,Xm,每個(gè)相關(guān)流量都由n個(gè)觀察樣本值構(gòu)成,Xi=[x1i,x2i,…,xni],通常X1,X2,…,Xm在時(shí)間上是不對(duì)齊的。因此,由X1,X2,…,Xm可以構(gòu)成原始預(yù)測(cè)輸入流量矩陣X(Xm×n):
X是一個(gè)m×n的矩陣,雖然X不是方陣,但是m階XXT和n階的XXT卻是對(duì)稱矩陣,若XXT=UΛ1UT,XTX=VΛ2VT,則矩陣X的奇異值分解為:X=UΣVT,其中U是一個(gè)m×m的矩陣,U=(u1,u2,…,um) ,列向量u1,u2,…,um是XXT的特征向量,即矩陣X的左奇異矩陣,Σ是一個(gè)m×n的矩陣,V是一個(gè)n×n的矩陣,V=(v1,v2,…,vn),列向量v1,v2,…,vn是XTX的特征向量,即X的右奇異向量。矩陣Λ1為m×m階,矩陣Λ2為n×n階,兩個(gè)矩陣對(duì)角線的非零元素相同,Σ為m×n階矩陣,位于對(duì)角線上的元素就是奇異值。設(shè)常數(shù)k是矩陣X的秩,則k≤(m,n),當(dāng)m≠n時(shí),很明顯矩陣Λ1和Λ2階數(shù)不同,但是對(duì)角線上的非零元素相同,設(shè)矩陣Λ1的對(duì)角線上的非零元素為λ1,λ2,…,λk,其中,這些特征值都是非負(fù)的,設(shè)矩陣Σ對(duì)角線上的非零元素為σ1,σ2,…,σk,則,即所有的奇異值。隨后計(jì)算各個(gè)奇異值的方差貢獻(xiàn)率:,以及累計(jì)貢獻(xiàn)率:,根據(jù)累計(jì)貢獻(xiàn)率的實(shí)際要求(這里要求大于90%)來決定主要的信息個(gè)數(shù)k,這里的k個(gè)主要信息將囊括所有原始流量變量中的絕大部分信息。
為了提高衛(wèi)星網(wǎng)絡(luò)流量預(yù)測(cè)的精度,本文提出一種基于梯度提升回歸樹的網(wǎng)絡(luò)流量預(yù)測(cè)模型。每個(gè)基本模型是一棵回歸樹,目的是用來糾正上一次迭代過程中產(chǎn)生的殘差。殘差就是預(yù)測(cè)值和觀測(cè)值之間的差值,差值越小說明模型的預(yù)測(cè)性能越好。為了提高模型的性能并且降低殘差值,現(xiàn)從損失函數(shù)入手進(jìn)行改進(jìn),通過引入lg-cosh 損失函數(shù),來降低殘差損失。lg-cosh 損失函數(shù)是一種使用魯棒性回歸的損失函數(shù),lg-cosh損失函數(shù)表述為:。通過上述奇異矩陣分解(SVD)提取衛(wèi)星網(wǎng)絡(luò)的時(shí)空相關(guān)流量,收集到的流量表現(xiàn)出時(shí)間上的特性和空間上的特性,對(duì)所確定區(qū)域內(nèi)的衛(wèi)星網(wǎng)絡(luò)流量選取與目標(biāo)衛(wèi)星網(wǎng)絡(luò)流量相關(guān)系數(shù)大的作為自變量,目標(biāo)衛(wèi)星網(wǎng)絡(luò)流量作為因變量,建立梯度提升回歸樹的預(yù)測(cè)模型,將時(shí)空相關(guān)流量作為模型的輸入變量。
已知訓(xùn)練數(shù)據(jù)集為:
假設(shè)每棵回歸樹的葉子是J,樹的深度max_depth,這里使用的是lightGBM 中的leaf_wise 算法,而并非是level_wise,相對(duì)于level_wise 而言,leaf_wise 每次選取的都是當(dāng)前損失下降最多的葉節(jié)點(diǎn)進(jìn)行分割使得整體模型的損失下降得更多,但是當(dāng)數(shù)據(jù)量較小的時(shí)候容易過擬合,因此max_depth 很好地解決了這個(gè)問題,將輸入空間劃分為J個(gè)互不相交的區(qū)域R1,R2,…,RJ,并且在每個(gè)區(qū)域上確定輸出的常量cj,則回歸樹可表述為:
其中,Θ={(R1,c1),(R2,c2),…,(RJ,cJ)} ,表示樹的區(qū)域劃分和各區(qū)域上的常數(shù)。J是回歸樹的復(fù)雜度即葉子結(jié)點(diǎn)個(gè)數(shù)。首先初始化模型:
模型沿梯度下降的方向進(jìn)行迭代生成M棵回歸樹,m表示第m棵樹,同時(shí),迭代的目的是降低殘差值。對(duì)于模型的第m次迭代,在模型中計(jì)算損失函數(shù)負(fù)梯度的當(dāng)前值,并將它作為殘差值的估計(jì)值rmi:
在原來梯度值的基礎(chǔ)上增加了對(duì)梯度值進(jìn)行動(dòng)量加速和減速,沿著負(fù)梯度方向一致的地方進(jìn)行加速,在梯度方向不斷改變地方進(jìn)行減速,更新公式為:rmi=ρrmi,其中ρ是一個(gè)動(dòng)量因子,取值為ρ∈[0,1],它的大小決定這動(dòng)量項(xiàng)作用的強(qiáng)弱,當(dāng)ρ=0 時(shí)沒有影響,當(dāng)ρ=1時(shí)影響最強(qiáng),平滑效果明顯。對(duì)于殘差,梯度提升回歸樹模型將為其擬合一個(gè)回歸樹T(x;Θ),得到第m棵樹的葉節(jié)點(diǎn)區(qū)域Rmj,j=1,2,…,J,計(jì)算梯度下降的步長(zhǎng):
隨后更新模型:
其中l(wèi)r表示學(xué)習(xí)率,引入較高的學(xué)習(xí)率,是為了讓模型收斂速度加快,減少訓(xùn)練時(shí)間。最后得到回歸樹:
基于梯度提升回歸樹的衛(wèi)星網(wǎng)絡(luò)流量預(yù)測(cè)模型如圖1 所示,利用訓(xùn)練數(shù)據(jù)建立穩(wěn)定模型,并利用測(cè)試數(shù)據(jù)對(duì)模型的性能進(jìn)行評(píng)價(jià)。
圖1 基于梯度提升回歸樹的衛(wèi)星網(wǎng)絡(luò)流量建模流程圖
梯度提升回歸樹沿梯度下降的方向構(gòu)建一個(gè)新的模型,這里利用提高學(xué)習(xí)率從而優(yōu)化算法收斂的方法,此外,通過最小化損失函數(shù)的期望值來不斷更新模型,從而使得模型趨于穩(wěn)定,最后用測(cè)試數(shù)據(jù)預(yù)測(cè)未來值進(jìn)行驗(yàn)證。該模型在訓(xùn)練過程中不僅引入了lg-cosh損失函數(shù)作為擬合殘差的方法,還考慮模型的預(yù)測(cè)結(jié)果受到衛(wèi)星網(wǎng)絡(luò)流量的時(shí)空相關(guān)性因素的影響,同時(shí)通過不斷調(diào)整基本模型的權(quán)重來提高預(yù)測(cè)精度。
在本實(shí)驗(yàn)中,首先利用STK 搭建一個(gè)銥星星座,如圖2所示。
圖2 銥星星座
在t時(shí)刻,選取LEO_4_5 衛(wèi)星作為待預(yù)測(cè)衛(wèi)星,設(shè)為1 號(hào)衛(wèi)星,此時(shí)1 號(hào)衛(wèi)星的流量為X1(t),通過觀察1號(hào)衛(wèi)星在這段時(shí)間內(nèi)的流量時(shí)間序列,它的流量負(fù)載在白天的時(shí)候相對(duì)較高,在接近午夜和凌晨的時(shí)較低,這也就表明了衛(wèi)星網(wǎng)絡(luò)流量具有周期性變化。因?yàn)樵阢炐切亲?,衛(wèi)星繞自身軌道運(yùn)轉(zhuǎn)的周期約為110 min,地球自轉(zhuǎn)周期約為1 440 min,流量的變化周期是24 h,所以衛(wèi)星接收到的總流量會(huì)按照三者的最小公倍數(shù),約為24 h,周期性的變化。將所選取的9 顆銥星衛(wèi)星所覆蓋的區(qū)域作為研究區(qū)域,在該區(qū)域當(dāng)中,若有衛(wèi)星與1 號(hào)衛(wèi)星星下點(diǎn)的連線和1 號(hào)衛(wèi)星與其星下點(diǎn)連線的夾角小于或者等于α,其中α取60,那么收集該衛(wèi)星在一定時(shí)間段內(nèi)的衛(wèi)星網(wǎng)絡(luò)流量,作為衛(wèi)星網(wǎng)絡(luò)流量時(shí)空相關(guān)性分析的條件。根據(jù)計(jì)算,共有8顆衛(wèi)星在此時(shí)間段內(nèi)與1號(hào)衛(wèi)星星下點(diǎn)的連線夾角小于或者等于α,所以取此8 顆衛(wèi)星收集的流量進(jìn)行時(shí)空相關(guān)性分析,此8 顆衛(wèi)星分別為L(zhǎng)EO_3_4、LEO_3_5、LEO_3_6、LEO_4_4、LEO_4_6、LEO_5_4、LEO_5_5、LEO_5_6。
如圖3所示,1號(hào)衛(wèi)星和與2號(hào)衛(wèi)星與地心的夾角為θ,即地心角,且h1、h2分別表示1號(hào)衛(wèi)星與其星下點(diǎn)的距離,2號(hào)衛(wèi)星與1號(hào)衛(wèi)星星下點(diǎn)的距離,α為h1與h2之間的夾角,d為1 號(hào)衛(wèi)星與2 號(hào)衛(wèi)星的星間鏈路距離,Re為地球半徑。由于所選衛(wèi)星是處于同一軌道高度,所以星間鏈路長(zhǎng)度d,可表示為所以h1與h2之間夾角為。首先收集1號(hào)衛(wèi)星在400 min內(nèi)的流量時(shí)間序列,每隔60 min進(jìn)行一次測(cè)量。
圖3 兩顆衛(wèi)星在1號(hào)衛(wèi)星星下點(diǎn)處的夾角
在獲得所有衛(wèi)星在400 min 內(nèi)的流量時(shí)間序列后,作為預(yù)測(cè)模型的輸入變量,然后利用Pearson 方程來計(jì)算1 號(hào)衛(wèi)星與其他各衛(wèi)星流量在不同時(shí)滯條件下的相關(guān)系數(shù),將結(jié)果由小到大進(jìn)行排列,選取了前32個(gè)相關(guān)程度較高的時(shí)空相關(guān)流量列于表中。設(shè)置的相關(guān)系數(shù)的閾值為0.75,此時(shí)獲得了較低的MAE結(jié)果,當(dāng)時(shí)空相關(guān)系數(shù)閾值小于0.75 時(shí),過多的低相關(guān)流量被選出,因此導(dǎo)致預(yù)測(cè)過程受到了較大的干擾,預(yù)測(cè)的MAE 結(jié)果偏高。當(dāng)時(shí)空相關(guān)系數(shù)閾值設(shè)置大于0.75時(shí),挑選出的少量時(shí)空相關(guān)流量不足以涵蓋目標(biāo)流量的全部特性,因此MAE 結(jié)果同樣偏高。而0.75 的閾值正好在兩種之中,所以獲得較好的預(yù)測(cè)結(jié)果。這樣,通過分析與驗(yàn)證,使得復(fù)雜度降低了,精度也有所提高。
設(shè)衛(wèi)星序列號(hào)為K,與目標(biāo)衛(wèi)星的相關(guān)系數(shù)設(shè)為P。第1號(hào)衛(wèi)星與各衛(wèi)星流量之間的時(shí)滯Pearson相關(guān)系數(shù)如表1所示。
如表1所示,第1號(hào)衛(wèi)星與這32組衛(wèi)星流量都具有較高的時(shí)空相關(guān)性(相關(guān)系數(shù)都大于0.75),但是其中有16組的時(shí)空相關(guān)系數(shù)在0.8以上,此處的0.8閾值經(jīng)分析之后相較于0.75預(yù)測(cè)更加準(zhǔn)確,所以選取0.8作為依據(jù),以16 組為待測(cè)的第1 號(hào)衛(wèi)星的時(shí)空相關(guān)流量。時(shí)空相關(guān)流量體現(xiàn)了衛(wèi)星網(wǎng)絡(luò)流量間的互相關(guān)性與自相關(guān)性。以時(shí)空相關(guān)流量作為預(yù)測(cè)可排除其他無關(guān)流量的干擾提升最終結(jié)果的準(zhǔn)確度。然而由于挑選出的相關(guān)流量數(shù)目較多且相互間存在大量的信息重疊和冗余。因此,使用SVD 對(duì)這16 組相關(guān)流量進(jìn)行降維,將這16組相關(guān)流量的分析結(jié)果列表于表2。
表1 第1號(hào)衛(wèi)星與各衛(wèi)星流量之間的時(shí)滯Pearson相關(guān)系數(shù)(相關(guān)系數(shù)閾值為0.75)
表2 16組相關(guān)流量的分析結(jié)果
如表2 所示,前4 個(gè)主要的信息t1,t2,t3,t4,已經(jīng)保留了原始16組的相關(guān)變量中91.811%的方差和信息,所以,將這4 個(gè)主要信息作為新的不相關(guān)變量,來替代原始的16組相關(guān)變量充當(dāng)預(yù)測(cè)算法的最終輸入。在收集的實(shí)驗(yàn)數(shù)據(jù)中,選取前300 組的數(shù)據(jù)作為訓(xùn)練樣本,最后100 組的數(shù)據(jù)將作為測(cè)試樣本。收集到的原始衛(wèi)星網(wǎng)絡(luò)流量如圖4所示。
圖4 原始衛(wèi)星網(wǎng)絡(luò)流量
實(shí)驗(yàn)采用預(yù)測(cè)誤差百分比絕對(duì)值均值(MAPE)、預(yù)測(cè)誤差絕對(duì)值均值(MAE)來評(píng)估模型的預(yù)測(cè)性能,其值越小表示預(yù)測(cè)結(jié)果越準(zhǔn)確。,其中y(i)代表流量的實(shí)際值,y"(i)代表流量的預(yù)測(cè)值,m是測(cè)試樣本的數(shù)量。
考慮到其中消除冗余和重疊信息的同時(shí),可能會(huì)出現(xiàn)將某些重要的信息也會(huì)一并消除,所以通過圖5、圖6的仿真對(duì)比發(fā)現(xiàn),S-GBDT模型的預(yù)測(cè)精度比GBDT預(yù)測(cè)模型的精度平均高47%,而且其訓(xùn)練時(shí)間較GBDT訓(xùn)練的時(shí)間大幅度縮短,整體上提高了39%,如表3所示。
圖5 S-GBDT算法預(yù)測(cè)結(jié)果
圖6 GBDT算法預(yù)測(cè)結(jié)果
表3 各算法的預(yù)測(cè)性能
最后將兩種方法進(jìn)行誤差對(duì)比,S-GBDT模型的誤差相較于GBDT 模型的誤差就比較低。兩種方法的誤差對(duì)比圖如圖7所示。
圖7 兩種方法誤差對(duì)比圖
本文利用收集到的衛(wèi)星網(wǎng)絡(luò)流量時(shí)間序列,提出了基于奇異矩陣分解的梯度提升決策樹的模型來預(yù)測(cè)衛(wèi)星網(wǎng)絡(luò)流量。通過在決策樹的訓(xùn)練過程中不斷對(duì)弱學(xué)習(xí)器的權(quán)重進(jìn)行優(yōu)化,使其成為強(qiáng)學(xué)習(xí)器,從而提高了模型的預(yù)測(cè)精度。大量的仿真實(shí)驗(yàn)證明,相比較其他的預(yù)測(cè)算法,S-GBDT算法擁有相對(duì)較高的預(yù)測(cè)準(zhǔn)確度以及更少的計(jì)算和訓(xùn)練時(shí)間。所以,該算法對(duì)于實(shí)際的衛(wèi)星網(wǎng)絡(luò)系統(tǒng)應(yīng)具有巨大的應(yīng)用價(jià)值。目前,對(duì)衛(wèi)星網(wǎng)絡(luò)流量預(yù)測(cè)的研究越來越深入,下一步工作將嘗試將流量預(yù)測(cè)值與擁塞控制相結(jié)合。