黃冬宜,楊 兵,吳子豪,匡佳一,顏澤明
云南大學(xué) 軟件學(xué)院,昆明650500
隨著智能手機(jī)的普及與應(yīng)用,蜂窩用戶數(shù)急劇增加,根據(jù)2018 年11 月版的愛(ài)立信《移動(dòng)市場(chǎng)報(bào)告》對(duì)VoLTE(Voiceover Long-Term Evolution)、5G(5th Generation Mobile Networks)、M-IoT(Machine-Internet of Things)、移動(dòng)流量進(jìn)行了分析與預(yù)測(cè),全球移動(dòng)數(shù)據(jù)流量在2018年至2024年間預(yù)計(jì)將增長(zhǎng)超過(guò)5倍。第五代移動(dòng)網(wǎng)絡(luò)(5G)將采用深度學(xué)習(xí)和人工智能技術(shù)[1-3],并且[4-7]針對(duì)該發(fā)展已經(jīng)進(jìn)行了深入研究。2019 年8 月22日國(guó)際電信聯(lián)盟(ITU)正式發(fā)布了一份5G+Al 國(guó)際標(biāo)準(zhǔn)[8],把機(jī)器學(xué)習(xí)ML(Machine Learning)以成本低但收效大的方式集成到5G 系統(tǒng)和未來(lái)網(wǎng)絡(luò)中作為標(biāo)準(zhǔn),電信網(wǎng)絡(luò)業(yè)界中的每家公司都在探索對(duì)機(jī)器學(xué)習(xí)的引入,以期待優(yōu)化網(wǎng)絡(luò)運(yùn)營(yíng)、提高能源利用效率并降低網(wǎng)絡(luò)運(yùn)營(yíng)成本為滿足移動(dòng)用戶的多樣化需求,人工智能的引入將使無(wú)線網(wǎng)絡(luò)能夠自我優(yōu)化,提高效率,并提供最佳的用戶體驗(yàn),從而為用戶帶來(lái)更穩(wěn)定的網(wǎng)絡(luò)連接。
為了實(shí)現(xiàn)全自動(dòng)網(wǎng)絡(luò)智能管理的增強(qiáng),對(duì)無(wú)線通信的流量進(jìn)行實(shí)時(shí)或非實(shí)時(shí)的分析和預(yù)測(cè)是非常重要的,準(zhǔn)確的流量預(yù)測(cè)[7]是關(guān)鍵問(wèn)題之一。例如,對(duì)未來(lái)流量的準(zhǔn)確預(yù)測(cè)可以大大提高需求感知資源分配的效率。然而,由于以下原因,同時(shí)對(duì)蜂窩網(wǎng)絡(luò)進(jìn)行廣泛的預(yù)測(cè)是一項(xiàng)非常困難的任務(wù)。首先,移動(dòng)用戶在不同的時(shí)空有不同的需求,這使得流量預(yù)測(cè)的難度提升。其次,且用戶間的通訊將空間依賴引入到蜂窩通信流量中。另外,每個(gè)地方的蜂窩流量狀況與該地歷史觀測(cè)值有關(guān),對(duì)這樣的時(shí)間相關(guān)性進(jìn)行建模也是個(gè)難題。最后,蜂窩網(wǎng)絡(luò)的流量受到許多外部因素的影響。
基于上述問(wèn)題,本文提出了一種有效的時(shí)空密集全連接網(wǎng)絡(luò)(ST-FCCNet)。設(shè)計(jì)了一個(gè)ST-FCC單元結(jié)構(gòu)直接捕獲任意區(qū)域間的空間依賴。ST-FCC單元作為一個(gè)全局特征提取器提取出區(qū)域間的空間依賴。其次,通過(guò)分別對(duì)蜂窩流量的臨近性和周期性進(jìn)行建模,并將它們進(jìn)行融合來(lái)捕捉完整的時(shí)間依賴性。最后,考慮到外部影響因素對(duì)蜂窩流量的影響,使得模型的擬合能力增強(qiáng)。本文的系統(tǒng)可以對(duì)更復(fù)雜的空間關(guān)聯(lián)性和外部影響因素進(jìn)行建模,獲得更好的效果,貢獻(xiàn)有以下幾點(diǎn):
(1)ST-FCCNet把原來(lái)卷積層得到的特征圖分出一部分,經(jīng)過(guò)全連接層來(lái)直接捕獲城市任意區(qū)域間的空間依賴。
(2)將蜂窩流量的時(shí)間特性歸為兩類(lèi)時(shí)間臨近性和周期性ST-FCCNet 使用兩個(gè)密集連接網(wǎng)絡(luò)分支分別對(duì)它們進(jìn)行建模,來(lái)捕捉它的時(shí)間依賴性。
(3)ST-FCCNet考慮了外部條件(時(shí)間、天氣、假期等)對(duì)蜂窩流量數(shù)據(jù)的影響,它將時(shí)間、天氣、假期、工作日這些外部影響因子加入模型中來(lái)提高預(yù)測(cè)結(jié)果的精確度。
(4)在實(shí)驗(yàn)部分,利用意大利的電信數(shù)據(jù)評(píng)估了本文的算法,結(jié)果表明本文的模型優(yōu)于其他4 種算法,與最優(yōu)模型相比本文提出的方法在預(yù)測(cè)精度上提高了7.50%到7.76%。
蜂窩網(wǎng)絡(luò)流量預(yù)測(cè)可以看作一個(gè)復(fù)雜的時(shí)空預(yù)測(cè)問(wèn)題。近年來(lái),人們?cè)谠擃I(lǐng)域做了大量的工作來(lái)研究蜂窩網(wǎng)絡(luò)流量的動(dòng)態(tài)特性。自回歸滑動(dòng)平均(ARIMA)[9]將觀測(cè)到的時(shí)間序列擬合進(jìn)一個(gè)模型,然后用來(lái)預(yù)測(cè),但ARIMA 不適合有缺失值的時(shí)間序列。歷史平均模型[10](HA)比較簡(jiǎn)單,它預(yù)測(cè)的未來(lái)時(shí)間序列的平均值僅是使用歷史時(shí)間序列的平均值來(lái)進(jìn)行預(yù)測(cè)的,導(dǎo)致此模型無(wú)法對(duì)動(dòng)態(tài)事件作出響應(yīng)。并且蜂窩流量的模式在個(gè)人需求和外部條件(如節(jié)假日、工作日等)等因素的影響下,變得非常復(fù)雜。為了解決這些問(wèn)題,基于深度學(xué)習(xí)的模型被相繼提出,獲得了很好的效果。Deep-ST[11]是第一個(gè)使用卷積網(wǎng)絡(luò)捕獲空間信息的模型。通過(guò)融合金字塔型的ConvGRU模型和周期表示,Periodic-CRN[12]被設(shè)計(jì)成了捕獲人群通訊周期性的模型。文獻(xiàn)[13]提出了一種基于深度信念網(wǎng)絡(luò)的預(yù)測(cè)方法來(lái)模擬蜂窩網(wǎng)絡(luò)流量的長(zhǎng)期依賴性它將深度置信回聲狀態(tài)網(wǎng)絡(luò)應(yīng)用于網(wǎng)絡(luò)流量預(yù)測(cè)。針對(duì)不同單元的空間依賴性,文獻(xiàn)[14]提出了一種自編碼與長(zhǎng)短時(shí)記憶(LSTM)網(wǎng)絡(luò)相結(jié)合的策略。文獻(xiàn)[15]提出了一種新的端到端深度學(xué)習(xí)模型ST-3DNet,考慮交通數(shù)據(jù)的兩種時(shí)間特性,即短期性和長(zhǎng)期性,ST-3DNet分別使用由3D convolutions和Rc block組成的兩個(gè)分量對(duì)這兩種模式進(jìn)行建模,然后加權(quán)組合在一起進(jìn)行最終預(yù)測(cè)。文獻(xiàn)[16]提出了一種時(shí)空注意力機(jī)制,能夠更好地建模動(dòng)態(tài)的空間相關(guān)性和非線性的時(shí)間相關(guān)性,提出一種轉(zhuǎn)移注意力機(jī)制,將歷史交通特征轉(zhuǎn)移到未來(lái)表征,建模歷史時(shí)間步和未來(lái)時(shí)間步之間的直接關(guān)系。文獻(xiàn)[17]提出了一種新的時(shí)空?qǐng)D注意算法,它能有效地捕捉道路網(wǎng)絡(luò)的時(shí)空動(dòng)態(tài)。文獻(xiàn)[18]提出了一種基于神經(jīng)網(wǎng)絡(luò)的交通預(yù)測(cè)方法——時(shí)間圖卷積網(wǎng)絡(luò)(T-GCN)模型,該模型結(jié)合了圖卷積網(wǎng)絡(luò)(GCN)和門(mén)控遞歸單元(GRU)。GCN用于學(xué)習(xí)復(fù)雜的拓?fù)浣Y(jié)構(gòu)來(lái)捕獲空間依賴關(guān)系,GRU 用于學(xué)習(xí)交通數(shù)據(jù)的動(dòng)態(tài)變化來(lái)捕獲時(shí)間依賴關(guān)系。文獻(xiàn)[19]提出了一個(gè)圖多注意力機(jī)制網(wǎng)絡(luò)(GMAN),預(yù)測(cè)路網(wǎng)上不同區(qū)域的交通狀況。DenseNet[20]是一種對(duì)無(wú)線交通的非線性和動(dòng)態(tài)性進(jìn)行建模的深度學(xué)習(xí)方法,它將交通數(shù)據(jù)作為圖像處理,利用密集連接的卷積神經(jīng)網(wǎng)絡(luò)很好地捕捉了蜂窩流量的時(shí)空依賴性,并提出了一種基于參數(shù)矩陣的融合方案,以學(xué)習(xí)時(shí)空相關(guān)性的影響程度。隨著研究的深入,很多高精度的方法涌現(xiàn)出來(lái),時(shí)間序列模型和參數(shù)模型成為常用的方法。
本章首先簡(jiǎn)要介紹了DenseNet 和它的不足之處,然后對(duì)數(shù)據(jù)集進(jìn)行了相關(guān)描述與分析。
DenseNet將CNN在分層捕獲空間結(jié)構(gòu)信息方面的卓越能力引入到區(qū)域間的空間依賴建模中。在每一層進(jìn)行一系列的卷積后,可以捕捉到整個(gè)城市交通的局部和全局空間依賴關(guān)系。考慮到不同區(qū)域的進(jìn)出交通相互依賴并且與區(qū)域間的距離無(wú)關(guān),DenseNet采用密集連接的方式緩解梯度消失問(wèn)題,以達(dá)到提高預(yù)測(cè)效率和準(zhǔn)確性的目的。該模型設(shè)計(jì)了兩個(gè)相同結(jié)構(gòu)的組件,一個(gè)用于對(duì)時(shí)間的鄰近依賴性建模,另一個(gè)用于對(duì)時(shí)間的周期依賴性建模。網(wǎng)絡(luò)中有L 層,每層實(shí)現(xiàn)一個(gè)非線性變換fl(·),L=1,2,…,L,這是一個(gè)連續(xù)三個(gè)操作的復(fù)合函數(shù),即卷積(Conv),批量歸一化(BN)和校正線性單元(ReLU)。為了對(duì)鄰近性依賴關(guān)系進(jìn)行建模,初始輸入在第l 層,輸出記為:
其中⊕指的是在前面所有層中生成的特征圖的連接。同樣,對(duì)于周期性依賴關(guān)系的建模,第l 層的輸出可以表示為:
但DenseNet仍然不夠有效且不精確:
(1)不能很好捕獲區(qū)域間的空間依賴。人們可以通過(guò)無(wú)線網(wǎng)絡(luò)與任何區(qū)域通信。因此,區(qū)域間的大范圍空間依賴在通信中逐漸扮演重要的角色。DenseNet 使用多層卷積網(wǎng)絡(luò)來(lái)建模。它是通過(guò)堆疊的卷積層來(lái)捕捉城市蜂窩流量的空間依賴,以至于只能一步一步地捕獲近鄰的空間依賴,這樣對(duì)遠(yuǎn)距離的空間依賴難以捕捉,甚至?xí)G失這些空間依賴的特征。
(2)DenseNet 沒(méi)有對(duì)外部因素進(jìn)行建模。例如,工作日是通訊的高峰期,這會(huì)對(duì)流量預(yù)測(cè)產(chǎn)生一定的影響。
本文中根據(jù)經(jīng)緯度將整個(gè)城市區(qū)域劃分為大小為H×W的網(wǎng)格。網(wǎng)格的一個(gè)正方形即為一個(gè)單元格,H和W表示網(wǎng)格的行數(shù)和列數(shù)。下面的介紹以歐洲一家大型電話服務(wù)提供商意大利電信數(shù)據(jù)集(Telecom Italia)為例,該數(shù)據(jù)集中H=W=100,也就是說(shuō)整個(gè)城市被劃分為了100×100 個(gè)區(qū)域。該數(shù)據(jù)集是用戶通過(guò)移動(dòng)終端在米蘭區(qū)域發(fā)送或接收數(shù)據(jù)的流量統(tǒng)計(jì)。該數(shù)據(jù)集記錄了00:00 11/01/2013至00:00 01/01/2014期間每間隔10 min 的交通流量的統(tǒng)計(jì)數(shù)據(jù)。此數(shù)據(jù)集包括短消息服務(wù)(sms)、呼叫服務(wù)(call)和互聯(lián)網(wǎng)(internet)三部分?jǐn)?shù)據(jù)。每個(gè)區(qū)域(i,j)中都記錄了10 min內(nèi)蜂窩流量的出入流,其中i,j代表了該區(qū)域在類(lèi)似于二維坐標(biāo)系中的橫坐標(biāo)和縱坐標(biāo)。在第t時(shí)間戳?xí)r,所有區(qū)域的流量可以表示為:Xt=D2×H×W,其中D表示數(shù)據(jù)集,Xt表示張量。
圖1(a)和圖1(b)分別展示呼叫服務(wù)(call)和短消息服務(wù)(sms)的時(shí)間動(dòng)態(tài)性,由圖,可以看出呼叫服務(wù)(call)和短消息服務(wù)(sms)的動(dòng)態(tài)雖然有些不同,但是都有很強(qiáng)的日周期性。例如,呼叫服務(wù)(call)每天的流量變化都是從上午10 時(shí)后先增加直到晚上10 時(shí)才降低。從圖2 可以確認(rèn)工作日的蜂窩交通流量明顯要高于非工作日,說(shuō)明人們的呼叫服務(wù)(call)和短消息服務(wù)(SMS)的使用受工作日的影響比較大。
圖1 蜂窩流量的時(shí)間動(dòng)態(tài)性
圖2 在Telecom Italia數(shù)據(jù)集上一周的動(dòng)態(tài)蜂窩流量交通
圖3 為給定時(shí)刻的交通流空間分布,從圖3 可以看出流量在不同的區(qū)域間分布不均勻。這是合理的,因?yàn)槿丝诒姸嗟某鞘兄行谋冗吘壍貐^(qū)有更多的通信,所以模型只截取了城市中心20×20 大小區(qū)域的蜂窩流量作為數(shù)據(jù)集。
圖3 在Telecom Italia數(shù)據(jù)集上的交通流空間分布
由于定時(shí)刻的交通流空間分布不均勻,對(duì)某個(gè)特定的區(qū)域計(jì)算了皮爾森相關(guān)系數(shù)ρ并由圖4 給出。ρ的定義如下:
其中,cov(X,Y)表示X與Y之間的協(xié)方差,(σX,σY)是各自標(biāo)準(zhǔn)差的乘積。
圖4 在Telecom Italia(sms)數(shù)據(jù)集上空間相關(guān)性分析
從圖4 可以看出,在sms 數(shù)據(jù)集上不同區(qū)域之間存在空間相關(guān)性,其相關(guān)值與距離無(wú)關(guān)。也就是說(shuō),整個(gè)城市的蜂窩流量具有廣泛的空間依賴性。例如,城市邊緣部分交通流與城市中心交通流的相關(guān)系數(shù)大于0.9,而城市中心部分交通流與城市中心交通流的相關(guān)系數(shù)也有低于0.9。皮爾森相關(guān)系數(shù)ρ直觀并有效地分析了交通數(shù)據(jù)的空間依賴性,有助于模型更深層次的設(shè)計(jì)。
本文提出了一種有效的深度學(xué)習(xí)方法(ST-FCCNet),對(duì)城市中任意區(qū)域間的時(shí)空依賴性進(jìn)行建模。在本章中,首先對(duì)ST-FCCNet的整體框架進(jìn)行了詳細(xì)地描述和公式推導(dǎo),接著介紹了ST-FCCNet 單元的內(nèi)部結(jié)構(gòu),及其內(nèi)部結(jié)構(gòu)的設(shè)計(jì)緣由。
根據(jù)時(shí)空領(lǐng)域的知識(shí),少數(shù)前面關(guān)鍵幾幀的數(shù)據(jù)能夠決定下面一幀的數(shù)據(jù)。因此,利用時(shí)間鄰近性和周期性來(lái)選擇關(guān)鍵幀。將一段時(shí)間內(nèi)城市中的進(jìn)入流和外出流轉(zhuǎn)化成一個(gè)類(lèi)似于圖像的雙通道矩陣。然后將時(shí)間軸劃分成2 個(gè)分段:鄰近時(shí)間段(closeness)和周期時(shí)間段(period)。再將流量數(shù)據(jù)按照時(shí)間上的鄰近性依賴和周期性依賴分為兩部分輸入,流量數(shù)據(jù)和外部特征數(shù)據(jù)通過(guò)Min-Max 歸一化處理到[-1,1]。如圖5 所示,ST-FCCNet將流量數(shù)據(jù)的兩部分輸入,分別使用兩個(gè)不同的組件進(jìn)行建模,從而捕捉鄰近的和周期的這兩種不同的時(shí)間特性。然后通過(guò)堆疊的ST-FCCNet 單元來(lái)捕捉城市蜂窩流量的空間依賴。兩個(gè)組件共享相同的網(wǎng)絡(luò)結(jié)構(gòu),都是密集全連接神經(jīng)網(wǎng)絡(luò)接上一層卷積,接著將這兩個(gè)組件學(xué)習(xí)到的特征進(jìn)行參數(shù)矩陣融合得到XDF。外部特征數(shù)據(jù)(天氣、節(jié)假日、周末等)嵌成向量輸入到全連接層得到外部特征XExt。最后將XDF和XExt融合后通過(guò)Sigmoid激活函數(shù)得到。
圖5 ST-FCCNet框架結(jié)構(gòu)(Conv:3×3卷積;FC:全連接層)
首先用參數(shù)矩陣融合算法融合前2個(gè)組件,然后與外部組件進(jìn)一步融合。在融合鄰近性和周期性兩個(gè)組件時(shí),考慮到了每個(gè)區(qū)域的時(shí)間特性的強(qiáng)度不同,因此模型使用了基于參數(shù)矩陣的融合方法,以取得了更好的結(jié)果。該基于參數(shù)矩陣融合的方法定義如下:
其中XDF是得到的融合特征,?是Hadamard乘法(即元素間相乘),XDF-C是鄰近性特征,XDF-P是周期性特征,WC、WP是可學(xué)習(xí)的權(quán)重,分別表示鄰近性和周期性的影響程度。使用下述方法將前2 個(gè)組件的輸出與外部組件進(jìn)行融合。t時(shí)刻的預(yù)測(cè)值形式化表示為:
其中,是t時(shí)刻的預(yù)測(cè)值,σ(*)表示激活函數(shù),XDF是融合特征,XExt是外部特征,⊕表示Add操作。通過(guò)最小化真實(shí)值與預(yù)測(cè)值的平均平方誤差來(lái)得到最優(yōu)的WC和WP:
其中,是t時(shí)刻的預(yù)測(cè)值,Y是t時(shí)刻的真實(shí)值。L(?)值取最小值時(shí),WC、WP取最優(yōu)值。
蜂窩流量的變化與區(qū)域內(nèi)前一段時(shí)間流量的流入流出數(shù)量有關(guān),也與周邊區(qū)域甚至很遠(yuǎn)區(qū)域的流入流出數(shù)量有關(guān),這就造成了蜂窩流量具有廣距離的空間依賴。傳統(tǒng)的卷積層難以對(duì)遠(yuǎn)距離的空間依賴進(jìn)行捕捉,因此,設(shè)計(jì)出ST-FCCNet單元來(lái)解決該問(wèn)題。
如圖6,將上一層的輸出分出一部分通道(將這部分分出的通道記為S),先通過(guò)Flatten層,把多維的輸入一維化,再經(jīng)過(guò)兩層全連接層來(lái)直接捕獲城市任意區(qū)域間的空間依賴,然后通過(guò)Reshape 函數(shù)來(lái)將輸出維度調(diào)整成S×H×W得到XFC。另一部分通道直接通過(guò)一層卷積層得到XFC。最后將通過(guò)concatenate操作。
圖6 ST-FCCNet單元
這樣設(shè)計(jì),它不需要堆疊很多層,模型只需要很淺的層就能獲取城市任意區(qū)域的空間特性,并使模型精度增加。因?yàn)閷訑?shù)減少,模型的參數(shù)也減少,這就使得模型的計(jì)算速度更快。
算法1 給出了ST-FCCNet 模型的訓(xùn)練過(guò)程。首先從原始序列中構(gòu)建一個(gè)訓(xùn)練實(shí)例(第1~6 行)然后通過(guò)后向傳播和Adam進(jìn)行訓(xùn)練(第7~11行)。
算法1ST-FCCNet訓(xùn)練過(guò)程
輸入:訓(xùn)練集歷史數(shù)據(jù):{Y0,Y1,…,Yn-1};
訓(xùn)練集外部特征數(shù)據(jù):{E0,E1,…,En-1};
鄰近、周期性序列長(zhǎng)度:?C,?P;
鄰近長(zhǎng)度:C=1;周期長(zhǎng)度:P=24;
輸出:訓(xùn)練后的ST-FCCNet模型M
算法2 給出了ST-FCCNet 模型的測(cè)試過(guò)程。首先從原始序列中構(gòu)建一個(gè)測(cè)試實(shí)例(第1~8 行)然后通過(guò)公式(6)計(jì)算真實(shí)值和預(yù)測(cè)值的RMSE(第6~9行)。
算法2ST-FCCNet測(cè)試過(guò)程
輸入:訓(xùn)練后的ST-FCCNet模型M
訓(xùn)練集歷史數(shù)據(jù):{Y0,Y1,…,Yn-1};
訓(xùn)練集外部特征數(shù)據(jù):{E0,E1,…,En-1};
鄰近、周期性序列長(zhǎng)度:?C,?P;
鄰近長(zhǎng)度:C=1;周期長(zhǎng)度:P=24;
輸出:全市未來(lái)的蜂窩流量真實(shí)值與預(yù)測(cè)值的RMSE//構(gòu)造測(cè)試實(shí)例
首先簡(jiǎn)要介紹了歐洲一家大型電話服務(wù)提供商意大利電信(Telecom Italia)的真實(shí)數(shù)據(jù),然后使用這個(gè)數(shù)據(jù)集來(lái)驗(yàn)證ST-FCCNet的優(yōu)越性,并與現(xiàn)存的7種算法進(jìn)行了對(duì)比。
為了驗(yàn)證模型的準(zhǔn)確性。選擇使用一個(gè)開(kāi)放的數(shù)據(jù)集,數(shù)據(jù)集下載地址為https://drive.google.com/open?id=1klAZtJXqsxTTLACSO5gvaAd1HMMTQQ97,這個(gè)數(shù)據(jù)集包括Telecom Italia數(shù)據(jù)集和節(jié)假日等外部信息(外部信息是額外加入的,是通過(guò)搜索00:00 11/01/2013至00:00 01/01/2014意大利的節(jié)假日和天氣情況來(lái)獲取的)。表1給出了Telecom Italia數(shù)據(jù)集的詳細(xì)信息。取Telecom Italia中最后七天的數(shù)據(jù)作為測(cè)試集,其他作為訓(xùn)練集。
表1 數(shù)據(jù)集(Telecom Italia)
實(shí)驗(yàn)數(shù)據(jù)集來(lái)自歐洲一家大型電話服務(wù)提供商意大利電信(Telecom Italia),將原始數(shù)據(jù)集里的10 min間隔數(shù)據(jù)匯總到1 h,因?yàn)?0 min 間隔里大量的手機(jī)流量為零,數(shù)據(jù)集非常稀疏,使得預(yù)測(cè)非常困難,可能導(dǎo)致網(wǎng)絡(luò)不穩(wěn)定或開(kāi)銷(xiāo)過(guò)大。
使用均方根誤差(RMSE)這個(gè)指標(biāo)來(lái)評(píng)價(jià)模型,并且定義為:
其中,yi是城市中i時(shí)刻的真實(shí)值,y^i是模型的預(yù)測(cè)值,N指數(shù)據(jù)集的總個(gè)數(shù)。
模型的loss函數(shù)是Mean Square Error(MSE):
在模型訓(xùn)練過(guò)程中,先從訓(xùn)練集中取出10%作為驗(yàn)證集,剩下的90%用以初次訓(xùn)練模型,根據(jù)最佳驗(yàn)證分?jǐn)?shù)提前停止訓(xùn)練。然后,用完整的訓(xùn)練集繼續(xù)對(duì)模型進(jìn)行訓(xùn)練,在迭代100次后保存最優(yōu)模型。
表2 參數(shù)設(shè)置
表2 給出了模型詳細(xì)的參數(shù)設(shè)置。對(duì)模型的參數(shù)都進(jìn)行了調(diào)整和測(cè)試,在4.4 節(jié)不同ST-FCCNet 配置下的結(jié)果和分析記錄了參數(shù)設(shè)置過(guò)程,以及其對(duì)實(shí)驗(yàn)結(jié)果的影響。表2 中加粗的參數(shù)設(shè)置為最優(yōu)參數(shù)設(shè)置。另外,Dropout和批量歸一化(Batch Normalization)的設(shè)置都是為了防止模型過(guò)擬合。
該實(shí)驗(yàn)在GPU 服務(wù)器上運(yùn)行。表3 給出了實(shí)驗(yàn)環(huán)境的細(xì)節(jié),主要使用Tensorflow和PyTorch來(lái)訓(xùn)練模型。
表3 實(shí)驗(yàn)環(huán)境
為驗(yàn)證ST-FCCNet 比現(xiàn)存的方法好,在Telecom Italia(call)數(shù)據(jù)集和Telecom Italia(sms)數(shù)據(jù)集上對(duì)比了ST-FCCNet與HA[10]、ARIMA[9]、LSTM[21]、DenseNet[20]、ST-Net[22]、STM-Net[22]、STCNet[22]的預(yù)測(cè)結(jié)果,如表4、表5。
表4 不同基線與ST-FCCNet在Telecom Italia(call)上的RMSE比較
表5 不同基線與ST-FCCNet在Telecom Italia(sms)上的RMSE比較
表4、表5顯示在Telecom Italia數(shù)據(jù)集上,ST-FCCNet的RMSE 明顯優(yōu)于其他所有的對(duì)比方法的RMSE。Telecom Italia 數(shù)據(jù)集上的結(jié)果表明ST-FCCNet(有3 個(gè)ST-FCCNet單元)比HA好196.98%~344.47%,比ARIMA好115.57%~240.98%,比LSTM 好87.72%~171.98%,比ST-Net好30.75%~37.15%,比STM-Net好19.6%~22.66%,比STCNet 好12.48%~13.33%,比DenseNet 的RMSE 降低了7.50%~7.76%。
本節(jié)進(jìn)行單步預(yù)測(cè)評(píng)估,即使用歷史數(shù)據(jù)來(lái)預(yù)測(cè)時(shí)間t的流量。為更直觀,將這些模型排序,如圖7所示。
圖7 在Telecom Italia(call)和Telecom Italia(sms)模型排序
通過(guò)改變ST-FCCNet unit配置、網(wǎng)絡(luò)深度和不同的組件,來(lái)討論在不同參數(shù)設(shè)置下的性能對(duì)比結(jié)果。
4.4.1 時(shí)間性鄰近性、周期性的影響
本文驗(yàn)證了Telecom Italia 數(shù)據(jù)集上短消息服務(wù)(sms)通信和呼叫服務(wù)(call)通信的時(shí)間鄰近性和周期性組件的影響。鄰近性序列長(zhǎng)度表示為?C,周期性序列長(zhǎng)度表示為?P。圖8(a)展示了在SMS 上?C對(duì)實(shí)驗(yàn)結(jié)果的影響,此時(shí),?P設(shè)為3,?C不斷變化。可以看到隨著?C增加,RMSE 首先下降,然后上升,且?C=3 的時(shí)候性能最佳。圖8(b)顯示了在SMS 上?P對(duì)實(shí)驗(yàn)結(jié)果的影響,此時(shí)?C等于3,?P的取值從1到4。當(dāng)?P=1時(shí)比?P=2,3 時(shí)的實(shí)驗(yàn)結(jié)果差些,當(dāng)?P=4 時(shí),性能反而變差。意味著小范圍的周期通常更有影響力,而長(zhǎng)時(shí)間的周期難以建模,通常無(wú)效。圖8(c)展示了在call上?C對(duì)實(shí)驗(yàn)結(jié)果的影響,此時(shí),?P設(shè)為3,?C不斷變化??梢钥吹疆?dāng)?C=1 時(shí),RMSE 最小。圖8(d)顯示了在call上?P對(duì)實(shí)驗(yàn)結(jié)果的影響,此時(shí)?C=1,?P的取值從1 到4。曲線表明?P=3的時(shí)候模型最好,這說(shuō)明call通信流量更易受到短時(shí)鄰近性的影響。
4.4.2 網(wǎng)絡(luò)深度的影響
本文通過(guò)設(shè)置不同的ST-FCCNet 單元數(shù)量來(lái)測(cè)試不同網(wǎng)絡(luò)深度對(duì)預(yù)測(cè)結(jié)果的影響。如圖9所示,隨著網(wǎng)絡(luò)深度的加深(即ST-FCCNet單元數(shù)量增加),短消息服務(wù)(sms)通信和呼叫服務(wù)(call)通信的RMSE 都先降低后增加,表明越深的網(wǎng)絡(luò)通常擁有更好的性能,因?yàn)樗軌驅(qū)r(shí)間依賴性和空間依賴性更好的建模。然而,當(dāng)網(wǎng)絡(luò)變得很深時(shí)(例如ST-FCCNet Unit超過(guò)3時(shí)),訓(xùn)練變得非常困難。
圖8 鄰近性與周期性長(zhǎng)度的影響
圖9 網(wǎng)絡(luò)深度的影響
4.4.3 不同ST-FCCNet unit配置的影響
圖10顯示的是不同分離通道數(shù)的影響。隨著S的增加,短消息服務(wù)(sms)通信和呼叫服務(wù)(call)通信的RMSE 都先降低,然后增加,表明不需要分離過(guò)多的通道來(lái)捕捉全局的空間依賴,當(dāng)分離的通道數(shù)過(guò)多時(shí),反而會(huì)影響模型對(duì)數(shù)據(jù)特征的捕捉。
圖10 分離通道數(shù)S的影響
圖11展示了一個(gè)隨機(jī)區(qū)域的真實(shí)值和預(yù)測(cè)值流量曲線。本文提出的模型在call和sms上都表現(xiàn)出優(yōu)秀的結(jié)果,對(duì)于流量的峰值和異常值也能很好地?cái)M合。
圖11 預(yù)測(cè)值與真實(shí)值對(duì)比
復(fù)雜度決定了模型的訓(xùn)練和預(yù)測(cè)時(shí)間,如果復(fù)雜度過(guò)高,會(huì)導(dǎo)致模型訓(xùn)練和預(yù)測(cè)耗費(fèi)大量時(shí)間,既無(wú)法快速地驗(yàn)證想法和改善模型,也無(wú)法做到快速地預(yù)測(cè)。用FLOPs來(lái)衡量模型的復(fù)雜度,并將ST-FCCNet與近年的模型進(jìn)行了對(duì)比。
表6 顯示,本文復(fù)雜度與近年模型相比降低不少,結(jié)果表明ST-FCCNet(有3 個(gè)ST-FCCNet 單元)比STNet、STM-Net、STCNet復(fù)雜度少89.97 MFLOPs。本文設(shè)計(jì)的ST-FCCNet 單元經(jīng)過(guò)兩層全連接層來(lái)直接捕獲城市任意區(qū)域間的空間依賴,不需要堆疊很多層,模型只需要很淺的層就能獲取城市任意區(qū)域的空間特性,并使模型精度增加。因?yàn)閷訑?shù)減少,模型的復(fù)雜度降低,這就使得模型的計(jì)算速度更快。
表6 近年模型與ST-FCCNet復(fù)雜度比較
實(shí)驗(yàn)中,本文首先將ST-FCCNet與4個(gè)基線進(jìn)行了對(duì)比,然后給出了在不同ST-FCCNet 配置下的結(jié)果并對(duì)這些結(jié)果進(jìn)行了詳細(xì)的分析。最終得到的結(jié)果表明,當(dāng)鄰近性序列長(zhǎng)度?C=1,周期性序列長(zhǎng)度?P=3,ST-FCCNet 單元個(gè)數(shù)為3,以及分離的通道數(shù)S=2 時(shí),ST-FCCNet在sms和call兩個(gè)數(shù)據(jù)集上的效果最佳。
本文提出了一種深度學(xué)習(xí)模型,通過(guò)捕捉歷史流量數(shù)據(jù)的時(shí)空特性對(duì)未來(lái)的流量進(jìn)行預(yù)測(cè)。在模型中,引入了天氣、假期和工作日等外部因素對(duì)蜂窩流量的影響。另外,設(shè)計(jì)了一種ST-FCCNet單元結(jié)構(gòu)來(lái)捕捉城市中任意區(qū)域間的空間依賴,解決了DenseNet 對(duì)空間依賴建模難的缺點(diǎn)。本文提出的時(shí)空密集全連接網(wǎng)絡(luò)(ST-FCCNet)加強(qiáng)了對(duì)區(qū)域間空間依賴的捕捉,并加入了外部因素(例如:天氣和假期等)的影響。通過(guò)在Telecom Italia數(shù)據(jù)集上的驗(yàn)證,該模型優(yōu)于其他4種對(duì)比方法,更進(jìn)一步證實(shí)了ST-FCCNet在蜂窩流量預(yù)測(cè)中的應(yīng)用價(jià)值。在未來(lái)工作中,將會(huì)考慮其他類(lèi)型的流數(shù)據(jù)(例如基站、商場(chǎng)、住宅區(qū)和辦公區(qū)的位置分布),利用它們進(jìn)行更精準(zhǔn)地蜂窩流量預(yù)測(cè),然后使用一個(gè)合適的融合模型將這些數(shù)據(jù)特征融合起來(lái)得到最終結(jié)果。