趙偉,李貝,孟寧,王廷偉,林俊釩,陳樂,胡煜華,楊漢源
(1.中國聯(lián)合網(wǎng)絡(luò)通信有限公司浙江省分公司,浙江 杭州 310051;2.中國聯(lián)合網(wǎng)絡(luò)通信有限公司研究院,北京 100048;3.中國聯(lián)合網(wǎng)絡(luò)通信集團有限公司,北京 100033)
在4G網(wǎng)絡(luò)逐步向5G基站牽引的背景下,不斷增長的網(wǎng)絡(luò)業(yè)務(wù)需求及流量需求使得基站能耗節(jié)節(jié)攀升。為響應國家集約化綠色網(wǎng)絡(luò)的建設(shè)要求,如何提升基站節(jié)能效率成為運營商當前亟須解決的問題。依據(jù)設(shè)備規(guī)格與負載水平的不同,5G基站每小時的耗電約2.5度,3G或4G基站則在1~2度,其主要能耗集中在基站的有源天線單元上?,F(xiàn)行基站節(jié)能方案也大多針對該設(shè)備進行節(jié)能,對夜間低能耗站點采取一刀切直接下電的方式進行。在實際生產(chǎn)中,該方案存在以下不足。
? 人工成本高。當前需要人工進行節(jié)能時間配置與調(diào)整,操作時對運維工程師的一線經(jīng)驗和專業(yè)水平要求較高。
? 節(jié)電策略單一?,F(xiàn)有的節(jié)電方案通常為千站一策,即運營商對批量基站設(shè)置統(tǒng)一的節(jié)能時間段,無法在不同覆蓋場景和不同業(yè)務(wù)需求下進行差異化節(jié)電。
? 無法適應動態(tài)網(wǎng)絡(luò)環(huán)境。一旦基站下電后便無法獲取站點附近的用戶情況,無法應對突發(fā)性業(yè)務(wù)和流量波動,基站恢復存在滯后性,易出現(xiàn)聚集性投訴風險。
? 難以平衡用戶體驗與節(jié)能需求。在實際節(jié)電時,考慮用戶感知,節(jié)電時間的參數(shù)設(shè)置通常相對保守,難以挖掘得到基站的最大節(jié)能空間。
為實現(xiàn)節(jié)能策略的動態(tài)化,需要對基站的業(yè)務(wù)流量進行預測,以便在低能耗時段進行節(jié)能。當前常見做法是將基站的歷史流量數(shù)據(jù)轉(zhuǎn)換為不同的算法進行求解,包括傳統(tǒng)時序算法、機器學習和深度學習算法3種,各有利弊。
(1)傳統(tǒng)時序算法
將業(yè)務(wù)流量預測轉(zhuǎn)換為時序預測模型進行建模是最為常見的算法。典型的時間序列預測方法包括整合移動平均自回歸模型(autoregressive integrated moving average model,ARIMA)、Holt-Winters等。此類算法對周期波動明顯的單一時間序列進行預測時預測效果較好,但難以適應周期波動不明顯的時序或區(qū)域突發(fā)流量。
(2)機器學習回歸算法
通過構(gòu)造時間特征可將流量預測問題轉(zhuǎn)化回歸問題,繼而使用如支持向量機(support vector machine,SVM)和梯度提升算法(如 XGBoost)等機器學習算法進行預測。該類算法對時間序列中的非線性因素適應較好,但對訓練樣本的要求較高且實際預測精度偏低。
(3)深度學習算法
循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)或長短期記憶(long short term memory,LSTM)網(wǎng)絡(luò)等深度學習模型能夠快速適應不穩(wěn)定的時間序列。但受限于模型本身特性,其建模效率較低。此外,基于序列的神經(jīng)網(wǎng)絡(luò)更關(guān)注與上一刻的業(yè)務(wù)流量情況,易累積預測誤差導致最終結(jié)果偏差過大。
從時域特征上看,受地理位置、無線環(huán)境、周圍人流及活動等多重因素影響,現(xiàn)網(wǎng)基站的流量波動整體呈周期性變化,但偶有突發(fā)性擾動。從空域特征上看,基站的覆蓋場景各不相同,存在單站覆蓋區(qū)域、多制式共站、多制式同覆蓋等多種情況,不同情況的流量分擔方式也不同。因此,對比上述算法后,文中提出一種先用動態(tài)時間規(guī)整(dynamic time warping,DTW)算法進行聚類,再用不同參數(shù)的季節(jié)性整合移動平均自回歸模型(seasonal autoregressive integrated moving average,SARIMA)對各類基站分別建模來進行節(jié)電時間窗預測的算法。
DTW 聚類算法通過動態(tài)規(guī)劃思想提取兩個不同時間序列的相似性,進而對時間序列進行聚類。假設(shè)有兩個長度分別為m和n的時間序列,如式(1):
則兩個序列可構(gòu)建一個m×n的矩陣,通過動態(tài)規(guī)劃可找出該矩陣的最小累積路徑γ(i,j),如式(2):
其中,d(Xi,Yj)代表矩陣內(nèi)任意兩點的距離。兩個時間序列的相似度即可用γ(i,j)表示,則對于n個時間序列來說,需找到使得總相似度最小的聚類結(jié)果,以便將具有相似時序波動的小區(qū)聚類在一起。
SARIMA模型是基于ARIMA模型之上,將時間序列看作依賴時間t的隨機變量,通過數(shù)據(jù)模型解析歷史序列的自相關(guān)性、平穩(wěn)性以及季節(jié)性來預測未來的數(shù)據(jù)。假設(shè)將某特定長度為T的d階非平穩(wěn)時間序列描述為Y1,Y2,Y3,… ,YT。對Yt∈R,ARIMA模型可表示為:
智能節(jié)電系統(tǒng)模塊如圖1所示,本項目搭建在 Windows服務(wù)器上,采用Python作為主要編程語言,基于DTW和SARIMA算法完成模型構(gòu)建,通過北向接口進行節(jié)能操作的指令下發(fā),后臺使用 MySQL承接操作日志,通過五大功能模塊實現(xiàn)基站智能節(jié)電閉環(huán)系統(tǒng)。
圖1 智能節(jié)電系統(tǒng)模塊
為進行智能節(jié)電預測,系統(tǒng)需獲取以下不同時間粒度的數(shù)據(jù)作為基站監(jiān)控數(shù)據(jù)源以及節(jié)電操作時進行干預決策的參考指標。智能節(jié)電系統(tǒng)數(shù)據(jù)源清單見表1。
表1 智能節(jié)電系統(tǒng)數(shù)據(jù)源清單
其中,采集待預測時間 7天內(nèi)的全量3G/4G/5G基站性能數(shù)據(jù)后,可供智能預測模塊進行節(jié)電時間窗口預測。采集小區(qū)工參和MDT數(shù)據(jù)并處理后,可生成某站點關(guān)閉后對應的切換基站(cell to cell)清單,供實時監(jiān)控模塊判決是否需要進行恢復操作以及進行何種恢復操作。
智能預測模塊是智能節(jié)電系統(tǒng)的“核心”模塊,其具體工作步驟如下。
步驟1數(shù)據(jù)聚類。若各基站單個小區(qū)的業(yè)務(wù)量可表示為時間序列Y,將對全網(wǎng)基站下小區(qū)的業(yè)務(wù)量Y1,Y2,Y3,… ,YN進行DTW算法聚類。聚類個數(shù)n可自行設(shè)置。經(jīng)實驗,本文中將聚類個數(shù)最終設(shè)置為3,則全量小區(qū)可分為C1、C2、C3共3類。
步驟2超參選擇。分別從C1、C2、C3聚類結(jié)果中選出 100個小區(qū),并針對這 100個小區(qū)使用SARIMA(p,d,q)(P,D,Q)模型進行20輪模型預訓練,獲取使得總評價指標信息準則(Akaike information criterion,AIC)最優(yōu)的超參組合,并輸出到最優(yōu)超參字典中,即{C1|p1,d1,q1,P1,D1,Q1},{C2|p2,d2,q2,P2,D2,Q2} ,{C3|p3,d3,q3,P3,D3,Q3} 。
步驟 3模型訓練。遍歷全網(wǎng)所有小區(qū),進行口碑場景級分析,根據(jù)其聚類結(jié)果,從最優(yōu)超參字典中找到對應的超參組合,將這個超參組合放入SARIMA(p,d,q)(P,D,Q)中進行模型訓練,訓練完成后的業(yè)務(wù)流量趨勢預測結(jié)果如圖2所示。
圖2 SARIMA模型業(yè)務(wù)預測結(jié)果示例
步驟4模型輸出。通過計算序列的統(tǒng)計置信區(qū)間3-sigma區(qū)間(μ? 3σ,μ+ 3σ)得到該站業(yè)務(wù)量正常區(qū)間的上限值和下限值。其中,μ為序列的均值,為序列的標準差。結(jié)合一線的實際經(jīng)驗,可認為當前時刻業(yè)務(wù)量落在(0,μ?3σ)時為低能耗時刻。確定每日關(guān)站門限后,將低能耗時間段對應小區(qū)粒度,并結(jié)合小區(qū)覆蓋特性,在保障感知的前提下,采取以下不同的節(jié)電策略。
(1)00:00—06:00時段
采用小區(qū)符號關(guān)斷;若小區(qū)完全無流量/話務(wù)量產(chǎn)生,則直接采用激活/去激活策略。
(2)非00:00—06:00時段
? 若存在多制式同覆蓋場景,則用3G小區(qū)作為覆蓋打底網(wǎng)絡(luò)保障用戶感知,對 4G/5G高制式小區(qū)進行節(jié)電;
? 當基站載波帶寬≥20 MHz,采取射頻通道關(guān)斷策略;
? 若頻段為LTE 1 800 MHz或LTE 900 MHz,采用載波關(guān)斷策略;
? 無法使用射頻通道關(guān)斷和載波關(guān)斷,則采用符號關(guān)斷策略。
步驟 5生成每日任務(wù)。在完成建模和節(jié)電策略判定后,數(shù)據(jù)結(jié)構(gòu)需要進行重組,生成每日每個節(jié)電時間點需要開關(guān)的基站清單,并將一天的時間切分成若干個需要監(jiān)控的時間段和該時間段內(nèi)需要監(jiān)控的基站小區(qū)清單,供后續(xù)基站開關(guān)模塊和實時監(jiān)控模塊執(zhí)行使用。
步驟 6反饋調(diào)整。在每一輪基站開關(guān)模塊實施調(diào)度過程中,可能會監(jiān)控到誤節(jié)能現(xiàn)象,即在模型預測需關(guān)站的時間段內(nèi),基站存在流量壓抑現(xiàn)象。因此,在重復步驟1~步驟5進行新一輪模型預測之前,系統(tǒng)會讀取日志輸出模塊生成的調(diào)度日志,利用上一輪產(chǎn)生偏差來反饋調(diào)節(jié)模型,以助于縮小下一周期預測業(yè)務(wù)量的誤差。
需要注意的是,在實際運行中,從數(shù)據(jù)處理模塊采集數(shù)據(jù)到完成本模塊前序的步驟1~步驟4均需要占用一定的計算時間。在該計算真空期內(nèi),基站開關(guān)模塊無法獲得任何指令數(shù)據(jù),導致每日有一段時間無法對基站進行操作。針對該情況,本系統(tǒng)在不增加算力資源的情況下,分上下各半天進行模型訓練。舉例來說,在T日上半天(當日 12:00前)獲取[T? 5 ,T]的下半天實時數(shù)據(jù)(12:00-24:00)進行訓練預測得出 T日下半天(12:00-24:00)的指令時間點。在T日下半天(當日 12:00前)獲取[T? 5 ,T]的上半天實時數(shù)據(jù)(00:00-12:00)進行訓練預測得出T+1日上半天(00:00-12:00)的指令時間點。這樣就保證了在運行過程中沒有真空期,基站開關(guān)模塊能實時對基站進行操作。
接收每日開關(guān)任務(wù),根據(jù)每日的開站時間點、關(guān)站時間點以及開站清單和關(guān)站清單,在對應時間點通過北向接口下達指令打開或關(guān)閉對應的基站。在每次下達指令、操作基站或出現(xiàn)異常時都需進行日志輸出。
實時監(jiān)控示意圖如圖3所示,一旦開啟節(jié)能后,將無法獲取被節(jié)電基站的業(yè)務(wù)量。為了在發(fā)生業(yè)務(wù)量突增時及時停止節(jié)電,減少對用戶感知的影響,需在開啟節(jié)能后同時觀測承接該節(jié)電基站業(yè)務(wù)量的周邊小區(qū)的業(yè)務(wù)量波動情況。基于小區(qū)工參和MDT數(shù)據(jù),可從數(shù)據(jù)處理模塊獲取某站點關(guān)閉后對應的切換基站(cell to cell)清單。
圖3 實時監(jiān)控示意圖
根據(jù)需要監(jiān)控的時間段和每個時間段內(nèi)的監(jiān)控基站清單,實時觀測這部分承接基站的3G/4G/5G的業(yè)務(wù)流量數(shù)據(jù)及投訴數(shù)據(jù)。結(jié)合實際情況,若當前節(jié)電時刻為T,則觀測當前節(jié)電時刻[T? 2 ,T]的業(yè)務(wù)量,即對3G站點觀測其前 兩個30 min業(yè)務(wù)量數(shù)據(jù),對4G/5G站點觀測其前兩個15 min的業(yè)務(wù)量數(shù)據(jù)。當因基站壓力過大、流量激增等原因發(fā)生異常時,利用是否發(fā)生異常流量增長或突發(fā)區(qū)域性投訴來進行異常判定,必要時通過北向接口開啟監(jiān)控基站,及時恢復基站覆蓋供用戶正常使用。若持續(xù)出現(xiàn)問題或發(fā)生指令操作異常,則發(fā)送短信告警給運維人員來進行人工干預。實時監(jiān)控流程如圖4所示。
圖4 實時監(jiān)控流程
每次下達指令、操作基站或出現(xiàn)異常時都需要進行日志輸出,輸出內(nèi)容包括操作日期、時間、操作指令、操作類型、操作基站 ID、操作基站名稱、操作小區(qū) ID、操作小區(qū)名稱、指令是否下發(fā)成功、操作結(jié)果等。所有操作日志統(tǒng)一存儲至MySQL數(shù)據(jù)庫,便于智能預測模塊進行反饋調(diào)整。此外,當系統(tǒng)發(fā)生異常故障時,可通過存儲的日志快速定位問題。
為評估本文算法在實際生產(chǎn)環(huán)境的預測能力,假設(shè)某節(jié)電基站為X1,在對其進行節(jié)電操作后,承接其業(yè)務(wù)量的基站為X2,X3,… ,Xn。通過對比承接站點在承接前后的業(yè)務(wù)量增長是否超過給定門限的5%來判定節(jié)電是否準確。小區(qū)的節(jié)電準確率可表示為
本文系統(tǒng)在某省會主城區(qū)進行14天的試點。使用本文所提出的算法,共試點85個小區(qū),其中在試點期內(nèi)進行節(jié)電操作的小區(qū)為60個,節(jié)電操作率為71%。
試點期間,采取符號關(guān)斷604.18 h,采取通道關(guān)斷660.77 h,采取載波關(guān)斷331.73 h,總計節(jié)電時長1 596.68 h。節(jié)電判定正確時長為1 504 h,節(jié)電準確率為 94.2%。試點區(qū)域單站平均年節(jié)電效率可達 9.24%站/日。試點期間所選區(qū)域未出現(xiàn)網(wǎng)絡(luò)感知明顯波動,未發(fā)生相關(guān)感知投訴,節(jié)電指令關(guān)閉與開啟未出現(xiàn)異常。智能節(jié)電系統(tǒng)試點前后節(jié)電時長對比見表2,本文所提算法在該區(qū)域的節(jié)電量為試點前凌晨下電方案的1.5倍。
表2 智能節(jié)電系統(tǒng)試點前后節(jié)電時長對比
本文描述了一種基于通過動態(tài)時間規(guī)整算法和SARIMA分覆蓋場景構(gòu)建預測節(jié)電的方法,相較于傳統(tǒng)在低能耗時段一刀切下電的方法,本文所提的智能節(jié)電系統(tǒng)一方面可以準確地預測節(jié)電時間窗,節(jié)電量是傳統(tǒng)方法的1.5倍,區(qū)域節(jié)電效率平均可達9.24%站/日,最大程度地挖掘了基站節(jié)電潛能;另一方面,通過構(gòu)建從數(shù)據(jù)拉取、制定策略、指令下發(fā)、監(jiān)控反饋的全流程自助閉環(huán)系統(tǒng),監(jiān)控同期客服投訴情況作為輔助評估,有效降低了節(jié)電對用戶感知的影響。本文所述方法已在某沿?!潦〕晒υ圏c,實時性及準確性均較高,可有效降低人工成本,具有良好的推廣性與復制性。