国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

關(guān)于智能運(yùn)維中KPI異常檢測與預(yù)測的研究

2023-04-29 17:51:59陳云爍符繁強(qiáng)
信息系統(tǒng)工程 2023年9期
關(guān)鍵詞:異常檢測回歸模型

陳云爍?符繁強(qiáng)

摘要:業(yè)務(wù)性能指標(biāo)(key performance indicator,KPI)異常檢測是網(wǎng)絡(luò)智能運(yùn)維中的底層核心技術(shù),對網(wǎng)絡(luò)故障發(fā)現(xiàn)和修復(fù)具有重要意義。針對智能運(yùn)維中KPI異常檢測和異常預(yù)測問題,使用數(shù)據(jù)特征分析、相關(guān)性分析、多元線性回歸分析、機(jī)器學(xué)習(xí)等方法,分別建立KPI異常值檢測差與標(biāo)準(zhǔn)差模型、KPI異常值預(yù)測多元線性回歸模型、KPI異常值預(yù)測RBF神經(jīng)網(wǎng)絡(luò)模型(RBF—Radial Basis Function),并通過構(gòu)建評估指標(biāo)模型對模型預(yù)測的優(yōu)劣進(jìn)行判斷,給出運(yùn)營商基站KPI核心指標(biāo)的異常孤立點(diǎn)、異常周期以及異常值預(yù)測。

關(guān)鍵詞:異常檢測;異常預(yù)測;差與標(biāo)準(zhǔn)差;回歸模型;RBF神經(jīng)網(wǎng)絡(luò)模型

一、問題描述

異常檢測(異常診斷/發(fā)現(xiàn))、異常預(yù)測,是智能運(yùn)維中首當(dāng)其沖需要解決的問題[1]。這類問題是通過業(yè)務(wù)、系統(tǒng)、產(chǎn)品直接關(guān)聯(lián)的KPI業(yè)務(wù)指標(biāo)進(jìn)行分析診斷,本文以運(yùn)營商基站KPI的性能指標(biāo)為研究數(shù)據(jù),研究三項(xiàng)核心指標(biāo)。

第一項(xiàng)指標(biāo):小區(qū)內(nèi)的平均用戶數(shù),表示某基站覆蓋的小區(qū)一定時(shí)間內(nèi)通過手機(jī)在線的平均用戶人數(shù);

第二項(xiàng)指標(biāo):小區(qū)PDCP流量,通過小區(qū)PDCP層所發(fā)送的下行數(shù)據(jù)的總吞吐量(比特)與小區(qū)PDCP層所接收到的上行數(shù)據(jù)的總吞吐量(比特)兩項(xiàng)指標(biāo)求和到,表示某基站覆蓋的小區(qū)在一定時(shí)間內(nèi)的上下行流量總和;

第三項(xiàng)指標(biāo):平均激活用戶數(shù),表示某基站覆蓋的小區(qū)在一定時(shí)間內(nèi)曾經(jīng)注冊過無線網(wǎng)絡(luò)的平均人數(shù)。

異常檢測問題:利用提供的研究數(shù)據(jù),判斷所有小區(qū)的異常孤立點(diǎn)和異常周期以及時(shí)間周期的選擇標(biāo)準(zhǔn)。

異常預(yù)測問題:根據(jù)檢測出的異常值,建立異常值前的數(shù)據(jù)預(yù)測模型,分析預(yù)測未來是否發(fā)生異常數(shù)值。

二、模型假設(shè)

1.假設(shè)題中給定的數(shù)據(jù)真實(shí)有效;

2.假設(shè)提供數(shù)據(jù)中異常數(shù)據(jù)只存在少部分;

3.假設(shè)運(yùn)營商基站所覆蓋的區(qū)域恒定。

三、符號說明

符號及解釋如表1。

四、異常檢測問題模型的建立與求解

(一)異常檢測問題分析

利用KPI性能指標(biāo)對小區(qū)內(nèi)的平均用戶數(shù)、小區(qū)PDCP流量、平均激活用戶三項(xiàng)關(guān)鍵指標(biāo)分析異常檢測問題。

將小區(qū)PDCP層所發(fā)送的下行數(shù)據(jù)的總吞吐量(比特)小區(qū)PDCP層所接收到的上行數(shù)據(jù)的總吞吐量(比特)兩個(gè)指標(biāo)進(jìn)行整合得到小區(qū)PDCP流量,提取數(shù)據(jù)時(shí)間、基站編號、小區(qū)編號、小區(qū)內(nèi)的平均用戶數(shù)、小區(qū)PDCP流量、平均激活用戶數(shù)進(jìn)行數(shù)據(jù)重構(gòu)。

引入差與標(biāo)準(zhǔn)差的倍數(shù),用來分析異常值,定義:若數(shù)據(jù)差與標(biāo)準(zhǔn)差的倍數(shù)大于2倍以上,則該數(shù)據(jù)稱為異常數(shù)據(jù),判斷三個(gè)關(guān)鍵指標(biāo)的異常孤立點(diǎn)和異常周期。

(二) KPI異常值檢測差與標(biāo)準(zhǔn)差模型

1.差與標(biāo)準(zhǔn)差的倍數(shù)

以小區(qū)內(nèi)的平均用戶數(shù)為例,計(jì)算出其對應(yīng)的差與標(biāo)準(zhǔn)差的倍數(shù),其余指標(biāo)小區(qū)PDCP流量,平均激活用戶按照相同方法操作。

其中,表示第個(gè)小區(qū)第個(gè)數(shù)據(jù)的差與標(biāo)準(zhǔn)差的倍數(shù),表示第個(gè)小區(qū)第個(gè)數(shù)據(jù)的值,表示第小區(qū)指標(biāo)平均值,=1,2,3,…,58。=1,2,3,…,。

2.異常值與非異常值判斷

其中,表示異常值的判斷值,表示異常值,表示非異常值。

(三)時(shí)間周期分析

由于數(shù)據(jù)中提供的小區(qū)個(gè)數(shù)多、時(shí)間跨度長,本文隨機(jī)選取三個(gè)小區(qū)9天的數(shù)值作為展示,分別選取260190015、26019039、26019057小區(qū)的三個(gè)核心指標(biāo)數(shù)值作數(shù)據(jù)可視化處理分析其周期性。

通過指標(biāo)可視化分析圖觀察可知三個(gè)小區(qū)關(guān)鍵指標(biāo)均存在異常值,針對不同場景的運(yùn)維雖然會(huì)混合多個(gè)時(shí)間間隔的數(shù)據(jù),但具備時(shí)序性特點(diǎn),均為隨時(shí)間變化而變化。小區(qū)內(nèi)的平均用戶數(shù)小區(qū)、平均激活用戶、PDCP流量三項(xiàng)核心指標(biāo)呈上下起伏的周期變化,為此選取小區(qū)內(nèi)的平均用戶數(shù)、小區(qū) PDCP流量、平均激活用戶數(shù)時(shí)間周期均為1天。

(四)異常孤立點(diǎn)、異常周期的檢測

將已處理的數(shù)據(jù)用差于標(biāo)準(zhǔn)差的模型計(jì)算小區(qū)核心指標(biāo)的相應(yīng)倍數(shù),求出以26019015、26019039、26019057小區(qū)的一段時(shí)間中小區(qū)內(nèi)的平均用戶數(shù)作為展示和分析。

若一段時(shí)間內(nèi)只有一個(gè)異常點(diǎn)則為一個(gè)異常孤立點(diǎn),在一天的時(shí)間周期中出現(xiàn)多個(gè)異常值則為異常周期。將除以2分別得到,的值。

可求出小區(qū)在異常點(diǎn)的總數(shù), =1,2,3,…,58。=1,2,3。以一天為時(shí)間周期標(biāo)準(zhǔn)從00:00—23:00時(shí)間段中出現(xiàn)多個(gè)異常點(diǎn)屬于異常周期,則異常周期的個(gè)數(shù),見表2。

五、異常預(yù)測問題模型的建立與求解

(一)數(shù)據(jù)處理

根據(jù)58個(gè)小區(qū)提供的數(shù)據(jù)對所有指標(biāo)進(jìn)行相關(guān)性分析[2],篩選出與小區(qū)內(nèi)的平均用戶數(shù)小區(qū)、平均激活用戶、PDCP流量三個(gè)關(guān)鍵性指標(biāo)相關(guān)性較強(qiáng)的指標(biāo)因子。

三項(xiàng)關(guān)鍵性指標(biāo)相關(guān)系數(shù)最高的指標(biāo)數(shù)據(jù),例如:平均激活用戶數(shù)與最大激活用戶數(shù)、空口上報(bào)全帶寬 CQI為12的次數(shù)、MR 測量上報(bào) RSRP 在 Index4 區(qū)間的次數(shù)的相關(guān)性都比原數(shù)據(jù)中其他指標(biāo)數(shù)據(jù)較高,將三項(xiàng)關(guān)鍵性指標(biāo)的相關(guān)系數(shù)較高的指標(biāo)數(shù)據(jù)提取出來重復(fù)異常值步驟,為求解異常預(yù)測,做好數(shù)據(jù)處理。

(二)KPI異常值預(yù)測多元線性回歸模型

多元線性回歸分析是通過確定因變量與自變量,分析因變量與自變量之間關(guān)系的一種方法,進(jìn)而確定變量間滿足的方程[3]。本文將問題中所提供的數(shù)據(jù)進(jìn)行劃分,前500條數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),用于訓(xùn)練變量之間存在的關(guān)系,剩余數(shù)據(jù)用于測試數(shù)據(jù)訓(xùn)練的效果,關(guān)于小區(qū)平均用戶數(shù)、平均激活用戶、小區(qū)PDCP流量三個(gè)關(guān)鍵性指標(biāo)的多元線性回歸分析情況如下:

1.將平均激活用戶數(shù)作為因變量,將上文中篩選出與平均激活用戶數(shù)相關(guān)關(guān)系較強(qiáng)的指標(biāo)作為自變量,使用EXCEL進(jìn)行多元線性回歸分析。

得到多元線性回歸模型,如下:

1=0+11+22+33 (4)

其中, 0=0,1=0.45, 2=0.21,3=0.16。

2.將小區(qū)PDCP流量作為因變量,將上文中篩選出與小區(qū)PDCP流量相關(guān)關(guān)系較強(qiáng)的指標(biāo)作為自變量,使用EXCEL進(jìn)行多元線性回歸分析。

可得到多元線性回歸模型,如下:

2=0+1 1+2 2+3 3+4 4+5 5 (5)

其中,0=0,1=0.25,2=0.14,3=0.09,3=0.29,3=0.18。

3.將小區(qū)內(nèi)的平均用戶數(shù)作為因變量,將上文中篩選出與小區(qū)內(nèi)的平均用戶數(shù)相關(guān)關(guān)系較強(qiáng)的指標(biāo)作為自變量,使用EXCEL進(jìn)行多元線性回歸分析。

可得到多元線性回歸模型,如下:

3=0+11+22+…+1111+1212 (6)

其中,0=0.01,1=0.03,2=-0.08,3=0.01,4=-3.31,5=3.55,6=-0.30,7=-0.004,8=-0.02,9=0.10,10=0.01,11=0.07,12=0.93。

上述方程(4)、方程(5)、方程(6)可以實(shí)現(xiàn)對未來時(shí)段三個(gè)關(guān)鍵指標(biāo)數(shù)據(jù)的變化趨勢進(jìn)行預(yù)測,以26019039小區(qū)的PDCP流量為例,將第500條之后的5個(gè)數(shù)據(jù)指標(biāo)(UE緩存為空的最后一個(gè)TTI所傳的上行PDCP吞吐量、扣除使UE緩存為空的最后一個(gè)TTI之后的上行數(shù)、平均激活用戶數(shù)、最大激活用戶數(shù)、MR測量上報(bào)RSRP在Index4區(qū)間的次數(shù))代入方程(5),計(jì)算出預(yù)測值,現(xiàn)對指標(biāo)預(yù)測情況與原始數(shù)據(jù)進(jìn)行展示,如圖1所示。

(三)預(yù)測評估指標(biāo)模型

為檢驗(yàn)構(gòu)建的模型預(yù)測效果是否好,現(xiàn)構(gòu)建預(yù)測評估指標(biāo)模型對建立的KPI異常值預(yù)測多元線性回歸模型的優(yōu)劣進(jìn)行判斷。

以26019039號小區(qū)為例,分別計(jì)算小區(qū)內(nèi)的平均用戶數(shù)、平均激活用戶數(shù)、小區(qū)總 PDCP 流量的F1值。

根據(jù)建立的多元線性回歸模型,所求出的模型評估值 F1 得出該模型針對小區(qū)內(nèi)的平均用戶數(shù)指標(biāo)預(yù)測效果較好,但平均激活用戶數(shù)、小區(qū)總PDCP流量指標(biāo)的預(yù)測效果明顯欠佳,為此我們考慮再采用RBF神經(jīng)網(wǎng)絡(luò)模型進(jìn)行求預(yù)測。

(四)KPI異常值預(yù)測RBF神經(jīng)網(wǎng)絡(luò)模型

RBF神經(jīng)網(wǎng)絡(luò)是將RBF高斯核函數(shù)應(yīng)用于神經(jīng)網(wǎng)絡(luò)的一種模型,RBF神經(jīng)網(wǎng)絡(luò)通常只有三層,第一層是輸入的各個(gè)指標(biāo)原始數(shù)值,即輸入層;中間的隱含層是多個(gè)高斯核函數(shù),每個(gè)高斯核函數(shù)都以一個(gè)樣本點(diǎn)或者一個(gè)聚類中心作為高斯核函數(shù)的參數(shù)。經(jīng)過隱含層,數(shù)據(jù)相當(dāng)于經(jīng)過了非線性的變化;之后在第二層和第三層之間采用線性輸出,利用線性加權(quán)的方法將隱含層的數(shù)據(jù)輸出到輸出層,作為最終的預(yù)測結(jié)果[4-5]。

將三個(gè)關(guān)鍵性指標(biāo)作為因變量,對應(yīng)三個(gè)關(guān)鍵指標(biāo)相關(guān)性較高指標(biāo)作為自變量[6-7],構(gòu)建RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測,將前200條預(yù)測結(jié)果與原始數(shù)據(jù)進(jìn)行展示。

由于在異常判斷時(shí),數(shù)據(jù)的差與標(biāo)準(zhǔn)差的倍數(shù)得到的值采取了萬分位四舍五入進(jìn)行計(jì)算,為此使用RBF神經(jīng)網(wǎng)絡(luò)模型時(shí)會(huì)產(chǎn)生較小的偏差,為減小誤差,本文作如下定義。

閥函數(shù):當(dāng)預(yù)測的指標(biāo)數(shù)據(jù)與原始數(shù)據(jù)差的絕對值小于或等于0.05時(shí),表示該預(yù)測的結(jié)果合理。

閥函數(shù):? ? ? ? ? ? ? ? |- |≤0.05 (7)

其中,為原始數(shù)據(jù),為預(yù)測數(shù)據(jù),,=1,2....,n。

使用F1值對RBF 神經(jīng)網(wǎng)絡(luò)模型的優(yōu)劣進(jìn)行判斷,通過使用RBF神經(jīng)網(wǎng)絡(luò)模型得到的F1值都在70%以上,將多元線性回歸模型與RBF神經(jīng)網(wǎng)絡(luò)模型F1值的數(shù)據(jù)對比,見表3。

從表3可以看出,RBF神經(jīng)網(wǎng)絡(luò)模型的模型評估值F1值遠(yuǎn)優(yōu)于多元線性回歸模型,因此RBF神經(jīng)網(wǎng)絡(luò)模型更適合KPI指標(biāo)的預(yù)測。

六、模型評價(jià)

KPI異常檢測與異常預(yù)測是智能運(yùn)維中最核心的問題。本文通過對數(shù)據(jù)進(jìn)行特征分析,針對異常檢測問題,提出了KPI異常值檢測差與標(biāo)準(zhǔn)差模型,解決了尋找異常孤立點(diǎn)、異常周期問題;針對異常預(yù)測問題提出了KPI異常值預(yù)測多元線性回歸模型、KPI異常值預(yù)測RBF神經(jīng)網(wǎng)絡(luò)模型,使用評價(jià)指標(biāo)模型判斷出兩個(gè)模型的優(yōu)劣,解決了異常預(yù)測問題。但智能運(yùn)維中的異常檢測無法完全避免故障的發(fā)生,只能通過提高系統(tǒng)的穩(wěn)定性和可靠性,減少故障對系統(tǒng)的影響。因此,在智能運(yùn)維中,需要不斷地完善技術(shù)手段和提高算法的精度,采用多種方法相互協(xié)作,才能實(shí)現(xiàn)更精確、可靠的異常預(yù)測。

參考文獻(xiàn)

[1]陳倩,戴躍偉,劉光杰.面向智能運(yùn)維的KPI異常檢測模型研究[J].重慶理工大學(xué)學(xué)報(bào)(自然科學(xué)),2022,36(06):181-188.

[2]李軍紅,李付慶,范建民.統(tǒng)計(jì)學(xué)[M].南京:南京大學(xué)出版社,2020.

[3]陳佳佳.面向成分?jǐn)?shù)據(jù)的回歸分析研究[M].武漢大學(xué)出版社,202008.157.

[4]張澤旭.神經(jīng)網(wǎng)絡(luò)控制與MATLAB仿真[M].哈爾濱:哈爾濱工業(yè)大學(xué)出版社,2011.

[5]孫永謙,張茹茹,林子涵,等.KPI異常檢測方法評估[J].數(shù)據(jù)與計(jì)算發(fā)展前沿,2022,4(03):46-65.

[6]王速,盧華,汪碩,等.智能運(yùn)維中KPI異常檢測的研究進(jìn)展[J].電信科學(xué),2021,37(05):42-51.

[7]張圣林,林瀟霏,孫永謙,等.基于深度學(xué)習(xí)的無監(jiān)督KPI異常檢測[J].數(shù)據(jù)與計(jì)算發(fā)展前沿,2020,2(03):87-100.

猜你喜歡
異常檢測回歸模型
基于LMD模糊熵的遙測振動(dòng)信號異常檢測方法
農(nóng)村秸稈處理方式的影響因素
東方教育(2016年9期)2017-01-17 00:43:44
基于度分布的流量異常在線檢測方法研究
國際旅游外匯收入影響因素分析
無線Mesh網(wǎng)絡(luò)安全性研究
無線Mesh網(wǎng)絡(luò)基礎(chǔ)知識
城市空間用地?cái)U(kuò)展變化研究與規(guī)模預(yù)測
電子商務(wù)影響因素的計(jì)量分析
商(2016年28期)2016-10-27 20:23:05
淺談燃?xì)廨啓C(jī)排氣溫度異常檢測及診斷
房地產(chǎn)價(jià)格影響因素實(shí)證分析
中國市場(2016年34期)2016-10-15 08:39:26
怀远县| 西盟| 清苑县| 澎湖县| 白玉县| 南平市| 景泰县| 宿迁市| 福鼎市| 汉阴县| 怀安县| 安达市| 沙洋县| 山阳县| 扎鲁特旗| 普陀区| 社会| 曲周县| 宁化县| 大同市| 顺平县| 昌宁县| 肇庆市| 寿光市| 阿克| 洛南县| 宜黄县| 崇礼县| 谷城县| 同德县| 绥宁县| 五大连池市| 台中县| 瓦房店市| 东安县| 称多县| 建平县| 信丰县| 郸城县| 长乐市| 龙井市|