国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于多判據(jù)融合的用電信息采集系統(tǒng)異常數(shù)據(jù)甄別模型

2019-10-10 07:06祝永晉馬吉科季聰
廣東電力 2019年9期
關鍵詞:位數(shù)用電聚類

祝永晉,馬吉科,季聰

(江蘇方天電力技術有限公司, 江蘇 南京 211102)

隨著計算機、傳感技術、通信技術的廣泛應用,配電網運營監(jiān)測業(yè)務的不斷推進以及大量監(jiān)測計量裝置的部署,配電變壓器(以下簡稱“配變”)臺區(qū)監(jiān)測獲得了海量運行數(shù)據(jù)、用戶用電數(shù)據(jù)及設備狀態(tài)數(shù)據(jù),對這些數(shù)據(jù)進行分析、挖掘、抽取與加工,實現(xiàn)配變臺區(qū)安全經濟運行、提升服務質量、拓展電量電費業(yè)務成為配電網面臨的挑戰(zhàn)[1-3]。需特別指出的是,用電信息采集系統(tǒng)配變臺區(qū)監(jiān)測獲得的海量電網數(shù)據(jù)中存在約10%的異常數(shù)據(jù),有必要對數(shù)據(jù)質量進行分析,甄別異常數(shù)據(jù),為開展監(jiān)測運營業(yè)務提供可靠、精確、有效的數(shù)據(jù)支撐[4-5]。

因計量裝置故障、通信信號差、采集器故障、人為因素等原因,用電信息采集系統(tǒng)時間序列數(shù)據(jù)會出現(xiàn)異常值[6-10],從而影響用電信息采集系統(tǒng)數(shù)據(jù)質量,而數(shù)據(jù)質量的好壞很大程度上決定了模型分析結果的好壞。因此,在建立分析模型前對用電信息采集系統(tǒng)數(shù)據(jù)中的異常值進行檢測甄別,是提高數(shù)據(jù)質量的重要途徑。

目前采用數(shù)據(jù)挖掘技術進行時間序列數(shù)據(jù)異常值檢測的方法較為成熟多樣,文獻[11]提出了通過統(tǒng)計學方法得到時間序列數(shù)據(jù)的概率分布函數(shù)和相應的糾偏函數(shù)來檢測異常點?;诮y(tǒng)計學的方法依賴海量樣本的隨機分析[12],且必須知道數(shù)據(jù)分布模型,因而該方法有很大的局限性[13]。文獻[14]使用Mahalanobis距離和最小協(xié)方差矩陣對變壓器油色譜檢測數(shù)據(jù)進行異常值診斷。文獻[15]使用基于數(shù)據(jù)集分割和距離的異常值辨識方法,該方法能較好地擴展到不同的數(shù)據(jù)集大小和維度;基于距離的檢測方法對于某些全局異常點效果較好,但其距離函數(shù)和參數(shù)不易選擇,不能檢測出局部異常點。文獻[16]使用基于聚類和核密度假設檢驗的方法,在樣本量不多的情況下有較好的效果,但不適用樣本量多、高維數(shù)據(jù)場合。文獻[17]將人工神經網絡(artificial neural networks,ANN)運用到異常值檢測,ANN在處理小規(guī)模問題上有很好的應用效果,但對大規(guī)模數(shù)據(jù)場景效率較低,難以較好地解決參數(shù)訓練問題,且訓練過程易陷入局部最優(yōu),模型結構和權值設置不當還會嚴重影響模型精確度。文獻[18]將用戶歷史最近24個月的用電量數(shù)據(jù)和信用評級作為分類特征,通過訓練支持向量機(support vector machines,SVM)分類,獲得了一定的效果;SVM具有更好的泛化能力,但在處理海量樣本時有一定的難度[19-20]。

上述基于統(tǒng)計學原理的方法和傳統(tǒng)的機器學習方法,在小樣本、低維度的異常數(shù)據(jù)辨識任務中獲取了不錯的效果,但這些傳統(tǒng)的學習方法如SVM、ANN通常難以在海量樣本中進行訓練,難以完成海量數(shù)據(jù)異常甄別的任務。相較于傳統(tǒng)的機器學習,深度學習將訓練集事先分成小批量數(shù)據(jù)進行計算,提高了訓練效率,且深度學習在深層結構中能有效避免梯度消失或梯度爆炸的問題。因此深度學習方法更適用于學習電流、電壓等海量用電信息采集系統(tǒng)數(shù)據(jù)的時變規(guī)律[21-22],從而進行異常值檢測與甄別。采用深度學習的方法可解決傳統(tǒng)機器學習方法在處理海量數(shù)據(jù)時所存在的占用內存高、運行處理速度慢及難以處理高維特征數(shù)據(jù)等問題。為此,本文主要以用電信息采集系統(tǒng)配變臺區(qū)監(jiān)測的電流、電壓和有功功率數(shù)據(jù)為對象,研究運用深度學習技術的用電信息采集系統(tǒng)異常數(shù)據(jù)甄別模型;為避免單一模型在處理不同任務時的局限性,同時采用原型聚類法、密度聚類法和概率密度法等機器學習算法進行異常值甄別,以“4取2”的方法交叉驗證,提升模型的異常點甄別能力,為運行監(jiān)測業(yè)務提供精確的數(shù)據(jù)保障。

1 用電信息采集系統(tǒng)數(shù)據(jù)特性

用電信息采集系統(tǒng)中智能電表的電流、電壓、有功功率、無功功率曲線中的異常數(shù)據(jù)直接反應了智能電表的運行狀態(tài),此類異常數(shù)據(jù)屬于表計方面的測量異常點以及用戶用電異常點。表計異常點較為隱蔽,一般存在較長時間,如數(shù)據(jù)持續(xù)缺失、偏大或偏小,其中,數(shù)據(jù)持續(xù)缺失問題可通過數(shù)據(jù)預處理統(tǒng)計發(fā)現(xiàn)。由于不同用戶用電行為特征和用電數(shù)值大小有區(qū)別,對用電信息采集系統(tǒng)數(shù)據(jù)進行數(shù)據(jù)挖掘和異常甄別時,主要依賴該用戶的用電行為產生的數(shù)據(jù)。若表計數(shù)據(jù)的變化規(guī)律與時序規(guī)律未發(fā)生改變,僅出現(xiàn)持續(xù)時間較長的數(shù)值偏大或偏小異常。在這種情況下,數(shù)據(jù)樣本中包含表計發(fā)生該類異常之前的數(shù)據(jù),通過數(shù)據(jù)挖掘的方法能尋找到異常開始發(fā)生的數(shù)據(jù)點;若此種情況下,數(shù)據(jù)樣本中不包含表計發(fā)生該異常之前的數(shù)據(jù),基于數(shù)據(jù)挖掘的方法很難從數(shù)據(jù)中甄別該異常數(shù)據(jù),此時更加依賴基于電力系統(tǒng)模型的方法,如計算排查線損率等方法,但該方法需求的數(shù)據(jù)量與數(shù)據(jù)種類較多,工作量大,檢測效率較低。本文運用數(shù)據(jù)挖掘領域的方法進行異常數(shù)據(jù)甄別,效率較高,但鑒于目前數(shù)據(jù)挖掘領域方法的局限性,本文主要討論數(shù)據(jù)樣本中此種表計隱蔽異常數(shù)據(jù)較少情況下的異常數(shù)據(jù)甄別。

2 基于多判據(jù)融合的用電信息采集系統(tǒng)數(shù)據(jù)異常值甄別方法

2.1 原型聚類模型

原型聚類法是對樣本空間中具有代表性的點進行迭代更新求解的聚類方法,本文采用原型聚類模型中的k-means算法。原型聚類法異常值檢測模型的輸入與輸出見表1,其中,i、u、P分別為電流、電壓、功率的當前采樣點實際值序列,Δi1、Δu1、ΔP1分別為電流、電壓、功率當前采樣點與前一個采樣點的變化值序列,Δi2、Δu2、ΔP2分別為當前采樣點與前兩個采樣點的變化值序列。該模型的輸入是當前采樣點的實際值與變化,主要檢測當前實際值與當前變化趨勢的關系;模型檢測出的異常點距離各類聚類中心較遠,這些點的當前實際值與當前變化趨勢的關系異常。

表1 原型聚類法異常值檢測模型的輸入與輸出Tab.1 Input and output of outlier detection model based on prototype clustering method

2.2 密度聚類模型

密度聚類法假定類別可以通過樣本分布的緊密程度來決定,將樣本分為密集樣本類別和離散樣本噪聲點。密度聚類法異常值檢測模型輸入與輸出見表2。該模型輸入的是2個不同物理量實際值的序列,主要檢測2個物理量之間的相關性;模型檢測出的異常點和其他點相比密度不可達,這些點的2個物理量之間相關性異常。

表2 密度聚類法異常值檢測模型的輸入與輸出Tab.2 Input and output of outlier detection model based on density clustering method

2.3 概率密度模型

事先難以判斷現(xiàn)場實際測量的電壓、電流及功率數(shù)據(jù)的概率分布類型,對電壓、電流及功率等不同時間序列進行異常值甄別時,先采用核密度函數(shù)分別擬合其概率分布,并獲得概率密度函數(shù);由概率密度函數(shù)可獲得變化值的正常范圍。概率密度法異常值甄別模型的輸入與輸出見表3。該模型的輸入是當前采樣點的變化值序列,主要檢測各采樣點的變化程度;該模型檢測出的異常點和其他點相比變化程度過大。

表3 概率密度法異常值檢測模型的輸入與輸出Tab.3 Input and output of outlier detection model based on probabilistic density method

2.4 長短期記憶網絡分位數(shù)回歸模型

基于深度學習算法的異常值甄別模型中,由訓練完成的深度學習分位數(shù)回歸模型對未來的電流、電壓和功率數(shù)據(jù)進行預測,獲得多組預測值,求出時序數(shù)據(jù)的置信區(qū)間范圍。若預測值偏離時序數(shù)據(jù)的置信區(qū)間范圍,該點即為異常值點。本文在分析長短期記憶網絡(long short-term memory,LSTM)基本原理的基礎上,分別對電流、電壓及功率建立LSTM分位數(shù)回歸模型,實現(xiàn)對三者時間序列的異常值甄別[23]。深度學習異常值檢測模型的輸入與輸出見表4,該模型的輸入為歷史數(shù)據(jù)序列,檢測出的異常點與其他點相比不符合歷史數(shù)據(jù)的時序變化規(guī)律。

表4 深度學習方法異常值檢測模型輸入輸出Tab.4 Input and output of outlier detection model based on deep learning method

圖1所示為LSTM各部分結構,計算過程分別如下[24]。

a)遺忘門計算過程如圖1(a)所示,計算公式為

ft=σf(Wf·[ht-1,xt]+bf) .

(1)

式中:Wf、bf分別為遺忘門權重矩陣和遺忘門偏置;[ht-1,xt]表示將2個向量拼接;ht-1為前一時刻的LSTM輸出;xt為當前時刻輸入;σf為遺忘門激活函數(shù)。

b)輸入門計算過程如圖1(b)所示,計算公式為

it=σi(Wi·[ht-1,xt]+bi) .

(2)

式中:Wi、bi分別為輸入門權重矩陣和偏置項;σi為輸入門結構的激活函數(shù)。

c)當前時刻輸入的單元狀態(tài)c′的計算過程如圖1(c)所示,計算公式為

(3)

式中:Wc、bc分別為該單元的權重矩陣和偏置項。

(4)

e)輸出門的計算如圖1(e)所示,即

ot=σo(Wo·[ht-1,xt]+bo) .

(5)

式中:Wo為輸出門權重矩陣;bo為輸出門偏置項;σo為輸出門激活函數(shù)。

f)LSTM最終輸出由輸出門和單元狀態(tài)共同決定,如圖1(f)所示,即

ht=ot°tanh(ct) .

(6)

建立LSTM模型后,分別訓練對應于分位數(shù)0.01~0.99的99個LSTM分位數(shù)回歸模型,預測得到99組預測曲線數(shù)據(jù),計算得到置信區(qū)間范圍。通過比較真實值與置信區(qū)間范圍,確定最終的異常數(shù)據(jù)辨識結果,這樣可以有效避免人為設置閾值對結果帶來的不確定性。

在模型訓練中,損失函數(shù)為分位數(shù)損失函數(shù)。LSTM回歸模型的訓練過程可看作是關于LSTM的權重參數(shù)W與網絡結構偏置項參數(shù)b的優(yōu)化問

題的求解,其目標函數(shù)為

(7)

式中:τ為分位數(shù),τ∈(0,1);Y為模型訓練集的輸出;X為模型訓練集中的輸入樣本;N為輸入樣本個數(shù)。

其中

ρτ(θ)=θ·[τ-I(θ)] .

(8)

(9)

式中θ為自變量。

在多判據(jù)融合模型中,原型聚類法檢測當前采樣點實際值與當前變化趨勢的關系是否異常,密度聚類法檢測電力系統(tǒng)中電壓、電流、功率兩兩之間的相關性,概率密度法檢測當前采樣點與之前時刻采樣點的變化值是否會過大造成突變異常,深度學習法檢測當前的采樣點數(shù)據(jù)是否符合歷史數(shù)據(jù)的時序變化規(guī)律。4種模型的目標檢測范圍互補,通過“4取2”確定最終甄別結果,既能互相驗證,降低誤檢率,又可以從不同的檢測維度發(fā)現(xiàn)異常點,獲得較高的正檢率。

圖1 LSTM各組成部分結構Fig.1 Structures of components of LSTM

3 基于多判據(jù)融合的用電信息采集系統(tǒng)異常數(shù)據(jù)甄別測試

3.1 用電信息采集系統(tǒng)異常數(shù)據(jù)甄別模型基本測試

測試分析的第一部分工作包括:基于正常運行計量裝置采集的電流、電壓、有功功率數(shù)據(jù),在原始數(shù)據(jù)中增加不同程度的隨機噪聲,形成異常點;使用上述4種模型對含噪聲數(shù)據(jù)進行測試,獲得各個模型異常值檢測結果。測試中,4種模型檢測結果通過“4取2”策略確定最終的異常值檢測結果,即4種模型中有2個或2個以上的模型判定待檢測數(shù)據(jù)點為異常值,則該數(shù)據(jù)點的最終檢測結果為異常,否則該數(shù)據(jù)點的最終檢測結果為正常。

選取某一正常電表,時間范圍為2017年7月1日至8月31日共計5 856點,其中有功功率均值為25.625 kW,最大值94.956 kW,最小值5.1 kW,變化平均值為2.866 kW;隨機生成均值為0、標準差為13的共59個正態(tài)分布誤差值,噪聲點個數(shù)占時序數(shù)據(jù)長度的1%,并將這些干擾隨機放入功率原始時間序列中。圖2為實際功率序列及隨機噪聲序列。

圖2 實際功率序列及隨機噪聲序列Fig.2 Actual power sequence and random noise sequence

采用4種模型進行異常值甄別測試分析分別如下。

a)基于原型聚類法的異常值甄別測試。由于原型分類法的分類個數(shù)k值需預先設定,經過多次模型測試,綜合考慮聚類效果、噪聲甄別效果以及運行時間等,選擇以下參數(shù):聚類類別為4類,異常值點判斷準則閾值嘗試設置為3.2,聚類最大循環(huán)次數(shù)為500,距離函數(shù)采用歐式距離。公式(10)表示聚類樣本中任意第i個樣本和第j個樣本之間的歐式距離,每個樣本有n維參數(shù),其中Xi={xi1,xi2,…,xin} ,Xj={xj1,xj2,…,xjn}。

d(i,j)=

(10)

原型聚類功率分析結果如圖3所示,其中縱坐標表示該樣本與所屬類別的聚類中心的相對距離。將該樣本與所屬類別聚類中心的實際歐式距離記為Lre,該聚類類別中所有樣本與所屬類別聚類中心的實際歐式距離的中位數(shù)記為Lme,則相對距離L=Lre/Lme.

圖3 原型聚類功率分析結果Fig.3 Prototype clustering power analysis results

由圖3可以看出,該方法的聚類效果較為明顯,標為△的異常點明顯與數(shù)據(jù)樣本中大多數(shù)●的樣本點分離;△異常數(shù)據(jù)點表示該采樣點實際值與變化趨勢的關系異常。

b)基于密度聚類法的異常值甄別測試。選擇的參數(shù)包括:最大距離設置為0.5、樣本點歸一化范圍為(0, 4)、1類別的最少樣本個數(shù)為5、距離函數(shù)為歐式距離計算方法。密度聚類分析結果如圖4所示。

由圖4可以看出,該方法的聚類效果較為明顯,功率、電流總體成線性關系,功率、電壓平面分布在左下角?!啊睢毙畏柋硎镜漠惓|c明顯處于數(shù)據(jù)樣本中大多數(shù)“×”形符號樣本組成的簇的邊緣,“☆”異常數(shù)據(jù)點表示功率、電流相關性異常和功率、電壓相關性異常。

c)基于概率密度法的異常值甄別測試。圖5為采用該方法測得的功率變化值概率密度曲線。

圖4 密度聚類分析結果Fig.4 Density clustering analysis results

圖5 概率分布分析結果Fig.5 Probability distribution analysis results

由圖5可以看出,功率變化值集中分布于0附近,結合概率密度函數(shù),可以獲得功率變化值出現(xiàn)某一值時的概率。假設功率變化值在0值附近某一范圍內的概率為99.9%,則認為功率變化值在該范圍內是正常的。此時可計算出功率變化值端點值為-10.464 6和10.462 8,即認為:正常功率變化值范圍為[-10.464 6,10.462 8],不在此范圍的即為異常功率變化,檢測出的異常數(shù)據(jù)點的異常類型為功率數(shù)值變化率過大異常。

d)基于深度學習算法的異常值甄別測試。使用LSTM分位數(shù)回歸算法對功率進行預測,獲得待測時間點功率的概率預測置信區(qū)間范圍,共同的網絡結構參數(shù)設置為:4層循環(huán)神經網絡,包括輸入層(96×1序列輸入),1層LSTM層(8節(jié)點),1層普通隱含層(4節(jié)點),1層輸出層(1節(jié)點);輸入與輸出參數(shù)使用最近歷史96點的數(shù)據(jù)預測下一時刻的電流值(采樣間隔15 min);模型優(yōu)化為RMSProp(帶動量的隨機梯度下降算法),迭代次數(shù)為400,訓練批數(shù)512(訓練樣本一共5 856個,1次迭代約分為4~5批),訓練樣本中驗證集所占比率為5%;對應不同的分位數(shù)回歸模型,目標函數(shù)為對應的模型輸出值與真實值的分位數(shù)損失函數(shù)。LSTM分位數(shù)回歸結果及功率真實值如圖6所示,橫坐標為數(shù)據(jù)點序號,縱坐標為功率值大小。對應圖例,實際值為實際的功率值曲線,預測值為對應于0.5分位數(shù)模型的預測值,圖例中100%CI為預測的100%置信區(qū)間范圍,對于不同類型的數(shù)據(jù),可以選擇不同的置信區(qū)間范圍作為閾值范圍。本文經多次測試實驗,綜合甄別檢出率和誤判率考慮,采用100%的置信區(qū)間范圍作為閾值。

圖6 LSTM分位數(shù)回歸結果及功率真實值Fig.6 LSTM quantile regression results and true power values

由圖6可以看出,實際值曲線基本在100%置信區(qū)間之內,且置信區(qū)間范圍比較窄;說明LSTM分位數(shù)回歸模型預測功率的置信區(qū)間的效果較好,并且區(qū)間范圍對異常甄別有很好的參考價值。超出閾值置信區(qū)間范圍的異常點為不符合歷史數(shù)據(jù)樣本的時序規(guī)律的采樣點。

對于本文提出的異常甄別模型,采用檢出率kacc和誤檢率kerr作為評價指標,即

(11)

式中:NT為正確檢測的異常點個數(shù);NF為錯誤檢測的異常點個數(shù);Nb為實際異常點個數(shù)。改變檢測時間序列數(shù)據(jù)類型,添加不同大小方差的噪聲,進行多次異常數(shù)據(jù)檢測,異常數(shù)據(jù)檢測結果見表5。

由表5可以看出,在不同聚類方法中,概率密度法的檢出率最高,密度聚類法的檢出率最低;同時,概率密度法對于變化值最敏感,誤檢率最高;LSTM分位數(shù)回歸模型的性能相對于這些聚類方法,有較為明顯的提升,檢出率指標和誤檢率指標均更好;基于多判據(jù)融合的異常數(shù)據(jù)甄別模型的甄別效果相比LSTM分位數(shù)回歸模型的甄別效果有所提升,平均檢出率能達到本文所述方法最高的76.27%,同時具有最低的平均誤檢率17.23%。

3.2 實際電表的電流和功率測試結果

為了驗證基于多判據(jù)融合的用電信息采集系統(tǒng)數(shù)據(jù)異常甄別模型在實際用電曲線序列中的效果,取3只異常電表A、B、C,對2017年3月6日至2017年5月7日共計5 952點A相功率值序列、電壓值序列和電流值序列組成原始數(shù)據(jù)集進行異常甄別,對模型檢測出的異常點進行曲線相關性研究分析,檢驗異常數(shù)據(jù)甄別模型是否有效,檢測具體情況如下。

a)電流變化率過大異常。對電表A在5月7日的電流曲線數(shù)據(jù)(如圖7所示)進行異常甄別,確定第37點為異常點。由圖7可以看出,在第37點處電流變化值較大,判定為異常值點,異常原因為電流突變異常,異常數(shù)據(jù)甄別有效。

b)功率變化率過大異常。對電表B在5月7日的功率曲線數(shù)據(jù)(如圖8所示)進行異常甄別,確定第57點為異常點。由圖8可以看出,在第57點處功率變化值較大,判定為異常值點,異常原因為功率突變異常,異常數(shù)據(jù)甄別有效。

c)電流功率相關性異常。對電表C在5月7日的功率曲線及電流曲線數(shù)據(jù)(如圖9所示)進行異常甄別,確定第75點為異常點。由圖9可以看出,在75點處,電流和功率相關性,顯著異常,判定為異常值點,異常數(shù)據(jù)甄別有效。

實際電表測試出的異常甄別結果可反饋給有關部門進行分析,若某一電表在一段時間內多次檢測出異常點,則它有較高的異常嫌疑;若它在某一較長的時間段內只有1個異常點,也可比對異常點發(fā)生前后的數(shù)據(jù),排查是否發(fā)生了數(shù)值偏大或偏小的隱蔽表計異常。該模型為主動排查異常用電計量裝置提供了可靠的依據(jù),有效縮小了排查范圍,有很高的參考價值。

圖7 電表A電流及電流變化值曲線Fig.7 A ammeter current and current change curve

圖8 電表B功率及功率變化值曲線Fig.8 B ammeter power and its change curve

表5 異常數(shù)據(jù)檢測結果Tab.5 Detection results of anomaly data

圖9 電表C電流及功率曲線Fig.9 C ammeter current and power curve

通過算例分析,得出以下結論:

a)基于LSTM分位數(shù)回歸算法的異常數(shù)據(jù)甄別模型具有可行性和有效性,在人工添加噪聲的模擬異常曲線檢測中,平均檢出率達到74.58%,平均誤檢率為21.18%。

b)基于多判據(jù)融合的異常數(shù)據(jù)甄別模型具有有效性,且該模型檢出率和誤檢率指標水平較基于LSTM分位數(shù)回歸算法的異常數(shù)據(jù)甄別模型有進一步改善。在人工添加噪聲的模擬異常曲線檢測中,平均檢出率達到76.27%,平均誤檢率為17.23%。

c)本文所提方法在人工添加的異常曲線和實際運行故障的異常曲線中,均能有效檢測異常數(shù)據(jù)點,表明了該方法用于模擬檢測具有可行性,本文建立的用電信息采集系統(tǒng)數(shù)據(jù)異常甄別模型具有實用性。

4 結論

為了驗證本文提出模型對于異常數(shù)據(jù)甄別的檢出率和誤判率,向正常運行工況下的用電信息采集系統(tǒng)時序數(shù)據(jù)中添加正態(tài)分布噪聲,構建并模擬用電信息采集系統(tǒng)系統(tǒng)異常數(shù)據(jù)。

本文建立的基于LSTM分位數(shù)回歸的用電信息采集系統(tǒng)數(shù)據(jù)異常甄別模型,實現(xiàn)了對智能電表歷史運行曲線的有效學習,運用深度學習技術挖掘歷史時間序列數(shù)據(jù)特征,建立歷史數(shù)據(jù)與待檢測數(shù)據(jù)之間的映射關系,進而對測試時間點智能電表運行曲線進行更為精確的概率預測,獲得更為準確置信區(qū)間范圍;將其與實際曲線進行對比,從而尋找出異常點。人工添加噪聲的時間序列數(shù)據(jù)測試證明了該算法的有效性。

本文建立了基于多判據(jù)融合的用電信息采集系統(tǒng)數(shù)據(jù)異常甄別模型,通過原型聚類法、密度聚類法、概率密度法和深度學習方法分別檢測,運用“4取2”方法交叉驗證,提高了異常點甄別檢出率,降低了異常點甄別的誤判率,提升了模型的異常點甄別能力,為運營檢測業(yè)務提供精確數(shù)據(jù)保障,有助于供電企業(yè)進行抄核收工作,減少用戶和供電企業(yè)經濟損失。

猜你喜歡
位數(shù)用電聚類
五次完全冪的少位數(shù)三進制展開
連續(xù)自然數(shù)及其乘積的位數(shù)分析
安全用電知識多
基于K-means聚類的車-地無線通信場強研究
對輸配電及用電工程的自動化運行的幾點思考
為生活用電加“保險”
用電安全要注意
基于高斯混合聚類的陣列干涉SAR三維成像
基于Spark平臺的K-means聚類算法改進及并行化實現(xiàn)
基于改進的遺傳算法的模糊聚類算法
景东| 始兴县| 庆城县| 武隆县| 大丰市| 永胜县| 青阳县| 汨罗市| 清水县| 夏津县| 镇坪县| 西藏| 汾西县| 宁安市| 东辽县| 嘉兴市| 孝感市| 丘北县| 潞西市| 延津县| 兴宁市| 渝北区| 诸城市| 遂川县| 穆棱市| 大港区| 平果县| 安丘市| 宣威市| 南宫市| 潮州市| 隆林| 崇明县| 开江县| 翼城县| 博白县| 微博| 华安县| 当涂县| 河池市| 博兴县|