谷海彤 陳邵華 吳曉強(qiáng) 蔡妙?yuàn)y 崔卓 曾小林
摘 要:針對(duì)電能量數(shù)據(jù)缺失值處理技術(shù),提出一種引入時(shí)間序列的基于貝葉斯常均值模型的數(shù)據(jù)增廣算法(DA多重插補(bǔ)法).應(yīng)用期望最大算法(EM插補(bǔ)算法)計(jì)算缺失值的插補(bǔ)值,將得到的插補(bǔ)值作為插補(bǔ)的初始值,然后根據(jù)電能量數(shù)據(jù)隨時(shí)間變化的特點(diǎn),構(gòu)建基于常均值模型的多重插補(bǔ)模型,利用貝葉斯方法預(yù)測(cè)每個(gè)缺失值的多次插補(bǔ)值,綜合分析觀測(cè)誤差方差和狀態(tài)誤差方差得到最終插補(bǔ)值,從而得到多個(gè)完整數(shù)據(jù)集合.在不同缺失率的條件下,通過與EM插補(bǔ)結(jié)果,以及與基于貝葉斯線性回歸的DA多重插補(bǔ)結(jié)果相比較,得出改進(jìn)的插補(bǔ)方法比所預(yù)測(cè)的誤差更低,波動(dòng)更小,插補(bǔ)結(jié)果更穩(wěn)定的結(jié)論,有效提高電能量缺失數(shù)據(jù)的插補(bǔ)精度.
關(guān)鍵詞:貝葉斯常均值模型;DA多重插補(bǔ)法;電能量數(shù)據(jù)缺失
中圖分類號(hào):TM71 文獻(xiàn)標(biāo)志碼:A
0 引言
電網(wǎng)數(shù)據(jù)處理應(yīng)用中,電能量數(shù)據(jù)質(zhì)量的校驗(yàn)及處理是電網(wǎng)大數(shù)據(jù)處理業(yè)務(wù)的一個(gè)重要環(huán)節(jié),其中,電能量數(shù)據(jù)的缺失,會(huì)導(dǎo)致有用信息的丟失,給電網(wǎng)企業(yè)后續(xù)的各種數(shù)據(jù)處理及應(yīng)用帶來嚴(yán)重影響;因此,為保證電網(wǎng)數(shù)據(jù)的完整性、有效性,提升電能量數(shù)據(jù)質(zhì)量,需要對(duì)缺失數(shù)據(jù)進(jìn)行插補(bǔ)以解決數(shù)據(jù)缺失問題.
傳統(tǒng)的電能量缺失數(shù)據(jù)插補(bǔ)方法主要是利用均值、眾數(shù)等統(tǒng)計(jì)量進(jìn)行替代,但電能量數(shù)據(jù)波動(dòng)大或缺失嚴(yán)重時(shí),這些處理方法的誤差不可控且效果欠佳.針對(duì)這類問題,已有專家學(xué)者進(jìn)行了相應(yīng)研究,以期找到更符合電能量數(shù)據(jù)規(guī)律的插補(bǔ)方法.文獻(xiàn)[1]中介紹了一種基于遺傳優(yōu)化算法的電網(wǎng)缺失數(shù)據(jù)填補(bǔ)方法,該方法考慮電能量數(shù)據(jù)的歷史信息,借助遺傳算法優(yōu)化多重插補(bǔ)的參數(shù),尋找最優(yōu)的插補(bǔ)值.但該方法將電能量數(shù)據(jù)視為平穩(wěn)序列,未考慮其時(shí)間波動(dòng)特性,從而導(dǎo)致插補(bǔ)效果不理想,因?yàn)橛秒姼叻搴陀秒姷凸葧r(shí)電能量數(shù)據(jù)顯然是非平穩(wěn)的.
在電能量缺失數(shù)據(jù)處理中,將時(shí)間序列引入多重插補(bǔ)是行之有效的方法.本論文將EM(Expectation Maximization)插補(bǔ)[2]及DA(Data Augmentation)多重插補(bǔ)相結(jié)合,提出一種基于貝葉斯常均值模型的DA多重插補(bǔ)方法.該方法根據(jù)電能量數(shù)據(jù)隨時(shí)間變化的特點(diǎn),構(gòu)建基于常均值模型的DA多重插補(bǔ)模型,通過貝葉斯方法預(yù)測(cè)缺失數(shù)據(jù)的多個(gè)插補(bǔ)值,以尋找更符合電能量數(shù)據(jù)時(shí)間波動(dòng)性質(zhì)的插補(bǔ)值,提高電能量數(shù)據(jù)的完整性及有效性.
1 方法介紹
1.1 EM插補(bǔ)計(jì)算初始值
記一個(gè)完全數(shù)據(jù)集Y=(y1,y2,…,yT)為T個(gè)時(shí)期的電能量數(shù)據(jù),其中Yobs為觀測(cè)數(shù)據(jù)集,Ymis為缺失數(shù)據(jù)集,即Y=(Yobs,Ymis).
EM插補(bǔ)運(yùn)用缺失數(shù)據(jù)和模型參數(shù)之間的迭代關(guān)系[3]:假定模型參數(shù),并在此基礎(chǔ)上獲得缺失數(shù)據(jù)的估計(jì)值,利用該估計(jì)值修正模型參數(shù),由此不斷迭代,直到模型參數(shù)值收斂.EM插補(bǔ)算法每一次迭代都由以下兩步來完成:
E步:E步是在給定觀測(cè)Yobs與當(dāng)前參數(shù)估計(jì)值的基礎(chǔ)上,得到完全數(shù)據(jù)對(duì)數(shù)似然函數(shù)lnp(Yobs,Ymis│?茲)關(guān)于缺失數(shù)據(jù)Ymis的期望:
g(?茲│?茲i,Yobs)=E[lnp(Yobs,Ymis│?茲)│Yobs,?茲i]=lnp(Ymis,Yobs│?茲)f(Ymis│?茲i,Yobs)dYmis(1)
其中?茲i為已知的當(dāng)前參數(shù)的估計(jì)值,Yobs與?茲i為常數(shù),?茲為待優(yōu)化的參數(shù),f(Ymis│?茲i,Yobs)是缺失數(shù)據(jù)Ymis的邊緣密度函數(shù),并依附于觀測(cè)數(shù)據(jù)和當(dāng)前參數(shù)?茲i,D為Ymis的取值空間.
Ymis為一隨機(jī)變量,并假設(shè)它服從分布:
f(Ymis│?茲i,Yobs)=f(Ymis,Yobs│?茲i)/f(Yobs│?茲i), (2)
f(Yobs│?茲i)與?茲無關(guān),則對(duì)數(shù)似然函數(shù)的期望為:
g(?茲│?茲i,Yobs)=lnp(Ymis,Yobs│?茲)f(Ymis,Yobs│?茲i)dYmis(3)
M步:M步是最大化期望值g(?茲│?茲i,Yobs),即找到一個(gè)?茲(i+1),滿足:
?茲(i+1)=argg(?茲│?茲i,Yobs)
其中?專代表參數(shù)空間.
1.2 構(gòu)造基于常均值模型的DA插補(bǔ)模型
常均值模型[4]為時(shí)間序列模型,其應(yīng)用范圍廣且算法簡(jiǎn)潔,對(duì)于完全數(shù)據(jù)集Y構(gòu)造的常均值模型為:
觀測(cè)方程:Yt=?滋t+vt,vt~Np(0,Vt),t=1,2,…,T (4)
狀態(tài)方程:?滋t=?滋t-1+wt,wt~Np(0,Wt) (5)
初始信息:?滋0│D0~Np(m0,c0) (6)
在式(4)中,Yt為t時(shí)刻的觀測(cè)值向量, ?滋t為t時(shí)刻的期望向量,vt為t時(shí)刻的觀測(cè)誤差,是一個(gè)協(xié)方差矩陣為Vt的零均值正態(tài)分布.動(dòng)態(tài)正態(tài)模型與傳統(tǒng)的靜態(tài)正態(tài)模型的不同之處在于,期望向量被看做是隨時(shí)間變化而變化的隨機(jī)變量.在式(5)中,?滋t相對(duì)于?滋t-1有一個(gè)狀態(tài)誤差,其分布為正態(tài)、零均值、協(xié)方差矩陣Wt.觀測(cè)和狀態(tài)誤差序列vt和wt相互獨(dú)立,且在不同的時(shí)刻每一序列內(nèi)部之間相互獨(dú)立.當(dāng)Wt=0時(shí),狀態(tài)方程轉(zhuǎn)化為恒等式,動(dòng)態(tài)正態(tài)模型轉(zhuǎn)化為靜態(tài)正態(tài)模型.
1.3 進(jìn)行貝葉斯預(yù)測(cè)獲得插補(bǔ)值
記t時(shí)刻的信息集Dt=Y′,Dt-1,t時(shí)刻缺失時(shí)Y′需用插補(bǔ)值代替Yt中的缺失值,不缺失時(shí)為觀測(cè)值,參數(shù)為?茲t=?滋t,Vt,參數(shù)空間為?專t.
基于常均值模型進(jìn)行貝葉斯預(yù)測(cè)的基本思想是[5]:首先根據(jù)(t-1)時(shí)刻的后驗(yàn)分布p(?茲t-1│Dt-1),求先驗(yàn)分布p(?茲t│Dt-1),若t時(shí)刻有數(shù)據(jù)缺失,則求預(yù)測(cè)分布p(Ymis,t│Dt-1),數(shù)據(jù)缺失變量的預(yù)測(cè)值作為插補(bǔ)值,然后求后驗(yàn)分布p(?茲t│Dt).以上過程隨時(shí)間推移不斷進(jìn)行遞推修正,具體如圖1所示.
插補(bǔ)后的數(shù)據(jù)依舊滿足常均值模型,在觀測(cè)誤差方差Vt和Wt狀態(tài)誤差方差已知的基礎(chǔ)上,遞推修正的過程如下:
Step1 (t-1)時(shí)刻的后驗(yàn)如下:
?滋t-1│Vt-1,Dt-1~Np(mt-1,ct-1);(7)
Step2 t時(shí)刻先驗(yàn)分布如下:
p(?茲t│Dt-1)=p(?茲t│?茲t-1,Dt-1)dF(?茲t-1│Dt-1)=p(?茲t│?茲t-1)p(?茲t-1│Dt-1)d?茲t-1,(8)
?滋t│Vt,Dt-1~Np(mt-1,Ct-1+Wt);(9)
Step3 t時(shí)刻缺失時(shí)預(yù)測(cè)分布如下:
p(Ymis,t│Dt-1)=p(Ymis,t│?茲t)dF(?茲t│Dt-1), (10)
Ymis,t│Dt-1~Np(mt-1,p,Ct-1+Wt+Vt),(11)
p(Y't│Dt-1)p(?茲t│Dt)=p(Y't│?茲t,Dt-1)p(?茲t│Dt-1);(12)
Step4 t時(shí)刻后驗(yàn)分布如下:
p(?茲t│Dt)∝p(Y't│?茲t,Dt-1)p(?茲t│Dt-1)=p(Y't│?茲t)p(?茲t│Dt-1),(13)
?滋t│Dt~Np(mt,Ct);(14)
其中:mt=mt-1+At(Y't-mt-1),Ct=Ct-1+Wt-At A'(Ct-1+Wt+Vt),At=(Ct-1+Wt)(Ct-1+Wt+Vt)-1. mt=(1-At)mt-1+AtY't,表明水平的后驗(yàn)估計(jì)mt是先驗(yàn)估計(jì)mt-1和觀測(cè)值Y't的加權(quán)平均[6],當(dāng)先驗(yàn)分布比似然分布更集中時(shí),At更接近0;當(dāng)似然分布比先驗(yàn)分布更集中式,At更接近1.
當(dāng)t時(shí)刻數(shù)據(jù)缺失時(shí),從預(yù)測(cè)分布和后驗(yàn)分布抽取樣本,抽取過程包括如下重復(fù)兩個(gè)步驟:
I步:從p(Ymis,t│Dt-1, ?滋)中抽取Y;
P步:從p(?滋t│Dt-1,Y)中抽取?滋.
結(jié)合EM插補(bǔ)得出的初始值形成一條MCMC鏈,該鏈?zhǔn)諗恳粋€(gè)穩(wěn)定分布,從收斂的分布中隨機(jī)抽取樣本,替代t時(shí)刻缺失數(shù)據(jù).對(duì)全部時(shí)刻的觀測(cè)數(shù)據(jù)做貝葉斯預(yù)測(cè),計(jì)算預(yù)測(cè)誤差,改變觀測(cè)誤差方差Vt和狀態(tài)誤差方差Wt,重復(fù)預(yù)測(cè),尋找預(yù)測(cè)誤差最小的Vt和Wt,此時(shí)插補(bǔ)的數(shù)據(jù)為最終插補(bǔ)數(shù)據(jù).
上述方法為本論文提出的基于貝葉斯常均值模型的DA多重插補(bǔ)法,根據(jù)電能量缺失數(shù)據(jù)提供一個(gè)實(shí)例進(jìn)行詳細(xì)說明.
2 在電能量缺失數(shù)據(jù)中的應(yīng)用與分析
現(xiàn)有一個(gè)電能量缺失數(shù)據(jù)集Y0,為某用戶2016-01-01至2016-01-31日共31天744條記錄的A相電流數(shù)據(jù),電流數(shù)據(jù)具有周期性.該數(shù)據(jù)集在時(shí)間為2016-01-01 1:00,2016-01-01 11:00及2016-01-02 14:00時(shí)A相電流缺失,為驗(yàn)證算法在不同缺失情況下的插補(bǔ)效果,在此缺失基礎(chǔ)上,隨機(jī)構(gòu)造缺失率為10%,15%,20%,25%,30%的電能量數(shù)據(jù)集,用于計(jì)算插補(bǔ)誤差并對(duì)比不同缺失條件下算法的穩(wěn)健性.用缺失率為20%的該電能量數(shù)據(jù)集Y為例,說明算法的具體實(shí)施過程,缺失數(shù)據(jù)集Y的部分?jǐn)?shù)據(jù)如表1所示.
將該電能量數(shù)據(jù)集中的觀測(cè)數(shù)據(jù)集表示為Yobs,缺失數(shù)據(jù)集表示為Ymis,即Y=(Yobs,Ymis).
2.1 EM插補(bǔ)作初始值
利用數(shù)據(jù)集Y使用EM插補(bǔ)計(jì)算電能量數(shù)據(jù)缺失值的插補(bǔ)值.作為DA多重插補(bǔ)的初始參數(shù)值.根據(jù)前文所述的EM插補(bǔ)算法,得到插補(bǔ)后完整數(shù)據(jù)集Yem,部分結(jié)果如表2所示.計(jì)算該數(shù)據(jù)集的期望?滋0=0.87,作為常均值模型的初始信息.
其中,根據(jù)電能量數(shù)據(jù)的相關(guān)特性,該用戶A相電流的額定電流為5 A,因此設(shè)置當(dāng)前參數(shù)?茲 i=5,Ymis的取值空間D∈[0,5].
2.2 貝葉斯常均值模型的計(jì)算
構(gòu)建基于時(shí)間序列的多重插補(bǔ)模型,觀測(cè)數(shù)據(jù)服從常均值模型,把缺失時(shí)間對(duì)缺失值大小的影響表現(xiàn)出來.根據(jù)2.1所得的完全數(shù)據(jù)集Yem,及其期望?滋0,作為常均值模型的初始信息,構(gòu)造出完全數(shù)據(jù)集Y的常均值模型,利用該模型作為后續(xù)DA多重插補(bǔ)的插補(bǔ)模型.
對(duì)于完全數(shù)據(jù)集Y構(gòu)造的常均值模型為:
觀測(cè)方程:Yt=?滋t+vt,vt~Np(0,0.05),t=1,2,…,744(15)
狀態(tài)方程:?滋t=?滋t-1+wt,wt~Np(0,0.005)(16)
初始信息:?滋0│D0~Np(m0,C0)(17)
其中,根據(jù)電網(wǎng)數(shù)據(jù)的特性,額定電流為5 A的A相電流數(shù)據(jù),其觀測(cè)值在額定電流的±0.05范圍內(nèi)波動(dòng)屬于正常值,由此設(shè)置觀測(cè)誤差vt~Np(0,0.05),t=1,2,…,744,狀態(tài)誤差wt~Np(0,0.005).
2.3 DA多重插補(bǔ)結(jié)果
根據(jù)2.2建立的貝葉斯常均值模型,從分布vt~Np(0,0.05)及wt~Np(0,0.005)隨機(jī)抽取觀測(cè)誤差vt及狀態(tài)誤差wt;再利用貝葉斯方法預(yù)測(cè)每個(gè)缺失值的多次插補(bǔ)值,本次實(shí)例重復(fù)預(yù)測(cè)10次,得到10個(gè)完整數(shù)據(jù)集合Ypre_i,i=1,2,3,…,10;找到使預(yù)測(cè)誤差最小的觀測(cè)誤差方差Vt和狀態(tài)誤差方差Wt,此時(shí)插補(bǔ)的數(shù)據(jù)為最終插補(bǔ)值.
經(jīng)過10次預(yù)測(cè)后,預(yù)測(cè)出的缺失數(shù)據(jù)部分結(jié)果及部分原始數(shù)據(jù)如表3所示.
由表3中10次插補(bǔ)的預(yù)測(cè)值Ypre_i,i=1,2,3,…,10,結(jié)合前文所述該電能量數(shù)據(jù)集Y0,計(jì)算該電能量數(shù)據(jù)集的絕對(duì)預(yù)測(cè)誤差E,并綜合絕對(duì)預(yù)測(cè)誤差計(jì)算平均絕對(duì)誤差EMAE,以查看預(yù)測(cè)效果,具體計(jì)算公式如下:
E=,i=1,2,3,…,744(18)
EMAE= (19)
其中,Y0為電能量數(shù)據(jù)的原始值,Ypre_i為電能量缺失數(shù)據(jù)的預(yù)測(cè)值.根據(jù)上述公式得出部分計(jì)算結(jié)果如表4所示.
根據(jù)表4,在缺失率為20%的條件下,從該DA多重插補(bǔ)法得到的10次插補(bǔ)結(jié)果中,綜合得到第2次預(yù)測(cè)的觀測(cè)誤差方差、狀態(tài)誤差方差,使得預(yù)測(cè)值的平均絕對(duì)誤差最小為0.12,因此選取第2次的插補(bǔ)數(shù)據(jù)為該電能量缺失數(shù)據(jù)最終確定的插補(bǔ)數(shù)據(jù).并且由表中對(duì)比可知,基于貝葉斯常均值模型的DA多重插補(bǔ)算法的絕對(duì)預(yù)測(cè)誤差、絕對(duì)平均誤差均明顯低于EM插補(bǔ)算法,插補(bǔ)效果更優(yōu).
2.4 不同缺失率下EM插補(bǔ)與DA多重插補(bǔ)對(duì)比
上述過程詳細(xì)描述了基于常均值模型的DA多重插補(bǔ)法在缺失率為20%的電能量數(shù)據(jù)集中的應(yīng)用,同理,將該過程同樣應(yīng)用于缺失率為10%,15%,25%,30%的電能量數(shù)據(jù)集,并對(duì)比EM插補(bǔ)與該方法在不同缺失率情況下的效果,結(jié)果對(duì)比如圖2所示.
從圖2可知,基于常均值模型的DA多重插補(bǔ)法的絕對(duì)平均誤差更低,不同缺失率之間的誤差波動(dòng)更小,效果更穩(wěn)定.由此證明該方法在不同缺失率下,較EM插補(bǔ)法在電網(wǎng)缺失數(shù)據(jù)的應(yīng)用中效果更優(yōu)越.
2.5 基于不同模型的DA多重插補(bǔ)對(duì)比
為了進(jìn)一步衡量與比較經(jīng)過改善后,基于貝葉斯常均值模型DA多重插補(bǔ)對(duì)電網(wǎng)缺失數(shù)據(jù)的插補(bǔ)效果.利用基于貝葉斯線性回歸的DA多重插補(bǔ)對(duì)同一批缺失率為20%的數(shù)據(jù),同樣利用EM插補(bǔ)算法計(jì)算初始值進(jìn)行插補(bǔ),計(jì)算絕對(duì)預(yù)測(cè)誤差和平均預(yù)測(cè)誤差.兩種DA多重插補(bǔ)的結(jié)果比較如圖3所示.
從圖3可以看出,基于貝葉斯常均值模型的DA多重插補(bǔ)均值更低,方差更小,預(yù)測(cè)結(jié)果更穩(wěn)定,進(jìn)一步證明該方法在電網(wǎng)數(shù)據(jù)中應(yīng)用的優(yōu)越性.
因此,將該方法應(yīng)用于實(shí)際電網(wǎng)缺失數(shù)據(jù)中以查看效果,取某用戶2016-01-18至2016-01-24即周一至周日共7天168條A相電流記錄,其中該記錄缺失率為21%,運(yùn)用該方法得到插補(bǔ)結(jié)果如圖4所示.
從圖4中可看出.該用戶的A相電流具有周期性,工作日的電流隨時(shí)間的波動(dòng)較大休息日波動(dòng)較穩(wěn)定.基于常均值模型的DA多重插補(bǔ)結(jié)果曲線與原數(shù)據(jù)曲線較吻合,且很好地描繪了原數(shù)據(jù)的周期性,體現(xiàn)了該方法充分考慮電能量數(shù)據(jù)時(shí)間波動(dòng)性的優(yōu)點(diǎn),及應(yīng)用于電網(wǎng)缺失數(shù)據(jù)中的優(yōu)越性.
3 結(jié)論
電能量缺失數(shù)據(jù)處理對(duì)保證電網(wǎng)數(shù)據(jù)質(zhì)量及各種數(shù)據(jù)處理的準(zhǔn)確性有著積極的意義.本研究利用貝葉斯常均值模型作為DA多重插補(bǔ)模型,考慮電能量數(shù)據(jù)隨時(shí)間變化的性質(zhì),通過貝葉斯預(yù)測(cè)得到缺失數(shù)據(jù)的多個(gè)插補(bǔ)值,并綜合歷史數(shù)據(jù)及當(dāng)前信息的變化規(guī)律,尋找最優(yōu)的插補(bǔ)數(shù)據(jù).通過對(duì)某供電局電能量數(shù)據(jù)的實(shí)驗(yàn)及對(duì)比驗(yàn)證,得到了在不同缺失率條件下,基于貝葉斯常均值模型的DA多重插補(bǔ)方法較EM插補(bǔ)法的效果更穩(wěn)定,并且相比于基于線性回歸模型的多重插補(bǔ)方法,基于貝葉斯常均值模型的DA多重方法的效果更優(yōu)的結(jié)論.該方法應(yīng)用于電網(wǎng)數(shù)據(jù)中,充分考慮電能量數(shù)據(jù)的時(shí)間波動(dòng)特性,不僅準(zhǔn)確描述了電能量數(shù)據(jù)的短期變化,而且對(duì)長(zhǎng)期變化的表征也更加科學(xué),有效提高電網(wǎng)數(shù)據(jù)質(zhì)量.
參考文獻(xiàn)
[1] 王一蓉,王瑞杰,陳文剛,等.基于遺傳優(yōu)化的調(diào)控系統(tǒng)缺失數(shù)據(jù)填補(bǔ)算法[J].電力系統(tǒng)保護(hù)與控制,2016,44(21):182-186.
[2] GUO X,LI Q Y,XU W L,et al.Acceleration of the EM algorithm using the vector aitken method and its steffensen form[J].Acta Mathematicatae Applicatae Sinica English,2017,33(1):175-182.
[3] 龐新生.缺失數(shù)據(jù)多重插補(bǔ)處理方法的算法實(shí)現(xiàn)[J].統(tǒng)計(jì)與決策,2012(11):88-90.
[4] 張聰慧,楊明.貝葉斯動(dòng)態(tài)模型在煤礦事故預(yù)測(cè)中的應(yīng)用研究[J].中國(guó)安全生產(chǎn)科學(xué)技術(shù),2014,10(S1):254-258.
[5] 盧艷紅.貝葉斯常均值模型狀態(tài)誤差方差Wt的改進(jìn)及在能源預(yù)測(cè)中的應(yīng)用[D].上海:華東理工大學(xué),2013.
[6] 林開榮,徐新苗.貝葉斯統(tǒng)計(jì)在多片板簧可靠性設(shè)計(jì)中的應(yīng)用[J].廣西工學(xué)院學(xué)報(bào),2004,15(4):34-36.
Application of DA multiple interpolation in electric energy data missing
GU Hai-tong, CHEN Shao-hua,WU Xiao-qiang, CAI Miao-zhuang, CUI Zhuo, ZENG Xiao-lin*
(Guangzhou Power Supply Co., Ltd., Guangzhou 510620, China)
Abstract:In this paper, a DA multiple interpolation method introducing time series based on Bayesian mean value model is proposed to handle with missing data in electric energy data. Firstly, the EM interpolation algorithm is used to calculate the interpolation value of missing value, and the obtained interpolation value is taken as the initial value of the interpolation. Secondly, according to the characteristics of electric energy date changing over time, a multiple imputation model on the base of mean value model is constructed. Then, the multiple interpolation values of each missing value will be predicted by Bayesian method. The final error is obtained by comprehensive analysis of the observed error variance and the state error variance, and a number of complete data sets are finally obtained. In the condition of different data loss rate, compared with other results of EM interpolation and the DA interpolation based on Bayesian linear regression, it is obviously concluded that the improved interpolation method applied in this paper takes full account of the time fluctuation characteristics of electric energy data and is more objective as well as practical, besides, its interpolation result is more scientific and reasonable.
Key words: Bayesian mean value model; DA multiple interpolation method; lack of electrical energy data
(學(xué)科編輯:張玉鳳)