馬一寧,余少鋒,鐘建栩,席凌之,廖崇陽
(1.南方電網(wǎng)能源發(fā)展研究院有限責任公司,廣東廣州 510000;2.南方電網(wǎng)調(diào)峰調(diào)頻發(fā)電有限公司信息通信分公司,廣東 廣州 510000)
時間序列模型也叫動態(tài)數(shù)列模型,是指能夠?qū)⑼唤y(tǒng)計指標數(shù)值按照發(fā)生時間的先后順序進行排列的數(shù)據(jù)處理模型。在實際應用過程中,時間序列預測注重分析已有數(shù)據(jù)的歷史變化趨勢,并可在綜合下級統(tǒng)計變量的同時,推測數(shù)值指標的后續(xù)變化形式[1-2]。在時間序列模型的作用下,待選取數(shù)據(jù)的排列行為始終滿足隨機變量原則,即為使變量指標之間的映射連接關系不受影響,默認時間序列模型認知下,有且僅有一個數(shù)據(jù)變量能夠完全滿足另一個數(shù)據(jù)變量的預測計算需求。
電力異常大數(shù)據(jù)是一種非常規(guī)的電信號數(shù)據(jù)參量,能夠與常規(guī)電信號數(shù)據(jù)融合在一起,但前者的連續(xù)性負荷特征較為明顯,會導致電信號負荷曲線出現(xiàn)過度波動的表現(xiàn)形式[3]。為準確預測包含電力異常大數(shù)據(jù)的信號負荷曲線的變化規(guī)律,傳統(tǒng)改進分段式檢測方法通過確定異常值坐標的方式,計算明顯波動特征在連續(xù)負荷曲線中所占比重,再聯(lián)合標準預測模型,實現(xiàn)對電量異常大數(shù)據(jù)的檢測與處理[4]。然而在異常大數(shù)據(jù)節(jié)點數(shù)量相對較多的情況下,此方法對于信號負荷曲線變化規(guī)律的預測準確性則相對有限,這就使得電網(wǎng)主機對連續(xù)性電量信號的精準檢測能力受到了較大影響。為解決上述問題,提出基于時間序列預測的新型電力異常大數(shù)據(jù)檢測算法。
在時間序列預測模型的作用下,電力異常數(shù)據(jù)修正包含降維預測系數(shù)計算、離散化修正權限確定等多個執(zhí)行步驟,具體研究方法如下。
對于電力網(wǎng)絡環(huán)境而言,時間序列模型中的所有指標數(shù)值都具有可加性,且序列組織中每一個指標數(shù)值的大小都與其所反映預測周期的表現(xiàn)時長有直接映射關系。因此在實際應用過程中,為使所有電力異常大數(shù)據(jù)都得到準確標注與記錄,應使時間序列模型中所有變量數(shù)據(jù)之間的數(shù)值映射關系都保持穩(wěn)定存在的狀態(tài)[5-6]。設r、i表示兩個不同的電力異常大數(shù)據(jù)編碼系數(shù),f表示基于時間序列的電量信號預測指標,αr表示編碼系數(shù)為r時的數(shù)據(jù)序列參量,αi表示編碼系數(shù)為i時的數(shù)據(jù)序列參量。聯(lián)立上述物理量,可將電力異常大數(shù)據(jù)的時間序列模型表示為:
式中,wr表示編碼系數(shù)為r時的電力異常大數(shù)據(jù)預測權限,wi表示編碼系數(shù)為i時的電力異常大數(shù)據(jù)預測權限。為使電力異常數(shù)據(jù)修正結果具有真實參考價值,在建立時間序列模型時,應選取大量的大數(shù)據(jù)信息作為變量指標。
在時間序列模型中,降維預測系數(shù)決定了電力異常大數(shù)據(jù)變量的實際分布情況。一般來說,降維預測系數(shù)的物理取值越大,就表示電力異常大數(shù)據(jù)變量之間的間隔距離越大;反之,降維預測系數(shù)的物理取值越小,就表示電力異常大數(shù)據(jù)變量之間的間隔距離越小[7-8]。假定d1、d2表示兩個隨機選取的電力異常大數(shù)據(jù)標度參量,且d1≠d2的不等式條件恒成立。設a表示最小的電力異常大數(shù)據(jù)降維系數(shù),φ表示常規(guī)電量數(shù)據(jù)的預測權限值,βa表示電力異常大數(shù)據(jù)的預測權限值。在上述物理量的支持下,聯(lián)立式(1),可將降維預測系數(shù)計算表達式定義為:
在時間序列預測模型中,降維預測系數(shù)能夠影響電力異常大數(shù)據(jù)與常規(guī)電量數(shù)據(jù)之間的分布配比關系。
如果將常規(guī)電量數(shù)據(jù)看作核心預測變量、將電力異常大數(shù)據(jù)看作干擾預測變量,則可認為只有在已知離散化修正權限條件的基礎上,才可以得到較為準確的數(shù)據(jù)指標檢測處理結果[9-10]。規(guī)定表示一個已定義的常規(guī)電量數(shù)據(jù),且指標的取值始終屬于[1,e)的物理區(qū)間。表示電力主機在單位時間內(nèi)所能記錄的常規(guī)電量數(shù)據(jù)均值,c0表示電力異常大數(shù)據(jù)離散化分布系數(shù)的初始取值,A表示一個已定義的電力異常大數(shù)據(jù),l表示基于時間序列預測模型的電量數(shù)據(jù)修正配比系數(shù),μ表示既定的電量數(shù)據(jù)修正定標特征。在上述物理量的支持下,聯(lián)立式(2),可將基于時間序列預測的電力異常大數(shù)據(jù)離散化修正權限表達式定義為:
對于電力異常大數(shù)據(jù)來說,只有在離散化修正權限取值結果保持為恒定物理數(shù)值的情況下,才可以實現(xiàn)對常規(guī)電量數(shù)據(jù)傳輸行為的準確預測。
根據(jù)時間序列預測模型的定義條件,建立完整的Hadoop 預測平臺,再按照電力大數(shù)據(jù)異常特征值計算、并行檢測強度確定的執(zhí)行流程,實現(xiàn)基于時間序列預測的電力異常大數(shù)據(jù)檢測算法的設計與應用。
Hadoop 平臺負責對電力異常大數(shù)據(jù)進行實時檢測,并可以在時間序列預測模型的作用下,干擾常規(guī)電量數(shù)據(jù)、電力異常大數(shù)據(jù)之間的分布配比關系,從而使得電力主機能夠準確分辨出異常節(jié)點處的電信號的輸入與輸出行為能力,進而最大化避免異常數(shù)據(jù)指標對常規(guī)數(shù)據(jù)指標的影響[11-12]。具體的Hadoop 預測平臺連接結構如圖1 所示。
圖1 Hadoop預測平臺連接結構
在Hadoop 預測平臺中,Hbase、Hlive、Sqoop 結構同時存在于應用集群內(nèi)部,可以將已輸入的常規(guī)電量數(shù)據(jù)與電力異常大數(shù)據(jù)分離開來,從而節(jié)省電網(wǎng)主機檢測電信號負荷曲線變化規(guī)律所需的消耗時長。
電力大數(shù)據(jù)的異常特征值決定了電網(wǎng)主機對于電力異常大數(shù)據(jù)指標的檢測與判別能力,在時間序列預測模型的影響下,該項物理指標的取值結果會在(-∞,+∞)的物理區(qū)間內(nèi)不斷波動,直到其數(shù)值水平在一個既定數(shù)值兩端的波動幅度完全相等。一般來說,為避免大量運算步驟對電力異常大數(shù)據(jù)信號負荷曲線變化規(guī)律造成影響,規(guī)定該穩(wěn)定系數(shù)項為電力大數(shù)據(jù)異常特征值的近似取值結果[13-14]。設λ表示電力大數(shù)據(jù)的異常行為系數(shù),表示異常電量指標的穩(wěn)定波動頻率,ΔT表示電量信號的單位波動周期。聯(lián)立上述物理量,可將基于時間序列預測模型的電力大數(shù)據(jù)異常特征值計算表達式定義為:
受到時間序列預測模型的影響,規(guī)定電力大數(shù)據(jù)異常特征值指標的實際取值越大,異常電力信號與常規(guī)電量信號之間的表現(xiàn)差異性也就越強。
并行檢測強度計算是電力異常大數(shù)據(jù)檢測算法設計的關鍵執(zhí)行環(huán)節(jié),能夠在異常特征值指標的基礎上,對常規(guī)電量信號與異常電力信號進行準確區(qū)分。一般來說,并行檢測強度參量的物理取值越大,就表示時間序列預測模型對于電力異常大數(shù)據(jù)的區(qū)分準確性越高,此時電網(wǎng)主機所得到的電信號檢測結果也就越符合實際應用需求[15-16]。設θc表示異常特征為c時的電力信號傳輸向量,ξ表示既定的電力異常大數(shù)據(jù)標記系數(shù),v1、v2、…、vn表示n個不同的電力異常大數(shù)據(jù)并行傳輸權限,n表示時間序列條件下的電力大數(shù)據(jù)最大預測權限,x表示既定的電力信號檢測標度參量。在上述物理量的支持下,聯(lián)立式(4),可將并行檢測強度表達式定義為:
至此,完成對各項指標參量的計算與處理,在保障時間序列模型作用權限的前提下,實現(xiàn)新型電力異常大數(shù)據(jù)檢測算法的順利應用。
在應用電網(wǎng)中,常規(guī)電力數(shù)據(jù)信號負荷曲線的變化趨勢相對較為平緩,其區(qū)域性極大值與區(qū)域性極小值之間的物理差值水平相對較低。如果常規(guī)電力數(shù)據(jù)與電力異常大數(shù)據(jù)混合在一起,異常信號節(jié)點處的信號負荷曲線則會出現(xiàn)明顯波動的變化情況,此時整條電力數(shù)據(jù)信號負荷曲線的變化趨勢都會受到影響。
電網(wǎng)主機對于包含電力異常大數(shù)據(jù)的信號負荷曲線的預測準確性,反映了主機元件對于連續(xù)性電量信號的精準檢測能力,通常情況下,電網(wǎng)主機所預測出的包含電力異常大數(shù)據(jù)的信號負荷曲線越貼合給定曲線的變化規(guī)律,則表示主機元件對于連續(xù)性電量信號的精準檢測能力越強。
圖2 給出了一組標準的包含電力異常大數(shù)據(jù)的信號負荷曲線。
圖2 標準信號負荷曲線
分析圖2 可知,在標準曲線中,信號負荷值的明顯波動狀態(tài)存在于第40-60 min 與第80-100 min 的實驗區(qū)段之內(nèi),前者的極限負荷差值為2 249 MW,后者的極限負荷差值為2 765 MW,即在80-100 min的實驗區(qū)段內(nèi),電力異常大數(shù)據(jù)對于常規(guī)電力數(shù)據(jù)的影響能力相對較強。
選取基于時間序列預測的電力異常大數(shù)據(jù)檢測算法、改進分段式檢測算法作為實驗組、對照組的檢測應用技術。分別利用實驗組、對照組的應用方法對電力信號進行檢測,在對實驗組、對照組檢測信號進行簡單區(qū)分后,將其與給定的包含電力異常大數(shù)據(jù)的信號負荷曲線進行對比,如圖3 所示。
圖3 信號負荷值的實驗曲線
實驗組:實驗組信號負荷曲線的變化規(guī)律始終與標準信號負荷曲線保持一致,在第40~60 min 的實驗區(qū)段內(nèi),實驗組信號負荷的極限差值為2 200 MW,略小于理想極限負荷差值;在第80~100min 的實驗區(qū)段內(nèi),實驗組信號負荷的極限差值為3 000 MW,大于理想極限負荷差值。
對照組:對照組信號負荷曲線的變化規(guī)律則并不能與標準信號負荷曲線保持一致,在電力異常大數(shù)據(jù)的影響下,在第40~60 min 的實驗區(qū)段內(nèi),對照組信號負荷的極限差值為1 300 MW,遠小于理想極限負荷差值;在第80~100 min 的實驗區(qū)段內(nèi),對照組信號負荷的極限差值為2 400 MW,小于理想極限負荷差值。
在基于時間序列預測的電力異常大數(shù)據(jù)檢測方法的作用下,電網(wǎng)主機所預測出的包含電力異常大數(shù)據(jù)的信號負荷曲線能夠較好貼合給定曲線的變化規(guī)律,符合精準檢測連續(xù)性電量信號的實際應用需求。
新型電力異常大數(shù)據(jù)檢測電力異常大數(shù)據(jù)檢測方法在時間序列預測模型的基礎上,對離散化修正權限的作用能力進行約束,再借助Hadoop 平臺,確定電力大數(shù)據(jù)異常特征值的具體計算結果,從而使得并行檢測強度的物理數(shù)值更貼近實際應用需求。實用結果顯示,與改進分段式檢測方法相比,在時間序列預測模型的作用下,電網(wǎng)主機所預測出的包含電力異常大數(shù)據(jù)的信號負荷曲線能夠更好貼合給定曲線的變化規(guī)律,對于連續(xù)性電量信號的精準檢測確實起到了促進性影響作用。