季金豹,袁曉峰,漢新宇,厲文秀,楊波
(1.國網(wǎng)山東省電力公司日照供電公司,山東 日照 276800;2.國網(wǎng)山東省電力公司五蓮縣供電公司,山東 日照 262300)
電力系統(tǒng)的數(shù)據(jù)收集與利用對電力系統(tǒng)的安全運行具有重要作用[1-3]。采用高質(zhì)量的數(shù)據(jù)對電力系統(tǒng)的生產(chǎn)運營和管理具有不可替代的作用,是電力調(diào)度自動化系統(tǒng)高質(zhì)量決策的重要保障[4-5]。然而,數(shù)據(jù)的準確性、時效性和完整性等受到調(diào)度自動化系統(tǒng)主子站通道數(shù)據(jù)傳輸?shù)挠绊懀?-7]。因此,在電力調(diào)度自動化系統(tǒng)中,數(shù)據(jù)篩選方法、數(shù)據(jù)質(zhì)量管理方法和評價方法被廣泛研究。
在辨識數(shù)據(jù)傳輸質(zhì)量的方法中,應(yīng)對多個數(shù)據(jù)傳輸通道進行綜合評價,篩選出數(shù)據(jù)傳輸質(zhì)量高的傳輸通道,提供最大可靠性的數(shù)據(jù)。文獻[8]提出了一種儲能電站接入電網(wǎng)的電能質(zhì)量評估分析方法,判斷數(shù)據(jù)是否在數(shù)據(jù)分布的置信區(qū)間內(nèi),從而完成數(shù)據(jù)質(zhì)量辨識。但是,基于分布的數(shù)據(jù)質(zhì)量評價對數(shù)據(jù)的規(guī)律性和數(shù)據(jù)量要求較高,并存在數(shù)據(jù)量大和數(shù)據(jù)分布不明顯的問題。文獻[9]利用相似性原理對數(shù)據(jù)進行橫向和縱向?qū)Ρ?,針對傳輸?shù)據(jù)的完整性和準確性等指標進行評估,確保數(shù)據(jù)傳輸質(zhì)量。文獻[10]根據(jù)密度聚類和相關(guān)性分析方法對電力系統(tǒng)數(shù)據(jù)進行分析。雖然通過數(shù)據(jù)的相似性能夠很好地進行數(shù)據(jù)的對比,但是大量傳輸數(shù)據(jù)橫向和縱向的對比對服務(wù)器的計算和處理能力是一個嚴峻的考驗。
文獻[11]通過灰色關(guān)聯(lián)分析數(shù)據(jù)的周期性規(guī)律,對數(shù)據(jù)進行重組,分析數(shù)據(jù)因通信損失、儀表故障等問題致使數(shù)據(jù)質(zhì)量下降的現(xiàn)象。文獻[12]采用基于灰色關(guān)聯(lián)分析和模糊聚類分析識別典型負荷曲線,辨識數(shù)據(jù)傳輸質(zhì)量,避免因信道錯誤、儀表故障、設(shè)備停運等因素導(dǎo)致的異常數(shù)據(jù)與缺失值?;疑P(guān)聯(lián)分析法能夠根據(jù)關(guān)聯(lián)度對專家的主觀賦權(quán)進行綜合評判,但是對于客觀上的評價,灰色關(guān)聯(lián)分析法無法給出。文獻[13]利用層次分析法、熵權(quán)法和CRITIC 法對數(shù)據(jù)進行多方面綜合評價,評估數(shù)據(jù)傳輸?shù)馁|(zhì)量。文獻[14]針對評價指標的主觀與客觀權(quán)重的權(quán)衡問題,構(gòu)建了基于層次分析法和指標相關(guān)性的方案評價方法。雖然,熵權(quán)法能夠針對不同的指標客觀地賦予權(quán)重,但是在當某一類指標數(shù)據(jù)偏離度較大的情況下,可能會造成對應(yīng)的權(quán)重也過大,從而導(dǎo)致其他指標被弱化的現(xiàn)象[15-16]。
針對灰色關(guān)聯(lián)分析只能應(yīng)對主觀賦權(quán)的問題,利用熵權(quán)法和自適應(yīng)線性神經(jīng)元算法確定指標的客觀賦權(quán),提出多屬性評價方法和D-S 證據(jù)推理的主觀和客觀證據(jù)融合推理方法,從而完成對主子站通道質(zhì)量的準確評價。該模型同時考慮不同的準則性質(zhì)和不同的主客觀風(fēng)險偏好,同時對多個數(shù)據(jù)通道指標綜合評價,以確保主子站通道數(shù)據(jù)傳輸質(zhì)量。對山東某地區(qū)的主子站傳輸進行仿真和分析,驗證本文所提模型的有效性。
為了量化主子站各數(shù)據(jù)傳輸通道的多方面性能以及對于數(shù)據(jù)傳輸通道的需求,從數(shù)據(jù)傳輸通道的穩(wěn)定性和可靠性兩個方面建立多屬性指標體系。
數(shù)據(jù)傳輸通道的穩(wěn)定性評價指標反映的是數(shù)據(jù)通道的數(shù)據(jù)帶載能力和數(shù)據(jù)傳輸穩(wěn)定程度,從傳輸通道的自身出發(fā),提出了通道延遲上送次數(shù)(Delayed Delivery,DD)、通道數(shù)據(jù)不刷新次數(shù)(Data Not Refreshed,DNR)和傳輸通道投退次數(shù)(Switch Fall,SF)作為主子站傳輸通道的穩(wěn)定性評價指標,并設(shè)三者指標值分別為IDD、IDNR和ISF。
不同的數(shù)據(jù)傳輸通道的DD、DNR 和SF 存在差異,IDD、IDNR和ISF的數(shù)值越小,則在數(shù)據(jù)傳輸?shù)倪^程中表示數(shù)據(jù)的帶載能力強,數(shù)據(jù)傳輸穩(wěn)定。因此在分析拓撲結(jié)構(gòu)時,DD、DNR和SF是很重要的指標,能夠反映電力系統(tǒng)主子站傳輸通道傳輸數(shù)據(jù)的能力。
電力系統(tǒng)主子站傳輸通道的可靠性指標是定量評價傳輸通道的基礎(chǔ),反應(yīng)數(shù)據(jù)傳輸中的異常狀態(tài)?;贗EEE 的主子站傳輸通道可靠性評價指標選取了3 個指標:平均跳變數(shù)據(jù)(Average Jumping Data,AJD)、異常數(shù)據(jù)數(shù)目(Number of Abnormal Data,NOAD)和平均異常數(shù)據(jù)出現(xiàn)次數(shù)(Average Frequency of Abnormal Data,AFOAD)建立可靠性指標體系,并設(shè)其指標值分別為IAJD、INOAD和IAFOAD。
1)AJD 反映的是電力系統(tǒng)中主子站因為網(wǎng)絡(luò)的傳輸bug 而產(chǎn)生數(shù)據(jù)跳變的平均水平。當電力系統(tǒng)主子站數(shù)據(jù)傳輸通道發(fā)生波動時,在低可靠性網(wǎng)架結(jié)構(gòu)中會造成數(shù)據(jù)跳變的情況,直到線路穩(wěn)定后數(shù)據(jù)恢復(fù)正常。因此在評價可靠性時,AJD 是一個比較有參考價值的指標,其指標值為
式中:NAJD為所有數(shù)據(jù)跳變次數(shù)的集合;μx為第x次跳變持續(xù)的時間;IAJD,x為第x次跳變的數(shù)據(jù)。
2)因為外部原因和網(wǎng)絡(luò)的設(shè)置不同,各種bug和數(shù)據(jù)亂碼的情況時有發(fā)生,導(dǎo)致數(shù)據(jù)傳輸序列中出現(xiàn)異常數(shù)據(jù)。出現(xiàn)異常數(shù)據(jù)時,各個數(shù)據(jù)傳輸通道的異常數(shù)據(jù)不同,因此利用NOAD 和AFOAD 來綜合衡量電力系統(tǒng)主子站傳輸通道數(shù)據(jù)傳輸?shù)目煽啃?。NOAD 反映的是電力系統(tǒng)主子站因外部擾動或者系統(tǒng)bug出現(xiàn)的異常數(shù)據(jù)數(shù)目,其指標值為
式中:NNOAD為所有異常數(shù)據(jù)跳變次數(shù)的集合;?x為第x次異常數(shù)據(jù)持續(xù)的時間;INOAD,x為第x次異常數(shù)據(jù)數(shù)目。
3)AFOAD反映的是電力系統(tǒng)主子站因外部擾動或者系統(tǒng)bug出現(xiàn)異常數(shù)據(jù)數(shù)目的平均水平,其指標值為
在實際工程中,多位專家對于傳輸通道數(shù)據(jù)質(zhì)量的評價方案存在差異化,因此需要對多位專家方案進行評估,確定最終統(tǒng)一的方案。采用數(shù)據(jù)處理速度快、計算簡便的K-means 算法對多專家意見進行聚類賦權(quán),對于所含方案數(shù)多的類型賦予一個較大的權(quán)重,相反則賦予一個較小的權(quán)重,使得方案的差異化能到充分評估。
假設(shè)有n個專家和m個評價指標,根據(jù)專家意見,構(gòu)建n×m的數(shù)據(jù)評價矩陣[17],如式(4)所示。
式中:zij為第i個專家所提供方案的第j個評價指標數(shù)值。
通過K-means 算法將所提需求方案分為k類,第b類方案的聚類中心和所含方案數(shù)分別為cb和Nb。為了充分準確評估各個專家方案對于整體方案的影響,計算各方案的占比權(quán)重。假設(shè)專家i所提方案屬于類別b,則該方案的權(quán)重可以表示為
對上述權(quán)重進行歸一化處理,即
雖然,K-means 算法具有計算速度快,工程應(yīng)用能力強的特點,但是在聚類時必須提前知道數(shù)據(jù)有多少類或組,不同的聚類數(shù)會直接影響聚類結(jié)果。因此,基于輪廓系數(shù)法,對K-means 算法進行改進,選出最優(yōu)的聚類數(shù)值k。
輪廓系數(shù)法的核心指標是輪廓系數(shù)(Silhouette Coefficient,SC),在類別b下的輪廓系數(shù)定義如式(6)所示。
式中:kPCH為凝聚度,表示專家l所提方案與同簇的其他方案的平均距離;kDOS為分離度,表示專家l所提方案與最近簇中所有樣本的平均距離。
式中:E(zi,z)l為專家l所提方案zl與同簇的其他方案zi的距離。
求出所有樣本的輪廓系數(shù)后再求平均值就得到了平均輪廓系數(shù)。平均輪廓系數(shù)的取值范圍為[-1,1],且簇內(nèi)樣本的距離越近,簇間樣本距離越遠,平均輪廓系數(shù)越大,聚類效果越好。因此,平均輪廓系數(shù)最大的k便是最佳聚類數(shù)。
基于熵權(quán)法的客觀賦權(quán)能夠根據(jù)信息的重要程度來確定客觀權(quán)重,熵值越小,表明信息量越多,相應(yīng)的權(quán)重也就越大[18]。首先,數(shù)據(jù)評價矩陣中指標值越大表示越優(yōu)秀指標定義為正向性指標,指標值越小表示越優(yōu)秀的指標定義為負向性指標。因此,正向性和負向性指標的計算過程如式(9)和式(10)所示。
對正向性和負向性指標進行歸一化處理,歸一化后的第i個樣本的第j項指標表示為
第j個指標的熵值ej表示為
式中:K=1/lnm。如果pij=0,則定義
因此,熵權(quán)值的表達式表示為
熵權(quán)法能夠針對多個指標確定指標權(quán)重,但是可能會出現(xiàn)一類指標數(shù)據(jù)值離散程度大,從而導(dǎo)致指標的權(quán)重值過大,致使其他類型指標權(quán)重值偏小,出現(xiàn)數(shù)據(jù)淹沒現(xiàn)象,嚴重影響數(shù)據(jù)分析?;谧赃m應(yīng)線性神經(jīng)元算法將熵值法確定的指標初始權(quán)重作為自適應(yīng)線性神經(jīng)元算法的初始權(quán)重,通過迭代校正確定數(shù)據(jù)指標權(quán)重[19]。改進后的熵權(quán)法算法流程如圖1所示。
圖1 改進后的熵權(quán)法流程
通過自適應(yīng)優(yōu)化得到權(quán)重的期望值Ej為
當實際值Rj和預(yù)測期望值Ej不等時,存在計算誤差為
式中:ERR為實際值與預(yù)測期望值的預(yù)測誤差。
采用誤差梯度下降算法不斷地調(diào)整權(quán)重為
式中:負號表示梯度下降;η為比例系數(shù)。
因此,權(quán)重的更新迭代表達式為
D-S 證據(jù)理論能夠在無先驗概率的前提下對信息進行融合和推理,為主觀和客觀證據(jù)的分析融合提供了理論基礎(chǔ)[20-21]?;谥饔^和客觀評價方法獲得的各項指標權(quán)重wa和wb,通過夾角余弦函數(shù)表示兩者之間的相似度,即
為了判定證據(jù)之間的矛盾程度,需先求得某一證據(jù)與其他證據(jù)之間的平均相似度
通過對權(quán)重進行重新分配,確定各個指標在整個數(shù)據(jù)評價中的占比權(quán)重為
結(jié)合主觀和客觀因素的電力系統(tǒng)主子站通道質(zhì)量動態(tài)評價可以表示為
式中:Zn為樣本通道的第n個評價指標值。
將多屬性評價優(yōu)選模型和證據(jù)推理模型植入到主子站傳輸網(wǎng)關(guān)的邊緣計算中,實現(xiàn)通道的優(yōu)選。根據(jù)主子站的傳輸數(shù)據(jù)確定數(shù)據(jù)規(guī)范化后的系統(tǒng)指標數(shù)據(jù)參考值,如表1 所示。電力系統(tǒng)主子站通道的數(shù)據(jù)質(zhì)量評估是高質(zhì)量數(shù)據(jù)應(yīng)用的基礎(chǔ)。選取3個主子站通道數(shù)據(jù)進行評估,典型日的逐時電負荷曲線如圖2所示。
表1 評價指標的參考值
圖2 典型日傳輸通道的負荷
圖2 中只展示24 h 整點的數(shù)據(jù),其中,每小時內(nèi)還包含60 個數(shù)據(jù),因為數(shù)據(jù)量龐大,不做詳細展示。此外,通過選取6 個指標來評價通道數(shù)據(jù)質(zhì)量,具體包括:數(shù)據(jù)的延遲上送、通道數(shù)據(jù)不刷新、數(shù)據(jù)跳變、異常數(shù)據(jù)數(shù)目、異常數(shù)據(jù)出現(xiàn)次數(shù)和投退次數(shù)。此外,根據(jù)專家意見,獲得評價指標的數(shù)據(jù)評價矩陣如表2所示。
表2 評價指標的數(shù)據(jù)評價矩陣
通過多屬性評價優(yōu)選模型和證據(jù)推理模型計算得到6 個評價指標的權(quán)重,得到6 個主觀評價的證據(jù)源信息,如表3 所示。表3 中,wal為第l個主觀評價獲得的指標權(quán)重,l∈{1,2,3}。
表3 六個評價指標的主觀權(quán)重
通過改進的熵權(quán)法計算得到各個評價指標的客觀權(quán)重值,如表4 所示。表4 中,wbu為第u個主觀評價獲得的指標權(quán)重,u∈{1,2,3,…,6}。
表4 客觀評價的指標權(quán)重
通過對3 個主子站通道的動態(tài)質(zhì)量的主觀評價、客觀評價和本文方法的3 種情況進行對比,評價結(jié)果如表5所示。從表5中可以看出,通過證據(jù)融合可以看出對于“通道樣本2”的數(shù)據(jù)支持度最高。按照信度函數(shù)值最大化的原則,選擇通道樣本1 作為當前數(shù)據(jù)傳輸通道的最優(yōu)選擇。此外,從表5 中可以看出,本文所提出的主觀和客觀相融合的證據(jù)推理的結(jié)果支持度更高,能夠更全面評價數(shù)據(jù)并給出結(jié)果。
表5 通道樣本的評價值
為了驗證所提方法的有效性,將本文方法與網(wǎng)絡(luò)大數(shù)據(jù)評價、最大流方法、熵值法和CRITIC 4種評價方法結(jié)果進行比較。圖3和表6分別展示了上述5 種方法的評價值及本文方法與其他4 種方法的數(shù)據(jù)評價值和相對誤差。從圖3和表6中可以看出,本文提出的方法與其他4種數(shù)據(jù)動態(tài)評價方法相比,數(shù)據(jù)比較接近,能夠保持一個比較高的數(shù)據(jù)精度。此外,本文方法與其他4種方法的數(shù)據(jù)相對誤差也較小。
圖3 5種評價方法的對比
表6 本文方法與其他4種方法的相對誤差 單位:%
提出一種基于多屬性評價分析和D-S 證據(jù)推理的主子站通道質(zhì)量動態(tài)評價模型,依據(jù)D-S 證據(jù)推理方法,結(jié)合主觀和客觀評價的信息進行融合,對主子站通道的數(shù)據(jù)質(zhì)量進行動態(tài)評估,相比于主觀或者客觀的單一評價方法,考慮主觀和客觀相融合的多屬性評價分析方法能夠克服單一因素對于系統(tǒng)數(shù)據(jù)評價的影響,使得評價結(jié)果更加可靠有效,避免單一方法的局限性和片面性。此外,通過與不同的數(shù)據(jù)質(zhì)量評價方法結(jié)果進行對比,驗證了本文所提模型在主子站通道數(shù)據(jù)質(zhì)量評價中能夠保證所選擇的傳輸通道具有較好的數(shù)據(jù)質(zhì)量,為決策者提供可靠的數(shù)據(jù)支撐,避免不良數(shù)據(jù)對決策的影響。