摘要:電力系統(tǒng)數(shù)據(jù)具有隱私性,容易發(fā)生完整性攻擊,被注入虛假數(shù)據(jù),造成完整性破壞,為此提出了隱私保護(hù)下的電力系統(tǒng)數(shù)據(jù)完整性檢測(cè)方案。因此,本文首先對(duì)電力系統(tǒng)數(shù)據(jù)進(jìn)行去、離散化以及標(biāo)準(zhǔn)化處理,提取數(shù)據(jù)中殘差特征突變特征并融合在一起,然后采用深度神經(jīng)網(wǎng)絡(luò)構(gòu)建完整性判斷模型,實(shí)現(xiàn)電力系統(tǒng)數(shù)據(jù)完整性檢測(cè),保護(hù)隱私數(shù)據(jù)安全,最后實(shí)施仿真實(shí)驗(yàn)。測(cè)試結(jié)果表明,該方案的電力系統(tǒng)數(shù)據(jù)完整性檢測(cè)Kappa系數(shù)均在0.9以上,獲得了較高精度的電力系統(tǒng)數(shù)據(jù)完整性檢測(cè)結(jié)果。
關(guān)鍵詞:隱私保護(hù);電力系統(tǒng)數(shù)據(jù);深度神經(jīng)網(wǎng)絡(luò);完整性檢測(cè)
一、引言
隨著各種微電網(wǎng)的加入,傳統(tǒng)電網(wǎng)逐漸無(wú)法滿足調(diào)控需求。為了提高調(diào)控工作效率,智慧電網(wǎng)的概念被提出,成為電網(wǎng)公司重點(diǎn)發(fā)展目標(biāo)。智慧電網(wǎng)的出現(xiàn)和使用,可以將電力運(yùn)營(yíng)的各環(huán)節(jié)聯(lián)系在一起,采集電力系統(tǒng)數(shù)據(jù)后,通過(guò)通信網(wǎng)絡(luò)將其傳輸至控制端進(jìn)行挖掘和分析,使電力系統(tǒng)與控制終端結(jié)合更加緊密,解決了傳統(tǒng)電網(wǎng)調(diào)控不利的難題。因此電力系統(tǒng)數(shù)據(jù)對(duì)于智慧電網(wǎng)至關(guān)重要,需要作為隱私數(shù)據(jù)被嚴(yán)密保護(hù)。然而,部分不法分子利用網(wǎng)絡(luò)的開(kāi)放性非法獲取或者破壞有價(jià)值的數(shù)據(jù)。智慧電網(wǎng)的數(shù)據(jù)網(wǎng)絡(luò)安全問(wèn)題越來(lái)越突出,受到的惡性攻擊類型越來(lái)越多,發(fā)現(xiàn)這類問(wèn)題時(shí),啟用預(yù)先設(shè)計(jì)好的應(yīng)急響應(yīng)計(jì)劃,以快速穩(wěn)定系統(tǒng)和防止進(jìn)一步損失,并根據(jù)事件類型和范圍,采取相應(yīng)的應(yīng)急響應(yīng)措施,例如隔離受影響的設(shè)備、停止服務(wù)、斷開(kāi)網(wǎng)絡(luò)連接等,其中完整性攻擊就是典型的一種。一旦電力公司未及時(shí)識(shí)別不完整的虛假數(shù)據(jù),將其當(dāng)作真實(shí)數(shù)據(jù)進(jìn)行利用,就會(huì)得出錯(cuò)誤判斷和決策,給電力公司造成重大損失。
因此,對(duì)電力系統(tǒng)數(shù)據(jù)隱私進(jìn)行保護(hù),對(duì)電力系統(tǒng)數(shù)據(jù)的完整性檢測(cè)具有重要的意義。所以,本文結(jié)合研究經(jīng)驗(yàn),提出一種隱私保護(hù)下的電力系統(tǒng)數(shù)據(jù)完整性檢測(cè)方案。通過(guò)該研究,以期為電力系統(tǒng)數(shù)據(jù)保護(hù)提供參考。
二、隱私保護(hù)下的電力系統(tǒng)隱私數(shù)據(jù)完整性檢測(cè)方案
電力系統(tǒng)數(shù)據(jù)具有較高的利用價(jià)值,對(duì)于電力公司發(fā)展而言具有重要意義,因此也就成為惡意攻擊的對(duì)象。惡意攻擊的目的是破壞數(shù)據(jù)的完整性,將假數(shù)據(jù)混入其中或者取代真實(shí)數(shù)據(jù),以實(shí)現(xiàn)數(shù)據(jù)竊取或者破壞。這種方法由于并非改變所有數(shù)據(jù),因此具有一定的隱蔽性,很難被發(fā)現(xiàn),危害性極大。因此,為了保護(hù)電力系統(tǒng)數(shù)據(jù)的安全,基于隱私保護(hù)需要對(duì)電力系統(tǒng)數(shù)據(jù)完整性進(jìn)行檢測(cè)。該研究分為三部分,即電力系統(tǒng)數(shù)據(jù)預(yù)處理、電力系統(tǒng)數(shù)據(jù)特征提取以及數(shù)據(jù)完整性判斷。
(一)電力系統(tǒng)數(shù)據(jù)預(yù)處理
為了檢測(cè)數(shù)據(jù)的完整性,需要提供良好的數(shù)據(jù)基礎(chǔ),對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。本文設(shè)計(jì)的預(yù)處理方法包括數(shù)據(jù)去噪、數(shù)據(jù)標(biāo)準(zhǔn)化。通過(guò)數(shù)據(jù)去噪的離群剝離,發(fā)現(xiàn)與噪聲混合在一起的惡意攻擊壞數(shù)據(jù);電力系統(tǒng)數(shù)據(jù)序列使完整數(shù)據(jù)和攻擊數(shù)據(jù)混合在一起,不容易檢測(cè)。因此,需要根據(jù)屬性關(guān)聯(lián)性,通過(guò)數(shù)據(jù)離散化切斷完整數(shù)據(jù)和攻擊數(shù)據(jù)的時(shí)間關(guān)聯(lián)性,僅依據(jù)屬性關(guān)聯(lián)性進(jìn)行檢測(cè)。為了提高數(shù)據(jù)處理效率,對(duì)量綱不同數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,使數(shù)據(jù)可以得到同步檢測(cè),然后消除重復(fù)數(shù)據(jù),完成數(shù)據(jù)預(yù)處理。
1.噪聲數(shù)據(jù)去除
電力系統(tǒng)數(shù)據(jù)經(jīng)過(guò)多道“工序”才能傳輸至數(shù)據(jù)處理終端當(dāng)中。該過(guò)程中,電力系統(tǒng)數(shù)據(jù)的質(zhì)量本身會(huì)受干擾,存在噪聲數(shù)據(jù)。這些噪聲數(shù)據(jù)的存在會(huì)嚴(yán)重干擾壞數(shù)據(jù)的發(fā)現(xiàn),因此預(yù)處理的第一個(gè)步驟就是去除掉噪聲數(shù)據(jù),讓原始中只存在真實(shí)的電力系統(tǒng)數(shù)據(jù),以及可能存在惡意攻擊的注入的壞數(shù)據(jù)。異常值又稱離群點(diǎn),檢測(cè)方法如下:
2.電力系統(tǒng)數(shù)據(jù)標(biāo)準(zhǔn)化
電力系統(tǒng)數(shù)據(jù)存在量綱不同的問(wèn)題,為了方便數(shù)據(jù)的同步處理,需要進(jìn)行標(biāo)準(zhǔn)化。
3.電力業(yè)務(wù)系統(tǒng)重復(fù)數(shù)據(jù)剔除
目前電力系統(tǒng)業(yè)務(wù)系統(tǒng)復(fù)雜,包含大量的省側(cè)自建系統(tǒng),系統(tǒng)之間集成錯(cuò)綜復(fù)雜,數(shù)據(jù)之間存在大量的重復(fù)錄入。目前電力系統(tǒng)正在開(kāi)展清楚數(shù)據(jù)重復(fù)錄入和雙軌制專項(xiàng)行動(dòng)。目標(biāo)為:為服務(wù)基層一線,減輕班組負(fù)擔(dān),切實(shí)推動(dòng)數(shù)字化賦能賦智,聚焦設(shè)備、營(yíng)銷專業(yè)的常態(tài)、高頻次應(yīng)用場(chǎng)景,全面盤清基層重復(fù)錄入、雙軌制情況,加強(qiáng)問(wèn)題診斷分析,解決一批基層反映強(qiáng)烈的數(shù)據(jù)重復(fù)錄入問(wèn)題,下線一批雙軌運(yùn)行老舊系統(tǒng),建立健全長(zhǎng)效管控機(jī)制,防止重復(fù)錄入、雙軌制問(wèn)題反復(fù)出現(xiàn),數(shù)據(jù)重復(fù)剔除方法如下:
假設(shè)內(nèi)容識(shí)別的滑動(dòng)窗口固定寬度為k,在數(shù)據(jù)塊中選取一大一小兩個(gè)整數(shù)值A(chǔ)、b,Agt;b,則k=A-b。刪除對(duì)象數(shù)據(jù)的序列為S=S1,S2,…,Sn,若,
則位置K屬于D-match。若數(shù)據(jù)塊的指紋計(jì)算窗口邊緣位置為v,則生成子序列為。窗口內(nèi),位置K是數(shù)據(jù)塊的刪除邊界,內(nèi)容檢測(cè)窗口如圖1所示。
從數(shù)據(jù)塊的首位數(shù)字開(kāi)始,將K寬度的滑動(dòng)窗口中的數(shù)據(jù)作為Hash函數(shù)的子序列,計(jì)算每個(gè)窗口位置的指紋。當(dāng)序列中的數(shù)字滿足指定條件時(shí),就將窗口所在位置的邊界作為數(shù)據(jù)塊的邊界。重復(fù)上述過(guò)程,直到電力系統(tǒng)中的數(shù)據(jù)被劃分,再用Hash函數(shù)計(jì)算出每個(gè)劃分的數(shù)據(jù)塊Hash值。
Hash函數(shù)在識(shí)別數(shù)據(jù)時(shí)具有唯一性,且識(shí)別概率較高,在一張表中記錄數(shù)據(jù)單元,并構(gòu)造了存儲(chǔ)位置的映射函數(shù)。在數(shù)據(jù)冗余情況下,可以通過(guò)重復(fù)數(shù)據(jù)消除過(guò)程來(lái)提高檢測(cè)效率。
(二)電力系統(tǒng)數(shù)據(jù)特征提取
(三)電力系統(tǒng)數(shù)據(jù)完整性判斷
為了實(shí)現(xiàn)電力系統(tǒng)隱私數(shù)據(jù)保護(hù),在使用前完整性檢測(cè)必不可少。通過(guò)完整性檢測(cè)能夠有效判斷是否存在惡意攻擊,以此來(lái)實(shí)現(xiàn)隱私保護(hù)。在這里結(jié)合深度學(xué)習(xí)算法,構(gòu)建電力系統(tǒng)數(shù)據(jù)完整性判斷模型。該模型如圖2所示。從圖2中看出,基于深度學(xué)習(xí)的電力系統(tǒng)數(shù)據(jù)完整性判斷模型主要分為三層,其中隱含層由多層疊加而成。判斷模型應(yīng)用分為兩部分,前一部分為訓(xùn)練,后一部分為應(yīng)用測(cè)試。針對(duì)前者,首先將融合后特征輸入到輸入層,經(jīng)輸入層后,進(jìn)入到隱含層第一層,按照下述公式進(jìn)行計(jì)算,計(jì)算公式如下:
計(jì)算輸出結(jié)果Ij與訓(xùn)練樣本的預(yù)期結(jié)果的差值。通過(guò)差值進(jìn)行反向誤差傳播,以此調(diào)整權(quán)值和閾值。利用訓(xùn)練好的電力系統(tǒng)數(shù)據(jù)完整性判斷模型實(shí)現(xiàn)完整性檢測(cè),找出隱藏在真實(shí)數(shù)據(jù)中的壞數(shù)據(jù),實(shí)現(xiàn)電力系統(tǒng)隱私數(shù)據(jù)保護(hù)。
三、仿真測(cè)試
將基于變色龍認(rèn)證樹(shù)的檢測(cè)方法、基于多分支樹(shù)結(jié)構(gòu)的檢測(cè)方法、基于索引-存根表的檢測(cè)方法作為對(duì)比項(xiàng),以MATLAB實(shí)驗(yàn)平臺(tái)作為對(duì)比項(xiàng),驗(yàn)證所研究檢測(cè)方法的對(duì)比項(xiàng)。電力系統(tǒng)數(shù)據(jù)分布式仿真環(huán)境采用Hadoop框架配置;數(shù)據(jù)時(shí)間序列串行環(huán)境采用普通PC機(jī)。實(shí)驗(yàn)平臺(tái)為多個(gè)節(jié)點(diǎn)組成的Cluster。系統(tǒng)搭建Hadoop節(jié)點(diǎn)集群,集群通信基于MPI實(shí)現(xiàn)。系統(tǒng)數(shù)據(jù)集選擇某電力公司的開(kāi)放數(shù)據(jù)集,該數(shù)據(jù)集提供多種規(guī)模數(shù)據(jù)集,將數(shù)據(jù)集寫入HDFS中。
(一)方法測(cè)試樣本
方法測(cè)試樣本由5類電力系統(tǒng)數(shù)據(jù)組成,即完整數(shù)據(jù)1、2和不完整數(shù)據(jù)3、4、5。每類數(shù)據(jù)的樣本數(shù)量如圖3所示。
(二)檢測(cè)結(jié)果對(duì)比分析
利用研究方法以及基于變色龍認(rèn)證樹(shù)的檢測(cè)方法、基于多分支樹(shù)結(jié)構(gòu)的數(shù)據(jù)完整性檢測(cè)方法、基于索引-存根表的檢測(cè)方法對(duì)電力系統(tǒng)數(shù)據(jù)樣本進(jìn)行完整性檢測(cè),然后根據(jù)檢測(cè)結(jié)果統(tǒng)計(jì)Kappa系數(shù),結(jié)果如圖4所示。從圖4中看出,與基于變色龍認(rèn)證樹(shù)的檢測(cè)方法、基于多分支樹(shù)結(jié)構(gòu)的數(shù)據(jù)完整性檢測(cè)方法、基于索引-存根表的檢測(cè)方法相比,研究檢測(cè)方法的Kappa系數(shù)均更大。
四、結(jié)束語(yǔ)
電力系統(tǒng)數(shù)據(jù)對(duì)于電力公司而言具有較高的利用價(jià)值,因此在電力公司看來(lái)是一種重要的隱私數(shù)據(jù)。為了保證這些數(shù)據(jù)安全,提出一種基于隱私保護(hù)的電力系統(tǒng)數(shù)據(jù)完整性檢測(cè)方法,該方法對(duì)電力系統(tǒng)數(shù)據(jù)進(jìn)行預(yù)處理,提取攻擊前后虛假數(shù)據(jù)注入前后電力系統(tǒng)數(shù)據(jù)呈現(xiàn)的殘差特征和突變特征,檢測(cè)模型由深度神經(jīng)網(wǎng)絡(luò)構(gòu)成,實(shí)現(xiàn)電力系統(tǒng)數(shù)據(jù)完整性檢測(cè)。最后通過(guò)實(shí)驗(yàn)測(cè)試,研究檢測(cè)方法Kappa系數(shù)更大,證明了該方法數(shù)據(jù)完整性檢測(cè)效果較好。然而,本研究仍然有許多問(wèn)題需要解決,如收集更廣泛、更全面的電力系統(tǒng)數(shù)據(jù)樣本、優(yōu)化判斷模型參數(shù)等。
作者單位:李洪波 廣州泓盈信息科技有限公司
李曉云 北京中電普華信息技術(shù)有限公司
參考文獻(xiàn)
[1]薛安成,常乃超,等.電力系統(tǒng)同步相量異常數(shù)據(jù)檢測(cè)與修復(fù)研究現(xiàn)狀與展望[J].中國(guó)電機(jī)工程學(xué)報(bào),2021,41(20):6869-6886.
[2]李秀艷,劉明曦,等.基于云存儲(chǔ)的動(dòng)態(tài)組共享數(shù)據(jù)完整性驗(yàn)證方案[J].計(jì)算機(jī)工程與設(shè)計(jì),2022,43(06):1510-1519.
[3]李桐,王剛,等.基于變色龍認(rèn)證樹(shù)的云邊端協(xié)同流式數(shù)據(jù)完整性驗(yàn)證模型[J].信息網(wǎng)絡(luò)安全,2022,22(01):37-45.
[4]王凌宇,陸治軍,張向東等.基于多分支樹(shù)結(jié)構(gòu)的電力繳費(fèi)終端數(shù)據(jù)完整性驗(yàn)證方案[J].重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版),2020,32(03):377-384.
[5]趙海春,鄭雪峰等.基于索引-存根表的云存儲(chǔ)數(shù)據(jù)完整性審計(jì)[J].工程科學(xué)學(xué)報(bào),2020,42(04):490-499.
[6]陳麗莎,李雪蓮,高軍濤.支持?jǐn)?shù)據(jù)完整性驗(yàn)證的可問(wèn)責(zé)數(shù)據(jù)交易方案[J].系統(tǒng)工程與電子技術(shù),2022,44(04):1364-1371.
[7]李慶丹,張澤輝,等.支持隱私保護(hù)和公平支付的數(shù)據(jù)完整性驗(yàn)證方案[J].計(jì)算機(jī)研究與發(fā)展,2022,59(06):1343-1355.
[8]王春波等.基于標(biāo)簽分類的云數(shù)據(jù)完整性驗(yàn)證審計(jì)方案[J].吉林大學(xué)學(xué)報(bào)(工學(xué)版),2021,51(04):1364-1369.