[關(guān)鍵詞]電網(wǎng);遺傳算法;數(shù)據(jù)壓縮;監(jiān)控;K-Means 聚類
[中圖分類號]TM76 [文獻(xiàn)標(biāo)志碼]A [文章編號]2095–6487(2024)11–0126–03
電網(wǎng)運(yùn)行調(diào)度監(jiān)控?cái)?shù)據(jù)量快速增長、動態(tài)變化的特征使得數(shù)據(jù)的調(diào)度和查詢功能受到了嚴(yán)重影響。數(shù)據(jù)量的增大會導(dǎo)致系統(tǒng)查詢時間延長以及信息延遲,難以滿足電網(wǎng)運(yùn)行調(diào)度的實(shí)時性需求,進(jìn)而導(dǎo)致關(guān)鍵性信息的遲報或漏報,甚至可能會引起警告的延遲或消失,從而嚴(yán)重威脅到電網(wǎng)運(yùn)行的安全可靠性。此外,海量數(shù)據(jù)的存儲不僅會增加集群存儲空間的壓力,還會提高數(shù)據(jù)傳輸?shù)某杀?。在此背景下,?chuàng)新性地將遺傳算法與K-Means 聚類算法相結(jié)合,并對門控循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化,設(shè)計(jì)出了一種電網(wǎng)運(yùn)行調(diào)度的監(jiān)控?cái)?shù)據(jù)壓縮模型,以期在提高監(jiān)控?cái)?shù)據(jù)的調(diào)度效率的同時,減少集群存儲空間的壓力。
1基于遺傳算法的電網(wǎng)運(yùn)行調(diào)度監(jiān)控?cái)?shù)據(jù)壓縮模型構(gòu)建
1.1基于遺傳優(yōu)化聚類算法的數(shù)據(jù)壓縮模型設(shè)計(jì)
國網(wǎng)調(diào)度監(jiān)控系統(tǒng)采用基于Hadoop 的分布式集群架構(gòu),這一架構(gòu)可支持大規(guī)模的數(shù)據(jù)存儲與處理。數(shù)據(jù)的壓縮過程可分為兩個主要階段,第一階段是基于輸入數(shù)據(jù)構(gòu)建出概率分布模型,第二階段是將此概率分布模型與編碼器相結(jié)合實(shí)現(xiàn)文件的壓縮。數(shù)據(jù)壓縮的效果通常通過壓縮率來評估,壓縮率越小,則表明文件壓縮得越小,即壓縮效果就越好。數(shù)據(jù)壓縮的數(shù)學(xué)表達(dá)式如下。
遺傳算法是一種高效的搜索算法,其能夠借鑒生物學(xué)中遺傳、變異等現(xiàn)象,來解決最佳化的搜索問題。而K-Means 算法可通過最小化每個數(shù)據(jù)點(diǎn)到其對應(yīng)的聚類中心的距離之和來優(yōu)化分類效果。因此,研究將這兩種算法的優(yōu)勢相結(jié)合,構(gòu)建出一個電網(wǎng)運(yùn)行調(diào)度的監(jiān)控?cái)?shù)據(jù)壓縮模型。該模型可利用K-Means 算法對相同特征的數(shù)據(jù)進(jìn)行聚類,并通過提升聚類中心點(diǎn)的相似度,來提升壓縮效率。基于遺傳優(yōu)化聚類算法的數(shù)據(jù)壓縮模型的工作步驟是,先在輸入電網(wǎng)運(yùn)行監(jiān)控?cái)?shù)據(jù)之后,進(jìn)行種群的初始化并對染色體進(jìn)行編碼。接著,通過交叉和變異等操作生成新的個體,然后利用K-Means 算法對這些個體進(jìn)行聚類。在聚類過程中,將聚類結(jié)果相同的個體去除,其目的是減少重復(fù)的數(shù)據(jù),以提高數(shù)據(jù)的處理效率。
1.2遺傳優(yōu)化的門控循環(huán)神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)壓縮設(shè)計(jì)
基于遺傳優(yōu)化聚類算法的數(shù)據(jù)壓縮模型能夠去除具有相似性的數(shù)據(jù)信息,然而對于不相似的數(shù)據(jù),其壓縮效果有限。因此,為了解決這一問題,研究提出了一種基于門控循環(huán)神經(jīng)網(wǎng)絡(luò)的電網(wǎng)運(yùn)行調(diào)度監(jiān)控?cái)?shù)據(jù)壓縮模型,該模型旨在更全面地處理數(shù)據(jù)壓縮。門控循環(huán)神經(jīng)網(wǎng)絡(luò)是改進(jìn)后的循環(huán)神經(jīng)網(wǎng)絡(luò),其不僅解決了傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)面臨的梯度消失和梯度爆炸問題,還提供了更好的長期依賴性能?;陂T控循環(huán)神經(jīng)網(wǎng)絡(luò)的電網(wǎng)運(yùn)行調(diào)度監(jiān)控?cái)?shù)據(jù)壓縮模型框架如圖1所示。
如圖1 所示,在該模型框架中先對監(jiān)控?cái)?shù)據(jù)進(jìn)行了初步的聚類處理,并將處理后的聚類數(shù)據(jù)輸入到門控循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中進(jìn)行關(guān)聯(lián)性分析。然后,通過門控循環(huán)神經(jīng)網(wǎng)絡(luò)對數(shù)據(jù)的狀態(tài)進(jìn)行傳遞,并以此預(yù)測出每個數(shù)據(jù)的分布概率,并將其整理為分布表。最后,將這一預(yù)測數(shù)據(jù)與聚類數(shù)據(jù)一同應(yīng)用于算術(shù)編碼過程中進(jìn)行數(shù)據(jù)的高效壓縮,再將壓縮后的數(shù)據(jù)存儲于磁盤上,從而完成整個數(shù)據(jù)壓縮過程。
2基于遺傳算法的電網(wǎng)運(yùn)行調(diào)度監(jiān)控?cái)?shù)據(jù)壓縮模型驗(yàn)證
為了驗(yàn)證基于遺傳優(yōu)化聚類算法的壓縮效果,研究選取了9 個電網(wǎng)運(yùn)行的實(shí)測監(jiān)控?cái)?shù)據(jù)集作為試驗(yàn)對象,以驗(yàn)證不同算法的壓縮效果。研究將該算法與普通K-Means 聚類算法、密度聚類(DBSCAN)算法以及層次聚類(Hierarchical Clustering,HC)算法等壓縮效果進(jìn)行對比分析,不同聚類算法的壓縮率對比如圖2 所示。從圖2 中可以看出,研究的遺傳優(yōu)化聚類算法壓縮率顯著低于其他3 種聚類算法,最低時為13.7%。因此可以看出,基于遺傳算法優(yōu)化的聚類壓縮模型有效地提高了壓縮效果。
為了驗(yàn)證基于門控循環(huán)神經(jīng)網(wǎng)絡(luò)的電網(wǎng)運(yùn)行調(diào)度監(jiān)控?cái)?shù)據(jù)壓縮模型的壓縮效果,研究將該方法與其他3 種先進(jìn)的壓縮方法進(jìn)行對比分析。這3 種壓縮方法分別是LZMA、DeepCABAC 和Gzip 等算法。不同壓縮算法的壓縮率對比如圖3 所示。從圖3 中可以看出,基于遺傳優(yōu)化聚類的門控循環(huán)神經(jīng)網(wǎng)絡(luò)壓縮算法的壓縮率最低,為0.98%,與LZMA、DeepCABAC和Gzip 等壓縮算法此時的壓縮率相比,分別降低了2.44%、2.95% 和9.99%。綜合來看,基于門控循環(huán)神經(jīng)網(wǎng)絡(luò)的電網(wǎng)運(yùn)行調(diào)度監(jiān)控?cái)?shù)據(jù)壓縮模型具有更優(yōu)的壓縮性能。
為了驗(yàn)證壓縮前后的集群空間性能,研究在數(shù)據(jù)集3中對不同壓縮方法和未壓縮前的集群空間進(jìn)行對比分析,壓縮前后的集群空間對比如圖4 所示。從圖4 中可以看出,在數(shù)據(jù)集3 中未壓縮前集群空間為32.8 GB,壓縮后研究的基于遺傳優(yōu)化聚類算法的壓縮方法、LZMA、DeepCABAC 和Gzip 等壓縮方法的集群空間占用分別為0.09 GB、4.38 GB、6.91 GB 和18.3 GB, 分別降低了99.72%、86.64%、78.93% 和44.20%。綜合可以看出,基于門控循環(huán)神經(jīng)網(wǎng)絡(luò)的電網(wǎng)運(yùn)行調(diào)度監(jiān)控?cái)?shù)據(jù)壓縮模型有效降低了集群存儲空間。
3結(jié)束語
面對國網(wǎng)調(diào)度監(jiān)控?cái)?shù)據(jù)存在的存儲空間大且調(diào)度效率低下等問題,研究通過將遺傳優(yōu)化聚類算法與門控循環(huán)神經(jīng)網(wǎng)絡(luò)相結(jié)合,進(jìn)行了數(shù)據(jù)壓縮優(yōu)化研究?;陂T控循環(huán)神經(jīng)網(wǎng)絡(luò)的電網(wǎng)運(yùn)行調(diào)度監(jiān)控?cái)?shù)據(jù)壓縮模型有效壓縮了數(shù)據(jù),并降低了集群存儲空間。研究僅針對壓縮效果進(jìn)行分析,未考慮壓縮時間,因此未來的研究應(yīng)在保障壓縮效果的同時縮短壓縮時長。