周嘉 劉飛 王棟
摘要:針對關(guān)系數(shù)據(jù)庫越來越不能滿足電網(wǎng)對大數(shù)據(jù)快速訪問和分析需求的問題,提出了一種基于Neo4j的配電網(wǎng)拓撲建模方法。在遵循電網(wǎng)CIM模型的基礎(chǔ)上,將CIM模型中的設(shè)備類對象建模為圖數(shù)據(jù)庫中的節(jié)點,將對象之間的連接關(guān)系建模為圖數(shù)據(jù)庫中的關(guān)系。最后,通過一個10 kV配電網(wǎng)算例的最短路徑查詢性能對比,驗證了所提建模方法的有效性。
關(guān)鍵詞:配電網(wǎng)拓撲;圖數(shù)據(jù)庫;最短路徑查詢
中圖分類號:TM711? 文獻標志碼:A? 文章編號:1671-0797(2022)05-0013-03
DOI:10.19514/j.cnki.cn32-1628/tm.2022.05.003
引言
隨著電網(wǎng)規(guī)模的不斷擴大,傳統(tǒng)的基于關(guān)系數(shù)據(jù)庫的配電網(wǎng)關(guān)系模型極大地限制了配電網(wǎng)結(jié)構(gòu)數(shù)據(jù)檢索的性能,給電網(wǎng)設(shè)備及其拓撲連接查詢帶來了嚴峻的挑戰(zhàn)。圖數(shù)據(jù)庫作為一種新型的非關(guān)系數(shù)據(jù)庫,更適合處理網(wǎng)絡(luò)類型數(shù)據(jù),為大規(guī)模電網(wǎng)拓撲查詢問題提供了新的解決方案。文獻[1]提出了一種基于Neo4j的變電站數(shù)據(jù)管理方法,并驗證了在數(shù)據(jù)檢索中使用圖數(shù)據(jù)庫管理變電站設(shè)備的優(yōu)勢。文獻[2]驗證了Neo4j圖數(shù)據(jù)庫在遍歷數(shù)據(jù)方面的優(yōu)勢,但沒有提供配電網(wǎng)圖模型的具體建模方法。
圖數(shù)據(jù)建模的常用方法有Neo4j圖數(shù)據(jù)建模[3]、GraphX圖數(shù)據(jù)建模[4]等。圖數(shù)據(jù)庫常用技術(shù)主要包括數(shù)據(jù)庫存儲技術(shù)[5]、圖索引機制[6]、圖查詢分析技術(shù)[7]等,圖數(shù)據(jù)庫存儲技術(shù)主要是利用數(shù)據(jù)結(jié)構(gòu)來存儲和表達圖,圖數(shù)據(jù)庫的基本存儲單元是節(jié)點、關(guān)系、屬性。由于圖數(shù)據(jù)庫符合電力系統(tǒng)網(wǎng)絡(luò)特點的技術(shù)優(yōu)勢,其在電網(wǎng)計算中的應(yīng)用越來越受到重視。文獻[8]在繼承CIM模型的基礎(chǔ)上,提出了一種Neo4j圖數(shù)據(jù)庫中功率數(shù)據(jù)的建模方法,但沒有進一步分析這種方法的優(yōu)越性。文獻[9]基于Neo4j圖數(shù)據(jù)庫提出了3種不同配電網(wǎng)圖模型的建模方法,但沒有與對應(yīng)關(guān)系型數(shù)據(jù)庫進行一些數(shù)據(jù)檢索性能方面的對比。
因此,本文結(jié)合Neo4j圖數(shù)據(jù)庫的優(yōu)勢,提出了一種面向配電網(wǎng)CIM模型的拓撲建模方法。
1? ? 圖數(shù)據(jù)庫和Neo4j
圖數(shù)據(jù)庫是以“圖”的形式存儲數(shù)據(jù)的數(shù)據(jù)庫,其中數(shù)據(jù)存儲的形式主要是節(jié)點和關(guān)系。這種設(shè)計模式可以快速解決復雜的關(guān)系問題,而不需要使用傳統(tǒng)的關(guān)系數(shù)據(jù)庫,因此圖數(shù)據(jù)庫非常適用于存儲配電網(wǎng)拓撲等網(wǎng)絡(luò)特征數(shù)據(jù)。而傳統(tǒng)的關(guān)系數(shù)據(jù)庫需要進行大量的連接表操作來查找數(shù)據(jù)之間的關(guān)聯(lián)。
Neo4j是圖形數(shù)據(jù)庫中的一種流行產(chǎn)品,它具有性能好、可擴展性強、可靠性高等特點。如圖1所示,Neo4j通過定義兩個數(shù)據(jù)結(jié)構(gòu)(節(jié)點和關(guān)系)來進行信息建模。一個節(jié)點可以有一個或多個標簽,一個關(guān)系只能有一種類型;同時,節(jié)點和關(guān)系可以定義多個鍵值對的屬性特征。
2? ? 配電網(wǎng)圖模型的建模原理
配電網(wǎng)CIM模型主要由連接節(jié)點類、設(shè)備端子類和設(shè)備類組成。圖2顯示了配電網(wǎng)CIM模型中最基本的拓撲連接方式,這些設(shè)備類節(jié)點將連接到0~2個設(shè)備端子,每個設(shè)備端子節(jié)點只連接一個連接節(jié)點,形成最終的拓撲結(jié)構(gòu)。
以圖2為例,“導線”設(shè)備連接到“分段開關(guān)”設(shè)備。如果使用原CIM模型的數(shù)據(jù)結(jié)構(gòu)進行計算,需要先查找與“導線”相連的設(shè)備端子節(jié)點T1的ID,然后根據(jù)設(shè)備端子節(jié)點T1查找連接節(jié)點C1,再根據(jù)連接節(jié)點C1查找所連接設(shè)備T4的設(shè)備端子節(jié)點,最終找到“分段開關(guān)”設(shè)備節(jié)點。整個過程涉及4次搜索,數(shù)據(jù)規(guī)模是冗余的。因此,考慮到配電網(wǎng)拓撲結(jié)構(gòu)分析方法要求的高遍歷性能,在CIM原理建模方法的基礎(chǔ)上,可以剔除對象類中的連接節(jié)點類、設(shè)備端子類節(jié)點,僅保留設(shè)備類節(jié)點。
因此,為了提高對配電網(wǎng)拓撲設(shè)備的連通性查詢效率,保證配電網(wǎng)圖模型的完整性和一致性,在使用Neo4j建模配電網(wǎng)圖模型的過程中,應(yīng)遵循配電網(wǎng)CIM模型,將模型中的對象類建模為圖數(shù)據(jù)庫中的節(jié)點數(shù)據(jù)格式,將對象之間的連接關(guān)系建模為圖數(shù)據(jù)庫中的關(guān)系數(shù)據(jù)格式,映射關(guān)系如表1所示。
3? ? 算例分析
為驗證基于圖數(shù)據(jù)庫的配電網(wǎng)圖建模方法的有效性,選取一個10 kV的簡單配電網(wǎng)為例。如圖3所示,系統(tǒng)由11條線路、8個開關(guān)等組成。
根據(jù)CIM模型的規(guī)則,只保留配電網(wǎng)中的每個設(shè)備節(jié)點,不包括設(shè)備終端節(jié)點、連接節(jié)點等。基于Neo4j構(gòu)建的圖模型如圖4所示,圖模型由31個節(jié)點和30條邊組成。
配電網(wǎng)拓撲結(jié)構(gòu)是研究設(shè)備之間連通性的基礎(chǔ),因此,有必要驗證圖建模方法與關(guān)系數(shù)據(jù)庫相比在最短路徑查詢性能方面的優(yōu)勢。以母線到負載組LP3的最短路徑查詢?yōu)槔?,圖5所示為關(guān)系數(shù)據(jù)庫中圖3所對應(yīng)的配電網(wǎng)拓撲數(shù)據(jù)的表達式,不同類型的設(shè)備存儲在不同的元件表中,元件之間的連接關(guān)系存儲在連接表中。
在關(guān)系數(shù)據(jù)庫MySQL和圖數(shù)據(jù)庫Neo4j中查詢10 kV配電網(wǎng)母線到負載組LP3的最短路徑所需時間結(jié)果如表2所示,從中可以看出,在關(guān)系數(shù)據(jù)庫中,查詢時間為8.46 s;而在圖數(shù)據(jù)庫中,查詢最短路徑只需要2.23 s,由此可對比出圖模型遍歷的高效性。
4? ? 結(jié)語
圖數(shù)據(jù)庫存儲方法因其適應(yīng)了電網(wǎng)拓撲結(jié)構(gòu)的特點,正逐漸應(yīng)用于電力系統(tǒng)領(lǐng)域。因此,本文在遵循電網(wǎng)CIM模型的基礎(chǔ)上,提出了一種基于圖數(shù)據(jù)庫的配電網(wǎng)圖模型建模方法。首先,基于Neo4j圖數(shù)據(jù)庫,將CIM模型中的設(shè)備類對象建立為圖模型中的頂點,將設(shè)備之間的連接關(guān)系建立為圖模型中的邊。其次,基于某10 kV配電網(wǎng)算例,通過與關(guān)系數(shù)據(jù)庫的比較,證明了基于圖模型的最短路徑搜索是更有效的。
[參考文獻]
[1] PER?覶UKU A,MINKOVSKA D,STOYANOVA L.Modeling and processing big data of power transmission grid substation using Neo4j[J].Procedia Computer Science,2017,113:9-16.
[2] 馬義松,武志剛.基于Neo4j的電力大數(shù)據(jù)建模及分析[J].電工電能新技術(shù),2016,35(2):24-30.
[3] COMYN-WATTIAU I,AKOKA J.Model driven reverse engineering of NoSQL property graph databases:The case of Neo4j[C]//2017 IEEE International Conference on Big Data (Big Data),2017:453-458.
[4] DEUTSCH A,XU Y,WU M X,et al.TigerGraph:A native MPP graph database[EB/OL].[2021-11-28].https://doc.paperpass.com/foreign/arXiv190108248.html.
[5] HUSAIN M F,DOSHI P,KHAN L,et al.Storage and retrieval of large RDF graph using hadoop and mapreduce[C]//IEEE International Conference on Cloud Computing,2009:680-686.
[6] HE H H,SINGH A K.Closure-tree:An index structure for graph queries[C]//22nd International Con-
ference on Data Engineering(ICDE′06),2006:38-49.
[7] ZHAO P X,HAN J W.On graph query optimization in large networks[J].Proceedings of the VLDB Endowment,2010,3(1/2):340-351.
[8] PAVKOVIV,APKO D,VUKMIROVIS,et al.Modeling power system data using NoSQL database[C]// IEEE 2017 25th Telecommunication Forum (TELFOR),2017:1-4.
[9] PAN Z H,JING Z X.Modeling methods of big data for power grid based on graph database[C]// 2018 International Conference on Power System Technology(POWERCON),2018:4340-4348.
收稿日期:2021-12-06
作者簡介:周嘉(1982—),男,江蘇南通人,高級工程師,研究方向:電網(wǎng)規(guī)劃、電網(wǎng)建設(shè)。