胡杰, 許剛,齊立忠,郄鑫,榮經(jīng)國
(1.華北電力大學電氣與電子工程學院, 北京市 102206; 2.國網(wǎng)經(jīng)濟技術(shù)研究院有限公司,北京市 102209)
碳達峰、碳中和國家戰(zhàn)略目標下,新型電力系統(tǒng)以清潔低碳、開放互動為目標不斷建設(shè),成為實現(xiàn)“雙碳”目標的重要抓手[1-3]。在此背景下,輸變電工程建設(shè)加速推進,尤其是特高壓工程已成集中開工態(tài)勢[4-5]。工程規(guī)模與數(shù)量的不斷擴大、建設(shè)復雜度的不斷提升,對輸變電工程建設(shè)提出了更高要求。隨著數(shù)字技術(shù)與實體經(jīng)濟的深度融合,推動輸變電工程建設(shè)領(lǐng)域數(shù)字化轉(zhuǎn)型,成為支撐新型電力系統(tǒng)建設(shè)、把握新一輪科技革命和產(chǎn)業(yè)變革新機遇的戰(zhàn)略選擇[6-8]。工程評審作為工程建設(shè)管控關(guān)鍵環(huán)節(jié),目前仍停留在以專家線下評審為主的低效率模式中,難以滿足輸變電工程大規(guī)模、高質(zhì)量建設(shè)需求。亟需通過知識圖譜、推理解析、大數(shù)據(jù)等數(shù)字化手段,建設(shè)輸變電工程輔助評審系統(tǒng),推動實現(xiàn)輸變電工程評審工作數(shù)字化、智能化轉(zhuǎn)型升級。
目前,輸變電工程輔助評審系統(tǒng)通常使用瀏覽器和服務(wù)器架構(gòu)(browser/server, B/S),相比較客戶端服務(wù)器端架構(gòu)(client/server, C/S),具有分布性強、開發(fā)簡單、共享性強、維護方便等優(yōu)勢[9-10]。在此基礎(chǔ)上,結(jié)合工程評審單位以及相關(guān)電力設(shè)計院具體業(yè)務(wù)需求,開展系統(tǒng)建設(shè)工作。文獻[11]提出適用于110 kV及以下輸變電工程設(shè)計評審管理平臺的關(guān)鍵因素提取法和光學字符識別(optical character recognition,OCR),實現(xiàn)歷史數(shù)據(jù)的收集、分析和研究。文獻[12]面向110 kV及以上輸變電工程智能規(guī)劃評審需求,提出基于典型歷史工程關(guān)鍵特性指標的輔助評審系統(tǒng)架構(gòu),提升數(shù)據(jù)收集、意見發(fā)文管理效率。文獻[13]研究了福建輸變電工程設(shè)計評審系統(tǒng),指出使用B/S模式的系統(tǒng)架構(gòu),在評審業(yè)務(wù)的標準化管理和評審文件的模板化管理方面發(fā)揮了良好的作用。文獻[14]基于B/S和.NET平臺設(shè)計并實現(xiàn)了輸變電工程設(shè)計評審系統(tǒng),其底層數(shù)據(jù)庫采用了常見的SQL Server 2005關(guān)系型數(shù)據(jù)庫。電力規(guī)劃總院根據(jù)自身業(yè)務(wù)需求及已有數(shù)據(jù)儲備,建立了咨詢評審平臺和專家輔助決策系統(tǒng),實現(xiàn)了工程庫信息錄入、計劃管理、評審管理、知識庫、輔助決策等業(yè)務(wù)功能。上述分析的系統(tǒng)平臺多聚焦于評審業(yè)務(wù)流程線上開展,對歷史工程數(shù)據(jù)進行分析以輔助工程評審方面開展的工作較少。隨著電網(wǎng)規(guī)模的不斷擴大,工程數(shù)據(jù)量不斷增加,亟需具備對歷史工程文本數(shù)據(jù)進行知識建模、存儲和分析能力的新型軟件平臺。
知識圖譜是最初由谷歌公司提出的一種用于增強搜索引擎功能的輔助知識庫,它采用“實體-關(guān)系-實體”三元組的形式描述現(xiàn)實世界中的物體及其之間的關(guān)系,具有關(guān)系表達能力強、推理、糾錯能力強等優(yōu)勢[15-19]。目前,知識圖譜在電力系統(tǒng)的應(yīng)用尚處于起步階段,主要應(yīng)用場景有電網(wǎng)故障處置[20-21]、電力設(shè)備故障診斷[22-23]、智能問答[24-27]、電力調(diào)度[28]等,在輸變電工程建設(shè)領(lǐng)域尚屬空白。文獻[29]提出了電力領(lǐng)域知識表示架構(gòu)圖,并詳細列舉了電力系統(tǒng)知識圖譜的應(yīng)用業(yè)務(wù)需求及應(yīng)用方向。文獻[30]分析了電網(wǎng)故障處置預(yù)案的文本特點,采用TextCNN、LR-CNN和BiGRU-Attention完成了命名實體識別和關(guān)系抽取,在沒有使用基于變換器的雙向編碼器表示技術(shù)(bidirectional encoder representation from transformers, BERT)等常見的預(yù)訓練語言模型背景下,仍取得了較好的效果。文獻[31]提出了面向配電網(wǎng)故障調(diào)度的知識圖譜構(gòu)建流程,并以neo4j數(shù)據(jù)庫為核心,設(shè)計了故障調(diào)度輔助決策系統(tǒng)。文獻[32]面向配電網(wǎng)故障處置,分析了配網(wǎng)設(shè)備臺賬數(shù)據(jù)、故障預(yù)案數(shù)據(jù)、調(diào)度規(guī)程數(shù)據(jù)和配網(wǎng)缺陷數(shù)據(jù),提出了一種基于BERT-BiLSTM-CRF模型的命名實體識別方案。文獻[33]針對電力文本實體邊界模糊、術(shù)語較多等特點,設(shè)計提出了一種新的命名實體識別方法I-BRC。文獻[34]基于ALBERT語言預(yù)訓練模型,開展電力變壓器運維數(shù)據(jù)的命名實體識別和關(guān)系抽取,提出基于知識圖譜的電力變壓器運維策略。
本文基于以上研究基礎(chǔ),通過梳理分析輸變電工程評審業(yè)務(wù)流程,提出基于知識圖譜的智能輔助評審體系架構(gòu),從知識圖譜構(gòu)建和圖譜解析推理等方面分析了系統(tǒng)實現(xiàn)所需關(guān)鍵技術(shù),最后介紹基于知識圖譜的輸變電工程輔助評審系統(tǒng)在工程中的應(yīng)用,為新型電力系統(tǒng)構(gòu)建和數(shù)字化轉(zhuǎn)型背景下輸變電工程建設(shè)提供技術(shù)支撐。
輸變電工程評審是工程建設(shè)階段的關(guān)鍵環(huán)節(jié)之一,其工作質(zhì)量對電網(wǎng)建設(shè)工作的設(shè)備選擇、工程量計算和造價產(chǎn)生直接影響。與一般民建工程相比,輸變電工程評審更加嚴格,可研階段增加了設(shè)計審查環(huán)節(jié);初步設(shè)計階段需要對全部電壓等級工程組織設(shè)計審查,而非特殊工程或達到一定規(guī)模的工程;施工圖階段重點關(guān)注土建相關(guān)部分,由同一圖審部門進行評審。另外,國家電網(wǎng)有限公司還會對重大工程,如特高壓工程及部分常規(guī)工程組織全專業(yè)施工圖審查工作。輸變電工程評審主要內(nèi)容包括初步設(shè)計評審(含概算、技術(shù)規(guī)范書、安穩(wěn)專題等)、施工圖評審(含預(yù)算、重大設(shè)計變更等)、相關(guān)專題評審等。涉及電氣一次、電氣二次、線路結(jié)構(gòu)、土建等多個領(lǐng)域,具有專業(yè)性強、流程復雜、對評審人員的經(jīng)驗要求高等特點。
輸變電工程評審需要相關(guān)電力設(shè)計院和工程評審單位共同完成,具體流程如圖1所示,其中評審資料的收集驗證、各專業(yè)評審、評審意見形成、工程資料歸檔入庫是所有工作的重點。由于評審資料多為非結(jié)構(gòu)化文本數(shù)據(jù)和圖紙類文件,為了提高評審效率,充分利用歷史工程數(shù)據(jù)及評審成果,需在總結(jié)專家經(jīng)驗基礎(chǔ)上,提出輸變電工程評審關(guān)鍵要素,為輔助評審平臺建設(shè)提供支撐。
圖1 輸變電工程評審流程圖
根據(jù)不同的工程實際情況,輸變電工程評審主要包括變電、架空線路及電纜工程評審,主要依據(jù)現(xiàn)行的國家、行業(yè)及企業(yè)標準,例如《國家電網(wǎng)公司輸變電工程通用造價》《電力建設(shè)工程裝置性材料預(yù)算價格》《國家電網(wǎng)公司輸變電工程通用設(shè)計》《國家電網(wǎng)公司基建技術(shù)經(jīng)濟管理規(guī)定》《國家電網(wǎng)公司輸變電工程初步設(shè)計審批管理辦法》《國務(wù)院關(guān)于調(diào)整和完善固定資產(chǎn)投資項目資本金制度的通知》《國家電網(wǎng)公司輸變電工程初步設(shè)計內(nèi)容深度規(guī)定》《電網(wǎng)工程建設(shè)預(yù)算編制與計算標準》等。結(jié)合現(xiàn)有標準規(guī)范、專家經(jīng)驗和工程實際情況,共總結(jié)出54個大類指標,共189個二級指標,其部分內(nèi)容如表1—3所示。
表1 變電工程評審要素
表2 架空線路工程評審要素
表3 電纜線路工程評審要素
構(gòu)建輸變電工程輔助評審系統(tǒng),一方面要充分利用現(xiàn)行國家標準、行業(yè)標準、企業(yè)標準及歷史評審經(jīng)驗,另一方面要避免專家個人經(jīng)驗的局限性和傾向性。要實現(xiàn)業(yè)務(wù)需求和數(shù)據(jù)基礎(chǔ)的兼顧,關(guān)鍵在于從大量低價值密度數(shù)據(jù)中抽取出高價值數(shù)據(jù),同時保證數(shù)據(jù)準確性和完整性,構(gòu)建結(jié)構(gòu)化數(shù)據(jù)庫,服務(wù)于檢索、問答等基本業(yè)務(wù)功能。另外,考慮到電網(wǎng)工程各項技術(shù)參數(shù)和設(shè)計規(guī)范的不斷優(yōu)化更新,輔助評審系統(tǒng)的數(shù)據(jù)模型應(yīng)具備自適應(yīng)更新升級能力,并能夠處理好新數(shù)據(jù)模型與舊數(shù)據(jù)模型之間的關(guān)系,從而得到更加完備準確的數(shù)據(jù)庫,支撐評審平臺上層應(yīng)用。
本文提出基于知識圖譜的輸變電評審系統(tǒng)架構(gòu),如圖2所示,重點在于基于結(jié)構(gòu)化數(shù)據(jù)形成知識圖譜,推動數(shù)據(jù)和業(yè)務(wù)需求的高度融合,提高輸變電工程歷史數(shù)據(jù)利用價值,達到提質(zhì)增效的目的。系統(tǒng)架構(gòu)主要由五個組件構(gòu)成:原始數(shù)據(jù)接入組件、人工智能平臺組件、知識圖譜組件、應(yīng)用場景組件及其他輔助組件,通過設(shè)計報告、專題報告等各類數(shù)據(jù)的安全接入、存儲與綜合管理,輔助評審業(yè)務(wù)工作開展。
圖2 基于知識圖譜的輸變電輔助評審系統(tǒng)框架圖
1)原始數(shù)據(jù)接入組件。該組件實現(xiàn)從業(yè)務(wù)系統(tǒng)、數(shù)據(jù)中臺或線下采集輸變電工程評審所需數(shù)據(jù),并通過數(shù)據(jù)接口安全可靠地將數(shù)據(jù)接入到人工智能平臺中去。根據(jù)以上對輸變電工程評審業(yè)務(wù)的分析可知,需要提交分析的數(shù)據(jù)資料包括初步設(shè)計報告、專題報告、設(shè)備清冊等文本數(shù)據(jù)。目前,國網(wǎng)經(jīng)濟技術(shù)研究院有限公司已經(jīng)建設(shè)完成了基建全過程綜合數(shù)字化管理平臺,從數(shù)據(jù)收集、接口設(shè)計、數(shù)據(jù)字典等多個方面對數(shù)據(jù)的匯集、整理、傳輸做了詳細的要求和規(guī)定,可以為輸變電輔助評審平臺提供數(shù)據(jù)接入服務(wù)。為保證數(shù)據(jù)傳輸?shù)慕y(tǒng)一性和規(guī)范性,接口API仍采用基建全過程綜合數(shù)字化管理平臺數(shù)據(jù)貫通實施方案,即面向不同數(shù)據(jù)結(jié)構(gòu)類型,去掉適用于進行流媒體類的視頻直播、回放等場景的第5類接口,使用簡化的4類接口傳輸結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。
2)人工智能平臺組件。該組件主要實現(xiàn)人工智能模型的管理、訓練和樣本的存儲等功能。其作用是使用業(yè)務(wù)、專家團隊預(yù)先標注的樣本對訓練語言預(yù)訓練模型,得到適用于輸變電工程評審的命名實體識別模型、關(guān)系抽取模型等服務(wù)于知識圖譜構(gòu)建和應(yīng)用的人工智能模型。
3)知識圖譜組件。知識圖譜組件是輸變電工程輔助評審系統(tǒng)的核心,主要承擔完成評審原始數(shù)據(jù)的接入、知識建模、數(shù)據(jù)存儲、可視化及相關(guān)基于圖數(shù)據(jù)的推理分析等功能。該組件將經(jīng)過評審專家分析的、通過眾包形成的大量包含歷史工程知識的文本數(shù)據(jù)通過數(shù)據(jù)清洗、知識抽取、知識表示等流程,形成準確度較高的結(jié)構(gòu)化數(shù)據(jù),并以知識圖譜的形式,使用Neo4j、GraphDB、ArangoDB等圖數(shù)據(jù)庫進行存儲,并最終服務(wù)于可視化、語義檢索、知識推理、知識圖譜問答等應(yīng)用。根據(jù)細分的不同業(yè)務(wù)需求,返回的數(shù)據(jù)通過RESRful API、SDK、WebService、HTML等服務(wù)接口傳遞給不同用戶,并支持不同終端、不同業(yè)務(wù)部門高并發(fā)訪問。
4)其他組件。同一電壓等級輸變電工程已有典型設(shè)計規(guī)范,但最終設(shè)計文件的編制,不同設(shè)計院仍有自己的標準和習慣,這也就導致需要不同的輔助模塊以應(yīng)對多種不同的情況。例如,需要OCR模塊對PDF文件進行預(yù)處理,提取出文件中的字符;自然語言處理(natural language processing,NLP)模塊對使用自然語言的訪問需求進行理解和分類,減少使用人員對系統(tǒng)內(nèi)在構(gòu)建機理的要求,降低系統(tǒng)操作的復雜度,擴大輸變電工程輔助評審系統(tǒng)的使用范圍。
輸變電工程輔助評審系統(tǒng)集數(shù)據(jù)收集、處理、建模、傳輸、應(yīng)用為一體,依托知識圖譜構(gòu)建、解析推理等關(guān)鍵技術(shù)作為數(shù)據(jù)處理的核心手段,滿足輸變電工程評審數(shù)據(jù)關(guān)聯(lián)信息抽取、技經(jīng)指標糾錯、工程綜合評分等典型需求,對于實現(xiàn)評審業(yè)務(wù)的數(shù)字化和智能化具有重要意義。
2.2.1 知識圖譜構(gòu)建技術(shù)
知識圖譜的本質(zhì)是一種結(jié)構(gòu)化的語義網(wǎng)絡(luò),主要用于描述物理世界的各種概念、實體以及他們之間的相互關(guān)系。知識圖譜主要采用資源描述框架(resource description framework,RDF)來進行標識,形式上可以表示為SPO三元組,即A=(S,P,O),其中S代表主語(subject),O代表賓語(object),P代表謂語(predicate)。知識圖譜的構(gòu)建過程通常分為模式層和數(shù)據(jù)層兩部分。模式層的構(gòu)建方法主要分為自頂向下、自底向上和兩者的混合方式,輸變電輔助評審系統(tǒng)知識圖譜屬于垂直領(lǐng)域知識圖譜,具有專業(yè)性強、術(shù)語更新快等特點,通常采用混合方式構(gòu)建。數(shù)據(jù)層的構(gòu)建方式可依據(jù)數(shù)據(jù)的特點而定,通常情況下,對于結(jié)構(gòu)化程度較高的設(shè)備清冊等表格類文件可采用正則表達式或規(guī)則抽取的方法,而對非結(jié)構(gòu)化的初步設(shè)計說明書等文件,則需要使用命名實體識別、關(guān)系抽取、實體消歧等自然語言處理技術(shù)提取數(shù)據(jù)文件中的知識,并進行知識建模。本文基于專家經(jīng)驗提出了面向輸變電工程評審的知識圖譜構(gòu)建總體框架圖,如圖3所示。該框架主要包括圖譜模式層、數(shù)據(jù)處理層和圖譜構(gòu)建層。
圖3 面向輸變電工程評審的知識圖譜構(gòu)建技術(shù)框架圖
1)圖譜模式層:由變電工程模式層、架空線路模式層和電纜線路模式層組成,主要負責為知識圖譜提供本體架構(gòu)。這些本體架構(gòu)通常來源于專家評審經(jīng)驗和歷史工程建設(shè)實踐,可以為知識圖譜的本體抽取、關(guān)系抽取的訓練提供標簽集。當新型設(shè)備設(shè)施引入電網(wǎng)后,受益于知識圖譜可拓展性較強的特點,只需在模式層構(gòu)建新的概念和關(guān)系,即可方便引入新的技術(shù)。
2)數(shù)據(jù)處理層:由輸變電工程評審中實際處理的氣象等結(jié)構(gòu)化數(shù)據(jù)、初設(shè)說明書等非結(jié)構(gòu)化數(shù)據(jù)和設(shè)備清冊等半結(jié)構(gòu)化數(shù)據(jù)組成數(shù)據(jù)源,為知識圖譜構(gòu)建提供數(shù)據(jù)準備。由于這些數(shù)據(jù)通常來源于各電力設(shè)計院,數(shù)據(jù)量較大,數(shù)據(jù)冗余程度較高,且往往存在一定程度的數(shù)據(jù)缺失和錯誤等問題,同時會存在PDF格式的文件數(shù)據(jù),因此有必要使用OCR技術(shù)識別文檔中的字符,然后通過數(shù)據(jù)挖掘、神經(jīng)網(wǎng)絡(luò)技術(shù)對生數(shù)據(jù)進行數(shù)據(jù)清洗,最后針對特高壓工程等工程數(shù)量少的典型輸變電工程進行文本增強,擴大樣本數(shù)量,為后續(xù)知識圖譜應(yīng)用提供良好的數(shù)據(jù)基礎(chǔ)。例如經(jīng)過OCR技術(shù)后的某段非結(jié)構(gòu)化數(shù)據(jù)為:“系統(tǒng)接入方案:本工程特高壓站擴建2×3 000 MVA主變,本期無新增 1 000 kV及500 kV出線;為降低短路電流,變電站500 kV母線分列運行,至A地2回、B地2回出線在一段母線運行;至C地2回、D地2回出線在另一段母線運行。后續(xù)需結(jié)合‘十四五’電網(wǎng)規(guī)劃,進一步研究論證降低該地特高壓站及周邊 500 kV 站點短路電流的措施?!边@段文本數(shù)據(jù)充分說明了該特高壓變電站的工程類型、系統(tǒng)接入方案及后續(xù)工作需要注意的情況。
3)圖譜構(gòu)建層:圖譜構(gòu)建層是輸變電工程輔助評審系統(tǒng)中負責圖譜生成、管理及更新的模塊,主要從已經(jīng)清洗好的數(shù)據(jù)中按照模式層的指導提取出相關(guān)的工程知識,形成結(jié)構(gòu)化的知識圖譜。由于從海量數(shù)據(jù)中人工抽取數(shù)據(jù)耗時長、準確率不高,采用基于自然語言處理的計算機自動處理技術(shù)成為了抽取結(jié)構(gòu)化知識的首選方法。針對現(xiàn)有語言預(yù)訓練模型對樣本庫敏感的特點,首先需要通過眾包、正則表達式等方式從結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中構(gòu)建樣本庫,然后采用實體抽取、關(guān)系抽取、屬性抽取等知識建模的方式從輸變電工程文本數(shù)據(jù)中抽取結(jié)構(gòu)化知識,便于形成變電工程知識圖譜、架空線工程知識圖譜、電纜工程知識圖譜和典型設(shè)計知識圖譜,其中典型設(shè)計圖譜不同于其他三類歷史數(shù)據(jù)知識圖譜,是一種規(guī)范化、樣本化的子圖,體現(xiàn)了輸變電工程設(shè)計專家的經(jīng)驗。知識圖譜完善模塊可以促進知識圖譜的演進,提取新的特征,挖掘缺失實體并補充完成他們之間的關(guān)系,形成新的工程建設(shè)知識。
2.2.2 基于知識圖譜的解析推理技術(shù)
基于知識圖譜的解析推理技術(shù)主要由關(guān)鍵信息解析和推理兩部分組成。其中關(guān)鍵信息解析指的是將知識圖譜中存儲的設(shè)備、屬性、工程規(guī)模等信息通過檢索提取出來的技術(shù),這項技術(shù)的實現(xiàn)有助于對錯誤信息進行比對和糾錯,從而減少工程評審中人工信息查找所需要的時間。為了擴大變電工程輔助評審系統(tǒng)的用戶范圍,讓缺少計算機相關(guān)知識的專家也能順暢使用該系統(tǒng),在關(guān)鍵信息檢索技術(shù)的前端通常會增加自然語言識別系統(tǒng),將專家使用的自然語言處理形成關(guān)鍵詞,投入到基于知識圖譜的數(shù)據(jù)庫的查詢系統(tǒng)中,常用的自然語言處理前端可以是以BERT為基礎(chǔ)的預(yù)訓練語言模型,也可以使用ChatGPT等新技術(shù)?;谥R圖譜的推理主要是通過圖神經(jīng)網(wǎng)絡(luò)等基于圖的深度學習網(wǎng)絡(luò),結(jié)合正則表達式,對新建工程與歷史工程的關(guān)鍵信息進行比對、相似度查詢和匹配,并通過典型設(shè)計等案例進行分析和處理。
本文所提基于知識圖譜的輸變電工程輔助評審系統(tǒng)架構(gòu)借鑒了國網(wǎng)經(jīng)濟技術(shù)研究院設(shè)計評審管理系統(tǒng),更新了后臺數(shù)據(jù)庫模式為知識圖譜圖數(shù)據(jù)庫結(jié)構(gòu),建設(shè)完成后可以滿足關(guān)鍵指標糾錯、修改建議生成和知識圖譜質(zhì)量分析等典型應(yīng)用需求。
輸變電工程關(guān)鍵指標糾錯指的是依據(jù)相關(guān)的設(shè)計規(guī)范和工程實際,對電力設(shè)計院提交文件的關(guān)鍵信息進行全面的梳理分析,及時快速提出可能影響工程實施的問題,為專家人工評審提供參考。輸變電工程評審需要關(guān)注的關(guān)鍵問題包括設(shè)計深度是否達標、基建標準化應(yīng)用程度是否達標、建設(shè)規(guī)模與核準規(guī)模是否一致、投資概算是否合理、新技術(shù)應(yīng)用情況等[35]。目前,現(xiàn)有的評審關(guān)鍵指標糾錯方法主要還是以人工糾錯為主,對專家經(jīng)驗的依賴程度較高,因此探索使用輔助評審系統(tǒng)將可能存在的問題提前梳理出來,交由各領(lǐng)域的專家進行二次審核能夠大大減小專家的工作量,提高工作效率。
綜合分析上述輸變電工程可能存在的問題,可以將其分為兩類:指標類問題和合規(guī)性問題。指標類問題涉及工程規(guī)模、設(shè)備選擇、設(shè)備參數(shù)等問題,可以簡單地從數(shù)據(jù)中提取關(guān)鍵信息后與歷史工程或規(guī)范文件進行比對,從而得到準確的結(jié)果。合規(guī)性問題包括投資概算是否合理、新技術(shù)新材料的應(yīng)用情況等問題,這些問題受特定工程自然條件、設(shè)備及工人工資等因素的影響,與歷史工程數(shù)值可能產(chǎn)生一些偏差,因此只要數(shù)值在一定范圍內(nèi)或滿足一定的發(fā)展趨勢均可視為正常。從知識圖譜的角度看,指標類問題通??梢钥醋鲗嶓w或?qū)傩约m錯的問題,可以通過預(yù)先定義關(guān)鍵指標集,通過檢索和與歷史數(shù)據(jù)或規(guī)范類文件比對的方式解決,需要注意的是由于不同設(shè)計院慣用的命名規(guī)則均有所不同,所以在對特定指標進行對比之前,需要通過本體層構(gòu)建的數(shù)據(jù)字典進行實體對齊,保證數(shù)據(jù)的完整性;合規(guī)類問題不僅僅需要對指標進行單獨判斷,還需要對工程概況有深入理解,因此可以將工程基本信息看作子圖,進行圖嵌入學習,從而得到較多的特征值,同時可以使用正則表達式的方式引入專家經(jīng)驗,對關(guān)鍵指標進行聚類分析,從而得到可能存在的合規(guī)類問題,提交專家審核。
修改建議生成是輸變電工程評審后的一項工作,是面向電力設(shè)計院的一項服務(wù)。目前主要以評審會后的會議紀要為主要依據(jù),由專家編寫生成,通常包括工程信息概況、問題說明和修改建議等多個部分。其中工程信息概況需要提取多專業(yè)關(guān)鍵信息,問題說明通常會指出數(shù)據(jù)中存在的錯誤和位置,而修改建議需要總結(jié)上述所有信息,對工程給出一個總結(jié)性概括說明。輸變電工程輔助評審系統(tǒng)修改建議生成功能展示如圖4所示。
圖4 輸變電工程輔助評審系統(tǒng)修改建議生成功能展示
綜合以上分析,修改建議生成需要知識圖譜檢索技術(shù)、語義槽填充技術(shù)和自然語言理解生成技術(shù)。利用知識圖譜的快速檢索特性,將檢索到的工程概況信息和電氣一次、電氣二次、土建消防等各專業(yè)的關(guān)鍵信息提取出來,利用預(yù)先定義的語義槽填入會議紀要中,最后基于自然語言生成技術(shù)產(chǎn)生對該工程的修改建議。該技術(shù)框架中對工程信息的準確理解和對專家意見傾向的明確分類是修改建議生成的基礎(chǔ)和前提,因此,構(gòu)建準確性高、泛化能力強的輸變電工程輔助評審預(yù)訓練模型是該領(lǐng)域研究的重點和難點。
目前對知識圖譜的質(zhì)量、效能的研究仍然較少,尚未形成統(tǒng)一的國際標準。由于知識圖譜是由模式、實體、屬性三類對象及其之間的關(guān)聯(lián)關(guān)系組成的,因此對知識圖譜質(zhì)量的評判主要也是面對幾類對象分別進行的。從數(shù)據(jù)的角度看,知識圖譜的準確性、一致性、完整性和時效性可以作為評判知識圖譜質(zhì)量的四個要素。其中準確性考察知識的準確度,由于從原始數(shù)據(jù)中獲取的知識往往存在不可避免的錯誤,因此可以通過抽樣的方式對已建成的知識圖譜的準確度進行分析;一致性衡量的是知識圖譜中知識表達是否一致,是否存在矛盾的知識;完整性考量的是已建成的知識圖譜是否能夠完整覆蓋輸變電工程建設(shè)輔助評審業(yè)務(wù);時效性側(cè)重考察知識是否是最新的,我國電網(wǎng)建設(shè)工程的電壓等級不斷提高,隨之而來的新設(shè)備和新技術(shù)也應(yīng)及時體現(xiàn)在知識圖譜的模式層和數(shù)據(jù)層中。
通過梳理輸變電工程評審業(yè)務(wù)的主要流程和業(yè)務(wù)要素,本文以知識圖譜為關(guān)鍵技術(shù),設(shè)計了面向工程實際的輔助評審體系架構(gòu)。該框架集數(shù)據(jù)收集、人工智能模型訓練、知識圖譜模型生成為一體,可以實現(xiàn)自上而下的數(shù)據(jù)模式層設(shè)計和自下而上的數(shù)據(jù)抽取及價值挖掘。最后,文章從關(guān)鍵指標糾錯、修改建議生成和圖譜質(zhì)量分析三個方面對評審典型業(yè)務(wù)需求進行了梳理,為平臺的落地應(yīng)用提供了技術(shù)參考。