国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于三維知識超圖的電力智庫知識服務平臺建設

2022-07-04 00:06李豪周爽
智庫理論與實踐 2022年3期
關鍵詞:知識圖譜

李豪 周爽

摘要:[目的/意義]針對電力智庫情報信息獲取不全面、邏輯關聯(lián)提取困難等問題,為電力企業(yè)量身打造電力智庫知識服務平臺。[方法/過程]本文通過對內(nèi)部信息和外部情報的全方位采集,搭建電力智庫知識庫,并以知識圖譜為基礎,引入知識超圖概念,提出電力智庫三維知識超圖架構,從而實現(xiàn)知識多維度提取關聯(lián),適應智庫研究思路,挖掘數(shù)據(jù)價值。[結(jié)果/結(jié)論]針對電力智庫研究需求,本文搭建了電力智庫知識服務平臺,為智庫研究提供知識搜索、知識問答、智能推薦、輔助決策等功能,為智庫研究提供有效信息指導和思路指引。

關鍵詞:電力智庫? ? 知識圖譜? ? 知識超圖? ? 知識平臺? ? 知識推理

分類號:TM181

DOI: 10.19318/j.cnki.issn.2096-1634.2022.03.10

1? 引言

面對我國政策環(huán)境的不斷變化,科學技術飛速發(fā)展,能源變革加快轉(zhuǎn)型,各大企業(yè)、組織和機構開始建立專門智庫,電力企業(yè)對智庫服務的需求越來越突出。國家電網(wǎng)有限公司(以下簡稱“國網(wǎng)公司”)在智庫建設方面積極探索,組建了以電力科學研究院、能源研究院、電力經(jīng)濟技術研究院等研究機構為中心的智庫體系,智庫研究蓬勃發(fā)展。智庫建設作為提升企業(yè)軟實力的重要手段,逐漸得到了各電力公司和相關企業(yè)部門的高度重視。提升智庫服務能力對助推電網(wǎng)企業(yè)發(fā)展起著重要作用[1]。明確企業(yè)智庫的戰(zhàn)略定位,將智庫研究從內(nèi)部視角轉(zhuǎn)向外部視角有利于企業(yè)智庫健康發(fā)展[2]。知識資源是智庫生存和發(fā)展的關鍵,構建全面、準確、前沿的知識庫是智庫研究的堅實基礎[3-4]。以往的智庫研究依賴人工情報收集和專家知識經(jīng)驗,人工智能技術的應用可以幫助智庫的構建從“經(jīng)驗驅(qū)動”轉(zhuǎn)變?yōu)椤皵?shù)據(jù)驅(qū)動”,為智庫研究人員提供多元化的數(shù)據(jù)支撐,增強研究成果的科學性和有效性。

知識圖譜(knowledge graph,KG)是指將知識工程、人工智能技術與傳統(tǒng)的數(shù)據(jù)庫概念相結(jié)合而構成的智能知識庫,能夠囊括多元化數(shù)據(jù),同時對數(shù)據(jù)進行智能化管理、探索、挖掘[5],進而提供智能搜索、智能問答、智能推薦以及智能決策等[6-7]定制化功能,已逐步在金融、公安、醫(yī)療等行業(yè)廣泛應用[8-10]。電力行業(yè)也在調(diào)度、營銷、運檢等專業(yè)領域開展了知識圖譜相關技術的研究和應用[11-13]。針對我國電力物聯(lián)網(wǎng)的數(shù)據(jù)特征,蒲天驕等[14]提出了一種基于NoDKG(Not only Domain-specific Knowledge Graph)思想的電力領域知識圖譜應用框架設計,并闡述了在客服、調(diào)度、運檢業(yè)務上的應用設計。目前,知識圖譜在電力行業(yè)的應用主要集中在業(yè)務數(shù)據(jù)可視化展示、業(yè)務數(shù)據(jù)管理分析和電網(wǎng)故障處理檢索分析等領域。宋厚巖[15]依托“某電網(wǎng)公司全業(yè)務數(shù)據(jù)智能管控平臺”,采用基于知識圖譜的圖數(shù)據(jù)庫,搭建電力系統(tǒng)知識圖譜,通過搜索引擎展示電力系統(tǒng)知識圖譜;呂夢平等[16]針對風電數(shù)據(jù)分散且無法統(tǒng)一管理應用等問題,提出了一種用知識圖譜管理風電數(shù)據(jù)的方法,通過構建風電數(shù)據(jù)全景知識圖譜,實現(xiàn)了不同類型和業(yè)務數(shù)據(jù)間的貫穿統(tǒng)一;郭成等[17]提出面向低壓配電網(wǎng)絡拓撲知識圖譜的構建方法與檢索分析方法,采用基于子圖匹配的檢索方法對電網(wǎng)故障圖譜進行檢索分析,能夠高效地搜索分析出發(fā)生故障的原因以及處理措施。

電力智庫知識采集需要從能源電力角度出發(fā),延伸至政策環(huán)境、市場導向、民生需求等各個方面,目前主要是人工采集、篩選和分析政策情報及相關文件,主觀性較強,且存在信息采集不全面、知識碎片化、知識零散化等問題,現(xiàn)有的通用知識圖譜無法滿足電力智庫研究需求。從應用目標出發(fā),可以將知識圖譜分為通用知識圖譜(common knowledge graph)和垂直知識圖譜(vertical domain knowledge graph)[18]。相對于通用知識圖譜,垂直領域知識圖譜能夠更精準、全面地服務于特定專業(yè)領域,深度挖掘知識邏輯關系。垂直領域知識圖譜能夠較好地適應電力智庫專業(yè)化、開放化、多元化、扁平化和邊界模糊化的發(fā)展趨勢。

電力智庫知識服務平臺是針對電力智庫研究內(nèi)容和特點量身打造的,能夠?qū)崿F(xiàn)電力內(nèi)部信息以及外部情報知識的有效獲取、精準分類、關聯(lián)關系、關鍵信息提取和智能分析推理等功能,為智庫研究工作提供前沿、熱點、全面且精準的數(shù)據(jù)信息。

2? 電力智庫知識庫構建

電力智庫知識庫的構建是電力智庫知識服務平臺的基礎,也是電力智庫研究的根本。電力智庫知識庫的有效性、全面性、針對性和實時性關系到知識體系服務平臺的服務水平,也會影響到后續(xù)電力智庫研究工作的準確性和有效性。

構建電力智庫知識庫主要包括信息源獲取、知識提取、知識融合、知識更新等過程。具體見圖1。

2.1? 信息源分類及獲取

詹姆斯·麥甘[19]指出:“知道最好的信息源在哪里,從中分析高質(zhì)量信息,信息體現(xiàn)價值,是智庫高質(zhì)量建設的基本要求?!闭鎸?、客觀、有效的信息源是智庫研究的基礎,對智庫研究起到重要的支撐作用。構建電力智庫知識庫,首先要進行相關資料的采集,包括數(shù)據(jù)、文字、圖表以及其他媒體資源,涉及結(jié)構化、半結(jié)構化、非結(jié)構化多元化數(shù)據(jù)信息。為了保證電力智庫研究需求,電力智庫知識庫不僅包括國際、國家、行業(yè)等頂層信息,還需要下沉至省、市、區(qū)縣,以及企業(yè)、部門、專業(yè)等。針對電力智庫研究的領域?qū)I(yè)性,信息來源可分為內(nèi)部信息源和外部信息源兩方面。內(nèi)、外部信息相結(jié)合,兼顧了內(nèi)部信息的專業(yè)化和外部信息的多樣化(見圖2)。

2.1.1? 內(nèi)部信息? ? ?內(nèi)部信息來源于公司內(nèi)部網(wǎng)站,包括國網(wǎng)公司總部及各網(wǎng)省公司、直屬公司通過內(nèi)網(wǎng)發(fā)布的文件、標準、通知、會議紀要,項目的技術規(guī)范、可行性研究報告、驗收報告以及公司內(nèi)網(wǎng)發(fā)布的媒體新聞報道。內(nèi)部信息主要為半結(jié)構化信息,需要后續(xù)對信息進行分類整理、主題標簽標注、關鍵詞句信息提取。其中,內(nèi)部網(wǎng)站發(fā)布的新聞報道和研究報告是電力智庫內(nèi)部信息源的重要組成部分,公司新聞報道,包括推動先進理念、先進技術落地實踐、理論及應用研究成果、中藥會議宣貫等內(nèi)容,提供電力智庫研究所需的企業(yè)內(nèi)部動態(tài)信息。在內(nèi)部網(wǎng)站中提供非常有價值的研究報告,供國網(wǎng)公司內(nèi)部單位免費下載。國網(wǎng)江蘇省電力公司為加強對地方智庫研究工作的指導和與之的交流合作,運用信息化手段打通地市層面信息數(shù)據(jù)接口,定期匯集各地市公司內(nèi)部情報信息,及時掌握第一手資料。328914AB-F61E-4124-8E19-47EC583A36D2

2.1.2? 外部信息? ? 外部信息涉獵廣泛,主要來源于互聯(lián)網(wǎng),可分為經(jīng)濟發(fā)展、政策與形勢、行業(yè)發(fā)展動態(tài)、企業(yè)經(jīng)營發(fā)展等多種層級。其中,經(jīng)濟發(fā)展和政策與形勢信息主要來源于中共中央組織部、國家發(fā)展改革委、工業(yè)和信息化部、生態(tài)環(huán)境部、國家能源局等政府組織機構在官方渠道公開發(fā)布的文件,包括文、函、意見、通知、公告、政策報告等,也包括從新華網(wǎng)、人民網(wǎng)等官方媒體發(fā)布的新聞報道;行業(yè)發(fā)展動態(tài)信息主要來源于行業(yè)權威網(wǎng)站發(fā)布的官方消息;企業(yè)經(jīng)營發(fā)展動態(tài)信息主要來源于大型能源企業(yè)官網(wǎng)發(fā)布的新聞及官方消息,電力企業(yè)也會通過官方渠道,發(fā)布公眾可見的研究成果,包括發(fā)布具有企業(yè)和行業(yè)特色的研究報告,以專業(yè)視角解讀政策及產(chǎn)業(yè)發(fā)展。前沿研究成果論述除了從中國知網(wǎng)、萬方等學術數(shù)據(jù)庫獲取以外,也可借助新媒體平臺,從官方微博、微信公眾號獲取企業(yè)和相關專家的最新研究成果和思想理論。外部信息類型豐富,且時效性極強,不僅要保證信息獲取的全面性和準確性,還需要保證信息的時效性。

2.2? 知識庫信息源特點

為了更好地服務于電力智庫研究,電力智庫知識庫中的信息源應具備以下特點:

(1)特定信息內(nèi)容應從特定來源獲取,如政策文件應從政府部門網(wǎng)站上獲取,論文、專利、著作從中國知網(wǎng)、萬方等學術數(shù)據(jù)庫獲取;

(2)避免重復采集信息,保證信息的獨一性、實時性、真實性和有效性;

(3)信息數(shù)據(jù)類型包括結(jié)構化、半結(jié)構化、非結(jié)構化等多元形式,涵蓋內(nèi)部數(shù)據(jù)、外部數(shù)據(jù)全口徑;

(4)信息源精益化管理,對信息源自動學習歸類、智能關聯(lián),輔助實現(xiàn)對實體關系的精準理解。

2.3? 標簽定義

電力智庫知識庫涉及廣泛,包含能源電力相關知識情報信息,政治、經(jīng)濟等環(huán)境形勢,以及相關技術領域發(fā)展追蹤。對知識庫實體進行標簽定義有利于知識庫資源管理,為實體間邏輯關系、知識挖掘提供豐富的數(shù)據(jù)管理基礎。電力智庫知識庫標簽采用元數(shù)據(jù)定義,是一種描述實體/屬性數(shù)據(jù)的數(shù)據(jù),能夠?qū)崿F(xiàn)信息資源的有效發(fā)現(xiàn)、查找、管理和追蹤。標簽提取基于模板的元數(shù)據(jù)解析方法,對于一些網(wǎng)站、專業(yè)數(shù)據(jù)庫論壇、微博、新聞網(wǎng)評等,采用簡易信息聚合(Really Simple Syndication,RSS)實現(xiàn)內(nèi)容傳播,在提取正文信息的同時,可以直接提取標題、作者、發(fā)表日期、分類、關鍵詞、信息來源等更加豐富的元數(shù)據(jù)信息;對于中國知網(wǎng)、萬方、維普等各類專業(yè)數(shù)據(jù)庫,以及政府部委官方網(wǎng)站文件、能源企業(yè)官方文章等,能夠解析出屬于能源電力涉及的元數(shù)據(jù)屬性,包括信息主題、關鍵詞、發(fā)布機構、發(fā)布時間、點擊數(shù)、引用次數(shù)等;對于公司內(nèi)部發(fā)布的文件,可以提取的文件形式,涉及單位部門、職責、時間、指標等關鍵詞。標簽定義功能支持個性化定制,根據(jù)需求針對性地采集數(shù)據(jù)庫中的部分字段信息,智能比對知識庫已有標簽和實體,并對標簽和實體進行自主學習擴充。

3? 電力智庫三維知識超圖

3.1? 知識預處理

電力智庫知識庫具有全覆蓋、多維性、復雜性、時間性、關聯(lián)性等特點,需要綜合運用多種數(shù)據(jù)挖掘技術和分析方法,對海量信息進行不同策略的知識提取,清洗篩選關鍵、有效的信息,進一步捕捉知識實體間的關系,構建事實本體。

構建知識圖譜[20]是捕捉海量知識實體間關聯(lián)關系的核心,以機器學習為基礎,通過大量的數(shù)據(jù)訓練學習,在海量信息中提取關鍵知識實體,對其進行抽取整合,對信息中的關鍵詞、信息來源、發(fā)布日期、引用、數(shù)字等數(shù)據(jù)項進行自動標注,從而實現(xiàn)實體之間的關系抽取。在采集過程中,電力智庫知識服務平臺可以根據(jù)自定義的數(shù)據(jù)格式確定知識提取范圍,自動過濾大量的冗余信息。

構建事實本體是將數(shù)據(jù)層映射到模型層的過程,如圖3所示,能夠使知識數(shù)據(jù)庫構建成結(jié)構化的知識圖譜,對知識進行統(tǒng)一管理。

電力智庫知識庫涉及領域廣泛,信息采集來源豐富,采用由數(shù)據(jù)驅(qū)動的以自底向上(Bottom-up)為主、以知識驅(qū)動的自頂向下(Top-down)為輔的構建方法。對于外部多元化信息,采用自底向上的構建方式,分析歸納底層結(jié)構信息,逐層向上形成知識本體;對于已有的電力領域知識系統(tǒng),采用自頂向下的構建方法,傳承電力智庫現(xiàn)有數(shù)據(jù)庫的相關經(jīng)驗知識,增強專業(yè)領域錯綜復雜情況下知識圖譜的魯棒性。

3.2? 構建三維知識超圖

知識圖譜中的每一個事實f可表示為一個三元組(v1, r, v2),其中v1, v2∈V,表示實體,r表示實體間的關系。而知識超圖是一種特殊的異構知識圖譜,一個事實可以被表示為多元組,基本單位是超關系事實fact=(r, v1, v2, …, vn},其中r∈R表示實體間的關系,vi∈V,表示實體。傳統(tǒng)的知識超圖普遍采用扁平化的組織架構,缺乏對時空和層級的表達,從而導致時空關系模糊,知識等級關系混亂。本文提出了一種電力智庫三維知識超圖架構,將電力智庫知識領域、頂層設計以及時空時序多維度聯(lián)合表示,能夠發(fā)現(xiàn)知識超圖中的隱式關系,使時空關系清晰明確、知識推理快捷可靠。

三維知識超圖可表示為G=(X, Y, Z, R),如圖4所示。其中,X是時間維度;Y是層級維度;Z是事實維度;R是關系集合。R={R(X,Y), R(X,Z), R(Y,Z),}表示三個維度之間的關系集合。其中,X是代表時間時序的連續(xù)坐標;Y是有序離散坐標,由人工定義層級屬性坐標點,包括中共中央辦公廳、國務院辦公廳、國家發(fā)展改革委、司法部、財政部、生態(tài)環(huán)境部、住房和城鄉(xiāng)建設部、交通運輸部、國家市場監(jiān)督管理總局等政府機構,省、自治區(qū)、直轄市行政區(qū)域,以及大型國企、大型私企、分公司等企業(yè)單位;Z是以事實為坐標點的離散坐標;關系集合R主要包括條件、組成、因果等邏輯推理關系。

圖4(a)表示在層級VYj不同時間與實事的映射關系,可得出某一層級在不同時刻關注事實的變化情況。例如,隨著時間的推移,國網(wǎng)公司從農(nóng)網(wǎng)改造、供電可靠性、電能質(zhì)量,到特高壓、新能源、全壽命、電能替代,再到現(xiàn)在的綠色電力、新型電力系統(tǒng)等關注事件領域的轉(zhuǎn)變。圖4(b)表示在時間VXi不同層級與實事的映射關系,可得出不同層級在某一時刻關注事實的分布情況。例如,2020年國家發(fā)展改革委關注點為電力市場、電價、電改等,國網(wǎng)公司關注點為電價、市場競爭力等,國網(wǎng)公司基層單位則更多關注線損、外力破壞、智能電表、用電信息采集等。圖4(c)表示事實VZk在不同層級與時間的映射關系,可得出不同層級對某一事實在不同時刻的關注變化情況。以“綠色建造”為例,2019年,住房和城鄉(xiāng)建設部部長王蒙徽提出了“綠色建造”,2020年住房和城鄉(xiāng)建設部印發(fā)《關于開展綠色建造試點工作的函》,并于2021年3月16日發(fā)布了《綠色建造技術導則(試行)》,湖南省作為綠色建造試點省份于2021年3月31日審議通過了《湖南省綠色建筑發(fā)展條例(草案)》,國網(wǎng)公司于2021年7月21日發(fā)布了《國家電網(wǎng)有限公司關于全面推進輸變電工程綠色建造的指導意見》,對于“綠色建造”這一事實,隨著時間變化,國家、部委、行業(yè)、企業(yè)等不同層級的關注度會有遷移。328914AB-F61E-4124-8E19-47EC583A36D2

為了發(fā)現(xiàn)知識超圖中的隱式關聯(lián),三維知識超圖架構在時序和層次兩個屬性進行三維擴充,能夠適應電力智庫對知識信息縱向關注情況以及橫向發(fā)展情況的研究特點,以及不同級別上下對比、歷史數(shù)據(jù)前后對比、相關行業(yè)橫向?qū)Ρ鹊戎菐煅芯糠绞?,進一步挖掘數(shù)據(jù)價值,同時提升知識庫管理邏輯水平,縮減推理查詢空間。

4? 電力智庫知識服務平臺架構設計

4.1? 電力智庫知識服務平臺總體架構

本文根據(jù)電力智庫的研究特點和實際需求,構建了電力智庫知識服務平臺(見圖5),使電力智庫知識庫能夠被用戶充分利用,為智庫研究提供數(shù)據(jù)支撐和輔助決策。

4.2? 知識發(fā)現(xiàn)獲取層

知識發(fā)現(xiàn)獲取層的主要功能是底層數(shù)據(jù)采集和預處理。數(shù)據(jù)信息源除了電力內(nèi)部運行數(shù)據(jù),更多的是政策經(jīng)濟環(huán)境、相關行業(yè)企業(yè)、涉及技術專業(yè)領域的情報知識,數(shù)據(jù)形式以半/非結(jié)構化文檔網(wǎng)頁數(shù)據(jù)為主。知識發(fā)現(xiàn)獲取層主要負責獲取、存儲原始數(shù)據(jù),并完成結(jié)構化數(shù)據(jù)解析,包括內(nèi)部的excel、json等文件導入、讀取以及結(jié)構化存儲;半/非結(jié)構化數(shù)據(jù)預處理,主要是對文本數(shù)據(jù)進行清洗和標準化,包括噪聲處理、詞匯規(guī)范化、對象標準化等。

4.3? 知識融合處理層

知識融合處理層是構建電力智庫知識庫的重要環(huán)節(jié),以零散、碎片化的底層數(shù)據(jù)為基礎,構建電力智庫三維知識超圖,形成電力智庫知識庫。知識融合處理層承載著自然語言處理、知識提取、知識融合加工等多項功能。其中,自然語言處理的主要任務是文本標注,包括語句分詞標注、語義判定、詞性標注以及語料內(nèi)容分類和主題歸納等深層處理,實現(xiàn)知識的深入理解和認知。在知識融合處理層規(guī)范采用圖數(shù)據(jù)庫存儲實體、屬性、關系,構成本體事實,形成多對多關系映射的三維知識超圖,構建邏輯關系強、可推理的電力知識庫。

4.4? 知識計算推理層

知識計算推理層負責提供上層應用所需的算法模型,包括表示學習、關系預測推理、圖譜搜索、路徑計算、線索推理等功能模塊。其中,“表示學習”能夠?qū)⒔邮盏降妮斎胄畔⑥D(zhuǎn)化為有效特征,實現(xiàn)對用戶的意圖感知;“關系預測推理”根據(jù)用戶的意圖推理不同邏輯關系的知識點;通過“圖譜搜索”能夠?qū)⒂脩粽埱鬁蚀_地對應到底層知識庫;“路徑計算”能夠利用輸入信息特征定制自適應學習路徑,提供最優(yōu)知識序列;“線索推理”可以進一步分析出熱點知識主題,提供主題脈絡和發(fā)展預測推理。

4.5? 知識展示應用層

知識展示應用層作為電力智庫知識服務平臺輸出的功能模塊,能夠與用戶開展有效交互,并與實際的應用場景對接,提供知識搜索、知識問答、智能推薦、輔助決策等功能模塊。其中,智能推薦能夠提供相關的熱點預測,追蹤研究發(fā)展動態(tài),為智庫研究思路提供方向指引,充分適應智庫研究的時效性和前瞻性。為不同類型的用戶設置訪問層級權限,內(nèi)置數(shù)據(jù)保密協(xié)議,僅公司內(nèi)部賬號能夠訪問內(nèi)部知識庫中有關電網(wǎng)運行的企業(yè)重要內(nèi)部數(shù)據(jù),避免數(shù)據(jù)泄露。

4.6? 結(jié)果反饋

平臺設置服務結(jié)果反饋溝通機制,統(tǒng)計用戶在知識展示應用層的用戶行為和服務反饋,包括熱門搜索主題、智能推薦點擊情況、知識問答用戶滿意度等,通過反饋結(jié)果持續(xù)優(yōu)化更新底層知識庫,提升智庫數(shù)據(jù)分析能力和知識庫自優(yōu)化能力,深度融合智庫研究需求,發(fā)現(xiàn)潛在需求和內(nèi)在規(guī)律,有針對性地提供主動型智庫知識服務。

5? 功能實現(xiàn)

5.1? 情報信息智慧捕捉

電力智庫知識服務平臺能夠?qū)崿F(xiàn)對最新發(fā)布的能源電力相關情報的智慧識別,持續(xù)捕捉更新,對原始信息情報篩選、分類、提煉和預處理,并支持以多種形式推薦展示。以某電力公司每周出版的“三分鐘閱讀”簡報為例,電力智庫知識服務平臺從知識庫最新捕捉的情報信息中,根據(jù)用戶需求定向獲取和提煉有效信息,根據(jù)技術趨勢變化和政策環(huán)境動態(tài)調(diào)整知識提取內(nèi)容,突出重點知識元,并進行可視化展示,如圖6所示。

5.2? 自定義結(jié)果輸出

為了能夠向用戶提供更加直觀、有效的知識展示,電力智庫知識服務平臺設置了自定義輸出模塊,該模塊能夠根據(jù)用戶期望的輸出文件,自動識別文件各部分內(nèi)容結(jié)構,生成結(jié)構模板。例如,某單位定期出版智庫研究專報和熱點追蹤等成果文件,其文檔結(jié)構與格式相對固定,電力智庫知識服務平臺能夠?qū)軜嬒鄬潭ǖ奈募M行智能學習分析,比對已有的知識庫,形成輸出結(jié)構模板,如定義、關鍵技術、應用情況、研究現(xiàn)狀、相關政策、專家觀點等,結(jié)構模板中的每一部分均能夠分別通過特定渠道自動獲取,調(diào)用模型計算生成結(jié)果,自動填補,形成用戶所需的輸出結(jié)果。

5.3? 知識信息精準檢索

通過電力智庫知識服務平臺,用戶能夠通過任意文本輸入,自動識別有效實體,通過信息抽取模型,從知識庫中提取相關內(nèi)部業(yè)務數(shù)據(jù)和外部情報信息實體,采用三維知識超圖架構,多維度深度推理實體間的邏輯關系。同時,通過結(jié)構化與非結(jié)構化數(shù)據(jù)處理以及自然語言處理技術,理解應對用戶問題,提供精準、有效的交互信息。

5.4? 研究主題智能推薦

電力智庫知識平臺能夠在自主學習過程中,從海量學術成果以及相關行業(yè)熱點新聞中,發(fā)掘主流智庫的研究主題和熱點話題,發(fā)現(xiàn)主題演化規(guī)律,進而發(fā)掘研究主題脈絡及發(fā)展動態(tài),為智庫研究提供科學、精準的方向指引。

6? 未來挑戰(zhàn)

知識數(shù)據(jù)是驅(qū)動智庫研究的堅實基礎,知識圖譜融合深度學習技術是知識工程的重要技術手段??v觀電力領域?qū)χR圖譜和知識工程應用的研究進展,電力智庫知識服務平臺的構建仍存在以下挑戰(zhàn)。

6.1? 混雜多源的數(shù)據(jù)提取與圖譜構建

電力智庫數(shù)據(jù)形式豐富,內(nèi)容多源異構,隨著相關行業(yè)媒體和自媒體的高速發(fā)展,信息迭代速度不斷提升,且伴有噪聲、冗余和歧義,導致電力智庫知識庫存在大量無用實體、屬性和關系,占據(jù)存儲空間和關系結(jié)構路徑,降低知識庫推理能力。隨著人工智能相關技術的不斷進步,知識庫構建過程的自動化程度和知識數(shù)據(jù)處理質(zhì)量將越來越高。因此,面向無監(jiān)督的智庫知識數(shù)據(jù)高效獲取、高效清洗、高效融合是構建電力智庫知識庫的一大挑戰(zhàn)。328914AB-F61E-4124-8E19-47EC583A36D2

6.2? 智能推理與輔助決策的深度應用

電力智庫知識服務平臺能夠提供模塊化、可擴展的功能服務,為了能夠提供滿足智庫研究實際需求的智能服務,需要對知識推理模型進行海量樣本的高質(zhì)量學習訓練,精準掌握事件之間的關系,準確研判事件的演化規(guī)律和發(fā)展態(tài)勢。如何基于圖譜分析技術高效利用知識庫資源,實現(xiàn)智能認知和智能推理,并結(jié)合人機交互,對推理結(jié)果需求進行準確的傳遞和反饋,形成輔助決策的推理結(jié)果,是電力智庫知識服務平臺的提升難點。

6.3? 第三方數(shù)據(jù)庫對接合作

目前,國內(nèi)外智庫建設已基本完成,并且多種不同專業(yè)領域的智庫數(shù)據(jù)庫應運而生。獲取可靠的第三方數(shù)據(jù)能夠大幅提升智庫知識庫構建效率,減輕數(shù)據(jù)采集負擔。社會上智庫種類、數(shù)量繁多,信息復雜性容易導致智庫數(shù)據(jù)庫與第三方信息不對稱。因此,如何與第三方數(shù)據(jù)庫對接合作,構成協(xié)同、高效的分布式智庫數(shù)據(jù)庫,仍需要進一步探討。

7? 結(jié)語

本文從電力智庫的研究特點出發(fā),以知識工程與人工智能為技術手段,建立兼顧內(nèi)部業(yè)務數(shù)據(jù)和外部情報信息的電力智庫知識庫,提出了創(chuàng)新性的三維知識超圖架構,通過對事實實體在時序和層級屬性的擴充,深度挖掘?qū)嶓w之間的隱式關聯(lián),并構建電力智庫知識服務平臺?;谌S知識超圖架構的電力智庫知識服務平臺,能夠適應電力智庫研究思路,有效解讀知識實體間的邏輯關系,有助于進行深層數(shù)據(jù)挖掘。電力智庫知識服務平臺有知識發(fā)現(xiàn)獲取層、知識融合處理層、知識計算推理層和知識展示應用層四層架構,具有情報信息智慧捕捉、自定義結(jié)果輸出、知識信息精準檢索以及研究主題智能推薦四項功能,實現(xiàn)“數(shù)據(jù)驅(qū)動”的“數(shù)據(jù)—知識—服務”流程,為電力智庫研究提供全面、精準、多樣化的知識指導和有效路徑指引。

需要指出的是,本文處于策劃建設階段,且仍存在一些不足之處:一方面,構建電力智庫知識庫對提升電力智庫知識服務平臺服務質(zhì)量起到至關重要的作用,內(nèi)部數(shù)據(jù)采集互聯(lián)、互通,外部信息獲取精準、及時、有效,構建電力智庫知識庫的具體手段和方式方法需要進一步確定,且需要在反復實踐應用中逐漸成熟;另一方面,三維超圖架構中“層級”維度無法完全通過智能算法定義,需要依賴人工判斷,對各維度屬性定義的質(zhì)量要求較高,需要進一步探索利用人工智能算法自適應學習屬性特征,智能定義多維度屬性的方法。此外,如何采用純智能算法快速構建高質(zhì)量電力知識超圖,進一步推進電力智庫知識服務平臺落地應用,是后續(xù)重要的研究方向。

參考文獻:

[1] 張飏, 韓向榮, 陳成, 等. 提升電網(wǎng)企業(yè)智庫服務能力策略研究[J]. 經(jīng)濟師, 2021(4): 275-276.

[2] 郭莉, 王樂, 沈高鋒. 企業(yè)智庫戰(zhàn)略定位研究: 從內(nèi)部視角轉(zhuǎn)向外部視角[J]. 智庫理論與實踐, 2020, 5(1): 16-21.

[3] 于旭, 項亞男. 社會智庫知識服務能力體系構建研究[J]. 情報雜志, 2021, 40(1): 98, 132-138.

[4] 宋忠惠, 鄭軍衛(wèi). 支撐智庫研究的信息源建設策略[J]. 智庫理論與實踐, 2016, 1(3): 65-72.

[5] 王飛, 劉井平, 劉斌, 等. 代碼知識圖譜構建及智能化軟件開發(fā)方法研究[J]. 軟件學報, 2020, 31(1): 47-66.

[6] SAWANT U, GARG S, CHAKRABARTI S, et al. Neural architecture for question answering using a knowledge graph and web corpus[J]. Information Retrieval Journal, 2019, 22(3/4): 324-349.

[7] LI Q, WANG D, FENG S, et al. Global graph attention embedding network for relation prediction in knowledge graphs[J/OL]. IEEE Transactions on Neural Networks and Learning Systems, 2021. https://doi.org/10.1109/TNNLS.2021.3083259.

[8] 黃恒琪, 于娟, 廖曉, 等. 知識圖譜研究綜述[J]. 計算機系統(tǒng)應用, 2019, 28(6): 1-12.

[9] 劉嶠, 李楊, 段宏, 等. 知識圖譜構建技術綜述[J]. 計算機研究與發(fā)展, 2016, 53(3): 582-600.

[10] 李瑞琪, 李佳, 韋莎, 等. 知識圖譜產(chǎn)業(yè)應用及標準化需求研究[J]. 信息技術與標準化, 2021(5): 11-16.

[11] 徐蕙, 及洪泉, 姚曉明, 等. 智能電網(wǎng)中基于知識圖譜的語義搜索算法[J]. 實驗室研究與探索,2021, 40(4): 71-74, 86.

[12] 郭素芹, 鄭建寧, 陳坤, 等. 基于知識圖譜的變電站安全隱患動態(tài)分析方法[J]. 電力系統(tǒng)及其自動化學報, 2021, 33(12): 125-133.

[13] 李新鵬, 徐建航, 郭子明, 等. 調(diào)度自動化系統(tǒng)知識圖譜的構建與應用[J]. 中國電力, 2019, 52(2): 70-77, 157.

[14] 蒲天驕, 談元鵬, 彭國政, 等. 電力領域知識圖譜的構建與應用[J]. 電網(wǎng)技術, 2021, 45(6): 2080-2091.

[15] 宋厚巖. 基于圖數(shù)據(jù)庫的電力系統(tǒng)知識圖譜研究與應用[D]. 北京: 中國科學院大學(中國科學院沈陽計算技術研究所), 2021.328914AB-F61E-4124-8E19-47EC583A36D2

[16] 呂夢平, 段斌, 蔣海輝, 等. 基于知識圖譜技術的風電數(shù)據(jù)管理與應用研究[J]. 電力系統(tǒng)保護與控制, 2021, 49(6): 167-173.

[17] 郭成, 徐成現(xiàn), 蔣維, 等. 面向低壓配電網(wǎng)絡拓撲的知識圖譜構建與檢索分析方法[J]. 電力科學與工程, 2021, 37(7): 52-61.

[18] 中國電子技術標準化研究院. 《知識圖譜標準化白皮書》正式發(fā)布[EB/OL]. (2019-09-11)[2021-01-11]. http://www.cesi.cn/201909/5588.html.

[19] 詹姆斯·麥甘. 建立全球定位的智庫[N]. 文匯報, 2010-09-06(010).

[20] 田玲, 張謹川, 張晉豪, 等. 知識圖譜綜述: 表示、構建、推理與知識超圖理論[J]. 計算機應用, 2021, 41(8): 2161-2186.

作者貢獻說明:

李? 豪:提出概念,設計論文框架;

周? 爽:設計平臺架構,收集資料,撰寫與修改論文。

Construction of Knowledge Service Platform Based on Three-Dimensional Knowledge Hypergraph for Power Think Tank

Li Hao1? Zhou Shuang2

1Power Construction Engineering Consulting Branch, State Grid Beijing Electric Power Company, Beijing? 100078

2Economic and Technological Research Institute, State Grid Beijing Electric Power Company, Beijing? 100055

Abstract: [Purpose/significance] In order to solve the problems of incomplete information acquisition and difficult logical association extraction in electric power think tank research, the knowledge service platform for power think tank research is specially designed for the think tank research in electric power enterprise. [Method/process] This paper builds the knowledge base of power think tank through a comprehensive collection of internal and external information. The three-dimensional knowledge hypergraph structure of power think tank is proposed based on knowledge graph and knowledge hypergraph, so as to realize the multi-dimensional extraction and association of knowledge. This can adapt to the research ideas of think tanks and mine data value. [Result/conclusion] In this paper, we build up the knowledge service platform for power think tank research according to the research demand of power think tank. It provides the functions of knowledge search, knowledge question and answer, intelligent recommendation and assistant decision-making for the research of think tank, to provide effective information and thinking guidance for think tank research.

Keywords: power think tank? ? knowledge graph? ? knowledge hypergraph? ? knowledge platform? ? knowledge reasoning

收稿日期:2021-12-03? ? ? 修回日期:2022-01-23

作者簡介:李豪,國家電網(wǎng)北京市電力公司高級工程師,碩士,E-mail: 13810359748@163.com;周爽,國家電網(wǎng)北京市電力公司工程師,碩士,E-mail: cherry_kaido@163.com。328914AB-F61E-4124-8E19-47EC583A36D2

猜你喜歡
知識圖譜
國內(nèi)外智庫研究態(tài)勢知識圖譜對比分析
國內(nèi)信息素養(yǎng)研究的知識圖譜分析
國內(nèi)圖書館嵌入式服務研究主題分析
國內(nèi)外政府信息公開研究的脈絡、流派與趨勢
基于知識圖譜的產(chǎn)業(yè)集群創(chuàng)新績效可視化分析
基于知識圖譜的產(chǎn)業(yè)集群創(chuàng)新績效可視化分析
基于知識圖譜的智慧教育研究熱點與趨勢分析
國內(nèi)酒店品牌管理研究進展的可視化分析
從《ET&S》與《電化教育研究》對比分析中管窺教育技術發(fā)展
專家知識圖譜構建研究
佛坪县| 花垣县| 和田市| 平山县| 隆子县| 乾安县| 武定县| 奉化市| 望谟县| 白城市| 荆门市| 平罗县| 原阳县| 汉源县| 屏东县| 布尔津县| 阜新市| 保康县| 施甸县| 赤城县| 乌恰县| 辉南县| 太仆寺旗| 高唐县| 佳木斯市| 怀柔区| 白沙| 泸州市| 浦城县| 广平县| 衡南县| 肇东市| 柞水县| 灵川县| 黄龙县| 晋州市| 桓台县| 威远县| 漯河市| 上高县| 长兴县|