曹 宇,葉健輝,于永超
(1.南瑞集團(tuán)北京科東公司,北京 100192;2. 國(guó)網(wǎng)湖南省電力公司,長(zhǎng)沙 410000)
基于電網(wǎng)本體知識(shí)庫(kù)的智能搜索研究與實(shí)現(xiàn)
曹宇1,葉健輝2,于永超1
(1.南瑞集團(tuán)北京科東公司,北京100192;2. 國(guó)網(wǎng)湖南省電力公司,長(zhǎng)沙410000)
摘要:針對(duì)電網(wǎng)調(diào)度數(shù)據(jù)類型多樣,結(jié)構(gòu)復(fù)雜,管理困難的問題,以構(gòu)建電網(wǎng)本體知識(shí)庫(kù)為基礎(chǔ),將電網(wǎng)設(shè)備、調(diào)度運(yùn)行數(shù)據(jù)、電網(wǎng)專業(yè)術(shù)語進(jìn)行統(tǒng)一知識(shí)建模,研究電網(wǎng)調(diào)度運(yùn)行結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ)、解析,及其數(shù)據(jù)間相互關(guān)聯(lián),歸屬及同義關(guān)系。根據(jù)電網(wǎng)本體推理規(guī)則找出本體之間潛在的關(guān)聯(lián)關(guān)系?;陔娋W(wǎng)本體知識(shí)庫(kù)、對(duì)結(jié)構(gòu)化與非結(jié)構(gòu)化采用倒排索引解析技術(shù),最終研究電網(wǎng)調(diào)度數(shù)據(jù)的智能檢索技術(shù),在快速檢索到相關(guān)數(shù)據(jù)的同時(shí),找出數(shù)據(jù)間內(nèi)在聯(lián)系。最后以查詢運(yùn)行數(shù)據(jù)與分析電網(wǎng)事故為例,討論了該技術(shù)的應(yīng)用場(chǎng)景,以及未來對(duì)電網(wǎng)調(diào)度運(yùn)行智能分析提供技術(shù)支撐。
關(guān)鍵詞:本體知識(shí)庫(kù);推理規(guī)則;非結(jié)構(gòu)化;倒排索引
隨著國(guó)內(nèi)電力系統(tǒng)的發(fā)展,特別是智能電網(wǎng)建設(shè)的全面開展,電網(wǎng)運(yùn)行管理系統(tǒng)在各級(jí)調(diào)控中心的應(yīng)用越發(fā)廣泛。電網(wǎng)結(jié)構(gòu)日益復(fù)雜、同時(shí)面臨的問題也層出不窮,如電網(wǎng)數(shù)據(jù)量的飛速增長(zhǎng),而傳統(tǒng)固化的業(yè)務(wù)查詢方式難以響應(yīng)靈活的數(shù)據(jù)查詢需求。常出現(xiàn)一個(gè)急需的業(yè)務(wù)數(shù)據(jù)查詢,因?yàn)橄到y(tǒng)有的查詢不能支持,所以必須等待應(yīng)用升級(jí)或功能完善,影響了決策的及時(shí)性,也嚴(yán)重束縛了業(yè)務(wù)人員對(duì)信息的主動(dòng)查詢的需求,影響了業(yè)務(wù)人員主動(dòng)靈活分析數(shù)據(jù)獲取價(jià)值信息的工作。
為了應(yīng)對(duì)日益增長(zhǎng)的電網(wǎng)業(yè)務(wù)數(shù)據(jù)分析需求,使電網(wǎng)系統(tǒng)的相關(guān)計(jì)算、分析、決策管理更加智能化。要求相關(guān)電網(wǎng)工作人員能夠快速的獲得所需的知識(shí)和信息,并能準(zhǔn)確的分析出信息之間潛在的關(guān)系,系統(tǒng)急需研制一種更便捷、更準(zhǔn)確、更智能的數(shù)據(jù)檢索技術(shù)。這些都需要借助于人工智能、快速檢索相關(guān)技術(shù)的研究與支持。
在人工智能領(lǐng)域,本體知識(shí)庫(kù)既要描述知識(shí)的特點(diǎn)、位置、說明等信息,最重要的是要記錄本體間的關(guān)系。近十年來人工智能技術(shù)在知識(shí)表達(dá),特別是描述本體及本體間的關(guān)系提供了新的技術(shù)、理論基礎(chǔ)。
在電網(wǎng)調(diào)度領(lǐng)域歸納分析知識(shí)本體,需要對(duì)電網(wǎng)數(shù)據(jù)進(jìn)行抽象分析,這部分?jǐn)?shù)據(jù)除了包括傳統(tǒng)意義上的電網(wǎng)調(diào)度運(yùn)行、管理等結(jié)構(gòu)化數(shù)據(jù)外,也包括各類電子文檔、文章、通知等非結(jié)構(gòu)化數(shù)據(jù)。電網(wǎng)數(shù)據(jù)存在結(jié)構(gòu)復(fù)雜、存儲(chǔ)分散、多類型異構(gòu)的特點(diǎn),傳統(tǒng)的關(guān)鍵詞搜索、模糊匹配的方法已經(jīng)很難滿足現(xiàn)在電網(wǎng)對(duì)數(shù)據(jù)深層次分析的需求,也無法將電網(wǎng)調(diào)度知識(shí)體系進(jìn)行統(tǒng)一管理分析,更加準(zhǔn)確、智能的得出想要的分析結(jié)論。通過人工智能技術(shù),將電網(wǎng)專業(yè)知識(shí)、設(shè)備信息、運(yùn)行數(shù)據(jù)、管理信息進(jìn)行本體建模,基于電網(wǎng)本體知識(shí)庫(kù)運(yùn)用解析結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù),倒排索引的技術(shù),實(shí)現(xiàn)智能化的信息快速檢索,是目前信息搜索領(lǐng)域的發(fā)展方向。
本文在互聯(lián)網(wǎng)領(lǐng)域搜索引擎以及電力搜索引擎研究進(jìn)展上[1-2],基于智能電網(wǎng)D5000調(diào)度管理類應(yīng)用(OMS),立足于電網(wǎng)調(diào)度業(yè)務(wù),研究人工智能領(lǐng)域的本體知識(shí)庫(kù)構(gòu)建技術(shù),通過分析結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)、解析,建立電網(wǎng)調(diào)度領(lǐng)域本體知識(shí)庫(kù),包括電網(wǎng)調(diào)度運(yùn)行數(shù)據(jù)、設(shè)備管理、技術(shù)規(guī)范、電網(wǎng)模型、參數(shù)、流程數(shù)據(jù),以及描述電網(wǎng)本體間的關(guān)系,研究智能化的數(shù)據(jù)檢索技術(shù),輔助分布式部署的省、地調(diào)管理系統(tǒng)(省地一體化OMS)智能化管理,滿足調(diào)度數(shù)據(jù)的互聯(lián)互通,提升智能電網(wǎng)調(diào)度運(yùn)行數(shù)據(jù)檢索的便捷性、準(zhǔn)確性,從而提高電網(wǎng)運(yùn)行數(shù)據(jù)管理的智能化水平。研究“有思想的”智能檢索技術(shù),并通過電網(wǎng)事故分析案例說明了基于電網(wǎng)本體知識(shí)庫(kù)構(gòu)建的智能檢索技術(shù)在電網(wǎng)調(diào)度領(lǐng)域的應(yīng)用。
1電網(wǎng)調(diào)度本體知識(shí)庫(kù)
1.1調(diào)度本體知識(shí)庫(kù)概念
知識(shí)是人類在實(shí)踐中所積累的認(rèn)識(shí)和經(jīng)驗(yàn)的總和,是人類進(jìn)行智能活動(dòng)的基礎(chǔ)。知識(shí)庫(kù)不僅僅貯存知識(shí),還包括知識(shí)處理方式。知識(shí)庫(kù)形成一個(gè)知識(shí)域,知識(shí)域中除了事實(shí)、規(guī)則和概念之外還包含推理、歸納、演繹等知識(shí)處理方法, 邏輯查詢語言、語義查詢優(yōu)化和人機(jī)交互界面等[3]。本體知識(shí)庫(kù)包含有明確定義的事實(shí)、斷言和通過規(guī)則推理表達(dá)的某些明顯的關(guān)系[4]。
本體(Ontology)這個(gè)術(shù)語來自于哲學(xué),它是研究世界上的各種實(shí)體以及他們是怎么關(guān)聯(lián)的科學(xué)。本體是一個(gè)可以共享的概念化范圍,描述了某個(gè)領(lǐng)域及其相互關(guān)聯(lián)的視圖,本體是共享概念模型的明確的形式化規(guī)范說明[5]。本體描述了給定領(lǐng)域的知識(shí)結(jié)構(gòu),內(nèi)在關(guān)系。
智能電網(wǎng)的調(diào)度知識(shí)表達(dá)了各個(gè)調(diào)度數(shù)據(jù)間的內(nèi)在聯(lián)系,依據(jù)其建立的本體知識(shí)庫(kù)作為描述調(diào)度領(lǐng)域數(shù)據(jù)含義及關(guān)系的基礎(chǔ)。從理論上來講,在電網(wǎng)調(diào)度領(lǐng)域中,本體對(duì)象可以使具體的電網(wǎng)設(shè)備、文檔資料,也可以描述抽象的專業(yè)知識(shí)概念、定義。基于調(diào)度本體知識(shí)庫(kù)對(duì)調(diào)度本體進(jìn)行分析,研究問題的語義抽象處理,描述調(diào)度本體的及其內(nèi)在關(guān)系,構(gòu)建調(diào)度本體知識(shí)庫(kù),目的是為電網(wǎng)運(yùn)行數(shù)據(jù)檢索進(jìn)行推理和知識(shí)積累。調(diào)度本體知識(shí)庫(kù)包括知識(shí)本體定義、調(diào)度本體間的關(guān)系兩部分,其中調(diào)度知識(shí)本體定義即調(diào)度領(lǐng)域分析方向和研究問題的抽象描述,是調(diào)度本體知識(shí)庫(kù)的基礎(chǔ)。調(diào)度知識(shí)本體的關(guān)系,用于描述本體間的關(guān)聯(lián)關(guān)系。
調(diào)度本體知識(shí)庫(kù)作用在于:①明確調(diào)度本體的定義,從而避免知識(shí)庫(kù)中來自不同數(shù)據(jù)源的信息的語義異構(gòu);②實(shí)現(xiàn)知識(shí)本體推理。本體可以體現(xiàn)出類似人類思維的邏輯性。用其對(duì)用戶提交的查詢式進(jìn)行語義擴(kuò)展, 可以推理出其所需的卻未能表達(dá)出的信息需求。
1.2調(diào)度本體知識(shí)庫(kù)構(gòu)建
本文采集并抽取現(xiàn)階段電網(wǎng)調(diào)度運(yùn)行中存在的各類數(shù)據(jù),包括結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),其中結(jié)構(gòu)化數(shù)據(jù)包括電網(wǎng)設(shè)備、調(diào)度運(yùn)行、管理流程;非結(jié)構(gòu)化數(shù)據(jù)包括調(diào)度生產(chǎn)過程中生成的報(bào)告、公文、圖像以及采集的視頻錄音等內(nèi)容。結(jié)合電網(wǎng)調(diào)度概念和專業(yè)術(shù)語生成調(diào)度本體知識(shí)庫(kù),如圖1所示。
圖1 調(diào)度本體知識(shí)庫(kù)數(shù)據(jù)來源
電網(wǎng)調(diào)度本體描述語言采用OWL,OWL( Web 本體語言)是W3C發(fā)布的推薦標(biāo)準(zhǔn)。OWL可被用來明確表示詞匯表中術(shù)語的含義以及術(shù)語間的關(guān)系。用于那些處理信息的內(nèi)容,而不是僅向人類呈現(xiàn)信息的應(yīng)用。OWL通過提供更多具有形式語義的詞匯使之在Web內(nèi)容的機(jī)器可理解性方面要強(qiáng)于XML,RDF 和RDF Schema( RDF- S)等所能達(dá)到的程度[6]。
OWL本體可以描述電網(wǎng)調(diào)度領(lǐng)域?qū)I(yè)數(shù)據(jù)、設(shè)備及之間的關(guān)系。
這段本體描述表示“變壓器”這個(gè)概念是“變電站”概念的子類。
可以描述本體的屬性,屬性本身是二元關(guān)系。
支持本體與屬性值定義。
這段本體描述的是變壓器的屬性,表示變壓器是變電站內(nèi)的設(shè)備,同時(shí)描述了變壓器有“額定容量”屬性,又進(jìn)一步列舉出變電站本體,這樣能根據(jù)變電站找出變壓器屬性,也可以找到所屬變電站,通過一個(gè)本體可以查找出據(jù)有關(guān)系的其他本體及屬性,并且支持迭代查詢。
1.3調(diào)度本體知識(shí)庫(kù)推理
完成構(gòu)建電網(wǎng)調(diào)度本體知識(shí)庫(kù)后,面臨的首要問題是基于知識(shí)庫(kù)如何查詢本體,查詢本體間的關(guān)系,得到查詢結(jié)果,滿足使用者的需求。本文研究通過解析OWL本體描述,結(jié)合調(diào)度業(yè)務(wù),利用推理規(guī)則的實(shí)現(xiàn)手段,分析查詢關(guān)鍵字,再利用這些關(guān)鍵字在本體知識(shí)庫(kù)中進(jìn)行本體查詢及推理,以滿足深層次的檢索需求。其中電網(wǎng)調(diào)度知識(shí)庫(kù)提供的推理服務(wù)主要是關(guān)系推理,屬性查詢推理兩種[7]。
本體推理結(jié)果用Q表示,本體屬性描述P表示,O表示本體,R表示關(guān)系,C表示推理?xiàng)l件,W表示屬性的權(quán)重(重要屬性,一般屬性等)。
(1)本體間關(guān)系推理,形如Q=(O,R,C),執(zhí)行推理后可得到關(guān)于這個(gè)本體O包含指定關(guān)系R的所有本體及其描述信息,如果不存在具有該關(guān)系的本體,則返回為空。例如推理?xiàng)l件定義為“電壓等級(jí)=‘220’”條件(“變壓器”,“繼承”,“電壓等級(jí)=‘220’”)得到結(jié)果的是所有變電站本體“小營(yíng)變”以及包括該本體的屬性信息。如將條件改為“電壓等級(jí)=‘500’”則符合條件的本體為空。
(2)本體屬性查詢推理,形如P=((O1…On),W),包括本體定位查詢Q=(O1…On),(O1…On)為具有繼承關(guān)系的本體,按照本體繼承關(guān)系從高到低依次排列形成唯一本體查詢路徑,如(“變電站”,“小營(yíng)變”,“變壓器”,“1號(hào)主變”),從而快速定位本體及其描述。執(zhí)行本體屬性查詢推理P后可得到本體O按照權(quán)重W過濾后的屬性,包含屬性值。例如(“變電站”,“小營(yíng)變”,“變壓器”,“1號(hào)主變”,“一般屬性”)可以獲得小營(yíng)變1號(hào)主變的所有屬性,額定容量,電壓等級(jí)。
基于調(diào)度本體知識(shí)庫(kù)以及推理規(guī)則可以分析使用者需求,需要檢索的信息在本體知識(shí)庫(kù)中的存儲(chǔ)、關(guān)聯(lián)關(guān)系。
2智能檢索技術(shù)
本文研究的快速檢索技術(shù)采用的是Lucene搜索引擎,Lucene是一個(gè)基于Java的全文檢索工具包,提供擴(kuò)展添加索引管理和全文檢索功能,輕量級(jí),性能較好。
2.1基于電網(wǎng)專業(yè)詞庫(kù)切詞
基于Lucene搜索引擎采用IKAnalyzer對(duì)查詢條件與非結(jié)構(gòu)化文檔的內(nèi)容切詞,IKAnalyzer特有的“正向迭代最細(xì)粒度切分算法“具有60萬字/s的高速處理能力,而且對(duì)中文支持較好,支持用戶詞典擴(kuò)展定義。結(jié)合電網(wǎng)調(diào)度本體知識(shí)庫(kù),將電網(wǎng)本體及屬性導(dǎo)出到詞典中,作為IKAnalyzer切詞的依據(jù)。
2.2結(jié)構(gòu)化數(shù)據(jù)的查詢
電網(wǎng)設(shè)備數(shù)據(jù)、調(diào)度運(yùn)行數(shù)據(jù)及其統(tǒng)計(jì)分析數(shù)據(jù)主要以結(jié)構(gòu)化方式進(jìn)行存儲(chǔ),依賴于數(shù)據(jù)庫(kù),因此查詢的重點(diǎn)是將電網(wǎng)本體與屬性按照SQL92標(biāo)準(zhǔn)生成可以執(zhí)行的SQL語句,包含數(shù)據(jù)庫(kù)、模式、表、字段等屬性。
在通過調(diào)度本體知識(shí)庫(kù)生成索引文件時(shí)對(duì)每個(gè)本體提供數(shù)據(jù)類型屬性,包括結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)描述,對(duì)于結(jié)構(gòu)化數(shù)據(jù)提供其擴(kuò)展屬性,主要包括有(數(shù)據(jù)源,模式,表/視圖,字段名,條件,結(jié)果,結(jié)果別名)。根據(jù)輸入的查詢關(guān)鍵字在索引文件中進(jìn)行查詢,按照出現(xiàn)次數(shù)作為權(quán)重,排列出符合條件的所有結(jié)果。在查詢結(jié)果中的結(jié)構(gòu)化數(shù)據(jù)按照其擴(kuò)展屬性組織成可執(zhí)行的標(biāo)準(zhǔn)SQL語句,如輸入查詢條件“小營(yíng)變1號(hào)主變額定容量”,通過IKAnalyzer將查詢條件切割成“小營(yíng)變”、“1號(hào)主變”、“額定容量”幾個(gè)電網(wǎng)領(lǐng)域知識(shí)本體,然后從索引文件中查詢出對(duì)應(yīng)的索引元數(shù)據(jù)的擴(kuò)展屬性。
小營(yíng)變:[ip,datasource,psidp,idpps,變電站管理表,調(diào)度命名,小營(yíng)變,ID,廠站ID]
1號(hào)變:[ip,datasource,psidp,idpps,變壓器參數(shù)表,調(diào)度命名,1號(hào)主變,,]
額定容量:[ip,datasource,psidp,idpps,變電站參數(shù)表, 額定容量,,,]查詢過程如下:
(1)查詢“小營(yíng)變”對(duì)應(yīng)的廠站ID:
SELECT ID AS廠站ID FROM變電站管理表 WHERE 調(diào)度命名=‘小營(yíng)變’
(2)查詢“額定容量”,由于額定容量是“1號(hào)變”的屬性,這兩個(gè)索引條件合并生成SQL語句:
SELECT額定容量 FROM變電站參數(shù)表WHERE調(diào)度命名=‘1號(hào)主變’AND 廠站ID=廠站ID
分別執(zhí)行兩個(gè)查詢過程獲得查詢結(jié)果。
2.3非結(jié)構(gòu)化數(shù)據(jù)查詢
針對(duì)電力調(diào)度領(lǐng)域非結(jié)構(gòu)化數(shù)據(jù)搜索而言,現(xiàn)有做法是根據(jù)非結(jié)構(gòu)化數(shù)據(jù)格式、類型采用各種解析器對(duì)各種不同類型的文檔進(jìn)行解析,通過Lucene生成索引。比如對(duì)于WORD文檔,提供的WORD解析器會(huì)做一些預(yù)處理的工作,如過濾文檔中的文檔格式、樣式等等。WORD解析器的輸出的是文檔文本內(nèi)容,接著通過Lucene的分詞器(IKAnalyzer)從讀取出的文本內(nèi)容中提取出索引項(xiàng)以及相關(guān)信息,比如索引項(xiàng)的出現(xiàn)頻率、文檔位置。接著Lucene的分詞器把這些信息寫到索引文件中,如圖2所示。
圖2 非結(jié)構(gòu)化數(shù)據(jù)索引文件生成
例如電網(wǎng)調(diào)度運(yùn)行文件、規(guī)程規(guī)范、文檔資料,網(wǎng)頁(yè)新聞等非結(jié)構(gòu)化數(shù)據(jù),提供相應(yīng)的文檔解析器,處理word、html、pdf、excel、txt等將解析完的數(shù)據(jù)按照調(diào)度專業(yè)詞庫(kù)進(jìn)行切詞,生成索引文件。
Lucene的搜索過程是將分散在不同的對(duì)象中的各種信息分析、處理、寫入,其中核心是建立索引機(jī)制。索引是在搜索時(shí)使用到的一種特殊的數(shù)據(jù)結(jié)構(gòu)。當(dāng)文檔的數(shù)量相當(dāng)龐大,并且這些文檔中的信息相對(duì)穩(wěn)定時(shí),建立索引可以大大提高搜索時(shí)的效率。在使用索引進(jìn)行查找時(shí),首先對(duì)需要索引的文檔進(jìn)行預(yù)處理,建立關(guān)于這些文檔的索引結(jié)構(gòu)。
本文研究的智能檢索技術(shù)的搜索準(zhǔn)確、快速必須依賴于建立合理的索引機(jī)制?;谡{(diào)度本體知識(shí)庫(kù)以及電網(wǎng)本體的推理規(guī)則,找出本體及其關(guān)聯(lián)的知識(shí)本體,對(duì)本體及其屬性描述生成本體描述文件,描述文件中的每一個(gè)本體對(duì)應(yīng)索引文件中的唯一元數(shù)據(jù),都具備兩個(gè)基本屬性及ID與描述,同時(shí)配有輔助屬性如關(guān)鍵字、數(shù)據(jù)類型、存儲(chǔ)位置、修改時(shí)間,擴(kuò)展屬性等。通過Lucene將本體描述文件生成索引供Lucene查詢使用。
Lucene索引機(jī)制是倒排索引,結(jié)構(gòu)區(qū)別于傳統(tǒng)的索引結(jié)構(gòu),這種結(jié)構(gòu)在應(yīng)用中需要根據(jù)屬性的值來查找記錄。這種索引表中的每一項(xiàng)都包括一個(gè)屬性值和具有該屬性值的各記錄的地址。由于不是由記錄來確定屬性值,而是由屬性值來確定記錄的位置,因而稱為倒排索引?;谡{(diào)度本體知識(shí)庫(kù)的索引生成方式如圖3所示。
圖3 調(diào)度本體倒排索引生成
為了提高檢索效率,可以將索引文件按照本體分類進(jìn)行建立,如電網(wǎng)設(shè)備類、運(yùn)行信息類、生成管理類等。然后將各個(gè)索引文件進(jìn)行合并,利用 Lucene在創(chuàng)建索引的過程中可以充分利用機(jī)器的硬件資源來提高索引的效率。Lucene在內(nèi)存中開辟一塊緩沖區(qū),采用二級(jí)緩存的機(jī)制來提高讀寫效率,通過使用IndexWriter方法調(diào)整緩沖區(qū)的大小以及往機(jī)器磁盤上寫索引文件的頻率與控制索引文件的合并。
3電網(wǎng)本體知識(shí)庫(kù)與檢索應(yīng)用
現(xiàn)階段智能電網(wǎng)調(diào)度支持系統(tǒng)存在數(shù)據(jù)量龐大,類型多樣,關(guān)聯(lián)關(guān)系復(fù)雜的實(shí)際情況,這些都對(duì)系統(tǒng)的建設(shè),人員技能的要求都提出更高的要求,因此使用基于電網(wǎng)調(diào)度本體知識(shí)庫(kù)的智能檢索技術(shù)對(duì)提升調(diào)度管理系統(tǒng)(OMS)的智能性,降低使用人員的技能門檻,具有深遠(yuǎn)的意義[8]。
(1)智能檢索技術(shù)在電網(wǎng)調(diào)度運(yùn)行數(shù)據(jù)查詢分析上的應(yīng)用。調(diào)度數(shù)據(jù)種類多樣,涵蓋了現(xiàn)階段電網(wǎng)調(diào)度運(yùn)行中能夠采集及統(tǒng)計(jì)得到的所有的數(shù)據(jù),如圖4所示,包括運(yùn)行數(shù)據(jù)、統(tǒng)計(jì)數(shù)據(jù)。查詢關(guān)鍵字通過本體知識(shí)庫(kù)進(jìn)行推理找到相應(yīng)的本體及與其存在關(guān)系的本體,然后用結(jié)構(gòu)化或非結(jié)構(gòu)化檢索技術(shù)對(duì)數(shù)據(jù)進(jìn)行查詢與展示。
圖4 智能檢索發(fā)電量結(jié)果
(2)在電網(wǎng)調(diào)度管理上的提升,智能檢索技術(shù)在電網(wǎng)調(diào)度運(yùn)行中的應(yīng)用以電網(wǎng)事故分析為例。電網(wǎng)運(yùn)行穩(wěn)定、安全是調(diào)度運(yùn)行管理重要的指標(biāo)之一,因此調(diào)度人員要對(duì)電網(wǎng)故障、事故有提前的預(yù)判能力,提前做好事故預(yù)案、分析以及事故后總結(jié)的工作。但電網(wǎng)運(yùn)行情況復(fù)雜,調(diào)度人員很難掌握所有的情況,因此需要一種便捷的手段查詢所有的電網(wǎng)事故和歷史情況分析,包括事故產(chǎn)生原因,事故后果、處理要點(diǎn)等[9]。
通過分析歷史電網(wǎng)事故、故障將事故按照原因進(jìn)行分類,例如輸入“氣象災(zāi)害 電網(wǎng)事故”,通過對(duì)“氣象災(zāi)害”與“電網(wǎng)事故”兩個(gè)本體的分析推理,找到有關(guān)聯(lián)的一系列知識(shí)本體,“降水”、“雷擊”……“線路跳閘”、“線路覆冰”等,這些作為進(jìn)階查詢條件,在結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)中進(jìn)行進(jìn)一步檢索,如在結(jié)構(gòu)化數(shù)據(jù)中根據(jù)“降水”的結(jié)構(gòu)化數(shù)據(jù)屬性找到氣象數(shù)據(jù),預(yù)警數(shù)據(jù),對(duì)應(yīng)的OMS中調(diào)度日志由降水導(dǎo)致的事故記錄以及相應(yīng)的處理流程,如圖5所示。
圖5 電網(wǎng)事故檢索過程
根據(jù)查詢結(jié)果使用者可以全面的了解一段時(shí)間內(nèi)的事故發(fā)生情況,發(fā)生原因,處理過程,分析措施和建議,從各種潛在數(shù)據(jù)中找到必然聯(lián)系,為日后預(yù)防此類電網(wǎng)事故的發(fā)生提供技術(shù)支持,提高電網(wǎng)運(yùn)行穩(wěn)定性,增強(qiáng)業(yè)務(wù)人員管理水平。
4結(jié)語
基于電網(wǎng)調(diào)度本體知識(shí)庫(kù)的智能檢索技術(shù),將電網(wǎng)調(diào)度領(lǐng)域?qū)I(yè)術(shù)語、運(yùn)行管理數(shù)據(jù)進(jìn)行知識(shí)梳理,維護(hù)調(diào)度本體以及關(guān)聯(lián)關(guān)系形成專業(yè)電網(wǎng)調(diào)度本體知識(shí)庫(kù)。通過調(diào)度本體知識(shí)庫(kù)生成檢索索引,對(duì)電網(wǎng)調(diào)度中的結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行數(shù)據(jù)分析、檢索,實(shí)現(xiàn)電網(wǎng)調(diào)度領(lǐng)域內(nèi)數(shù)據(jù)的相關(guān)性分析,提高調(diào)度數(shù)據(jù)檢索準(zhǔn)確性、智能性。為調(diào)度中心所有工作人員提供了具備全局性、透明性和高效性的調(diào)度數(shù)據(jù)智能檢索功能,提高系統(tǒng)的智能化水平,降低使用者的技能門檻。實(shí)現(xiàn)調(diào)度運(yùn)行信息全景管理、調(diào)度精細(xì)化決策、運(yùn)行數(shù)據(jù)智能分析、資源優(yōu)化配置,提升調(diào)度駕馭電網(wǎng)能力、科學(xué)決策管理能力和靈活高效調(diào)控能力,為智能電網(wǎng)調(diào)度管理系統(tǒng)(OMS)深化應(yīng)用提供技術(shù)支撐。
參考文獻(xiàn):
[1]張蓮梅, 陳世鴻, 陳紅梅, 等. 基于分布式電力資源庫(kù)的搜索引擎框架[J]. 高電壓技術(shù), 2005,31(8):66-68.
ZHANG Lian-mei, CHEN Shi-hong, CHEN Hong-mei, et al. Framework of searching engine based on distributed electrical resource database[J]. High Voltage Engineering, 2005,31(8):66-68.
[2]趙海波,黃勇理,陳勝,等. 基于電廠運(yùn)行數(shù)據(jù)庫(kù)的專業(yè)智能搜索引擎[J]. 電力自動(dòng)化設(shè)備, 2003,23(8):25-28.
ZHAO Hai-bo, HUANG Yong-li, CHEN Sheng, et al.
Professional intelligent search engine based on running database of power plant[J]. 電力自動(dòng)化設(shè)備, 2003,23(8):25-28.
[3]吳順祥,吉國(guó)力. 數(shù)據(jù)庫(kù)系統(tǒng)與知識(shí)庫(kù)系統(tǒng)的對(duì)比分析[J]. 計(jì)算機(jī)工程與應(yīng)用, 1999(35) : 83-85.
WU Shun-xiang, JI Guo-li. Comparative analysis of database system and knowledge-base system[J]. Computer Engineering and Application, 1999(35) : 83-85.
[4]楊勇, 鄒時(shí)林, 蔡源. 知識(shí)庫(kù)系統(tǒng)的原理[J]. 華東地質(zhì)學(xué)院學(xué)報(bào), 2001, 24(4):334-337.
YANG Yong, ZHOU Shi-lin, CAI Yuan. Principle of knowledge-base system[J]. Journal of East China Geological Institute, 2001, 24(4) :334-337.
[5]何新貴. 知識(shí)處理與專家系統(tǒng)[M]. 北京:國(guó)防工業(yè)出版社, 1990.
HE Xin-gui. Knowledge processing and expert system[M]. National Defence Industry Press, 1990.
[6]W3C. Web Ontology Language(OWL) [ EB/OL]. [ 2007-10-08] .http://www.w3.org/2004/OWL/.
[7]李春. 基于本體的文本信息檢索技術(shù)研究與實(shí)現(xiàn)[D]. 南京:南京航空航天大學(xué), 2009.
LI Chun. Research and implementation of text information retrieval based on Ontology[D]. Nanjing University of Aeronautics and Astronautics, 2009.
[8]錢智勇. 基于本體的專題域知識(shí)庫(kù)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)——以張謇研究專題知識(shí)庫(kù)系統(tǒng)實(shí)現(xiàn)為例[J]. 情報(bào)理論與實(shí)踐, 2006(4):58-60.
QIAO Zhi-yong. Special domain ontology knowledge base system design and implementation——on zhang jian research subject knowledge database system implementation[J]. Information Studies:Theory & Application, 2006(4):58-60.
[9]徐瑞卿, 周渝慧. 電力系統(tǒng)應(yīng)急管理探討[A]. 第八屆中國(guó)管理科學(xué)學(xué)術(shù)年會(huì)論文集[C], 2006.
XU Rui-qing, ZHOU Yu-hui. Study on emergency management of power system[A]. The Eighth Session of The China Management Science Annual Meeting Proceedings[C], 2006.
(本文編輯:嚴(yán)加)
Research and Implementation of Intelligent Search Based on Power Grid Ontology-Based Knowledge Base
CAO Yu1, YE Jian-hui2, YU Yong-chao1
(1. NARI Group Corporation Beijing KeDong Company, Beijing 100192, China;2. State Grid Hunan Electric Power Company, Changsha 410000, China)
Abstract:In view of the type diversity, structure complexity and management difficulty of power grid dispatching data, this paper builds unified model on grid equipment, dispatching operation data and power grid term by constructing ontology-based knowledge base. Further, we research the storage and analysis of structured and unstructured data and correlation, subordination and synonymy among the data in dispatching operating system. The potential correlation among ontology is derived from power grid ontology inference rules. Then the intelligent retrieval technology in power grid dispatching data is researched based on the ontology-based knowledge base, structured and unstructured data and inverted index analysis techniques, which can search the relevant data very fast and find out the internal relationship among data at the same time. Finally, taking querying operating data and analyzing power grid accident as an example, we discuss the application scenarios of this technology, aiming to provide future technology support to intelligent analysis of power grid dispatching operation.
Key words:ontology-based knowledge base; inference rule; unstructured; inverted index
作者簡(jiǎn)介:曹宇(1983),男,碩士,工程師,主要研究方向?yàn)閿?shù)據(jù)挖掘,人工智能等。
中圖分類號(hào):TM769
文獻(xiàn)標(biāo)志碼:B
文章編號(hào):2095-1256(2016)01-0001-06
收稿日期:2015-11-01