剡昌鋒, 張永明, 艾科勇, 栗 宇, 吳黎曉
(1. 蘭州理工大學(xué) 機電工程學(xué)院, 甘肅 蘭州 730050; 2. 安徽容知日新科技股份有限公司, 安徽 合肥 230031; 3. 大秦鐵路股份有限公司, 山西 太原 030045)
汽輪發(fā)電機組作為電力系統(tǒng)中極為關(guān)鍵的大型旋轉(zhuǎn)機械設(shè)備,對安全性、穩(wěn)定性以及壽命的要求非常高,如果出現(xiàn)意外故障,會造成人員傷害或嚴(yán)重的經(jīng)濟損失,因此為了提高汽輪發(fā)電機組運行的安全性與可靠性,對汽輪發(fā)電機組的故障進(jìn)行準(zhǔn)確的診斷和預(yù)測具有重要的工程實用價值.汽輪發(fā)電機組結(jié)構(gòu)復(fù)雜,并且其故障知識分布存在多樣性和異構(gòu)性,導(dǎo)致在建立故障診斷專家系統(tǒng)時知識的表示與管理成為一個關(guān)鍵問題.
本體在知識表示、檢索、共享和應(yīng)用方面成為一個研究的熱點.本體是源自于哲學(xué)中的術(shù)語,指事物客觀存在的本質(zhì)[1-2],它能描述某一特定領(lǐng)域概念間的含義和關(guān)系.近年來,基于本體的多源異構(gòu)的知識表達(dá)在人工智能、知識工程、語義檢索等領(lǐng)域中引起廣泛的關(guān)注.
斯坦福大學(xué)提出了七步法構(gòu)建領(lǐng)域本體,研制了Protégé軟件,使本體建模更加方便.Dendani等[3]研發(fā)了基于領(lǐng)域本體的汽輪機故障診斷案例推理系統(tǒng),實現(xiàn)了文檔化的知識表示與推理.栗宇等[4]提出了基于本體的汽輪發(fā)電機組故障診斷知識建模,對汽輪機故障進(jìn)行單一本體建模.Zhou等[5]介紹了一種基于本體機床故障診斷方法和一種基于知識庫的故障診斷方法,設(shè)計了一個基于知識的可配置機床故障診斷平臺.周安美等[6]提出了基于本體的風(fēng)電設(shè)備多源異構(gòu)知識管理框架,建立了局部本體與全局本體之間的映射關(guān)系,并開發(fā)了基于本體和故障模式及危害性分析(failure mode effects and criticality analysis,FMECA)的風(fēng)力發(fā)電機組智能故障診斷系統(tǒng).Fang等[7]研究了從用戶生成的帶注釋的圖像中自動構(gòu)建基于大眾分類的視覺本體,從另一個角度實現(xiàn)了本體知識的表示.Peng等[8]針對液壓系統(tǒng)故障診斷知識具有復(fù)雜的結(jié)構(gòu)和映射關(guān)系等問題,提出了一種基于本體的故障診斷知識表示方法.Zhao等[9]將本體應(yīng)用到電力的異常診斷中,能夠挖掘出電網(wǎng)出現(xiàn)故障的深層原因.袁侃等[10]將本體應(yīng)用于飛機結(jié)構(gòu)診斷中,通過本體實例推理出故障原因,提出了基于本體和FMECA的風(fēng)力發(fā)電機組智能故障診斷研究.Yan等[11]利用產(chǎn)生式的方法表示了汽輪機的故障知識.Wei等[12]提出了基于二維全息譜和貝葉斯決策理論的不確定性問題,研究了汽輪機故障知識的不確定性問題.Orchard等[13]采用框架知識表示的方法研究了渦輪發(fā)電機組的診斷與預(yù)測問題.
以上的研究在本體知識表示和推理方面都存在一定的局限性,對復(fù)雜大型的故障知識庫難以精準(zhǔn)高效地表達(dá)與推理,對故障診斷概念及其屬性沒有形成固定的表現(xiàn)方法,易形成某一領(lǐng)域知識本體孤立.對于汽輪發(fā)電機組復(fù)雜的診斷知識以及概念間的關(guān)系和屬性約束,利用本體可以實現(xiàn)規(guī)范化定義,提供全局與局部檢索,實現(xiàn)知識表示、管理與重用[14].因此本文提出了汽輪發(fā)電機組多源異構(gòu)的本體建模與知識融合的方法,利用軟件Protégé_4.3構(gòu)建了汽輪發(fā)電機組的全局與局部本體,詳細(xì)說明了建模的方法與步驟,改進(jìn)了知識融合的算法與多源知識檢索的過程,通過多源知識的檢索過程驗證本體知識模型的可行性,最后通過SQI(spectra quest incorporated)機械故障模擬實驗臺模擬了汽輪發(fā)電機組轉(zhuǎn)子不同的故障,驗證了本體模型與知識融合算法的可行性與有效性.
汽輪發(fā)電機組的知識源分布在各個不同的電廠中,這些知識概念的表示方式和存儲方式都不同.電廠的知識存儲方式有結(jié)構(gòu)化、半結(jié)構(gòu)化的數(shù)據(jù)庫,也有非結(jié)構(gòu)化的數(shù)據(jù),例如文本、圖像等[15].從不同的知識庫中獲取建模所需的知識,構(gòu)建一個能夠被共同理解的概念體系,以供汽輪發(fā)電機組知識共享使用.這些都可以采用本體進(jìn)行結(jié)構(gòu)化表示,實現(xiàn)不同領(lǐng)域、不同結(jié)構(gòu)知識的統(tǒng)一表示[16].不同知識源運用不同的局部本體進(jìn)行建模,映射關(guān)系則是這些領(lǐng)域本體之間的紐帶,它能夠加強企業(yè)間知識庫的銜接,使汽輪發(fā)電機組領(lǐng)域知識融合為一個可供全局檢索的知識群.
各知識源以一個擁有公共詞匯庫的全局本體為基礎(chǔ),建立自己的領(lǐng)域本體結(jié)構(gòu),即局部本體[17].全局本體包含汽輪發(fā)電機組領(lǐng)域中最基本的概念和知識結(jié)構(gòu),是統(tǒng)一描述的概念,圖1為汽輪發(fā)電機組的多源異構(gòu)混合本體結(jié)構(gòu).局部本體在全局本體的基礎(chǔ)上進(jìn)行拓展,增添各個領(lǐng)域的特性和知識體系結(jié)構(gòu),通過映射關(guān)系使領(lǐng)域本體之間易于操作.如果知識源中的知識有變化時,不再需要對全局本體進(jìn)行修改,大大降低了建模的難度,提高了查詢的效率.
圖1 汽輪發(fā)電機組多源異構(gòu)混合本體Fig.1 Multi-source heterogeneous ontology of steam turbine
在汽輪發(fā)電機組混合本體的基礎(chǔ)上,建立了其多源異構(gòu)的知識融合框架,如圖2所示,此框架主要有基礎(chǔ)層、結(jié)構(gòu)層和用戶層構(gòu)成.各層之間通過Web服務(wù)進(jìn)行通訊,當(dāng)用戶層發(fā)出查詢請求時,結(jié)構(gòu)層會根據(jù)系統(tǒng)發(fā)出的要求選擇適當(dāng)?shù)闹R源,執(zhí)行處理后將結(jié)果反饋給用戶.基礎(chǔ)層處于框架的底層,是各個知識源與單本體之間的交互.各知識源的數(shù)據(jù)儲存方式是不一樣,采用單本體對各個知識源進(jìn)行統(tǒng)一化的描述,形成局部本體,為各知識源之間的融合提供基礎(chǔ).結(jié)構(gòu)層是框架的核心,對用戶層發(fā)來的請求進(jìn)行處理,先根據(jù)全局查詢語句查詢,查詢無果時,通過映射關(guān)系將全局查詢語句分解成局部查詢語句,從各個知識源抽取知識后,返回給用戶層.用戶層處于框架的頂部,主要任務(wù)是輸入汽輪發(fā)電機組的故障信息和輸出系統(tǒng)的診斷結(jié)果.
圖2 汽輪發(fā)電機組多源異構(gòu)知識融合框架Fig.2 Heterogeneous knowledge fusion framework of steam turbine
1.2.1汽輪發(fā)電機組結(jié)構(gòu)知識庫
大型火電設(shè)備汽輪發(fā)電機組結(jié)構(gòu)知識來源不一,主要有設(shè)備說明書、設(shè)備手冊和設(shè)計原理圖等[18],從這些資料中提取知識為汽輪發(fā)電機組設(shè)備維護(hù)和故障診斷提供指導(dǎo).汽輪發(fā)電機組由多個系統(tǒng)組成[19],系統(tǒng)由組件組成,組件又由最基本的零件組成,層次結(jié)構(gòu)如圖3所示.主要系統(tǒng)有控制系統(tǒng)、機械部件、潤滑油系統(tǒng)、滑銷系統(tǒng)、輔助系統(tǒng)等.
圖3 汽輪發(fā)電機組層次結(jié)構(gòu)圖Fig.3 Hierarchy chart of steam turbine generator sets
1.2.2汽輪發(fā)電機組故障診斷知識庫
根據(jù)歷史經(jīng)驗和有關(guān)專家診斷技術(shù)的不斷積累,形成了汽輪發(fā)電機組的故障診斷知識庫.這些專家經(jīng)驗和診斷案例分散在各個不同的領(lǐng)域中[20],利用本體提取這些經(jīng)驗和案例有助于設(shè)備的預(yù)防維護(hù)和實時診斷.汽輪發(fā)電機組故障主要有機械故障、電氣故障、熱力故障和輔助設(shè)備故障等,如圖4所示.其中機械故障又可分為轉(zhuǎn)子不平衡故障、轉(zhuǎn)子不對中故障、油膜失穩(wěn)故障等.轉(zhuǎn)子不平衡故障又可分為原始質(zhì)量不平衡、轉(zhuǎn)子初始彎曲、轉(zhuǎn)子熱彎曲等.這樣就形成了一個龐大的汽輪發(fā)電機組故障樹.
圖4 汽輪發(fā)電機組故障樹Fig.4 Failure tree of steam turbine generator sets
1.2.3汽輪發(fā)電機組故障模式、影響和危害性
故障模式、影響及危害性分析是針對汽輪發(fā)電機組所有可能的故障,并根據(jù)對故障模式的分析,確定每種故障模式對汽輪機工作的影響.找出某一特定故障,并根據(jù)故障表現(xiàn)方式的不同程度及其發(fā)生率確定其危害性[21].汽輪機的FMECA部分知識如表1所列.
表1 汽輪發(fā)電機組部分FMECA Tab.1 Part FMECA of steam turbine generator sets
1.2.4汽輪發(fā)電機組檢測知識庫
汽輪發(fā)電機組檢測知識庫的不斷豐富[23],形成了本體的檢測域,如圖5所示.檢測域結(jié)構(gòu)主要包括動力故障檢測、控制系統(tǒng)檢測、管路系統(tǒng)檢測和現(xiàn)場要素檢測等.檢測的范圍廣泛,主要對象有汽輪發(fā)電機組(設(shè)備)、技術(shù)員能力水平(人員)、技術(shù)方法、運行環(huán)境等,這些對象在不斷積累中形成了龐大的檢測知識庫.
圖5 汽輪發(fā)電機組檢測層次結(jié)構(gòu)圖Fig.5 Detection structure chart of steam turbine generator sets
全局本體是一個公共詞匯庫,描述整個系統(tǒng)的語義,能夠準(zhǔn)確地對所有異構(gòu)知識源中的概念和概念間的關(guān)系進(jìn)行統(tǒng)一規(guī)范表達(dá),使用戶在檢索知識時不用考慮各知識源的異構(gòu)也能很快地檢索出所需知識.
本體概念化是使用統(tǒng)一術(shù)語來對對象規(guī)范說明[24].本體一般由類、類屬性、關(guān)系、關(guān)系屬性、實例和公理集等組成.汽輪發(fā)電機組故障診斷本體(steam turbine diagnosis ontology,SDO)形式化定義為(SDO)=〈C,AC,R,AR,I,X〉.其中,C為汽輪發(fā)電機組中類集,AC為類的屬性集,R是類間的關(guān)系集,AR為關(guān)系的屬性集,I為實例集,X為類與類之間的嚴(yán)格約束公理集.
針對汽輪發(fā)電機組構(gòu)建了全局本體的基本類,主要有故障特征、故障類型、故障現(xiàn)象、發(fā)生時間、故障機理、診斷方法、評價方法、維修策略、汽輪機型號和隸屬機構(gòu)等.汽輪發(fā)電機組全局本體的基本類如表2所列.
表2 汽輪發(fā)電機組全局本體基本類Tab.2 Global ontology base classes of steam turbine
汽輪發(fā)電機組故障診斷本體中的屬性是對故障類內(nèi)部結(jié)構(gòu)的描述,對象屬性描述的是類與類之間的關(guān)系.本文定義了9種主要對象屬性,類的屬性如表3所列.
表3 汽輪發(fā)電機組全局本體基本類屬性Tab.3 Global ontology base classes property of steam turbine
在汽輪發(fā)電機組本體概念化的過程中,需要對各個概念約束,完成對知識的嚴(yán)格定義.除了以上屬性定義,還需完善對知識的描述,如steam turbine type還需添加屬性install date、equipment number等.定義概念和屬性后,建立汽輪發(fā)電機組全局本體模型如圖6所示.
圖6 汽輪發(fā)電機組故障診斷全局本體模型Fig.6 Fault diagnosis global ontology model of steam turbine
根據(jù)各異構(gòu)知識源的具體情況,獲得各知識源的局部本體.在全局本體的基礎(chǔ)上,通過定義各局部本體的概念屬性,將模型繼續(xù)擴展,不斷對各個局部本體進(jìn)行修改和完善,最終形成整個汽輪發(fā)電機組的故障診斷知識表示模型.利用建模軟件建立汽輪機局部本體模型如圖7所示.汽輪機的局部本體的知識源主要有結(jié)構(gòu)域本體、故障域本體、檢測域本體、FMECA本體等.構(gòu)建局部本體的步驟和方法與構(gòu)建全局本體的基本一致,其中最重要的是本體基本類的確定和類屬性的規(guī)范.
圖7 汽輪發(fā)電機組局部本體模型Fig.7 Local ontology model of steam turbine
通過對汽輪發(fā)電機組物理結(jié)構(gòu)、故障知識、檢測知識以及FMECA術(shù)語的概念化,得到汽輪機結(jié)構(gòu)域本體、故障域本體、檢測域本體、FMECA本體的類和對象屬性,將類與對象屬性進(jìn)行連接,得到各個局部本體的模型.
建立全局本體與局部本體的目的是為了實現(xiàn)知識融合,用戶不用考慮知識源的分布和異構(gòu),輸入查詢語句,就會獲得診斷結(jié)果的所有集合.建立全局本體與局部本體之間的映射是為搭建一個橋梁,實現(xiàn)多源知識融合與檢索.
由于汽輪機知識分布不同,同語義的概念在全局本體與局部本體可能會存在不同的名稱,所以通過本體間的映射關(guān)系實現(xiàn)兩個本體之間語義概念的關(guān)聯(lián),可以將源本體的實例映射到目標(biāo)本體[6].汽輪機本體映射的流程如圖8所示.
圖8 本體映射流程圖Fig.8 The chart of ontology map
定義全局本體OG和局部本體OL,分別從中選取概念CG和CL,分別計算概念相似度SN、屬性相似度SA、全相似度SO,若是這三者中一個或者一個以上的最大相似值大于給定的閾值λi,則將這一概念對存儲在結(jié)果集合中.用同樣的方法完成本體中所有概念對的相似度計算,最后在結(jié)果集中選取相似度值最大的概念對成立映射關(guān)系.流程中主要步驟如下:
1) 概念相似度的計算
由于汽輪機本體的命名一般由詞組組成,所以首先對其進(jìn)行詞組序列化、去冗余詞和去連字符預(yù)處理.根據(jù)字符串映射法ISub[13]映射處理后,判斷全局本體與局部本體的概念相似度.分別給定汽輪發(fā)電機組全局本體與局部本體的兩個概念CG和CL,CG∈OG,CL∈OL.概念CG和CL的語義相似度為
(1)
(2)
(3)
式中:IDG、IDL分別表示CG和CL在OG、OL中的URI;LbG,LbL分別表示CG和CL在OG、OL中的名稱;SG、SL表示CG和CL在OG、OL中的同一詞集合;wG、wL為權(quán)重,此權(quán)重由專家給出.
字符串映射法ISub為
ISub(tG,tL)=comm(tG,tL)-diff(tG,tL)+
winkler(tG,tL)
(4)
式中:tG、tL表示全局與局部概念對的字符串;comm(tG,tL)表示字符串的相同部分;diff(tG,tL)表示字符串的差異部分;winkler(tG,tL)表示修正系數(shù).
2) 屬性相似度的計算
(5)
式中:θi為局部本體概念屬性的權(quán)重值.
3) 概念全相似度的計算
由于現(xiàn)實中會存在同形異義或異形同義的情況,不能單純憑概念的相似度或者屬性的相似度來認(rèn)定兩個概念的重合程度.分別給定概念相似度和屬性相似度的權(quán)值,得到概念全相似度的計算公式為
(6)
式中:φi,φj為權(quán)重值.
映射的條件就是概念相似度、屬性相似度和概念全相似度是否大于各自給定的閾值.若其中一個或者一個以上滿足條件,則被存儲到結(jié)果集合中,以供映射時調(diào)用.
多源異構(gòu)知識檢索是整個汽輪發(fā)電機組知識集成的關(guān)鍵步驟[25].在給定查詢請求時,無須了解底層知識源的情況,直接對全局本體發(fā)送查詢請求,以汽輪機全局本體和局部本體間的映射關(guān)系為基礎(chǔ),將查詢語句分解成若干條子查詢語句,實現(xiàn)多源異構(gòu)情況下的知識檢索.知識檢索的過程如圖2中結(jié)構(gòu)層所示,主要包括:故障源查詢請求的提出、全局查詢語句生成、底層知識源的確定、查詢語句分解、子查詢語句的生成、查詢結(jié)果集成、查詢結(jié)果輸出.其中,根據(jù)映射關(guān)系分解全局查詢語句是最重要的一個步驟,具體的算法如下:
本文首先介紹了汽輪機的知識源,然后根據(jù)各個不同的知識源建立汽輪機本體模型,根據(jù)字符串映射法ISub設(shè)計全局本體與局部本體映射算法,實現(xiàn)了汽輪機多源知識融合和檢索.主要創(chuàng)新點是汽輪機本體知識模型的構(gòu)建及全局本體與局部模型間映射算法的設(shè)計.為了驗證其合理性,采用實驗臺模擬汽輪機的經(jīng)典故障,即轉(zhuǎn)子質(zhì)量偏心故障與轉(zhuǎn)子不平衡故障.實驗臺如圖9所示,由電動機、電動機變速控制器、轉(zhuǎn)子系統(tǒng)、數(shù)據(jù)采集器和信號分析軟件等組成.
圖9 SQI機械故障模擬實驗臺Fig.9 SQI simulation test bench(MFS) of mechanical fault
圖10 質(zhì)量偏心故障特征Fig.10 Fault characteristics of mass eccentricity
圖11 質(zhì)量偏心軸心軌跡Fig.11 Track of shaft axis of mass eccentricity
圖12 不平衡故障特征Fig.12 Fault characteristics of imbalance
圖13 不平衡軸心軌跡Fig.13 Track of shaft axis of imbalance
圖14 汽輪機本體模型推理過程圖Fig.14 Ontology model reasoning process of turbine
圖15 OWL_Viz推理結(jié)果圖Fig.15 Result chart of OWL_Viz reasoning
此實驗通過定義共同屬性,驗證了局部本體子類“轉(zhuǎn)子及動葉片”和“轉(zhuǎn)子不平衡”與全局本體子類“轉(zhuǎn)子質(zhì)量偏心”之間的本體映射算法,證明汽輪發(fā)電機組多源異構(gòu)知識融合算法是可行、有效的.
故障診斷技術(shù)已發(fā)展成集狀態(tài)檢測、信號處理、模式識別和智能決策等為一體的新型交叉學(xué)科[26].汽輪發(fā)電機組多源異構(gòu)的知識建模與融合為故障診斷提供了方法與技術(shù).本文將全局本體與局部本體的映射算法引入汽輪機,能夠使多源異構(gòu)的知識融合,分析汽輪發(fā)電機組多源異構(gòu)知識源的選擇.根據(jù)汽輪機多源異構(gòu)知識定義了汽輪機的概念屬性,借助Protégé軟件構(gòu)建了汽輪機可供檢索的全局本體與局部本體模型.提出了汽輪機本體映射與知識融合算法,并通過實例驗證了算法的可行性與有效性.