王巖, 曹現(xiàn)剛, 張旭輝, 樊紅衛(wèi), 段雍, 霍小泉
(1.西安科技大學(xué) 機械工程學(xué)院, 陜西 西安 710054;2.陜西省礦山機電裝備智能監(jiān)測重點實驗室, 陜西 西安 710054;3.陜煤銅川礦業(yè)有限公司, 陜西 銅川 727000)
作為煤礦綜采工作面完成煤壁截割工藝的核心裝備之一,采煤機的作業(yè)環(huán)境極其惡劣,影響其安全運行的眾多因素高度耦合,故障預(yù)防與檢修難度極大,這導(dǎo)致采煤機的故障率遠高于其他綜采設(shè)備。一旦采煤機因出現(xiàn)故障而停機,將對綜采工作面的人員及生產(chǎn)安全構(gòu)成嚴重威脅。因此,亟需開發(fā)一種快速故障定位與精準(zhǔn)采煤機檢修技術(shù),幫助煤礦設(shè)備檢修管理部門及時診斷明確采煤機故障隱患,并采取必要措施主動保養(yǎng)與維護,以降低采煤機的停機率,進而有效提升開采效率。
大量學(xué)者針對搖臂、齒輪箱、軸承等采煤機關(guān)鍵元部件的運行狀態(tài)監(jiān)測與故障診斷進行了卓有成效的研究[1-3],然而元部件級故障診斷分析不能從眾多耦合因素中精確定位潛在故障源。尤其是處于極端惡劣工況下的采煤機關(guān)鍵元部件失效觸發(fā)因素大幅增加,目前沒有成熟的方法滿足設(shè)備多部件協(xié)同工作條件下的故障源精確定位需求[4-6]。本文從采煤機整機角度分析各元部件協(xié)同關(guān)系,引入知識圖譜技術(shù),系統(tǒng)地研究各故障源的耦合程度,通過圖論中的節(jié)點關(guān)系圖直觀描述設(shè)備運行過程中產(chǎn)生的各種信息及其復(fù)雜關(guān)聯(lián)關(guān)系,形成面向采煤機故障檢修的智能維護知識圖譜,以圖譜的形式固化采煤機故障檢修知識,配合相關(guān)故障診斷模型與算法,實現(xiàn)故障源快速準(zhǔn)確定位及潛在故障點精準(zhǔn)管控,達到故障前有效預(yù)防、故障后及時維修和止損的目的。
采煤機故障涉及的因素眾多,如人、機械、環(huán)境等[7]。實現(xiàn)快速準(zhǔn)確故障定位的基礎(chǔ)是從系統(tǒng)的角度梳理影響采煤機運行狀態(tài)的因素,采用圖示化方式描述各因素間的關(guān)聯(lián)關(guān)系,并分析各因素在故障產(chǎn)生中的耦合關(guān)系與異常傳導(dǎo)機制,最后通過構(gòu)建采煤機智能維護知識圖譜實現(xiàn)故障檢修知識的固化與持續(xù)迭代。
采煤機智能維護知識圖譜的構(gòu)建過程主要包含4個步驟:① 收集設(shè)備技術(shù)文檔、專家經(jīng)驗和歷史維修數(shù)據(jù)等相關(guān)資料,明確采煤機故障信息涉及范圍,定義其故障檢修知識圖譜構(gòu)建策略。② 分析采煤機典型故障特征,規(guī)范與之相關(guān)的核心概念與術(shù)語,定義采煤機故障的概念類,抽象采煤機故障內(nèi)容核心概念集。③ 根據(jù)采煤機的結(jié)構(gòu)特點和故障特點,定義并抽取實體類型、屬性及實體間的關(guān)聯(lián)關(guān)系,形成實體關(guān)系表達的網(wǎng)絡(luò)圖,通過實體消岐、共指消解等步驟合并網(wǎng)絡(luò),最終實現(xiàn)采煤機智能維護知識圖譜的實體和關(guān)系表達。④ 采用Neo4j圖數(shù)據(jù)庫創(chuàng)建知識圖譜,提升采煤機故障檢修信息查詢過程中實體及耦合關(guān)系的檢索效率,進而探索一種高效的采煤機故障檢修知識的固化與復(fù)用技術(shù)解決方案,為實現(xiàn)采煤機智能化維護提供技術(shù)基礎(chǔ)。采煤機智能維護知識圖譜的構(gòu)建流程如圖1所示。
圖1 采煤機智能維護知識圖譜構(gòu)建流程
通過檢修日志、專家經(jīng)驗、技術(shù)文檔等方式收集的故障檢修資料中對同類型故障的描述方式不同,為了統(tǒng)一知識圖譜構(gòu)建過程中的實體、關(guān)系與屬性,需要對所有內(nèi)容進行規(guī)范化命名。對收集到的所有采煤機故障信息[8-12]進行研究分析后,確定整個故障檢修知識庫的范疇、類別、功能需求,明確定義采煤機故障診斷中的重要術(shù)語和概念,并對其進行歸納整理。針對采煤機智能維護知識圖譜的建模需求,本文主要從硬件拓撲、故障檢修、傳感監(jiān)測3個方面規(guī)范實體的命名方式。
選用MG400/930-WD交流電牽引采煤機作為研究對象,該型號采煤機具有多電動機驅(qū)動、橫向抽屜式布置、機載式交流變頻調(diào)速等特點,適用于較傾斜、中硬煤層長壁式綜采工作面,采高范圍為2~3.5 m。其典型機械部件包括左右搖臂、左右滾筒、牽引傳動箱、外牽引、泵站、牽引電動機調(diào)速裝置、高壓控制箱、調(diào)高油缸、主機架、輔助部件、電器系統(tǒng)及附件等。
為了保證命名體系的一致,引用產(chǎn)品設(shè)計說明、技術(shù)文檔的命名方式,對采煤機的機械結(jié)構(gòu)進行分析,將采煤機機械結(jié)構(gòu)分為截割部、牽引部、液壓調(diào)高系統(tǒng)、主機架、輔助部件和電氣系統(tǒng)6個部分。MG400/930-WD采煤機的硬件拓撲結(jié)構(gòu)如圖2所示,限于篇幅,圖中只給出了采煤機關(guān)鍵部件的結(jié)構(gòu)關(guān)系,后續(xù)將在知識圖譜建模部分詳細描述實體所包含的類型及關(guān)聯(lián)關(guān)系。
圖2 采煤機部分硬件拓撲結(jié)構(gòu)
通過梳理故障檢修規(guī)范方面的相關(guān)資料,將與故障檢修相關(guān)的實體分為故障類型、故障位置、故障現(xiàn)象、原因分析、解決方法5種類型,進行實體規(guī)范化命名。
2.2.1 故障類型的規(guī)范命名
采煤機可能發(fā)生的故障主要包括機械故障和電氣故障,由于液壓故障的發(fā)生率比較高,將采煤機故障檢修知識庫的故障類型分為機械故障、液壓故障和電氣故障,如圖3所示。
圖3 采煤機故障分類
2.2.2 故障位置的規(guī)范命名
故障位置的命名需要根據(jù)不同的故障類型來進行具體規(guī)劃,而且需要準(zhǔn)確定位到故障發(fā)生的部位,命名要求是簡潔明了且易于精準(zhǔn)導(dǎo)向故障發(fā)生位置。結(jié)合硬件拓撲的實體命名規(guī)范,分別針對機械故障、液壓故障和電氣故障3種故障類型進行故障位置的規(guī)范命名。
(1) 機械故障。機械故障根據(jù)采煤機的硬件拓撲結(jié)構(gòu)分為截割部故障、牽引部故障、主機架故障、齒輪故障和軸承故障。由于采煤機機械故障中齒輪和軸承的問題經(jīng)常出現(xiàn),所以單獨列出齒輪和軸承故障,方便常見故障的知識檢索。
(2) 液壓故障。采煤機出現(xiàn)的故障問題有80%屬于液壓故障,液壓故障一旦出現(xiàn)會嚴重影響煤礦開采的效率。通過整理液壓故障的相關(guān)資料,將液壓故障大致分為液壓牽引部故障、液壓系統(tǒng)壓力故障、液壓調(diào)高系統(tǒng)故障、補油熱交換系統(tǒng)壓力故障、油液故障、滾筒故障、擋煤板故障、采煤機降塵故障等8種類型。
(3) 電氣故障。通過整理電氣故障相關(guān)資料,將電氣故障大致分為先導(dǎo)回路故障、搖臂升降系統(tǒng)故障、端頭站與遙控器故障、電動機故障、瓦斯斷電儀與傳感器故障、變頻器故障6種類型。
2.2.3 故障現(xiàn)象的規(guī)范描述
由于采煤機結(jié)構(gòu)內(nèi)部故障的因素耦合關(guān)聯(lián),如何精準(zhǔn)檢索到相應(yīng)的故障現(xiàn)象及相關(guān)故障原因分析和解決辦法是構(gòu)建智能維護知識庫的關(guān)鍵問題。故障現(xiàn)象規(guī)范描述的原則是簡潔、清楚,可選擇多個相同或相近的關(guān)鍵詞匹配相應(yīng)的故障現(xiàn)象,進而高效、準(zhǔn)確地檢索到故障現(xiàn)象。以“故障位置+故障現(xiàn)象”的格式對故障現(xiàn)象進行命名,如針對搖臂傳動箱中二軸軸承的磨損問題,命名為“二軸軸承磨損”。
2.2.4 原因分析的規(guī)范描述
故障現(xiàn)象與故障原因之間是一對多關(guān)系,即一種故障現(xiàn)象對應(yīng)多個故障原因。采用“關(guān)鍵詞+潛在原因分析”的描述方式將可能的故障原因存儲在采煤機智能維護知識庫中,這種方式既利于精準(zhǔn)檢索潛在原因,也可以描述故障發(fā)生過程的演化機理,便于追本溯源。
2.2.5 解決方法的規(guī)范描述
解決方法與原因分析是一對一關(guān)系,即一種可能的故障原因?qū)?yīng)于一種解決方法。采用“動詞+名詞”的命名方式對解決方法進行規(guī)范描述,如“緊固連接螺栓”“更換齒輪油”“過濾齒輪油”等。
通過采煤機控制狀態(tài)及運行狀態(tài)的變化反映采煤機真實服役狀態(tài)是一種有效且可行的手段。整理MG400/930-WD交流電牽引采煤機的各個監(jiān)測點位,得到采煤機傳感監(jiān)測點分布,如圖4所示。根據(jù)各項監(jiān)測指標(biāo)命名傳感監(jiān)測實體,最終對應(yīng)采煤機硬件拓撲結(jié)構(gòu)的實體命名,得到傳感器實體。
圖4 采煤機部分傳感監(jiān)測裝置分布
要實現(xiàn)采煤機智能維護知識圖譜的建模,首先需要明確圖譜的構(gòu)成元素。主要從實體節(jié)點、實體關(guān)系及實體屬性3個方面定義構(gòu)成元素。
(1) 實體節(jié)點。假設(shè)實體為面向?qū)ο缶W(wǎng)絡(luò)編程中的一個類,針對同一種實體,采煤機型號不同,其實體節(jié)點的抽取及命名也不同。因此,特定型號的采煤機會形成一個獨一無二的實體節(jié)點集?;趯嶓w命名規(guī)范,從硬件拓撲、故障檢修、傳感監(jiān)測3個方面明確實體的種類和數(shù)量。其中,硬件拓撲由整機、部件、子部件、元件和零件5種實體組成。故障檢修由故障類型、故障位置、故障現(xiàn)象、原因分析和解決方法5種實體組成。傳感監(jiān)測由傳感器和監(jiān)測位置2種實體組成。
(2) 實體關(guān)系。實體關(guān)系指2個實體之間存在的某種或某幾種特定的交互關(guān)系。實體關(guān)系是反映物理世界運行規(guī)律最本質(zhì)的體現(xiàn)。在知識庫的建模過程中,抽取實體關(guān)系是完成智能維護知識固化的基礎(chǔ)。本文中采煤機智能維護知識庫的實體關(guān)系描述的是故障檢修信息在硬件拓撲結(jié)構(gòu)、傳感器和檢修規(guī)范之間流動的內(nèi)在邏輯。
(3) 實體屬性。實體屬性描述實體本源信息,是一個實體區(qū)別于另一個實體的基本參數(shù)。在知識圖譜的建模過程中,實體屬性通常以實體的內(nèi)涵描述為主,不以網(wǎng)絡(luò)節(jié)點的形式存在。如工作面長度、機面高度、滾筒直徑、調(diào)高誤差、極限運輸負荷、坡度、俯仰角、搖臂長度等數(shù)據(jù)是用于描述采煤機的性能參數(shù),對于型號確定的采煤機,其性能參數(shù)是確定的,故可以將其作為采煤機實體的屬性。
采煤機智能維護知識圖譜的實體屬性可以歸納為名稱、基本參數(shù)、可擴展性、性質(zhì)4個方面,見表1。此外,為便于圖譜的直接展示,在實體屬性中加入實體節(jié)點半徑與節(jié)點顏色屬性,從而增加不同類型實體的區(qū)分度。
表1 采煤機故障檢修知識圖譜的實體屬性
知識圖譜本質(zhì)上是一種基于圖論的數(shù)據(jù)存儲、檢索理論和方法。為了清晰描述采煤機智能維護知識圖譜的構(gòu)建過程,采用圖論方法建立包含維護知識實體、關(guān)系與相關(guān)屬性的有向圖模型,并通過合理的形式化描述,介紹智能維護知識圖譜的拓撲架構(gòu)的構(gòu)建過程。
步驟1:建立硬件拓撲子網(wǎng)絡(luò)圖。
硬件拓撲子網(wǎng)絡(luò)是一種依托硬件拓撲結(jié)構(gòu)的關(guān)系描述?;趯嶓w及關(guān)系屬性的命名規(guī)范,從機械、液壓和電氣3個方面抽取實體類型為整機、部件、子部件、元件和零件的節(jié)點和關(guān)系,子部件和元件實體類型可根據(jù)情況調(diào)整。硬件拓撲子網(wǎng)絡(luò)圖Gst可描述為
Gst={Vst,Est,Wst}
(1)
Vst={Vequip,Vcomp,Vscomp,Vunit,Vpart}
(2)
式中:Vst為硬件拓撲結(jié)構(gòu)實體節(jié)點集合;Est為5種類型實體的關(guān)系集合;Wst用于描述Est中的量化關(guān)系,在知識圖譜中可通過關(guān)系的屬性來描述;Vequip為設(shè)備整機實體節(jié)點,本文中整機實體為采煤機;Vcomp為部件實體節(jié)點,如截割部、牽引部等;Vscomp為子部件實體節(jié)點,如截割部的搖臂、滾筒等,為了清楚描述設(shè)備硬件拓撲關(guān)系,子部件實體也可分為多個層級;Vunit為元件實體節(jié)點,以獨立個體的形式存在,完成部分功能,其本身常由若干零件構(gòu)成,如搖臂的截割電動機、截割傳動箱等;Vpart為硬件拓撲中的最小層級,通常為設(shè)備細分的最小獨立單位,如截割傳動箱的殼體、一軸、二軸、中心齒輪組、行星齒輪等。
Est采用實體→關(guān)系→實體的結(jié)構(gòu)模式描述,具體內(nèi)容包括整機→component_of(關(guān)系)→部件,部件→subcomponent_of(關(guān)系)→子部件,子部件→unit_of(關(guān)系)→元件,元件→part_of(關(guān)系)→零件。采煤機硬件拓撲子網(wǎng)絡(luò)圖如圖5所示。其中,I為設(shè)備整機的部件總數(shù),i=1,2,…,I;J為部件i的子部件總數(shù),j=1,2,…,J;K為子部件ij的元件總數(shù),k=1,2,…,K;L為元件ijk的零件總數(shù),l=1,2,…,L。
圖5 采煤機硬件拓撲子網(wǎng)絡(luò)圖
步驟2:建立故障檢修子網(wǎng)絡(luò)圖。
故障檢修子網(wǎng)絡(luò)圖用于描述故障現(xiàn)象、原因分析及最終解決方法之間的邏輯關(guān)系。事實上,導(dǎo)致一種故障現(xiàn)象發(fā)生的原因非常多,基于故障命名規(guī)范,構(gòu)建故障類型、故障發(fā)生位置、故障現(xiàn)象、原因分析、解決方法5類實體的耦合關(guān)系圖。故障檢修子網(wǎng)絡(luò)圖Gft可描述為
Gft={Vft,Eft,Wft}
(3)
Vft={Vtype,Vloca,Vphen,Vcause,Vsolu}
(4)
式中:Vft為故障檢修子網(wǎng)絡(luò)圖的節(jié)點集合,由5類實體節(jié)點集組成;Eft為故障檢修子網(wǎng)絡(luò)圖中的關(guān)系集合;Wft用于描述關(guān)系集合Eft中的量化關(guān)系,在知識圖譜中可以通過關(guān)系的屬性來描述;Vtype為故障類型實體節(jié)點;Vioca為故障發(fā)生位置實體節(jié)點;Vphen為故障現(xiàn)象實體節(jié)點;Vcause為故障發(fā)生的可能原因?qū)嶓w節(jié)點;Vsolu為對應(yīng)于某種故障發(fā)生原因的解決方法實體節(jié)點。
Eft采用實體→關(guān)系→實體的結(jié)構(gòu)模式描述,具體內(nèi)容包括采煤機故障→type_of(關(guān)系)→故障類型,故障類型→location_of(關(guān)系)→故障位置,故障位置→phenomenon_of(關(guān)系)→故障現(xiàn)象,故障現(xiàn)象→cause_of(關(guān)系)→原因分析,故障分析→solution_of(關(guān)系)→解決方法。采煤機故障檢修子網(wǎng)絡(luò)圖如圖6所示。其中,M為故障類型總數(shù),m=1,2,…,M;N為故障位置總數(shù),n=1,2,…,N;R為故障現(xiàn)象x的原因總數(shù),r=1,2,…,R;S為故障現(xiàn)象x的解決方法總數(shù),s=1,2,…,S。
圖6 采煤機故障檢修子網(wǎng)絡(luò)圖
步驟3:建立傳感監(jiān)測子網(wǎng)絡(luò)圖。
傳感監(jiān)測子網(wǎng)絡(luò)圖用于描述布置在設(shè)備各個關(guān)鍵運行元部件上的傳感器與監(jiān)測位置的關(guān)聯(lián)關(guān)系。該網(wǎng)絡(luò)圖中包含傳感器實體節(jié)點、監(jiān)測位置實體節(jié)點,為了清晰描述傳感器的監(jiān)測位置與監(jiān)測目標(biāo),監(jiān)測位置實體節(jié)點對應(yīng)于硬件拓撲子網(wǎng)絡(luò)圖中最小的層級,也就是元件級或零件級。傳感監(jiān)測子網(wǎng)絡(luò)圖Gse可描述為
Gse={Vse,Ese,Wse}
(5)
Vse={Vsen,Vloca}
(6)
式中:Vse為傳感監(jiān)測實體節(jié)點集合,由傳感器、監(jiān)測位置2類實體節(jié)點集合組成;Ese為傳感監(jiān)測子網(wǎng)絡(luò)圖中的關(guān)系集合;Wse用于描述Ese中的量化關(guān)系,在知識圖譜中可以通過關(guān)系的屬性來描述;Vsen為傳感器實體節(jié)點集;Vloca為傳感器監(jiān)測的設(shè)備具體位置節(jié)點集,為了精確描述監(jiān)測對象,以設(shè)備部件的最小層級零件或部件來表示監(jiān)測位置。
Ese采用實體→關(guān)系→實體的結(jié)構(gòu)模式描述,具體內(nèi)容為傳感器→monitor_of(關(guān)系)→位置。采煤機傳感監(jiān)測子網(wǎng)絡(luò)圖如圖7所示。其中,T為故障位置n處的傳感器總數(shù),t=1,2,…,T。
圖7 采煤機傳感監(jiān)測子網(wǎng)絡(luò)圖
步驟4:合并各子網(wǎng)絡(luò)圖,建立采煤機智能維護知識網(wǎng)絡(luò)圖。
硬件拓撲子網(wǎng)絡(luò)圖Gst、故障檢修子網(wǎng)絡(luò)圖Gft和傳感監(jiān)測子網(wǎng)絡(luò)圖Gse有相同的節(jié)點,但邊不相交,即Est∩Eft∩Ese=?,Vst∩Vft∩Vse=?。將各子網(wǎng)絡(luò)圖合并,形成包含整機、部件、子部件、元件、零件、故障類型、故障現(xiàn)象、原因分析、解決方法、傳感器10類實體節(jié)點的采煤機智能維護知識圖譜的拓撲網(wǎng)絡(luò)G:
G={V,E,W}=Gst1∪…∪GstA∪Gft1∪…∪
GftB∪Gse1∪…∪GseC
(7)
式中:V為采煤機智能維護知識圖中所有實體類型的節(jié)點集合;E為所有智能維護知識圖中所有實體的關(guān)系集合;W用于描述E中的量化關(guān)系;GstA為第A個硬件拓撲子網(wǎng)絡(luò)圖;GftB為第B個故障檢修子網(wǎng)絡(luò)圖;GseC為第C個傳感監(jiān)測子網(wǎng)絡(luò)圖。
合并后的知識圖譜邏輯關(guān)系如圖8所示。
圖8 合并后的知識圖譜邏輯關(guān)系
知識圖譜中的數(shù)據(jù)表示方式和數(shù)據(jù)存儲方式種類多樣,尤其是結(jié)構(gòu)化程度低、數(shù)據(jù)復(fù)雜、連接關(guān)系多的大數(shù)據(jù),需要根據(jù)垂直領(lǐng)域設(shè)計的知識特點并結(jié)合知識圖譜應(yīng)用的具體場所來確定知識的存儲方式和表示方式。采煤機故障檢修知識庫應(yīng)用于單一的設(shè)備維修,因此不需要頻繁修改實體及關(guān)系,但是由于其整體數(shù)據(jù)量較大,通過關(guān)系型數(shù)據(jù)庫進行大量數(shù)據(jù)導(dǎo)入時會產(chǎn)生較多的表連接或需添加新表、新字段。
圖數(shù)據(jù)庫是一種非關(guān)系型數(shù)據(jù)庫,隨著大數(shù)據(jù)時代對提高數(shù)據(jù)檢索效率的需求而飛速發(fā)展。應(yīng)用較多的圖數(shù)據(jù)庫有Neo4j,HyperGraphDB,Trinity,AllegroGraph,InfiniteGraph,DEX,InfoGrid等。其中,Neo4j圖數(shù)據(jù)庫具有便攜性與擴展性良好、支持百億級數(shù)據(jù)量存儲、易于維護等特點,是當(dāng)前最受歡迎的圖數(shù)據(jù)庫[13]。因此,本文選用Neo4j圖數(shù)據(jù)庫作為知識圖譜數(shù)據(jù)存儲和分析的數(shù)據(jù)庫。
Neo4j圖數(shù)據(jù)庫包含2種數(shù)據(jù)存儲方式:
(1) 節(jié)點(Node)。表示知識圖譜中的特征實體,該實體可以附帶與之相關(guān)的屬性詞,理論上數(shù)量沒有上限。其格式?jīng)]有要求,主要依據(jù)節(jié)點的屬性標(biāo)簽來進行分類。
(2) 關(guān)系(Relationship)。表示當(dāng)前節(jié)點與其他節(jié)點之間的關(guān)系,關(guān)系自身也可以設(shè)定屬于自己的屬性,與節(jié)點基本相同,存儲格式也沒有特定的要求,不過其包含所連接的2個節(jié)點的ID。
4.2.1 實體導(dǎo)入
實體的導(dǎo)入分單個導(dǎo)入和批量導(dǎo)入2種模式??紤]到不同類型實體的數(shù)量差異較大,少則3個,多則近300個,因此,本文采用單個導(dǎo)入和批量導(dǎo)入2種模式組合的方式進行實體導(dǎo)入。其中,故障類型采用單個導(dǎo)入方式,由于故障位置、故障現(xiàn)象、故障分析、解決方法的實體數(shù)量較多,且較復(fù)雜,故均采用批量導(dǎo)入方式。
(1) 單個導(dǎo)入。采煤機發(fā)生的故障屬于液壓故障的故障率為80%,因此,在進行故障分類時將其從機械故障和電氣故障中分離出來。對于3種故障類型實體,采用單個分別導(dǎo)入的方法。Cypher導(dǎo)入代碼如下。
單個導(dǎo)入代碼創(chuàng)建節(jié)點實體:create(n:故障類型{故障類型:'液壓故障'})create(n:故障類型{故障類型:'機械故障'})create(n:故障類型{故障類型:'電氣故障'})查詢實體:match(n:故障類型)return n
(2) 批量導(dǎo)入。故障位置數(shù)量超過了10個,因此本文采用批量導(dǎo)入的方式。首先需要創(chuàng)建1個csv文件并將其放在Neo4j數(shù)據(jù)庫文件夾的import目錄下,將所有的故障位置實體排成1列,編碼模式為utf-8。批量導(dǎo)入的Cypher語句如下。
批量導(dǎo)入代碼導(dǎo)入代碼:LOAD CSV FROM "file://故障位置.csv" AS linemerge(a:故障位置{故障位置:line[0]})查詢實體:match(n:故障位置)return n
4.2.2 實體間關(guān)系導(dǎo)入
實體導(dǎo)入只涉及單個內(nèi)容的導(dǎo)入,大批量導(dǎo)入比較簡單,而多個實體之間關(guān)系的導(dǎo)入相對比較復(fù)雜。實體間關(guān)系包括如下情形:① 單個實體對應(yīng)單個實體;② 單個實體對應(yīng)多個實體;③ 多個實體對應(yīng)單個實體。因為csv文件只能存在一對一的映射關(guān)系,而關(guān)系創(chuàng)建語句create不適合對同一實體創(chuàng)建多個關(guān)系,所以本文采用另一種Cypher語句——merge。使用merge語句時,先進行實體關(guān)系查詢,若已存在關(guān)系則不創(chuàng)建,若不存在關(guān)系則創(chuàng)建,避免了create語句直接創(chuàng)建實體關(guān)系時可能出現(xiàn)的錯誤。
以故障檢修子網(wǎng)絡(luò)圖的實現(xiàn)過程為例,對于該子圖的5種實體,需要創(chuàng)建4層關(guān)系:① 故障類型與故障位置的關(guān)系;② 故障位置與故障現(xiàn)象的關(guān)系;③ 故障現(xiàn)象與故障分析的關(guān)系;④ 故障分析與相關(guān)解決方法的關(guān)系。
一般的實體關(guān)系導(dǎo)入思路:① 查詢需要關(guān)聯(lián)的實體,一般為單實體與另一實體;② 創(chuàng)建關(guān)系:{實體1→[關(guān)系名稱]→實體2},該關(guān)系可能為單向或雙向。根據(jù)上述思路,采用csv文件導(dǎo)入法創(chuàng)建4層關(guān)系,依次創(chuàng)建以4層關(guān)系命名的csv文件,以方便識別和導(dǎo)入。創(chuàng)建的csv文件必須放在Neo4j目錄下的import文件夾中,否則下面的導(dǎo)入語句會出現(xiàn)故障。以故障類型與故障位置實體關(guān)系為例,Cypher導(dǎo)入語句如下。
關(guān)系導(dǎo)入代碼LOAD CSV FROM "file://故障類型與位置關(guān)系.csv"AS linematch(from:故障位置{故障位置:line[2]})match(to:故障類型{故障類型:line[0]})merge(to)-[r:位置{location:line[1]}]->(from)
根據(jù)導(dǎo)入的實體關(guān)系,形成故障類型與故障位置的一對多關(guān)系表達(圖9)、故障現(xiàn)象與原因分析的一對一關(guān)系表達、原因分析與解決方法的多對一關(guān)系表達,最終形成包含整機、部件、子部件、元件、零件、故障類型、故障現(xiàn)象、原因分析、解決方法、傳感器10類實體節(jié)點的采煤機智能維護知識圖譜,如圖10所示。
圖9 故障類型與故障位置的一對多關(guān)系表達
圖10 采煤機智能維護知識圖譜
使用Py2neo庫中的Node,Relationship及Graph實現(xiàn)知識庫智能交互。Node用于創(chuàng)建節(jié)點實體,Relationship用于創(chuàng)建連接實體的關(guān)系,Graph用于故障查詢。假設(shè)某采煤機發(fā)生故障,通過傳感器傳來的數(shù)據(jù)初步斷定屬于液壓故障,故障位置在滾筒,故障現(xiàn)象是滾筒升降出現(xiàn)問題,提取關(guān)鍵詞“不能調(diào)高”“升降”,在查詢系統(tǒng)中輸入關(guān)鍵詞進行查詢,查詢結(jié)果如圖11所示。雙擊查詢結(jié)果,得到詳細的故障內(nèi)容,包括故障現(xiàn)象分析和解決方法等。
圖11 模擬故障查詢結(jié)果
(1) 構(gòu)建了基于知識圖譜的采煤機智能維護知識庫。從實體命名規(guī)范化角度進行知識圖譜的實體消岐,采用形式化描述建模的方式,從硬件拓撲、故障檢修和傳感監(jiān)測3個方面分別建立子網(wǎng)絡(luò)圖,并通過共指消解完成各子網(wǎng)絡(luò)圖的合并,形成采煤機智能維護知識圖譜。
(2) 采用Neo4j,Py2neo等技術(shù)搭建了可實現(xiàn)動態(tài)交互的采煤機智能維護知識庫原型系統(tǒng),初步實現(xiàn)了故障信息檢索、技術(shù)指導(dǎo)等功能。
(3) 提出的采煤機智能維護知識庫構(gòu)建方法對采煤機故障檢修知識固化及數(shù)字化實現(xiàn)具有一定的創(chuàng)新意義和實用價值,然而該方法采用人工構(gòu)建方式,僅適用于小規(guī)模圖譜建模,不能滿足大規(guī)模的工程領(lǐng)域知識圖譜建模需求。此外,考慮到良好的人機交互有助于工程領(lǐng)域知識復(fù)用,后續(xù)工作將從以下4個方面展開:① 研究一種自動的知識圖譜構(gòu)建方式,以提升實體及關(guān)系的抽取效率。② 研究一種基于實體關(guān)系動態(tài)描述的知識推理方法,以實現(xiàn)工程領(lǐng)域知識結(jié)構(gòu)的動態(tài)構(gòu)建。③ 開發(fā)一種友好的人機交互模式,以簡化知識固化與復(fù)用過程。④ 建立一種圖譜構(gòu)建質(zhì)量的評價體系,以提升知識固化準(zhǔn)確性。