劉政 張華 廖育武 肖國(guó)宏
(1.湖北文理學(xué)院汽車與交通工程學(xué)院 湖北省襄陽(yáng)市 441053 2.湖北歐安電氣股份有限公司信息裝備部 湖北省襄陽(yáng)市 441030)
伴隨信息技術(shù)的發(fā)展和制造行業(yè)數(shù)字化改造的實(shí)施,國(guó)內(nèi)制造行業(yè)積累與沉淀了大量的制造設(shè)備工作過(guò)程數(shù)據(jù),逐漸形成了工業(yè)大數(shù)據(jù)。這些設(shè)備中各種機(jī)床設(shè)備占有較大的比例[1]。為了有效利用機(jī)床設(shè)備的大數(shù)據(jù)信息,研究人員提出將數(shù)據(jù)存儲(chǔ)于關(guān)系數(shù)據(jù)庫(kù)等當(dāng)中的數(shù)據(jù)進(jìn)行調(diào)用并應(yīng)用于相關(guān)設(shè)備的健康狀態(tài)監(jiān)測(cè)與故障診斷及預(yù)測(cè)等[2]。隨著2012年谷歌公司正式提出知識(shí)圖譜的概念并應(yīng)用于提高搜索的能力以來(lái),知識(shí)圖譜技術(shù)被廣泛關(guān)注并開始在各行業(yè)進(jìn)行應(yīng)用[3]。Hai[4]等提出了半自動(dòng)構(gòu)建知識(shí)圖譜并應(yīng)用于電網(wǎng)設(shè)備的運(yùn)行及維修。Feng Yun[5]等提出了基于知識(shí)圖譜的電氣信息采集系統(tǒng)故障診斷知識(shí)問(wèn)答系統(tǒng),實(shí)現(xiàn)采集和維護(hù)故障診斷的高效化、智能化。知識(shí)圖譜的應(yīng)用大大提高了數(shù)據(jù)處理的效率,并能清晰直觀的表示知識(shí)間的深層關(guān)系,有利于采用神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)算法對(duì)設(shè)備的健康狀態(tài)和故障隱患進(jìn)行預(yù)測(cè)。本文針對(duì)制造設(shè)備中應(yīng)用較多的鉆床設(shè)備建立知識(shí)圖譜并將其在設(shè)備故障診斷與預(yù)測(cè)方面的應(yīng)用進(jìn)行了探索,建立了相關(guān)知識(shí)圖譜框架及數(shù)據(jù)庫(kù)案例,并對(duì)其應(yīng)用進(jìn)行了分析。
百度百科中解釋知識(shí)圖譜為圖書情報(bào)界中的知識(shí)域可視化或知識(shí)領(lǐng)域映射地圖,是顯示知識(shí)發(fā)展進(jìn)程與結(jié)構(gòu)關(guān)系的一系列各種不同的圖形,用可視化技術(shù)描述知識(shí)資源及其載體,挖掘、分析、構(gòu)建、繪制和顯示知識(shí)及它們之間的相互聯(lián)系[6]。而知識(shí)圖譜作為知識(shí)的結(jié)構(gòu)化表示,是一種以圖的形式來(lái)描述知識(shí)和客觀世界萬(wàn)物之間關(guān)聯(lián)關(guān)系的技術(shù)方法[7]。本質(zhì)上,知識(shí)圖譜是一種描述實(shí)體、實(shí)體屬性與實(shí)體關(guān)系的大型語(yǔ)義網(wǎng)絡(luò),其由節(jié)點(diǎn)與邊組成。節(jié)點(diǎn)可以代表一個(gè)概念、一個(gè)實(shí)體或一個(gè)屬性,邊可以代表實(shí)體、概念等相關(guān)屬性。
同時(shí)知識(shí)圖譜對(duì)于不同的領(lǐng)域可分為通用知識(shí)圖譜與領(lǐng)域知識(shí)圖譜。通用知識(shí)圖譜主要采用三元組的形式進(jìn)行表示,實(shí)體構(gòu)建的規(guī)模較大,精確度要求較低一般應(yīng)用于搜索與問(wèn)答。而領(lǐng)域知識(shí)圖譜側(cè)重于知識(shí)的質(zhì)量,需要行業(yè)數(shù)據(jù)進(jìn)行構(gòu)建,一般應(yīng)用于軍事、機(jī)械、醫(yī)療等特定領(lǐng)域進(jìn)行輔助決策。
知識(shí)圖譜架構(gòu)主要從邏輯結(jié)構(gòu)與構(gòu)建技術(shù)兩方面進(jìn)行區(qū)分。
2.2.1 知識(shí)圖譜邏輯結(jié)構(gòu)
知識(shí)圖譜的邏輯結(jié)構(gòu)包括數(shù)據(jù)層與模式層,知識(shí)的表示形式是事實(shí),故而數(shù)據(jù)層由大量的事實(shí)構(gòu)成。而模式層由實(shí)體構(gòu)成,是知識(shí)圖譜的核心,是保證知識(shí)質(zhì)量的部分。其建立在數(shù)據(jù)層之上,利用本體與實(shí)體的相關(guān)公理、規(guī)則與約束條件對(duì)數(shù)據(jù)層的事實(shí)進(jìn)行規(guī)范[8]。對(duì)于本體來(lái)說(shuō)是概念的集合,是公認(rèn)的概念事實(shí),變化的概率較小,對(duì)于借助本體庫(kù)構(gòu)建的知識(shí)圖譜不僅結(jié)構(gòu)性強(qiáng),知識(shí)質(zhì)量高冗余較小。
2.2.2 知識(shí)圖譜構(gòu)建技術(shù)
知識(shí)圖譜的技術(shù)架構(gòu)如圖1 所示。
知識(shí)圖譜構(gòu)建的基本方法分為自頂向下的構(gòu)建方法、自底向上的構(gòu)建方法兩種方法,自頂向下的構(gòu)建方法指的是根據(jù)已有的結(jié)構(gòu)化數(shù)據(jù)庫(kù)定義本體與模式層,再?gòu)钠渌麛?shù)據(jù)源中抽取實(shí)體加入到知識(shí)庫(kù)。該方法需要根據(jù)結(jié)構(gòu)化數(shù)據(jù)庫(kù)、專家知識(shí)及固定的知識(shí)體系進(jìn)行實(shí)體與模式層的構(gòu)建,保障知識(shí)的質(zhì)量與準(zhǔn)確性。自低向上的構(gòu)建方法從開放的、半結(jié)構(gòu)化、非結(jié)構(gòu)化或結(jié)構(gòu)化的數(shù)據(jù)庫(kù)、文本信息中抽取事實(shí),選擇置信度較高的知識(shí)加入數(shù)據(jù)庫(kù)中構(gòu)建數(shù)據(jù)層。然后再根據(jù)數(shù)據(jù)層構(gòu)建相關(guān)實(shí)體與模式層[9]。目前通用知識(shí)圖譜大多數(shù)采用自底向上的構(gòu)建方法,如微軟的Satori 知識(shí)庫(kù)。
圖1:知識(shí)圖譜技術(shù)架構(gòu)
圖2:鉆床設(shè)備故障知識(shí)圖譜構(gòu)建步驟
但對(duì)于一些領(lǐng)域知識(shí)圖譜數(shù)據(jù)的特殊性及不完善性,通常采用自頂向下和自低向上相結(jié)合的方式進(jìn)行構(gòu)建。一般首先建立模式層,設(shè)置實(shí)體、屬性及關(guān)系的相關(guān)規(guī)則;然后利用數(shù)據(jù)映射或知識(shí)抽取進(jìn)行實(shí)體、屬性、關(guān)系的填充;最后再利用數(shù)據(jù)層知識(shí)的關(guān)系進(jìn)行知識(shí)推理、知識(shí)更新擴(kuò)展知識(shí)圖譜。
本文提出構(gòu)建鉆床設(shè)備的知識(shí)圖譜并根據(jù)鉆床設(shè)備數(shù)據(jù)的復(fù)雜性提出了相關(guān)構(gòu)建方法,提出利用自頂向下與自底向上結(jié)合的方式構(gòu)建知識(shí)圖譜,首先通過(guò)人工建立實(shí)體模式層,然后隨著數(shù)據(jù)的積累從事實(shí)進(jìn)行實(shí)體更新與填充。根據(jù)鉆床設(shè)備故障數(shù)據(jù)的復(fù)雜性進(jìn)行實(shí)體、實(shí)體關(guān)系的定義,鉆床設(shè)備知識(shí)圖譜的構(gòu)建過(guò)程主要包括知識(shí)表示即實(shí)體建模與存儲(chǔ)、知識(shí)映射、知識(shí)更新與可視化處理。其具體實(shí)現(xiàn)步驟如圖2 所示。
知識(shí)表示是對(duì)知識(shí)的一種描述,將知識(shí)表示稱為一種計(jì)算機(jī)可理解的數(shù)據(jù)結(jié)構(gòu),現(xiàn)如今知識(shí)表示可分為邏輯表示[10]、產(chǎn)生式表示、框架表示、面向?qū)ο蟮谋硎?、本體表示、基于模型的知識(shí)表示等。對(duì)于鉆床設(shè)備的知識(shí)表示可分為數(shù)據(jù)的收集與本體的構(gòu)建,鉆床設(shè)備數(shù)據(jù)來(lái)源于設(shè)備使用手冊(cè)、生產(chǎn)制造積累的關(guān)系數(shù)據(jù)庫(kù)、專家經(jīng)驗(yàn)、案例文本等結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù),為本體模式層的構(gòu)建提供了數(shù)據(jù)的支持。
本文以本體表示的方式進(jìn)行知識(shí)表示,并將本體模型定義為P=<C、R、S、A>四元組形式,P 表示本體模型、C 表示本體概念即某實(shí)體類別的集合、R 表示概念之間的關(guān)系、S 表示子概念即實(shí)體元素、A 元素屬性,同時(shí)本文將概念的屬性與概念表示在一起,并未采用單獨(dú)表示的形式。根據(jù)定義的本體模型建立鉆床設(shè)備的網(wǎng)狀知識(shí)結(jié)構(gòu),為了便于查詢與分析,也可以將其轉(zhuǎn)化為RDF 語(yǔ)言三元組的形式。
知識(shí)映射是指建立兩個(gè)數(shù)據(jù)模型,利用相關(guān)語(yǔ)言或技術(shù)將模型之間的元素進(jìn)行關(guān)系的鏈接形成網(wǎng)狀結(jié)構(gòu)。鉆床設(shè)備故障事實(shí)一般存儲(chǔ)于關(guān)系數(shù)據(jù)庫(kù)中,屬于結(jié)構(gòu)化數(shù)據(jù),所以本文提出基于關(guān)系數(shù)據(jù)庫(kù)進(jìn)行知識(shí)映射。將鉆床設(shè)備故障案例中的實(shí)體、關(guān)系、屬性等存儲(chǔ)于Mysql 關(guān)系數(shù)據(jù)庫(kù)中,形成相應(yīng)的數(shù)據(jù)表格,利用R2RML[11]、D2RQ 映射語(yǔ)言進(jìn)行直接映射或采用間接映射將本體與數(shù)據(jù)同時(shí)存在Neo4j 中進(jìn)行數(shù)據(jù)映射等。根據(jù)解析工具將本體解析為如<主軸(實(shí)體)、故障原因(關(guān)系)、電機(jī)(實(shí)體)>的形式,然后與建立的關(guān)系數(shù)據(jù)庫(kù)進(jìn)行相關(guān)映射,將數(shù)據(jù)庫(kù)中的如<主軸反轉(zhuǎn)、出現(xiàn)、電機(jī)電源接反>與本體中的主軸實(shí)體、故障關(guān)系、電機(jī)實(shí)體映射到解析的本體三元組中,建立本體與數(shù)據(jù)的相關(guān)關(guān)系。
本文中采用人工建立關(guān)系數(shù)據(jù)庫(kù)與本體的形式,將數(shù)據(jù)庫(kù)存儲(chǔ)與Mysql 關(guān)系型數(shù)據(jù)庫(kù)中,形成XML 或Excel 關(guān)系表格并就將其存入Neo4j 圖數(shù)據(jù)庫(kù)中,然后利用protégé[12]軟件建立本體與實(shí)體形成SQL 語(yǔ)言文件并進(jìn)行解析形成三元組。通過(guò)知識(shí)映射能更好地表示實(shí)體間關(guān)系,同時(shí)為知識(shí)推理與知識(shí)更新做了相應(yīng)的基礎(chǔ),豐富了本體、實(shí)體間的關(guān)系。
知識(shí)推理是指對(duì)已建立的知識(shí)圖譜進(jìn)行進(jìn)一步的知識(shí)挖掘與預(yù)測(cè),挖掘出實(shí)體間隱含的關(guān)系,并對(duì)未來(lái)的關(guān)系、屬性等進(jìn)行預(yù)測(cè),進(jìn)而豐富擴(kuò)充知識(shí)圖譜。Ni Lao·William W. Cohen[13]等提出了一種新的鄰近度度量方法用于路徑約束隨機(jī)行走,進(jìn)行檢測(cè)實(shí)體間的關(guān)系。Lei[14]提出了改進(jìn)的基于規(guī)則的推理方法來(lái)推理出微生物之間的相關(guān)性。
鉆床設(shè)備故障的知識(shí)推理可體現(xiàn)在如電機(jī)部件間的關(guān)系、使用時(shí)間與發(fā)生故障可能性的關(guān)系、主軸之間的位置關(guān)系等。其應(yīng)用的對(duì)象可以是設(shè)備的實(shí)體、屬性、實(shí)體的關(guān)系等。從推理的方式上知識(shí)推理可分為基于演繹的知識(shí)圖譜推理和基于歸納的知識(shí)圖譜推理。知識(shí)更新一般分為模式層更新與數(shù)據(jù)層更新,模式層更新就是對(duì)本體的增加、刪減、變更等[15],但本體更改概率較小且會(huì)影響實(shí)體與其他概念,所以鉆床設(shè)備知識(shí)的更新一般采用數(shù)據(jù)層的更新。根據(jù)工業(yè)生產(chǎn)過(guò)程中產(chǎn)生的事實(shí)數(shù)據(jù),篩選高質(zhì)量的知識(shí)進(jìn)行實(shí)體的增加、刪減、變更等,實(shí)現(xiàn)數(shù)據(jù)層的擴(kuò)充。
鉆床設(shè)備知識(shí)圖譜數(shù)據(jù)可以采用三元組形式存儲(chǔ),工作人員根據(jù)存儲(chǔ)的語(yǔ)言進(jìn)行相關(guān)查詢,但并不能直觀清晰的查看實(shí)體間的關(guān)系,對(duì)于不具有工作經(jīng)驗(yàn)的人員不能直接進(jìn)行設(shè)備故障的檢測(cè)與判斷。故而本文提出采用Neo4j[16]對(duì)三元組知識(shí)進(jìn)行處理,利用neo4j-admin import 將部分鉆床設(shè)備的關(guān)系型數(shù)據(jù)導(dǎo)入Neo4j 中展示可視化圖譜。圖譜中包含了47 個(gè)實(shí)體事實(shí)、4 種關(guān)系。47 個(gè)實(shí)體分為三類屬性進(jìn)行表示為18 個(gè)故障實(shí)體如絲杠、主軸、電機(jī)、數(shù)控裝置等并分別標(biāo)簽鉆床部件、氣動(dòng)系統(tǒng)、數(shù)控系統(tǒng)等屬性,16個(gè)發(fā)生現(xiàn)象如絲杠支撐松動(dòng)、傳動(dòng)精度減弱、主軸運(yùn)動(dòng)困難等標(biāo)簽為故障現(xiàn)象、13 個(gè)故障原因如灰塵進(jìn)入數(shù)控裝置、主軸與皮帶過(guò)松或過(guò)緊等標(biāo)簽為故障原因。每個(gè)實(shí)體對(duì)應(yīng)一個(gè)節(jié)點(diǎn),每個(gè)邊表示4 種關(guān)系,第一層關(guān)系為子類及包含、第二層關(guān)系為發(fā)生、第三層關(guān)系為發(fā)生的原因。實(shí)體及邊共同構(gòu)成了鉆床設(shè)備部分事實(shí)數(shù)據(jù)的知識(shí)圖譜,具有高性能、輕量級(jí)、嵌入式等優(yōu)點(diǎn)同時(shí)還提供了相關(guān)的圖算法更加便捷、清晰,可視化如圖3 所示。
圖3:鉆床設(shè)備知識(shí)圖譜的可視化
知識(shí)圖譜已經(jīng)在語(yǔ)義搜索、智能問(wèn)答、輔助決策以及一些垂直行業(yè)有所發(fā)展及應(yīng)用,并有了一些成熟的系統(tǒng)及平臺(tái),比較著名的有蘋果的智能語(yǔ)音助手Siri,百度公司的小度APP 等。同時(shí)基于知識(shí)圖譜的輔助決策也被應(yīng)用于軍事、機(jī)械等行業(yè),李代祎[17]等構(gòu)建了一種基于知識(shí)圖譜的軍事武器問(wèn)答系統(tǒng),喬驥[18]等提出了一種知識(shí)圖譜框架應(yīng)用于電網(wǎng)調(diào)度故障處理的輔助決策。
鉆床設(shè)備是被廣泛應(yīng)用的通用性機(jī)械設(shè)備,可對(duì)零件進(jìn)行鉆孔、擴(kuò)孔、絞孔等工藝,同時(shí)鉆床可分為立式、臺(tái)式、搖臂式、深孔等類型。而對(duì)于通用性廣泛、種類較多的鉆床,其設(shè)備故障作為復(fù)雜事件,將會(huì)受到機(jī)械部件、數(shù)控系統(tǒng)、使用周期等各方面的綜合影響。例如鉆床電機(jī)發(fā)生不轉(zhuǎn)動(dòng)故障,可能是器件接觸不良、電源故障等方面問(wèn)題;某鉆床出現(xiàn)發(fā)熱、電流變大現(xiàn)象,可歸咎于數(shù)控設(shè)備進(jìn)入灰塵,引起元器件絕緣電阻下降損壞器件;某型號(hào)鉆床打孔深度、大小不精確、出現(xiàn)誤差,主軸升降、正反轉(zhuǎn)出現(xiàn)故障可能由平臺(tái)偏移、主軸過(guò)松、電機(jī)故障引起。
針對(duì)不同種類的鉆床設(shè)備出現(xiàn)的故障事實(shí)可能屬于同類故障現(xiàn)象,也可屬于不同故障現(xiàn)象,共同構(gòu)成了復(fù)雜的事實(shí)知識(shí)網(wǎng)絡(luò)架構(gòu)。對(duì)于扁平化的關(guān)系數(shù)據(jù)庫(kù)則不能清晰明了的表示鉆床知識(shí)與展示知識(shí)間的深層關(guān)系,而知識(shí)圖譜對(duì)知識(shí)進(jìn)行直接的表示,并進(jìn)一步分析故障事實(shí)間的關(guān)系。所以鉆床設(shè)備知識(shí)圖譜將可應(yīng)用于故障案例的問(wèn)答搜索,通過(guò)可視化界面進(jìn)行相關(guān)部件的查詢并給出具有關(guān)聯(lián)性較大的實(shí)體及關(guān)系,同時(shí)建立的知識(shí)圖譜中包含解決方法幫助鉆床操作人員做出決策,起到輔助決策的作用。鉆床設(shè)備知識(shí)圖譜描述了鉆床實(shí)體、使用時(shí)間、實(shí)體關(guān)系等事件的復(fù)雜關(guān)系,在鉆床設(shè)備領(lǐng)域方面發(fā)揮了較大的技術(shù)作用,提升了設(shè)備故障診斷的智能化處理水平。應(yīng)用于故障診斷與預(yù)測(cè)方面不僅提高了數(shù)據(jù)的利用率及故障處理的效率,對(duì)于無(wú)經(jīng)驗(yàn)的工作人員還具有重要的指導(dǎo)效果,能清晰直觀的展示故障對(duì)象、故障原因及解決方法,減少了處理不當(dāng)?shù)陌l(fā)生概率。
為了提高工業(yè)大數(shù)據(jù)的應(yīng)用效率,本文提出一種鉆床設(shè)備知識(shí)圖譜的構(gòu)建及其在設(shè)備故障診斷與預(yù)測(cè)中的應(yīng)用方法。介紹了關(guān)于知識(shí)圖譜的定義及架構(gòu),并從知識(shí)表示、知識(shí)映射、知識(shí)推理與更新及可視化處理四個(gè)方面對(duì)鉆床設(shè)備故障案例知識(shí)圖譜的構(gòu)建進(jìn)行了相關(guān)介紹。同時(shí)提出將該知識(shí)圖譜應(yīng)用與問(wèn)答及輔助決策方面,分析了應(yīng)用特點(diǎn)及優(yōu)點(diǎn)。對(duì)于未來(lái)的工作將實(shí)現(xiàn)知識(shí)圖譜的具體建立并進(jìn)行實(shí)際應(yīng)用,建立的知識(shí)圖譜將包含不同類型鉆床的故障案例實(shí)體,擴(kuò)大本體與關(guān)系的建立。同時(shí)選擇最優(yōu)路徑選擇算法,實(shí)現(xiàn)最優(yōu)路徑并提供概率最大發(fā)生的故障實(shí)體與原因。