杜文強,滕宇東,顧 復,,顧新建
(1. 浙江大學 工程師學院,浙江 杭州 310027;2. 浙江大學 機械工程學院,浙江 杭州 310027)
家用吸油煙機是一種安裝在爐灶上部,用于收集、處理被污染空氣的電動器具[1]。家用吸油煙機的設(shè)計與生產(chǎn)涉及空氣動力學、金屬加工制造、電子電氣等學科知識。該產(chǎn)品相關(guān)知識的數(shù)據(jù)資源豐富。以“吸油煙機”作為關(guān)鍵詞,按2000年到2021年的時間段檢索發(fā)現(xiàn),大為專利網(wǎng)站上約有4萬份公開專利,中國知網(wǎng)數(shù)據(jù)平臺上約有2萬篇論文,國家標準公共平臺上有11份相關(guān)標準,企業(yè)標準備案公共平臺上約有100份標準。
家用吸油煙機產(chǎn)品在生命周期的不同階段,對相關(guān)人員的的知識要求是不一樣的。舉例來說:工業(yè)設(shè)計師在研發(fā)過程需要融合各種知識,設(shè)計出讓用戶有更好體驗的產(chǎn)品;工業(yè)工程師需要融合各類知識,以最小的消耗實現(xiàn)最大的產(chǎn)能;銷售員工需要融合各類知識,銷售更多的產(chǎn)品,創(chuàng)造最大的利潤;售后服務工程師需要融合各類知識,更好地提供產(chǎn)品維修服務,最大限度地減少投訴;企業(yè)管理者需要融合各類知識,對產(chǎn)品生命周期各環(huán)節(jié)及部門的知識進行高效集成和利用,提高企業(yè)的經(jīng)營管理和決策水平。對家用吸油煙機產(chǎn)品的各種知識進行高效和精準的融合、集成、利用,離不開知識圖譜的支持。
查閱相關(guān)文獻可知,目前知識本體技術(shù)、知識圖譜技術(shù)等在家用吸油煙機設(shè)計和生產(chǎn)上的應用還是空白。本文將基于Neo4j圖數(shù)據(jù)庫研究家用吸油煙機知識圖譜的構(gòu)建問題,以提高對家用吸油煙機知識管理的水平,提升知識搜索的完整率、準確率和效率,提高企業(yè)的產(chǎn)品研發(fā)和設(shè)計能力。
知識圖譜通過節(jié)點和邊實現(xiàn)關(guān)系結(jié)合[2]。其節(jié)點和邊的關(guān)聯(lián)形式(圖1)有兩種:①描述實體之間的某種特定關(guān)系,如“家用吸油煙機-隸屬于-廚房家電”;②描述實體與其屬性值之間的某種特定關(guān)系,如“家用吸油煙機-功率是-360 W”。
圖1 知識圖譜中節(jié)點和邊的關(guān)聯(lián)形式
知識圖譜的早期理念來自語義網(wǎng)[3],Google公司為優(yōu)化其搜索引擎返回的結(jié)果,改善用戶搜索的質(zhì)量和體驗,提出了知識圖譜的概念[4]。隨著社會發(fā)展,知識圖譜技術(shù)在智能問答等應用方面逐漸發(fā)揮了重要作用[5]。目前,知識圖譜已經(jīng)應用于許多領(lǐng)域,如支持產(chǎn)品創(chuàng)新的用戶需求分析[6]、機電產(chǎn)品創(chuàng)新設(shè)計[7]、產(chǎn)品工藝成本的快速估算[8]、數(shù)控設(shè)備的故障診斷[9]等,能夠有效提高知識管理的水平。
知識圖譜在家用吸油煙機上的應用,就是實現(xiàn)“家用吸油煙機產(chǎn)品-關(guān)系-家用吸油煙機知識文檔”的圖譜化構(gòu)建,將產(chǎn)品、零部件與家用吸油煙機生命周期中的知識文檔關(guān)聯(lián)起來。例如,家用吸油煙機的集煙罩在設(shè)計時需要使用某專利文獻,在測試時需要使用鈑金件的零部件標準,在制造時需要使用集煙罩制造的工藝流程單,在維修時需要使用集煙罩的維修指導書。這些知識一般分散在產(chǎn)品生命周期所涉及的各個部門。在集煙罩知識圖譜中,集煙罩是主線,各相關(guān)知識文檔由各部門圍繞集煙罩的設(shè)計、制造和服務的全生命周期來提供。來自企業(yè)不同部門的家用吸油煙機知識資源如圖2所示。
圖2 來自企業(yè)不同部門的家用吸油煙機知識資源
知識圖譜的構(gòu)建會遇到一些問題,必須有針對性地加以解決。
(1) 知識集成問題。在技術(shù)上,知識圖譜可以實現(xiàn)分散于各部門的知識集成,提高企業(yè)的產(chǎn)品開發(fā)設(shè)計能力,因此知識圖譜中的知識集成是一種有效益的工作。但要讓企業(yè)內(nèi)各部門積極將自己的知識貢獻出來,需要一種機制,讓員工能從知識集成獲得的效益中受益,使知識貢獻者得到公平合理的激勵。只有這樣,知識集成才可持續(xù)。對于不同企業(yè)之間的知識集成問題,要按照知識貢獻所產(chǎn)生的效益進行公平合理的激勵,難度會更大,更需要基于新一代信息技術(shù)的透明、公平的知識集成環(huán)境來確保知識共享各方的利益[10]。
(2) 知識有序化問題。知識圖譜應是高度有序的,即知識節(jié)點、屬性值和邊的名稱應是統(tǒng)一、規(guī)范、準確和完整的。這種知識圖譜的有序化工作要求各部門相關(guān)人員積極認真參與,需要基于新一代信息技術(shù)來構(gòu)建透明、公平的知識有序化環(huán)境[10]。而知識本體技術(shù)的應用有助于知識圖譜有序化的實現(xiàn),例如民用航空維修數(shù)據(jù)有序化[11]、學科知識有序化[12]、文物知識有序化[13]等。在構(gòu)建知識圖譜的三元組結(jié)構(gòu)時,需要利用知識本體技術(shù),使知識圖譜有序化。例如原料藥知識圖譜[14]、民用航空維修知識管理平臺[15]等,均采用了知識本體技術(shù)路線。
(1) 互聯(lián)網(wǎng)公開知識。它包括與家用吸油煙機產(chǎn)品相關(guān)的國家標準、專利、論文、網(wǎng)文、用戶意見和評論等。這類知識很多,構(gòu)建知識圖譜時需要從大量的、雜亂的知識中找到有價值的內(nèi)容。
(2) 企業(yè)內(nèi)部公開知識。它包括日常工作中產(chǎn)生的文檔資料、企業(yè)內(nèi)部使用的內(nèi)控標準、設(shè)計手冊、測試報告等。這是企業(yè)內(nèi)部要求公開的知識,通常較容易獲取。
(3) 企業(yè)內(nèi)部隱性知識。它包括員工的經(jīng)驗訣竅,諸如手感、質(zhì)感、分寸感、節(jié)奏、時機、火候、度的把握能力等,往往屬于員工個人的核心價值范疇[10]。這類隱性知識可以顯性化,但需要員工及時總結(jié)和發(fā)布。構(gòu)建知識圖譜中獲取這部分知識時,需要建立透明公平的激勵機制。
構(gòu)建家用吸油煙機知識圖譜模型的過程如圖3所示。由于Neo4j圖數(shù)據(jù)庫具有查詢便利、可拓展性強等優(yōu)勢[16-17],因此本文構(gòu)建家用吸油煙機知識圖譜模型時采用了Neo4j圖數(shù)據(jù)庫。
圖3 家用吸油煙機知識圖譜模型的構(gòu)建過程
知識本體主要用于解決描述同一概念的知識名稱術(shù)語及關(guān)系的多樣化問題,以提高知識搜索的完整率、準確率和效率。產(chǎn)品知識本體包括知識的名稱術(shù)語本體和名稱同義本體。家用吸油煙機知識本體的構(gòu)建過程主要是:①匯總家用吸油煙機相關(guān)知識的名稱術(shù)語;②識別名稱術(shù)語的相似性,建立知識名稱術(shù)語本體和知識名稱同義本體表;③建立知識名稱術(shù)語的關(guān)系本體。這里以濾網(wǎng)為例來說明。濾網(wǎng)的知識名稱同義本體包含平面網(wǎng)、環(huán)形網(wǎng)、雙層網(wǎng)、塔形網(wǎng)。以濾網(wǎng)為例的產(chǎn)品知識本體如圖4所示。
圖4 以濾網(wǎng)為例的產(chǎn)品知識本體
家用吸油煙機的知識名稱術(shù)語本體主要來自以下方面:①敘詞表、領(lǐng)域字典、設(shè)計手冊等;②相關(guān)知識標題、知識內(nèi)容、關(guān)鍵詞等;③相關(guān)專業(yè)人員。家用吸油煙機集煙罩的知識名稱術(shù)語本體庫主要內(nèi)容見表1。
表1 集煙罩的知識名稱術(shù)語本體庫主要內(nèi)容
知識關(guān)系本體規(guī)范了知識之間的關(guān)系,在知識圖譜中表現(xiàn)為知識名稱術(shù)語本體之間的關(guān)系。在圖5所示的家用吸油煙機知識關(guān)系本體中,知識名稱術(shù)語本體是“節(jié)點”,由“節(jié)點”可鏈接具體的知識文檔;知識關(guān)系本體是“邊”,“邊”描述了這些知識文檔間的關(guān)系。
圖5 家用吸油煙機的知識關(guān)系本體
(1) 產(chǎn)品的內(nèi)部關(guān)系。它主要是一種包含(隸屬)關(guān)系,可采用類似于物料清單的整機、組件、零件之間的關(guān)系。
(2) 產(chǎn)品與其他知識文檔之間的關(guān)系。它主要包括:①設(shè)計引用、測試依照(研發(fā))關(guān)系(用于表示產(chǎn)品或零件在設(shè)計應用、測試依照中的知識文檔);②工藝指導、制造參考(生產(chǎn))關(guān)系(用于表示為產(chǎn)品或零件提供工藝指導、制造參考的相應知識文檔);③維修參考(售后)關(guān)系(用于表示產(chǎn)品或零件的維修所需要參考的知識文檔);④市場營銷參考關(guān)系(用于表示產(chǎn)品市場營銷策略對應的知識文檔);⑤人員管理關(guān)系(用于企業(yè)人員的能力評價,關(guān)聯(lián)其文憑、資格和培訓證書、所獲獎項、所發(fā)知識文檔等)。
(3) 知識文檔的內(nèi)部關(guān)系。它主要是引用或被引用的關(guān)系。
家用吸油煙機知識圖譜中的主要關(guān)系之例見表2。
表2 家用吸油煙機知識圖譜中的主要關(guān)系之例
家用吸油煙機的知識文檔主要分為非結(jié)構(gòu)化、半結(jié)構(gòu)化以及結(jié)構(gòu)化3種。非結(jié)構(gòu)化知識文檔如產(chǎn)品圖片、產(chǎn)品維修視頻等,其信息抽取的準確度較低;半結(jié)構(gòu)化知識文檔如產(chǎn)品在銷售網(wǎng)頁上的數(shù)據(jù)、百度百科介紹等;結(jié)構(gòu)化知識文檔如生產(chǎn)報表數(shù)據(jù)、測試結(jié)果等,這類知識文檔的信息獲取準確度較高。
在構(gòu)建家用吸油煙機知識圖譜時,獲取相應的知識文檔后,需要依靠廣大員工協(xié)同進行知識圖譜中知識文檔節(jié)點的屬性標注。家用吸油煙機知識圖譜的知識獲取流程如圖6所示。目前,知識節(jié)點的屬性標注需要人工完成,要求員工積極認真、主動參與。知識節(jié)點的屬性標注之例見表3。
圖6 家用吸油煙機知識圖譜的知識獲取流程
表3 知識節(jié)點的屬性標注之例
構(gòu)建家用吸油煙機知識圖譜時,需要將獲取的知識以統(tǒng)一的格式存儲下來。它主要有RDF 格式存儲方式和圖數(shù)據(jù)庫存儲方式[17]。家用吸油煙機知識圖譜可采用Neo4j圖數(shù)據(jù)庫的方式進行知識存儲。本文構(gòu)建的家用吸油煙機吸煙組件知識圖譜的相關(guān)產(chǎn)品節(jié)點有19個、邊有18個;知識文檔節(jié)點有57個、邊有92個?;贜eo4j圖數(shù)據(jù)庫生成的家用吸油煙機吸煙組件的知識圖譜如圖7所示。
家用吸油煙機知識圖譜的應用性能評價包括:①知識圖譜內(nèi)容和使用情況的評價(如果沒有一定的內(nèi)容、使用數(shù)量以及增加量,那么知識圖譜就是一個“死庫”,就沒有價值可言);②知識圖譜質(zhì)量的評價(它與知識的有序化水平有關(guān),主要通過知識搜索準確率和完整率這兩個指標進行評價);③企業(yè)部門的知識共享度和員工的知識參與度評價(它是基于知識圖譜的內(nèi)容來源、本體來源的分析,目的在于建立一種透明、公平的知識圖譜協(xié)同共建環(huán)境,促進更多的人參與,使知識圖譜得到可持續(xù)的發(fā)展)。
知識圖譜的內(nèi)容和使用情況評價的主要指標有產(chǎn)品知識名稱術(shù)語本體數(shù)量、知識關(guān)系本體數(shù)量、知識文檔數(shù)量及相應的增加量,此外,還有查找知識時間的縮短量。
研究發(fā)現(xiàn),從家用吸油煙機知識圖譜平臺可行性驗證階段到平臺的試運行階段,平臺用戶數(shù)量以及參與知識共享共建的人數(shù)顯著增加。其效果是產(chǎn)品知識名稱術(shù)語本體、知識文檔的數(shù)量越來越大,知識的日均瀏覽量快速上升(圖8)。
圖8 家用吸油煙機知識圖譜平臺的數(shù)據(jù)量
對于家用吸油煙機的知識圖譜來說,平臺應用前后查找知識文檔的時間對比情況如圖9所示。
由圖9數(shù)據(jù)可算出,與無知識圖譜技術(shù)應用相比,家用吸油煙機知識圖譜平臺試運行階段查找知識文檔的時間縮短了近70%。查找知識文檔時間的縮短有利于工作效率的提升,也讓員工更愿意使用知識圖譜。
圖9 平臺應用前后查找知識文檔的時間對比
知識搜索的準確率和完整率是家用吸油煙機知識圖譜平臺應用性能評價的主要指標。根據(jù)文獻[18],家用吸油煙機知識搜索準確率A為從知識圖譜平臺中成功搜索特定家用吸油煙機知識的概率。其計算式為:
(1)
式中:T為從家用吸油煙機知識圖譜平臺中搜索到的正確樣本數(shù)量;F為從家用吸油煙機知識圖譜平臺中搜索到的錯誤樣本數(shù)量。
家用吸油煙機知識搜索完整率B為從知識圖譜平臺中成功搜索理想結(jié)果的概率。其計算式為:
(2)
式中,X為家用吸油煙機知識圖譜平臺中存在的正確樣本數(shù)量。
本文對采用知識圖譜技術(shù)前后搜索家用吸油煙機知識的準確率和完整率進行了統(tǒng)計。不同搜索分類的搜索結(jié)果如表4所示。顯然,知識圖譜的應用使知識文檔的搜索準確率和完整率得到了有效提升。
表4 不同搜索分類的搜索結(jié)果
企業(yè)部門對家用吸油煙機知識圖譜的知識共享度評價用于激勵部門之間競爭,提高企業(yè)各部門管理者對知識圖譜構(gòu)建和使用的重視程度。企業(yè)部門的知識共享度能夠客觀反映部門的知識共享績效。企業(yè)內(nèi)部各部門之間的職能不同,對產(chǎn)品知識名稱術(shù)語本體以及知識關(guān)系本體的共享能力存在差異。企業(yè)部門對家用吸油煙機知識圖譜的知識共享度評價(例如圖10),可直接用知識文檔的數(shù)量來體現(xiàn)。
圖10 企業(yè)部門對家用吸油煙機知識圖譜的知識共享度評價之例
由圖10可以看出:產(chǎn)品開發(fā)部的知識共享數(shù)量最多;市場營銷部的知識共享數(shù)量最少。通過評價企業(yè)部門對家用吸油煙機知識圖譜的知識共享度,可以激勵各部門的知識共享行為,建立透明公平的知識共享環(huán)境,促進知識圖譜的完善。
員工對家用吸油煙機知識圖譜的知識參與度評價用于公平公正地展現(xiàn)各員工的知識共享情況,可按照評分制度給出每個員工的知識參與度。設(shè)定評分制度時應考慮員工協(xié)同共建的產(chǎn)品知識名稱術(shù)語本體數(shù)量、知識關(guān)系本體數(shù)量、知識文檔數(shù)量,以及員工知識共享行為在同事中的影響。對員工的知識參與度評價,有利于員工之間的相互學習,也有利于所構(gòu)建家用吸油煙機知識圖譜的完善。
知識圖譜能夠幫助制造企業(yè)對分散于各部門的知識進行集成。它以產(chǎn)品零部件為主線的管理模式,摒棄了傳統(tǒng)知識管理中以知識文檔為出發(fā)點的管理模式,避免了產(chǎn)生“死庫”的知識存儲現(xiàn)象。本文通過構(gòu)建家用吸油煙機知識圖譜,解決了一些關(guān)于家用吸油煙機產(chǎn)品全生命周期的知識管理問題。
(1) 家用吸油煙機的知識圖譜是什么?以家用吸油煙機產(chǎn)品零部件生命周期為主線,確定來自不同部門的知識;知識是通過節(jié)點和屬性描述的,知識之間的關(guān)系是用“邊”描述的;知識之間的關(guān)系有多種,并且可通過屬性描述實現(xiàn)多維度管理。
(2) 如何實現(xiàn)家用吸油煙機知識圖譜的有序化?將家用吸油煙機的產(chǎn)品知識名稱術(shù)語本體化;建立產(chǎn)品與知識文檔的節(jié)點和屬性;采用人工標注方式將家用吸油煙機的各類知識轉(zhuǎn)換成結(jié)構(gòu)化的數(shù)據(jù)文檔,在建立產(chǎn)品與知識文檔關(guān)系后實現(xiàn)可視化關(guān)聯(lián)。
(3) 如何解決知識圖譜集成難和有序化難的問題?企業(yè)知識圖譜中的知識來源很廣泛,不僅有公開的知識,還有員工的隱性知識,這部分知識對于企業(yè)尤其重要;知識很雜亂,名稱術(shù)語很多,需要利用本體技術(shù)實現(xiàn)知識的有序化,這些工作的完成都離不開廣大員工主動參與的精神和認真負責的態(tài)度。
(4) 家用吸油煙機知識圖譜的評價指標是什么?家用吸油煙機知識圖譜的應用性能評價要考慮:①知識圖譜數(shù)量指標,沒有數(shù)量就沒有質(zhì)量;②知識圖譜質(zhì)量指標,主要是知識搜索的準確率和完整率;③企業(yè)部門的知識共享度和員工的知識參與度。通過家用吸油煙機知識圖譜的應用性能評價,可建立一種透明公平的知識圖譜協(xié)同共建環(huán)境,促進知識圖譜的快速完善,實現(xiàn)較好的社會效益和經(jīng)濟效益。