王佳皓,張?zhí)A
(1.貴州大學現(xiàn)代制造技術教育部重點實驗室,貴陽 550025;2.貴州師范大學機械與電氣工程學院,貴陽 550025)
數(shù)字孿生體是連接物理空間和知識空間的橋梁和紐帶,通過它來提高產品創(chuàng)新能力和產品附加值,而產品知識的支持是提升數(shù)字孿生體質量的關鍵要素。目前,關于數(shù)字孿生體及知識管理方面的研究已得到國內外學者和業(yè)界的高度重視,并取得了一定的成果。莊存波等[1]把數(shù)字孿生體定義為與真實物理實體完全一致的數(shù)字虛擬模型,可實時模擬自身在真實世界中的性能和行為。陶飛等[2]對基于數(shù)字孿生體的產品設計和工藝設計進行研究和分析,指出基于數(shù)字孿生體的產品設計表現(xiàn)出新的轉變和新突破,其中提到新設計知識和工藝知識挖掘、分析與建模等關鍵點。于勇等[3]基于數(shù)字孿生體的工藝知識挖掘可全面有效地挖掘和總結行業(yè)工藝“設計經驗”和“設計知識”。
目前關于知識推理的研究,官賽萍等[4]總結了基于傳統(tǒng)的知識推理、單步推理、多步推理所包含的推理方法。馬忠貴等[5]總結了知識圖譜的技術架構,從知識抽取、知識融合、知識推理三個方面進行了系統(tǒng)性闡述并作出展望。自動色環(huán)機按照設計要求進行計算后,在方案制定時需要對零器件進行選型,以在滿足客戶要求的同時降低設備的成本。但是對于零器件的選擇需要咨詢相應的廠家,并按照廠家提供的圖紙對產品數(shù)字孿生體的幾何模型進行反復修改或者重建。而且在以往的設計過程中,產品設計公司往往累積了大量的設計知識。但是,設計人員的設計能力各不相同,設計的效率也差異較大。所以如何利用整合公司的設計知識與設計人員的設計經驗以達到知識的快速推理,為創(chuàng)建產品數(shù)字孿生體提供服務是這類公司迫切需要的。
所以,在產品數(shù)字孿生體的構建過程中,對產品功能性能、結構層次、幾何特征、產品特性等方面知識圖譜進行推理,可以提升物理產品的創(chuàng)新水平和質量,從而提供宏觀尺度和微觀尺度的產品知識服務支持,方便產品數(shù)字孿生體構建人員進行知識的理解、查詢和應用,提高產品數(shù)字孿生體構建的質量及效率。
產品數(shù)字孿生體是產品的物理實體在虛擬空間的映射。構建產品數(shù)字孿生體不止是構建相應的虛擬樣機,虛擬樣機主要用于驗證在設計初期系統(tǒng)的某些關鍵決策,提高系統(tǒng)的安全系數(shù)[6]。本文設計的自動色環(huán)機用于對航天連接器中的插孔和插針的外表面進行上色,如圖1所示。本文的設計要求自動色環(huán)機數(shù)字孿生體可以根據(jù)用戶的需求進行改進,并隨時與設計需求進行交互優(yōu)化;模擬工藝流程以驗證該工藝的可行性,并且對工藝執(zhí)行過程有動態(tài)的可視化認識;檢查裝配過程是否有干涉等問題存在。
圖1 產品數(shù)字孿生的設計框架
李浩等[7]提出了基于數(shù)字孿生的復雜產品設計制造一體化體系,對比了傳統(tǒng)設計與基于數(shù)字孿生的設計方法,從3個方面構建了基于數(shù)字孿生的復雜產品設計制造體系框架。本文主要討論自動色環(huán)機的產品數(shù)字孿生體虛擬設計過程。如圖1所示,自動色環(huán)機的設計流程由以下4個方面組成:
圖2 自動色環(huán)機本體(部分)圖
(1)用戶需求。自動色環(huán)機的設計要求設備除人工添料外,插孔插針所有零件實現(xiàn)自動上料排序功能;實現(xiàn)自動識別插針插孔孔徑大小功能;實現(xiàn)識別插針插孔孔徑后上指定顏色;實現(xiàn)自動擺盤;完成上色后成品應滿足圖紙要求;生產速度3~5 s/件。
(2)方案設計。自動色環(huán)機的方案設計包括機械系統(tǒng)、工藝設計和控制系統(tǒng)設計。在此過程中需要對機械結構、工藝流程、控制系統(tǒng)進行設計或選型并優(yōu)化以確保最終方案的可行性。
(3)建立虛擬模型。如圖1所示,本文建立了自動色環(huán)機的虛擬模型。此設備由振動盤、分割器、滑臺擺盤、下機柜、上機罩、操作臂6大部分組成。
(4)樣機裝配與調試。在自動色環(huán)機組裝過程中可能會產生新的誤差。因此,需要在確定自動色環(huán)機虛擬模型高保真的前提下對實物樣機進行裝配與驗證。如果未達到預期目標,則需要進行校準。
基于自動色環(huán)機設計流程,本文總結了其基于數(shù)字孿生的自動色環(huán)機設計框架,如圖1所示。
物理層包括篩選工位、上料工位、上色工位、定位工位、下料工位共5個功能模塊。通過分度轉盤將這5個功能模塊連接起來實現(xiàn)對插孔或插針在各個工位的流轉。各個工位主要通過氣缸、電機進行插針或插孔的拾取與擺放,用探針來篩選合格品。
虛擬層主要建立了自動色環(huán)機的虛擬模型,其中包括了幾何尺寸、裝配關系、運動邏輯等;對每一模塊進行動力學和運動學進行仿真,檢查干涉、時序、速度、受力分析等問題;建立控制模型,進行控制仿真。
數(shù)據(jù)層將物理層和虛擬層所產生的數(shù)據(jù)信息抽取到數(shù)據(jù)層中,包括了工藝信息、產品BOM、仿真數(shù)據(jù)、虛擬樣機數(shù)據(jù)等。
知識層在自動色環(huán)機的設計過程中會使用很多知識,同時也會產生新的知識。新的知識可以從大量的數(shù)據(jù)中分析總結而來,同時知識層包含已有的知識。這些知識可以很好地驅動自動色環(huán)機的設計。
知識圖譜是知識庫的一種,是知識的一種可視化表示、邏輯化組織、關聯(lián)化儲存形式。知識圖譜的構建通?;谡Z義知識,利用語義符號和符號的鏈接描述各個實體間的關系,最終形成一個便于人理解的圖結構。
類似自動色環(huán)機這樣的非標自動化設備的在產品數(shù)字孿生體創(chuàng)建中會產生大量的設計知識與數(shù)據(jù)。因此,結合產品數(shù)字孿生與知識圖譜技術對自動色環(huán)機進行設計可以快速高效可靠地形成設計方案?;诋a品數(shù)字孿生設計的4個階段,我們可以先創(chuàng)建基于知識圖譜的初本體。所謂初本體,是指在創(chuàng)建產品數(shù)字孿生體過程中提取的本體,用來在知識圖譜創(chuàng)建中關聯(lián)知識抽取的范圍。
如圖2所示,基于產品數(shù)字孿生,本文用對自動色環(huán)機的初本體進行初步建模,為后續(xù)知識圖譜建立提供參考和依據(jù)。
自動色環(huán)機設計的知識圖譜屬于垂直行業(yè)知識庫,屬于封閉域[8]。知識圖譜構建過程主要由知識抽取、知識融合和知識推理3部分構成。將知識圖譜技術應用于自動色環(huán)機的設計形成了圖3的設計體系框架,也為類似產品設計開發(fā)提供理論參考。如圖所示,結合初本體與PDM、標注庫、行業(yè)庫進行知識抽取,形成三元組。三元組中實體與屬性存在映射關系,各個實體間通過關系相互連接。知識融合則通過基于屬性實體進行實體對齊與鏈接。形成的產品研制知識庫適用于類似自動色環(huán)機的設備研究,形成產品系列開發(fā)設計知識庫。由此知識庫中基于設計需要與實體屬性可以抽取初自動色環(huán)機設計知識圖譜,最后本文進行知識推理以發(fā)現(xiàn)更多路徑以改善自動色環(huán)機的設計。
圖3 自動色環(huán)機知識圖譜構建框架
1.2.1 知識抽取
知識抽取主要從大量的結構化、半結構化與非結構化的設備設計知識中抽取出實體、關系與屬性。自動色環(huán)機的知識抽取范圍主要在企業(yè)產品數(shù)據(jù)、標準庫與行業(yè)庫。
(1)實體抽取。自動色環(huán)機設計所需要的知識從企業(yè)產品設計流程、部門論文、知識點、參考資料、標準庫與行業(yè)知識庫進行抽取。企業(yè)設計該類型的設備的零部件種類與數(shù)量有限,所以可以采用基于規(guī)則和詞典的方法[9]進行實體抽取。
(2)關系抽取。根據(jù)圖2可以看出自動色環(huán)機的實體間關系相對簡單,可以采用基于規(guī)則模板的方法進行實體關系抽取,具有較高的準確率。但是此方法的人力成本較高,故可以采用半監(jiān)督學習的方法對實體關系進行抽取。
(3)屬性抽取。自動色環(huán)機所構成的實體屬性主要有尺寸、形狀、運動參數(shù)、功率等。這些屬性決定了實體是否適用于自動色環(huán)機的設計,而且每一個實體具有獨特的屬性。因此,它與實體之間有著映射關系。
1.2.2 知識融合
自動色環(huán)機設計過程中所涉及的知識來源多樣,可能存在知識重復、知識表現(xiàn)形式不同等情況,例如同一實體的不同表述指向同一屬性。知識融合需要把這些知識、數(shù)據(jù)進行整合、合并,最終形成對知識的正確表述。本文在自動色環(huán)機的設計過程主要涉及實體對齊與實體鏈接兩部分。
(1)實體對齊。對于自動色環(huán)機的同一實體,由于生產廠家的不同可能有兩種叫法,例如感應器和傳感器。通過實體對齊,將這類同義不同名的實體合并為同一名稱。對于本文實體來說,屬性是其區(qū)分不同實體的重要依據(jù)。所以,可以基于實體屬性對實體進行對齊。
(2)實體鏈接。在已建立的自動色環(huán)機設計知識庫基礎上,給定一個外來文本,實體鏈接需要將外來文本的實體對應到已有知識庫的實體。對于知識庫中不包含的實體,則將該實體添加到知識庫中。對于添加依據(jù),則可以依據(jù)實體屬性與原有知識庫中相似命名實體進行比較,其主要通過計算實體屬性中字符串的相似度來判斷兩個實體是否相同。
1.2.3 知識推理
本文對自動色環(huán)機設計知識圖譜的知識推理進行研究,將部分知識圖譜其代入強化學習環(huán)境,建立了知識推理框架模型,以便后續(xù)類似非標自動化設備開發(fā)。自動色環(huán)機的知識推理框架模型如圖4所示。
圖4 自動色環(huán)機知識推理框架模型
基于平移的知識圖譜表示的基本思想是把知識圖譜中的每一個三元組都映射在幾何空間上,使知識圖譜的圖結構在幾何空間具有一致性[9]。
TransE模型的基本思想:在知識圖譜中,每一條知識都由一個三元組(h,r,t)表示,即頭實體、關系、尾實體。知識圖譜的TransE表示模型希望對每一個實體都分配一個表示向量e,即頭實體向量h,關系r,尾實體t,且它們的關系為:
h+r=t
模型的目標是使知識圖譜中的每一個三元組在幾何空間中都是平移關系,則可以求解優(yōu)化目標。
強化學習[10]的主要思想主要是把推理過程看做是馬爾科夫決策過程。強化學習很好地利用了知識圖譜的嵌入表示,通過對獎勵函數(shù)與策略網絡的構建建立模型。
馬爾科夫決策過程(MDP)由一個四元組成。其中,S是連續(xù)的狀態(tài)空間;A表示所有可能的動作;P為概率傳遞矩陣;R(s,a)是狀態(tài)動作對(s,a)的獎勵函數(shù)。
依據(jù)文獻[11],本文的全局獎勵為:
(1)
另外,較短的路徑比較長的路徑更加有效率,路徑效率的獎勵函數(shù)為:
(2)
式中,lengthp為可達路徑的距離。
本文對于智能體Agent的設置采取蟻群算法[12]的路徑選擇策略:
(3)
式中,i、j分別為路徑的起點和終點;τij為t時間i到j的信息素濃度;ηij=1/dij為能見度,是兩點i、j間距離的倒數(shù);allowedk為尚未訪問過的節(jié)點的集合;α是信息啟發(fā)式因子;β是期望啟發(fā)式因子。
計算完訪問各個實體的概率之后,采用輪盤賭的方法選擇下一個訪問的節(jié)點。為了不讓螞蟻選擇已經訪問過的節(jié)點,采用禁忌表來記錄螞蟻走過的路徑。當螞蟻到達目標實體,將禁忌表中記錄的路徑轉移給可達路徑p,并清空禁忌表。
在蟻群算法中,信息素的更新是蟻群算法的核心。其公式如下:
(4)
(5)
式中,dij為第k只螞蟻走完路徑后所得到的路徑的總長度。
在本文中達到目標實體后,信息素按照如下方式更新:
(6)
Rtotal=γ1×rglobal+γ2×rrefficiency
(7)
式中,γ1、γ2為控制迭代速度的參數(shù)。
通過將強化學習的獎勵代入到蟻群算法的信息素更新中,對算法進行了創(chuàng)新,使算法不僅能求解多種路徑,并且在求解知識圖譜可達路徑中的最短路徑中能夠快速實現(xiàn)。算法流程如圖5所示。
圖5 算法流程圖
首先基于平移原則與TransE模型將各個實體映射到坐標系中,最終得到各個實體在二維坐標平面上的坐標值如表1所示。
表1 實體坐標值
各個實體之間的距離即為各個關系向量的模。根據(jù)策略網絡,將初始信息素濃度設置為1,α設置為1,β設置為2,根據(jù)式(3)計算得到各個實體之間選擇的概率如表2所示。
表2 實體間距離與選擇概率
根據(jù)各個實體選擇的概率,采用輪盤賭的方式來選擇從一個實體到另一個實體。
在本文中,通過智能體決策的下一個實體可能為空,如圖4所示到達上料工位時,下一個實體為空,這時的獎勵函數(shù)為-1,智能體重新回到上一個狀態(tài)。通過設置max_step來限制智能體返回的次數(shù)。本文設置最大搜索次數(shù)為10次。
實驗結果如圖6所示,起始的實體為自動色環(huán)機,坐標點為(0,0);目標實體為氣缸,坐標為(4,2)。經過多次訓練后,尋找到可達路徑如表3所示。
(a) 路徑1 (b) 路徑2 (c) 路徑3圖6 3種路徑結果
表3 可達路徑
在一次到達目標實體后,記錄可到達路徑。通過式(4)、式(5)、式(6)、式(7)對信息素進行更新。通過信息素的更新,可以使得新一輪的尋找路徑速度加快。本文可以通過設置參數(shù)γ1、γ2與信息素的揮發(fā)速度系數(shù)來控制迭代速度。將信息素揮發(fā)系數(shù)為0.5,將可達路徑上的信息素濃度為其他路徑上1000倍作為穩(wěn)定狀態(tài)條件,結果如表4所示。
表4 算法達到穩(wěn)定迭代次數(shù)
根據(jù)表4,通過將蟻群算法信息素更新和結合強化學習獎勵的信息素更新進行對比,可以看出改進后的算法迭代次數(shù)降低一倍,可以快速收斂,由此可見結合強化學習和蟻群算法可以有效降低運算時間。但是,若將γ1、γ2設置過大,容易陷入局部最優(yōu),所以本文將γ1、γ2設置為2進行迭代。實驗結果如圖7所示,以其中一條路徑為例,每次迭代后,經過信息素的更新,選擇可達路徑上的信息素濃度有效累積,最終達到穩(wěn)定狀態(tài)。
(a) 第1次迭代 (b) 第2次迭代
(c) 第3次迭代 (d) 第4次迭代
(e) 第5次迭代 (f) 第6次迭代
本文結合了數(shù)字孿生與知識推理,對自動色環(huán)機進行了虛擬設計和本體建模,設計了基于數(shù)字孿生和知識圖譜的自動色環(huán)機設計框架,為類似設備的設計提供參考;結合強化學習和蟻群算法對知識推理的算法進行了研究。其中,采用TransE將知識圖譜轉化為坐標向量;將蟻群算法中的路徑選擇與信息素更新當做強化學習的策略網絡,對信息素的更新進行了改進。結果說明算法再經過多次訓練后,可以快速找到起始實體與目標實體的路徑,為以后知識推理算法的研究提供參考。