朱 海,譚文安,2,郭 凱
(1.南京航空航天大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,江蘇 南京 211106;2.上海第二工業(yè)大學(xué) 計(jì)算機(jī)與信息工程學(xué)院,上海 201209;3.河南科技大學(xué) 管理學(xué)院,河南 洛陽(yáng) 471023;4.河南省有色金屬協(xié)同創(chuàng)新中心,河南 洛陽(yáng) 471023)
隨著云計(jì)算技術(shù)的發(fā)展,很多制造企業(yè)開(kāi)始服務(wù)化轉(zhuǎn)型。制造企業(yè)將企業(yè)的制造資源和制造能力進(jìn)行虛擬化和服務(wù)化,并接入到云制造管理平臺(tái),由其進(jìn)行集中統(tǒng)一的智能化管理和運(yùn)營(yíng)[1]。云制造模式根據(jù)用戶特定需求,將處在不同位置、不同企業(yè)的服務(wù)進(jìn)行選擇、組合,為用戶提供各類(lèi)按需制造服務(wù)。如何在大量功能相似、服務(wù)質(zhì)量相近的云制造服務(wù)中檢索并選擇合適的服務(wù),已成為云制造平臺(tái)亟待解決的難題[2-3]。
在現(xiàn)實(shí)場(chǎng)景中,大量制造業(yè)務(wù)不僅考慮服務(wù)個(gè)體性能等指標(biāo),更多需要考慮服務(wù)間的協(xié)同信任關(guān)系等社會(huì)因素[4]。良好的協(xié)同與合作信任關(guān)系有助于在企業(yè)間建立穩(wěn)定的業(yè)務(wù)合作、提高生產(chǎn)投入、促進(jìn)制造能力提升[5]。云制造過(guò)程中服務(wù)組合、協(xié)同關(guān)系、服務(wù)質(zhì)量之間的相互作用,有效提高了服務(wù)質(zhì)量和創(chuàng)新能力。因此,任務(wù)間協(xié)同能力也必須是服務(wù)選擇的重要指標(biāo)[6]。
在云制造等大數(shù)據(jù)場(chǎng)景下,對(duì)海量數(shù)據(jù)進(jìn)行準(zhǔn)確、快速檢索時(shí),基于哈希的檢索方法被越來(lái)越多的學(xué)者所關(guān)注[7]。哈希檢索方法也逐漸變成比較流行的目標(biāo)檢索方法之一。為了提高監(jiān)督方法的性能,文獻(xiàn)[8]提出了一種基于內(nèi)核的監(jiān)督哈希模型,使用核函數(shù)解決了線性不可分問(wèn)題,極大提升了目標(biāo)檢索準(zhǔn)確率[8]。為了加快哈希算法的運(yùn)行速度,提高數(shù)據(jù)處理規(guī)模,文獻(xiàn)[9]提出了一種新的基于學(xué)習(xí)的快速監(jiān)督哈希離散算法,通過(guò)一個(gè)單一哈希碼求解步驟,提高了算法的效率??紤]到實(shí)現(xiàn)圖像類(lèi)別標(biāo)簽信息完全獲取的困難性,為了降低數(shù)據(jù)標(biāo)記帶來(lái)的高昂成本,半監(jiān)督哈希方法僅使用部分標(biāo)簽信息對(duì)模型進(jìn)行訓(xùn)練[10-11]。通過(guò)對(duì)多視圖哈希模型的研究,文獻(xiàn)[12]選擇將部分標(biāo)簽信息融入模型訓(xùn)練過(guò)程,提出了一種半監(jiān)督多視圖哈希模型[12]。無(wú)監(jiān)督哈希方法避免了對(duì)樣本標(biāo)注標(biāo)簽的行為,利用發(fā)現(xiàn)數(shù)據(jù)內(nèi)在聯(lián)系的方法保持?jǐn)?shù)據(jù)原有的結(jié)構(gòu)特征,以達(dá)到訓(xùn)練哈希函數(shù)的目的[13]。與有監(jiān)督方法一樣,無(wú)監(jiān)督方法也經(jīng)常用于執(zhí)行圖像檢索任務(wù)[14]。文獻(xiàn)[15]以無(wú)監(jiān)督的方式學(xué)習(xí)二進(jìn)制哈希碼,設(shè)計(jì)了一種高效的生成對(duì)抗框架,實(shí)驗(yàn)表明其與有監(jiān)督的哈希方法的性能不相上下。為提高相似性搜索的效率,文獻(xiàn)[16]通過(guò)使用偽標(biāo)簽將無(wú)監(jiān)督的深度哈希轉(zhuǎn)換為有監(jiān)督模型,從而構(gòu)建了一種無(wú)監(jiān)督框架,并通過(guò)實(shí)驗(yàn)驗(yàn)證了該模型在性能上的有效性[16]。
云制造服務(wù)進(jìn)行協(xié)同制造時(shí),協(xié)同關(guān)系對(duì)服務(wù)選擇也有著至關(guān)重要的作用,當(dāng)前方法無(wú)法同時(shí)處理服務(wù)特征和協(xié)同關(guān)系兩種數(shù)據(jù)。圖卷積神經(jīng)網(wǎng)絡(luò)方法利用鄰居節(jié)點(diǎn)聚合,同時(shí)提取節(jié)點(diǎn)特征和邊特征,是解決該問(wèn)題的重要途徑。此外,針對(duì)圖數(shù)據(jù)關(guān)聯(lián)關(guān)系的學(xué)習(xí)和提取,圖卷積網(wǎng)絡(luò)表現(xiàn)出具有與其它神經(jīng)網(wǎng)絡(luò)結(jié)合更高效、更方便的特點(diǎn)[17]。近幾年,其在節(jié)點(diǎn)預(yù)測(cè)、信息檢索等方面得到了越來(lái)越廣泛的應(yīng)用[18-21]。文獻(xiàn)[22]利用譜圖卷積的局部一階近似構(gòu)建了圖卷積神經(jīng)網(wǎng)絡(luò)(graph convolutional neural networks,GCN),提出了基于圖卷積網(wǎng)絡(luò)的半監(jiān)督學(xué)習(xí)方法,避免模型僅依賴于單一圖結(jié)構(gòu)問(wèn)題[22]。為了克服模型因淺層架構(gòu)造成的局限性,文獻(xiàn)[23]對(duì)圖卷積網(wǎng)絡(luò)模型展開(kāi)了深入研究,提出了圖卷積網(wǎng)絡(luò)的聯(lián)合訓(xùn)練和自訓(xùn)練方法[23]。針對(duì)基于圖的半監(jiān)督學(xué)習(xí)方法性能局限這一問(wèn)題,文獻(xiàn)[24]提出了一種新的基于圖卷積網(wǎng)絡(luò)的半監(jiān)督學(xué)習(xí)方法,該方法利用數(shù)據(jù)相似性和圖結(jié)構(gòu)獲得低維表示以提高方法的性能。
針對(duì)上述挑戰(zhàn),本文提出了一種基于圖卷積的云制造服務(wù)編碼檢索算法,針對(duì)服務(wù)選擇過(guò)程中僅考慮服務(wù)質(zhì)量(quality of service,QoS)屬性,從服務(wù)間協(xié)同關(guān)系角度研究云服務(wù)初選任務(wù)。算法根據(jù)編碼相似度獲取服務(wù)候選集,為后續(xù)服務(wù)組合提供候選服務(wù)候選集。算法利用圖卷積網(wǎng)絡(luò)和深度哈希編碼技術(shù),構(gòu)建了一個(gè)端到端的深度網(wǎng)絡(luò)框架,面向云制造服務(wù)協(xié)同提出一種制造服務(wù)哈希檢索(manufacturing services hashing,MSH)算法,并在2個(gè)仿真數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),分析了所提算法的有效性。該方法考慮QoS屬性為服務(wù)選擇的基礎(chǔ),對(duì)服務(wù)關(guān)系特征中存在的重要信息進(jìn)行挖掘,以聯(lián)合學(xué)習(xí)QoS屬性特征和服務(wù)關(guān)系特征的方式,構(gòu)建了服務(wù)網(wǎng)絡(luò)圖,以解決服務(wù)選擇過(guò)程中社會(huì)屬性缺失問(wèn)題。
不同的制造服務(wù)具有不同的QoS屬性、合作關(guān)系、任務(wù)調(diào)度等復(fù)雜特征,這些會(huì)對(duì)服務(wù)質(zhì)量和性能造成不確定的影響。服務(wù)平臺(tái)進(jìn)行服務(wù)組合或服務(wù)重調(diào)度時(shí),面對(duì)海量制造服務(wù),對(duì)平臺(tái)上全部服務(wù)進(jìn)行檢索需要消耗巨大的資源。因此,需要根據(jù)目標(biāo)服務(wù)或需求生成候選集以縮小計(jì)算量。
為了解決面向協(xié)同的制造服務(wù)編碼問(wèn)題,本文建立的制造服務(wù)圖的定義如下:
定義1 制造服務(wù)提供者。記當(dāng)前平臺(tái)中的服務(wù)提供者為集合E={E1,E2,…,Em},其中:有m個(gè)制造服務(wù)提供者;Ei為第i個(gè)制造服務(wù)提供者。
定義2 制造服務(wù)。制造服務(wù)企業(yè)能夠?yàn)橥獠刻峁┑?、具有?dú)立功能且不可分割的制造業(yè)務(wù),在日常過(guò)程中,制造服務(wù)可以與企業(yè)內(nèi)外部的服務(wù)進(jìn)行合并,形成1個(gè)獨(dú)立的服務(wù)功能。
定義3 制造服務(wù)協(xié)同關(guān)系。即制造服務(wù)間所有制造服務(wù)協(xié)同關(guān)系的簡(jiǎn)稱,當(dāng)兩個(gè)服務(wù)si與sj有協(xié)同關(guān)系,則定義eij=(si,sj)表示服務(wù)間協(xié)同關(guān)系。根據(jù)具體任務(wù),可對(duì)其定義不同的連接關(guān)系和權(quán)重。
定義4 圖(Graph),給定無(wú)向圖G=(V,E,X),其由服務(wù)節(jié)點(diǎn)集合V={v1,v2,…,vN}、服務(wù)協(xié)同關(guān)系邊集合E?V×V和服務(wù)特征集合X構(gòu)成。節(jié)點(diǎn)數(shù)量N=|V|;邊eij=(vi,vj)∈E表示節(jié)點(diǎn)vi與vj具有連接關(guān)系;矩陣X={x1,x2,…,xN},其中,xi表示第i個(gè)節(jié)點(diǎn)的特征向量。
定義5 鄰接矩陣。令A(yù)表示圖G的鄰接矩陣,如果節(jié)點(diǎn)xi、xj之間存在連接關(guān)系,則Aij=1,否則Aij=0,對(duì)于無(wú)向圖有Aij=Aji。令D表示圖G的度矩陣,其為對(duì)角矩陣,且對(duì)角線上的元素表示各個(gè)頂點(diǎn)的度。頂點(diǎn)vi的度表示和該頂點(diǎn)相關(guān)聯(lián)的邊的數(shù)量,即Dii=d(vi)。
定義6 圖哈希編碼。定義圖哈希編碼器H為云制造服務(wù)圖到哈希編碼的映射。即H:G→hash∈{-1,1}N×K,定義服務(wù)Si的哈希編碼為hashi。
定義7 距離。指不同服務(wù)的相似度Sim,利用服務(wù)的哈希編碼距離Dist對(duì)其進(jìn)行度量。對(duì)于?sm,sn,starget∈S,假設(shè)Sim(sm,starget) 為了生成服務(wù)特征的中間表示,本文設(shè)計(jì)了服務(wù)編碼的神經(jīng)網(wǎng)絡(luò),首先構(gòu)造了1個(gè)圖卷積層φ:G→u∈RN×d;然后定義哈希層ω:u→hash∈{0,1}N×K,以學(xué)習(xí)二進(jìn)制的哈希編碼,神經(jīng)網(wǎng)絡(luò)框架圖如圖1示。 圖1 基于圖卷積的服務(wù)編碼神經(jīng)網(wǎng)絡(luò)框架 該神經(jīng)網(wǎng)絡(luò)定義了一個(gè)參數(shù)化的非線性映射,將包含拓?fù)浣Y(jié)構(gòu)和節(jié)點(diǎn)特征的圖節(jié)點(diǎn)vi映射為哈希編碼hashi,其中拓?fù)浣Y(jié)構(gòu)和節(jié)點(diǎn)特征分別表示服務(wù)制造中的服務(wù)間合作關(guān)系與制造服務(wù)屬性。圖卷積網(wǎng)絡(luò)φ的參數(shù)Γφ和哈希層ω的參數(shù)Γω為可學(xué)習(xí)的參數(shù),通過(guò)神經(jīng)網(wǎng)絡(luò)的反向傳播學(xué)習(xí)。 1.2.1 圖卷積層 如圖1所示,圖卷積層φ包含2層圖卷積神經(jīng)網(wǎng)絡(luò),它以圖G為輸入,輸出節(jié)點(diǎn)中間向量u。其中圖G中的服務(wù)特性X和服務(wù)關(guān)系A(chǔ)通過(guò)GCN獲取其整體的低維表示。對(duì)于單層GCN,其逐層傳播規(guī)則如下: H(l+1)=GCN(H(l),A)=σ(AH(l)W(l)), (1) 其中:W為神經(jīng)網(wǎng)絡(luò)的權(quán)重參數(shù),通過(guò)神經(jīng)網(wǎng)絡(luò)的損失反向傳播自動(dòng)學(xué)習(xí);σ為神經(jīng)網(wǎng)絡(luò)的激活函數(shù)。 圖卷積層φ可以表示為: φ(H,A)=σ(Aσ(AXW(1))W(2))。 (2) 1.2.2 哈希編碼層 哈希編碼層連接圖卷積層,接收節(jié)點(diǎn)中間向量u前向傳播,以生成節(jié)點(diǎn)的二進(jìn)制哈希碼。如圖2所示,利用2層全連接神經(jīng)網(wǎng)絡(luò)(fully convolutional networks,FCN)構(gòu)建哈希編碼層,對(duì)于給節(jié)點(diǎn)v的中間表示ui,采用全連接層FCN將ui轉(zhuǎn)換為K維嵌入向量zi∈K: 圖2 算法在MSGDs-06數(shù)據(jù)集上的性能與損失 FCN(ui)=σ(WTui+b)。 (3) 所以, (4) 為了將生成的嵌入表示轉(zhuǎn)換為二進(jìn)制哈希碼,本文設(shè)置激活函數(shù)σ為tanh函數(shù),即z∈[-1,1]。在此之后,為了將生成嵌入向量z表示為精確的二進(jìn)制哈希碼,選擇符號(hào)函數(shù)將連續(xù)的K維向量zi轉(zhuǎn)換為hashi∈{1,-1}K,即: (5) 1.2.3 損失函數(shù) 給定上述定義的圖編碼器和哈希層,圖卷積網(wǎng)絡(luò)φ的參數(shù)Γφ和哈希層ω的參數(shù)Γω需要通過(guò)反向傳播學(xué)習(xí)。在后面的工作中,目標(biāo)是學(xué)習(xí)從圖G到K維二進(jìn)制編碼的映射,在模型學(xué)習(xí)過(guò)程中采用半監(jiān)督學(xué)習(xí)的方式,故利用部分有類(lèi)標(biāo)簽的數(shù)據(jù)對(duì)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)。相似服務(wù)的哈希碼之間的距離應(yīng)盡可能接近,而不相似服務(wù)其哈希碼之間的距離應(yīng)遠(yuǎn)離?;谠撃繕?biāo)設(shè)計(jì)損失函數(shù)。 首先定義 (6) 其中:hm,hn分別為服務(wù)m,n的哈希碼;t為服務(wù)相似的布爾值。為了能夠在神經(jīng)網(wǎng)絡(luò)中通過(guò)梯度下降訓(xùn)練模型,需要將對(duì)二元實(shí)值網(wǎng)絡(luò)進(jìn)行松弛。為此,本文將Dist(hm,htarget)中的漢明距離替換為歐氏距離,則式(6)更新為: (7) 其中:α為超參數(shù);r為正則化器,公式化的表達(dá)為: (8) 根據(jù)式(6)~式(8),可得到目標(biāo)損失函數(shù)為: (9) 在實(shí)際工作中,訓(xùn)練過(guò)程對(duì)于模型的優(yōu)化至關(guān)重要。本文提出的MSH算法將服務(wù)特征X和服務(wù)關(guān)系鄰接矩陣A同時(shí)放入神經(jīng)網(wǎng)絡(luò),有效提取了面向協(xié)同制造的云服務(wù)特征,通過(guò)合理設(shè)置的損失函數(shù)對(duì)網(wǎng)絡(luò)模型進(jìn)行優(yōu)化,實(shí)現(xiàn)了有效的服務(wù)編碼。訓(xùn)練優(yōu)化過(guò)程如表1所示。 表1 訓(xùn)練優(yōu)化過(guò)程 當(dāng)前在云制造服務(wù)選擇研究中,實(shí)驗(yàn)多采用小批量真實(shí)數(shù)據(jù)或仿真數(shù)據(jù)進(jìn)行驗(yàn)證,面向大數(shù)據(jù)的研究數(shù)據(jù)較為匱乏。為了評(píng)估所提出算法的性能,實(shí)驗(yàn)將提出的MSH算法與一些基線算法如深度Fisher哈希(deep fisher hashing,DFH)算法、中心相似度量化(central similarity quantization,CSQ)算法進(jìn)行對(duì)比分析。其中,CSQ利用中心相似性量化方法優(yōu)化數(shù)據(jù)點(diǎn)之間的中心相似性;DFH算法采用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)直接學(xué)習(xí)編碼,并用正則化方法將編碼進(jìn)行約束。由于DFH、CSQ模型不支持圖數(shù)據(jù),實(shí)驗(yàn)中僅輸入節(jié)點(diǎn)特征數(shù)據(jù)。本節(jié)通過(guò)制造服務(wù)仿真程序模擬現(xiàn)實(shí)云制造場(chǎng)景來(lái)創(chuàng)建實(shí)驗(yàn)數(shù)據(jù)集,命名為制造服務(wù)組數(shù)據(jù)集(manufacturing service group dataset,MSGDs);然后,給出了2個(gè)廣泛使用的評(píng)價(jià)指標(biāo)用于評(píng)價(jià)實(shí)驗(yàn)算法在服務(wù)服務(wù)選擇任務(wù)中的性能;最后,詳細(xì)且全面地匯報(bào)并分析了所提出方法的實(shí)驗(yàn)結(jié)果,以驗(yàn)證所提出方法的有效性。數(shù)值實(shí)驗(yàn)將服務(wù)作為圖節(jié)點(diǎn),將服務(wù)屬性作為節(jié)點(diǎn)特征,相同服務(wù)提供商的同類(lèi)服務(wù)具有相同的標(biāo)簽。本文期望能夠通過(guò)云制造服務(wù)選擇縮小云制造模式下服務(wù)匹配范圍,提高服務(wù)匹配和組合的效率。 仿真程序初始化制造任務(wù)并發(fā)布到平臺(tái)。平臺(tái)根據(jù)任務(wù)需求選擇合適的服務(wù),并通過(guò)服務(wù)組合完成制造任務(wù)。仿真過(guò)程中,程序?qū)⒎?wù)制造順序關(guān)系記錄為日志??紤]到制造服務(wù)合作關(guān)系對(duì)服務(wù)選擇的重要性,本文利用服務(wù)屬性特征和服務(wù)間合作關(guān)系構(gòu)建圖數(shù)據(jù)集,二者在圖數(shù)據(jù)集中分別表示節(jié)點(diǎn)特征與連接關(guān)系。具體的,數(shù)據(jù)集將服務(wù)作為圖節(jié)點(diǎn)V,服務(wù)的QoS屬性作為節(jié)點(diǎn)特征X,鄰接矩陣A根據(jù)服務(wù)間產(chǎn)生的合作日志生成。標(biāo)簽數(shù)據(jù)根據(jù)制造服務(wù)的服務(wù)商和服務(wù)類(lèi)型屬性劃分,即相同服務(wù)商的同類(lèi)型服務(wù)劃分為相同服務(wù)組。實(shí)驗(yàn)采用0.2∶0.6∶0.2將數(shù)據(jù)節(jié)點(diǎn)劃分為訓(xùn)練集、測(cè)試集、驗(yàn)證集。為了進(jìn)行性能分析,本文建立了2個(gè)不同規(guī)模的數(shù)據(jù)集驗(yàn)證所提出模型的性能,分別為MSGDs-06與MSGDs-13。實(shí)驗(yàn)采用的數(shù)據(jù)集的統(tǒng)計(jì)信息如表2所示。其中,MSGDs-06包含分屬于6個(gè)服務(wù)組的1 709個(gè)服務(wù),以及7 504個(gè)表示合作關(guān)系的邊,且每個(gè)服務(wù)用5 661維的浮點(diǎn)數(shù)表示服務(wù)屬性。MSGDs-13中有分屬于13個(gè)服務(wù)組的2 749個(gè)服務(wù),以及11 550個(gè)表示合作關(guān)系的邊。2個(gè)數(shù)據(jù)集中的服務(wù)均采用5 661維的浮點(diǎn)數(shù)表示服務(wù)節(jié)點(diǎn)特征。 表2 數(shù)據(jù)集統(tǒng)計(jì)信息 為了評(píng)估所提出方法的性能,實(shí)驗(yàn)采用2個(gè)廣泛使用的評(píng)價(jià)指標(biāo)度量服務(wù)檢索性能,分別為召回率、平均精度均值。 召回率(Recall)能夠衡量信息檢索的覆蓋率。給定一個(gè)信息檢索請(qǐng)求Q,令R為集群中與Q相關(guān)的文檔集,Recall可根據(jù)檢索需求獲得檢索集合A。集合R和A中元素個(gè)數(shù)分別為|R|和|A|,|R∩A|表示同時(shí)在R和A中的文檔數(shù)。則召回率定義為Recall=|R∩A|/|R|。 實(shí)驗(yàn)環(huán)境為i7 10750H CPU+64G內(nèi)存+3090顯卡,運(yùn)行操作系統(tǒng)為Windows 10,編程語(yǔ)言采用Python,統(tǒng)一計(jì)算架構(gòu)(compute unified device architecture,CUDA)版本為11.4。實(shí)驗(yàn)將服務(wù)特征X和鄰接矩陣A送入模型中進(jìn)行訓(xùn)練,在反向傳播過(guò)程中,使用訓(xùn)練集的標(biāo)簽進(jìn)行半監(jiān)督學(xué)習(xí)。在評(píng)價(jià)過(guò)程中,模型在根據(jù)編碼的漢明距離選擇出前N個(gè)服務(wù)作為候選集并驗(yàn)證,實(shí)驗(yàn)過(guò)程中,令N=10。 本節(jié)在MSGDs-06和MSGDs-13數(shù)據(jù)集上對(duì)模型性能進(jìn)行分析。實(shí)驗(yàn)采用mAP和Recall這兩種度量指標(biāo),運(yùn)行在MSGDs-06數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果如表3所示。其中,CSQ算法在mAP性能和Recall性能指標(biāo)上最低,分別為40.6%和50.8%。DFH算法性能略好,mAP性能為45.0%,相較CSQ有12%左右的提升,Recall性能為51.0%,相較CSQ提升不明顯。MSH算法的mAP性能和Recall性能最好,分別達(dá)到了99.4%和87.1%,基本是CSQ和DFH性能的2倍左右。 表3 運(yùn)行在MSGDs-06數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果 % 運(yùn)行在MSGDs-13數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果如表4所示。其中,CSQ算法在mAP性能和Recall性能指標(biāo)上最低,分別為33.8%和52.1%。DFH算法性能略好,分別為37.5%和54.3%。MSH算法的mAP性能和Recall的性能最好,達(dá)到了97.6%和90.3%,其中,mAP性能基本是CSQ算法和DFH算法性能的3倍左右,Recall性能基本也超過(guò)CSQ算法和DFH算法約60%。 表4 運(yùn)行在MSGDs-13數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果 % 算法在不同的數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),最終的mAP指標(biāo)均能達(dá)到0.96以上。這表明服務(wù)間合作關(guān)系對(duì)服務(wù)選擇能夠提出有效決策支持,所提出的算法利用圖卷積網(wǎng)絡(luò),綜合考慮QoS特征和服務(wù)間合作關(guān)系這兩方面的信息,并進(jìn)行有效的特征提取,進(jìn)而得到更有助于學(xué)習(xí)到有效度量服務(wù)間相似度的哈希編碼,在服務(wù)選擇的驗(yàn)證中證明具有較高的準(zhǔn)確率和召回率。評(píng)價(jià)指標(biāo)說(shuō)明在提取到的10個(gè)候選服務(wù)中,與查詢服務(wù)有較高的匹配程度。因此,能夠?yàn)楹罄m(xù)階段的服務(wù)組合等任務(wù)提供較為有效的支持。與此同時(shí),得到的Recall值也均能達(dá)到0.87以上,且在MSGDs-13數(shù)據(jù)集上達(dá)到0.903的精度值。較好的Recall性能表明在查詢到的候選服務(wù)中,同類(lèi)服務(wù)具有很高的占比,說(shuō)明查詢結(jié)果具有較高的覆蓋度。綜合分析表3中的結(jié)果,不難發(fā)現(xiàn)哈希編碼能夠根據(jù)查詢服務(wù)對(duì)候選服務(wù)進(jìn)行較好的區(qū)分,能夠在提供更準(zhǔn)確的查詢結(jié)果同時(shí),保持候選制造服務(wù)的多樣性。訓(xùn)練結(jié)果表明,服務(wù)編碼距離能夠有效度量服務(wù)間的類(lèi)別相似度,訓(xùn)練之后的編碼結(jié)果可以進(jìn)行保存并用于服務(wù)間距離度量,進(jìn)而進(jìn)行快速服務(wù)查詢和候選服務(wù)集的選擇等業(yè)務(wù)。 2.4.1 模型收斂性分析 本節(jié)通過(guò)觀察在MSGDs-06和MSGDs-13數(shù)據(jù)集上,隨著模型優(yōu)化模型損失和模型性能的變化分析模型收斂情況,實(shí)驗(yàn)結(jié)果如圖2和圖3所示。 圖3 算法在MSGDs-13數(shù)據(jù)集上的性能與損失 在MSGDs-06數(shù)據(jù)集上,模型訓(xùn)練開(kāi)始時(shí)損失(Loss)大約為35。在前200步訓(xùn)練中,模型損失快速下降;之后,隨著模型的進(jìn)一步優(yōu)化,損失趨于相對(duì)穩(wěn)定的狀態(tài)。與此同時(shí),mAP和Recall隨著損失下降穩(wěn)定上升。在400步左右,mAP為0.95,Recall為0.85;接著,隨著迭代次數(shù)的增加,模型逐漸提取到服務(wù)編碼信息并經(jīng)過(guò)一定的訓(xùn)練之后能夠達(dá)到穩(wěn)定狀態(tài),在MSGDs-13數(shù)據(jù)集上,與MSGDs-06相似,模型經(jīng)過(guò)前200步訓(xùn)練,其損失快速下降并達(dá)到相對(duì)穩(wěn)定階段。在經(jīng)過(guò)400步訓(xùn)練,mAP為0.9,Recall為0.85,相對(duì)于MSGDs-06數(shù)據(jù)集的指標(biāo)值略低。直觀分析可能是由于數(shù)據(jù)集大小和每個(gè)類(lèi)的數(shù)據(jù)量不同造成的偏差。之后,模型經(jīng)過(guò)持續(xù)訓(xùn)練,其性能和損失均能夠達(dá)到穩(wěn)定狀態(tài)。 通過(guò)上述分析可以發(fā)現(xiàn),隨著優(yōu)化的進(jìn)行,模型在2個(gè)數(shù)據(jù)集上的損失能夠快速下降并最終達(dá)到平穩(wěn)狀態(tài)。模型性能隨著損失的下降不斷提升,最終也達(dá)到平穩(wěn)狀態(tài)。實(shí)驗(yàn)結(jié)果表明模型經(jīng)過(guò)訓(xùn)練能夠達(dá)到收斂狀態(tài)。 2.4.2 超參數(shù)選擇 超參數(shù)的選擇對(duì)模型性能有著重要影響,本節(jié)分析超參數(shù)α和編碼長(zhǎng)度k對(duì)模型mAP性能的影響。 對(duì)于超參數(shù)α,令其在[0.05,1]取值,步長(zhǎng)為0.05,在MSGDs-06和MSGDs-13數(shù)據(jù)集進(jìn)行訓(xùn)練,記錄模型的mAP指標(biāo)的變化。 綜合分析圖4中的mAP性能結(jié)果不難發(fā)現(xiàn),當(dāng)超參數(shù)α在[0.2,0.7]取值時(shí),能夠保持在1個(gè)相對(duì)穩(wěn)定且性能較高的水平。當(dāng)α設(shè)置在某一合理范圍值時(shí),模型對(duì)該參數(shù)并不太敏感且能夠獲得較高的精確值。 圖4 超參數(shù)α對(duì)mAP性能影響 在下一步實(shí)驗(yàn)時(shí),將超參數(shù)α固定為0.6,通過(guò)改變哈希碼長(zhǎng)度探討其對(duì)mAP性能的影響,其中k∈[12,64],結(jié)果如圖5所示。分析圖5中實(shí)驗(yàn)結(jié)果,當(dāng)超參數(shù)k∈[28,56]時(shí),模型基本能取得相對(duì)較好性能。隨著k取值的增加,mAP性能會(huì)出現(xiàn)較大的波動(dòng)。 圖5 超參數(shù)k對(duì)mAP性能影響 云制造平臺(tái)上的服務(wù)具有數(shù)量龐大、種類(lèi)繁多、特征復(fù)雜等特點(diǎn),在服務(wù)選擇的過(guò)程中,服務(wù)間協(xié)同關(guān)系缺失會(huì)對(duì)服務(wù)匹配和服務(wù)選擇的準(zhǔn)確性造成巨大影響。本文提出了一種基于圖卷積網(wǎng)絡(luò)的云制造服務(wù)編碼模型,同時(shí)考慮服務(wù)特征和服務(wù)協(xié)同關(guān)系,通過(guò)圖卷積網(wǎng)絡(luò)實(shí)現(xiàn)半監(jiān)督學(xué)習(xí)提取到云制造服務(wù)的哈希編碼。在2個(gè)仿真數(shù)據(jù)集上驗(yàn)證并證明所提出方法有較好的性能。通過(guò)計(jì)算該模型生成的服務(wù)的哈希編碼距離,可以度量服務(wù)間相似性,這有助于對(duì)制造服務(wù)進(jìn)行快速有效查詢和選擇,為后續(xù)的服務(wù)組合、服務(wù)調(diào)度等任務(wù)奠定了基礎(chǔ)。1.2 基于圖卷積的服務(wù)編碼神經(jīng)網(wǎng)絡(luò)
1.3 算法描述
2 實(shí)驗(yàn)結(jié)果與分析
2.1 數(shù)據(jù)集和訓(xùn)練
2.2 評(píng)價(jià)指標(biāo)
2.3 實(shí)驗(yàn)結(jié)果
2.4 實(shí)驗(yàn)分析
3 結(jié)束語(yǔ)