鄭 杰,曹華軍,李洪丞,陳二恒,朱林全,邢 鑌+
(1.重慶大學(xué) 機(jī)械傳動(dòng)國家重點(diǎn)實(shí)驗(yàn)室,重慶 400044;2.重慶郵電大學(xué) 先進(jìn)制造工程學(xué)院,重慶 400065;3.重慶大數(shù)據(jù)創(chuàng)新中心有限公司,重慶 400707)
由于經(jīng)濟(jì)全球化和用戶對高度定制化產(chǎn)品需求的增加,各種離散制造活動(dòng)之間的聯(lián)系越來越緊密。具體而言,傳統(tǒng)制造技術(shù)與物聯(lián)網(wǎng)(Internet of Things, IoT)、大數(shù)據(jù)和人工智能等新一代信息通信技術(shù)的深度融合,正在支持云制造(Cloud Manufacturing, CMFg)和云平臺[1]的發(fā)展,這些將極大地優(yōu)化產(chǎn)品質(zhì)量、降低成本、增強(qiáng)制造資源按需服務(wù)的能力。制造資源的本質(zhì)指的是從可以服務(wù)化和遠(yuǎn)程操作(訪問)開始,到完成產(chǎn)品整個(gè)生命周期的所有生產(chǎn)活動(dòng)的軟、硬性元素,例如CAD軟件、相關(guān)人力資源、數(shù)控加工中心等,而其中又以制造設(shè)備為核心要素。然而,現(xiàn)階段大量制造資源存在著高度離散化、與用戶之間缺乏互通性、無法為用戶提供精準(zhǔn)服務(wù)等問題,容易導(dǎo)致制造業(yè)供需過程失衡、生產(chǎn)成本上升。而制造資源歸根結(jié)底是為需求服務(wù)的,無法為用戶匹配到所需的服務(wù)資源且將降低企業(yè)的核心競爭力。由此可見,為用戶進(jìn)行精準(zhǔn)的智能匹配在提升制造服務(wù)中起著基礎(chǔ)性作用,它通過將分散的制造資源整合至統(tǒng)一的云平臺上,有助于打破傳統(tǒng)的靜態(tài)企業(yè)資源配置模式,從而優(yōu)化產(chǎn)業(yè)鏈,推動(dòng)傳統(tǒng)制造企業(yè)由生產(chǎn)型制造向新一代信息通信技術(shù)驅(qū)動(dòng)的智能制造轉(zhuǎn)型發(fā)展。
信息通信技術(shù)的研究進(jìn)展降低了將傳統(tǒng)制造設(shè)備升級到按需制造所需服務(wù)水平的門檻,為了應(yīng)對制造過程中的智能匹配問題,學(xué)術(shù)界和工業(yè)界提出了廣泛而具有建設(shè)性的思路。XUE等[2]提出一種基于計(jì)算實(shí)驗(yàn)的評估框架,可以模擬在云環(huán)境下的各種實(shí)際場景來驗(yàn)證服務(wù)匹配策略的性能,用以優(yōu)化制造業(yè)的供給和需求導(dǎo)向;LU等[3]開發(fā)了一種基于網(wǎng)絡(luò)物理生產(chǎn)系統(tǒng)和大數(shù)據(jù)分析的云計(jì)算制造設(shè)備通用系統(tǒng)架構(gòu),允許制造設(shè)備連接到云端,并提供按需制造服務(wù);CHENG等[4]首次提出自組織映射系統(tǒng)中制造服務(wù)的供需匹配超網(wǎng)絡(luò)概念,揭示了匹配關(guān)系,從功能角度比較制造服務(wù)和任務(wù)的輸入或輸出信息;NASERI等[5]提出一種新的混合方法來實(shí)現(xiàn)云計(jì)算中的高效服務(wù)組合,即通過粒子群優(yōu)化算法構(gòu)建適應(yīng)度函數(shù)來選擇最佳服務(wù);GONG等[6]提出描述制造需求的多質(zhì)量模型和描述機(jī)床支持的制造云服務(wù)的能力模型,并構(gòu)造了兩個(gè)模型之間的映射機(jī)制,根據(jù)灰色關(guān)聯(lián)理論來尋求機(jī)床資源和服務(wù)需求之間的最大滿意度。然而,目前行業(yè)內(nèi)采用的制造資源供需匹配模式仍存在一些不足,通常情況下在云平臺上,制造資源和用戶需求所涉及的制造企業(yè)較多、數(shù)據(jù)量較大、制造資源離散程度高,而大多數(shù)匹配研究主要采用基于語義[7]或傳統(tǒng)多因素統(tǒng)計(jì)分析[8]的方式,導(dǎo)致其只能適用于數(shù)據(jù)量較少、制造屬性較少的制造資源,在進(jìn)行大數(shù)據(jù)的分析檢索時(shí),有效信息提取效率較低,可供用戶選擇的范圍有限。
為解決上述問題,本文從大數(shù)據(jù)的處理應(yīng)用出發(fā),以自然語言處理和卷積神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),提出一種基于云平臺的制造資源和用戶需求的智能匹配方法,該方法能夠有效解決在供需匹配過程中所面臨的大數(shù)據(jù)問題,提升有效信息處理效率,為用戶提供更加準(zhǔn)確迅速、跨企業(yè)的制造資源服務(wù),優(yōu)化匹配流程。
在云平臺上針對制造資源進(jìn)行交互式操作時(shí),本文發(fā)現(xiàn)制造設(shè)備作為制造資源的核心要素,實(shí)質(zhì)上影響了資源與需求的最優(yōu)匹配,即用戶所需的產(chǎn)品服務(wù)最終是由設(shè)備完成的。因此,本文將制造設(shè)備,即硬性元素的特征描述作為制造資源端參數(shù)特征提取的核心部分,將軟性元素如人員配置、技術(shù)信息能力等作為次要部分,最終完成制造資源的封裝,并發(fā)布上傳至統(tǒng)一的云平臺。由此可見,在云制造環(huán)境下[9],對于制造資源服務(wù)能力的統(tǒng)一描述與表征是制造服務(wù)供需雙方精確匹配的基礎(chǔ)。結(jié)合制造業(yè)與當(dāng)前市場的特點(diǎn),本文建立了描述制造資源模型的靜態(tài)和動(dòng)態(tài)通用特征集。
1.1.1 靜態(tài)特征
制造資源在進(jìn)行智能匹配過程中,當(dāng)某項(xiàng)服務(wù)屬性不會(huì)隨著時(shí)間和市場發(fā)生改變時(shí),可以認(rèn)為其歸屬于靜態(tài)特征的描述范疇,主要包括基礎(chǔ)信息、制造加工能力、人員配置、技術(shù)支持、環(huán)境承載力、信息支援能力。
1.1.2 動(dòng)態(tài)特征
制造資源在進(jìn)行智能匹配過程中,當(dāng)某項(xiàng)服務(wù)屬性會(huì)隨著時(shí)間和市場發(fā)生改變時(shí),可以將其歸屬于動(dòng)態(tài)特征的描述范疇。制造資源的動(dòng)態(tài)特征主要包括平均完成時(shí)間、當(dāng)前狀態(tài)、可靠性、價(jià)格、產(chǎn)品質(zhì)量。
(1)平均完成時(shí)間
(1)
(2)當(dāng)前狀態(tài)
當(dāng)前狀態(tài)描述的是制造資源的狀態(tài)屬性,對于智能匹配過程具有基礎(chǔ)性意義,其主要分為閑置狀態(tài)、正常負(fù)荷運(yùn)行、滿負(fù)荷運(yùn)行、超負(fù)荷運(yùn)行、預(yù)訂狀態(tài)、維修狀態(tài)。若提交至云平臺的制造資源狀態(tài)顯示為滿負(fù)荷狀態(tài)、超負(fù)荷狀態(tài)、預(yù)訂狀態(tài)以及維修狀態(tài),則自動(dòng)屏蔽,不會(huì)與用戶需求進(jìn)行匹配。
本文使用圖表來解釋性說明一段時(shí)間內(nèi)的制造資源所處狀態(tài)。如圖1所示:①表示制造資源當(dāng)前處于閑置狀態(tài),擁有最大生產(chǎn)能力;②表示制造資源接到訂單指令,開始進(jìn)行生產(chǎn)活動(dòng);③表示制造資源當(dāng)前處于正常負(fù)荷狀態(tài),可以接受額外生產(chǎn)指令;④表示制造資源當(dāng)前處于滿負(fù)荷運(yùn)行,無法接受新的訂單;⑤表示制造資源當(dāng)前處于超負(fù)荷運(yùn)行,所接受的生產(chǎn)任務(wù)已超出規(guī)定的承載量,事實(shí)上,長時(shí)間處于超負(fù)荷運(yùn)行狀態(tài)會(huì)對設(shè)備造成損傷;⑥表示制造資源處于預(yù)訂及維修狀態(tài),不具備接受訂單的條件。
(3)可靠性
制造資源的可靠性主要由歷史服務(wù)成功率、設(shè)備穩(wěn)定運(yùn)行率等構(gòu)成。
1)歷史服務(wù)成功率指的是往期制造資源成功完成用戶訂單,提交產(chǎn)品的比率,定義
(2)
式中s為歷史服務(wù)成功率。
2)設(shè)備穩(wěn)定運(yùn)行率指的是制造資源設(shè)備穩(wěn)定運(yùn)行的時(shí)長占設(shè)備開機(jī)總時(shí)長的比率,定義
(3)
式中w為設(shè)備穩(wěn)定運(yùn)行率。
(4)價(jià)格
價(jià)格指制造資源完成用戶訂單的服務(wù)報(bào)價(jià),受市場、政府政策、原材料供應(yīng)等多方面因素影響,是智能匹配過程中相當(dāng)重要的一個(gè)指標(biāo)。本文采用平均價(jià)格這一指標(biāo)進(jìn)行制造資源屬性的描述:
(4)
式中:pi為制造資源執(zhí)行第i個(gè)任務(wù)過程中,完成產(chǎn)品生產(chǎn)后的最終報(bào)價(jià);n為總?cè)蝿?wù)完成次數(shù)。
(5)產(chǎn)品質(zhì)量
產(chǎn)品質(zhì)量是用戶確定制造資源過程中最關(guān)鍵的參考因素之一,本文采用用戶評價(jià)作為衡量產(chǎn)品質(zhì)量的指標(biāo),用戶評價(jià)是消費(fèi)者的主觀評分。為了能夠較好地反映用戶對于產(chǎn)品的反饋,設(shè)定用戶評價(jià)={很不滿意、不滿意、一般、滿意、很滿意}共5個(gè)層次,層次標(biāo)簽的選定依據(jù)來源于歷史用戶的評價(jià)眾數(shù),即選取歷史用戶評價(jià)數(shù)最多的層次作為該制造資源生產(chǎn)同類產(chǎn)品的產(chǎn)品質(zhì)量特征。
用戶針對制造資源的個(gè)性化服務(wù)需求帶來了日趨復(fù)雜化的約束和急劇增多的數(shù)據(jù)量。結(jié)合制造業(yè)與當(dāng)前市場的特點(diǎn),本文建立了描述用戶需求的通用特征集,主要包括基本屬性、產(chǎn)品質(zhì)量、價(jià)格、安全性、生產(chǎn)時(shí)間、地域、靈活性,詳細(xì)信息如圖2所示。
制造資源和用戶需求的信息都是相對規(guī)范化、格式化的自然語言。在自然語言處理任務(wù)中,一般將其交給機(jī)器學(xué)習(xí)算法來處理,但機(jī)器無法直接理解人類的語言,因此需要將語言數(shù)字化,即通過訓(xùn)練將某種語言中的每個(gè)詞映射成一個(gè)固定長度的短向量[10],同時(shí)所有這些詞構(gòu)成一個(gè)詞向量空間。本文假定制造資源和用戶需求信息之間存在一個(gè)潛在的公共空間,這個(gè)公共空間包含于為制造資源進(jìn)行供需匹配服務(wù)的云平臺內(nèi),每個(gè)制造資源和用戶需求都可以轉(zhuǎn)化為公共空間中的詞向量。本文將每個(gè)制造資源和用戶需求的特征進(jìn)行向量化表示,這樣兩者在公共空間中的距離便可以看作是兩者的匹配度。從針對制造資源和用戶需求的特征描述中可以看出,進(jìn)行智能匹配的目的是為了使制造資源項(xiàng)在公共空間中的向量盡可能與用戶需求項(xiàng)靠近。
傳統(tǒng)的文本處理方法需要大量的人工特征選取工作,這種方式在大數(shù)據(jù)背景下顯然是不合適的。本文語料的數(shù)據(jù)特征是標(biāo)簽化、離散化的,多由短句或者有限的關(guān)鍵字組成。而卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)模型主要能發(fā)掘文本的層次化和局部語義特征,非常適合本文的文本挖掘工作。因此,本文采用Word2Vec進(jìn)行詞向量的獲取與訓(xùn)練,其核心是基于深度學(xué)習(xí)方法和卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建的,已經(jīng)成為一系列自然語言處理任務(wù)中事實(shí)上表現(xiàn)最好的技術(shù),通過文本卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建的詞向量在文本建模方面具有無可比擬的優(yōu)勢[11]。
本文的文本挖掘主要包含制造資源信息文本建模和用戶需求文本建模兩個(gè)方面。由于二者在詞性豐度上存在差異,本文對二者分別進(jìn)行詞向量建模,建模過程一致。
本文將制造資源和用戶需求中的文本信息表示為D×K的文檔矩陣,其中D為詞典,通過掃描所有文本詞匯統(tǒng)計(jì)獲得,K表示詞向量的維度。在Word2Vec中,對詞典D的任意詞w,指定一個(gè)固定長度的實(shí)值向量v(w)∈Rm,v(w)就稱為w的詞向量??紤]到制造資源和用戶需求信息都是短文本,甚至有些特征僅包含幾個(gè)關(guān)鍵字,因此本文采用Skip-gram模型進(jìn)行文本建模[12],訓(xùn)練的過程采用梯度下降法對參數(shù)空間和用戶需求詞向量進(jìn)行優(yōu)化。Skip-gram模型的核心思想是已知當(dāng)前詞w,對其上下文Context(w)中的詞進(jìn)行預(yù)測,經(jīng)過輸入層、投影層和輸出層網(wǎng)絡(luò)結(jié)構(gòu)之后,導(dǎo)出詞向量。其條件概率函數(shù)為:
(5)
優(yōu)化的目標(biāo)函數(shù)如下:
(6)
其中C表示語料。值得注意的是,為了節(jié)省訓(xùn)練時(shí)間,提高模型準(zhǔn)確度,語料C是從詞典D中抽取出來的,不存在重復(fù)的詞。獲得的詞向量將作為聯(lián)合嵌入卷積神經(jīng)網(wǎng)絡(luò)(Joint Embedded CNN, JE-CNN)的輸入,以實(shí)現(xiàn)制造資源和用戶需求的供需匹配。
建立智能匹配模型分析的目的主要是將含有制造資源端和用戶需求端的信息映射到一個(gè)潛在的公共空間當(dāng)中,使其能夠建立起定量的判別關(guān)系。顯然,本文的目標(biāo)不是為了文本分類,而是求取匹配模型的匹配度并加以評價(jià)分析,因此需要提出符合數(shù)據(jù)結(jié)構(gòu)的目標(biāo)函數(shù),并通過優(yōu)化方法進(jìn)行目標(biāo)函數(shù)的求解。考慮到語料數(shù)據(jù)呈現(xiàn)體量較大、高度離散化的特征,并且要求在盡可能短的時(shí)間內(nèi)得出最優(yōu)化結(jié)果,本文采用基于深度學(xué)習(xí)與卷積神經(jīng)網(wǎng)絡(luò)[13]的方法構(gòu)建智能匹配模型。在匹配過程中,輸入層是由不同結(jié)構(gòu)的詞向量組成的,無法直接進(jìn)行匹配。因此,為了能夠?qū)⑵溆成涞焦部臻g,轉(zhuǎn)化為具備匹配基礎(chǔ)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),需要將異構(gòu)數(shù)據(jù)嵌入到統(tǒng)一的公共空間中,這一過程稱為聯(lián)合嵌入[14],表達(dá)式如下:
(7)
式中:φ,ω為嵌入函數(shù);J為衡量相似度的目標(biāo)函數(shù)。
將用戶需求詞向量作為卷積神經(jīng)網(wǎng)絡(luò)的輸入,進(jìn)行卷積訓(xùn)練,建立用戶需求項(xiàng)集合,該集合的獲取可以看作是一個(gè)查詞典的過程,當(dāng)中包含|N|個(gè)詞的需求項(xiàng),可以由此構(gòu)建相應(yīng)的矩陣N∈RL×|N|,L為嵌入的序列長度,N為詞典大小:
N=[w1,w2,…,wN],wi∈RL。
(8)
輸入聯(lián)合嵌入卷積神經(jīng)網(wǎng)絡(luò)的用戶需求項(xiàng)中,一個(gè)用戶需求項(xiàng)di可以由下式表示:
di=[N1,N2,…,Nndi]T。
(9)
式中ndi表示di的需求項(xiàng)數(shù)。考慮到每個(gè)用戶的需求描述都存在或大或小的差異,這意味著輸入層的用戶需求項(xiàng)數(shù)和每項(xiàng)中的向量數(shù)都不一樣,需要對維度進(jìn)行靈活調(diào)控。故本文采用兩個(gè)一維卷積層[15]作用于輸入層,抽取共有的顯著特征,具體操作為將權(quán)重m的一維卷積向量和序列化的N進(jìn)行n-gram點(diǎn)積運(yùn)算,之后附上一個(gè)池化層。
點(diǎn)積運(yùn)算的對象為N中每連續(xù)的n項(xiàng)與權(quán)重為m的一維卷積向量,得出序列A,
Ai=mT·Ni-|n|+1:i。
(10)
(11)
最后,為了確保用戶需求向量與制造資源保持一致,在輸出層之前需要進(jìn)行一次最大池化運(yùn)算。
(12)
式中nri為ri的制造資源項(xiàng)目數(shù)量。與用戶需求部分的處理不同,制造資源最后輸出之前需要進(jìn)行一次平均池化操作。
在最后一步處理過程中,制造資源采用了平均池化方式,而用戶需求采用了最大池化方式,這是因?yàn)橛脩粜枨蟮拿恳豁?xiàng)較為獨(dú)立,都各自表達(dá)了最重要的一個(gè)需求,所以用戶需求部分采用最大池化操作去除干擾因素,保留關(guān)鍵信息。相反,制造資源部分每項(xiàng)之間相似性較多,例如可靠性和平均完成時(shí)間、產(chǎn)品質(zhì)量之間都不是完全獨(dú)立的,具有較高的相關(guān)性,所以制造資源部分采用平均池化操作體現(xiàn)制造資源的總體特征。
為了能夠定量描述公共空間中二者的關(guān)系,本文利用距離來衡量一個(gè)用戶需求和一個(gè)制造資源的匹配程度,故引入目標(biāo)函數(shù)來最小化匹配成功的向量之間的距離。為防止JE-CNN訓(xùn)練時(shí)令所有參數(shù)下降為零,也在目標(biāo)函數(shù)中最大化匹配失敗的向量之間的距離,目標(biāo)函數(shù)如下:
(13)
式中:S為匹配成功的集合數(shù);F為匹配失敗的集合數(shù);cosθ1表示匹配成功的制造資源和用戶需求向量之間的距離;cosθ2表示匹配失敗的制造資源和用戶需求向量之間的距離;‖θ‖為L2正則化項(xiàng);θ為權(quán)重向量(模型中各層參數(shù));α為平衡系數(shù)。
從式(13)可以看出,作為最終需要優(yōu)化的函數(shù),目標(biāo)函數(shù)越小,所建立的模型的預(yù)測效果越好。但如果只是簡單的追求模型預(yù)測能力,則會(huì)導(dǎo)致模型復(fù)雜度過高,訓(xùn)練成本增大,從而導(dǎo)致過擬合,喪失泛化能力。為了減小過擬合發(fā)生的概率,在機(jī)器學(xué)習(xí)當(dāng)中一般會(huì)對目標(biāo)函數(shù)進(jìn)行正則化修正,即在目標(biāo)函數(shù)后面增加一個(gè)正則化項(xiàng)[17]。本文采用L2正則項(xiàng),L2正則化加快了參數(shù)的減小速度,在此條件下模型能夠擬合的數(shù)據(jù)變少,并且擬合精度變高,抑制了過擬合,增強(qiáng)了模型的抗擾動(dòng)能力。
本文采用余弦相似度作為距離公式,距離公式如下:
(14)
(15)
其中:Vri和Vrf分別為制造資源匹配成功與匹配失敗的向量;Vdi和Vdf分別為用戶需求匹配成功與匹配失敗的向量。
考慮到目標(biāo)函數(shù)的表示式中包含匹配失敗項(xiàng),在最優(yōu)化運(yùn)算過程中,需要包含匹配失敗的樣本。在實(shí)際制造環(huán)境下,匹配失敗的情況即意味著用戶在云平臺上并未找尋到合適的制造資源服務(wù),因此,本文采取隨機(jī)選取制造資源項(xiàng)的方式來構(gòu)建匹配失敗的樣本。
考慮到目標(biāo)函數(shù)為多變量函數(shù),為了能夠求取目標(biāo)函數(shù)最值,優(yōu)化模型的內(nèi)部參數(shù),本文采用梯度下降來替代導(dǎo)數(shù)。與此同時(shí),傳統(tǒng)的批量梯度下降將計(jì)算整個(gè)數(shù)據(jù)集梯度,但只會(huì)進(jìn)行一次更新,因此在處理大型數(shù)據(jù)集時(shí)速度很慢且難以控制,甚至導(dǎo)致內(nèi)存溢出。因此,本文采用自適應(yīng)時(shí)刻估計(jì)(Adaptive time estimation, Adam)算法對目標(biāo)函數(shù)進(jìn)行梯度優(yōu)化,該算法能計(jì)算每個(gè)參數(shù)的自適應(yīng)學(xué)習(xí)率[18]。在實(shí)際的訓(xùn)練過程中,每個(gè)參數(shù)的更新都更加具有獨(dú)立性,提升了模型的收斂速度和訓(xùn)練的穩(wěn)定性,適合解決含大規(guī)模數(shù)據(jù)和參數(shù)的優(yōu)化問題。梯度優(yōu)化過程如下:
V(t)=ρ1V(t-1)+(1-ρ1)ΔJ(θ),
(16)
gt=ρ2gt-1+(1-ρ2)ΔJ(θ)2,
(17)
(18)
(19)
(20)
其中:式(16)為Moment項(xiàng);式(17)為RMSProp項(xiàng);V(t)為當(dāng)前的時(shí)間步長;V(t-1)為過去的時(shí)間步長;ρ1,ρ2為矩估計(jì)的指數(shù)衰減速率;ρ1和ρ2在區(qū)間[0,1)內(nèi);J為要優(yōu)化的目標(biāo)函數(shù);θ為權(quán)重參數(shù),1-ρ為學(xué)習(xí)率;gt為指數(shù)衰減值;ε為步長值;θt為結(jié)果參數(shù)。
針對智能匹配的總體流程以及主要變量之間的轉(zhuǎn)換計(jì)算關(guān)系表述,如圖3所示。
為了衡量最終輸出的結(jié)果是否符合預(yù)期要求,需要設(shè)定一個(gè)評價(jià)閾值,將匹配成功的樣本看作正類,匹配失敗的樣本看作負(fù)類,這樣模型就轉(zhuǎn)化為一個(gè)二分類問題。由于針對用戶需求和制造資源的智能匹配相似度閾值無法確定,故采用AUC(area under curve)模型。
如圖4所示,AUC指的是ROC(receiver operating characteristic curve)曲線與FPR(false positive rate)軸之間的面積[19]。ROC曲線指的是受試者工作特征曲線,其橫坐標(biāo)為FPR,即在所有實(shí)際的負(fù)樣本中,被錯(cuò)誤地判斷為正樣本的比率,縱坐標(biāo)為TPR(true positive rate),即在所有實(shí)際的正樣本中,被正確地判斷為正樣本的比率。AUC考慮的是模型預(yù)測的排序質(zhì)量,反映了模型把正例排在反例前面的比例。ROC曲線一般都處于y=x這條直線的上方,因此AUC的取值范圍在0.5和1之間。AUC越接近1.0,預(yù)測方法真實(shí)性越高;AUC的值等于0.5時(shí),則真實(shí)性最低,無應(yīng)用價(jià)值。本文將制造資源和用戶需求的余弦相似度作為閾值,繪制出對應(yīng)的ROC曲線。
在進(jìn)行整體樣本的AUC處理操作時(shí),本文通過ROC函數(shù)確定分類閾值σ。當(dāng)制造資源和用戶需求的余弦相似度大于或等于閾值σ時(shí),則AUC模型認(rèn)為兩者能夠匹配成功,輸出匹配成功的制造資源服務(wù);當(dāng)余弦相似度小于設(shè)定閾值σ時(shí),則匹配失敗,向用戶輸出當(dāng)前云平臺上暫無符合需求的制造資源服務(wù)。余弦相似度越大,表明制造資源指標(biāo)越接近于目標(biāo)用戶需求,即匹配程度越高,該方案越好。
在完成智能匹配模型的構(gòu)建與求解之后,對于提交的用戶需求,模型便可以根據(jù)神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)效果及泛化能力,為提交的用戶需求預(yù)測出匹配程度最高的制造資源項(xiàng),并判斷對應(yīng)匹配度與分類閾值的大小關(guān)系。
具體的制造資源智能匹配流程圖如圖5所示。
為了驗(yàn)證上述方法和模型的可行性和準(zhǔn)確性,將本文模型應(yīng)用于重慶市內(nèi)某幾家大型制造企業(yè)。其中,制造資源信息采集于重慶市內(nèi)某幾家大型制造企業(yè),用戶需求信息采集于對應(yīng)制造企業(yè)歷年的服務(wù)訂單,以此建立了制造資源和用戶需求數(shù)據(jù)庫,并完成了特征集整合歸納。其中,部分制造資源信息數(shù)據(jù)如表1所示。
表1 制造資源信息(部分)
續(xù)表1
考慮到詞向量的維度代表了詞語的特征,特征越多越能準(zhǔn)確地將詞與詞進(jìn)行區(qū)分,但在實(shí)際應(yīng)用中維度過多會(huì)導(dǎo)致模型訓(xùn)練成本增加,淡化詞與詞之間的關(guān)系。因此,參考文獻(xiàn)[20]在CNN文本建模方面的研究,本文將制造資源文本詞向量維度值設(shè)置為200,用戶需求文本詞向量維度設(shè)置為100。圖6給出部分詞語的詞向量訓(xùn)練樣例,分別為制造資源特征中的“加工精度”和用戶需求中的“生產(chǎn)時(shí)間”。
根據(jù)第3章所建立的制造資源和用戶需求智能匹配模型,本文將樣本數(shù)據(jù)按8∶1∶1劃分用于訓(xùn)練、調(diào)參和測試,并將制造資源和用戶需求信息映射到潛在公共空間,將兩者合并為兩個(gè)32位的向量。在用戶需求部分,第一次卷積化的輸入維度為ndi×100,卷積核個(gè)數(shù)為100,卷積高度為5,最大池化步長為2;第二次卷積高度為3,卷積核個(gè)數(shù)與池化步長均與第一次一致。在制造資源部分,第一次卷積化的輸入維度為nri×200,卷積核個(gè)數(shù)為200,其余參數(shù)設(shè)置均與用戶需求部分相同。
本文給出樣本當(dāng)中的某重慶用戶A與某重慶企業(yè)B的樣本,依據(jù)模型對于樣本的訓(xùn)練效果,顯示其JE-CNN學(xué)習(xí)向量輸出如圖7所示。
圖7中:左側(cè)為用戶需求和制造資源部分的輸入實(shí)例,右側(cè)為其對應(yīng)的映射到公共空間的向量,以熱度圖形式呈現(xiàn),每個(gè)部分的最后一行顯示為合并后的32位向量,用戶需求取向量最大值合并,制造資源取平均值合并。值得注意的是,用戶名稱在匹配過程無實(shí)際意義,故不將其輸出。
從圖7中可以看出,制造資源和用戶需求部分向量分布未呈現(xiàn)明顯差異,其中用戶需求的第2、4、6、7項(xiàng),制造資源的第4、8、9、11項(xiàng),向量分布較為稀疏且數(shù)值較小,說明對應(yīng)信息區(qū)分度不高,在數(shù)據(jù)庫中存在較多類似描述。由于本文所采集制造資源數(shù)據(jù)基本來自于重慶市內(nèi)企業(yè),故用戶需求中“地域”要求一項(xiàng)基本無區(qū)分,數(shù)值普遍偏小。而制造資源中針對制造加工能力的描述關(guān)聯(lián)度較大,因此向量相對稠密。
最后在進(jìn)行匹配分析時(shí),計(jì)算制造資源和用戶需求的合并后向量的余弦相似度,圖7案例的余弦相似度為0.892 1,通過目標(biāo)函數(shù)優(yōu)化求解,可得該資源為相似度最高的制造資源項(xiàng)。
在整體樣本的AUC計(jì)算時(shí),本節(jié)通過ROC函數(shù)對所建立的制造資源與用戶需求數(shù)據(jù)庫進(jìn)行了訓(xùn)練和評估,得到了本模型在AUC上的表現(xiàn),如圖8所示。由ROC曲線與FPR軸之間的面積確定最終模型的分類閾值為0.78。
若有新的用戶需求提交至云平臺,模型便能夠根據(jù)學(xué)習(xí)訓(xùn)練的樣本,為其預(yù)測出最合適的制造資源項(xiàng)。若所計(jì)算匹配度大于分類閾值,表明匹配成功,輸出該制造資源服務(wù);若所計(jì)算匹配度小于分類閾值,則表明二者匹配失敗,模型當(dāng)中沒有合適的制造資源。
本文所述制造資源智能匹配云平臺,適用于需要對制造資源進(jìn)行交互式操作的供需雙方,尤其適合于需要進(jìn)行跨企業(yè)大數(shù)據(jù)分析檢索的用戶,云平臺能夠?qū)⒅圃熨Y源服務(wù)能力進(jìn)行統(tǒng)一描述與表征,為其提供按需服務(wù),云平臺界面展示如圖9所示。
相較于傳統(tǒng)方法而言,本文所采取的制造資源智能匹配方法具有可匹配制造資源數(shù)量更多、匹配效率更高的優(yōu)點(diǎn),為了體現(xiàn)該方法的優(yōu)越性,本節(jié)針對相同的制造資源與用戶需求數(shù)據(jù),采用基于語義的供需匹配方法以及多因素統(tǒng)計(jì)分析法進(jìn)行匹配研究,在面對同等制造資源數(shù)量的情況下,比較不同方法處理輸出最終用戶所需制造資源結(jié)果要花費(fèi)的時(shí)間,具體情況如圖10所示。
從圖10可以看出,針對以往常用的制造資源匹配方式如語義匹配和多因素統(tǒng)計(jì)分析等,以JE-CNN為基礎(chǔ)的智能匹配方式在制造資源數(shù)量較少的情況下不具有明顯優(yōu)勢,匹配時(shí)長甚至要略多于語義匹配和多因素統(tǒng)計(jì)分析法。但是,在面對大量制造資源時(shí),以JE-CNN為基礎(chǔ)的智能匹配方式表現(xiàn)出了較高的效率,經(jīng)過神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,增強(qiáng)了智能匹配過程的魯棒性和泛化能力,特別是在數(shù)據(jù)量急劇增多的情況下,傳統(tǒng)的語義匹配和多因素統(tǒng)計(jì)分析所花費(fèi)的匹配時(shí)間呈現(xiàn)指數(shù)式遞增,而以JE-CNN為基礎(chǔ)的智能匹配方式則表現(xiàn)平穩(wěn)。綜合上述分析結(jié)果可知,本文提出的制造資源智能匹配方法能夠較好地處理制造資源數(shù)量較多、分布范圍廣、匹配過程繁雜效率低的問題,體現(xiàn)了在大數(shù)據(jù)環(huán)境下處理制造資源供需匹配的獨(dú)特優(yōu)勢。
大數(shù)據(jù)環(huán)境下的制造資源供需匹配是提升制造服務(wù)能力的關(guān)鍵研究問題之一。在這方面,本文提出了一種基于云平臺的制造資源智能匹配方法,該方法通過詞向量建模,完成了制造資源和用戶需求的特征描述以及向量提取,構(gòu)建了制造資源和用戶需求匹配向量的公共空間,并利用JE-CNN將制造資源和用戶需求詞向量映射到該公共空間,以兩組詞向量匹配距離為目標(biāo)函數(shù),采用Adam算法優(yōu)化該目標(biāo)函數(shù),最后根據(jù)AUC模型判斷匹配度是否滿足要求,并利用案例分析驗(yàn)證了模型和方法的有效性和可行性。通過該方法,用戶能夠進(jìn)行海量的跨企業(yè)大數(shù)據(jù)分析檢索,大大拓展了用戶可以選擇的制造資源范圍。與此同時(shí),也無需用戶自行選擇所需的制造資源,可以做到定量描述,最優(yōu)匹配,提高了制造資源智能匹配的效率和精度。下一步將重點(diǎn)細(xì)化制造資源和用戶需求的粒度描述,從而提高模型訓(xùn)練的精度。同時(shí),為了獲得更高質(zhì)量的匹配結(jié)果,需要研究異構(gòu)制造設(shè)備的智能數(shù)據(jù)采集與處理技術(shù),以此來確保實(shí)際匹配過程的時(shí)效性。
計(jì)算機(jī)集成制造系統(tǒng)2022年12期