陳瀚寧, 胡永青, 蘇衛(wèi)星, 孫琳程
(1. 天津工業(yè)大學(xué) 控制科學(xué)與工程學(xué)院, 天津 300000; 2. 天津工業(yè)大學(xué) 計算機科學(xué)與技術(shù)學(xué)院, 天津 300000)
云制造作為一種面向服務(wù)的網(wǎng)絡(luò)化制造模式[1],借助云計算、網(wǎng)格計算等信息技術(shù),將企業(yè)內(nèi)部及分布式企業(yè)間圍繞產(chǎn)品開發(fā)、生產(chǎn)、銷售、使用等全生命周期的相關(guān)資源進行優(yōu)化整合和按需配置,通過標(biāo)準(zhǔn)、規(guī)范、可共享的制造服務(wù),實現(xiàn)跨企業(yè)、跨行業(yè)間的資源整合、業(yè)務(wù)協(xié)作和互補共生,進而有效提升產(chǎn)業(yè)鏈整體乃至整個制造業(yè)的整體競爭力和可持續(xù)發(fā)展能力[2].在云制造模式下,產(chǎn)業(yè)鏈內(nèi)或跨產(chǎn)業(yè)鏈的制造資源和制造能力被聚合到云平臺以便消費者可以按需獲得制造服務(wù)[3],所以云制造模式的推廣應(yīng)用迫切需要產(chǎn)業(yè)鏈上下游或跨產(chǎn)業(yè)鏈企業(yè)間開展大規(guī)模開放式協(xié)作及高端產(chǎn)品研發(fā)所需資源(包括模型、信息、工具、技術(shù)等)的共享共用.這些具有多源、海量、異構(gòu)特征的資源通常屬于不同經(jīng)營主體,具有較高商業(yè)價值.企業(yè)缺乏對資源的共享意愿度和使用意愿度,造成資源共享與重用效率低,導(dǎo)致云制造推廣應(yīng)用缺少科學(xué)的運行機制和良好的商業(yè)模式,其可持續(xù)發(fā)展受到影響[4].因此,企業(yè)的參與對于云制造系統(tǒng)的開發(fā)和實施非常重要,探索制造資源共享的推動模式以及有效的分布式企業(yè)間資源共享激勵機制,對促進云制造模式的良性、健康、可持續(xù)發(fā)展具有重要意義.
資源共享激勵機制一直是共享環(huán)境下企業(yè)保持核心競爭力的關(guān)鍵及協(xié)調(diào)通用技術(shù)研發(fā)及創(chuàng)新的重要問題[5].在云制造領(lǐng)域,Simeone等[6]建立了一個智能云制造平臺框架,支持制造服務(wù)的動態(tài)共享來提高制造網(wǎng)絡(luò)中的資源利用率.Sun等[7]針對云數(shù)據(jù)中心特點,基于眾籌思想建立資源共享激勵機制,提高了工作效率.Jin等[8]針對移動云計算資源設(shè)計了以雙向拍賣機制為主導(dǎo)的高效資源共享激勵機制.Nayak等[9]建立了一個新的基于資源共享的RSBF框架,促進各類制造資源的動態(tài)整合.Assis等[10]提出了一種新的多云錦標(biāo)賽的云聯(lián)盟方法,鼓勵資源共享行為,減少“搭便車”的投機行為.
企業(yè)間關(guān)于資源共享策略的選擇相互影響,資源共享發(fā)展過程可視為企業(yè)在有限理性情況下的博弈過程[11].利用演化博弈理論對資源共享激勵機制進行建模,目前已有研究成果.Yang等[12]利用演化博弈理論對市場多個主體之間知識產(chǎn)權(quán)合作共享行為的博弈演化過程進行探討,為知識產(chǎn)權(quán)共享激勵機制的建立提供參考.Wang等[13]基于進化博弈理論制定了師徒模式下知識共享激勵機制,促進師徒模式下組織內(nèi)的知識資源共享.Li等[14]為了解決代理商之間的合作困境,提出了以演化博弈理論為基礎(chǔ)的推薦激勵機制.Wang等[15]在共享網(wǎng)絡(luò)中為鼓勵機會主義社會網(wǎng)絡(luò)節(jié)點間信息傳遞,運用演化博弈理論構(gòu)建激勵機制.Du等[16]結(jié)合演化博弈理論對集成項目交付(IPD)中促進一體化項目團隊內(nèi)部知識共享演化機制進行了探討.
演化博弈理論應(yīng)用于云制造領(lǐng)域中制造資源共享與決策分配.Carlucci等[17]利用少數(shù)博弈理論實現(xiàn)云制造環(huán)境下資源分配決策,提高整體環(huán)境資源利用率.趙道致等[18]研究了云制造模式下兩個企業(yè)之間剩余資源分享的問題,分析了資源共享過程中的收益及決策情況.喬國通等[19]利用演化博弈理論對制造資源共享進行了博弈分析并探討了不同參數(shù)對共享過程的影響.基于演化博弈理論的云制造領(lǐng)域資源共享激勵機制雖然受到關(guān)注,但相關(guān)研究相對較少.現(xiàn)有研究很多是從共享雙方完全理性的角度出發(fā),但在實際情況下,參與博弈的雙方是根據(jù)對方策略實時調(diào)整自己的策略,屬于有限理性行為.除此之外,已有研究主要將影響資源共享行為的因素局限在對稱型資源共享雙方的角度,忽視了資源共享行為的倡導(dǎo)者或服務(wù)商在共享過程中起到的作用,而沒有考慮到資源本身價值對資源共享良性發(fā)展的影響.
針對以上問題,從資源共享的有限理性角度出發(fā),基于演化博弈理論,分別從資源共享雙方水平、共享行為影響及共享資源價值的角度抽象提取出分布式資源共享過程中各影響因素,建立云制造模式下資源共享演化博弈模型,對資源共享雙方所采用的基本策略進行博弈分析,基于系統(tǒng)動力學(xué)理論討論各因素對資源共享行為演化趨勢的影響.最后進行仿真驗證,為實際生產(chǎn)過程中資源共享的實施及相應(yīng)的策略制定提供借鑒.
將分布式資源共享行為抽象為雙方互動行為,A,B表示資源共享雙方,分別表示參與資源共享的企業(yè)A和企業(yè)B.企業(yè)A和B不僅代表一家企業(yè),還可以代表資源共享決策相同的企業(yè)集群.
分布式資源共享過程中各影響因素的參數(shù)假設(shè)如表1所示.
為了促進資源共享行為的良性發(fā)展及高質(zhì)量資源的最大化利用,本文將共享資源的評價結(jié)果作為資源共享行為的影響因素引入激勵機制,以資源評價收益系數(shù)φi的形式表達(dá).
在對共享資源進行評價時,需要以較高的用戶滿意度為基本指向,對于產(chǎn)品研發(fā)所需的各類資源(包括科技資源、信息資源、技術(shù)資源等)的評價要保證全面可靠,設(shè)置的評價體系須科學(xué)完善.根據(jù)企業(yè)研發(fā)設(shè)計資源特點及資源共享行為流程, 結(jié)合Morville等[20]提出的用戶體驗蜂巢模型,資源共享整體評價研究從以下幾個角度展開:找到資源,獲得資源,使用資源,評價反饋.其中,找到資源即資源的可見性,主要表示資源本身及資源擁有者基本信息的公開及齊全程度;獲得資源即資源的可得性,表示資源內(nèi)容及其功能可正常獲取的易操作性及資源獲取的便利程度;使用資源即資源可用性,主要指資源是否可以正常使用及對應(yīng)用任務(wù)的適用性;評價反饋主要指用戶在資源使用期間及使用完成后的主觀滿意度,除了資源功能角度的滿意程度外,還包括資源的非功能角度評價,例如資源擁有方提供的共享服務(wù)及未來的資源使用意向等.以上幾個方面可以基本表達(dá)資源共享過程中各個環(huán)節(jié)資源的狀態(tài),實現(xiàn)對企業(yè)研發(fā)設(shè)計資源全方位、多維度及細(xì)粒度的評價.從以上4個角度出發(fā)建立4維評價模型,如圖1所示.
表1 分布式資源共享演化博弈模型參數(shù)假設(shè)
圖1 評價結(jié)構(gòu)模型
共享資源評價的核心思想:以圖1所示的4維評價模型為基礎(chǔ),針對各類資源特點,建立相應(yīng)的評價指標(biāo)體系,在資源共享過程中通過專家評分或用戶反饋等評價方式獲得共享資源各指標(biāo)得分情況,利用賦權(quán)方法確定各評價指標(biāo)相應(yīng)權(quán)重,與各評價指標(biāo)得分加權(quán)計算出共享資源的綜合評價結(jié)果.
在資源共享過程中,企業(yè)A和B均有共享(S)及不共享(N)2種策略,根據(jù)表1所示的資源共享影響因素設(shè)置,不同策略下共享雙方收益以支付矩陣的形式表示,如表2所示.
表2 支付矩陣
表2中:
(1)
假設(shè)企業(yè)A選擇策略S的概率為p1,則選擇策略N的概率為1-p1.企業(yè)B選擇策略S的概率為p2,則選擇策略N的概率為1-p2.
企業(yè)A在S策略下的期望收益為
PEA=p2(PPA-CA)+(1-p2)(PRA-CA).
(2)
企業(yè)A在N策略下的期望收益為
REA=p2(RPA-TA)+(1-p2)IA.
(3)
那么,在混合策略下,企業(yè)的平均收益為
MEA=p1PEA+(1-p1)REA.
(4)
企業(yè)A的復(fù)制動態(tài)方程為
(PEA-REA)=p1(1-p1)(p2(θ(tAlA+tBlBuA)sA+
tBlBuAωA)+tAlAφA+tAlAeA-tAlAcA) .
(5)
同理,企業(yè)B的復(fù)制動態(tài)方程為
(6)
企業(yè)A,B的復(fù)制動態(tài)方程組為
(7)
根據(jù)Friedman的研究[21],局部平衡點的穩(wěn)定性可以通過分析復(fù)制動態(tài)方程的雅克比矩陣確定,F(p1),F(p2)的雅克比矩陣為
(8)
式中:
雅克比矩陣的行列式和跡分別表示為
Det(J)=J11J22-J12J21,
(9)
Tr(J)=J11+J22.
(10)
5個平衡點處Det(J)及Tr(J)的情況如表3所示.
表3 平衡點處Det(J)及Tr(J)的情況
當(dāng)Det(J)>0,Tr(J)<0時,對應(yīng)的局部平衡點為演化穩(wěn)定點;當(dāng)Det(J)>0,Tr(J)>0時,對應(yīng)的局部平衡點為不穩(wěn)定點;當(dāng)Det(J)<0時,對應(yīng)的局部平衡點為鞍點.
表4 局部平衡點穩(wěn)定性
演化相位圖如圖2所示.
由圖2a可知,初始共享概率(p1,p2)落在區(qū)域OCPA中時,(N,N)為演化穩(wěn)定策略ESS;落在區(qū)域APCB中,(S,S)為演化穩(wěn)定策略ESS,即APCB區(qū)域面積越大,資源共享雙方在演化學(xué)習(xí)之后,選擇資源共享的概率就越大.在圖2b~圖2d中,資源共享概率演化結(jié)果與初始概率無關(guān),經(jīng)過不斷演化學(xué)習(xí),演化穩(wěn)定策略ESS均為(N,N),博弈雙方最終均不會參與資源共享.
APCB區(qū)域面積可表示為S:
(11)
實驗在MATLAB 2018b環(huán)境下進行,驗證各因素對資源共享概率演化趨勢的影響.隨機選取100個初始進化點,資源共享演化路徑如圖3所示,圖中每條曲線均代表一條進化路徑.當(dāng)cA=2.5,cB=2.5時,仿真結(jié)果如圖3a所示,所有初始點的進化路徑最后均穩(wěn)定在(0,0)和(1,1)兩個穩(wěn)定點,資源共享演化趨勢與圖2a一致;當(dāng)cA=2.5,cB=4;cA=4,cB=2.5;cA=4,cB=4時,仿真結(jié)果分別如圖3b~圖3d所示,資源共享演化趨勢分別與圖2b~圖2d一致,所有進化路徑最后均穩(wěn)定在(0,0)點,雙方最終均會選擇不共享策略.
隨機選取投機懲罰系數(shù)ωi(i=A,B)、資源共享成本系數(shù)ci(i=A,B)及協(xié)同收益分配系數(shù)θ作為待調(diào)整參數(shù),分別改變其取值情況,演化時間用t表示,資源共享概率用p表示,通過實驗仿真對第2節(jié)中各因素對資源共享演化趨勢的影響分析進行驗證.
投機懲罰系數(shù)ωi對資源共享演化趨勢的影響:設(shè)ωA和ωB的范圍均為0.5~2.5,步長為0.5,資源共享博弈雙方演化仿真結(jié)果如圖4、圖5所示.當(dāng)ωA為0.5,1,1.5,ωB為0.5時,資源共享博弈雙方最終會選擇(N,N)策略.由于懲罰成本太小,資源共享過程中的投機行為無法得到有效抑制,導(dǎo)致整體環(huán)境下資源共享行為的劣性發(fā)展,企業(yè)雙方最終都會放棄資源共享,合作失敗.懲罰系數(shù)越大,博弈雙方參與資源共享概率收斂到0的速度越慢.在其余情況下,資源共享雙方會選擇(S,S)策略,懲罰系數(shù)越大,資源共享概率演化曲線收斂到1的速度越快.投機懲罰力度較大時,投機行為需要承擔(dān)較大的心理預(yù)期風(fēng)險,資源共享行為可得以良性發(fā)展.“搭便車”行為是阻礙資源共享持續(xù)性發(fā)展的重要因素,投機懲罰系數(shù)對資源共享行為起正向促進作用,增加懲罰系數(shù)對減少投機行為的產(chǎn)生具有積極影響.
圖2 演化相位圖
圖3 資源共享演化路徑
圖4 ωA對資源共享演化趨勢的影響
圖5 ωB對資源共享演化趨勢的影響
資源共享成本系數(shù)ci的影響:在資源參與共享的過程中,資源共享方不可避免地會付出一定成本,包括資源共享轉(zhuǎn)移及資源獲取過程中花費的成本,比如時間成本、風(fēng)險成本、操作成本(包括人力、技術(shù)等)[7].設(shè)置cA,cB的范圍均為1~5,步長為1,所得資源共享雙方博弈演化結(jié)果如圖6、圖7所示.當(dāng)cA,cB均取1,2時,資源共享雙方最終會選擇(S,S)策略,共享成本系數(shù)越大,博弈雙方參與資源共享概率演化曲線收斂到1的速度越慢.當(dāng)cA,cB均取3,4,5時,資源共享雙方最終會選擇(N,N)策略,且共享成本系數(shù)越大,資源共享概率曲線收斂到0的速度越快.隨資源共享成本的增加,資源共享行為的意愿降低,共享成本對資源共享行為具有顯著的負(fù)面影響,通過技術(shù)手段降低共享成本也是吸引分布式環(huán)境下各企業(yè)加入云制造資源共享的有效途徑.
圖6 cA對資源共享演化趨勢的影響
圖7 cB對資源共享演化趨勢的影響
協(xié)同收益分配系數(shù)θ的影響:當(dāng)θ為0.1,0.3,0.5,0.6,0.8時,所得資源共享雙方演化博弈仿真結(jié)果如圖8所示,當(dāng)θ為0.1,0.3及0.8時,博弈雙方最終會選擇(N,N)策略,其中當(dāng)θ=0.8時,企業(yè)A將獲得總體協(xié)同收益的80%,導(dǎo)致資源共享概率大幅上升,然而由于收益分配不均,企業(yè)B共享概率下降,企業(yè)A也將被動降低資源共享概率,最終導(dǎo)致共享雙方采取(N,N)策略.當(dāng)θ為0.5,0.6時,(S,S)策略為演化穩(wěn)定狀態(tài).可知,θ的大小反映了分布式共享環(huán)境下對合作行為產(chǎn)生協(xié)同收益分配的公平性,θ取值過大或者過小均會導(dǎo)致協(xié)同收益分配不均,進而使協(xié)同收益分配較少的一方共享積極性受到抑制.隨時間的推移,企業(yè)雙方都將拒絕資源共享,只有當(dāng)收入分配公平時,共享環(huán)境下的各企業(yè)才會保持或增加共享熱情[7],資源共享過程中協(xié)同收益分配系數(shù)與共享行為的演化結(jié)果呈倒U型關(guān)系.
圖8 θ對資源共享演化趨勢的影響
本文通過理論分析及實驗仿真驗證,探索分布式環(huán)境下各企業(yè)間資源共享行為的長期演化規(guī)律及各因素影響,可以為激勵企業(yè)采取共享策略提供指導(dǎo),從長遠(yuǎn)來看,整體共享環(huán)境下將形成資源共享的良性循環(huán),這將有利于促進云制造環(huán)境下分布式企業(yè)間的協(xié)同創(chuàng)新水平.
1) 資源可共享總量、資源共享水平、資源利用能力、協(xié)同收益系數(shù)、評價收益系數(shù)、共享激勵系數(shù)及投機懲罰系數(shù)對資源共享起正向促進作用;共享成本系數(shù)對資源共享起負(fù)向阻礙作用;直接收益系數(shù)對資源共享演化過程不產(chǎn)生影響;協(xié)同收益分配系數(shù)與資源共享演化穩(wěn)定狀態(tài)呈倒U型關(guān)系.
2) 對于資源共享行為倡導(dǎo)者(如云制造平臺、第三方資源集成管理組織等),本文或許可以為分布式環(huán)境下對資源共享相關(guān)政策的制定提供參考.
3) 對于資源共享的參與企業(yè),本文提出的激勵機制可考慮作為實際情況下共享行為實施的方向指導(dǎo),從而降低博弈過程所帶來的效率損失.
4) 在激勵模型中引入價值信息:一方面可以促進高價值資源共享進而提高總體環(huán)境下資源共享的積極性;另一方面會使資源共享者更加謹(jǐn)慎,有效抑制無用資源的盲目共享行為,促進云制造環(huán)境下分布式資源共享行為的良性發(fā)展.本文研究內(nèi)容對于云制造模式全面支撐企業(yè)一體化協(xié)同研制,促進我國高端裝備研制創(chuàng)新,提高裝備制造企業(yè)的核心競爭力均具有重要意義.