伍京華,耿翠陽,韓佳麗
中國礦業(yè)大學(xué)(北京)管理學(xué)院,北京100083
基于Agent的自動談判通過發(fā)揮Agent的主動自治等人工智能特性模擬人們開展實際商務(wù)談判,在降低談判成本的同時幫助人們提高談判效率和效果,因此一直處于商務(wù)智能研究前沿[1]。2020 年突發(fā)的新冠肺炎疫情橫掃全球,更是迫使人們不得不采取該方式代替?zhèn)鹘y(tǒng)的面對面商務(wù)談判,在保證復(fù)工復(fù)產(chǎn)的同時降低傳染風(fēng)險,這就為該領(lǐng)域的發(fā)展帶來了前所未有的機遇和挑戰(zhàn)[2]。
實際商務(wù)談判往往是多屬性的,但由于談判屬性性質(zhì)不同,決策模型也不同,導(dǎo)致基于Agent 的自動談判中的多屬性決策問題一直未能很好解決[3],進而導(dǎo)致Agent的人工智能優(yōu)勢在其中發(fā)揮還不夠理想,所以對其中多屬性決策的研究具有重要的理論意義和實際價值。
現(xiàn)有的多屬性決策研究主要集中于權(quán)重設(shè)定和方案的感知價值計算,但都有進一步提升的空間。例如,在權(quán)重設(shè)定方面,劉小弟等根據(jù)屬性值的均值、方差以及屬性間的關(guān)聯(lián)度建立屬性權(quán)重確定模型[4]。陳業(yè)華等采用TODIM法,綜合考慮方案和屬性兩個層面,構(gòu)造相應(yīng)的權(quán)重優(yōu)化模型[5]。王鐵旦等提出將準則相對重要程度以猶豫模糊數(shù)表示,通過形成猶豫模糊偏好關(guān)系計算最終屬性權(quán)重[6]。以上研究僅關(guān)注決策信息的模糊性,且僅從客觀角度確定權(quán)重,均有待改進。在方案的感知價值計算方面,包順等結(jié)合前景價值函數(shù),通過轉(zhuǎn)化價值矩陣對備選方案排序[7]。閆書麗等提出一種基于累積前景理論和灰靶思想的決策方法,通過構(gòu)造正負橢球灰靶模型對方案排序[8]。馬慶功針對屬性指標值為猶豫模糊信息且權(quán)重未知的決策問題,提出基于新的決策參考點和前景理論的多屬性群決策方法[9]。王應(yīng)明等考慮決策者對指標集的偏好和決策者的風(fēng)險心理因素,提出逼近理想解和前景理論相結(jié)合的多屬性決策方法[10]。以上研究僅考慮決策者對待損失時的規(guī)避程度,容易夸大風(fēng)險,從而影響決策結(jié)果的準確性。
上述研究除具備以上提升空間外,與基于Agent的自動談判結(jié)合并進行基于Agent 的多屬性決策的研究也還不多見,這就為該領(lǐng)域進一步拓展留下了更多寶貴的改進機會。例如,吳靜杰等基于Agent的態(tài)度偏好及心理特征,構(gòu)造新直覺模糊得分函數(shù),并結(jié)合直覺模糊熵構(gòu)建相應(yīng)決策模型[11]。危小超等結(jié)合心理學(xué),以后悔理論為基礎(chǔ),設(shè)計出一種能夠根據(jù)歷史信息建立學(xué)習(xí)規(guī)則的Agent 體系,從進化博弈的角度構(gòu)建決策模型[12]。Ghorbani等基于模糊最小二乘策略,結(jié)合博弈論提出新的基于Agent的迭代學(xué)習(xí)方法,并通過構(gòu)造內(nèi)部策略模型和近似最優(yōu)策略學(xué)習(xí)模型構(gòu)建相應(yīng)決策模型[13]。以上研究雖然從不同角度構(gòu)建了相應(yīng)的決策模型,但對模型中的權(quán)重設(shè)定及感知價值計算合理性方面的推進程度仍舊不大,因此亟待解決。
針對以上不足,本文結(jié)合Agent 的人工智能優(yōu)勢,首先采用猶豫模糊數(shù),將屬性分為外部因素屬性和內(nèi)在價值屬性,建立相應(yīng)的猶豫模糊評價矩陣并進行評價值規(guī)范后構(gòu)建相應(yīng)主觀權(quán)重算法;其次結(jié)合目標優(yōu)化模型和拉格朗日函數(shù)構(gòu)建相應(yīng)客觀權(quán)重算法,進而提出改進的綜合權(quán)重算法;再次,在前景理論基礎(chǔ)上,引入損失規(guī)避因子,將正負理想點作為雙參考點,設(shè)定相應(yīng)算法計算各屬性與正負理想解的距離,并將其作為新參數(shù)加入感知價值函數(shù),從而提出基于改進綜合感知價值函數(shù)的總體優(yōu)勢度算法,最終構(gòu)建出基于Agent的多屬性決策模型;最后,以某高校實驗教學(xué)設(shè)備采購談判為例,通過對結(jié)果的敏感性分析和與相關(guān)研究的比較分析驗證模型的有效性和優(yōu)越性。
構(gòu)建合理有效的基于Agent的多屬性決策模型,首先要建立合適的多屬性猶豫模糊評價矩陣,并對其中的屬性評價值個數(shù)進行規(guī)范化處理;其次要設(shè)計相應(yīng)的權(quán)重確定算法及對該方案的綜合感知價值算法,并將二者結(jié)合后得出最終針對各方案的總體優(yōu)勢度,最后根據(jù)總體優(yōu)勢度的大小完成決策。
在構(gòu)建模型之前,假設(shè)基于Agent的多屬性決策中有m個方案A={A1,A2,…,Am}(i=1,2,…,m)和n個屬性G={G1,G2,…,Gn}(j=1,2,…,n),屬性權(quán)重集W={W1,W2,…,Wn} ,且滿足,猶豫模糊數(shù)hij表示方案Ai滿足屬性Gj的程度。
現(xiàn)有的基于Agent 的多屬性決策研究多從成本收益角度出發(fā),將屬性分為成本型和效益型[14],而實際還存在其他類型。由于猶豫模糊集對不確定決策信息表達具有明顯優(yōu)勢,因此,本文采用猶豫模糊數(shù),將屬性分為外部因素屬性和內(nèi)在價值屬性,并將這兩種屬性的猶豫模糊評價值分別設(shè)為hij=hij和補集hij=hcij,建立相應(yīng)的猶豫模糊評價矩陣為:
此外,在基于Agent 的多屬性決策中,不同專家對不同屬性評價值不同會導(dǎo)致評價值個數(shù)不同,不利于決策。因此,本文采用公式(2),對同一屬性下評價值個數(shù)不同的任意兩個猶豫模糊數(shù)進行規(guī)范,使其個數(shù)相同。
其中,γi為猶豫模糊數(shù)中第i種類型的元素個數(shù),ni為對應(yīng)元素個數(shù)為γi的個數(shù),ε為調(diào)節(jié)參數(shù),取值范圍為0~1,且所有調(diào)節(jié)參數(shù)之和為1。
現(xiàn)有的基于Agent 的多屬性決策多采用客觀權(quán)重[4],而鮮有的采用主觀權(quán)重確定法的研究也只給出單一偏好值[15]。但實際上,不同Agent受認知環(huán)境、知識及信息不同等影響,對權(quán)重的確定也會有差異。因此,本文一方面采用主客觀權(quán)重相結(jié)合的方法確定屬性權(quán)重值;另一方面,在計算主觀權(quán)重時采用猶豫模糊數(shù),綜合考慮不同Agent的意見,再通過一致性檢驗及修正給出相應(yīng)的主觀權(quán)重確定法,并在計算客觀權(quán)重時通過構(gòu)造目標優(yōu)化模型[16]后對其求解,給出更符合實際的客觀權(quán)重確定法。
(1)基于猶豫模糊數(shù)的主觀權(quán)重確定
首先,采用1~9 標度法確定屬性Gj相對于屬性Gt的猶豫模糊偏好關(guān)系,構(gòu)造猶豫模糊偏好矩陣:
其次,確定矩陣H*=(hjt)n×n的特征偏好關(guān)系,并進行一致性檢驗。本文在模糊一致性計算[17]的基礎(chǔ)上進一步考慮元素間的特征偏好關(guān)系,引入加性一致性,構(gòu)造公式(4)表示上述猶豫模糊偏好矩陣的不一致程度。
若CI(H(σ))≤(為一致性指數(shù)閾值),則通過一致性檢驗,否則未通過檢驗;若未通過檢驗,令σ=σ+1,采用下面的迭代公式(5),對猶豫模糊偏好關(guān)系進行修正,并再進行一致性檢驗,直至通過檢驗。
綜上,可得各屬性的主觀權(quán)重W主j為:
其中,Wjt表示與hjt正相關(guān)的相對權(quán)重,通過比較hjt的大小進行比較。
(2)基于目標優(yōu)化模型的客觀權(quán)重確定
首先,計算猶豫模糊數(shù)hjt(1 ≤j≤n,1 ≤t≤n)的得分值S(hjt),可得相應(yīng)的得分值矩陣為:
其次,結(jié)合目標優(yōu)化模型,可得各屬性的客觀權(quán)重為:
其中,S(hij)表示猶豫模糊數(shù)hij的得分值,V(hij)表示方差,Wj表示各屬性的主觀權(quán)重。
再次,通過構(gòu)造相應(yīng)的拉格朗日函數(shù)對該模型求解:
(3)綜合權(quán)重確定
現(xiàn)有綜合權(quán)重確定多采用乘法合成法與加權(quán)匯總合成法[18],偏向于單純將主客觀權(quán)重相加或相乘,不僅權(quán)重系數(shù)確定不合理,而且難以綜合反映Agent 的意見。因此,為彌補這些缺陷,本文提出公式(11)并通過歸一化來計算各指標綜合權(quán)重值,公式中的aj和bj分別表示主客觀權(quán)重的重要程度系數(shù):
且:
其中,xj表示第δ個Agent 對第j項屬性的模糊評價值,且
現(xiàn)有的基于Agent的多屬性決策中,多采用TODIM法計算方案的感知價值,僅考慮Agent對待損失時的規(guī)避程度,容易造成夸大風(fēng)險[19],且由于對各屬性分類不合理,使比較方案感知價值的α和β取值相同[20],這些都導(dǎo)致感知價值計算的不合理。為此,本文在前景理論基礎(chǔ)上,引入損失規(guī)避因子,在以上研究基礎(chǔ)上,提出將正負理想點作為雙參考點,設(shè)定相應(yīng)算法計算各屬性與正負理想解的距離,并將其作為新參數(shù)加入感知價值函數(shù),在解決以上問題的基礎(chǔ)上使Agent的決策更符合實際。
首先,屬性Gj下,方案Ai相較Av的感知價值函數(shù)為:
其中,α和β(0 <α,β<1)表示Agent對“收益”或“損失”的敏感程度,θ(θ≥1)為損失規(guī)避因子,表示Agent 面對“收益”比“損失”更敏感的損失規(guī)避心理特征。pj、qj表示Agent在各風(fēng)險敏感度條件下對屬性類型的偏好程度。
其次,pj、qj的確定需要設(shè)定正負理想解作為雙參考點,設(shè)為屬性Gj的正理想解集,為屬性Gj的負理想解集,且:
則有:
且:
綜合以上研究,可得所有屬性下方案Ai相較Av的綜合感知價值函數(shù)為:
從而可得方案Ai(1 ≤i≤m)的總體優(yōu)勢度為:
最后,Agent根據(jù)Φ(Ai)的大小對方案進行決策,從而確定最佳方案。
為驗證以上模型,本文以代表某高校購買商Agent的實驗教學(xué)設(shè)備采購談判為例,擬定相應(yīng)數(shù)據(jù),進行計算和分析。其中,A1、A2、A3、A4為代表四家供應(yīng)商Agent 提供的方案,包括的屬性分別為外部屬性品牌聲譽G1和價格合理性G2,以及內(nèi)在價值屬性信息化程度G3和靈敏性G4,這些屬性的相應(yīng)權(quán)重分別為W1、W2、W3、W4。
首先,假設(shè)購買商Agent 對四家供應(yīng)商Agent 報價屬性進行評價后的猶豫模糊評價矩陣如表1。
假定其風(fēng)險態(tài)度是樂觀的,即ε1=0.9,可得評價值規(guī)范化后的猶豫模糊評價矩陣如表2。
其次,可得猶豫模糊偏好矩陣如表3。
表1 猶豫模糊評價矩陣
表2 規(guī)范化后的猶豫模糊評價矩陣
表3 猶豫模糊偏好矩陣
由表3可得:
令σ=0,H(0)=H,0.01,ρ=0.3,計算H(0)的加性一致性特征偏好關(guān)系矩陣為:
計算得CI(H(0))=0.018,H(0)不滿足加性一致性條件,修正后可得:
計算H(1)中元素的得分值,按列進行集結(jié)(δ=0.1),可得(1.112,2.495,2.127,2.203),并可得各屬性的主觀權(quán)重依次為0.541、0.156、0.145、0.157,客觀權(quán)重依次為0.262、0.223、0.258、0.257,從而可得各屬性的綜合權(quán)重為Wj=0.171,0.278,0.286,0.265。
再次,在各屬性下對方案進行兩兩比較,可得表4,其中,D代表收益,L代表損失。
表4 方案的比較情況
最后,計算cj、dj分別為(0.358,0.354,0.356,0.354)、(0.642,0.646,0.644,0.646)。取θ=1,α=0.88,β=0.92[21],可得各屬性下方案比較的感知價值為:
本文提出的模型中,當θ取不同值時,表示Agent對損失的規(guī)避程度不同,是模型中的重要參數(shù)。因此,本文對θ取不同值,并進行敏感性分析,以進一步驗證本文研究的有效性,得表5、圖1及相應(yīng)分析如下:
表5 損失規(guī)避因子θ取不同值時方案的總體優(yōu)勢度比較
圖1 損失規(guī)避因子θ取不同值時方案的總體優(yōu)勢度比較
綜上,可得各方案總體優(yōu)勢度為:Φ(A1)=-0.648,Φ(A2)=-0.576,Φ(A3)=0.803,Φ(A4)=0.936,則A4>A3>A2>A1,購買商Agent 選擇從方案A4的供應(yīng)商Agent處采購實驗教學(xué)設(shè)備。
(1)θ取值不同,Agent的決策結(jié)果不同
當θ=1,θ=1.5,θ=2 時,總體優(yōu)勢度排序為A4>A3>A2>A1,但當θ=4,θ=6 和θ=10 時,總體優(yōu)勢度排序變?yōu)锳4>A3>A1>A2,此時A1和A2的順序發(fā)生了變化。
(2)方案風(fēng)險程度不同,θ的影響不同
對A1、A2、A3來說,損失規(guī)避程度越強,即θ越大,其總體優(yōu)勢度越低,反之越高;但對A4來說正好相反。這是由于A1、A2、A3為風(fēng)險型,A4為穩(wěn)健型,風(fēng)險程度不同。
綜上,Agent 可以根據(jù)自身對損失的敏感程度及風(fēng)險偏好,調(diào)節(jié)損失規(guī)避因子θ的大小,計算方案的總體優(yōu)勢度并進行決策,使決策結(jié)果更符合實際。
為進一步驗證本文模型的有效性和優(yōu)越性,將模型所得決策結(jié)果分別與文獻[5]和[6]的決策結(jié)果進行對比分析,如表6和圖2所示。
表6 采用本文模型與文獻[5]和[6]的決策結(jié)果對比
圖2 采用本文模型與文獻[5]、[6]的決策結(jié)果對比折線圖
由表6和圖2可得:
(1)采用本文模型所得決策結(jié)果與文獻[6]不一致,但與文獻[5]所得決策結(jié)果一致。這是由于文獻[6]僅考慮Agent的主觀權(quán)重,而文獻[5]則在一定程度上考慮了Agent的客觀權(quán)重。因此,相比之下,采用本文提出的模型幫助Agent做出的決策更合理。
(2)采用本文模型所得決策結(jié)果與文獻[5]和[6]相比,差距更大,表現(xiàn)為圖中曲線更曲折,這不僅更有利于Agent 在現(xiàn)有方案中做出快速決策,而且能在節(jié)約談判時間的基礎(chǔ)上保證談判效果。另外,即使方案增多,Agent也會由于曲線更曲折仍能做出更好決策。
本文綜合采用猶豫模糊數(shù)、目標優(yōu)化模型和拉格朗日函數(shù)等,在設(shè)定相應(yīng)的主客觀權(quán)重算法后構(gòu)建出相應(yīng)的綜合權(quán)重確定算法,隨后結(jié)合前景理論,在引入損失規(guī)避因子后提出將正負理想點作為雙參考點,設(shè)定相應(yīng)算法計算各屬性與正負理想解的距離,并將其作為新參數(shù)加入感知價值函數(shù),從而提出基于綜合感知價值函數(shù)的總體優(yōu)勢度算法,最終構(gòu)建出基于Agent的多屬性決策模型。設(shè)計的算例、敏感性分析及與相關(guān)研究的比較分析表明,該模型不僅能幫助Agent 做出更合理決策,而且有助于Agent在更多方案中做出更快速決策,并且方案越多越能體現(xiàn)該模型的這些優(yōu)勢。