張振文,陳 琛,龔靜雯,陳學(xué)廣
(1.華中科技大學(xué)系統(tǒng)工程研究所,湖北武漢 430074;2.武漢理工大學(xué)數(shù)字制造湖北省重點(diǎn)實(shí)驗(yàn)室,湖北武漢 430070)
議價(jià)是指議價(jià)雙方在議價(jià)區(qū)間內(nèi)基于成本和價(jià)格尋求最終成交點(diǎn)的過(guò)程。議價(jià)的核心活動(dòng)在于買賣雙方的議價(jià)策略,也就是開(kāi)局策略與讓步策略[1]。研究表明,具有議價(jià)功能的網(wǎng)站會(huì)吸引更多的購(gòu)物者[2-3]。自治Agent之間會(huì)發(fā)生分歧和沖突,可以通過(guò)社會(huì)調(diào)節(jié)機(jī)制使得Agent群體的狀況變好。協(xié)商是一個(gè)分散化的在自治Agent之間進(jìn)行利益調(diào)整和沖突解決的有效方法[4]。協(xié)商機(jī)制包括協(xié)商協(xié)議和協(xié)商策略兩大部分[5]。議價(jià)是指Agent之間圍繞價(jià)格展開(kāi)協(xié)商的一種形式,其機(jī)制對(duì)應(yīng)為議價(jià)協(xié)議和議價(jià)策略。從狹義方面解釋,協(xié)商是一個(gè)驅(qū)使參與者進(jìn)行讓步,從先前分歧產(chǎn)生時(shí)的利益要求逐步退縮的交互過(guò)程。從這個(gè)意義上可以引出,讓步是協(xié)商機(jī)制中一項(xiàng)極其重要的組成部分,讓步作為Agent要求的效用減少應(yīng)用到雙邊的協(xié)商當(dāng)中[6]。
在計(jì)算機(jī)科學(xué)應(yīng)用領(lǐng)域,博弈分析通常假定針對(duì)獨(dú)立協(xié)商,協(xié)商中只考慮當(dāng)前的協(xié)商空間和決策計(jì)劃。在社會(huì)或可學(xué)習(xí)Agent系統(tǒng)中,因?yàn)锳gent能夠應(yīng)用先前的協(xié)商經(jīng)驗(yàn)來(lái)幫助或差別性地對(duì)待隨后出現(xiàn)在協(xié)商中的其他Agent[7]。與博弈論和協(xié)商相關(guān)的分布式人工智能的研究者認(rèn)為讓步與行為相關(guān),更準(zhǔn)確地講是指智能體的客觀適應(yīng)行為。Agent被要求通過(guò)提出不同的倡議來(lái)改變他們的行為[8-10]。協(xié)商談判中的讓步是交易雙方進(jìn)行利益調(diào)整與實(shí)現(xiàn)的主要手段,讓步意味著Agent提出的提議有可能在提高對(duì)手的效用的同時(shí),使自己的收益減少[11]。
相關(guān)的研究已經(jīng)定義了一些議價(jià)策略,如SIEGEL 等人提出的強(qiáng)硬策略[12],BARTOS 提出的調(diào)節(jié)策略[13],OSGOOD 提出的溫和策略[14],以及SCHELLING提出的公平策略[15]。目前,在具有議價(jià)功能的網(wǎng)站中,Agent所應(yīng)用的讓步策略也多是基于以上幾種類型的策略進(jìn)行設(shè)計(jì)的。在MIT多媒體實(shí)驗(yàn)室開(kāi)發(fā)出的Kasbah系統(tǒng)中,用戶建立的Agent分別呈線性函數(shù)、二次函數(shù)和指數(shù)函數(shù)。這3種讓步策略分別代表急切的、冷靜的和貪婪的議價(jià)態(tài)度[16]。而LIANG和DOONG開(kāi)發(fā)的電子商業(yè)街模式提供了效用遞減策略、效用遞增策略和效用平均策略等3個(gè)議價(jià)策略。
綜上可知,已有的關(guān)于議價(jià)協(xié)商問(wèn)題的研究主要是圍繞制定單方Agent的靜態(tài)議價(jià)策略任務(wù)進(jìn)行的。筆者將議價(jià)策略的分析拓展到屏蔽出價(jià)信息的同步議價(jià)協(xié)商環(huán)境中來(lái),分析了強(qiáng)制讓步要求對(duì)議價(jià)進(jìn)程的作用效果,提出了一套能夠作用于動(dòng)態(tài)條件下的讓步指導(dǎo)機(jī)制。
議價(jià)是一個(gè)多回合的交互過(guò)程,它主要解決議價(jià)雙方在價(jià)格上存在的分歧,而議價(jià)雙方通過(guò)什么樣的方式來(lái)解決分歧是議價(jià)協(xié)議所要規(guī)定的內(nèi)容。議價(jià)協(xié)議是一套規(guī)范,是管理議價(jià)過(guò)程的各項(xiàng)規(guī)則的集合,主要包括議價(jià)雙方的行動(dòng)方式和行動(dòng)集合。以下為基本的議價(jià)讓步模型定義:
圖1 模型1示例
圖2 模型2示例
模型1中的賣方讓步軌跡1和模型2中的買方讓步軌跡1分別為Agent先積極、后消極的讓步策略,價(jià)格在讓步過(guò)程初期變化幅度較大,在一定的輪次過(guò)后,價(jià)格變化趨于平緩,顯示出先軟后硬的議價(jià)態(tài)度;模型1中的賣方讓步軌跡2和模型2中的買方讓步軌跡2分別為Agent前后均衡的讓步策略,價(jià)格在讓步過(guò)程中的變化幅度始終較均勻,顯示出前后一致的議價(jià)態(tài)度;模型1中的賣方讓步軌跡3和模型2中的買方讓步軌跡3分別為Agent先消極、后積極的讓步策略,價(jià)格在讓步過(guò)程初期變化幅度較小,在一定的輪次過(guò)后,價(jià)格變化變快,顯示出先硬后軟的議價(jià)態(tài)度。應(yīng)用策略的實(shí)際制定過(guò)程非常復(fù)雜,但基本上可歸結(jié)為以上基本策略形式的變化或組合。
按照?qǐng)?bào)價(jià)的先后順序,可分為單向報(bào)價(jià)、輪換報(bào)價(jià)、同步報(bào)價(jià)或混合報(bào)價(jià)。報(bào)價(jià)容易暴露參與者的私有信息,并由此帶來(lái)潛在收益被非正當(dāng)侵害的可能,因此,報(bào)價(jià)過(guò)程中的Agent都會(huì)盡可能減少出價(jià),或推后出價(jià),從而造成議價(jià)過(guò)程拖沓和欺詐現(xiàn)象的發(fā)生,推后報(bào)價(jià)的一方能夠利用對(duì)方的報(bào)價(jià)信息修改自身的策略以獲得利益。同步報(bào)價(jià)雖然解決了先后差別造成的不當(dāng)?shù)美?,但是Agent依然會(huì)由于策略選擇的不同,面臨暴露報(bào)價(jià)信息帶來(lái)的利益流失。筆者針對(duì)該問(wèn)題提出了一種改進(jìn)的同步議價(jià)讓步的協(xié)議規(guī)則。
通過(guò)對(duì)上述議價(jià)讓步協(xié)議的分析可知,若引入一個(gè)可信任的第三方Agent M,在每一步雙方報(bào)價(jià)時(shí),Agent B和Agent S同步將自己的報(bào)價(jià)在屏蔽他人的情況下向Agent M遞交,就可以起到對(duì)Agent私有信息的保護(hù),避免潛在收益的流失。筆者研究的自動(dòng)議價(jià)系統(tǒng)中規(guī)定,議價(jià)過(guò)程由買、賣雙方Agent多回合同步進(jìn)行出價(jià)。整個(gè)交易過(guò)程可分為3個(gè)階段,即準(zhǔn)備階段、議價(jià)階段和結(jié)束階段,如圖3所示。
圖3 新型議價(jià)協(xié)議的議價(jià)過(guò)程
在準(zhǔn)備階段,由買賣雙方輸入基本參數(shù),議價(jià)過(guò)程進(jìn)入狀態(tài)0(初始狀態(tài))。進(jìn)入議價(jià)階段后,買賣雙方Agent根據(jù)基本參數(shù)生成報(bào)價(jià)策略,議價(jià)過(guò)程進(jìn)入狀態(tài)1(策略生成狀態(tài))。買賣Agent根據(jù)報(bào)價(jià)策略進(jìn)行首次報(bào)價(jià),并將該價(jià)格發(fā)送給Agent M,進(jìn)入狀態(tài)2(議價(jià)狀態(tài))。
在t時(shí)刻,Agent M在將雙方提交的報(bào)價(jià)進(jìn)行比較后,根據(jù)實(shí)際情況會(huì)得出以下幾種行動(dòng)選擇:
買賣Agent在出價(jià)時(shí)遵循單調(diào)原則,不允許出現(xiàn)反復(fù),價(jià)格不相容時(shí)系統(tǒng)會(huì)判斷是否已經(jīng)達(dá)到強(qiáng)制退出條件(如是否已經(jīng)達(dá)到某一方Agent設(shè)定的截止時(shí)間)。如果滿足該條件,則議價(jià)系統(tǒng)將判定交易失敗,強(qiáng)行結(jié)束議價(jià)進(jìn)程。綜合起來(lái),議價(jià)進(jìn)程將以3種方式結(jié)束:成交結(jié)束、強(qiáng)制結(jié)束和主動(dòng)結(jié)束。
強(qiáng)制讓步要求是為了激勵(lì)議價(jià)Agent加快議價(jià)節(jié)奏,公平地維護(hù)雙方的協(xié)商利益,提高議價(jià)效率。對(duì)于強(qiáng)制讓步要求,Agent只有一次不遵守該規(guī)則的讓步行動(dòng),且是最后一次報(bào)價(jià)機(jī)會(huì),以防止通過(guò)破壞機(jī)制來(lái)得到非正當(dāng)?shù)慕灰桌妗?/p>
圖4 B、S報(bào)價(jià)所屬區(qū)間分布
表1 任意t時(shí)刻Agent的報(bào)價(jià)決策
如果有一方的讓步空間已經(jīng)不能達(dá)到強(qiáng)制讓步距離的要求,以買方Agent B為例,讓步空間受限情況下的報(bào)價(jià)區(qū)間分布如圖5所示。
圖5 讓步空間受限情況下的報(bào)價(jià)區(qū)間分布
此時(shí),強(qiáng)制讓步后的報(bào)價(jià)取值必然超出了A-gent B的保留邊界的限制,而如果機(jī)械地遵從這一規(guī)則,買方參與者將取消這次出價(jià),堅(jiān)持上一次的報(bào)價(jià)pt-1B,因?yàn)閺?qiáng)制讓步的原因,有潛在成交可能性的議價(jià)任務(wù)最終會(huì)以失敗結(jié)束。因此,完善的協(xié)商機(jī)制必須適當(dāng)允許Agent打破強(qiáng)制讓步的束縛,例如在最后一次報(bào)價(jià)機(jī)會(huì)時(shí)允許參與者不受強(qiáng)制讓步距離的影響,給出Agent在保障讓步單調(diào)的前提下有最后的一次自由博弈的機(jī)會(huì),以提升整體的議價(jià)成功率。
上述所論忽略了議價(jià)者貼現(xiàn)率存在的情景,如果進(jìn)一步考慮Agent的心理期望的變化(即貼現(xiàn)率不再為零),則將會(huì)有另外一番情景。此時(shí)要將Agent的報(bào)價(jià)轉(zhuǎn)為自身支付值,即使Agent在t+1時(shí)刻的報(bào)價(jià)維持不變,其對(duì)應(yīng)的支付依然減少。讓步方做出的讓步必須小于自身的底線保留值,越到后期效用衰減的比例幅度越高,此時(shí)賣家報(bào)價(jià)的絕對(duì)值卻越小,買家的報(bào)價(jià)的絕對(duì)值越高,但是雙方的期望效用值均一致減少。從社會(huì)福利的角度看,越早得出議價(jià)成果,交易所帶來(lái)的社會(huì)福利越大。議價(jià)Agent從自身利益出發(fā),也需要在與對(duì)手對(duì)等的前提下做出積極的讓步,這也說(shuō)明了強(qiáng)制讓步機(jī)制的合理性。
上述分析的協(xié)商過(guò)程中的議價(jià)策略從一開(kāi)始就已經(jīng)制定完成,在其后的協(xié)商過(guò)程中,Agent按部就班地進(jìn)行報(bào)價(jià),議價(jià)策略并不發(fā)生變化?,F(xiàn)實(shí)中的Agent議價(jià)過(guò)程由于受到來(lái)自外部環(huán)境和自身心理精神活動(dòng)的動(dòng)態(tài)影響,議價(jià)策略在議價(jià)過(guò)程中將產(chǎn)生變化,因此必須對(duì)動(dòng)態(tài)條件下的議價(jià)機(jī)制進(jìn)行分析。每一輪次的報(bào)價(jià)策略均為上一輪次議價(jià)之后的子博弈決策過(guò)程,子博弈是原博弈的一部分,它本身可以作為一個(gè)獨(dú)立的博弈進(jìn)行分析。貼現(xiàn)率不再為恒值,同樣的報(bào)價(jià)有可能對(duì)Agent帶來(lái)不同的獲利,因此參與者支付的變化將由多元因素決定。與以上不受外界環(huán)境影響的決策狀況分析不同,參與者由于既定的策略會(huì)受到外界干擾,其決策過(guò)程具有突發(fā)的不確定性,隨時(shí)會(huì)選擇退出議價(jià)過(guò)程。在動(dòng)態(tài)條件下的A-gent報(bào)價(jià)決策狀況如表2所示。
表2 動(dòng)態(tài)條件下的t時(shí)刻Agent報(bào)價(jià)決策狀況
當(dāng)有一方中途退出時(shí),Agent的議價(jià)決策會(huì)存在沒(méi)有到達(dá)原有保留價(jià)格前而選擇結(jié)束交易的狀況,從而整體議價(jià)活動(dòng)的進(jìn)程結(jié)束。
動(dòng)態(tài)條件下的議價(jià)活動(dòng)依然需要結(jié)構(gòu)化的協(xié)議來(lái)指導(dǎo)和規(guī)范。為防止Agent反復(fù)行為的影響,報(bào)價(jià)函數(shù)依然要隨時(shí)間設(shè)定為單調(diào)的,已報(bào)出的價(jià)格在Agent尚未選擇退出交易前應(yīng)仍然有效。Agent在做每一步策略決定時(shí)都要分析多重因素的作用,但是原有規(guī)則對(duì)于對(duì)手的真實(shí)報(bào)價(jià)信息的屏蔽和自身策略決定因素的變化使得參與者的讓步策略的具體制定失去了足夠的指引。為此,筆者引入了讓步需求強(qiáng)度σt來(lái)輔助Agent進(jìn)行報(bào)價(jià)決策,其計(jì)算式為σt=2×。讓步需求強(qiáng)度為上一輪次Agent S與Agent B的報(bào)價(jià)差值與報(bào)價(jià)均值的比值,它能夠顯示出子博弈面臨的博弈空間的大小。但是如果準(zhǔn)確的獲得該信息,Agent可以反算出對(duì)手上一輪次的具體出價(jià),與屏蔽信息的規(guī)則宗旨相抵觸。為解決這一問(wèn)題,筆者引入了另外一個(gè)讓步需求標(biāo)準(zhǔn)集 ψ ={ψ1,ψ2,…,ψn},其中 ψ1>ψ2>…>ψn。其是由一系列的數(shù)值來(lái)將讓步需求強(qiáng)度進(jìn)行分級(jí),并提示給參與議價(jià)的雙方Agent,而議價(jià)Agent并不清楚用作分級(jí)標(biāo)準(zhǔn)的具體數(shù)值,通過(guò)將讓步需求強(qiáng)度與標(biāo)準(zhǔn)集ψ中的各分級(jí)標(biāo)準(zhǔn)相比較得出對(duì)應(yīng)的多級(jí)提示信息。使得參與者獲悉部分必要的能夠用以制定實(shí)時(shí)議價(jià)策略的信息。
以圖4為例,在提示信息作用后,對(duì)于還有很大價(jià)格分歧的情況,Agent能夠據(jù)此制定出更加積極準(zhǔn)確的讓步?jīng)Q策,使得參與者在趨同的策略下加大讓步幅度,有利于提高議價(jià)效率及保障由此議價(jià)協(xié)商帶來(lái)的社會(huì)福利。在圖5中,首先在提示信息作用后,Agent在提示的讓步強(qiáng)度信息減弱情況下能夠據(jù)此制定出謹(jǐn)慎恰當(dāng)?shù)淖尣經(jīng)Q策,雙方的讓步策略表現(xiàn)為對(duì)等,極有可能出現(xiàn)的情況是雙方最后都將面對(duì)無(wú)法滿足最低讓步需求的最后一搏的讓步選擇情景,協(xié)商決策條件將更加公平,直接得出較合理的最終結(jié)果。由此可以看出,在讓步引導(dǎo)機(jī)制的作用下,有利于更好地控制同步協(xié)商的進(jìn)程,買賣雙方Agent的議價(jià)策略將趨于相同,能夠得出較公平的議價(jià)結(jié)果。
筆者在建立基本讓步模型和屏蔽報(bào)價(jià)信息的同步議價(jià)協(xié)議規(guī)則的基礎(chǔ)上,分析了強(qiáng)制讓步要求對(duì)議價(jià)進(jìn)程的作用影響及合理的應(yīng)用方式。在對(duì)實(shí)際動(dòng)態(tài)協(xié)商環(huán)境分析的基礎(chǔ)上,引入了讓步需求強(qiáng)度及配套的讓步需求評(píng)級(jí)等讓步指導(dǎo)機(jī)制,分析了讓步指導(dǎo)機(jī)制的應(yīng)用對(duì)協(xié)商效率和公平性的作用效果。該研究為建立公平、高效的第三方智能議價(jià)協(xié)商平臺(tái)奠定了基礎(chǔ)。
[1]OLIVER J R.A machine-learning approach to automated negotiation and prospects for electronic commerce[J].Journal of Management Information Systems,1996,13(3):83-112.
[2]TING-PENG L,HER-SEN D.Effect of bargaining in electronic commerce[C]//Proceedings of the International Workshop on Advance Issues of E-Commerce and Web-based Information Systems.Washington:IEEE,1999:174-181.
[3]DARKE P R,F(xiàn)REEDMAN J L.Non financial motives and bargain hunting[J].Journal of Applied Psychology,1995,25(18):1597-1610.
[4]LOMUSCIO A R,WOOLDRIDGE M,JENNINGS N R.A classification scheme for negotiation in electronic commerce[J].International Journal of Group Decision and Negotiation,2003,12(1):31-56.
[5]PRUITT D G.Negotiation behaviour[M].New York:Academic Press,1981:23-98.
[6]ROSENSCHEIN J S,ZLOTKIN G.Rules of encounter:designing conventions for automated negotiation among computers[M].London:The MIT Press,1994:46-132.
[7]SCHROTER K,URBIG D,HANS N.Social formation of negotiation space and group for non-isolated multilateral negotiations[J].Fundamenta Informaticae,2005(67):187-201.
[8]SIMONIN O,F(xiàn)ERBER J.Modeling self-satisfaction and altruism to handle action selection and reactive cooperation[C]//Proceedings of the 6th International Conference on the Simulation of Adaptive Behavior.Paris:[s.n.],2000:314-323.
[9]URBIG D.Negotiating by balancing personal utilities[C]//Proceedings of the Workshop Concurrency,Specification & Programming.Berlin:[s.n.],2004:576-587.
[10]OSSOWSKI S,GARCIA-SERRANO A.Social structure in artificial agent societies:implications for autonomous problem-solving agents[M].Berlin:Springer,1999:133-148.
[11]WOOLDRIDGE M,BUSSMANN S,KLOSTERBERG M.Production sequencing as negotiation[C]//Proceeding of the First International Conference on Practical Applications of Intelligent Agents and Multi-Agent Technology.[S.l.]:[s.n.],1996:709-726.
[12]SIEGEL S,F(xiàn)OURAKER L F.Bargaining and group decision making[M].New York:McGraw-Hill,1960:32-134.
[13]BARTOS O J.How predicable are negotiations? [J].Journal of Conflict Resolution,1967(11):481-496.
[14]OSGOOD C E.An alternative to war and surrender[M].Urbana:University of Illinois Press,1962:54-98.
[15]SCHELLING T.The strategy of conflict[M].Cambrigde:Harvard University Press,1960:23-152.
[16]MAES P,GUTTMAN R H,MOUKAS A G.Agents that buy and sell[J].Communication of ACM,1999,42(3):81-91.
武漢理工大學(xué)學(xué)報(bào)(信息與管理工程版)2010年2期