摘 ?要:伴隨著互聯(lián)網(wǎng)技術(shù)的應(yīng)用,連續(xù)雙向拍賣機制在商業(yè)世界廣泛運用,引發(fā)諸多學(xué)者對該機制的研究與探索。本文詳細介紹了連續(xù)雙向拍賣機制的研究方法、在連續(xù)雙向拍賣機制下的算法策略以及人工交互實驗方法,分析了競價策略研究的發(fā)展前景。
關(guān)鍵詞:連續(xù)雙向拍賣;算法;人機交互
拍賣機制是指根據(jù)一系列規(guī)則競價決定的價格來決定資源配置的市場機制。經(jīng)典的拍賣機制多為單向拍賣。近年來隨著互聯(lián)網(wǎng)的發(fā)展,雙向拍賣制度引起了學(xué)術(shù)界的廣泛關(guān)注。相較于“1對多”的單向拍賣而言,雙向拍賣為“多對多”形式,競價雙方均存在多位參與者,買賣雙方是平等的供給與需求關(guān)系。傳統(tǒng)雙向拍賣分為連續(xù)雙向拍賣與集和競價。連續(xù)雙向拍賣市場中,買賣雙方根據(jù)市場規(guī)則提交報價,一旦市場中出現(xiàn)可成交價格,便立即達成交易,若未達成交易,買賣雙方可調(diào)整報價;集和競價市場中,買賣雙方在開放期內(nèi)根據(jù)市場規(guī)則自由競價,開放期結(jié)束后,使得市場成交數(shù)量達到最大的報價成為市場價。兩種機制各有利弊,互為補充,在現(xiàn)實經(jīng)濟中經(jīng)常聯(lián)合使用,如股票市場,便采用集和競價啟動市場,連續(xù)雙方拍賣運行市場。由于連續(xù)雙向拍賣機制的動態(tài)性和隨機性,連續(xù)雙向拍賣市場的競價策略相較于單向拍賣、集和競價更為復(fù)雜,受到學(xué)術(shù)界更加廣泛的關(guān)注。
一、連續(xù)雙向拍賣市場最優(yōu)策略的研究方法
(1)納什均衡求解
Chatterjee和Samuelson將博弈論方法運用于雙向拍賣市場中的均衡競價策略研究中,得到了只包含一個買方、一個賣方和一件商品的簡化雙向拍賣市場中的貝葉斯納什均衡策略。Satterthwaite和Williams等人擴展到多個買賣雙方的情形,并證明隨著買賣雙方參與者人數(shù)的不斷增加,市場效率逐步提升,雙方報價更加趨近真實報價。Friedman提出雙向拍賣市場的價格形成模型,將雙向拍賣簡化成貝葉斯更新過程,證明了買賣雙方存在最優(yōu)簡單策略。
(2)實驗經(jīng)濟學(xué)方法
實驗經(jīng)濟學(xué)在連續(xù)雙向拍賣市場中的競價策略研究分為兩種:一是計算機仿真實驗,利用計算機對所設(shè)計策略進行模擬實驗,通過不同策略的實驗結(jié)果對比,分析策略優(yōu)劣。二是人機交互實驗,用算法機器人替代部分人類參與者,觀察人類交易者與算法交易者身處同一市場的交易結(jié)果。伴隨人工智能的發(fā)展,人機交互實驗為連續(xù)雙向拍賣的競價策略研究提供了更為契合真實世界的研究方法。
二、經(jīng)典算法策略簡介
(1)連續(xù)雙向拍賣機制設(shè)計
大多數(shù)連續(xù)雙向拍賣市場的研究圍繞Smith的市場協(xié)議開展:假定市場中只存在一類同質(zhì)商品,交易期內(nèi),買賣雙方可對商品進行報價,但每次報價只能指定唯一商品。只要市場上的賣方報價與買方報價相互匹配,立即達成交易,交易價格為達成交易的買賣方報價的平均值,交易期間允許雙方修改報價,市場存在多個交易日,每個交易日有多個交易期,每個交易期期初更新商品保留價格。市場出清或?qū)嶒烆A(yù)定時間達到即交易結(jié)束。同時,Smith開創(chuàng)性的設(shè)計了誘導(dǎo)序列以控制實驗環(huán)境:在交易期開始階段,分配給買家和賣家一個保留價格序列。買家序列為逐漸降低的價值序列以控制市場的需求曲線;賣家序列為逐漸上升的成本序列以控制賣家的供給曲線。在此假定買方價值為w,賣方成本為c,成交價格為p。那么對應(yīng)的買方剩余為w-p,賣方剩余為p-c?;赟mith的研究,定義市場分配效率為所有的買方剩余與賣方剩余之和和理論剩余值的比值。
(2)零智能算法
Gode和Sunder提出了兩種零智能算法,分別為ZIU算法和ZIC算法。假設(shè)市場允許的最高報價為x,最高報價為z,Vi為第i個算法買方交易員保留價值,Cj為第j個算法賣方交易員保留成本。ZIU算法中買賣雙方策略均為[x,z]的均勻分布隨機值。ZIC算法:買方策略為[x,Vi]的均勻分布隨機值;賣方策略為[Cj,z]的均勻分布隨機值。實驗結(jié)果表明:即使是零智能算法策略機器人參與連續(xù)雙向拍賣,也能達到資源配置的有效性。證明了連續(xù)雙向拍賣機制的有效性依賴其市場規(guī)則,與交易者的動機、市場信息和自我學(xué)習(xí)無關(guān)。
(3)增強零智能算法
Cliff和Bruten發(fā)現(xiàn)在非對稱市場結(jié)構(gòu)下ZI算法并不能達到高市場效率,并提出增強零智能算法(ZIP算法)。ZIP算法引入自我學(xué)習(xí)機制,根據(jù)市場信息進行簡單的自學(xué)習(xí)。ZIP算法根據(jù)四類市場信息調(diào)整利潤率進而修改自身報價:自己的上期報價p是否成交;市場最新報價q;q是買方報價還是賣方報價;報價q是否達成交易。如果自身報價p在市場中達成交易,算法交易員不會降低自身利潤;如果市場中有新的交易達成,那么報價高于等于成交價的買方交易員將提高利潤率,報價低于等于成交價的賣方交易員將提高利潤率;當(dāng)市場中出現(xiàn)新的買方報價,報價低于最新報價的買方交易員降低利潤率;當(dāng)市場中出現(xiàn)新的賣方報價,報價高于最新報價的賣方交易員降低利潤率。利用以上擁有簡單自學(xué)習(xí)能力的ZIP算法交易員進行仿真實驗發(fā)現(xiàn),在更一般的市場供需結(jié)構(gòu)下,ZIP算法相較ZI算法更接近人類在連續(xù)雙向拍賣機制下的市場表現(xiàn)。
(4)GD算法
GD算法是Gjerstad和Dickhaut基于啟發(fā)式信念學(xué)習(xí)模型的一種算法,該算法主要包括以下三個核心元素:啟發(fā)式信念函數(shù),通過收集市場數(shù)據(jù),將過去n期市場所有交易者的出價信息和成交情況整合為歷史數(shù)據(jù)集,利用數(shù)據(jù)集求解價格p達成交易的概率;基于信念的期望剩余價值最大化,根據(jù)啟發(fā)式信念函數(shù),計算以價格p出價的期望剩余價值,根據(jù)最大化結(jié)果決定出價;決定提交報價的時間。該算法的特點是接近于理性人的決策思維。
(5)AA算法
Vytelingum提出了自主交易代理策略(AA策略),該策略基于長期和短期學(xué)習(xí),使得算法可以調(diào)整自己的出價,并在各個環(huán)境下保持高效。短期學(xué)習(xí)將根據(jù)市場波動調(diào)整其“侵略度”,高侵略度意味著其追求更高的成交概率而會主動放棄一些收益。低侵略度則追求更高的收益而損失一些成交的概率。長期學(xué)習(xí)則基于每次交易后的市場信息調(diào)整決定侵略度影響出價的參數(shù)。短期學(xué)習(xí)的核心是對市場波動的即刻反應(yīng),長期學(xué)習(xí)的核心則是適應(yīng)市場供需變化的長期趨勢。分析AA算法與ZIP算法、GD算法的仿真實驗結(jié)果可知:無論是靜態(tài)還是動態(tài)實驗環(huán)境,AA算法均表現(xiàn)更優(yōu)。
[6]Gjerstad,S.,Dickhaut,J.Price Formation in Double Auctions[J]Games and Econimic Behavior,1998.22:1-29
[7]Vytelingum P,Cliff D,Jennings N R.Strategic bidding in continuous double auctions.Artificial Intelligence,2008.172(14):1700~1729
[8]Yue C,Mabu S,Hirasawa K.A bidding strategy using genetic network programming with adjusting parameters for large-scale continuous double auction.In:2012 IEEE International Conference on Systems,Man,and Cybern etics(SMC),New York: IEEE Press,2012:1896~1902.
[9]Zhan W,Zhang J,Yang J,etal.K-ZI: A general zero-intelligence model in continuous double auction.International Journal of Information Technology & Decision Marketing,2002.1(4):673~691
[10]詹文杰,楊潔.連續(xù)雙向拍賣市場中基于馬爾科夫鏈的交易策略研究。中國管理科學(xué),2008.16(1):111~116
[11]詹文杰,白延濤.基于動態(tài) Hurwicz 準(zhǔn)則的連續(xù)雙向拍賣報價策略研究.管理學(xué)報,2014.11(3):
[12]欒海軍,董紅斌,周陽.連續(xù)雙向拍賣市場中的一種自適應(yīng)競價策略研究[J].南京大學(xué)學(xué)報,2015.51(2)
[13]RAJARSHI DAS,JAMES E HANSON,JEFFREY O KEPHART,et al.Agent-human interactions in the continuous double auction[C]//International Joint Conference on Artificial Intelligence.2001.17:1169–1178.
[14]MARCO DE LUCA,DAVE CLIFF.Human-agent auction interactions: Adaptive-aggressive agents do Minate[C]//Proceedings of the Twenty-Second international joint conference on Artificial Intelligence.2011.1:178–185.
[15]M DE LUCA,C SZOSTEK,J CARTLIDGE,et al.Studies on interactions between human traders and Algorithmic Trading Systems[J].UK Government Foresight Project,2011.
[16]JOHN CARTLIDGE,CHARLOTTE SZOSTEK,MARCO DE LUCA,et al.Too Fast Too Furious Faster Financial-market Trading Agents Can Give Less Efficient Markets[C]//ICAART,(2)2012:126–135.
[17]VERNON L SMITH.An experimental study of competitive market behavior[J].The Journal of Political Economy,1962.70(2):111–137.
[18]VERNON L SMITH.Experimental economics: Induced value theory[J].The American Economic Review,1976.66(2):274–279.
[19]M.He,H.F.Leung,N.R.Jennings,A fuzzy logic based bidding strategy for autonomous agents in continuous double auctions,IEEE Transactions on Knowledge and Data Engineering 15(6)(2003)1345–1363.
[20]J.Nicolaisen,V.Petrov,L.Tesfatsion,Market power and efficiency in a computational electricity market with discriminatory double-auction pricing,IEEE Transactions on Evolutionary Computation 5(5)(2001) 504–523.
[21]S.Phelps,S.Parsons,P.McBurney,An evolutionary game-theoretic comparision of two double auction market designs,in:Proc.Sixth Workshop on Agent Mediated Electronic Commerce,2004,pp.192–198
作者簡介:曹陽,1995,男,漢,四川,碩士,武漢大學(xué),實驗經(jīng)濟學(xué) 4430072。