張小偉,江東,袁野
1. 東北大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院,遼寧 沈陽(yáng) 110819;2. 北京理工大學(xué)計(jì)算機(jī)學(xué)院,北京 100081
近年來(lái),隨著物聯(lián)網(wǎng)(Internet of things,IoT)的發(fā)展,基于IoT的智慧世界系統(tǒng)(智慧電網(wǎng)、智慧交通、智慧城市)發(fā)展迅速,來(lái)自各種設(shè)備或應(yīng)用程序的日志文件、數(shù)據(jù)庫(kù)文件、視頻、圖片、文檔等數(shù)據(jù)呈爆發(fā)式增長(zhǎng)[1-5]。數(shù)據(jù)作為一種新的生產(chǎn)要素,促進(jìn)及引領(lǐng)了新一輪的科技創(chuàng)新和經(jīng)濟(jì)增長(zhǎng)。然而,在大數(shù)據(jù)繁榮發(fā)展的背后有一個(gè)問(wèn)題不容忽視,即“數(shù)據(jù)孤島”。不同的企業(yè)甚至不同的部門(mén)之間的數(shù)據(jù)無(wú)法流通,如統(tǒng)計(jì)局和醫(yī)院等機(jī)構(gòu)長(zhǎng)期存儲(chǔ)大量個(gè)人信息數(shù)據(jù),滴滴和美團(tuán)等企業(yè)掌握了大量的用戶信息及出行信息,若無(wú)法將數(shù)據(jù)以合理的價(jià)格銷(xiāo)售,不僅無(wú)法最大化數(shù)據(jù)擁有者的收益,還會(huì)為維護(hù)和存儲(chǔ)數(shù)據(jù)耗費(fèi)大量財(cái)力。近年來(lái)發(fā)展迅速的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)需要大量的數(shù)據(jù)進(jìn)行訓(xùn)練以提高測(cè)試精度,但是由于數(shù)據(jù)收集困難,導(dǎo)致訓(xùn)練精度無(wú)法提升,因此數(shù)據(jù)需求者需要一個(gè)渠道來(lái)獲得大量且可靠的數(shù)據(jù)?;谏鲜鲂枨螅琌liveira A C等人[6]提出了數(shù)據(jù)即服務(wù)(data as a service,DaaS)的概念。在DaaS中,數(shù)據(jù)被認(rèn)為是一種商品,可以通過(guò)購(gòu)買(mǎi)數(shù)據(jù),并將其處理之后獲得知識(shí),進(jìn)而幫助企業(yè)、政府做出決策。因此,在數(shù)據(jù)擁有者和數(shù)據(jù)需求者之間搭建一個(gè)數(shù)據(jù)交易平臺(tái),越來(lái)越受到人們的關(guān)注。
要建立一個(gè)合理有效的數(shù)據(jù)交易市場(chǎng),需要解決以下幾個(gè)問(wèn)題。第一個(gè)問(wèn)題是市場(chǎng)的參與者是誰(shuí)?數(shù)據(jù)的參與者可以分為3類(lèi),分別是數(shù)據(jù)擁有者、數(shù)據(jù)消費(fèi)者、交易中間人。數(shù)據(jù)擁有者通常為政府、私人企業(yè)(如微軟、雅虎、微博等)或者個(gè)人;數(shù)據(jù)消費(fèi)者即數(shù)據(jù)需求者,可能為數(shù)據(jù)處理算法開(kāi)發(fā)人員、數(shù)據(jù)分析師等;交易中間人即第三方交易平臺(tái),如現(xiàn)有的貴陽(yáng)大數(shù)據(jù)交易所、中關(guān)村數(shù)海大數(shù)據(jù)交易平臺(tái)等。按照交易中間人職能的不同,可以將其分為中間商和服務(wù)提供商,中間商負(fù)責(zé)連接數(shù)據(jù)擁有者和數(shù)據(jù)消費(fèi)者,此時(shí)交易的是原始數(shù)據(jù),如中關(guān)村數(shù)海大數(shù)據(jù)交易平臺(tái);而服務(wù)提供商一般會(huì)對(duì)數(shù)據(jù)擁有者的原始數(shù)據(jù)進(jìn)行處理,為數(shù)據(jù)消費(fèi)者提供處理之后的數(shù)據(jù),如貴陽(yáng)大數(shù)據(jù)交易所。第二個(gè)問(wèn)題是如何為確定交易的數(shù)據(jù)設(shè)定合理的價(jià)格?在設(shè)定相應(yīng)的數(shù)據(jù)定價(jià)模型時(shí),必須考慮相應(yīng)的市場(chǎng)結(jié)構(gòu)以及數(shù)據(jù)需求者和數(shù)據(jù)擁有者的需求,確保雙方的收益。第三個(gè)問(wèn)題則與數(shù)據(jù)交易市場(chǎng)相關(guān),即選擇何種數(shù)據(jù)交易市場(chǎng)才能確保市場(chǎng)參與者的需求得到滿足,實(shí)現(xiàn)公平、隱私保護(hù)等,如選用基于分布式的數(shù)據(jù)交易市場(chǎng)能夠解決隱私泄露的問(wèn)題。為了解決上述問(wèn)題,筆者對(duì)大數(shù)據(jù)交易市場(chǎng)進(jìn)行了全面的調(diào)查,以幫助希望了解該領(lǐng)域的新來(lái)者對(duì)這一復(fù)雜的學(xué)科和新興的研究領(lǐng)域有一個(gè)大致的了解。
在大數(shù)據(jù)時(shí)代,每天都有接近25 TB的數(shù)據(jù)產(chǎn)生[7]。中國(guó)信息通信研究院發(fā)布的《大數(shù)據(jù)白皮書(shū)(2020年)》預(yù)測(cè),2030年全球數(shù)據(jù)生產(chǎn)量將達(dá)到612 ZB,而2035年時(shí)將達(dá)到2 142 ZB,全球數(shù)據(jù)量將迎來(lái)爆發(fā)式的增長(zhǎng)。
在從龐大的數(shù)據(jù)集中提取數(shù)據(jù)的價(jià)值時(shí),經(jīng)常用數(shù)據(jù)挖掘和商業(yè)智能(business intelligence,BI)來(lái)描述大數(shù)據(jù)的處理過(guò)程,并且往往需要通過(guò)這些手段來(lái)發(fā)現(xiàn)數(shù)據(jù)的價(jià)值。數(shù)據(jù)的價(jià)值與數(shù)據(jù)的交易價(jià)格關(guān)系密切。
給數(shù)據(jù)一個(gè)確定的價(jià)格,將數(shù)據(jù)視為一種可以自由交易的商品,可以提高數(shù)據(jù)市場(chǎng)的流動(dòng)性,從而創(chuàng)造更大的價(jià)值。然而相比于傳統(tǒng)的實(shí)物商品,數(shù)據(jù)商品在生產(chǎn)、分配和消費(fèi)的流程中顯著降低了成本[8],分別表現(xiàn)在商品的搜索成本、生產(chǎn)成本、復(fù)制成本、運(yùn)輸成本和跟蹤與驗(yàn)證成本這5個(gè)方面。并且,數(shù)據(jù)的特性導(dǎo)致數(shù)據(jù)的復(fù)制成本接近0,即邊際成本接近0,這導(dǎo)致無(wú)法使用邊際成本等于邊際收益的方式使數(shù)據(jù)產(chǎn)品的收益最大化,這與傳統(tǒng)的實(shí)物產(chǎn)品不同[9-10]。同樣,數(shù)據(jù)產(chǎn)品的一個(gè)明顯特征為非競(jìng)爭(zhēng)性,即一個(gè)數(shù)據(jù)消費(fèi)者消費(fèi)一件數(shù)據(jù)商品并不會(huì)減少和降低其他數(shù)據(jù)消費(fèi)者可以得到的產(chǎn)品數(shù)量和質(zhì)量。但是數(shù)據(jù)同樣具有排他性,即數(shù)據(jù)消費(fèi)者需要支付一定的費(fèi)用來(lái)獲得數(shù)據(jù)的使用權(quán)。
Muschalle A等人[11]介紹了數(shù)據(jù)市場(chǎng)中可以參考的收費(fèi)策略,主要包括如下幾種。
● 通過(guò)控制版本來(lái)收費(fèi),如企查查等應(yīng)用,用戶可以免費(fèi)使用基礎(chǔ)版本查詢(xún)信息,但是如果需要更高級(jí)的信息,則需要購(gòu)買(mǎi)專(zhuān)業(yè)版。
● 基于使用時(shí)間的收費(fèi),像撥號(hào)上網(wǎng)那樣,根據(jù)使用時(shí)長(zhǎng)收取費(fèi)用,但是該方式的缺陷是對(duì)于一個(gè)無(wú)法明確自己需求的數(shù)據(jù)需求者或者不熟悉購(gòu)買(mǎi)方式的數(shù)據(jù)需求者而言,他需要花費(fèi)大量時(shí)間,導(dǎo)致花費(fèi)太高,從而可能抑制數(shù)據(jù)需求者的購(gòu)買(mǎi)欲望。
● 以固定費(fèi)用獲取一定量數(shù)據(jù)的永久使用權(quán)或應(yīng)用程序接口(application programming interface, API)的調(diào)用權(quán)。Kantere V等人[12]對(duì)該方法進(jìn)行了詳細(xì)的研究。
● 以統(tǒng)一的定價(jià)對(duì)產(chǎn)品進(jìn)行收費(fèi),如參考文獻(xiàn)[13]中的方式,但是該方式缺乏靈活性。
● 組合定價(jià),即固定的基礎(chǔ)費(fèi)用加額外的單位費(fèi)用。如各大電信運(yùn)營(yíng)商的收費(fèi)分為基礎(chǔ)的套餐費(fèi)用和在此基礎(chǔ)之上的額外單位費(fèi)用。
數(shù)據(jù)交易市場(chǎng)中常見(jiàn)的數(shù)據(jù)定價(jià)方式可以分為:基于博弈論和拍賣(mài)的數(shù)據(jù)定價(jià)[14-18]、基于查詢(xún)的數(shù)據(jù)定價(jià)[19-21]、基于模型的數(shù)據(jù)定價(jià)(model-based pricing,MBP)[22-23]。其中,基于博弈論和拍賣(mài)的數(shù)據(jù)定價(jià)更注重價(jià)格發(fā)現(xiàn)的過(guò)程,利用數(shù)據(jù)交易市場(chǎng)的不同特點(diǎn),使用不同的方式確定適當(dāng)?shù)臄?shù)據(jù)價(jià)格。
由前文可知,有多種多樣的方法來(lái)設(shè)計(jì)和實(shí)現(xiàn)數(shù)據(jù)產(chǎn)品的定價(jià)。針對(duì)如何衡量這些定價(jià)模型的優(yōu)劣以及一個(gè)優(yōu)秀的定價(jià)模型應(yīng)該滿足什么標(biāo)準(zhǔn),Pei J[24]將數(shù)據(jù)定價(jià)的標(biāo)準(zhǔn)分為6類(lèi),具體如下。
● 誠(chéng)實(shí):參與數(shù)據(jù)交易的各方均有動(dòng)力“說(shuō)真話”,報(bào)出自己真實(shí)的估價(jià)。
● 收益最大化:無(wú)論是數(shù)據(jù)擁有者還是數(shù)據(jù)消費(fèi)者,他們參與交易最直接的動(dòng)力是使自身的利益最大化。
● 公平:數(shù)據(jù)的賣(mài)家能夠根據(jù)自身的貢獻(xiàn)量獲得公平的收入份額。
● 無(wú)套利定價(jià):無(wú)法通過(guò)多個(gè)市場(chǎng)之間的價(jià)格差異來(lái)獲得收益。
● 隱私保護(hù):能夠保護(hù)參與交易的各方的信息。
● 計(jì)算效率:由于數(shù)據(jù)商品自身的特性,如數(shù)據(jù)的時(shí)效性或多賣(mài)家多買(mǎi)家之間的適當(dāng)匹配機(jī)制,需要高速有效的計(jì)算方法。
本文將沿用這6個(gè)標(biāo)準(zhǔn)來(lái)衡量下述研究的優(yōu)劣。
大多數(shù)模型追求的是實(shí)現(xiàn)上述6個(gè)標(biāo)準(zhǔn)中的部分標(biāo)準(zhǔn),而無(wú)法滿足全部要求。如Goldberg A V等人[25]的研究表明,在拍賣(mài)這一價(jià)格發(fā)現(xiàn)過(guò)程中,無(wú)法同時(shí)實(shí)現(xiàn)誠(chéng)實(shí)、競(jìng)爭(zhēng)性和無(wú)嫉妒性。因此,如何在諸多標(biāo)準(zhǔn)之間做出取舍也是當(dāng)前數(shù)據(jù)定價(jià)研究需要關(guān)注的主要內(nèi)容。此外,數(shù)據(jù)商品還具備其他特性,這些特性要求數(shù)據(jù)定價(jià)模型實(shí)現(xiàn)某些特殊的標(biāo)準(zhǔn),具體如下。
● 某些數(shù)據(jù)可能是對(duì)時(shí)間敏感的,同一數(shù)據(jù)在不同時(shí)間段的價(jià)值可能會(huì)完全不同,因此對(duì)于該類(lèi)數(shù)據(jù)的定價(jià)要求是實(shí)現(xiàn)較高的計(jì)算效率。
● 某些數(shù)據(jù)的價(jià)格可能與數(shù)據(jù)中包含的信息有相關(guān)性,而公布數(shù)據(jù)的價(jià)格可能會(huì)泄露數(shù)據(jù)的信息,因此對(duì)于該類(lèi)數(shù)據(jù)的定價(jià)要求是實(shí)現(xiàn)無(wú)套利定價(jià)。
● 數(shù)據(jù)的價(jià)值并不取決于數(shù)據(jù)量,而是取決于其提供的信息量,對(duì)于該類(lèi)數(shù)據(jù)的定價(jià)要求是實(shí)現(xiàn)誠(chéng)實(shí)、公平、收益最大化等。
博弈論和拍賣(mài)均是關(guān)于決策制定的研究,二者均需多方參與,如數(shù)據(jù)的擁有者、數(shù)據(jù)的消費(fèi)者以及中間人,并且每個(gè)參與者做出的決策都會(huì)影響其余參與者做出的決策,即參與者之間相互影響,最終做出在當(dāng)前情況下的最優(yōu)決策。本節(jié)研究的是如何使用博弈論和拍賣(mài)的方式為數(shù)據(jù)設(shè)置合理價(jià)格。
博弈論又被稱(chēng)為對(duì)策論或賽局理論等,屬于運(yùn)籌學(xué)的范疇,是一門(mén)有關(guān)“互動(dòng)行為”的科學(xué)[26-28]。博弈論是一種方法,目前已被應(yīng)用于多種學(xué)科,如經(jīng)濟(jì)學(xué)、計(jì)算機(jī)科學(xué)、國(guó)際關(guān)系、軍事戰(zhàn)略等。博弈是指由兩個(gè)或兩個(gè)以上的理性人或組織,參加一系列具有競(jìng)爭(zhēng)或?qū)剐再|(zhì)的行為。參與博弈的各方會(huì)受到一系列的環(huán)境約束(即規(guī)則),各自擁有不同的目標(biāo)或者利益,為了實(shí)現(xiàn)自己的目標(biāo)或?qū)⒗孀畲蠡?,參與者必須綜合考慮所有對(duì)手的全部可行動(dòng)方案,并在其基礎(chǔ)上做出最有益于自己的決策。
為了理解博弈的含義,下面給出一些博弈方面的術(shù)語(yǔ)。
● 效用函數(shù):效用函數(shù)是參與博弈的各方能夠從該次博弈中獲得的效用水平,反映了參與者對(duì)結(jié)果的期望。經(jīng)濟(jì)學(xué)中規(guī)定效用函數(shù)必須是可以量化的,它可以是連續(xù)函數(shù),也可以是離散函數(shù)。效用的取值可以為正值,也可以為負(fù)值。參與博弈的每一方都有自己的效用函數(shù),但是彼此并不一定了解對(duì)方的效用函數(shù)。
● 參與博弈的主體:博弈的參與者是一個(gè)能夠選擇合適的決策從而最大化自身效用的主體,該主體可以是個(gè)人,也可以是團(tuán)體,如國(guó)家、企業(yè)、組織等,以下簡(jiǎn)稱(chēng)參與人。
● 參與人可選擇的策略或者策略的組合:策略是指參與人選擇自身行動(dòng)的規(guī)則,該規(guī)則將決定參與人在什么情況下選擇什么行動(dòng),如“敵進(jìn)我退,敵駐我擾,敵疲我打,敵退我追”是一種策略,這里,“敵”與“我”是參與博弈的雙方,“進(jìn)”“退”“駐”“擾”“?!薄按颉薄巴恕薄白贰笔?種不同的行動(dòng),由戰(zhàn)略規(guī)定于何時(shí)采取何種策略[29]。
在基于博弈論數(shù)據(jù)定價(jià)的過(guò)程中有諸多參與者,根據(jù)當(dāng)前的研究,可將參與者分為3類(lèi):數(shù)據(jù)擁有者(賣(mài)家)、數(shù)據(jù)消費(fèi)者(買(mǎi)家)、中間人。通常情況下均假定參與博弈的各方均為“理性人”,即參與人的每一個(gè)經(jīng)濟(jì)活動(dòng)都是利己的,試圖以最小的經(jīng)濟(jì)成本獲得最大的收益。
根據(jù)不同的博弈類(lèi)型,可將現(xiàn)有常見(jiàn)的博弈論定價(jià)模型分為3類(lèi):基于非合作博弈(non-cooperative game)的定價(jià)模型、基于Stackelberg博弈的定價(jià)模型、基于討價(jià)還價(jià)博弈的定價(jià)模型。
3.1.1 基于非合作博弈的定價(jià)模型
非合作博弈是指一種參與人之間不可能組成聯(lián)盟或者達(dá)成一種具有約束力的協(xié)議的博奕類(lèi)型[30]。
式(1)表明鑒于納什均衡狀態(tài),賣(mài)家沒(méi)有動(dòng)機(jī)改變自身的決策,因?yàn)槟菢訒?huì)使自身的預(yù)期收益變低。式(1)表明納什均衡是指在給定別人策略的情況下,做出相應(yīng)最優(yōu)的選擇。但是應(yīng)當(dāng)注意并不是所有的博弈均存在納什均衡,而且有時(shí)一個(gè)博弈中會(huì)存在多個(gè)納什均衡。因此,使用非合作博弈對(duì)數(shù)據(jù)集進(jìn)行定價(jià)的充分必要條件是該博弈有且只有一個(gè)納什均衡。
由于參與博弈的各方均為“理性人”,參與者會(huì)將自己的戰(zhàn)略建立在假定對(duì)手會(huì)將其收益最大化的基礎(chǔ)上。因此,完全競(jìng)爭(zhēng)市場(chǎng)[31-33]中的均衡就是非合作博弈均衡。在這種市場(chǎng)中,每個(gè)參與者都會(huì)根據(jù)別人的價(jià)格策略來(lái)決定自己的價(jià)格策略。在完全競(jìng)爭(zhēng)市場(chǎng)中,數(shù)據(jù)擁有者為了使自身的收益最大化,希望在銷(xiāo)售自身數(shù)據(jù)時(shí)價(jià)格盡可能高。數(shù)據(jù)消費(fèi)者為了使自身的效用最大化,希望在得到數(shù)據(jù)時(shí)盡可能地壓低價(jià)格。在傳統(tǒng)的商品市場(chǎng)中,使用邊際成本等于邊際收益的方式使數(shù)據(jù)產(chǎn)品的收益最大化,但是數(shù)據(jù)商品的特性(即邊際成本接近0)導(dǎo)致無(wú)法使用上述方法實(shí)現(xiàn)利潤(rùn)最大化。故Li Z N等人[34]提出了一種定價(jià)方法,該方法將所有需求者和供應(yīng)商都考慮在內(nèi),在不降低價(jià)格的情況下得出適當(dāng)?shù)膬r(jià)格。但是,由于將動(dòng)態(tài)創(chuàng)建大量物聯(lián)網(wǎng)數(shù)據(jù)交易,這通常會(huì)成為集中式定價(jià)系統(tǒng)的性能瓶頸,因此該方法對(duì)于物聯(lián)網(wǎng)數(shù)據(jù)交易是不切實(shí)際的。
3.1.2 基于Stackelberg博弈的定價(jià)模型
非合作博弈的納什均衡成立的前提是參與博弈的賣(mài)家彼此知道對(duì)方的策略,并且同時(shí)宣布自己的策略。然而,在現(xiàn)實(shí)生活中,這個(gè)前提成立的情況較少,參與者無(wú)法計(jì)算其納什均衡,因此他們無(wú)法為數(shù)據(jù)設(shè)定合理的價(jià)格。在現(xiàn)實(shí)中更常見(jiàn)的情形是:一個(gè)賣(mài)家(追隨者)等待其他賣(mài)家(領(lǐng)導(dǎo)者)先宣布自己的定價(jià)策略,然后追隨者在領(lǐng)導(dǎo)者做出定價(jià)策略的情況下,做出對(duì)應(yīng)策略的優(yōu)化,從而確定相對(duì)最優(yōu)的定價(jià)策略,這種博弈模式被稱(chēng)為Stackelberg博弈[35]。
在Stackelberg博弈中,賣(mài)家1(領(lǐng)導(dǎo)者)首先確定自己的定價(jià)策略v1,賣(mài)家2(追隨者)在觀測(cè)到v1后,確定自己的定價(jià)策略v2。因?yàn)橘u(mài)家2是在觀察到v1之后確定自己的定價(jià)策略的,所以該博弈是完美信息動(dòng)態(tài)博弈。賣(mài)家1率先行動(dòng),無(wú)法觀察到v2,因此,賣(mài)家2的定價(jià)策略應(yīng)該是一個(gè)由V1決定的V2,是一個(gè)映射函數(shù)T,即V1→V2。Haddadi S等人[36]證明,相較于使用其他模型,使用Stackelberg博弈模型,領(lǐng)導(dǎo)者可以獲得更大的收益。Lyu X Y等人[15]指出,在數(shù)字市場(chǎng)中參與Stackelberg博弈的各方均可實(shí)現(xiàn)利益最大化,尤其是對(duì)于領(lǐng)導(dǎo)者而言,可將其效用最大化。
Mei L J 等人[16]討論了針對(duì)純捆綁定價(jià)和分開(kāi)定價(jià)兩種情況,在數(shù)據(jù)擁有者和中間商之間搭建Stackelberg博弈模型(其中數(shù)據(jù)擁有者為領(lǐng)導(dǎo)者,中間商為追隨者)、實(shí)現(xiàn)雙方利益最大化的條件下,數(shù)據(jù)擁有者應(yīng)該采取何種定價(jià)方式才能使得自身利益最大化。參考文獻(xiàn)[16]雖然涉及數(shù)據(jù)定價(jià)的問(wèn)題,卻忽略了數(shù)據(jù)交易市場(chǎng)信息不完全以及市場(chǎng)競(jìng)爭(zhēng)的客觀條件。
Liu K等人[37]搭建了一個(gè)兩階段的Stackelberg博弈模型來(lái)解決數(shù)據(jù)需求者的定價(jià)和購(gòu)買(mǎi)問(wèn)題。在最簡(jiǎn)單的情況下,市場(chǎng)包含多個(gè)數(shù)據(jù)擁有者i= { 1 , 2,…,N}、一個(gè)數(shù)據(jù)需求者、一個(gè)中間商。Liu K等人[37]假設(shè):中間商可以獲得數(shù)據(jù)擁有者的名單以及數(shù)據(jù)需求者和數(shù)據(jù)擁有者的交易相關(guān)信息。第一階段,每一個(gè)數(shù)據(jù)擁有者對(duì)自己擁有的數(shù)據(jù)設(shè)定合理的價(jià)格,中間商作為領(lǐng)導(dǎo)者,將定價(jià)策略的集合展示給數(shù)據(jù)需求者;第二階段,數(shù)據(jù)需求者作為追隨者,根據(jù)給出的定價(jià)策略空間,決定自己的購(gòu)買(mǎi)策略;最后,中間商根據(jù)數(shù)據(jù)擁有者的服務(wù)質(zhì)量以及數(shù)據(jù)需求者的購(gòu)買(mǎi)意愿來(lái)決定由數(shù)據(jù)擁有者中的贏家與數(shù)據(jù)需求者發(fā)生交易,(pi,xi)表示以單價(jià)p從數(shù)據(jù)擁有者i處購(gòu)買(mǎi)了數(shù)量為x的數(shù)據(jù)。
Xu C Z等人[38]在數(shù)據(jù)擁有者、服務(wù)提供商和數(shù)據(jù)需求者之間構(gòu)建了一個(gè)3層的Stackelberg博弈模型。在該模型中,第一層的Stackelberg博弈發(fā)生在數(shù)據(jù)擁有者和服務(wù)提供商之間,數(shù)據(jù)擁有者決定原始數(shù)據(jù)的價(jià)格,服務(wù)提供商根據(jù)定價(jià)策略做出相應(yīng)的購(gòu)買(mǎi)策略。在第二層,服務(wù)提供商在購(gòu)買(mǎi)原始數(shù)據(jù)之后需要對(duì)數(shù)據(jù)進(jìn)行加工,并且提供N種不同精度版本的數(shù)據(jù)供數(shù)據(jù)需求者選擇,并為其設(shè)置合理的價(jià)格。在第三層,數(shù)據(jù)需求者選擇要購(gòu)買(mǎi)的數(shù)據(jù)版本,并決定購(gòu)買(mǎi)的數(shù)量。
使用Stackelberg博弈進(jìn)行數(shù)據(jù)定價(jià)[16,37-41]的缺陷在于:在這種模型中,每個(gè)數(shù)據(jù)擁有者需在主供應(yīng)商宣布價(jià)格后宣布自己的價(jià)格,但在數(shù)據(jù)交易環(huán)境中,確定主要數(shù)據(jù)擁有者的方式困難且效率低下,使得該模型在數(shù)據(jù)交易市場(chǎng)中的實(shí)施難度較大。
3.1.3 基于討價(jià)還價(jià)博弈的定價(jià)模型
討價(jià)還價(jià)博弈指的是由兩名或者更多的參與人就如何分配一個(gè)物品達(dá)成協(xié)議,為了達(dá)成這種協(xié)議所有參與人需要進(jìn)行談判。假設(shè)在一個(gè)簡(jiǎn)單的數(shù)據(jù)交易市場(chǎng)中,只有當(dāng)數(shù)據(jù)擁有者和數(shù)據(jù)需求者對(duì)某種數(shù)據(jù)商品的銷(xiāo)售價(jià)格達(dá)成一致時(shí),交易才會(huì)發(fā)生。
Jung K等人[17]使用差分隱私(differential privacy,DP)的方式給原始數(shù)據(jù)或查詢(xún)出來(lái)的結(jié)果增加噪聲,這是因?yàn)镈P提供了一個(gè)令人信服的方式來(lái)衡量隱私(如隱私的損失ε)。近年來(lái)有很多面向數(shù)據(jù)擁有者的基于隱私損失方面的定價(jià)策略[42-48]。Jung K等人[17]提出了一種公平協(xié)商的方式,采用Rubinstein討價(jià)還價(jià)模型來(lái)確定數(shù)據(jù)的價(jià)格以及隱私損失的價(jià)值,保證了公平交易。
討價(jià)還價(jià)博弈適用于復(fù)雜談判條件下的談判,且其最后的解是合作博弈最終的解決方案,因此其常被用于諸多領(lǐng)域的資源分配,如無(wú)線體域網(wǎng)(wireless body area network,WBAN)[46]、無(wú)線傳感器網(wǎng)絡(luò)(wireless sensor network,WSN)[47]、頻譜分配[48]。但是在討價(jià)還價(jià)博弈中,需要供需雙方通過(guò)談判達(dá)成協(xié)議,而談判過(guò)程通常是耗時(shí)和浪費(fèi)資源的,故將該模型應(yīng)用于數(shù)據(jù)交易市場(chǎng)存在一定困難。
拍賣(mài)是流行的數(shù)據(jù)交易機(jī)制之一。一般來(lái)說(shuō),拍賣(mài)是一種經(jīng)濟(jì)驅(qū)動(dòng)的方案,其目的是通過(guò)買(mǎi)賣(mài)雙方的競(jìng)價(jià)過(guò)程分配商品,并建立相應(yīng)的價(jià)格[49]。當(dāng)前對(duì)拍賣(mài)理論的研究[50-51]以及拍賣(mài)理論在諸多領(lǐng)域的應(yīng)用[52-55]已經(jīng)有了很好的探索。在信息不對(duì)稱(chēng)的經(jīng)濟(jì)環(huán)境中,拍賣(mài)是一種形式簡(jiǎn)單卻又具備完整定義,能夠確保公平和效率,以及賣(mài)方的收益最大化的方案,因此在解決大數(shù)據(jù)交易問(wèn)題方面拍賣(mài)機(jī)制顯示出巨大的潛力。在對(duì)大數(shù)據(jù)交易市場(chǎng)中拍賣(mài)理論的相關(guān)工作做出總結(jié)之前,首先介紹拍賣(mài)機(jī)制的基本概念。
● 投標(biāo)方:投標(biāo)人,指在市場(chǎng)上投標(biāo)并以購(gòu)買(mǎi)商品為目的的人,即買(mǎi)方。在大數(shù)據(jù)市場(chǎng)中,一般由數(shù)據(jù)需求者充當(dāng)買(mǎi)方。
● 拍賣(mài)商:拍賣(mài)商扮演的是代理角色,與上述中間商的作用相似,負(fù)責(zé)運(yùn)行拍賣(mài)流程,確定獲勝者,并進(jìn)行支付和分配。
● 賣(mài)方:指希望通過(guò)售賣(mài)數(shù)據(jù)增加自身收益的個(gè)人或團(tuán)體,如數(shù)據(jù)擁有者。
● 投標(biāo)人的估價(jià):在拍賣(mài)過(guò)程中,投標(biāo)方和賣(mài)方都對(duì)他們需要或出售的每一單位商品進(jìn)行估價(jià)。此外,估價(jià)可以高于或低于最終清算價(jià)格,這是由拍賣(mài)商在拍賣(mài)過(guò)程中決定的。
● 結(jié)算價(jià)格:拍賣(mài)中最終成交的價(jià)格(買(mǎi)賣(mài)雙方同意達(dá)成交易的價(jià)格),即落錘價(jià)。拍賣(mài)價(jià)格有兩種類(lèi)型,即要價(jià)和競(jìng)價(jià)。賣(mài)方提出一個(gè)要價(jià)(即出售該商品的價(jià)格),而投標(biāo)方可以提出一個(gè)投標(biāo)價(jià)格(表示他們?yōu)楂@得該商品所愿意提交的價(jià)格)。結(jié)算價(jià)格則是由拍賣(mài)商根據(jù)社會(huì)福利最大化等優(yōu)化目標(biāo)來(lái)確定的最終交易價(jià)格。
根據(jù)參與拍賣(mài)的投標(biāo)方和賣(mài)方人數(shù)的不同,可以將目前基于拍賣(mài)定價(jià)方式的數(shù)據(jù)市場(chǎng)的研究分為單邊拍賣(mài)(單個(gè)賣(mài)方、多個(gè)投標(biāo)方)和雙邊拍賣(mài)(多個(gè)賣(mài)方、多個(gè)投標(biāo)方)?;谂馁u(mài)的大數(shù)據(jù)交易市場(chǎng)的典型框架如圖1所示[56]。
圖1 基于拍賣(mài)的大數(shù)據(jù)交易市場(chǎng)的典型框架[56]
3.2.1 單邊拍賣(mài)
在單邊拍賣(mài)中,賣(mài)方提交競(jìng)價(jià)到拍賣(mài)商,拍賣(mài)商根據(jù)不同的拍賣(mài)機(jī)制,確定最后的勝利者。其市場(chǎng)結(jié)構(gòu)如圖2所示,通常數(shù)據(jù)擁有者是“資源優(yōu)勢(shì)方”,而最終的價(jià)格是由其和數(shù)據(jù)需求者即投標(biāo)方共同決定的,投標(biāo)方被稱(chēng)為“信息優(yōu)勢(shì)方”。
圖2 單邊拍賣(mài)的市場(chǎng)結(jié)構(gòu)
(1)第k價(jià)格密封拍賣(mài)
第一價(jià)格密封拍賣(mài)和第二價(jià)格密封拍賣(mài)是重要的兩種第k價(jià)格密封拍賣(mài)的方式。在第一價(jià)格密封拍賣(mài)中,投標(biāo)方以密封的形式獨(dú)立出價(jià),獲勝的投標(biāo)方是出價(jià)最高的人,需要支付最高的價(jià)格來(lái)獲得商品,最終的成交價(jià)為其中P是投標(biāo)方的競(jìng)價(jià)集。第二價(jià)格密封拍賣(mài)又被稱(chēng)為Vickrey拍賣(mài),投標(biāo)方同樣以密封的形式獨(dú)立 出價(jià),獲勝的投標(biāo)方是出價(jià)最高的人,獲勝者需要支付第二高的價(jià)格來(lái)贏得拍賣(mài),即其中pi是獲勝者所出的最高價(jià)格。
雖然第一價(jià)格密封拍賣(mài)機(jī)制在現(xiàn)實(shí)中的應(yīng)用很多,但是它也有許多缺點(diǎn)。首先,投標(biāo)方很難計(jì)算出應(yīng)如何報(bào)價(jià);其次,賣(mài)方或者拍賣(mài)的設(shè)計(jì)方很難預(yù)測(cè)拍賣(mài)中會(huì)發(fā)生什么,難以保證投標(biāo)方之間不結(jié)成聯(lián)盟,信息不對(duì)等的情況會(huì)阻礙公平的實(shí)現(xiàn);最后,拍賣(mài)的獲勝者可能會(huì)出現(xiàn)“贏者詛咒”的現(xiàn)象。
在第二價(jià)格密封拍賣(mài)中,每個(gè)投標(biāo)方的占優(yōu)策略是使出價(jià)等于自己對(duì)這件商品的完全估價(jià),也就是說(shuō),對(duì)于投標(biāo)方而言,此時(shí)誠(chéng)實(shí)才是最好的競(jìng)拍策略。因此投標(biāo)方報(bào)出的價(jià)格是真實(shí)且可信的,并且保證了最終的拍賣(mài)品歸屬于出價(jià)最高者,因此該密封拍賣(mài)是具有帕累托效率的。理論上講,第二價(jià)格密封拍賣(mài)是理想化的,滿足以下條件。
● 強(qiáng)動(dòng)機(jī)保證:第二價(jià)格密封拍賣(mài)是占優(yōu)策略激勵(lì)相容的。
● 高性能保證:第二價(jià)格密封拍賣(mài)機(jī)制能夠使社會(huì)福利最大化。
● 計(jì)算高效:第二價(jià)格密封拍賣(mài)可以在輸入量的多項(xiàng)式時(shí)間內(nèi)實(shí)施。
但是,在市場(chǎng)中實(shí)現(xiàn)第二價(jià)格密封拍賣(mài)是困難的,如投標(biāo)方之間形成聯(lián)盟、拍賣(mài)商和投標(biāo)方之間串通、拍賣(mài)商的品德敗壞等問(wèn)題都會(huì)影響這種拍賣(mài)方式的有效性。
(2)VCG拍賣(mài)
VCG(Vickrey-Clarke-Groves)拍賣(mài)是Vickrey拍賣(mài)的廣義形式,是將單物品拍賣(mài)形式的Vickrey拍賣(mài)一般化為多物品拍賣(mài)的形式[57]。假設(shè)市場(chǎng)中有M個(gè)商品需要出售,表示為ti表示第i件商品,以及市場(chǎng)中有N個(gè)投標(biāo)方,表示為bi表示第i個(gè)投標(biāo)方。VCG拍賣(mài)背后的原理為獲勝者需補(bǔ)償其獲得物品所造成的其他N-1個(gè)投標(biāo)方的社會(huì)價(jià)值損失。例如,在Vickrey拍賣(mài)中,獲勝者對(duì)其他投標(biāo)方造成的社會(huì)價(jià)值的損失等于出價(jià)第二高的競(jìng)價(jià)(假定投標(biāo)方都是真實(shí)出價(jià)),而這恰好是Vickrey拍賣(mài)的支付規(guī)則。因此,在VCG拍賣(mài)中,根據(jù)VCG拍賣(mài)規(guī)則,如果vi(tj)是最高的,則投標(biāo)方bi獲得商品tj,投標(biāo)方ib需要支付的價(jià)格為:
其中,vi(tj)表示投標(biāo)方bi對(duì)商品tj的出價(jià),表示由M件商品創(chuàng)造的社會(huì)價(jià)值。VCG拍賣(mài)的結(jié)果是貝葉斯納什均衡的[58]。
盡管理論上VCG拍賣(mài)能夠使投標(biāo)方“說(shuō)真話”,且能夠?qū)崿F(xiàn)社會(huì)福利最大化,但是VCG拍賣(mài)機(jī)制在實(shí)際的運(yùn)用中存在一些障礙,如偏好獲取困難,計(jì)算福利最大化結(jié)果或者近似福利最大化結(jié)果十分困難,以及VCG拍賣(mài)機(jī)制的收益和激勵(lì)可能表現(xiàn)不好。
(3)組合拍賣(mài)
在大數(shù)據(jù)市場(chǎng)中,數(shù)據(jù)需求者對(duì)數(shù)據(jù)的需求是多樣化的,單一的數(shù)據(jù)可能無(wú)法滿足其需求,且一般需要大量的數(shù)據(jù)才能達(dá)到其要求。在這種市場(chǎng)需求下,組合拍賣(mài)的方式被提出。在這種方式下,賣(mài)家提供靈活的可捆綁銷(xiāo)售的多種物品的商品組合[59],投標(biāo)方提出自己的需求及報(bào)價(jià),而拍賣(mài)商根據(jù)競(jìng)價(jià)中包含的約束條件和賣(mài)方的物品分配能力,找到最優(yōu)的分配,從而確定拍賣(mài)中最終勝利的賣(mài)家。與上述密封競(jìng)價(jià)等標(biāo)準(zhǔn)的拍賣(mài)方式相比,組合拍賣(mài)的優(yōu)勢(shì)是經(jīng)濟(jì)效率高、買(mǎi)家收益最大化、賣(mài)家收益最大化等。然而,在組合拍賣(mài)中,計(jì)算拍賣(mài)最終的獲勝者是一個(gè)NP問(wèn)題,這意味著在現(xiàn)實(shí)世界中很難找到最優(yōu)的分配。
上述各種拍賣(mài)方式在實(shí)際應(yīng)用中均有優(yōu)缺點(diǎn),而第一價(jià)格密封拍賣(mài)和第二價(jià)格密封拍賣(mài)由于具有簡(jiǎn)單和隱私保護(hù)等特點(diǎn),相較于其他的拍賣(mài)方式,在實(shí)際中應(yīng)用得更加廣泛[60]。參與拍賣(mài)的各方會(huì)根據(jù)需求的不同采取不同的拍賣(mài)方式。
首先,為了盡可能地保護(hù)隱私,以及促使數(shù)據(jù)擁有者將數(shù)據(jù)分享出來(lái),需要一定的獎(jiǎng)勵(lì)機(jī)制。而差分隱私提供了衡量隱私的方式,如隱私的損失可以被量化,因此隱私被視為一種可替代的商品,其價(jià)格可以通過(guò)拍賣(mài)的方式確定[61-63]。
其次,在數(shù)據(jù)交易市場(chǎng)中,“聰明的”投標(biāo)方可能會(huì)操縱拍賣(mài)的過(guò)程,從而導(dǎo)致不真實(shí)的競(jìng)價(jià)。特別地,投標(biāo)方可以通過(guò)創(chuàng)建多個(gè)身份來(lái)影響拍賣(mài)的結(jié)果,這被稱(chēng)為假名投標(biāo)(false-name bids)[64]。為了解決這個(gè)問(wèn)題,An D等人[56]提出了一種多輪假名驗(yàn)證拍賣(mài)(multi-round false-name proof auction,MFPA)的方式,從而構(gòu)建了一個(gè)真實(shí)的數(shù)據(jù)交易市場(chǎng)。
在初始的基于拍賣(mài)的數(shù)據(jù)定價(jià)方面的研究中[54,65-66],大多數(shù)拍賣(mài)中由數(shù)據(jù)擁有者充當(dāng)拍賣(mài)商的角色,在賣(mài)家自身運(yùn)營(yíng)的平臺(tái)上進(jìn)行銷(xiāo)售,在拍賣(mài)過(guò)程中,來(lái)自投標(biāo)方的信息向賣(mài)家開(kāi)放。另外,隨著數(shù)據(jù)擁有者的增加,由每個(gè)數(shù)據(jù)擁有者自行維護(hù)拍賣(mài)平臺(tái)的方式效率低下、不方便。因此,在網(wǎng)絡(luò)環(huán)境中建立第三方數(shù)據(jù)交易平臺(tái)是一種更加現(xiàn)實(shí)的方法。Gao W C等人[67]提出由客觀的第三方中間商平臺(tái)充當(dāng)拍賣(mài)商,這樣不僅保證了客觀性,也防止拍賣(mài)商和數(shù)據(jù)擁有者或數(shù)據(jù)需求者之間達(dá)成某種協(xié)議。此外,Gao W C等人[67]解決了信息物理系統(tǒng)(cyber-physical system,CPS)中的隱私保護(hù)問(wèn)題。他們提出了一種通用的隱私保護(hù)拍賣(mài)方案(privacy-preserving auction scheme,PPAS),其中拍賣(mài)商和中間平臺(tái)兩個(gè)獨(dú)立實(shí)體組成了一個(gè)不可信的第三方交易平臺(tái)。通過(guò)實(shí)現(xiàn)同態(tài)加密和一次性填充,可以確定拍賣(mài)過(guò)程中的贏家,并對(duì)所有競(jìng)價(jià)信息進(jìn)行偽裝,并且他們?cè)O(shè)計(jì)的系統(tǒng)不基于某種特定的拍賣(mài)方式,故適用于各種拍賣(mài)規(guī)則。
3.2.2 雙邊拍賣(mài)
雙邊拍賣(mài)是現(xiàn)實(shí)世界中常用的拍賣(mài)方式之一,它被廣泛應(yīng)用于證券交易所[68]、智能電網(wǎng)[54,69]等場(chǎng)景。在雙邊拍賣(mài)中,多個(gè)數(shù)據(jù)擁有者和數(shù)據(jù)需求者同時(shí)向拍賣(mài)商提交自己的要價(jià)和出價(jià),其市場(chǎng)結(jié)構(gòu)如圖3所示。
圖3 雙邊拍賣(mài)的市場(chǎng)結(jié)構(gòu)
當(dāng)且僅當(dāng)數(shù)據(jù)擁有者的要價(jià)po小于等于數(shù)據(jù)需求者的出價(jià)pc時(shí),拍賣(mài)商決定最后的結(jié)算價(jià)格p。拍賣(mài)的過(guò)程通常如下,每一個(gè)賣(mài)家(即數(shù)據(jù)擁有者)對(duì)于自己所要銷(xiāo)售的物品都有一個(gè)邊際成本MC,賣(mài)家的收益是產(chǎn)品的價(jià)格P與邊際成本的差值(P-MC),賣(mài)家的目標(biāo)是獲得盡可能多的收益,即價(jià)格盡可能高,但是同時(shí)又需要與市場(chǎng)中的其他賣(mài)家競(jìng)爭(zhēng),若競(jìng)爭(zhēng)失敗,則賣(mài)家的收入為0。每一個(gè)買(mǎi)家(即數(shù)據(jù)需求者)對(duì)于產(chǎn)品都有一個(gè)邊際收益MR,買(mǎi)家的收益是邊際收益與產(chǎn)品價(jià)格的差值(MR-P),買(mǎi)家的目標(biāo)是獲得盡可能多的收益,即價(jià)格盡可能低,但是又需要與市場(chǎng)中的其他買(mǎi)家競(jìng)爭(zhēng),若競(jìng)爭(zhēng)失敗,則買(mǎi)家的收益為0。對(duì)于賣(mài)家而言,每一輪的要價(jià)都必須低于上一輪;而對(duì)于買(mǎi)家而言,每一輪的出價(jià)都必須高于上一輪。市場(chǎng)中買(mǎi)家和賣(mài)家的數(shù)量足夠多時(shí),產(chǎn)品價(jià)格的形成如圖4所示。
圖4 雙邊拍賣(mài)市場(chǎng)價(jià)格的形成
Jiao Y T等人[70]首先根據(jù)數(shù)據(jù)量大小對(duì)大數(shù)據(jù)分析性能的影響定義了數(shù)據(jù)成本和效用,然后提出真實(shí)、合理、計(jì)算效率高的貝葉斯 利潤(rùn)最大化拍賣(mài)模型。通過(guò)求解利潤(rùn)最大化拍賣(mài)模型,得到最優(yōu)服務(wù)價(jià)格和數(shù)據(jù)量,從而解決服務(wù)商的利潤(rùn)最大化問(wèn)題。參考文獻(xiàn)[70]是一篇引入服務(wù)提供商角色的文獻(xiàn)。服務(wù)提供商(即中間商)負(fù)責(zé)收集數(shù)據(jù)擁有者的數(shù)據(jù),并對(duì)數(shù)據(jù)擁有者進(jìn)行隱私補(bǔ)償,同時(shí)利用自身的專(zhuān)業(yè)性對(duì)收集的大量數(shù)據(jù)進(jìn)行處理,滿足數(shù)據(jù)消費(fèi)者的需求,其為買(mǎi)家提供的是服務(wù)而不是原始數(shù)據(jù)。但是該參考文獻(xiàn)假定市場(chǎng)中的服務(wù)提供商是壟斷者,這在現(xiàn)實(shí)場(chǎng)景中較難實(shí)現(xiàn),不滿足客觀需求。而Cao X Y等人[71]著眼于數(shù)據(jù)交易與市場(chǎng)交易效率的協(xié)調(diào),提出了一種迭代拍賣(mài)機(jī)制來(lái)協(xié)調(diào)交易,并以社會(huì)福利最大化為目標(biāo)。在參考文獻(xiàn)[71]中,數(shù)據(jù)擁有者與數(shù)據(jù)消費(fèi)者直接發(fā)生交易,交易的是原始數(shù)據(jù)。然而上述激勵(lì)機(jī)制忽視了數(shù)據(jù)消費(fèi)者之間既有偏好又有復(fù)雜的利益沖突關(guān)系這一事實(shí)。Cai H等人[72]提出了DTPCI這種雙邊拍賣(mài)機(jī)制來(lái)應(yīng)對(duì)市場(chǎng)偏好的多樣性、數(shù)據(jù)消費(fèi)者之間復(fù)雜的利益沖突關(guān)系以及交易雙方的戰(zhàn)略選擇這三大挑戰(zhàn)。上述研究大多基于集中式的數(shù)據(jù)交易市場(chǎng),存在集中式數(shù)據(jù)交易市場(chǎng)常有的問(wèn)題,如數(shù)據(jù)擁有者的隱私泄露、數(shù)據(jù)丟失等問(wèn)題。而Li Z N等人[34]則聚焦于基于分布式的數(shù)據(jù)交易市場(chǎng),并且提出了具有稀疏信息的經(jīng)紀(jì)人來(lái)管理和調(diào)整交易市場(chǎng),采用了一種迭代雙邊拍賣(mài)的方案。該方案由經(jīng)紀(jì)人解決計(jì)算資源交易的分配問(wèn)題,并設(shè)計(jì)了一個(gè)特定的價(jià)格規(guī)則來(lái)誘導(dǎo)計(jì)算資源的買(mǎi)家和賣(mài)家以真實(shí)的方式投標(biāo),從而實(shí)現(xiàn)了社會(huì)福利最大化,并且實(shí)現(xiàn)了安全的數(shù)據(jù)交易。
關(guān)于拍賣(mài)市場(chǎng)研究的進(jìn)一步分析見(jiàn)表1。
表1 不同拍賣(mài)機(jī)制在數(shù)據(jù)定價(jià)中的應(yīng)用
數(shù)據(jù)定價(jià)和數(shù)據(jù)交易是一個(gè)相輔相成的過(guò)程。因?yàn)閿?shù)據(jù)具有商業(yè)價(jià)值,所以大數(shù)據(jù)市場(chǎng)以及數(shù)據(jù)交易市場(chǎng)成為實(shí)現(xiàn)數(shù)據(jù)共享的最有效的市場(chǎng)。第3節(jié)總結(jié)了一些常見(jiàn)的基于博弈論和拍賣(mài)的數(shù)據(jù)定價(jià)模型,本節(jié)將系統(tǒng)地研究數(shù)據(jù)交易平臺(tái),并基于現(xiàn)有的研究將數(shù)據(jù)交易市場(chǎng)劃分為集中式數(shù)據(jù)交易市場(chǎng)和分布式數(shù)據(jù)交易市場(chǎng)。
縱觀關(guān)于數(shù)據(jù)交易的研究,根據(jù)是否有第三方參與,可以將數(shù)據(jù)交易劃分為有中間商的數(shù)據(jù)交易市場(chǎng)[16,21,43,75]和無(wú)中間商的數(shù)據(jù)交易市場(chǎng)[10,54,65-66,76],根據(jù)為買(mǎi)家提供的服務(wù)可以劃分為買(mǎi)家提供原始數(shù)據(jù)的數(shù)據(jù)交易[10,16,21,71]和為買(mǎi)家提供處理后的數(shù)據(jù)(如對(duì)數(shù)據(jù)加入噪聲從而保護(hù)數(shù)據(jù)所有者的隱私,或經(jīng)預(yù)處理直接獲得滿足客戶需求的數(shù)據(jù))的數(shù)據(jù)交易[43,75]。關(guān)于集中式數(shù)據(jù)交易市場(chǎng)的進(jìn)一步分析見(jiàn)表2。
表2 集中式市場(chǎng)中各種定價(jià)模型的應(yīng)用
在沒(méi)有中間商作為中介的框架中,數(shù)據(jù)擁有者和數(shù)據(jù)需求者直接進(jìn)行數(shù)據(jù)交易,這種交易方式可以避免為第三方支付交易費(fèi)用,可以讓交易雙方更了解雙方的需求,從而降低交易價(jià)格。然而在沒(méi)有第三方平臺(tái)的交易市場(chǎng)中,數(shù)據(jù)擁有者需要自己搭建數(shù)據(jù)交易市場(chǎng),并且由于市場(chǎng)中存在多個(gè)數(shù)據(jù)擁有者,賣(mài)方之間的數(shù)據(jù)可能會(huì)形成“孤島”;而且,對(duì)于買(mǎi)家而言,由于信息不對(duì)稱(chēng),從多個(gè)數(shù)據(jù)擁有者的交易平臺(tái)中分別購(gòu)買(mǎi)數(shù)據(jù)會(huì)消耗大量的精力和金錢(qián),且存在購(gòu)買(mǎi)數(shù)據(jù)與需求不匹配的可能,從而降低買(mǎi)家購(gòu)買(mǎi)的欲望。為了解決上述難題,現(xiàn)有的關(guān)于數(shù)據(jù)交易市場(chǎng)的框架大多存在一個(gè)或多個(gè)中間商充當(dāng)?shù)谌狡脚_(tái)。但是該框架在解決上述難題的同時(shí)也帶來(lái)了新的問(wèn)題,如第三方平臺(tái)的信任危機(jī)以及數(shù)據(jù)產(chǎn)品接近0的復(fù)制成本,進(jìn)而導(dǎo)致數(shù)據(jù)丟失、數(shù)據(jù)被非法篡改、用戶隱私泄露等潛在的問(wèn)題。
傳統(tǒng)的數(shù)據(jù)交易是在一個(gè)集中式的市場(chǎng)中進(jìn)行的,這就需要可靠的權(quán)威機(jī)構(gòu)負(fù)責(zé)數(shù)據(jù)交換。在這項(xiàng)工作中,為了解決潛在的問(wèn)題,將區(qū)塊鏈技術(shù)[77]應(yīng)用于數(shù)據(jù)交易市場(chǎng),從而構(gòu)建去中心化的數(shù)據(jù)交易市場(chǎng)。去中心化的數(shù)據(jù)交易市場(chǎng)可以擺脫單點(diǎn)性能瓶頸和單點(diǎn)故障問(wèn)題,并且允許參與數(shù)據(jù)交易的多方之間建立去中心化的信任和依賴(lài),其吸引了越來(lái)越多的關(guān)注。區(qū)塊鏈?zhǔn)且环N去中心化的分布式數(shù)據(jù)存儲(chǔ)技術(shù),其特點(diǎn)是防篡改、可跟蹤性和公共可訪問(wèn)性,其中共識(shí)機(jī)制確保了同步。為此,目前的研究設(shè)計(jì)了一個(gè)聯(lián)合體區(qū)塊鏈網(wǎng)絡(luò),以創(chuàng)建P2P(peer-to-peer)交易市場(chǎng),提高數(shù)據(jù)所有者節(jié)點(diǎn)、服務(wù)提供商節(jié)點(diǎn)、數(shù)據(jù)消費(fèi)者節(jié)點(diǎn)和礦工之間數(shù)據(jù)交易的安全性。在數(shù)據(jù)市場(chǎng)中,區(qū)塊鏈的引入可以解決集中式數(shù)據(jù)市場(chǎng)的弊端,為實(shí)現(xiàn)數(shù)據(jù)交易的去中心化提供了另一種可能。
數(shù)據(jù)交易屬于在線的商業(yè)交易,參與者之間存在固有的不信任問(wèn)題,這是因?yàn)闆](méi)有任何先驗(yàn)的交易在前。而這種初始的不信任可能會(huì)導(dǎo)致數(shù)據(jù)交易陷入僵局,參與者沒(méi)有動(dòng)力進(jìn)行交易。因此Delgado-Segura S等人[78]提出了一個(gè)公平的比特幣數(shù)據(jù)交易的基礎(chǔ)協(xié)議,建立了一個(gè)公平的數(shù)據(jù)交易市場(chǎng)。因?yàn)樵搮f(xié)議是原子性的,所以該交易過(guò)程可以隨時(shí)完成或終止,以確保數(shù)據(jù)提供商和數(shù)據(jù)消費(fèi)者都沒(méi)有遭受損失。但是該數(shù)據(jù)交易市場(chǎng)的缺點(diǎn)是不能辨別虛假信息,且一次只能考慮一個(gè)交易流程。
Liu K等人[37]利用區(qū)塊鏈技術(shù)建立物聯(lián)網(wǎng)數(shù)據(jù)市場(chǎng)體系,提出了一個(gè)邊緣/云計(jì)算輔助的、區(qū)塊鏈增強(qiáng)的框架,以應(yīng)對(duì)物聯(lián)網(wǎng)數(shù)據(jù)市場(chǎng)中安全、信任和效率的挑戰(zhàn);并在其中搭建了兩階段的Stackelberg博弈,以解決數(shù)據(jù)需求者的定價(jià)和購(gòu)買(mǎi)問(wèn)題,為物聯(lián)網(wǎng)數(shù)據(jù)市場(chǎng)設(shè)計(jì)了最優(yōu)定價(jià)機(jī)制,從而最大化贏家和消費(fèi)者的利潤(rùn)。
此外,Chuang I H等人[76]提出了一種信任感知物聯(lián)網(wǎng)數(shù)據(jù)經(jīng)濟(jì)系統(tǒng)(trustaware IoT data economic system,TIDES)。Yu Y等人[79]提出了一種基于比特幣的用于物聯(lián)網(wǎng)數(shù)據(jù)交易的加密貨幣LRCoin。Zhou J Y等人[80]在區(qū)塊鏈上結(jié)合數(shù)據(jù)嵌入和相似度學(xué)習(xí)提出了分布式數(shù)據(jù)銷(xiāo)售,這種方法權(quán)衡了數(shù)據(jù)檢索的有效性和數(shù)據(jù)索引的泄漏風(fēng)險(xiǎn)之間的關(guān)系。汪靖?jìng)サ热薣81]提出搭建一個(gè)基于區(qū)塊鏈系統(tǒng)的數(shù)據(jù)交易市場(chǎng)分別需要考慮如下幾個(gè)設(shè)計(jì)目標(biāo):去中心化、公平性、隱私性、有效性和經(jīng)濟(jì)激勵(lì)。
盡管基于區(qū)塊鏈的數(shù)據(jù)定價(jià)可以解決大多數(shù)集中式數(shù)據(jù)定價(jià)市場(chǎng)帶來(lái)的潛在問(wèn)題,但是基于區(qū)塊鏈的數(shù)據(jù)定價(jià)也面臨許多難題,如固有的物理約束、有限的計(jì)算和存儲(chǔ)資源限制了使用更復(fù)雜的應(yīng)用程序的機(jī)會(huì)。為了解決計(jì)算和存儲(chǔ)資源有限的問(wèn)題,Li Z N等人[34]通過(guò)引入邊緣云計(jì)算來(lái)增強(qiáng)基于區(qū)塊鏈的數(shù)據(jù)定價(jià),提供了強(qiáng)大的計(jì)算資源和可擴(kuò)展性。其中邊緣提供了有限的低時(shí)延的計(jì)算和存儲(chǔ)資源,而云計(jì)算可以提供強(qiáng)大的計(jì)算和存儲(chǔ)資源,但是缺點(diǎn)是時(shí)延較高。而Li Z N等人[34]將二者結(jié)合,并且采用了非合作博弈的模型,更加符合現(xiàn)實(shí)的數(shù)據(jù)交易市場(chǎng)。
盡管基于區(qū)塊鏈的去中心化數(shù)據(jù)交易系統(tǒng)可以支持鏈上數(shù)據(jù)的安全性,但是需要更多努力來(lái)確保用戶收集并記錄在區(qū)塊鏈上的鏈下數(shù)據(jù)的可信性,即分布式數(shù)據(jù)市場(chǎng)也帶來(lái)了隱私和安全問(wèn)題。
本文研究了數(shù)據(jù)定價(jià)的相關(guān)問(wèn)題。具體來(lái)說(shuō),首先分析了數(shù)據(jù)作為商品相較于傳統(tǒng)的實(shí)物產(chǎn)品的特性與區(qū)別,并且回顧了常見(jiàn)的數(shù)據(jù)產(chǎn)品定價(jià)策略和定價(jià)準(zhǔn)則。對(duì)于數(shù)據(jù)定價(jià)以及建立一個(gè)高效的數(shù)據(jù)交易市場(chǎng),明確了其重要性,對(duì)不同的市場(chǎng)結(jié)構(gòu)、數(shù)據(jù)定價(jià)策略以及數(shù)據(jù)定價(jià)模型進(jìn)行了分類(lèi),并指出了各種類(lèi)型的優(yōu)勢(shì)和局限性。然后研究了博弈論和拍賣(mài)策略,詳細(xì)介紹了不同的方案、交易平臺(tái)及相關(guān)問(wèn)題,并對(duì)現(xiàn)有的基于博弈論和拍賣(mài)的數(shù)據(jù)定價(jià)模型進(jìn)行了回顧,分析了這些研究對(duì)數(shù)據(jù)定價(jià)的貢獻(xiàn)及局限性。最后討論了傳統(tǒng)的集中式數(shù)據(jù)交易市場(chǎng)和近年熱門(mén)的基于區(qū)塊鏈的數(shù)據(jù)定價(jià)方式,并討論了兩種數(shù)據(jù)交易市場(chǎng)的優(yōu)劣,分析了這兩種交易平臺(tái)未來(lái)的改進(jìn)方向。本文旨在讓大家了解常見(jiàn)的數(shù)據(jù)定價(jià)的方式和方法,以及數(shù)據(jù)定價(jià)領(lǐng)域存在的尚未解決的難題,以期進(jìn)一步推動(dòng)大數(shù)據(jù)交易的發(fā)展。