張軍歡,葛俊杰,張 輝
(1.北京航空航天大學 經(jīng)濟管理學院,北京 100191;2.北京航空航天大學 計算機學院,北京 100191)
隨著大數(shù)據(jù)、云計算以及物聯(lián)網(wǎng)技術的成熟與完善,個人、企業(yè)以及政府部門產(chǎn)生的數(shù)據(jù)量正呈現(xiàn)爆發(fā)式增長。多元化的數(shù)據(jù)成為現(xiàn)代社會運行必不可少的科技資源,尤其是在商業(yè)、科研應用領域,通過處理與分析數(shù)據(jù)能夠輔助研究與決策,創(chuàng)造巨大的經(jīng)濟價值與學術價值。因此,本身具備價值的數(shù)據(jù)資源已經(jīng)成為市場流通交易的對象,數(shù)據(jù)交易已經(jīng)成為科技資源流轉的重要環(huán)節(jié)與配置方式。黨的十九屆四中全會首次將數(shù)據(jù)列為重要的生產(chǎn)要素,提出加快構建數(shù)據(jù)新型要素市場體系,這從國家戰(zhàn)略層面確立了數(shù)據(jù)這一類科技資源的重要性。建立完善的數(shù)據(jù)交易規(guī)則與市場化的數(shù)據(jù)產(chǎn)品定價機制是保障數(shù)據(jù)交易市場有序運行的前提,也有助于科技資源高效配置,推動經(jīng)濟社會發(fā)展。因此,研究數(shù)據(jù)交易機制與定價問題具有重要理論和現(xiàn)實意義,已經(jīng)引起諸多學者的研究興趣。本文將從數(shù)據(jù)交易相關概念定義、交易方式、定價與風險管理四個維度,總結目前已有的基于多維特性的數(shù)據(jù)交易定價與風險管理方面的研究成果,并提出基于數(shù)據(jù)多維特性的標準化數(shù)據(jù)交易合約定價與交易的研究思路和設想。
在現(xiàn)有研究中,數(shù)據(jù)交易一般定義為通過等價有償?shù)姆绞阶尪葦?shù)據(jù)資源的所有權、使用權或收益權。Muschalle et al.(2012)[1]認為數(shù)據(jù)資源是特殊的信息產(chǎn)品,它們像其他信息產(chǎn)品一樣在數(shù)據(jù)市場中以適當?shù)膬r格出售給數(shù)據(jù)消費者。
結合Schomm et al.(2013)[2]的研究,數(shù)據(jù)交易可以具體定義為以下6 種模式:(1)可以使用數(shù)據(jù)服務的免費模式;(2)將免費服務和增值服務結合在一起的免費增值模式,消費者有限地免費訪問數(shù)據(jù),并需要付費使用高級服務;(3)消費者以固定價格購買一定數(shù)量數(shù)據(jù)的批發(fā)打包模式;(4)消費者根據(jù)使用量為數(shù)據(jù)服務付費的定量付費模式;(5)數(shù)據(jù)消費者每月支付訂閱費,以換取不受限制地訪問數(shù)據(jù)服務報酬的固定費用模式;(6)消費者支付固定的基本費用,當其使用量超出某些預先定義的配額時,將采用附加費用補充的多檔收費模式。
數(shù)據(jù)市場的出現(xiàn)促使人們設計了一種新型的商業(yè)模型,其中信息和分析工具有效地成為可交易的電子商品。Yu et al.(2013)[3]將數(shù)據(jù)產(chǎn)品定義為經(jīng)過爬網(wǎng)、重新格式化、清理、加密和其他過程之后的可交易數(shù)據(jù)形式的數(shù)據(jù)集。根據(jù)內(nèi)容性質(zhì)劃分,數(shù)據(jù)產(chǎn)品可以分為政府數(shù)據(jù)、醫(yī)療數(shù)據(jù)、財務數(shù)據(jù)、電子商務數(shù)據(jù)和交通數(shù)據(jù)等。
數(shù)據(jù)產(chǎn)品進行有序交易的場所即為數(shù)據(jù)交易市場。Armstrong 和Durfee(1998)[4]最早提出“數(shù)據(jù)市場”一詞,用來表示參與數(shù)據(jù)產(chǎn)品商業(yè)交易的代理商的整體。廣義的數(shù)據(jù)交易市場還包括所有參與數(shù)據(jù)交易的主體。Tang et al.(2014)[5]將典型的數(shù)據(jù)市場交易主體分為3 類:數(shù)據(jù)提供者、數(shù)據(jù)使用者和數(shù)據(jù)市場所有者。數(shù)據(jù)提供者向數(shù)據(jù)市場提供數(shù)據(jù)并設置相應的價格。數(shù)據(jù)使用者購買他們需要的數(shù)據(jù)產(chǎn)品。數(shù)據(jù)市場所有者充當提供者和消費者之間的中介,與這些提供者協(xié)商定價機制并管理數(shù)據(jù)交易。狹義的數(shù)據(jù)市場指數(shù)據(jù)交易的平臺。正如Stahl et al.(2013)[6]指出的,目前新興的數(shù)據(jù)交易平臺包括設立在美國的Factual、Infochimps、Xignite 和Windows Azure Data Marketplace,其中Windows Azure Data Marketplace 包含一百多個待售數(shù)據(jù)源,Infochimps 包含15 000 個數(shù)據(jù)集合,而Xignite 則專注于財務數(shù)據(jù)。
中國首家大數(shù)據(jù)交易所——貴陽大數(shù)據(jù)交易所于2015 年4 月15 日正式掛牌運營。此外,陜西西咸新區(qū)大數(shù)據(jù)交易所、武漢東湖大數(shù)據(jù)交易中心、江蘇大數(shù)據(jù)交易平臺等區(qū)域性數(shù)據(jù)交易場所也先后興起;2021 年3 月,北京國際大數(shù)據(jù)交易所成立,定位于打造國內(nèi)領先的數(shù)據(jù)交易基礎設施和國際重要的數(shù)據(jù)跨境流通樞紐;此外,《上海市數(shù)據(jù)條例(草案)》指出上海市要按照國家要求在浦東新區(qū)設立數(shù)據(jù)交易所,開展實質(zhì)化運營,標志著大數(shù)據(jù)交易模式與交易制度在中國快速發(fā)展并逐漸成熟。
關于數(shù)據(jù)交易的業(yè)務模式,Schroeder et al.(2013)[7]認為有三種:數(shù)據(jù)用戶模式、數(shù)據(jù)供應商模式、數(shù)據(jù)服務商模式。數(shù)據(jù)用戶模式是指在公司內(nèi)部使用大數(shù)據(jù)進行戰(zhàn)略決策或對其他產(chǎn)品和服務投入的模式;數(shù)據(jù)供應商模式是大數(shù)據(jù)持有方將數(shù)據(jù)視作產(chǎn)品并出售的模式;數(shù)據(jù)服務商模式是公司針對大數(shù)據(jù)進行分析并出售分析結果的模式,如實踐中“廣數(shù)club”,針對數(shù)據(jù)的加工處理和應用,提供包括數(shù)據(jù)應用方案、數(shù)據(jù)技術以及數(shù)據(jù)跨行業(yè)合作等領域的咨詢以及業(yè)務解決方案就屬于數(shù)據(jù)服務商模式。
在中國,隨著綜合性、區(qū)域性數(shù)據(jù)交易市場的投入運營,已經(jīng)初步形成了數(shù)據(jù)交易的主要業(yè)務模式,按照交易要素來劃分,主要可以分成3 種:
一是數(shù)據(jù)產(chǎn)品的所有權交易。該交易模式以數(shù)據(jù)的所有權轉移為基本特征,交易后的數(shù)據(jù)歸買方所有,原數(shù)據(jù)所有人將失去對數(shù)據(jù)的占有、使用、收益與處置的權利。該模式下的購買方獲得的是排他性的絕對支配權,因此往往需要支付較高的交易定價(定價往往采用收益法評估),適用于規(guī)模化、私密化以及使用價值較高的數(shù)據(jù)資源。這種模式類似于其他無形資產(chǎn)(專利技術、著作權等)的交易,交易流程更加復雜,需要通過登記、公證的方式達到確權的目的。
二是數(shù)據(jù)產(chǎn)品的使用權交易。該交易模式體現(xiàn)的是對數(shù)據(jù)部分經(jīng)濟價值的讓渡或購買方暫時性的擁有。常見的有特許權使用、數(shù)據(jù)庫會員資格出售、數(shù)據(jù)共享服務等。交易不發(fā)生所有權的轉讓,往往通過協(xié)議約定進行場外交易,常見的收費方式有計次收費、計時收費、按會員席位收費、特殊適用范圍使用收費等。早期的數(shù)據(jù)庫服務供應商以該類交易模式為主,如彭博公司、萬得公司等。
三是數(shù)據(jù)產(chǎn)品服務方式的交易。該交易模式圍繞數(shù)據(jù)增值、數(shù)據(jù)定制以及滿足客戶其他數(shù)據(jù)需求的目標進行有償交易。張樹臣等(2020)[8]將該類模式又細分為3 種業(yè)務類型:一是依據(jù)用戶需求,為用戶提供原始數(shù)據(jù)租售、數(shù)據(jù)采集和清洗等基礎大數(shù)據(jù)服務;二是專注于提供數(shù)據(jù)處理和分析服務,不僅能夠提供硬件基礎設施服務,同時還可以提供數(shù)據(jù)計算、云存儲、挖掘和可視化分析等多種大數(shù)據(jù)服務,并能夠幫助用戶實現(xiàn)數(shù)據(jù)統(tǒng)一管理;三是以知識服務為主,既能提供軟硬件服務,又能為客戶提供全方位、定制化的問題解決方案,通過深度介入客戶業(yè)務,跨越行業(yè)邊界,用數(shù)據(jù)驅動業(yè)務增長。
本文從基于數(shù)據(jù)交易的經(jīng)濟學角度定價以及基于數(shù)據(jù)特性的技術層面定價兩方面對現(xiàn)有的研究成果進行總結。
基于數(shù)據(jù)交易的經(jīng)濟學角度定價可以分為基于數(shù)據(jù)產(chǎn)品價值、基于數(shù)據(jù)產(chǎn)品定價機制、基于數(shù)據(jù)產(chǎn)品營銷策略以及其他數(shù)據(jù)產(chǎn)品定價4 個方面。
1.數(shù)據(jù)產(chǎn)品的價值。數(shù)據(jù)交易定價的基礎是正確評估數(shù)據(jù)價值。蔡莉等(2021)[9]認為由于買家和賣家之間幾乎沒有透明度、信息嚴重不對稱,造成數(shù)據(jù)定價的混亂,如果存在數(shù)據(jù)定價的標準流程和評估方法,買家就能夠以合理的價格獲得需要的數(shù)據(jù)。Heckman et al.(2015)[10]建議著眼于數(shù)據(jù)的內(nèi)在價值和質(zhì)量,而不是作為基礎的信息價值,以求透明和公平。但是,數(shù)據(jù)價值不是一個屬性能決定的,而是許多因素的綜合。Yu et al.(2017)[3]研究了數(shù)據(jù)質(zhì)量的多個維度,并建立了多維質(zhì)量評估的線性方法。Heckman et al.(2015)[10]認為數(shù)據(jù)值還取決于多個相互作用的復雜因素。例如,特定數(shù)據(jù)集及時性的增加可能會以其完整性為代價。因此,數(shù)據(jù)提供者將產(chǎn)生額外的費用,以增加及時性,同時又保持完整性。Pei(2015)[11]研究了包括無套利定價、收入最大化定價、動態(tài)數(shù)據(jù)定價、在線定價以及聯(lián)合和協(xié)作學習中的定價方式。Hayashi et al.(2021)[12]關注數(shù)據(jù)業(yè)務中利益相關者之間的關系,并討論使用它們的創(chuàng)造性方法,提出了一個描述以利益相關者為中心的數(shù)據(jù)價值鏈(SVC)的框架。
2.數(shù)據(jù)產(chǎn)品的定價機制。Wu 和Banker(2010)[13]指出,信息服務市場主要有3 種定價機制:“純固定費用”定價(pure flat-fee pricing)、“基于純使用價值的定價”(pure usage-based)和“兩階段關稅”定價(two-part tariff pricing)。Wu 和Banker 發(fā)現(xiàn)邊際成本和監(jiān)控成本會影響公司對定價方案的選擇。Huang et al.(2015)[14]認為云軟件中存在服務中斷,有些消費者對此很敏感。在這樣的市場中,對于云計算服務的供應商來說,明智的做法是采用混合定價策略,將固定價格保留的服務與現(xiàn)貨價格按需服務混合在一起。Mei et al.(2013)[15]構建了基于Stackelberg 博弈的定價模型,并提倡在設備價格昂貴且消費者評價差異很大時采用純捆綁策略而非純組件。張小偉等(2021)[16]綜述了第k 價格密封拍賣、VCG 拍賣、組合拍賣、雙邊拍賣定價方法在數(shù)據(jù)交易市場的應用。Balasubramanian et al.(2011)[17]考慮了頻率使用的差異以及與按使用付費模式相關的消費者的心理成本。他們得出結論,通過分析信息產(chǎn)品的兩種定價機制,即固定費用和按使用付費機制,這兩個因素可以影響賣方的利潤。Ichihashi(2020)[18]研究了一種競爭數(shù)據(jù)中介(例如在線平臺和數(shù)據(jù)經(jīng)紀人)的模型,這些中介從消費者收集個人數(shù)據(jù)并將其出售給下游公司。趙子瑞(2017)[19]梳理了平臺預定價、自動計價、拍賣式定價、自由定價、協(xié)議定價以及捆綁式定價現(xiàn)行的6 種大數(shù)據(jù)交易定價策略,并提取了數(shù)據(jù)質(zhì)量評價指標、數(shù)據(jù)拆分指標、數(shù)據(jù)歷史成交價指標、數(shù)據(jù)效用指標等4 種現(xiàn)行的大數(shù)據(jù)交易定價指標。Liang et al.(2021)[20]基于享樂價格理論,分析了影響數(shù)據(jù)價格的因素,并從數(shù)據(jù)對象、數(shù)據(jù)需求方和數(shù)據(jù)提供方三個方面提出構建數(shù)據(jù)價格特征指標體系。實踐中,北京國際大數(shù)據(jù)交易所建立了根據(jù)行為確權、使用用途和數(shù)量頻次,對計算結果和數(shù)據(jù)服務等進行市場化定價體系,是大數(shù)據(jù)交易指標定價的典型案例。
3.基于產(chǎn)品營銷策略的定價模式。數(shù)據(jù)產(chǎn)品的營銷策略很大程度上影響數(shù)據(jù)產(chǎn)品的實際價格。Xu et al.(2018)[21]基于完全覆蓋的雙頭壟斷市場,構建兩家公司并提供差異化信息產(chǎn)品,在市場均衡狀態(tài)下,企業(yè)是否采用免費增值策略的決定很大程度上取決于信息產(chǎn)品的質(zhì)量。當信息產(chǎn)品的質(zhì)量相似并且產(chǎn)品的內(nèi)在價值足夠大時,兩家公司都可以通過采用免費增值策略來獲得更好的收益。Wu 和Banker(2010)[22]從客戶的異質(zhì)性與價格敏感性角度研究定價策略,研究了最優(yōu)定價方案對邊際成本和監(jiān)控成本的敏感程度,發(fā)現(xiàn)當邊際成本和監(jiān)控成本的總和低于某個閾值時,固定費用定價是最優(yōu)方案。Abbas et al.(2021)[23]使用服務—技術組織—財務(STOF)模型構建數(shù)據(jù)交易定價分析框架。Goren et al.(2021)[24]提出了一套用于制定業(yè)務決策和分析市場行為的工具,稱為開源市場模擬器(OSOUM),用于分析數(shù)據(jù)交易市場。
4.其他類數(shù)字產(chǎn)品的定價方法。除了單純的數(shù)據(jù)類產(chǎn)品交易,還包括電商平臺、云計算平臺等數(shù)據(jù)集成平臺等產(chǎn)品與服務,它們的定價方法可以為數(shù)據(jù)定價提供參考。相較于單獨的數(shù)據(jù)產(chǎn)品,它們的數(shù)據(jù)規(guī)模體量更大,且通過集成與包裝更具有功能性,可以視為數(shù)據(jù)產(chǎn)品的批發(fā)價格與協(xié)同性溢價的總和。Lee et al.(2016)[25]引入數(shù)學模型來分析為客戶提供信息服務的電子商務公司的定價和服務質(zhì)量策略,發(fā)現(xiàn)可以在直接網(wǎng)絡效應強度的相同水平下獲得優(yōu)質(zhì)商品或服務的最佳質(zhì)量和價格。Kauffman et al.(2015)[14]提供了一個決策支持模型,可以基于對信息產(chǎn)品、電價、產(chǎn)品版本控制和收益管理研究,為IT 服務創(chuàng)建適當?shù)牟呗?。該模型適用于將固定價格預留服務與現(xiàn)貨價格按需服務混合在一起的云計算服務供應商。Mao et al.(2020)[26]提出了多對多數(shù)據(jù)交易算法(MMDTA),模擬驗證了MMDTA 模型在不同市場規(guī)模和不同市場力量下有效的收斂行為和經(jīng)濟特性。Cong et al.(2021)[27]基于原始數(shù)據(jù)集和數(shù)據(jù)標簽,在機器學習模型的協(xié)作訓練步驟中調(diào)查定價。Hyeontaek et al.(2021)[28]提出了一種使用區(qū)塊鏈的數(shù)據(jù)經(jīng)紀人的存款決策模型。
基于數(shù)據(jù)特性的技術層面定價可以分為基于查詢方式、基于數(shù)據(jù)質(zhì)量、基于數(shù)據(jù)隱私性以及基于數(shù)據(jù)版本等4 類定價方法。
1.基于查詢方式的數(shù)據(jù)定價方法?;诓樵兎绞降亩▋r是數(shù)據(jù)交易平臺定價常用方法,該方法允許賣方僅在幾個視圖(或一組視圖)上設置可見的價格,但允許買方發(fā)布數(shù)據(jù)查詢服務需求或購買任何數(shù)據(jù)的查詢服務。查詢的價格是從視圖的可見價格自動得出的,因此,購買者有完全的自由選擇要購買的數(shù)據(jù)查詢,而無需賣方在所有可能查詢的詳盡目錄上明確設定價格。由于每個查詢(以給定的查詢語言)都是一個版本,因此可以吸引具有各種需求的各種購買者。有不同需求的買家可以根據(jù)與數(shù)據(jù)相關聯(lián)的價值來選擇要購買的查詢(Koutris et al.,2015[29])。Koutris et al.(2013)[30]構造了滿足無套利屬性和無折扣屬性的查詢定價函數(shù)并將賣方的明確價格擴展到所有查詢。Li et al.(2012)[31]考慮在聯(lián)合查詢下數(shù)據(jù)的復雜性,為算法提供了多項式時間數(shù)據(jù)復雜度的算法,用于計算兩類查詢的價格:鏈式查詢(通過將問題減少到網(wǎng)絡流量)和循環(huán)查詢。Zhang et al.(2020)[32]根據(jù)粒度的粗細程度,數(shù)據(jù)隱私是否重要,將數(shù)據(jù)定價方法細分為基于數(shù)據(jù)集的定價方法、基于噪聲數(shù)據(jù)集的定價方法、基于查詢的定價方法和基于噪聲查詢的定價方法。
2.基于數(shù)據(jù)質(zhì)量的定價方法。數(shù)據(jù)質(zhì)量是針對交易數(shù)據(jù)內(nèi)容實質(zhì)的評價指標,反映的是數(shù)據(jù)價值性、功能性以及交易可行性,是影響數(shù)據(jù)產(chǎn)品定價的關鍵性因素。Balazinska et al.(2013)[33]認為經(jīng)常有多家供應商提供類似的數(shù)據(jù)產(chǎn)品,但其數(shù)據(jù)質(zhì)量不同。因此開發(fā)了一個質(zhì)量評分模型,該模型包含內(nèi)容因素(植根于數(shù)據(jù))、技術因素(與數(shù)據(jù)的組織和交付有關)、智力因素(與最終用戶的知識結構有關)、實例化因素(與數(shù)據(jù)表示有關)4 個方面,可以比較來自不同提供商的兩個報價。Yu et al.(2017)[3]考慮了數(shù)據(jù)質(zhì)量的兩個方面:數(shù)據(jù)的多維性、維之間的相互作用,并設計了一種多版本的數(shù)據(jù)策略,并根據(jù)數(shù)據(jù)質(zhì)量提出了一種數(shù)據(jù)定價的雙層編程模型,以使數(shù)據(jù)平臺所有者和使用程序收益最大化。Stahl et al.(2016)[34]提出了以質(zhì)量為中心的價格定價模型,通過使用“自己定價”(NYOP)模型來調(diào)整關系數(shù)據(jù)產(chǎn)品的質(zhì)量,以匹配買方的付款意愿。在該模型下,數(shù)據(jù)提供者可以區(qū)分客戶,從而使他們意識到客戶愿意支付的最高價格,并且客戶會收到針對其自身數(shù)據(jù)質(zhì)量需求和預算量身定制的產(chǎn)品。Batin et al.(2016)[35]提供了一套詳細的描述,包括準確性、完整性、冗余性、可讀性、可訪問性、一致性、有用性和可信賴性。Heckman et al.(2015)[10]列出了一些會顯著影響數(shù)據(jù)評估的屬性,并提出了適用于所有數(shù)據(jù)類型的價值評估通用線性模型。在此模型中,數(shù)據(jù)的估計值受許多特性的影響,例如固定成本、年齡、周期性、數(shù)據(jù)量和準確性。Yang et al.(2019)[36]分析了影響數(shù)據(jù)質(zhì)量的維度指標,建立了線性評價模型,并從數(shù)據(jù)科學的角度分析了質(zhì)量水平對數(shù)據(jù)交易的影響,定義了數(shù)據(jù)質(zhì)量的效用函數(shù)。Hayashi et al.(2016)[37]使用地方政府共享的經(jīng)驗數(shù)據(jù),通過三個實驗來研究數(shù)據(jù)的質(zhì)量特征,重點是每個數(shù)據(jù)集中的數(shù)據(jù)組合和變量之間的關系。
3.基于數(shù)據(jù)隱私性的定價方法。對于部分個人隱私數(shù)據(jù)的交易,往往根據(jù)其隱私特性進行定價。在數(shù)據(jù)隱私研究領域,基于計算技術的方法試圖解決隱私保護與運營級別的數(shù)據(jù)共享之間的沖突。這些方法中的大多數(shù)使用數(shù)據(jù)屏蔽技術[例如擾動(Gopal et al.,2002)[38],交換、泛化(Li,2011)[39]和抑制(Zhu et al.,2009)[40]]來更改原始數(shù)據(jù),以便在保護數(shù)據(jù)個人信息的同時,還可以合理地保留數(shù)據(jù)的實用性。Laudon et al.(1996)[41]介紹了受監(jiān)管的國家信息市場(NIM)的思想,該市場可以允許個人信息像商品一樣被買賣。在NIM 中,個人將決定是否可以釋放其個人信息或將其個人信息釋放多少以便二次使用,而數(shù)據(jù)收集者和用戶將為收集和使用此信息付費。Garfinkel et al.(2006)[42]提出了一種將數(shù)據(jù)屏蔽技術集成到經(jīng)濟模型中的機制。該機制允許個人動態(tài)指定和修改其隱私保護級別,該級別與數(shù)據(jù)用戶要支付的補償金額有關。Li 和Raghunathan(2014)[43]基于經(jīng)濟學和市場營銷中的縱向差異框架,對嘈雜的私人數(shù)據(jù)進行定價與銷售,以此補償其隱私受到的影響。由于賣方不了解單個客戶的類型,因此必須設計一種激勵兼容的質(zhì)量價格組合,以便客戶自行選擇需要的產(chǎn)品。在模型中提供信息的敏感度等級類似于產(chǎn)品質(zhì)量。Jaisingh et al.(2008)[44]以互聯(lián)網(wǎng)公司為例,研究隱私數(shù)據(jù)價值發(fā)現(xiàn),當個性化產(chǎn)品或服務交易的總收益小于低隱私類型的隱私損失時,公司不收集有關消費者的信息是最佳選擇。Duan et al.(2020)[45]調(diào)查了隱私問題對平臺最優(yōu)廣告定價和數(shù)據(jù)收集策略的影響,發(fā)現(xiàn)當用戶對隱私的關注較少時,數(shù)據(jù)搜集價格會隨著分析效率提升而上升,隨著廣告對用戶的初始滋擾成本降低而下降。
4.基于數(shù)據(jù)版本更新的定價方法?,F(xiàn)實中,數(shù)據(jù)資源是實時更新并且快速更迭,因此,數(shù)據(jù)資源的定價要考慮數(shù)據(jù)版本更新問題。Koutris et al.(2013)[46]考慮了更新的數(shù)據(jù)庫和重疊的信息,并提出了一種避免重新收費的新定價系統(tǒng)。Yu 和Zhang[3]建立的數(shù)據(jù)定價模型的解決方案表明,考慮到數(shù)據(jù)質(zhì)量的多個維度時,多版本策略可以實現(xiàn)更好的市場細分,并且更加經(jīng)濟可行。Schomn et al.(2013)[47]認為數(shù)據(jù)版本更新可以被認為是對數(shù)據(jù)產(chǎn)品的后續(xù)維護以及增值服務,應被包含在原有的定價內(nèi),而不能額外再次收費。
本節(jié)介紹了基于經(jīng)濟學理論的定價方法以及基于數(shù)據(jù)多維特性的定價方法,上述方法便于從數(shù)據(jù)類產(chǎn)品共性以及異質(zhì)數(shù)據(jù)特性兩個層面對多維數(shù)據(jù)做出較準確的價值評估,相關的理論方法總結可參見表1。
表1 數(shù)據(jù)產(chǎn)品定價方法總結與優(yōu)缺點對比
續(xù)表1
數(shù)據(jù)交易過程中衍生出的安全問題是阻礙數(shù)據(jù)要素正常流通的重大因素。Kurbalija 和Gelbstein(2005)[48]對數(shù)據(jù)交易安全問題進行分類,主要分為用戶身份竊取、非法侵入數(shù)據(jù)系統(tǒng)、數(shù)據(jù)竊取、非授權使用、數(shù)據(jù)干涉、數(shù)據(jù)篡改、數(shù)據(jù)泄漏、間諜活動等。國內(nèi)學者楊鳴雨(2019)[49]與張敏(2018)[50]將數(shù)據(jù)交易安全歸集為數(shù)據(jù)質(zhì)量安全、數(shù)據(jù)內(nèi)容安全、數(shù)據(jù)流通安全,認為現(xiàn)行的立法與交易自律規(guī)則沒有對交易數(shù)據(jù)的權利邊界做出明確的界定,現(xiàn)實交易中的安全漏洞廣泛存在。Kieseberg et al.(2021)[51]概述了全球和內(nèi)部數(shù)據(jù)市場在安全性方面的主要差異。本文就數(shù)據(jù)質(zhì)量、數(shù)據(jù)內(nèi)容以及數(shù)據(jù)流通3 個要素中可能產(chǎn)生的風險與應對措施進行梳理與歸納。
在數(shù)據(jù)質(zhì)量安全方面,中國現(xiàn)有交易所的交易制度與規(guī)則中并未系統(tǒng)地對數(shù)據(jù)質(zhì)量標準作明確的闡述與規(guī)制。劉航(2019)[52]認為數(shù)據(jù)質(zhì)量體現(xiàn)在合法性、真實性、準確性、一致性和完整性等多個方面,需要在數(shù)據(jù)收集、整理、分析、集成、傳輸、儲存等多個環(huán)節(jié)嚴格把控,是交易監(jiān)管的重點與難點。張云丹(2019)[53]認為數(shù)據(jù)交易具備一般商品交易的特征,因此數(shù)據(jù)質(zhì)量標準無需由交易平臺制定,可以由交易雙方簽訂合同的方式將數(shù)據(jù)范圍、數(shù)據(jù)形式、數(shù)據(jù)標準以及數(shù)據(jù)權屬問題以條款形式明確,交易所作為中介與監(jiān)管機構督促合同的執(zhí)行與違約糾紛處理。也有學者認為交易所可以設計標準化的數(shù)據(jù)產(chǎn)品,定義數(shù)據(jù)的維度特征與口徑標準,類似于證券交易所的交易制度,交易所僅對標準化的產(chǎn)品質(zhì)量進行規(guī)制與擔保,對于場外交易的數(shù)據(jù)產(chǎn)品質(zhì)量標準仍以交易雙方協(xié)商約定。張敏(2019)[54]建議可以將部分交易價款作為質(zhì)量保證金,交易所作為第三方交割機構,在交付數(shù)據(jù)產(chǎn)品后的一段使用時期內(nèi),若雙方未發(fā)生重大質(zhì)量糾紛,交易所再將剩余款項劃至數(shù)據(jù)賣方賬戶。
在數(shù)據(jù)內(nèi)容方面,主要涉及數(shù)據(jù)內(nèi)容的合規(guī)性以及數(shù)據(jù)的隱私問題。交易數(shù)據(jù)內(nèi)容的合規(guī)性在于其所描述或者記錄的內(nèi)容是否會危及國家安全、公共利益損失以及個人隱私的泄露,這要求交易平臺設立專門的監(jiān)察機構對擬掛牌交易的數(shù)據(jù)產(chǎn)品進行實質(zhì)性審核以及深度篩查。在立法層面,雷震文(2018)[55]認為交易安全與數(shù)據(jù)流通需妥善平衡,與企業(yè)或個人有關的數(shù)據(jù)內(nèi)容可采取“負面清單”加以保護,嚴格禁止交易泄露商業(yè)秘密以及個人隱私信息的數(shù)據(jù)。在技術層面,劉航(2019)[52]認為,數(shù)據(jù)脫敏技術以及語義識別技術能夠有效核查數(shù)據(jù)內(nèi)容的合規(guī)性,這比人工篩查更具備效率。張晨原(2017)[56]認為個人數(shù)據(jù)的匿名化處理也是防止個人隱私泄露的有效手段,或許未來能成為將從個人口徑提取的隱私數(shù)據(jù)作為實驗數(shù)據(jù)樣本的可行途徑。
在數(shù)據(jù)流通安全方面,影響最為廣泛的議題是數(shù)據(jù)所有權的歸屬。新修改的《民法典》單獨強調(diào)數(shù)據(jù)以及網(wǎng)絡虛擬財產(chǎn)的所有權保護。2021 年9 月起實施的《中華人民共和國數(shù)據(jù)安全法》建立了數(shù)據(jù)分類分級保護制度,確定企業(yè)、個人、數(shù)據(jù)交易中介機構、在線數(shù)據(jù)處理機構、重要數(shù)據(jù)處理者等多個主體在數(shù)據(jù)流通環(huán)節(jié)安全保護的法律責任。從數(shù)據(jù)交易的環(huán)節(jié)上看,王玉林(2016)[57]認為一是要確保掛牌交易的數(shù)據(jù)產(chǎn)品來源的合法性,務必保證權屬明晰無爭議;二是要保障數(shù)據(jù)交易后所有權的歸屬問題。第一類問題是數(shù)據(jù)能否流通的前提,該環(huán)節(jié)需要由出售數(shù)據(jù)的賣方提供合理的證據(jù)證明數(shù)據(jù)的來源以及歸屬,交易所對掛牌的數(shù)據(jù)進行嚴格的核查。由于中國還未對數(shù)據(jù)所有權實行登記制度,所以目前無法對數(shù)據(jù)產(chǎn)權的流轉進行系統(tǒng)管理。韓葉(2018)[58]指出,數(shù)據(jù)產(chǎn)品具備無形資產(chǎn)的特性,而現(xiàn)有的權屬登記中,專利權、商標權以及著作權已經(jīng)有完善的登記備案制度,數(shù)據(jù)產(chǎn)品具備同樣的特征,因此可以在部分交易所實行產(chǎn)權登記的試點。具有法律效力的登記能夠快速識別交易數(shù)據(jù)的產(chǎn)權歸屬,但該方案的可行性還有待實踐論證。第二類問題主要存在于數(shù)據(jù)所有權的交易中。由于數(shù)據(jù)的可獲得性與可復制性,如何保證數(shù)據(jù)產(chǎn)品所有權交割后真正所有權人主張權利的排他性往往成為實施難點,原所有人對轉讓后數(shù)據(jù)的使用權限的規(guī)制體系尚在探索中。李怡等(2017)[59]認為可以參考其他無形資產(chǎn)的交易制度,一是實行產(chǎn)權登記,二是完善糾紛解決機制,如互聯(lián)網(wǎng)法庭、仲裁機構等,加大對侵權行為的懲罰力度,進一步保障數(shù)據(jù)產(chǎn)權流轉的安全,控制交易風險。
本節(jié)從數(shù)據(jù)質(zhì)量安全、內(nèi)容安全與流通安全三個維度闡述了數(shù)據(jù)交易中常見的風險要素及其特征,相應文獻要點與安全問題應對措施優(yōu)缺點總結參見表2。
表2 數(shù)據(jù)交易安全問題總結與應對措施優(yōu)缺點對比表
數(shù)據(jù)交易安全風險管理策略是數(shù)據(jù)交易有序開展的前提與保障。針對前文所述的數(shù)據(jù)交易質(zhì)量、內(nèi)容以及流通安全,本文結合實踐經(jīng)驗從技術與制度兩個層面提出有效的風險管理策略。
1. 差分隱私技術。差分隱私模型是一種基于數(shù)據(jù)擾動技術的隱私保護模型。孫道柱等(2021)[60]指出,差分隱私技術通過向真實數(shù)據(jù)中添加符合特定概率分布的噪聲,將確定的查詢、分析結果映射到不確定的值域區(qū)間上,從而達到保護數(shù)據(jù)庫中單個數(shù)據(jù)的目的。在個體用戶隱私保護的應用上,中國華為公司于2018 年率先將該技術應用到“用戶體驗改進計劃”,僅在結合數(shù)據(jù)整體分析的基礎上才能去除擾動噪聲。差分隱私與同態(tài)加密、匿名化等傳統(tǒng)加密技術相比,擁有更嚴格的數(shù)學基礎證明數(shù)據(jù)隱私保護的可行性,同時嚴格定義了攻擊者擁有的背景知識,增強對數(shù)據(jù)交易內(nèi)容隱私性的保護。Yun et al.(2021)[61]通過將差分隱私引入數(shù)據(jù)交易過程,提出了差分隱私數(shù)據(jù)交易(DPDT)的新機制。
2.同態(tài)加密技術。楊亞濤等(2021)[62]指出,同態(tài)加密技術是指在不解密的情況下對密文進行任意的函數(shù)變換,對變換的輸出解密,所得結果與對相應的明文進行同樣的函數(shù)變換結果一樣。同態(tài)加密與一般性數(shù)據(jù)安全技術相比更關注數(shù)據(jù)處理安全。在該技術下允許數(shù)據(jù)使用者對加密數(shù)據(jù)進行處理,但是處理過程中不會泄露任何原始內(nèi)容。同態(tài)加密技術可應用于分布式計算環(huán)境下的密文數(shù)據(jù)計算,例如云計算、匿名投票、密文檢索與匿名訪問等。
3.區(qū)塊鏈加密技術。文必龍等(2021)[63]指出,數(shù)區(qū)塊鏈可以根據(jù)數(shù)據(jù)存放區(qū)塊位置、存放時間、系統(tǒng)密鑰等信息自動生成商品確權編碼,數(shù)據(jù)商品和確權編碼綁定,交易信息存儲在區(qū)塊鏈上,追溯數(shù)據(jù)交易信息。騰訊云數(shù)鏈為區(qū)塊鏈加密技術應用于數(shù)據(jù)存儲與流通的典型案例,其開創(chuàng)了三種數(shù)據(jù)交換方式:通過非對稱加密方式直接在鏈上傳輸;基于鏈上傳播健全信息、關鍵的控制信息;可信計算方式數(shù)據(jù)流轉。區(qū)塊鏈的留痕性與可控性很好地保障了數(shù)據(jù)流通的安全性與可追溯性,主要應用于數(shù)據(jù)交易信息溯源。Huang et al.(2020)[64]提出了一種基于智能合約的協(xié)議,以保護數(shù)據(jù)生產(chǎn)者的利潤,同時允許消費者合法轉售數(shù)據(jù)。該協(xié)議確保通過授權轉售與數(shù)據(jù)生產(chǎn)者共享收入,并檢測任何未經(jīng)授權的轉售。黃小紅等(2021)[65]提出了一種基于聯(lián)盟區(qū)塊鏈的分布式數(shù)據(jù)交易框架,在不依賴第三方的情況下實現(xiàn)了P2P 的數(shù)據(jù)交易。區(qū)塊鏈加密技術已經(jīng)在數(shù)據(jù)交易實踐中得到廣泛應用,如新上線的北京數(shù)據(jù)交易系統(tǒng)運用區(qū)塊鏈和隱私計算技術支持全鏈條交易服務體系,全面提升數(shù)據(jù)登記的安全性、合規(guī)性、保密性。
4.數(shù)據(jù)水印技術。侯瑞濤等(2020)[66]指出,其將特定的數(shù)字信號嵌入數(shù)字產(chǎn)品中保護數(shù)字產(chǎn)品版權或完整性的技術,保障了數(shù)據(jù)所有權有據(jù)可查,數(shù)據(jù)泄露有跡可循,可降低數(shù)據(jù)在流通、共享的過程中被盜用、侵權的風險。Liang et al.(2018)[67]回顧了數(shù)字版權保護機制,包括數(shù)字版權標識符、數(shù)字版權管理、數(shù)字加密、水印等,并概述了數(shù)據(jù)交易生命周期中數(shù)據(jù)保護的挑戰(zhàn)。實踐中,貴陽數(shù)據(jù)交易所載入了“數(shù)據(jù)確權”模塊,為數(shù)據(jù)打碼加印,可通過抽取水印信息的方式,進行數(shù)據(jù)所有權判定,主要應用于數(shù)據(jù)確權、數(shù)據(jù)泄露排查等領域①貴陽大數(shù)據(jù)交易所官網(wǎng)http://cms.gbdex.bdgstore.cn/ptdw/.。
1.訪問授權制度。目前中國開展大規(guī)模數(shù)據(jù)交易的平臺多采用會員制,對用戶訪問的權限進行嚴格管控。對參與數(shù)據(jù)交換的用戶通過身份確權與認證的方式確保數(shù)據(jù)合法訪問,對突發(fā)性惡意接入進行有效隔離,防止數(shù)據(jù)被截獲事件的發(fā)生。
2.數(shù)據(jù)交易征信名單。各類交易平臺可在監(jiān)管接入的基礎上強化對用戶異常使用行為的識別,分析用戶操作特征,建立數(shù)據(jù)提供方、需求方、中介三類征信名單,根據(jù)違規(guī)操作事件的惡劣程度分類分級管理。張曉芬(2019)[68]指出對不同級別用戶操作權限做出明確區(qū)分,失信用戶可限制其操作或判定交易行為無效。
3.強化數(shù)據(jù)接口管理。對提供流通的數(shù)據(jù)接口安全性進行管理與甄別,要求接口提供者或服務商自查接口的合規(guī)性與穩(wěn)健性,形成詳細的技術報告供平臺監(jiān)管報備,隨機抽樣測試數(shù)據(jù)接口的安全性與數(shù)據(jù)內(nèi)容的真實性、有效性。
4.建立平臺爭議判定機制。對數(shù)據(jù)流通、共享中的權屬糾紛建立糾紛調(diào)整機制與權屬判定機制。同時加強對基礎平臺交易記錄儲存與維護,保障交易的可追溯性,確保權屬爭議的及時解決。建立自動化的爭議判定系統(tǒng),強化職能識別,做到交易前中后的全流程管理,特別是事前的風險預警提示,實現(xiàn)事前預防,事后爭議調(diào)解的完善機制。
本節(jié)在數(shù)據(jù)交易風險管理上總結了區(qū)塊鏈加密、數(shù)據(jù)水印、差分隱私、同態(tài)加密4 種風控技術,綜述了其在實踐領域的應用,具體總結參見表3。
表3 數(shù)據(jù)交易安全風險管理策略總結與優(yōu)缺點對比表
數(shù)據(jù)交易是信息化產(chǎn)業(yè)快速發(fā)展的新興交易類型,已逐步成為廣大研究人員關注的一項課題。本文總結目前數(shù)據(jù)交易與定價的研究進展,詳細歸納了國內(nèi)外學者對數(shù)據(jù)產(chǎn)品、數(shù)據(jù)交易、數(shù)據(jù)交易市場以及數(shù)據(jù)交易主體的定義和概念;介紹了目前國內(nèi)外數(shù)據(jù)交易平臺主要的交易模式及其特征;從經(jīng)濟學理論框架與技術特性框架歸納了常見的數(shù)據(jù)產(chǎn)品的定價方法與模型;梳理了目前中國數(shù)據(jù)交易實踐中存在的安全問題,并綜述了風險管理對策與方案。現(xiàn)有的研究以數(shù)據(jù)特性與價值作為切入點,提出了數(shù)據(jù)特性維度的評價指標與定價方法,但并未建立標準化數(shù)據(jù)產(chǎn)品的定價模型,各類模型的使用場景有限。在交易安全與風險管理機制方面主要以監(jiān)管、立法以及制度的研究為主,缺少對風險管理技術的研究。
基于以上對數(shù)據(jù)產(chǎn)品定價的研究,可以考慮構建以數(shù)據(jù)產(chǎn)品交易特性為基準的價值評估模型,并在經(jīng)濟學定價的基礎上引入數(shù)據(jù)多維特性的考慮調(diào)整數(shù)據(jù)產(chǎn)品的價格,例如多維線性模型、雙向連續(xù)拍賣模型、決策支持模型等構建標準化數(shù)據(jù)產(chǎn)品的定價機制。并引入質(zhì)量評分模型、版本控制函數(shù)、無套利查詢定價函數(shù)等作為價格的調(diào)整項,從標準化數(shù)據(jù)產(chǎn)品價格拓展到非標準化交易產(chǎn)品。
在此基礎上,可以研究適用于交易所掛牌交易的標準化數(shù)據(jù)交易產(chǎn)品設計與定價問題。標準化的數(shù)據(jù)交易產(chǎn)品更具可比性,依據(jù)市場交易的活躍程度擁有豐富的交易數(shù)據(jù),也可以利用機器學習的方法研究可比類型的數(shù)據(jù)產(chǎn)品的價格變動建立市場定價模型。此外,研究標準化數(shù)據(jù)交易合約的設計問題也有利于研究系統(tǒng)化的風險控制策略與風險轉移手段,通過建立科技資源數(shù)據(jù)的交易機制更好地促進中國科技資源聚集、共享與配置。