周林彬,馬恩斯
(中山大學(xué) 法學(xué)院,廣東 廣州 510006)
法律視角中,什么是大數(shù)據(jù)?大數(shù)據(jù)和普通數(shù)據(jù)有什么區(qū)別?目前理論*國內(nèi)外經(jīng)濟(jì)學(xué)與法學(xué)期刊對于大數(shù)據(jù)的關(guān)注從2014年起呈現(xiàn)井噴式增長,檢索HeinOnline和CNKI數(shù)據(jù)庫中經(jīng)濟(jì)學(xué)、法學(xué)CSSCI期刊中以“大數(shù)據(jù)”為標(biāo)題的論文共100篇,其中明確論及大數(shù)據(jù)定義的有71篇。該71篇對于大數(shù)據(jù)定義所引述的主要文獻(xiàn)高度重合于以下四處,分別是麥肯錫在 2011 年的《大數(shù)據(jù):下一個創(chuàng)新、競爭和生產(chǎn)力的前沿》報告中定義的“是容量大小超出一般數(shù)據(jù)軟件所能采集、存儲和分析的數(shù)據(jù)集”、暢銷書《大數(shù)據(jù)時代:生活、工作與思維的大變革》中的“不是小部分的數(shù)據(jù)樣本,而是人們能夠運用和掌握的所有數(shù)據(jù);不是精確的數(shù)據(jù),而是比較混雜且為人們可以挖掘的數(shù)據(jù)”、美國國家科學(xué)基金會的“通過互聯(lián)網(wǎng)交易、電子郵件、網(wǎng)絡(luò)點擊等形成的分布式數(shù)據(jù)集”以及下文中IBM定義的“4V標(biāo)準(zhǔn)”。并大都表達(dá)“雖然對大數(shù)據(jù)并未形成普遍接受的定義,但理論和實務(wù)界普遍接受了4V標(biāo)準(zhǔn)”。、實務(wù)界*實務(wù)中大數(shù)據(jù)服務(wù)于“云計算”,云計算服務(wù)于“互聯(lián)網(wǎng)+”,“互聯(lián)網(wǎng)+”服務(wù)于“工業(yè)4.0”,大數(shù)據(jù)不依托云計算既無法挖掘,也無法存儲分析,更沒法應(yīng)用和維護(hù)。所以大數(shù)據(jù)實務(wù)基本是云服務(wù)公司的一部分業(yè)務(wù)與工作。國內(nèi)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展頗有代表性的是阿里云、騰訊云和貴陽大數(shù)據(jù)交易所。阿里云的創(chuàng)設(shè)宗旨之一在于“云計算將數(shù)據(jù)變成生產(chǎn)資料和企業(yè)資產(chǎn)”;騰訊云在“TOD大數(shù)據(jù)處理”中表示“完成對海量數(shù)據(jù)的各種處理”;貴陽大數(shù)據(jù)交易所的定義“是對數(shù)量巨大、來源分散、格式多樣的數(shù)據(jù)進(jìn)行采集、存儲和關(guān)聯(lián)分析,發(fā)現(xiàn)新知識、創(chuàng)造新價值、提升新能力的新一代信息技術(shù)和服務(wù)業(yè)態(tài)”。與立法者*截至2017年4月,國務(wù)院及各部委共發(fā)布以大數(shù)據(jù)為調(diào)整對象的行政法規(guī)19部,地方法規(guī)規(guī)章201部。中央法規(guī)中明確定義“大數(shù)據(jù)”的僅有《國務(wù)院關(guān)于印發(fā)促進(jìn)大數(shù)據(jù)發(fā)展行動綱要的通知》(下稱《綱要》)一部,地方共有16部。其定義基本延續(xù)了《綱要》的定義“大數(shù)據(jù)是以容量大、類型多、存取速度快、應(yīng)用價值高為主要特征的數(shù)據(jù)集合”,也即“4V”標(biāo)準(zhǔn)。他國政府或政府間國際組織也制定了多部以廣義大數(shù)據(jù)為調(diào)整對象的法律法規(guī),較有代表性的是歐盟1995年的《數(shù)據(jù)保護(hù)指令》、2015年的《通用數(shù)據(jù)保護(hù)條例》、澳大利亞的《隱私保護(hù)原則》、巴西司法部的《個人數(shù)據(jù)保護(hù)法》(草案)、日本的《個人信息保護(hù)法》和亞太經(jīng)合組織(APEC)的《APEC隱私保護(hù)和框架》等。由于“大數(shù)據(jù)(Big Date)”的提法產(chǎn)生于2012年,早于前述大多數(shù)法律法規(guī),故而對“大數(shù)據(jù)”進(jìn)行明確的定義仍是空白。出于現(xiàn)實考慮,默契一致地選擇回避正面回答“什么是大數(shù)據(jù)”,而是采用了描述性的概念界定即眾所周知的“4V標(biāo)準(zhǔn)”*第一,數(shù)量(Volume),即數(shù)據(jù)巨大,從TB級別躍升到PB級別;第二,多樣性(Variety),即數(shù)據(jù)類型繁多,不僅包括傳統(tǒng)的格式化數(shù)據(jù),還包括來自互聯(lián)網(wǎng)的網(wǎng)絡(luò)日志、視頻、圖片、地理位置信息等;第三,速度(Velocity),即處理速度快;第四,真實性(Veracity),即追求高質(zhì)量的數(shù)據(jù)。,將“大數(shù)據(jù)”定義為“大量(普通)數(shù)據(jù)的集合”。這樣定義的優(yōu)點是解釋力強,符合法理學(xué)常識中的“法律原則的抽象程度與解釋力成正比”,但缺點是“法律原則的抽象程度與可用性成反比”?!?V標(biāo)準(zhǔn)”的解釋力與實用性相悖,將大數(shù)據(jù)與普通數(shù)據(jù)的區(qū)別定位為數(shù)量而非性質(zhì)上的區(qū)別,進(jìn)而導(dǎo)致大數(shù)據(jù)在世界范圍內(nèi)被拖入隱私權(quán)爭論的泥淖之中——“既然歸根結(jié)底是一般數(shù)據(jù),當(dāng)然應(yīng)該參照個人信息保護(hù)規(guī)則”。同時也既無法被民法典或其他立法直接采納也難以被司法直接適用。但“法律視角中,什么是大數(shù)據(jù)”是不應(yīng)也不能閃爍其詞的。不清楚大數(shù)據(jù)在法律上是什么,何談確權(quán)?如何流轉(zhuǎn)?如何保障?后續(xù)的法律和法律法規(guī)如沙灘城堡,如何穩(wěn)定?
筆者認(rèn)為,大數(shù)據(jù)是依確定目的而挖掘、處理的大量不特定主體的數(shù)字信息。
概念的提出是從“大數(shù)據(jù)”概念提出的背景與根本目的反推而來。大數(shù)據(jù)的重大意義已不需贅言*國務(wù)院印發(fā)《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》提出“全面推進(jìn)大數(shù)據(jù)發(fā)展,加快建設(shè)數(shù)據(jù)強國”,將大數(shù)據(jù)的重要意義概括為“提升政府治理能力、優(yōu)化民生公共服務(wù)、促進(jìn)經(jīng)濟(jì)轉(zhuǎn)型和創(chuàng)新發(fā)展”。這四方面可以具體理解到社會經(jīng)濟(jì)生活的方方面面,學(xué)界對大數(shù)據(jù)應(yīng)用的潛在意義和發(fā)展前景已進(jìn)行了汗牛充棟的論述,再次略去不述。。但究其根本,大數(shù)據(jù)技術(shù)、大數(shù)據(jù)服務(wù)和大數(shù)據(jù)產(chǎn)業(yè)的根本目的在于精確預(yù)測[1]2。通過隨機分析、回歸分析等統(tǒng)計工具和計算機算法實現(xiàn)對個人、企業(yè)、政府或國家行為與效果的準(zhǔn)確預(yù)測*比如淘寶網(wǎng)統(tǒng)計買家購買偏好以便進(jìn)行CCM(定向廣告投放),所以現(xiàn)在每個人看到手機或其他移動終端上的淘寶APP界面都是不同的。從2015年開始,淘寶在移動終端全面鋪開個性化推送業(yè)務(wù)。阿里官方給出了推送參數(shù)近一百種,比如購物風(fēng)格、年齡、地域、收藏店鋪、瀏覽寶貝、平均購買力等等。比如男性的淘寶APP中基本不會出現(xiàn)唇彩的推送,女性用戶的推薦里也不會出現(xiàn)剃須刀,再暢銷也不會。。該定義由三個要件構(gòu)成,分別是行為要件、行為對象和對象性質(zhì)。
從行為要件來說,與一般數(shù)據(jù)不同,不具備“特定目的挖掘”主觀要件和“挖掘、處理”客觀要件而只是靜置、沉睡的數(shù)據(jù),種類和數(shù)量再多、處理速度和本身準(zhǔn)確性再高也不會產(chǎn)生這種精準(zhǔn)預(yù)測力,也不是“大數(shù)據(jù)”。好比檔案館,里邊檔案再豐富如果不進(jìn)行有目的的挖掘和處理,也只是大量普通數(shù)據(jù)而非大數(shù)據(jù)。
從行為對象來說,“大量不特定主體”有兩個意群,分別是“大量”“不特定主體”?!按罅俊奔创髷?shù)據(jù)的數(shù)量級門檻,也即“多大是‘大’”。由立法界定什么是“大”的制度效率低于司法界定和私法替代[2]65-66。這一方面是由于“摩爾定律”*當(dāng)價格不變時,集成電路上可容納的元器件的數(shù)目,約每隔18—24個月便會增加一倍,性能也將提升一倍。的存在,“大量”必然是個動態(tài)的概念,另一方面是由于大數(shù)據(jù)應(yīng)用領(lǐng)域?qū)挿簩?dǎo)致各行業(yè)的數(shù)據(jù)總量和標(biāo)準(zhǔn)不同。“不特定主體”是借鑒了刑法對危害公共安全罪的犯罪構(gòu)成要件思路*危害公共安全罪共四十七個罪名,如放火罪、爆炸罪、破壞交通工具罪等。該罪的犯罪客體是公共安全,即不特定的多數(shù)人的生命、健康和重大公私財產(chǎn)安全及公共生產(chǎn)、生活安全。犯罪的主觀方面是行為人明知自己的行為危害公共安全,有可能造成不特定的多數(shù)人傷亡或者公私財產(chǎn)的重大損失,并且希望或者放任這種結(jié)果的發(fā)生。其本質(zhì)特征表現(xiàn)為不特定性。比如明確要炸毀對方車隊,雖然客觀上造成了重大傷亡,則仍可能屬于故意殺人罪,并不符合爆炸罪的主觀方面構(gòu)成要件。而如果想要爆破一條道路制造恐慌,哪怕僅炸毀了一輛汽車也可能成立爆炸罪。,目的是為了區(qū)分侵犯商業(yè)秘密和信息盜竊。
從對象性質(zhì)的角度來說,“數(shù)字信息”是“大數(shù)據(jù)”與“個人信息”的核心區(qū)別。目前,之所以歐美關(guān)于大數(shù)據(jù)的爭論主要集中在憲法權(quán)利、隱私權(quán)、法律倫理等方面*索引自HeinOnline,按照關(guān)鍵詞“Big Date”搜索近五年下載量前一百的法學(xué)文獻(xiàn),占比如下:大數(shù)據(jù)的潛力26%,大數(shù)據(jù)隱私34%(其中援引第四修正案為27篇),大數(shù)據(jù)應(yīng)用28%,大數(shù)據(jù)確權(quán)9%,其他3%。參見Lenard,Thomas M.,Rubin,Paul H.Big Data,Privacy and the Familiar Solutions[J].Journal of Law,Economics & Policy,Vol.11,Issue 1(Spring 2015),pp.1-32.一篇較為全面的綜述類論文。并爆發(fā)了數(shù)次激烈的沖突[3]276-281,究其原因,主要是稟賦效應(yīng)和信息不對稱徒增的制度成本。而國內(nèi)由于“大數(shù)據(jù)”提法的興起與販賣個人信息活動日益猖獗的周期高度重合、同步“流行”,使得國內(nèi)輿論與研究者也將除大數(shù)據(jù)應(yīng)用之外的主題放到了隱私權(quán)保障上*CNKI搜索“篇名”與“關(guān)鍵詞”包含“大數(shù)據(jù)”的法學(xué)論文共計3 796篇,其中以隱私權(quán)、個人信息保護(hù)為主題的共計1 500篇,約占40%。,《個人信息保護(hù)法》的呼聲也日益高漲*自2009年起我國個人信息泄露案件激增,八年來屢禁不絕。包括全國人大財經(jīng)委副主任委員吳曉靈、央行副行長陳雨露、奇虎360董事長周鴻祎在內(nèi)的政企兩界都認(rèn)為制定《個人信息保護(hù)法》是一劑良藥,截至2017年5月3日相關(guān)信息搜索量也已超過210萬條。。但這和大數(shù)據(jù)的關(guān)系似是而非,主要是缺乏對大數(shù)據(jù)技術(shù)的進(jìn)一步了解。之所以“似是”,是因為個體主義方法論下“大數(shù)據(jù)”的一切應(yīng)用歸根結(jié)底確是來自于具體自然人,最終也確實是應(yīng)用到具體自然人,“取之于斯而用之于斯”。之所以“而非”是因為大數(shù)據(jù)要分析和處理的是海量數(shù)字化信息,個人信息并不是天然的計算機語言無法被直接運算,必須轉(zhuǎn)化為數(shù)字信息才能產(chǎn)生最后“精確預(yù)測”的結(jié)果。這其中關(guān)于數(shù)據(jù)清洗、區(qū)塊鏈存儲、秘鑰、分布式處理以及其他在大數(shù)據(jù)存儲、分析的整個流程中,“個人信息”都不再以初始形式存在,大數(shù)據(jù)的內(nèi)容是計算機語言表述的數(shù)字信息。
前述定義下的法律視角中的“大數(shù)據(jù)”和“隱私”、“個人信息”、“商業(yè)秘密”、“(一般)數(shù)據(jù)” 各自范疇均已界定,這是明確“大數(shù)據(jù)確權(quán)”的前提。
如開篇所述,大數(shù)據(jù)確權(quán)即大數(shù)據(jù)的權(quán)利性質(zhì)、內(nèi)容和歸屬。
傳統(tǒng)法經(jīng)濟(jì)學(xué)在產(chǎn)權(quán)初始分配方面?zhèn)戎赜谝越灰踪M用為基礎(chǔ)分析權(quán)利的歸屬問題,為什么此處的確權(quán)卻要論及權(quán)利的內(nèi)容與權(quán)利的性質(zhì)?究其原因有二,從理論的角度來看經(jīng)濟(jì)學(xué)研究的基本假定是“其他條件確定”,所以無論是在“公地悲劇”、“火車燒柴”,還是在“蜜蜂神話”等經(jīng)典模型中,產(chǎn)權(quán)的具體類型與性質(zhì)是確定的,學(xué)界很少探討過度放牧是否侵害了畫家的寫生權(quán),也不關(guān)注火車是否還影響了農(nóng)場主的夜間休息安寧權(quán),更不會探討什么是農(nóng)場、火車。但在大數(shù)據(jù)問題上,如前所述理論與實務(wù)界對“什么是大數(shù)據(jù)”問題淺嘗輒止、貪功冒進(jìn),并不存在經(jīng)典模型中確定的研究基礎(chǔ)。從實踐的角度來看,法律框架下對調(diào)整對象法律性質(zhì)的界定具有實際意義,意味著不同的資源稀缺性度、不同的市場競爭條件、不同的制度成本。將大數(shù)據(jù)界定為財產(chǎn)權(quán)和人身權(quán)意味著截然相反的資源稀缺度,將大數(shù)據(jù)界定為知識產(chǎn)權(quán)或物權(quán)也意味著截然不同的制度成本,前者限制交易而后者鼓勵交易。而既然探討大數(shù)據(jù)確權(quán)的目的在于產(chǎn)生最有效率的制度設(shè)計思路,那么對交易成本與制度效率有重要影響的要素就應(yīng)當(dāng)是題中之意。故而,大數(shù)據(jù)確權(quán)除探討權(quán)利歸屬問題,有必要探討權(quán)利性質(zhì)與權(quán)利內(nèi)容。
大數(shù)據(jù)確權(quán)的目的和必要性如何?從法律經(jīng)濟(jì)學(xué)來看,雖確權(quán)的具體目的包括鼓勵創(chuàng)新以提高正外部性溢出、降低信息不對稱的影響以滿足有效需求最大化的實現(xiàn)等不一而足,但根本目的是為了無限接近科斯的“零交易成本世界”。大數(shù)據(jù)的一切具體應(yīng)用的不二法門是開放與共享。醫(yī)療大數(shù)據(jù)應(yīng)用可以降低誤診率、提高藥物效用、提升整體居民健康水平,消費大數(shù)據(jù)可以促進(jìn)供給側(cè)改革的實現(xiàn)、發(fā)現(xiàn)和滿足有效需求、降低庫存和開發(fā)失敗率、提升購物體驗,金融大數(shù)據(jù)可以預(yù)防系統(tǒng)性金融風(fēng)險、加強反洗錢效率、提高資金效率,這些都是為了降低由逆向選擇、次品問題和道德風(fēng)險產(chǎn)生的信息成本減損社會福利。大數(shù)據(jù)發(fā)展的指向應(yīng)該是開放而不是封閉,是在個人權(quán)益與社會福利間謀求均衡,哪怕這種均衡不得不通過“卡爾多-??怂棺顑?yōu)”而非“帕累托最優(yōu)”實現(xiàn)。
從確定大數(shù)據(jù)權(quán)利性質(zhì)的必要性而言,探討大數(shù)據(jù)的權(quán)利性質(zhì)即將目前法律性質(zhì)不明的大數(shù)據(jù)界定為物權(quán)、債權(quán)還是知識產(chǎn)權(quán)的交易成本最低,制度效率最高。由于不同的法律性質(zhì)意味著不同的保護(hù)模式,也就意味著不同的交易成本與制度效率。由于前述已言明大數(shù)據(jù)的本質(zhì)屬性是財產(chǎn)性而非人身性,故不將“隱私權(quán)”列入大數(shù)據(jù)權(quán)利性質(zhì)的討論范疇。
從確定大數(shù)據(jù)權(quán)利性質(zhì)的可行性而言,大數(shù)據(jù)的法律性質(zhì)之所以可以被選擇主要是因為其性質(zhì)未定。由于“大數(shù)據(jù)”是依確定目的而挖掘、處理的大量不特定主體的數(shù)字信息,顯然不是天然存在而是人為加工的一種財產(chǎn)。故而其權(quán)利性質(zhì)并不屬于自然權(quán)利而是屬于擬制權(quán)利。而大數(shù)據(jù)這一2012年開始“躥紅”的熱點問題,2017年編纂的民法總則卻對其權(quán)利性質(zhì)問題刻意進(jìn)行了回避*2016年7月的《民法總則(草案一審稿)》第一百○八條規(guī)定:民事主體依法享有知識產(chǎn)權(quán)。知識產(chǎn)權(quán)是指權(quán)利人依法就下列客體所享有的權(quán)利:(一)作品;(二)專利;(三)商標(biāo);(四)地理標(biāo)記;(五)商業(yè)秘密;(六)集成電路布圖設(shè)計;(七)植物新品種;(八)數(shù)據(jù)信息;(九)法律、行政法規(guī)規(guī)定的其他內(nèi)容。同年11月,《民法總則(草案二審稿)》第一百二十條規(guī)定,知識產(chǎn)權(quán)是指權(quán)利人依法就下列客體所享有的權(quán)利:(一)作品;(二)發(fā)明、實用新型、外觀設(shè)計;(三)商標(biāo);(四)地理標(biāo)志;(五)商業(yè)秘密;(六)集成電路布圖設(shè)計;(七)植物新品種;(八)科學(xué)發(fā)現(xiàn);(九)法律規(guī)定的其他客體。刪除了一稿中的“(八)數(shù)據(jù)信息”。而后正式頒行的《民法典總則》延續(xù)了二稿的表述,并在第一百二十七條中用“法律對數(shù)據(jù)、網(wǎng)絡(luò)虛擬財產(chǎn)的保護(hù)有規(guī)定的,依照其規(guī)定”,放棄了對大數(shù)據(jù)確權(quán)問題的正面回答而采取了開放式規(guī)定。。究其原因,很大程度上是出于對大數(shù)據(jù)發(fā)展并未成熟與法典式立法必要的穩(wěn)定性之間存在沖突,可能導(dǎo)致法律適用上的不當(dāng)進(jìn)而增加社會成本。故而其法律性質(zhì)目前處于制度空白期,所以可以被選擇。
既然是財產(chǎn)權(quán),權(quán)利性質(zhì)又可以被選擇,那么大數(shù)據(jù)應(yīng)該屬于何種財產(chǎn)權(quán)的客體?我國民法典編纂的過程中,已頒布的《民法總則》在第五章“民事權(quán)利”的第一百一十三條“民事主體的財產(chǎn)權(quán)利受法律平等保護(hù)”后以第一百一十四條、第一百一十八條和第一百二十三條列明了財產(chǎn)權(quán)利的三個主要組成部分,物權(quán)、債權(quán)和知識產(chǎn)權(quán)。從法律經(jīng)濟(jì)學(xué)來看,大數(shù)據(jù)的權(quán)利性質(zhì)確定過程可以被視為一種制度選擇的過程,在前述在物權(quán)、債權(quán)、知識產(chǎn)權(quán)這三種路徑的制度競爭間進(jìn)行“成本-收益分析”,得出效率最高的制度效率。
債權(quán)路徑帶有明顯的負(fù)外部性后果,促使壟斷和不正當(dāng)競爭的形成。債權(quán)路徑中最主要的是通過契約意思自治來實現(xiàn)大數(shù)據(jù)確權(quán),這是當(dāng)前現(xiàn)實中最普遍的形式,比如貴陽和中關(guān)村的大數(shù)據(jù)交易中心所內(nèi)進(jìn)行公開交易以及企業(yè)間或企業(yè)內(nèi)部進(jìn)行的非公開數(shù)據(jù)交易*貴陽大數(shù)據(jù)交易所可以交易包括政府大數(shù)據(jù)、征信大數(shù)據(jù)、專利大數(shù)據(jù)在內(nèi)的三十類數(shù)據(jù)交易品種。來自貴陽大數(shù)據(jù)交易所官方網(wǎng)站http://www.gbdex.com/website/view/dataDeal.jsp,訪問日期2017年4月3日。?;ヂ?lián)網(wǎng)巨頭正各自構(gòu)建不同領(lǐng)域的互聯(lián)網(wǎng)托拉斯,比如騰訊對于人們現(xiàn)在的衣食住行(分別對應(yīng)京東、大眾點評、58同城、滴滴打車)都持有相當(dāng)股份,大數(shù)據(jù)確權(quán)存在制度空白的情況下,通過市場機制進(jìn)行大數(shù)據(jù)交易的法律風(fēng)險過高,進(jìn)而導(dǎo)致交易成本高起。故而大數(shù)據(jù)企業(yè)選擇企業(yè)機制,在關(guān)聯(lián)企業(yè)內(nèi)部流轉(zhuǎn)大數(shù)據(jù)形成市場替代。但這種市場替代事實上是一種“數(shù)據(jù)壁壘”,導(dǎo)致大數(shù)據(jù)企業(yè)與關(guān)聯(lián)企業(yè)得以迅速向行業(yè)壟斷的方向發(fā)展??偟膩碚f,如果過度依賴契約路徑與放任大數(shù)據(jù)產(chǎn)權(quán)不明晰狀態(tài)的持續(xù)則將產(chǎn)生市場失靈,其主要形態(tài)是壟斷。屆時小型互聯(lián)網(wǎng)公司將不得不對大數(shù)據(jù)托拉斯繳納高昂的市場進(jìn)入稅,直接損害社會福利。而微軟公司的視窗系統(tǒng),蘋果公司的App Store都已經(jīng)出現(xiàn)了這一問題。
知識產(chǎn)權(quán)路徑則面臨制度需求小、負(fù)外部性大的問題。大數(shù)據(jù)在技術(shù)方面類似計算機軟件著作權(quán),目前也確實在通過這一途徑實現(xiàn)部分財產(chǎn)權(quán)益保障功能。從制度需求的角度看,知識產(chǎn)權(quán)法主要保護(hù)的是實現(xiàn)大數(shù)據(jù)的外在技術(shù),而對于大數(shù)據(jù)本身的解釋力有限。其解釋力主要在于大數(shù)據(jù)分析和大數(shù)據(jù)應(yīng)用,因為此階段確實包含了大數(shù)據(jù)工程師的智慧成果。但是在大數(shù)據(jù)挖掘方面則很難解釋,比如Cookies(電腦上網(wǎng)緩存)與網(wǎng)絡(luò)痕跡,并不包含明顯的智慧加工。同時由于諸如Hadoop、HDFS、Mapreduce等主流大數(shù)據(jù)開發(fā)和處理軟件為了快速普及、降低開發(fā)成本、實現(xiàn)行業(yè)話語等商業(yè)考量基本都采取了開源的方式,即很大程度上放棄了智慧成果的專屬權(quán)。故而如前所述,在大數(shù)據(jù)挖掘方面知識產(chǎn)權(quán)性體現(xiàn)的不明顯。最關(guān)鍵的問題是知識產(chǎn)權(quán)法某種程度上說是以限制應(yīng)用來鼓勵創(chuàng)新。這與數(shù)據(jù)共享和零交易成本的“互聯(lián)網(wǎng)+”方向相左。從卡爾多-??怂棺顑?yōu)的角度來說,應(yīng)該以補償大數(shù)據(jù)企業(yè)及其工程師的方式限制大數(shù)據(jù)的知識產(chǎn)權(quán)屬性。
相較于債權(quán)、知識產(chǎn)權(quán)這兩種路徑,“物權(quán)路徑”的制度效率最高,債權(quán)次之、知識產(chǎn)權(quán)最次。之所以“物權(quán)路徑”制度效率最高,理由在于兩方面。
第一是需要克服的制度稟賦難度低、制度改進(jìn)成本小。若將大數(shù)據(jù)解釋為一種物權(quán)客體,則現(xiàn)有物權(quán)體系中的無體物基本能夠相融,從而更容易被立法者接受,克服制度稟賦難度較小。具體來說,物權(quán)的占有、使用、收益、處分四大權(quán)能較好對應(yīng)大數(shù)據(jù)流程,占有對應(yīng)大數(shù)據(jù)挖掘和大數(shù)據(jù)存儲,使用對應(yīng)大數(shù)據(jù)分析和大數(shù)據(jù)應(yīng)用,收益和處分對應(yīng)大數(shù)據(jù)交易,這方面明顯優(yōu)于知識產(chǎn)權(quán)路徑;另外民法學(xué)界共識物權(quán)客體范圍不宜過窄已成通說,在法律邏輯上的改動幅度小,不易觸及民法成熟體系的歷史稟賦,被民法典或其他私法部門法采納的阻力小、可能性高。
第二是抑制制度負(fù)外部性,降低交易費用。這又具體分成三個角度,首先是物權(quán)路徑不會直接導(dǎo)致因過度意思自治帶來的壟斷和不正當(dāng)競爭以及其他市場失靈情形,甚至可以有效抑制壟斷(應(yīng)用階段大數(shù)據(jù)產(chǎn)權(quán)公有化,下文詳述)從而優(yōu)于債權(quán)路徑;其次是物權(quán)路徑權(quán)責(zé)最為明晰,大數(shù)據(jù)產(chǎn)權(quán)的所有者與應(yīng)用者即相關(guān)法律責(zé)任的承擔(dān)者,相較于債權(quán)路徑而言降低了因合同相對性與內(nèi)外雙重效力導(dǎo)致的“侵權(quán)無責(zé)”傷害社會福利的情形;最后是流轉(zhuǎn)順暢,相較于知識產(chǎn)權(quán)路徑而言將大數(shù)據(jù)理解為一種無體物動產(chǎn)則沒有復(fù)雜的登記與公示,更有利于大數(shù)據(jù)流轉(zhuǎn)和信息的傳播以及由此帶來的激勵創(chuàng)新等正外部性的產(chǎn)生。
大數(shù)據(jù)的權(quán)利內(nèi)容即哪些具體權(quán)利應(yīng)該被法律明確規(guī)定、保障。大數(shù)據(jù)的權(quán)利內(nèi)容從具體層面上講,在諸如電商大數(shù)據(jù)、醫(yī)療大數(shù)據(jù)、金融大數(shù)據(jù)各有其差異,篇幅所限不宜贅述。但從產(chǎn)業(yè)鏈條上時間先后順序來看大體包含大數(shù)據(jù)挖掘階段、大數(shù)據(jù)存儲階段、大數(shù)據(jù)分析階段、大數(shù)據(jù)應(yīng)用階段的權(quán)利內(nèi)容四部分。當(dāng)然,由于在技術(shù)創(chuàng)新和商業(yè)創(chuàng)新領(lǐng)域,非正式制度對正式制度發(fā)揮著類似企業(yè)機制對市場機制的有效替代作用。故而并非大數(shù)據(jù)的所有權(quán)利內(nèi)容都適宜通過《民法分則》《個人信息保護(hù)法》或其他法律部門予以規(guī)制。以下說明的都是通過成文法尤其是民法典予以規(guī)制更具制度效率的大數(shù)據(jù)基本權(quán)利內(nèi)容。
大數(shù)據(jù)挖掘階段的權(quán)利內(nèi)容主要包括有Cookies輔助數(shù)據(jù)、網(wǎng)站爬行數(shù)據(jù)和旁路采集數(shù)據(jù)等*Cookies是讓網(wǎng)站服務(wù)器把少量數(shù)據(jù)儲存到客戶端的硬盤或內(nèi)存,或是從客戶端的硬盤讀取數(shù)據(jù)的一種技術(shù),包含相當(dāng)?shù)挠脩粜畔ⅲ喈?dāng)于確定網(wǎng)站中用戶的身份證,其存在形式與一般意義上理解的“電腦緩存”近似。網(wǎng)站爬行數(shù)據(jù)是網(wǎng)站上發(fā)生一切變化的數(shù)據(jù)記錄,其應(yīng)用的典型例子“量子恒道”,在PC端淘寶店鋪的左下角經(jīng)??梢钥吹剑峭ㄟ^分析流量、銷售、購買群、推廣效果等買家、賣家在平臺上發(fā)生的一切數(shù)據(jù)進(jìn)行搜集整理從而進(jìn)行優(yōu)化店鋪經(jīng)營的輔助工具。旁路采集數(shù)據(jù)也叫旁路監(jiān)聽數(shù)據(jù),是通過鏡像交換機的方式將出口數(shù)據(jù)備份到指定服務(wù)器進(jìn)行同態(tài)模擬、記錄與分析而產(chǎn)生的數(shù)據(jù)??梢越频乩斫鉃榱硪慌_服務(wù)器對用戶在網(wǎng)上各種訪問行為的鏡像或者說實時錄像。。這三種數(shù)據(jù)分別涵蓋了大數(shù)據(jù)中的靜態(tài)數(shù)據(jù)(含線上、線下)和動態(tài)數(shù)據(jù),如同在圍棋中占了三點“邊星”即鎖定了大局。目前Cookies輔助數(shù)據(jù)、網(wǎng)站爬行數(shù)據(jù)的主要爭論發(fā)生在學(xué)界而非實務(wù)界*實務(wù)界也即互聯(lián)網(wǎng)公司、數(shù)據(jù)服務(wù)公司等,由于前述三種數(shù)據(jù)或者有著嚴(yán)格的加密系統(tǒng),或者時效性非常有限,或者專用性非常強(比如在淘寶量子恒道搜集的數(shù)據(jù)放到京東平臺上意義并不直接,用戶數(shù)據(jù)并不共享),所以實務(wù)界對于數(shù)據(jù)采集基本是“井水不犯河水”,爭議不大。而2014年“北京百度網(wǎng)訊科技公司與朱燁隱私權(quán)糾紛案”經(jīng)過二審,南京市中級人民法院認(rèn)定“百度網(wǎng)訊公司的個性化推薦行為不構(gòu)成侵犯朱燁的隱私權(quán)”,事實上認(rèn)可了網(wǎng)絡(luò)服務(wù)提供者對cookies數(shù)據(jù)擁有所有權(quán),但有保護(hù)隱私的注意義務(wù)。國內(nèi)學(xué)界有268篇論文討論了cookie與隱私權(quán)的關(guān)系問題,大體分成了三派觀點。盡管cookie輔助數(shù)據(jù)與網(wǎng)絡(luò)爬行數(shù)據(jù)、旁路采集數(shù)據(jù)不盡相同,但同作為網(wǎng)絡(luò)服務(wù)者挖掘用戶數(shù)據(jù)的工具有相當(dāng)?shù)慕梃b意義。,大體流行三種說法即產(chǎn)生者所有說、挖掘者所有說和折中的必要契約說*產(chǎn)生者所有說認(rèn)為cookie數(shù)據(jù)應(yīng)屬于用戶所有,核心原因是cookie記載的是用戶的各類身份信息。挖掘者所有說認(rèn)為cookie數(shù)據(jù)應(yīng)屬于網(wǎng)絡(luò)服務(wù)提供者所有,經(jīng)典的舉例是“好比一個人在別人的土地上留下了一串腳印,這串腳印當(dāng)然屬于土地所有權(quán)人”。折中的必要契約說認(rèn)為cookie數(shù)據(jù)本身是屬于用戶所有,但是在訪問網(wǎng)站時依據(jù)相關(guān)協(xié)議已經(jīng)發(fā)生了所有權(quán)轉(zhuǎn)移,屬于依合同取得所有權(quán)的情形。篇幅所限,在此僅簡單介紹。關(guān)于互聯(lián)網(wǎng)各類計算機數(shù)據(jù)的產(chǎn)權(quán)問題目前大都屬于法律空白領(lǐng)域,受制于法律人的計算機與統(tǒng)計學(xué)的專業(yè)水平,進(jìn)展一直較為緩慢,使得互聯(lián)網(wǎng)長期存在大范圍的法外之地。。此類元數(shù)據(jù)是整個大數(shù)據(jù)產(chǎn)業(yè)的原材料,也是前述“大數(shù)據(jù)定義”中的“數(shù)字信息”。缺乏界定已經(jīng)產(chǎn)生了高額外部性隱患,即Cookies等元數(shù)據(jù)處于公共產(chǎn)品狀態(tài),極低的平均可變成本使得騰訊、阿里等大型互聯(lián)網(wǎng)企業(yè)在短時間內(nèi)獲取了10億級的個人數(shù)字信息,企業(yè)在某些領(lǐng)域正在比他們的國家更了解他的人民。進(jìn)一步的數(shù)據(jù)搜集將使得壟斷加劇,新型企業(yè)不依托數(shù)據(jù)支持將很難進(jìn)入相關(guān)領(lǐng)域,進(jìn)而損害社會福利。這不能通過互聯(lián)網(wǎng)公司參與制定的行業(yè)慣例與標(biāo)準(zhǔn)進(jìn)行界定,成文法的比較制度優(yōu)勢必要發(fā)揮。
大數(shù)據(jù)存儲、分析階段*廣義上的大數(shù)據(jù)挖掘包含大數(shù)據(jù)存儲和大數(shù)據(jù)分析,狹義的大數(shù)據(jù)存儲即大數(shù)據(jù)數(shù)據(jù)庫,大數(shù)據(jù)分析即根據(jù)大數(shù)據(jù)挖掘目標(biāo)對已存儲的大數(shù)據(jù)進(jìn)行分析整理得出模型、結(jié)論或其他有價信息。大數(shù)據(jù)存儲和大數(shù)據(jù)分析在實踐中是云計算的靜態(tài)和動態(tài)過程的統(tǒng)一,兩者其實很難分得開?!胺治觥笔恰按鎯Α钡哪康?,不需要分析的數(shù)據(jù)也沒必要存儲。當(dāng)然,由于單位硬件存儲成本的飛速下降,“備而不用”的機會成本降低,“存儲”也有了獨立于“分析”而存在的現(xiàn)實。的權(quán)利內(nèi)容主要包括清潔數(shù)據(jù)、區(qū)塊鏈數(shù)據(jù)、Hadoop的MapReduce分散節(jié)點數(shù)據(jù)、用戶行為模型數(shù)據(jù)等方面*清潔數(shù)據(jù)、區(qū)塊鏈數(shù)據(jù)、Hadoop的MapReduce分散節(jié)點數(shù)據(jù)、用戶行為模型數(shù)據(jù)是大數(shù)據(jù)運作流程的各個步驟。簡單來說,將cookie等包含豐富個人信息的一般數(shù)據(jù)進(jìn)行重新編碼,非個人信息化以實現(xiàn)數(shù)據(jù)清潔(也即原有的個人信息此時已經(jīng)成了某種程序語言,非專業(yè)者看起來會覺得更像是亂碼,不可辨認(rèn))。區(qū)塊鏈數(shù)據(jù)簡單來說可以比作大數(shù)據(jù)蜂房中的一個個六角形房孔,主要是用來保密存儲個人數(shù)據(jù)(不是個人信息,至少不是以一般可辨認(rèn)形式存在的個人信息)的,當(dāng)然其應(yīng)用范圍在不斷擴(kuò)展其內(nèi)涵的當(dāng)下也遠(yuǎn)遠(yuǎn)不止如此。簡單理解Hadoop的MapReduce分散節(jié)點數(shù)據(jù)就是前文提到的分散式運算存儲在不同計算機節(jié)點中的數(shù)據(jù),比如將10PB數(shù)據(jù)分配到一百臺終端中進(jìn)行存儲和計算,每臺終端中的數(shù)據(jù)即是。用戶行為模型數(shù)據(jù)顧名思義,是大數(shù)據(jù)的核心目標(biāo)之一,通過多方面搜集個體身份、年齡、購買力、信用度等盡可能多的信息準(zhǔn)確預(yù)測個人行為以進(jìn)行定價、精準(zhǔn)廣告推送、精準(zhǔn)營銷以及在人工智能、VR等領(lǐng)域無限的開發(fā)潛力。。從法律經(jīng)濟(jì)學(xué)的角度來看,之所以區(qū)塊鏈數(shù)據(jù)等大數(shù)據(jù)權(quán)利內(nèi)容應(yīng)該通過成文法進(jìn)行規(guī)定,是因為目前大數(shù)據(jù)產(chǎn)品交易中存在較高的制度風(fēng)險與制度成本。這種風(fēng)險主要體現(xiàn)在商事私人談判中違約收益過高,商業(yè)交易缺乏穩(wěn)定性。比如甲公司購買乙公司挖掘并清洗的數(shù)據(jù),或租賃了確定時間的區(qū)塊鏈數(shù)據(jù)訪問權(quán)限,在此過程中該如何解決復(fù)制了對方的數(shù)據(jù)后即違約或解約并轉(zhuǎn)賣其數(shù)據(jù)庫內(nèi)容或算法的問題。由于數(shù)據(jù)摩擦微弱的技術(shù)特點,大數(shù)據(jù)復(fù)制的邊際成本可以忽略不計。在現(xiàn)有區(qū)塊鏈數(shù)據(jù)與清潔數(shù)據(jù)權(quán)屬不明的情況下,合同違約存在行為激勵。為此,大數(shù)據(jù)出賃方為規(guī)避合同違約風(fēng)險就不得不選擇加大投入開發(fā)保密技術(shù)或者提高出賃價格,這將使得生產(chǎn)者剩余與消費者剩余雙雙下降,進(jìn)而妨礙社會福利的實現(xiàn)[4]24。以上事實說明靠契約解決大數(shù)據(jù)確權(quán)制度成本過高。應(yīng)該依照規(guī)范的霍布斯定理,通過立法明晰大數(shù)據(jù)產(chǎn)權(quán)以促進(jìn)合作。
大數(shù)據(jù)應(yīng)用階段*應(yīng)用階段主要是將大數(shù)據(jù)分析后的具體模型實際應(yīng)用,最典型的是CCM也就是個性化廣告推送。目前大數(shù)據(jù)應(yīng)用的核心在于商業(yè)應(yīng)用,商業(yè)應(yīng)用利潤的主要來源是精準(zhǔn)營銷收入,精準(zhǔn)營銷收入的主要方法是個性化廣告推送和經(jīng)營策略優(yōu)化。這當(dāng)然還比較初級,但是現(xiàn)實也很本質(zhì)——大數(shù)據(jù)的核心目的是精確。前述大數(shù)據(jù)挖掘、存儲和分析本質(zhì)上就是個統(tǒng)計學(xué)的技術(shù)表現(xiàn)。一定意義上,大數(shù)據(jù)應(yīng)用就是無數(shù)組個性化統(tǒng)計學(xué)報告的可視化——我經(jīng)常去吃什么菜,最后在APP上呈現(xiàn)給我的就是什么飯店。所以這個問題的實質(zhì)是問可視化的統(tǒng)計報告歸誰所有。那按照一般的財產(chǎn)法思維,作為知識產(chǎn)權(quán)中的著作權(quán)自然歸制作人所有。而制作人基本是公司雇傭的,和公司之間有協(xié)議,這也同樣根據(jù)知識產(chǎn)權(quán)規(guī)則,委托制作開發(fā)則有約定按約定,所以歸委托方所有,也就是大數(shù)據(jù)服務(wù)的提供者所有。主要包括LBS數(shù)據(jù)、CRM數(shù)據(jù)等*LBS(location based services)基于位置的服務(wù),比如手機定位、百度地圖、微信位置分享、搖一搖等。CRM(customer relation management)是客戶管理系統(tǒng),比如根據(jù)顧客消費金額及區(qū)間決定折扣力度等。。如前文對“大數(shù)據(jù)”的定義,大數(shù)據(jù)興起的根本動因是精準(zhǔn)預(yù)測,而LBS、CRM以及在可視化(VR)、人工智能等方面的大數(shù)據(jù)本質(zhì)也都服務(wù)于這一目標(biāo)。但諸如用戶將自己的位置信息通過微信轉(zhuǎn)發(fā)給朋友,接受京東商城等電商的個性化推送,抑或是醫(yī)療機構(gòu)針對患者病史提出的轉(zhuǎn)向醫(yī)療服務(wù)和意見,這些轉(zhuǎn)發(fā)、推送、獲取的大數(shù)據(jù)應(yīng)用權(quán)屬皆不明確。從法律經(jīng)濟(jì)學(xué)的角度分析這一方面導(dǎo)致逆向選擇問題,用戶相對于大數(shù)據(jù)應(yīng)用運營者而言屬于無信息乙方,無法觀察到特征組合的不合意傾向,進(jìn)而承擔(dān)物品價高或質(zhì)量低的風(fēng)險,損害消費者剩余與社會福利。比如滴滴打車會在交通閑時推薦忙時路線(擁堵少但繞遠(yuǎn)),導(dǎo)致用戶打車費用的增加,而用戶卻無法起訴滴滴損害了自己何種權(quán)益,若是根據(jù)合同主張滴滴沒有履行誠實信用義務(wù)將自己按照最合適路程安全送達(dá)目的地,則一方面舉證難度過高,另一方面又面臨訴訟成本高于訴訟受益的“正義不及于一元錢”法律經(jīng)濟(jì)學(xué)困局,故而也需要法律明文規(guī)定權(quán)屬。
如前所述,在大數(shù)據(jù)定性的制度選擇中,將大數(shù)據(jù)定性為一種物權(quán)更具有效率。在物權(quán)路徑下更為具體的制度選擇中,物權(quán)由占有、使用、轉(zhuǎn)讓、收益、處分等權(quán)能構(gòu)成,故而在大數(shù)據(jù)各流程中又面臨著哪些主體對大數(shù)據(jù)享有完整物權(quán)權(quán)能抑或不完整權(quán)能這兩種路徑之間的制度競爭問題,需要進(jìn)一步分析。
大數(shù)據(jù)挖掘階段選擇完整物權(quán)權(quán)能路徑更有效率,應(yīng)將Cookies輔助數(shù)據(jù)、網(wǎng)站爬行數(shù)據(jù)和旁路采集數(shù)據(jù)等大數(shù)據(jù)的物權(quán)歸屬于大數(shù)據(jù)挖掘者所有。
從占有權(quán)能的角度說,此階段數(shù)據(jù)挖掘者占有大數(shù)據(jù)交易成本更低。對此,目前學(xué)界和社會公眾中比較流行的看法是“大數(shù)據(jù)時代個人信息應(yīng)歸個人所有,用戶對自己不愿意公開的信息享有被遺忘權(quán)”。這種“被遺忘權(quán)”雖然一般被認(rèn)為屬于知識產(chǎn)權(quán)法的范疇,但是從物權(quán)法與知識產(chǎn)權(quán)法的一般關(guān)系來看,“被遺忘權(quán)”本質(zhì)上是默認(rèn)用戶對個人信息享有占有權(quán)的前提下產(chǎn)生的一種返還占有請求權(quán),是典型的物上請求權(quán)。前文已經(jīng)駁斥過大數(shù)據(jù)語境下主流觀點所認(rèn)為的“個人用戶是數(shù)據(jù)產(chǎn)生者,網(wǎng)絡(luò)經(jīng)營者是數(shù)據(jù)應(yīng)用者”。用戶確實是個人信息的產(chǎn)生者和所有者,但是并不是被數(shù)字化、匿名化以及其他大數(shù)據(jù)技術(shù)處理后的個人信息的產(chǎn)生者與所有者。將挖掘階段大數(shù)據(jù)的占有權(quán)歸屬于個人用戶的制度設(shè)計是明顯無效率性的。一方面是因為這增加了締約成本,也即大數(shù)據(jù)挖掘有賴于與數(shù)據(jù)挖掘企業(yè)與用戶訂立契約并按照現(xiàn)行的合同法對格式條款要盡到充分的提示義務(wù)。數(shù)據(jù)挖掘經(jīng)常是在幾毫秒之間即完成的,但是由于占有權(quán)不明,部分企業(yè)考慮到用戶對大數(shù)據(jù)具有占有權(quán)而用強制的“五秒倒計時”*比如安卓客戶端百度的數(shù)據(jù)應(yīng)用提示如下“您確定已知曉并同意下述服務(wù)改進(jìn)計劃條款(5)”,括號中的“5”是五秒倒數(shù)計時的第一個數(shù)字。提示隱私條款和數(shù)據(jù)挖掘許可條款,大大降低了數(shù)據(jù)挖掘效率。另一方面是增加了履約成本。如果占有權(quán)歸屬于用戶,則用戶依據(jù)返還占有請求權(quán)行使個人信息的“被遺忘權(quán)”。以全球大數(shù)據(jù)企業(yè)領(lǐng)頭羊的Google在歐洲的遭遇為例,每年要收到數(shù)萬份個人信息刪除的請求。為此Google等公司成立了專家組和刪除組去審核這些申請并予以回復(fù)、查詢、刪除。這種契約轉(zhuǎn)讓大數(shù)據(jù)占有權(quán)的法律邏輯極大推高了企業(yè)的履約成本,進(jìn)而妨礙了生產(chǎn)者剩余和社會總剩余最大化的實現(xiàn)。
從使用、處分權(quán)能的角度說,由于信息成本過高,挖掘階段的使用權(quán)人應(yīng)該是大數(shù)據(jù)挖掘者而不是用戶?!靶畔ⅰ笔谴髷?shù)據(jù)產(chǎn)業(yè)的主要原材料,大數(shù)據(jù)挖掘的過程即信息獲取的過程或生產(chǎn)大數(shù)據(jù)的過程,而這一過程目前成果過高。具體包括固定成本和可變成本等經(jīng)濟(jì)學(xué)基本邏輯內(nèi)容。相較于企業(yè)而言,單個自然人用戶進(jìn)行數(shù)據(jù)挖掘的平均可變成本過高,既沒有效率也缺乏可能。而目前由于租賃云服務(wù)(存儲)和超級計算機的成本仍舊過高,規(guī)模經(jīng)濟(jì)以下的中小企業(yè)仍然無法充分利用大數(shù)據(jù)工具服務(wù)于生產(chǎn)。大數(shù)據(jù)目前的主要用戶仍然是規(guī)模經(jīng)濟(jì)的大型企業(yè)或政府。相較于將挖掘階段的大數(shù)據(jù)確權(quán)給自然人,確權(quán)給有挖掘能力及有效率的企業(yè)與政府則更有利于這一技術(shù)正外部性的拓展與實現(xiàn)。
從轉(zhuǎn)讓與收益的角度說,相對于用戶而言,大數(shù)據(jù)挖掘者享有轉(zhuǎn)讓與收益權(quán)更有利于降低交易成本和促成私人談判。大數(shù)據(jù)挖掘市場正處于非完全競爭狀態(tài),不同于新古典經(jīng)濟(jì)學(xué)基本假設(shè)中的“完全競爭”即無壟斷、無摩擦、信息對稱的自動均衡市場,大數(shù)據(jù)挖掘市場目前摩擦成本高起,信息不對稱情況嚴(yán)重。由于“數(shù)據(jù)豎井”(數(shù)據(jù)壁壘)*Data Silo(DS),狹義上代指各公司數(shù)據(jù)庫由不同軟件公司開發(fā)所以很難將其整合。但是隨著技術(shù)的發(fā)展,技術(shù)障礙已不再是主要矛盾。故而數(shù)據(jù)豎井向廣義發(fā)展,近似于數(shù)據(jù)壁壘,指的是各企業(yè)、國家之間各自為戰(zhàn)拒絕共享數(shù)據(jù)以促進(jìn)社會和人類福利的最大化。的存在,非相關(guān)專業(yè)的元數(shù)據(jù)占有者(即用戶)想要通過私人談判實現(xiàn)元數(shù)據(jù)交易的成本過高,且削減這種成本促使個體用戶直接交易緩存也無必要。反之,大數(shù)據(jù)最為流行的Hadoop平臺核心步驟HDFS(分布式計算)極類似法律經(jīng)濟(jì)學(xué)中的私人談判,由各節(jié)點依據(jù)協(xié)議分散運算并以最低的成本完成數(shù)據(jù)挖掘。進(jìn)而企業(yè)或政府能夠以更低的成本實現(xiàn)私人談判與合作,最大限度加速大數(shù)據(jù)有效挖掘,進(jìn)而形成全社會范圍內(nèi)有效的大數(shù)據(jù)流動和社會福利的增加。
該階段權(quán)利應(yīng)歸委托人所有或依據(jù)契約進(jìn)行產(chǎn)權(quán)確認(rèn)。大數(shù)據(jù)存儲、分析階段也即“云計算”階段,此時由于個人信息已被清潔和數(shù)字化,從而不再涉及用戶所有權(quán)問題。故而制度選擇方案即是在“云計算委托人”和“云計算受托人”之間進(jìn)行確權(quán),具體包括四種路徑,即全部分配給委托人、全部分配給受托人、法定折中分配權(quán)利和契約意思自治。在進(jìn)行制度選擇之前首先有必要審視下“云計算”市場的真實狀況,如果現(xiàn)行制度交易費用低下、制度運轉(zhuǎn)高效、負(fù)外部性可控,那么現(xiàn)行制度并不存在制度改進(jìn)空間。
“云計算”的核心資產(chǎn)是大型、超級計算機,核心競爭力是“4V”標(biāo)準(zhǔn)項下的“大量、多樣、快速、準(zhǔn)確”地運算。國內(nèi)外提供云服務(wù)的企業(yè)主要包括Google、IBM、阿里、騰訊以及華為等互聯(lián)網(wǎng)寡頭,這些企業(yè)大都本身擁有10億級別的大數(shù)據(jù)運算需求,所以本身都擁有自己的云服務(wù)軟、硬件,比如阿里巴巴集團(tuán)的“阿里云”,騰訊公司的“騰訊云”,都有自己的超級計算機中心。云服務(wù)是在滿足自身大數(shù)據(jù)運算的過程中發(fā)現(xiàn)的對主營產(chǎn)品的替代商品,將“剩余運算能力”出售給其他公司實現(xiàn)企業(yè)資產(chǎn)配置效率的最大化??偠灾F(xiàn)在“云市場”中云服務(wù)的主要生產(chǎn)者與消費者高度統(tǒng)一。
在這一過程中制度經(jīng)濟(jì)學(xué)的預(yù)言已然實現(xiàn)??扑沟挠^點,企業(yè)機制對市場機制發(fā)生替代作用的關(guān)鍵是市場交易成本高于企業(yè)內(nèi)部交易成本,以及威廉姆森發(fā)展的交易費用理論“當(dāng)資產(chǎn)具有高強度專用性或者高頻率交易的情況下,由企業(yè)內(nèi)部交易更有效率”[5]149-151完美地描述了現(xiàn)在的云服務(wù)市場現(xiàn)狀。在占市場主導(dǎo)地位的互聯(lián)網(wǎng)寡頭中,基本都采取了企業(yè)內(nèi)部云服務(wù)替代市場云交易。而由于近五年來國內(nèi)云服務(wù)市場還在以每年30%左右的增速*參見《2015—2020年中國云計算行業(yè)前景調(diào)查及投資策略分析報告》。拓展,目前云市場競爭較為充分,使用成本低廉,信息獲取便利,沒有明顯阻礙私人談判和抬高交易成本以阻礙社會福利的情況。另外,大數(shù)據(jù)的存儲方式和分析技術(shù)隨著產(chǎn)業(yè)革新而處于動態(tài)調(diào)整狀態(tài),通過描述性立法對該階段的各項具體大數(shù)據(jù)權(quán)利內(nèi)容的主體進(jìn)行明晰,則面臨頻發(fā)的法律修訂和高昂的立法成本[6]1331-1334。所以目前立法應(yīng)該在云服務(wù)市場中保持“謙抑”,交由合同法與契約自治去解決存儲、計算階段的大數(shù)據(jù)確權(quán)問題。
應(yīng)用階段的大數(shù)據(jù)應(yīng)被界定為公有產(chǎn)權(quán),屬于全體社會成員所有,但需要法律對其邊界加以具體限制。
前文已述,大數(shù)據(jù)的法律屬性是一種物權(quán),包括占有、使用、轉(zhuǎn)讓與收益、處分四種權(quán)能。其確權(quán)面臨的制度選擇是在公有產(chǎn)權(quán)路徑與私有產(chǎn)權(quán)路徑之間(包括運營商所有和用戶所有)進(jìn)行比較,將完整權(quán)能或部分權(quán)能賦予何者交易成本更低、制度效率更高。
從占有的角度來說,LBS數(shù)據(jù)、CRM數(shù)據(jù)等應(yīng)用階段的大數(shù)據(jù)事實上已歸屬于政府和運營商占有,而這種占用基于法律行為而產(chǎn)生,且目前并未產(chǎn)生足以降低社會福利的負(fù)外部性影響,故而暫時不需要調(diào)整。
從使用的角度來說,應(yīng)用階段的大數(shù)據(jù)不應(yīng)私有化。主要原因在于這將抑制正外部性溢出并催生壟斷。從供給側(cè)改革的角度來看,應(yīng)用階段大數(shù)據(jù)若歸屬于少數(shù)大型互聯(lián)網(wǎng)公司則意味著法律為價格歧視和無謂損失提供溫床。其他企業(yè)在無力承擔(dān)高昂運維成本時必須購買其大數(shù)據(jù)產(chǎn)權(quán),否則將失去精確供給能力和市場競爭力。若購買則提升商品的邊際成本,造成部分消費需求沒有得到滿足進(jìn)而降低社會福利;若不購買則使得商品生存的過?;虿蛔鉡7]91-93,而無論是哪種結(jié)果都與供給側(cè)改革相悖。從“大眾創(chuàng)業(yè),萬眾創(chuàng)新”的角度來講,應(yīng)用階段的大數(shù)據(jù)確權(quán)將對無償公開大數(shù)據(jù)成果產(chǎn)生負(fù)面激勵,抬高企業(yè)創(chuàng)新與科學(xué)研究的成本,阻礙正外部性的產(chǎn)生與技術(shù)溢出。
從轉(zhuǎn)讓、收益和處分的角度來說,將應(yīng)用階段大數(shù)據(jù)界定為私有產(chǎn)權(quán)將導(dǎo)致交易成本陡然增加。這主要是通過增加合同履行成本以及削減社會有效需求而產(chǎn)生的。大數(shù)據(jù)根本追求是共享和開放,確權(quán)意味著應(yīng)用階段的大數(shù)據(jù)本身可以定價,即乘坐一次網(wǎng)約車要給運營商、導(dǎo)航、語音、搜索等多種企業(yè)支付對價,而非當(dāng)下通過替代支付手段即通過使消費者接受廣告而由廣告主支付相關(guān)服務(wù)費用。比如規(guī)定LBS大數(shù)據(jù)應(yīng)用歸運營商所有,則百度地圖、谷歌地圖將有理由收費使用。關(guān)于企業(yè)選址、市政規(guī)劃、個人出行的整體社會成本都會受到影響。
總而言之,應(yīng)用階段的大數(shù)據(jù)從社會總體福利的角度來講應(yīng)該參考土地制度,界定為公共所有并交由政府管理。對于應(yīng)用階段的大數(shù)據(jù),與其說“凱恩斯主義”比起“奧地利學(xué)派”更有效率,不如說應(yīng)該在宏觀管制的框架下盡可能實施大數(shù)據(jù)的零交易成本流動。具體方式可以通過成立“中央大數(shù)據(jù)銀行”[8]711-714對大數(shù)據(jù)市場實施“統(tǒng)而少治”[9]2。一方面限縮大數(shù)據(jù)的流動規(guī)模以保護(hù)國家信息安全和防治大數(shù)據(jù)的“新型國有資產(chǎn)流失”,另一方面限制大數(shù)據(jù)發(fā)展中的市場失靈,比如大型互聯(lián)網(wǎng)企業(yè)大數(shù)據(jù)托拉斯的形成[10]1451。
[1] [美]埃里克·西格爾.大數(shù)據(jù)預(yù)測[M].周昕,譯.北京:中信出版社,2014.
[2] 周林彬,董淳鍔.中國商會立法芻議:從契約的視角[J].南開學(xué)報(哲學(xué)社會科學(xué)版),2007(02).
[3] [德]托馬斯·舒爾茨.Google:未來之鏡[M].嚴(yán)孟然,陳琴,譯.北京:當(dāng)代中國出版社,2016.
[4] 周林彬.市場經(jīng)濟(jì)法立法的成本效益分析[J].中國法學(xué),1995(1).
[5] 周林彬.法律經(jīng)濟(jì)學(xué):中國的理論與實踐[M].北京:北京大學(xué)出版社,2008.
[6] Krotoszynski,Ronald J.Jr.Reconciling Privacy and Speech in the Era of Big Data:A Comparative Legal Analysis[J].William&MaryLawReview,2015,56(4).
[7] 魏建,周林彬.法經(jīng)濟(jì)學(xué)[M].北京:中國人民大學(xué)出版社,2008.
[8] Data Bank.Ownership of Demand Deposits[J].Federal Reserve Bulletin,1954,40(7).
[9] Sieben,Katie Clark.Labor Markets in 2040:Big Data Could Be a Big Deal for Jobseekers[J].Monthly Labor Review,2016,139(2).
[10] Price,W.Nicholson II,Big Data,Patents,and the Future of Medicine[J].Cardozo Law Review,2016,3(4).