国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)生產(chǎn)理論下爬蟲技術(shù)的法律規(guī)制路徑*

2022-02-09 08:24:10高富平冉高苒
江淮論壇 2022年5期
關(guān)鍵詞:運(yùn)營(yíng)者爬蟲生產(chǎn)

高富平 冉高苒

(華東政法大學(xué)法律學(xué)院,上海 200042)

一、引言

在諸如人工智能、云計(jì)算、區(qū)塊鏈等紛繁復(fù)雜的新興技術(shù)之中,爬蟲技術(shù)(Data Scraping)似乎難以“新技術(shù)”自居。簡(jiǎn)單說來,爬蟲技術(shù)就是從一個(gè)或多個(gè)網(wǎng)站上掃描和提取大量數(shù)據(jù)副本的過程。[1]從起源時(shí)間來看,早在20世紀(jì)90年代末,美國(guó)出現(xiàn)的賬戶聚合服務(wù)(Account Aggregation)中就已經(jīng)使用了早期的屏幕爬蟲(Screen Scraping)技術(shù),使客戶能夠在一個(gè)地方查看自己來自不同機(jī)構(gòu)的賬戶信息。[2]而我們慣常使用的谷歌搜索引擎也是在這個(gè)時(shí)期出現(xiàn),它也是爬蟲技術(shù)的早期技術(shù)形態(tài)。[3]2-3從技術(shù)普及情況來看,爬蟲技術(shù)已經(jīng)在眾多互聯(lián)網(wǎng)領(lǐng)域開始普遍使用。有機(jī)構(gòu)統(tǒng)計(jì),目前有將近二分之一的網(wǎng)絡(luò)流量來自爬蟲技術(shù)。[4]爬蟲技術(shù)已經(jīng)成為被普遍使用的網(wǎng)絡(luò)技術(shù)之一。

新技術(shù)會(huì)提高生產(chǎn)力,促進(jìn)經(jīng)濟(jì)發(fā)展,會(huì)帶來巨大的社會(huì)進(jìn)步,但同時(shí)也會(huì)帶來在政治制度、社會(huì)制度以及經(jīng)濟(jì)制度之上的不平等。[5]對(duì)于爬蟲技術(shù)而言,由于其獲取散落數(shù)據(jù)的便捷性與低成本性,一方面成為需求者高效獲取數(shù)據(jù)的主要途徑,其重要性之于特定網(wǎng)絡(luò)商業(yè)模式不言而喻,但另一方面又因?yàn)槠浣啤氨I竊”“掠奪”的資源獲取方式,給被爬者帶來了極大的防范成本和經(jīng)營(yíng)困局,甚至由于其違背Robots協(xié)議(1)等“君子協(xié)定”而成為網(wǎng)絡(luò)世界人人喊打的“害蟲”。因此,對(duì)于技術(shù)與法律的研究者來說,需要謹(jǐn)慎、客觀地推進(jìn)我們對(duì)新興技術(shù)領(lǐng)域的連續(xù)性觀察,及早發(fā)現(xiàn)既有模式存在的問題并加以改進(jìn),從而探索出符合人類社會(huì)普遍認(rèn)知與行為準(zhǔn)則的途徑。[6]

本文將按照如下邏輯展開討論。首先,爬蟲技術(shù)呈現(xiàn)出從表層內(nèi)容爬蟲到底層原始數(shù)據(jù)爬蟲的流變趨勢(shì)。爬蟲技術(shù)的原始性、寄生性等特質(zhì)導(dǎo)致了目前的巨大爭(zhēng)議,而實(shí)踐中單純依靠現(xiàn)有法律規(guī)范并不能完全化解這些爭(zhēng)議。其次,從生產(chǎn)性的維度來看,爬蟲技術(shù)的流變是互聯(lián)網(wǎng)生產(chǎn)活動(dòng)由內(nèi)容生產(chǎn)向數(shù)據(jù)生產(chǎn)深化的結(jié)果與體現(xiàn)。其中網(wǎng)絡(luò)運(yùn)營(yíng)者(或稱網(wǎng)絡(luò)平臺(tái))發(fā)揮著重要的組織核心作用。(2)但現(xiàn)有法律并未對(duì)代碼層面的數(shù)據(jù)生產(chǎn)活動(dòng)進(jìn)行必要的規(guī)范,這在一定程度上導(dǎo)致了以爬蟲技術(shù)為代表的數(shù)據(jù)生產(chǎn)、利用秩序的混亂。理性對(duì)待爬蟲技術(shù)負(fù)面影響的同時(shí),我們必須認(rèn)識(shí)到其本質(zhì)是獲取數(shù)據(jù)生產(chǎn)活動(dòng)所需的生產(chǎn)要素,核心目的系為實(shí)現(xiàn)數(shù)據(jù)重用。最后,通過對(duì)于各國(guó)探索與中國(guó)實(shí)踐的經(jīng)驗(yàn)總結(jié),本文將討論如何超越數(shù)據(jù)權(quán)屬爭(zhēng)論,從數(shù)據(jù)利用秩序上解決爬蟲爭(zhēng)議的問題。網(wǎng)絡(luò)運(yùn)營(yíng)者基于數(shù)據(jù)生產(chǎn)活動(dòng)事實(shí)上控制了數(shù)據(jù),法律應(yīng)當(dāng)承認(rèn)并尊重這種事實(shí)上的財(cái)產(chǎn)性權(quán)益。為防止“反公地悲劇”的出現(xiàn),法律還需要賦予網(wǎng)絡(luò)運(yùn)營(yíng)者一定的數(shù)據(jù)分享義務(wù),以實(shí)現(xiàn)數(shù)據(jù)要素的充分流通和利用,從而從根本上實(shí)現(xiàn)對(duì)于非法爬蟲的科學(xué)規(guī)制。

二、爬蟲技術(shù)的流變與爭(zhēng)議

(一)爬蟲技術(shù)的發(fā)展流變

從技術(shù)目的上來說,爬蟲技術(shù)主要是為了方便、快捷地獲取網(wǎng)絡(luò)上海量的數(shù)據(jù)/信息應(yīng)運(yùn)而生的。網(wǎng)絡(luò)可以承載傳輸海量的信息,為了獲取相關(guān)的有價(jià)值的信息,有許多公司專門雇用員工從互聯(lián)網(wǎng)上手動(dòng)收集相關(guān)內(nèi)容。(3)這樣的方式看起來似乎原始至極,但卻是爬蟲技術(shù)的初始形態(tài)。隨著技術(shù)成本的降低,爬蟲技術(shù)很快擺脫了人工的束縛,進(jìn)入程序/代碼或者機(jī)器爬蟲的階段。(4)

爬蟲技術(shù)從人工走向機(jī)器,其爬蟲對(duì)象也從淺層信息走向了底層數(shù)據(jù)。從數(shù)據(jù)/代碼角度來說,網(wǎng)絡(luò)提供的以任何形式呈現(xiàn)的內(nèi)容,包括網(wǎng)頁、超文本語言、文字、照片、視頻等等都是由結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化的定量或定性數(shù)據(jù)組成。[7]這些數(shù)據(jù),首先是用澤字節(jié)(Zettabytes)測(cè)量的海量數(shù)據(jù);其次,這些數(shù)據(jù)存儲(chǔ)有各種各樣的格式,并依賴于各種技術(shù)和標(biāo)準(zhǔn);再次,這些數(shù)據(jù)并不是靜態(tài)的,它是以極快的速度生成、流通和修改變化的。[8]為了應(yīng)對(duì)上述的技術(shù)挑戰(zhàn),現(xiàn)階段的爬蟲技術(shù)開始被廣泛地定義為一種數(shù)據(jù)收集技術(shù),包括從一般的屏幕輸出中收集數(shù)據(jù),或從大多數(shù)網(wǎng)站顯示的HTML代碼中提取數(shù)據(jù),更為流行的是在通過解析對(duì)底層網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行訪問時(shí),在沒有數(shù)據(jù)主機(jī)許可甚至感知的情況下爬取大量數(shù)據(jù)。[9]也正因此,如今爬蟲技術(shù)已經(jīng)從獲取網(wǎng)頁數(shù)據(jù)轉(zhuǎn)移至底層數(shù)據(jù),成為許多所謂的大數(shù)據(jù)公司獲取數(shù)據(jù)、從事大數(shù)據(jù)挖掘的最主要的手段[10]8,因此也被稱為數(shù)據(jù)爬蟲。

一開始,爬蟲技術(shù)看起來是一種簡(jiǎn)單的信息獲取技術(shù),或者更接近于一般的傳播媒介技術(shù),而“媒介是人的延伸”[11],爬蟲技術(shù)為網(wǎng)絡(luò)用戶提供了器官與思維上獲取半徑的擴(kuò)展,這種技術(shù)對(duì)任何網(wǎng)絡(luò)用戶而言具有積極意義。后來,人們逐漸發(fā)現(xiàn)如果爬蟲技術(shù)應(yīng)用于以信息聚合為代表的互聯(lián)網(wǎng)新興產(chǎn)業(yè)中,就不難看出其技術(shù)價(jià)值已經(jīng)由簡(jiǎn)單的信息獲取走向新的聚合價(jià)值的生產(chǎn),由此,爬蟲技術(shù)成為了一種基礎(chǔ)數(shù)據(jù)資源的獲?。ɑ蛘卟杉┕ぞ?。隨著網(wǎng)絡(luò)用戶開始習(xí)慣通過這種方式接受網(wǎng)絡(luò)服務(wù),傳統(tǒng)的(或者擁有先發(fā)優(yōu)勢(shì)的)網(wǎng)絡(luò)服務(wù)提供商就難以繼續(xù)沿用一般的網(wǎng)絡(luò)服務(wù)模式和生產(chǎn)模式開展商業(yè)活動(dòng)。因?yàn)榕老x技術(shù)開始妄圖成為一個(gè)一般性的商業(yè)模式基礎(chǔ)技術(shù)進(jìn)入已有的網(wǎng)絡(luò)生產(chǎn)組織系統(tǒng),并妄圖以改變現(xiàn)有的法律態(tài)度以使得自身可以獲得合法的生產(chǎn)性地位。在這一階段,兩者之間的張力開始顯現(xiàn),傳統(tǒng)的生產(chǎn)商渴望揭示其背后的原始性與侵入性,削弱技術(shù)本身的合法性與正當(dāng)性,從而對(duì)其使用場(chǎng)景和空間進(jìn)行壓縮。

(二)爬蟲技術(shù)的價(jià)值爭(zhēng)議與適法困境

爬蟲技術(shù)帶來的爭(zhēng)議可以從數(shù)據(jù)生產(chǎn)機(jī)制本身與法律規(guī)范兩個(gè)維度來分析。

一是數(shù)據(jù)生產(chǎn)機(jī)制層面的爭(zhēng)議。網(wǎng)絡(luò)運(yùn)營(yíng)者的構(gòu)架設(shè)計(jì)是一種面向長(zhǎng)期的市場(chǎng)性的激勵(lì)機(jī)制,還為這種機(jī)制找到了穩(wěn)定的市場(chǎng)和法律環(huán)境,通過各種方法來組織維護(hù)它,以確?!捌脚_(tái)經(jīng)濟(jì)”的各參與方可以得到確定的收益。這種機(jī)制的生產(chǎn)性成本和“交叉收益”[12]都是巨大的,但爬蟲技術(shù)“寄生蟲”般的技術(shù)邏輯卻打破了這一平衡。首先,爬蟲技術(shù)具有原始性。此處與原始性相對(duì)應(yīng)的概念是市場(chǎng)性,就是指遵循所謂“市場(chǎng)的邏輯”,即“以利人之行,實(shí)現(xiàn)利己之心”。(5)在成熟的市場(chǎng)性生產(chǎn)機(jī)制中,為生產(chǎn)作出貢獻(xiàn)的主體都恰當(dāng)?shù)孬@得了相應(yīng)的貢獻(xiàn)對(duì)價(jià)。從用戶角度來看,作為UGC(User Generated Content)的貢獻(xiàn)者,用戶一方面獲得了來自網(wǎng)絡(luò)運(yùn)營(yíng)者的激勵(lì)補(bǔ)貼,同時(shí)也可以直接獲取源于自身IP的廣告利益;而網(wǎng)絡(luò)運(yùn)營(yíng)者則在“交叉收益”的機(jī)制下獲得了源自廣告商的收益,同時(shí)也可以直接向消費(fèi)型用戶收取平臺(tái)服務(wù)的相關(guān)費(fèi)用作為提供內(nèi)容產(chǎn)品的對(duì)價(jià)。對(duì)于爬蟲技術(shù)來說,由于獲取目標(biāo)數(shù)據(jù)是不需要向被爬者支付對(duì)價(jià)的,利益的獲取方只有爬蟲者。作為原始數(shù)據(jù)的生產(chǎn)者和控制者,用戶和網(wǎng)絡(luò)運(yùn)營(yíng)者在整個(gè)爬蟲的生產(chǎn)流程中處于利益缺位的狀態(tài)。這樣的數(shù)據(jù)生產(chǎn)方式類似于“掠奪式”的原始積累,具有生產(chǎn)要素獲取機(jī)制上的原始性。

其次,爬蟲技術(shù)具有寄生性。此處與寄生性相對(duì)應(yīng)的概念是共生性,體現(xiàn)在各個(gè)機(jī)制主體(即共生單元)之間可以進(jìn)行物質(zhì)、信息和能量的雙向交流,這種交流是否存在或是否順暢是共生關(guān)系得以實(shí)現(xiàn)的基礎(chǔ)條件。[13]具體來看,就是用戶、平臺(tái)、廣告商之間可以實(shí)現(xiàn)資金、技術(shù)、信息的流通,可以構(gòu)建維持一個(gè)共生環(huán)境和共生界面。因此,有學(xué)者曾言,“共生,是運(yùn)用科技增加社會(huì)福祉,用社會(huì)訴求推動(dòng)科技創(chuàng)新的基本法則?!保?4]而爬蟲這樣的數(shù)據(jù)獲取方式是寄生性的,它的存在完全依賴于被爬平臺(tái),甚至給被爬者以破壞。爬蟲程序可以在未經(jīng)用戶和平臺(tái)同意的情況下爬取數(shù)據(jù),并可以依靠數(shù)據(jù)的重用來獲取具有競(jìng)爭(zhēng)性的用戶和廣告收入,以削弱被爬平臺(tái)的收入。此外,爬蟲技術(shù)可能收集、侵害用戶的隱私信息,甚至可能直接損害被爬者的數(shù)據(jù)主機(jī)。[3]3這樣一種數(shù)據(jù)資源的獲取是單向度的,是缺乏生態(tài)持續(xù)性的。

最后,爬蟲技術(shù)具有不穩(wěn)定性。生產(chǎn)要素供給的穩(wěn)定帶來產(chǎn)品供給的穩(wěn)定,這樣的穩(wěn)定既體現(xiàn)在產(chǎn)品的質(zhì)量上,同時(shí)也體現(xiàn)在供給的持續(xù)性上。而爬蟲面臨著技術(shù)與法律的雙重挑戰(zhàn),反爬蟲技術(shù)可以阻礙、中斷數(shù)據(jù)獲取,法律的立場(chǎng)和態(tài)度也可以從市場(chǎng)規(guī)范和商業(yè)模式的合法性上阻礙、中斷數(shù)據(jù)獲取。在數(shù)據(jù)要素市場(chǎng)中,數(shù)據(jù)要素的供給需求是動(dòng)態(tài)持續(xù)且穩(wěn)定的,而爬蟲技術(shù)是獲取靜態(tài)數(shù)據(jù)的,且隨時(shí)面臨持續(xù)性挑戰(zhàn),其獲取的數(shù)據(jù)質(zhì)量低,穩(wěn)定性低,持續(xù)性差。這既是爬蟲技術(shù)天生的缺陷,也是數(shù)據(jù)生產(chǎn)機(jī)制自我保護(hù)的體現(xiàn)。由于網(wǎng)絡(luò)數(shù)據(jù)中存在大量虛假或不完整、不標(biāo)準(zhǔn)化數(shù)據(jù),當(dāng)通過爬蟲技術(shù)手段獲取的數(shù)據(jù)呈現(xiàn)多源異構(gòu)性時(shí),數(shù)據(jù)資源的時(shí)效性、關(guān)聯(lián)性、準(zhǔn)確性無法保障,當(dāng)其被再利用后,不但造成數(shù)據(jù)分析計(jì)算價(jià)值的下降,還會(huì)造成數(shù)據(jù)資源的“污染”,嚴(yán)重危害數(shù)據(jù)要素市場(chǎng)的健康運(yùn)行。

二是現(xiàn)行法律的局限性導(dǎo)致了爬蟲技術(shù)規(guī)制問題上的巨大爭(zhēng)議與不確定。首先,版權(quán)制度無法解決數(shù)據(jù)權(quán)益問題。平臺(tái)數(shù)據(jù)來源具有多樣性,以微信公眾號(hào)為例,平臺(tái)所管理的數(shù)據(jù)就包括用戶登記的賬號(hào)信息、用戶發(fā)布的信息內(nèi)容以及平臺(tái)產(chǎn)生的用戶與平臺(tái)互動(dòng)數(shù)據(jù),當(dāng)平臺(tái)因?yàn)檫@些數(shù)據(jù)被爬而提起版權(quán)訴訟時(shí),基本無法得到支持。因?yàn)椋⑿殴娞?hào)平臺(tái)不“擁有”其網(wǎng)站上的所有數(shù)據(jù),特別是當(dāng)它是用戶生成的內(nèi)容時(shí),平臺(tái)并沒有得到權(quán)利的專有許可或者轉(zhuǎn)讓。更為重要的理由是,思想不能受到版權(quán)法保護(hù)——只有這些思想的具體形式或表達(dá)可以,原創(chuàng)性成為平臺(tái)不可能達(dá)成的舉證義務(wù),而且,這種爬蟲技術(shù)所得數(shù)據(jù)的再利用,很可能構(gòu)成版權(quán)法上的合理使用。

其次,Robots協(xié)議的效力存在巨大爭(zhēng)議。對(duì)于訴諸合同法(典型的如用戶服務(wù)協(xié)議、Robots協(xié)議)的案件來說,針對(duì)任何使用網(wǎng)站的用戶來說,都會(huì)被要求簽署一份“用戶服務(wù)協(xié)議”。這樣的協(xié)議通常面臨兩個(gè)方面的質(zhì)疑。一是關(guān)于協(xié)議效力的問題,是否屬于“格式條款”(6);二是協(xié)議對(duì)象的問題,用戶服務(wù)協(xié)議往往只是針對(duì)自然人用戶,而爬蟲技術(shù)是以機(jī)器人的身份出現(xiàn)的,這就導(dǎo)致爬蟲技術(shù)者事實(shí)上并不是所謂“用戶服務(wù)協(xié)議”的相對(duì)人,因?yàn)樗⒉皇怯脩?。也正是由于后者的原因,網(wǎng)絡(luò)運(yùn)營(yíng)者專門針對(duì)機(jī)器人/腳本設(shè)計(jì)了專門的Robots協(xié)議,但針對(duì)Robots協(xié)議的法律性質(zhì)和強(qiáng)制力效力的問題也爭(zhēng)議不斷。一些學(xué)者認(rèn)為其系一種集體協(xié)議,一些認(rèn)為其是一種寬泛的契約關(guān)系,一些認(rèn)為其是網(wǎng)站所有者與搜索引擎間是一種事實(shí)上的信息服務(wù)合同關(guān)系,還有一些認(rèn)為Robots協(xié)議是體現(xiàn)了相關(guān)細(xì)分領(lǐng)域公認(rèn)商業(yè)道德的行業(yè)慣例。因此,當(dāng)被爬者希望通過合同法的路徑取得利益保護(hù)的時(shí)候,受制于合同主體、效力等問題,并不總是能得到法律積極的反饋。

最后,技術(shù)控制面臨巨大的成本和合法性挑戰(zhàn)。在缺失法律從社會(huì)層面保障的情況下,網(wǎng)絡(luò)運(yùn)營(yíng)者自身的技術(shù)防御措施也會(huì)面臨成本和法律的挑戰(zhàn)。對(duì)于反爬蟲技術(shù)來說,網(wǎng)絡(luò)運(yùn)營(yíng)者為了實(shí)現(xiàn)對(duì)于其平臺(tái)上數(shù)據(jù)的控制,愿意付出一定的技術(shù)成本來采取反爬蟲技術(shù)。更為嚴(yán)峻的現(xiàn)實(shí)是,網(wǎng)絡(luò)運(yùn)營(yíng)者的技術(shù)措施并不一定會(huì)得到法律的積極認(rèn)可。例如,美國(guó)在HiQ與Linkedln的案件中,HiQ主動(dòng)提起訴訟,認(rèn)為L(zhǎng)inkedIn的技術(shù)手段系違反信息自由的基本原則,要求通過法律手段強(qiáng)制允許自己繼續(xù)持續(xù)爬取LinkedIn的數(shù)據(jù),而該請(qǐng)求在地區(qū)法院和巡回法院獲得了初步禁令的支持。由此,被爬者單方意思和技術(shù)措施不再能發(fā)生法律上禁止他方數(shù)據(jù)爬取的效果,其對(duì)數(shù)據(jù)的封閉將面臨反不正當(dāng)競(jìng)爭(zhēng)法、憲法第一修正案、開放互聯(lián)網(wǎng)之公共利益的挑戰(zhàn)。[15]正如本案所反映的,網(wǎng)絡(luò)運(yùn)營(yíng)者的反爬蟲技術(shù)同樣需要法律的確認(rèn),而在法律缺失明確態(tài)度的情況下,這樣的方式與爬蟲技術(shù)一樣會(huì)面臨合法性的質(zhì)疑,例如信息自由價(jià)值、市場(chǎng)競(jìng)爭(zhēng)價(jià)值等。

三、爬蟲技術(shù)的生產(chǎn)性意涵

(一)互聯(lián)網(wǎng)生產(chǎn)活動(dòng)與數(shù)據(jù)生產(chǎn)

以互聯(lián)網(wǎng)為基本載體的數(shù)字經(jīng)濟(jì)已經(jīng)成為國(guó)民經(jīng)濟(jì)的重要組成部分,各產(chǎn)業(yè)的數(shù)字化改革推動(dòng)著國(guó)家數(shù)字經(jīng)濟(jì)的發(fā)展,也成為我國(guó)未來數(shù)字經(jīng)濟(jì)的主要方向?;ヂ?lián)網(wǎng)的這種特殊的創(chuàng)造力被稱為:生產(chǎn)性(Generativity)。這種依靠網(wǎng)絡(luò)從事的生產(chǎn)性活動(dòng)被概括性地稱為互聯(lián)網(wǎng)生產(chǎn)活動(dòng)?;ヂ?lián)網(wǎng)的生產(chǎn)性被認(rèn)為是一項(xiàng)技術(shù)的總體能力,它能夠在大量、多樣和不協(xié)調(diào)的網(wǎng)絡(luò)用戶的推動(dòng)下產(chǎn)生非預(yù)期的變化。[16]特別是對(duì)于商業(yè)互聯(lián)網(wǎng)平臺(tái)而言,當(dāng)用戶消費(fèi)需求異質(zhì)化、技術(shù)分散、整體市場(chǎng)軌跡不確定的時(shí)候,這種生產(chǎn)能力尤為重要,甚至成為某一商業(yè)互聯(lián)網(wǎng)平臺(tái)得以生存的技術(shù)支撐架構(gòu)。這也就形成了諸如微信公眾號(hào)、頭條號(hào)、知乎、抖音等相對(duì)獨(dú)立、封閉,卻又生產(chǎn)異質(zhì)性內(nèi)容的網(wǎng)絡(luò)運(yùn)營(yíng)者,并成為支撐我國(guó)數(shù)字經(jīng)濟(jì)的重要力量。

從網(wǎng)絡(luò)分層理論來看,上述這樣的互聯(lián)網(wǎng)生產(chǎn)活動(dòng)表面上是一個(gè)獨(dú)立的生產(chǎn)行為,卻在不同的層級(jí)具有不同的生產(chǎn)機(jī)制和生產(chǎn)結(jié)果,當(dāng)然也會(huì)產(chǎn)生不同的市場(chǎng)作用與價(jià)值。(7)它揭示了網(wǎng)絡(luò)生產(chǎn)活動(dòng)可以在內(nèi)容層(具有一定信息意義的內(nèi)容)、代碼層(原始數(shù)據(jù)和數(shù)據(jù)集的產(chǎn)生),或者通過物理載體,以不同的產(chǎn)品形式予以呈現(xiàn)。這三個(gè)層次當(dāng)然是聯(lián)系在一起的,因?yàn)槲锢韺映休d代碼層,代碼層蘊(yùn)含內(nèi)容層意義。然而,從生產(chǎn)性的法律角度來看,每一層都代表著定義一定“產(chǎn)品”和生產(chǎn)活動(dòng)的相對(duì)獨(dú)立。

因此,除去物理層之外,可以在內(nèi)容層和代碼層中分別定義互聯(lián)網(wǎng)生產(chǎn)活動(dòng)。對(duì)于內(nèi)容層而言,互聯(lián)網(wǎng)生產(chǎn)的活動(dòng)價(jià)值在于信息與知識(shí)的加工創(chuàng)造?;ヂ?lián)網(wǎng)內(nèi)容生產(chǎn)者通過創(chuàng)造性的思維結(jié)合標(biāo)準(zhǔn)化的過程來更便捷地創(chuàng)造內(nèi)容和信息商品。這樣的生產(chǎn)活動(dòng)起源于非常早期的人類歷史,隨著生產(chǎn)技術(shù)的不斷推進(jìn),從打字機(jī)、攝影、電報(bào)、電話、錄音錄像到廣播電視,最后是互聯(lián)網(wǎng)信息技術(shù),產(chǎn)品的呈現(xiàn)以文字、圖片、音頻、視頻等出現(xiàn),本質(zhì)仍是直接生產(chǎn)人類可以識(shí)讀的,以降低人類活動(dòng)不確定性為價(jià)值的信息。

對(duì)于代碼層而言,互聯(lián)網(wǎng)的生產(chǎn)活動(dòng)就是數(shù)據(jù)生產(chǎn)活動(dòng)。數(shù)據(jù)是對(duì)客觀世界的數(shù)字化映射,是信息和知識(shí)的數(shù)字化表達(dá)。隨著互聯(lián)網(wǎng)、人工智能等技術(shù)的發(fā)展,數(shù)據(jù)的價(jià)值開始逐漸被人類發(fā)覺。首先,人類通過網(wǎng)絡(luò)實(shí)施的各種行為活動(dòng)越來越多地被數(shù)據(jù)化。例如,網(wǎng)絡(luò)用戶的Cookies等“數(shù)字痕跡”開始被數(shù)據(jù)化記錄。其次,聯(lián)網(wǎng)的智能設(shè)備(物)可以產(chǎn)生、存儲(chǔ)和傳輸數(shù)據(jù),成為大數(shù)據(jù)主要的來源。例如,智能汽車、智能電話、智能家居和可穿戴設(shè)備等等。再次,數(shù)據(jù)自身也被當(dāng)作某種類“資源”進(jìn)行交易。因此,數(shù)據(jù)經(jīng)濟(jì)不僅是指數(shù)據(jù)驅(qū)動(dòng)或數(shù)據(jù)控制的經(jīng)濟(jì),還是一種以數(shù)據(jù)為基本生產(chǎn)要素的經(jīng)濟(jì)模式。正是基于這種具有機(jī)讀性,非人類可直接識(shí)讀的數(shù)據(jù)的價(jià)值爆發(fā),才使得傳統(tǒng)的互聯(lián)網(wǎng)內(nèi)容生產(chǎn)具有了數(shù)據(jù)生產(chǎn)的價(jià)值意味。

可見,之前停留在內(nèi)容層的互聯(lián)網(wǎng)生產(chǎn)活動(dòng)已經(jīng)突破了語義、信息的界限,在代碼層完成了數(shù)據(jù)生產(chǎn)的價(jià)值創(chuàng)造過程。網(wǎng)絡(luò)運(yùn)營(yíng)者為了創(chuàng)造激發(fā)互聯(lián)網(wǎng)生產(chǎn)的活力,為了在內(nèi)容層創(chuàng)造差異性、功能分化的競(jìng)爭(zhēng)價(jià)值,在代碼層生產(chǎn)更多可供計(jì)算分析的數(shù)據(jù),更多地?fù)?dān)負(fù)起中介與組織的雙重功能,它們的供給支持創(chuàng)新和創(chuàng)造力,為內(nèi)容生產(chǎn)提供了構(gòu)架和行為模式上的基礎(chǔ),但同時(shí)也限制了參與,并將其引導(dǎo)到有利于平臺(tái)創(chuàng)造者的生產(chǎn)活動(dòng)中。[17]正是在此種數(shù)據(jù)生產(chǎn)理論的視域下,爬蟲技術(shù)具有了一種生產(chǎn)性意義上的表征,需要得到法律的正視與回應(yīng)。

(二)數(shù)據(jù)重用:爬蟲技術(shù)的生產(chǎn)性表征

盡管當(dāng)下數(shù)據(jù)的生產(chǎn)要素性質(zhì)已經(jīng)得到了政策制定者和產(chǎn)業(yè)界、學(xué)界不同程度的認(rèn)同。但如何實(shí)現(xiàn)數(shù)據(jù)要素的生產(chǎn)性價(jià)值,人們似乎并無定論?!斑@些數(shù)據(jù)最好是結(jié)構(gòu)化的,但不一定是結(jié)構(gòu)化的”,因此“實(shí)現(xiàn)大數(shù)據(jù)的潛力需要從所有來源進(jìn)行更多的數(shù)據(jù)重用”[18]。數(shù)據(jù)(或者信息)的創(chuàng)生性、涌現(xiàn)性、相互性與共享性決定了相同的數(shù)據(jù)用于不同的場(chǎng)景(或者與不同的數(shù)據(jù)進(jìn)行匹配),會(huì)創(chuàng)造不同的價(jià)值。(8)因此,與數(shù)據(jù)(一次)使用相對(duì)應(yīng),數(shù)據(jù)重用就成為數(shù)據(jù)生產(chǎn)與數(shù)據(jù)價(jià)值創(chuàng)造的重要途徑。數(shù)據(jù)重用主要有數(shù)據(jù)循環(huán)(Data Recycling)、數(shù)據(jù)目的重用(Data Repurposing)和數(shù)據(jù)場(chǎng)景重用(Data Recontextualization)三種主要形式[18],而爬蟲技術(shù)是實(shí)現(xiàn)后兩者數(shù)據(jù)重用的重要技術(shù)手段。

從技術(shù)機(jī)制來看,將爬蟲技術(shù)的技術(shù)過程進(jìn)行細(xì)致劃分,現(xiàn)階段的爬蟲技術(shù)一般包含網(wǎng)站解析(Website Analysis)、網(wǎng)站爬行(Website Crawling)和數(shù)據(jù)組織(Data Organization)三個(gè)步驟。首先,網(wǎng)站解析就是通過檢查一個(gè)網(wǎng)站(或多個(gè)網(wǎng)站)或網(wǎng)絡(luò)存儲(chǔ)庫(例如在線數(shù)據(jù)庫)以了解所需數(shù)據(jù)的網(wǎng)絡(luò)架構(gòu)和存儲(chǔ)方式。其次,通過開發(fā)和運(yùn)行一個(gè)程序腳本,自動(dòng)瀏覽網(wǎng)站和檢索所需的數(shù)據(jù)來進(jìn)行對(duì)于底層數(shù)據(jù)的爬取。具體使用怎樣的代碼語言與這些語言在數(shù)據(jù)科學(xué)的可用性有關(guān),它們的目的是自動(dòng)抓取和選擇數(shù)據(jù)。最后,從選定的網(wǎng)絡(luò)存儲(chǔ)庫中爬取出必要的數(shù)據(jù)后,需要對(duì)其進(jìn)行清理、預(yù)處理和組織,以便能夠?qū)@些數(shù)據(jù)進(jìn)行進(jìn)一步分析。[8]

結(jié)合數(shù)據(jù)生產(chǎn)和重用理論的分析,上述三個(gè)過程可以清晰地體現(xiàn)出爬蟲技術(shù)的技術(shù)邏輯。一方面,網(wǎng)站解析和網(wǎng)站爬行實(shí)現(xiàn)了數(shù)據(jù)網(wǎng)絡(luò)存儲(chǔ)庫(就如同蘊(yùn)含資源的礦藏)和數(shù)據(jù)(資源本身)的分離,實(shí)現(xiàn)了初始的數(shù)據(jù)要素獲取的過程,即通過對(duì)網(wǎng)站代碼層的數(shù)據(jù)化解析、篩選和復(fù)制,實(shí)現(xiàn)對(duì)于網(wǎng)絡(luò)內(nèi)容、網(wǎng)絡(luò)活動(dòng)的數(shù)據(jù)化映射,從而為數(shù)據(jù)本身成為資源或者商品[19]進(jìn)行流通,提供了基本的可能。另一方面,隨著技術(shù)的深化,爬蟲技術(shù)也不單單扮演“搬運(yùn)工”的角色,數(shù)據(jù)組織過程讓爬蟲技術(shù)具有了價(jià)值創(chuàng)造和價(jià)值添付的功能,組織標(biāo)準(zhǔn)、組織范圍、組織語言等的選擇與確定[8],使得數(shù)據(jù)的可攜性與互操作性的統(tǒng)一成為可能,更是實(shí)現(xiàn)了“基于需求的數(shù)據(jù)供給”成為可能。[20]這一階段,爬蟲者通過將爬蟲得到的數(shù)據(jù)以某種標(biāo)準(zhǔn)進(jìn)行分類、組織,甚至還涉及不同數(shù)據(jù)源的數(shù)據(jù)要素匹配和融合的過程,以生產(chǎn)出新的數(shù)據(jù)要素。事實(shí)上,這一過程已經(jīng)完成了數(shù)據(jù)不同語境的變換,實(shí)現(xiàn)了場(chǎng)景化(或者語境化)重用與價(jià)值添付的過程。加之,若被爬數(shù)據(jù)的最終用途與數(shù)據(jù)源不同,則又實(shí)現(xiàn)了數(shù)據(jù)目的的重用。(9)

從生產(chǎn)對(duì)象來看,如前所述,用戶利用平臺(tái)主動(dòng)生成的數(shù)據(jù)和網(wǎng)絡(luò)行為的“數(shù)字痕跡”都是數(shù)據(jù)資源的重要組成,但不可否認(rèn)的是,如同原始采集來的能源資源未經(jīng)“清洗”難以高效使用一樣,上述兩種原始數(shù)據(jù)由于質(zhì)量、用途、采集方式、使用目的等各方面因素的差異性,直接用于數(shù)據(jù)分析/挖掘的可用性并不高。打破不同類型原始數(shù)據(jù)的孤立性,實(shí)現(xiàn)原始數(shù)據(jù)的互通、再提煉,將原始數(shù)據(jù)匯集成為更有價(jià)值的數(shù)據(jù)集(Dataset)的過程同樣具有價(jià)值創(chuàng)造上的重要意義。[21]

從爬蟲技術(shù)的結(jié)果來看,爬蟲的過程就是通過不同的數(shù)據(jù)匯集與重用,以形成新的數(shù)據(jù)集。爬蟲技術(shù)的價(jià)值就在于發(fā)現(xiàn)這些海量數(shù)據(jù)的某些特征,為特定目的、以可識(shí)別標(biāo)準(zhǔn)創(chuàng)建不同的原始數(shù)據(jù)之間的聯(lián)系,將它們匯聚起來?;谔囟ǖ臉?biāo)準(zhǔn)和意圖,出于效率和良好系統(tǒng)運(yùn)行的考慮,當(dāng)這些原始數(shù)據(jù)在大多數(shù)情況下以一種標(biāo)準(zhǔn)類型的“數(shù)據(jù)包”的形式存在時(shí),它們所包含的計(jì)算價(jià)值通常才是特定的(或者說是可以量化的),才可以用以支持收集、創(chuàng)建它們的直接目的。因此,對(duì)于商業(yè)數(shù)據(jù)競(jìng)爭(zhēng)而言,真正的競(jìng)爭(zhēng)優(yōu)勢(shì)往往來自那些生產(chǎn)出的具有獨(dú)特性的數(shù)據(jù)集,而不是原始數(shù)據(jù)。[22]“數(shù)據(jù)生產(chǎn)實(shí)現(xiàn)數(shù)據(jù)從無到有,數(shù)據(jù)集生產(chǎn)則實(shí)現(xiàn)關(guān)于某個(gè)對(duì)象的數(shù)據(jù)匯聚和優(yōu)化?!币虼耍老x技術(shù)在原始數(shù)據(jù)“數(shù)據(jù)集化”的過程中扮演了極為重要的角色。[21]

綜上,爬蟲技術(shù)是一種典型的數(shù)據(jù)重用技術(shù),具有一定意義上的生產(chǎn)性意涵。但需要強(qiáng)調(diào)的是,本文把爬蟲技術(shù)定義為數(shù)據(jù)重用行為,這里的重用只是事實(shí)判斷意義上的,因?yàn)槠浯_實(shí)付出了生產(chǎn)上的勞動(dòng),實(shí)現(xiàn)了從1到多(或者從分散到聚集、從粗放到優(yōu)化)的價(jià)值創(chuàng)造的跨越。[23]但這樣的行為或者技術(shù)能否得到價(jià)值判斷上的正當(dāng)性確認(rèn),則是另一個(gè)層面的問題。因此,在法律上如何對(duì)待爬蟲技術(shù)需要更為系統(tǒng)的分析論證。

(三)法律回應(yīng)的缺失

從生產(chǎn)性的視角來看,作為數(shù)據(jù)生產(chǎn)者的網(wǎng)絡(luò)運(yùn)營(yíng)者,希望其生產(chǎn)性貢獻(xiàn)得到法律的確認(rèn)和保護(hù),這種合法性的確認(rèn)既是商業(yè)模式的考量,也是利益分配的考量。從現(xiàn)實(shí)來看,網(wǎng)絡(luò)運(yùn)營(yíng)者對(duì)于自身生產(chǎn)行為的控制存在于技術(shù)與法律兩個(gè)維度。

從技術(shù)維度來看,自發(fā)的技術(shù)控制是網(wǎng)絡(luò)運(yùn)營(yíng)者自力救濟(jì)(自我保護(hù))的體現(xiàn)。網(wǎng)絡(luò)運(yùn)營(yíng)者對(duì)于自身生產(chǎn)活動(dòng)控制是高度依賴技術(shù)構(gòu)架的。以微信公眾號(hào)為例,微信公眾號(hào)設(shè)置有登陸限制、IP訪問限制、驗(yàn)證機(jī)制等技術(shù)措施。諸如此類網(wǎng)絡(luò)運(yùn)營(yíng)者設(shè)置的登陸機(jī)制,其目的就是在于通過限制非真人的訪問。對(duì)于IP頻率訪問限制而言,網(wǎng)絡(luò)運(yùn)營(yíng)者會(huì)設(shè)置IP訪問頻率限制。如果一個(gè)訪問者訪問太快了,網(wǎng)絡(luò)運(yùn)營(yíng)者就會(huì)認(rèn)為你不是一個(gè)人,而是一個(gè)機(jī)器人或者其他腳本程序。除了上述對(duì)于訪問者主體身份的控制外,對(duì)于平臺(tái)內(nèi)容來說,網(wǎng)絡(luò)運(yùn)營(yíng)者也會(huì)通過分享控制、編輯限制、“白名單”、原創(chuàng)聲明等方式,在不違背信息自由的基本前提下,一定程度上實(shí)現(xiàn)對(duì)內(nèi)容生產(chǎn)的技術(shù)控制。

從法律維度來看,內(nèi)容層的法律規(guī)范是網(wǎng)絡(luò)運(yùn)營(yíng)者的社會(huì)性保護(hù),同時(shí)也是對(duì)平臺(tái)內(nèi)容生產(chǎn)技術(shù)控制的確認(rèn)。通過知識(shí)產(chǎn)權(quán)保護(hù)由人類思想創(chuàng)造性的信息,如發(fā)明創(chuàng)造、藝術(shù)作品或?qū)@O(shè)計(jì);通過合同(典型的如用戶服務(wù)協(xié)議等)實(shí)現(xiàn)與平臺(tái)用戶的法律關(guān)系的確認(rèn)并明確兩者之間的權(quán)利義務(wù)關(guān)系;通過反不正當(dāng)競(jìng)爭(zhēng)實(shí)現(xiàn)對(duì)于市場(chǎng)競(jìng)爭(zhēng)者、競(jìng)爭(zhēng)利益與競(jìng)爭(zhēng)環(huán)境的規(guī)范等等。因此,法律通過對(duì)于平臺(tái)技術(shù)的規(guī)制和確認(rèn),從人類的網(wǎng)絡(luò)行為規(guī)范層面實(shí)現(xiàn)了對(duì)于內(nèi)容生產(chǎn)活動(dòng)正當(dāng)性的保護(hù),確認(rèn)了這種知識(shí)生產(chǎn)的新模式及其背后所代表的商業(yè)利益與價(jià)值。

而對(duì)于代碼層或者數(shù)據(jù)來說,法律的應(yīng)對(duì)體現(xiàn)出了其自身固有的保守性和滯后性。當(dāng)可被人直接識(shí)讀的信息、知識(shí),被數(shù)據(jù)化為僅機(jī)器可讀的數(shù)據(jù)時(shí),其價(jià)值也從單純的信息價(jià)值向更復(fù)雜的計(jì)算價(jià)值跨越,由此,網(wǎng)絡(luò)運(yùn)營(yíng)者相應(yīng)地用于生產(chǎn)和管理數(shù)據(jù)并據(jù)此控制數(shù)據(jù)生產(chǎn)過程的邏輯也發(fā)生了變化。因此,正是代碼層法律的缺失導(dǎo)致了數(shù)據(jù)生產(chǎn)活動(dòng)的混亂。一方面,網(wǎng)絡(luò)運(yùn)營(yíng)者自發(fā)的技術(shù)控制未得到法律的認(rèn)可,典型的體現(xiàn)如美國(guó)《計(jì)算機(jī)欺詐與濫用法案》(CFAA)對(duì)于突破技術(shù)防線訪問計(jì)算機(jī)系統(tǒng)是否構(gòu)成“未經(jīng)授權(quán)訪問”的爭(zhēng)議,Robots協(xié)議性質(zhì)與效力的爭(zhēng)議等。另一方面,無論是因?yàn)榉傻捏w系局限性還是法律適用的有限性,傳統(tǒng)法律(如前述知識(shí)產(chǎn)權(quán)、競(jìng)爭(zhēng)法等)又無法像規(guī)范內(nèi)容生產(chǎn)一樣應(yīng)對(duì)數(shù)據(jù)代碼層面的爭(zhēng)議。因此,以數(shù)據(jù)爭(zhēng)議為表現(xiàn)的數(shù)據(jù)生產(chǎn)活動(dòng)秩序的混亂由此產(chǎn)生。

綜上,限于時(shí)間、技術(shù)或者其他眾多原因的影響,人們對(duì)于內(nèi)容層的探討與思考較多,而對(duì)于代碼層面的數(shù)據(jù)生產(chǎn)認(rèn)識(shí)尚淺。而用喬納森·齊特林(Jonathan Zittrain)的話來說,“入侵者可以在一層工作,而無需了解另一層工作,和另一層工作之間不需要任何協(xié)調(diào)或關(guān)系?!保?4]隨著大數(shù)據(jù)、傳感等技術(shù)的深化,內(nèi)容(信息)可以輕松實(shí)現(xiàn)數(shù)據(jù)化的轉(zhuǎn)化,從而使存在于內(nèi)容層的問題延伸、擴(kuò)展至代碼層。(10)由此,當(dāng)爬蟲技術(shù)出現(xiàn)時(shí),現(xiàn)行法律在代碼層面的不完善成為網(wǎng)絡(luò)運(yùn)營(yíng)者對(duì)于數(shù)據(jù)生產(chǎn)活動(dòng)法律上控制的難題,這也導(dǎo)致了未經(jīng)授權(quán)的爬蟲技術(shù)被大量應(yīng)用,成為網(wǎng)絡(luò)運(yùn)營(yíng)者眼中人人喊打的“害蟲”。

四、規(guī)制路徑的各國(guó)探索與我國(guó)實(shí)踐

為化解爬蟲技術(shù)的爭(zhēng)議,世界各國(guó)都進(jìn)行了各具特色的制度創(chuàng)新與嘗試。其中,美國(guó)法律在面對(duì)爬蟲技術(shù)時(shí)的,動(dòng)用了幾乎法律“武器庫里”任何可以想象到的“武器”。其中最具美國(guó)特色的法律就是《計(jì)算機(jī)欺詐與濫用法案》(以下簡(jiǎn)稱CFAA)。CFAA是一項(xiàng)聯(lián)邦法規(guī),規(guī)定任何“在未經(jīng)授權(quán)的情況下故意訪問計(jì)算機(jī)或超出授權(quán)訪問范圍”的主體都應(yīng)承擔(dān)刑事責(zé)任。與合同法的理論沒有很大的差異,適用CFAA的案例通常取決于用戶是否對(duì)網(wǎng)站用戶服務(wù)條款的限制性條款有實(shí)際或建設(shè)性的了解(即明知爬蟲是“未經(jīng)授權(quán)的”)。在過去二十年中,大量的爬蟲技術(shù)案件涉及CFAA的適用問題,但法院并未達(dá)成共識(shí),特別是針對(duì)“未經(jīng)授權(quán)訪問”的理解與解釋問題上仍存在巨大分歧。[25]372-415但總體的趨勢(shì)是,對(duì)于構(gòu)成CFAA所描述的“未經(jīng)授權(quán)”,美國(guó)法院的態(tài)度越來越謹(jǐn)慎,以防止其適用范圍的無限擴(kuò)大,對(duì)正常的網(wǎng)絡(luò)信息流通產(chǎn)生不利影響。典型如備受關(guān)注的HiQ與Linkedln的案件,經(jīng)過初審、上訴和重審的立場(chǎng)搖擺,美國(guó)第九巡回法院的第二次裁決,依然堅(jiān)持并重申了其最初的裁決意見,認(rèn)為爬取互聯(lián)網(wǎng)上已公開的數(shù)據(jù)并不違反CFAA,并強(qiáng)調(diào)“未經(jīng)授權(quán)”的概念不適用于公共網(wǎng)站。(11)由此可見,美國(guó)法院對(duì)于爬蟲技術(shù)是否適用CFAA的看法動(dòng)搖。正如安德魯·塞勒斯(Andrew Sellars)教授所言,“爬蟲技術(shù)的法律地位經(jīng)歷了二十年的不確定性——這不是像一些學(xué)者所說的那樣一片混亂,而是在不同時(shí)刻搖擺的狀態(tài)。”[25]412

最具歐洲特色的法律應(yīng)對(duì)是通過“數(shù)據(jù)庫權(quán)(Database Right)”來實(shí)現(xiàn)對(duì)于爬蟲技術(shù)的規(guī)制。為了對(duì)“數(shù)據(jù)庫”施加保護(hù),歐盟在既有知識(shí)產(chǎn)權(quán)法的體系框架之下設(shè)置了一種特殊的專有權(quán)——數(shù)據(jù)庫權(quán),并通過頒布《關(guān)于數(shù)據(jù)庫法律保護(hù)的第96/9/EC指令》(以下簡(jiǎn)稱“數(shù)據(jù)庫指令”)確認(rèn)了該項(xiàng)專有權(quán),該項(xiàng)權(quán)利旨在保護(hù)以系統(tǒng)或方法方式排列并通過電子或其他方式單獨(dú)訪問的獨(dú)立作品、數(shù)據(jù)或其他材料的集合。(12)在數(shù)據(jù)生產(chǎn)的語境下,數(shù)據(jù)庫權(quán)所保護(hù)的數(shù)據(jù)至少需要具備兩個(gè)條件,第一個(gè)是該數(shù)據(jù)必須是以系統(tǒng)或有條理的方式排列并通過電子或其他方式單獨(dú)獲取的數(shù)據(jù),即結(jié)構(gòu)性。第二個(gè)條件是在獲取、驗(yàn)證或呈現(xiàn)內(nèi)容方面的質(zhì)量和/或數(shù)量上的大量投資,即投入性。盡管《數(shù)據(jù)庫指令》的出發(fā)點(diǎn)不可謂不積極,但在實(shí)際的運(yùn)用中還是出現(xiàn)了巨大的爭(zhēng)議。很明顯,《數(shù)據(jù)庫指令》忽略了對(duì)于非結(jié)構(gòu)化數(shù)據(jù)和經(jīng)營(yíng)行為衍生數(shù)據(jù)(即經(jīng)營(yíng)副產(chǎn)品)的保護(hù),這使得當(dāng)下真正占據(jù)大多數(shù)的網(wǎng)絡(luò)活動(dòng)的“單一數(shù)據(jù)源數(shù)據(jù)庫(Solo-source Database)”無法被視為《數(shù)據(jù)庫指令》保護(hù)的對(duì)象。這就導(dǎo)致目前大多數(shù)網(wǎng)絡(luò)運(yùn)營(yíng)者在面對(duì)爬蟲技術(shù)時(shí),依然不能依據(jù)確定的財(cái)產(chǎn)權(quán)路徑進(jìn)行保護(hù)。2017年歐盟頒布《構(gòu)建歐洲數(shù)據(jù)經(jīng)濟(jì)》(Building a European Data Economy)文件,提出構(gòu)建“數(shù)據(jù)生產(chǎn)者權(quán)”(Data Producer's Right)的財(cái)產(chǎn)權(quán)保護(hù)路徑以解決機(jī)器生成數(shù)據(jù)的權(quán)屬問題,是否可以有效解決爬蟲技術(shù)所帶來的沖突問題,還需要更多的研究與思考。(13)

結(jié)合我國(guó)的司法現(xiàn)狀,我國(guó)法院采用最為常見的路徑是通過反不正當(dāng)競(jìng)爭(zhēng)法和刑法來對(duì)爬蟲技術(shù)行為進(jìn)行規(guī)制。對(duì)于法院認(rèn)定爬蟲技術(shù)構(gòu)成反不正當(dāng)競(jìng)爭(zhēng)行為的案件不勝枚舉。但總體看來,法院并沒有直接對(duì)于爬蟲技術(shù)本身做出任何價(jià)值判斷,而是堅(jiān)持從反不正當(dāng)競(jìng)爭(zhēng)行為的一般判定要件出發(fā),對(duì)于利用Robots協(xié)議或者爬蟲所得數(shù)據(jù)進(jìn)行的市場(chǎng)活動(dòng),(14)進(jìn)行行為性質(zhì)的合法性判斷。這就導(dǎo)致行為人對(duì)于爬蟲技術(shù)行為的行為預(yù)期始終處于不確定的狀態(tài)。盡管很多案件的原告都取得了勝訴判決,但在法律適用問題上的爭(zhēng)議并不鮮見。[26]因此,適用《反不正當(dāng)競(jìng)爭(zhēng)法》來規(guī)制爬蟲技術(shù)行為總體上是一種“曲線救國(guó)”的應(yīng)對(duì)方式。

在“谷米公司訴元光公司不正當(dāng)競(jìng)爭(zhēng)案”中,元光公司為提升本公司的APP軟件“車來了”的服務(wù)質(zhì)量,利用網(wǎng)絡(luò)爬蟲技術(shù)爬取了谷米公司“酷米客”APP軟件上的公交信息數(shù)據(jù),將之用于“車來了”APP并提供給公眾查詢。法院認(rèn)為,“元光公司利用網(wǎng)絡(luò)爬蟲技術(shù)大量獲取并無償使用‘酷米客’APP實(shí)時(shí)公交信息數(shù)據(jù)的行為,是一種不勞而獲的行為,破壞他人的市場(chǎng)競(jìng)爭(zhēng)優(yōu)勢(shì),具有主觀過錯(cuò),違反了誠(chéng)實(shí)信用原則,擾亂了競(jìng)爭(zhēng)秩序,構(gòu)成不正當(dāng)競(jìng)爭(zhēng)?!保?5)在“新浪微博訴蟻坊公司不正當(dāng)競(jìng)爭(zhēng)案”中,由于新浪微博與蟻坊公司之間并無明顯的商業(yè)模式和用戶對(duì)象的競(jìng)爭(zhēng)關(guān)系,法院在認(rèn)定兩者的競(jìng)爭(zhēng)關(guān)系,明顯擴(kuò)大了解釋與適用的范圍,認(rèn)為“只要經(jīng)營(yíng)者的行為不僅具有對(duì)其他經(jīng)營(yíng)者利益造成損害的可能性,且其同時(shí)會(huì)基于該行為獲得現(xiàn)實(shí)或潛在的經(jīng)濟(jì)利益,則可以認(rèn)定二者具有競(jìng)爭(zhēng)關(guān)系”,“在當(dāng)前的市場(chǎng)環(huán)境下,這種競(jìng)爭(zhēng)并不限于同業(yè)競(jìng)爭(zhēng),顯然也包括非同業(yè)競(jìng)爭(zhēng)但仍對(duì)交易機(jī)會(huì)、交易能力存在爭(zhēng)奪的情形;因此,如一方經(jīng)營(yíng)者為了提高自己的交易能力而直接侵占或損害另一方經(jīng)營(yíng)者的合法權(quán)益,即便雙方并非同業(yè)競(jìng)爭(zhēng)者,仍然構(gòu)成了競(jìng)爭(zhēng)關(guān)系?!保?6)

由此可見,互聯(lián)網(wǎng)反不正當(dāng)競(jìng)爭(zhēng)法的保護(hù)已經(jīng)明顯向市場(chǎng)主體合法利益的侵權(quán)法方向發(fā)展。[27]針對(duì)爬蟲技術(shù)來說,就是指網(wǎng)絡(luò)運(yùn)營(yíng)者所主張的數(shù)據(jù)權(quán)益,這種權(quán)益除其對(duì)數(shù)據(jù)本身所享有的權(quán)益之外,還包括運(yùn)營(yíng)網(wǎng)絡(luò)平臺(tái),維護(hù)數(shù)據(jù)安全而產(chǎn)生的成本控制,以及基于所享有權(quán)益的數(shù)據(jù)進(jìn)行衍生性利用或開發(fā)所獲得經(jīng)營(yíng)利益等。(17)

另一條重要的路徑是刑法路徑。據(jù)不完全統(tǒng)計(jì),爬蟲技術(shù)涉案主要罪名為侵犯公民個(gè)人信息罪、侵犯著作權(quán)罪、非法獲取計(jì)算機(jī)信息系統(tǒng)數(shù)據(jù)罪與破壞計(jì)算機(jī)信息系統(tǒng)罪等。(18)罪名的多樣性,也意味著對(duì)于爬蟲技術(shù)本身性質(zhì)的模糊性??傮w看來,《刑法》對(duì)于爬蟲技術(shù)非法與合法的判斷,重點(diǎn)是從形式層面進(jìn)行的。[28]因此,有學(xué)者提出要從實(shí)質(zhì)的法益侵害性來進(jìn)行罪與非罪的判斷。[28]以關(guān)系最為緊密的非法侵入計(jì)算機(jī)系統(tǒng)罪來看(19),我國(guó)是否會(huì)陷入如CFAA一樣對(duì)于“入侵”和“非法”等關(guān)鍵概念的解釋困境,爬蟲技術(shù)能否被認(rèn)定為黑客行為,還需要司法的實(shí)踐以于驗(yàn)證。[29]

事實(shí)上,不論是從哪個(gè)側(cè)面進(jìn)行的探索,都體現(xiàn)了法律制度本身對(duì)于爬蟲技術(shù)外部性的積極回應(yīng)。法律還應(yīng)當(dāng)發(fā)揮出一種具有導(dǎo)向性的作用,從而尋找和確定我們面對(duì)爬蟲技術(shù)的應(yīng)然態(tài)度和價(jià)值取向。因此,有必要將爬蟲技術(shù)放置于更大更宏觀的整個(gè)數(shù)據(jù)生產(chǎn)與數(shù)據(jù)要素資源市場(chǎng)化配置的體系之中予以分析和討論,才可以擺脫單純的技術(shù)主義視角,對(duì)爬蟲技術(shù)做出全面而恰當(dāng)?shù)姆蓱?yīng)對(duì)。

五、控制與分享:爬蟲技術(shù)的法律應(yīng)對(duì)

通過對(duì)我國(guó)司法實(shí)踐的觀察,我們不難得出以下結(jié)論:利用反不正當(dāng)競(jìng)爭(zhēng)法來規(guī)制爬蟲技術(shù)行為,表面上是對(duì)于市場(chǎng)競(jìng)爭(zhēng)性秩序的保護(hù),但實(shí)質(zhì)上卻有明顯的數(shù)據(jù)財(cái)產(chǎn)性權(quán)利保護(hù)的趨勢(shì)?,F(xiàn)行法雖然暫時(shí)缺乏有名財(cái)產(chǎn)性權(quán)益來明確,但在案件裁判上仍然會(huì)不知不覺地借用財(cái)產(chǎn)性權(quán)益的分析框架來完成判斷與說理。所以,不論是理論上還是現(xiàn)實(shí)需要,為數(shù)據(jù)構(gòu)建相應(yīng)的財(cái)產(chǎn)性利益保護(hù)規(guī)則是解決爬蟲技術(shù)爭(zhēng)議的根本路徑。只是這種財(cái)產(chǎn)性價(jià)值的利用與分配規(guī)則最終會(huì)以何種形式被法律體系表達(dá)出來需要探討。本文主張的制度方案主要包括“控制”與“分享”兩個(gè)方面。

(一)控制:數(shù)據(jù)持有者權(quán)

爬蟲技術(shù)之所以爭(zhēng)議巨大,究其根本是數(shù)據(jù)權(quán)屬的爭(zhēng)議問題。無論是傳統(tǒng)的法學(xué)理論還是經(jīng)典的經(jīng)濟(jì)學(xué)理論,解決產(chǎn)權(quán)問題一直都是資源配置、利益分配的基礎(chǔ)與核心問題。[30]但由于數(shù)據(jù)這一權(quán)利客體本身的非競(jìng)爭(zhēng)性與非排他性[31],加上數(shù)據(jù)利益相關(guān)者的多樣性,導(dǎo)致在數(shù)據(jù)權(quán)屬這一重大學(xué)術(shù)議題的討論中往往無法形成基本共識(shí)。在筆者看來,超越傳統(tǒng)的權(quán)利范式,從數(shù)據(jù)資源的利用角度,為網(wǎng)絡(luò)運(yùn)營(yíng)者配置數(shù)據(jù)持有者權(quán),以實(shí)現(xiàn)資源的有序利用是切實(shí)可行的制度路徑。

1.技術(shù)視角。其一,數(shù)據(jù)持有者權(quán)的正當(dāng)性在于數(shù)據(jù)生產(chǎn)活動(dòng)。如前所述,網(wǎng)絡(luò)運(yùn)營(yíng)者通過內(nèi)容層的組織架構(gòu)和內(nèi)容生產(chǎn)機(jī)制客觀上實(shí)現(xiàn)了代碼層的數(shù)據(jù)生產(chǎn)活動(dòng),一方面實(shí)現(xiàn)了數(shù)據(jù)源對(duì)于原始數(shù)據(jù)的自主性供給,另一方面通過分離數(shù)據(jù)源和數(shù)據(jù),實(shí)現(xiàn)元數(shù)據(jù)的生產(chǎn)和處理,數(shù)據(jù)價(jià)值的添付。從這個(gè)數(shù)據(jù)生產(chǎn)活動(dòng)的意義上來說,數(shù)據(jù)持有者權(quán)就是生產(chǎn)組織者對(duì)于生產(chǎn)過程全流程的管控,其當(dāng)然性地包括生產(chǎn)者與生產(chǎn)要素。關(guān)于數(shù)據(jù)生產(chǎn)與內(nèi)容生產(chǎn)前文已具體論述,此處不再重復(fù)。

其二,數(shù)據(jù)持有者權(quán)的邊界是平臺(tái)。數(shù)據(jù)資源的流動(dòng)性問題,直接關(guān)系互聯(lián)網(wǎng)的生產(chǎn)機(jī)制和過程的成敗。[32]流動(dòng)性既是數(shù)據(jù)價(jià)值產(chǎn)生、匯集的關(guān)鍵,但也客觀上成為數(shù)據(jù)控制基本難題。而平臺(tái)相對(duì)意義上的封閉性就成為實(shí)現(xiàn)數(shù)據(jù)控制技術(shù)上的關(guān)鍵?;谇拔膶?duì)于互聯(lián)網(wǎng)生產(chǎn)機(jī)制中網(wǎng)絡(luò)運(yùn)營(yíng)者的組織核心地位,我們不難看出,互聯(lián)網(wǎng)的開放是建立在各個(gè)平臺(tái)的相對(duì)封閉性之上的,從架構(gòu)技術(shù)上來說,平臺(tái)內(nèi)部的通用標(biāo)準(zhǔn)和架構(gòu)模塊往往只在本平臺(tái)內(nèi)部使用,要想實(shí)現(xiàn)跨平臺(tái)的互通往往具有使用標(biāo)準(zhǔn)上的復(fù)雜性和困難度,這也不難解釋諸如阿里、騰訊、谷歌總是被認(rèn)為進(jìn)行事實(shí)上的“壟斷”。從網(wǎng)絡(luò)運(yùn)營(yíng)者主觀上來看,這種構(gòu)架上的差異性是內(nèi)容異質(zhì)性和商業(yè)活動(dòng)競(jìng)爭(zhēng)性的要求。他們希望通過控制核心構(gòu)架和標(biāo)準(zhǔn)上的差異,來滿足不同的市場(chǎng)需求。而且隨著各種新技術(shù)、新的組織和人類行為模式的共同發(fā)展,這種持續(xù)的相對(duì)封閉性可能會(huì)繼續(xù)下去。而這種相對(duì)的封閉性就成為數(shù)據(jù)持有者權(quán)相對(duì)清晰的邊界,一面為財(cái)產(chǎn)劃定的邊界,一面可以匹配數(shù)據(jù)的供求關(guān)系。例如針對(duì)爬蟲技術(shù)的“反爬蟲”訴求的實(shí)質(zhì)是要求構(gòu)建一種新的生產(chǎn)秩序,并由在先的、往往擁有大量信息內(nèi)容的平臺(tái)主導(dǎo)。

其三,數(shù)據(jù)持有者權(quán)的實(shí)現(xiàn)途徑是訪問控制。由于數(shù)據(jù)的非物質(zhì)性,技術(shù)上實(shí)現(xiàn)對(duì)于數(shù)據(jù)的控制就是訪問控制,它的意義相當(dāng)于有形財(cái)產(chǎn)中占有的價(jià)值。從互聯(lián)網(wǎng)生產(chǎn)性活動(dòng)的視角來看,訪問控制就是限制對(duì)資源的訪問。通過訪問控制,可以識(shí)別個(gè)人(或計(jì)算機(jī)),驗(yàn)證他們的身份,授權(quán)他們擁有所需的訪問級(jí)別,然后針對(duì)用戶名、IP地址或其他識(shí)別信息記錄他們的操作,以實(shí)現(xiàn)流程的可追溯。訪問控制最大限度地降低了授權(quán)訪問平臺(tái)或者數(shù)據(jù)庫,接觸到數(shù)據(jù)的風(fēng)險(xiǎn),構(gòu)成了信息安全、數(shù)據(jù)安全和網(wǎng)絡(luò)安全的基礎(chǔ)部分,同時(shí)也是實(shí)現(xiàn)數(shù)據(jù)有效控制的基本手段。

2.法律視角。其一,數(shù)據(jù)持有者權(quán)是對(duì)于平臺(tái)生產(chǎn)性投入的確認(rèn)。目的是法律的創(chuàng)造者,而目的本身就是利益……利益是權(quán)利構(gòu)成的本質(zhì)要素。[33]而分配權(quán)利的標(biāo)準(zhǔn)之一可以是考慮已完成的投資和用于創(chuàng)建數(shù)據(jù)的資源。這一點(diǎn)與歐盟《數(shù)據(jù)庫指令》的立法思想基本一致,但其內(nèi)涵應(yīng)該是廣義的。此類投資通常由兩方進(jìn)行:配備傳感器的機(jī)器、工具或裝置(生成數(shù)據(jù))的制造商,他們投資于機(jī)器、工具或裝置的開發(fā)和市場(chǎng)商業(yè)化,以及使用此類機(jī)器的經(jīng)濟(jì)運(yùn)營(yíng)商,支付購買價(jià)格或租賃的工具或設(shè)備,并必須攤銷機(jī)器、工具或設(shè)備。這也符合數(shù)據(jù)生產(chǎn)理論中為價(jià)值創(chuàng)造者配置權(quán)利的邏輯。因?yàn)橹挥羞@樣才能平衡網(wǎng)絡(luò)運(yùn)營(yíng)者對(duì)于組織數(shù)據(jù)生產(chǎn)的成本,保證數(shù)據(jù)的有效供給,才可以促進(jìn)數(shù)據(jù)的后續(xù)分析與利用。

其二,數(shù)據(jù)持有者權(quán)旨在實(shí)現(xiàn)一定程度的排他性。典型的財(cái)產(chǎn)權(quán)必然包括三個(gè)核心特征:對(duì)世、排他和追及。其中對(duì)世是自動(dòng)創(chuàng)設(shè)與全世界所有其他人之財(cái)產(chǎn)關(guān)系;排他為物權(quán)人與他人之間的法律關(guān)系之內(nèi)容,即他人有不侵犯財(cái)產(chǎn)權(quán)的義務(wù);追及則是在同一物上的多個(gè)權(quán)利人之間發(fā)揮作用。[34]由于數(shù)據(jù)的非物質(zhì)性和非獨(dú)占性,不能排除他人對(duì)合法取得的同樣數(shù)據(jù)的使用,因此數(shù)據(jù)控制不應(yīng)包括完全的對(duì)世性。由于數(shù)據(jù)的范圍和能產(chǎn)生的價(jià)值都具有不確定性,如果賦予數(shù)據(jù)持有者無限的追及效力,會(huì)導(dǎo)致權(quán)利界分與識(shí)別的復(fù)雜化,讓數(shù)據(jù)流通產(chǎn)生極高的交易成本。因此,該權(quán)利沒有追及力,喪失控制即喪失權(quán)利。綜上,數(shù)據(jù)持有者權(quán)實(shí)際上主要的權(quán)利效果是有限的排他效力,以防止無權(quán)使用數(shù)據(jù)的第三方首次使用數(shù)據(jù),包括因未經(jīng)授權(quán)訪問和使用數(shù)據(jù)而要求損害賠償?shù)臋?quán)利。

其三,數(shù)據(jù)持有者權(quán)負(fù)有數(shù)據(jù)合法管理義務(wù)。法律上得以確認(rèn)的數(shù)據(jù)控制必須是合法的。這既是數(shù)據(jù)生產(chǎn)的前提,也是數(shù)據(jù)流通的前提。對(duì)于數(shù)據(jù)生產(chǎn)活動(dòng)來說,要想取得對(duì)于數(shù)據(jù)的合法控制,就要在生產(chǎn)過程中遵守《民法典》《網(wǎng)絡(luò)安全法》《數(shù)據(jù)安全法》等規(guī)范數(shù)據(jù)處理行為的法律規(guī)定,只有這樣生產(chǎn)/獲得的數(shù)據(jù)才是合法的財(cái)產(chǎn)。反之,不遵守法律會(huì)導(dǎo)致侵權(quán)責(zé)任、行政處罰甚至刑事責(zé)任,導(dǎo)致數(shù)據(jù)持有喪失法律基礎(chǔ)。[35]而對(duì)于后續(xù)的流通供應(yīng)來說,合法性同樣是數(shù)據(jù)進(jìn)入流通環(huán)節(jié)的前提。因?yàn)閿?shù)據(jù)上存在的利益多樣性,即使合法取得的數(shù)據(jù)也并不能消滅或忽視數(shù)據(jù)上存在的合法利益。[35]因此,數(shù)據(jù)使用環(huán)節(jié)仍然需要維護(hù)數(shù)據(jù)上所承載的利益主體的利益,只有每個(gè)環(huán)節(jié)都保證自己的數(shù)據(jù)控制合法合規(guī),且可以追溯到流通前手,才能保證整個(gè)數(shù)據(jù)流通過程的合法合規(guī)性,保證數(shù)據(jù)要素市場(chǎng)的運(yùn)行秩序。又由于這樣的財(cái)產(chǎn)權(quán)是純粹的防御性權(quán)利,它也可以通過增加防御元素來增強(qiáng)平臺(tái)對(duì)于數(shù)據(jù)的控制,從而更好地實(shí)現(xiàn)數(shù)據(jù)的流通共享。

(二)分享:數(shù)據(jù)分享義務(wù)

當(dāng)多重專有權(quán)導(dǎo)致公共資源的低效利用時(shí),“反公地悲劇”就會(huì)發(fā)生。[36]因此,我們?cè)跇?gòu)建數(shù)據(jù)持有者權(quán)時(shí),有意地限制了傳統(tǒng)所有權(quán)的對(duì)世、排他、追及權(quán)能,并使權(quán)利人盡量明確,但這還遠(yuǎn)遠(yuǎn)不夠。由于龐大的網(wǎng)絡(luò)運(yùn)營(yíng)者事實(shí)上控制著用戶的網(wǎng)絡(luò)活動(dòng)和海量的數(shù)據(jù),其性質(zhì)已經(jīng)越來越接近具有公共性的基礎(chǔ)設(shè)施,因此,解決數(shù)據(jù)資源供給問題的另一條途徑,就是讓數(shù)據(jù)資源的控制者分享(Data Sharing)或開放其數(shù)據(jù)資源,從而使更多的數(shù)據(jù)需求者得到滿足,而不是“自產(chǎn)自銷”。

1.基于公共利益的數(shù)據(jù)分享(開放)。賦予網(wǎng)絡(luò)運(yùn)營(yíng)者數(shù)據(jù)開放義務(wù)的正當(dāng)性理由主要有以下兩個(gè)方面。一方面,很多網(wǎng)絡(luò)平臺(tái)已逐漸具備準(zhǔn)公共基礎(chǔ)設(shè)施的屬性。要滿足傳統(tǒng)的公共基礎(chǔ)設(shè)施的定位,一般需要滿足雙重條件:一是“自然壟斷(Natural Monopoly)”[37],二是“受到公眾利益的影響”。[38]這兩種要件完全可以適用到目前的大型網(wǎng)絡(luò)平臺(tái),因?yàn)樗鼈兊淖饔猛恰扒度氲?,大部分是不可見的,通常被認(rèn)為是理所當(dāng)然的、高度標(biāo)準(zhǔn)化的信息傳播系統(tǒng)”[39],具有自然的壟斷地位和高度的社會(huì)依賴性。結(jié)合我國(guó)實(shí)際來看,對(duì)于網(wǎng)絡(luò)平臺(tái)的準(zhǔn)公共基礎(chǔ)設(shè)施地位的討論也有涉及,在《個(gè)人信息保護(hù)法》第58條(也被稱為互聯(lián)網(wǎng)“守門人條款”)[40]“互聯(lián)網(wǎng)平臺(tái)個(gè)人信息保護(hù)特別義務(wù)”規(guī)定中的三個(gè)條件“基礎(chǔ)互聯(lián)網(wǎng)服務(wù)”“用戶數(shù)量巨大”和“業(yè)務(wù)類型復(fù)雜”,就從平臺(tái)規(guī)模、力量、持續(xù)性與生態(tài)影響等幾個(gè)方面事實(shí)上劃定了一個(gè)網(wǎng)絡(luò)平臺(tái)是否為準(zhǔn)公共基礎(chǔ)設(shè)施的標(biāo)準(zhǔn),在實(shí)現(xiàn)從“開放資源到基礎(chǔ)服務(wù)”[41]的過程中,事實(shí)上接受了一種公共信任和公共責(zé)任。

另一方面,很多具有公共利益的數(shù)據(jù)存在“私人控制”的情況。由于數(shù)據(jù)價(jià)值的凸顯,數(shù)據(jù)開放帶來的好處已經(jīng)得到了世界各地政府的普遍承認(rèn),受益于政府信息公開制度的借鑒價(jià)值[42],政府?dāng)?shù)據(jù)開放率先成為國(guó)際社會(huì)的熱潮,并逐漸掀起一項(xiàng)開放政府?dāng)?shù)據(jù)運(yùn)動(dòng)。我國(guó)也于2015年印發(fā)《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》將“加快政府?dāng)?shù)據(jù)開放共享”作為大數(shù)據(jù)發(fā)展的主要任務(wù)。顯而易見,公共利益因素是早期數(shù)據(jù)開放,尤其是政府?dāng)?shù)據(jù)開放的重要出發(fā)點(diǎn)。結(jié)合近年各地方政府紛紛出臺(tái)相關(guān)的“公共數(shù)據(jù)管理辦法”,其中的一個(gè)重要目的旨在“加強(qiáng)公共數(shù)據(jù)管理,促進(jìn)公共數(shù)據(jù)應(yīng)用創(chuàng)新……保障數(shù)字化改革……推進(jìn)省域治理體系和治理能力現(xiàn)代化”(20)。簡(jiǎn)單而言,就是出于公共管理、社會(huì)治理等公共利益的目的而推進(jìn)公共數(shù)據(jù)的分享與開放。

但上述舉措都沒有解決一個(gè)基礎(chǔ)性的缺陷,即具有公共利益的數(shù)據(jù)的私人控制的問題。在我國(guó),無論是政府?dāng)?shù)據(jù)還是公共數(shù)據(jù)都依據(jù)“數(shù)據(jù)控制者”標(biāo)準(zhǔn),被界定為被政府或者公主體實(shí)際控制的數(shù)據(jù)。這就造成很多作為私主體的網(wǎng)絡(luò)運(yùn)營(yíng)者,特別是典型的“互聯(lián)網(wǎng)巨頭”們,即使由于其業(yè)務(wù)類型和用戶數(shù)量,事實(shí)上控制了很多涉及公共利益的數(shù)據(jù),卻無法在滿足特定條件的情況(如環(huán)境惡化、疫情防控等突發(fā)事件)下被分享使用,以滿足公共利益的目的。因此,為化解“公益數(shù)據(jù)的私人控制”問題,網(wǎng)絡(luò)運(yùn)營(yíng)者被賦予一定意義上的數(shù)據(jù)分享(開放)義務(wù)具有正當(dāng)性與合理性。事實(shí)上,在歐盟委員會(huì)最新立法建議《關(guān)于公平獲取和使用數(shù)據(jù)的協(xié)調(diào)規(guī)則(數(shù)據(jù)法)》(Data Act)中,已經(jīng)明確規(guī)定,基于突發(fā)公共事件、重大自然災(zāi)害以及重大網(wǎng)絡(luò)安全事件等公共利益的目的,使用數(shù)據(jù)的公共利益將超過數(shù)據(jù)持有者自由處置其持有數(shù)據(jù)的利益。在這種情況下,私人的數(shù)據(jù)持有者有義務(wù)根據(jù)公共部門、工會(huì)等相關(guān)機(jī)構(gòu)的要求向其分享(開放)數(shù)據(jù)。(21)

2.基于市場(chǎng)需求的數(shù)據(jù)分享。嚴(yán)格意義上來說,基于市場(chǎng)需求的數(shù)據(jù)分享更具有鼓勵(lì)數(shù)據(jù)控制者積極參與數(shù)據(jù)流通(包括數(shù)據(jù)開放、共享、交換、交易等形式)的意味,這不是一般意義上的賦予社會(huì)責(zé)任或義務(wù)。從獲取數(shù)據(jù)資源的數(shù)據(jù)生產(chǎn)角度出發(fā),市場(chǎng)化的數(shù)據(jù)分享是獲得生產(chǎn)要素,規(guī)范數(shù)據(jù)流通的必由之路和主要途徑。隨著越來越多的網(wǎng)絡(luò)運(yùn)營(yíng)者開始進(jìn)行數(shù)據(jù)市場(chǎng)化的數(shù)據(jù)分享時(shí),其對(duì)于削弱爬蟲技術(shù)的需求具有不可替代的作用。因此,本文亦對(duì)此部分作簡(jiǎn)要論述。

由于前述數(shù)據(jù)持有者權(quán)的存在,(除公共數(shù)據(jù)外)網(wǎng)絡(luò)運(yùn)營(yíng)者應(yīng)當(dāng)自主決定自身所管理的數(shù)據(jù)資源的開放方式。[10]5-16,254最大的可能是為了服務(wù)于網(wǎng)絡(luò)運(yùn)營(yíng)者的利益,會(huì)決定自愿與其他市場(chǎng)主體進(jìn)行合作。為此,應(yīng)向這些網(wǎng)絡(luò)運(yùn)營(yíng)者提供適當(dāng)?shù)募?lì)措施,以鼓勵(lì)這種自愿的合作與分享。事實(shí)上,作為開放數(shù)據(jù)運(yùn)動(dòng)的深化,很多政府在激勵(lì)、推廣、普及數(shù)據(jù)分享方面取得了重大進(jìn)展,而這些網(wǎng)絡(luò)運(yùn)營(yíng)者(包括企業(yè)、社會(huì)組織、學(xué)術(shù)機(jī)構(gòu)等等)通過免費(fèi)開放、共享和數(shù)據(jù)交易為更多的數(shù)據(jù)市場(chǎng)利益相關(guān)者帶來切實(shí)的利益。(22)另一種形式的激勵(lì)措施可以包括建立相關(guān)的稅收政策。推動(dòng)包含激勵(lì)因素的稅務(wù)制度設(shè)計(jì),探索實(shí)施“以數(shù)抵稅”政策,對(duì)于積極開放、共享數(shù)據(jù)并產(chǎn)生較大經(jīng)濟(jì)價(jià)值的網(wǎng)絡(luò)運(yùn)營(yíng)者,在因數(shù)據(jù)帶來的增值性收入中,給予適當(dāng)比例稅收減免,對(duì)于具有較大社會(huì)公益價(jià)值的,給予一定的稅收優(yōu)惠。綜上,政府可以通過培養(yǎng)和傳播機(jī)構(gòu)數(shù)據(jù)能力、闡明價(jià)值并建立影響證據(jù)庫、支持新的數(shù)據(jù)中介機(jī)構(gòu)、建立治理框架、創(chuàng)建可重用的技術(shù)基礎(chǔ)設(shè)施等方式實(shí)現(xiàn)對(duì)于數(shù)據(jù)市場(chǎng)化流通的激勵(lì)。[20]

此外,具有我國(guó)特色的“公共數(shù)據(jù)授權(quán)運(yùn)營(yíng)”制度也為公共數(shù)據(jù)參與數(shù)據(jù)要素市場(chǎng)分享活動(dòng)提供了重要的制度途徑。公共數(shù)據(jù)除了前述公共性價(jià)值,同時(shí)也具備了無限的經(jīng)濟(jì)價(jià)值與商業(yè)利用可能性。為了激發(fā)這部分?jǐn)?shù)據(jù)價(jià)值的轉(zhuǎn)化,以市場(chǎng)化的方式實(shí)現(xiàn)公共數(shù)據(jù)的分享與流通,“公共數(shù)據(jù)授權(quán)運(yùn)營(yíng)”可以說是一種極具中國(guó)特色的數(shù)據(jù)要素分享模式。授權(quán)運(yùn)營(yíng)單位通過取得公共數(shù)據(jù)管理機(jī)構(gòu)的授權(quán),對(duì)授權(quán)運(yùn)營(yíng)的公共數(shù)據(jù)進(jìn)行加工,形成的數(shù)據(jù)產(chǎn)品和服務(wù),以實(shí)現(xiàn)向市場(chǎng)化的主體提供符合標(biāo)準(zhǔn)要求的數(shù)據(jù)要素的目的。這種具有“特許經(jīng)營(yíng)”性質(zhì)的市場(chǎng)化數(shù)據(jù)分享模式[43],一方面協(xié)調(diào)了公主體及其他社會(huì)主體之于公共數(shù)據(jù)之上的利益關(guān)系,同時(shí)也在可控、可監(jiān)督的數(shù)據(jù)安全監(jiān)管范疇內(nèi)實(shí)現(xiàn)了高質(zhì)量數(shù)據(jù)要素產(chǎn)品的供給,實(shí)現(xiàn)了市場(chǎng)化價(jià)值與效率的提升。包括上海、浙江、成都等在內(nèi)的地方政府都在積極進(jìn)行“公共數(shù)據(jù)授權(quán)運(yùn)營(yíng)”的實(shí)踐層面的探索與嘗試。這一制度與公共數(shù)據(jù)開放、共享制度相結(jié)合,將完整構(gòu)建關(guān)于公共數(shù)據(jù)分享利用的制度框架,對(duì)化解爬蟲技術(shù)所面臨的數(shù)據(jù)“獲取難”問題大有裨益。

六、結(jié)語

互聯(lián)網(wǎng)不僅僅是通信和活動(dòng)開展的工具,還是感知和記錄客觀世界的系統(tǒng)。由此形成的數(shù)字化記錄(數(shù)據(jù))正成為新的知識(shí)生產(chǎn)方式的原料。人類文明所呈現(xiàn)出的“數(shù)據(jù)→信息→知識(shí)→智慧”的遞進(jìn)式結(jié)構(gòu)[44],已經(jīng)隨著數(shù)字技術(shù)發(fā)展而發(fā)生了重要變化,人類認(rèn)知世界的對(duì)象也由人類觀察和描述的信息、知識(shí)向底層數(shù)據(jù)——可機(jī)讀數(shù)據(jù)、語義元數(shù)據(jù),不斷地深化,關(guān)于客觀世界的機(jī)讀數(shù)據(jù)、語義元數(shù)據(jù)開始成為數(shù)字時(shí)代的生產(chǎn)要素。

正因?yàn)榛ヂ?lián)網(wǎng)產(chǎn)生的數(shù)據(jù)具有巨大的重用價(jià)值,以爬蟲技術(shù)為代表的“代碼層”爭(zhēng)議不斷出現(xiàn)。對(duì)此,本文論證了爬蟲技術(shù)的兩面性。顯然,目前的理論與司法實(shí)踐都更加關(guān)注其負(fù)面影響,而未正視其生產(chǎn)性的數(shù)據(jù)重用價(jià)值。爬蟲技術(shù)對(duì)于便利要素流動(dòng),擴(kuò)展要素重用場(chǎng)景、拓展要素使用目的,實(shí)現(xiàn)數(shù)據(jù)要素計(jì)算循環(huán)價(jià)值有著與生俱來的特殊技術(shù)優(yōu)勢(shì)。因此,爬蟲技術(shù)的問題本質(zhì)是對(duì)于數(shù)據(jù)要素市場(chǎng)主體合法利益分配治理的制度性問題,是解決創(chuàng)制數(shù)據(jù)和添附價(jià)值的數(shù)據(jù)生產(chǎn)者對(duì)數(shù)據(jù)重用權(quán)益保護(hù)問題。

通過“控制”與“分享”的二元路徑,既可以實(shí)現(xiàn)對(duì)于數(shù)據(jù)利益的合理分配,促進(jìn)數(shù)據(jù)要素市場(chǎng)的穩(wěn)定供給和生產(chǎn),又可以幫助促成更加公平的數(shù)據(jù)利益分享機(jī)制,為全社會(huì)主體有效獲取利用數(shù)據(jù)開辟道路。推而廣之,數(shù)據(jù)要素的“控制”與“分享”應(yīng)當(dāng)是所有數(shù)字經(jīng)濟(jì)社會(huì)主體圍繞數(shù)據(jù)流通使用的“社會(huì)契約”,以保障公平實(shí)現(xiàn)社會(huì)主體參與數(shù)據(jù)價(jià)值的轉(zhuǎn)化,共同探索建立數(shù)據(jù)治理的信任框架。

注釋:

(1)Robots協(xié)議,也稱爬蟲協(xié)議、爬蟲規(guī)則等,是約定俗成的規(guī)范,不具有強(qiáng)制力。指網(wǎng)站通過建立robots.txt文件來告訴搜索引擎哪些頁面可以抓取,哪些頁面不可以抓取。

(2)《網(wǎng)絡(luò)安全法》規(guī)定:網(wǎng)絡(luò)運(yùn)營(yíng)者是指網(wǎng)絡(luò)的所有者、管理者和網(wǎng)絡(luò)服務(wù)提供者。另外需要說明的是,網(wǎng)絡(luò)可以實(shí)現(xiàn)各種社會(huì)活動(dòng),在實(shí)現(xiàn)或組織實(shí)現(xiàn)這些活動(dòng)過程會(huì)形成數(shù)據(jù)這種“副產(chǎn)品”,內(nèi)容平臺(tái)或者具有內(nèi)容生產(chǎn)功能的社交平臺(tái)只是其中典型。本文以內(nèi)容平臺(tái)為例進(jìn)行相關(guān)分析論述,相關(guān)結(jié)論同樣適用于其他的網(wǎng)絡(luò)運(yùn)營(yíng)者,特在此予以強(qiáng)調(diào)說明。

(3)一些公司主要是依靠員工手動(dòng)瀏覽網(wǎng)站,并每天將數(shù)據(jù)從一個(gè)或多個(gè)網(wǎng)站復(fù)制/粘貼到電子表格或表單中。這種方法有許多缺點(diǎn),包括支付人工費(fèi)用、數(shù)據(jù)準(zhǔn)確性較低以及時(shí)間限制等。

(4)相關(guān)研究參見劉艷紅:《網(wǎng)絡(luò)爬蟲行為的刑事規(guī)制研究——以侵犯公民個(gè)人信息犯罪為視角》,《政治與法律》2019年第11期;Myra F.Din.Breaching and Entering:When Data Scraping Should Be a Federal Computer Hacking Crime.Brook.L.Rev.2015,(81)等。

(5)參見張維迎.理念的力量[M],西安:西北大學(xué)出版社,2014.本書中張維迎教授具體區(qū)分了“市場(chǎng)邏輯”與“宗教邏輯”。

(6)關(guān)于網(wǎng)絡(luò)服務(wù)協(xié)議、服務(wù)政策效力的相關(guān)研究參見王葉剛:《論網(wǎng)絡(luò)隱私政策的效力——以個(gè)人信息保護(hù)為中心》,《比較法研究》2020年第1期;姚黎黎:《網(wǎng)絡(luò)服務(wù)協(xié)議中動(dòng)態(tài)條款的異質(zhì)性規(guī)則與權(quán)利平衡》,《學(xué)習(xí)與實(shí)踐》2017年第4期。

(7)參見L.Lessig.The Future of Ideas:The Fate of the Commons in a Connected World,New York:Random House,2002.在談到現(xiàn)代網(wǎng)絡(luò)信息技術(shù)中的信息傳遞時(shí),萊斯格教授(Lawrence Lessig)所提出的這三個(gè)層面區(qū)分的經(jīng)典理論至今起著至關(guān)重要的作用。

(8)參見王天恩:《信息及其基本特征的當(dāng)代性開顯》,《中國(guó)社會(huì)科學(xué)》2022年第1期。信息既不是物質(zhì)也不是能量,而是一種基于物能的感受性關(guān)系,其成熟形態(tài)即信宿和信源間的感受性關(guān)系過程。

(9)相關(guān)案例參見杭州鐵路運(yùn)輸法院(2021)浙8601民初309號(hào)民事判決書。事實(shí)上,在我國(guó)的司法審判中,數(shù)據(jù)的用途與數(shù)據(jù)源的用途是否具有實(shí)質(zhì)性替代的效果,成為判斷爬蟲技術(shù)是屬于不正當(dāng)競(jìng)爭(zhēng)行為的重要考量因素。

(10)內(nèi)容生產(chǎn)活動(dòng)一方面創(chuàng)造了UGC數(shù)據(jù),一方面也基于用戶的生產(chǎn)活動(dòng)客觀產(chǎn)生了觀測(cè)數(shù)據(jù)和衍生數(shù)據(jù)。從數(shù)據(jù)生產(chǎn)角度來說,進(jìn)行內(nèi)容生產(chǎn)就是一種數(shù)據(jù)生產(chǎn)活動(dòng)。

(11)參見HiQ Labs,Inc.v.LinkedIn Corp.No.17-16783 D.C.No.3:17-cv-03301-EMC.

(12)參見Directive 96/9/EC of the European Parliament and of the Council of 11 March 1996 on the Legal Protection of Databases.

(13)參 見P.Hugenholtz.Against‘Data Property’.Kritika,2018,(3).對(duì)于數(shù)據(jù)生產(chǎn)者權(quán),學(xué)界質(zhì)疑的聲音比較大。

(14)參見(2017)京民終487號(hào)民事判決書。

(15)參見(2017)粵03民初822號(hào)民事判決書。

(16)參見(2019)京73民終3789號(hào)民事判決書。

(17)參見(2019)京73民終3789號(hào)民事判決書。

(18)據(jù)蘇青教授統(tǒng)計(jì),截至2020年12月31日,網(wǎng)絡(luò)爬蟲涉罪刑事案件共有31件,涉案主要罪名為侵犯公民個(gè)人信息罪、侵犯著作權(quán)罪、非法獲取計(jì)算機(jī)信息系統(tǒng)數(shù)據(jù)罪與破壞計(jì)算機(jī)信息系統(tǒng)罪,案件數(shù)量分別為13件、8件和7件。參見蘇青:《網(wǎng)絡(luò)爬蟲的演變及其合法性限定》,《比較法研究》2021年第3期。

(19)《刑法》第285條規(guī)定了非法侵入計(jì)算機(jī)信息系統(tǒng)罪,非法獲取計(jì)算機(jī)信息系統(tǒng)數(shù)據(jù)與非法控制計(jì)算機(jī)信息系統(tǒng)罪,提供侵入、非法控制計(jì)算機(jī)信息系統(tǒng)程序、工具罪。

(20)參見《浙江省公共數(shù)據(jù)條例》第1條。

(21)參見REGULATION OF THE EUROPEAN PARLIAMENT AND OF THE COUNCIL on Harmonised Rules on Fair Access to and Use of Data(Data Act),{SEC(2022)81 final}-{SWD(2022)34 final}-{SWD(2022)35 final},Brussels,23.2.2022,COM(2022)68 final,2022/0047(COD).

(22)例如,美國(guó)專利商標(biāo)局(USPTO)也可能為聲稱從數(shù)據(jù)池獲得新創(chuàng)新的專利申請(qǐng)者提供快速途徑,從而激勵(lì)平臺(tái)公司參與數(shù)據(jù)池。

猜你喜歡
運(yùn)營(yíng)者爬蟲生產(chǎn)
利用網(wǎng)絡(luò)爬蟲技術(shù)驗(yàn)證房地產(chǎn)灰犀牛之說
公眾號(hào)再增視頻號(hào)入口
基于Python的網(wǎng)絡(luò)爬蟲和反爬蟲技術(shù)研究
用舊的生產(chǎn)新的!
“三夏”生產(chǎn) 如火如荼
利用爬蟲技術(shù)的Geo-Gnutel la VANET流量采集
S-76D在華首架機(jī)實(shí)現(xiàn)生產(chǎn)交付
網(wǎng)絡(luò)運(yùn)營(yíng)者不得泄露個(gè)人信息
大數(shù)據(jù)環(huán)境下基于python的網(wǎng)絡(luò)爬蟲技術(shù)
電子制作(2017年9期)2017-04-17 03:00:46
鏈接:網(wǎng)絡(luò)運(yùn)營(yíng)者不得泄露其收集的個(gè)人信息
河南省| 颍上县| 班玛县| 云林县| 厦门市| 清水河县| 塔城市| 石屏县| 西乡县| 莫力| 平潭县| 乌拉特中旗| 台北县| 宜黄县| 屏山县| 潼关县| 保德县| 宿州市| 南充市| 永昌县| 昌图县| 南雄市| 黑水县| 三亚市| 驻马店市| 新丰县| 龙泉市| 建昌县| 乌鲁木齐县| 扎赉特旗| 延安市| 宁津县| 五寨县| 剑河县| 巴林左旗| 新龙县| 屏南县| 白银市| 工布江达县| 绥芬河市| 东安县|