內(nèi)容提要:數(shù)據(jù)已成為數(shù)字經(jīng)濟(jì)時(shí)代和人工智能產(chǎn)業(yè)發(fā)展的重要生產(chǎn)要素。如何構(gòu)建數(shù)據(jù)產(chǎn)權(quán)在內(nèi)的數(shù)據(jù)基礎(chǔ)制度成為當(dāng)前的重要課題。中國(guó)“數(shù)據(jù)二十條”提出的“三權(quán)分置”數(shù)據(jù)產(chǎn)權(quán)理念和制度屬于重大理論創(chuàng)新,但面臨如何準(zhǔn)確界定“三權(quán)”各自客體內(nèi)容和權(quán)利邊界等問題。相關(guān)司法實(shí)踐可以提供有效的借鑒,并已形成部分共識(shí)。當(dāng)前高質(zhì)量中文數(shù)據(jù)集短缺作為制約人工智能發(fā)展的主要因素,亟待通過法律規(guī)則的更新供給來激活數(shù)據(jù)要素的價(jià)值。未來,應(yīng)堅(jiān)持以數(shù)據(jù)要素的高效流通利用為目標(biāo),并根據(jù)司法實(shí)踐總結(jié)的規(guī)則適配數(shù)據(jù)要素的特性對(duì)數(shù)據(jù)產(chǎn)權(quán)的權(quán)項(xiàng)內(nèi)容、權(quán)利邊界、權(quán)利有效期、權(quán)利限制等進(jìn)行審慎設(shè)置與平衡,確保數(shù)據(jù)資源的有效分配和利用,還應(yīng)加強(qiáng)對(duì)個(gè)人信息匿名化標(biāo)準(zhǔn)和公共數(shù)據(jù)授權(quán)運(yùn)營(yíng)實(shí)踐的探索,促進(jìn)數(shù)據(jù)流通,助力人工智能產(chǎn)業(yè)發(fā)展。
關(guān)鍵詞:數(shù)據(jù)流通 數(shù)據(jù)產(chǎn)權(quán) 三權(quán)分置 人工智能
一、引言
隨著人工智能技術(shù)的發(fā)展,人類社會(huì)生活方式與經(jīng)濟(jì)模式產(chǎn)生了根本性變革,數(shù)據(jù)不僅成為數(shù)字經(jīng)濟(jì)時(shí)代最重要的生產(chǎn)要素,也是數(shù)字經(jīng)濟(jì)發(fā)展的重要驅(qū)動(dòng)力。根據(jù)互聯(lián)網(wǎng)數(shù)據(jù)中心(IDC)的預(yù)測(cè),到2025年,全球數(shù)據(jù)圈(global datasphere)將擴(kuò)展至163ZB,【1ZB約等于1萬億GB?!肯喈?dāng)于2016年所產(chǎn)生的16.1ZB數(shù)據(jù)的十倍。【David Reinsel、John Gantz和John Rydning:《數(shù)據(jù)時(shí)代2025》,載希捷網(wǎng),https://www.seagate.com/files/www-content/our-story/trends/files/data-age-2025-white-paper-simplified-chinese.pdf,2024年8月19日訪問?!?/p>
國(guó)家數(shù)據(jù)局2024年6月發(fā)布的《數(shù)字中國(guó)發(fā)展報(bào)告(2023年)》顯示,我國(guó)數(shù)據(jù)產(chǎn)量保持快速增長(zhǎng)態(tài)勢(shì),數(shù)字經(jīng)濟(jì)規(guī)模持續(xù)壯大。2023年,全國(guó)數(shù)據(jù)生產(chǎn)總量達(dá)32.85 ZB,同比增長(zhǎng)22.44%。截至2023年年底,全國(guó)數(shù)據(jù)存儲(chǔ)總量為1.73 ZB。2023年數(shù)字經(jīng)濟(jì)核心產(chǎn)業(yè)增加值估計(jì)超過12萬億元,占GDP比重的10%左右。以云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)等為代表的新興業(yè)務(wù)收入逐年攀升,信息通信產(chǎn)品生產(chǎn)和電子元器件生產(chǎn)領(lǐng)域發(fā)展較快,圍繞“數(shù)據(jù)資源、基礎(chǔ)硬件、通用軟件、行業(yè)應(yīng)用、安全保障”的數(shù)字產(chǎn)業(yè)基礎(chǔ)不斷夯實(shí),數(shù)字產(chǎn)業(yè)體系完備性、規(guī)模性優(yōu)勢(shì)日益明顯。
我國(guó)數(shù)據(jù)產(chǎn)量的顯著增長(zhǎng)和存儲(chǔ)量的擴(kuò)大,不僅反映了數(shù)據(jù)積累的規(guī)模,也顯示了數(shù)據(jù)潛力的深度,為數(shù)據(jù)的深度挖掘和應(yīng)用提供了堅(jiān)實(shí)的基礎(chǔ)。2022年,ChatGPT的問世標(biāo)志著人工智能從判別式發(fā)展到生成式的跨越。雖然目前的大模型只是針對(duì)特定任務(wù)和指定模態(tài),離通用人工智能還有不少距離,但語言大模型讓機(jī)器初步具有常識(shí),懂得推理,學(xué)會(huì)創(chuàng)作,讓人和機(jī)器能以較自然的方式互動(dòng),通過與周邊工具的結(jié)合,表現(xiàn)出擬人的智能?!緡?guó)家數(shù)據(jù)局:《AI時(shí)代的數(shù)據(jù)要素開發(fā)與治理》,載國(guó)家數(shù)據(jù)局微信公眾號(hào)2023年11月3日,https://mp.weixin.qq.com/s/UW9tn28dN7ehThSRZ8S3sQ,2024年8月19日訪問。】
作為引領(lǐng)未來的通用技術(shù),人工智能的快速迭代和其在各領(lǐng)域的廣泛應(yīng)用正在引發(fā)一系列鏈?zhǔn)酵黄?,為?shù)字經(jīng)濟(jì)的發(fā)展提供了強(qiáng)勁的動(dòng)力支撐。如何通過法律制度和規(guī)則促進(jìn)人工智能產(chǎn)業(yè)、數(shù)字經(jīng)濟(jì)的發(fā)展,是當(dāng)前法律共同體面臨的重大議題。
二、數(shù)據(jù)產(chǎn)權(quán)的構(gòu)建探索、理論爭(zhēng)議及比較法觀察
2020年4月,中共中央、國(guó)務(wù)院發(fā)布的《關(guān)于構(gòu)建更加完善的要素市場(chǎng)化配置體制機(jī)制的意見》首次明確將數(shù)據(jù)列為和土地、勞動(dòng)力、資本、技術(shù)并列的生產(chǎn)要素,如何激發(fā)數(shù)據(jù)這一生產(chǎn)要素的活力、實(shí)現(xiàn)生產(chǎn)要素創(chuàng)新性配置,成為培育數(shù)據(jù)要素市場(chǎng)的核心目標(biāo)。“研究根據(jù)數(shù)據(jù)性質(zhì)完善產(chǎn)權(quán)性質(zhì)”等關(guān)于數(shù)據(jù)基礎(chǔ)制度的探索由此拉開了序幕。
數(shù)據(jù)基礎(chǔ)制度是包含數(shù)據(jù)產(chǎn)權(quán)、數(shù)據(jù)要素流通和交易、收益分配、安全與治理等在內(nèi)的一系列制度安排,是充分發(fā)揮數(shù)據(jù)要素作用的根本性制度。發(fā)揮數(shù)據(jù)要素價(jià)值、對(duì)數(shù)據(jù)進(jìn)行充分開發(fā)利用及市場(chǎng)化配置,是數(shù)據(jù)基礎(chǔ)制度的優(yōu)先目標(biāo)。然而,數(shù)據(jù)作為新興生產(chǎn)要素,其在一定程度上既遵循傳統(tǒng)生產(chǎn)要素市場(chǎng)化配置的一般規(guī)律,也呈現(xiàn)出許多新的特征。
(一)數(shù)據(jù)要素的特征
相較于土地、資本等生產(chǎn)要素而言,數(shù)據(jù)具有顯著的無形性、可復(fù)制性、共享性、非競(jìng)爭(zhēng)性、非消耗性特征,特別是從價(jià)值層面而言,數(shù)據(jù)具有場(chǎng)景化的價(jià)值潛力和不確定性,即相同數(shù)據(jù)在不同使用方或不同使用場(chǎng)景之下可發(fā)揮不同的價(jià)值,且數(shù)據(jù)復(fù)制和使用的邊際成本接近于零,意味著數(shù)據(jù)的使用可以大規(guī)模擴(kuò)展而不會(huì)帶來相應(yīng)的成本增加。就數(shù)據(jù)的上述特性而言,其在法律層面最接近知識(shí)產(chǎn)權(quán)的客體。特別是在無形性和排他性的問題上,知識(shí)產(chǎn)權(quán)客體借助法律擬制實(shí)現(xiàn)了排他性,似乎也可以借鑒至數(shù)據(jù)產(chǎn)權(quán)的規(guī)則框架中。但是,數(shù)據(jù)在收集、流轉(zhuǎn)過程中承載了多方主體的參與和利益訴求,使得關(guān)于其排他性的規(guī)則設(shè)置遠(yuǎn)比知識(shí)產(chǎn)權(quán)客體復(fù)雜。數(shù)據(jù)的上述特性決定了在法律層面對(duì)其進(jìn)行權(quán)利化制度構(gòu)造,具有特殊性和復(fù)雜性。從立法依據(jù)看,雖然《民法總則》(草案)第108條曾將“數(shù)據(jù)信息”納入知識(shí)產(chǎn)權(quán)客體范疇,但最終未獲通過。《民法典》依舊將數(shù)據(jù)與知識(shí)產(chǎn)權(quán)的客體作了立法層面的區(qū)分。
(二)數(shù)據(jù)確權(quán)與數(shù)據(jù)流通
雖然數(shù)據(jù)權(quán)屬不明確導(dǎo)致的不確定性會(huì)增加數(shù)據(jù)流通難度,但實(shí)踐中,數(shù)據(jù)流通的場(chǎng)景遠(yuǎn)多于數(shù)據(jù)交易。數(shù)據(jù)在供應(yīng)鏈上下游的數(shù)據(jù)產(chǎn)品生成和服務(wù)流轉(zhuǎn)中發(fā)揮助推產(chǎn)業(yè)轉(zhuǎn)型升級(jí)、壯大經(jīng)濟(jì)發(fā)展新引擎的作用,并非只有通過數(shù)據(jù)確權(quán)后的產(chǎn)權(quán)交易形式才能實(shí)現(xiàn)流轉(zhuǎn)和價(jià)值的發(fā)揮。
有觀點(diǎn)認(rèn)為,《個(gè)人信息保護(hù)法》《反不正當(dāng)競(jìng)爭(zhēng)法》和知識(shí)產(chǎn)權(quán)法在回應(yīng)數(shù)據(jù)權(quán)益主體的數(shù)據(jù)保護(hù)需求方面存在不足之處,數(shù)據(jù)確權(quán)立法才能有效實(shí)現(xiàn)對(duì)數(shù)據(jù)的保護(hù),進(jìn)而激勵(lì)數(shù)據(jù)相關(guān)的生產(chǎn)和投資。從實(shí)踐來看,上述觀點(diǎn)值得商榷。無論是個(gè)人作為數(shù)據(jù)來源者,還是企業(yè)作為數(shù)據(jù)的收集、加工、處理者,基于勞動(dòng)理論賦予其財(cái)產(chǎn)權(quán)進(jìn)行激勵(lì)固然有一定的理論正當(dāng)性,但也要警惕過度激勵(lì)或者超范圍激勵(lì)可能損害其他主體的利益,需要在激勵(lì)程度上予以權(quán)衡。此外,通過用戶協(xié)議、平臺(tái)規(guī)則、商事合同等市場(chǎng)自治手段,已經(jīng)完成了大量場(chǎng)景下的數(shù)據(jù)流通和交易,對(duì)于已經(jīng)產(chǎn)生的數(shù)據(jù)糾紛,《反不正當(dāng)競(jìng)爭(zhēng)法》以其彈性和靈活性也進(jìn)行了較好的應(yīng)對(duì),特別是最高人民法院和各知識(shí)產(chǎn)權(quán)法院、互聯(lián)網(wǎng)法院等通過發(fā)布典型案例的形式,以裁判促規(guī)則,以規(guī)則促治理,以治理促發(fā)展,在沒有數(shù)據(jù)確權(quán)的狀態(tài)下,已經(jīng)就部分?jǐn)?shù)據(jù)流通規(guī)則在司法實(shí)踐中達(dá)成了適應(yīng)產(chǎn)業(yè)發(fā)展的一定共識(shí)。
從數(shù)據(jù)確權(quán)的實(shí)際效果而言,還需警惕“數(shù)據(jù)沼澤”現(xiàn)象。具言之,《民法典》《個(gè)人信息保護(hù)法》等法律法規(guī)已經(jīng)為個(gè)人信息的收集、存儲(chǔ)、使用等處理行為設(shè)定了規(guī)則,并賦予個(gè)人信息主體查閱、復(fù)制、刪除等權(quán)利,在此基礎(chǔ)之上從財(cái)產(chǎn)權(quán)角度賦予個(gè)人信息主體一項(xiàng)個(gè)人數(shù)據(jù)權(quán)利的必要性缺乏理論基礎(chǔ),且存在與已有權(quán)利的協(xié)調(diào)難題。此外,企業(yè)數(shù)據(jù)確權(quán)的規(guī)則更為復(fù)雜,不僅因?yàn)槠髽I(yè)數(shù)據(jù)存在公開、半公開、非公開,單一、集合,原始、衍生等不同數(shù)據(jù)樣態(tài),確權(quán)及配套的流通規(guī)則需要進(jìn)一步類型化和場(chǎng)景化,方可促進(jìn)行業(yè)行穩(wěn)致遠(yuǎn)合法合規(guī)持續(xù)發(fā)展。在部分場(chǎng)景下,企業(yè)數(shù)據(jù)還不可避免地包含大量的個(gè)人數(shù)據(jù),面臨與個(gè)人信息主體相關(guān)權(quán)益的協(xié)調(diào)問題,雖然“權(quán)利束”的理論構(gòu)建旨在對(duì)權(quán)利進(jìn)行分割配置,符合反公地悲劇設(shè)定的條件,但“在眾多權(quán)利交織的背景下,任何一項(xiàng)權(quán)利、任何一個(gè)權(quán)利主體都可以排除他人對(duì)于數(shù)據(jù)的使用,以至于出現(xiàn)比專利叢林更為復(fù)雜的‘?dāng)?shù)據(jù)沼澤’現(xiàn)象”?!局軡h華:《數(shù)據(jù)確權(quán)的誤區(qū)》,載《法學(xué)研究》2023年第2期?!?/p>
(三)比較法觀察:從賦權(quán)到聚焦設(shè)定流通規(guī)則
歐盟出于對(duì)數(shù)據(jù)庫(kù)投資進(jìn)行激勵(lì)的目的,于1996年通過了《歐洲共同體關(guān)于數(shù)據(jù)庫(kù)法律保護(hù)的指令》(以下簡(jiǎn)稱“數(shù)據(jù)庫(kù)指令”),【See Directive 96/9/EC of the European Parliament and of the Council of 11 March 1996 on the legal protection of databases [1996] OJ L77/20.】對(duì)數(shù)據(jù)庫(kù)設(shè)定了特殊權(quán)利保護(hù)。歐盟委員會(huì)非常重視此種設(shè)置的實(shí)踐效果,因而在2005年和2018年先后兩次對(duì)其進(jìn)行了效果評(píng)估,但兩次評(píng)估結(jié)論均認(rèn)為特殊權(quán)利未能刺激歐洲數(shù)據(jù)庫(kù)產(chǎn)業(yè)投資,甚至產(chǎn)生了相反的效果?!究椎旅鳎骸稊?shù)據(jù)財(cái)產(chǎn)權(quán)到訪問權(quán):歐盟數(shù)據(jù)設(shè)權(quán)立法轉(zhuǎn)型解析》,載《比較法研究》2023年第6期?!?017年,《構(gòu)建歐洲數(shù)據(jù)經(jīng)濟(jì)》(Building a European data economy)提出“數(shù)據(jù)生產(chǎn)者權(quán)利”(data producers right)的概念,目的是提高非個(gè)人或匿名化的機(jī)器生成數(shù)據(jù)作為經(jīng)濟(jì)商品的可交易性。就該權(quán)利的范圍,存在兩種設(shè)想:一種是將其設(shè)想為對(duì)物權(quán)利,即類似“所有權(quán)”的概念,包括轉(zhuǎn)讓、許可使用數(shù)據(jù)的專有權(quán)利,以及防止他人未經(jīng)授權(quán)使用和獲取數(shù)據(jù)的權(quán)利;另一種是不設(shè)定所有權(quán),而是設(shè)定一套防御性的權(quán)利,保護(hù)對(duì)數(shù)據(jù)事實(shí)上的“占有”。【參見COMMISSION STAFF WORKING DOCUMENT on the free flow of data and emerging issues of the European data economy Accompanying the document Communication Building a European data economy,載https://eur-lex.europa.eu/legal-content/EN/TXT/?uri=CELEX%3A52017SC0002.】然而,上述設(shè)想遭到了學(xué)界和業(yè)界的強(qiáng)烈反對(duì),認(rèn)為“定義數(shù)據(jù)訪問權(quán)比定義所有權(quán)更重要”的觀點(diǎn)逐漸占據(jù)上風(fēng)。此后,2018年歐盟《通用數(shù)據(jù)保護(hù)條例》和2019年歐盟《非個(gè)人數(shù)據(jù)自由流動(dòng)條例》從實(shí)現(xiàn)數(shù)據(jù)要素自由流動(dòng)和市場(chǎng)有效競(jìng)爭(zhēng)等目的出發(fā),轉(zhuǎn)向設(shè)定個(gè)人數(shù)據(jù)可攜權(quán)和非個(gè)人數(shù)據(jù)可遷移性相關(guān)規(guī)則。2023年11月,歐洲議會(huì)和歐洲理事會(huì)正式批準(zhǔn)了《歐盟數(shù)據(jù)法案》,不再?gòu)?qiáng)調(diào)個(gè)人數(shù)據(jù)與非個(gè)人數(shù)據(jù)的區(qū)分,“數(shù)據(jù)”在該法案下的定義廣泛,涵蓋“任何數(shù)字形式的行為、事實(shí)或信息”。法案要求數(shù)據(jù)處理服務(wù)供應(yīng)商需采取措施,消除影響切換服務(wù)商的商業(yè)、技術(shù)、合同或組織障礙,允許更廣泛地訪問數(shù)據(jù)并消除更改數(shù)據(jù)服務(wù)供應(yīng)商的障礙來刺激競(jìng)爭(zhēng)激烈的數(shù)據(jù)市場(chǎng)。由此可見,歐盟在促進(jìn)數(shù)據(jù)要素保護(hù)和流動(dòng)的制度探索上,經(jīng)歷了從構(gòu)建產(chǎn)權(quán)規(guī)則到聚焦設(shè)定流通規(guī)則的過程。
美國(guó)曾在1996年和1999年分別提出《數(shù)據(jù)庫(kù)投資和知識(shí)產(chǎn)權(quán)反盜版法案》(Database Investment and Intellectual Property Antipiracy Act of 1996)和《信息收集反盜用法案》(Collections of Information Antipiracy Act),旨在對(duì)數(shù)據(jù)庫(kù)投資或投入大量資源收集、維護(hù)信息集合者的利益進(jìn)行保護(hù),防止他人未經(jīng)授權(quán)的復(fù)制、傳播等盜用行為?!緟⒁奌.R.3531- Database Investment and Intellectual Property Antipiracy Act of 1996,載https://www.govinfo.gov/content/pkg/BILLS-104hr3531ih/pdf/BILLS-104hr3531ih.pdf,H.R.354 - Collections of Information Antipiracy Act,https://www.congress.gov/bill/106th-congress/house-bill/354.】然而,相關(guān)法案議案均因可能造成數(shù)據(jù)訪問限制、數(shù)據(jù)壟斷而遭到多方強(qiáng)烈反對(duì),最終未能通過。關(guān)于個(gè)人數(shù)據(jù),美國(guó)立法始終將其置于消費(fèi)者權(quán)益保護(hù)的法律框架下,并未像歐盟一樣對(duì)個(gè)人信息數(shù)據(jù)設(shè)定較強(qiáng)的保護(hù)規(guī)則。直到2018年6月,美國(guó)加州才頒布首個(gè)關(guān)于個(gè)人數(shù)據(jù)隱私的專門立法——《加利福尼亞消費(fèi)者隱私法案》(California Consumer Privacy Act)。在法無禁止即自由的原則下,美國(guó)數(shù)據(jù)流通實(shí)踐高度奉行意思自治、自由交易原則,形成了較為悠久的數(shù)據(jù)交易市場(chǎng)。市場(chǎng)主體通過合同約定、行業(yè)慣例等實(shí)現(xiàn)了對(duì)各自權(quán)利義務(wù)的分配,再配合法院的裁判規(guī)則,共同構(gòu)筑了美國(guó)的數(shù)據(jù)流通規(guī)則。
日本在2018年修改《不正當(dāng)競(jìng)爭(zhēng)防止法》時(shí)將對(duì)特定數(shù)據(jù)的不正當(dāng)獲取、使用、披露,以及顯著違反誠(chéng)信原則使用或者披露數(shù)據(jù)等行為納入其中進(jìn)行規(guī)制?!緟⒁娙毡窘?jīng)濟(jì)產(chǎn)業(yè)省:「限定提供データに関する指針」,載日本經(jīng)濟(jì)產(chǎn)業(yè)省官網(wǎng),https://www.meti.go.jp/policy/economy/chizai/chiteki/guideline/h31pd.pdf.】從保護(hù)范圍看,其將具有商業(yè)價(jià)值的、可供交易的數(shù)據(jù)集合(這種數(shù)據(jù)因?yàn)樘峁┙o特定人或多名特定人而并沒有進(jìn)行秘密管理)這一原本無法通過商業(yè)秘密路徑進(jìn)行保護(hù)的數(shù)據(jù)予以保護(hù),擴(kuò)張了反不正當(dāng)競(jìng)爭(zhēng)法保護(hù)的數(shù)據(jù)范圍和類型,同時(shí)特別排除了免費(fèi)向一般公眾開放使用的數(shù)據(jù)。日本采取的這種數(shù)據(jù)保護(hù)模式較好地處理了數(shù)據(jù)保護(hù)和數(shù)據(jù)利用之間的關(guān)系,但存在和商業(yè)秘密保護(hù)界限不清、保護(hù)客體要件設(shè)置模糊等問題。
韓國(guó)于2021年12月修訂了《反不正當(dāng)競(jìng)爭(zhēng)及保護(hù)商業(yè)秘密的相關(guān)法律》,吸收借鑒了日本的經(jīng)驗(yàn),采取了與日本類似的反不正當(dāng)競(jìng)爭(zhēng)法弱保護(hù)模式?!緟⒁奾ttps://www.shinkim.com/attachment/25431;shinkimfront=CFBAC6F178EECFC74856A718DFB27A6A.】
事實(shí)上,確保數(shù)據(jù)最大限度地流通和利用才是數(shù)據(jù)要素價(jià)值最大化和數(shù)據(jù)基礎(chǔ)制度構(gòu)建的基礎(chǔ)?;诖?,《中共中央、國(guó)務(wù)院關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見》(以下簡(jiǎn)稱“數(shù)據(jù)二十條”)在關(guān)于數(shù)據(jù)權(quán)屬的建構(gòu)上淡化甚至放棄了“所有權(quán)”概念,轉(zhuǎn)而強(qiáng)調(diào)一種以“數(shù)據(jù)相關(guān)權(quán)利結(jié)構(gòu)性分置”為基本思路的數(shù)據(jù)產(chǎn)權(quán)觀念和產(chǎn)權(quán)制度,為科學(xué)地認(rèn)識(shí)和建構(gòu)數(shù)據(jù)產(chǎn)權(quán)制度提供了新的基礎(chǔ)。【熊丙萬:《數(shù)據(jù)產(chǎn)權(quán)制度的理論挑戰(zhàn)與現(xiàn)代回應(yīng)》,載國(guó)家發(fā)展和改革委員會(huì)網(wǎng)站,https://www.ndrc.gov.cn/xxgk/jd/jd/202212/t20221219_1343666.html.】
三、以數(shù)據(jù)流通促進(jìn)人工智能產(chǎn)業(yè)發(fā)展
(一)司法實(shí)踐有關(guān)企業(yè)數(shù)據(jù)權(quán)益糾紛規(guī)則的分析與借鑒
“數(shù)據(jù)二十條”的“三權(quán)分置”產(chǎn)權(quán)結(jié)構(gòu)設(shè)計(jì)屬于我國(guó)數(shù)據(jù)基礎(chǔ)制度的重大理論創(chuàng)新。然而,數(shù)據(jù)資源持有權(quán)、數(shù)據(jù)加工使用權(quán)和數(shù)據(jù)產(chǎn)品經(jīng)營(yíng)權(quán)各自的客體內(nèi)容和權(quán)利邊界,仍需審慎研究。特別是不同數(shù)據(jù)主體權(quán)利的排他性邊界劃定,仍存在較大的理論難度。對(duì)此,可以通過分析有關(guān)企業(yè)數(shù)據(jù)權(quán)益糾紛的司法實(shí)踐借鑒相關(guān)規(guī)則。
在司法實(shí)踐裁判規(guī)則中,對(duì)非公開的數(shù)據(jù)集合或企業(yè)合法收集并深度加工形成的數(shù)據(jù)產(chǎn)品予以保護(hù)已基本達(dá)成共識(shí),理論分歧僅限于適用《反不正當(dāng)競(jìng)爭(zhēng)法》的商業(yè)秘密條款還是“互聯(lián)網(wǎng)專條”或者第2條基本原則條款進(jìn)行保護(hù)的具體法律適用問題。在“三權(quán)分置”結(jié)構(gòu)中,數(shù)據(jù)加工使用權(quán)、數(shù)據(jù)產(chǎn)品經(jīng)營(yíng)權(quán)已經(jīng)具備了較為清晰的權(quán)利內(nèi)容和排他性邊界。具體而言,對(duì)于數(shù)據(jù)加工使用權(quán),由于其客體數(shù)據(jù)本身是可分享的,只要具有各自的價(jià)值基礎(chǔ),不同的使用者即可在相同或相似數(shù)據(jù)上形成各自獨(dú)立使用的數(shù)據(jù)權(quán)利?!靖吒黄剑骸墩摂?shù)據(jù)持有者權(quán)——構(gòu)建數(shù)據(jù)流通利用秩序的新范式》,載《中外法學(xué)》2023年第2期。】
較多的司法糾紛集中在公開狀態(tài)下,數(shù)據(jù)持有者從數(shù)據(jù)來源主體處依法收集后,按照產(chǎn)品邏輯簡(jiǎn)單聚合或初步加工的企業(yè)數(shù)據(jù)集合的保護(hù)或者排他性邊界問題。對(duì)于此類數(shù)據(jù)而言,企業(yè)的收集、存儲(chǔ)、展示、運(yùn)營(yíng)等行為都需付出相應(yīng)的成本和勞動(dòng),也實(shí)現(xiàn)了數(shù)據(jù)資源價(jià)值的部分提升與轉(zhuǎn)化。但其由于加工程度較低,甚至只是根據(jù)產(chǎn)品運(yùn)營(yíng)目的將海量原始數(shù)據(jù)予以聚合,并不足以使企業(yè)獲得對(duì)該等數(shù)據(jù)的絕對(duì)排他控制性權(quán)益,否則可能侵害數(shù)據(jù)來源者的合法數(shù)據(jù)權(quán)益。加之其公開狀態(tài)之下,還承載了數(shù)據(jù)流通利用的公共利益。三者利益沖突時(shí),如何妥善地權(quán)衡,這是數(shù)據(jù)產(chǎn)權(quán)制度構(gòu)建的核心難點(diǎn)之一,具體表現(xiàn)為數(shù)據(jù)資源持有權(quán)的權(quán)利邊界設(shè)定。
對(duì)此,部分司法案例進(jìn)行了有益探索,強(qiáng)調(diào)了“三重授權(quán)”【北京知產(chǎn)法院(2016)京73民終588號(hào)民事判決提到:在Open API開發(fā)合作模式中,第三方通過Open APl獲取用戶信息時(shí)應(yīng)堅(jiān)持“用戶授權(quán)”+“平臺(tái)授權(quán)”+“用戶授權(quán)”的三重授權(quán)原則?!吭瓌t適用的局限性,防止對(duì)數(shù)據(jù)持有企業(yè)利益的保護(hù)異化為對(duì)數(shù)據(jù)要素流通的不當(dāng)阻礙。如認(rèn)為“如果數(shù)據(jù)是經(jīng)過用戶同意通過平臺(tái)公開的,第三方可以不必遵守該原則直接爬取和使用平臺(tái)內(nèi)的公開個(gè)人數(shù)據(jù)內(nèi)容。對(duì)于公開數(shù)據(jù)的流動(dòng)一般不涉及‘三重授權(quán)’原則的適用”【北京互聯(lián)網(wǎng)法院課題組:《數(shù)據(jù)權(quán)益知識(shí)產(chǎn)權(quán)司法保護(hù)的體系協(xié)調(diào)與規(guī)則創(chuàng)新》,載《法律適用》2024年第4期。】。比如,強(qiáng)調(diào)平臺(tái)經(jīng)營(yíng)者應(yīng)當(dāng)在一定程度上容忍他人合法收集或利用其平臺(tái)中已公開的數(shù)據(jù)。【北京市海淀區(qū)人民法院(2017)京0108民初24512號(hào)民事判決書?!繉?duì)于原始數(shù)據(jù),平臺(tái)作為數(shù)據(jù)控制主體只能依其與用戶的約定享有有限使用權(quán),單一用戶數(shù)據(jù)權(quán)益的歸屬并非“誰控制,誰享有”,使用他人控制的用戶數(shù)據(jù)只要不違反“合法、正當(dāng)、必要、不過度、征得用戶同意”的原則,一般不應(yīng)被認(rèn)定為侵權(quán)行為?!菊憬『贾菔兄屑?jí)人民法院(2020)浙01民終5889號(hào)民事判決書。】企業(yè)對(duì)涉案整體數(shù)據(jù)集合享有競(jìng)爭(zhēng)性權(quán)益,與用戶基于原始信息主張相關(guān)權(quán)利互不沖突、并行不悖?!菊憬「呒?jí)人民法院(2023)浙民終1113號(hào)民事判決書。】
這些司法實(shí)踐與“數(shù)據(jù)二十條”強(qiáng)調(diào)“數(shù)據(jù)來源者獲取和復(fù)制由其促成產(chǎn)生數(shù)據(jù)的權(quán)益”的內(nèi)在邏輯是一致的,其背后的法律邏輯也不言自明。參與主體在數(shù)據(jù)價(jià)值衍化過程中的投入不同,權(quán)益分配比重及排他性程度亦應(yīng)有所差別。對(duì)于數(shù)據(jù)資源而言,收集和聚合的企業(yè)主體付出的勞動(dòng)和數(shù)據(jù)產(chǎn)生的價(jià)值增益尚不足以使其獲得與數(shù)據(jù)產(chǎn)品同等的排他控制力,更無法對(duì)抗數(shù)據(jù)來源主體合法獲取、復(fù)制、轉(zhuǎn)移的權(quán)利。否則,不僅與數(shù)據(jù)價(jià)值生成的分配邏輯和比例不相符,數(shù)據(jù)來源者對(duì)該等數(shù)據(jù)形成所作的貢獻(xiàn)和權(quán)益無法得到充分尊重,還會(huì)使先占數(shù)據(jù)資源的企業(yè)憑借數(shù)據(jù)控制的優(yōu)勢(shì)地位設(shè)置數(shù)據(jù)獲取障礙,阻礙數(shù)據(jù)合理傳播和要素價(jià)值的充分發(fā)揮。當(dāng)然,數(shù)據(jù)來源者的數(shù)據(jù)權(quán)益也并非凌駕于其他數(shù)據(jù)主體的權(quán)益之上,實(shí)踐中仍應(yīng)注意妥善平衡。比較法視野下,《歐盟數(shù)據(jù)法案》設(shè)定的用戶數(shù)據(jù)訪問及使用權(quán)也有“相關(guān)”“適當(dāng)”“技術(shù)可行”等前提條件,并且對(duì)權(quán)利行使進(jìn)行了限制,要求用戶不得將請(qǐng)求獲得的數(shù)據(jù)用于開發(fā)與數(shù)據(jù)來源產(chǎn)品競(jìng)爭(zhēng)的產(chǎn)品。
綜上,盡管目前受限于數(shù)據(jù)產(chǎn)權(quán)相關(guān)法律法規(guī)供給不足,司法實(shí)踐圍繞數(shù)據(jù)權(quán)益糾紛均采取行為規(guī)制模式,即將企業(yè)數(shù)據(jù)權(quán)益的分配問題置于反不正當(dāng)競(jìng)爭(zhēng)法下公共利益、經(jīng)營(yíng)者利益與消費(fèi)者利益的“三元疊加”利益格局之中進(jìn)行衡量。這與賦權(quán)模式下數(shù)據(jù)產(chǎn)權(quán)的構(gòu)建思路殊途同歸。故有學(xué)者認(rèn)為,關(guān)于數(shù)據(jù)糾紛的司法裁判已經(jīng)接近于為企業(yè)合法形成的數(shù)據(jù)確立一種新的排他性財(cái)產(chǎn)權(quán),只是沒有在名義上予以明確而已?!君埿l(wèi)球:《再論企業(yè)數(shù)據(jù)保護(hù)的財(cái)產(chǎn)權(quán)化路徑》,載《東方法學(xué)》2018年第3期?!啃枰獜?qiáng)調(diào)的是,無論是行為規(guī)制模式還是賦權(quán)模式,均考慮數(shù)據(jù)的非排他、非競(jìng)爭(zhēng)特性,以及數(shù)據(jù)的公共屬性和在先權(quán)利,對(duì)數(shù)據(jù)產(chǎn)權(quán)所具有的支配性、排他性進(jìn)行一定限制,特別是在數(shù)據(jù)權(quán)利的具體權(quán)能構(gòu)建方面,相較財(cái)產(chǎn)權(quán)而言進(jìn)行適度限縮?!竞紊铑#骸稊?shù)據(jù)流通利用 | 數(shù)據(jù)產(chǎn)權(quán)研究綜述》,載清華大學(xué)智能法治研究院微信公眾號(hào)2022年8月31日,https://mp.weixin.qq.com/s/ZNscyid0CEGU_piF4bFdag,2024年8月20日訪問。】以上兩種規(guī)制模式并無優(yōu)劣之分,更重要的是探索出符合當(dāng)前經(jīng)濟(jì)、社會(huì)發(fā)展階段與特征的治理模式。
(二)數(shù)據(jù)流通助力人工智能產(chǎn)業(yè)發(fā)展的思考與建議
有鑒于此,應(yīng)始終堅(jiān)持以數(shù)據(jù)要素的高效流通利用為目標(biāo),并根據(jù)司法實(shí)踐總結(jié)的規(guī)則適配數(shù)據(jù)要素的特性對(duì)企業(yè)數(shù)據(jù)產(chǎn)權(quán)的權(quán)項(xiàng)內(nèi)容、控制范圍、權(quán)利有效期、權(quán)利限制等進(jìn)行審慎設(shè)置與平衡,在保護(hù)數(shù)據(jù)相關(guān)權(quán)利人合法權(quán)益的同時(shí)防止權(quán)利藩籬可能產(chǎn)生的阻礙數(shù)據(jù)流通后果。特別應(yīng)聚焦探討如何在促進(jìn)數(shù)據(jù)利用和保護(hù)公共利益之間找到平衡點(diǎn),確保數(shù)據(jù)資源的有效分配和利用,同時(shí)防止市場(chǎng)力量濫用和數(shù)據(jù)壟斷現(xiàn)象的出現(xiàn)。具體而言,在企業(yè)數(shù)據(jù)賦權(quán)的實(shí)踐中,必須審慎考量企業(yè)追求數(shù)據(jù)私利最大化的行為對(duì)數(shù)據(jù)流通及社會(huì)總體效益的潛在侵蝕效應(yīng)。與此同時(shí),需特別警惕數(shù)據(jù)權(quán)利泛化可能導(dǎo)致的新型市場(chǎng)壁壘的出現(xiàn),如數(shù)據(jù)企業(yè)在市場(chǎng)競(jìng)爭(zhēng)中利用其市場(chǎng)優(yōu)勢(shì)占據(jù)關(guān)鍵稀缺數(shù)據(jù)資源,并采取措施限制競(jìng)爭(zhēng)對(duì)手獲取相應(yīng)數(shù)據(jù)。高昂的數(shù)據(jù)收集成本將降低數(shù)據(jù)的可獲得性,從而限制大量的新進(jìn)入者和潛在的進(jìn)入者進(jìn)入數(shù)據(jù)市場(chǎng)。
在個(gè)人信息流通方面,雖然《個(gè)人信息保護(hù)法》規(guī)定了匿名化處理后的信息不是個(gè)人信息,但匿名化的判斷標(biāo)準(zhǔn)以及重新識(shí)別的風(fēng)險(xiǎn)始終是高懸在個(gè)人信息數(shù)據(jù)處理者頭上的“達(dá)摩克利斯之劍”。為了確定一個(gè)自然人是否可識(shí)別,應(yīng)考慮到控制者或他人為直接或間接識(shí)別該自然人而合理地可能使用的所有手段。進(jìn)行識(shí)別程序所需要的成本、識(shí)別身份的目的、技術(shù)的現(xiàn)狀及處理數(shù)據(jù)期間技術(shù)的發(fā)展都是應(yīng)考慮的因素。當(dāng)識(shí)別的可能性不存在或可被忽略時(shí),不應(yīng)理解為身份可識(shí)別的情況,而有關(guān)數(shù)據(jù)亦不屬于個(gè)人信息?!続RTICLE 29 DATA PROTECTION WORKING PARTY,《Opinion 4/2007 on the concept of personal data》,https://ec.europa.eu/justice/article-29/documentation/opinion-recommendation/files/2007/wp136_en.pdf,2024年8月20日訪問?!咳缬嘘P(guān)個(gè)人信息的相關(guān)司法解釋或國(guó)家標(biāo)準(zhǔn)可以將經(jīng)濟(jì)成本和技術(shù)可行等細(xì)化為匿名化的具體考量因素,則有望為企業(yè)匿名化處理個(gè)人信息數(shù)據(jù)提供評(píng)估方法和判斷標(biāo)準(zhǔn),實(shí)現(xiàn)個(gè)人信息保護(hù)和數(shù)據(jù)商業(yè)化利用流通的有效平衡。
在公共數(shù)據(jù)的開放共享方面,“數(shù)據(jù)二十條”提出對(duì)公共數(shù)據(jù)加強(qiáng)匯聚共享和開放開發(fā),推進(jìn)互聯(lián)互通,打破“數(shù)據(jù)孤島”,并區(qū)分了“有條件無償使用”和“有條件有償使用”兩種路徑。然而,目前公共數(shù)據(jù)還存在數(shù)據(jù)質(zhì)量不高、數(shù)據(jù)更新不及時(shí)、監(jiān)督約束機(jī)制弱、開放評(píng)價(jià)不到位等問題,難以滿足數(shù)字經(jīng)濟(jì),特別是人工智能產(chǎn)業(yè)發(fā)展的現(xiàn)實(shí)需求。美國(guó)在聯(lián)邦層面設(shè)立了統(tǒng)一開放平臺(tái)(data.gov),規(guī)范數(shù)據(jù)的標(biāo)準(zhǔn)和格式,整體數(shù)據(jù)開放的體量大、種類多、更新頻率高,AI數(shù)據(jù)訓(xùn)練的可用性較強(qiáng)。從高質(zhì)量數(shù)據(jù)集建設(shè)的需求而言,期待我國(guó)能進(jìn)一步加大公共數(shù)據(jù)的開放力度和標(biāo)準(zhǔn)化形式,助力人工智能產(chǎn)業(yè)的高效發(fā)展。
四、結(jié)語
人工智能的發(fā)展和產(chǎn)業(yè)應(yīng)用,經(jīng)歷了從解決單一任務(wù)到生成通用大模型的發(fā)展歷程,其中關(guān)鍵即在于擴(kuò)展定律(Scaling Law)的成功驗(yàn)證,從GPT 1到GPT 3不斷嘗試,將參數(shù)規(guī)模提升100倍,訓(xùn)練數(shù)據(jù)量提升50倍,GPT 3.5(ChatGPT)出現(xiàn)了能力“涌現(xiàn)”?!景⒗镅芯吭海骸懂a(chǎn)業(yè)之聲 | 生成式AI在電商場(chǎng)景的應(yīng)用、前景與挑戰(zhàn)》,載阿里研究院微信公眾號(hào)2024年7月2日,https://mp.weixin.qq.com/s/piHq97-antGidwR--F-87g,2024年8月20日訪問?!坑写竽P酮?dú)角獸企業(yè)創(chuàng)始人對(duì)未來人工智能的發(fā)展給出了更為直接的判斷:“AI研究了七八十年,唯一有效的東西其實(shí)是scaling law,就是不斷放大數(shù)據(jù)、算力和算法這幾樣生產(chǎn)要素?!薄臼跋螅骸秾TL月之暗面楊植麟:lossless long context is everything》,載海外獨(dú)角獸微信公眾號(hào)2024年2月8日,https://mp.weixin.qq.com/s/UMY0qZsCGh87KnW4wjfvoA.2024年8月20日訪問。】
當(dāng)前高質(zhì)量中文數(shù)據(jù)集短缺作為制約人工智能,尤其是大模型發(fā)展的主要因素,亟待通過數(shù)據(jù)基礎(chǔ)制度的構(gòu)建促進(jìn)企業(yè)數(shù)據(jù)、個(gè)人數(shù)據(jù)、公共數(shù)據(jù)的流通,通過法律規(guī)則的更新供給來激活數(shù)據(jù)要素的價(jià)值。
國(guó)家數(shù)據(jù)局等17部門聯(lián)合印發(fā)的《“數(shù)據(jù)要素 ×” 三年行動(dòng)計(jì)劃(2024—2026年)》要求,“建設(shè)高質(zhì)量語料庫(kù)和基礎(chǔ)科學(xué)數(shù)據(jù)集,支持開展人工智能大模型開發(fā)和訓(xùn)練”,并特別在“提升數(shù)據(jù)供給水平”部分專門強(qiáng)調(diào),完善數(shù)據(jù)資源體系,打造高質(zhì)量人工智能大模型訓(xùn)練數(shù)據(jù)集,加大公共數(shù)據(jù)資源供給,引導(dǎo)企業(yè)開放數(shù)據(jù),加強(qiáng)供給激勵(lì),制定完善數(shù)據(jù)內(nèi)容采集、加工、流通、應(yīng)用等不同環(huán)節(jié)相關(guān)主體的權(quán)益保護(hù)規(guī)則,在保護(hù)個(gè)人隱私前提下促進(jìn)個(gè)人信息合理利用,進(jìn)一步為公共數(shù)據(jù)、企業(yè)數(shù)據(jù)、個(gè)人數(shù)據(jù)的保護(hù)和流通指明了方向。2023年12月,包括1億余條數(shù)據(jù)、500億個(gè)token、共計(jì)120G的首批中文基礎(chǔ)語料庫(kù)發(fā)布,但還遠(yuǎn)遠(yuǎn)不能滿足國(guó)內(nèi)大模型訓(xùn)練數(shù)據(jù)的要求。未來仍需進(jìn)一步通過數(shù)據(jù)產(chǎn)權(quán)規(guī)則激活數(shù)據(jù)要素價(jià)值,為人工智能產(chǎn)業(yè)發(fā)展增添動(dòng)力。
數(shù)據(jù)生產(chǎn)要素的特性、數(shù)據(jù)類型的復(fù)雜性和數(shù)據(jù)流通場(chǎng)景的多樣性,決定了數(shù)據(jù)產(chǎn)權(quán)規(guī)則構(gòu)建的理論和現(xiàn)實(shí)難度。盡管如此,仍可從廣闊的數(shù)據(jù)流通交易和司法實(shí)踐中歸納出共識(shí)的部分用以指導(dǎo)數(shù)據(jù)要素市場(chǎng)建設(shè)的具體規(guī)則,特別是在企業(yè)數(shù)據(jù)權(quán)益與數(shù)據(jù)來源者權(quán)益沖突的協(xié)調(diào)問題上,堅(jiān)持企業(yè)數(shù)據(jù)資源持有權(quán)有限排他性的立場(chǎng),保障數(shù)據(jù)來源者對(duì)數(shù)據(jù)的獲取、復(fù)制或可攜權(quán)。同時(shí),通過對(duì)個(gè)人信息匿名化標(biāo)準(zhǔn)和公共數(shù)據(jù)授權(quán)運(yùn)營(yíng)實(shí)踐的探索,進(jìn)一步促進(jìn)數(shù)據(jù)流通,助力人工智能產(chǎn)業(yè)發(fā)展。
Abstract:Data has become an important factor of production for the development of AI industry in the era of digital economy. Whether and how to construct the foundational system for data, including data property rights, has become an important issue. The concept and system of the “tripartite allocation” of data property rights proposed in China’s “Twenty Data Measures” is a major theoretical innovation, however, it needs to solve such issues as how to accurately define the content and boundary of each of the “three rights”. Relevant judicial practices can provide effective references and have formed some consensus on these issues.
Currently, the shortage of high-quality Chinese datasets is the major factor restricting the development of AI, and it is urgent to activate the value of data element by providing and updating legal rules. In the future, we should aim for the efficient circulation and utilization of data element to establish and carefully balance the content, boundary, valid period, and the limitations of data property rights in accordance with the rules summarized in judicial practice as well as the characteristics of data element, so that the effective distribution and utilization of data resources can be realized. In addition, we should continue exploring the anonymization standard of personal information and public data authorization to facilitate data circulation and boost the development of AI industry.
[責(zé)任編輯 邢峻彬]