国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

機(jī)器利用數(shù)據(jù)行為構(gòu)成著作權(quán)合理使用的經(jīng)濟(jì)分析

2024-06-12 12:04
知識產(chǎn)權(quán) 2024年3期
關(guān)鍵詞:著作權(quán)人許可數(shù)據(jù)挖掘

劉 禹

內(nèi)容提要:未經(jīng)權(quán)利人許可的數(shù)據(jù)挖掘或機(jī)器學(xué)習(xí)行為可能侵犯著作權(quán)人的多項權(quán)能。盡管目前市面上存在一些互聯(lián)網(wǎng)平臺與數(shù)據(jù)庫,可供數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者一站式批量獲取作品,但若不免除數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者事先尋求許可的法律義務(wù),則他們?nèi)詴笥诟甙旱慕灰壮杀荆瑹o法有效獲取所需數(shù)據(jù),這制約數(shù)字創(chuàng)新產(chǎn)品的開發(fā)。允許數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者免費使用作品數(shù)據(jù),可能實質(zhì)損害著作權(quán)人的部分市場利益,但由此開發(fā)的數(shù)字創(chuàng)新產(chǎn)品可以為權(quán)利人帶來其他市場收益,且社會自我調(diào)節(jié)機(jī)制能夠消化很多市場損害,因此,顛覆性改進(jìn)現(xiàn)有技術(shù)的數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)行為宜被認(rèn)定為合理使用。不宜通過法定許可或“選擇退出”合理使用機(jī)制來規(guī)制數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)行為。

一、引 言

當(dāng)今數(shù)字經(jīng)濟(jì)時代,紙張、膠片、光盤等有形載體上的作品與錄音錄像制品①本文關(guān)于作品合理使用問題的研究,同樣適用于錄音錄像制品。為簡潔表述,文中以“作品”概括性地指代二者。越來越多地被轉(zhuǎn)化為電子版,呈現(xiàn)在互聯(lián)網(wǎng)上。作品的數(shù)字化能使互聯(lián)網(wǎng)用戶更為便捷地欣賞這些智力成果。不過,這一數(shù)字化浪潮更深層的動因是數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者需要將這些數(shù)字副本作為數(shù)據(jù)使用,大規(guī)模地進(jìn)行讀取索引、整理分類、識別提取、試錯學(xué)習(xí)等自動化處理,以便獲得有用信息或優(yōu)化計算機(jī)程序。除了通過掃描等方式制作作品的數(shù)字副本并加以利用外,數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者還會收集、復(fù)制人們在上網(wǎng)過程中無意或有意生成的作品用作數(shù)據(jù)。一張微博配圖,一段抖音視頻,一條美食評論,都不僅因為給公眾帶來審美享受而具有價值,還因可作為計算機(jī)自動化處理的原材料而具有價值。

規(guī)?;貙⒆髌纷鳛閿?shù)據(jù)使用,能為使用者帶來很多收益,著作權(quán)人自然希望從中分一杯羹。權(quán)利人與使用者之間的利益交鋒,最初發(fā)生在文本與數(shù)據(jù)挖掘(text and data mining)技術(shù)嶄露頭角的時期,直到今天仍未決勝負(fù)。文本與數(shù)據(jù)挖掘的典型例子是谷歌數(shù)字圖書館這樣的搜索引擎。谷歌大量掃描整本的紙質(zhì)版圖書并編制索引,使數(shù)字圖書館用戶輸入關(guān)鍵詞后可獲得書中包含該關(guān)鍵詞的簡短片段。2015年,美國聯(lián)邦第二巡回上訴法院認(rèn)定谷歌復(fù)制圖書與通過信息網(wǎng)絡(luò)向公眾傳播作品片段的行為構(gòu)成合理使用,未經(jīng)許可的免費使用行為不侵犯著作權(quán)。②See Authors Guild v. Google, Inc., 804 F.3d 202 (2d Cir.2015).不過,在面對TVEyes創(chuàng)建的電視新聞搜索引擎時,該法院卻得出了完全相反的結(jié)論,認(rèn)定TVEyes復(fù)制海量電視新聞后為搜索關(guān)鍵詞的用戶提供剪輯片段的行為侵犯了新聞著作權(quán)人的權(quán)利。③See Fox News Network, LLC v.TVEyes, Inc., 883 F.3d 169 (2d Cir.2018).英國、德國、法國、歐盟等在著作權(quán)法框架下增設(shè)了數(shù)據(jù)挖掘合理使用條款,但或者適用范圍僅限于非營利性科研機(jī)構(gòu),④See Copyright, Designs and Patents Act 1988, Section 29A.Act on Copyright and Related Rights (Urheberrechtsgesetz-UrhG),Section 60d.Law No.2016-1231 of 7 October 2016, for a Digital Republic, Article 38.或者規(guī)定著作權(quán)人能以機(jī)器人協(xié)議(Robots.txt)等極為便捷的方式“選擇退出”合理使用機(jī)制,⑤Directive (EU) 2019/790 of the European Parliament and of the Council, Article 3 & 4.遠(yuǎn)不能有效緩解權(quán)利人與使用者之間的矛盾。如今,隨著機(jī)器學(xué)習(xí)技術(shù)取得突破性進(jìn)展,著作權(quán)人與使用者之間的較量可謂一波未平,一波又起。利用作品訓(xùn)練能執(zhí)行自動駕駛、醫(yī)療診斷或手術(shù)等復(fù)雜任務(wù)的人工智能,是否構(gòu)成合理使用呢?如果訓(xùn)練的是能執(zhí)行吟詩作畫、自動編程等任務(wù),輸出物與訓(xùn)練數(shù)據(jù)在同一市場上競爭的生成式人工智能,答案會不一樣嗎?

前幾年,在我國人工智能產(chǎn)業(yè)開始起步的背景下,國內(nèi)已有一些文章主張在修訂《著作權(quán)法實施條例》時,明確利用作品訓(xùn)練人工智能的行為構(gòu)成合理使用,豁免機(jī)器學(xué)習(xí)者的侵權(quán)責(zé)任。⑥參見張金平:《人工智能作品合理使用困境及其解決》,載《環(huán)球法律評論》2019年第3期,第120-132頁;萬勇:《人工智能時代著作權(quán)法合理使用制度的困境與出路》,載《社會科學(xué)輯刊》2021年第5期,第93-102頁;林秀芹:《人工智能時代著作權(quán)合理使用制度的重塑》,載《法學(xué)研究》2021年第6期,第170-185頁。不過,這些文章仍存在一定問題。首先,這些文章僅將數(shù)據(jù)挖掘作為機(jī)器學(xué)習(xí)過程的一個步驟,忽略了很多數(shù)據(jù)挖掘行為與訓(xùn)練人工智能毫無關(guān)聯(lián),但相關(guān)數(shù)據(jù)挖掘者在利用作品時與機(jī)器學(xué)習(xí)者面臨同種合法性困境的事實。法條新增專門的例外情形時,完全可以一并解決這兩類主體的困境。前文提到的數(shù)字圖書館、新聞搜索工具,商家提取、分析電商平臺上消費者的評價內(nèi)容以提升品牌競爭力,以及經(jīng)濟(jì)分析師挖掘大量財經(jīng)新聞來預(yù)測股市發(fā)展趨勢等,都是與訓(xùn)練人工智能無關(guān)的數(shù)據(jù)挖掘的例子。我國近期也不乏利用作品進(jìn)行文本與數(shù)據(jù)挖掘是否侵犯著作權(quán)的爭議。⑦參見西安佳韻社數(shù)字娛樂發(fā)行股份有限公司與上海簫明企業(yè)發(fā)展有限公司侵害作品信息網(wǎng)絡(luò)傳播權(quán)糾紛案,北京市高級人民法院民事判決書(2022)京民再62號。其次,在現(xiàn)實中存在一些付費或免費的數(shù)據(jù)庫、互聯(lián)網(wǎng)平臺的情況下,這些文章沒有充分論證將作品作為數(shù)據(jù)使用的許可市場(以下簡稱作品數(shù)據(jù)許可市場)為何仍會處于失靈狀態(tài),以至于需要以合理使用豁免使用者的行為。這也是為何有反對意見認(rèn)為我國立法者應(yīng)先對產(chǎn)業(yè)實際進(jìn)行調(diào)研,再決定是否在法律中新增針對數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)行為的合理使用情形。⑧參見謝琳副教授題為“文本和數(shù)據(jù)挖掘的市場失靈與著作權(quán)例外”的會議發(fā)言紀(jì)要,載微信公眾號“中國政法大學(xué)民商經(jīng)濟(jì)法學(xué)院”2021年12月15日,https://mp.weixin.qq.com/s/IwimtxzsAzYQ-bI1mbkyxg.最后,這些文章對著作權(quán)人能否以及如何排除數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)合理使用條款適用于自己的作品這一實踐中棘手的具體問題,并未給出答案。

近年來,ChatGPT、Stable Diffusion等生成式人工智能開始推廣應(yīng)用。生成式人工智能可以輸出內(nèi)容表達(dá),與作為訓(xùn)練數(shù)據(jù)的作品在作品欣賞市場上展開競爭。有鑒于此,有學(xué)者建議,區(qū)別對待生成式人工智能與其他數(shù)據(jù)挖掘及機(jī)器學(xué)習(xí)項目,要求生成式人工智能的開發(fā)者向集體管理組織繳費來補(bǔ)償訓(xùn)練數(shù)據(jù)的著作權(quán)人。⑨參見林秀芹:《人工智能利用作品的版權(quán)保護(hù)須重塑平衡》,載《中國新聞出版廣電報》2023年11月30日,第A6版。還有學(xué)者在此基礎(chǔ)上,進(jìn)一步區(qū)分訓(xùn)練數(shù)據(jù)來自海量著作權(quán)人的生成式人工智能與訓(xùn)練數(shù)據(jù)來自一位著作權(quán)人的生成式人工智能。對于前者,該學(xué)者認(rèn)為開發(fā)者利用作品的行為構(gòu)成合理使用,但允許著作權(quán)人“選擇退出”,哪怕會妨礙實現(xiàn)降低交易成本的初衷;對于后者,該學(xué)者認(rèn)為開發(fā)者利用作品的行為不應(yīng)適用合理使用豁免侵權(quán)。⑩參見李安:《機(jī)器學(xué)習(xí)的版權(quán)規(guī)則:歷史啟示與當(dāng)代方案》,載《環(huán)球法律評論》2023年第6期,第97-112頁。本文認(rèn)為,以上觀點有待商榷。首先,其未考慮以下關(guān)鍵問題:生成式人工智能取代社會上大部分創(chuàng)作者和制作者,是否是新一輪產(chǎn)業(yè)革命下社會生產(chǎn)效率大幅提升的必然代價?少部分創(chuàng)意杰出的創(chuàng)作者、制作者是否得益于生成式人工智能的發(fā)展?被機(jī)器取代的創(chuàng)作者、制作者能否走向新崗位?其次,如果要求訓(xùn)練數(shù)據(jù)來自海量著作權(quán)人的生成式人工智能的開發(fā)者付費使用作品,那么集體管理組織的運行成本會不會很高?有權(quán)機(jī)關(guān)確定及定期調(diào)整法定許可費率會不會很復(fù)雜?在技術(shù)不斷發(fā)展、產(chǎn)品生產(chǎn)成本和價格接連下降的情況下,數(shù)年不變的法定許可費會不會不當(dāng)損害機(jī)器學(xué)習(xí)者投資開發(fā)生成式人工智能的激勵?

顯然,決策者在決定著作權(quán)人應(yīng)否控制將作品用作數(shù)據(jù)的行為時,需要全面比較產(chǎn)權(quán)保護(hù)的效益與成本,才能作出正確的選擇。本文第二部分探討未經(jīng)許可數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)作品會侵犯哪些著作權(quán)能。第三部分分析在何種條件下宜通過合理使用機(jī)制排除權(quán)利人對數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者的數(shù)據(jù)利用行為的控制,指出為實現(xiàn)數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)的技術(shù)功能而商業(yè)性地使用作品是顛覆性改進(jìn)的使用,即使實質(zhì)損害著作權(quán)人市場利益,也可能構(gòu)成合理使用。第四部分揭示作品數(shù)據(jù)許可市場處于交易成本高昂的失靈狀態(tài),需要引入合理使用機(jī)制。第五部分分析數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者合理使用作品對權(quán)利人市場利益的影響,認(rèn)為一些數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)項目雖實質(zhì)損害著作權(quán)人在作品欣賞市場上的利益,但同時對之有積極影響,尤其針對生成式人工智能,其帶來的多重挑戰(zhàn)能被社會自我調(diào)節(jié)。第六部分解釋為何不宜引入法定許可,不宜允許著作權(quán)人通過機(jī)器人協(xié)議、反爬蟲措施與網(wǎng)頁公告“選擇退出”合理使用機(jī)制,以及為何要尊重著作權(quán)人采取的有效接觸控制措施。由此,為我國決策者設(shè)計數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)合理使用條款提供參考。

二、機(jī)器利用數(shù)據(jù)可能侵犯的著作權(quán)權(quán)能

在我國著作權(quán)法的視域下,未經(jīng)許可數(shù)據(jù)挖掘或機(jī)器學(xué)習(xí)作品的行為,可能侵犯權(quán)利人的復(fù)制權(quán)、改編權(quán)和信息網(wǎng)絡(luò)傳播權(quán)。具體而言,首先,數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)活動往往需要制作并在服務(wù)器上存儲作品的副本,以便計算機(jī)程序反復(fù)讀取其中的有用信息。其次,為提高計算機(jī)程序提取有用信息的效率,數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者還經(jīng)常需要對復(fù)制件進(jìn)行改編,如對新聞內(nèi)容、微博言論等進(jìn)行改寫,標(biāo)注是否為暴力、仇恨等帶有攻擊性的言論并加以解釋。最后,出于驗證挖掘與學(xué)習(xí)結(jié)果、開展關(guān)聯(lián)合作研究以及幫助開展非相關(guān)研究等目的,數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者還可能通過信息網(wǎng)絡(luò)向不特定的多數(shù)人傳播作品復(fù)制件。

有觀點主張,在挖掘文本獲取有用信息以及訓(xùn)練自動駕駛等非生成式人工智能的情況下,計算機(jī)程序在復(fù)制件中提取的是事實、思想、數(shù)據(jù)等非表達(dá)性元素,此時相關(guān)復(fù)制行為不侵犯著作權(quán)。理由在于,法律允許創(chuàng)作者、制作者對內(nèi)容表達(dá)加以排他控制,正當(dāng)性基礎(chǔ)是產(chǎn)權(quán)保護(hù)能促進(jìn)創(chuàng)作者、制作者通過具有表現(xiàn)力和價值的言論與社會公眾交流觀點、思想、情感,而為文本挖掘與訓(xùn)練非生成式人工智能目的制作的電子版復(fù)制件并沒有被公眾欣賞,只是被計算機(jī)程序用作自動化處理的數(shù)據(jù),那么讓創(chuàng)作者、制作者控制相關(guān)數(shù)字化復(fù)制行為便不能起到促進(jìn)其與社會公眾對話交流的作用。?See Alain Strowel, Reconstructing the Reproduction and the Communication to the Public Rights: How to Align Copyright with Its Fundamentals, in P.Bernt Hugenholtz ed., Copyright Reconstructed: Rethinking Copyright's Economic Rights in a Time of Highly Dynamic Technological and Economic Change, Kluwer Law International, 2018, p.203; 注釋⑩,第107頁。持有這種觀點的部分學(xué)者還認(rèn)為,作品復(fù)制件被社會公眾欣賞時具有獨立的經(jīng)濟(jì)利用價值,但被計算機(jī)程序用于自動化處理時沒有這種價值,因此權(quán)利人不應(yīng)對后者尋求經(jīng)濟(jì)回報。?Ibid., Alain Strowel, p.206.我國有學(xué)者據(jù)此建議,《著作權(quán)法》再次修訂時,宜明確規(guī)定復(fù)制權(quán)只控制出于欣賞作品的目的而進(jìn)行的復(fù)制行為,即“作品性使用”。?同注釋⑩,第112頁。

本文認(rèn)為,上述說理難以成立。首先,作品復(fù)制件用作數(shù)據(jù)時不能促進(jìn)創(chuàng)作者、制作者與社會公眾交流對話這一論點,可以很容易地被反駁。以谷歌數(shù)字圖書館為例,谷歌采取技術(shù)手段使得輸入關(guān)鍵詞的用戶只能閱讀圖書數(shù)字化復(fù)制件的片段,谷歌服務(wù)器上存儲的整本圖書復(fù)制件沒有被用戶欣賞,但展示的片段已經(jīng)足以將圖書作者關(guān)于特定關(guān)鍵詞的觀點、思想、情感傳達(dá)給用戶,促進(jìn)作者與用戶之間的交流。甚至可以說,作者與用戶之間交流的效率還被大幅提高了,通過關(guān)鍵詞搜索,用戶分秒間就可以在一本厚厚的著作中定位到自己感興趣的部分。其次,數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者通過計算機(jī)程序提取電子版復(fù)制件中的事實、思想、數(shù)據(jù)能夠獲利,具有制作電子版復(fù)制件的市場需求與支付意愿。這一產(chǎn)業(yè)現(xiàn)實表明,作品電子版復(fù)制件盡管沒被社會公眾欣賞,也具有獨立的經(jīng)濟(jì)利用價值,創(chuàng)作者、制作者對這些復(fù)制件尋求經(jīng)濟(jì)回報并非無序擴(kuò)張利益。

其實,著作權(quán)保護(hù)的邏輯很簡單。從功利主義的視角看,法律賦予著作權(quán)人對其作品一定期限的排他權(quán),是為了幫助其獲取作品被使用后所產(chǎn)生的部分價值,以便收回投資。以產(chǎn)權(quán)保障投資回報能激勵社會上更多的人投身于創(chuàng)作活動,為社會提供更多作品,增進(jìn)社會福利。不過,幾乎不可能確定著作權(quán)人在作品被使用所產(chǎn)生的價值中獲取多大份額才能實現(xiàn)“最優(yōu)水平”的激勵,即恰好足夠使其有動力投入創(chuàng)造、開發(fā)、傳播作品所需的固定成本的金額。因此,如果科技發(fā)生重大進(jìn)步,新技術(shù)通過復(fù)制、傳輸作品能產(chǎn)生新的價值,那么法律通常就會保障著作權(quán)人能夠通過控制以新技術(shù)方式利用作品的行為來獲取一部分新產(chǎn)生的使用價值。?See Harold Demsetz, Toward a Theory of Property Rights II: The Competition between Private and Collective Ownership, 31 Journal of Legal Studies S653, S672 (2002).這不僅起到激勵供給的作用,還促使市場有效配置資源:運用新技術(shù)復(fù)制、傳輸作品的使用者在許可交易中的支付意愿,會向社會上潛在的創(chuàng)作者、制作者表明投資生產(chǎn)那些更適合被這種新技術(shù)利用的類型的作品是否有利可圖。在價格信號的指引下,創(chuàng)作者、制作者會將恰當(dāng)?shù)馁Y源分配到生產(chǎn)那些類型的作品上去,避免投資過度或投資不足。?See Harold Demsetz, The Private Production of Public Goods, 13 Journal of Law and Economics 293, 306 (1970).

如今,在運用數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)技術(shù)提取電子版復(fù)制件中的事實、思想等非表達(dá)性元素時,作品會產(chǎn)生新的使用價值。允許著作權(quán)人控制相關(guān)數(shù)字化復(fù)制行為,在這些價值中獲取一部分,能鼓勵權(quán)利人產(chǎn)出更多作品,更能引導(dǎo)社會上潛在的創(chuàng)作者、制作者投入恰當(dāng)?shù)馁Y源生產(chǎn)那些包含的思想、事實更多,提取起來更方便的作品(如拍攝面部特征高度清晰的人臉照片,用于訓(xùn)練人臉識別類人工智能)。初步看來,這樣的產(chǎn)權(quán)安排是有利于增進(jìn)社會福利的。聲稱著作權(quán)保護(hù)的目的是促進(jìn)表達(dá)者與受眾對話交流,或者通過給著作權(quán)建構(gòu)其他哲學(xué)層面的正當(dāng)性基礎(chǔ),來論證為了讓計算機(jī)程序提取作品中的非表達(dá)元素而進(jìn)行的復(fù)制行為不侵權(quán),不僅違背產(chǎn)權(quán)保護(hù)的基本邏輯,還會破壞復(fù)制概念在技術(shù)上的一致性,損害制度的確定性,得不償失。更合理的選擇應(yīng)是:法律先承認(rèn)著作權(quán)人有權(quán)控制相關(guān)復(fù)制行為,然后進(jìn)一步作成本收益分析,如果發(fā)現(xiàn)需要排除權(quán)利人對這種復(fù)制行為的控制,那么再通過合理使用、法定許可等制度限制權(quán)利行使。

三、合理使用豁免機(jī)器利用數(shù)據(jù)行為的分析步驟

為數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)目的復(fù)制、改編和通過信息網(wǎng)絡(luò)傳播作品的行為可能侵犯著作權(quán)。當(dāng)然,立法者也可能基于一些理由選擇限制權(quán)利,將這些行為視為合理使用。至于什么是足夠充分的限權(quán)理由,包括我國在內(nèi)的世界主要法域的著作權(quán)法并未給出答案。

以我國《著作權(quán)法》第24條為例,第1款借鑒了《與貿(mào)易有關(guān)的知識產(chǎn)權(quán)協(xié)定》第13條中的“三步檢測法”,從其表述中我們只能看出立法者認(rèn)為如果允許他人不經(jīng)許可免費以特定方式利用作品不會實質(zhì)性損害權(quán)利人的市場利益,則該特定利用行為可以構(gòu)成合理使用。又如,美國《版權(quán)法》第107條列出四項判斷合理使用行為的要素,第四項因素(對作品潛在市場價值的影響)自不待言,前三項因素實際上也只是從不同角度強(qiáng)調(diào)了合理使用以不使權(quán)利人遭受市場損失為前提。第一項要素規(guī)定,出于非營利目的的免費使用更可能是合理的,因為立法者知道此種使用即便形成了作品的復(fù)制件或演繹件,也不會上市流通從而與原作品形成競爭。第三項要素規(guī)定,免費使用整個作品中少量、非實質(zhì)性的部分更可能具有合理性,因為占比極小且不重要的部分很難對整個作品產(chǎn)生市場替代效果,使用者愿意為不重要的片段支付的許可費也會極為有限。第二項要素(作品的性質(zhì))倒是一個限權(quán)理由:相比于小說等文學(xué)藝術(shù)作品,當(dāng)免費使用的是時事新聞、史書、辭典等事實作品或程序代碼等功能性作品時,使用行為更可能被免責(zé),這是因為此類作品中作者貢獻(xiàn)的獨創(chuàng)性表達(dá)比例更小,復(fù)制其中的一些表達(dá)可能是充分傳遞事實思想所必需的。不過,實踐中產(chǎn)生法律爭議的大多是使用文學(xué)藝術(shù)作品的行為,因此這一限權(quán)理由適用頻率很低。

司法實踐表明,美國《版權(quán)法》列舉的四項要素對精確判斷合理使用行為的作用有限,有時一個使用行為同時違背了前三項要素,法院仍會認(rèn)定該行為合理,或?qū)Υ擞袕?qiáng)烈的傾向性。一個典型例子是戲仿。戲仿通常具有商業(yè)性目的,使用對象是文學(xué)藝術(shù)作品,批評諷刺原作時需要使用其實質(zhì)性部分,但美國聯(lián)邦最高法院仍強(qiáng)烈傾向于認(rèn)定戲仿是合理使用行為,?See Campbell v.Acuff-Rose Music, Inc., 114 S.Ct.1164 (1994).以下簡稱Cambell案。且屬于美國《版權(quán)法》第106條列舉的合理使用情形。又如,谷歌出于搭建數(shù)字圖書館的商業(yè)目的,制作了海量整本紙質(zhì)版文學(xué)藝術(shù)作品的電子版復(fù)制件,并公開傳播了作品片段。這些片段很多時候足以讓用戶了解作者有關(guān)特定關(guān)鍵詞的觀點、思想、情感,使用戶在瀏覽片段后無需再購買整部作品。盡管在“量”的層面看,作品片段的占比很小,但在“質(zhì)”的意義上,將其認(rèn)定為構(gòu)成作品實質(zhì)、核心的部分并無障礙。然而,美國聯(lián)邦第二巡回上訴法院仍認(rèn)定谷歌的復(fù)制與公開傳播行為構(gòu)成合理使用。?同注釋②??梢姡挥兄匦聦徱暫侠硎褂门袛嘁?guī)則,闡明一個作品使用行為基于何種理由而有必要被豁免侵權(quán),才能為合理使用的判斷提供穩(wěn)定可靠的指引。

Wendy Gordon教授曾提供了一套可操作性較強(qiáng)的合理使用測試方法:當(dāng)出現(xiàn)交易成本高昂導(dǎo)致的市場失靈時,有必要將相關(guān)作品利用行為視為合理使用。在其看來,當(dāng)市場上的作品使用者與權(quán)利人為談判或執(zhí)行許可所付出的交易成本顯著高于交易能為他們帶來的凈收益時,盡管這筆交易可以增進(jìn)社會福利,也不會被雙方簽約達(dá)成。這時,有益于社會的作品使用行為無法進(jìn)行,市場因高昂的交易成本而失靈。如果使用者免費使用作品并不會實質(zhì)性損害著作權(quán)人的市場利益,則可以考慮認(rèn)定相關(guān)的使用行為為合理使用,使增進(jìn)社會收益的作品利用行為不為交易成本所累。?See Wendy J.Gordon, Fair Use as Market Failure: A Structural and Economic Analysis of the Betamax Case and Its Predecessors, 82 Columbia Law Review 1600, 1601 (1982).

合理使用的市場失靈測試方法得到學(xué)界廣泛認(rèn)同。套用這一測試方法,能較好地解釋戲仿、谷歌數(shù)字圖書館等使用行為的合理性。戲仿會批評原作在內(nèi)容或藝術(shù)風(fēng)格等方面的缺陷,貶損原作在消費者心目中的形象,因此無論使用者出價多高,權(quán)利人往往都不會發(fā)放使用許可。這時,市場因原作者阻礙揭露作品缺陷的信息被傳播給公眾的強(qiáng)烈動機(jī)而失靈。與此同時,戲仿為消費者提供了對立性、批判性的新穎視角,使消費者對原作有了更全面的認(rèn)知,甚至引發(fā)啟迪民智的公共辯論,由此產(chǎn)生實質(zhì)性的社會價值。如果戲仿不會實質(zhì)性損害原作作者的市場利益,那么這種出于商業(yè)目的利用文學(xué)藝術(shù)作品實質(zhì)部分的行為就會因構(gòu)成合理使用而被豁免。類似的,谷歌建立數(shù)字圖書館文本挖掘項目需要利用海量作品,與大規(guī)模分散的著作權(quán)人逐一談判與執(zhí)行許可的交易成本極為高昂,導(dǎo)致市場失靈。與此同時,文本挖掘信息檢索技術(shù)大幅提升了用戶按需精準(zhǔn)獲取信息的能力與效率。如果谷歌復(fù)制整本圖書與公開傳播作品片段的行為不會對著作權(quán)人造成實質(zhì)損失,那么其有益社會的利用行為也應(yīng)該被豁免。

不過,與成文法法條一致,Gordon強(qiáng)調(diào)合理使用以不實質(zhì)損害著作權(quán)人市場利益為前提。但細(xì)心的讀者可能會發(fā)現(xiàn),戲仿與谷歌數(shù)字圖書館案的情形其實并不滿足這一條件。Campbell案判決的相關(guān)分析就體現(xiàn)了這點。美國聯(lián)邦最高法院承認(rèn),戲仿作品往往會與原作屬于不同的細(xì)分作品類型(如抒情歌曲與說唱歌曲?Campbell案就是原告歌曲抒情,被告戲仿歌曲為說唱。,電影與短視頻?例如,胡戈制作短視頻《一個饅頭引發(fā)的血案》諷刺陳凱歌的電影《無極》。),因此原作作者許可他人在戲仿作品所屬的那一細(xì)分領(lǐng)域進(jìn)行尋常的、不諷刺原作缺陷的演繹的市場利益可能會受到實質(zhì)損害。因此,法院只能將案件發(fā)回重審,要求下級法院審查是否有證據(jù)證明存在這一市場損害。[21]同注釋?,at 1178.在庭外和解中,戲仿者還是向原作作者支付了一筆演繹許可費。[22]See Acuff-Rose Settles Suit with Rap Group, The Commercial Appeal (Memphis), June 5, 1996, at A14.類似的,在谷歌數(shù)字圖書館案中,美國聯(lián)邦第二巡回上訴法院承認(rèn)數(shù)字圖書館很可能損害著作權(quán)人的市場利益,消費者閱讀作品片段了解所需的事實信息后可能就不會再購買整本圖書了。[23]同注釋②,at 224, 225.為了合理化谷歌的使用行為,法院不得不強(qiáng)行限縮解釋著作權(quán)人市場利益的范圍,稱著作權(quán)人的潛在市場“只限于消費者對被版權(quán)保護(hù)的表達(dá)形式的興趣”。[24]Ibid.但一些散落在判決中的論述語句表明,法院自己都在猶豫這種限縮是否合適。[25]同注釋②,at 220, 221, 225.

那么,若戲仿、數(shù)字圖書館等文本挖掘項目以及其他以各種新方式出于商業(yè)目的利用作品實質(zhì)部分的行為能增進(jìn)社會收益,且遭受高昂交易成本的市場失靈,此時究竟應(yīng)否因可能減損著作權(quán)人的市場收益而不被合理使用豁免侵權(quán)呢?本文認(rèn)為,從累積性創(chuàng)新的角度出發(fā)進(jìn)行分層思考,對這一問題的回答才能最大程度地平衡著作權(quán)人的創(chuàng)新激勵、使用者的行動自由與社會文化及科技進(jìn)步的公共利益,實現(xiàn)整體福利最大化的目標(biāo)。

具體而言,當(dāng)使用者的使用行為通過顛覆性改進(jìn)現(xiàn)有知識或技術(shù)顯著增進(jìn)了社會福利,且權(quán)利人的作品在使用者使用行為所產(chǎn)生的社會福利中貢獻(xiàn)占比很小時,這種出于商業(yè)目的的使用可能更適宜被豁免于侵權(quán),允許使用者免費開發(fā)利用作品,充分實現(xiàn)潛在的社會價值。避免出現(xiàn)“權(quán)利人的市場利益得以保全,但以剝奪社會收獲更明顯的價值為代價”的結(jié)果。相反,如果使用者只是單純復(fù)制或公開傳播作品的實質(zhì)部分,對現(xiàn)有知識或科技并無改進(jìn),或即便在作品上添加表達(dá)元素、含義與信息,產(chǎn)生了改進(jìn)現(xiàn)有知識的新作品,但改進(jìn)程度有限,且權(quán)利人的作品在使用行為所帶來的社會價值中貢獻(xiàn)占比很高,那么即便使用行為的社會收益大于權(quán)利人遭受的市場損失,即社會凈收益為正,使用行為也不宜被合理化。這樣的制度安排能最大程度地避免破壞潛在創(chuàng)作者、制作者的激勵預(yù)期與信心,保證作品供給充足。[26]Lemley教授也曾提出,現(xiàn)有的合理使用分析過分強(qiáng)調(diào)保護(hù)著作權(quán)人的市場利益。See Mark A.Lemley, The Economics of Improvement in Intellectual Property Law, 75 Texas Law Review 989, 1077-1083 (1997).戲仿行為利用原作、與原作互動才能形成的新思想見解,顛覆消費者對原作的既有認(rèn)知,谷歌數(shù)字圖書館形成了能大幅提升社會生產(chǎn)效率的信息挖掘技術(shù),二者都屬于顛覆性改進(jìn)的情形,因此認(rèn)定為合理使用可能更合適。事實上,Campbell案判決中引入的“轉(zhuǎn)換性使用”指標(biāo)很大程度上就是在做這種社會收益的評估。[27]被告的新歌曲對原作添加的批評性含義與信息 “產(chǎn)生社會收益”(provide social benefit),被告使用原作的行為具有轉(zhuǎn)換性價值,并且這種對原作本質(zhì)或風(fēng)格的批評性揭露比其他一般性的評論轉(zhuǎn)換性更強(qiáng),即產(chǎn)生的思想見解的社會價值更大,因此更應(yīng)該被認(rèn)定為合理使用。同注釋②, at 1171-1172.但遺憾的是,法院在該案戲仿行為揭露原作缺陷、顛覆消費者對原作認(rèn)知的情況下,還是沒有明確地排除權(quán)利人的排他控制。

在此基礎(chǔ)上,如果他人顛覆性改進(jìn)的使用行為對權(quán)利人作品的市場銷量或演繹許可收入同時具有消極和積極影響,[28]See Jeanne C.Fromer, Market Effects Bearing on Fair Use, 90 Washington Law Review 615, 649 (2015).或者社會能通過自我調(diào)節(jié)消化部分消極影響,那么使用行為被認(rèn)定為合理自然會更有說服力。當(dāng)然,可能會有讀者提出,何不采用法定許可,讓使用者向指定機(jī)構(gòu)支付法定數(shù)額的許可費,既免去交易成本困擾,又給著作權(quán)人一筆補(bǔ)償呢?或者可以允許著作權(quán)人“選擇退出”合理使用機(jī)制,在利用合理使用制度降低交易成本的同時,尊重個別著作權(quán)人在市場上獲利的意愿?對于前一問題,本文認(rèn)為,法定許可會產(chǎn)生一系列制度成本,甚至可能超過著作權(quán)保護(hù)的社會收益,因此往往不是劃算的選擇。對于后一問題,本文認(rèn)為,應(yīng)保證大部分著作權(quán)人仍會留在合理使用框架內(nèi),否則合理使用條款會變成一紙空文。

概言之,本文主張,在市場因高昂交易成本而失靈時,如果出于商業(yè)目的的作品使用行為顛覆性地改進(jìn)了現(xiàn)有的思想見解或技術(shù)功能,顯著增進(jìn)社會福利,并且著作權(quán)人的作品在這些社會福利中的貢獻(xiàn)占比很小,那么即使使用行為實質(zhì)損害權(quán)利人的市場利益,權(quán)利人的排他權(quán)也宜被限制。如果該使用行為能給著作權(quán)人帶來其他市場收益,或部分市場損害能被社會自我調(diào)節(jié),那么限制著作權(quán)會更加適當(dāng)。法定許可的制度成本大概率會很高昂,因此合理使用往往是首選。至于“選擇退出”合理使用的機(jī)制,需以大部分著作權(quán)人都會選擇留在合理使用框架內(nèi)為前提。運用本文搭建的合理使用分析框架,也能更精準(zhǔn)地判斷數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)之外的其他新興作品使用方式是否構(gòu)成合理使用,[29]例如,出于商業(yè)目的的同人作品創(chuàng)作,盡管有學(xué)者認(rèn)為是“非標(biāo)準(zhǔn)化”的,權(quán)利人很難預(yù)見自己作品的實質(zhì)部分會被他人如此利用,因此在合作剩余分配的過程中產(chǎn)生信息不完全問題,導(dǎo)致交易成本走高。但畢竟此時交易成本遠(yuǎn)未高到使市場失靈的程度。同時,同人創(chuàng)作往往利用的是極具影響力的現(xiàn)有作品,消費者之所以喜歡閱讀同人作品就是因為能時時聯(lián)想到原作,如果剔除原作的人物姓名、人物關(guān)系、部分背景特征和情節(jié)安排等,同人作品很可能無人問津,因此原作在同人作品社會價值中貢獻(xiàn)占比很高。并且同人作品也經(jīng)常并未比原作產(chǎn)生顯著增進(jìn)社會福利的思想見解,因此出于商業(yè)目的的同人作品創(chuàng)作一般還是應(yīng)該被認(rèn)為侵害了原作權(quán)利人的改編權(quán)。有關(guān)“非標(biāo)準(zhǔn)化”的解釋,參見蔣舸:《論著作權(quán)法的“寬進(jìn)寬出”結(jié)構(gòu)》,載《中外法學(xué)》2021年第2期,第333頁。該文引用的Merges與Nelson教授的文章,其落腳點也是社會價值。但這超出了本文的關(guān)注范圍。本文接下來將利用這一合理使用分析框架,詳細(xì)分析我國著作權(quán)法為何應(yīng)新增針對作品文本數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)行為的合理使用情形,以及如何具體設(shè)計這一法律條款。

如前所述,將作品用作數(shù)據(jù)來挖掘有用信息時,不斷發(fā)展的信息檢索技術(shù)大幅提升用戶按需精準(zhǔn)獲取信息的能力與效率,使用行為產(chǎn)生實質(zhì)性的社會價值。類似的,利用作品訓(xùn)練自動駕駛、醫(yī)療診斷、自然語言生成等人工智能算法時,發(fā)展的機(jī)械自動化技術(shù)大幅提升用戶的出行、辦公效率等,使用行為產(chǎn)生明顯的社會收益。如今,自動泊車、機(jī)器人輔助手術(shù)、自動創(chuàng)建演示文稿等都已是家常便飯。與此同時,這些社會收益明顯的新技術(shù)中,著作權(quán)人的貢獻(xiàn)占比很小。因此,為數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)而使用作品的行為是顛覆性改進(jìn)的使用這一點,應(yīng)該沒什么爭議。那么剩下的任務(wù)是依次考察以下方面:在目前市面上存在一些數(shù)據(jù)集合的情況下,作品數(shù)據(jù)許可市場是否處于失靈狀態(tài);數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者免費利用作品的行為對著作權(quán)人市場利益的影響;法定許可與“選擇退出”的替代機(jī)制為何不可行。

四、作品數(shù)據(jù)許可市場失靈

數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)經(jīng)常需要海量作品作為數(shù)據(jù)。數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者如分別與這些著作權(quán)人進(jìn)行交易,成本會極為高昂,其很可能因交易成本高于預(yù)期利潤而放棄發(fā)展新技術(shù)。不過,目前微博配圖、抖音視頻、美食評論等互聯(lián)網(wǎng)用戶發(fā)布的內(nèi)容都集中在互聯(lián)網(wǎng)平臺上,很多紙質(zhì)圖書、膠片電影等的數(shù)字化副本也會被為數(shù)不多的數(shù)據(jù)庫服務(wù)商收集起來,數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者可以通過與平臺、數(shù)據(jù)庫的服務(wù)商交易一站式獲取海量數(shù)據(jù)。如此看來,似乎作品數(shù)據(jù)許可市場可以有效運行,不存在系統(tǒng)性的交易成本高昂困難。

然而,仔細(xì)觀之,會發(fā)現(xiàn)事情并非這么簡單。首先,的確,一些互聯(lián)網(wǎng)平臺通過用戶服務(wù)協(xié)議從用戶處獲得了使用這些內(nèi)容的免費、非獨家、可分許可(sublicense)的權(quán)利。[30]例如,抖音《用戶服務(wù)協(xié)議》第10.3條規(guī)定了分許可權(quán)利,https://www.douyin.com/draft/douyin_agreement/douyin_agreement_user.html?id=6773906068725565448,2023年10月19日訪問。我國的新浪微博、微信,國外的Twitter、Meta、YouTube等的用戶服務(wù)協(xié)議也普遍采用這種格式條款。數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者直接與平臺談判授權(quán)并從平臺的應(yīng)用程序接口(API)批量下載數(shù)據(jù)后,如果有個別用戶主張侵權(quán),數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者似乎可以被免責(zé)。[31]例如,新浪微博向數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者提供一攬子許可中文學(xué)科類無監(jiān)督文本數(shù)據(jù)、場景描述圖像數(shù)據(jù)等。參見數(shù)據(jù)堂官網(wǎng),https://www.datatang.com/llm,2023年11月6日訪問。不過需要注意的是,用戶點擊平臺的服務(wù)格式協(xié)議,同意平臺免費使用和分許可自己發(fā)布的作品,是因為用戶的普遍預(yù)期是平臺無非會出于維持運營與提升服務(wù)質(zhì)量的目的而自行或許可第三方使用相關(guān)內(nèi)容,畢竟平臺的商業(yè)模式需要用戶發(fā)布的內(nèi)容被更多人轉(zhuǎn)發(fā)、評論。因此當(dāng)平臺超出上述目的使用與分許可用戶發(fā)布的內(nèi)容時,其行為盡管在字面上構(gòu)成合同內(nèi)容的一部分,卻很可能因為超出用戶的期待而被法院認(rèn)為與合同法、知識產(chǎn)權(quán)法、反壟斷法等法律上的強(qiáng)制規(guī)則沖突,不產(chǎn)生法律上的約束力。[32]See Mark A.Lemley, Intellectual Property and Shrinkwrap Licenses, 68 Southern California Law Review 1239, 1294 (1995).例如美國法院近年的判例就表明,如果平臺行使發(fā)放分許可的權(quán)利,授權(quán)第三方對用戶發(fā)布的作品進(jìn)行嵌入式鏈接(embedding),很可能須對用戶承擔(dān)幫助、引誘等間接侵權(quán)責(zé)任。[33]See Agence France Presse v.Morel, 934 F.Supp.2d 547 (S.D.N.Y.2013); McGucken v.Newsweek LLC, 464 F.Supp.3d 594(S.D.N.Y.2020); Hunley v.Instagram, LLC, No.21-CV-03778-CRB (N.D.Cal.Feb.1, 2022), aff'd, 73 F.4th 1060 (9th Cir.2023).當(dāng)然,最近國內(nèi)外互聯(lián)網(wǎng)社交平臺正紛紛更新服務(wù)格式條款,明確規(guī)定自己能免費使用用戶發(fā)布的內(nèi)容進(jìn)行數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí),[34]例如,Twitter 2023年8月更新了相關(guān)條款,See Alex Ivanovs, X/Twitter Has Updated Its Terms of Service to Let It Use Posts for AI Training, https://stackdiary.com/x-can-now-use-posts-for-ai-training-as-per-terms-of-service/, 2023年11月7日訪問。甚至對第三方數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者發(fā)放分許可,[35]例如,抖音2023年9月更新的《用戶服務(wù)協(xié)議》第10.3條明確,平臺能分許可第三方在“研究”中使用用戶發(fā)布的相關(guān)內(nèi)容。但此類修改正受到廣泛質(zhì)疑。[36]Stack Dirary, Mozilla等博客專門寫文章探討這些問題。See Ask Microsoft, Are You Using Our Personal Data to Train AI?,https://foundation.mozilla.org/en/campaigns/microsoft-ai/, 2023年11月6日訪問。

其次,存在一些公開網(wǎng)頁,如維基百科、Github等,上面的內(nèi)容是著作權(quán)人根據(jù)CC BYSA、GFDL、MIT、GPL、Apache等開源許可協(xié)議提供的,能遵守這些協(xié)議(通常包括須注明版權(quán)歸屬信息)的使用者可以免費使用這些內(nèi)容。[37]參見維基百科官方網(wǎng)站對他人免費使用內(nèi)容的條件的說明,https://en.wikipedia.org/wiki/Wikipedia:Copying_within_Wikipedia,2023年10月19日訪問。另見Github官網(wǎng),https://github.com/open-source, 2024年1月23日訪問。但客觀而言,數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者幾乎不可能在其產(chǎn)品的輸出物上附加動輒千百頁的版權(quán)歸屬信息。因此,數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者不經(jīng)與諸多權(quán)利人分別協(xié)商便利用作品的行為,會導(dǎo)致侵權(quán)。

最后,很多數(shù)據(jù)庫服務(wù)商是在未經(jīng)著作權(quán)人同意的情況下,收集大量作品并一攬子許可給數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者使用。因此,數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者即便向數(shù)據(jù)庫服務(wù)商支付了許可費,如不額外與海量的著作權(quán)人逐一談判許可,使用相關(guān)作品仍會導(dǎo)致侵權(quán)。例如,Getty Images公司宣稱自己有將圖庫內(nèi)攝影作品作為數(shù)據(jù)許可的業(yè)務(wù),[38]See Getty Images Statement, https://newsroom.gettyimages.com/en/getty-images/getty-images-statement, 2023年11月6日訪問。但該公司并未就此征詢過這些作品的作者同意。又如ChatGPT等自然語言生成模型會運用一個名為BookCorpus的免費開源數(shù)據(jù)集,其創(chuàng)始人聲稱集內(nèi)所有電子書都是“尚未發(fā)表的免費書籍”(free books written by [as] yet unpublished authors)。[39]See Yukun Zhu et.al., Aligning Books and Movies: Towards Story-like Visual Explanations by Waching Movies and Reading Books, p.3, https://arxiv.org/pdf/1506.06724v1.pdf, 2023年10月19日訪問。但實際上,該數(shù)據(jù)集囊括了很多已發(fā)表的書籍,且BookCorpus創(chuàng)始人收集這些書籍作為數(shù)據(jù)之前并未獲得相關(guān)作者授權(quán)。從一些書籍扉頁上的著作權(quán)聲明可以看出,相關(guān)作者并不愿意自己的作品基于個人欣賞之外的目的被免費使用,尤其是商業(yè)目的的使用。[40]See Jack Bandy & Nicholas Vincent, Addressing "Documentation Debt" in Machine Learning: A Retrospective Datasheet for BookCorpus, p.4-6, https://datasets-benchmarks-proceedings.neurips.cc/paper/2021/file/54229abfcfa5649e7003b83dd4755294-Paperround1.pdf, 2023年10月19日訪問。那么,未經(jīng)作者許可為挖掘?qū)W習(xí)目的使用這些書籍就可能侵權(quán)。其他免費開源數(shù)據(jù)集如Open Subtitles、the Enron Emails Dataset,[41]See Leo Gao et.al., The Pile: An 800GB Dataset of Diverse Text for Language Modeling, p.14, https://arxiv.org/abs/2101.00027,2023年10月19日訪問。以及Stable Diffusion類圖像生成模型依托訓(xùn)練的圖文配對數(shù)據(jù)集LAION-5B等,[42]參見LAION官網(wǎng)問題解答部分的介紹, https://laion.ai/faq/, 2023年10月19日訪問。也存在同樣的問題。

總而言之,數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者從互聯(lián)網(wǎng)平臺公開網(wǎng)頁與數(shù)據(jù)庫處獲得作品時,都可能需要額外與大規(guī)模、分散化的著作權(quán)人逐一談判許可,信息搜索、許可談判及合約執(zhí)行成本極為高昂。

當(dāng)然,有些付費數(shù)據(jù)庫是由諸多著作權(quán)人共同委托代理數(shù)據(jù)許可事宜的,數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者從此處獲取數(shù)據(jù)集合后無須向每個權(quán)利人分別尋求許可。但其仍可能經(jīng)常受到侵權(quán)之訴困擾,負(fù)擔(dān)高昂的機(jī)會主義訴訟成本。原因在于委托付費數(shù)據(jù)庫代理數(shù)據(jù)許可的未必是某一作品的全部相關(guān)權(quán)利人,例如委托人只是某演繹作品的作者,不包括原作品的作者;又如委托人是某音樂作品的詞曲作者,不包括錄音制作者和表演者。在這些情況下,未授權(quán)服務(wù)商代理數(shù)據(jù)許可事宜的著作權(quán)人可能會起訴數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者的行為侵權(quán)。[43]Lemley教授也提到過這種可能性。See Mark A.Lemley & Bryan Casey, Fair Learning, 99 Texas Law Review 743, 758-759(2021).他們有起訴動力的原因是:第一,行使權(quán)利的成本不算高,[44]關(guān)于行使權(quán)利的成本會影響權(quán)利人行權(quán)動力的論述,See Tim Wu, Tolerated Use, 31 Columbia Journal of Law & the Arts 617, 636 (2008).他們可以通過user agent識別爬蟲所有者的身份、[45]正規(guī)的爬蟲訪問網(wǎng)頁時會通過HTTP請求中的user agent字段告知網(wǎng)站管理者自己的身份信息。利用自動化工具查閱科研成果發(fā)表時公開的研究數(shù)據(jù)集、對生成式人工智能進(jìn)行誘導(dǎo)式提問[46]這也是為何《紐約時報》等著作權(quán)人能很容易地對生成式人工智能發(fā)起侵權(quán)之訴。See the New York Times Compliant,Case 1:23-cv-11195, https://nytco-assets.nytimes.com/2023/12/NYT_Complaint_Dec2023.pdf.等方式,鎖定未經(jīng)許可使用數(shù)據(jù)的數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者。提起侵權(quán)之訴后,律師費用最終也會由侵權(quán)人承擔(dān)。第二,很多時候數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者面臨的訴訟成本或禁令威脅遠(yuǎn)高于版權(quán)許可費,因此會愿意支付高出版權(quán)許可費數(shù)倍的金額來達(dá)成和解。即使數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者選擇進(jìn)入訴訟程序,鑒于權(quán)利人的實際損失或許可費難以計算,我國著作權(quán)司法實踐往往適用法定賠償,而《著作權(quán)法》第54條規(guī)定的法定賠償額范圍為“五百元以上五百萬元以下”,不排除有權(quán)利人認(rèn)為起訴要求損害賠償可超過許可費收益。

此外,市面上存在一些能夠代表作品的所有相關(guān)權(quán)利人對外作出數(shù)據(jù)許可的運營商,例如擁有音樂作品詞曲版權(quán)并經(jīng)表演者同意的錄音制作者環(huán)球音樂唱片公司[47]See Reuters, Google, Universal Music in Talks for Deal on AI "Deepfakes", https://www.reuters.com/technology/google-universalmusic-talks-deal-ai-deepfakes-ft-2023-08-08/.;也存在一些自己擁有職務(wù)作品著作權(quán)的運營商,如《紐約時報》。它們均表示正在探索數(shù)據(jù)許可事宜。但本文認(rèn)為,這對緩解作品數(shù)據(jù)許可市場的交易成本問題作用有限。一方面,當(dāng)開發(fā)的是生成式人工智能時,即使運營商愿意許可,但可能有實質(zhì)數(shù)量的歌曲表演者、新聞作者等,因擔(dān)心人工智能讓自己失業(yè)而竭盡全力阻止許可交易發(fā)生,無論機(jī)器學(xué)習(xí)者愿意支付多高的許可費。這很可能使得運營商一攬子許可中的數(shù)據(jù)條目數(shù)量有限,機(jī)器學(xué)習(xí)者不得不因缺乏足量的數(shù)據(jù)而放棄研發(fā),造成反公地悲劇式的社會福利損失。[48]See Ben Depoorter & Francesco Parisi, Fair Use and Copyright Protection: A Price Theory Explanation, 21 International Review of Law and Economics 453, 460-461 (2002); 焦和平、梁龍坤:《人工智能合成音樂的著作權(quán)風(fēng)險及其化解》,載《知識產(chǎn)權(quán)》2023年第11期,第103-104頁。環(huán)球音樂唱片公司旗下已被人工智能模仿的歌手Drake就極為反感自己的職業(yè)生涯受到機(jī)器威脅,環(huán)球音樂唱片公司也公開強(qiáng)調(diào)如果自己向機(jī)器學(xué)習(xí)者發(fā)放一攬子許可,會讓相關(guān)表演者自己決定是否選擇加入。[49]參見注釋[46]。美國好萊塢員工甚至集體罷工反對自己的作品等被用作數(shù)據(jù)。[50]參見《好萊塢演員罷工陷入僵持!要求加錢,保護(hù)演員不被AI取代》,載微信公眾號“超英隊長”2023年10月13日,

https://mp.weixin.qq.com/s/35prX1_r1BqZm_7daMGt2g.

另一方面,數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者在數(shù)據(jù)獲取環(huán)節(jié)不太可能改變自己優(yōu)先利用爬蟲或大型開源數(shù)據(jù)集的習(xí)慣,轉(zhuǎn)而優(yōu)先找?guī)准疫\營商談判。畢竟,運營商掌握的作品只占互聯(lián)網(wǎng)上全部作品的部分份額,而數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者通過自己或開源數(shù)據(jù)集的爬蟲抓取能將互聯(lián)網(wǎng)中所有可用數(shù)據(jù)收入囊中。此時,鑒于互聯(lián)網(wǎng)上盜版泛濫,運營商所掌握的正版內(nèi)容即便在官網(wǎng)鏈接中被付費墻等接觸控制措施保護(hù),也往往可在其他鏈接中找到盜版副本。例如,《紐約時報》付費墻背后的文章,在互聯(lián)網(wǎng)上就不乏可免費閱讀的復(fù)制件,這些免費鏈接的域名并不顯示文章來自《紐約時報》。[51]例如注釋[46]提及的《紐約時報》的起訴狀里,《紐約時報》代理律師舉例被侵權(quán)的新聞文章大多能在互聯(lián)網(wǎng)上找到盜版版本。如How US Lost on iPhone Work, https://www.livemint.com/Companies/lhMmzW2muqLlDjpzm48lFM/How-US-lostout-on-iPhone-work.html, https://www.pulitzer.org/files/2013/explanatory-reporting/01ieconomy1-22.pdf,2024年1月23日訪問。讓數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者在利用爬蟲搜集數(shù)據(jù)后,再一一辨別每條數(shù)據(jù)可以從哪個運營商處獲得許可,會導(dǎo)致極其高昂的辨別成本。當(dāng)然,可能有質(zhì)疑者會指出,如果數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者利用的是Common Crawl這樣的開源數(shù)據(jù)集,且開源數(shù)據(jù)集通常提供的是運營商官網(wǎng)的鏈接,那么可以根據(jù)域名輕松識別出這些作品的來源,并向運營商尋求使用許可。不過,如果數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者在不規(guī)避、不破壞接觸控制措施的情況下使用了官網(wǎng)付費墻保護(hù)的作品,說明數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者其實已經(jīng)支付過付費墻要求的價格,盡管該價格是為人類閱讀欣賞而定。

綜上,作品類數(shù)據(jù)許可市場很可能在總體上處于失靈狀態(tài),將為數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)目的而復(fù)制、演繹或公開傳播作品的行為認(rèn)定為侵害著作權(quán),會使數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者負(fù)擔(dān)高昂的交易成本,導(dǎo)致其無法有效利用數(shù)據(jù)開發(fā)數(shù)字創(chuàng)新產(chǎn)品。因此,需要在著作權(quán)法中引入針對數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)行為的合理使用條款,以清除產(chǎn)權(quán)保護(hù)形成的障礙。

五、數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)類合理使用對著作權(quán)人市場利益的影響

不同類型的數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)項目對著作權(quán)人市場利益的影響有差別。大多數(shù)文本數(shù)據(jù)挖掘項目免費使用作品后,不會向普通消費者提供復(fù)制件全文或片段,也就不會損害著作權(quán)人在作品欣賞市場上的利益。類似的,自動駕駛等非生成式人工智能的訓(xùn)練者不會將訓(xùn)練數(shù)據(jù)的復(fù)制件提供給普通消費者,也不會輸出新的內(nèi)容表達(dá),因此相關(guān)訓(xùn)練者免費使用作品的行為不會損害權(quán)利人在作品欣賞市場上的利益。

如前提及,谷歌數(shù)字圖書館、新聞搜索引擎這種文本數(shù)據(jù)挖掘項目,即便采取技術(shù)措施保證普通消費者無法通過分次輸入不同關(guān)鍵詞獲得作品復(fù)制件的全文,[52]谷歌有采取這種措施。作為對比,注釋⑦提及的西安佳韻社數(shù)字娛樂發(fā)行股份有限公司與上海簫明企業(yè)發(fā)展有限公司侵害作品信息網(wǎng)絡(luò)傳播權(quán)糾紛案中,被告沒有采取措施防止用戶分次反復(fù)獲得原告的整部電視劇。但提供的復(fù)制件片段在“質(zhì)”的意義上會構(gòu)成原件的市場替代品,導(dǎo)致原件銷量減少,從而實質(zhì)性損害著作權(quán)人的收益。然而,此類信息挖掘項目同時具有網(wǎng)絡(luò)效應(yīng)。信息搜索引擎不斷收集作品并對外提供復(fù)制件片段,吸引越來越多的用戶使用引擎進(jìn)行數(shù)據(jù)挖掘,加入信息挖掘項目的作品因此有機(jī)會被更多消費者看到。一些偶然搜索到某一作品的用戶可能在接觸片段后,反而產(chǎn)生購買全文的興趣,導(dǎo)致作品原件銷量增加。[53]See Michael R.Mattioli, Opting Out: Procedural Fair Use, 12 Virginia Journal of Law & Technology 1, 23-25 (2007).對著作權(quán)人市場利益的消極與積極影響相互抵消后,著作權(quán)人市場利益被損害的程度會有所降低。

生成式人工智能在某些情況下(如用戶發(fā)出誘導(dǎo)式提問時)會輸出某條作品數(shù)據(jù)的實質(zhì)部分,構(gòu)成該條數(shù)據(jù)的市場替代品,實質(zhì)性損害數(shù)據(jù)著作權(quán)人的市場收益。但可以預(yù)見的是,隨著生成式人工智能的開發(fā)者采用過濾技術(shù)等方式不斷提升防御誘導(dǎo)式提問的能力,機(jī)器輸出某條數(shù)據(jù)實質(zhì)部分的情況越來越少。與此同時,生成式人工智能的開發(fā)者還可以參考New Bing的做法,在輸出某條訓(xùn)練數(shù)據(jù)局部片段時附隨提供數(shù)據(jù)原出處的網(wǎng)站鏈接,使服務(wù)用戶能通過點擊鏈接直接訪問數(shù)據(jù)全文。這樣,生成式人工智能還能同谷歌數(shù)字圖書館等文本數(shù)據(jù)挖掘項目一樣,起到通過網(wǎng)絡(luò)效應(yīng)吸引流量的作用,增加訓(xùn)練數(shù)據(jù)在作品欣賞市場上的銷量,增進(jìn)相關(guān)著作權(quán)人的市場收益。

不過,生成式人工智能還會以其他方式實質(zhì)性損害著作權(quán)人的市場利益。首先,有時,生成式人工智能僅將一位作者的作品作為訓(xùn)練數(shù)據(jù),初始階段輸出物不包含任一訓(xùn)練數(shù)據(jù)的實質(zhì)部分,但模仿了該作者的表達(dá)風(fēng)格。例如,不包含某一作者美術(shù)作品中的具體構(gòu)圖布局、卡通形象等,但在透視方法、線條紋理、色調(diào)光影等的運用上一脈相承。又如,不包含某一作者音樂作品中的具體旋律、節(jié)奏等,但在調(diào)式、和聲、配器等的選擇偏好上如出一轍。此時,機(jī)器初始階段輸出物對被模仿作者的作品具有一定市場替代效果。畢竟,有些消費者購買特定作者的作品,只是因為被其表達(dá)風(fēng)格、特色吸引,并不關(guān)心內(nèi)容表達(dá)究竟出自誰手。這時,被機(jī)器模仿的特定作者的作品銷量不可避免地會下滑。即便這些被模仿表達(dá)風(fēng)格的作者往往知名度很大,主要通過向簽約客戶[54]例如,被生成式人工智能模仿表達(dá)風(fēng)格的插畫師Hollie Mengert僅向迪士尼等簽約客戶提供插畫。在不經(jīng)簽約客戶允許的情況下,Hollie甚至不能隨意在網(wǎng)上傳播自己的插畫。、對作者本人頗有好感的忠實粉絲[55]最近,漫畫家Kim Jung Gi的粉絲甚至激烈抵制人工智能按照Kim的風(fēng)格生成美術(shù)作品。See Andrew Deck, AI-generated Art Sparks Furious Backlash from Japan's Anime Community, https://restofworld.org/2022/ai-backlash-anime-artists/, 2024年1月23日訪問。和潛在慕名者銷售作品獲利,并且如今各國法規(guī)大多要求有機(jī)器參與創(chuàng)作的內(nèi)容表達(dá)須附加來源標(biāo)識,[56]參見潘駿、王悅:《標(biāo)識雖小意義非凡——〈生成式人工智能服務(wù)內(nèi)容標(biāo)識方法(征求意見稿)〉簡評》,載微信公眾號“國浩律師事務(wù)所”2023年8月25日,https://mp.weixin.qq.com/s/-hWTQzWPm_sipO-_7OCDrw.消費者不會因誤認(rèn)而購買,我們也不敢斷言機(jī)器初始階段輸出物搶走的市場份額不是實質(zhì)性的。

其次,更多時候,生成式人工智能廣泛學(xué)習(xí)不同作者的作品,盡管初始階段的機(jī)器輸出物不與訓(xùn)練數(shù)據(jù)集中的任何一部作品實質(zhì)相似,但可與部分或全部訓(xùn)練數(shù)據(jù)歸為同一風(fēng)格流派。例如,用作咖啡館背景音樂的后波普爵士樂,可作為商品廣告的攝影風(fēng)格人物特寫,甚至一部扣人心弦的奇幻小說。隨著人工智能技術(shù)不斷進(jìn)步,根據(jù)用戶輸入的簡單指令,機(jī)器在分秒之間輸出內(nèi)容,且品質(zhì)超過用作數(shù)據(jù)之作品平均質(zhì)量水平的情況,會越來越常見。此時,機(jī)器初始階段輸出物與訓(xùn)練數(shù)據(jù)會共同搶奪這一風(fēng)格流派內(nèi)容表達(dá)的消費者的注意力,訓(xùn)練數(shù)據(jù)著作權(quán)人的市場收益會顯著減少。這可能意味著,部分作者無法繼續(xù)靠創(chuàng)作活動維生,工作被機(jī)器取代,甚至引發(fā)失業(yè)浪潮。[57]See Benjamin L.W.Sobel, Artificial Intelligence's Fair Use Crisis, 41 The Columbia Journal of Law & the Arts 45, 98 (2017).

本文承認(rèn),允許機(jī)器學(xué)習(xí)者免費利用作品開發(fā)生成式人工智能會對訓(xùn)練數(shù)據(jù)的著作權(quán)人造成上述實質(zhì)性市場損失。但在數(shù)據(jù)許可市場因許可方主體數(shù)量眾多或單一許可方拒絕許可動機(jī)強(qiáng)烈而普遍失靈的情況下,這些市場損害是社會生產(chǎn)效率大幅提升的必然代價。并且,被機(jī)器模仿個人表達(dá)風(fēng)格的作者在市場利益被機(jī)器減損的同時,也受益于生成式人工智能的進(jìn)步。當(dāng)他們運用新技術(shù)輔助自己進(jìn)行創(chuàng)作等活動時,生產(chǎn)成本大幅下降,效率和產(chǎn)量明顯提升,很可能比僅憑人力創(chuàng)作時獲得更多的市場收益。[58]參見曲三強(qiáng):《論人工智能與知識產(chǎn)權(quán)》,載《知識產(chǎn)權(quán)》2023年第8期,第30頁。智能機(jī)器因此間接對他們的市場利益產(chǎn)生積極影響,沖抵市場負(fù)面影響。具體而言,從確定主題到完成表達(dá)細(xì)節(jié),甚至形成全新表達(dá)風(fēng)格,智能機(jī)器的輔助可以貫穿創(chuàng)作、制作的所有步驟。以繪制美術(shù)作品為例,作者可以更少地使用畫筆和數(shù)位手繪板,通過不斷調(diào)試指令指使人工智能算法物態(tài)化自己構(gòu)思的審美意象。這樣不僅速度更快,而且能智能補(bǔ)充一些細(xì)節(jié)。更重要的是,人工智能可以參與到藝術(shù)構(gòu)思活動中來,激發(fā)創(chuàng)作靈感,幫助作者形成風(fēng)格獨特的審美意象。畫家創(chuàng)作審美意象從來不是無中生有的,需要他人的智力成果啟迪靈感。[59]參見[美]奧斯丁·克萊恩:《“偷”師學(xué)藝——10個你一定要知道的創(chuàng)意秘籍》,嵇小庭譯,上海人民美術(shù)出版社2014年版,第35-36頁。不乏成功的藝術(shù)家坦言“藝術(shù)即是剽竊”(畢加索)、“不成熟的詩人照葫蘆畫瓢,成熟的詩人偷天換日”(T.S.艾略特)。通過學(xué)習(xí)諸多先賢的佳作,如反向工程般拆解美術(shù)作品線條、圖形、紋理的使用、透視方法、色彩調(diào)配、色度比對、比例、構(gòu)圖、抽象或?qū)憣嵆潭鹊戎T多方面,了解個中原理,畫家可巧妙地重新排列組合、加工提煉前人的表達(dá)風(fēng)格特征,從模仿蛻化成原創(chuàng)審美意象。[60]同注釋[59]。生成式人工智能無疑能大大加速作者“從模仿到創(chuàng)新”的過程,幫助作者高效地進(jìn)行調(diào)試碰撞、排列組合。

當(dāng)然,在生成式人工智能大幅提升創(chuàng)意產(chǎn)業(yè)整體的創(chuàng)作效率的同時,部分創(chuàng)作者可能會被機(jī)器淘汰,失去目前的工作。但這波失業(yè)浪潮可以隨著新產(chǎn)業(yè)和新崗位的出現(xiàn)而被社會自我調(diào)節(jié)。事實上,自第一次工業(yè)革命以來,技術(shù)變革帶來工作形態(tài)變遷的事例比比皆是。從蒸汽動力到內(nèi)燃機(jī)、電力,新技術(shù)的應(yīng)用和機(jī)械化的普及大幅節(jié)約勞動力成本,導(dǎo)致大量的手工勞動者被生產(chǎn)效率更高的機(jī)器淘汰。但與此同時,新的產(chǎn)業(yè)與工作崗位不斷涌現(xiàn):汽車、飛機(jī)、家用電器等各類現(xiàn)代制造業(yè)需要流水線工人、維修技工、工程師、機(jī)械師、經(jīng)理等輔助機(jī)器生產(chǎn)的每個環(huán)節(jié)。[61]See Carl Benedikt Frey, The Technology Trap: Capital Labor, and Power in the Age of Automation, Princeton University Press, 2019.那么類似的,在生成式人工智能技術(shù)發(fā)展的今天,智能機(jī)器應(yīng)該只是讓很多創(chuàng)作者的工作崗位和性質(zhì)發(fā)生變化,而不是直接導(dǎo)致其喪失勞動機(jī)會和生活來源。被機(jī)器取代的創(chuàng)作者可能轉(zhuǎn)型成為數(shù)據(jù)標(biāo)注者、人工智能訓(xùn)練師、軟件和平臺開發(fā)者,以及不斷涌現(xiàn)的其他新崗位的從業(yè)者,參與創(chuàng)作自動化進(jìn)程。

可能還會有質(zhì)疑者擔(dān)憂通過合理使用制度允許生成式人工智能自由學(xué)習(xí)盡可能多的作品后,智能機(jī)器不斷優(yōu)化少部分能力杰出的創(chuàng)作者的使用體驗,這些人會越來越依賴機(jī)器,手工創(chuàng)作的基本功逐漸退化。盡管這不直接關(guān)乎個體著作權(quán)人的市場利益,但影響人類創(chuàng)意行業(yè)能否可持續(xù)發(fā)展。本文認(rèn)為這一假想不大可能成為現(xiàn)實。因為當(dāng)市面上充斥機(jī)器初始階段輸出物和機(jī)器輔助完成的作品時,手工完成的作品反而可能因為相對稀缺而被消費者賦予更高的價值,[62]人類社會最擅長在資源因生產(chǎn)自動化而變得豐富時人為制造稀缺性。See Dan L.Burk, Cheap Creativity and What It Will Do, 57 Georgia Law Review 1669, 1712 (2023).創(chuàng)作者也就仍有動力僅靠人力以更慢的速度、更高的成本創(chuàng)作作品。這就好比當(dāng)工業(yè)流水線生產(chǎn)出來的物美價廉的糕點、啤酒充斥大街小巷的便利店時,一些精品店仍會手工制作同類食品,甚至被尊稱為甜品、精釀,售以高價,即便其口感未必優(yōu)于流水線面包、啤酒中品質(zhì)最好的那批。服飾、包具等產(chǎn)品領(lǐng)域也存在類似現(xiàn)象。

六、法定許可與“選擇退出”不可行

作品數(shù)據(jù)許可市場總體處于失靈狀態(tài)時,需要權(quán)利限制機(jī)制實現(xiàn)對作品使用的讓渡。除了采用徹底的合理使用機(jī)制外,決策者還可以引入法定許可機(jī)制,或者實施折衷的合理使用機(jī)制,即允許著作權(quán)人通過機(jī)器可讀的機(jī)器人協(xié)議、反爬蟲措施或人類可讀的網(wǎng)頁公告排除合理使用條款的適用。對此,本文持反對態(tài)度。當(dāng)然,著作權(quán)人采取有效接觸控制措施保護(hù)作品的行為還是應(yīng)予以尊重,此時為平衡權(quán)利人與社會公眾的利益,法律可以單獨設(shè)立以非營利性學(xué)術(shù)研究和教學(xué)目的規(guī)避接觸控制措施的例外。

(一)不宜引入法定許可制度

理論上,決策者的確可以選擇實施法定許可制度,讓數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者在向指定機(jī)構(gòu)(如著作權(quán)集體管理組織)繳納一筆著作權(quán)主管部門確定的許可費后,不經(jīng)權(quán)利人許可而使用作品。這樣,數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者無須與著作權(quán)人就許可費數(shù)額討價還價,也不用擔(dān)心實質(zhì)數(shù)量的著作權(quán)人拒絕許可導(dǎo)致可利用的數(shù)據(jù)不夠充足,交易成本大幅降低。與此同時,著作權(quán)人可以獲得一筆數(shù)據(jù)許可收益。美國國會圖書館近期在征求產(chǎn)業(yè)界意見,考慮是否引入數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)法定許可。[63]The U.S.Copyright Office, Library of Congress, Artificial Intelligence and Copyright: Notice of Inquiry and Request for Comments, Clause 10.3, https://www.federalregister.gov/documents/2023/08/30/2023-18624/artificial-intelligence-and-copyright.我國學(xué)界也有建議采納法定許可機(jī)制促進(jìn)作品作為數(shù)據(jù)利用的聲音,尤其是在面對生成式人工智能的情況下。[64]參見高陽、胡丹陽:《機(jī)器學(xué)習(xí)對著作權(quán)合理使用制度的挑戰(zhàn)與應(yīng)對》,載《電子知識產(chǎn)權(quán)》2020年第10期,第13-25頁。另見注釋⑨。本文反對引入此類法定許可機(jī)制。下文雖僅在生成式人工智能的場景下展開討論,但論證適用于所有類型的挖掘?qū)W習(xí)項目。

首先,集體管理組織的運行成本很高。為節(jié)省新成立一個法定許可費管理機(jī)構(gòu)的成本,著作權(quán)主管部門可以直接指定現(xiàn)有的幾家著作權(quán)集體管理組織收取、分發(fā)數(shù)據(jù)許可費。但存在以下問題。第一,集體管理組織與每個生成式人工智能開發(fā)項目的負(fù)責(zé)人建立聯(lián)系,確認(rèn)項目利用的作品類型、數(shù)量等,需要花費成本。第二,集體管理組織精確辨別這些作品分別屬于哪些著作權(quán)人,這些著作權(quán)人是不是自己的會員,并將官定許可費逐一分發(fā),需要花費更加高昂的成本——畢竟生成式人工智能動輒需要幾萬條甚至數(shù)百萬條訓(xùn)練數(shù)據(jù)。第三,集體管理組織替權(quán)利人起訴維權(quán),需要支付訴訟費、律師費、公證費、車馬費、餐費、文印費、電話費等不可缺少的費用。凡此種種,不一而足。集體管理組織需要先用收取的法定許可費彌補(bǔ)上述運行成本,剩下的部分才能分給相關(guān)著作權(quán)人,轉(zhuǎn)化成著作權(quán)人的創(chuàng)新激勵。在這之外,政府監(jiān)管集體管理組織的運行也要耗費實質(zhì)成本。與此同時,機(jī)器學(xué)習(xí)者將法定許可費通過更高的產(chǎn)品售價轉(zhuǎn)嫁給生成式人工智能的消費者,造成消費者的福利損失。總體來看,社會整體福利很可能是凈損失的。

其次,確定及定期調(diào)整法定許可費很復(fù)雜。法定許可費率不能是“拍腦袋”決策的結(jié)果,需要根據(jù)可信賴的基準(zhǔn)確定。既然采用法定許可的目的是節(jié)省交易成本,法定許可費率就應(yīng)該盡量反映一個不受限制的市場上善意談判的被許可方愿意對善意許可方支付的價格。[65]近年來美國《音樂現(xiàn)代化法案》(Orrin G.Hatch-Bob Goodlatte Music Modernization Act)和版稅委員會的一些費率裁定就體現(xiàn)了這種思路。為此,著作權(quán)主管部門可以仿效美國《版權(quán)法案》針對自動點唱機(jī)對非戲劇型音樂作品進(jìn)行公開表演的法定許可[66]See 17 U.S.C.§116 (b).和非商業(yè)性、教育型公共廣播機(jī)構(gòu)公開表演特定作品的法定許可,[67]See 17 U.S.C.§118 (b).優(yōu)先鼓勵產(chǎn)業(yè)內(nèi)部分著作權(quán)人代表與機(jī)器學(xué)習(xí)者代表在一定期限內(nèi)通過談判來達(dá)成許可費率,雙方代表達(dá)成的和解協(xié)議中的費率經(jīng)著作權(quán)主管部門批準(zhǔn)后,適用于所有開發(fā)生成式人工智能的機(jī)器學(xué)習(xí)者和相關(guān)著作權(quán)人,無論他們是否參與了和解談判。[68]See 17 U.S.C.§801 (b) (7); 37 C.F.R.§351.2 (b) (2023).不過,雙方代表很可能為盡力爭取有利費率價格而無法達(dá)成和解,需要著作權(quán)主管部門自行計算費率。在這一過程中,著作權(quán)主管部門需要花費大量時間精力來收集市場信息。尤其是在生成式人工智能產(chǎn)業(yè)還在起步階段的情況下,很難找到有效的可比協(xié)議,著作權(quán)主管部門甚至可能需要基于機(jī)器學(xué)習(xí)者的盈利、成本等財會數(shù)據(jù),以及許可雙方的談判地位等,建立經(jīng)濟(jì)模型來進(jìn)行復(fù)雜的價格計算。更何況,考慮到市場上的成本與需求處于動態(tài)變化之中,確定的法定許可費率價格不應(yīng)該是一成不變的,否則無法反映產(chǎn)業(yè)的供需現(xiàn)實。這就要求著作權(quán)主管部門每隔一段時間就得重新計算一次費率。事實上,很可能著作權(quán)主管部門還沒來得及算清楚現(xiàn)階段的費率,技術(shù)條件和市場環(huán)境就已經(jīng)進(jìn)入新階段了。

最后,法定許可大概率會過度剝奪機(jī)器學(xué)習(xí)者投資開發(fā)生成式人工智能的激勵。即便著作權(quán)主管部門定期調(diào)整法定許可費率,但各次調(diào)整的時間間隔通常不會太短。本文假設(shè),兩次調(diào)整相隔五年。在這五年中,生成式人工智能技術(shù)發(fā)展速度飛快,產(chǎn)品的生產(chǎn)成本不斷下降,產(chǎn)品價格也相應(yīng)處于接連下降的狀態(tài)。這意味著第一年年初確定的費率在第四、五年時對機(jī)器學(xué)習(xí)者而言很可能是偏高的。機(jī)器學(xué)習(xí)者在第四、五年就只能支付偏高價格的法定許可費,剩下更少的資金投入于升級人工智能產(chǎn)品的活動中。生成式人工智能提升社會各行各業(yè)的生產(chǎn)、生活效率,能帶來的社會價值遠(yuǎn)高于被利用的作品,延緩人工智能產(chǎn)品升級的社會成本實質(zhì)性大于社會上產(chǎn)生更多作品的收益。因此,第四、五年收取的法定許可費很可能貶損社會整體福利。

(二)不宜允許“選擇退出”合理使用機(jī)制

歐盟2019年頒布的《數(shù)字單一市場版權(quán)指令》第3條和第4條規(guī)定了數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)合理使用條款。第3條適用于非營利性科研機(jī)構(gòu),第4條適用于商業(yè)性主體。但在挖掘?qū)W習(xí)者具有商業(yè)目的的情況下,即使互聯(lián)網(wǎng)中的作品處于社會公眾可獲得的狀態(tài),也允許著作權(quán)人以適當(dāng)方式明確地排除挖掘?qū)W習(xí)合理使用條款適用于自己的作品、錄音錄像制品。第4條指出,權(quán)利人“選擇退出”合理使用機(jī)制的適當(dāng)方式包括機(jī)器可讀的技術(shù)手段。[69]同注釋⑤。通常來講,能通知網(wǎng)絡(luò)爬蟲不訪問網(wǎng)頁中的作品但不限制人類正常瀏覽的技術(shù)手段有機(jī)器人協(xié)議和反爬蟲措施。同時,著作權(quán)人在自建的獨立網(wǎng)站、博客等處張貼的網(wǎng)頁公告也可以被理解為第4條所稱的適當(dāng)方式。

本文認(rèn)為,我國著作權(quán)法應(yīng)不允許著作權(quán)人以機(jī)器人協(xié)議、網(wǎng)頁公告和反爬蟲措施“選擇退出”挖掘?qū)W習(xí)合理使用條款。首先,權(quán)利人實施“選擇退出”手段的成本極低,但可產(chǎn)生顯著的社會負(fù)外部性損害。本文猜測,歐盟設(shè)計“選擇退出”機(jī)制時的預(yù)期是只有個別著作權(quán)人會退出合理使用條款。但現(xiàn)實更可能是實質(zhì)數(shù)量的著作權(quán)人都會決定排除合理使用條款適用于自己的作品,以試圖獲得數(shù)據(jù)許可收益或純粹因不愿意許可。畢竟,機(jī)器人協(xié)議只是在服務(wù)器根目錄下存儲的robots.txt文件中寫幾行代碼,[70]參見維基百科 "Robots.txt", https://en.wikipedia.org/wiki/Robots.txt, 2023年10月27日訪問。網(wǎng)頁公告只是創(chuàng)建內(nèi)容頁面,著作權(quán)人以這兩種方式執(zhí)行退出合理使用機(jī)制的成本基本為零。類似的,大多數(shù)反爬蟲措施,如驗證碼驗證、設(shè)置IP訪問頻率、動態(tài)頁面加載等,成本均較低。著作權(quán)人可以很方便地以上述方式“選擇退出”。實質(zhì)數(shù)量的著作權(quán)人退出合理使用機(jī)制導(dǎo)致數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者重新面對高昂的交易成本,很難獲得充足數(shù)量的數(shù)據(jù)來研發(fā)優(yōu)質(zhì)的數(shù)字創(chuàng)新產(chǎn)品。這將廣泛損害第三方社會公眾的福利,造成的社會負(fù)外部性損害遠(yuǎn)大于權(quán)利人所獲收益。

其次,著作權(quán)法采取上述制度安排不太可能導(dǎo)致著作權(quán)人的服務(wù)器訪問負(fù)擔(dān)超載。本文理解會有質(zhì)疑者擔(dān)心,如果著作權(quán)法不禁止數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者忽視機(jī)器人協(xié)議與網(wǎng)頁公告、規(guī)避反爬蟲措施的行為,那么爬蟲頻繁爬取會給著作權(quán)人的服務(wù)器和帶寬造成負(fù)擔(dān)。但這是其他部門法可以有效解決的問題。例如,如果爬蟲短期內(nèi)的高頻反復(fù)訪問導(dǎo)致著作權(quán)人的網(wǎng)絡(luò)帶寬和服務(wù)器負(fù)荷超載,影響被訪問網(wǎng)站的正常運行,可適用《反不正當(dāng)競爭法》第12條第2款第4項的兜底規(guī)定,來追究數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者妨礙、破壞被訪問網(wǎng)站經(jīng)營者合法提供的網(wǎng)絡(luò)產(chǎn)品或者服務(wù)正常運行的法律責(zé)任。對于構(gòu)成犯罪的,可適用《刑法》第285條第2款的“非法獲取計算機(jī)信息系統(tǒng)數(shù)據(jù)、非法控制計算機(jī)信息系統(tǒng)罪”和第217條的“侵犯著作權(quán)罪”,追究其刑事責(zé)任。與本文觀點不謀而合,新加坡雖曾在2019年準(zhǔn)備規(guī)定數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者不得規(guī)避維護(hù)服務(wù)器穩(wěn)定的反爬蟲措施、機(jī)器人協(xié)議等來獲取作品,[71]See Intellectual Property Office of Singapore: Singapore Copyright Review Report, Conclusion 8 at p.34: "Rights-holders will not be prevented from taking reasonable measures to maintain the security and stability of their computer system or network." https://www.mlaw.gov.sg/files/news/press-releases/2019/01/Annex%20A%20-%20Copyright%20Review%20Report%2016%20Jan%202019.pdf.但在2021年正式頒布的合理使用條款中刪除了這一規(guī)定。

不過,需要注意的是,著作權(quán)人有時會把作品藏在付費墻、需要口令驗證的軟件鎖等接觸控制措施背后,社會公眾未經(jīng)許可無法獲取和使用措施保護(hù)的作品。對此,著作權(quán)法不應(yīng)為挖掘?qū)W習(xí)者規(guī)避這些有效接觸控制措施的行為提供一般性的合理使用豁免,但可以單獨設(shè)立以非營利性學(xué)術(shù)研究和教學(xué)目的規(guī)避措施的例外。理由如下:第一,權(quán)利人采用有效的付費墻、軟件鎖等通常需要花費實質(zhì)性成本,且措施保護(hù)程度越高,成本一般也會越高,例如《紐約時報》甚至曾為付費墻技術(shù)花費四千萬美元。[72]See Mike Masnick, It Took the NY Times 14 Months and $40 Million Dollars to Build the World’s Stupidest Paywall?, https://www.techdirt.com/2011/03/17/it-took-ny-times-14-months-40-million-dollars-to-build-worlds-stupidest-paywall/.這意味著能負(fù)擔(dān)起實施有效接觸控制措施的成本的著作權(quán)人為數(shù)不至眾多,社會上一部分權(quán)利人通過接觸控制措施來保護(hù)自己的作品不被他人免費利用不會導(dǎo)致交易成本嚴(yán)重回彈,權(quán)利人實施接觸控制措施也就不會明顯對社會公眾造成負(fù)外部性損害。第二,權(quán)利人為保護(hù)對自己而言很重要的利益花費了實質(zhì)性的資源,顯示了自己的誠意。在其實施技術(shù)措施的行為沒有產(chǎn)生顯著負(fù)外部性的情況下,法律應(yīng)尊重這種誠意。第三,接觸控制措施對未經(jīng)許可的爬蟲訪問設(shè)置了較為有效的物理障礙,亦即他人需要較高的技術(shù)能力和資金成本才能規(guī)避有效的接觸控制措施,能規(guī)避措施的使用者是少數(shù)。這意味著當(dāng)規(guī)避接觸控制措施的行為被法律禁止時,權(quán)利人對每個規(guī)避者都能有效執(zhí)法。第四,著作權(quán)法如果為數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)者規(guī)避權(quán)利人的接觸控制措施提供一般性的合理使用豁免,可能會刺激雙方進(jìn)行技術(shù)措施與規(guī)避措施的“軍備競賽”,造成社會資源的浪費,與此同時卻沒有明顯的社會收益。當(dāng)然,出于公共利益的考量,可以允許非營利性圖書館、檔案館、博物館、高等教育機(jī)構(gòu)的研究人員出于非市場化的學(xué)術(shù)研究和教學(xué)目的規(guī)避保護(hù)某些類型作品的接觸控制措施。

結(jié) 語

我國現(xiàn)行《著作權(quán)法》第24條構(gòu)建的合理使用制度沒有一般條款,已有的合理使用法定情形即使被擴(kuò)張解釋,也難以覆蓋數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)活動。即使未來修法時引入一般條款,也無法有效應(yīng)對數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)實踐中的諸多細(xì)節(jié)問題。若不專設(shè)數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)合理使用條款,會使數(shù)字產(chǎn)業(yè)發(fā)展的制度環(huán)境有失穩(wěn)定。因此,鑒于《著作權(quán)法》第24條第13項允許法律、行政法規(guī)增設(shè)合理使用情形,應(yīng)在《著作權(quán)法實施條例》和《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》修訂時引入數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)合理使用規(guī)則,以支持我國數(shù)字創(chuàng)新產(chǎn)業(yè)快速成長。

猜你喜歡
著作權(quán)人許可數(shù)據(jù)挖掘
著作權(quán)轉(zhuǎn)讓聲明
著作權(quán)轉(zhuǎn)讓聲明
版權(quán)許可聲明
版權(quán)許可聲明
版權(quán)許可聲明
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
本期作者介紹
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
著作權(quán)許可聲明