王瑤 李勝利
收稿日期:2023-08-07
作者簡介:王 瑤(1998-),女,安徽太湖人,安徽大學(xué)法學(xué)院碩士研究生。
李勝利(1972-),男,安徽潁上人,經(jīng)濟(jì)法學(xué)博士,安徽大學(xué)法學(xué)院教授、博士生導(dǎo)師。
摘? ?要:以ChatGPT為代表的生成式人工智能一經(jīng)問世便空前火爆,給社會帶來巨大便利的同時(shí),也存在隱藏的版權(quán)風(fēng)險(xiǎn)。針對數(shù)據(jù)挖掘可能面臨版權(quán)侵權(quán)風(fēng)險(xiǎn),我國可以參照國外確立文本數(shù)據(jù)挖掘的版權(quán)例外規(guī)定,將人工智能創(chuàng)作利用數(shù)據(jù)納入合理使用范圍。針對版權(quán)權(quán)屬爭議風(fēng)險(xiǎn),從思想表現(xiàn)形式和人格主義要素兩個(gè)方面認(rèn)定ChatGPT生成內(nèi)容的獨(dú)創(chuàng)性,證明生成式人工智能生成內(nèi)容的可版權(quán)性。此外,建議建構(gòu)“作者—著作權(quán)人”二元權(quán)利主體結(jié)構(gòu),明確生成作品著作權(quán)歸屬于使用者,從而鼓勵(lì)生成式人工智能創(chuàng)作、促進(jìn)人工智能產(chǎn)業(yè)的發(fā)展。
關(guān)鍵詞:ChatGPT;生成式人工智能;版權(quán)風(fēng)險(xiǎn);可版權(quán)性;數(shù)據(jù)挖掘;合理使用
DOI:10.3969/j.issn.1003-9031.2023.10.004
中圖分類號:D923.41;TP18? ? ? ? ? 文獻(xiàn)標(biāo)識碼:A? ? ?文章編號:1003-9031(2023)10-0049-10
一、引言
生成式人工智能(Generative AI)是通過各種既定的機(jī)器學(xué)習(xí)方法從廣大的數(shù)據(jù)資源中有針對性地進(jìn)行學(xué)習(xí),從而生成符合人類偏好的、完全原創(chuàng)的內(nèi)容的人工智能。2022年11月30日ChatGPT的問世,帶來了更加簡便的接入方式以及較低的操作門檻,受到廣大群眾的追捧,進(jìn)而迅速地融入到人類生活的各個(gè)方面,成為人類生活領(lǐng)域、工作領(lǐng)域、學(xué)習(xí)領(lǐng)域的重要應(yīng)用工具。ChatGPT可以按照人類的指令編寫代碼,撰寫符合人類要求的高質(zhì)量論文。這不僅讓人類體驗(yàn)到科技創(chuàng)新帶來的成果,而且也激發(fā)了人工智能領(lǐng)域研究者對ChatGPT技術(shù)改造升級的積極性。2023年OpenAI公司推出了更新?lián)Q代的AI新模型GPT-4,此模型的最大特點(diǎn)是能夠識別抽象化的表達(dá)以及處理高達(dá)兩萬多字?jǐn)?shù)的文本。微軟公司對外宣稱,不久將合理利用ChatGPT相關(guān)技術(shù)對Office系列辦公軟件進(jìn)行改造升級,并將GPT-4技術(shù)應(yīng)用到其開發(fā)的必應(yīng)(Bing)搜索引擎當(dāng)中,以此提升企業(yè)的核心競爭力。
在公眾驚喜于新技術(shù)帶來的益處時(shí),也有不少專家、學(xué)者對生成式人工智能的誕生表示深深擔(dān)憂。有學(xué)者認(rèn)為,人工智能的大量普及勢必會使公眾遭遇個(gè)人隱私數(shù)據(jù)泄露風(fēng)險(xiǎn),甚至可能會被不法分子利用并實(shí)施違法犯罪行為。還有學(xué)者認(rèn)為,生成式人工智能在興起過程中掌握了大量公眾數(shù)據(jù),增強(qiáng)了企業(yè)的競爭力,這大大加強(qiáng)了科技巨頭公司的壟斷地位,很有可能實(shí)施濫用市場支配地位的行為,造成市場不公平競爭的現(xiàn)象。本文著眼于ChatGPT的誕生給我國現(xiàn)行著作權(quán)法帶來的劇烈沖擊,一方面,生成式人工智能輸入階段的數(shù)據(jù)獲取問題是否違反我國著作權(quán)法的規(guī)定尚不確定。另一方面,針對生成式人工智能生成內(nèi)容是否具有可版權(quán)性存在爭議,這無疑加大了以ChatGPT為代表的生成式人工智能的版權(quán)保護(hù)難度。為了推動(dòng)生成式人工智能產(chǎn)業(yè)的發(fā)展,應(yīng)當(dāng)合理規(guī)范數(shù)據(jù)挖掘行為、厘清生成內(nèi)容的法律性質(zhì)、明確相關(guān)主體的法律權(quán)利與義務(wù)。
二、生成式人工智能運(yùn)作原理及其引發(fā)的版權(quán)風(fēng)險(xiǎn)
(一)ChatGPT的運(yùn)作原理
ChatGPT作為生成式人工智能的典型,不同于以往的人工智能,而是以深度學(xué)習(xí)和人類反饋強(qiáng)化學(xué)習(xí)等技術(shù)為基礎(chǔ),挖掘數(shù)量龐大的互聯(lián)網(wǎng)信息,反復(fù)自我訓(xùn)練數(shù)據(jù)庫中保存的豐富數(shù)據(jù),從而根據(jù)使用者在輸入端發(fā)出的特定指令,生成內(nèi)容頗為精彩、語言風(fēng)格與人類相似等符合使用者內(nèi)心偏好的自然語言文本。ChatGPT的形成不是一蹴而就的,而是經(jīng)歷了紛繁復(fù)雜的訓(xùn)練過程。首先,研究人員通過比較分析選定一款較為成熟的大型語言模型作為訓(xùn)練的初始模型,用戶端輸入一個(gè)提示詞(Prompt),模型輸出端通常能夠輸出一個(gè)令人較為滿意的文本。其次,研究人員需要設(shè)定相關(guān)條件來建立人類偏好數(shù)據(jù)。針對輸入端的問題隨機(jī)選擇進(jìn)行精準(zhǔn)回答,以此提高模型回答的精準(zhǔn)度,形成標(biāo)注數(shù)據(jù),并將其反饋至初始模型再次進(jìn)行學(xué)習(xí)與訓(xùn)練。研究人員根據(jù)標(biāo)準(zhǔn)數(shù)據(jù)訓(xùn)練反饋模型(Feedback Model),對初始模型中輸出的內(nèi)容按照回答的相關(guān)性、質(zhì)量的高低標(biāo)準(zhǔn)等進(jìn)行排序。最后,研究人員需要根據(jù)初始模型輸出的內(nèi)容訓(xùn)練打分模型(Reward Model)。此階段的目的主要是判斷模型生成的文本是否符合人類偏好。基于RM(Reward Model)模型中設(shè)立的打分函數(shù),可以對初始模型輸出的內(nèi)容賦予分值,以此判斷輸出文本是否優(yōu)質(zhì),然后按照分值的高低進(jìn)行分流。當(dāng)模型輸出的文本分值較低時(shí),初始模型將自動(dòng)進(jìn)行原始的學(xué)習(xí)流程。通過打分優(yōu)化算法更新模型參數(shù),經(jīng)過循環(huán)往復(fù)的訓(xùn)練,使得輸出文本更加符合人類的需求和認(rèn)知,這便產(chǎn)生了ChatGPT。從技術(shù)層面來看,ChatGPT建構(gòu)了大型語言模型LLM(Large Language Model)和強(qiáng)化學(xué)習(xí)微調(diào)訓(xùn)練模型,采用了Transformer神經(jīng)網(wǎng)絡(luò)架構(gòu)(目前為 GPT-4 架構(gòu)),綜合利用神經(jīng)網(wǎng)絡(luò)、人類反饋強(qiáng)化學(xué)習(xí)、深度學(xué)習(xí)等AI技術(shù),綜合用戶輸入的文本深入理解人類思維,著重分析用戶輸入指令的特定內(nèi)涵,根據(jù)數(shù)據(jù)庫中已經(jīng)存儲的文本語料,生成按數(shù)字序列形式排列的內(nèi)容,最后將其轉(zhuǎn)換為文本輸出,從而生成符合人類偏好的作品。
(二)ChatGPT引發(fā)的版權(quán)風(fēng)險(xiǎn)
生成式人工智能的興起推動(dòng)了教育領(lǐng)域、生產(chǎn)領(lǐng)域、科研領(lǐng)域等方面的變革,給人類生活帶來極大便利的同時(shí),不可避免地給版權(quán)領(lǐng)域帶來極大的挑戰(zhàn)。部分人基于利益的驅(qū)使,可能會借助ChatGPT的便利實(shí)施版權(quán)侵權(quán)行為并加大版權(quán)侵權(quán)力度。
第一,生成式人工智能在學(xué)習(xí)階段可能存在數(shù)據(jù)侵權(quán)風(fēng)險(xiǎn)。ChatGPT作為生成式人工智能,在進(jìn)行創(chuàng)作之前,需要將已經(jīng)存在的大量作品通過一定形式轉(zhuǎn)化為人工智能可以識別的數(shù)據(jù),并將其導(dǎo)入生成式人工智能系統(tǒng)中,以此形成一個(gè)可供ChatGPT學(xué)習(xí)的巨大數(shù)據(jù)庫,經(jīng)過強(qiáng)化學(xué)習(xí)與微調(diào)訓(xùn)練,使ChatGPT自主生成具有獨(dú)創(chuàng)性的作品。由此可見,數(shù)據(jù)輸入是ChatGPT創(chuàng)作的前提。由于ChatGPT仍屬于算法黑箱,其所屬公司OpenAI并未向外公布ChatGPT創(chuàng)作使用的數(shù)據(jù)來源,訓(xùn)練的數(shù)據(jù)庫資源是否獲取他人的授權(quán)也存在合理懷疑。根據(jù)《中國人民共和國著作權(quán)法》(以下簡稱《著作權(quán)法》)規(guī)定,除合理使用、法定許可外,未經(jīng)過他人授權(quán)或者未支付相關(guān)費(fèi)用使用他人處于保護(hù)期內(nèi)的作品,構(gòu)成版權(quán)侵害行為。因此,ChatGPT在創(chuàng)作過程中獲取數(shù)據(jù)時(shí)可能遭遇版權(quán)侵權(quán)風(fēng)險(xiǎn),ChatGPT在人類指導(dǎo)下創(chuàng)作的作品可能一經(jīng)生成就背上版權(quán)侵權(quán)的“原罪”,這不僅影響其創(chuàng)作作品的傳播安全與效率,而且還會挫傷人工智能技術(shù)研發(fā)者的積極性,影響人工智能產(chǎn)業(yè)的發(fā)展。
第二,生成式人工智能在生成階段存在版權(quán)權(quán)屬爭議風(fēng)險(xiǎn)。相較于分析式人工智能,生成式人工智能的智能化程度更高,處理和分析數(shù)據(jù)的能力更強(qiáng),因此在運(yùn)算時(shí)對于版權(quán)的歸屬產(chǎn)生了爭議。ChatGPT創(chuàng)作作品的模式主要是挖掘人類日常交流的文本,并進(jìn)行統(tǒng)計(jì)分析,甚至在對已有的數(shù)據(jù)庫進(jìn)行爬取行為后組合得出全新的作品,因此這類作品中的“原創(chuàng)性”存在爭議,而這也是ChatGPT產(chǎn)生版權(quán)爭議的來源。ChatGPT的創(chuàng)作者中部分蘊(yùn)含了自然人的創(chuàng)作因素(思想、情感),在一定程度上符合作品構(gòu)成要件的要求,但對于這類由生成式人工智能創(chuàng)作的作品能否賦權(quán)尚存爭議,而且具體的賦權(quán)認(rèn)定標(biāo)準(zhǔn)也仍屬空白。如何理解作品的獨(dú)創(chuàng)性、對ChatGPT創(chuàng)作作品是否應(yīng)該賦權(quán)以及如何確定ChatGPT作品的版權(quán)歸屬者,是當(dāng)前亟需解決的版權(quán)問題。
三、生成式人工智能在學(xué)習(xí)階段中的數(shù)據(jù)挖掘風(fēng)險(xiǎn)及其合規(guī)處置
(一)ChatGPT存在數(shù)據(jù)挖掘風(fēng)險(xiǎn)
數(shù)據(jù)獲取與利用幾乎貫穿ChatGPT創(chuàng)作全過程。ChatGPT的認(rèn)知能力是在學(xué)習(xí)人類現(xiàn)有知識的基礎(chǔ)之上產(chǎn)生的,擁有海量的創(chuàng)作素材是ChatGPT進(jìn)行創(chuàng)作的前提,但與自然人作者創(chuàng)作不同的是,ChatGPT所需的創(chuàng)作素材是以數(shù)據(jù)集表現(xiàn)的數(shù)字化作品。因此,ChatGPT創(chuàng)作的第一步是訪問和獲取海量的知識和信息,進(jìn)行文本與數(shù)據(jù)挖掘,這也是數(shù)據(jù)輸入的過程,然后將這些內(nèi)容予以數(shù)字化并建立數(shù)據(jù)庫以供ChatGPT進(jìn)行學(xué)習(xí)。ChatGPT創(chuàng)作的第二步是深度學(xué)習(xí),即利用算法從數(shù)據(jù)庫中提取相關(guān)內(nèi)容并自動(dòng)構(gòu)建,然后通過自我優(yōu)化與分析處理,最終在輸出端得出結(jié)果。從創(chuàng)作的流程來看,ChatGPT創(chuàng)作利用數(shù)據(jù)可能存在以下幾種版權(quán)侵權(quán)風(fēng)險(xiǎn)。
第一,復(fù)制權(quán)侵權(quán)風(fēng)險(xiǎn)。從ChatGPT的運(yùn)作原理來看,ChatGPT在進(jìn)行深度自主學(xué)習(xí)之前,需要對知識與信息內(nèi)容進(jìn)行數(shù)字化處理,然后轉(zhuǎn)化為數(shù)據(jù)格式進(jìn)行儲存。ChatGPT主要通過以下兩種方式完成數(shù)字化處理:一是將非數(shù)字格式的知識與信息內(nèi)容(創(chuàng)作素材)轉(zhuǎn)化為人工智能可以閱讀的數(shù)字格式。例如,谷歌數(shù)字圖書館掃描各類圖書建立一個(gè)數(shù)據(jù)庫,其目的是讓人工智能進(jìn)行深度學(xué)習(xí)。二是對他人已經(jīng)轉(zhuǎn)化的數(shù)據(jù)格式,通過API等接口訪問和獲取相關(guān)數(shù)據(jù)。例如,李飛飛教授通過網(wǎng)絡(luò)爬蟲技術(shù)在互聯(lián)網(wǎng)上抓取各類圖片數(shù)以億計(jì),以此建立計(jì)算機(jī)圖像識別的圖片數(shù)據(jù)庫并免費(fèi)提供給有需要的科研人員使用。以上兩種方式均是在不改變內(nèi)容的情況下對作品進(jìn)行復(fù)制,并且會永久地存儲在ChatGPT自身系統(tǒng)中。根據(jù)《著作權(quán)法》第十條第(五)項(xiàng)規(guī)定,數(shù)字化復(fù)制行為涵蓋在復(fù)制權(quán)的范圍內(nèi)。從著作權(quán)法意義上來說,ChatGPT的數(shù)據(jù)挖掘行為屬于著作權(quán)法上的“復(fù)制”行為,該行為存在侵犯復(fù)制權(quán)的風(fēng)險(xiǎn)。若ChatGPT經(jīng)過創(chuàng)作過程最終輸出的內(nèi)容與其先前使用的作品相比存在實(shí)質(zhì)性相似,那么基于“接觸+實(shí)質(zhì)性相似”的版權(quán)侵權(quán)規(guī)則,可能會侵犯著作權(quán)法規(guī)定的復(fù)制權(quán)。
第二,改編權(quán)侵權(quán)風(fēng)險(xiǎn)。我國《著作權(quán)法》規(guī)定,改編權(quán)是指權(quán)利人有權(quán)許可他人改變作品,創(chuàng)作出具有獨(dú)創(chuàng)性的新作品的權(quán)利。以ChatGPT為代表的生成式人工智能在數(shù)據(jù)挖掘過程中需要對挖掘?qū)ο筮M(jìn)行智能識別以及轉(zhuǎn)碼,通過改變對象的表達(dá)形式,納入自身數(shù)據(jù)庫,成為新的創(chuàng)作研究樣本,為自身創(chuàng)作提供基礎(chǔ)。由此可見,轉(zhuǎn)碼行為與改編行為具有同質(zhì)性,數(shù)據(jù)挖掘行為有可能會侵犯著作權(quán)人的改編權(quán)。改編作品具體有兩個(gè)構(gòu)成要件,一是利用了原作品的表達(dá),二是進(jìn)行了再創(chuàng)作,具有獨(dú)創(chuàng)性,并且已經(jīng)形成新的作品。當(dāng)ChatGPT創(chuàng)作的內(nèi)容不同于數(shù)據(jù)庫內(nèi)的原作品,而是創(chuàng)作全新作品時(shí),符合版權(quán)法規(guī)定的鼓勵(lì)創(chuàng)新的立法目的,這當(dāng)然不會產(chǎn)生改編權(quán)侵權(quán)的風(fēng)險(xiǎn)。若ChatGPT生成內(nèi)容利用了數(shù)據(jù)庫內(nèi)原作品的基本表達(dá),即使該生成內(nèi)容具有獨(dú)創(chuàng)性,但ChatGPT利用該作品進(jìn)行創(chuàng)作時(shí)未獲得原作品著作權(quán)人許可并支付相應(yīng)報(bào)酬,此時(shí)也可能會構(gòu)成版權(quán)法上規(guī)定的改編權(quán)侵權(quán)行為。
第三,數(shù)據(jù)庫使用產(chǎn)生的侵權(quán)風(fēng)險(xiǎn)。針對不具有獨(dú)創(chuàng)性的數(shù)據(jù)庫,其保護(hù)方式在不同的國家規(guī)定也不盡相同。歐盟頒布的《數(shù)據(jù)庫保護(hù)指令》中規(guī)定了數(shù)據(jù)庫權(quán),即制作者有權(quán)禁止任何人通過任何方式抽取和再利用數(shù)據(jù)庫的全部或?qū)嵸|(zhì)性部分。所以,生成式人工智能未獲得權(quán)利人的授權(quán)或者無其他豁免事由,在某些國家和地區(qū)挖掘數(shù)據(jù)庫的行為也存在版權(quán)侵權(quán)風(fēng)險(xiǎn)。同時(shí),當(dāng)ChatGPT對數(shù)據(jù)挖掘分析結(jié)果通過網(wǎng)絡(luò)進(jìn)行傳播時(shí),還可能會侵犯原作品的信息網(wǎng)絡(luò)傳播權(quán)。
(二)將ChatGPT創(chuàng)作利用數(shù)據(jù)納入合理使用范圍
ChatGPT學(xué)習(xí)階段中關(guān)于訓(xùn)練數(shù)據(jù)獲取和使用的合法性問題,決定了ChatGPT等生成式人工智能創(chuàng)作等后續(xù)行為是否正當(dāng)。由于單個(gè)作品對ChatGPT生成內(nèi)容的貢獻(xiàn)極小,所以只有大批量、規(guī)模化地使用數(shù)據(jù)對于ChatGPT創(chuàng)作才有意義。因此,傳統(tǒng)授權(quán)許可模式難以滿足ChatGPT數(shù)據(jù)規(guī)?;梅绞降男枨?,要求ChatGPT使用者為了實(shí)施創(chuàng)作向不同的作者獲得對不同作品的許可幾乎無法實(shí)現(xiàn)。采用法定許可制度解決ChatGPT創(chuàng)作使用數(shù)據(jù)作品問題將會面臨巨額使用費(fèi)問題,投資者可能會因?yàn)橘Y金不足而不得不放棄對人工智能創(chuàng)作相關(guān)技術(shù)的研發(fā)與更迭,或者部分企業(yè)、個(gè)人可能因降低經(jīng)營成本、追求高經(jīng)濟(jì)效益而不顧版權(quán)法的規(guī)定仍然使用他人作品,這不僅不能避免版權(quán)侵權(quán)行為的發(fā)生,反而加劇了該行為的產(chǎn)生。美國學(xué)者戈登認(rèn)為著作權(quán)使用規(guī)則配置數(shù)據(jù)資源可能是實(shí)現(xiàn)社會公共利益最大化的最佳選擇。所以,歐美發(fā)達(dá)國家為了順應(yīng)人工智能時(shí)代的新發(fā)展,率先通過成文法或者判例法的形式規(guī)定了相關(guān)領(lǐng)域數(shù)據(jù)挖掘行為的版權(quán)例外,但是考慮到不同國家的國情,對該例外規(guī)定的適用范圍以及合理使用條件均存在差異。
美國采取“轉(zhuǎn)換性使用例外”模式。美國通過判例法的方式引入“轉(zhuǎn)換性使用”理論,將文本數(shù)據(jù)挖掘行為納入合理使用范圍。根據(jù)“轉(zhuǎn)化性使用”理論,當(dāng)使用者對作品進(jìn)行利用時(shí)采用了不同的表達(dá)方式,或者表達(dá)出了新意義,又或者在新作品中闡釋了新功能,那么均可認(rèn)為是對原作品的轉(zhuǎn)化性使用,屬于合理使用行為。在“作家協(xié)會訴Google”案件中,法院認(rèn)為具有商業(yè)利益不能成為構(gòu)成否定合理使用的絕對標(biāo)準(zhǔn),“Google Books項(xiàng)目”具有轉(zhuǎn)化性目的,屬于合理使用。在“作家協(xié)會訴Hathitrust圖書館”案件中,初審法院以及第二巡回法院均認(rèn)為Hathitrust圖書館所提供的檢索服務(wù)是一種衍生出的學(xué)術(shù)研究方法與路徑,屬于一種新功能,因此具有較強(qiáng)的“轉(zhuǎn)化性目的”。通過以上案例不難發(fā)現(xiàn),美國法院對“轉(zhuǎn)化性使用”理論采取了寬泛解讀的全面適用,以適應(yīng)生成式人工智能時(shí)代的發(fā)展需要。
日本采取“計(jì)算機(jī)分析例外”模式。日本著作權(quán)法在2018年修訂時(shí),將“提供新的知識和信息”規(guī)定為使用他人作品進(jìn)行創(chuàng)作的目的。日本立法者借鑒了美國關(guān)于數(shù)據(jù)挖掘行為規(guī)定的“轉(zhuǎn)換性使用”理論,對于正在進(jìn)行人工智能研究的開發(fā)者,可以準(zhǔn)許其合理地復(fù)制他人的作品并且有權(quán)利就此作品的具體內(nèi)容向公眾公開使用。同時(shí),日本著作權(quán)法彈性規(guī)定了科研領(lǐng)域特別是商業(yè)領(lǐng)域?qū)ψ髌返臄?shù)字化使用,不以商業(yè)性目的與否作為判斷標(biāo)準(zhǔn)。日本對于企業(yè)使用數(shù)據(jù)的規(guī)定,不僅擴(kuò)大了計(jì)算機(jī)信息分析范疇,還適應(yīng)了關(guān)于人工智能產(chǎn)業(yè)的發(fā)展趨勢。
歐盟采取“科研目的例外”模式。2016年歐盟《數(shù)字化單一市場版權(quán)指令》草案中規(guī)定了社會公共機(jī)構(gòu)以及科研組織文本數(shù)據(jù)挖掘的著作權(quán)例外。從適用主體的規(guī)定可以發(fā)現(xiàn),該例外主要適用于非商業(yè)性目的(主要用于科研目的)。2019年歐盟出臺的《單一數(shù)字市場版權(quán)指令》中,將私人主體規(guī)定為著作權(quán)例外的另一適用主體,由此擴(kuò)大了版權(quán)例外規(guī)定的主體適用范圍。此規(guī)定是一種“有限開放”條款,當(dāng)作品的權(quán)利主體沒有以明確方式保留自身權(quán)利內(nèi)容的使用,使用者則默認(rèn)可以對合法獲取的內(nèi)容進(jìn)行復(fù)制,用于非科研目的的文本數(shù)據(jù)分析,更好地鼓勵(lì)私人企業(yè)進(jìn)行創(chuàng)新。
為適應(yīng)生成式人工智能的發(fā)展,我國《著作權(quán)法》應(yīng)對數(shù)據(jù)挖掘行為這一問題做出回應(yīng)。我國《著作權(quán)法實(shí)施條例》第21條規(guī)定了“三步檢測法”的判斷順序①,但是我國司法機(jī)關(guān)在運(yùn)用此規(guī)則時(shí)只是將其作為輔助性的考慮因素。當(dāng)出現(xiàn)《著作權(quán)法》規(guī)定法定情形之外的情況時(shí),則很難運(yùn)用該規(guī)則。針對數(shù)據(jù)挖掘行為,我國現(xiàn)行《著作權(quán)法》并沒有將其納入合理使用情形之一,對于合理性使用的認(rèn)定存在爭議。生成式人工智能創(chuàng)作離不開數(shù)據(jù)的支持,數(shù)據(jù)質(zhì)量的優(yōu)劣決定了人工智能創(chuàng)作成果質(zhì)量的高低。人工智能企業(yè)在不能獲得作品著作權(quán)人的授權(quán)情況下,為了避免侵權(quán)糾紛,往往選擇公共領(lǐng)域的作品來進(jìn)行人工智能的學(xué)習(xí),由于公共領(lǐng)域的作品質(zhì)量參差不齊,人工智能輸出的內(nèi)容不僅存在同質(zhì)化和低質(zhì)化的現(xiàn)象,還導(dǎo)致輸出作品存在隱形的偏見。筆者認(rèn)為,我國應(yīng)在引入“三步檢測法”之外,將人工智能創(chuàng)作利用數(shù)據(jù)納入我國著作權(quán)法規(guī)定的合理使用情形之一。考慮到一些大型互聯(lián)網(wǎng)企業(yè)進(jìn)行人工智能研究需要大量的數(shù)據(jù),我國對該項(xiàng)條款的適用主體不應(yīng)該僅限于大學(xué)、研究所等科研機(jī)構(gòu),此時(shí)不限定適用主體的做法更加符合我國的國情。此條款的增設(shè)不僅能解決生成式人工智能作品輸入階段的難題,擴(kuò)大學(xué)習(xí)數(shù)據(jù)的范圍,還能化解作品利用侵權(quán)風(fēng)險(xiǎn)、避免算法隱形偏見,收獲更加優(yōu)質(zhì)的人工智能作品,從而推動(dòng)人工智能產(chǎn)業(yè)的發(fā)展。
四、生成式人工智能在生成階段中的權(quán)屬爭議風(fēng)險(xiǎn)及其化解路徑
(一)ChatGPT生成內(nèi)容的版權(quán)權(quán)屬爭議風(fēng)險(xiǎn)及其可版權(quán)性證成
1.版權(quán)權(quán)屬爭議風(fēng)險(xiǎn)
關(guān)于ChatGPT生成內(nèi)容是否屬于我國《著作權(quán)法》規(guī)定的“作品”存在爭議,學(xué)術(shù)界觀點(diǎn)不一。人工智能版權(quán)否定者認(rèn)為,人工智能生成內(nèi)容不能認(rèn)定為版權(quán)法意義上的作品。有學(xué)者認(rèn)為作品應(yīng)當(dāng)是作者人格精神的彰顯,ChatGPT生成內(nèi)容只是具備人類作品的形式要件,而在創(chuàng)作過程中缺乏主體意識,不具有內(nèi)在人格基礎(chǔ),因此不符合作品的構(gòu)成要件(李俊,2019)。還有學(xué)者認(rèn)為它們只是數(shù)據(jù)算法的結(jié)果,不具有智力財(cái)產(chǎn)的屬性,無法成為版權(quán)的客體,應(yīng)當(dāng)歸屬于公有領(lǐng)域(曹博,2019)。人工智能版權(quán)肯定者認(rèn)為,人工智能生成內(nèi)容屬于著作權(quán)法上規(guī)定的版權(quán)作品。他們認(rèn)為ChatGPT輸出內(nèi)容是按照其設(shè)計(jì)者意志創(chuàng)作的產(chǎn)物,人類充分參與了ChatGPT內(nèi)在的算法創(chuàng)作,因而具備作品的人格要素。而關(guān)于ChatGPT生成作品獨(dú)創(chuàng)性的認(rèn)定,主要是根據(jù)已經(jīng)生成的表達(dá)結(jié)果進(jìn)行推定。ChatGPT曾模仿某位小說作家的寫作風(fēng)格創(chuàng)作新作品,這使得機(jī)器算法創(chuàng)作與人類獨(dú)立思考之間的邊界模糊不清。在技術(shù)迭代升級的背景下,理論必因社會發(fā)展變化而更新。ChatGPT生成內(nèi)容是否屬于作品以及版權(quán)權(quán)利如何歸屬,成為現(xiàn)階段亟需解決的難題。
2.可版權(quán)性證成
人類作者創(chuàng)作作品過程主要分為思想內(nèi)容和思想表達(dá)兩個(gè)方面,思想內(nèi)容主要集中存儲在作者的腦海里,而思想表達(dá)則是作品的最終完成形態(tài),如文學(xué)作品、繪畫作品等。ChatGPT創(chuàng)作作品過程中數(shù)據(jù)的挖掘與深度學(xué)習(xí),屬于作品的思想內(nèi)容方面;而ChatGPT在生成階段輸出的結(jié)果,則屬于作品的思想表達(dá)方面。ChatGPT創(chuàng)作作品的過程不是“無限猴子定理”①的隨機(jī)計(jì)算,也不同于早期人工智能“輸入不同的數(shù)據(jù)得出相同的結(jié)果”的機(jī)械計(jì)算??梢哉f,ChatGPT創(chuàng)作與自然人創(chuàng)作具有異曲同工之妙,從內(nèi)容構(gòu)思到作品創(chuàng)作的過程本質(zhì)相同。版權(quán)法所保護(hù)的作品,需要滿足獨(dú)創(chuàng)性與可復(fù)制性兩個(gè)基礎(chǔ)要件,學(xué)界對ChatGPT作品可復(fù)制性的認(rèn)同基本一致,但對于獨(dú)創(chuàng)性存在分歧。筆者認(rèn)為,“算法創(chuàng)作”生成內(nèi)容不是一種技術(shù)上的機(jī)械反映,而是一定思想內(nèi)容的表達(dá)。ChatGPT創(chuàng)作的內(nèi)容只要符合獨(dú)創(chuàng)性的條件,則具備“可版權(quán)性”的要求。獨(dú)創(chuàng)性主要從思想表現(xiàn)形式與人格主義要素兩個(gè)方面為著手點(diǎn)進(jìn)行認(rèn)定。
第一,ChatGPT能夠做出獨(dú)立表達(dá)。一方面,類腦技術(shù)的改造升級推動(dòng)生成式人工智能可以進(jìn)行類人化行為,如ChatGPT能夠發(fā)現(xiàn)輸入端的內(nèi)容與自身數(shù)據(jù)庫內(nèi)資源之間的關(guān)聯(lián)性,自行選擇所需素材,通過深度學(xué)習(xí),進(jìn)而突破設(shè)計(jì)者既定的算法預(yù)設(shè)而輸出符合使用者需求的內(nèi)容。另一方面,即使算法程序完全相同,而供深度學(xué)習(xí)的數(shù)據(jù)不同,則會做出不同的獨(dú)立表達(dá),生成符合人類偏好的作品。
第二,ChatGPT生成內(nèi)容具有人格主義要素。ChatGPT生成內(nèi)容離不開人類的指導(dǎo),其接收端必然需要人類意志的參與。在ChatGPT學(xué)習(xí)階段,研究人員需要對輸入數(shù)據(jù)按照一定的價(jià)值評判標(biāo)準(zhǔn)進(jìn)行取舍,然后按照符合人類思想表達(dá)的方式對ChatGPT輸出的內(nèi)容進(jìn)行微調(diào)訓(xùn)練。在ChatGPT訓(xùn)練過程中,研究人員通過植入代碼的方式將人類的取舍標(biāo)準(zhǔn)植入其中。ChatGPT按照一定的算法規(guī)則,經(jīng)過循環(huán)往復(fù)的自我訓(xùn)練,從海量數(shù)據(jù)中分析數(shù)據(jù)之間的關(guān)聯(lián)性,提煉最準(zhǔn)確的內(nèi)容與表達(dá)方式,完成人類所需的目標(biāo)。這都體現(xiàn)了ChatGPT創(chuàng)作的人格主義要素,也滿足《人工智能生成物的版權(quán)問題決議》中的規(guī)定。正如劉艷紅教授(2023)所說“算法模型內(nèi)部也存在“人工標(biāo)準(zhǔn)”所附隨的個(gè)人意志,具有一定的可解釋性,因此其生成物具有創(chuàng)新性與獨(dú)創(chuàng)性,滿足賦予其知識產(chǎn)權(quán)的實(shí)質(zhì)要求。
(二)明確ChatGPT生成內(nèi)容的權(quán)利歸屬
1.建立“作者—著作權(quán)人”二元權(quán)利主體結(jié)構(gòu)
生成式人工智能雖然基于深度學(xué)習(xí)而生成具有作品外觀的思想表達(dá),這似為某種意義上的創(chuàng)作,由于其沒有意志能力和獨(dú)立的責(zé)任能力,根據(jù)我國現(xiàn)行《著作權(quán)法》規(guī)定是無法獲得主體資格的。主體資格的取得與是否具有行為能力和責(zé)任能力息息相關(guān)。在我國《著作權(quán)法》當(dāng)中,主體資格僅為自然人作者與法人作者,前者基于事實(shí)行為而取得,后者基于法律的擬制而取得。因此,筆者認(rèn)為,需要對生成式人工智能創(chuàng)作提出新的構(gòu)想,區(qū)分創(chuàng)作主體資格與權(quán)利主體資格。
在我國《著作權(quán)法》中,合作作品通常是兩個(gè)以上的人共同合作創(chuàng)作的作品,合作者之間不僅有創(chuàng)作的合意,還有共同的創(chuàng)作行為。ChatGPT生成作品本質(zhì)上是“機(jī)器作者”與人類作者(ChatGPT的開發(fā)者或使用者)合作創(chuàng)作的作品,是生成式人工智能時(shí)代合作作品的特殊類型。首先,對于人工智能與人類共同創(chuàng)作的作品,應(yīng)確立“機(jī)器作者”與人類作者的二元?jiǎng)?chuàng)作主體結(jié)構(gòu),前者是基于人工智能創(chuàng)作事實(shí)而“視為”作者;后者是基于法律規(guī)定而當(dāng)然成為作者。主要有以下兩個(gè)方面的原因:一是ChatGPT基于深度學(xué)習(xí)能力自行分析數(shù)據(jù),然后脫離限定的算法預(yù)設(shè),輸出符合人類需求的內(nèi)容,這是“人工智能作者”類人化的智力創(chuàng)作;二是ChatGPT的使用者進(jìn)行數(shù)據(jù)輸入,對結(jié)果輸入設(shè)立特定的要求,這是生成作品的決定性因素。ChatGPT整個(gè)運(yùn)行過程都體現(xiàn)了使用者參與的創(chuàng)作意志,所以這應(yīng)當(dāng)認(rèn)定為自然人作者與生成式人工智能作者所完成的合作作品。其次,對人工智能與人類共同完成的作品,應(yīng)建構(gòu)“作者—著作權(quán)人”二元權(quán)利主體結(jié)構(gòu)。由于人工智能作者不能像自然人作者一樣去擁有并行使權(quán)利、履行義務(wù),對行為的后果承擔(dān)責(zé)任,筆者建議將作者與著作權(quán)人相區(qū)別,將人工智能“視為”作者,
五、結(jié)語
ChatGPT的誕生拉開了強(qiáng)人工智能時(shí)代的序幕。人類在享受ChatGPT帶來便利生活的同時(shí),也應(yīng)正視人工智能進(jìn)步背后潛在的法律風(fēng)險(xiǎn),并研究相應(yīng)對策,使人工智能可以更好地為人類服務(wù)。人類通過深入了解生成式人工智能的工作機(jī)理以及充分利用其特有的優(yōu)勢,通過人機(jī)協(xié)作充分展現(xiàn)人類智力成果,真正實(shí)現(xiàn)為民所用。本文主要闡述以ChatGPT為代表的生成式人工智能存在的版權(quán)風(fēng)險(xiǎn)以及化解路徑,以ChatGPT的運(yùn)作原理為起點(diǎn),剖析其運(yùn)作過程中可能存在的版權(quán)風(fēng)險(xiǎn),如數(shù)據(jù)挖掘風(fēng)險(xiǎn)以及ChatGPT生成內(nèi)容的版權(quán)權(quán)屬爭議風(fēng)險(xiǎn)。數(shù)據(jù)輸入是ChatGPT創(chuàng)作的前提,未經(jīng)過他人授權(quán)或者未支付相關(guān)費(fèi)用使用他人處于保護(hù)期內(nèi)的作品,可能構(gòu)成版權(quán)侵害行為。為此,我國可以參照國外確立文本數(shù)據(jù)挖掘的版權(quán)例外規(guī)定,將生成式人工智能創(chuàng)作利用數(shù)據(jù)納入合理使用范圍。生成式人工智能承擔(dān)著部分的創(chuàng)作性工作,不能簡單地將其認(rèn)定為人類創(chuàng)作作品的輔助性工具。面對ChatGPT生成內(nèi)容的版權(quán)權(quán)屬爭議風(fēng)險(xiǎn),基于ChatGPT思想表現(xiàn)形式與人格主義要素兩個(gè)方面的論證,我國應(yīng)承認(rèn)ChatGPT生成內(nèi)容的可版權(quán)性。由于我國現(xiàn)行著作權(quán)法并未規(guī)定人工智能的創(chuàng)作主體資格,以及生成式人工智能不具有我國民事理論上的意志能力、行為能力以及責(zé)任能力,所以生成式人工智能不易獲得著作權(quán)人的法律地位。對此,建議建構(gòu)“作者—著作權(quán)人”二元權(quán)利主體結(jié)構(gòu),明確生成作品著作權(quán)歸屬于ChatGPT使用者,平衡參與創(chuàng)作各主體之間的利益。
(責(zé)任編輯:夏凡)
參考文獻(xiàn):
[1]蒲清平,向往.生成式人工智能——ChatGPT的變革影響、風(fēng)險(xiǎn)挑戰(zhàn)及應(yīng)對策略[J].重慶大學(xué)學(xué)報(bào)(社會科學(xué)版),2023,29(3):102-114.
[2]令小雄,王鼎民,袁健.ChatGPT爆火后關(guān)于科技倫理及學(xué)術(shù)倫理的冷思考[J].新疆師范大學(xué)學(xué)報(bào)(哲學(xué)社會科學(xué)版),2023,44(4):123-136.
[3]朱光輝,王喜文.ChatGPT的運(yùn)行模式、關(guān)鍵技術(shù)及未來圖景[J].新疆師范大學(xué)學(xué)報(bào)(哲學(xué)社會科學(xué)版),2023(4):113-122.
[4]謝永江,楊永興.ChatGPT法律風(fēng)險(xiǎn)及其規(guī)制[J/OL].南京郵電大學(xué)學(xué)報(bào)(社會科學(xué)版):1-9[2023-09-04].DOI:10.14132/j.cnki.nysk.20230601.005.
[5]焦和平.人工智能創(chuàng)作中數(shù)據(jù)獲取與利用的著作權(quán)風(fēng)險(xiǎn)及化解路徑[J].當(dāng)代法學(xué),2022(4):128-140.
[6]鄧建鵬,朱懌成.ChatGPT模型的法律風(fēng)險(xiǎn)及應(yīng)對之策[J].新疆師范大學(xué)學(xué)報(bào)(哲學(xué)社會科學(xué)版),2023(5):91-101+2.
[7]韓丹東,王意天.ChatGPT火爆背后有何法律風(fēng)險(xiǎn)?[N].法治日報(bào),2023-02-13.
[8]方卿,丁靖佳.人工智能生成內(nèi)容(AIGC)的三個(gè)出版學(xué)議題[J].出版科學(xué),2023(2):5-10.
[9]張金平.人工智能作品合理使用困境及其解決[J].環(huán)球法律評論,2019(3):120-132.
[10]吳漢東.人工智能生成作品的著作權(quán)法之問[J].中外法學(xué),2020(3):653-673.
[11]吳高,黃曉斌.人工智能時(shí)代文本與數(shù)據(jù)挖掘合理使用規(guī)則設(shè)計(jì)研究[J].圖書情報(bào)工作,2021(22):3-13.
[12]董凡,關(guān)永紅.論文本與數(shù)字挖掘技術(shù)應(yīng)用的版權(quán)例外規(guī)則構(gòu)建[J].河北法學(xué),2019(9):148-160.
[13]Wendy J Gordon.Fair Use as Market Failure:A Structural and Economic Analysis of the Betamax Case and its Predecessors[J].Columbia Law Review,1982,1600:1675-58.
[14]Casetext.Authors Guild v.Google, Inc.[EB/OL].[2015-10-16].https://casetext.com/case/guild-v-google-inc-1.
[15]楊和義.日本知識產(chǎn)權(quán)法[M].北京:北京大學(xué)出版社,2014.
[16]李俊.論人工智能生成內(nèi)容的著作權(quán)法保護(hù)[J].甘肅政法學(xué)院學(xué)報(bào),2019(4):77-85.
[17]曹博.人工智能生成物的智力財(cái)產(chǎn)屬性辨析[J].比較法研究,2019(4):138-150.
[18]孫山.人工智能生成內(nèi)容著作權(quán)法保護(hù)的困境與出路[J].知識產(chǎn)權(quán),2018(11):60-65.
[19]熊琦.人工智能生成內(nèi)容的著作權(quán)認(rèn)定[J].知識產(chǎn)權(quán),2017(3):3-8.
[20]周佑勇.中國行政法學(xué)學(xué)術(shù)體系的構(gòu)造[J].中國社會科學(xué),2022(5):103-121+206-207.
[21]郭萬明.人工智能生成成果的法律性質(zhì)及著作權(quán)保護(hù)[J].出版發(fā)行研究,2022(5):58-64.
[22]梅傲,鄭宇豪.人工智能作品的困境及求解——以人工智能寫作領(lǐng)域第一案為考察中心[J].出版發(fā)行研究,2020(12):50-56.
[23]劉艷紅.生成式人工智能的三大安全風(fēng)險(xiǎn)及法律規(guī)制——以ChatGPT為例[J].東方法學(xué),2023(4):29-43.
[24]孟磊,段妍宇,李華.人工智能創(chuàng)作物版權(quán)保護(hù)機(jī)制研究[J].牡丹江大學(xué)學(xué)報(bào),2023(3):39-46.
[25]Open AI.Sharing&publication-policy[EB/OL].[2022-11-14].https://openai.com/policies/sharing-publication-policy.
[26]Open AI.Terms of use[EB/OL].[2023-03-14].https://openai.com/policies/terms-of-use.
[27]蔡鎮(zhèn)疆,車宇璐.ChatGPT的法律人格認(rèn)定與生成內(nèi)容性質(zhì)探討[J/OL].新疆師范大學(xué)學(xué)報(bào)(哲學(xué)社會科學(xué)版):1-8[2023-09-04].DOI:10.14100/j.cnki.65-1039/g4.20230628.001.
①三步檢測法:具體來說,首先判斷版權(quán)作品利用情形是否屬于《著作權(quán)法》規(guī)定的12種法定合理使用情形之一,其次作品的利用不得影響作品的正常使用,最后不得以不合理方式損害作品著作權(quán)人的合法利益。
①無限猴子定理:有無限只猴子用無限的時(shí)間會產(chǎn)生特定的文章。實(shí)際上并不需要出現(xiàn)兩個(gè)無限的事物,一只猴子打字無限次已經(jīng)足夠打出任何文章,而無限只猴子則能即時(shí)產(chǎn)生所有可能的文章。博雷爾原意強(qiáng)調(diào)有些物理事件雖然就統(tǒng)計(jì)上來說,發(fā)生的機(jī)率并非等于零。