周若瑋
(安徽大學法學院,安徽 合肥 230601)
技術的發(fā)展創(chuàng)造了全新的領域,人工智能技術已經(jīng)成為當前炙手可熱的研究方向,在社會生活的各個方面也隨處可見人工智能的影子。在科學與文化領域,人工智能生成內容在互聯(lián)網(wǎng)中大量出現(xiàn),“微軟小冰”的詩集《陽光失了玻璃窗》也已出版。人工智能生成內容以及該內容生成過程中涉及的著作權問題仍有待探討。
人工智能(Artificial Intellegence,AI)就是讓計算機完成人類心智(Mind)能做的各種事情,其重點不在于計算機,而在于計算機所做出的行為。在大數(shù)據(jù)時代到來之前,人工智能的創(chuàng)作方式以“代碼定義”為主,設計者通過程序代碼在機器人的運行過程中模擬人類的思維方式或思維結構,人工智能機器僅僅是承載設計者思維過程的創(chuàng)作工具。隨著互聯(lián)網(wǎng)與大數(shù)據(jù)技術的不斷發(fā)展,“數(shù)據(jù)訓練”成為人工智能的主要創(chuàng)作方式。人工智能通過對數(shù)據(jù)庫內的海量數(shù)據(jù)進行統(tǒng)計分析形成與數(shù)據(jù)庫內所有數(shù)據(jù)所展現(xiàn)的人類思維方式近似的邏輯組合,其智能程度與數(shù)據(jù)庫容量和計算能力的提升成正比。此時計算機的創(chuàng)作不再一味追求理解人類創(chuàng)作中使用的元素的本意,而是通過提煉數(shù)據(jù)庫中出現(xiàn)的高頻率搭配并按照設定的數(shù)據(jù)模型生成人類可以閱讀、理解的內容。數(shù)據(jù)訓練的基礎是機器學習,由數(shù)據(jù)輸入、機器學習與結果輸出三個階段構成。
人工智能生成內容能否取得突破性的進展,關鍵在于訓練數(shù)據(jù)的完備性,數(shù)據(jù)輸入是人工智能進行內容生成的重要基礎。由于數(shù)據(jù)庫的規(guī)模會對人工智能的“智能”產(chǎn)生直接影響,開發(fā)者或設計者往往在人工智能系統(tǒng)或實體的訓練環(huán)節(jié)為其尋找盡可能多的訓練數(shù)據(jù)。然而,訓練數(shù)據(jù)作為以計算機可讀形式呈現(xiàn)的知識和信息,難免會包括受著作權法保護的作品,對作品進行數(shù)字化處理并形成集合輸入智能系統(tǒng)的行為是對文本數(shù)據(jù)進行挖掘,在本質上即是一種對作品的復制行為。[1]在著作權法上,缺乏著作權人授權而對作品進行復制的行為可能是合法使用,也可能構成侵權使用。
在人工智能的開發(fā)過程中,訓練數(shù)據(jù)的著作權問題不可回避。機器對數(shù)據(jù)的獲取與人類讀者的閱讀行為具有一定的相似性,是“機器讀者”的一種數(shù)據(jù)輸入行為;但“機器讀者”批量閱讀的閱讀數(shù)量和閱讀速度遠遠超過人類讀者,其閱讀目的與作品本身的藝術價值和表達價值并無關聯(lián),而是為了提煉常見的詞語搭配和句式關系并形成元素合輯以便依據(jù)指令按照既定模式生成新的內容,與人類讀者通過閱讀獲得文學藝術滋養(yǎng)、學習思想觀點、與作者進行交流的閱讀目的存在明顯差異。一旦獲取訓練數(shù)據(jù)的成本變得高昂,人工智能設計者將傾向于更多地使用已處于公共領域的不再受著作權保護的材料用于人工智能系統(tǒng)或實體的訓練。由于著作權法對自然人作品的保護時限為終身加身故后五十年,對法人或非法人組織作品、著作權由法人或非法人組織享有的特殊職務作品、視聽作品的保護時限也從作品首次發(fā)表時開始計算長達五十年,①因此處于公共領域的材料往往已經(jīng)不符合社會發(fā)展的現(xiàn)狀,具有嚴重的時代偏見性和滯后性,以此類作品作為訓練數(shù)據(jù)缺乏全面性與客觀性,難以實現(xiàn)人工智能所要達成的科研目的。
在當前的著作權法框架下,意圖解決人工智能訓練數(shù)據(jù)引起的版權爭議存在多種方式。有學者認為,可以采取“選擇退出”(opt-out)模式。傳統(tǒng)著作權法模式采用的是“選擇加入”(opt-in)模式,除法律規(guī)定的特別情形外,若要利用他人的作品則必須取得著作權人的許可,否則將構成侵權行為?!斑x擇退出”模式則是將作品置于統(tǒng)一的“作品市場”之中,在法律規(guī)定的特殊情形下,作品的使用者從“市場”中選用作品并支付合理報酬即為合法,除非著作權人明確表示拒絕授權,即退出該“作品市場”,使用者應當停止對該作品的利用行為[2]英國則采用了“有條件例外”模式,將數(shù)據(jù)挖掘行為作為版權侵權的例外情形,并將數(shù)據(jù)挖掘行為嚴格限定在非商業(yè)使用的范圍內。②美國和日本采用“無條件例外”模式,使用者對現(xiàn)有作品進行數(shù)據(jù)挖掘屬于合理使用,是否為商業(yè)目的在所不問。其中美國以“轉換性使用”作為裁判基礎,通過判例法將文本數(shù)據(jù)存儲、挖掘納入合理使用一般條款的范圍之內。日本則采取列舉方式擴張了對作品合理使用的范圍,將信息處理行為納入侵權例外,但信息處理行為應當限于對作品的輕微利用,且不得不合理地損害著作權人的利益。③歐盟也采取了類似的方式,一方面將文本數(shù)據(jù)存儲、挖掘的著作權例外使用主體范圍擴展至具有商業(yè)意義的私人主體,另一方面有允許著作權人以明示的方式對將其作品用于非科研目的的文本數(shù)據(jù)分析表示拒絕。④最后,也有學者主張采用“法定許可”模式,即由法律明文規(guī)定允許人工智能的開發(fā)者或設計者無需事先獲取著作權人的授權而直接使用他人享有著作權的作品,但需按照法律規(guī)定向著作權人支付合理報酬。[3]
訓練數(shù)據(jù)的輸入為人工智能實行“創(chuàng)作”的后續(xù)機器學習和結果輸出奠定了重要基礎,因此著作權法從制度設計上對其做出回應是必然之勢。若采用“選擇退出”模式或“有條件例外”模式,在人工智能開發(fā)和設計的過程中仍將面臨較大的授權阻力,目前看來“無條件例外”模式與“法定許可”模式更具有可行性。采取“法定許可”模式一方面可以簡化著作權作品的獲取環(huán)節(jié),另一方面可以有效保障著作權人的利益,但“機器閱讀”與人類閱讀仍然有本質上的差異,因此在支付合理費用時應當對這一事實情況予以考量。更為重要的一點在于,法定許可需要由法律進行明文規(guī)定,但這恰恰是立法的空白區(qū)域。若采取“合理使用”模式,我國可以效仿日本或歐合輸入智能系統(tǒng)的行為是對文本數(shù)據(jù)進行挖掘,在本質上即是一種對作品的復制行為盟的方式,將文本數(shù)據(jù)挖掘行為新增為合理使用的具體情形;亦或是參考美國的立法方式,在著作權法中增加合理使用情形的一般條款,同時在對合理使用的法定列舉中增加兜底條款以擴展該條款的適用范圍。我國新修訂的《著作權法》即對合理使用的條件作出了新的限制規(guī)定,并在法定列舉情形中增加兜底條款⑤,為文本數(shù)據(jù)挖掘行為預留出了充分的制度空間。
人工智能輸入內容的著作權問題得到合理解決并不意味著其生成的內容就必然具有可版權性,學界對于是否應當將人工智能生成內容作為著作權法上的作品予以保護仍然存有爭議。有學者主張,當前并不具備在著作權法體系中為人工智能生成內容尋求著作權或鄰接權客體地位的必要性與合理性。[4]著作權法的基本目標、作品的基本前提與特征均是對人工智能生成內容著作權法上的地位考察時不可或缺的必要標準,人類應當是著作權法意義上的作品的創(chuàng)作者,作品本身具有多樣性、價值型與稀缺性的特征。多數(shù)學者主張,人工智能生成內容是算法遵循設計者的思維和設計方式運行的產(chǎn)物,應當屬于著作權法上的作品[5];“算法創(chuàng)作”的各個環(huán)節(jié)中不可避免有人類的參與,也為人工智能生成內容帶來了充分的人格要素[6];作品的可版權性判斷應當以生成結果為準,其過程如何以及主體為誰在所不問[7]。還有學者提出,當今全球人工智能技術仍處于“弱人工智能”的狀態(tài),人工智能技術有限,還僅僅處于“創(chuàng)作工具”的地位,若該生成內容符合著作權法對作品的“獨創(chuàng)性”要求,就應當將其認定為人工智能使用者運用工具創(chuàng)作的作品;未來技術發(fā)展至“強人工智能”時代,人工智能有能力在完全獨立的情況下生成具有作品外觀的內容,即使如此在人工智能的創(chuàng)作中也難以避免人類人格要素的參與,這也意味著該生成內容可能涉及人類思想的表達,因此在“強人工智能”時代著作權法對該類人工智能生成內容也不能輕易地采取排斥立場。[2]
我國《著作權法實施條例》第2 條⑥明確規(guī)定了著作權法上的作品應當滿足的四個要件,人工智能生成內容從客觀上看,明顯符合“文學、藝術和科學領域”與“能夠以某種有形形式復制”的要求,因此判斷人工智能生成內容是否構成著作權法意義上的作品的關鍵之處即落在:生成內容是否具有“獨創(chuàng)性”以及是否具有“智力成果”屬性。
“獨”與“創(chuàng)”結合構成“獨創(chuàng)性”,“獨”是指獨立完成該成果,并非抄襲他人;“創(chuàng)”是要求生成內容至少表現(xiàn)出最低限度的智力水平。目前,針對“人工智能生成內容的獨創(chuàng)性存在與否”應當采取何種判斷方式,在學界存在兩種截然不同的觀點。觀點之一認為,獨創(chuàng)性判斷應當采用主觀主義標準,人工智能依據(jù)既定的規(guī)則生成目標內容的過程中并不具備創(chuàng)作主體應有的智力創(chuàng)作空間,對于相同的原始素材,其生成的內容是相同或類似的,不具有個性特征,因此不具有獨創(chuàng)性。觀點之二認為,采用客觀標準才是獨創(chuàng)性判斷的正確渠道,內容“如何產(chǎn)生”以及“由誰生成”并不構成影響內容獨創(chuàng)性的元素,應當站在受眾角度僅從內容本身出發(fā),對是否具有獨創(chuàng)性作出判斷。
對人工智能生成內容進行是否具有獨創(chuàng)性的甄別應當采取客觀標準。我國的著作權法體系對英美法系的版權體系和大陸法系的作者權體系報以兼收并蓄的態(tài)度,一方面注重作者與作品之間的聯(lián)系,在著作權體系中首先規(guī)定了四項重要的人身權利;另一方面維護著作權人的財產(chǎn)權利,從而保障權利人通過創(chuàng)作作品獲得利益的可能性,有效激發(fā)作者的創(chuàng)作欲望,從而實現(xiàn)著作權法促進社會文化和科學事業(yè)發(fā)展的基本目標⑦。若采取主觀主義視角,過于注重人工智能生成內容中的“人格要素”,極有可能造成對內容獨創(chuàng)性論證的機械化,即:欲證明該生成內容具有獨創(chuàng)性,就必須證明生成物來自于人,則需要證明內容的生成者具有“人”的主體資格。但基于人類中心主義的倫理基礎,人工智能無法具備“人”的主體資格。依據(jù)前述的機械化論證,人工智能生成內容永遠無法具備獨創(chuàng)性,著作權法始終不會對其予以保護。顯然,這一論證結果與人工智能生成內容著作權保護的現(xiàn)實必要性之間產(chǎn)生了嚴重的沖突。
對人工智能生成內容的獨創(chuàng)性判斷應當堅持“人工智能創(chuàng)作工具說”的前提。人類是具有認識能力和實踐能力的主體,具有理性與自主性,而人工智能的本質是物,可以被占有和利用,具有私人性和可占有性,因此賦予人工智能法律主體的地位使其享有權利和承擔義務并不具有現(xiàn)實意義。在弱人工智能時代,任何機器的正常運轉都依附于人類行為,人類的指令輸入是其運行行為的發(fā)生原因,解決人類所提出的問題是其運行行為的目標和結果。在作品創(chuàng)作方面,人工智能本身不具備創(chuàng)作作品的沖動和欲望,生成作品的風格和所依照的模板由開發(fā)者或使用者事先設定,不具備自主意識。對于人工智能生成內容而言,其獨創(chuàng)性的來源是人類而非機器。在人工智能的算法設計、數(shù)據(jù)糾偏、模板生成等各個環(huán)節(jié),人類均有相應的參與和控制行為,并借此方式將自己的獨創(chuàng)性意志融入到人工智能的生成內容之中。從這一角度來看,即使未來技術發(fā)展到強人工智能時代,人工智能的客體地位仍然不會發(fā)生改變,只能作為人類進行創(chuàng)作活動的工具而存在,因此對其生成內容獨創(chuàng)性的判斷不應當糾結于生成主體和生成過程,而應當專注于內容本身。
人工智能本身即為人類創(chuàng)造的智力成果,其依據(jù)人類的指令并模仿人類的思維生成的內容理應具有智力成果的屬性。人工智能雖然無法理解人類輸入的符號所代表的文化含義,但能夠依據(jù)這些符號創(chuàng)設的規(guī)則即人類的思維邏輯進行內容生成活動,其生成內容與人的智力成果在外觀上幾乎沒有差異,能夠被讀者準確理解,因此具有智力成果的屬性。
人工智能生成內容獲得的著作權法上的保護是人工智能產(chǎn)業(yè)發(fā)展所帶來的現(xiàn)實需求。以搜狐“智能報盤”、騰訊“Dream Writer”、新華社“快筆小新”以及Giiso 咨詢機器人為代表的人工智能數(shù)據(jù)分析和新聞采編機器層出不窮,其生成內容的速度和體量都是人類作者難以企及的。但由于人工智能生成內容需要依照事先設定的模式或依照其通過自學習形成的某種現(xiàn)有模式,因此人工智能生成內容始終桎梏于現(xiàn)下存儲的數(shù)據(jù)材料,無法像人類一樣實現(xiàn)對當今創(chuàng)作水準的突破。若大量的人工智能生成內容充斥市場并處于公共領域,使用者無需付出任何代價即可獲得,而人類的作品卻因受著作權保護造成了使用成本的高昂,從而被束之高閣。不可否認財產(chǎn)權利是人類作者進行創(chuàng)作的重要原因之一,當作者無法從作品的使用中獲取利益時,其創(chuàng)作欲望將會大大降低,此時文化市場將被大量創(chuàng)作水平“原地踏步”的人工智能生成內容占領,形成了“劣幣驅逐良幣”的不良局面,社會文化水平和科學事業(yè)發(fā)展將停滯不前。此外,明確界定財產(chǎn)權的邊界有利于提高經(jīng)濟效率,降低交易成本。根據(jù)“知識產(chǎn)權法定主義”,由于知識產(chǎn)權客體具有無形性的特征,導致其無法通過合法占有排除他人的非法占有,知識產(chǎn)權的權利內涵與外延均依賴法律擬制,著作權的行使與保護均以法律規(guī)定為前提。在著作權法的保護體系內為人工智能生成內容創(chuàng)設一席之地將有助于文化市場的運行與發(fā)展。
在一套成熟的權利體系中,權利的歸屬、義務的履行與責任的承擔是永恒不變的中心話題,若權利義務確實存在卻不明確其歸屬主體,無異于使該權力體系歸于空白。人工智能技術的發(fā)展對現(xiàn)有的法律制度造成了重大沖擊,歐盟甚至開始對是否應當賦予機器人以“電子人”法律地位的問題進行思考。本文認為,對于人工智能生成內容而言,人工智能本身僅僅是一種生成工具,無論是在“弱人工智能”時代還是“強人工智能”時代,甚至在未來可能存在的“超人工智能”時代,人工智能都無法擁有人類的自主意志,不具備行使權利的能力,沒有獨立的財產(chǎn),更遑論履行義務與承擔責任了。當人工智能的主體資格被全盤否定時,誰才是人工智能生成內容權利的歸屬、義務的履行與責任的承擔主體呢?
我國學者對于人工智能生成內容的權利歸屬從不同角度提出了多種學術觀點。有學者認為,人工智能生成內容構成著作權法上的作品,具有獨創(chuàng)性和必要的人格要素,在人機合作的情況下,“機器作者”與人類作者均對作品的產(chǎn)生做出了貢獻,可以按照法人作品或創(chuàng)作者約定對作品的著作權進行安排。[8]也有學者主張,在人工智能著作權時代,投資者的是促成作品生成的重要主體,各相關法律應當將投資者權益納入保護范圍。但由于投資者的對于作品生成的貢獻往往是“非創(chuàng)造性”的,因此對于人工智能生成內容的保護應當與人類作品的保護區(qū)別開來,即通過鄰接權對投資者利益予以保護。[9]還有學者主張,人工智能本身是客體,人工智能生成內容則是客體之客體,實際上即為一類知識產(chǎn)權客體的孳息,依據(jù)民法中孳息的所有權歸屬原則,可以認定人工智能的開發(fā)者、使用者或所有者作為著作權人。[10]
我國《著作權法》堅持“著作權屬于作者”的一般原則,自然人的作者地位來源于其創(chuàng)作作品的行為,法人或非法人組織則在特殊情況下可以被視為作者。⑨著作權法對作者權利的保護實際上是對作者在創(chuàng)作作品時所貢獻的創(chuàng)造性勞動進行保護,因此從原則上來看,對人工智能生成內容貢獻更多的創(chuàng)造性勞動的主體理應成為作者。英國早在上世紀九十年代就對計算機生成作品的著作權歸屬做出明文規(guī)定,著作權屬于“對該創(chuàng)作作品做出必要安排之人”。⑩“做出必要安排之人”的表述方式進一步印證了人工智能生成內容的著作權應當歸屬于在作品生成過程中做出實質性創(chuàng)作貢獻的人。人工智能在作品生成過程中所貢獻的是一種理性的計算能力,在當前的“弱人工智能”時期,人類指導、控制人工智能完成技術方案或生成智力成果,該成果本質上而言是人工智能開發(fā)者或使用者思維和意志的延伸。將人工智能生成內容劃分為不同類型,在個案中對人工智能開發(fā)者和使用者所投入的創(chuàng)造性勞動程度進行對比,貢獻更多的即為作者。例如,對于人工智能生成的文字作品,使用者所做出的貢獻可能僅在于輸入關鍵詞,最終的生成內容與作品風格取決于人工智能開發(fā)者在開發(fā)過程中進行的數(shù)據(jù)輸入和算法訓練,開發(fā)者的意志對文字作品的生成起到了決定性的作用;對于人工智能進行照片處理生成的美術作品,使用者貢獻了生成作品必不可少的基礎材料,開發(fā)者對于作品的貢獻則相對較小。
并非所有構成作品的人工智能生成內容都可以將人工智能開發(fā)者、使用者或其他參與者對其貢獻的創(chuàng)造性勞動大小進行對比和排序,針對難以區(qū)分何人投入的創(chuàng)造性勞動更大的人工智能生成內容,實現(xiàn)作品流通和利用效率的提高,對新興產(chǎn)業(yè)的發(fā)展予以保障和激勵,是進行著作權權利配置時應當考量的重要因素。本文認為,將該類作品的著作權賦予人工智能使用者比賦予其他主體更有效率。人工智能的本質是計算機軟件,是受著作權法保護的作品,即使人工智能生成內容的著作權未被配置給開發(fā)者,開發(fā)者也可以通過對計算機軟件作品的權利的行使得到利益回報。一方面,人工智能開發(fā)者可以與投資者簽訂委托協(xié)議或依據(jù)特殊職務作品、法人作品的制度規(guī)則從投資者獲取資金支持;另一方面,人工智能開發(fā)者將開發(fā)成果投入市場也能夠獲取可觀的許可費用收入和流量資金收入。人工智能使用者在作品的生成過程中也做出了貢獻,但卻沒有相應的權利保障,缺乏權利保障的使用者可能面臨其他有權主體“二次賦權”的風險。此外,人工智能產(chǎn)品的使用者眾多,將生成內容交由開發(fā)者管理需要消耗大量的財力資源,相比較而言,使用者對于自己在某事某地生成的某一特定內容進行管理將更為明晰,既能夠提高人工智能生成內容在文化市場中的利用效率,也能夠對人工智能產(chǎn)業(yè)的發(fā)展也將起到一定的激勵作用,有利于實現(xiàn)著作權法促進社會文化和科學事業(yè)發(fā)展的基本目標。
此外,由于人工智能的開發(fā)需要大量的資金投入,對于部分學者主張的“注重對人工智能投資者的權益保護”的觀點,著作權法本身從未忽視對投資者的權益保護,出于保護投資者所創(chuàng)設的委托作品制度、職務作品制度和法人作品制度在面對人工智能生成內容時的靈活適用足以充分保障投資者的利益。
隨著人工智能技術的發(fā)展,人工智能實現(xiàn)了新聞機器人自主采編新聞稿件,“微軟小冰”甚至出版了詩集,著作權法不可逃避地開始邁入“智能版權”時代。人工智能實施“創(chuàng)作”行為依賴于完備的數(shù)據(jù)輸入,在此過程中可能涉及對輸入的訓練數(shù)據(jù)造成著作權侵權的風險,我國新修訂的《著作權法》通過在合理使用的法定情形列舉中增設兜底條款,為將文本數(shù)據(jù)挖掘行為納入合理使用范圍預留了充分的空間,對這一問題做出有效回應。判斷人工智能生成內容的可版權性的應當采用客觀標準,從生成內容本身出發(fā),與生成主體和生成過程無關。人工智能生成內容的可版權性也為文化市場的運行與發(fā)展提供了制度保障。人工智能本身無法成為其生成內容的著作權主體,不具備行使權利、履行義務和承擔責任的能力。對人工智能生成內容權利歸屬的判斷應當堅持著作權法上“著作權屬于作者”的一般原則,對作品貢獻更多創(chuàng)造性勞動的人是作者;若難以區(qū)分創(chuàng)造性勞動的貢獻大小,應充分考慮著作權法的立法目標,將人工智能生成內容的著作權賦予更能鼓勵作品的創(chuàng)作與傳播、促進社會文化與科學事業(yè)發(fā)展的人工智能使用者。
人工智能技術的發(fā)展趨勢是不可阻擋的,對于新的科學技術,人類應當遵循著作權法的歷史軌跡,持有開放、包容的態(tài)度,沉著冷靜地應對科技帶來的挑戰(zhàn)。
注釋:
①《著作權法》第23 條。
②Copyright,Design and Patents Act 1988,29A: Copies for text and data analysis for non-commercial research.
③《著作権法》第四十七條の五:……著作権者の利益を不當に害……
④ Directive (EU)2019/790 of the European Parliament and of the Council of 17 April 2019 on copyright and related rights in the Digital Single Market and amending Directives 96/9/EC and 2001/29/EC.Art 3 Text and data mining for the purposes of scientific research,Art 4 Exception or limitation for text and data mining,Art 7 Common provisions.
⑤《著作權法》第24 條第1 款:在下列情況下使用作品,可以不經(jīng)著作權人許可,不向其支付報酬,但應當指明作者姓名或者名稱、作品名稱,并且不得影響該作品的正常使用,也不得不合理地損害著作權人的合法權益:……(十三)法律、行政法規(guī)規(guī)定的其他情形。
⑥《著作權法實施條例》第2 條:著作權法所稱作品,是指文學、藝術和科學領域內具有獨創(chuàng)性并能以某種有形形式復制的智力成果。
⑦《著作權法》第1 條。
⑧《著作權法》第11 條。
⑨Copyright,Design and Patents Act 1988,9(3): In the case of a literary,dramatic,musical or artistic work which is computergenerated,the author shall be taken to be the person by whom the arrangements necessary for the creation of the work are undertaken.