尹鋒林 趙旖鑫
摘? ? 要:20世紀(jì)30年代,法國(guó)科學(xué)家G.B.阿爾楚尼便提出用機(jī)器進(jìn)行翻譯的設(shè)想。近一個(gè)世紀(jì)以來(lái),機(jī)器翻譯實(shí)現(xiàn)了從規(guī)則驅(qū)動(dòng)到統(tǒng)計(jì)驅(qū)動(dòng),再到神經(jīng)網(wǎng)絡(luò)驅(qū)動(dòng)的技術(shù)進(jìn)步,人類目前可以較為準(zhǔn)確地實(shí)現(xiàn)外文作品的語(yǔ)言轉(zhuǎn)換,授權(quán)他人翻譯、出版以獲取經(jīng)濟(jì)回報(bào)這一翻譯權(quán)行使的基本模式因此面臨著重大挑戰(zhàn)。當(dāng)語(yǔ)言轉(zhuǎn)換非限于個(gè)人使用目的時(shí),智能翻譯機(jī)器的訓(xùn)練者、所有者可能面臨著承擔(dān)間接侵權(quán)責(zé)任之指控。同時(shí),智能翻譯機(jī)器的訓(xùn)練將會(huì)不可避免地使用現(xiàn)有作品,并可能會(huì)借鑒體現(xiàn)于其中的獨(dú)創(chuàng)性表達(dá),這一行為無(wú)法援引現(xiàn)行合理使用制度豁免之。從歷史經(jīng)驗(yàn)與利益平衡角度出發(fā),版權(quán)補(bǔ)償金制度的借鑒有利于在新技術(shù)的發(fā)展與著作權(quán)的保護(hù)間找尋微妙的平衡。
關(guān)鍵詞:人工智能;機(jī)器翻譯;深度學(xué)習(xí);著作權(quán);翻譯權(quán);翻譯作品
中圖分類號(hào):D 926 ? 文獻(xiàn)標(biāo)識(shí)碼:A? ? ? ? ? 文章編號(hào): 2096-9783(2021)03-0045-10
引? ?言
人工智能的發(fā)展總體表現(xiàn)為從機(jī)械學(xué)習(xí)(Mechanical Learning)到機(jī)器學(xué)習(xí)(Machine Learning)的進(jìn)步過(guò)程。機(jī)器翻譯伴隨現(xiàn)代信息處理技術(shù)而生,是計(jì)算機(jī)語(yǔ)言學(xué)下的一個(gè)重要分支[1],目前以神經(jīng)網(wǎng)絡(luò)技術(shù)的驅(qū)動(dòng)為主要發(fā)展方向。從規(guī)則驅(qū)動(dòng),到統(tǒng)計(jì)驅(qū)動(dòng),再到神經(jīng)網(wǎng)絡(luò)驅(qū)動(dòng)的機(jī)器翻譯,反映了深度學(xué)習(xí)算法對(duì)于人工智能技術(shù)的強(qiáng)大驅(qū)動(dòng)力。機(jī)器翻譯為作品開(kāi)辟了新的利用方式,然而這種新興的作品利用方式所帶來(lái)的利益授予給誰(shuí),在現(xiàn)行《著作權(quán)法》中卻尚無(wú)明確的答案。技術(shù)的進(jìn)步總會(huì)使權(quán)利人深陷于權(quán)利被侵犯的擔(dān)憂之中,這一問(wèn)題的消解依賴于技術(shù)趨勢(shì)的分析與權(quán)利脈絡(luò)的研究。作為《保護(hù)文學(xué)和藝術(shù)作品伯爾尼公約》所承認(rèn)的第一項(xiàng)權(quán)利,翻譯權(quán)是將作品從一種語(yǔ)言文字轉(zhuǎn)換成另一種語(yǔ)言文字的權(quán)利,作者因此可以自行翻譯或授權(quán)他人在原作品的基礎(chǔ)上創(chuàng)作演繹作品。
機(jī)器翻譯的發(fā)展給著作權(quán)制度帶來(lái)兩大挑戰(zhàn),分別體現(xiàn)于第一重的翻譯權(quán)與第二重的翻譯作品之上。作為機(jī)器翻譯的基礎(chǔ)——機(jī)器學(xué)習(xí)高度依賴于訓(xùn)練數(shù)據(jù)集,將含有作品在內(nèi)的數(shù)據(jù)集儲(chǔ)存于服務(wù)器、上傳到開(kāi)源平臺(tái)或?qū)⒎菙?shù)字形式展現(xiàn)的作品轉(zhuǎn)換為數(shù)字形式,并將之以非人類閱讀的方式供機(jī)器翻譯系統(tǒng)進(jìn)行學(xué)習(xí)和訓(xùn)練,這樣的行為是否構(gòu)成對(duì)翻譯作品或其原作品復(fù)制權(quán)、演繹權(quán)等權(quán)利的侵犯,是事關(guān)機(jī)器翻譯技術(shù)能否健康發(fā)展的重大問(wèn)題。同時(shí),機(jī)器翻譯的發(fā)展所催生的“個(gè)人翻譯”行為使得著作權(quán)人行使翻譯權(quán)的空間受到擠壓,如何平衡著作權(quán)人、機(jī)器翻譯系統(tǒng)開(kāi)發(fā)商、機(jī)器翻譯系統(tǒng)使用者之間的利益,亦是一個(gè)值得深入研究的問(wèn)題。立于著作權(quán)人、新技術(shù)培育者與社會(huì)公眾之間,《著作權(quán)法》將以何樣的回答消解上述困境?本文試對(duì)此問(wèn)題進(jìn)行分析和研究。
一、機(jī)器翻譯發(fā)展歷史
機(jī)器翻譯(Machine Translation)是指利用自然語(yǔ)言處理技術(shù),由機(jī)器將某一語(yǔ)言文本或語(yǔ)音轉(zhuǎn)換為另一語(yǔ)言文本或語(yǔ)音,進(jìn)而實(shí)現(xiàn)不同語(yǔ)種人群間交流的技術(shù)。不同于由翻譯記憶技術(shù)驅(qū)動(dòng)的計(jì)算機(jī)輔助翻譯技術(shù)(Computer aided translation),機(jī)器翻譯的目標(biāo)是由計(jì)算機(jī)獨(dú)立實(shí)現(xiàn)文本輸出任務(wù),其發(fā)展因而表現(xiàn)為從規(guī)則驅(qū)動(dòng),到統(tǒng)計(jì)驅(qū)動(dòng),再到神經(jīng)網(wǎng)絡(luò)驅(qū)動(dòng)的進(jìn)步過(guò)程。
(一)緣起:基于規(guī)則的機(jī)器翻譯
基于規(guī)則的機(jī)器翻譯(Rule-Based Machine Translation)的開(kāi)發(fā)高度依賴于規(guī)則庫(kù)與語(yǔ)言資料庫(kù)的建構(gòu)[2],其在20世紀(jì)90年代前引領(lǐng)著機(jī)器發(fā)展的主要研究方向。雙語(yǔ)語(yǔ)言學(xué)家需將已有的翻譯知識(shí)全部轉(zhuǎn)換為翻譯規(guī)則,然而,語(yǔ)言的翻譯規(guī)則是無(wú)法被窮盡的,面對(duì)海量的翻譯任務(wù),語(yǔ)言學(xué)家定義規(guī)則的難度越來(lái)越高,非恰當(dāng)定義的某個(gè)規(guī)則可能導(dǎo)致某一個(gè)或某幾個(gè)規(guī)則的變化?;谝?guī)則的機(jī)器翻譯因而呈現(xiàn)出開(kāi)發(fā)成本高、開(kāi)發(fā)周期長(zhǎng)的特點(diǎn),在面向具體場(chǎng)景應(yīng)用時(shí),該種翻譯技術(shù)常常會(huì)面臨“答非所問(wèn)”的窘境。
(二)進(jìn)步:統(tǒng)計(jì)機(jī)器翻譯
統(tǒng)計(jì)機(jī)器翻譯(Statistical Machine Translation)對(duì)機(jī)器翻譯進(jìn)行了數(shù)學(xué)建模,谷歌翻譯首席科學(xué)家 Franz Josef Och曾言:“基于統(tǒng)計(jì)的谷歌翻譯需要構(gòu)建非常大的語(yǔ)言模型,比人類歷史上任何人曾經(jīng)構(gòu)建的都要大。”[3]統(tǒng)計(jì)機(jī)器翻譯對(duì)于語(yǔ)料庫(kù)的讀取集中于模型建構(gòu)的前端而非處理翻譯任務(wù)的過(guò)程中,因?yàn)殡p語(yǔ)文本的轉(zhuǎn)換基于統(tǒng)計(jì)概率而非對(duì)于語(yǔ)料庫(kù)的機(jī)械依賴。
(三)發(fā)展:神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯
谷歌與蒙特利爾大學(xué)在2014年搭建出首個(gè)神經(jīng)網(wǎng)絡(luò)翻譯模型,2015年,百度上線了首個(gè)互聯(lián)網(wǎng)機(jī)器翻譯系統(tǒng),這標(biāo)志著機(jī)器翻譯步入新的發(fā)展階段,深度學(xué)習(xí)算法(Deep Learning Algorithm)實(shí)現(xiàn)廣泛應(yīng)用,而統(tǒng)計(jì)機(jī)器翻譯的地位迅速被取代。
神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯(Neural Machine Translation)通過(guò)算法模擬搭建人類大腦中的神經(jīng)元結(jié)構(gòu),通過(guò)“編碼——解碼”的過(guò)程實(shí)現(xiàn)計(jì)算機(jī)對(duì)于目標(biāo)語(yǔ)言的輸出,其核心在于擁有海量節(jié)點(diǎn)、具有自組織和自學(xué)習(xí)能力的深度神經(jīng)網(wǎng)絡(luò)可直接從數(shù)據(jù)中學(xué)習(xí),且能有效捕獲長(zhǎng)距離依賴[4]?;诖耍?jì)算機(jī)能夠自動(dòng)在海量語(yǔ)料中獲取語(yǔ)言特征與翻譯規(guī)則,機(jī)器翻譯因此逐漸克服了基于規(guī)則階段時(shí)窮盡翻譯規(guī)則之困境與統(tǒng)計(jì)階段時(shí)搭建龐大語(yǔ)料庫(kù)之所難。
(四)機(jī)器翻譯發(fā)展的趨勢(shì)與特征
從基于規(guī)則驅(qū)動(dòng)、到統(tǒng)計(jì)驅(qū)動(dòng)、再到神經(jīng)網(wǎng)絡(luò)驅(qū)動(dòng),機(jī)器翻譯的開(kāi)發(fā)周期不斷縮短,開(kāi)發(fā)成本逐漸降低,這一進(jìn)步反映了半個(gè)世紀(jì)以來(lái)深度學(xué)習(xí)算法在人工智能技術(shù)發(fā)展中所凸顯的強(qiáng)大作用。只要具備足夠復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)、難以想象的海量數(shù)據(jù)和高效的運(yùn)算力,深度學(xué)習(xí)便能充分發(fā)揮出其強(qiáng)大的數(shù)據(jù)擬合能力。根據(jù)面向場(chǎng)景的不同,可以將機(jī)器翻譯技術(shù)發(fā)展的趨勢(shì)與特征總結(jié)為以下兩點(diǎn):
第一,在簡(jiǎn)單任務(wù)中,機(jī)器翻譯的準(zhǔn)確度越來(lái)越高,人類角色在機(jī)器翻譯中的參與度越來(lái)越低。在機(jī)器翻譯的開(kāi)發(fā)過(guò)程中,人類角色的參與主要集中于訓(xùn)練階段。應(yīng)用無(wú)監(jiān)督學(xué)習(xí)(Unsupervised Learning)算法訓(xùn)練時(shí),算法工程師無(wú)需為數(shù)據(jù)“打標(biāo)簽”1,只需將相關(guān)語(yǔ)料轉(zhuǎn)換成低維向量[5],智能翻譯機(jī)器便可自動(dòng)識(shí)別特征、實(shí)現(xiàn)譯文輸出并將學(xué)習(xí)的經(jīng)驗(yàn)保存下來(lái)。通過(guò)給定輸入值與輸出值,智能翻譯機(jī)器可以擬合出某一函數(shù)表達(dá)式的系數(shù),而這組函數(shù)將成為神經(jīng)網(wǎng)絡(luò)里新的神經(jīng)元。因此,神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯模型得以被不斷訓(xùn)練,不斷學(xué)習(xí)新的規(guī)則。
目前,騰訊、百度等多家互聯(lián)網(wǎng)企業(yè)均已上線在線機(jī)器翻譯服務(wù),其中,百度在線翻譯平臺(tái)已經(jīng)能夠?qū)崿F(xiàn)200余種語(yǔ)言的互譯,并支持拍照、手動(dòng)輸入等多種形式的翻譯。借助這些網(wǎng)絡(luò)服務(wù),人類基于出行、工作等需要時(shí),可以在瞬時(shí)內(nèi)得到一個(gè)較為準(zhǔn)確的翻譯結(jié)果。
第二,在復(fù)雜任務(wù)中,機(jī)器翻譯的表現(xiàn)能力有待提升,其主要作為人類譯者的輔助工具出現(xiàn)。以百度在線翻譯平臺(tái)為例,用戶雖可以在瞬時(shí)間免費(fèi)得到翻譯結(jié)果,然而,當(dāng)用戶追求更高質(zhì)量的翻譯文本時(shí),其只能點(diǎn)擊“人工翻譯”按鈕載入到付費(fèi)翻譯界面當(dāng)中。
處理一些復(fù)雜的翻譯任務(wù)時(shí),機(jī)器翻譯的發(fā)展還未達(dá)到一個(gè)完全理想化的水平。嚴(yán)復(fù)曾在《天演論》中提到:“譯事三難:信、達(dá)、雅?!蹦壳埃瑱C(jī)器翻譯已經(jīng)基本能夠達(dá)到“信”的標(biāo)準(zhǔn),即在某些領(lǐng)域中保證翻譯內(nèi)容的準(zhǔn)確性;然而,要求其完全符合“達(dá)”(以接近母語(yǔ)的方式表達(dá))和“雅”(追求文章本身的簡(jiǎn)明優(yōu)雅)兩個(gè)標(biāo)準(zhǔn),還需等待一個(gè)奇點(diǎn)的到來(lái)。以文學(xué)作品為例,天馬行空的想象力、起承轉(zhuǎn)合的撰寫(xiě)風(fēng)格與極具特色的表達(dá)方式是其主要特點(diǎn),不同形式的作品展現(xiàn)獨(dú)創(chuàng)性之方式有所不同[6]。由于“感知”能力的缺乏,智能翻譯機(jī)器還不能較為出色地完成文學(xué)作品的語(yǔ)言轉(zhuǎn)換。因此,完成一些復(fù)雜任務(wù)時(shí),機(jī)器翻譯主要作為人類譯者或讀者的輔助工具出現(xiàn)。
二、翻譯權(quán)的發(fā)展與變遷
作為人類交流思想、傳播文化的重要工具,語(yǔ)言在社會(huì)發(fā)展中起著舉足輕重的作用。目前,世界上的現(xiàn)存語(yǔ)言已超7 000種,事實(shí)證明,翻譯人類語(yǔ)言比上個(gè)世紀(jì)的任何科學(xué)難題都更有挑戰(zhàn)性[7]。翻譯權(quán)的概念最早在《保護(hù)文學(xué)和藝術(shù)作品伯爾尼公約》中被確定下來(lái),如今,授權(quán)他人翻譯并出版?zhèn)鞑テ渥髌肥钱?dāng)前著作權(quán)制度中作者行使翻譯權(quán)的基本模式。翻譯權(quán)的行使不僅是作者獲取經(jīng)濟(jì)報(bào)酬的主要途徑,還是打破貿(mào)易壁壘、促進(jìn)文化交流和傳播優(yōu)質(zhì)作品的重要渠道。
(一)國(guó)際公約中的翻譯權(quán)
1. 《保護(hù)文學(xué)和藝術(shù)作品伯爾尼公約》中的翻譯權(quán)
翻譯權(quán)是《保護(hù)文學(xué)和藝術(shù)作品伯爾尼公約》(Berne Convention for the Protection of Literary and Artistic Works)(下文簡(jiǎn)稱為“《伯爾尼公約》”)所承認(rèn)的第一項(xiàng)權(quán)利,1967年,被各國(guó)廣泛認(rèn)可為“經(jīng)濟(jì)權(quán)利之首”的復(fù)制權(quán)才被納入到《伯爾尼公約》。
19世紀(jì),各國(guó)迫切需要打破文化貿(mào)易的壁壘,而事實(shí)上,作者通常并不會(huì)自行對(duì)作品進(jìn)行翻譯。因此,在當(dāng)時(shí)的文化背景下,國(guó)際條約對(duì)于翻譯權(quán)的承認(rèn)就顯得尤為重要。1886年《伯爾尼公約》第五條2劃定翻譯權(quán)的保護(hù)期限為作品發(fā)表后的十年,并將翻譯權(quán)定義為自行或者授權(quán)他人對(duì)作者作品進(jìn)行翻譯的權(quán)利;同時(shí),第六條對(duì)于翻譯作品提供了保護(hù),其享有與原作品同等的保護(hù),這種保護(hù)不應(yīng)帶有任何偏見(jiàn)。
后來(lái),該公約幾經(jīng)補(bǔ)充與修訂,翻譯權(quán)的相關(guān)內(nèi)容也有所變化。1896年,公約成員國(guó)代表在巴黎舉行了一次增補(bǔ)公約內(nèi)容的會(huì)議,將翻譯權(quán)的保護(hù)期限延長(zhǎng);1908年,《伯爾尼公約》進(jìn)行第一次修訂,翻譯權(quán)的保護(hù)期限得以與復(fù)制權(quán)等其他權(quán)利的保護(hù)期限相統(tǒng)一3;1971年對(duì)公約進(jìn)行修訂時(shí),應(yīng)發(fā)展中國(guó)家的強(qiáng)烈要求,《伯爾尼公約》附件中增加了對(duì)于翻譯行為的強(qiáng)制許可證條款4。1995年,世界知識(shí)產(chǎn)權(quán)組織在《關(guān)于伯爾尼公約議定書(shū)的備忘錄》中申明,翻譯的概念過(guò)去和現(xiàn)在都針對(duì)實(shí)際語(yǔ)言即人類語(yǔ)言[8],因此,翻譯權(quán)的概念僅限于人類所使用語(yǔ)言間的相互轉(zhuǎn)換。
《伯爾尼公約》作為一個(gè)整體,目的是在每個(gè)成員國(guó)中對(duì)與該國(guó)存在關(guān)聯(lián)的外國(guó)作者提供保護(hù)[9],這就要求其成員國(guó)按照公約之要求調(diào)整本國(guó)法律。以日本為例,雖然文學(xué)界人士一貫強(qiáng)調(diào)日語(yǔ)的特殊性及和西歐語(yǔ)之間的翻譯差異[10],但是,作為亞洲最早加入《伯爾尼公約》的國(guó)家,日本仍然需要主動(dòng)修改其《著作權(quán)法》以履行成員國(guó)的義務(wù)。
2. 《世界版權(quán)公約》中的翻譯權(quán)
為協(xié)調(diào)《伯爾尼公約》成員國(guó)與非成員國(guó)之間的關(guān)系,鼓勵(lì)文學(xué)、科學(xué)與藝術(shù)的發(fā)展,在聯(lián)合國(guó)教育、科學(xué)及文化組織的推動(dòng)下,《世界版權(quán)公約》(Universal Copyright Convention)(下文簡(jiǎn)稱為《版權(quán)公約》)于1952年通過(guò)。同時(shí),《版權(quán)公約》要求各成員國(guó)不作任何保留。
首先,《版權(quán)公約》明確提出對(duì)于翻譯權(quán)、復(fù)制權(quán)、廣播權(quán)及表演權(quán)四項(xiàng)經(jīng)濟(jì)權(quán)利的保護(hù)。其次,《版權(quán)公約》第五條第(二)款之甲提出了對(duì)于翻譯權(quán)的限制措施:如果一部文字作品自首次出版算起七年期滿而翻譯權(quán)所有者或在其授權(quán)下尚未以該締約國(guó)通用語(yǔ)文出版譯本,該締約國(guó)任何國(guó)民都可從主管當(dāng)局得到用該國(guó)通用語(yǔ)文翻譯該作品并出版譯本的非專有許可證。當(dāng)然,該許可證的頒發(fā)只能用于教學(xué)、學(xué)習(xí)或研究5。
(二)我國(guó)《著作權(quán)法》中翻譯權(quán)的變遷
我國(guó)于1992年加入《伯爾尼公約》與《世界版權(quán)公約》。1990年9月7日,《中華人民共和國(guó)著作權(quán)法》(下文簡(jiǎn)稱為“《著作權(quán)法》”)于第七屆全國(guó)人民代表大會(huì)常務(wù)委員會(huì)第十五次會(huì)議通過(guò),其中,第十條提供了對(duì)于作者人身權(quán)和財(cái)產(chǎn)權(quán)的保護(hù),復(fù)制、表演、播放、展覽等使用作品的權(quán)利被統(tǒng)一稱為“使用權(quán)與獲得報(bào)酬權(quán)”6。同時(shí),第十二條提供了對(duì)于翻譯作品的保護(hù),翻譯、注釋、改編、整理的行為被視作創(chuàng)作演繹作品的行為,相關(guān)行為應(yīng)當(dāng)尊重原作的著作權(quán)。這樣,翻譯的行為被規(guī)定于演繹行為之下,翻譯作品與改編作品等共稱為演繹作品。
2001年,《著作權(quán)法》進(jìn)行第一次修正。其中,第十條采用列舉的立法方式,將著作權(quán)中的經(jīng)濟(jì)權(quán)利分類為十二項(xiàng)權(quán)利,翻譯權(quán)作為一項(xiàng)“將作品從一種語(yǔ)言文字轉(zhuǎn)換成另一種語(yǔ)言文字的權(quán)利”被規(guī)定于第(十五)項(xiàng)當(dāng)中。至此,我國(guó)《著作權(quán)法》對(duì)于翻譯權(quán)的保護(hù)框架基本被確定下來(lái),2010年進(jìn)行第二次修正、2020年進(jìn)行第三次修正時(shí),《著作權(quán)法》中翻譯權(quán)的原有條款被立法者保留下來(lái)。
因此,我國(guó)《著作權(quán)法》對(duì)于翻譯權(quán)的保護(hù)主要分為以下兩個(gè)維度:第一,著作權(quán)人的翻譯權(quán)受法律保護(hù),著作權(quán)人可以自己翻譯或授權(quán)他人翻譯作品。第二,翻譯已有作品的行為會(huì)產(chǎn)生基于演繹作品的著作權(quán),翻譯作品的獨(dú)創(chuàng)性在一定程度上受制于原作品的獨(dú)創(chuàng)性。譯者應(yīng)尊重原作品的著作權(quán),使用原作品需獲得原著作權(quán)人的許可,并向其支付報(bào)酬。同時(shí),第三方使用翻譯作品時(shí),需同時(shí)征求原作者與演繹作者的許可,并向二者支付報(bào)酬。
三、機(jī)器翻譯的訓(xùn)練對(duì)于翻譯作品的使用
機(jī)器翻譯加快了世界一體化的進(jìn)程,使人類遙不可及的夢(mèng)想成為可能,但其也帶來(lái)了一些著作權(quán)難題。目前,機(jī)器翻譯技術(shù)以研究神經(jīng)網(wǎng)絡(luò)方法最為盛行,具體之訓(xùn)練依靠深度學(xué)習(xí)算法為之。神經(jīng)網(wǎng)絡(luò)是模擬人腦搭建的類神經(jīng)元結(jié)構(gòu),深度學(xué)習(xí)算法則是幫助機(jī)器實(shí)現(xiàn)智能的主要驅(qū)動(dòng)力。
日本于2018年開(kāi)始“大刀闊斧”地進(jìn)行《著作權(quán)法》改革,允許互聯(lián)網(wǎng)及高科技企業(yè)直接使用作品而無(wú)需經(jīng)作者同意7,這傳遞出一個(gè)信號(hào):于機(jī)器學(xué)習(xí)而言,作品的自由使用存在著一些障礙;而于著作權(quán)人而言,機(jī)器對(duì)于作品的使用存在著“隱秘的風(fēng)險(xiǎn)”。
(一)機(jī)器翻譯的訓(xùn)練過(guò)程中將不可避免地使用現(xiàn)有翻譯作品
機(jī)器翻譯的訓(xùn)練目標(biāo)是幫助計(jì)算機(jī)獨(dú)立、準(zhǔn)確且快速地實(shí)現(xiàn)譯文輸出,其開(kāi)發(fā)與改進(jìn)需要學(xué)習(xí)海量數(shù)據(jù)?;谝?guī)則的和統(tǒng)計(jì)翻譯機(jī)器需要語(yǔ)言學(xué)家與算法工程師共同協(xié)力,將翻譯規(guī)則轉(zhuǎn)化為儲(chǔ)存在機(jī)器內(nèi)部的語(yǔ)料庫(kù),而神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯能夠自動(dòng)識(shí)別輸入數(shù)據(jù)的特征并進(jìn)行學(xué)習(xí),通過(guò)學(xué)習(xí)經(jīng)驗(yàn)的累積實(shí)現(xiàn)翻譯文本的準(zhǔn)確輸出。
2017年,由微軟開(kāi)發(fā)的機(jī)器人小冰出版“詩(shī)集”《陽(yáng)光失了玻璃窗》,據(jù)開(kāi)發(fā)者所言,小冰的訓(xùn)練量達(dá)到10 000次,其共學(xué)習(xí)了1920年來(lái)500余位現(xiàn)代詩(shī)人的作品8。人工智能的“創(chuàng)作”不是簡(jiǎn)單的大數(shù)據(jù)組合,而是一種基于數(shù)學(xué)模型的再數(shù)據(jù)化輸出[11],因此,表達(dá)型人工智能的訓(xùn)練將會(huì)不可避免地使用現(xiàn)有作品和其他文本。
然而,文字是人類可以理解的表示符號(hào),為實(shí)現(xiàn)機(jī)器的自我學(xué)習(xí),訓(xùn)練者需將文本語(yǔ)句向量化并層層傳遞直至轉(zhuǎn)化為機(jī)器可以理解的機(jī)器語(yǔ)言,再經(jīng)過(guò)多重傳導(dǎo)運(yùn)算,最終生成譯文[12]。諸如小冰一類的詩(shī)歌創(chuàng)作型機(jī)器的訓(xùn)練以學(xué)習(xí)詩(shī)歌作品為主要途徑,通過(guò)分析不同流派(作者)的不同表達(dá)方式,小冰得以在選定的參數(shù)下輸出類似風(fēng)格的詩(shī)歌作品。智能翻譯機(jī)器以學(xué)習(xí)雙語(yǔ)或單語(yǔ)語(yǔ)料為主要路徑:理想狀態(tài)下,輸入雙語(yǔ)平行語(yǔ)料能夠在最短時(shí)間內(nèi)實(shí)現(xiàn)訓(xùn)練目標(biāo);以上語(yǔ)料匱乏時(shí),以單語(yǔ)語(yǔ)料訓(xùn)練機(jī)器也可以幫助其了解該種語(yǔ)言的表達(dá)規(guī)則與撰寫(xiě)邏輯。
智能翻譯機(jī)器的訓(xùn)練需要數(shù)以萬(wàn)計(jì)的數(shù)據(jù)輔助之,且訓(xùn)練數(shù)據(jù)以存在雙語(yǔ)形式為最佳。雖然著作權(quán)的保護(hù)只是公有領(lǐng)域中的幾座“孤島”[6],但僅僅從公有領(lǐng)域中抓取雙語(yǔ)訓(xùn)練數(shù)據(jù)恐難以滿足其數(shù)量和質(zhì)量要求,因此,許多人工智能公司選擇使用包含作品的訓(xùn)練數(shù)據(jù)集,而這些數(shù)據(jù)本身可能又是利用爬蟲(chóng)技術(shù)從其他數(shù)據(jù)庫(kù)中非法抓取的[11]。當(dāng)這些公司未經(jīng)權(quán)利人許可并支付報(bào)酬,將一篇中文文章與其英文譯文(或者其他平行語(yǔ)料)轉(zhuǎn)化為低維向量訓(xùn)練機(jī)器學(xué)習(xí)時(shí),這一行為可能會(huì)落入到《著作權(quán)法》的保護(hù)范圍中。
機(jī)器學(xué)習(xí)的過(guò)程主要表現(xiàn)為“輸入數(shù)據(jù)——機(jī)器分析——輸出結(jié)果”的過(guò)程,這一過(guò)程高度依賴訓(xùn)練數(shù)據(jù)集與測(cè)試數(shù)據(jù)集。訓(xùn)練過(guò)程中,包含某一翻譯作品(與其原作品)的訓(xùn)練數(shù)據(jù)集可能被儲(chǔ)存于某人工智能公司的服務(wù)器中用以反復(fù)訓(xùn)練一臺(tái)或多臺(tái)機(jī)器,同時(shí),這一訓(xùn)練數(shù)據(jù)集也可能被上傳到某一開(kāi)源平臺(tái)中,這時(shí),以上行為觸犯了復(fù)制權(quán)9的邊界。
即將于2021年6月1日實(shí)施的新《著作權(quán)法》第十條之(五)實(shí)現(xiàn)了復(fù)制權(quán)權(quán)利范圍的擴(kuò)大,“數(shù)字化”這一方式被納入到復(fù)制權(quán)的保護(hù)范圍中10。有研究認(rèn)為“數(shù)字化”是指依靠計(jì)算機(jī)技術(shù)把一定形式的信息輸入計(jì)算機(jī)系統(tǒng)并轉(zhuǎn)換成二進(jìn)制數(shù)字編碼的技術(shù)[12]??偠灾?,“數(shù)字化”是將人類語(yǔ)言轉(zhuǎn)換為機(jī)器語(yǔ)言并儲(chǔ)存在機(jī)器中的行為,當(dāng)訓(xùn)練者將非數(shù)字形式存在的作品轉(zhuǎn)換為以數(shù)字形式存在的作品并儲(chǔ)存在服務(wù)器當(dāng)中時(shí),其也應(yīng)當(dāng)面臨著侵犯復(fù)制權(quán)的指控。
同時(shí),機(jī)器學(xué)習(xí)以模仿為主要手段,譯文的輸出以在訓(xùn)練數(shù)據(jù)中抽取可供優(yōu)化翻譯模型的特征為基礎(chǔ),這一行為中抽取了原屬于翻譯作品的表達(dá)。翻譯作品的獨(dú)創(chuàng)性主要體現(xiàn)在譯詞的選擇、譯文的編排上,其獨(dú)創(chuàng)性在某種程度上受制于原作品的獨(dú)創(chuàng)性[13]。機(jī)器對(duì)于雙語(yǔ)語(yǔ)料的分析并非針對(duì)性體現(xiàn)于作品當(dāng)中的思想,而是基于其表達(dá)。與人類利用參考文獻(xiàn)寫(xiě)作文章的機(jī)理相同,海量數(shù)據(jù)的輸入也使得機(jī)器增長(zhǎng)了新的知識(shí)并實(shí)現(xiàn)了知識(shí)增值,這些“知識(shí)”將轉(zhuǎn)化成為機(jī)器內(nèi)部新的模型參數(shù)。
(二)現(xiàn)行合理使用制度難以包容此種行為
現(xiàn)行《著作權(quán)法》第二十二條以封閉列舉的方式將合理使用限定在十二種情形中,機(jī)器翻譯的訓(xùn)練對(duì)于作品的使用行為并不包含在此范圍內(nèi)。近年來(lái),有法院主張對(duì)于封閉列舉立法例的突破11,這一聲音為新《著作權(quán)法》所回應(yīng)。新《著作權(quán)法》第二十四條將原見(jiàn)于《中華人民共和國(guó)著作權(quán)法實(shí)施條例》(下文簡(jiǎn)稱為《實(shí)施條例》)第二十九條12的內(nèi)容移入,并擴(kuò)大了合理使用制度適用的情形,第(十三)項(xiàng)“法律、行政法規(guī)規(guī)定的其他情形”作為一條封閉性兜底條款被引入。
然而,在“音樂(lè)噴泉”案中,北京知識(shí)產(chǎn)權(quán)法院明確表達(dá)了適用此類兜底條款之態(tài)度:“能否作為著作權(quán)法所稱的其他作品,必須由法律、行政法規(guī)規(guī)定,不能由其他規(guī)范性文件規(guī)定,以保證法制的統(tǒng)一?!?3第二十四條之(十三)的設(shè)立試圖在新技術(shù)的發(fā)展與著作權(quán)保護(hù)間找尋平衡,因?yàn)楹侠硎褂玫呐袛鄻?biāo)準(zhǔn)產(chǎn)生變動(dòng)的原因,是新技術(shù)背景下對(duì)作品全新利用方式的激勵(lì)[14]。但是,缺乏其他法律、行政法規(guī)的指引時(shí),不能直接引用該條款進(jìn)行合理使用的辯解。
不過(guò),神經(jīng)網(wǎng)絡(luò)技術(shù)具有不可解釋性,在人工智能系統(tǒng)輸入的數(shù)據(jù)和其輸出的結(jié)果之間,存在著無(wú)法洞悉的“隱層”,即“算法黑箱”[15]。因此,認(rèn)定具體侵權(quán)行為時(shí),僅從某一次或某幾次的譯文輸出判斷,無(wú)法推知機(jī)器學(xué)習(xí)了哪一部或哪幾部作品,更無(wú)法推知機(jī)器為何生成這一翻譯結(jié)果。這時(shí),應(yīng)要求訓(xùn)練者提供原始訓(xùn)練數(shù)據(jù)集。雖然機(jī)器翻譯技術(shù)的發(fā)展有其政治、軍事及文化意義,未經(jīng)著作權(quán)人許可而對(duì)他人作品加以利用的行為卻不能因此得到《著作權(quán)法》的豁免,然而,基于人工智能訓(xùn)練行為的非公開(kāi)性,這種風(fēng)險(xiǎn)總是隱秘存在的。
四、機(jī)器翻譯的發(fā)展與翻譯權(quán)行使的挑戰(zhàn)
“Dreamwriter”案中,Dreamwriter系騰訊科技(北京)有限公司開(kāi)發(fā)并授權(quán)給原告方深圳市騰訊計(jì)算機(jī)系統(tǒng)有限公司使用的智能新聞寫(xiě)作軟件,該軟件可以自動(dòng)撰寫(xiě)股市財(cái)經(jīng)綜述類文章,且原告的創(chuàng)作人員每年可在該軟件的協(xié)助下完成大約30萬(wàn)篇作品。深圳市南山區(qū)人民法院否認(rèn)了該軟件獨(dú)立為“創(chuàng)作”行為的正當(dāng)性,但其認(rèn)為,作為創(chuàng)作人員的工作助手,Dreamwriter參與撰寫(xiě)的文章是具有獨(dú)創(chuàng)性的法人作品14。人工智能技術(shù)正不斷邁入到文學(xué)、藝術(shù)領(lǐng)域當(dāng)中,雖然其“作者”地位并不為《著作權(quán)法》所包容,利用其進(jìn)行創(chuàng)作卻已成為一種新的風(fēng)尚。
神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯的開(kāi)發(fā)成本低,運(yùn)行速度快。由翻譯記憶技術(shù)驅(qū)動(dòng)的計(jì)算機(jī)輔助翻譯技術(shù)與專業(yè)譯者的配合度更高,自動(dòng)生成翻譯結(jié)果的機(jī)器翻譯則面向更多非專業(yè)譯者。目前,準(zhǔn)確度不斷提升的機(jī)器翻譯對(duì)于翻譯權(quán)行使的挑戰(zhàn)主要有二。
(一)機(jī)器翻譯的普及打破了翻譯權(quán)行使的固有模式
知識(shí)產(chǎn)權(quán)的客體是無(wú)形的智力活動(dòng)成果,它以信息的方式存在于那里,雖然其具有鮮明的地域性,但對(duì)于相關(guān)的智力活動(dòng)成果的利用卻是沒(méi)有國(guó)界的[16],這為某一作品在世界范圍內(nèi)的傳播提供了可能。然而,作品的廣泛傳播存在一個(gè)前提:該作品需被譯為多國(guó)語(yǔ)言,基于此,作者得以通過(guò)授權(quán)他人翻譯或自行翻譯(若其掌握該門(mén)語(yǔ)言的話)的方式行使翻譯權(quán),并獲取經(jīng)濟(jì)報(bào)酬。
當(dāng)讀者對(duì)某一部外國(guó)作品產(chǎn)生興趣,其會(huì)產(chǎn)生閱讀該作品的文學(xué)性需求,這種需求的實(shí)現(xiàn)以將該部作品翻譯為本國(guó)通行語(yǔ)言為前提。神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯的普及與發(fā)展使讀者的私人翻譯行為成為可能。當(dāng)某一讀者對(duì)于某部外國(guó)作品的需求僅限于了解其基本含義而非欣賞文學(xué)性、準(zhǔn)確度更高的專業(yè)譯本時(shí),其可以借助機(jī)器翻譯將部分或全部作品翻譯成其熟練使用的語(yǔ)言,當(dāng)然,這一行為應(yīng)基于個(gè)人欣賞或?qū)W習(xí)之目的。長(zhǎng)久以往,讀者對(duì)于外國(guó)作品的本國(guó)譯本的需求相應(yīng)下降,這時(shí),著作權(quán)人行使翻譯權(quán)的空間相應(yīng)縮小。即使作者仍通過(guò)翻譯權(quán)的行使在該國(guó)出版了該譯本,該譯本的銷量可能也會(huì)因機(jī)器翻譯的迅速普及而不甚理想。
(二)機(jī)器翻譯為侵權(quán)者提供了便利
繼續(xù)上文的假設(shè),某一外文作品在某讀者所在國(guó)家內(nèi)依據(jù)國(guó)際公約或雙邊條約享有著作權(quán),某讀者非基于個(gè)人欣賞或?qū)W習(xí)之目的,未經(jīng)著作權(quán)人許可,擅自借助機(jī)器翻譯實(shí)現(xiàn)了該外文作品的語(yǔ)言轉(zhuǎn)換以獲取非法收益時(shí),這名讀者毋庸置疑應(yīng)面臨侵犯著作權(quán)人翻譯權(quán)之指控,其應(yīng)承擔(dān)直接侵權(quán)之責(zé)任。
無(wú)論基于合法或非法的目的,當(dāng)用戶將需要翻譯的文本輸入至在線翻譯平臺(tái)中并點(diǎn)擊“翻譯”按鈕時(shí),機(jī)器翻譯將在幾秒鐘之內(nèi)生成翻譯結(jié)果。因此,當(dāng)用戶未經(jīng)許可翻譯他人作品時(shí),機(jī)器只能別無(wú)選擇地繼續(xù)完成輔助工作。對(duì)于這一法律風(fēng)險(xiǎn),以百度公司為首的機(jī)器翻譯服務(wù)提供商在《翻譯協(xié)議》中指明:“其對(duì)于鍵入內(nèi)容和翻譯結(jié)果造成的侵權(quán)、糾紛、損失概不負(fù)責(zé),亦不承擔(dān)任何法律責(zé)任?!?5
當(dāng)用戶基于未經(jīng)許可的翻譯行為構(gòu)成直接侵權(quán)時(shí),智能翻譯機(jī)器實(shí)際上成為了直接侵權(quán)者的“侵權(quán)工具”,其訓(xùn)練者或所有者開(kāi)發(fā)新技術(shù)的行為客觀上為直接侵權(quán)者提供了侵權(quán)的便利,這一技術(shù)支持行為[17]可能面臨著承擔(dān)間接侵權(quán)責(zé)任中輔助侵權(quán)[18]之指控,這一行為無(wú)法通過(guò)以上的免責(zé)條款進(jìn)行規(guī)避。面對(duì)浩如煙海般的“私人翻譯”行為,權(quán)利人直接起訴機(jī)器翻譯用戶是不明智的,因此,其有可能將訴訟的矛頭指向訓(xùn)練者或所有者。這時(shí),機(jī)器翻譯便面臨著美國(guó)“索尼”案中的尷尬處境。
作為本案的原告,環(huán)球影視公司和迪士尼公司就一系列電視節(jié)目享有版權(quán)。由于索尼公司生產(chǎn)的家用錄像機(jī)的購(gòu)買者通過(guò)電視廣播錄制了原告享有版權(quán)的節(jié)目,1976年,二位原告在地方法院提起了針對(duì)被告索尼公司的訴訟,并向法院控告索尼公司售賣的錄像機(jī)構(gòu)成輔助侵權(quán)。在該案的審判中,地方法院作出了有利于被告的判決,然而,上訴法院的判決則主要支持了原告的訴求。當(dāng)案件進(jìn)入美國(guó)最高法院的審理程序當(dāng)中時(shí),最高法院再次支持了被告的主張,認(rèn)定改變觀看時(shí)間使用錄像機(jī)錄制電視節(jié)目的行為構(gòu)成合理使用,而錄像機(jī)具有除侵權(quán)外的其他用途,被告的行為并沒(méi)有構(gòu)成幫助侵權(quán)?!八髂帷卑刚J(rèn)為:只要產(chǎn)品能夠具有一種潛在的“實(shí)質(zhì)性非侵權(quán)用途”,產(chǎn)品的制造商和經(jīng)銷商就無(wú)需承擔(dān)輔助侵權(quán)之責(zé)任16。
若按照“實(shí)質(zhì)性非侵權(quán)用途”標(biāo)準(zhǔn),機(jī)器翻譯的開(kāi)發(fā)者或許無(wú)需承擔(dān)間接侵權(quán)之責(zé)任。然而,這一技術(shù)的發(fā)展與普及帶給著作權(quán)人的沖擊卻是切實(shí)存在的。間接侵權(quán)責(zé)任以直接侵權(quán)責(zé)任的成立為前提[19],“索尼”案中,改變觀看時(shí)間使用錄像機(jī)錄制電視節(jié)目的行為構(gòu)成合理使用,然而,非基于個(gè)人欣賞、學(xué)習(xí)之目的,未經(jīng)許可利用機(jī)器翻譯實(shí)現(xiàn)他人作品語(yǔ)言轉(zhuǎn)換的行為卻不具有適用合理使用進(jìn)行抗辯的空間。
同時(shí),“索尼”案中所確立的“實(shí)質(zhì)性非侵權(quán)用途”標(biāo)準(zhǔn)為故意設(shè)計(jì)一種主要用途在于侵權(quán), 卻具有至少“一種”“潛在”的合法用途的產(chǎn)品打開(kāi)了方便之門(mén)[20],其正當(dāng)性也有待一事一論的探討。事實(shí)上,本案中持不同觀點(diǎn)的法官曾發(fā)表這樣的言論:“可以認(rèn)定被告構(gòu)成幫助侵權(quán),但是可以通過(guò)判給損害賠償金或權(quán)利金的方式維持被告的生產(chǎn)與售賣行為,這樣,購(gòu)買者也可以繼續(xù)使用錄像機(jī)而不受打攪?!盵21]
五、利益平衡視角下的風(fēng)險(xiǎn)應(yīng)對(duì)路徑:版權(quán)補(bǔ)償金制度的借鑒
技術(shù)中立原則與利益平衡原則是《著作權(quán)法》立法始終應(yīng)遵循的兩大原則。《著作權(quán)法》基于回應(yīng)印刷技術(shù)的發(fā)展而產(chǎn)生,基于回應(yīng)網(wǎng)絡(luò)技術(shù)的發(fā)展而變化,也將基于回應(yīng)人工智能技術(shù)的發(fā)展而面臨挑戰(zhàn)。
(一)版權(quán)補(bǔ)償金制度產(chǎn)生于利益平衡的需要
上世紀(jì)六十年代,德國(guó)正面臨著這樣一個(gè)問(wèn)題:伴隨著各種復(fù)制設(shè)備的普及,私人復(fù)制的成本愈發(fā)低廉,大量的私人復(fù)制作品涌現(xiàn)出來(lái),這嚴(yán)重沖擊了正版作品銷售的市場(chǎng)。然而,依據(jù)當(dāng)時(shí)德國(guó)的《著作權(quán)及鄰接權(quán)法》,個(gè)人復(fù)制行為并不具有非法性。因此,這樣一個(gè)問(wèn)題被置于立法者眼前:當(dāng)私人復(fù)制行為不具有法律上的可責(zé)性,卻又切實(shí)影響到作者的收益時(shí),該采取何種措施來(lái)平衡二者之間的利益關(guān)系?
1965年,德國(guó)的《著作權(quán)及鄰接權(quán)法》吸收了1955年“Grunding Reporter”案與1964年“Personalawsweise”案中法院的基本做法,將版權(quán)補(bǔ)償金制度從立法的層面確定下來(lái)。由此,復(fù)制設(shè)備的生產(chǎn)商與進(jìn)口商需要繳納不超過(guò)銷售額百分之五的補(bǔ)償金,該補(bǔ)償金的收取由著作權(quán)集體管理組織承擔(dān)。后續(xù),伴隨著科技的發(fā)展,德國(guó)又將該制度進(jìn)行了兩次革新,該制度的征收對(duì)象(復(fù)印設(shè)備等也被納入到征收對(duì)象中)不斷擴(kuò)大,受益人范圍不斷被擴(kuò)展(鄰接權(quán)人被納入到受益人范圍中),同時(shí),制度開(kāi)始對(duì)不同設(shè)備收取不同金額的版權(quán)補(bǔ)償金。
在美國(guó),“索尼”案的判決雖然釋明了“幫助侵權(quán)”與“合理使用”的問(wèn)題,但是,這一判決并沒(méi)有完全把握住新技術(shù)發(fā)展與著作權(quán)保護(hù)間的微妙關(guān)系。1990年,索尼公司再次陷入訴訟中,以作曲家Sammy Cahn為首的大量音樂(lè)版權(quán)人認(rèn)為索尼公司生產(chǎn)的數(shù)字錄音機(jī)影響了作品的“潛在市場(chǎng)”17。這場(chǎng)訴訟雖因原告方Sammy Cahn的撤訴結(jié)案,卻在客觀上推動(dòng)了《家庭錄音法》( Audio Home Recording Act of 1992)的通過(guò),該法后成為《美國(guó)版權(quán)法》中的內(nèi)容?!都彝ヤ浺舴ā芬笤跀?shù)字錄音設(shè)備中設(shè)置控制復(fù)制行為的技術(shù)措施,并要求其制造、銷售商按照申報(bào)的銷售數(shù)量繳納版稅[6]。
試圖彌補(bǔ)合理使用偏差的版權(quán)補(bǔ)償金制度的導(dǎo)入,在某種程度上緩解了模擬復(fù)制技術(shù)條件下的權(quán)利人與使用人之間的緊張關(guān)系[22],復(fù)制設(shè)備的生產(chǎn)者可能并不攜有生產(chǎn)侵權(quán)工具的目的,消費(fèi)者在購(gòu)買設(shè)備時(shí)也并非都攜有使用該設(shè)備為侵權(quán)行為之目的,但是,為應(yīng)對(duì)私人復(fù)制行為帶給著作權(quán)制度的沖擊,版權(quán)補(bǔ)償金制度所采取的“一刀切”設(shè)計(jì)符合利益平衡原則。一方面,私人復(fù)制行為仍具有合法性,但是,版權(quán)補(bǔ)償金最后都將轉(zhuǎn)換為設(shè)備的成本,該部分金額實(shí)際上被轉(zhuǎn)嫁到了購(gòu)買產(chǎn)品的消費(fèi)者身上,這在一定程度上約束了消費(fèi)者的行為;另一方面,著作權(quán)人的潛在利益或許因私人復(fù)制行為受到影響,但是,該制度使其獲得應(yīng)有的經(jīng)濟(jì)補(bǔ)償,這在另一種維度上維護(hù)了其合法權(quán)益。
(二)應(yīng)借鑒版權(quán)補(bǔ)償金制度建立我國(guó)的“人工智能稅”
版權(quán)補(bǔ)償金制度是數(shù)字技術(shù)時(shí)代下調(diào)和不同主體間利益沖突的重要路徑,隨著新一代科技革命[23]的到來(lái),其還應(yīng)被賦予更多的內(nèi)涵。盡管許多歐洲國(guó)家都參考德國(guó)《著作權(quán)法及鄰接權(quán)法》建立了各具特色的版權(quán)補(bǔ)償金制度,但由于種種原因,我國(guó)《著作權(quán)法》中并未建立起這一制度。
文學(xué)藝術(shù)作品在本質(zhì)上是流動(dòng)的、無(wú)形的、共享的,且不會(huì)被消耗, 具有公共產(chǎn)品屬性[24]。神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯和其他人工智能技術(shù)在其訓(xùn)練、商業(yè)性應(yīng)用過(guò)程中對(duì)于作品的利用、翻譯行為對(duì)著作權(quán)人的潛在利益造成了影響,而這些行為卻總是隱秘發(fā)生的。新技術(shù)的發(fā)展與培育,使得著作權(quán)人的利益長(zhǎng)期處于不安寧的狀態(tài)之中,某一作品被納入到機(jī)器的訓(xùn)練數(shù)據(jù)集時(shí),該作品的權(quán)利人往往難以發(fā)現(xiàn)或舉證這一侵權(quán)行為。同時(shí),由于作品自由利用的障礙性,訓(xùn)練人工智能模型時(shí)常會(huì)面臨數(shù)據(jù)稀缺問(wèn)題。因此,應(yīng)在人工智能時(shí)代下建立與我國(guó)國(guó)情相適應(yīng)的版權(quán)補(bǔ)償金制度,可以稱之為“人工智能稅”。
人工智能的訓(xùn)練者、所有者尋求作品等數(shù)據(jù)的開(kāi)放獲取以實(shí)現(xiàn)相關(guān)模型的訓(xùn)練與提升,著作權(quán)人則迫切希望智力成果能夠得到合法、理性的使用。因此,人工智能訓(xùn)練者與所有者是該種版權(quán)稅的義務(wù)主體,著作權(quán)人相應(yīng)作為受益主體,同時(shí),該種版權(quán)稅應(yīng)由我國(guó)的著作權(quán)集體管理組織進(jìn)行征收。不過(guò),在我國(guó)設(shè)立“人工智能稅”的前提是以下兩個(gè)問(wèn)題的順利解決:
第一,加強(qiáng)著作權(quán)集體管理組織的建設(shè)?!吨鳈?quán)法》第八條確定了集體管理組織的非營(yíng)利性特征18,該組織的目標(biāo)應(yīng)是通過(guò)使用費(fèi)的代收取與維權(quán)訴訟行為保障著作權(quán)人合法利益的實(shí)現(xiàn)。在我國(guó),基于制度環(huán)境與自利動(dòng)機(jī)[25],著作權(quán)集體管理組織缺乏相應(yīng)的市場(chǎng)基礎(chǔ),目前,這一制度設(shè)計(jì)并未實(shí)現(xiàn)《著作權(quán)法》的預(yù)期目標(biāo)。賦予著作權(quán)集體管理組織收取版權(quán)稅義務(wù)的前提應(yīng)是相關(guān)組織具有一定的市場(chǎng)接受度,并且能最大化地維護(hù)著作權(quán)人利益的實(shí)現(xiàn)。
第二,確定一個(gè)合適的征收稅率。版權(quán)補(bǔ)償是一種折衷方案,賠償基于著作權(quán)法人的實(shí)際損失,而補(bǔ)償則基于法律的例外規(guī)定。因此,這一制度設(shè)計(jì)不應(yīng)將更多的砝碼加于著作權(quán)的保護(hù)之上,而應(yīng)在市場(chǎng)規(guī)律的指導(dǎo)下,確定一個(gè)折衷、合理的征收稅率?!叭斯ぶ悄芏悺敝械陌鏅?quán)補(bǔ)償基于具體的開(kāi)發(fā)、銷售行為,補(bǔ)償金額則以開(kāi)發(fā)商、服務(wù)商的申報(bào)數(shù)量為主要計(jì)算基點(diǎn)。過(guò)高的稅率無(wú)疑是為新技術(shù)的發(fā)展增加了新的負(fù)擔(dān),這一負(fù)擔(dān)不應(yīng)重于單獨(dú)為作品的利用而付費(fèi)的負(fù)擔(dān),同時(shí),過(guò)低的稅率無(wú)法彌補(bǔ)著作權(quán)人潛在市場(chǎng)受到擠壓而帶來(lái)的利益受損。
結(jié)? ?語(yǔ)
雖然,新技術(shù)的發(fā)展總能為人類帶來(lái)生產(chǎn)、生活方式上的變革,但革新中的“陣痛”應(yīng)得到理性地分析與對(duì)待。智能翻譯機(jī)器的訓(xùn)練需要海量的平行雙語(yǔ)語(yǔ)料,在深度學(xué)習(xí)中,其將會(huì)不可避免地復(fù)制、改編某部作品與其翻譯作品,這一行為無(wú)法為現(xiàn)行的合理使用制度所包容。同時(shí),伴隨著神經(jīng)網(wǎng)絡(luò)技術(shù)的普及與應(yīng)用,當(dāng)用戶基于合法或非法目的使用機(jī)器翻譯實(shí)現(xiàn)某部作品的語(yǔ)言轉(zhuǎn)換時(shí),著作權(quán)人的潛在市場(chǎng)及利益會(huì)因此受到影響,其作品面臨著被擅自翻譯并利用的風(fēng)險(xiǎn)。
技術(shù)中立視角要求《著作權(quán)法》在新技術(shù)的發(fā)展與著作權(quán)的保護(hù)間尋求微妙的平衡。版權(quán)補(bǔ)償金制度的借鑒既可以掃清人工智能開(kāi)發(fā)者使用作品進(jìn)行深度學(xué)習(xí)的法律障礙,擴(kuò)充其訓(xùn)練數(shù)據(jù)集,又給予了深陷于擔(dān)憂權(quán)利被侵犯的不安寧情緒中的著作權(quán)人以合理補(bǔ)償,《著作權(quán)法》應(yīng)朝著這一方向邁出步伐。應(yīng)當(dāng)認(rèn)為,機(jī)器翻譯對(duì)于《著作權(quán)法》的挑戰(zhàn)尚不足以動(dòng)搖法律的根基,但是,身處這一洪流時(shí),《著作權(quán)法》應(yīng)當(dāng)基于利益平衡的信念發(fā)出聲音。
參考文獻(xiàn):
[1] 黎亞飛,張瑞華.機(jī)器翻譯發(fā)展與現(xiàn)狀[J].中國(guó)輕工教育,2019(5):38-45.
[2] 侯強(qiáng),侯瑞麗.機(jī)器翻譯方法研究與發(fā)展綜述[J].計(jì)算機(jī)工程與應(yīng)用,2019,55(10):30-66.
[3] 斯介生,宋大我,李揚(yáng).大數(shù)據(jù)背景下的谷歌翻譯——現(xiàn)狀與挑戰(zhàn)[J].統(tǒng)計(jì)研究,2016,33(5):109-112
[4] 劉洋.神經(jīng)機(jī)器翻譯前沿進(jìn)展[J].計(jì)算機(jī)研究與發(fā)展,2017,54(6):1144-1149.
[5] 蔡圓媛,盧葦.基于低維語(yǔ)義向量模型的語(yǔ)義相似度度量[J].中國(guó)科學(xué)技術(shù)大學(xué)學(xué)報(bào),2016,46(9):719-726.
[6] 李明德.美國(guó)知識(shí)產(chǎn)權(quán)法[M].北京:法律出版社,2014.
[7] Erik Ketzan. Rebuilding Babel: Copyright and the Future of Online Machine Translation[J].Tulane Journal of Technology and Intellectual Property,2007(205):206-234.
[8] 鄭敬蓉,陳波.圖書(shū)館館藏作品數(shù)字化的法律性質(zhì)與立法完善[J].新世紀(jì)圖書(shū)館,2020(11):22-26.
[9] 喬治·庫(kù)曼托 ,鄭成思.國(guó)際私法與伯爾尼公約[J].法律科學(xué)(西北政法學(xué)院學(xué)報(bào)),1992(3):57-65.
[10] 李志紅.翻譯權(quán)在日本的變遷[J].出版發(fā)行研究,1992(6):56-59.
[11] 馬忠法,肖宇露.論人工智能學(xué)習(xí)創(chuàng)作的合理使用[J].山東科技大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2020,22(5):32-47.
[12] 劉友華,魏遠(yuǎn)山.機(jī)器學(xué)習(xí)的著作權(quán)侵權(quán)問(wèn)題及其解決[J].華東政法大學(xué)學(xué)報(bào),2019,22(2):68-79.
[13] 應(yīng)明.數(shù)字化技術(shù)的發(fā)展對(duì)現(xiàn)行著作權(quán)制度帶來(lái)的新問(wèn)題[J].知識(shí)產(chǎn)權(quán),1994(6):7-13.
[14] Matthew Sag. The New Legal Landscape for Text Mining and Machine Learning[J]. Copyright Socy of the U.S.A.(2019)66:291-365.
[15] 徐小奔,楊依楠.論人工智能深度學(xué)習(xí)中著作權(quán)的合理使用[J].交大法學(xué),2019(3):32-42.
[16] 徐鳳.人工智能算法黑箱的法律規(guī)制——以智能投顧為例展開(kāi)[J].東方法學(xué),2019(6):78-86.
[17] 李明德.知識(shí)產(chǎn)權(quán)法.[M].北京:法律出版社,2014.
[18] 劉文杰.信息網(wǎng)絡(luò)傳播行為的認(rèn)定[J].法學(xué)研究,2016,38(3):122-139.
[19] 劉平.著作權(quán)“間接侵權(quán)”理論之檢討與展望[J].知識(shí)產(chǎn)權(quán),2018(1):67-96.
[20] 羅斌.云計(jì)算環(huán)境下的著作權(quán)間接侵權(quán)規(guī)則探討——從“索尼案”到“Cablevision案”的適用原則變更[J].中國(guó)版權(quán),2012(3):48-51.
[21] 王遷.“索尼案”二十年祭——回顧、反思與啟示[J].科技與法律,2004(4):59-68.
[22] 曹世華.論數(shù)字時(shí)代的版權(quán)補(bǔ)償金制度及其導(dǎo)入[J].法律科學(xué).西北政法學(xué)院學(xué)報(bào),2006(6):143-151.
[23] 張今.數(shù)字環(huán)境下的版權(quán)補(bǔ)償金制度[J].政法論壇,2010,28(1):80-87.
[24] 尹鋒林,肖尤丹.以人工智能為基礎(chǔ)的新科技革命對(duì)知識(shí)產(chǎn)權(quán)制度的挑戰(zhàn)與機(jī)遇[J].科學(xué)與社會(huì),2018,8(4):23-33.
[25] 向波.著作權(quán)集體管理組織:市場(chǎng)功能、角色安排與定價(jià)問(wèn)題[J].知識(shí)產(chǎn)權(quán),2018(7):68-76.
Challenges and Solutions: the Development of Machine Translation and the Future of Translation Right
Yin Fenglin, Zhao Yixin
(School of Intellectual Property, University of Chinese Academy of Sciences, Beijing 100040, China)
Abstract: In 1930s, French scientist G.B. Artsouni proposed the idea of machine translation. In the past century, machine translation has achieved its progress from rule-Based machine translation to statistical machine translation, and then to neural machine translation. It can be foreseen that in the future, machine translation will perform a pivotal role in text translation, which will challenge the normal approach of exercising the translation right of the author, that is, to authorize others to translate the preexisting works to obtain the royalty. When the language conversion is not limited to purpose of personal use, the trainers and owners of machine translation may be charged with indirect infringement liability. At the same time, the training of intelligent translation machine will inevitably use a number of preexisting works, and may learn from the original expression embodied in them, which cannot be exempted by fair use. From the perspective of historical experience and balance of interests, the reference of copyright compensation system is helpful to find a delicate balance between the development of new technology and the protection of copyright.
Key words: artificial intelligence; machine translation; deep learning; copyright; translation right; translation works