——以內(nèi)容挖掘?yàn)楹诵?/>
趙 力(天津科技大學(xué)法政學(xué)院 天津 300457)
·新理念、新思潮、新視野論壇·
《數(shù)字時(shí)代知識(shí)發(fā)現(xiàn)海牙宣言》之借鑒
——以內(nèi)容挖掘?yàn)楹诵?/p>
趙 力
(天津科技大學(xué)法政學(xué)院 天津 300457)
〔摘 要〕所謂內(nèi)容挖掘,指從機(jī)器可讀的材料中得到信息的過(guò)程?!稊?shù)字時(shí)代知識(shí)發(fā)現(xiàn)海牙宣言》指出,著作權(quán)法成為限制內(nèi)容挖掘的障礙之一,限制了數(shù)據(jù)、思想的自由流通,有違知識(shí)產(chǎn)權(quán)法的宗旨,亟需變革。根據(jù)現(xiàn)行著作權(quán)法之規(guī)定,內(nèi)容挖掘下的作品復(fù)制和使用行為存在構(gòu)成侵權(quán)的風(fēng)險(xiǎn)。歐美司法實(shí)踐中,關(guān)于內(nèi)容挖掘下的作品復(fù)制和使用行為是否符合著作權(quán)合理使用問(wèn)題,存在相互沖突的裁決。我國(guó)第三次著作權(quán)法修改應(yīng)當(dāng)借鑒海牙宣言之原則,因應(yīng)大數(shù)據(jù)時(shí)代的內(nèi)容挖掘技術(shù)。
〔關(guān)鍵詞〕海牙宣言 內(nèi)容挖掘 例外
《數(shù)字時(shí)代知識(shí)發(fā)現(xiàn)海牙宣言》由歐洲圖書涫研究協(xié)會(huì)(LIBER)發(fā)起,2015年5月6日于布魯塞爾正式發(fā)布。目前,已經(jīng)有50多個(gè)國(guó)際組織簽署。國(guó)際圖聯(lián)是《數(shù)字時(shí)代知識(shí)發(fā)現(xiàn)海牙宣言》的初始簽約國(guó)際組織之一。《數(shù)字時(shí)代知識(shí)發(fā)現(xiàn)海牙宣言》提出,大數(shù)據(jù)時(shí)代,知識(shí)產(chǎn)權(quán)法特別是著作權(quán)法成為限制內(nèi)容挖掘的障礙之一,從而限制了數(shù)據(jù)、思想的自由流通,有違知識(shí)產(chǎn)權(quán)法的宗旨,亟需變革。
1.1 內(nèi)容挖掘技術(shù)概述
新技術(shù)使得人類認(rèn)識(shí)世界和自身的方式發(fā)生變革。隨著計(jì)算機(jī)處理能力增長(zhǎng)、網(wǎng)絡(luò)迅速發(fā)展、政府信息公開,高新技術(shù)不僅是應(yīng)對(duì)大數(shù)據(jù)時(shí)代的方式,同樣是數(shù)據(jù)時(shí)代知識(shí)發(fā)現(xiàn)的關(guān)鍵,內(nèi)容挖掘技術(shù)即是其中之一。根據(jù)國(guó)際圖聯(lián)的定義,所謂內(nèi)容挖掘(content mining),是指從機(jī)器可讀的材料中得到信息的過(guò)程。內(nèi)容挖掘的流程為復(fù)制大量材料,精煉數(shù)據(jù),并重新組合數(shù)據(jù)以預(yù)測(cè)新的發(fā)展趨勢(shì)。內(nèi)容挖掘的核心在于對(duì)文本的自動(dòng)程序進(jìn)行分析,以獲得新知識(shí)。
內(nèi)容挖掘能夠增進(jìn)對(duì)于未發(fā)現(xiàn)的公共知識(shí)的可及性,并且能夠?qū)τ诮?jīng)濟(jì)、社會(huì)、文化生活提供重要的預(yù)見。內(nèi)容挖掘的優(yōu)點(diǎn)包括但不限于以下方面:①闡釋包括氣候變化和全球流行病在內(nèi)的重大變化;②促進(jìn)公眾健康、財(cái)富和發(fā)展;③創(chuàng)造崗位和促進(jìn)就業(yè);④通過(guò)創(chuàng)建更高的研究效率,極大促進(jìn)科學(xué)發(fā)展的速度和進(jìn)程;⑤提高政府及其行為的透明度;⑥促進(jìn)創(chuàng)新與合作,并增進(jìn)開放科學(xué)的影響;⑦提供新的和更豐富的文化見解。
1.2 內(nèi)容挖掘技術(shù)的困境
根據(jù)現(xiàn)行著作權(quán)法之規(guī)定,內(nèi)容挖掘下,作品的復(fù)制和使用行為存在構(gòu)成侵權(quán)的風(fēng)險(xiǎn)。歐美司法實(shí)踐中,關(guān)于內(nèi)容挖掘下的作品復(fù)制和使用行為是否符合著作權(quán)合理使用問(wèn)題,存在相互沖突的裁決。盡管Google圖書案和解協(xié)議中,允許內(nèi)容挖掘下的 “非展示使用”(nondisplay use)和“非消費(fèi)使用”(non-consumptive research),歐盟國(guó)家的Google圖書案亦多為判決Google公司構(gòu)成著作權(quán)侵權(quán)行為。在Infopaq I、II案中,應(yīng)丹麥最高法院之請(qǐng)求,歐洲法院于2009、2012年分別作出咨詢意見。
國(guó)際圖聯(lián)認(rèn)為,研究者應(yīng)當(dāng)享有分析和獲取知識(shí)的自由而無(wú)受到監(jiān)控與制裁之虞,上述自由不應(yīng)當(dāng)在數(shù)字環(huán)境下削弱。但是,目前許多國(guó)家的法律框架特別是知識(shí)產(chǎn)權(quán)法并不支持新方式進(jìn)行的研究,限制了內(nèi)容挖掘的進(jìn)行。
2.1 內(nèi)容挖掘下的非展示與非消費(fèi)使用
在Google圖書案中,自動(dòng)文本分析與著作權(quán)發(fā)生關(guān)聯(lián)。Google圖書和解協(xié)議中,對(duì)于內(nèi)容挖掘下的 “非展示使用”和“非消費(fèi)使用”進(jìn)行定義。所謂“非展示使用”,是指不對(duì)數(shù)字化圖書中的表達(dá)向公眾展示的使用。非展示使用主要包括不對(duì)公眾展示的書目提要,不展示表達(dá)的全文索引,書籍章節(jié)中的關(guān)鍵術(shù)語(yǔ)索引等。Google圖書和解協(xié)議中,Google公司被允許對(duì)于作品進(jìn)行不經(jīng)賠償?shù)姆钦故臼褂谩K^“非消費(fèi)使用”,是指由電腦對(duì)一本或者更多作品進(jìn)行分析的研究,但該研究中并無(wú)研究者閱讀或者展示書籍內(nèi)容以理解書籍中所呈現(xiàn)的知識(shí)內(nèi)容。非消費(fèi)使用主要包括文本、語(yǔ)言和圖像分析、文本或者信息精煉分析、自動(dòng)翻譯、檢索和研究等。在Perfect 10, Inc. v. Amazon, Inc.案[1]中,法院認(rèn)為在檢索引擎上使用縮略圖應(yīng)當(dāng)屬于著作權(quán)合理使用之范疇。
歐盟司法實(shí)踐中,對(duì)于涉及內(nèi)容挖掘的使用是否屬于著作權(quán)合理使用存在不同觀點(diǎn)。在法國(guó),Google圖書館服務(wù)被認(rèn)為在部分來(lái)源于法國(guó)的作品使用方面,違反法國(guó)著作權(quán)法。爭(zhēng)議焦點(diǎn)在于,Google公司數(shù)字化作品,未經(jīng)作者事先同意,制作作品摘要并使得該內(nèi)容經(jīng)檢索可獲得,是否侵犯著作權(quán)。作品在美國(guó)復(fù)制掃描,內(nèi)容使得包括法國(guó)在內(nèi)的全世界使用者可獲得。Google公司在抗辯中認(rèn)為,案件根據(jù)伯爾尼公約5(2)款,應(yīng)當(dāng)適用美國(guó)著作權(quán)法上的合理使用規(guī)則。法國(guó)法院駁回上述抗辯,并認(rèn)為適用法應(yīng)當(dāng)為互聯(lián)網(wǎng)侵權(quán)行為發(fā)生地,即主張侵權(quán)行為發(fā)生地的法律。原告為設(shè)立于法國(guó)的公司,法國(guó)與該訴訟有最密切聯(lián)系;案件涉及法國(guó)作者的作品和法國(guó)出版社;數(shù)字化作品目標(biāo)閱讀者亦在法國(guó)。因此應(yīng)當(dāng)適用法國(guó)的法律。Google 公司復(fù)制全部作品,隨機(jī)選擇提煉摘要的行為,嚴(yán)重影響作為整體的作者人身權(quán)利,與合理使用規(guī)則不符,不屬于合理使用的范疇。在德國(guó),德國(guó)漢堡地區(qū)法院認(rèn)為,網(wǎng)絡(luò)搜索引擎展示微縮圖片不得適用德國(guó)著作權(quán)法關(guān)于著作權(quán)例外的規(guī)定,構(gòu)成著作權(quán)侵權(quán)。在英國(guó),英國(guó)法院認(rèn)為,Google圖書館案被判決不得使用著作權(quán)法公平使用之規(guī)則,構(gòu)成著作權(quán)侵權(quán)。[2]
2.2 內(nèi)容挖掘下的復(fù)制
大數(shù)據(jù)環(huán)境下的文本挖掘存在商業(yè)和研究?jī)煞矫鎽?yīng)用,有著廣泛發(fā)展前景的自動(dòng)文本挖掘與著作權(quán)法之間存在沖突之困境。以歐洲法院Infopaq咨詢案所涉的內(nèi)容挖掘服務(wù)為例,內(nèi)容挖掘程序包括5個(gè)步驟。第一,Infopaq公司在數(shù)據(jù)庫(kù)中人工對(duì)于相關(guān)出版物進(jìn)行登記。第二,拆散出版物的書脊,出版物變成活頁(yè)并開始掃描。掃描過(guò)程使得出版物每頁(yè)生成TIFF文檔。掃描完成之后,TIFF文檔被傳送至OCR(光學(xué)文字識(shí)別)機(jī)器。第三,OCR機(jī)器將TIFF文檔轉(zhuǎn)換為二進(jìn)制數(shù)據(jù),并能夠被文本挖掘軟件所識(shí)別。第四,對(duì)文本進(jìn)行關(guān)鍵詞檢索,每次確定關(guān)鍵詞,在每篇文檔中關(guān)鍵詞所包含的比率按照0至100排列。為了更加方便地檢索文獻(xiàn), 最終文檔被刪除。第五,在文本挖掘結(jié)束時(shí),涉及檢索關(guān)鍵詞的頁(yè)數(shù)被打印于封面。
文本挖掘的復(fù)制行為、精煉信息與傳統(tǒng)著作權(quán)法上的復(fù)制概念存在沖突。一方面,自動(dòng)程序要求對(duì)于全部作品不斷的復(fù)制,上述行為表面上看來(lái)構(gòu)成著作權(quán)侵權(quán)行為。另一方面,自動(dòng)文本挖掘中,復(fù)制行為的目的,在于從文本中精煉信息。精煉信息行為與著作權(quán)法上的侵權(quán)復(fù)制并非一致。當(dāng)科學(xué)研究方法論的發(fā)展,要求自動(dòng)的知識(shí)發(fā)現(xiàn)工具,該工具建立在無(wú)拘束的接觸和重復(fù)復(fù)制基礎(chǔ)之上。[3]因此,《數(shù)字時(shí)代知識(shí)發(fā)現(xiàn)海牙宣言》提倡的以內(nèi)容挖掘?yàn)楹诵模瑢?duì)知識(shí)產(chǎn)權(quán)法特別是著作權(quán)法的合理使用例外制度進(jìn)行補(bǔ)充和完善,在大數(shù)據(jù)時(shí)代內(nèi)容挖掘技術(shù)廣泛應(yīng)用的背景之下,具有重要的理論與實(shí)踐價(jià)值。
《數(shù)字時(shí)代知識(shí)發(fā)現(xiàn)海牙宣言》提出五項(xiàng)原則,即知識(shí)產(chǎn)權(quán)法與促進(jìn)研究相一致原則、分析與獲取知識(shí)無(wú)監(jiān)控和制裁之虞原則、合同許可條款不得限制個(gè)人使用、技術(shù)發(fā)展原則、知識(shí)產(chǎn)權(quán)法不限制基于數(shù)據(jù)和思想的創(chuàng)新和商業(yè)研究原則,其中三項(xiàng)原則與內(nèi)容挖掘密切相關(guān)。
3.1 知識(shí)產(chǎn)權(quán)法與促進(jìn)研究相一致原則
《數(shù)字時(shí)代知識(shí)發(fā)現(xiàn)海牙宣言》指出,信息與思想的自由流動(dòng)是一項(xiàng)重要的人權(quán),是人類知識(shí)產(chǎn)生的催化劑,促進(jìn)社會(huì)福利與實(shí)現(xiàn)繁榮富足。對(duì)于純粹的事實(shí)、思想、數(shù)據(jù)不予保護(hù)是知識(shí)產(chǎn)權(quán)法的重要原則之一。然而,知識(shí)產(chǎn)權(quán)法在某種程度上已經(jīng)成為大數(shù)據(jù)時(shí)代限制知識(shí)創(chuàng)新與共享的障礙之一。
知識(shí)產(chǎn)權(quán)法的宗旨并非限制事實(shí)、思想、數(shù)據(jù),而是以促進(jìn)研究活動(dòng)為宗旨。知識(shí)產(chǎn)權(quán)的客體知識(shí)產(chǎn)品具有非競(jìng)爭(zhēng)性和非排他性,具有公共物品屬性。如果對(duì)于屬于公共物品的知識(shí)產(chǎn)品,不進(jìn)行明晰產(chǎn)權(quán),將有可能導(dǎo)致搭順風(fēng)車,即所有人都愿意利用公共物品的正外部性特點(diǎn),無(wú)人愿意投入時(shí)間、精力和資本進(jìn)行創(chuàng)新。需要通過(guò)規(guī)定知識(shí)產(chǎn)權(quán)的方式,鼓勵(lì)和促進(jìn)知識(shí)產(chǎn)品創(chuàng)造者的時(shí)間、精力和資本投入。另一方面,鑒于知識(shí)產(chǎn)品是一種特殊的公共產(chǎn)品,應(yīng)當(dāng)保留合理的正外部性,促進(jìn)社會(huì)的發(fā)展與進(jìn)步。法律規(guī)定知識(shí)產(chǎn)權(quán)實(shí)現(xiàn)定紛止?fàn)幍哪康?,同時(shí)應(yīng)當(dāng)規(guī)定特定情形下的知識(shí)產(chǎn)權(quán)合理使用制度,發(fā)揮知識(shí)產(chǎn)權(quán)的公益性價(jià)值。如前文所述,在大數(shù)據(jù)環(huán)境下的內(nèi)容挖掘技術(shù)與著作權(quán)法保護(hù)的復(fù)制權(quán)發(fā)生沖突的情形下,有必要重新界定法律邊界,通過(guò)明晰規(guī)定內(nèi)容挖掘例外的方式,保障公共利益。
3.2 合同許可條款不得限制個(gè)人使用
許可協(xié)議、合同條款不得規(guī)制和限制個(gè)人如何分析和使用事實(shí)、數(shù)據(jù)和思想,否則將導(dǎo)致對(duì)于創(chuàng)新和知識(shí)更新的損害。隨著網(wǎng)絡(luò)時(shí)代的發(fā)展,面對(duì)數(shù)以千計(jì)的網(wǎng)絡(luò)用戶,基于便利與經(jīng)濟(jì)原則,大多數(shù)網(wǎng)絡(luò)公司選擇與消費(fèi)者訂立格式合同。為了最大限度地提高效益和保護(hù)自身權(quán)益,拆封合同和點(diǎn)擊合同被廣泛采用。所謂拆封合同,是指在銷售電子產(chǎn)品特別是軟件產(chǎn)品時(shí),使用印刷在封裝的軟件包裝上或者隱藏于包裝內(nèi)的格式合同。打開包裝即意味著消費(fèi)者同意該條款并受該條款的約束。點(diǎn)擊合同是指在互聯(lián)網(wǎng)公司注冊(cè)免費(fèi)或者收費(fèi)的例如電子郵箱的服務(wù)之時(shí),以消費(fèi)者同意接收格式合同為提供服務(wù)的前提。在以拆封合同、點(diǎn)擊合同為代表的網(wǎng)絡(luò)合同許可條款對(duì)于個(gè)人使用的限制之下,大數(shù)據(jù)時(shí)代的內(nèi)容挖掘受到一定的限制。
與此同時(shí),以授權(quán)協(xié)議為基礎(chǔ)的數(shù)字版權(quán)管理措施,對(duì)內(nèi)容挖掘亦造成一定程度的限制。數(shù)字版權(quán)管理的技術(shù)控制,體現(xiàn)于對(duì)作品的接觸控制和使用控制兩個(gè)方面。只有授權(quán)的人,才能接觸作品,加密技術(shù)使得公眾對(duì)作品的獲得變得幾乎不可能。數(shù)字版權(quán)管理將用戶的合理使用建立在獲得許可方或者第三方的許可基礎(chǔ)之上。我國(guó)《信息網(wǎng)絡(luò)傳播權(quán)條例》僅對(duì)于課堂教學(xué)研究、執(zhí)行公務(wù)、向盲人提供網(wǎng)絡(luò)作品、網(wǎng)絡(luò)安全測(cè)試四種目的允許實(shí)施技術(shù)措施規(guī)避行為。有學(xué)者主張,數(shù)字版權(quán)管理與著作權(quán)合理使用制度存在沖突,有必要通過(guò)立法規(guī)制與司法實(shí)踐加以協(xié)調(diào)。[4]在大數(shù)據(jù)時(shí)代,數(shù)字版權(quán)管理使得基于內(nèi)容挖掘的非展示使用、非消費(fèi)使用、復(fù)制等行為難以進(jìn)行,限制和阻礙了在生命安全、公共健康、節(jié)能環(huán)保、教育等方面的研發(fā)和創(chuàng)新。
3.3 不限制基于事實(shí)、數(shù)據(jù)和思想的創(chuàng)新和商業(yè)研究
事實(shí)、數(shù)據(jù)和思想并非著作權(quán)法保護(hù)的對(duì)象。例如我國(guó)著作權(quán)法第五條規(guī)定,對(duì)于時(shí)事新聞、通用數(shù)表、通用表格,不給予著作權(quán)法保護(hù)。然而,在內(nèi)容挖掘技術(shù)之下,鑒于存在對(duì)于海量材料的掃描、使用、復(fù)制行為,大數(shù)據(jù)資料的獲得與作者的著作權(quán)存在潛在沖突的可能性。限制通過(guò)內(nèi)容挖掘技術(shù)獲得的事實(shí)、數(shù)據(jù)、思想的使用將在全球范圍內(nèi)對(duì)于創(chuàng)新和經(jīng)濟(jì)增長(zhǎng)有重大影響,同樣可能減少在健康、科技、就業(yè)、研究、環(huán)境和文化領(lǐng)域的工具和方法的使用。對(duì)于由合法獲得的內(nèi)容材料中精煉出事實(shí)、數(shù)據(jù)和思想的使用和復(fù)制行為,應(yīng)當(dāng)屬于著作權(quán)法例外的范疇。
4.1 內(nèi)容挖掘之價(jià)值
4.1.1 技術(shù)價(jià)值
內(nèi)容挖掘越來(lái)越多地通過(guò)自動(dòng)化系統(tǒng)進(jìn)行。特別是由科學(xué)研究而產(chǎn)生的數(shù)據(jù)庫(kù),因?yàn)槠潺嫶笮詿o(wú)法由人肉眼瀏覽。數(shù)據(jù)庫(kù)的數(shù)量和規(guī)模都在不斷發(fā)展。數(shù)據(jù)的增長(zhǎng),對(duì)人們研究大型數(shù)據(jù)集的方式造成影響,為適應(yīng)數(shù)據(jù)集發(fā)展的影響,計(jì)算機(jī)技術(shù)越來(lái)越多地應(yīng)用于被稱之為“數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)”(knowledge discovery in databases),以回溯和分析數(shù)據(jù)。數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)涉及由數(shù)據(jù)中獲得有用的知識(shí),而內(nèi)容挖掘?yàn)檫m用特殊算法已由數(shù)據(jù)精煉模型。人工智能機(jī)構(gòu)從擁有大量數(shù)據(jù),過(guò)渡到發(fā)現(xiàn)之前所未發(fā)現(xiàn)的重要信息。而且,在大型挖掘運(yùn)行中,實(shí)現(xiàn)了從占有大量原始數(shù)據(jù)的轉(zhuǎn)移,為發(fā)現(xiàn)更為有價(jià)值的信息。盡管上述領(lǐng)域非常前沿,但是日益增長(zhǎng)的電子計(jì)算機(jī)計(jì)算能力,使得對(duì)于大型數(shù)據(jù)庫(kù)的分析不僅可能,而且實(shí)用。
4.1.2 應(yīng)用價(jià)值
內(nèi)容挖掘可能涉及公共健康風(fēng)險(xiǎn)評(píng)估、預(yù)警與決策,重大災(zāi)害預(yù)警與防范,食品安全監(jiān)管與控制等領(lǐng)域。文本挖掘包括一系列應(yīng)用于大量文本的自然語(yǔ)言過(guò)程技術(shù)(natural language processing techniques),在生物或者制藥領(lǐng)域有著廣泛的應(yīng)用。文本挖掘應(yīng)用于大量科技文獻(xiàn),只要在有足夠多的文本的前提之下,能夠提供迅速探究具體事實(shí)而非抽象信息的方法。例如,對(duì)于在大量文獻(xiàn)中同時(shí)出現(xiàn)的描述基因、藥品和疾病概念的內(nèi)容挖掘,能夠發(fā)現(xiàn)上述概念之間全新的聯(lián)系,并且在生物有效方面具有很高的可能性,以自動(dòng)產(chǎn)生和排列出科學(xué)家能夠在實(shí)驗(yàn)室中檢測(cè)的假說(shuō)。
4.2 內(nèi)容挖掘例外缺失之不足
4.2.1 涉內(nèi)容挖掘判例缺乏穩(wěn)定性與可預(yù)期性
Google圖書和解協(xié)議中,包括對(duì)于作品的 “非展示使用”和“非消費(fèi)使用”。然而美國(guó)司法實(shí)踐中亦存在對(duì)于”非展示”復(fù)制行為相互矛盾的判決。Google圖書案在歐盟國(guó)家,例如法國(guó)、德國(guó)、英國(guó)法院,其復(fù)制與使用行為均被判決不符合著作權(quán)合理使用之范疇。對(duì)于涉及內(nèi)容挖掘的Infopaq公司案,應(yīng)丹麥最高法院兩次請(qǐng)求,歐洲法院作出了兩個(gè)結(jié)果不同的咨詢意見。綜上所述,對(duì)于內(nèi)容挖掘之下復(fù)制行為與著作權(quán)法之沖突,司法裁決具有不確定性與不可預(yù)期性。
4.2.2 內(nèi)容挖掘例外缺失,影響技術(shù)發(fā)展
“數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)”涉及由數(shù)據(jù)中獲得有用的知識(shí),而內(nèi)容挖掘?yàn)檫m用特殊算法已由數(shù)據(jù)精煉模型。人工智能機(jī)構(gòu)從擁有大量數(shù)據(jù),過(guò)渡到發(fā)現(xiàn)之前所未發(fā)現(xiàn)的重要信息。而且,在大型內(nèi)容挖掘運(yùn)行中,實(shí)現(xiàn)了從占有大量原始數(shù)據(jù)的轉(zhuǎn)移,為發(fā)現(xiàn)更有價(jià)值的信息。盡管上述領(lǐng)域非常前沿,但是日益增長(zhǎng)的電子計(jì)算機(jī)計(jì)算能力,使得對(duì)于大型數(shù)據(jù)庫(kù)的分析不僅可能,而且實(shí)用。當(dāng)著作權(quán)法允許著作權(quán)人以其著作權(quán)阻礙具有重要意義的新技術(shù)發(fā)展,創(chuàng)新可能受到阻礙,發(fā)展可能受到損害。
法律可能限制技術(shù)的發(fā)展 ,例如,目前內(nèi)容挖掘技術(shù)的使用可能涉及著作權(quán)所禁止的復(fù)制行為,但是,上述沖突的原因,在于著作權(quán)法滯后于技術(shù)的發(fā)展,在著作權(quán)法關(guān)于禁止復(fù)制規(guī)定確立之初,技術(shù)的發(fā)展無(wú)法預(yù)見。 英國(guó)報(bào)告中指出,應(yīng)當(dāng)將著作權(quán)與科技發(fā)展相協(xié)調(diào),允許使用目前著作權(quán)法所禁止的內(nèi)容挖掘技術(shù)。[5]
4.2.3 內(nèi)容挖掘例外缺失,影響公共利益
內(nèi)容挖掘,是指由大型數(shù)據(jù)庫(kù)中精煉數(shù)據(jù),發(fā)現(xiàn)之前未知、或者具有潛在價(jià)值的信息。內(nèi)容挖掘可能涉及,結(jié)合關(guān)于水污染的期刊數(shù)據(jù)庫(kù),并獲得醫(yī)院的準(zhǔn)許,研究關(guān)于受污染影響的疾病發(fā)生問(wèn)題。內(nèi)容挖掘同樣有著廣泛的商業(yè)應(yīng)用。例如,信用卡公司可能發(fā)現(xiàn)特定航班的機(jī)票購(gòu)買與特定汽車之間的聯(lián)系,并制定包括合適促銷手段的市場(chǎng)計(jì)劃。[6]例如,研究已經(jīng)使用內(nèi)容挖掘技術(shù),通過(guò)分析社交媒介,探究社會(huì)情緒、公眾觀點(diǎn)等。亦有研究通過(guò)使用社交媒介,調(diào)研健康和疾病的發(fā)生。
Jerome Reichman和Ruth Okediji指出,在當(dāng)今科研環(huán)境下使用數(shù)字資源,存在私人權(quán)利和公共產(chǎn)品之間的矛盾。政策制定者發(fā)現(xiàn)將上游數(shù)據(jù)和信息資源視為公共產(chǎn)品,廣泛共享,以期產(chǎn)生更多的下游商業(yè)應(yīng)用,提高公共福利。與之相反,知識(shí)產(chǎn)權(quán)法禁止對(duì)于科學(xué)數(shù)據(jù)和文獻(xiàn)的接觸權(quán)。而科學(xué)研究方法論發(fā)展要求自動(dòng)的知識(shí)發(fā)現(xiàn)工具,而該工具建立在無(wú)拘束的接觸和重復(fù)復(fù)制基礎(chǔ)之上。[7]
英國(guó)學(xué)者Ian Hargreaves在獨(dú)立報(bào)告——《數(shù)字機(jī)遇:知識(shí)產(chǎn)權(quán)與發(fā)展之反思》中提出,鑒于數(shù)據(jù)挖掘具有較高的技術(shù)發(fā)展?jié)摿洼^強(qiáng)的實(shí)用價(jià)值,目前英國(guó)著作權(quán)法限制與例外已經(jīng)不能滿足技術(shù)發(fā)展的需要。[8]英國(guó)著作權(quán)法2014年6月的修訂過(guò)程中,增加了涉及數(shù)據(jù)挖掘著作權(quán)例外。英國(guó)著作權(quán)法數(shù)據(jù)挖掘復(fù)制例外制度,其概念為,對(duì)于有權(quán)接觸作品的主體,非商業(yè)研究的數(shù)據(jù)挖掘之復(fù)制行為,不構(gòu)成著作權(quán)侵權(quán)。英國(guó)著作權(quán)法修改,在原有條文基礎(chǔ)上增加29A款,即數(shù)據(jù)挖掘復(fù)制例外,對(duì)于數(shù)據(jù)挖掘復(fù)制例外的主體要件、目的要件、形式要件做出了規(guī)范。同時(shí),鑒于轉(zhuǎn)讓行為、非單一商業(yè)性使用行為、交易行為等可能威脅數(shù)據(jù)挖掘復(fù)制非商業(yè)性目的之例外情形做出規(guī)定,上述三種行為仍然構(gòu)成著作權(quán)侵權(quán)行為。英國(guó)著作權(quán)法將著作權(quán)挖掘例外制度存在對(duì)象僅限于數(shù)據(jù)挖掘例外、未規(guī)定合同條款及數(shù)字版權(quán)管理等不得限制挖掘例外的問(wèn)題,與《數(shù)字時(shí)代知識(shí)發(fā)現(xiàn)海牙宣言》相比,存在一定的滯后性。但是,鑒于《數(shù)字時(shí)代知識(shí)發(fā)現(xiàn)海牙宣言》為較為原則的框架性規(guī)定,研究英國(guó)數(shù)據(jù)挖掘例外仍對(duì)于中國(guó)完善大數(shù)據(jù)時(shí)代的著作權(quán)法有所裨益。
5.1 構(gòu)建內(nèi)容挖掘復(fù)制例外
日益增長(zhǎng)的電子計(jì)算機(jī)計(jì)算能力,使得人工智能機(jī)構(gòu)從擁有大量數(shù)據(jù),過(guò)渡到發(fā)現(xiàn)之前所未發(fā)現(xiàn)的重要信息,內(nèi)容挖掘?qū)⒃谥卮蠹膊〉念A(yù)防和治療、重大災(zāi)害的預(yù)報(bào)等關(guān)乎國(guó)計(jì)民生的關(guān)鍵領(lǐng)域發(fā)揮著日益重要的作用。我國(guó)著作權(quán)法第三次修改草案重新定義了復(fù)制權(quán),即以印刷、復(fù)印、錄制、翻拍以及數(shù)字化等任何方式將作品制作一份或者多份的權(quán)利。然而,“數(shù)字化”這一內(nèi)涵模糊的術(shù)語(yǔ),將使得我國(guó)著作權(quán)法面對(duì)內(nèi)容挖掘這一技術(shù)挑戰(zhàn),顯現(xiàn)出滯后性的特征。因此,我國(guó)有必要借鑒英國(guó)著作權(quán)法內(nèi)容挖掘復(fù)制例外制度,規(guī)定對(duì)于有權(quán)接觸作品的主體,進(jìn)行的非商業(yè)研究的內(nèi)容挖掘之復(fù)制行為,不構(gòu)成著作權(quán)侵權(quán)。
在內(nèi)容挖掘復(fù)制例外的主體要件,為對(duì)于作品有合法接觸權(quán)之主體。接觸權(quán)這一概念源自美國(guó)數(shù)字千年法案(Digital Millennium Copyright Act, DMCA)。該法案明確區(qū)分對(duì)于控制接觸技術(shù)的規(guī)避和對(duì)于權(quán)利保護(hù)技術(shù)的規(guī)避。接觸控制并非受到著作權(quán)的排他性保護(hù),而作品本身受到著作權(quán)的保護(hù)。
內(nèi)容挖掘復(fù)制例外應(yīng)當(dāng)包含對(duì)于作品有接觸權(quán)者復(fù)制,其復(fù)制之目的在于,對(duì)于作品中記錄的內(nèi)容進(jìn)行計(jì)算機(jī)分析。其內(nèi)涵應(yīng)當(dāng)能夠包括內(nèi)容挖掘的核心內(nèi)容,即尋找數(shù)據(jù)中的重要元素、精煉數(shù)據(jù)、發(fā)現(xiàn)數(shù)據(jù)規(guī)律和重要信息等。其次,內(nèi)容挖掘復(fù)制例外對(duì)于復(fù)制的手段加以限制,即僅限于依靠計(jì)算機(jī)的分析,避免在非大數(shù)據(jù)處理的傳統(tǒng)語(yǔ)境中,內(nèi)容挖掘復(fù)制例外可能對(duì)于著作權(quán)人產(chǎn)生的權(quán)利限制。內(nèi)容挖掘復(fù)制例外之目的要件,應(yīng)當(dāng)同時(shí)滿足為分析數(shù)據(jù)和內(nèi)容、單一非商業(yè)性目的兩個(gè)條件。所謂分析數(shù)據(jù)和內(nèi)容,是指對(duì)于作品有接觸權(quán)者復(fù)制,其復(fù)制之目的在于,對(duì)于作品中記錄的內(nèi)容進(jìn)行計(jì)算機(jī)分析,且僅限于依靠計(jì)算機(jī)的分析,避免在非大數(shù)據(jù)處理的傳統(tǒng)語(yǔ)境中,內(nèi)容挖掘復(fù)制例外可能對(duì)于著作權(quán)人產(chǎn)生的權(quán)利限制。所謂單一非商業(yè)性目的,是指不構(gòu)成侵權(quán)的復(fù)制,其目的應(yīng)為單一非商業(yè)性目的。
5.2 合同許可條款不得限制內(nèi)容挖掘
許可協(xié)議、合同條款不得規(guī)制和限制個(gè)人如何分析和使用事實(shí)、數(shù)據(jù)和思想,否則將導(dǎo)致對(duì)于創(chuàng)新和知識(shí)更新的損害。在以拆封合同、點(diǎn)擊合同為代表的網(wǎng)絡(luò)合同許可條款對(duì)于個(gè)人使用的限制之下,大數(shù)據(jù)時(shí)代的內(nèi)容挖掘受到一定的限制。應(yīng)當(dāng)規(guī)定大數(shù)據(jù)時(shí)代的內(nèi)容挖掘例外條款,不應(yīng)受合同條款之制約;限制內(nèi)容挖掘的合同條款,應(yīng)為無(wú)效條款。
以授權(quán)協(xié)議為基礎(chǔ)的數(shù)字版權(quán)管理措施,不應(yīng)對(duì)內(nèi)容挖掘亦造成一定程度的限制。我國(guó)《信息網(wǎng)絡(luò)傳播權(quán)條例》僅對(duì)于課堂教學(xué)研究、執(zhí)行公務(wù)、向盲人提供網(wǎng)絡(luò)作品、網(wǎng)絡(luò)安全測(cè)試四種目的允許實(shí)施技術(shù)措施規(guī)避行為。應(yīng)當(dāng)規(guī)定在內(nèi)容挖掘之下,對(duì)于數(shù)字版權(quán)管理措施之規(guī)避,以利于大數(shù)據(jù)之下非展示使用、非消費(fèi)使用、復(fù)制等行為的進(jìn)行,促進(jìn)生命安全、公共健康、節(jié)能環(huán)保、教育等方面的研發(fā)和創(chuàng)新。
5.3 構(gòu)建內(nèi)容挖掘復(fù)制例外之限制
鑒于數(shù)據(jù)挖據(jù)成果的價(jià)值潛在性,對(duì)于內(nèi)容挖掘復(fù)制例外,亦有必要加以嚴(yán)格的限制。對(duì)于存在轉(zhuǎn)讓行為、超越目的行為、交易行為的情形,內(nèi)容挖掘復(fù)制仍構(gòu)成著作權(quán)侵權(quán)。所謂轉(zhuǎn)讓行為,是指復(fù)制件被轉(zhuǎn)讓給其他任何主體,除非上述轉(zhuǎn)讓由著作權(quán)人授權(quán)。所謂交易行為,包括合法內(nèi)容挖掘復(fù)制之后的出售、出租,許諾出售、出租,或者為出售、出租而披露三種行為。對(duì)于合法內(nèi)容挖掘復(fù)制行為之后的上述三種交易行為,該復(fù)制件被認(rèn)為是基于上述目的之侵權(quán)復(fù)制件。其次,交易行為具有阻卻合法復(fù)制行為之效力。若合法復(fù)制之后的出售、出租,許諾出售、出租,或者為出售、出租而披露行為侵犯著作權(quán),復(fù)制件在上述行為之后的所有目的均被認(rèn)為是侵權(quán)。
5.4 構(gòu)建充分承認(rèn)制度
內(nèi)容挖掘復(fù)制例外,同時(shí)應(yīng)當(dāng)滿足充分承認(rèn)的形式要件,以保護(hù)著作權(quán)人的權(quán)利。所謂承認(rèn)的充分性,是指有合法接觸權(quán)的主體,對(duì)于內(nèi)容挖掘復(fù)制行為之承認(rèn),應(yīng)當(dāng)包括內(nèi)容挖掘之目的,內(nèi)容挖掘復(fù)制行為發(fā)生和結(jié)束之時(shí)間、地點(diǎn),內(nèi)容挖掘復(fù)制行為之客體等。充分承認(rèn)應(yīng)當(dāng)以書面形式進(jìn)行,其中,能夠以電子數(shù)據(jù)方式再現(xiàn)的,視為書面形式。充分承認(rèn)制度包含例外情形,即在特殊情形下如涉及國(guó)家安全、公共安全、緊急狀態(tài)等,可以不作出書面承認(rèn),但應(yīng)當(dāng)以書面形式明確記載該承認(rèn)不能之原因。
(來(lái)稿時(shí)間:2015年6月)
參考文獻(xiàn):
1. Perfect 10, Inc. v. Amazon.com, Inc., 508 F.3d 1146 (9th Cir. 2007).
2. Eleonora Rosati, Copyright: Google Books’ Library Project is fair use.Journal of Intellectual Property Law & Practice, 2014,9 (2):104-106
3. Jerome H. Reichman and Ruth Okediji, When Copyright Law and Science Collide: Empowering Digitally Integrated Research Methods on a Global Scale.Minnesota Law Review, 2012, 96:1362
4. 袁真富. 論數(shù)字版權(quán)管理的濫用及其限制——兼評(píng)微軟“黑屏”事件. 電子知識(shí)產(chǎn)權(quán),2008 (12):32-35
5, 8. Ian Hargreaves, Digital Opportunity: A Review of Intellectual Property and Growth,2011:4
6. 曲佳彬.大數(shù)據(jù)環(huán)境下高校圖書館服務(wù)轉(zhuǎn)型探析.圖書館學(xué)刊,2014(6):65-68
7. Jerome H. Reichman and Ruth Okediji, When Copyright Law and Science Collide: Empowering Digitally Integrated Research Methods on a Global Scale.Minnesota Law Review,2012, 96:1362
〔分類號(hào)〕G250
〔作者簡(jiǎn)介〕趙力(1984-),女,法學(xué)博士,天津科技大學(xué)法政學(xué)院講師,研究方向:國(guó)際經(jīng)濟(jì)法、國(guó)際知識(shí)產(chǎn)權(quán)法。
The Hague Declaration on Knowledge Discovery in the Digital Age and Its Reference
Zhao Li
( Tianjin University of Science and Technology )
〔Abstract 〕Content mining is the process of deriving information from machine-readable material. The Hague Declaration on Knowledge Discovery in the Digital Age points out that the copyright law has become a barrier to the content mining and constricts the access to data and ideas. Under the content mining technology, the copy and use of works will have the potential risks of infringing copyright. There are conflicting judgments in the cases in the U.S. and EU. The principles of the Hague Declaration should be referred to in the third modification of Chinese copyright in order to adapt to the content mining technology in the big data era.
〔Keyw ords 〕The Hague Declaration Content mining Exceptions