国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

國(guó)際出版商對(duì)文本和數(shù)據(jù)挖掘限制的正當(dāng)性辨析*

2016-08-11 10:18:38茹麗潔顧立平田鵬偉中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心北京100190
圖書(shū)館建設(shè) 2016年7期
關(guān)鍵詞:出版商許可權(quán)利

茹麗潔 顧立平 田鵬偉(中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心 北京 100190)

國(guó)際出版商對(duì)文本和數(shù)據(jù)挖掘限制的正當(dāng)性辨析*

茹麗潔 顧立平 田鵬偉(中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心 北京 100190)

隨著文本和數(shù)據(jù)挖掘技術(shù)的發(fā)展和廣泛應(yīng)用,其法律確定性問(wèn)題日益突出。一方面,國(guó)際出版商主張通過(guò)許可合同和API服務(wù)對(duì)文本和數(shù)據(jù)挖掘進(jìn)行限制,以保障著作權(quán)人的合法權(quán)益;另一方面,信息服務(wù)機(jī)構(gòu)和科研社群認(rèn)為出版商對(duì)文本和數(shù)據(jù)挖掘(TDM)施加的限制過(guò)于嚴(yán)苛,不利于研究和開(kāi)發(fā),因而缺乏正當(dāng)性,提出應(yīng)當(dāng)完善著作權(quán)例外制度。解決這一問(wèn)題需從以下方面入手:完善相關(guān)立法,平衡各方利益;出版商和信息服務(wù)機(jī)構(gòu)要從資源能力走向服務(wù)能力;各方應(yīng)加強(qiáng)溝通與協(xié)作,共同謀求公眾利益的最大化。

文本和數(shù)據(jù)挖掘 出版商 信息服務(wù)機(jī)構(gòu) 科研社群 著作權(quán)例外

1 引 言

文本和數(shù)據(jù)挖掘(Text and Data Mining,簡(jiǎn)稱(chēng)TDM)這一概念可以追溯到幾百甚至上千年前,從最初的手工操作方式發(fā)展到如今高度自動(dòng)化方式,其技術(shù)已取得空前的進(jìn)步。英國(guó)知識(shí)產(chǎn)權(quán)局將TDM定義為:“從機(jī)器的可讀資料中提取有價(jià)值信息的過(guò)程,涉及對(duì)資料的大量復(fù)制、數(shù)據(jù)的提取以及數(shù)據(jù)的整合,從而識(shí)別出特定模式?!保?]

利用TDM技術(shù)不但可以提高科研人員的效率、改進(jìn)研究過(guò)程、提升研究質(zhì)量,還能夠發(fā)掘其中的隱含信息,開(kāi)發(fā)新知識(shí),拓展研究視野,從而促進(jìn)經(jīng)濟(jì)增長(zhǎng)和社會(huì)進(jìn)步[2]。如今,越來(lái)越多的科研人員意識(shí)到TDM技術(shù)的價(jià)值,TDM技術(shù)的應(yīng)用已不僅僅局限于計(jì)算機(jī)科學(xué)領(lǐng)域,而是滲透到科學(xué)技術(shù)與人文社會(huì)等多個(gè)學(xué)科領(lǐng)域[3-6]。隨著TDM技術(shù)對(duì)科學(xué)研究的推動(dòng)作用日益突顯,科研人員對(duì)科研數(shù)據(jù)進(jìn)行挖掘的需求日益增強(qiáng)。然而,他們?cè)趯?shí)踐過(guò)程中卻經(jīng)常遇到來(lái)自政治、法律方面的阻礙。一方面,大多數(shù)出版商聲稱(chēng)其對(duì)數(shù)據(jù)資源享有著作權(quán)(或數(shù)據(jù)庫(kù)權(quán)),他們認(rèn)為T(mén)DM技術(shù)涉及對(duì)其資源的大規(guī)模讀取、下載、保存和重用,侵犯了其合法權(quán)益,應(yīng)當(dāng)通過(guò)許可合同對(duì)讀者的挖掘行為進(jìn)行規(guī)范。另一方面,一些信息服務(wù)機(jī)構(gòu)和科研社群認(rèn)為,讀者的TDM操作是基于出版商的訂閱內(nèi)容進(jìn)行的,讀者已經(jīng)向出版商支付了高額的訂閱費(fèi)用,閱讀的權(quán)利應(yīng)當(dāng)包括挖掘的權(quán)利,但出版商的許可合同中存在諸多問(wèn)題,限制了讀者獲取信息的自由。

2014年6月1日,英國(guó)修訂的著作權(quán)法正式生效,其中引入了1條特殊款項(xiàng),即合法訪(fǎng)問(wèn)數(shù)據(jù)資源的讀者以非商業(yè)目的進(jìn)行TDM行為不視為對(duì)著作權(quán)的侵犯,且無(wú)需獲得其他任何許可[7]。同年4月,歐盟委員會(huì)發(fā)布了1份建議在歐盟范圍內(nèi)推行TDM例外條款的報(bào)告[8]。TDM所涉及的法律問(wèn)題日益受到出版商與學(xué)術(shù)界的廣泛關(guān)注和激烈爭(zhēng)論,本文分別從出版商、信息服務(wù)機(jī)構(gòu)和科研社群3個(gè)角度來(lái)闡述各方對(duì)于TDM所涉及政策、法律問(wèn)題的主要觀點(diǎn)與依據(jù)。

2 國(guó)際出版商對(duì)用戶(hù)TDM權(quán)利的主張

2.1 通過(guò)許可合同實(shí)現(xiàn)TDM的法律確定性

目前,大多數(shù)國(guó)家或地區(qū)并未建立起完善的法律體系對(duì)TDM權(quán)利做出清晰的界定,TDM的法律不確定性是未來(lái)長(zhǎng)期存在的一個(gè)問(wèn)題,多數(shù)傳統(tǒng)出版商主張通過(guò)許可合同來(lái)解決TDM的法律確定性問(wèn)題。2013年2月,歐盟委員會(huì)舉辦了“歐洲許可證”利益相關(guān)者對(duì)話(huà),與會(huì)的出版商(如愛(ài)思唯爾、美國(guó)化學(xué)學(xué)會(huì)、英國(guó)醫(yī)學(xué)雜志出版集團(tuán)、牛津大學(xué)出版社等)希望就TDM問(wèn)題采用一種基于各方合作的“市場(chǎng)化方法”,他們承諾“為非商業(yè)研究人員針對(duì)其訂閱的內(nèi)容進(jìn)行文本和數(shù)據(jù)挖掘提供一定的便利,但需基于許可條款”[9]。2014年6月,歐洲出版商協(xié)會(huì)(Europe Publishers Council,簡(jiǎn)稱(chēng)EPC)明確反對(duì)通過(guò)著作權(quán)法來(lái)規(guī)定TDM的例外條款;EPC同時(shí)指出通過(guò)使用許可合同不但能完全滿(mǎn)足合法訪(fǎng)問(wèn)者進(jìn)行TDM的需求,還能夠適當(dāng)?shù)亟档颓謾?quán)和濫用的風(fēng)險(xiǎn)[10]。國(guó)際科技醫(yī)藥出版商聯(lián)盟(International Association of Scientific,Technical & Medical Publishers,簡(jiǎn)稱(chēng)STM)于2015年5月表示:(1)TDM的法律確定性已經(jīng)通過(guò)出版商許可合同來(lái)實(shí)現(xiàn);(2)以著作權(quán)法來(lái)制定TDM例外條款會(huì)破壞確保高質(zhì)量?jī)?nèi)容可用性的投資激勵(lì)機(jī)制[11]。

總之,大多數(shù)出版商主張通過(guò)許可合同來(lái)界定TDM的權(quán)利,其理由主要有以下幾點(diǎn):

首先,通過(guò)許可合同能對(duì)用戶(hù)的TDM行為進(jìn)行細(xì)致的規(guī)定,而TDM例外制度未必能夠?qū)DM的權(quán)利范圍給出精確的界定,如“非商業(yè)研究”的概念模糊不清,因而依然不能解決TDM的法律確定性問(wèn)題。

其次,TDM例外制度會(huì)破壞出版商對(duì)高質(zhì)量?jī)?nèi)容所提供的投資激勵(lì)機(jī)制。目前,許多出版商致力于向其用戶(hù)提供高質(zhì)量的學(xué)術(shù)內(nèi)容和安全、穩(wěn)定的服務(wù)體驗(yàn),投資開(kāi)發(fā)TDM平臺(tái),而TDM例外制度將對(duì)這一機(jī)制造成破壞。

最后,在國(guó)際競(jìng)爭(zhēng)和經(jīng)濟(jì)問(wèn)題方面,目前沒(méi)有明確證據(jù)表明缺乏TDM例外制度的國(guó)家會(huì)出現(xiàn)市場(chǎng)失靈、經(jīng)濟(jì)下滑或在國(guó)際競(jìng)爭(zhēng)中落后于某些有TDM例外制度的國(guó)家(如美國(guó)、加拿大、英國(guó)、日本、以色列等)的情況。

表1 Elsevier的TDM注冊(cè)登記表

2.2 使用出版商提供的API及平臺(tái)實(shí)施TDM

對(duì)于TDM實(shí)施的方式,多數(shù)傳統(tǒng)出版商(如Elsevier、EPC、STM等)主張通過(guò)專(zhuān)用的應(yīng)用程序接口(Application Programming Interface,簡(jiǎn)稱(chēng)API)或挖掘平臺(tái)等來(lái)提供TDM服務(wù)[12-13],稱(chēng)該方式更有利于滿(mǎn)足用戶(hù)的實(shí)際需求[14]。下面以Elsevier的TDM注冊(cè)登記表[15](見(jiàn)表1)為例進(jìn)行分析。

總體來(lái)說(shuō),Elsevier提供的API服務(wù)對(duì)訂閱用戶(hù)的TDM權(quán)利施加了比較嚴(yán)格的限定,具體可概括為以下3個(gè)方面:

(1)對(duì)挖掘范圍的限制。目前Elsevier提供的服務(wù)只針對(duì)XML格式的文本內(nèi)容,而圖像、圖表、交互信息、視頻等信息必須與利益相關(guān)方談判后按照個(gè)案處理。

(2)對(duì)挖掘過(guò)程的限制。Elsevier明確禁止使用自動(dòng)機(jī)器人程序抓取其網(wǎng)站內(nèi)容,并且對(duì)訪(fǎng)問(wèn)數(shù)量和訪(fǎng)問(wèn)頻率設(shè)置了比較嚴(yán)格的限制,如規(guī)定用戶(hù)每周進(jìn)行TDM的數(shù)量不得超過(guò)1萬(wàn)篇。

(3)對(duì)挖掘結(jié)果的限制。主要體現(xiàn)在對(duì)挖掘結(jié)果的重用性方面,盡管Elsevier規(guī)定可以將挖掘結(jié)果用于發(fā)表論文或存儲(chǔ)于機(jī)構(gòu)知識(shí)庫(kù)中,但并不能生成任何衍生成果,其目的在于避免對(duì)出版商的產(chǎn)品和服務(wù)造成競(jìng)爭(zhēng)性威脅。

相比之下,Springer的TDM政策相對(duì)寬松。Springer授予訂閱用戶(hù)以非商業(yè)研究為目的的TDM權(quán)利,文章的篩選可采用現(xiàn)有的檢索方法和工具,如Pubmed、Web of S cie n ce和S pr in ge r元數(shù)據(jù)AP I,研究人員可以從SpringerLink 平臺(tái)下載全文內(nèi)容且無(wú)需注冊(cè)API密鑰[16]。

此外,跨平臺(tái)許可問(wèn)題是許可合同存在的一個(gè)重要障礙,由于各出版商往往處于不同地域,其商業(yè)模式也不盡相同,TDM用戶(hù)與多家出版商談判會(huì)造成時(shí)間和精力的浪費(fèi)。CrossRef是一個(gè)基于DOI實(shí)現(xiàn)文獻(xiàn)引文跨出版商服務(wù)的非營(yíng)利機(jī)構(gòu),該機(jī)構(gòu)于2014年5月推出了一項(xiàng)免費(fèi)的CrossRef Prospect TDM服務(wù)[17],提供了兩種統(tǒng)一機(jī)制:首先是統(tǒng)一的API,利用統(tǒng)一的機(jī)制從多家出版商獲取全文內(nèi)容;其次是統(tǒng)一的許可框架,使研究人員在同一個(gè)門(mén)戶(hù)網(wǎng)站閱讀并同意多家出版商的使用條款。目前,已有5 000多家學(xué)術(shù)出版商及協(xié)會(huì)加入CrossRef[18]。美國(guó)著作權(quán)結(jié)算中心(Copyright Clearance Center,簡(jiǎn)稱(chēng)CCC)于2015年6月推出的RightFind平臺(tái)提供了另一種相對(duì)寬松的跨平臺(tái)解決方案[19]。該平臺(tái)提供XML格式的文本挖掘,允許科研人員在平臺(tái)上創(chuàng)建XML格式的全文數(shù)據(jù)集供文本挖掘,并將其導(dǎo)入第三方文本挖掘軟件。

總之,出版商堅(jiān)持要求TDM用戶(hù)采用指定的API及平臺(tái),其依據(jù)主要有以下兩點(diǎn):

第一,系統(tǒng)功能的角度。如果TDM用戶(hù)采用任意的第三方軟件在出版商數(shù)據(jù)庫(kù)平臺(tái)上進(jìn)行批量抓取或下載,將對(duì)其現(xiàn)有數(shù)據(jù)庫(kù)平臺(tái)造成巨大壓力,使正常訂閱用戶(hù)的訪(fǎng)問(wèn)速度明顯降低,從而損害他們本應(yīng)享有的權(quán)益,同時(shí)也加大了出版商違約的風(fēng)險(xiǎn)。因此,將TDM服務(wù)和數(shù)據(jù)庫(kù)平臺(tái)分而治之比較合理,這樣既能保障原有訂閱用戶(hù)的合同權(quán)益,又能為T(mén)DM用戶(hù)提供優(yōu)質(zhì)的服務(wù)。Elsevier認(rèn)為,20名TDM用戶(hù)同時(shí)對(duì)其網(wǎng)站進(jìn)行爬取將顯著影響其他訂閱用戶(hù)的正常使用[20]。Thomson Reuters表示,他們的系統(tǒng)并未達(dá)到允許第三方TDM程序爬取數(shù)據(jù)的環(huán)境,在此環(huán)境下進(jìn)行TDM將很有可能對(duì)其平臺(tái)造成嚴(yán)重?fù)p壞或?qū)е孪到y(tǒng)崩潰[20]。

第二,法律根據(jù)的角度。一些出版商進(jìn)一步從法律層面上闡釋要求使用API及平臺(tái)的合理性。以英國(guó)新修訂的《著作權(quán)法》中的例外條款為例,其解釋文件中明確指出:出版商和內(nèi)容提供商可以采取“合理措施”(reasonable measures)維護(hù)網(wǎng)絡(luò)安全和穩(wěn)定性,只要這些措施不妨礙或無(wú)理由限制科研人員復(fù)制TDM內(nèi)容的權(quán)利,使得研究人員能夠從這種非商業(yè)研究例外中獲益?!昂侠泶胧笨赡馨ê侠硐拗葡螺d速度、控制用戶(hù)在特定時(shí)間內(nèi)的訪(fǎng)問(wèn)量等[21]。也就是說(shuō),出版商可以在管理數(shù)據(jù)獲取方式的過(guò)程中發(fā)揮作用。按照Elsevier的觀點(diǎn),“合理措施”應(yīng)當(dāng)包括要求用戶(hù)使用特定的API[22]。此外,出版商嚴(yán)格區(qū)分“閱讀”和“挖掘”的概念,認(rèn)為這是兩種完全不同的信息活動(dòng),需要制定不同的許可合同和使用條款來(lái)明確TDM的權(quán)利范圍。

3 信息服務(wù)機(jī)構(gòu)對(duì)TDM權(quán)利的爭(zhēng)取

近年來(lái),信息服務(wù)機(jī)構(gòu)在推動(dòng)內(nèi)容重用和文本挖掘方面做了許多努力,尤其在資源的關(guān)聯(lián)、組織、集成與檢索等方面取得了可喜的進(jìn)展,然而,在實(shí)踐中卻遇到了來(lái)自資源封閉的障礙,信息服務(wù)機(jī)構(gòu)在多數(shù)情況下無(wú)權(quán)對(duì)訂閱資源進(jìn)行TDM,其法律不確定性是當(dāng)前的主要矛盾。

3.1 呼吁完善TDM例外制度

國(guó)際圖書(shū)館協(xié)會(huì)和機(jī)構(gòu)聯(lián)合會(huì)(International Federation of Library Associations,簡(jiǎn)稱(chēng)IFLA)表示,TDM的法律確定性只能通過(guò)著作權(quán)例外制度得以實(shí)現(xiàn),而非許可合同,只要TDM的結(jié)果不是對(duì)受版權(quán)保護(hù)原有作品的替換,研究人員就有權(quán)共享該類(lèi)研究成果[23]。2015年5月6日,歐洲研究圖書(shū)館協(xié)會(huì)(the Association of Europe Research Libraries,簡(jiǎn)稱(chēng)LIBER)發(fā)布了《數(shù)字時(shí)代知識(shí)發(fā)現(xiàn)海牙宣言》,提出讀者享有信息權(quán)、隱私權(quán)及挖掘權(quán)[24],旨在呼吁建立利于TDM發(fā)展的規(guī)則。LIBER同時(shí)指出,應(yīng)當(dāng)為商業(yè)研究建立類(lèi)似的TDM強(qiáng)制例外制度,這將極大提高企業(yè)的核心競(jìng)爭(zhēng)力[25]。

信息服務(wù)機(jī)構(gòu)主張完善TDM例外制度的理由主要有以下兩點(diǎn):

(1)許可合同的弊端。許可合同的靈活性過(guò)強(qiáng),某些出版商的許可合同明確禁止TDM;許可合同主要是針對(duì)個(gè)案,不易廣泛擴(kuò)展,且對(duì)于協(xié)議的長(zhǎng)期有效難以保證。此外,用戶(hù)點(diǎn)擊許可也存在嚴(yán)重弊端,這將增加用戶(hù)承擔(dān)責(zé)任的風(fēng)險(xiǎn),并且出版商大多會(huì)保留修改條款的權(quán)利,這也可能造成不公平限制的問(wèn)題。

(2)國(guó)際競(jìng)爭(zhēng)和經(jīng)濟(jì)問(wèn)題。目前,國(guó)際上一些國(guó)家已將TDM例外制度納入其法律體系中,如美國(guó)和加拿大主要基于合理使用框架,英國(guó)和日本則專(zhuān)門(mén)制定了相應(yīng)的TDM例外條款。由于明確了TDM的法律確定性,這些國(guó)家的科研人員將可能在國(guó)際競(jìng)爭(zhēng)中處于優(yōu)勢(shì)地位,TDM技術(shù)對(duì)經(jīng)濟(jì)增長(zhǎng)的貢獻(xiàn)也將逐漸顯現(xiàn)。另外,出版商應(yīng)將投資從許可合同的合規(guī)性監(jiān)控轉(zhuǎn)向更有意義的TDM研究開(kāi)發(fā)中去[26]。

3.2 反對(duì)限制使用挖掘工具與平臺(tái)

信息服務(wù)機(jī)構(gòu)對(duì)大多數(shù)出版商要求采用指定的API或挖掘平臺(tái)來(lái)限制TDM的做法持反對(duì)態(tài)度,因?yàn)檫@些API及平臺(tái)往往被施加了過(guò)多的限制,所以對(duì)用戶(hù)TDM造成了一定的阻礙,具體理由如下:

首先,在工具與平臺(tái)方面,信息服務(wù)機(jī)構(gòu)認(rèn)為API本身存在一些弊端。以Elsevier頒布的TDM政策為例,LIBER、EIFL(Electronic Information for Libraries,圖書(shū)館電子信息聯(lián)盟)等在回應(yīng)Elsevier的公開(kāi)信中表示,Elsevier的API注冊(cè)條款限制過(guò)于嚴(yán)苛,具體表現(xiàn)在以下3方面:(1)挖掘范圍。只允許挖掘文本,而更加豐富的圖片、圖表、交互內(nèi)容和視頻等可能蘊(yùn)含了大量有價(jià)值的信息。(2)挖掘過(guò)程。Elsevier明確禁止使用機(jī)器人、蜘蛛、爬蟲(chóng)或其他自動(dòng)化程序、算法,而這些是最常用的方式,這一規(guī)定限制了用戶(hù)的挖掘自由;還規(guī)定用戶(hù)每周的挖掘量不得超過(guò)1萬(wàn)篇,這個(gè)數(shù)量從比例上來(lái)看,簡(jiǎn)直微不足道。(3)挖掘結(jié)果。對(duì)原文片段的引用不得超過(guò)200字符,這可能會(huì)導(dǎo)致錯(cuò)引或?qū)υ佳芯匡@示的不準(zhǔn)確;科研人員不得不接受創(chuàng)作共享協(xié)議(Creative Commons, 簡(jiǎn)稱(chēng)CC)中CC-BY-NC(署名—非商業(yè)性使用)的許可方式,但非商業(yè)研究很難界定,因此LIBER認(rèn)為對(duì)于不受著作權(quán)保護(hù)的數(shù)據(jù)和事實(shí)最好采用CC0(公共領(lǐng)域貢獻(xiàn)宣告)許可;對(duì)挖掘結(jié)果的限制影響了研究成果的透明性和可重復(fù)性,而這些對(duì)于科學(xué)研究是至關(guān)重要的[27-28]。

其次,在系統(tǒng)功能方面,信息服務(wù)機(jī)構(gòu)認(rèn)為這一點(diǎn)可以通過(guò)技術(shù)手段升級(jí)和改進(jìn)其系統(tǒng)功能,且其難度并不大,目前出版商的基礎(chǔ)設(shè)施已經(jīng)能夠應(yīng)對(duì)大量訪(fǎng)問(wèn)服務(wù)器的需求,如Reddit[20]。隨著TDM數(shù)量的不斷增長(zhǎng),出版商的服務(wù)質(zhì)量將成為區(qū)分市場(chǎng)的一個(gè)關(guān)鍵因素,因此TDM應(yīng)當(dāng)是出版商未來(lái)發(fā)展的關(guān)鍵因素之一[29],信息服務(wù)機(jī)構(gòu)愿意幫助出版商解決這一問(wèn)題。

最后,在法律方面,以英國(guó)新修訂的《著作權(quán)法》為例,只要科研人員對(duì)著作有閱讀權(quán)限,就允許他們以計(jì)算和分析為目的復(fù)制任何具有著作權(quán)保護(hù)的資料,無(wú)需征得著作權(quán)所有人的許可[7]?!昂戏ㄔL(fǎng)問(wèn)”(lawful access)包括已經(jīng)訂閱了期刊、數(shù)據(jù)庫(kù)或者開(kāi)放許可(CC或開(kāi)放政府許可)的作品[21]。信息服務(wù)機(jī)構(gòu)認(rèn)為,Elsevier的技術(shù)限制在英國(guó)侵犯了讀者合法訪(fǎng)問(wèn)的權(quán)利。信息服務(wù)機(jī)構(gòu)普遍認(rèn)為,“閱讀的權(quán)利應(yīng)當(dāng)包括挖掘的權(quán)利”,機(jī)構(gòu)已經(jīng)投入大量精力和財(cái)力來(lái)談判、購(gòu)買(mǎi)相關(guān)資源,那么TDM只是簡(jiǎn)單地應(yīng)用計(jì)算機(jī)讀取資料與事實(shí),不能因?yàn)橛?jì)算機(jī)使用了復(fù)制技術(shù)就被認(rèn)為是觸犯了著作權(quán)及數(shù)據(jù)庫(kù)的相關(guān)法律[24-30]。此外,出版商還要求研究人員在填寫(xiě)注冊(cè)登記表時(shí)填寫(xiě)基本信息和項(xiàng)目描述,信息服務(wù)機(jī)構(gòu)擔(dān)心這可能侵犯了讀者的隱私權(quán),他們反對(duì)第三方機(jī)構(gòu)收集用戶(hù)的相關(guān)信息[27]。

4 科研社群對(duì)TDM權(quán)利的觀點(diǎn)

科研社群對(duì)待TDM政策、法律問(wèn)題的態(tài)度同信息服務(wù)機(jī)構(gòu)大致相同。多數(shù)學(xué)者從TDM的障礙著手,闡述出版商的TDM政策在實(shí)踐中存在的問(wèn)題。Brook等認(rèn)為,當(dāng)前TDM的非技術(shù)障礙是制約TDM應(yīng)用發(fā)展的主要因素,一方面,著作權(quán)、數(shù)據(jù)庫(kù)權(quán)法律不確定性的長(zhǎng)期存在,使得某些風(fēng)險(xiǎn)規(guī)避型研究人員出于對(duì)風(fēng)險(xiǎn)的考慮選擇不使用TDM工具; 另一方面,出版商的許可合同在實(shí)施過(guò)程中也存在一些弊端,如點(diǎn)擊許可、成果的復(fù)現(xiàn)性和隱私泄露等[31]。Dyas-Correia和Alexopoulos提出,研究人員在使用出版商提供的API時(shí)可能遇到一些問(wèn)題,如由于研究人員可能沒(méi)有充分了解信息服務(wù)機(jī)構(gòu)與其他利益相關(guān)者之間簽訂的協(xié)議,因此可能在不經(jīng)意間違反了相關(guān)許可合同;研究人員在請(qǐng)求訪(fǎng)問(wèn)進(jìn)行TDM時(shí),往往需要與多個(gè)利益相關(guān)方交涉;當(dāng)TDM涉及到下載大量資源時(shí),出版商很可能不愿提供授權(quán)許可或嚴(yán)格限制挖掘的數(shù)量[32]。Clark認(rèn)為,出版商要求網(wǎng)絡(luò)爬蟲(chóng)在連續(xù)下載文章時(shí)應(yīng)間隔5至10秒的延遲,這雖然看似合理,但它的可執(zhí)行性不高——連續(xù)下載1萬(wàn)篇文章預(yù)計(jì)需要4~8個(gè)月的時(shí)間[33]。

對(duì)于TDM的法律確定性究竟該通過(guò)TDM例外制度還是出版商的許可合同實(shí)現(xiàn),大多數(shù)學(xué)者表示前者更有利于實(shí)現(xiàn)公眾利益的最大化。盡管有少數(shù)學(xué)者對(duì)Elsevier的TDM政策表示歡迎,如Richard認(rèn)為“它解決了真正的技術(shù)問(wèn)題”[34]。但是,大多數(shù)學(xué)者并不能接受出版商嚴(yán)格的限制。歐洲研究型大學(xué)聯(lián)盟(League of European Research Universities,簡(jiǎn)稱(chēng)LERU)指出,當(dāng)前歐洲的著作權(quán)制度已經(jīng)不能適用數(shù)字環(huán)境下的需求,并呼吁在歐洲范圍內(nèi)建立基于訂閱內(nèi)容的TDM例外制度[30]。Keller表示,TDM的法律確定性應(yīng)由相關(guān)的法律明確規(guī)定,技術(shù)保護(hù)措施與許可條款不能超越這樣的法律例外[20]。Smith指出,TDM本質(zhì)上是自動(dòng)、快速閱讀和分析的過(guò)程,均處于合理使用范圍之內(nèi),而用許可合同的方式來(lái)實(shí)現(xiàn)TDM將會(huì)過(guò)度發(fā)揮其功效[35]。徐軒等建議將有權(quán)獲取的主體開(kāi)展的非商業(yè)性研究的數(shù)據(jù)挖掘行為納入我國(guó)著作權(quán)法復(fù)制權(quán)的合理使用范疇[36]。

5 總結(jié)與建議

5.1 關(guān)于TDM權(quán)利的爭(zhēng)議焦點(diǎn)及依據(jù)

本文通過(guò)研究發(fā)現(xiàn),出版商對(duì)TDM限制的正當(dāng)性以及采用何種方式規(guī)范TDM行為是爭(zhēng)議的焦點(diǎn)所在,目前大致存在兩種聲音:一種是以Elsevier為代表的出版商一方,他們堅(jiān)稱(chēng)許可合同完全能夠解決TDM的法律確定性問(wèn)題,通過(guò)使用出版商提供的API既能保證向用戶(hù)提供高質(zhì)量的服務(wù),又能確保原有數(shù)據(jù)庫(kù)的功能不受影響;另一種是以信息服務(wù)機(jī)構(gòu)和科研社群為代表的一方,他們認(rèn)為出版商實(shí)施的許可合同和API方式限制過(guò)于嚴(yán)格,侵犯了讀者本應(yīng)享有的權(quán)利,主張制定TDM法律例外規(guī)定而使TDM合法化。

筆者就爭(zhēng)議雙方的主要理由或依據(jù)做如下總結(jié),如表2所示。其中,TDM政策是否真的會(huì)影響經(jīng)濟(jì)發(fā)展或國(guó)際競(jìng)爭(zhēng),這一點(diǎn)在目前看來(lái)并沒(méi)有充分的數(shù)據(jù)給出證實(shí),更多的是基于經(jīng)驗(yàn)和理論上的預(yù)測(cè)或推斷,下結(jié)論也許還為時(shí)尚早。用戶(hù)采用第三方發(fā)掘軟件對(duì)出版商數(shù)據(jù)庫(kù)進(jìn)行直接挖掘是否一定會(huì)造成數(shù)據(jù)庫(kù)的癱瘓也不是雙方爭(zhēng)議的焦點(diǎn),并且我們相信隨著技術(shù)的進(jìn)步,這些問(wèn)題終究將得到解決。雙方爭(zhēng)議的重點(diǎn)主要在前兩個(gè)方面,出版商一方側(cè)重于強(qiáng)調(diào)用戶(hù)購(gòu)買(mǎi)了什么權(quán)利,從Elsevier的TDM政策來(lái)看,用戶(hù)僅僅購(gòu)買(mǎi)到了緩存、瀏覽、打印以及在PDF上進(jìn)行單詞搜索的權(quán)利,而基于數(shù)據(jù)的挖掘權(quán)利則需通過(guò)另外的許可合同才能進(jìn)行。而信息服務(wù)機(jī)構(gòu)和科研社群的一方側(cè)重于強(qiáng)調(diào)讀者本應(yīng)享有的權(quán)利,他們達(dá)成的共識(shí)是“閱讀的權(quán)利包括挖掘的權(quán)利”,高校和科研機(jī)構(gòu)每年花費(fèi)大量的資金購(gòu)買(mǎi)電子期刊等資源,那么機(jī)構(gòu)在訂閱這些數(shù)字資源時(shí)到底購(gòu)買(mǎi)的是什么?既然機(jī)構(gòu)支付了電子訂閱費(fèi),那么就應(yīng)該對(duì)其所訂閱的內(nèi)容具有使用權(quán)。

表2 爭(zhēng)議雙方的主要依據(jù)

5.2 發(fā)展建議

盡管各方就TDM權(quán)利問(wèn)題的爭(zhēng)議還未有定論,但這一問(wèn)題日益受到各界的廣泛關(guān)注和積極討論,本文提出以下建議:

(1)完善相關(guān)立法,平衡各方利益。TDM的權(quán)利爭(zhēng)議是數(shù)字時(shí)代背景下產(chǎn)生的新問(wèn)題,是舊的法律法規(guī)難以解決和應(yīng)付的。對(duì)TDM進(jìn)行一定的限制和規(guī)范是必要的,知識(shí)產(chǎn)權(quán)的本質(zhì)是保護(hù)權(quán)利人的合法權(quán)益,避免資源的濫用,從而促進(jìn)科技進(jìn)步和人類(lèi)智慧的發(fā)展;然而,知識(shí)產(chǎn)權(quán)也是一把雙刃劍,如果過(guò)度地保護(hù)就可能會(huì)阻礙知識(shí)的傳播,損害公眾利益。因此,明確TDM的法律確定性問(wèn)題是目前的當(dāng)務(wù)之急,而對(duì)于具體的實(shí)現(xiàn)方式,筆者認(rèn)為最終還是要上升到法律層面,通過(guò)完善各國(guó)家、地區(qū)的相關(guān)例外制度或合理使用框架,明確TDM行為的合理使用邊界和判斷標(biāo)準(zhǔn),盡量平衡各利益相關(guān)方的利益,為T(mén)DM的發(fā)展提供良好的法律環(huán)境。出版商提供的許可合同過(guò)于靈活,不同的出版商的許可合同中對(duì)TDM的規(guī)定不盡相同,在實(shí)踐中可能會(huì)遇到諸多問(wèn)題。當(dāng)然,法律法規(guī)也不可能面面俱到,因而許可合同可作為法律法規(guī)在具體實(shí)踐中的有益補(bǔ)充。

(2)從資源能力走向服務(wù)能力?;ヂ?lián)網(wǎng)的飛速發(fā)展與大數(shù)據(jù)時(shí)代的到來(lái)為T(mén)DM開(kāi)啟了新的征程,也為其帶來(lái)了新的挑戰(zhàn)。無(wú)論是出版商還是信息服務(wù)機(jī)構(gòu),都應(yīng)當(dāng)逐漸從資源能力走向服務(wù)能力。對(duì)于出版商而言,未來(lái),資源將進(jìn)一步開(kāi)放化,傳統(tǒng)的出版形式也將逐漸被數(shù)字出版所取代,因此出版商應(yīng)當(dāng)順應(yīng)數(shù)字時(shí)代的大趨勢(shì),對(duì)資源進(jìn)行適當(dāng)開(kāi)放并實(shí)現(xiàn)技術(shù)連通。如果出版商一味追求以封閉的資源來(lái)謀取短期利益,則將在長(zhǎng)期競(jìng)爭(zhēng)中處于劣勢(shì)。對(duì)于信息服務(wù)機(jī)構(gòu)來(lái)說(shuō),應(yīng)當(dāng)以用戶(hù)的需求為基本出發(fā)點(diǎn),善用技術(shù)的手段解決實(shí)際問(wèn)題,進(jìn)一步發(fā)展內(nèi)容重用和文本挖掘技術(shù),提升其TDM服務(wù)能力。

(3)合作共贏,實(shí)現(xiàn)公眾利益的最大化。筆者認(rèn)為,雖然出版商與信息服務(wù)機(jī)構(gòu)、科研社群關(guān)于TDM權(quán)益沖突是自然存在的,但雙方并非完全對(duì)立。在TDM問(wèn)題中,出版商具有先天的資源優(yōu)勢(shì),科研社群是目標(biāo)用戶(hù),而信息服務(wù)機(jī)構(gòu)在二者之間起到橋梁的作用,一方面從出版商處購(gòu)買(mǎi)資源,另一方面為用戶(hù)提供服務(wù),因此應(yīng)當(dāng)找到三者的有效對(duì)接點(diǎn):首先是在政策和制度上的對(duì)接,無(wú)論是出版商還是信息服務(wù)機(jī)構(gòu)、科研社群的TDM解決方案并非是十全十美的,如出版商對(duì)TDM施加了過(guò)于嚴(yán)格的限制,使用戶(hù)在實(shí)踐中遇到了很大阻力;但不能對(duì)資源完全不加限度地開(kāi)放或允許TDM,如LIBER提倡的CC0許可合同可能并不適用于所有的資源或挖掘場(chǎng)景。其次是技術(shù)和方法上的對(duì)接,包括在資源格式、元數(shù)據(jù)標(biāo)準(zhǔn)等方面的統(tǒng)一,在數(shù)據(jù)庫(kù)功能和負(fù)載等問(wèn)題上也要提出合理的解決方案。值得注意的一點(diǎn)是,大多數(shù)的科學(xué)研究是由政府公共資金支持的,因此本文呼吁出版商、信息服務(wù)機(jī)構(gòu)和科研社群加強(qiáng)彼此之間的合作與協(xié)調(diào),最大限度地發(fā)揮公共資金的效用,共同謀求公眾利益的最大化。

[1]UK Intellectual Property Office. Text Mining and Data Analytics in Call for Evidence Responses [EB/OL]. (2014-07-29)[2015-12-27]. http://www.ipo.gov.uk/ipreview-doc-t.pdf.

[2]McDonald D, Kelly U. The Value and Benefits of Text Mining [EB/OL]. (2012-03-14)[2015-12-27]. https://www.jisc.ac.uk/ reports/value-and-benefits-of-text-mining.

[3]Karimi S, Wang C, Metke-Jimenez A, et al. Text and Data Mining Techniques in Adverse Drug Reaction Detection[J]. Acm Computing Surveys, 2015,47(4):1-39.

[4]Ju Yonghan, Sohn S Y. Identifying Patterns in Rare Earth Element Patents Based on Text and Data Mining[J]. Scientometrics,2015,102(1): 389-410.

[5]Vijayakrishnan R, Steinhubl S R, Ng K, et al. Prevalence of Heart Failure Signs and Symptoms in a Large Primary Care Population Identified Through the Use of Text and Data Mining of the Electronic Health Record[J]. Journal of Cardiac Failure, 2014, 20 (7):459-464.

[6]Giój n-Correas J A, Andrade-Navarro M A, Fontaine J F. Alkemio:Association of Chemicals with Biomedical Topics by Text and Data Mining[J]. Nucleic Acids Research, 2014,42(5): 422-429.

[7]UK Government. Intellectual Property Guidance: Exceptions to Copyright [EB/OL]. [2016-01-30]. https://www.gov.uk/guidance/ exceptions-to-copyright.

[8]Triaille J P, Argenteuil J, Francquen de A. Study on the Legal Framework of Text and Data Mining (TDM) [EB/OL]. [2015-12-28]. http://ec.europa.eu/internal_market/copyright/docs/ studies/1403_study2_en.pdf.

[9]European Commission. Licences for Europe[EB/OL]. (2013-11-13) [2015-12-27]. http://ec.europa.eu/internal_market/copyright/ docs/licences-for-europe/131113_ten-pledges_en.pdf.

[10]European Publishers Council. Copyright Enabled on the Network [EB/OL]. [2015-12-27]. http://www.leru.org/files/general/ EPC%20Copyright%20Vision%202014_final.pdf.

[11]STM. Text and Data Mining in the EU: Legal Certainty Already Exists[EB/OL]. (2015-05-19) [2015-12-27]. http://www.stmassoc.org/2015_05_19_News_Release_Text_Mining_ in_the_ EU_STM_Association_Reaction.pdf.

[12]Elsevier. Text and Data Mining[EB/OL]. [2015-12-27].https:// www.elsevier.com/about/company-information/policies/textand-data-mining.

[13]Publishers Licensing Society. PLSclear TDM[EB/OL]. [2015-12-27].http://www.pls.org.uk/services/text-and-data-mining/.

[14]STM. Text and Data Mining for Non-Commercial Scientific Research[EB/OL]. (2015-11-10) [2015-12-27].http://www. stm-assoc.org/2015_11_10_Text_and_ Data_Mining_ Declaration.pdf.

[15]Elsevier. Elsevier Text and Data Mining (TDM) Registration Form[EB/OL]. [2015-12-27]. https://www.elsevier.com/__data/ assets/pdf_file/0012/102234/TDM-sign-up-short-form.pdf.

[16]Springer. Springer's Text- and Data-Mining Policy[EB/OL]. [2015-12-27].http://www.springer.com/gb/rights-permissions/ springer-s-text-and-data-mining-policy/29056.

[17]CrossRef. CrossRef Text and Data Mining Services[EB/OL]. [2015-12-27]. http://tdmsupport.crossref.org/.

[18]CrossRef. Publishers and Societies[EB/OL]. [2016-02-07]. http:// www.crossref.org/01company/06publishers.html.

[19]Copyright Clearance Center. Copyright Clearance Center Launches Text Mining Solution[EB/OL]. [2016-01-04].http:// www.copyright.com/copyright-clearance-center-launchestext-mining-solution/.

[20]European Commission. Text and Data Mining: Report from the Expert Group[EB/OL]. [2015-12-28].http://ec.europa.eu/ research/innovation-union/pdf/TDM-report_from_the_expert_ group-042014.pdf#view=fit&pagemode=none.

[21]UK Intellectual Property Office. Exceptions to Copyright:Research[EB/OL].[2015-12-28]. https://www.gov.uk/ government/uploads/system/uploads/attachment_data/file/ 375954/Research.pdf.

[22]Hersh G. How does Elsevier's Text Mining Policy Work with New UK TDM Law? [EB/OL]. (2014-06-09) [2015-12-30]. https://www.elsevier.com/connect/how-does-elseviers-textmining-policy-work-with-new-uk-tdm-law.

[23]IFLA. IFLA Statement on Text and Data Mining[EB/OL]. (2013-12-19)[2016-01-04].http://www.ifla.org/publications/iflastatement-on-text-and-data-mining-2013.

[24]LIBER. The Hague Declaration on Knowledge Discovery in the Digital Age [EB/OL]. (2015-05-06)[2016-01-04]. http:// thehaguedeclaration.com/wp-content/uploads/sites/2/2015/04/ Liber_DeclarationA4_2015.pdf.

[25]LIBER. LIBER Responds to Elsevier's Text and Data Mining Policy[EB/OL]. (2014-03-28) [2016-01-04].http://www. libereurope.eu/news/liber-response-to-elsevier's-text-anddata-mining-policy.

[26]LIBER. LIBER Response to STM Statement on Text and Data Mining[EB/OL]. (2015-06-09) [2016-01-04].http:// libereurope.eu/blog/2015/06/09/liber-response-to-stmstatement-on-text-and-data-mining/.

[27]LIBER. Realising the Innovative Potential of Digital Research Methods: A Call from the Research Community[EB/OL]. (2014-07-01) [2016-01-04]. http://libereurope.eu/wp-content/uploads/ 2014/07/Open-Letter-To-Elsevier1.pdf.

[28]LIBER. Response to Elsevier's Text and Data Mining Policy: A LIBER Discussion Paper[EB/OL]. (2014-03-28) [2016-01-04]. http://libereurope.eu/wp-content/uploads/2014/04/ TDMdiscussionpaper-final1.pdf.

[29]LIBER. Workshop Report from the Perfect Swell: Defining the Ideal Conditions for the Growth of Text and Data Mining in Europe. [EB/OL]. (2013-10-29) [2016-01-04]. http:// libereurope.eu/blog/2013/10/29/workshop-report-from-theperfect-swell-defining-the-ideal-conditions-for-the-growthof-text-and-data-mining-in-europe/.ERBER.

[30]LERU. LERU Statement: The Right to Read is the Right to Mine [EB/OL]. (2015-06-17) [2016-01-04]. http://www.leru.org/files/ general/LERU%20statement%20-%20The%20Right% 20to%20Read%20is%20the%20Right%20to%20Mine.pdf.

[31]Brook M, Murray-Rust P, Oppenheim C. The Social, Political and Legal Aspects of Text and Data Mining (TDM)[J]. D-Lib Magazine, 2014,20(11):1-9.

[32]Dyas-Correia S, Alexopoulos M. Text and Data Mining: Searching for Buried Treasures[J]. Serials Review, 2014,40(3):210-216.

[33]Clark J. Text Mining and Scholarly Publishing[EB/OL]. [2016-01-03]. http://www.publishingresearch.org.uk/documents/ PRCTextMiningandScholarlyPublishinFeb2013_000.pdf.

[34]Richard V N. Elsevier Opens Its Papers to Text-Mining[J]. Nature,2014,506(748):17.

[35]Bernhardt B, Herndon J, Herron P, et al. Revolutionizing Scholarship: A Panel Discussion on Text and Data Mining[J]. Serials Review, 2015,41(3):184-186.

[36]徐 軒, 孫益武. 英國(guó)數(shù)據(jù)挖掘著作權(quán)例外條款研究及其啟示[J].圖書(shū)館建設(shè), 2015(9):10-14.

Analysis on Properness of International Publishers Restricting Text and Data Mining

With the development and application of text and data mining technology, its legal certainty issue has become increasingly acute. On the one hand, international publishers claim to restrict text and data mining through licensing contract and API service, so as to protect the legitimate interest of copyright holders. On the other hand, information service institutions and researcher groups consider that publishers's restriction on Text and Data Mining(TDM) is too restrict to carry out research and development, therefore, it is lack of legitimacy, system of copyright exception should be improved. This problem would be solved from the following aspects: improving relecant legislation, balancing the interests among all parties, publishers and information service institutions should enhance the service ability instead of resources, and all parties should strengthen communication and coordination to maximize the public interest.

Text and data mining; Publisher; Information service institution;Researcher group;Copyright exception

G250

A

*本文系中國(guó)科學(xué)院文獻(xiàn)情報(bào)出版領(lǐng)域擇優(yōu)支持人才項(xiàng)目的研究成果之一,項(xiàng)目編號(hào):院1434。

茹麗潔 女,1992年生,中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心2014級(jí)情報(bào)學(xué)專(zhuān)業(yè)碩士研究生。

顧立平 男,1978年生,博士,中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心科技信息政策中心副主任,副研究館員,研究方向?yàn)橹R(shí)產(chǎn)權(quán)與著作權(quán)、科研數(shù)據(jù)權(quán)益管理、開(kāi)放獲取政策。

田鵬偉 男,1990年生,中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心2015級(jí)情報(bào)學(xué)專(zhuān)業(yè)碩士研究生。

2016-03-07 ]

猜你喜歡
出版商許可權(quán)利
版權(quán)許可聲明
版權(quán)許可聲明
版權(quán)許可聲明
我們的權(quán)利
本期作者介紹
論不存在做錯(cuò)事的權(quán)利
法大研究生(2018年2期)2018-09-23 02:19:50
歐盟對(duì)谷歌新聞?wù)鞫惡翢o(wú)意義
權(quán)利套裝
Coco薇(2015年12期)2015-12-10 02:43:39
七成軟件出版商轉(zhuǎn)向云服務(wù)
了解自己
通榆县| 林口县| 海淀区| 天气| 文登市| 慈溪市| 防城港市| 安义县| 门头沟区| 茶陵县| 蒙阴县| 临澧县| 彰化县| 新安县| 吴忠市| 化德县| 柘城县| 兴业县| 玉门市| 疏勒县| 长岭县| 咸宁市| 南漳县| 濮阳市| 镇江市| 调兵山市| 许昌市| 凤台县| 竹北市| 新和县| 措美县| 淳安县| 渝中区| 昌黎县| 连城县| 出国| 大丰市| 深圳市| 竹溪县| 富民县| 基隆市|