●臧國全,閆 勵(鄭州大學(xué)信息管理學(xué)院,鄭州450001)
電子圖書長期保存的困擾
●臧國全,閆 勵(鄭州大學(xué)信息管理學(xué)院,鄭州450001)
電子圖書;數(shù)字保存;數(shù)字保存質(zhì)量
電子圖書長期保存既存在一些共性的困擾,也有針對不同類型電子圖書的特殊困擾。共性困擾主要來自于電子圖書的虛擬化擁有屬性、電子圖書的格式多樣化、數(shù)字產(chǎn)權(quán)管理等。數(shù)字轉(zhuǎn)換型電子圖書的特殊困擾主要來自數(shù)字轉(zhuǎn)換質(zhì)量。純電子圖書的特殊困擾主要來自自助出版模式、電子圖書包含的內(nèi)嵌對象、內(nèi)容的穩(wěn)定性、呈繳本制度、電子圖書唯一標(biāo)識符等?;谝蛱鼐W(wǎng)的集體創(chuàng)作型電子圖書的特殊困擾主要來自產(chǎn)權(quán)許可、保存價(jià)值、保存動機(jī)缺失等。
總體上講,電子圖書可以分為三類:傳統(tǒng)圖書進(jìn)行數(shù)字轉(zhuǎn)換而成的電子圖書;純電子圖書;基于因特網(wǎng)的集體創(chuàng)作型電子圖書。這三類電子圖書在長期保存過程中,既存在一些共性的困擾,每類電子圖書也存在一些特殊的困擾。
1.1 電子圖書的虛擬化擁有屬性對用戶長期訪問的困擾
電子圖書的“銷售”本質(zhì)導(dǎo)致了對其“擁有”的虛擬化。針對傳統(tǒng)紙介質(zhì)圖書,用戶購買就意味著擁有了圖書的物理實(shí)體,這種擁有是“實(shí)在”的。但對于電子圖書,用戶購買的結(jié)果僅僅是擁有一段時(shí)間的訪問許可權(quán),并不真正擁有構(gòu)成該書的二進(jìn)制字節(jié)流,這種以二進(jìn)制字節(jié)流表現(xiàn)出的電子圖書存在于云端服務(wù)器中。因此,這種擁有是“虛擬”的。著名的電子圖書銷售商Amazon在其銷售條款中明確聲明,[1]“Kindle電子圖書的銷售是由內(nèi)容提供商將其電子圖書內(nèi)容許可給用戶,而不是賣給用戶”。
電子圖書的虛擬化擁有屬性對最終用戶的長期訪問帶來困擾。比如,一個圖書館購買電子圖書,用戶想要永久訪問,圖書館就需要持續(xù)向電子圖書平臺繳費(fèi),這種銷售與購買的商業(yè)模式對圖書館最終用戶的長期訪問許諾的實(shí)現(xiàn)是不靠譜的。原因有三:一是費(fèi)用繳納的可持續(xù)性取決于圖書館的經(jīng)費(fèi)狀況,一旦經(jīng)費(fèi)缺乏將可能終止用戶的訪問;二是即使一次性購買了永久訪問權(quán),但電子圖書是一種數(shù)字資源,眾多因素都可能會導(dǎo)致數(shù)字資源的消失,一旦消失,也無法繼續(xù)提供訪問;三是一些電子圖書中內(nèi)嵌了眾多的多媒體文件,現(xiàn)行的商業(yè)化許可協(xié)議中沒有設(shè)立明確的這類數(shù)字對象永久和不可撤銷的轉(zhuǎn)移給保存系統(tǒng)的許可條款,一旦電子圖書內(nèi)嵌的數(shù)字對象產(chǎn)權(quán)擁有者提出產(chǎn)權(quán)質(zhì)疑,將可能會對最終用戶的訪問帶來影響。
1.2 電子圖書的格式多樣化對用戶訪問的困擾
出版商為了經(jīng)濟(jì)效益,出版發(fā)行的電子圖書大多都采用其專有格式,格式的多樣化對保存機(jī)構(gòu)和最終用戶而言都會帶來困擾。
對于保存機(jī)構(gòu),多樣的格式會造成對出版機(jī)構(gòu)的依賴,如果出版機(jī)構(gòu)停止對瀏覽軟件的支持,就會使對應(yīng)格式的電子圖書無法使用。比如,微軟生產(chǎn)的LIT格式電子圖書,瀏覽軟件為Microsoft Reader,[2]2012年,微軟已停止該瀏覽軟件的生產(chǎn),導(dǎo)致保存機(jī)構(gòu)必須對保存的LIT格式的電子書進(jìn)行數(shù)字遷移,否則就無法保證該格式電子圖書的訪問。
對于最終用戶,格式的多樣化限制了用戶的訪問,用戶需要下載專用瀏覽器才能對相應(yīng)電子圖書訪問,給用戶帶來困擾。例如,Kindle不支持常用電子圖書的專用格式EPUB;iBooks格式只能在iBooks和IBooks Author中使用;超星的電子圖書使用的PDF變種格式PDG和PDZ只能在超星的SsReader中使用。如果用戶對多種格式的電子書都有需求,就需要安裝多個瀏覽軟件。
為了簡化管理,保存機(jī)構(gòu)常常將多種格式遷移為一種格式。但格式遷移存在一定風(fēng)險(xiǎn),可能由于格式不兼容造成電子圖書視覺效果的改變(如文本加粗,斜體和字體顏色)以及電子圖書質(zhì)量的下降(如圖像分辨率降低),甚至導(dǎo)致內(nèi)容的丟失。
1.3 數(shù)字產(chǎn)權(quán)管理對保存內(nèi)容的困擾
數(shù)字產(chǎn)權(quán)管理(DRM)技術(shù)用于電子圖書之中的目的是保存該類圖書的商業(yè)化知識產(chǎn)權(quán)。電子圖書保存許可中使用DRM,將限制用戶以特定的方式對電子圖書的訪問,比如訪問的頻率、持續(xù)時(shí)間以及對產(chǎn)權(quán)轉(zhuǎn)移的限制和對電子圖書復(fù)制的限制等。DRM也可防止電子圖書的篡改,比如對電子圖書的二進(jìn)制數(shù)據(jù)流進(jìn)行加密,添加數(shù)字水印以跟蹤電子圖書的使用,從而及時(shí)發(fā)現(xiàn)電子圖書的非法盜版。在用的電子圖書DRM方案有多個,比較著名的有Adobe Adept的DRM和Amazon的DRM。[3]在很多情況下,DRM由第三方管理,而不是由電子圖書出版者直接管理。
DRM對電子圖書的保存構(gòu)成了挑戰(zhàn)。從商業(yè)模式角度講,如果電子圖書的銷售是基于DRM進(jìn)行監(jiān)控的有限制的使用,那么,保存機(jī)構(gòu)對基于這種銷售模式的電子圖書保存權(quán)的許可價(jià)值將會降低;從技術(shù)角度講,DRM將阻礙電子圖書的可保存性。另外,數(shù)字產(chǎn)權(quán)技術(shù)的改變可以被認(rèn)為是電子圖書格式過時(shí)的一種特殊案例。這些挑戰(zhàn)已經(jīng)對電子圖書的保存形成了現(xiàn)實(shí)威脅,Adobe已經(jīng)宣布DRM技術(shù)的變遷不具向后兼容性。
如果電子圖書的提交版本應(yīng)用了DRM(比如加密、水印等),并且保存機(jī)構(gòu)又無法從電子圖書保存版本中除掉DRM,那么,電子圖書對于瀏覽者來說是有質(zhì)量缺陷的(如模糊不清)。對于這種電子圖書的長期保存只能是純字節(jié)式的,并且電子圖書的內(nèi)容變得難以理解。
2.1 傳統(tǒng)圖書進(jìn)行數(shù)字轉(zhuǎn)換而成的電子圖書
這類電子圖書基于的數(shù)字轉(zhuǎn)換方法主要是數(shù)字掃描或數(shù)字拍照,存在的形式主要是圖像文件或基于OCR識別的文本文件。與其他類型電子圖書相比,這類電子圖書長期保存的主要困擾是數(shù)字轉(zhuǎn)換的質(zhì)量。
數(shù)字轉(zhuǎn)換的質(zhì)量主要受下述幾個因素影響。(1)原始文獻(xiàn)的質(zhì)量,如果原始文獻(xiàn)本身存在污損、缺頁等問題,在數(shù)字轉(zhuǎn)換之前需要進(jìn)行去污、補(bǔ)齊等相應(yīng)處理。(2)硬件設(shè)備的性能,硬件設(shè)備包括數(shù)碼相機(jī)和掃描儀等,它們所具有的性能限制可能對數(shù)字轉(zhuǎn)換的質(zhì)量造成重大影響,如像素和分辨率的限制會影響對原始文獻(xiàn)中最小字符和最有意義信息細(xì)節(jié)的抓取程度。(3)圖像質(zhì)量增強(qiáng)處理軟件的功能,轉(zhuǎn)換所得的數(shù)字圖像需要采用這類軟件進(jìn)行圖像質(zhì)量增強(qiáng)處理,包括去網(wǎng)紋、去斑點(diǎn)、糾正偏斜、銳化、位元深度調(diào)整等,軟件功能的缺失會影響質(zhì)量增強(qiáng)處理的效果。(4)文本轉(zhuǎn)換軟件的準(zhǔn)確度,針對最終需求為文本的數(shù)字轉(zhuǎn)換,還需OCR識別,雖然不同的OCR識別軟件的準(zhǔn)確度不同,但可以肯定都不會達(dá)到100%。(5)數(shù)字轉(zhuǎn)換場所的物理環(huán)境,包括照明、濕度、氣溫等,比如,照明是對采用數(shù)字拍照進(jìn)行數(shù)字轉(zhuǎn)換所得數(shù)字圖像質(zhì)量的一個重要影響因素。(6)數(shù)字轉(zhuǎn)換操作人員的專業(yè)性,包括專業(yè)技能和工作態(tài)度,比如,由操作人員人工設(shè)定的黑白掃描模式中的閾值會對數(shù)字轉(zhuǎn)換所得圖像的質(zhì)量產(chǎn)生影響,如果設(shè)定得當(dāng)可以最大限度地減少線條失落或線條粘連現(xiàn)象。
針對這類電子圖書的最佳質(zhì)量要求應(yīng)該是傳統(tǒng)紙介質(zhì)圖書的等質(zhì)量替代品。但是,基于上述分析,眾多因素都會產(chǎn)生質(zhì)量降低的風(fēng)險(xiǎn),因此,幾乎可以肯定這類電子圖書的質(zhì)量都會低于對應(yīng)的傳統(tǒng)圖書質(zhì)量,只是質(zhì)量降低的程度不同而已。
2.2 純電子圖書
這類電子圖書沒有對應(yīng)的紙介質(zhì)印刷版,幾乎將網(wǎng)絡(luò)銷售作為唯一的傳播渠道,一個著名的例子是亞馬遜銷售的大部分電子圖書。
2.2.1 自助出版模式給保存機(jī)構(gòu)帶來的困擾
隨著亞馬遜自助出版服務(wù)(Kindle Direct Publishing[4])、電子圖書的在線出版網(wǎng)站(NOOK Press[5])和蘋果自助出版服務(wù)(iBooks Author[6])的出現(xiàn),個人自助出版電子圖書變得非常簡單方便。越來越多的個人使用自助出版模式,正如Klems報(bào)道,[7]美國出版信息服務(wù)商Bowker公司的市場研究數(shù)據(jù)表明,自助出版的電子圖書數(shù)量每年呈指數(shù)增長,保守估計(jì)2013年新增的自助出版圖書達(dá)到了235,000多種。但由于這類出版方式的很多電子圖書都沒有ISBN號,導(dǎo)致難以精確統(tǒng)計(jì)。
由于自助出版的電子圖書是以標(biāo)準(zhǔn)的電子圖書格式進(jìn)行創(chuàng)作與發(fā)布的,所以,主流平臺的自助出版電子圖書的長期保存沒有額外的技術(shù)挑戰(zhàn)。然而,這種出版模式對保存機(jī)構(gòu)構(gòu)成了挑戰(zhàn),因?yàn)楸4鏅C(jī)構(gòu)需要與每種電子圖書的作者聯(lián)系協(xié)商并且簽訂保存許可協(xié)議,這是一項(xiàng)艱巨的工作,甚至根本就無法完成。因?yàn)榈侥壳盀橹惯€沒有一個簡單高效的方法與這些獨(dú)立的作者進(jìn)行聯(lián)系與協(xié)商,雖然針對一些類型的數(shù)字資源已經(jīng)出現(xiàn)了集體授權(quán)方式,但針對個人自助出版的電子圖書很難采用這種授權(quán)方式。
2.2.2 電子圖書包含的內(nèi)嵌對象的保存困擾
許多電子圖書格式支持內(nèi)嵌對象,這些對象幾乎可以是任何類型的文件,比如音頻和視頻等多媒體文件。美國國會圖書館將這種電子圖書格式稱為“封裝格式”(wrapper format[8])。對這種內(nèi)容豐富的電子圖書實(shí)施全面保存,除了保存文本內(nèi)容外,還要通過相應(yīng)鏈接,識別和定位內(nèi)嵌的對象,采取相應(yīng)保存措施,對封裝內(nèi)的對象進(jìn)行保存。更為復(fù)雜的是,內(nèi)嵌對象的知識產(chǎn)權(quán)可能完全獨(dú)立于電子圖書的文本內(nèi)容,如果實(shí)施深度保存,就需要對電子圖書的內(nèi)容和所有內(nèi)嵌對象的產(chǎn)權(quán)狀態(tài)進(jìn)行識別,對于有產(chǎn)權(quán)保護(hù)的內(nèi)嵌對象均要獲取長期保存存檔權(quán)、長期保存管理與處理權(quán)、服務(wù)提供權(quán)的許可。
保存機(jī)構(gòu)是否需要對這種電子圖書實(shí)施完全深度保存將取決于保存方針。該類保存方針的制定必須考慮保存技術(shù)的可行性、接收的提交信息包的組成、系統(tǒng)支持的保存等級等。很明顯,保存機(jī)構(gòu)對內(nèi)容提交者提交的電子圖書中內(nèi)嵌的文件格式進(jìn)行限制將有利于深度保存,但同時(shí)會對電子圖書的獲取造成障礙,一些不符合格式要求的電子圖書將被拒之門外。另外,電子圖書的產(chǎn)權(quán)許可如果包括了內(nèi)嵌對象的產(chǎn)權(quán)當(dāng)然有利于保存機(jī)構(gòu)對其獲取和長期保存,但這種可能性并不大,因?yàn)榧词闺娮訄D書在編輯時(shí)已經(jīng)獲得了內(nèi)嵌對象產(chǎn)權(quán)擁有者的許可,在被收錄到保存系統(tǒng)之前仍需要延伸許可。還有,如果電子圖書內(nèi)嵌的數(shù)字對象是因特網(wǎng)上的網(wǎng)絡(luò)文獻(xiàn)(如網(wǎng)頁、網(wǎng)站等),這在數(shù)字化教材中很常見,保存系統(tǒng)對該類數(shù)字對象收割的方法有二,一是僅保存超鏈,二是將數(shù)字對象下載到本地。前者的優(yōu)點(diǎn)是簡單且節(jié)約保存空間,但缺點(diǎn)是日后可能產(chǎn)生死鏈從而導(dǎo)致不可訪問;后者的優(yōu)點(diǎn)是保證了可訪問性,但缺點(diǎn)是需要額外的存儲空間來保存數(shù)字對象。
2.2.3 內(nèi)容的穩(wěn)定性對保存的困擾
提供電子圖書內(nèi)容即時(shí)更新與校正的能力被看做是電子圖書格式設(shè)計(jì)的吸引眼球的特征,但這種特征使得對其保存復(fù)雜化。如果這種更新是隨機(jī)的且持續(xù)的,那么,一種電子書將會存在多個版本,保存系統(tǒng)需要保存一種電子圖書的多少個版本?這些版本記錄了作者對電子圖書修改的所有過程,該過程可能有利于讀者對電子圖書內(nèi)容的理解,但如果對所有更新版本都進(jìn)行長期保存,不僅涉及存儲空間問題,還會導(dǎo)致電子圖書內(nèi)容的穩(wěn)定性受到質(zhì)疑。
更為嚴(yán)重的是,如果對電子圖書的更新伴隨著回收保存系統(tǒng)的原版本操作,可能會給已購買的用戶帶來問題。比如,一個著名的案例[9]是2009年發(fā)生的亞馬遜從其用戶的Kindle電子書閱讀器中刪除了George Orwell小說的一些版本,而這些版本用戶已經(jīng)購買。因此,保存系統(tǒng)應(yīng)該保障存儲的電子圖書內(nèi)容的穩(wěn)定性,并對可能的電子圖書回收、刪除甚至訪問取消等操作進(jìn)行有效管理。
2.2.4 呈繳本制度帶來的保存困擾
許多國家都要求出版商將一定數(shù)量的出版物復(fù)本呈繳給國家圖書館。電子圖書的出版是一種新生事物,很多國家的電子圖書呈繳本制度的法律還在制定之中。早在1996年,一些國家(如加拿大和挪威)已經(jīng)要求電子圖書的呈繳存儲。自此之后,不同國家對法定的呈繳要求有所不同,有些國家(如英國[10])要求電子圖書必須呈繳,但另外一些國家(如美國),僅僅要求沒有對應(yīng)印刷版本的電子圖書必須呈繳給版權(quán)辦公室;否則,僅要求印刷版本必須呈繳。荷蘭[11]的自愿呈繳系統(tǒng)最為成功,國家圖書館把接收和要求電子圖書的呈繳并保存視為實(shí)現(xiàn)公民利益的途徑,并將其當(dāng)成自己的使命。我國雖然對傳統(tǒng)出版物的呈繳本制度已非常完善,但時(shí)至今日,針對電子圖書的呈繳本制度仍在研究探討之中。
呈繳本制度也給電子圖書的長期保存帶來困擾。在一個完善的呈繳本制度框架下,一個國家或地區(qū)出版的所有電子圖書都將以呈繳本方式集中,這樣,任何一個保存系統(tǒng),無論是商業(yè)化的還是公益性的,起碼在尋求產(chǎn)權(quán)擁有者方面不僅會更全面而且會更加便利。但是基于上述分析,不少國家尤其是我國的電子圖書呈繳本制度不太理想,這就造成了保存機(jī)構(gòu)尋求產(chǎn)權(quán)許可方面的困擾。
2.2.5 電子圖書唯一標(biāo)識符帶來的識別困擾
電子圖書格式的多樣化(如一種書的MOBI格式、EPUB格式以及出版商平臺的格式等)和版本的多元化使得對其識別所依賴的唯一標(biāo)識符非常復(fù)雜。目前為止,電子圖書的唯一標(biāo)識符方案主要有下述幾種。
(1)ISBN號。ISBN號是針對傳統(tǒng)圖書的識別而設(shè)計(jì)的,但對電子圖書的識別非常復(fù)雜,因?yàn)?,根?jù)國際ISBN中心的規(guī)則,[12]電子圖書的完全相同內(nèi)容、出版日期、版本、作者、出版社的MOBI格式、EPUB格式以及出版商平臺的格式均賦予不同的ISBN號。從保存角度講,可能不需要保存一種電子圖書的所有格式,但是ISBN的多樣性使得識別相同內(nèi)容的電子圖書副本成為困難,也使得在保存系統(tǒng)中收錄一種電子圖書時(shí)的查重成為困難。
(2)ASIN或BN。許多的自助出版工具并不強(qiáng)制使用ISBN。例如,Amazon Kindle Direct Publishing和Barnes&Noble NookPress都不需要對出版物配置一個ISBN。相反,這些出版工具賦予電子圖書內(nèi)部的識別號,如前者的ASIN和后者的BN號。
(3)國際標(biāo)準(zhǔn)文本編碼(ISTC,國際標(biāo)準(zhǔn)ISO 21047)。與ISBN的編碼對象是知識作品的格式不同,ISTC針對知識作品的文本。因此,當(dāng)多家出版商以不同格式出版內(nèi)容一樣的文本時(shí),它們被賦予一個ISTC編碼。但目前為止,ISTC還沒有得到廣泛使用。
(4)DOI(數(shù)字對象標(biāo)識符)。廣泛應(yīng)用于學(xué)術(shù)型電子圖書的標(biāo)識。在學(xué)術(shù)出版界,不僅對一種電子圖書賦予一個DOI,而且常常對該電子圖書的每一章賦予一個DOI。國際數(shù)字對象識別號基金會建議將DOI與ISBN結(jié)合,形成“ISBN-A”(可操作的ISBN)。這意味著,同一內(nèi)容的電子圖書可能存在多個不同的ISBN(因?yàn)楦袷讲煌┑膯栴}在DOI中同樣存在。
目前為止,電子圖書的長期保存界還沒有對電子圖書的識別方法達(dá)成一致,所以保存機(jī)構(gòu)一般保存出版商提供的電子圖書所有識別符。但在一個保存系統(tǒng)中,如果收錄眾多出版商的電子圖書,因?yàn)椴煌霭嫔滩捎玫淖R別符方案可能不同,將導(dǎo)致電子圖書的識別混亂。
2.3 基于因特網(wǎng)的集體創(chuàng)作型電子圖書的保存困擾
這類圖書主要集中在大型參考工具書,如詞典、字典、百科全書等。隨著因特網(wǎng)的廣泛普及和技術(shù)的快速發(fā)展,越來越多的大型參考工具書采用基于因特網(wǎng)平臺的集體創(chuàng)作形式進(jìn)行編纂出版。這種編纂方式導(dǎo)致了這類電子圖書具有內(nèi)容的高度動態(tài)性、產(chǎn)權(quán)擁有的分散性、內(nèi)容的集體貢獻(xiàn)性、鏈接的多樣性等特征,對其進(jìn)行長期保存存在諸多困擾。
2.3.1 產(chǎn)權(quán)許可的困擾
針對基于web的集體創(chuàng)作型電子圖書,保存機(jī)構(gòu)獲得產(chǎn)權(quán)許可的最大障礙來自于這類電子圖書的產(chǎn)權(quán)復(fù)雜性。這種復(fù)雜性表現(xiàn)在下述四個方面。
(1)產(chǎn)權(quán)歸屬的人員眾多。宏觀上,這類電子圖書整體上就是集體創(chuàng)作的結(jié)晶,任何一個網(wǎng)絡(luò)用戶都可以貢獻(xiàn)內(nèi)容;微觀上,任何一個條目的編纂也可能是眾多作者的勞動結(jié)果,每一個作者可以貢獻(xiàn)條目的全部內(nèi)容,也可以貢獻(xiàn)條目中的部分內(nèi)容。
(2)產(chǎn)權(quán)歸屬的人員組成復(fù)雜。無論是宏觀上的整本電子圖書還是微觀上的一個具體條目,都是集體創(chuàng)作的,而這個集體并非集中在一個機(jī)構(gòu),是廣泛分散的,且可能分布在眾多的行業(yè)領(lǐng)域、廣袤的地域空間。
(3)產(chǎn)權(quán)歸屬的模糊性。作者貢獻(xiàn)的內(nèi)容有些是自創(chuàng)的,也有不少是轉(zhuǎn)載于其他地方,這種轉(zhuǎn)載有的有規(guī)范的引用,但網(wǎng)絡(luò)環(huán)境下這種轉(zhuǎn)載的引用缺失是常見的,有的甚至根本就沒有加入引用標(biāo)識的意圖,還有,這種轉(zhuǎn)載也可能是多次的。因此,產(chǎn)權(quán)歸屬難以清晰界定。
(4)產(chǎn)權(quán)歸屬的間接性。與其他類型的網(wǎng)絡(luò)文獻(xiàn)相比,這類web資源的鏈出型超級鏈接更多,被鏈接的網(wǎng)絡(luò)文獻(xiàn)構(gòu)成了這類電子圖書內(nèi)容的組成部分,但這部分內(nèi)容的產(chǎn)權(quán)并不歸實(shí)施鏈接的作者所有,電子圖書在進(jìn)行長期保存之前需要通過該類作者尋求被鏈接內(nèi)容的產(chǎn)權(quán)擁有者實(shí)施產(chǎn)權(quán)許可。因此,這類內(nèi)容的產(chǎn)權(quán)歸屬對于電子圖書來說具有間接性特性。
上述前兩個產(chǎn)權(quán)復(fù)雜性的表現(xiàn)要求保存機(jī)構(gòu)與眾多內(nèi)容貢獻(xiàn)者聯(lián)系以取得產(chǎn)權(quán)許可,后兩個需要保存機(jī)構(gòu)通過內(nèi)容貢獻(xiàn)者聯(lián)系被引用或被鏈接內(nèi)容的產(chǎn)權(quán)擁有者進(jìn)行產(chǎn)權(quán)延伸許可。但在實(shí)際操作中,無論哪種類型的產(chǎn)權(quán)復(fù)雜性表現(xiàn)都將對獲取許可帶來巨大挑戰(zhàn)。
2.3.2 保存價(jià)值的困擾
經(jīng)濟(jì)學(xué)上,價(jià)值被定義為受益。因此,數(shù)字資源的保存價(jià)值可以被界定為用戶的受益,這種受益來自于對保存的數(shù)字資源訪問和使用。針對基于因特網(wǎng)的集體創(chuàng)作型電子圖書,保存價(jià)值存在高度的不確定性,具體表現(xiàn)在下述幾個方面。
(1)用戶需求的不確定性。①現(xiàn)實(shí)用戶需求的發(fā)散性,不同類型的用戶群體對這類電子圖書的需求差別較大。一般來講,年輕人比年長者的需求大,因?yàn)榍罢吒鼉A向于使用數(shù)字化信息資源;學(xué)術(shù)界比其他領(lǐng)域從業(yè)者的需求大,因?yàn)檫@類電子圖書一般是學(xué)術(shù)型的。②未來用戶需求的預(yù)測性,數(shù)字保存的用戶需求雖然著眼現(xiàn)在,但主要集中在未來,而web數(shù)字資源具有很強(qiáng)的時(shí)效性,用戶對這類數(shù)字資源的未來需求具有很強(qiáng)的不確定性。
(2)電子圖書價(jià)值的不確定性。這類電子圖書一般是參考工具書,參考工具書本身的價(jià)值主要體現(xiàn)在內(nèi)容的準(zhǔn)確性和完整性。但是,由于這類工具書的每個條目撰寫并非是相應(yīng)領(lǐng)域的學(xué)術(shù)權(quán)威,而是網(wǎng)絡(luò)用戶的集體貢獻(xiàn),其準(zhǔn)確性和完整性很難保證。不過,這類圖書編纂的聚集效應(yīng)和網(wǎng)絡(luò)效應(yīng)很明顯,內(nèi)容貢獻(xiàn)者越多,其準(zhǔn)確性和完整性可能越高,電子圖書的價(jià)值也可能越高。
(3)保存內(nèi)容的不確定性。一是保存內(nèi)容選擇的不確定性,與其他電子圖書不同,這類工具書型的電子圖書中的每一個條目都有不少內(nèi)容貢獻(xiàn)者給出修改和補(bǔ)充意見,并且都經(jīng)歷一個較長時(shí)間的編輯過程。因此,每個條目都有一段編輯歷史,對這類電子圖書進(jìn)行保存收割時(shí),僅保存每個條目的定稿內(nèi)容,還是要保存條目的整個編輯歷史,還是對編輯歷史進(jìn)行有選擇性地保存,這給保存機(jī)構(gòu)制定保存內(nèi)容的選擇政策帶來困擾。二是保存版本選擇的困擾,很明顯,這類電子圖書的內(nèi)容一直處于動態(tài)的編輯修改完善之中,傳統(tǒng)圖書的“版本”概念在這類圖書中已非常模糊,甚至根本就無法界定,在保存實(shí)踐中,這種特征給這類電子圖書保存版本的選擇帶來困境。
一般來講,數(shù)字資源的保存價(jià)值取決于三個方面:目標(biāo)用戶群體的明確性、數(shù)字資源本身的學(xué)術(shù)性、內(nèi)容的相對固定性。但是,基于上述分析,針對基于因特網(wǎng)的集體創(chuàng)作型電子圖書,這三個因素都存在很大的不確定性,從而導(dǎo)致了這類數(shù)字資源價(jià)值的不確定性。因此,商業(yè)性保存機(jī)構(gòu)對這種保存價(jià)值不確定的數(shù)字資源進(jìn)行長期保存存在保存動機(jī)不足甚至缺失的風(fēng)險(xiǎn)。
2.3.3 保存動機(jī)缺失的困擾
保存動機(jī)是指保存決策者實(shí)施數(shù)字保存的愿望。保存動機(jī)的缺失是指保存機(jī)構(gòu)對某些類型的數(shù)字資源缺乏保存動機(jī)或保存動機(jī)不足。產(chǎn)生保存動機(jī)缺失的基本原因是保存條件的可獲得性不足和保存目的的實(shí)現(xiàn)預(yù)期程度不高。
(1)保存條件的可獲得性不足。數(shù)字保存的一個非常重要的條件是數(shù)字資源產(chǎn)權(quán)許可的可獲得性。但是,基于因特網(wǎng)的集體創(chuàng)作型參考工具書產(chǎn)權(quán)許可的可獲得性很差,導(dǎo)致保存動機(jī)的不足。針對這種類型的保存動機(jī)缺失,提升的一個基本方法是這些內(nèi)容貢獻(xiàn)者采用非排他性許可方式(比如簽署知識共享協(xié)議)授權(quán)給保存機(jī)構(gòu)(比如,可以在維基百科網(wǎng)站的顯著位置放置這種授權(quán)聲明)。但是,這種產(chǎn)權(quán)許可方式的負(fù)面效應(yīng)是降低商業(yè)型保存機(jī)構(gòu)的經(jīng)濟(jì)效益,因?yàn)榉仟?dú)占性許可可以將數(shù)字資源同時(shí)授權(quán)給其他保存機(jī)構(gòu)進(jìn)行長期保存,導(dǎo)致保存機(jī)構(gòu)之間的商業(yè)競爭。因此,即使這樣,也無法完全解決保存動機(jī)缺失的問題。
(2)保存目的的實(shí)現(xiàn)預(yù)期程度不高。實(shí)際上,數(shù)字保存是一種經(jīng)濟(jì)產(chǎn)品,保存目的在于該產(chǎn)品的銷售收入。對于一般經(jīng)濟(jì)產(chǎn)品,銷售收入的預(yù)期周期都不會特別長。但對于數(shù)字保存來說,用戶的需求不僅分布在現(xiàn)在,更主要分布在未來,所以,數(shù)字保存是一項(xiàng)跨時(shí)代的經(jīng)濟(jì)活動,這種經(jīng)濟(jì)活動的特性導(dǎo)致了數(shù)字保存這類產(chǎn)品的生產(chǎn)與銷售的非同步性,且跨越時(shí)間非常長。對這種跨越時(shí)代的銷售收入進(jìn)行預(yù)期的困難度很大,風(fēng)險(xiǎn)也很高。另外,基于因特網(wǎng)的集體貢獻(xiàn)型電子圖書是Web數(shù)字資源的一種類型,一般認(rèn)為,Web數(shù)字資源的時(shí)效性很強(qiáng),影響這類數(shù)字資源的未來銷售預(yù)期。所以,這類電子圖書保存目的的實(shí)現(xiàn)預(yù)期也存在不理想的風(fēng)險(xiǎn)。基于上述分析,一方面這類電子圖書的獨(dú)占性產(chǎn)權(quán)許可的獲得幾乎沒有可能,采用內(nèi)容貢獻(xiàn)者使用默認(rèn)的非排他性產(chǎn)權(quán)許可方式雖可以降低保存障礙,但會導(dǎo)致保存機(jī)構(gòu)的經(jīng)濟(jì)收益下降;另一方面,這類數(shù)字資源長期保存的未來收益預(yù)期也存在不樂觀的因素。所以,商業(yè)性保存機(jī)構(gòu)對這類電子圖書存在著保存動機(jī)缺失或不足的困擾。
電子圖書是一種重要的數(shù)字資源,對其進(jìn)行長期保存的項(xiàng)目已有不少,比如,荷蘭國家圖書館牽頭組織美國、加拿大、西班牙、澳大利亞等國家圖書館建立的HathiTrust數(shù)字圖書館。但是,至今電子圖書的長期保存仍然存在各種缺憾,困擾著這類數(shù)字資源的有效保存使用。本文對這種困擾進(jìn)行了分析和總結(jié),以期業(yè)界探討解決方案,完善電子圖書的保存實(shí)踐。
[1]Amazon.KindleStoreTerms ofUse[EB/OL].[2015-03-30].http://www.amazon.com/gp/help/customer/display.html/ref=hp_200699130_storeTOU1?nodeId=20101 4950.
[2]Wikipedia.Microsoft Reader From[EB/OL].[2015-05-30].http://en.wikipedia.org/wiki/Microsoft_Reader.
[3]Wikipedia.Digital rights management[EB/OL].[2015-05-30].https://en.wikipedia.org/wiki/Digital_rights _management#DRM_and_e-books.
[4]Kindle Direct Publishing,Publishing FAQ[EB/OL].[2015-05-30].https://kdp.amazon.com/help?topicId=A36BYK5S7AJ2NQ.
[5]NOOK Press.Frequently Asked Questions About NOOKPress[EB/OL].[2015-05-30].https://www.nookpress.com/support/faq.
[6]iBooks Author[EB/OL].[2015-05-30].http://www. apple.com/ibooks-author/.
[7]Klems B.How can the average writer make money self-publishing e-books?[EB/OL].[2015-06-01].http://www.writersdigest.com/online-editor/howcan-the-average-writer-make-money-selfpublishinge-books.
[8]Sustainability of Digital Formats Planning for Library of Congress Collections[EB/OL].[2015-06-09].http: //www.digitalpreservation.gov/formats/intro/format_eval_ rel.shtml.
[9]新浪網(wǎng).亞馬遜就“刪書門”事件補(bǔ)償用戶30美元[EB/OL].[2015-06-11].http://tech.sina. com.cn/i/2009-09-05/10113412925.shtml.
[10]CDNL.BritishLibrary:InternationalSurveyonElectronic Legal Deposit[EB/OL].[2015-06-10]. http://www.cdnl.info/Legal_Deposit/CDNL_2010_-_BL _international_survey_on_e-Legal_Deposit.pdf.
[11]Van Trier G.Permanent Access to the Records of Science The International Role of the e-Depot at the KoninklijkeBibliotheek.LIBERQuarterly,16:3/4.[EB/OL].[2015-06-10].https://liber.library.uu.nl/index.php/lq/article/view/URN%3ANBN%3ANL% 3AUI%3A10-1-113470/8062.
[12]International ISBN Agency.E-Books and ISBNs:a position paper and action points from the International ISBN Agency[EB/OL].[2015-06-11].http: //www.isbn.org/sites/default/files/images/isbn_agency_ e-books_position_paper.pdf.
G255
A
1005-8214(2015)11-0001-05
臧國全(1963-),男,教授,鄭州大學(xué)信息管理學(xué)院副院長,發(fā)表論文80多篇,出版學(xué)術(shù)專著3部,研究方向:數(shù)字資源長期保存;閆勵(1989-),女,在讀研究生,發(fā)表論文1篇。
2015-06-19[責(zé)任編輯]王崗