国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

國外數(shù)字資源長期保存的熱點(diǎn)問題研究

2011-03-18 06:57趙玉宇溫州市圖書館浙江溫州325000
圖書館建設(shè) 2011年6期
關(guān)鍵詞:數(shù)字圖書館資源

趙玉宇 (溫州市圖書館 浙江 溫州 325000)

數(shù)字資源長期保存是人們?yōu)榱吮4鏀?shù)字時(shí)代的記憶、應(yīng)對數(shù)字資源的脆弱性和短暫性、保證數(shù)字資源的可持續(xù)利用而采取的必要措施。完整的數(shù)字資源保存活動(dòng)應(yīng)由政策、戰(zhàn)略和行動(dòng)三部分組成。其中保存政策用于明確組織的保存職責(zé)、規(guī)定保存格式和等級、確保保存活動(dòng)與現(xiàn)有的數(shù)字信息標(biāo)準(zhǔn)和最佳實(shí)踐相吻合,而數(shù)字保存的戰(zhàn)略和行動(dòng)則致力于解決保存信息的創(chuàng)建、整合和維護(hù)問題[1]。美國和歐洲聯(lián)盟各國由于信息化建設(shè)起步較早、基礎(chǔ)設(shè)施完善、社會(huì)信息化水平較高,很早就意識(shí)到數(shù)字資源長期保存的重要性,在政府的支持下開展了一系列保存活動(dòng),積累了豐富的實(shí)踐經(jīng)驗(yàn)。本文通過對上述國家保存活動(dòng)的最新進(jìn)展和實(shí)踐進(jìn)行歸納總結(jié),為我國的相關(guān)活動(dòng)提供參考和借鑒。

1 對數(shù)字資源保存重要性的認(rèn)識(shí)逐步加深

與傳統(tǒng)資源相比,數(shù)字資源的存在總是依附于特定的載體,需要借助一定的軟硬件設(shè)備才能為人們所使用,對載體和技術(shù)的依賴性強(qiáng)且生命周期短暫,一旦損失將難以恢復(fù)。所以,隨著社會(huì)信息化水平的不斷提升和數(shù)字資源的飛速增長,數(shù)字資源保存在歐美等國家正在引起越來越多的關(guān)注。據(jù)Pauline Sinclair等人對歐洲96所國家圖書館和檔案館的調(diào)查顯示,有93%的受訪對象表示關(guān)注長期保存所帶來的挑戰(zhàn);在人們認(rèn)為需要保存的資源中,排名居前四位的依次是文獻(xiàn)系統(tǒng)、文獻(xiàn)掃描程序、互聯(lián)網(wǎng)和電子文獻(xiàn)管理系統(tǒng);保存過程中人們最關(guān)注的是所保存記錄的真實(shí)性、可靠性和整體性,保存策略是否與已有數(shù)字信息管理標(biāo)準(zhǔn)相吻合,能否保證記錄在未來50年內(nèi)可獲取且可以應(yīng)用遷移策略來應(yīng)對技術(shù)過時(shí)[2]。

美國研究圖書館協(xié)會(huì)(Association of Research Libraries,簡稱ARL)2009年度的《成員館數(shù)字資源保存實(shí)踐調(diào)研報(bào)告》[3]指出:(1)館藏建設(shè)工作在不斷變化,擴(kuò)展到對包括博客、研究報(bào)告在內(nèi)的多種類型網(wǎng)絡(luò)出版資源的搜集。在研究機(jī)構(gòu)內(nèi)部,圖書館正被賦予新的使命:與大學(xué)其他部門合作長期保存有價(jià)值的數(shù)字資源。(2)因?yàn)榻?jīng)濟(jì)和技術(shù)的限制,數(shù)字資源保存工作不能由1個(gè)部門獨(dú)自承擔(dān),變化著的機(jī)構(gòu)職能、關(guān)聯(lián)和共同利益要求合作迎接現(xiàn)在和未來將要面對的保存挑戰(zhàn)。(3)數(shù)字資源保存計(jì)劃需要考慮保存的組織模式和政策,明確在資源生命周期不同階段的保存行為、成本收益和風(fēng)險(xiǎn),制訂員工培訓(xùn)計(jì)劃和災(zāi)難備份計(jì)劃。(4)跨機(jī)構(gòu)的長期保存合作戰(zhàn)略需要有權(quán)威性的國家領(lǐng)導(dǎo)部門進(jìn)行協(xié)調(diào),圖書館間需要更多的資源共享以減少數(shù)字拷貝行為。

近年來,美國和歐洲聯(lián)盟國家開展了一系列長期保存實(shí)踐。美國國會(huì)圖書館開展了國家數(shù)字信息基礎(chǔ)設(shè)施保存項(xiàng)目(National Digital Information Infrastructure &Preservation Program,簡稱NDIIPP),該項(xiàng)目負(fù)責(zé)搜集、保存重要數(shù)字信息,以備將來使用。澳大利亞國家圖書館實(shí)施了網(wǎng)絡(luò)信息資源保存項(xiàng)目——Pandora,并制定了《保存網(wǎng)上出版物的選擇方針》。瑞典皇家圖書館設(shè)立了網(wǎng)絡(luò)信息資源收集項(xiàng)目——Kulturarw3,用于收集、保存瑞典的網(wǎng)絡(luò)信息資源并提供網(wǎng)上獲取。法國國家圖書館開展的網(wǎng)絡(luò)信息資源保存項(xiàng)目每年進(jìn)行若干次大范圍的網(wǎng)絡(luò)信息自動(dòng)收集,對經(jīng)過選擇的網(wǎng)站進(jìn)行持續(xù)的自動(dòng)收集,對不能自動(dòng)收集的深層網(wǎng)站采取人工收集策略,對某些極易消失的網(wǎng)站則開展基于事件的專題收集。荷蘭政府早在1995年就啟動(dòng)了世界第一個(gè)接受深層網(wǎng)絡(luò)信息繳送并予以長期保存的項(xiàng)目——荷蘭電子出版物保存計(jì)劃(Deposit of Netherlands Electronic Publications,簡稱DNEP),用于搜集電子文本、論文、數(shù)據(jù)庫和參考信息等資源,荷蘭皇家圖書館也與Elsevier Science和Kluwer Academic等大型出版機(jī)構(gòu)簽署了協(xié)議,由出版社定期將經(jīng)過篩選的電子出版物通過物理載體移交或網(wǎng)絡(luò)傳遞給保存機(jī)構(gòu)。

在我國,2009年9月中國科學(xué)院國家科學(xué)圖書館與Springer科學(xué)和商業(yè)媒體集團(tuán)簽署了長期保存協(xié)議,雙方同意由Springer定期向國家科學(xué)圖書館提供其現(xiàn)刊數(shù)據(jù)庫的長期保存數(shù)據(jù),并將其轉(zhuǎn)載到國家科學(xué)圖書館的長期保存系統(tǒng),按照雙方共同確認(rèn)的可信賴流程和系統(tǒng)進(jìn)行長期保存。該協(xié)議是中國科學(xué)院國家科學(xué)圖書館與國外出版機(jī)構(gòu)簽署的第一個(gè)數(shù)字資源長期保存協(xié)議,對我國引進(jìn)國外數(shù)字資源、進(jìn)行可靠長期保存具有積極的示范意義[4]。

2 保存資源的范圍不斷擴(kuò)大

數(shù)字信息資源類型豐富、形式多樣,按資源來源可分為政府信息、商業(yè)信息和公共信息等,按資源載體可分為視頻信息、文字信息、音頻信息等。完整的數(shù)字資源體系不僅包括資源本身,還包括資源的載體和利用設(shè)施,所以數(shù)字資源保存的范圍應(yīng)廣及多種類型的資源和相應(yīng)的載體及利用設(shè)施。

美國國會(huì)圖書館的NDIIPP項(xiàng)目不僅建立了保存特定學(xué)科資源的聯(lián)合保存網(wǎng)絡(luò),通過個(gè)人多備份資源保存 (Lots of Copies Keep Stuff Safe,簡稱LOCKSS)網(wǎng)絡(luò)使全球范圍內(nèi)的機(jī)構(gòu)能夠分布式地協(xié)作保存與商業(yè)、社會(huì)和技術(shù)相關(guān)的信息資源[5],而且該項(xiàng)目還資助了一系列多個(gè)領(lǐng)域內(nèi)的數(shù)字資源保存項(xiàng)目,如長年資助圖書館員和檔案工作人員抓取和保存網(wǎng)絡(luò)上政府信息的“網(wǎng)絡(luò)危險(xiǎn)計(jì)劃”,資助建立數(shù)字視頻文件保存庫項(xiàng)目,資助MetaArchive等保存文化記憶項(xiàng)目,資助社會(huì)科學(xué)資源數(shù)據(jù)存儲(chǔ)聯(lián)盟(Data Preservation Alliance for the Social Sciences,簡稱Data-PASS)識(shí)別、獲取和保存處于危險(xiǎn)狀態(tài)的社會(huì)科學(xué)數(shù)據(jù)[6]。

Web2.0的興起、草根文化的盛行使撰寫博客成為時(shí)尚。博客憑借其內(nèi)容新穎、時(shí)效性強(qiáng)、傳播迅速成為重要的信息源。倫敦大學(xué)計(jì)算中心和大英博物館聯(lián)合開展了以搜集和保存博客內(nèi)容為目的的ArchivePress項(xiàng)目。該項(xiàng)目的開發(fā)者們摒棄了傳統(tǒng)全局保存的網(wǎng)絡(luò)存檔理念,認(rèn)為博客是一組完全分開的網(wǎng)絡(luò)資源,帖子是分散的,博客內(nèi)容的布局、顏色等屬性對許多用戶而言是多余的,所以他們開發(fā)了一種建立在網(wǎng)絡(luò)種子功能基礎(chǔ)上的保存方式,有選擇地抓取博客信息,整合源自不同博客的資源內(nèi)容[7]。

數(shù)字資源的使用依賴于特定的軟硬件環(huán)境,所以軟件保存也是數(shù)字保存的形式之一。Esther Conway等指出,由于相對數(shù)字資源保存而言,軟件保存的緊迫性不強(qiáng)且復(fù)雜度較高,所以現(xiàn)有的數(shù)字對象保存研究很少關(guān)注軟件保存,但人們不應(yīng)忽視[8]。Esther Conway等人將軟件保存定義為保存軟件的副本以便將來能重構(gòu)和執(zhí)行,強(qiáng)調(diào)保存軟件是保存其他數(shù)據(jù)的必備條件,是保證數(shù)據(jù)存在及可重用的基礎(chǔ);討論了軟件保存的仿真和遷移方式,并設(shè)計(jì)判定軟件保存方法完備性的模型,并在此基礎(chǔ)上提出了軟件保存的概念框架,包括軟件的表現(xiàn)形式、描述模型和需要保存的屬性3個(gè)方面[8]。

數(shù)字資源的存在與利用總是依附于一定的載體而實(shí)現(xiàn)的,載體的更新?lián)Q代容易導(dǎo)致資源內(nèi)容無法讀取或丟失,所以對載體保存的研究也應(yīng)得到人們的重視。David Tarrant提出了用關(guān)聯(lián)數(shù)據(jù)保存數(shù)據(jù)載體格式的理念,指出網(wǎng)絡(luò)是一個(gè)不斷增長的、有聯(lián)系的數(shù)據(jù)平臺(tái),通過建立聯(lián)系可以增加網(wǎng)絡(luò)數(shù)據(jù)的價(jià)值,使用戶能夠獲取更多的信息;基于資源描述框架(Resource Description Framework,簡稱RDF)和網(wǎng)絡(luò)本體語言(Web Ontology Language,簡稱OWL)構(gòu)建的關(guān)聯(lián)數(shù)據(jù)可以減少冗余、促使發(fā)現(xiàn)最大化[9]。David Tarrant對全球數(shù)字格式注冊(Global Digital Format Registry,簡稱GDFR)等數(shù)字保存組織基于關(guān)聯(lián)數(shù)據(jù)理論創(chuàng)建的“統(tǒng)一數(shù)字格式注冊”平臺(tái)進(jìn)行分析發(fā)現(xiàn),該平臺(tái)能將文件格式的相關(guān)信息(如文件格式的歷史、可讀取軟件等)進(jìn)行集成,為數(shù)字保存中的格式風(fēng)險(xiǎn)管理、應(yīng)用和轉(zhuǎn)換提供比個(gè)人或組織更多的解決途徑[9]。

數(shù)字資源的表現(xiàn)形式豐富,具有個(gè)性化特征,對歷史研究人員而言,特殊的字體表達(dá)往往隱含著重要意義。Geoffrey Brown和Kam Woods認(rèn)為,成百上千萬法律文獻(xiàn)的正確翻譯有賴于文獻(xiàn)中所含的特殊字體,但是這些信息在數(shù)據(jù)導(dǎo)入過程中并沒有被很好地控制[10]。法律文獻(xiàn)中有很多的特殊字體,在應(yīng)用諸如Office等軟件創(chuàng)建文獻(xiàn)副本時(shí),由于不能正確表達(dá)文獻(xiàn)字體,可能造成關(guān)鍵信息的損失。Geoffrey Brown等人利用包含225 000個(gè)Word文檔的資源集評估字體庫匹配特殊字體的困難并指出,在資源保存過程中應(yīng)該明確關(guān)鍵字體的替代措施,使用Unicode碼協(xié)助語言識(shí)別,同時(shí)使用語言識(shí)別工具鑒別人類語言和具有象征意義的字體,并開發(fā)測試使用替代字體后的文本質(zhì)量的工具[10]。

3 關(guān)注數(shù)字資源保存的經(jīng)濟(jì)成本問題

數(shù)字資源保存項(xiàng)目的建設(shè)和維護(hù)需要持續(xù)地投入大量資金,所以對不同保存方式的成本分析有助于項(xiàng)目的組織根據(jù)實(shí)際情況分析保存的成本、風(fēng)險(xiǎn)和收益,制訂合理的管理政策,選擇恰當(dāng)?shù)谋4娣绞?,同時(shí)也有助于項(xiàng)目的投資者評估所需經(jīng)費(fèi)。美國國家科學(xué)基金會(huì)等組織成立了由圖書館、檔案館工作人員及多領(lǐng)域?qū)W者組成的“數(shù)字資源長期保存與訪問藍(lán)色絲帶特別工作組”,以期加深人們對可持續(xù)性數(shù)字保存經(jīng)濟(jì)價(jià)值的認(rèn)識(shí)[11]。

在英國聯(lián)合信息系統(tǒng)委員會(huì)(Joint Information System Committee,簡稱JISC)等機(jī)構(gòu)的聯(lián)合資助下,倫敦大學(xué)和英國國家圖書館合作啟動(dòng)了電子文獻(xiàn)信息生命周期(Lifecycle Information for E-Literature,簡稱LIFE)項(xiàng)目,旨在探索數(shù)字資源保存生命周期過程中的花費(fèi),建立通用的數(shù)字保存生命周期模型,探索評估生命周期各階段花費(fèi)的方法。該項(xiàng)目目前已進(jìn)行到第三階段(LIFE3)。LIFE3致力于開發(fā)數(shù)字資源保存生命周期過程中的成本估算系統(tǒng),建立周期中每一階段或元素的成本模型,用戶只需輸入內(nèi)容信息 (包括內(nèi)容類型、文件格式、復(fù)雜度、規(guī)模)、組織信息(包括現(xiàn)有基礎(chǔ)設(shè)施、保存政策、法律限制)和環(huán)境信息(包括通貨膨脹情況、硬件成本、員工花費(fèi)),該估算系統(tǒng)就能自動(dòng)估算資源獲取、導(dǎo)入、比特流保存、內(nèi)容保存和檢索等過程的花費(fèi)。LIFE3的成果將有助于保存機(jī)構(gòu)完善已有的保存活動(dòng),調(diào)整館藏管理政策[12]。

丹麥文化部資助了為國家文化保存機(jī)構(gòu)建立數(shù)字資源存儲(chǔ)的成本計(jì)算模型項(xiàng)目,以為未來數(shù)字保存的財(cái)政撥款需求提供比較和評估技術(shù),促進(jìn)數(shù)字資源保存活動(dòng)的資金使用效率。該項(xiàng)目借助開放檔案信息系統(tǒng)(Open Archival Information System,簡稱OAIS)模型確定保存活動(dòng)的主要花費(fèi)項(xiàng)目,如檢測技術(shù)的開發(fā)、保存決策和標(biāo)準(zhǔn)的制訂、存儲(chǔ)包的設(shè)計(jì)和遷移計(jì)劃、相關(guān)標(biāo)準(zhǔn)和政策的建立、管理系統(tǒng)的設(shè)計(jì)和文檔信息的更新等。Ulla Bogvad Kejser等人利用OAIS模型對丹麥檔案館的兩個(gè)數(shù)據(jù)集(一個(gè)采用正常計(jì)劃,另一個(gè)采用遷移計(jì)劃)進(jìn)行了測試發(fā)現(xiàn),該模型提供了很好的成本統(tǒng)計(jì)分析框架,但其中一些功能還需要額外的細(xì)節(jié)信息準(zhǔn)確計(jì)算成本[13]。

4 關(guān)注數(shù)字資源的整合和互操作

促進(jìn)資源的共享和持續(xù)利用是長期保存活動(dòng)的根本目標(biāo)。數(shù)字資源共享性強(qiáng),但與傳統(tǒng)資源相比,其共享依賴于不同系統(tǒng)間的互操作性能,因此對保存系統(tǒng)的互操作研究也是數(shù)字資源保存研究的重要組成部分。Reinhard Altenhoner指出,長期保存已引起了全球范圍內(nèi)的關(guān)注,但對具有實(shí)際操作價(jià)值的資源整合方案的研究卻不多,現(xiàn)今還沒有能將數(shù)字存儲(chǔ)與文化傳承組織、數(shù)據(jù)中心和數(shù)據(jù)生成者整合在一起的數(shù)字基礎(chǔ)設(shè)施,適用于整合全球數(shù)字資源保存的基礎(chǔ)設(shè)施發(fā)展緩慢[14]。Reinharda Altenloner以德國的現(xiàn)狀和經(jīng)驗(yàn)為例,討論上述問題的成因,并從戰(zhàn)略層面上提出了解決方法[14]。

Priscilla Caplan等認(rèn)為,由于過量的信息、連續(xù)性的規(guī)劃和軟件的遷移,存儲(chǔ)庫之間必須能相互交換文檔信息[15]。鑒于此,他們發(fā)動(dòng)了致力于解決在不同保存庫間遷移復(fù)雜數(shù)字對象問題的存儲(chǔ)庫互操作(Towards Interoperable Preservation Repositories,簡稱TIPR)計(jì)劃,設(shè)計(jì)了存儲(chǔ)交換包(Repository eXchange Package,簡稱RXP)。RXP是一種符合元數(shù)據(jù)編碼、傳輸標(biāo)準(zhǔn)(Metadata Encoding and Transmission Standard,簡稱METS)和保存元數(shù)據(jù)應(yīng)用策略(Preservation Metadata: Implementation Strategies,簡稱PREMIS)的數(shù)字對象組件與元數(shù)據(jù)文件結(jié)構(gòu),可以作為所有存儲(chǔ)庫都能讀寫的中介格式,能克服不同存儲(chǔ)庫之間無法匹配的問題。RXP已在佛羅里達(dá)州圖書館自動(dòng)化中心、紐約大學(xué)圖書館和康奈爾大學(xué)圖書館間進(jìn)行了轉(zhuǎn)換測試[15]。

Dirk Roorda和Rene van Horik介紹了文件格式轉(zhuǎn)換存儲(chǔ)庫(Migration to Intermediate XML for Electronic Data,簡稱MIXED)計(jì)劃中用于格式轉(zhuǎn)化的“靈活遷移”方案。該方案在數(shù)據(jù)導(dǎo)入過程中,將特殊類型的數(shù)據(jù)格式轉(zhuǎn)換為用XML數(shù)據(jù)表達(dá)的中間格式,該格式包含元數(shù)據(jù)、內(nèi)容和數(shù)字對象標(biāo)識(shí)符(Digital Object Identifier,簡稱DOI)等信息[16]。

5 關(guān)注數(shù)字資源長期保存的過程分析

數(shù)字資源的長期保存是一項(xiàng)系統(tǒng)工程,涉及從資源導(dǎo)入到重新利用過程中的各個(gè)環(huán)節(jié),需要考慮的因素眾多,各要素之間前后相繼,相互依存,互相促進(jìn)。因此有必要按照一定的脈絡(luò)順序,借助特定的模型或流程圖對長期保存過程中所涉及的要素予以分析。

Wolfgang Wilkes將長期保存與文檔生命周期結(jié)合起來分析長期保存過程,將長期保存的周期劃分為創(chuàng)建(提取元數(shù)據(jù)、轉(zhuǎn)換為標(biāo)準(zhǔn)格式)、集中(OAIS轉(zhuǎn)換、存儲(chǔ)、后期獲?。⒗茫ㄞD(zhuǎn)換格式以適應(yīng)特定工具的格式需求)和重用(將保存數(shù)據(jù)融入實(shí)際應(yīng)用)4個(gè)階段,指出長期保存應(yīng)存儲(chǔ)包括文檔生命周期全過程中的數(shù)據(jù)(早期的需求分析文件、設(shè)計(jì)的邏輯依據(jù))、產(chǎn)品運(yùn)行過程中的經(jīng)驗(yàn)性數(shù)據(jù)和當(dāng)時(shí)的社會(huì)環(huán)境,Wolfgang Wilkes還特別強(qiáng)調(diào)了有關(guān)特殊版本的工具及其服務(wù)功能的工程信息也應(yīng)被記錄[17]。

Esther Conway等認(rèn)為保存科學(xué)數(shù)據(jù)所面臨的挑戰(zhàn),不僅包括數(shù)據(jù)集本身,還包括向未來用戶群體傳遞知識(shí)的能力,因此長期保存活動(dòng)必須基于特定的目標(biāo)用戶等具體情境開展。針對上述要求,Esther Conway等人以文化藝術(shù)和科學(xué)知識(shí)保存項(xiàng)目(Cultural, Artistic and Scientific knowledge for Preservation, Access and Retrieval,簡稱CASPAR)為例,詳細(xì)描述了該項(xiàng)目的存儲(chǔ)分析方法,包括進(jìn)行數(shù)據(jù)存取的初步調(diào)查(了解用戶從數(shù)據(jù)中抽取的信息、區(qū)分所保存數(shù)據(jù)的描述類和表達(dá)類信息、正確理解信息及信息之間的關(guān)聯(lián))、歸檔分析、定義存儲(chǔ)目標(biāo)、清晰地界定目標(biāo)用戶群體,討論了如何與其他數(shù)字保存項(xiàng)目交互,保存科學(xué)數(shù)據(jù)集以及必要的工具和技術(shù)以應(yīng)對未來挑戰(zhàn)[18]。

6 關(guān)注數(shù)字資源的元數(shù)據(jù)及其互操作

元數(shù)據(jù)通過對資源內(nèi)容、物理狀態(tài)、應(yīng)用環(huán)境和管理環(huán)境等要素的揭示,反映資源的內(nèi)容特征、形式特征和環(huán)境特征,是人們發(fā)現(xiàn)、檢索和利用資源的基礎(chǔ)。Angela Dappert等指出,高效地開展數(shù)字資源保存活動(dòng)和提供服務(wù)依賴于一系列元數(shù)據(jù),特別是描述數(shù)字對象的應(yīng)有屬性和描述數(shù)字保存服務(wù)需求的元數(shù)據(jù),以確保數(shù)字對象能被長久保存[19]。Angela Dappert等人還設(shè)想利用詞典注冊庫、元數(shù)據(jù)字典和屬性注冊庫描述資源屬性,表達(dá)資源特征和組織需求,并建議長期保存活動(dòng)的元數(shù)據(jù)方案需要描述目標(biāo)特征(文件尺寸、頁數(shù)、像素)、環(huán)境特征(保存活動(dòng)中所使用的各類軟件、保存活動(dòng)中的數(shù)據(jù)處理類型、硬件設(shè)施的處理器和內(nèi)存速度)和行為特征(成本、速度、CPU占用率),元數(shù)據(jù)方案中需要包含有關(guān)資源、環(huán)境、行為和組織需求的元數(shù)據(jù)要素[19]。

David Giaretta針對在數(shù)字資源保存過程中關(guān)鍵屬性一直被賦予各式各樣的定義、保存元數(shù)據(jù)方案不易確定的現(xiàn)狀,結(jié)合OAIS模型定義了長期保存過程中關(guān)鍵屬性、信息真實(shí)性和起源信息等概念的內(nèi)涵與作用[20]。David Giaretta指出,關(guān)鍵屬性就是必須存儲(chǔ)的數(shù)字對象的主要特征,對數(shù)字對象的遷移和轉(zhuǎn)換具有重要的作用,能夠幫助人們判別轉(zhuǎn)換能否被接受,檢測新對象的真實(shí)性;真實(shí)度是指對象達(dá)到預(yù)期目標(biāo)程度的判定;起源信息是關(guān)于對象的歷史信息,可以用來作為支撐真實(shí)度的工具[20]。據(jù)此其認(rèn)為,關(guān)鍵屬性應(yīng)包含優(yōu)先選擇信息、起源信息、語境信息、固定信息和獲取權(quán)信息等描述信息[20]。

Rebecca Guenther和Robert Wolfe以整合元數(shù)據(jù)標(biāo)準(zhǔn)以支持對數(shù)字資源的長久保存為目標(biāo),按照METS標(biāo)準(zhǔn),利用PREMIS中的存儲(chǔ)元數(shù)據(jù)設(shè)計(jì)了以容器格式整合數(shù)字資源的不同格式元數(shù)據(jù)。該整合規(guī)則發(fā)掘METS標(biāo)準(zhǔn)中的公共部分,能夠適應(yīng)數(shù)字系統(tǒng)中不同功能、支持各種格式的元數(shù)據(jù)結(jié)構(gòu),并且能根據(jù)數(shù)字資源生命周期的變更而改變,以適應(yīng)未來的保存需求[21]。

Angela Di Iorio認(rèn)為,盡管采用的保存方法和工具各異,不同機(jī)構(gòu)的長久保存資源應(yīng)該共享,以實(shí)現(xiàn)互操作和數(shù)字資源的完美交換保存,確保分布式長期保存的可行性。Angela Di Iorio詳細(xì)介紹了基于PREMIS的存檔信息包傳輸項(xiàng)目(Archives Ready To the AIPs Transmission,簡稱ARTAT)的元數(shù)據(jù)互操作措施,該項(xiàng)目致力于試驗(yàn)采用通用的存儲(chǔ)元數(shù)據(jù)標(biāo)準(zhǔn)作為互換語言,創(chuàng)建了符合PREMIS編目標(biāo)準(zhǔn)的保存元數(shù)據(jù)層,整合不同存儲(chǔ)庫的保存元數(shù)據(jù),使不同存儲(chǔ)系統(tǒng)的保存元數(shù)據(jù)框架與PREMIS框架一致,以便合作成員間進(jìn)行數(shù)字資源交換,實(shí)現(xiàn)長期存取資源的共同目標(biāo)[22]。

7 關(guān)注長期保存活動(dòng)的組織問題

長期保存活動(dòng)是一項(xiàng)持久性工程,在人員、技術(shù)和管理方面對保存機(jī)構(gòu)提出了挑戰(zhàn)?,F(xiàn)有的長期保存活動(dòng)多是基于項(xiàng)目開展的,缺乏持續(xù)性,所以應(yīng)該研究保存機(jī)構(gòu)如何應(yīng)對挑戰(zhàn),如何保證長期保存活動(dòng)的可持續(xù)發(fā)展。

Sabine Schrimpf介紹了德國Nestor項(xiàng)目由實(shí)驗(yàn)項(xiàng)目成為長期組織的經(jīng)驗(yàn)。Nestor是2003年德國開展的數(shù)字存儲(chǔ)網(wǎng)絡(luò)項(xiàng)目,其中心目標(biāo)之一就是準(zhǔn)備建立能提供數(shù)字資源保存服務(wù)的持久性組織。為了實(shí)現(xiàn)這一目標(biāo),該項(xiàng)目開展了一系列協(xié)調(diào)措施,如指定協(xié)調(diào)者、制定項(xiàng)目計(jì)劃、召開4年一度的項(xiàng)目會(huì)議、定期向項(xiàng)目的投資者匯報(bào)等。最終于2009年7月,Nestor轉(zhuǎn)變?yōu)槌志媒M織,擁有7個(gè)項(xiàng)目成員,其建立持久性組織的準(zhǔn)備措施對其他項(xiàng)目來說是一筆有價(jià)值的經(jīng)驗(yàn)[23]。

法國國家圖書館為了迎接數(shù)字資源保存的挑戰(zhàn),在人員、部門設(shè)置等方面作出調(diào)整。該館意識(shí)到按照OAIS模型進(jìn)行數(shù)字資源存儲(chǔ)不僅是技術(shù)調(diào)整,還需要圖書館開發(fā)和維持相應(yīng)的技能與組織,將數(shù)字資源保存活動(dòng)融入圖書館工作流程。為了應(yīng)對數(shù)字資源存儲(chǔ)所帶來的機(jī)構(gòu)和人力資源挑戰(zhàn),法國國家圖書館在各個(gè)層面上采取了措施,如改變組織、持續(xù)培訓(xùn)員工、建立任務(wù)小組等,在部門設(shè)置上,建立了存儲(chǔ)與保存部門,將數(shù)字化項(xiàng)目從數(shù)字圖書館轉(zhuǎn)移到保存部門;在人力資源方面,開設(shè)了包括元數(shù)據(jù)、數(shù)字圖書館、數(shù)字化、數(shù)字存儲(chǔ)在內(nèi)的數(shù)字信息管理方面的培訓(xùn)課程,界定了數(shù)字館員的內(nèi)涵。這些活動(dòng)的結(jié)果能夠啟發(fā)人們思考國家圖書館如何開展長期數(shù)字資源保存活動(dòng)[24]。

8 關(guān)注數(shù)字資源保存涉及的知識(shí)產(chǎn)權(quán)問題

法律問題是數(shù)字資源保存活動(dòng)的主要障礙之一,數(shù)字資源保存在資源導(dǎo)入、格式轉(zhuǎn)換、資源整合和提供利用的過程中不可避免地涉及到一系列的知識(shí)產(chǎn)權(quán)問題。2008年7月,美國國會(huì)圖書館發(fā)布了一份由NDIIPP、JISC、澳大利亞昆士蘭理工大學(xué)開放存取知識(shí)法律項(xiàng)目及荷蘭SURF基金會(huì)聯(lián)合參與完成的《版權(quán)對數(shù)字保存影響的國際研究》報(bào)告,該報(bào)告建議[25]:各國應(yīng)當(dāng)制訂相關(guān)的法律和政策,以鼓勵(lì)和支持向公眾開放的非營利性圖書館、檔案館、博物館和其他機(jī)構(gòu)在無任何商業(yè)目的的情況下,對存在風(fēng)險(xiǎn)的不同類型、不同載體和不同格式的版權(quán)資料進(jìn)行長期保存,并允許這些機(jī)構(gòu)在存在風(fēng)險(xiǎn)的版權(quán)資料惡化、損壞或丟失之前以及各種與資料存取相關(guān)的軟硬件過時(shí)之前,積極主動(dòng)地采取行動(dòng),但必須以適當(dāng)措施保護(hù)權(quán)利持有人的合法權(quán)益。該報(bào)告建議的保存活動(dòng)包括為確保有效的數(shù)字化保存而復(fù)制和保存的文件副本,為應(yīng)對技術(shù)發(fā)展和標(biāo)準(zhǔn)變化而對版權(quán)作品進(jìn)行的格式轉(zhuǎn)換,為防止災(zāi)難性損失而保存的多余副本,保存機(jī)構(gòu)內(nèi)部或保存機(jī)構(gòu)與法律授權(quán)的第三方倉儲(chǔ)機(jī)構(gòu)之間積極開展的交流。

Mags McGinley詳細(xì)分析了開展數(shù)據(jù)保存和提供獲取服務(wù)可能會(huì)涉及的知識(shí)產(chǎn)權(quán)問題,他認(rèn)為數(shù)字時(shí)代信息公開獲取與版權(quán)所有者對獲取和利用的強(qiáng)大控制力之間存在爭論,提醒人們應(yīng)該關(guān)注相關(guān)法律權(quán)利以及這些權(quán)利的例外原則和數(shù)字資源的許可、保存、風(fēng)險(xiǎn)分析等問題[26]。Mags McGinley列舉了可能會(huì)影響數(shù)字資源保存和獲取服務(wù)的知識(shí)產(chǎn)權(quán)問題,如版權(quán)法、數(shù)據(jù)庫所有權(quán)和作者的道德權(quán)利,并分析了相關(guān)法律中可能存在的例外條例,如出于非商業(yè)研究、個(gè)人研究、批評和回顧等目的的合理使用原則,法定存儲(chǔ)法案可以擴(kuò)展到數(shù)字領(lǐng)域等[26]。

9 關(guān)注數(shù)字資源保存系統(tǒng)

保存系統(tǒng)為數(shù)字資源長期保存提供了必要的軟硬件環(huán)境,是開展保存活動(dòng)的基礎(chǔ)設(shè)施。保存系統(tǒng)的優(yōu)化、系統(tǒng)的穩(wěn)定性與安全性等直接關(guān)系到數(shù)字資源的安全和保存活動(dòng)的順利開展。

加利福尼亞大學(xué)圖書館為了更好地滿足該校各機(jī)構(gòu)的多樣化需求,重新構(gòu)建了數(shù)字圖書館的基礎(chǔ)架構(gòu)。其中將數(shù)字存儲(chǔ)庫的管理和保存功能分解為互操作、應(yīng)用(包括轉(zhuǎn)換、搜索、索引和數(shù)據(jù)輸入)、解釋、保護(hù)等一系列微小獨(dú)立的但內(nèi)部之間能進(jìn)行互操作的微服務(wù)[27]。這些服務(wù)細(xì)小而且獨(dú)立,容易開發(fā)、應(yīng)用、維護(hù)和升級,復(fù)雜的恢復(fù)功能可以通過服務(wù)因子的戰(zhàn)略組合實(shí)現(xiàn)。此方式強(qiáng)調(diào)內(nèi)容的永久保存而不是管理系統(tǒng),文檔沒有與特定技術(shù)綁定[27]。該框架應(yīng)用范圍廣泛,可以根據(jù)具體策略而進(jìn)行彈性調(diào)整,可持續(xù)發(fā)展能力強(qiáng)[27]。

英國教育部、文化和科技部聯(lián)手資助的Planets計(jì)劃以“服務(wù)為中心”定義和評價(jià)保存戰(zhàn)略,注重?cái)?shù)字資源的邏輯保存,開發(fā)了具有自動(dòng)提取、遷移、比較不同格式數(shù)字實(shí)體等功能的保存工具,同時(shí)記錄這些實(shí)體的原始運(yùn)行環(huán)境,以確保資源可以長期獲取且被正確解釋。Planets的整合環(huán)境中還提供了一些面向終端用戶的應(yīng)用,以便數(shù)據(jù)管理者執(zhí)行保存活動(dòng)及對其進(jìn)行科學(xué)評價(jià)。Rainer Schmidt在《分布式長期保存工作流的方案模型和架構(gòu)》中關(guān)注Planets方案的環(huán)境,展示該方案如何創(chuàng)建復(fù)雜的保存工作流[28]。Rainer Schmidt強(qiáng)調(diào)保存系統(tǒng)對法律和第三方服務(wù)有很強(qiáng)的依賴,因此,研究統(tǒng)一保存界面、標(biāo)準(zhǔn)的服務(wù)文檔和服務(wù)模型,對保存工具與對象的互操作及重用性能十分關(guān)鍵[28]。

數(shù)字資源長期保存是信息環(huán)境下保存人類文化遺產(chǎn)和社會(huì)記憶的必要措施,已引起世界范圍內(nèi)的普遍關(guān)注。數(shù)字資源長期保存涉及的資源范圍廣泛,牽涉因素眾多,是一項(xiàng)需要大量投入的系統(tǒng)工程和長期項(xiàng)目?,F(xiàn)有研究在數(shù)字資源保存的成本評估、元數(shù)據(jù)方案設(shè)計(jì)、組織調(diào)整和流程分析等方面取得了一定的進(jìn)展,在后續(xù)研究中,需進(jìn)一步研究適用于不同資源類型、不同保存需求和不同國情的、普適性強(qiáng)的保存標(biāo)準(zhǔn)和保存方案。

[1]Definitions of Digital Preservation[EB/OL]. [2011-02-18].http://www.ala.org/ala/mgrps/divs/alcts/resources/preserv/defdigpres0408.cfm.

[2]Sinclair P, Billenness C, Duckworth J, et al. Are You Ready?Assessing Whether Organisations are Prepared for Digital Preservation[EB/OL]. [2011-02-18].http://www.cdlib.org/iPres/presentations/Sharpe.pdf.

[3]Safeguarding Collections at the Dawn of the 21st Century: Describing Roles & Measuring Contemporary Preservation Activities in ARL Libraries [EB/OL].[2011-02-18].http://www.arl.org/bm~doc/safeguarding-collections.pdf.

[4]國家科學(xué)圖書館與Springer簽訂數(shù)字資源長期保存協(xié)議[EB/OL].[2011-02-18].http://www.luolang.com.cn/Article/library/200909/Article_20090917082053_27526.html.

[5]Victoria R, Rosenthal D. Distributed Digital Preservation: Private LOCKSS Networks as Business, Social, and Technical Frameworks[J].Library Trends,2009(3):461-475.

[6]Myron P, Abrahamson M, Adams M O,et al. From Preserving the Past to Preserving the Future: The Data-PASS Project and the Challenges of Preserving Digital Social Science Data [J].Library Trends, 2009(3):315-337.

[7]Pennock M.ArchivePress: A Really Simple Solution to Archiving Blog Content[EB/OL].[2011-02-18].http://www.cdlib.org/services/uc3/iPres/presentations/Pennockm.pdf.

[8]Conway E.Towards a Methodology for Software Preservation[EB/OL].[2011-02-18].http://www.cdlib.org/iPres/presentations/ConwaySoftware.pdf.

[9]Tarrant D.Where the Semantic Web and Web2.0 Meet Format Risk Management:P2 Registry[EB/OL].[2011-02-18]. http://www.cdlib.org/iPres/presentations/Tarrant.pdf.

[10]Brown G,Woods K.Born Broken: Fonts and Information Loss in Legacy Digital Documents[EB/OL].[2011-02-18].http://www.cdlib.org/iPres/presentations/Brown.pdf.

[11]Lavoie B,Rumsey A S,Anderson M, et al.Perspectives on the Economics of Sustainable Digital Preservation (Panel discussion)[EB/OL].[2011-02-18]. http://www.cdlib.org/services/uc3/iPres/presentations/Lavoie.pdf.

[12]Wheatley P.LIFE3: Predicting Long Term Preservation Costs[EB/OL].[2011-02-18].http://www.cdlib.org/iPres/presentations/Wheatley.pdf.

[13]Kejser U B, Nielsen A B, Thirifays A.Cost Model for Digital Preservation:Cost of Digital Migration[EB/OL].[2011-02-18].http://www.cdlib.org/iPres/presentations/Kejser.pdf.

[14]Altenh.o.ner R.E-Infrastructure and Digital Preservation: Challenges and Outlook[EB/OL].[2011-02-18].http://www.cdlib.org/iPres/presentations/Altenhoener.pdf.

[15]Caplan P, Kehoe W, Pawletko J. Towards Interoperable Preservation Repositories (TIPR) [EB/OL].[2011-02-18]. http://www.cdlib.org/iPres/presentations/Caplan.pdf.

[16]Roorda D,Horik R V.MIXED: Repository of Durable File Format Conversions[EB/OL].[2011-02-18].http://www.cdlib.org/iPres/presentations/VanHorik.pdf.

[17]Wilkes W, Brunsmann J, Heutelbeck D, et al. Towards Support for Long-Term Digital Preservation in Product Life Cycle Management[EB/OL].[2011-02-18]. http://www.cdlib.org/iPres/presentations/Wilkes.pdf.

[18]Conway E, Dunckley M, Giaretta D. Curating Scientific Research Data for the Long Term: A Preservation Analysis Method in Context[EB/OL].[2011-02-18]. http://www.cdlib.org/iPres/presentations/ConwayCurating.pdf.

[19]Dappert A,Farquhar A.Implementing Metadata that Guides Digital Preservation Services[EB/OL].[2011-02-18]. http://www.cdlib.org//services/uc3/iPres/presentations/Farquhar.pdf.

[20]Giaretta D,Matthews B,Bicarregui J,et al.Significant Properties,Authenticity, Provenance, Representation Information and OAIS[EB/OL].[2011-02-18].http://www.cdlib.org/iPres/presentations/GiarettaSigProps.pdf.

[21]Guenther R, Wolfe R.Integrating Metadata Standards to Support Long-Term Preservation of Digital Assets: Developing Best Practices for Expressing Preservation Metadata in a Container Format [EB/OL].[2011-02-18]. http://www.cdlib.org/iPres/presentations/Guenther.pdf.

[22]Iorio A D.A Translation Layer to Convey Preservation Metadata[EB/OL].[2011-02-18]. http://www.cdlib.org/iPres/presentations/DiIorio.pdf.

[23]Schrimpf S.Lessons Learned: Moving a Digital Preservation Network from Project Organization to Sustainability[EB/OL].[2011-02-18].http://www.cdlib.org/iPres/presentations/Schrimpf.pdf.

[24]Bermès M, Fauduet L.The Human Face of Digital Preservation:Organizational and Staff Challenges and Initiatives at the Bibliothèque Nationale de France[EB/OL].[2011-02-18].http://www.cdlib.org/iPres/presentations/Bermes.pdf.

[25]International Study on the Impact of Copyright on Digital Preservation[EB/OL].[2011-02-18].http://www.digitalpreservation.gov/partners/resources/pubs/digital_preservation_final_report2008.pdf.

[26]McGinley M.Intellectual Property Rights and Their Impact on Digital Preservation and Access[EB/OL].[2011-02-18].http://www.dpconline.org/whats-new/download-document/172-digital-rightsasset-management-forum-mcginley.html.

[27]Abrams S, Kunze J, Loy D.An Emergent Micro-Services Approach to Digital Curation Infrastructure[EB/OL].[2011-02-18].http://www.cdlib.org/iPres/presentations/Abrams.pdf.

[28]Schmidt R, King R, Steeg F, et al.A Framework for Distributed Preservation Workflows[EB/OL].[2011-02-18].http://homepage.univie.ac.at/rainer.schmidt/publications/iPres09.pdf.

猜你喜歡
數(shù)字圖書館資源
基礎(chǔ)教育資源展示
一樣的資源,不一樣的收獲
資源回收
圖書館
答數(shù)字
資源再生 歡迎訂閱
數(shù)字看G20
去圖書館
成雙成對
數(shù)字變變變
黄梅县| 措美县| 旬邑县| 资阳市| 无棣县| 三江| 宝兴县| 九龙县| 丰县| 梧州市| 博客| 沽源县| 上高县| 闽清县| 邵东县| 连平县| 鄱阳县| 磐安县| 绥化市| 宁国市| 偏关县| 仲巴县| 内乡县| 沁源县| 那坡县| 萝北县| 普格县| 扎鲁特旗| 谢通门县| 厦门市| 百色市| 阳城县| 兖州市| 无极县| 自治县| 永登县| 尉犁县| 府谷县| 石家庄市| 彰武县| 介休市|