国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

高校圖書(shū)館館藏?cái)?shù)字化資源長(zhǎng)期保存系統(tǒng)探索與實(shí)踐

2024-09-14 00:00:00孫超
圖書(shū)館學(xué)刊 2024年8期
關(guān)鍵詞:數(shù)字化資源高校圖書(shū)館

[摘 要]隨著數(shù)字技術(shù)的發(fā)展,高校圖書(shū)館數(shù)字化加工能力大幅提升,并逐步積累特色數(shù)字化館藏資源。為確保這些寶貴資源的持久性和可訪問(wèn)性,高校圖書(shū)館開(kāi)展數(shù)字化資源長(zhǎng)期保存工作的研究與探索具有十分重要的意義。以北京大學(xué)圖書(shū)館館藏?cái)?shù)字化資源長(zhǎng)期保存工作實(shí)踐為例,研究高校圖書(shū)館開(kāi)展館藏?cái)?shù)字化資源長(zhǎng)期保存的實(shí)施路徑,設(shè)計(jì)數(shù)字化資源長(zhǎng)期保存概念及功能模型,并基于Islandora開(kāi)發(fā)館藏?cái)?shù)字化資源長(zhǎng)期保存示范系統(tǒng)。

[關(guān)鍵詞]高校圖書(shū)館 數(shù)字化資源 長(zhǎng)期保存 Islandora

[分類號(hào)]G252.3

高校圖書(shū)館作為知識(shí)與信息的重要載體,承擔(dān)著傳承文化、傳播知識(shí)、促進(jìn)科研與教育的重任。隨著全球數(shù)字化趨勢(shì)的不斷發(fā)展,國(guó)內(nèi)外高校圖書(shū)館數(shù)字化加工能力大大提升,很多高校逐步積累了特色數(shù)字化館藏資源,包括數(shù)字化圖書(shū)、數(shù)字化古籍、數(shù)字化音視頻、數(shù)字化地圖等。2017年OCLC發(fā)布研究報(bào)告顯示,美國(guó)92%的公共圖書(shū)館開(kāi)展了數(shù)字化建設(shè)[1]。張毅等對(duì)U.S.News世界大學(xué)排名前100的高校展開(kāi)調(diào)研,結(jié)果顯示有82所高校具有數(shù)字化資源[2]。這些特色數(shù)字化資源對(duì)于學(xué)術(shù)研究和歷史文化的傳承都有著不可替代的重要作用。然而,數(shù)字化資源的長(zhǎng)期保存面臨諸多挑戰(zhàn),包括技術(shù)更新?lián)Q代導(dǎo)致的格式和設(shè)備兼容性問(wèn)題、數(shù)據(jù)損壞及意外丟失等。美國(guó)國(guó)會(huì)圖書(shū)館將長(zhǎng)期保存定義為“對(duì)數(shù)字內(nèi)容進(jìn)行長(zhǎng)期積極管理,以確保持續(xù)訪問(wèn)”[3],“長(zhǎng)期積極管理”涉及保存政策、財(cái)務(wù)、人力、技術(shù)等。然而大多數(shù)圖書(shū)館只是簡(jiǎn)單掃描形成數(shù)字化資源,或者將其以數(shù)據(jù)庫(kù)的形式供用戶訪問(wèn),無(wú)法滿足數(shù)字化資源的長(zhǎng)期保存需求[4]。

數(shù)字化資源長(zhǎng)期保存不僅關(guān)乎學(xué)術(shù)研究和教育的可持續(xù)發(fā)展,還涉及人類文化傳承問(wèn)題。因此,為確保珍貴資源的持久性和可訪問(wèn)性,高校圖書(shū)館開(kāi)展數(shù)字化資源長(zhǎng)期保存工作的研究與探索具有十分重要的意義。

1 數(shù)字資源長(zhǎng)期保存研究現(xiàn)狀

國(guó)外對(duì)數(shù)字資源長(zhǎng)期保存的研究較早,自1990年美國(guó)空間數(shù)據(jù)系統(tǒng)咨詢委員會(huì) (Consultative Committee for Space Data Systems,CCSDS)開(kāi)始制訂長(zhǎng)期保存數(shù)字?jǐn)?shù)據(jù)檔案的標(biāo)準(zhǔn)起,經(jīng)過(guò)三十多年的發(fā)展,已形成了一系列成熟的政策、標(biāo)準(zhǔn)和技術(shù)。例如,自2000年起,美國(guó)國(guó)會(huì)圖書(shū)館推出“國(guó)家數(shù)字信息基礎(chǔ)設(shè)施和保護(hù)計(jì)劃(NDIIPP)”用于加強(qiáng)數(shù)字資源存檔和訪問(wèn)提供,資助研制了一系列的保存標(biāo)準(zhǔn)和技術(shù)工具[3]。英國(guó)于2001年成立了數(shù)字保存聯(lián)盟(Dgital Presrevation Coalition,DPC),由教育、圖書(shū)館、檔案館、文化和商業(yè)領(lǐng)域共同領(lǐng)導(dǎo),旨在確保全球面臨風(fēng)險(xiǎn)的數(shù)字資源能夠?qū)嶋H保存,以保障全球的數(shù)字記憶和知識(shí)基礎(chǔ)[5]。哈佛大學(xué)圖書(shū)館建立了長(zhǎng)期保存庫(kù)服務(wù) (Digital Repository Service,DRS),以滿足其當(dāng)前和未來(lái)教學(xué)科研對(duì)數(shù)字資源的長(zhǎng)期需求[6]。斯坦福大學(xué)牽頭的LOCKSS項(xiàng)目是為學(xué)術(shù)期刊設(shè)計(jì)的分布式開(kāi)源系統(tǒng),由保存同一份材料的圖書(shū)館所組成點(diǎn)對(duì)點(diǎn)網(wǎng)絡(luò),允許圖書(shū)館對(duì)網(wǎng)上發(fā)布的材料進(jìn)行收集、保存并提供訪問(wèn)權(quán)限[7]。牛津大學(xué)圖書(shū)館和劍橋大學(xué)圖書(shū)館于2016年合作設(shè)立為期兩年的DPOC項(xiàng)目,開(kāi)展了長(zhǎng)期保存和管理領(lǐng)域的現(xiàn)有專業(yè)知識(shí)研究,并加強(qiáng)了各自圖書(shū)館的長(zhǎng)期保存計(jì)劃[8]。此外,荷蘭國(guó)家圖書(shū)館推行了長(zhǎng)期保存的數(shù)字存檔系統(tǒng)e-Depot、澳大利亞國(guó)家圖書(shū)館聯(lián)合國(guó)內(nèi)公共和高校圖書(shū)館成立了保存聯(lián)盟共同保存澳大利亞的數(shù)字記憶等[9]。

國(guó)內(nèi)對(duì)數(shù)字化資源長(zhǎng)期保存的研究始于2000年左右。國(guó)家圖書(shū)館聯(lián)合北京大學(xué)圖書(shū)館、清華大學(xué)圖書(shū)館等,參照國(guó)外已有標(biāo)準(zhǔn)制定了數(shù)字化加工掃描、保存元數(shù)據(jù)等一系列相關(guān)規(guī)范標(biāo)準(zhǔn)[10]。國(guó)家圖書(shū)館設(shè)有數(shù)字化加工部,采用保存級(jí)別和非保存級(jí)別文件格式將資源區(qū)分保存到不同系統(tǒng)[11]。香港中文大學(xué)圖書(shū)館采用Islandora開(kāi)源軟件構(gòu)建數(shù)字集合,對(duì)其本地自建的數(shù)字化資源進(jìn)行攝入保存和展示[12]。香港科技大學(xué)圖書(shū)館基于WordPress開(kāi)發(fā)自建資源的元數(shù)據(jù)著錄系統(tǒng),將本地?cái)?shù)字化資源與館藏系統(tǒng)元數(shù)據(jù)關(guān)聯(lián),輔助以人工進(jìn)行元數(shù)據(jù)統(tǒng)一著錄并攝入系統(tǒng)中進(jìn)行保存和展示[13-14]。中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心自2009年開(kāi)始研發(fā)商業(yè)數(shù)字資源長(zhǎng)期保存系統(tǒng),并于2013年依托“國(guó)家數(shù)字科技文獻(xiàn)資源長(zhǎng)期保存體系(NDPP)”構(gòu)建了國(guó)家級(jí)保存網(wǎng)絡(luò)[15]。北京大學(xué)圖書(shū)館在2016年加入NDPP工作,成為其中一個(gè)重要保存節(jié)點(diǎn),參與保存了電子期刊、電子書(shū)、學(xué)位論文等多種資源[16]。

總體來(lái)講,在國(guó)際范圍內(nèi)數(shù)字化資源長(zhǎng)期保存已經(jīng)有了較為成熟的研究和實(shí)踐。國(guó)外圖書(shū)館、檔案館和研究機(jī)構(gòu)通過(guò)合作和創(chuàng)新,共同努力確保數(shù)字資源的長(zhǎng)期可訪問(wèn)性和可持續(xù)性。在國(guó)內(nèi),數(shù)字化資源長(zhǎng)期保存的研究和實(shí)踐也在逐步展開(kāi),中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心、國(guó)家圖書(shū)館等多個(gè)重點(diǎn)圖書(shū)館和研究機(jī)構(gòu)積極參與并貢獻(xiàn)力量。然而高校圖書(shū)館在館藏?cái)?shù)字化資源長(zhǎng)期保存系統(tǒng)方面的建設(shè)實(shí)踐比較欠缺,一方面是由于高校對(duì)長(zhǎng)期保存的重要性認(rèn)識(shí)不足,人力和資金資源短缺,另一方面我國(guó)開(kāi)展數(shù)字資源長(zhǎng)期保存研究主要集中在理論和政策方面,可供參考的應(yīng)用案例較少。

2 館藏?cái)?shù)字化資源長(zhǎng)期保存實(shí)施路徑分析

2.1 館藏?cái)?shù)字化資源長(zhǎng)期保存需求分析

隨著數(shù)字化設(shè)備由自動(dòng)化逐步向智能化發(fā)展,數(shù)字化內(nèi)容的精度大幅提升,存儲(chǔ)設(shè)備的成本逐步降低,高校圖書(shū)館的數(shù)字化資源越來(lái)越普遍。從機(jī)構(gòu)的角度來(lái)看,高校圖書(shū)館開(kāi)展資源數(shù)字化工作主要包括兩種:一是基于聯(lián)盟。該方式采用合作共享的機(jī)制,實(shí)現(xiàn)高校圖書(shū)館本地資源的數(shù)字化共建共享。如,大學(xué)數(shù)字圖書(shū)館國(guó)際合作計(jì)劃(China Academic Digital Associative Library,CADAL),構(gòu)建了較完善的項(xiàng)目標(biāo)準(zhǔn)規(guī)范體系,成員館在元數(shù)據(jù)、資源保存與展示等方面,采用聯(lián)盟統(tǒng)一的平臺(tái)和技術(shù)[17]。二是高校圖書(shū)館自建。主要針對(duì)特色館藏資源,或者一些項(xiàng)目的數(shù)字化資源。這部分資源由于缺乏統(tǒng)一的系統(tǒng)保存和管理,存在種類繁多、存儲(chǔ)混亂等問(wèn)題。筆者將著重討論本地?cái)?shù)字化資源的長(zhǎng)期保存建設(shè)問(wèn)題。

2.2 數(shù)字化資源長(zhǎng)期保存系統(tǒng)功能設(shè)計(jì)

張智雄等調(diào)研了符合開(kāi)放檔案信息系統(tǒng)(Open Archival Information System,OAIS)普遍特性的多個(gè)系統(tǒng),認(rèn)為長(zhǎng)期保存系統(tǒng)涉及面廣、功能復(fù)雜,是由多個(gè)系統(tǒng)組成的有機(jī)整體,并歸納了相關(guān)功能實(shí)體[18]。具體而言,OAIS提供了一套概念和術(shù)語(yǔ)體系,對(duì)開(kāi)放存檔信息系統(tǒng)的構(gòu)成組件、結(jié)構(gòu)功能、管理要求和信息組織管理模式進(jìn)行了描述,筆者基于OAIS六大功能實(shí)體設(shè)計(jì)了數(shù)字化資源長(zhǎng)期保存功能(見(jiàn)圖1)。

2.3 數(shù)字化資源長(zhǎng)期保存開(kāi)源系統(tǒng)選型指標(biāo)設(shè)計(jì)

筆者根據(jù)自身建設(shè)實(shí)施的經(jīng)驗(yàn),梳理了開(kāi)源系統(tǒng)的選型需求,并參考丹佛大學(xué)實(shí)施長(zhǎng)期保存系統(tǒng)時(shí)的評(píng)估方法[19],構(gòu)建了一個(gè)指標(biāo)體系及其權(quán)重來(lái)評(píng)估開(kāi)源系統(tǒng)是否符合當(dāng)前機(jī)構(gòu)的需求(見(jiàn)表1)。

2.4 長(zhǎng)期保存開(kāi)源系統(tǒng)對(duì)比分析

根據(jù)長(zhǎng)期保存工具登記網(wǎng)站COPTR[15]統(tǒng)計(jì),截至2023年1月17日,已有29種長(zhǎng)期保存系統(tǒng)登記,其中大部分為開(kāi)源系統(tǒng)。筆者通過(guò)文獻(xiàn)和檢索系統(tǒng)調(diào)研了其中比較有代表性的4種系統(tǒng),分別是Islandora[21]、Samvera[22]、Archivematica[23]和DAITSS[24]。筆者基于六大功能實(shí)體和ISO 16363[25]的詳細(xì)要求梳理了4個(gè)主要功能模塊及若干具體功能,對(duì)上述系統(tǒng)功能進(jìn)行對(duì)比分析,詳見(jiàn)圖2。

總體來(lái)看,4個(gè)系統(tǒng)都能滿足攝入、處理、訪問(wèn)、存儲(chǔ)等基本功能,但是各自的特點(diǎn)和優(yōu)勢(shì)又有所不同。其中,Islandora滿足的功能最多,但是目前不具備攝入過(guò)程中的復(fù)制和文件查重功能。其基于Drupal模塊化的架構(gòu)優(yōu)勢(shì)可以滿足各種不斷增加的長(zhǎng)期保存活動(dòng)帶來(lái)的新功能需求,適合那些不具備基本的保存功能、需要自定義更多優(yōu)化功能的圖書(shū)館。Samvera能夠滿足大部分功能,但是無(wú)法打包元數(shù)據(jù),同時(shí)導(dǎo)出策略也沒(méi)有明確。其架構(gòu)與Islandora類似,基于微服務(wù)架構(gòu),支持多種功能需求。Archivematica具備完善的長(zhǎng)期保存流程功能,但是在存儲(chǔ)方面功能較簡(jiǎn)單,需要配合第三方存儲(chǔ)軟件滿足長(zhǎng)期保存需要,如LOCKSS、DuraCloud和Arkivum。DAITSS能夠滿足長(zhǎng)期保存的基本功能,但是在進(jìn)一步優(yōu)化功能方面有所欠缺。如不具備自動(dòng)收割元數(shù)據(jù)、手動(dòng)創(chuàng)建元數(shù)據(jù)的功能,也不具備權(quán)限管理功能;在訪問(wèn)方面不具備公共訪問(wèn)的接口;在多副本及可靠的長(zhǎng)期保存方面也不如基于Fedora倉(cāng)儲(chǔ)的Islandora和Samvera。綜上所述,這幾種開(kāi)源軟件均具備基本的長(zhǎng)期保存功能,并且能夠“開(kāi)箱即用”。圖書(shū)館在建設(shè)數(shù)字化資源長(zhǎng)期保存系統(tǒng)時(shí)可根據(jù)各自需求及成本選擇合適的技術(shù)方案。

3 北京大學(xué)圖書(shū)館館藏?cái)?shù)字化資源長(zhǎng)期保存示范系統(tǒng)建設(shè)

多年來(lái),北京大學(xué)圖書(shū)館開(kāi)展了大量文獻(xiàn)數(shù)字化工作,將珍貴文獻(xiàn)數(shù)字化后建成特色數(shù)據(jù)庫(kù),方便用戶使用,避免或減少對(duì)原始紙質(zhì)文獻(xiàn)的直接使用以加強(qiáng)保護(hù)。但由于缺乏系統(tǒng)性規(guī)劃,數(shù)字化資源面臨著存儲(chǔ)分散、管理難度大等問(wèn)題以及數(shù)字對(duì)象老化、損壞等風(fēng)險(xiǎn)。因此,北京大學(xué)圖書(shū)館基于數(shù)字化項(xiàng)目的實(shí)際需求,開(kāi)展了數(shù)字化館藏資源長(zhǎng)期保存工作探索。北京大學(xué)圖書(shū)館基于開(kāi)源軟件Islandora開(kāi)發(fā)了館藏?cái)?shù)字化資源長(zhǎng)期保存示范系統(tǒng),實(shí)現(xiàn)了數(shù)字化資源從元數(shù)據(jù)生產(chǎn)到提交數(shù)據(jù)包(SIP)提交,到攝入保存管理,再到發(fā)布的整套流程。該系統(tǒng)的探索實(shí)踐也為高校圖書(shū)館數(shù)字化資源的管理與保存工作提供了經(jīng)驗(yàn)借鑒。

3.1 數(shù)字化資源保存需求分析

北京大學(xué)分館數(shù)字化項(xiàng)目涉及的資源來(lái)自社會(huì)學(xué)系民國(guó)圖書(shū)、哲學(xué)系部分民國(guó)圖書(shū)、歷史系部分縮微膠片、外語(yǔ)學(xué)院和新聞傳播學(xué)院音視頻資源以及馬克思主義學(xué)院的影印圖書(shū)和報(bào)紙,這些資源均有保存和發(fā)布的需求。數(shù)字化后的資源格式包括圖像、文檔、音視頻等,分別存儲(chǔ)在移動(dòng)硬盤、館員辦公電腦和服務(wù)器上,因此數(shù)字化館藏資源長(zhǎng)期保存需要解決的問(wèn)題主要包括:(1)自動(dòng)采集元數(shù)據(jù)。數(shù)字化資源僅有圖像和PDF文件,元數(shù)據(jù)缺失,因此需要解決如何將館藏資源進(jìn)行相關(guān)元數(shù)據(jù)加工、以何種封裝格式向保存系統(tǒng)提交數(shù)據(jù)等問(wèn)題。(2)保存管理。目前,北京大學(xué)參與的國(guó)家科技文獻(xiàn)數(shù)字資源保存體系主要適用于期刊資源,并沒(méi)有針對(duì)自建數(shù)字化資源的保存系統(tǒng)。(3)發(fā)布管理。保存系統(tǒng)和展示系統(tǒng)對(duì)于數(shù)字對(duì)象的要求不同,涉及如何進(jìn)行保存和格式轉(zhuǎn)換的問(wèn)題。

3.2 數(shù)字化資源長(zhǎng)期保存示范系統(tǒng)設(shè)計(jì)

筆者設(shè)計(jì)了北京大學(xué)圖書(shū)館數(shù)字化資源長(zhǎng)期保存示范系統(tǒng)概念模型,如圖3所示。整個(gè)系統(tǒng)設(shè)計(jì)采用國(guó)際標(biāo)準(zhǔn)的OAIS框架構(gòu)建,分為3個(gè)子系統(tǒng):元數(shù)據(jù)加工系統(tǒng)、長(zhǎng)期保存管理系統(tǒng)和展示發(fā)布系統(tǒng)。數(shù)字加工中心、北京大學(xué)長(zhǎng)期保存系統(tǒng)和用戶分別對(duì)應(yīng)數(shù)據(jù)生產(chǎn)者、數(shù)據(jù)管理者和數(shù)據(jù)使用者3個(gè)概念。在數(shù)字化加工過(guò)程中,添加描述元數(shù)據(jù)的加工,通過(guò)圖書(shū)館業(yè)務(wù)系統(tǒng)的API接口實(shí)現(xiàn)與館藏相關(guān)數(shù)字化資源的自動(dòng)編目。同時(shí),對(duì)于未收藏的圖書(shū),可以手動(dòng)填寫(xiě)生成元數(shù)據(jù)。系統(tǒng)采用開(kāi)源Fedora作為底層倉(cāng)儲(chǔ),設(shè)計(jì)通用數(shù)據(jù)對(duì)象模型,并通過(guò)開(kāi)放接口開(kāi)發(fā)模塊化的工具套件,構(gòu)建出滿足實(shí)際需求的應(yīng)用系統(tǒng)。

3.3 數(shù)字化資源長(zhǎng)期保存示范系統(tǒng)選型分析

如上所述,筆者構(gòu)建了一個(gè)指標(biāo)體系及其權(quán)重來(lái)評(píng)估開(kāi)源系統(tǒng)是否符合當(dāng)前機(jī)構(gòu)的需求。以北京大學(xué)圖書(shū)館為例,在技術(shù)選型方面除了上述4種開(kāi)源軟件之外,將北京大學(xué)圖書(shū)館參與的國(guó)家保存體系中的長(zhǎng)期保存系統(tǒng)DPS也加入對(duì)比。該系統(tǒng)將Fedora存儲(chǔ)系統(tǒng)進(jìn)行了擴(kuò)展,在此基礎(chǔ)上基于Java開(kāi)發(fā)了數(shù)據(jù)處理和訪問(wèn)系統(tǒng)[26]。利用“矩陣分析”技術(shù),通過(guò)對(duì)該5種軟件關(guān)鍵因素得分的加權(quán)計(jì)算,得出決策結(jié)果(見(jiàn)圖4)。

3.4 數(shù)字化資源長(zhǎng)期保存示范系統(tǒng)功能及效果

(1)元數(shù)據(jù)加工

為了解決數(shù)字化資源僅有圖像和PDF文件、元數(shù)據(jù)缺失的問(wèn)題,北京大學(xué)圖書(shū)館基于Java和業(yè)務(wù)系統(tǒng)接口開(kāi)發(fā)了元數(shù)據(jù)加工客戶端(見(jiàn)圖5)。該工具通過(guò)館藏目錄檢索來(lái)補(bǔ)充元數(shù)據(jù)??蛻舳四軌虬惭b到館員的電腦上,實(shí)現(xiàn)對(duì)本地已掃描圖書(shū)文件的元數(shù)據(jù)自動(dòng)生成,也支持手動(dòng)修改增加元數(shù)據(jù)。

(2)數(shù)字化資源攝入

攝入是指將前面補(bǔ)充完元數(shù)據(jù)的壓縮包導(dǎo)入長(zhǎng)期保存系統(tǒng)中的過(guò)程。攝入過(guò)程支持多種文件格式,如JPEG、PNG、PDF、MP3、MP4等;支持多種描述元數(shù)據(jù)的解析與轉(zhuǎn)換,如Dublin Core、MODS、MARC等;同時(shí)支持生成保存元數(shù)據(jù)標(biāo)準(zhǔn)PREMIS文件,并將數(shù)字資源內(nèi)容封裝存儲(chǔ)到Fedora倉(cāng)儲(chǔ)中。

(3)數(shù)字化資源保存管理

數(shù)字化資源的長(zhǎng)期保存與管理,是系統(tǒng)的核心功能。該系統(tǒng)制定了完整的保存管理流程,包括病毒檢查、MD5校驗(yàn)、描述元數(shù)據(jù)轉(zhuǎn)換、技術(shù)元數(shù)據(jù)抽取、保存元數(shù)據(jù)自動(dòng)生成、縮略圖生成、圖像格式轉(zhuǎn)換、自動(dòng)審計(jì)、攝入保存到Fedora、分發(fā)等。為實(shí)現(xiàn)該流程功能,系統(tǒng)應(yīng)用了以下開(kāi)源工具:圖像格式轉(zhuǎn)換工具Imagemagick、MD5校驗(yàn)工具、技術(shù)元數(shù)據(jù)抽取JHOVE、審計(jì)工具、BagIT打包工具等。

(4)數(shù)字化資源獲取

基于drupal搭建的發(fā)布系統(tǒng),內(nèi)容數(shù)據(jù)全部來(lái)自保存管理系統(tǒng)。依據(jù)元數(shù)據(jù)采用solr構(gòu)建了索引,支持分面瀏覽和內(nèi)容檢索。如圖6所示,在內(nèi)容建設(shè)時(shí),按照北京大學(xué)圖書(shū)館各分館所屬院系分別建設(shè)了不同數(shù)據(jù)集,支持包括文檔、大圖像、音視頻等格式內(nèi)容的在線瀏覽、檢索和下載,同時(shí)能夠針對(duì)用戶的身份類型作不同權(quán)限設(shè)置。

(5)系統(tǒng)實(shí)施效果

基于Islandora框架的長(zhǎng)期保存系統(tǒng),充分利用了Islandora豐富的功能和模塊。本探索工作總共處理了近一萬(wàn)條元數(shù)據(jù)文件,實(shí)現(xiàn)了分館珍貴數(shù)字化資源的資源描述和長(zhǎng)期保存。在實(shí)驗(yàn)階段,成功測(cè)試保存了超過(guò)兩千本數(shù)字化圖書(shū),約500GB的數(shù)據(jù)量。借助Islandora的特性,系統(tǒng)實(shí)現(xiàn)了豐富的圖書(shū)資源展示和管理,包括在線瀏覽、下載等基本功能。同時(shí),Islandora的高度可定制性和擴(kuò)展性也為未來(lái)系統(tǒng)升級(jí)和功能拓展提供了便利。

4 高校圖書(shū)館館藏?cái)?shù)字化資源長(zhǎng)期保存建設(shè)思考

4.1 制定完善的長(zhǎng)期保存實(shí)施策略

長(zhǎng)期保存工作不僅需要系統(tǒng)建設(shè)和開(kāi)發(fā),還應(yīng)具備完善的政策保障。為了確保自建數(shù)字化資源的長(zhǎng)久保存并能夠在未來(lái)重用,國(guó)內(nèi)高校圖書(shū)館在開(kāi)展數(shù)字化資源長(zhǎng)期保存系統(tǒng)建設(shè)時(shí)也應(yīng)考慮政策和保存策略問(wèn)題。筆者基于調(diào)研和北大圖書(shū)館工作實(shí)踐,認(rèn)為應(yīng)著重考慮以下方面問(wèn)題:(1)制定長(zhǎng)期保存政策,明確需要保存的數(shù)字化資源范圍以及利益相關(guān)者的角色和責(zé)任。(2)實(shí)施符合國(guó)際標(biāo)準(zhǔn)(如OAIS參考模型)的長(zhǎng)期保存系統(tǒng)。(3)采用適當(dāng)?shù)谋4嬖獢?shù)據(jù)標(biāo)準(zhǔn)(如保存元數(shù)據(jù)字典PREMIS),并為數(shù)字資源創(chuàng)建準(zhǔn)確和全面的元數(shù)據(jù)記錄。(4)定期監(jiān)測(cè)和評(píng)估保存系統(tǒng)及保存過(guò)程,確保數(shù)字資源隨著時(shí)間的推移能保持完整性、真實(shí)性和可訪問(wèn)性。(5)為館員和用戶提供長(zhǎng)期保存最佳實(shí)踐[如可信賴倉(cāng)儲(chǔ)標(biāo)準(zhǔn)(Trustworthy Digital Repositories),TDR[12]]的培訓(xùn)和支持。

4.2 重視長(zhǎng)期保存技術(shù)和系統(tǒng)的建設(shè)

筆者調(diào)研了國(guó)內(nèi)外現(xiàn)有的長(zhǎng)期保存系統(tǒng),并比較分析了其中有代表性的4種系統(tǒng)功能,認(rèn)為當(dāng)前長(zhǎng)期保存系統(tǒng)的功能并不能完全滿足保存機(jī)構(gòu)需求,尤其是對(duì)數(shù)字化資源的保存。筆者提出的館藏?cái)?shù)字化資源長(zhǎng)期保存系統(tǒng)建設(shè)方案及技術(shù)選型方案,可以為國(guó)內(nèi)高校圖書(shū)館提供一定參考,但各館仍需個(gè)性化開(kāi)發(fā)和優(yōu)化系統(tǒng)功能。以北京大學(xué)圖書(shū)館館藏?cái)?shù)字化資源長(zhǎng)期保存實(shí)踐為例,考慮到珍貴數(shù)字化資源的安全性要求,元數(shù)據(jù)加工系統(tǒng)采用了C/S模式。國(guó)內(nèi)其他高校在實(shí)施長(zhǎng)期保存策略時(shí),可考慮將元數(shù)據(jù)補(bǔ)充功能集成到Web系統(tǒng)中,并適當(dāng)引入外部接口(如CALIS聯(lián)機(jī)目錄等)以加快元數(shù)據(jù)補(bǔ)充效率。

4.3 加強(qiáng)對(duì)珍貴數(shù)字化資源的長(zhǎng)期保存

高校圖書(shū)館在開(kāi)展數(shù)字化保存工作時(shí),應(yīng)支持更多資源類型,制定分層級(jí)的保存標(biāo)準(zhǔn),優(yōu)先加強(qiáng)珍貴資源(如名人手稿、古籍圖像等)的數(shù)字化保存。當(dāng)前國(guó)內(nèi)高校圖書(shū)館已經(jīng)積累了大量的數(shù)字化古籍資源,如北京大學(xué)圖書(shū)館已掃描了256萬(wàn)頁(yè)古籍,清華大學(xué)、南京大學(xué)、武漢大學(xué)圖書(shū)館等也已開(kāi)展了數(shù)字化掃描工作[27]。針對(duì)古籍資源的數(shù)字化掃描工作既能為古籍?dāng)?shù)據(jù)庫(kù)建設(shè)提供支持,也有助于長(zhǎng)久保護(hù)這些珍貴資源。

5 結(jié)語(yǔ)

筆者通過(guò)調(diào)研國(guó)際高校圖書(shū)館針對(duì)數(shù)字化資源的保存案例,分析了當(dāng)前國(guó)內(nèi)外的研究現(xiàn)狀,并對(duì)比研究了成熟的保存系統(tǒng)。結(jié)合北京大學(xué)圖書(shū)館館藏?cái)?shù)字化資源建設(shè)和保存的實(shí)際需求,設(shè)計(jì)了基于Islandora的北京大學(xué)圖書(shū)館長(zhǎng)期保存示范系統(tǒng)建設(shè)方案。通過(guò)系統(tǒng)搭建、元數(shù)據(jù)加工、數(shù)據(jù)攝入、長(zhǎng)期保存管理、展示等探索研究,實(shí)現(xiàn)了對(duì)館藏?cái)?shù)字化資源全生命周期的保存管理,可為高校圖書(shū)館數(shù)字化資源長(zhǎng)期保存工作提供實(shí)踐參考。

參考文獻(xiàn):

[1] 曲蘊(yùn),馬春.推進(jìn)國(guó)家數(shù)字平臺(tái):美國(guó)公共圖書(shū)館和州立圖書(shū)館的數(shù)字化現(xiàn)狀[J].公共圖書(shū)館,2017(1):88-94

[2] 張毅,陳丹.全球100所知名高校圖書(shū)館特藏資源調(diào)查與分析[J].圖書(shū)館雜志,2023(5):71-81.

[3] National Digital Information Infrastructure and Preservation Program (NDIIPP) [EB/OL]. [2023-01-10]. https://www.digitalpreservation.gov/.

[4] 蔡迎春. 數(shù)字人文視域下的圖書(shū)館特藏資源數(shù)字化建設(shè)——以“民國(guó)時(shí)期文獻(xiàn)目錄數(shù)據(jù)平臺(tái)”為例 [J]. 圖書(shū)館建設(shè),2018 (7): 31-36,41.

[5] Digital Preservation Coalition[EB/OL].[2023-01-11]. https://www.dpconline.org/.

[6] Research Data Service [EB/OL]. [2023-03-10]. https://www.ed.ac.uk/library/research-support/research-data-service.

[7] LOCKSS Program. Lost Of Copice Keep Stuff Safe[EB/OL]. [2023-03-10]. https://www.lockss.org/.

[8] DPOC [EB/OL]. [2023-03-10]. http://www.dpoc.ac.uk.

[9] E-DEPO [EB/OL]. [2023-03-10]. https://finanzen.belgium.be/de/e-depo

[10] 姜愛(ài)蓉,等.長(zhǎng)期保存元數(shù)據(jù)在文物數(shù)字化保護(hù)項(xiàng)目中的應(yīng)用[J].數(shù)字圖書(shū)館論壇,2020(6):2-7.

[11] 邢軍. 國(guó)家圖書(shū)館數(shù)字資源保存的現(xiàn)狀和發(fā)展策略 [J]. 數(shù)字與縮微影像,2016 (4): 8-10.

[12] 香港中文大學(xué)圖書(shū)館. Digitisation Policy[EB/OL]. [2023-03-10]. https://repository. lib. cuhk. edu. hk/en/digitisation-policy.

[13] 認(rèn)識(shí)WordPress [EB/OL]. [2023-03-10]. https://cn.wordpress.org/.

[14] HKUST Library [EB/OL]. [2023-03-10]. https://library.ust.hk/.

[15] 張曉林,等.國(guó)家數(shù)字科技文獻(xiàn)資源長(zhǎng)期保存體系的戰(zhàn)略與實(shí)踐[J].圖書(shū)館雜志,2017(12):14-19.

[16] 張乃帥,孫超.北京大學(xué)圖書(shū)館長(zhǎng)期保存系統(tǒng)建設(shè)與探索[J].大學(xué)圖書(shū)館學(xué)報(bào),2019(2):62-66.

[17]" 金佳麗,薛霏,黃晨.學(xué)術(shù)數(shù)字圖書(shū)館二十年:從數(shù)字化合作到數(shù)字知識(shí)服務(wù)聯(lián)盟[J].中國(guó)圖書(shū)館學(xué)報(bào),2022(2):25-35.

[18] 張智雄,等.基于OAIS的主要數(shù)字保存系統(tǒng)研究[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2005(11):1-9,13.

[19] Yeh S-T,et al. Deploying Islandora as a Digital Repository Platform: a Multifaceted Experience at the University of Denver Libraries [J]. D-Lib Magazine,2016(7/8): 10.1045.

[20] Community Owned digital Preservation Tool Registry (COPTR) [EB/OL].[2023-03-10]. https://coptr.digipres.org/index.php/Main_Page.

[21] Islandora [EB/OL]. [2023-03-10]. https://www.Islandora.ca/.

[22] Samvera [EB/OL]. [2023-03-10]. https://wiki.lyrasis.org/display/samvera/Samvera.

[23] Archivematica [EB/OL]. [2023-03-10]. https://www.archivematica.org/.

[24] Caplan. The Florida Digital Archive and DAITSS: a working preservation repository based on format migration[J]. International Journal on Digital Libraries,2007,6(4): 305-11.

[25] CRL. ISO 1636/TDR[EB/OL]. [2023-03-10]. https://www.crl.edu/archiving-preservation/digital-archives/metrics-assessing-and-certifying/iso16363.

[26] 吳振新,等.長(zhǎng)期保存系統(tǒng)數(shù)據(jù)存儲(chǔ)管理策略研究與應(yīng)用[J].圖書(shū)館雜志,2017(9):75-81.

[27] 王波.高校圖書(shū)館古籍保護(hù)與利用工作的現(xiàn)狀、亮點(diǎn)、問(wèn)題與建議[J].大學(xué)圖書(shū)館學(xué)報(bào),2022(3):21-28.

孫 超 男,1991年生。碩士,館員。研究方向:數(shù)據(jù)管理、長(zhǎng)期保存。

(收稿日期:2023-06-28;責(zé)編:徐向東。)

*本文系2020年高校圖書(shū)館數(shù)字資源采購(gòu)聯(lián)盟(DRAA)項(xiàng)目“數(shù)字資源建設(shè)與長(zhǎng)期保存”(項(xiàng)目編號(hào):2020DRAA11)的研究成果之一。

猜你喜歡
數(shù)字化資源高校圖書(shū)館
《電子基本技能與實(shí)訓(xùn)》及數(shù)字化資源共享建設(shè)
要善于運(yùn)用交互式電子白板為高中物理教學(xué)服務(wù)
“智慧教室”平臺(tái)數(shù)字化教學(xué)資源課堂教學(xué)應(yīng)用策略研究
職業(yè)培訓(xùn)數(shù)字化資源共享模式研究
高校圖書(shū)館閱讀推廣案例分析
科技視界(2016年21期)2016-10-17 19:32:37
微信公眾平臺(tái)在高校圖書(shū)館信息服務(wù)中的應(yīng)用研究
科技視界(2016年21期)2016-10-17 19:25:20
高校圖書(shū)館閱讀推廣活動(dòng)研究
商(2016年27期)2016-10-17 06:38:27
試論高校圖書(shū)館在網(wǎng)絡(luò)環(huán)境沖擊下的人文建設(shè)
商(2016年27期)2016-10-17 06:30:59
高校圖書(shū)館閱讀推廣實(shí)踐探討
科技視界(2016年20期)2016-09-29 13:17:57
高校圖書(shū)館電子資源的宣傳與推廣
科技視界(2016年20期)2016-09-29 11:22:45
兴安盟| 泉州市| 巧家县| 河南省| 五大连池市| 民勤县| 武乡县| 山西省| 乌鲁木齐市| 贡山| 巴东县| 麦盖提县| 望江县| 庆阳市| 抚州市| 镇远县| 宣化县| 新干县| 柳州市| 吉隆县| 府谷县| 塔城市| 车险| 临朐县| 绥芬河市| 株洲县| 莲花县| 余姚市| 沭阳县| 阜新| 泸西县| 淄博市| 台东县| 措勤县| 长治县| 凤山县| 潜山县| 青川县| 高陵县| 太谷县| 平乡县|