都平平 蔡莉嫻 黃 敏 穆亞鳳 李蘇豐
〔摘 要〕本文介紹了開放源碼軟件Dspace及在圖書館的應(yīng)用,并介紹了DSpace的功能特征及在圖書館操作中的流程,并談了開源軟件DSpace使用的利與弊。
〔關(guān)鍵詞〕開源軟件;Dspace;機(jī)構(gòu)倉儲
〔中圖分類號〕G250.7 〔文獻(xiàn)標(biāo)識碼〕B 〔文章編號〕1008-0821(2009)03-0150-02
“開放源碼”(open source)用于描述那些源碼可以被公眾使用的軟件,并且此軟件的使用、修改和發(fā)行也不受許可證的限制。由于Internet發(fā)展的推動(dòng),開放源碼軟件正在許多日常工作的幕后扮演著日益重要的角色,比如Web瀏覽和E-mail。軟件開發(fā)者開始攜手支持linux這種開放源碼操作系統(tǒng),使用者也開始認(rèn)識開放源碼軟件,這些意味著你將會(huì)看到越來越多的開放源碼軟件。
開源軟件同時(shí)涉及源碼本身和開發(fā)過程,涵蓋了3個(gè)方面的意義:免費(fèi)分發(fā)的源代碼、模塊化的體系和集市式的開發(fā)——在這種開發(fā)方式中,任何地方的任何人都可以參與最終產(chǎn)品的制造;另一方面,任何人都可以復(fù)用和發(fā)行開源軟件的代碼這一事實(shí)又支持了公眾利益,因?yàn)閯?chuàng)新的觀念被所有用戶所共享。
目前在圖書館數(shù)字化的流程中許多圖書館采用了不同的開源軟件,使用最多的是數(shù)據(jù)庫底層 軟件和一些數(shù)圖的應(yīng)用軟件。如:我的圖書館軟件、門戶軟件、DSpace開放獲取數(shù)據(jù)庫的設(shè) 置等。本文重點(diǎn)介紹DSpace軟件在圖書館機(jī)構(gòu)倉儲中的應(yīng)用。DSpace已被學(xué)術(shù)機(jī)構(gòu)廣泛使用 ,以達(dá)到學(xué)術(shù)資源的有效管理與再利用的工具軟件,DSpace不僅實(shí)用與單一的圖書館數(shù)據(jù)庫 的建設(shè),也適用于跨組織的機(jī)構(gòu)存儲。
機(jī)構(gòu)倉儲(Institutional Repository(簡稱IR)又稱機(jī)構(gòu)庫是收集、存放由某個(gè)或多個(gè)學(xué)術(shù)機(jī)構(gòu)(例如大學(xué)、研究所、圖書館、博物館等)專家、教授、學(xué)生創(chuàng)造的、可供機(jī)構(gòu)內(nèi)外用戶共享的學(xué)術(shù)文獻(xiàn)的數(shù)據(jù)庫[1]。機(jī)構(gòu)倉儲可以由一個(gè)機(jī)構(gòu)或聯(lián)合許多機(jī)構(gòu)組成聯(lián)盟一起創(chuàng)建。它隨著計(jì)算機(jī)的普及、學(xué)術(shù)出版的電子化以及網(wǎng)絡(luò)技術(shù)的快速發(fā)展、為實(shí)現(xiàn)科學(xué)信息資料開放獲取而產(chǎn)生。國外用于機(jī)構(gòu)存儲的創(chuàng)建工具已比較成熟,代表性的工具有DSpace和Greenstone。DSpace是美國麻省理工學(xué)院圖書館與惠普科技公司共同合作,遵循Mozilla協(xié)議基于BSD開放原代碼(open source)許可的DSpace源碼方式開發(fā)的。其他使用者,可以直接利用或改寫軟件的方式,便可利用DSpace來創(chuàng)建自己的機(jī)構(gòu)存儲知識庫。
1 DSpace系統(tǒng)功能特點(diǎn)
1.1 存儲內(nèi)容格式類型不限
DSpace系統(tǒng)主要用于長期保存機(jī)構(gòu)的各種數(shù)字化資源,包括期刊論文、圖書、圖書章節(jié)、數(shù)據(jù)集、學(xué)習(xí)資源、圖像、3D圖像、地圖、樂譜、設(shè)計(jì)圖、預(yù)印本、錄音記錄、音樂錄音、軟件、技術(shù)報(bào)告、論著、視頻、工作文檔等等。DSpace系統(tǒng)可以存儲幾乎所有格式的數(shù)字化的文字、圖像、音頻和視頻資源。
1.2 DSpace的支撐軟件
DSpace的安裝和正常運(yùn)行需要如下的軟件來配套:①操作系統(tǒng)安裝:RedHat Enterprise 4.0,作為裸機(jī)的支撐系統(tǒng);②DSpace:安裝之前先下載DSpace安裝源代碼和上述PostgreSQL數(shù)據(jù)庫版本相對應(yīng)版本的PostgreSQL JDBC驅(qū)動(dòng)程序;③DNS服務(wù)器安裝與配置;④Jakarta Tomcat安裝與配置:安裝之前先下載2個(gè)安裝包,分別是jakarta tomcat和jdk;⑤E-mail 服務(wù)器安裝與配置:若需要E-mail進(jìn)行注冊驗(yàn)證時(shí),服務(wù)器在操作系統(tǒng)安裝時(shí)就安裝好E-mail服務(wù)器了,可以下載最新的Sendmail或Postfix源代碼安裝包(現(xiàn)在最新版本分別是8.13 .5和2.2.5);⑥數(shù)據(jù)庫安裝與配置:使用PostgreSQL數(shù)據(jù)庫配置或者Oracle數(shù)據(jù)庫配置 作為底層數(shù)據(jù)庫。
1.3 數(shù)據(jù)組織模型
DSpace系統(tǒng)中有5種數(shù)據(jù)模型,分別是社區(qū)(community)、合集(collection)、條目(item)、數(shù)字包(bundle)和比特流(bitstream)。
1.4 規(guī)范的元數(shù)據(jù)標(biāo)引
DSpace系統(tǒng)采用DC元數(shù)據(jù)來標(biāo)引上述各種數(shù)據(jù)模型。在創(chuàng)建上述數(shù)字對象或者提交學(xué)術(shù)資源時(shí),系統(tǒng)將要求提交人員同時(shí)提供該學(xué)術(shù)資源的元數(shù)據(jù)信息,或者由專門負(fù)責(zé)標(biāo)引審核的人員對提交的學(xué)術(shù)資源的元數(shù)據(jù)進(jìn)行編輯或修改。運(yùn)用DC元數(shù)據(jù)對這些學(xué)術(shù)資源進(jìn)行充分的標(biāo)引,對這些資源的保存、揭示、檢索和利用提供了良好的基礎(chǔ)。
1.5 支持OAI協(xié)議和OpenURL協(xié)議
通過OAI接口,有關(guān)機(jī)構(gòu)(如Google Scholar和OAIster)可以定期或不定期對DSpace系統(tǒng)的元數(shù)據(jù)進(jìn)行收割(DSpace系統(tǒng)中DC元數(shù)據(jù)默認(rèn)是公開的,并允許其他系統(tǒng)對其收割)。通過對元數(shù)據(jù)的收割利用,無疑加快和提高了相關(guān)資源的傳播與利用,促進(jìn)了學(xué)術(shù)成果的交流和 科研的發(fā)展。
另外,由于DSpace系統(tǒng)支持OpenURL協(xié)議,對于擁有SFX服務(wù)器的機(jī)構(gòu),通過設(shè)置DSpace系統(tǒng),系統(tǒng)將在每個(gè)條目頁面上顯示一個(gè)OpenURL鏈接,同時(shí)能夠響應(yīng)外來的OpenURL請求,這些都有利于相關(guān)信息的被檢索與利用。
1.6 良好人機(jī)界面與管理功能
在Web界面下,可以方便地按不同的方式瀏覽DSpace資料庫中的條目。管理員可以在DSpace系統(tǒng)管理界面中創(chuàng)建或刪除相關(guān)的數(shù)字對象,對數(shù)字對象的權(quán)限進(jìn)行控制管理,對用戶與群組進(jìn)行控制管理,對數(shù)字對象的相關(guān)元數(shù)據(jù)進(jìn)行編輯,以及DSpace系統(tǒng)一些相關(guān)設(shè)置等。
1.7 統(tǒng)計(jì)分析
DSpace系統(tǒng)有一個(gè)強(qiáng)大的日志記錄功能,對系統(tǒng)的安裝、運(yùn)行和使用情況都有詳細(xì)的日志記錄。使用DSpace系統(tǒng)自帶的日志分析工具自動(dòng)對系統(tǒng)使用情況部分進(jìn)行統(tǒng)計(jì)分析,可以得到對管理員或用戶有幫助意義的統(tǒng)計(jì)報(bào)表。
2 DSpace在機(jī)構(gòu)存儲系統(tǒng)的應(yīng)用
DSpace是用于自行存儲開放獲取資源的軟件,目前DSpace1.3a已經(jīng)發(fā)布,可訪問http:∥sourceforge.net/projects/dspace/目前版本有日志分析、可翻譯用戶界面等。全球的科研機(jī)構(gòu)都可以免費(fèi)獲取該軟件,可以用它來構(gòu)建機(jī)構(gòu)存儲、學(xué)習(xí)對象庫、電子論文庫、電子記錄管理、數(shù)字保存、數(shù)字出版及其他更多領(lǐng)域。
DSpace實(shí)現(xiàn)主要步驟:
3 DSpace系統(tǒng)目前存在的不足與展望
安裝DSpace系統(tǒng)并使之正常運(yùn)行,需要比較熟練操作Linux操作系統(tǒng)、各種服務(wù)器的安裝與配置、軟件編程,以及相關(guān)數(shù)據(jù)庫應(yīng)用與管理等。
用戶注冊信息少。新用戶注冊后,若事先不知道用戶,或沒有其他方式通知管理員,則管理員無法判斷新用戶身份,也就不能給新用戶授予相應(yīng)的權(quán)限。
DSpace系統(tǒng)雖然具有條目導(dǎo)入導(dǎo)出功能,但是只能在操作系統(tǒng)的文本模式下操作,而不能在Web界面下操作,操作比較復(fù)雜。
不能對某些類型的數(shù)字資源提供存儲,例如動(dòng)態(tài)類型的網(wǎng)頁。
DSpace底層是3層架構(gòu),但只適應(yīng)中等或少量的數(shù)據(jù)存儲,對于大數(shù)據(jù)量的運(yùn)算會(huì)產(chǎn)生數(shù)據(jù)的冗余。
系統(tǒng)設(shè)置字段很難增加和更改,如增加字段庫結(jié)構(gòu)和發(fā)布達(dá)不到一致。
DSpace系統(tǒng)是開源軟件,與商業(yè)軟件相對比,MIT和HP沒有義務(wù)對該系統(tǒng)的一些問題承擔(dān)責(zé)任,但是承諾繼續(xù)提供一些技術(shù)方面的支持,另外,基于DSpace系統(tǒng)的開源社區(qū)也日趨活躍,他們不斷對DSpace的一些功能進(jìn)行改進(jìn),修復(fù)已知bug等等。
DSpace的優(yōu)勢:系統(tǒng)結(jié)構(gòu)合理、具有較為完善的功能、遵從相關(guān)標(biāo)準(zhǔn)、支持任意類型的的內(nèi)容存儲、在國外學(xué)術(shù)機(jī)構(gòu)中的得到最為廣泛的應(yīng)用。目前,新版本正在出臺。
由于DSpace系統(tǒng)支持OAI-PMH協(xié)議,一些大型的目錄服務(wù)機(jī)構(gòu)(如Google Scholar和OAIster)可以定期或不定期對收割DSpace系統(tǒng)的元數(shù)據(jù),為DSpace系統(tǒng)中的數(shù)字資源的傳播與利用提供了便利。
4 選擇開源軟件的問題與利弊
選擇軟件時(shí),是選擇商業(yè)軟件還是開源軟件進(jìn)行圖書館數(shù)字化建設(shè),應(yīng)考慮多方面的因素:
圖書館的資金投入;
使用單位的技術(shù)力量,是否有能力開發(fā)開源軟件;
開源軟件的開放性,權(quán)威性,可用性,標(biāo)準(zhǔn)性和規(guī)范性;
開源軟件被用到的用戶是那些(大用戶),使用的背景;
開源軟件要使用的對象;
是否有一個(gè)技術(shù)支撐體系支持,是松散的組織,還是有后續(xù)的服務(wù)和支撐。
參考文獻(xiàn)
[1]黃凱文,劉芳.網(wǎng)絡(luò)科學(xué)信息資源“公開獲取運(yùn)動(dòng)”的模式與方法[J].大學(xué)圖書館學(xué)報(bào),2005,(2):38-41.
[2]http:∥archives.eprints.org/eprints.php?action=browse[EB].2005-07-15.
[3]http:∥dspace.xmu.edu.cn/dspace/register[EB].
[4]李愛國,陸美.學(xué)術(shù)圖書館機(jī)構(gòu)知識庫的創(chuàng)建[J].圖書情報(bào)工作,2006,(6):119-121.
[5]葉鷹,黃晨.基于DSpace的Lib2.0[J].大學(xué)圖書館學(xué)報(bào),2006,(3):2-5.
[6]圖1:Paul Gandel.Technology——Converging Changes.The 4th Annual Library Leadership Institute:The 21st Century Digital/Print Hybrid Research Library:Challenges for Leadership.
[7]范并思,胡小青.圖書館2.0:構(gòu)建新的圖書館服務(wù)[J].大學(xué)圖書館學(xué)報(bào),2006,(1):2-7.
[8]Web2.0技術(shù)探源.
[9]任樹懷.Web2.0與信息服務(wù),2006-05-25.上海:構(gòu)建以dSpace為核心的校內(nèi)學(xué)術(shù)信息存儲倉庫.
[10]孫衛(wèi).2006年數(shù)字圖書館前沿問題高級研討班講話.國家圖書館二期工程暨國家數(shù)字圖書館工程介紹.
[11]陳和.2006年數(shù)字圖書館前沿問題高級研討班講話.廈門大學(xué)機(jī)構(gòu)存儲系統(tǒng).