国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

從數(shù)據(jù)監(jiān)護看美國高校圖書館的機構(gòu)庫建設(shè)新思路——來自DataStaR的啟示

2012-06-28 13:26:18楊鶴林
大學(xué)圖書館學(xué)報 2012年2期
關(guān)鍵詞:圖書館員監(jiān)護學(xué)者

□楊鶴林

隨著計算機技術(shù)的大量應(yīng)用,許多科研過程會產(chǎn)出海量科學(xué)數(shù)據(jù),科學(xué)數(shù)據(jù)是信息時代最基本、最活躍、影響面最寬的一種戰(zhàn)略性資源,對于科技創(chuàng)新具有顯著的支撐作用,從一定角度來說,未來的科研活動將是科學(xué)數(shù)據(jù)驅(qū)動的科研活動。近年來,數(shù)據(jù)監(jiān)護(Data Curation)服務(wù)在美國高校圖書館中日益興起,此處的“數(shù)據(jù)”專指科學(xué)數(shù)據(jù)而非計算機科學(xué)中所指以數(shù)字化形式編碼的數(shù)據(jù),美國國家科學(xué)基金會在專門扶持數(shù)據(jù)監(jiān)護服務(wù)的數(shù)據(jù)網(wǎng)(DataNet)計劃中,將數(shù)據(jù)定義為“所有能以數(shù)字化形式存儲并能以電子方式獲取的信息,包括數(shù)字、文本、出版物、感應(yīng)器讀數(shù)流、視頻、音頻、算法、軟件、模型、模擬、圖像等。”[1]數(shù)據(jù)監(jiān)護不是單純對這些數(shù)據(jù)進行存儲,而是在數(shù)據(jù)供學(xué)術(shù)、科學(xué)及教育所用的生命周期內(nèi)對其進行持續(xù)管理的活動,通過評價、篩選、重現(xiàn)及組織數(shù)據(jù)以供當(dāng)前科研活動獲取,并能用于未來再發(fā)現(xiàn)及再利用。

數(shù)據(jù)階段型存儲庫(Data Staging Repository,DataStaR)是康奈爾大學(xué)圖書館的一項主要針對本校學(xué)者的數(shù)據(jù)監(jiān)護服務(wù),其以機構(gòu)庫為基礎(chǔ),力圖扮演學(xué)術(shù)界共享數(shù)據(jù)集時的一個暫時的、過渡性質(zhì)的存儲節(jié)點,其設(shè)想是建設(shè)成為一個數(shù)據(jù)監(jiān)護平臺及一套完整服務(wù)方案,擁有可產(chǎn)生多種格式的高質(zhì)量元數(shù)據(jù)的工具,由圖書館員負責(zé)操作,通過協(xié)助學(xué)者完善數(shù)據(jù)和元數(shù)據(jù)來促進共享,最終積極幫助他們向各自領(lǐng)域的學(xué)科庫發(fā)布數(shù)據(jù)成果,供長期使用和保存[2]。DataStaR不但是具體數(shù)據(jù)監(jiān)護服務(wù)的典型案例,還體現(xiàn)出當(dāng)前美國高校圖書館對機構(gòu)庫建設(shè)的一些新思路,非常值得了解。

1 DataStaR面對的學(xué)科服務(wù)新形勢

1.1 高校圖書館運作的機構(gòu)庫遭遇發(fā)展瓶頸

作為校園信息基礎(chǔ)的有機組成元素,機構(gòu)庫(Institutional Repository)已發(fā)展多年,在最初的愿景中,圖書館界普遍希望機構(gòu)庫可以完成兩大任務(wù):一是實現(xiàn)研究成果的開放存取,克服現(xiàn)有學(xué)術(shù)交流模式的弊端,二是長期保存機構(gòu)的研究成果,借此體現(xiàn)機構(gòu)學(xué)術(shù)聲望、學(xué)術(shù)水平和社會價值。

到2011年7月,OpenDOAR上收錄的機構(gòu)庫突破2000個。然而在數(shù)量不斷增加的同時,不少研究者也發(fā)現(xiàn)最初美好的構(gòu)思并沒有獲得用戶充分認同,與頻頻受到學(xué)者青睞的學(xué)科庫、協(xié)會庫相反,薩洛(Salo)形容機構(gòu)庫是學(xué)者不在意,圖書情報專業(yè)不教學(xué),甚至圖書館員也不了解[3];機構(gòu)庫定位模糊、服務(wù)缺失、用戶參與度不高等問題對人們的信心造成了嚴重沖擊,甚至有人表示“沒有什么建設(shè)像機構(gòu)庫一樣,承諾如此多,效果如此差”[4]。面對嚴峻的現(xiàn)狀,如何發(fā)展機構(gòu)庫,如何使機構(gòu)庫在學(xué)術(shù)界獲得認可,將是對圖書館智慧的考驗。

1.2 高??蒲械臄?shù)據(jù)監(jiān)護需求日益凸顯

目前,類似人類基因組計劃的大型科學(xué)研究項目由于組織縝密,都有完善的數(shù)據(jù)保存利用政策,基因庫(GenBank)就是其成果之一。在國家層面上,對專業(yè)科研系統(tǒng)獲得的數(shù)據(jù)也有對應(yīng)機構(gòu)進行處理,中科院自1982年便開始了“中科院科學(xué)數(shù)據(jù)庫”項目,現(xiàn)已經(jīng)成為國內(nèi)信息量最大、服務(wù)層次最高的綜合性科學(xué)數(shù)據(jù)系統(tǒng);中國科技部也于2002年啟動了“國家科學(xué)數(shù)據(jù)共享工程”建設(shè),引發(fā)了科學(xué)數(shù)據(jù)共享研究的熱潮。

與之形成鮮明對比的是,大量高校學(xué)者所承擔(dān)的“小科學(xué)”(Small Science)卻因分布散、規(guī)模小而長期是數(shù)據(jù)管理的盲區(qū),這些項目通常只有數(shù)名學(xué)者參與,產(chǎn)生的數(shù)據(jù)存放在個人電腦里,既沒有統(tǒng)一標準,也沒有分享機制,更缺乏長期利用策略。海登(Heidorn)對2007年美國國家科學(xué)基金會批準項目的調(diào)查顯示,當(dāng)年共撥款28.7億美元資助12025個項目,其中獲撥款排名前20%的項目占據(jù)六成經(jīng)費,剩余四成經(jīng)費資助了多達9621個項目,最小一項只獲得591美元。這些小項目根本不可能有充裕的人力財力來處理產(chǎn)生的數(shù)據(jù),海登稱其為“暗數(shù)據(jù)”[5]。小科學(xué)是人們認識和了解特定局部事物的重要手段,長期忽視小科學(xué)的數(shù)據(jù)是非常不合理的,隨著計算機技術(shù)、互聯(lián)網(wǎng)技術(shù)、數(shù)字化存儲技術(shù)的發(fā)展,海量科學(xué)數(shù)據(jù)的數(shù)字化和網(wǎng)絡(luò)化成為可能。美國越來越多的基金機構(gòu)要求資助的項目發(fā)布數(shù)據(jù),如國立健康研究院就從2003年起規(guī)定年度預(yù)算達到50萬美元的項目在申請時必須制定數(shù)據(jù)發(fā)布方案。

1.3 高校圖書館紛紛推出數(shù)據(jù)監(jiān)護服務(wù)

金融危機以來,美國不少高校和基金會紛紛削減開支、減少資助。圖書館作為服務(wù)大戶,受到了很大沖擊。面對嚴峻的形勢,通過更新服務(wù)內(nèi)容、提升服務(wù)效果體現(xiàn)自身存在價值,避免被學(xué)術(shù)圈邊緣化成為許多高校圖書館的當(dāng)務(wù)之急。小科學(xué)日益高漲的數(shù)據(jù)監(jiān)護需求與服務(wù)缺失的矛盾使高校圖書館看到了機會:作為一個長期穩(wěn)定的信息機構(gòu),圖書館通過數(shù)據(jù)監(jiān)護服務(wù),可以為小科學(xué)提供一整套可靠的數(shù)據(jù)交流、發(fā)布和保存解決方案。2007年后,美國多家高校圖書館陸續(xù)開始了數(shù)據(jù)監(jiān)護服務(wù)的探索:除DataStaR外,新墨西哥大學(xué)圖書館主持的地球數(shù)據(jù)觀測網(wǎng)(Data Observation Network for Earth,DataONE)項目關(guān)注地球影像數(shù)據(jù),約翰·霍普金斯大學(xué)圖書館主持的數(shù)據(jù)保育(Data Conservancy)項目關(guān)注天文數(shù)據(jù),這兩個項目各獲得國家科學(xué)基金會高達2000萬美元的資助。還有調(diào)查數(shù)據(jù)監(jiān)護需求的伊利諾伊大學(xué)數(shù)據(jù)監(jiān)護基礎(chǔ)信息(Data Curation Profiles)項目;設(shè)計數(shù)據(jù)監(jiān)護課程的北卡羅來納大學(xué)數(shù)據(jù)化監(jiān)護課程(Digital Curation Curriculum,DigCCurr)項目;探索“數(shù)據(jù)館員”職業(yè)規(guī)劃的普渡大學(xué)圖書館的分布式數(shù)護監(jiān)護中心(Distributed Data Curation Center,D2C2)項目等。

2 DataStaR的可行性

2.1 圖書館理論支持和實踐經(jīng)驗積累

早在2003年就有調(diào)查指出,許多學(xué)科沒有數(shù)據(jù)存儲庫,研究人員無法很好地存儲、分享、發(fā)布數(shù)據(jù),而即使如天文學(xué)、物理學(xué)等少數(shù)已經(jīng)有較完善數(shù)據(jù)存儲庫的學(xué)科,學(xué)者仍不善使用,甚至完全不會用[6]。

在DataStaR前,康奈爾大學(xué)圖書館已經(jīng)有一些較成功的數(shù)據(jù)發(fā)布項目,如康奈爾地理空間信息庫(the Cornell University Geospatial Information Repository,CUGIR)和美國農(nóng)業(yè)部經(jīng)濟、統(tǒng)計與市場信息系統(tǒng)(the USDA Economics,Statistics and Marketing Information System,USDA-ESMIS),兩者都是由國家科學(xué)基金會全額資助的學(xué)科數(shù)據(jù)存儲庫。圖書館通過這些項目可評估自身協(xié)助學(xué)者進行數(shù)據(jù)歸檔和整理的可行性,尤其在USDA-ESMIS中,圖書館員需要處理的數(shù)據(jù)往往是少量多批的,這就使得每次任務(wù)都比較個性化,需要跟學(xué)者反復(fù)溝通。為了提高效率,圖書館員開始萌生出摸索一套更規(guī)范、更便捷也更具可持續(xù)性的標準化解決方案以協(xié)助跨項目組、跨專業(yè)交流。澳大利亞莫納什大學(xué)圖書館的全局式監(jiān)護(Curation Continuum)項目曾論證過數(shù)據(jù)的使用可以分為發(fā)布前共享環(huán)境及更正式的發(fā)布后長期保存環(huán)境,這兩個環(huán)境間的交互階段有一個素材傳遞的過程[7]。這個交互階段也被康奈爾大學(xué)圖書館所意識到,并將其作為DataStaR的切入點,利用機構(gòu)庫這個成熟的平臺探索圖書館員-學(xué)者互動規(guī)律,以及機構(gòu)庫如何在實現(xiàn)數(shù)據(jù)監(jiān)護中發(fā)揮作用。

2.2 學(xué)者普遍具有數(shù)據(jù)監(jiān)護需求

康奈爾的圖書館員通過調(diào)查發(fā)現(xiàn),合作過的學(xué)者對數(shù)據(jù)監(jiān)護確實有不少需求,這使得圖書館確信主動開展合作能給雙方都帶來切實收獲。從調(diào)查結(jié)果來看,學(xué)者對數(shù)據(jù)監(jiān)護的需求五花八門,最常見的幾點有:

·需要一個協(xié)作空間以便科研過程中分享數(shù)據(jù);

·需要協(xié)助確認共享時應(yīng)該分享原始的還是加工后的數(shù)據(jù)、是完整的還是重點的數(shù)據(jù);

· 需要在期刊不提供發(fā)布途徑時,依科研資助者要求完成數(shù)據(jù)發(fā)布;

· 需要了解下階段用戶如何使用數(shù)據(jù),避免誤讀、誤用。

還有些學(xué)者干脆想知道別人使用他們的數(shù)據(jù)后做出了什么新成果,有些人希望后繼使用者能在發(fā)表成果時注明原始數(shù)據(jù)源及其所屬資助項目名稱等等。當(dāng)然DataStaR也許無法滿足所有要求,但這些需求也確實反映出學(xué)者普遍覺得靠自身去處理數(shù)據(jù)有些力不從心,發(fā)展一個本地的、階段型的數(shù)據(jù)發(fā)布方案是很值得研究的事情[8]。

3 DataStaR的運作模型

DataStaR系統(tǒng)主要由4部分構(gòu)成:

· 基于Fedora的數(shù)據(jù)集存儲庫;

· 基于Vitro的語義元數(shù)據(jù)存儲庫;

· 用于對文件格式進行批量自動識別的開源工具:數(shù)字記錄目標識別程序(Digital Record Object Identification,DROID,由英國國家檔案局開發(fā));

·用于向外部永久存儲庫傳輸文件的內(nèi)容轉(zhuǎn)移協(xié)議——面向存儲的簡單網(wǎng)絡(luò)服務(wù)協(xié)議(Simple Web Service Offering Repository Deposit,SWORD,由英國JISC資助開發(fā))。

以一位生態(tài)學(xué)者研究某物種的分布為例,操作流程大致如下:用戶首先將野外觀測數(shù)據(jù)匯總,然后錄入一個電子表格成為數(shù)據(jù)集。她將電子表格上傳到DataStaR,此時系統(tǒng)會根據(jù)用戶注冊時填寫的信息以及檢測到的文件格式自動生成一些基本元數(shù)據(jù),用戶只需補充一項描述信息的元數(shù)據(jù)并設(shè)定他人訪問權(quán)限。

上傳時,用戶選定一個未來發(fā)布的目標庫,系統(tǒng)會根據(jù)目標庫的要求,生成合適的元數(shù)據(jù)表單供用戶填寫;若選擇“待定”,則要填寫一些額外的元數(shù)據(jù)供備用。隨著數(shù)據(jù)集不斷豐富,最終還可生成顯示物種分布情況的地理信息系統(tǒng)(GIS)數(shù)據(jù)集,DataStaR的圖書館員在這一過程中根據(jù)生態(tài)學(xué)及GIS數(shù)據(jù)存儲庫的不同標準,協(xié)助學(xué)者決定應(yīng)該共享哪些數(shù)據(jù),整理和格式化數(shù)據(jù),創(chuàng)建高質(zhì)量元數(shù)據(jù)等。

決定哪些數(shù)據(jù)應(yīng)該共享以及如何組織,在一定程度上根據(jù)預(yù)期用戶而定。就生態(tài)學(xué)來說,一般預(yù)期數(shù)據(jù)將會用于反復(fù)分析,或集合多位研究人員的數(shù)據(jù)進行對比,故加工后的數(shù)據(jù)集就比原始觀測數(shù)據(jù)更有用。至于元數(shù)據(jù),一些元數(shù)據(jù)很容易理解和完成,另一些則可能需要專業(yè)知識或?qū)唧w要求進行仔細研讀才能完成。目前圖書館員協(xié)助學(xué)者創(chuàng)建元數(shù)據(jù)中最重大的作用就是準確賦予受控詞和主題詞、知識產(chǎn)權(quán)申明的書面表述、撰寫地理坐標等特殊元素的規(guī)范表達等。DataStaR雖然不承擔(dān)數(shù)據(jù)集長期保存任務(wù),但它會對數(shù)據(jù)集的元數(shù)據(jù)進行備份,這些高質(zhì)量的元數(shù)據(jù)可供學(xué)者未來反復(fù)使用,也是其提高用戶忠誠度的重要手段之一。

科研結(jié)束時,用戶和圖書館員一同核對元數(shù)據(jù)和數(shù)據(jù),將整理好的數(shù)據(jù)集發(fā)布到一個生態(tài)學(xué)的學(xué)科庫,如CUGIR;將相應(yīng)的GIS數(shù)據(jù)集發(fā)布到紐約州立GIS數(shù)據(jù)交流中心,最后將兩個數(shù)據(jù)集的備份存儲到康奈爾大學(xué)圖書館自己的機構(gòu)庫eCommons里。數(shù)據(jù)從DataStaR流動到外部學(xué)科庫的機制可自動亦可手動,視目標庫的結(jié)構(gòu)和要求決定。當(dāng)向eCommons發(fā)布數(shù)據(jù)集時,系統(tǒng)可從早前提交的學(xué)科記錄中提取必要元數(shù)據(jù)并自動生成到機構(gòu)庫中,然后將數(shù)據(jù)集和作為支撐材料的學(xué)科記錄一起存入;向生態(tài)學(xué)科專門數(shù)據(jù)存儲庫發(fā)布的工作也是自動完成,但向紐約州立GIS數(shù)據(jù)交流中心提交時則由于政策規(guī)定,必須由圖書館員人工操作[9]。DataStaR的構(gòu)成和運作流程見圖1。

圖1 DataStaR模型

4 DataStaR的特色

DataStaR最主要的服務(wù)對象是康奈爾大學(xué)的學(xué)者,這一點跟傳統(tǒng)的機構(gòu)庫類似。但是,其主要任務(wù)是促進數(shù)據(jù)向長期存儲庫(如學(xué)科庫)流動,對自身的定位是一個短期的、暫時性的數(shù)據(jù)集存儲點和可靠的服務(wù)伙伴。這種階段型定位使DataStaR兼有一般機構(gòu)庫和學(xué)科庫的特征,具體見表1。

DataStaR與機構(gòu)庫一樣,重點服務(wù)于本地機構(gòu);沒有提供過多的數(shù)據(jù)分析、使用方面的工具,比如可視化統(tǒng)計軟件、數(shù)據(jù)抓取軟件等;沒有為終端用戶提供存儲內(nèi)容方面的服務(wù);沒有針對學(xué)者的強制性存儲要求。在其他方面,DataStaR又具備一些學(xué)科庫的功能:機構(gòu)庫的初衷是管理文檔而非數(shù)據(jù),一些學(xué)科庫則一開始就把目標對準了數(shù)據(jù)。學(xué)科庫通常都有各自特定的元數(shù)據(jù)標準,而DataStaR由于面向多學(xué)科的用戶,所以可以支持好幾種元數(shù)據(jù)標準。學(xué)科庫都要求發(fā)布的數(shù)據(jù)格式化,DataStaR就會主動幫助數(shù)據(jù)提供者根據(jù)那些要求來完善并提交數(shù)據(jù)。

表1 DataStaR與機構(gòu)庫、學(xué)科庫特征對比

5 DataStaR體現(xiàn)的機構(gòu)庫建設(shè)新思路

5.1 調(diào)整開放獲取戰(zhàn)略,承認當(dāng)前學(xué)術(shù)交流圈

在機構(gòu)庫興起時,許多人將機構(gòu)庫和開放獲取等同起來,視其為變革學(xué)術(shù)傳播方式的利器,哈內(nèi)德(Harnad)早在1994年就發(fā)出過顛覆性的論點,呼吁所有學(xué)者都應(yīng)該把他們的論文在開放存取庫中發(fā)布,通過共同努力打破出版商利用經(jīng)濟手段設(shè)置的信息壁壘[10]。但隨后的機構(gòu)庫實踐卻顯示了用戶和圖書館員在這一認識上存在差異,戴維斯(Davis)描述到:“在康奈爾大學(xué),一些被圖書館員看得心急火燎的學(xué)術(shù)交流問題,例如文獻開放獲取,許多學(xué)者卻覺得無關(guān)痛癢,每個學(xué)科都有自己的學(xué)術(shù)小圈子,很大程度上取決于科研激勵機制以及傳統(tǒng)。”[11]如果機構(gòu)庫希望解決的問題在學(xué)者看來不感興趣,那關(guān)注度如此低也就不足為奇了。學(xué)者在長期形成的學(xué)術(shù)圈中有各自的交流渠道,如參加協(xié)會、出席會議、出版商贈閱等,至少現(xiàn)階段對全面開放獲取的需求尚不很迫切。喬赫利(Choudhury)指出,學(xué)者愿意向美國國家生物技術(shù)信息中心(NCBI)的PubMed Central數(shù)據(jù)庫提交文獻,卻忽視自己學(xué)校機構(gòu)庫的原因,不僅因為NCBI是重要的科研資助機構(gòu),更重要的是向PubMed Central提交就意味著進入了當(dāng)前運作中的學(xué)術(shù)出版流程,在學(xué)術(shù)圈內(nèi)獲得了認可[12]。

其實,機構(gòu)庫和開放獲取互為部分,開放獲取只是機構(gòu)庫服務(wù)的一部分,其最終實現(xiàn)有賴于整個學(xué)術(shù)體制的變革,這將是一個較為長期的過程,寄望短期內(nèi)以機構(gòu)庫去挑戰(zhàn)已確立數(shù)個世紀的學(xué)術(shù)發(fā)布和交流圈,無異于堂吉訶德對陣風(fēng)車,這樣過于急切的愿景反而使機構(gòu)庫不堪重荷。DataStaR就體現(xiàn)出圖書館這種思路轉(zhuǎn)變:不再將強硬的開放獲取作為核心戰(zhàn)略,用戶對上傳的初始數(shù)據(jù)集可以自行調(diào)整甚至刪除,可能永遠也不會用于正式發(fā)布;用戶也可以根據(jù)個人需要和意愿自行設(shè)定共享范圍,可以是課題組成員、本校用戶,也可以對公眾公開;最重要的是,在數(shù)據(jù)發(fā)布時,DataStaR也不承擔(dān)開放獲取任務(wù),而交由為學(xué)術(shù)圈普遍認可的學(xué)科庫完成。

5.2 制定富有彈性的存儲政策,與學(xué)科庫共贏

自機構(gòu)庫建設(shè)開展以來,學(xué)者參與度偏低的問題始終困擾著建設(shè)者,麥克道爾(McDowell)表示:“在大多數(shù)機構(gòu)庫都是每天僅一件的增長率下,估計可預(yù)見的未來里美國機構(gòu)庫都無法顯著促進開放獲取,也難以改變學(xué)術(shù)傳播模式?!保?3]。為了促使學(xué)者使用機構(gòu)庫,相當(dāng)一部分人認為要狠抓強制提交制度,例如哈內(nèi)德(Harnad)就不客氣地指出只要康奈爾大學(xué)圖書館規(guī)定強制提交就能解決所有問題[14]。筆者認為,此類觀點實際上是在回避關(guān)鍵問題:為何自愿提交率如此之低?當(dāng)要學(xué)者們自己選擇時,很多人并不情愿花時間向機構(gòu)庫提交資源。

約翰遜(Johnson)指出:學(xué)者的個人發(fā)展與當(dāng)前出版體系緊密關(guān)聯(lián),在他們認可的交流圈中發(fā)布成果遠比機構(gòu)庫效果好[15]。馬克(Mark)的調(diào)查也支持這種論斷,他對康奈爾大學(xué)早期的機構(gòu)庫DSpace進行過使用調(diào)查,發(fā)現(xiàn)幾乎未被本校學(xué)者了解,收集的論文數(shù)量非常少,有些院系板塊甚至沒有任何實質(zhì)內(nèi)容。多數(shù)學(xué)者還是習(xí)慣于使用自認為比機構(gòu)庫更具學(xué)術(shù)價值和更高認知度的學(xué)科庫[16]。一味強硬不可能使機構(gòu)庫成功發(fā)展下去,重要的是認真研究用戶需求,靈活調(diào)整存儲策略,使機構(gòu)庫成為整個學(xué)術(shù)環(huán)境中的一份子,而不是一個被邊緣化的孤立實體。機構(gòu)庫應(yīng)當(dāng)尊重學(xué)者的使用習(xí)慣,改變視學(xué)科庫為“對手”的傳統(tǒng)觀念,化競爭為合作,建立一種更實際的伙伴關(guān)系。DataStaR就顯現(xiàn)出一種富有彈性的存儲政策:它沒有強制學(xué)者提交數(shù)據(jù),也沒有規(guī)定數(shù)據(jù)集只能發(fā)布到康奈爾大學(xué)圖書館的eCommons中,而是在完成數(shù)據(jù)監(jiān)護后,懇請學(xué)者同時在學(xué)科庫和機構(gòu)庫中都發(fā)布成果。通過數(shù)據(jù)監(jiān)護,用戶享受到了圖書館實實在在的服務(wù),也順利地在學(xué)術(shù)圈中發(fā)布了成果,毫無例外地都樂于在eCommons里對數(shù)據(jù)集進行二次發(fā)布和備份。這一柔性政策既避免了強制提交的不愉快,又豐富了機構(gòu)庫藏品,充分體現(xiàn)出對學(xué)術(shù)圈和學(xué)者個人的尊重,博得了用戶好感和忠誠度。

5.3 開展數(shù)據(jù)監(jiān)護,推出“回到科研流程中”的服務(wù)

近年來機構(gòu)庫熱潮席卷美國高校圖書館,但其中不乏視其為一種館藏或純粹爭取經(jīng)費之舉,許多機構(gòu)庫只是一味收集校內(nèi)學(xué)術(shù)成果,至多是個“網(wǎng)上文庫”而已??的螤柎髮W(xué)圖書館也稱自己的舊機構(gòu)庫DSpace“像個鄉(xiāng)村圖書館的地下室,堆積著落滿灰塵的舊文件。”[17]喬赫利(Choudhury)認為學(xué)者對機構(gòu)庫不感興趣的一個重要原因是機構(gòu)庫提供的存儲功能只涉及科研過程終端產(chǎn)品,用戶實際上已經(jīng)完成了自己的工作。為此他倡議機構(gòu)庫要推出能切入到科研起點,進而惠及整個科研流程的新服務(wù)[18]。

DataStaR正是機構(gòu)庫“回到科研流程中”的一次嘗試,它關(guān)注的不是改變學(xué)術(shù)出版體系,而是機構(gòu)庫如何能成為支持數(shù)據(jù)密集型學(xué)術(shù)的新形式。圖書館已經(jīng)意識到數(shù)據(jù)對科研的重要驅(qū)動力和再利用價值,開展數(shù)據(jù)監(jiān)護正是面向科研流程的新服務(wù)。美國國家科學(xué)基金會在考察提交申請的數(shù)據(jù)監(jiān)護項目時,指明收藏數(shù)據(jù)只是服務(wù)切入點,對數(shù)據(jù)進行監(jiān)護,使之可供再利用或跨學(xué)科新利用才是最根本目的。這要求圖書館必須從“以藏為主”轉(zhuǎn)變?yōu)橐粋€活躍的科研代理人,為科研數(shù)據(jù)交流、知識共享提供機會和橋梁。學(xué)者改變學(xué)術(shù)交流習(xí)慣的動力并非機構(gòu)強迫,而來自于數(shù)據(jù)監(jiān)護的新需求,這對他們來說是個緊迫的問題。機構(gòu)庫可以成為容納數(shù)據(jù)的倉儲,更進一步說,機構(gòu)庫可成為整個數(shù)據(jù)監(jiān)護戰(zhàn)略的一個重要部分。

5.4 構(gòu)建網(wǎng)上社區(qū),提高學(xué)者參與度

隨著科研項目規(guī)模擴大和內(nèi)容深入,許多問題需要多方參與者共同處理?;ヂ?lián)網(wǎng)正是當(dāng)今協(xié)同工作的優(yōu)良載體,學(xué)者利用網(wǎng)絡(luò)交流知識、傳輸文件,逐漸形成所謂的“虛擬社區(qū)”。社區(qū)可以為分享信息和解決問題提供便利,凸顯出協(xié)作網(wǎng)絡(luò)在將原有那種松散的耦合系統(tǒng)發(fā)展為有序的跨界網(wǎng)絡(luò)中不可或缺的地位。圖書館在總結(jié)過往機構(gòu)庫建設(shè)的經(jīng)驗教訓(xùn)時,體會到人氣的重要性,而為學(xué)者創(chuàng)造穩(wěn)定的網(wǎng)上社區(qū)無疑是凝聚人氣、提高機構(gòu)庫認同感的好方法。

就數(shù)據(jù)監(jiān)護服務(wù)來看,前述DataNet這類受國家資助的數(shù)據(jù)監(jiān)護計劃都有大型社區(qū),其他區(qū)域性、中小型社區(qū)也如雨后春筍般在許多圖書館項目中出現(xiàn)。在康奈爾大學(xué),為了進一步推廣DataStaR和數(shù)據(jù)監(jiān)護,圖書館于2008年7月創(chuàng)建了一個研究數(shù)據(jù)管理服務(wù)組(The DISCOVER Research Service Group,DRSG),成員包括學(xué)者、計算機專家、圖書館員和來自Fedora Commons社區(qū)的機構(gòu)庫建設(shè)者,DRSG通過開發(fā)用于數(shù)據(jù)監(jiān)護的軟件,為學(xué)者們提供方便的數(shù)據(jù)監(jiān)護、保存方案,推動項目組之間的協(xié)作、促進數(shù)據(jù)的跨學(xué)科利用,最終在康奈爾校園內(nèi)建設(shè)一個繁榮的數(shù)據(jù)監(jiān)護虛擬平臺。目前DRSG已經(jīng)和天文學(xué)、物理學(xué)、信息科學(xué)、農(nóng)學(xué)和鳥類學(xué)等多個學(xué)科院系建立了聯(lián)系并在不斷擴大中[19]。

從全美高校的高度看,甚至有一些更可喜的進展,一些機構(gòu)庫的用戶在認識到數(shù)據(jù)監(jiān)護的重要性后,組成了“自下而上”的自發(fā)性社區(qū),如約翰霍普金斯大學(xué)DuraSpace項目中產(chǎn)生的數(shù)據(jù)監(jiān)護處理社區(qū)(Data Curation Solution Community)便是一個,其組織格言為“復(fù)雜系統(tǒng)在適當(dāng)條件下自會產(chǎn)生規(guī)律”。并進一步指出:“數(shù)據(jù)監(jiān)護應(yīng)支持自然科學(xué)及人文科學(xué)中產(chǎn)生的新形式研究與學(xué)習(xí)。在推廣數(shù)據(jù)監(jiān)護時,要廣泛調(diào)研專業(yè)學(xué)者及普通用戶的需求?!保?0]另一個屬于北卡羅來納大學(xué)的DigCCurr項目的數(shù)字化監(jiān)護交流社區(qū)(Digital Curation Exchange)也有類似的組織目標:“為參與者、研究者、教育者、學(xué)生構(gòu)建數(shù)據(jù)監(jiān)護活動中心?!保?1]圖書館通過積極參與和引導(dǎo)這些自發(fā)社區(qū),在推廣機構(gòu)庫和數(shù)據(jù)監(jiān)護方面取得了良好的進展。

6 結(jié)語

目前,DataStaR已經(jīng)和康奈爾大學(xué)內(nèi)多個項目組、科考站和實驗室建立了良好的長期合作關(guān)系,還為不少學(xué)者創(chuàng)建了個人數(shù)據(jù)空間,截止2011年9月,已有多個項目的39個數(shù)據(jù)集經(jīng)DataStaR完成高質(zhì)量元數(shù)據(jù)并成功發(fā)布。DataStaR不僅成為美國國家科學(xué)基金會資助的數(shù)據(jù)保育項目的一個重要建設(shè)者,還獲得不少基金機構(gòu)的認可,獲邀在申報會上專門做數(shù)據(jù)監(jiān)護宣傳。還有一些高校開始采用其系統(tǒng)開發(fā)自己的數(shù)據(jù)監(jiān)護服務(wù),例如由墨爾本大學(xué)主持的大型項目澳大利亞國家數(shù)據(jù)服務(wù)(Australian National Data Service,ANDS)[22]。盡管運行時間不算太長,且在實際工作中仍有一些問題,但DataStaR在探索數(shù)據(jù)監(jiān)護服務(wù)上另辟蹊徑,為機構(gòu)庫如何繼續(xù)發(fā)展提供了很大啟示,作為一個成功的項目,越來越頻繁地出現(xiàn)在美國高校圖書館界的學(xué)術(shù)報告中。前車之鑒,后車之師,美國圖書館在機構(gòu)庫發(fā)展中遇到的問題可以為尚不發(fā)達的中國高校機構(gòu)庫提供參考,而他們在處理機構(gòu)庫的開放獲取、存儲政策、服務(wù)內(nèi)容等問題時所采取的靈活務(wù)實的態(tài)度,以及新穎的數(shù)據(jù)監(jiān)護服務(wù),也非常值得中國高校圖書館借鑒和思考。

1 National Science Board.Long-lived digital data collections.[2010- 07 - 14]. http://www.nsf.gov/pubs/2005/nsb0540/nsb0540.pdf

2 DataStaR.[2011-02-10].http://DataStaR.mannlib.cornell.edu/

3 Salo D.Innkeeper at the Roach Motel.Library Trends,2008(2):98-123

4 Jacobs N.Report of a workshop on research and development priorities to support research data curation.[2011-04-20].http://infteam. jiscinvolve. org/files/2008/05/datacurationwshop20071214.pdf

5 Heidorn P.Shedding Light on the Dark Data in the Long Tail of Science.Library Trends,2008(2):280-299

6 Lord P.Data curation for e-Science in the UK.[2010-07-29].http://www.jisc.ac.uk/uploaded_documents/e-Science Report-Final.pdf

7 Treloar A.The Data Curation Continuum.D-Lib Magazine,2007(9/10).[2010-11-05].http://www.dlib.org/dlib/september07/treloar/09treloar.html

8 Steinhart G.DataStaR:An Institutional Approach to Research Data Curation.IASSIST Quarterly,2009(3-4):34-39

9 Steinhart G.DataStaR:A Data Sharing and Publication Infrastructure to Support Research.Agricultural Information Worldwide,2011(1):16-20

10 Harnad,S.Scholarly Journals at the Crossroads.Chapter 1.Washington D.C.[2011-07-26].http://www.arl.org/scomm/subversive/sub01.html

11 Davis P. Evaluating the Reasons for Non-use of Cornell University's Installation of DSpace.D-Lib Magazine,2007(3/4).[2011-03-12].http://www.dlib.org/dlib/march07/davis/03davis.html

12 Choudhury G.Case study in data curation at Johns Hopkins University.Library Trends,2008(2):211-220

13 McDowell C.Evaluating institutional repository deployment in American academy since early 2005.D-Lib Magazine 2007(9/10).[2011-03-15].http://www.dlib.org/dlib/september07/mcdowell/09mcdowell.html

14 Johnson,R.Institutional repositories:Partnering with faculty to enhance scholarly communication.D-Lib Magazine 2002(11).[2010-12-15].http://www.dlib.org/dlib/november02/johnson/11johnson.html

15 Mark T.Institutional Repositories:a Review of Content Recruitment Strategies.[2010-10-09].http://www.ifla.org/IV/ifla72/papers/155-Mark_Shearer-en.pdf

16 Harnad S.Why Cornell's Institutional Repository Is Near-Empty.[2011-08-15].http://eprints.ecs.soton.ac.uk/13967/

17 eCommons,née DSpace.[2011-09-03].http://www.news.cornell.edu/stories/Aug07/ecommons.ws.html

18 同12:214

19 DRSG.[2011-06-13].http://drsg.cac.cornell.edu/

20 Data Curation Solution Community.[2011-06-16].http://fedora-commons.org/confluence/display/FCCWG/Data+ Curation

21 Digital Curation Exchange.[2011-06-16].http://digitalcurationexchange.org/

22 ANDS.[2010-07-29].http://ands.org.au/

猜你喜歡
圖書館員監(jiān)護學(xué)者
學(xué)者介紹
學(xué)者簡介
學(xué)者介紹
護娃成長盡責(zé)監(jiān)護 有法相伴安全為重
高校圖書館員之歌
黃河之聲(2021年8期)2021-07-23 03:34:28
我國成年監(jiān)護制度之探討與展望
學(xué)者介紹
帶養(yǎng)之實能否換來監(jiān)護之名?
用博弈理論解決圖書館員排班問題
未成年人監(jiān)護制度的完善
浠水县| 米林县| 临城县| 且末县| 英德市| 高碑店市| 吴旗县| 无极县| 永新县| 琼中| 牙克石市| 丹凤县| 五大连池市| 林周县| 昌黎县| 沧州市| 靖宇县| 历史| 永胜县| 九龙坡区| 广宁县| 嵊州市| 昆山市| 星座| 沙坪坝区| 休宁县| 阿巴嘎旗| 巴楚县| 老河口市| 锡林郭勒盟| 阿合奇县| 南丹县| 晋州市| 西华县| 积石山| 万源市| 乌恰县| 堆龙德庆县| 武邑县| 视频| 清水县|