, , , ,孟子,曉燕,
大數(shù)據(jù)時(shí)代,數(shù)據(jù)密集型科學(xué)研究模式的產(chǎn)生和科研數(shù)據(jù)管理任務(wù)的建立不斷催生科研人員對科研數(shù)據(jù)管理支持服務(wù)的需求[1]。國外圖書館為了應(yīng)對大數(shù)據(jù)帶來的機(jī)遇和挑戰(zhàn),紛紛探索科研數(shù)據(jù)管理服務(wù)的方法與模式。2012年,科研數(shù)據(jù)監(jiān)管被認(rèn)為是美國高校圖書館十大發(fā)展趨勢之一[2]。國外圖書館界,尤其是學(xué)術(shù)圖書館正不斷發(fā)展支持科研數(shù)據(jù)管理的基礎(chǔ)設(shè)施和服務(wù)。
不同學(xué)科的科研人員對科研數(shù)據(jù)管理服務(wù)的需求存在差異[3-4]。在進(jìn)行科研數(shù)據(jù)管理服務(wù)之前應(yīng)考慮學(xué)科之間的異同,考慮不同學(xué)科、不同課題組科研人員在資金、設(shè)備、技術(shù)、研究方法、原材料等方面的差異,根據(jù)特定學(xué)科的特定需求提供一系列有針對性的科研數(shù)據(jù)管理服務(wù)。生物醫(yī)學(xué)是關(guān)系到人類自身健康的重要領(lǐng)域,是生物醫(yī)學(xué)信息、醫(yī)學(xué)影像技術(shù)、基因芯片、納米技術(shù)、新材料等技術(shù)的學(xué)術(shù)研究和創(chuàng)新基地,其科技活動(dòng)非?;钴S,已產(chǎn)生海量數(shù)據(jù),并在持續(xù)快速增長。一些獨(dú)特的科研數(shù)據(jù)是不可復(fù)制的,具有重要的研究價(jià)值。如何共享、規(guī)范、管理和利用這些海量數(shù)據(jù)是非常關(guān)鍵的。
學(xué)科館員通常具備相關(guān)學(xué)科背景和圖書情報(bào)的實(shí)踐經(jīng)驗(yàn),并且與科研用戶建立了較為密切的聯(lián)系和信任關(guān)系,能夠深入科研一線,以綜合的視角來研究科研數(shù)據(jù)的采集、描述、存儲(chǔ)、管理和使用等問題[5]。在當(dāng)前信息大環(huán)境下和已建立的學(xué)科化服務(wù)成果之上,學(xué)科館員進(jìn)一步深入開展科研數(shù)據(jù)管理服務(wù)已是大勢所趨。
筆者結(jié)合解放軍醫(yī)學(xué)圖書館學(xué)科化服務(wù)對象的學(xué)科特性[6],對國外圖書館尤其是醫(yī)學(xué)圖書館開展科研數(shù)據(jù)管理支持服務(wù)的情況進(jìn)行了調(diào)研,以期建立生物醫(yī)學(xué)領(lǐng)域科研數(shù)據(jù)管理支持服務(wù)模式,對學(xué)科館員參與科研數(shù)據(jù)管理的實(shí)踐發(fā)揮指導(dǎo)作用。
在國外,科研數(shù)據(jù)管理已經(jīng)成為一種制度。美國國立衛(wèi)生研究院(NIH)要求申請50萬以上基金項(xiàng)目的科研人員都提交一個(gè)數(shù)據(jù)共享計(jì)劃或者數(shù)據(jù)不共享的說明[7]。該數(shù)據(jù)計(jì)劃包括:數(shù)據(jù)共享的時(shí)間軸、數(shù)據(jù)集格式、數(shù)據(jù)分析工具、共享協(xié)議、數(shù)據(jù)共享方式等內(nèi)容。英國生物技術(shù)和生物科學(xué)研究理事會(huì)(BBSRC)、英國癌癥研究中心和英國醫(yī)學(xué)研究理事會(huì)(MRC)[8]在資助科研項(xiàng)目時(shí)都要求研究人員提交數(shù)據(jù)共享計(jì)劃,包括數(shù)據(jù)領(lǐng)域、類型和格式,標(biāo)準(zhǔn)和元數(shù)據(jù),二次使用和數(shù)據(jù)共享的方法等內(nèi)容,并為科研人員提供了數(shù)據(jù)共享計(jì)劃模板,包括描述數(shù)據(jù)、數(shù)據(jù)收集、數(shù)據(jù)管理、數(shù)據(jù)安全、數(shù)據(jù)共享和責(zé)任等。澳大利亞政府、國家健康和醫(yī)學(xué)研究理事會(huì)(NHMRC)和澳大利亞研究理事會(huì)(ARC)聯(lián)合發(fā)布的澳大利亞誠信科研行為規(guī)范[9]中對于研究數(shù)據(jù)和重要資料的管理提出了明確的要求:研究者有責(zé)任保留科研數(shù)據(jù),提供安全的數(shù)據(jù)存儲(chǔ),對數(shù)據(jù)進(jìn)行明確標(biāo)識(shí),明確數(shù)據(jù)的擁有者以及確保數(shù)據(jù)的安全可靠性等。
高等教育機(jī)構(gòu)開始嘗試解決如何支持科研數(shù)據(jù)管理的問題,有的開展科研數(shù)據(jù)共享和管理的咨詢和培訓(xùn)服務(wù),有的提供專業(yè)的數(shù)據(jù)服務(wù),包括研究管理和計(jì)算機(jī)服務(wù)等。高校圖書館被認(rèn)為可以在支持科研數(shù)據(jù)管理中發(fā)揮很大作用。但根據(jù)2012年一項(xiàng)關(guān)于英國大學(xué)圖書館正在從事的研究數(shù)據(jù)管理服務(wù)的調(diào)研表明,圖書館當(dāng)前為研究密集型機(jī)構(gòu)高水平活動(dòng)所提供的科研數(shù)據(jù)管理服務(wù)還遠(yuǎn)遠(yuǎn)不夠,在技能、資源和文化上仍存在巨大的挑戰(zhàn)[10]。圖書館正在努力參與開發(fā)科研數(shù)據(jù)管理政策和服務(wù),并將其視為未來角色的重要組成部分之一。本文選取印第安納大學(xué)圖書館(Indiana University Libraries)和提供生物醫(yī)學(xué)科研數(shù)據(jù)管理服務(wù)的圖書館進(jìn)行調(diào)研,參考借鑒其圖書館員為科研人員提供的數(shù)據(jù)管理支持服務(wù)的模式、內(nèi)容、方法及工具等。
印第安納大學(xué)圖書館[11]開展了針對生命科學(xué)數(shù)據(jù)的數(shù)據(jù)管理服務(wù)。該圖書館設(shè)立了科學(xué)數(shù)據(jù)管理館員(Science Data Management Librarian)的職位,專職負(fù)責(zé)科研數(shù)據(jù)管理服務(wù)與聯(lián)絡(luò)工作,免費(fèi)為本??蒲腥藛T提供科研數(shù)據(jù)云存儲(chǔ)和存儲(chǔ)介質(zhì),或協(xié)助科研人員找到能夠滿足需求的第三方數(shù)據(jù)存儲(chǔ)的解決方案,建立數(shù)據(jù)管理服務(wù)網(wǎng)頁,提供針對生命科學(xué)領(lǐng)域數(shù)據(jù)管理的詳細(xì)指南和服務(wù)。具體服務(wù)內(nèi)容主要涉及以下四大部分。
1.1.1 記錄數(shù)據(jù)
對實(shí)驗(yàn)室記錄,提供針對生命科學(xué)實(shí)驗(yàn)室數(shù)據(jù)記錄獲取的指南,如保持好的實(shí)驗(yàn)室筆記(包括案例和清單)的新手指南,萊斯大學(xué)生物化學(xué)和細(xì)胞生物學(xué)保持實(shí)驗(yàn)室記錄的指南,甚至比較了各種油墨后提出的實(shí)驗(yàn)室筆記本選擇建議,還有專業(yè)研究人員描述他們?nèi)绾纬晒Φ毓芾韺I(yè)筆記的書籍等。
對于元數(shù)據(jù),提供了生命科學(xué)科學(xué)數(shù)據(jù)常用的機(jī)讀標(biāo)準(zhǔn),如Darwin Core的生物多樣性數(shù)據(jù)標(biāo)準(zhǔn),生態(tài)元數(shù)據(jù)語言(EML)的生態(tài)學(xué)數(shù)據(jù)標(biāo)準(zhǔn),ISA-Tab的omics-based實(shí)驗(yàn)數(shù)據(jù)標(biāo)準(zhǔn)以及其他的生命科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)等。
1.1.2 撰寫數(shù)據(jù)資源管理計(jì)劃
協(xié)助制定數(shù)據(jù)管理計(jì)劃,提供了一個(gè)采用IU-specific語言編寫的NSF數(shù)據(jù)管理計(jì)劃模板,并且建議使用 DMPTool作為計(jì)劃撰寫工具,提供關(guān)于數(shù)據(jù)管理的指南,包括數(shù)據(jù)管理的一般概念(即記錄數(shù)據(jù)與元數(shù)據(jù),如何處理敏感數(shù)據(jù)等)和鏈接相關(guān)資源,以及提供制定數(shù)據(jù)管理計(jì)劃的培訓(xùn)視頻等。另外,還提供有關(guān)科研數(shù)據(jù)管理計(jì)劃的人工咨詢服務(wù),由科學(xué)數(shù)據(jù)管理館員審查核定,確保計(jì)劃符合基金的要求。
1.1.3 存儲(chǔ)數(shù)據(jù)和保護(hù)資源
印第安納大學(xué)圖書館提供免費(fèi)的數(shù)據(jù)長期保存服務(wù),研究人員能夠獲得50TB的數(shù)據(jù)存儲(chǔ)空間。印第安納大學(xué)科研人員還可以注冊一個(gè)研究文件系統(tǒng)(RFS)或?qū)W術(shù)數(shù)據(jù)檔案(SDA)賬戶,為進(jìn)行中和已結(jié)束的研究提供獨(dú)立的私人存儲(chǔ)數(shù)據(jù)。它提供的小型開放數(shù)據(jù)空間,可以上傳150M的文件到IUScholarWorks平臺(tái)。它提供的私有數(shù)據(jù)到開放數(shù)據(jù)的轉(zhuǎn)換體統(tǒng),研究人員可以將研究文件系統(tǒng)(RFS)或?qū)W術(shù)數(shù)據(jù)檔案(SDA)中的科研數(shù)據(jù)傳輸?shù)介_放數(shù)據(jù)平臺(tái),供他人訪問下載,實(shí)現(xiàn)科研數(shù)據(jù)共享。
此外,印第安納大學(xué)圖書館還向科研人員介紹了Biosharing.org和databib.org兩個(gè)科研數(shù)據(jù)網(wǎng)站,主題領(lǐng)域涉及生物科學(xué)、生態(tài)系統(tǒng)科學(xué)、環(huán)境科學(xué)和健康與醫(yī)學(xué)科學(xué)等。
1.1.4 匯集數(shù)據(jù)管理相關(guān)政策
提供印第安納大學(xué)和科研數(shù)據(jù)管理相關(guān)的研究政策,如在生命科學(xué)領(lǐng)域特殊的研究政策,印第安納大學(xué)關(guān)于人類被試研究的標(biāo)準(zhǔn)操作程序,敏感數(shù)據(jù)管理指南等。
馬薩諸塞大學(xué)醫(yī)學(xué)院與新英格蘭地區(qū)的幾所圖書館聯(lián)合開發(fā)了新英格蘭協(xié)作數(shù)據(jù)管理課程(NECDMC)項(xiàng)目。NECDMC課程是科學(xué)數(shù)據(jù)管理最佳實(shí)踐的教學(xué)工具,適用于健康科學(xué)的本科生、研究生以及科研人員。馬薩諸塞大學(xué)醫(yī)學(xué)院圖書館將這套課程上傳至網(wǎng)站上,供科研人員和學(xué)生學(xué)習(xí)。課程的案例來自臨床研究、生物醫(yī)學(xué)實(shí)驗(yàn)室、工程項(xiàng)目和行為醫(yī)學(xué)定性研究等科研數(shù)據(jù)管理的最佳實(shí)踐案例。除了MECDMC課程外,馬薩諸塞大學(xué)醫(yī)學(xué)院圖書館還提供生物醫(yī)學(xué)科研數(shù)據(jù)管理支持服務(wù),由3名不同專業(yè)的圖書館員負(fù)責(zé)聯(lián)系、咨詢及其他服務(wù)。服務(wù)內(nèi)容主要包括四個(gè)部分。
1.2.1 科研數(shù)據(jù)管理介紹
馬薩諸塞大學(xué)醫(yī)學(xué)院圖書館大力強(qiáng)調(diào)管理科研數(shù)據(jù)的重要性、為什么管理數(shù)據(jù)、良好的數(shù)據(jù)管理是什么樣的、數(shù)據(jù)丟失的結(jié)果等。
1.2.2 管理數(shù)據(jù)
數(shù)據(jù)引用:向科研人員介紹為什么要引用數(shù)據(jù)、數(shù)據(jù)引用規(guī)范、引用數(shù)據(jù)的工具(DOI引文格式化程序),并列出了若干數(shù)據(jù)引用規(guī)范案例。
數(shù)據(jù)倫理:向科研人員指出什么是負(fù)責(zé)任的研究行為、什么是數(shù)據(jù)完成性、如何匿名化定量數(shù)據(jù)和定型數(shù)據(jù)、去除識(shí)別信息的病人數(shù)據(jù)使用,并且提供了數(shù)據(jù)倫理案例研究等。
文件管理:提供了文件結(jié)構(gòu)和命名模板,數(shù)據(jù)文件組織建議等。
文件儲(chǔ)存和備份:介紹數(shù)據(jù)存儲(chǔ)介質(zhì)(個(gè)人存儲(chǔ)介質(zhì)、網(wǎng)絡(luò)驅(qū)動(dòng)器、云存儲(chǔ))和存儲(chǔ)設(shè)備,數(shù)據(jù)存儲(chǔ)、備份和安全的建議及最佳實(shí)踐。
所有權(quán):介紹了知識(shí)產(chǎn)權(quán)政策、數(shù)據(jù)所有權(quán)和知識(shí)產(chǎn)權(quán)相關(guān)知識(shí)。
規(guī)劃:提供數(shù)據(jù)管理計(jì)劃政策、程序和指南,數(shù)據(jù)管理計(jì)劃制定工具,以及eScholarship@UMM管理平臺(tái)。
政策:提供各類數(shù)據(jù)政策,如基金自助者數(shù)據(jù)政策、出版商數(shù)據(jù)政策、期刊數(shù)據(jù)政策以及馬薩諸塞大學(xué)醫(yī)學(xué)院的數(shù)據(jù)管理政策。
數(shù)據(jù)保留時(shí)長:介紹本地?cái)?shù)據(jù)保留政策、數(shù)據(jù)保留時(shí)間及負(fù)責(zé)數(shù)據(jù)保留的部門。
1.2.3 提供學(xué)校的資源與政策
提供了學(xué)校的數(shù)據(jù)管理工具BioTools @ UMass Medical School安全的數(shù)據(jù)云存儲(chǔ)、學(xué)校的數(shù)據(jù)管理政策、學(xué)校數(shù)據(jù)分析規(guī)劃服務(wù)、臨床資料咨詢和解決方案以及研究計(jì)算方案和工具等。
1.2.4 提供其他開放和可用的數(shù)據(jù)資源
提供了開放以及公開可用的數(shù)據(jù)(如Bioinformatics Timesaver、Data.gov、Databib、Genomic Data Repositories、HSRIC: Data, Tools, and Statistics、NIH Data Sharing Repositories等資源)和可用的生物科學(xué)的數(shù)據(jù)存儲(chǔ)庫(如Dryad、GenBank、Gene Expression Omnibus、Mouse Genome Informatics、Protein Data Bank等資源),以及公開的衛(wèi)生數(shù)據(jù)集、社會(huì)科學(xué)數(shù)據(jù)集和開放數(shù)據(jù)資源等。
從上述圖書館科研數(shù)據(jù)管理服務(wù)來看,生物醫(yī)學(xué)科研數(shù)據(jù)管理咨詢服務(wù)占很大比重,除了數(shù)據(jù)管理政策咨詢、數(shù)據(jù)管理計(jì)劃撰寫指南及模板、知識(shí)產(chǎn)權(quán)咨詢等咨詢服務(wù)外,具有生物醫(yī)學(xué)領(lǐng)域特色的數(shù)據(jù)收集方法、元數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)類型和范圍、生物醫(yī)學(xué)數(shù)據(jù)特有的分析方法和工具、生物醫(yī)學(xué)研究政策、生物醫(yī)學(xué)數(shù)據(jù)資源以及生物醫(yī)學(xué)研究數(shù)據(jù)管理的最佳實(shí)踐案例更成為了服務(wù)的重點(diǎn)??蒲袛?shù)據(jù)管理服務(wù)與文獻(xiàn)情報(bào)服務(wù)有很大差異,需要配備專業(yè)的數(shù)據(jù)管理服務(wù)人員。
無論圖書館如何提供科研數(shù)據(jù)管理支持服務(wù),科研數(shù)據(jù)管理的主要責(zé)任者仍是科研人員。因此圖書館開展科研數(shù)據(jù)管理支持服務(wù)必須堅(jiān)持以用戶為中心,從用戶的實(shí)際需求出發(fā)。
首先在服務(wù)范圍內(nèi)對生物醫(yī)學(xué)科研人員進(jìn)行科研數(shù)據(jù)管理服務(wù)需求的調(diào)研,主要內(nèi)容包括對科研數(shù)據(jù)管理政策的掌握情況,實(shí)際的科研數(shù)據(jù)管理方法及工具、科研數(shù)據(jù)管理計(jì)劃的模板及工具使用情況,元數(shù)據(jù)格式、轉(zhuǎn)換格式和工具使用情況,數(shù)據(jù)分析方法及工具的利用情況,科研數(shù)據(jù)管理目前存在的困難,以及對于圖書館能夠提供的科研數(shù)據(jù)管理服務(wù)的需求等。針對以上情況,學(xué)科館員需深入重點(diǎn)課題組,對科研數(shù)據(jù)管理實(shí)際情況進(jìn)行考察,全面掌握服務(wù)對象在科研數(shù)據(jù)管理方面實(shí)際存在的問題,提升模式和對服務(wù)的需求。
然后根據(jù)對調(diào)研結(jié)果的分析,初步設(shè)計(jì)出科研數(shù)據(jù)管理服務(wù)思路,結(jié)合本單位學(xué)科化服務(wù)重點(diǎn)服務(wù)計(jì)劃,進(jìn)一步開展基于生物醫(yī)學(xué)數(shù)據(jù)生命周期的科研數(shù)據(jù)管理服務(wù)模式的研究和實(shí)踐。
科研數(shù)據(jù)是根據(jù)科研工作的流程而產(chǎn)生的,同科研項(xiàng)目一樣,也有生命周期。醫(yī)學(xué)圖書館學(xué)科館員為科研團(tuán)隊(duì)或科研人員提供科研數(shù)據(jù)管理服務(wù),必須遵循生物醫(yī)學(xué)科研數(shù)據(jù)的生命周期,滿足科研進(jìn)程不同階段對科研數(shù)據(jù)管理的不同需求,才能有效地提供科研數(shù)據(jù)管理服務(wù)。
學(xué)科館員根據(jù)數(shù)據(jù)文檔計(jì)劃(Data Documentation Initiative,簡稱 DDI)的研究數(shù)據(jù)生命周期[13],確定基于數(shù)據(jù)生命周期的科研數(shù)據(jù)管理服務(wù)模型,包括研究設(shè)計(jì)、數(shù)據(jù)收集、數(shù)據(jù)處理、數(shù)據(jù)存檔、數(shù)據(jù)發(fā)布、數(shù)據(jù)發(fā)現(xiàn)、數(shù)據(jù)分析及數(shù)據(jù)再利用8個(gè)階段,并根據(jù)不同研究階段數(shù)據(jù)管理需求來確定科研數(shù)據(jù)管理服務(wù)的內(nèi)容和方式。
圖1 基于數(shù)據(jù)生命周期的科研數(shù)據(jù)管理服務(wù)
2.2.1 研究設(shè)計(jì)階段
在研究設(shè)計(jì)階段,確定研究任務(wù)的同時(shí)需制定一份關(guān)于未來科研數(shù)據(jù)管理的規(guī)范計(jì)劃??蒲袛?shù)據(jù)管理計(jì)劃(DMP)是描述研究過程中及研究項(xiàng)目完成后科研數(shù)據(jù)處理方式的正式文件。清晰完備的數(shù)據(jù)管理計(jì)劃不僅使得科研數(shù)據(jù)生成、保存、共享和利用等操作規(guī)范化,也可保證他人分享數(shù)據(jù)和長期保存數(shù)據(jù)的完整性和一致性。學(xué)科館員要提供各基金機(jī)構(gòu)數(shù)據(jù)管理政策、數(shù)據(jù)管理計(jì)劃軟件、基于科研數(shù)據(jù)管理計(jì)劃的制訂提供咨詢與指導(dǎo)、基于數(shù)據(jù)生命周期的DMP最佳實(shí)踐案例以及詳細(xì)的研究數(shù)據(jù)管理指南等。
2.2.2 數(shù)據(jù)收集階段
在數(shù)據(jù)收集階段,科研數(shù)據(jù)管理需要確定數(shù)據(jù)格式、尺寸和命名方式,以及對數(shù)據(jù)短期進(jìn)行存儲(chǔ)。但生物醫(yī)學(xué)領(lǐng)域的研究由于實(shí)驗(yàn)方法、對象、材料等方面存在諸多差異,導(dǎo)致數(shù)據(jù)收集方法與工具也存在很大差異。學(xué)科館員需協(xié)助科研人員創(chuàng)建元數(shù)據(jù),提供生物醫(yī)學(xué)數(shù)據(jù)元數(shù)據(jù)格式、生物醫(yī)學(xué)數(shù)據(jù)存儲(chǔ)標(biāo)準(zhǔn)、一些分布式文件系統(tǒng)的介紹、其他可用的圖書館數(shù)據(jù)資源,以及根據(jù)情況構(gòu)建或引入科研數(shù)據(jù)管理平臺(tái)。
2.2.3 數(shù)據(jù)處理階段
在數(shù)據(jù)處理階段,科研數(shù)據(jù)管理的任務(wù)主要為數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)重新構(gòu)建。生物醫(yī)學(xué)領(lǐng)域數(shù)據(jù)類型比較復(fù)雜,需要針對不同類型的數(shù)據(jù)提供專業(yè)數(shù)據(jù)分析處理工具,學(xué)科館員可以為科研人員介紹高性能計(jì)算中心、專業(yè)數(shù)據(jù)處理課程、數(shù)據(jù)處理方法等。
2.2.4 數(shù)據(jù)存檔階段
在數(shù)據(jù)存檔階段,科研數(shù)據(jù)管理的任務(wù)主要為數(shù)據(jù)長期保存與管理。目前用于科研數(shù)據(jù)長期保存的系統(tǒng)主要有公共數(shù)據(jù)倉儲(chǔ)庫、各學(xué)科領(lǐng)域的專門數(shù)據(jù)倉儲(chǔ)庫、各機(jī)構(gòu)建立的數(shù)據(jù)倉儲(chǔ)系統(tǒng)等。學(xué)科館員需協(xié)助科研人員進(jìn)行數(shù)據(jù)的上傳存檔,提供生物醫(yī)學(xué)數(shù)據(jù)歸檔政策、數(shù)據(jù)倉庫介紹、數(shù)據(jù)上傳歸檔工具以及數(shù)據(jù)字典等。
2.2.5 數(shù)據(jù)發(fā)布階段
在數(shù)據(jù)發(fā)布階段,科研數(shù)據(jù)管理的任務(wù)主要為數(shù)據(jù)共享、確保數(shù)據(jù)安全和權(quán)力。數(shù)據(jù)的發(fā)布和出版是將研究數(shù)據(jù)視為科學(xué)研究活動(dòng)的產(chǎn)出成果進(jìn)行發(fā)布和出版,將有助于推動(dòng)數(shù)據(jù)共享的進(jìn)程。學(xué)科館員可以提供生物醫(yī)學(xué)科研數(shù)據(jù)共享與數(shù)據(jù)出版政策、生物醫(yī)學(xué)科研數(shù)據(jù)交換格式標(biāo)準(zhǔn),以及科研數(shù)據(jù)安全相關(guān)問題咨詢等。
2.2.6 數(shù)據(jù)發(fā)現(xiàn)階段
在數(shù)據(jù)發(fā)現(xiàn)階段,科研數(shù)據(jù)管理的任務(wù)主要為數(shù)據(jù)挖掘和數(shù)據(jù)利用服務(wù)。學(xué)科館員可以幫助科研人員發(fā)掘更多可用的數(shù)據(jù)來源、提供數(shù)據(jù)引用規(guī)范以及科研數(shù)據(jù)知識(shí)產(chǎn)權(quán)相關(guān)問題。
2.2.7 數(shù)據(jù)分析階段
在數(shù)據(jù)分析階段,科研數(shù)據(jù)管理的任務(wù)主要為萃取和提煉科研數(shù)據(jù)中的信息知識(shí)。此時(shí),學(xué)科館員需幫助科研人員對數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,找到數(shù)據(jù)內(nèi)在的知識(shí)聯(lián)系,提供生物醫(yī)學(xué)科研數(shù)據(jù)分析軟件(如SAS、SPSS等)及生物醫(yī)學(xué)科研數(shù)據(jù)統(tǒng)計(jì)咨詢服務(wù)等。
2.2.8 數(shù)據(jù)再利用階段
在數(shù)據(jù)再利用階段,科研數(shù)據(jù)管理的任務(wù)主要為數(shù)據(jù)關(guān)聯(lián)與再利用。學(xué)科館員可以為科研人員提供再利用的政策,并根據(jù)新的科研任務(wù)提供新的科研數(shù)據(jù)管理計(jì)劃等。
學(xué)科館員在基于數(shù)據(jù)生命周期的科研數(shù)據(jù)管理服務(wù)過程中可以使用libguides建立數(shù)據(jù)管理支持服務(wù)平臺(tái),提供生物醫(yī)學(xué)領(lǐng)域數(shù)據(jù)管理詳細(xì)的指南和服務(wù),重點(diǎn)建設(shè)數(shù)據(jù)計(jì)劃及元數(shù)據(jù)標(biāo)準(zhǔn)、生物醫(yī)學(xué)科研數(shù)據(jù)管理最佳實(shí)踐、生物醫(yī)學(xué)領(lǐng)域資源等。
科研數(shù)據(jù)管理服務(wù)的發(fā)展對圖書館員帶來了極大挑戰(zhàn),如專業(yè)領(lǐng)域的科研數(shù)據(jù)管理服務(wù)受知識(shí)和技能的限制。有研究表明[14],健康、科學(xué)的圖書館員雖然對科研數(shù)據(jù)管理服務(wù)的開發(fā)具有興趣,但往往缺乏提供生物醫(yī)學(xué)科研數(shù)據(jù)管理服務(wù)的有效技能。
學(xué)科館員雖然具備一定的學(xué)科知識(shí)和圖書館實(shí)踐經(jīng)驗(yàn),但對于專業(yè)的科研數(shù)據(jù)管理服務(wù)仍需提升各方面能力。在數(shù)據(jù)管理咨詢服務(wù)能力方面,需加強(qiáng)理解和把握生物醫(yī)學(xué)科研數(shù)據(jù)的生命周期,學(xué)習(xí)生物醫(yī)學(xué)數(shù)據(jù)管理相關(guān)技術(shù)知識(shí),熟悉生物醫(yī)學(xué)元數(shù)據(jù),掌握生物醫(yī)學(xué)領(lǐng)域科研數(shù)據(jù)相關(guān)政策及規(guī)定,熟悉生物醫(yī)學(xué)領(lǐng)域科研數(shù)據(jù)的范圍和存儲(chǔ)格式,加強(qiáng)對機(jī)構(gòu)知識(shí)庫的了解,補(bǔ)充基金申請書寫作經(jīng)驗(yàn),提升與科研人員合作和溝通的技巧等。另外還需加強(qiáng)開發(fā)數(shù)據(jù)管理軟硬件的能力,掌握應(yīng)用專業(yè)軟件(如Dspace、Fedora、Eprints等)定制開發(fā)特定領(lǐng)域的數(shù)據(jù)管理平臺(tái)的能力等。
目前學(xué)科館員開展科研數(shù)據(jù)管理支持服務(wù)的一個(gè)主要難點(diǎn)是缺乏數(shù)據(jù)標(biāo)準(zhǔn)。不同的科研領(lǐng)域,不同的管理方式都會(huì)產(chǎn)生不同的數(shù)據(jù)格式,缺乏數(shù)據(jù)標(biāo)準(zhǔn)使得已產(chǎn)生的海量數(shù)據(jù)因?yàn)榧嫒菪詥栴}難以實(shí)現(xiàn)共享和分析。學(xué)科館員在協(xié)助科研人員進(jìn)行科研數(shù)據(jù)管理初期應(yīng)充分參考該領(lǐng)域的最佳實(shí)踐案例,盡量使用國際通用標(biāo)準(zhǔn),以避免之后調(diào)整數(shù)據(jù)標(biāo)準(zhǔn)的麻煩。
在生物醫(yī)學(xué)科研數(shù)據(jù)管理服務(wù)過程中存在一系列問題,如數(shù)據(jù)重構(gòu)、數(shù)據(jù)分析、數(shù)據(jù)出版等,需要服務(wù)人員對生物醫(yī)學(xué)和數(shù)據(jù)管理兩個(gè)領(lǐng)域都具有較深的造詣[15]。學(xué)科館員需要投入大量的時(shí)間和精力去學(xué)習(xí)新的研究方法、政策、工具等知識(shí),才能很好地為科研人員提供生物醫(yī)學(xué)科研數(shù)據(jù)管理服務(wù)??蒲袛?shù)據(jù)管理服務(wù)對學(xué)科館員而言既是機(jī)遇也是挑戰(zhàn),優(yōu)質(zhì)的生物醫(yī)學(xué)科研數(shù)據(jù)管理服務(wù)可以幫助培養(yǎng)新的研究、新的發(fā)現(xiàn)以及獲得更好的科研成果,但需要更加深刻地把握學(xué)科領(lǐng)域研究數(shù)據(jù)的特性,開發(fā)更為便捷可靠的工具,不斷優(yōu)化的服務(wù)模式,持續(xù)地在數(shù)據(jù)挖掘、知識(shí)服務(wù)等方面進(jìn)行深入探索。
中華醫(yī)學(xué)圖書情報(bào)雜志2015年8期