,,
科學(xué)研究產(chǎn)生了大量的科學(xué)數(shù)據(jù),精密儀器和大規(guī)模計算的應(yīng)用使科學(xué)研究數(shù)據(jù)呈指數(shù)級增長態(tài)勢。由于實驗環(huán)境、實驗設(shè)備、實驗人員的限制,科學(xué)數(shù)據(jù)通常是不可復(fù)制和再現(xiàn)的,但又具有重要的現(xiàn)實價值和潛在價值,因此對科學(xué)數(shù)據(jù)的保存和管理顯得尤為重要。數(shù)據(jù)監(jiān)護(Digital Curation or Data Curation,DC)是將科學(xué)數(shù)據(jù)的維護、保存和增值貫穿于科學(xué)數(shù)據(jù)生命周期每一環(huán)節(jié)的長期實踐活動[1]。在數(shù)據(jù)生命周期整個過程中對數(shù)據(jù)的持續(xù)監(jiān)管,不僅能夠為學(xué)術(shù)、科研和教育提供便利,而且能夠維護數(shù)據(jù)質(zhì)量,提供數(shù)據(jù)增值服務(wù)和復(fù)用服務(wù)。
近年來,為培養(yǎng)數(shù)據(jù)監(jiān)護的專業(yè)人才,滿足數(shù)據(jù)館員的職業(yè)技能需求,國內(nèi)外許多大學(xué)及研究中心開展了DC相關(guān)項目或課程[2]。有學(xué)者調(diào)研了相關(guān)院校的DC課程[3]或DC認(rèn)證項目[4],從教學(xué)層次、師資力量、先修課程、指定教材、推薦閱讀、作業(yè)形式、課程名稱、課程目標(biāo)等對DC相關(guān)課程或DC認(rèn)證項目的信息進行了歸納整理。周霞等人通過調(diào)研國內(nèi)高校情報學(xué)專業(yè)的培養(yǎng)方案,從情報學(xué)碩士研究方向提煉課程內(nèi)容,發(fā)現(xiàn)在數(shù)據(jù)監(jiān)護方面,情報學(xué)碩士教育依然側(cè)重于數(shù)據(jù)庫技術(shù)及數(shù)據(jù)挖掘,鮮有涉及數(shù)據(jù)的管理與保存[5]。上述研究主要從學(xué)院網(wǎng)站調(diào)查結(jié)果入手,結(jié)合問卷調(diào)查等方式,歸納整理了相關(guān)課程的信息,揭示目前DC課程開設(shè)現(xiàn)狀。
數(shù)據(jù)監(jiān)護是貫穿于科學(xué)數(shù)據(jù)管理生命周期每一環(huán)節(jié)的長期實踐活動。結(jié)合數(shù)據(jù)管理生命周期分析DC相關(guān)課程,對于梳理目前DC相關(guān)課程的內(nèi)容主題及完善DC課程體系都具有重要的意義。本文將結(jié)合數(shù)據(jù)管理生命周期理論,分析數(shù)據(jù)監(jiān)護課程的側(cè)重點和發(fā)展方向,從內(nèi)容主題角度進一步了解DC課程開設(shè)現(xiàn)狀,為我國高校開設(shè)DC相關(guān)課程提供參考意見。
成立于2005年的iSchools是致力于促進信息領(lǐng)域發(fā)展的全球信息學(xué)院聯(lián)盟,聯(lián)盟成員來自全球LIS(Library and Information Science)相關(guān)學(xué)院。截至2017年11月,該聯(lián)盟已擁有來自北美、歐洲、澳洲、亞洲等地區(qū)的82所成員學(xué)院。iSchools成員學(xué)院是全球信息學(xué)院中的領(lǐng)軍院系,其DC課程設(shè)置對于國內(nèi)外其他信息學(xué)院開展數(shù)據(jù)監(jiān)護教育具有重要的啟示和借鑒作用。本文采用網(wǎng)絡(luò)調(diào)查法,以66所iSchools成員學(xué)院作為樣本進行調(diào)查。首先通過訪問院校網(wǎng)站搜集院校DC課程信息,并對其課程標(biāo)題、教學(xué)大綱、課程目標(biāo)、課程描述等課程內(nèi)容信息進行統(tǒng)計。將獲得的DC相關(guān)課程內(nèi)容形成課程內(nèi)容標(biāo)簽,分析不同國家與地區(qū)、不同課程等級以及科學(xué)數(shù)據(jù)管理生命周期不同階段的課程主題,從課程內(nèi)容進一步深入了解數(shù)據(jù)監(jiān)護課程開設(shè)現(xiàn)狀,同時結(jié)合數(shù)據(jù)管理生命周期,揭示目前DC課程的教學(xué)側(cè)重點?;谡{(diào)研結(jié)果,結(jié)合目前國內(nèi)DC課程開設(shè)現(xiàn)狀,對我國信息學(xué)院開設(shè)DC相關(guān)課程提出建議。
為了便于研究,筆者對DC課程做了如下界定:課程名稱、課程描述、課程目標(biāo)或課程大綱中出現(xiàn)Data Curation或Digital Curation一詞,課程的主要內(nèi)容涉及DC相關(guān)主題。
本文共調(diào)研了66所iSchools成員學(xué)院。由于其中7所(中國大陸4所,德國1所,西班牙1所,丹麥1所)未在其網(wǎng)站上公布課程目錄及課程信息,因此共獲得59所院校的有效課程數(shù)據(jù)。59所iSchools成員學(xué)院中有2所位于中國臺灣,但并未開設(shè)DC相關(guān)課程,其余57所iSchools成員學(xué)院的國家分布及開設(shè)DC課程的iSchools成員學(xué)院數(shù)量如表1所示。共有32所成員院校開設(shè)了數(shù)據(jù)監(jiān)護課程,共開設(shè)了58門DC課程。分析這些學(xué)院DC課程的主題內(nèi)容信息,即對所有課程的課程介紹和教學(xué)大綱進行人工標(biāo)注,得到DC課程內(nèi)容標(biāo)簽云圖(圖1),整體把握目前DC課程教育的發(fā)展概況。
表1 57所iSchools成員院校的國家分布及開設(shè)DC課程的成員院校數(shù)量
從圖1可以看出,除digital curation 和 data curation 之外,出現(xiàn)較多的課程標(biāo)簽是preservation,lifecycle,practices,management,standards,metadata,可見,目前的DC課程教育普遍關(guān)注數(shù)據(jù)保存相關(guān)問題、數(shù)據(jù)管理生命周期、數(shù)據(jù)監(jiān)護相關(guān)的標(biāo)準(zhǔn)和元數(shù)據(jù)問題,并且將現(xiàn)存的最佳實踐作為案例研究,探索實際數(shù)據(jù)監(jiān)護中面臨的問題及挑戰(zhàn)。
對不同國家iSchools院校DC課程內(nèi)容標(biāo)簽進行分析,得出其標(biāo)簽云圖(圖2)。圖2中,美國作為開設(shè)DC課程最多的國家,其DC課程標(biāo)簽在所有DC課程標(biāo)簽中占有較大比重,因此美國的DC課程標(biāo)簽云圖與全球各國DC課程的總標(biāo)簽云圖具有較大的相似性。分析其他各國的DC課程內(nèi)容標(biāo)簽,發(fā)現(xiàn)各國既有共同出現(xiàn)的標(biāo)簽,如preservation或preserving,lifecycle,practices,management,standards,metadata,又各自有與其他國家不同的DC課程標(biāo)簽,說明雖然各國普遍關(guān)注的DC課程主題大體相近,但是側(cè)重點各有不同。
英國iSchools院校的DC課程強調(diào)對數(shù)字資源的質(zhì)量管理以及適用于數(shù)字資源長期保存與長期可獲取的信息系統(tǒng)進行開發(fā)與設(shè)計。數(shù)字資源質(zhì)量管理方面,格拉斯哥大學(xué)的Management,Curation & Preservation of the Digital Materials[6]課程強調(diào)學(xué)生需要從數(shù)據(jù)的真實性(authenticity)、完整性(integrity)和可靠性(reliability)去評價數(shù)字資源的質(zhì)量;羅伯特高登大學(xué)DC模塊[7]中的User Participation and Engagement課程強調(diào)在普遍合作的科學(xué)環(huán)境下,用戶團體共同創(chuàng)建資源的管理、選擇和整合技術(shù)。DC信息系統(tǒng)開發(fā)與設(shè)計方面,格拉斯哥大學(xué)的課程強調(diào)信息系統(tǒng)功能需求的分析,課程偏重理論分析;羅伯特高登大學(xué)DC模塊中的System Development for Digital Curation強調(diào)滿足數(shù)字資源存儲、檢索和長期獲取需求的信息系統(tǒng)的開發(fā)與設(shè)計,以及如何利用Linux環(huán)境和其他開源技術(shù)開發(fā)DC原型系統(tǒng),課程偏重技術(shù)實現(xiàn)。
澳大利亞iSchools院校的DC課程重視對數(shù)據(jù)管理生命周期每個階段的任務(wù)和活動的梳理,并且突出了大數(shù)據(jù)時代下對科學(xué)數(shù)據(jù)的管理而非寬泛的對數(shù)字資源的管理。查爾斯特大學(xué)的Data Curation課程大綱[8]覆蓋了從數(shù)據(jù)設(shè)計、數(shù)據(jù)創(chuàng)建、數(shù)據(jù)篩選、數(shù)據(jù)攝入、數(shù)據(jù)保存、數(shù)據(jù)存儲、數(shù)據(jù)使用和復(fù)用的數(shù)據(jù)監(jiān)護生命周期管理。墨爾本大學(xué)的E-Science課程[9]強調(diào)科學(xué)數(shù)據(jù)管理的生命周期理論以及科學(xué)數(shù)據(jù)管理和處理的方法、工具及面臨的挑戰(zhàn),深入講授數(shù)據(jù)的特性、結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的處理、數(shù)據(jù)分析、存儲、獲取以及數(shù)據(jù)可視化等科學(xué)數(shù)據(jù)的有效管理過程。
圖2 不同國家iSchools院校DC課程內(nèi)容標(biāo)簽云圖
加拿大iSchools院校的DC課程十分重視重要模型,如OAIS模型以及數(shù)據(jù)管理生命周期的學(xué)習(xí)和運用。多倫多大學(xué)的課程Digital Preservation and Curation[10]重點關(guān)注數(shù)據(jù)從預(yù)涉入到傳播的工作流。麥吉爾大學(xué)的課程Digital Curation[11]明確將OAIS模型和DDC的科學(xué)數(shù)據(jù)管理生命周期作為學(xué)生指定的閱讀材料,并在課程中設(shè)計了一個部分專門講授OAIS模型、AIP、SIP、DIP和數(shù)據(jù)管理生命周期。機構(gòu)庫(institutional repository)和數(shù)字倉儲(digital repository)作為數(shù)字資源保存和利用的重要平臺,也是加拿大iSchools院校DC課程關(guān)注的重點。多倫多大學(xué)關(guān)注數(shù)字倉儲的特點以及可信賴數(shù)字倉儲的審計與認(rèn)證問題。除此之外,麥吉爾大學(xué)的Digital Curation課程還詳細講授數(shù)字倉儲的實施與評估問題,討論常見的Eprints,DSpace和Fedora等機構(gòu)庫軟件工具。Digital Curation課程中僅有的4個小組項目作業(yè)中有2個是關(guān)于數(shù)字倉儲的實施與評估,課程計劃中有2周的課時都用于學(xué)習(xí)和討論數(shù)字倉儲的相關(guān)問題。
荷蘭僅有的一所iSchools院校是阿姆斯特丹大學(xué)的人文、檔案和信息研究生院。該學(xué)院的Research Data Management for Information Professionals[12]強調(diào)不同學(xué)科領(lǐng)域科學(xué)數(shù)據(jù)管理的需求及實踐,并介紹了REDCap,DataVerse,Archivematica和DSpace等科學(xué)數(shù)據(jù)管理系統(tǒng)軟件。
iSchools學(xué)院中所有DC課程均面向碩士研究生及以上開設(shè)。依據(jù)課程的開設(shè)周期、課程成熟度、課程關(guān)聯(lián)度,本文將DC課程分為特殊專題、常規(guī)課程和系列課程3個等級。特殊專題(special topics)是指已經(jīng)列入課程目錄但尚未被列入常規(guī)課程的新興研究課題,根據(jù)實際情況決定是否開課,而特殊課程可以看作是DC課程的探索階段;常規(guī)課程(regular course)是指已經(jīng)列入課程目錄并且每學(xué)年都開設(shè)的課程,DC常規(guī)課程是數(shù)據(jù)監(jiān)護領(lǐng)域入門課程,可以看作是DC課程的發(fā)展階段;系列課程(serial courses)是指學(xué)院開設(shè)的由淺入深、從理論到實踐的一系列DC課程(5個及以上)或者已經(jīng)將DC作為碩士研究生教育的一個培養(yǎng)方向開設(shè)了碩士研究生認(rèn)證課程(Graduate Academic Certificate),是DC課程的成熟階段。根據(jù)調(diào)研結(jié)果,得到開設(shè)各個等級DC課程的iSchools學(xué)院數(shù)量與國家分布(表2),大部分iSchools學(xué)院都開設(shè)了DC常規(guī)課程,表明各國已經(jīng)進入DC課程的快速發(fā)展階段。對比不同等級的DC課程標(biāo)簽云圖(圖3),發(fā)現(xiàn)不同等級的DC課程主題內(nèi)容各有側(cè)重。
表2 開設(shè)不同等級DC課程的iSchools成員學(xué)院數(shù)量與國家分布
圖3 不同等級的DC課程標(biāo)簽云圖
32所iSchools學(xué)院中,僅有3所院校開設(shè)了DC特殊專題課程。從課程內(nèi)容標(biāo)簽看,特殊專題主要介紹目前常見的數(shù)據(jù)監(jiān)護模型OAIS以及現(xiàn)有的科學(xué)數(shù)據(jù)管理的最佳實踐項目,如美國國家海洋大氣管理局(NOAA)、美國國家大氣研究中心(NCAR)、美國校際社會科學(xué)數(shù)據(jù)共享聯(lián)盟(ICPSR)。
32所iSchools學(xué)院中,有26所學(xué)院開設(shè)DC常規(guī)課程,占81.25%,而且這些學(xué)院的地域分布覆蓋了所有開設(shè)DC課程的國家:美國、英國、澳大利亞、加拿大和荷蘭。從課程內(nèi)容標(biāo)簽看,常規(guī)課程出現(xiàn)最多的標(biāo)簽是preservation,其次是archives,standards,metadata,management,practices,data curation,libraries,policy,tool等??梢?,科學(xué)數(shù)據(jù)的保存問題是常規(guī)課程的重點教學(xué)內(nèi)容。具體來說,常規(guī)課程涉及以下內(nèi)容:概述數(shù)字資源或科學(xué)數(shù)據(jù)從創(chuàng)建、選擇、組織、保存、存儲、獲取、使用到復(fù)用整個生命周期過程中的原理、標(biāo)準(zhǔn)、技術(shù)與方法,如田納西大學(xué)的INSC562 Digital Curation課程[13]、查爾斯特大學(xué)的INF462 Data Curation課程[8]、倫敦大學(xué)學(xué)院的INSTG064 Introduction to Digital Curation課程[14]。該課程重點講述了數(shù)字資源或科學(xué)數(shù)據(jù)長期保存涉及的保存元數(shù)據(jù)、保存技術(shù)和保存挑戰(zhàn)問題,同時分析了目前最佳保存實踐項目-機構(gòu)庫(Digital Repository)和可信賴數(shù)字倉儲(Trusted Digital Repository,TDR),從最佳實踐的案例中獲取數(shù)字資源長期保存的實踐經(jīng)驗。少數(shù)課程還探討了數(shù)字環(huán)境下科研團隊、數(shù)據(jù)中心、圖書館與存檔館等不同利益相關(guān)方如何管理數(shù)據(jù)和數(shù)字資源的版權(quán)、數(shù)據(jù)安全以及數(shù)據(jù)隱私、數(shù)據(jù)道德問題,如加州大學(xué)的262A Data Management and Practice課程[15]、德雷塞爾大學(xué)的INFO591 Data and Digital Stewardship課程[16]、阿姆斯特丹大學(xué)的ARST 556K Research Data Management for Information Professionals課程[12]。
有3所院校開設(shè)了DC認(rèn)證項目或DC培養(yǎng)方向:北卡羅來納大學(xué)的Digital Curation認(rèn)證項目[17]、北德克薩斯大學(xué)Digital Curation and Data Management認(rèn)證項目[18]、羅伯特高登大學(xué)Digital Curation培養(yǎng)方向[7]。從課程內(nèi)容標(biāo)簽看,與常規(guī)課程不同的是,系列課程中出現(xiàn)最多的標(biāo)簽是lifecycle,突出了生命周期在數(shù)據(jù)監(jiān)護中的重要性。系列課程是包括了DC理論課、DC技術(shù)課、DC應(yīng)用課3類課程在內(nèi)的具有連貫性和承接性的DC課程體系。DC理論課不僅涵蓋了常規(guī)DC課程中涉及到的數(shù)據(jù)監(jiān)護的基本概念和理論,還深入探索了共創(chuàng)環(huán)境下多源數(shù)據(jù)融合問題、數(shù)據(jù)監(jiān)護研究前沿問題;技術(shù)課主要涉及以下主題:底層數(shù)據(jù)的描述與表示,如不同學(xué)科領(lǐng)域元數(shù)據(jù)的設(shè)計與標(biāo)準(zhǔn)選取與元數(shù)據(jù)抽取技術(shù)、知識組織原理與技術(shù),信息系統(tǒng)設(shè)計與開發(fā)包含了數(shù)據(jù)存儲、數(shù)據(jù)檢索、數(shù)據(jù)獲取甚至是數(shù)據(jù)可視化呈現(xiàn)功能的信息檢索系統(tǒng)的開發(fā)與設(shè)計,數(shù)據(jù)長期保存系統(tǒng)開發(fā)工具與應(yīng)用;應(yīng)用課主要是作為認(rèn)證項目的結(jié)業(yè)課程,學(xué)生除了需要寫DC相關(guān)主題的畢業(yè)論文外,還需完成1個DC實踐項目,將所學(xué)的DC理論知識和技術(shù)知識應(yīng)用到實際項目開發(fā)與項目管理中,在實踐中深化對原理和技術(shù)的理解和運用。
數(shù)據(jù)管理生命周期模型從不同角度描述了數(shù)據(jù)從產(chǎn)生、收集、描述、存儲、發(fā)現(xiàn)、分析到再利用的整個生命周期[19]。本文結(jié)合數(shù)據(jù)監(jiān)護課程特點,將數(shù)據(jù)管理生命周期劃分為數(shù)據(jù)計劃、數(shù)據(jù)處理、數(shù)據(jù)保存和數(shù)據(jù)利用4個階段。將課程標(biāo)簽投射到數(shù)據(jù)管理生命周期理論的每一階段,獲得涉及數(shù)據(jù)管理生命周期4個不同階段的課程數(shù)量(表3)。
數(shù)據(jù)管理計劃階段作為科學(xué)數(shù)據(jù)管理生命周期中概念性的規(guī)劃設(shè)計環(huán)節(jié),對于后續(xù)的科學(xué)數(shù)據(jù)管理具有重要的指導(dǎo)作用。目前只有1個iSchools成員院校(英國羅伯特戈登大學(xué)Project Management for Digital Curation)針對數(shù)據(jù)管理計劃開設(shè)了獨立的DC課程[7],課程內(nèi)容主要涉及數(shù)據(jù)管理生命周期每個階段所包含活動的界定及項目管理政策。
數(shù)據(jù)處理階段包括從數(shù)據(jù)創(chuàng)建、數(shù)據(jù)清洗與選擇、數(shù)據(jù)描述與組織到數(shù)據(jù)分析的一系列數(shù)據(jù)處理過程。共有12門DC課程涉及數(shù)據(jù)處理階段,其中涉及數(shù)據(jù)處理階段最多的課程主題是數(shù)據(jù)的選擇與描述。并不是所有的數(shù)據(jù)都需要進行保存和監(jiān)管,只有具備真實性、準(zhǔn)確性和完整性的有價值的數(shù)據(jù)才是長期保存和管理的對象。不同類型的數(shù)字資源具有不同的元數(shù)據(jù)描述標(biāo)準(zhǔn),如何選擇合適的元數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)格式、知識表示和知識組織技術(shù)以支持后續(xù)的數(shù)據(jù)的獲取和利用,是DC課程關(guān)注的重點。
表3 DC課程內(nèi)容手工標(biāo)簽-數(shù)據(jù)管理生命周期階段映射表
從表3可看出,涉及數(shù)據(jù)保存階段的DC課程最多(24門)。數(shù)據(jù)監(jiān)護的初衷是保證有價值的科學(xué)數(shù)據(jù)在較長一段時間內(nèi)能夠得以保存,以便以后的研究人員能夠復(fù)用這些數(shù)據(jù)進行科學(xué)研究。因此,數(shù)據(jù)的長期保存是數(shù)據(jù)監(jiān)護最重要的環(huán)節(jié),DC課程的設(shè)置也說明了數(shù)據(jù)長期保存的重要性。通過分析這24門數(shù)據(jù)保存主題的DC課程內(nèi)容標(biāo)簽,發(fā)現(xiàn)這些課程主要涉及了以下主題內(nèi)容:數(shù)字資源長期保存面臨的管理、技術(shù)、社會、經(jīng)濟上的挑戰(zhàn)以及長期保存策略的制定;數(shù)字倉儲和可信賴數(shù)字倉儲的建立與認(rèn)證,包括Eprints,DSpace,Fedora,REDCap,DataVerse,Archivematica等相應(yīng)軟件工具的介紹;選擇合適的元數(shù)據(jù)類型與標(biāo)準(zhǔn)以支持?jǐn)?shù)據(jù)的獲取、管理和保存;保存數(shù)據(jù)的選擇與評估;長期保存技術(shù)如數(shù)據(jù)更新、數(shù)據(jù)遷移、數(shù)據(jù)仿真中數(shù)據(jù)完整性和準(zhǔn)確性的維持;數(shù)據(jù)長期保存中涉及的版權(quán)和數(shù)據(jù)隱私問題。
涉及數(shù)據(jù)利用階段的DC課程數(shù)量排在第二位,共19門。數(shù)據(jù)利用包括數(shù)據(jù)訪問與獲取、數(shù)據(jù)復(fù)用以及數(shù)據(jù)出版。目前所有iSchools院校都不將涉及數(shù)據(jù)利用主題的DC課程列為一門獨立課程,而是與數(shù)據(jù)保存一起納入同一門DC課程當(dāng)中。數(shù)據(jù)利用主題的DC課程主要涉及以下主題內(nèi)容:數(shù)據(jù)的訪問與獲取范圍、條件、方式和流程等,數(shù)字出版或?qū)W術(shù)出版中涉及的元數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)格式(XML)、出版工具。
對科學(xué)數(shù)據(jù)的持續(xù)、高效監(jiān)管為當(dāng)前和未來的學(xué)術(shù)、科研和教育提供了有力支撐。LIS學(xué)院作為長期以來培養(yǎng)信息管理和知識管理專業(yè)人員的搖籃,在培養(yǎng)數(shù)據(jù)管理和數(shù)據(jù)處理專業(yè)人才方面應(yīng)該承擔(dān)更多的責(zé)任。
目前iSchools成員院校的DC課程普遍關(guān)注數(shù)據(jù)保存相關(guān)問題、數(shù)據(jù)管理生命周期、數(shù)據(jù)監(jiān)護相關(guān)的標(biāo)準(zhǔn)和元數(shù)據(jù)問題,并且將現(xiàn)存的最佳實踐作為案例研究,探索實際數(shù)據(jù)監(jiān)護中面臨的問題及挑戰(zhàn)。不同國家的iSchool學(xué)院有各自偏好的課程主題。英國iSchool院校的DC課程強調(diào)對數(shù)字資源的質(zhì)量管理以及適用于數(shù)字資源長期保存與長期可獲取的信息系統(tǒng)的開發(fā)與設(shè)計;澳大利亞iSchools院校的DC課程重視對數(shù)據(jù)管理生命周期每個階段的任務(wù)和活動的梳理,并且突出了大數(shù)據(jù)時代對科學(xué)數(shù)據(jù)的管理而非寬泛的對數(shù)字資源的管理;加拿大iSchools院校的DC課程不僅十分重視OAIS模型及數(shù)據(jù)管理生命周期的學(xué)習(xí)和運用,而且對作為數(shù)字資源保存和利用的重要平臺的機構(gòu)庫也給予充分關(guān)注;荷蘭則更強調(diào)不同學(xué)科領(lǐng)域科學(xué)數(shù)據(jù)管理的需求及實踐。
目前常規(guī)DC課程所占比重較大,系列課程或者認(rèn)證課程還處于起步階段,開設(shè)的院校較少,反映出大部分iSchools學(xué)院的數(shù)據(jù)監(jiān)護教育依然以基礎(chǔ)概念和理論的梳理、最佳實踐項目的介紹為主,只有少數(shù)學(xué)院嘗試將數(shù)據(jù)監(jiān)護設(shè)為一個新的專業(yè)方向。
目前的DC課程對科學(xué)數(shù)據(jù)生命周期每個階段的理論、標(biāo)準(zhǔn)、技術(shù)、方法和工具都有涉及,說明當(dāng)前數(shù)據(jù)監(jiān)護課程教學(xué)內(nèi)容主題的范圍較廣。其中,數(shù)據(jù)的長期保存是數(shù)據(jù)監(jiān)護最重要的環(huán)節(jié)。從課程數(shù)量來看,DC課程的重點落在數(shù)據(jù)長期保存階段的相關(guān)問題上,具體主題內(nèi)容包括長期保存目前面臨的挑戰(zhàn)、元數(shù)據(jù)的選擇、保存數(shù)據(jù)的選擇與評估、長期保存技術(shù)與工具以及相關(guān)版權(quán)問題等。
國內(nèi)武漢大學(xué)、南京大學(xué)、北京大學(xué)等高校已經(jīng)意識到數(shù)據(jù)監(jiān)護專業(yè)教育迫在眉睫,并在圖書情報學(xué)院、信息資源管理學(xué)院等增設(shè)了與數(shù)據(jù)監(jiān)護相關(guān)的課程,但目前還處于起步階段[20]。國外iSchools院校數(shù)據(jù)監(jiān)護教育的蓬勃開展以及對數(shù)據(jù)監(jiān)護課程內(nèi)容主題的探索,對于我國相關(guān)高校開設(shè)數(shù)據(jù)監(jiān)護課程具有重要的啟示和借鑒意義。
2018年1月,國家標(biāo)準(zhǔn)《科學(xué)數(shù)據(jù)引用》(GB/T 35294-2017)正式發(fā)布,標(biāo)志著科學(xué)數(shù)據(jù)可以像學(xué)術(shù)論文一樣被學(xué)術(shù)同行標(biāo)準(zhǔn)化引用,這將在一定程度上促進數(shù)據(jù)擁有者開放共享其數(shù)據(jù)。越來越多的開放科學(xué)數(shù)據(jù)需要專業(yè)的數(shù)據(jù)監(jiān)護人員進行科學(xué)有效的管理,數(shù)據(jù)監(jiān)護人才需求迫切。雖然從2014年起,中國圖書館學(xué)會專業(yè)圖書館分會聯(lián)合中國科學(xué)院文獻情報中心已經(jīng)舉辦了5期科學(xué)數(shù)據(jù)管理研修班,為各界培訓(xùn)具有科學(xué)數(shù)據(jù)素養(yǎng)的專業(yè)人員,但是研修班的規(guī)模小且學(xué)習(xí)時間短,許多內(nèi)容都是淺嘗輒止,培養(yǎng)的數(shù)據(jù)監(jiān)護人才不足以滿足社會的需求。因此,加強高等院校的數(shù)據(jù)監(jiān)護專業(yè)教育迫在眉睫。相關(guān)院校也需要做好充分準(zhǔn)備,積極開展數(shù)據(jù)監(jiān)護專業(yè)教育。
目前,數(shù)據(jù)監(jiān)護領(lǐng)域已經(jīng)形成了一些較為成熟的理論、模型和元數(shù)據(jù)標(biāo)準(zhǔn)以及較大規(guī)模的科學(xué)數(shù)據(jù)管理與共享平臺,如GBIF(Global Biodiversity Information Facility),DataOne,Dryad。相關(guān)院校在開設(shè)數(shù)據(jù)監(jiān)護課程時,既要注重基礎(chǔ)理論的學(xué)習(xí),也要將現(xiàn)存的最佳實踐作為案例研究,探索實際工作中面臨的問題、挑戰(zhàn)及其解決方法。
信息組織與信息描述是LIS學(xué)院的傳統(tǒng)優(yōu)勢課程,可將其與數(shù)據(jù)監(jiān)護領(lǐng)域中涉及的數(shù)據(jù)組織、數(shù)據(jù)描述進行無縫接軌,納入數(shù)據(jù)監(jiān)護專業(yè)課程體系之中。
機構(gòu)庫和可信賴數(shù)字倉儲(TDR)是數(shù)據(jù)監(jiān)護領(lǐng)域的最佳保存實踐項目。機構(gòu)庫和TDR的開發(fā)依賴于目前流行的開源軟件,包括Eprints,DSpace,Fedora,REDCap,DataVerse,Archivematica等。不同的開源軟件各有其側(cè)重點和優(yōu)缺點,只有對主流開源軟件有了充分的了解,在實際工作中才能夠根據(jù)自身需求和實際條件,選擇合適的軟件構(gòu)建機構(gòu)庫。