楊傳汶,徐坤
基于生命周期的動(dòng)態(tài)科學(xué)數(shù)據(jù)服務(wù)模式研究
楊傳汶,徐坤
探討如何有效開(kāi)展科學(xué)數(shù)據(jù)服務(wù),通過(guò)專(zhuān)家訪談法參考專(zhuān)家意見(jiàn),借鑒國(guó)內(nèi)外相關(guān)研究和實(shí)踐,以科學(xué)數(shù)據(jù)生命周期理論為基礎(chǔ),結(jié)合科研工作流程,提出動(dòng)態(tài)科學(xué)數(shù)據(jù)服務(wù)模式,并給出漸進(jìn)開(kāi)展科學(xué)數(shù)據(jù)服務(wù)的建議。
科學(xué)數(shù)據(jù) 生命周期 動(dòng)態(tài)科學(xué)數(shù)據(jù)服務(wù)
歐美發(fā)達(dá)國(guó)家的科學(xué)數(shù)據(jù)服務(wù)發(fā)展較快,在數(shù)據(jù)開(kāi)發(fā)、檢索、存儲(chǔ)、咨詢(xún)、分析等方面取得了較好的成績(jī)。數(shù)據(jù)開(kāi)發(fā)服務(wù)主要是對(duì)科學(xué)數(shù)據(jù)進(jìn)行組織,使之更好地被共享和利用,如美國(guó)加州大學(xué)圖書(shū)館對(duì)學(xué)校實(shí)驗(yàn)室數(shù)據(jù)進(jìn)行收集和整理[1]。數(shù)據(jù)檢索服務(wù)主要是幫助用戶獲取所需數(shù)據(jù)和相關(guān)資源的信息,實(shí)現(xiàn)文獻(xiàn)資源和相關(guān)數(shù)據(jù)資源的交叉鏈接,為科學(xué)數(shù)據(jù)用戶提供系統(tǒng)服務(wù),如德國(guó)國(guó)家科技圖書(shū)館利用給數(shù)據(jù)對(duì)象分配唯一的標(biāo)識(shí)符實(shí)現(xiàn)文獻(xiàn)對(duì)科學(xué)數(shù)據(jù)的鏈接[2]。科學(xué)數(shù)據(jù)存儲(chǔ)服務(wù)是科學(xué)數(shù)據(jù)服務(wù)的重要內(nèi)容,是其他相關(guān)服務(wù)的基礎(chǔ),有效地對(duì)相關(guān)數(shù)據(jù)進(jìn)行存儲(chǔ)才能實(shí)現(xiàn)科學(xué)數(shù)據(jù)的共享和復(fù)用,如哈佛和麻省理工大學(xué)聯(lián)合建立數(shù)據(jù)中心,供本校教師進(jìn)行數(shù)據(jù)存儲(chǔ)和獲取[3]。數(shù)據(jù)咨詢(xún)服務(wù)主要是針對(duì)用戶需求,幫助用戶選擇數(shù)據(jù)知識(shí)庫(kù),協(xié)助用戶制定相應(yīng)的數(shù)據(jù)管理計(jì)劃,如麻省理工大學(xué)圖書(shū)館提供地理GIS數(shù)據(jù)、社會(huì)科學(xué)數(shù)據(jù)、生命科學(xué)數(shù)據(jù)的咨詢(xún)服務(wù)[4]??茖W(xué)數(shù)據(jù)分析服務(wù)主要是對(duì)科學(xué)數(shù)據(jù)之間的相互關(guān)系進(jìn)行分析,總結(jié)出新內(nèi)容或者發(fā)現(xiàn)相關(guān)領(lǐng)域的研究趨勢(shì),如哈佛大學(xué)Dataverse Network項(xiàng)目就提供利用SPSS和STATA對(duì)數(shù)據(jù)進(jìn)行分析服務(wù),并能對(duì)分析結(jié)果進(jìn)行下載[5]。另外,數(shù)據(jù)服務(wù)人員的教育培訓(xùn)[6]、數(shù)據(jù)服務(wù)軟件工具的開(kāi)發(fā)[7]等在國(guó)外都有較好發(fā)展。
國(guó)內(nèi)科學(xué)數(shù)據(jù)服務(wù)的研究起步較晚,但近年呈現(xiàn)蓬勃發(fā)展趨勢(shì),在CNKI上以“科學(xué)數(shù)據(jù)”為主題進(jìn)行檢索,對(duì)檢索到的相關(guān)文獻(xiàn)進(jìn)行篩選,得到科學(xué)數(shù)據(jù)相關(guān)論文篇數(shù)見(jiàn)表1(檢索時(shí)間:2015年2月27日)。
表1 CNKI科學(xué)數(shù)據(jù)相關(guān)文獻(xiàn)數(shù)量表
由檢索結(jié)果可知,科學(xué)數(shù)據(jù)一直是科研人員關(guān)心的熱點(diǎn),2013年開(kāi)始受到更多的關(guān)注和研究。從內(nèi)容看,多為對(duì)國(guó)外相關(guān)理論和經(jīng)驗(yàn)的介紹[8],洪程以東南大學(xué)研究生為對(duì)象調(diào)查科學(xué)數(shù)據(jù)需求與利用情況[9],還有一些單位做了科學(xué)數(shù)據(jù)管理上的實(shí)踐,如武漢大學(xué)的社會(huì)科學(xué)數(shù)據(jù)管理中心[10]。
從實(shí)際效果看,雖然國(guó)內(nèi)科學(xué)數(shù)據(jù)服務(wù)對(duì)科學(xué)研究產(chǎn)生了積極影響,但與歐美發(fā)達(dá)國(guó)家相比還存在差距,許多方面仍然需要完善。盡管?chē)?guó)外有較多的實(shí)踐經(jīng)驗(yàn),但由于服務(wù)對(duì)象和科研環(huán)境不同,國(guó)內(nèi)科學(xué)數(shù)據(jù)服務(wù)不可能完全照抄國(guó)外經(jīng)驗(yàn)。同時(shí)又因?yàn)閿?shù)據(jù)服務(wù)是一項(xiàng)系統(tǒng)的持續(xù)的任務(wù),有大量工作需要做,如何系統(tǒng)地開(kāi)展國(guó)內(nèi)科學(xué)數(shù)據(jù)服務(wù),具體有哪些工作需要做,這些問(wèn)題是在目前科學(xué)數(shù)據(jù)服務(wù)研究蓬勃發(fā)展的情況下亟待解決的,需要一個(gè)有效合理的科學(xué)數(shù)據(jù)服務(wù)模式來(lái)指導(dǎo)科學(xué)數(shù)據(jù)服務(wù)的具體實(shí)踐,以促進(jìn)科學(xué)數(shù)據(jù)服務(wù)更好實(shí)施。基于此,本文參考國(guó)內(nèi)外相關(guān)研究和實(shí)踐,結(jié)合科學(xué)數(shù)據(jù)生命周期和科研過(guò)程,提出覆蓋整個(gè)科學(xué)數(shù)據(jù)生命周期的動(dòng)態(tài)科學(xué)數(shù)據(jù)服務(wù)模式,并對(duì)科學(xué)數(shù)據(jù)服務(wù)實(shí)施提出建議。
構(gòu)建動(dòng)態(tài)科學(xué)數(shù)據(jù)服務(wù)模式需要正確理解科研過(guò)程和其所需數(shù)據(jù)服務(wù),為此,本研究在參考相關(guān)研究文獻(xiàn)的基礎(chǔ)上,于2014年10月對(duì)相關(guān)專(zhuān)家進(jìn)行訪談。訪談過(guò)程如下:
(1)擬定訪談提綱。除介紹訪談目的、意義、匿名保證等基礎(chǔ)項(xiàng)目外,還需參考相關(guān)研究文獻(xiàn),從中抽取整理科研過(guò)程、科學(xué)數(shù)據(jù)生命周期等知識(shí),訪談人員要熟悉相關(guān)內(nèi)容,保證訪談過(guò)程中與專(zhuān)家有良好的互動(dòng)交流。訪談提綱可在與專(zhuān)家訪談后進(jìn)一步完善,以利于后續(xù)訪談取得更好的效果。
(2)選擇專(zhuān)家。為使訪談?dòng)行нM(jìn)行,筆者從吉林醫(yī)藥學(xué)院選擇訪談對(duì)象,包括臨床醫(yī)學(xué)、檢驗(yàn)、口腔影像、藥學(xué)等科學(xué)數(shù)據(jù)產(chǎn)出較多的專(zhuān)業(yè)。首先由筆者工作部門(mén)領(lǐng)導(dǎo)與相關(guān)院長(zhǎng)溝通,而后院長(zhǎng)推薦專(zhuān)家,保證訪談工作順利進(jìn)行。在被訪談的40名專(zhuān)家中,教授25人,副教授12人,均曾主持過(guò)省級(jí)以上科研項(xiàng)目或者是項(xiàng)目的主要完成人,了解和掌握科研過(guò)程,對(duì)數(shù)據(jù)服務(wù)具有較高需求,其中3名是中級(jí)職稱(chēng),主要從事實(shí)驗(yàn)室實(shí)驗(yàn)工作,日常工作中科學(xué)數(shù)據(jù)接觸頻繁,對(duì)科學(xué)數(shù)據(jù)服務(wù)需求內(nèi)容較了解。因?yàn)楸辉L談人員均由各個(gè)學(xué)院院長(zhǎng)選擇推薦,在科研過(guò)程、科學(xué)數(shù)據(jù)服務(wù)需求內(nèi)容等方面的意見(jiàn)具有一定代表性,能夠?qū)ο嚓P(guān)內(nèi)容做出較真實(shí)的反應(yīng)。
(3)進(jìn)行訪談。訪談地點(diǎn)雙方約定,保證不受外界干擾,一般宜選擇小型會(huì)議室。首先記錄專(zhuān)家的性別、年齡、專(zhuān)業(yè)、學(xué)歷、研究方向等基本信息,使用錄音筆需經(jīng)專(zhuān)家同意。訪談內(nèi)容按照提綱順序進(jìn)行,注意訪談過(guò)程與專(zhuān)家進(jìn)行適度互動(dòng),主要是介紹和解釋相關(guān)研究成果中的科研過(guò)程、科學(xué)數(shù)據(jù)生命周期等內(nèi)容,同時(shí)在訪談過(guò)程中保證對(duì)訪談核心問(wèn)題理解的全面性與深刻性。訪談時(shí)間一般在30分鐘左右,訪談結(jié)束后請(qǐng)專(zhuān)家核實(shí)記錄內(nèi)容。
(4)訪談結(jié)果分析整理。整理專(zhuān)家訪談結(jié)果,再選擇10名被訪談教授對(duì)結(jié)果進(jìn)行修正和確認(rèn),最終得到一般科研過(guò)程和科學(xué)數(shù)據(jù)生命周期。
科研過(guò)程一般包括如下步驟:①制定計(jì)劃,設(shè)計(jì)如何實(shí)施整個(gè)科研項(xiàng)目;②進(jìn)行實(shí)驗(yàn),采用相關(guān)的儀器設(shè)備采用相關(guān)的方法進(jìn)行實(shí)驗(yàn);③收集數(shù)據(jù),對(duì)實(shí)驗(yàn)過(guò)程中所產(chǎn)生的數(shù)據(jù)進(jìn)行收集整理;④解釋與分析,將整理好的數(shù)據(jù)進(jìn)行加工,分析其相互關(guān)系;⑤得出結(jié)論,整理分析結(jié)果,得到相應(yīng)結(jié)論;⑥表達(dá)與交流,對(duì)結(jié)論進(jìn)行合適的表達(dá),與其他科研人員交流;⑦評(píng)價(jià)與改進(jìn),在交流過(guò)程中對(duì)結(jié)論進(jìn)行評(píng)價(jià),改進(jìn)不夠理想的地方。
在科研活動(dòng)中,科學(xué)數(shù)據(jù)由最初創(chuàng)建的初始數(shù)據(jù),經(jīng)過(guò)科研人員的解釋和處理形成中間數(shù)據(jù),并進(jìn)行存儲(chǔ)管理、復(fù)用,最后隨著研究的進(jìn)展將數(shù)據(jù)發(fā)布整理結(jié)果數(shù)據(jù),再被其他研究所引用,形成這樣一個(gè)生命周期過(guò)程。各研究機(jī)構(gòu)和學(xué)者給出了不同的數(shù)據(jù)生命周期模型,如英國(guó)的Data Archive項(xiàng)目把數(shù)據(jù)生命周期分成6個(gè)階段[11],澳大利亞國(guó)家數(shù)據(jù)服務(wù)項(xiàng)目將數(shù)據(jù)監(jiān)護(hù)分成了創(chuàng)造、存儲(chǔ)、描述、標(biāo)識(shí)、登記、獲取、檢索、開(kāi)發(fā)等8個(gè)環(huán)節(jié)。在與專(zhuān)家有效溝通上述科學(xué)數(shù)據(jù)生命周期的情況下,獲取專(zhuān)家對(duì)科學(xué)數(shù)據(jù)生命周期的設(shè)置建議,經(jīng)整理后將科學(xué)數(shù)據(jù)分為計(jì)劃、生產(chǎn)、保存、篩選、存儲(chǔ)、利用、更新等7個(gè)階段,在每個(gè)階段所需進(jìn)行的工作內(nèi)容也不相同,具體如下:
①計(jì)劃:進(jìn)行科研工作前須有周密計(jì)劃,在計(jì)劃階段設(shè)計(jì)好數(shù)據(jù)生命周期每個(gè)階段的任務(wù)和需注意的問(wèn)題,能使科學(xué)數(shù)據(jù)服務(wù)實(shí)施更加容易和可靠,同時(shí)讓相關(guān)人員清楚自己的任務(wù),保證工作有效地開(kāi)展。對(duì)科學(xué)數(shù)據(jù)而言,要滿足后續(xù)的數(shù)據(jù)存儲(chǔ)和共享復(fù)用,需要針對(duì)本學(xué)科并兼顧科學(xué)數(shù)據(jù)的跨系統(tǒng)應(yīng)用做好科學(xué)數(shù)據(jù)的元數(shù)據(jù)模板,明確需要記錄的內(nèi)容,以及應(yīng)以怎樣的方式對(duì)記錄進(jìn)行有效組織,方便科學(xué)數(shù)據(jù)在不同的系統(tǒng)中處理和利用。
②生產(chǎn):做詳細(xì)計(jì)劃后是實(shí)施科研工作,在這個(gè)過(guò)程中科研人員利用自己的專(zhuān)業(yè)知識(shí),參考其他相關(guān)知識(shí)和數(shù)據(jù),進(jìn)行科學(xué)研究,利用科學(xué)數(shù)據(jù)元數(shù)據(jù)模板記錄科學(xué)研究產(chǎn)出的數(shù)據(jù)。由于科研人員在查找資料和相關(guān)數(shù)據(jù)上要花費(fèi)大量的時(shí)間和精力,他們需要更專(zhuān)業(yè)的人員和機(jī)構(gòu)為他們提供相關(guān)服務(wù),基于國(guó)內(nèi)科學(xué)數(shù)據(jù)交流與共享的實(shí)際情況,對(duì)科學(xué)數(shù)據(jù)的服務(wù)需求更為明顯。
③保存:科研過(guò)程生產(chǎn)的科學(xué)數(shù)據(jù)存入臨時(shí)存儲(chǔ)系統(tǒng),為進(jìn)一步研究使用。這些原始數(shù)據(jù)來(lái)自于科研人員的研究項(xiàng)目,不同的研究人員對(duì)同一數(shù)據(jù)可能產(chǎn)生不同的想法,進(jìn)而產(chǎn)出新的研究成果,這就是科學(xué)數(shù)據(jù)的增值性特點(diǎn)。即使是錯(cuò)誤的或者失敗的數(shù)據(jù)對(duì)避免同類(lèi)錯(cuò)誤發(fā)生也具有重要的借鑒價(jià)值。而科研人員保存數(shù)據(jù)的情況亟待改進(jìn),目前,這些數(shù)據(jù)多數(shù)是零散的以表格的形式存在于計(jì)算機(jī)中,缺乏安全機(jī)制,數(shù)據(jù)丟失情況嚴(yán)重,更不利于數(shù)據(jù)的復(fù)用和共享,科研人員急需專(zhuān)業(yè)的服務(wù)將他們從不太合格的數(shù)據(jù)管理員的角色中解放出來(lái)。
④篩選:由于科研實(shí)驗(yàn)產(chǎn)生大量的原始數(shù)據(jù)、中間數(shù)據(jù)和結(jié)果數(shù)據(jù),鑒于科學(xué)數(shù)據(jù)存儲(chǔ)需要花費(fèi)一定的人力物力,并不是所有的原始數(shù)據(jù)都需要進(jìn)行存儲(chǔ),只需要對(duì)原始數(shù)據(jù)進(jìn)行篩選,選出具有長(zhǎng)期存儲(chǔ)價(jià)值的數(shù)據(jù),這個(gè)過(guò)程需要同行的參與,在與其他研究人員充分交流的基礎(chǔ)上篩選的數(shù)據(jù)才能更好的保證有用的數(shù)據(jù)不被誤刪,發(fā)揮其應(yīng)有價(jià)值。而要實(shí)現(xiàn)這一目標(biāo)需要有一個(gè)合適的交流平臺(tái),既能保證數(shù)據(jù)交流,又能保證數(shù)據(jù)的安全。
⑤存儲(chǔ):將篩選出的科學(xué)數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)中心,讓更多的科研人員復(fù)用和與其他科研人員共享交流,并做好備份工作。共享和交流最多的是結(jié)果數(shù)據(jù),但因?yàn)楦鞣N原因結(jié)果數(shù)據(jù)往往不夠完整,并且加入了研究人員的主觀因素,導(dǎo)致復(fù)用數(shù)據(jù)的人員對(duì)科學(xué)數(shù)據(jù)產(chǎn)生誤解和誤用。因此,存儲(chǔ)數(shù)據(jù)需要將更加完整的原始數(shù)據(jù)和中間數(shù)據(jù)也以不同的版本存儲(chǔ),這樣科研人員可根據(jù)需要對(duì)數(shù)據(jù)進(jìn)行較好的利用,減少因誤解而造成的錯(cuò)誤。信息組織不是科研人員的專(zhuān)長(zhǎng),需要專(zhuān)業(yè)的服務(wù)技術(shù)幫助他們實(shí)現(xiàn)科學(xué)數(shù)據(jù)的有效組織,發(fā)揮科學(xué)數(shù)據(jù)的最大價(jià)值。
⑥利用:數(shù)據(jù)中心的科學(xué)數(shù)據(jù)應(yīng)可較方便地為科研人員提供檢索、下載等服務(wù),根據(jù)需要,還可以進(jìn)行數(shù)據(jù)分析等高級(jí)應(yīng)用服務(wù),這部分一般是科研數(shù)據(jù)創(chuàng)建者已經(jīng)完成科研工作,將數(shù)據(jù)完全公開(kāi)在科學(xué)數(shù)據(jù)中心,由科學(xué)數(shù)據(jù)中心向其他科研人員提供服務(wù)。
⑦更新:因?yàn)榭茖W(xué)數(shù)據(jù)是動(dòng)態(tài)存在的,在被其他科研人員共享復(fù)用的過(guò)程中可能不斷對(duì)原有數(shù)據(jù)進(jìn)行完善和更新,并且這一過(guò)程可能多次出現(xiàn),科學(xué)數(shù)據(jù)服務(wù)中應(yīng)該能夠提供該項(xiàng)功能,如果不是數(shù)據(jù)創(chuàng)建者本人對(duì)數(shù)據(jù)更新,應(yīng)該提供便利的溝通渠道,使雙方對(duì)數(shù)據(jù)更新達(dá)成一致意見(jiàn),以保證數(shù)據(jù)的質(zhì)量和數(shù)據(jù)不被濫用。
科學(xué)數(shù)據(jù)經(jīng)歷一個(gè)從創(chuàng)建到更新,再到其它研究繼續(xù)應(yīng)用進(jìn)而產(chǎn)生新的科學(xué)數(shù)據(jù)的一個(gè)動(dòng)態(tài)的循環(huán)過(guò)程,并且與科研過(guò)程緊密相聯(lián)。通過(guò)調(diào)研得知在科學(xué)數(shù)據(jù)生命周期的每個(gè)階段都需要不同的科學(xué)數(shù)據(jù)服務(wù),并且服務(wù)隨著科研過(guò)程的推進(jìn)而動(dòng)態(tài)變化著,其在科研活動(dòng)過(guò)程中的周期如圖1。
圖1 科研活動(dòng)中科學(xué)數(shù)據(jù)的生命周期圖
由圖1可知,科學(xué)數(shù)據(jù)在科研過(guò)程中不是一成不變的,可能會(huì)經(jīng)過(guò)若干次的利用和修正,在利用中被不斷更新和完善,是一個(gè)循環(huán)上升的過(guò)程,不但如此,一個(gè)科研項(xiàng)目雖然結(jié)束,其數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)平臺(tái)還可以被其他項(xiàng)目所應(yīng)用,繼續(xù)發(fā)揮其更大的價(jià)值,這也正是進(jìn)行科學(xué)數(shù)據(jù)服務(wù)的目的所在。
在確定科研工作流程與數(shù)據(jù)生命周期的基礎(chǔ)上,將第一輪訪談中專(zhuān)家建議的服務(wù)基于生命周期進(jìn)行分類(lèi)整理,如計(jì)劃階段需要哪些數(shù)據(jù)服務(wù),本研究采用德?tīng)柗品ǖ睦砟钸x擇15名教授(包括做確認(rèn)的10名)進(jìn)行了三輪調(diào)查,對(duì)所調(diào)查內(nèi)容專(zhuān)家們具有較高的收斂度,整理后得出動(dòng)態(tài)科學(xué)數(shù)據(jù)服務(wù)模式,如圖2所示。在此模式下,數(shù)據(jù)服務(wù)人員參與整個(gè)科學(xué)數(shù)據(jù)生命周期,在不同階段提供不同服務(wù),使數(shù)據(jù)服務(wù)形成一個(gè)動(dòng)態(tài)的有機(jī)的整體,保證科學(xué)數(shù)據(jù)的完整性,避免數(shù)據(jù)描述不全而造成的理解上的誤解,更有利于科學(xué)數(shù)據(jù)被有效共享復(fù)用或者二次開(kāi)發(fā),發(fā)揮科學(xué)數(shù)據(jù)的最大價(jià)值。動(dòng)態(tài)科學(xué)數(shù)據(jù)服務(wù)模式要求科學(xué)數(shù)據(jù)服務(wù)人員與科研人員密切合作,對(duì)提高科研人員的數(shù)據(jù)信息素養(yǎng)具有重要意義,能更有效地促進(jìn)科研人員共享科學(xué)數(shù)據(jù),發(fā)揮科學(xué)數(shù)據(jù)的最大價(jià)值,提高科研效率。
動(dòng)態(tài)科學(xué)數(shù)據(jù)服務(wù)模式需要具有以下特點(diǎn):
①科學(xué)數(shù)據(jù)服務(wù)內(nèi)容的整體性。動(dòng)態(tài)科學(xué)數(shù)據(jù)服務(wù)模式基于科研工作過(guò)程和科學(xué)數(shù)據(jù)生命周期,覆蓋科研過(guò)程的各個(gè)階段,針對(duì)科學(xué)數(shù)據(jù)的整個(gè)生命周期對(duì)科研人員提供科學(xué)數(shù)據(jù)服務(wù)。
②科學(xué)數(shù)據(jù)服務(wù)的動(dòng)態(tài)性與及時(shí)性。動(dòng)態(tài)科學(xué)數(shù)據(jù)服務(wù)模式不但要覆蓋科研過(guò)程的各個(gè)階段,同時(shí)還要根據(jù)科研人員的工作的動(dòng)態(tài)需要及時(shí)地為科研工作提供服務(wù)。
③以科研用戶為中心。從科研人員進(jìn)行科研計(jì)劃、資料搜集到科研工作的進(jìn)行、科研成果的存儲(chǔ)與利用,數(shù)據(jù)服務(wù)人員要提供相應(yīng)的數(shù)據(jù)服務(wù),如幫助科研人員制定科學(xué)數(shù)據(jù)管理計(jì)劃、幫助科研人員搜集相關(guān)科學(xué)數(shù)據(jù)、有效組織存儲(chǔ)數(shù)據(jù)、利用數(shù)據(jù)服務(wù)等,做到按照科研人員的需求,并以科研人員的科研活動(dòng)為重心為科研人員提供科學(xué)數(shù)據(jù)服務(wù)。
圖2 動(dòng)態(tài)科學(xué)數(shù)據(jù)服務(wù)模式圖
④完整存儲(chǔ)科學(xué)數(shù)據(jù)。動(dòng)態(tài)科學(xué)數(shù)據(jù)服務(wù)強(qiáng)調(diào)對(duì)整個(gè)科學(xué)數(shù)據(jù)生命周期進(jìn)行服務(wù),能夠?qū)茖W(xué)數(shù)據(jù)的各階段的狀態(tài)做及時(shí)準(zhǔn)確的存儲(chǔ),并由專(zhuān)業(yè)的信息組織人員與相關(guān)領(lǐng)域人員共同完成,既保證數(shù)據(jù)的準(zhǔn)確完整性,又能保證數(shù)據(jù)的長(zhǎng)期可用,避免因數(shù)據(jù)描述不全而造成的理解上的誤解。
⑤有效提高相關(guān)人員的能力。動(dòng)態(tài)科學(xué)數(shù)據(jù)服務(wù)要求科研人員與數(shù)據(jù)服務(wù)人員合作,不但保證數(shù)據(jù)管理與應(yīng)用的有效實(shí)施,同時(shí)對(duì)科研人員的數(shù)據(jù)信息素養(yǎng)和數(shù)據(jù)服務(wù)人員的專(zhuān)業(yè)知識(shí)的提高都有幫助,為科研人員與數(shù)據(jù)服務(wù)人員進(jìn)一步合作打下良好基礎(chǔ),使得數(shù)據(jù)服務(wù)形成良性循環(huán)。
⑥持續(xù)提供科學(xué)數(shù)據(jù)服務(wù)。隨著科研項(xiàng)目的結(jié)題,一個(gè)科學(xué)數(shù)據(jù)生命周期完結(jié),但相關(guān)科學(xué)數(shù)據(jù)還會(huì)繼續(xù)被共享重用,發(fā)揮價(jià)值,進(jìn)入到另一個(gè)科研過(guò)程中??茖W(xué)數(shù)據(jù)服務(wù)也一樣繼續(xù)為其他項(xiàng)目提供服務(wù),這一過(guò)程并非簡(jiǎn)單的循環(huán),無(wú)論是科研過(guò)程還是科學(xué)數(shù)據(jù)服務(wù),都是一種螺旋式上升的過(guò)程。
動(dòng)態(tài)科學(xué)數(shù)據(jù)服務(wù)模式不僅是一個(gè)有機(jī)整體,同時(shí)也是一個(gè)復(fù)雜的工程,基于當(dāng)前的實(shí)際情況,想要在短時(shí)間內(nèi)實(shí)施所有動(dòng)態(tài)科學(xué)數(shù)據(jù)服務(wù)內(nèi)容是不現(xiàn)實(shí)的,應(yīng)采用漸進(jìn)式的方法,逐步實(shí)施?;谏鲜隹茖W(xué)數(shù)據(jù)服務(wù)模式的特點(diǎn)要求,如下幾個(gè)方面的工作需要開(kāi)展。
3.1 培訓(xùn)數(shù)據(jù)服務(wù)人員
優(yōu)秀的科學(xué)數(shù)據(jù)服務(wù)人員是動(dòng)態(tài)科學(xué)數(shù)據(jù)服務(wù)實(shí)施的重要保障。從相關(guān)計(jì)劃的制定到數(shù)據(jù)的動(dòng)態(tài)存儲(chǔ),再到科學(xué)數(shù)據(jù)的交流復(fù)用,在整個(gè)動(dòng)態(tài)的科研過(guò)程的各個(gè)環(huán)節(jié)中,需要不同的科學(xué)數(shù)據(jù)服務(wù),這要求動(dòng)態(tài)科學(xué)數(shù)據(jù)服務(wù)模式下的服務(wù)人員具有良好的服務(wù)水平,需要具有信息組織知識(shí)和所服務(wù)學(xué)科的專(zhuān)業(yè)知識(shí)雙重能力,針對(duì)以上特點(diǎn),國(guó)外開(kāi)設(shè)了相關(guān)的教育和培訓(xùn)。而國(guó)內(nèi)科學(xué)數(shù)據(jù)服務(wù)以信息人員為主,缺少必要的專(zhuān)業(yè)知識(shí)。有些科研團(tuán)體設(shè)置相關(guān)數(shù)據(jù)管理崗位,由科研人員自己進(jìn)行相關(guān)服務(wù),而科研人員又相對(duì)缺少信息組織方面的知識(shí)。比如近年來(lái)吉林醫(yī)藥學(xué)院圖書(shū)館優(yōu)先培訓(xùn)學(xué)科館員,使學(xué)科館員嵌入科研過(guò)程,從科研計(jì)劃階段開(kāi)始參與科研活動(dòng),負(fù)責(zé)相關(guān)資料的搜集整理服務(wù),協(xié)助制定數(shù)據(jù)管理計(jì)劃和針對(duì)學(xué)科特點(diǎn)制定元數(shù)據(jù)模型,對(duì)科學(xué)數(shù)據(jù)進(jìn)行有效組織,1年后3名學(xué)科館員的領(lǐng)域知識(shí)明顯提高,較好地融入學(xué)院科研團(tuán)隊(duì),科學(xué)數(shù)據(jù)服務(wù)能力顯著增強(qiáng)。同時(shí),嵌入學(xué)科館員科研團(tuán)隊(duì)科研人員的信息素養(yǎng)也顯著提高,在數(shù)據(jù)搜集整理和管理利用上的技能明顯進(jìn)步。
3.2 提高科研人員數(shù)據(jù)信息素養(yǎng)
在動(dòng)態(tài)科研過(guò)程中,科研人員的數(shù)據(jù)服務(wù)需求也是動(dòng)態(tài)變化的,單憑科學(xué)數(shù)據(jù)服務(wù)人員很難有效滿足其需求,不斷提高科研人員的數(shù)據(jù)信息素養(yǎng)對(duì)滿足科研人員不斷變化的科學(xué)數(shù)據(jù)服務(wù)需求具有一定積極作用。目前科研人員搜集傳統(tǒng)文獻(xiàn)資源的信息素養(yǎng)已經(jīng)具備一定水準(zhǔn)[12-13],但由于科學(xué)數(shù)據(jù)服務(wù)是近年來(lái)的一個(gè)新興領(lǐng)域,限于相關(guān)機(jī)構(gòu)或者部門(mén)所提供的科學(xué)數(shù)據(jù)服務(wù)宣傳不夠,以及科研人員出于數(shù)據(jù)安全等因素對(duì)自己所創(chuàng)建科學(xué)數(shù)據(jù)的保護(hù)行為,在數(shù)據(jù)信息素養(yǎng)上離滿足科研人員的科研工作需求還有較大差距,需要進(jìn)行相關(guān)的培訓(xùn)干預(yù)來(lái)提高科研人員的數(shù)據(jù)信息素養(yǎng)。例如近年來(lái)吉林醫(yī)藥學(xué)院圖書(shū)館開(kāi)展了科學(xué)數(shù)據(jù)相關(guān)研究講座、國(guó)內(nèi)外數(shù)據(jù)資源介紹、科研數(shù)據(jù)相關(guān)政策學(xué)習(xí)等講座,對(duì)提高科研人員數(shù)據(jù)信息素養(yǎng)起到了一定效果,使相關(guān)科研人員的數(shù)據(jù)獲取能力、數(shù)據(jù)共享態(tài)度等發(fā)生了積極轉(zhuǎn)變。
3.3 選擇組織部門(mén)
在服務(wù)過(guò)程中會(huì)涉及多個(gè)部門(mén),如信息組織部門(mén)、資源管理部門(mén)、科研部門(mén),它們之間需要協(xié)作才能更好地進(jìn)行科學(xué)數(shù)據(jù)服務(wù)。在高校,圖書(shū)館是科學(xué)數(shù)據(jù)服務(wù)較理想的組織部門(mén),與科研處和各院系協(xié)作完成科學(xué)數(shù)據(jù)服務(wù)。圖書(shū)館具有信息服務(wù)的經(jīng)驗(yàn)和人員,與學(xué)校各個(gè)院系部門(mén)建立了長(zhǎng)期的服務(wù)關(guān)系,在此基礎(chǔ)上進(jìn)行科學(xué)數(shù)據(jù)服務(wù),只是對(duì)信息服務(wù)的升級(jí)和細(xì)化,在技術(shù)、組織和協(xié)調(diào)上都能較好完成服務(wù)任務(wù)。吉林醫(yī)藥學(xué)院圖書(shū)館組織實(shí)施科學(xué)數(shù)據(jù)服務(wù)1年時(shí)間以來(lái),在資源、技術(shù)和部門(mén)間組織協(xié)調(diào)上未出現(xiàn)特殊困難,保證了科學(xué)數(shù)據(jù)服務(wù)有效實(shí)施。以一個(gè)部門(mén)為主導(dǎo)對(duì)科學(xué)數(shù)據(jù)服務(wù)進(jìn)行有效組織,協(xié)調(diào)多部門(mén)共同協(xié)作,能夠保證科學(xué)數(shù)據(jù)服務(wù)的動(dòng)態(tài)性和及時(shí)性,有利于科學(xué)數(shù)據(jù)服務(wù)的持續(xù)發(fā)展。
3.4 利用和開(kāi)發(fā)相關(guān)軟件
在科學(xué)數(shù)據(jù)服務(wù)的不同階段,有針對(duì)性的利用相關(guān)計(jì)算機(jī)軟件對(duì)相關(guān)科學(xué)數(shù)據(jù)進(jìn)行組織與管理,使科學(xué)數(shù)據(jù)資源有效數(shù)字化,提高科學(xué)數(shù)據(jù)的安全性和可重用性。目前主要開(kāi)發(fā)了一個(gè)科學(xué)數(shù)據(jù)存儲(chǔ)系統(tǒng),功能上還只是實(shí)現(xiàn)簡(jiǎn)單的存儲(chǔ)和檢索展示,基本滿足科研人員的數(shù)據(jù)日常管理需求,對(duì)科學(xué)數(shù)據(jù)進(jìn)一步的利用和開(kāi)發(fā)需要繼續(xù)完善相關(guān)軟件,如輔助制定科學(xué)數(shù)據(jù)管理計(jì)劃、元數(shù)據(jù)構(gòu)建、科學(xué)數(shù)據(jù)的關(guān)聯(lián)化組織管理等功能還待開(kāi)發(fā)。
3.5 搭建數(shù)據(jù)交流與共享平臺(tái)
盡管動(dòng)態(tài)科學(xué)數(shù)據(jù)服務(wù)各個(gè)階段內(nèi)容不盡相同,但最終目標(biāo)都是使科學(xué)數(shù)據(jù)被更好的利用和發(fā)揮更大的價(jià)值,有效的交流平臺(tái)是實(shí)現(xiàn)這一目標(biāo)的途徑。在大數(shù)據(jù)背景下,科學(xué)數(shù)據(jù)已經(jīng)成了科研人員之間交流的一項(xiàng)主要內(nèi)容,而科研人員之間現(xiàn)在能夠方便獲取的數(shù)據(jù)還僅限于所發(fā)表成果中的結(jié)果數(shù)據(jù),而對(duì)這些結(jié)果數(shù)據(jù)具有重要支持作用的初始數(shù)據(jù)和中間數(shù)據(jù)的獲取則較困難。產(chǎn)生這種情況的主要原因之一是缺少方便科研人員進(jìn)行交流和共享數(shù)據(jù)的平臺(tái)。目前的科學(xué)數(shù)據(jù)平臺(tái)多以數(shù)據(jù)存儲(chǔ)為主,所存儲(chǔ)內(nèi)容多為基礎(chǔ)數(shù)據(jù)和結(jié)果數(shù)據(jù),對(duì)初始數(shù)據(jù)和中間數(shù)據(jù)未見(jiàn)有相關(guān)處理方法。同時(shí)鑒于科學(xué)數(shù)據(jù)具有重要價(jià)值,交流共享當(dāng)中如何才能保證數(shù)據(jù)創(chuàng)建者的利益不被損害,就需要有一個(gè)好的政策平臺(tái)來(lái)保證。鑒于技術(shù)、資源、政策等原因,目前平臺(tái)還未能成功搭建,吉林醫(yī)藥學(xué)院圖書(shū)館將進(jìn)一步完善相關(guān)工作,由于任務(wù)的復(fù)雜性和艱巨性,只能漸進(jìn)地實(shí)施。
科學(xué)數(shù)據(jù)服務(wù)是一項(xiàng)重要又復(fù)雜的工程,本文在參考相關(guān)文獻(xiàn)的基礎(chǔ)上,利用專(zhuān)家調(diào)查法、問(wèn)卷調(diào)查法等研究方法,結(jié)合科學(xué)數(shù)據(jù)生命周期理論與科研工作流程,提出動(dòng)態(tài)科學(xué)數(shù)據(jù)服務(wù)模式,并給出科學(xué)數(shù)據(jù)服務(wù)動(dòng)態(tài)實(shí)施的建議,為科學(xué)數(shù)據(jù)服務(wù)開(kāi)展提供參考。由于時(shí)間、人力、技術(shù)等因素,加之科學(xué)數(shù)據(jù)服務(wù)本身的復(fù)雜性和長(zhǎng)期性,對(duì)科學(xué)數(shù)據(jù)服務(wù)細(xì)節(jié)研究不夠深入,深層次的科學(xué)數(shù)據(jù)服務(wù)也沒(méi)能有效開(kāi)展,這是本研究的不足,也是下一步需要繼續(xù)研究的方向。
[1]UC Berkeley's Principal Archive of Social Science Data [EB/OL].[2015-03-09].http://ucdata.berkeley.edu/.
[2]Lautenschlager M,Hock H,Brase J.Publication and Citation of Scientific Primary Data at WDC Climate [EB/OL].[2015-03-09].http://colab.mpdl.mpg.de/ mediawiki/images/3/30/ESci08_Sem_1_Primary_data_ registration_Lautenschlager.pdf.
[3]Harvard-MIT Data Center[EB/OL].[2015-03-09]. http://hmdc.harvard.edu/.
[4]Lincoln Laboratory Grid(LLGrid)[EB/OL].[2015-03-10].http://www.ll.mit.edu/news/llgrid.html.
[5]An Open-source Application for Publishing,Citing and DiscoveringResearch Data[EB/OL].[2015-03-10]. http://thedata.org/book/features.
[6]陳清文.美國(guó)Data Curation職業(yè)教育研究綜述及啟示[J].情報(bào)理論與實(shí)踐,2015(1):135-138.
[7]Digital Research and Curation Center[EB/OL].[2015-03-10].http://ldp.library.jhu.edu/dkc.
[8]馬建玲,祝忠明,王楠楊.美國(guó)高校圖書(shū)館參與研究數(shù)據(jù)管理服務(wù)研究[J].圖書(shū)情報(bào)工作,2012(11):77-82.
[9]洪程,錢(qián)鵬.高校研究生科學(xué)數(shù)據(jù)需求與利用行為調(diào)查分析[J].國(guó)家圖書(shū)館學(xué)刊,2014(1):17-21.
[10]項(xiàng)英,賴(lài)劍菲,丁寧.高校圖書(shū)館科學(xué)數(shù)據(jù)管理服務(wù)實(shí)踐探索——以武漢大學(xué)社會(huì)科學(xué)數(shù)據(jù)管理為例[J].情報(bào)理論與實(shí)踐,2013(12):89-93.
[11]Keeping Research Data Safe:A Cost Model and Guidance for UK Universities[EB/OL].[2014-05-19].http://www.jisc.ac.uk/media/documents/publications/keepingresearchdatasafe0408.pdf.
[12]徐秀秀,楊寅華,尚珊珊.上海地區(qū)一般本科高校圖書(shū)館學(xué)科服務(wù)工作探究[J].圖書(shū)情報(bào)工作,2014(23):117-121,125.
[13]沈婷婷.數(shù)據(jù)素養(yǎng)及其對(duì)科學(xué)數(shù)據(jù)管理的影響[J].圖書(shū)館論壇,2015(1):68-73.
Study of Dynamic Scientific Data Service Model Based on Life Cycle
YANG Chuan-wen,XU Kun
In order to discuss how to effectively carry out the scientific data service,after consulting the experts and taking the domestic and foreign relevant researches and practices for reference,a dynamic scientific data service model is proposed on the basis of scientific data life cycle theory,combined with the process of scientific research work.At the same time,suggestions are given on how to carry out scientific data services gradually.
scientific data;life cycle;dynamic scientific data services
格式 楊傳汶,徐坤.基于生命周期的動(dòng)態(tài)科學(xué)數(shù)據(jù)服務(wù)模式研究[J].圖書(shū)館論壇,2015(10):82-87.
楊傳汶(1973-),男,三峽大學(xué)圖書(shū)館館員;徐坤(1979-),男,吉林大學(xué)公共衛(wèi)生學(xué)院博士研究生。
2015-04-07