韓金鳳
(廣東技術(shù)師范大學(xué) 圖書館,廣東 廣州 510665)
21 世紀初,科學(xué)發(fā)現(xiàn)步入數(shù)據(jù)密集型為特征的“第四范式時代”,科研數(shù)據(jù)成為推動科技創(chuàng)新的重要戰(zhàn)略資源,如何有效管理、保存和共享數(shù)據(jù)已成為全球科研人員共同關(guān)注的問題.在數(shù)據(jù)與需求的雙重驅(qū)動下,圖書館積極開發(fā)科研數(shù)據(jù)管理服務(wù),為科研人員提供數(shù)據(jù)管理技能、技術(shù)和工具的支持.科研數(shù)據(jù)管理需求調(diào)研是圖書館開展數(shù)據(jù)管理服務(wù)的首要環(huán)節(jié),可幫助高校了解科研人員的數(shù)據(jù)管理實踐情況,明確其數(shù)據(jù)管理需求,為圖書館拓展數(shù)據(jù)管理服務(wù)與教育提供新思路.
科研數(shù)據(jù)管理需求調(diào)查進入學(xué)者和圖書館的研究視野并得到廣泛關(guān)注,目前國內(nèi)外在這個領(lǐng)域已取得許多成果.雖然調(diào)研范圍和調(diào)研對象各不相同,但都聚焦于揭示科研人員數(shù)據(jù)管理需求的共性.其中,機構(gòu)層面的數(shù)據(jù)管理需求調(diào)研最為常見,主要確定位于特定機構(gòu)研究人員的共性需求[1-2],而不關(guān)注因?qū)W科、身份等因素形成的個性化需求.部分研究則專注于特定學(xué)科(如農(nóng)學(xué)[3]、社會科學(xué)[4])研究人員的數(shù)據(jù)管理行為和需求.還有針對跨機構(gòu)多學(xué)科的研究人員開展的大規(guī)模調(diào)研,如DataONE 評估小組在2009—2010 年[5]和2013—2014 年[6]對千余名科學(xué)家進行的數(shù)據(jù)管理實踐調(diào)查.以上三種類型的調(diào)研都面向多層次的科研人員,而另一些研究則關(guān)注特定科研子群體的數(shù)據(jù)管理需求,包括研究生[7]、首席研究員(PI)[8]等.此外,還有一些學(xué)者對調(diào)研案例進行了總體分析,包括美國數(shù)據(jù)管理調(diào)查的定量分析[9]、英國數(shù)據(jù)管理需求調(diào)研實踐梳理[10]、研究人員數(shù)據(jù)共享定性調(diào)查的元綜合研究[11]等.
目前科研數(shù)據(jù)管理需求調(diào)研主要著眼于特定機構(gòu)或?qū)W科研究人員的需求,而缺乏從綜合分析的視角對調(diào)查結(jié)果展開研究.鑒于此,本文對2017—2023 年美國數(shù)據(jù)管理需求的調(diào)查結(jié)果進行系統(tǒng)梳理與深入分析,探討科研人員數(shù)據(jù)管理行為特點,厘清科研人員數(shù)據(jù)管理需求,為我國高校圖書館實施科研數(shù)據(jù)管理服務(wù)與數(shù)據(jù)素養(yǎng)教育提供若干啟示.
筆者以檢索式“Title=(research data OR scientific data OR data management OR data curation OR data literacy) AND Title=(survey OR assess OR interview OR practice OR need OR behavior),在 Web of Science、Elsevier、EBSCO、Emerald、Springer、Wiley、google scholar中進行檢索,考慮到調(diào)研具有時效性,為使研究更具科學(xué)性和可比性,將發(fā)表時間限定為2017年至2023 年.本研究擬定兩項文獻納入標(biāo)準(zhǔn):(1)納入文獻為美國數(shù)據(jù)管理需求調(diào)查研究;(2)文獻內(nèi)容包含數(shù)據(jù)管理實踐、數(shù)據(jù)素養(yǎng)或數(shù)據(jù)需求的調(diào)查研究.根據(jù)這些納入標(biāo)準(zhǔn)篩選出有效文獻,并通過追溯其參考文獻和引證文獻進行查漏補缺,最終獲得12 篇納入文獻.
概括起來,美國科研數(shù)據(jù)管理需求調(diào)查主要涉及兩個主題:數(shù)據(jù)管理實踐、數(shù)據(jù)管理服務(wù)與教育期望.調(diào)研主題是對調(diào)研內(nèi)容的匯總與分類,但僅依據(jù)寬泛的調(diào)研主題無法厘清具體的調(diào)研內(nèi)容,有必要對調(diào)研主題進行再細化.本研究采用內(nèi)容分析法,深入閱讀文獻,從中提取出10 個指標(biāo),通過分析指標(biāo)間內(nèi)在關(guān)系,將其聚類并劃歸入兩個主題中,美國數(shù)據(jù)管理需求調(diào)研具體內(nèi)容見圖1.圖2 呈現(xiàn)了調(diào)研內(nèi)容的數(shù)量分布,從中可以發(fā)現(xiàn),美國調(diào)研案例中出現(xiàn)最多的前四項依次是:數(shù)據(jù)共享、數(shù)據(jù)存儲、數(shù)據(jù)收集和數(shù)據(jù)組織,這四項常規(guī)的數(shù)據(jù)管理生命周期活動,構(gòu)成了科研數(shù)據(jù)管理主流程,而數(shù)據(jù)素養(yǎng)教育和數(shù)據(jù)分析的關(guān)注度最低.
圖1 美國科研數(shù)據(jù)管理需求調(diào)研內(nèi)容
圖2 美國科研數(shù)據(jù)管理需求調(diào)研內(nèi)容數(shù)量分布
(1)數(shù)據(jù)管理計劃.數(shù)據(jù)管理計劃是基金組織要求受資助者制定的數(shù)據(jù)管理方案,說明在科研活動中如何創(chuàng)建、管理、分析、保存和共享數(shù)據(jù).數(shù)據(jù)管理計劃知識與經(jīng)驗方面,克萊姆森大學(xué)2021 年調(diào)查結(jié)果顯示約有50%的受訪者撰寫過數(shù)據(jù)管理計劃,與2016 年的調(diào)查數(shù)據(jù)(6.5%)相比無疑是一個進步[12];而具備數(shù)據(jù)管理計劃知識的研究生相對較少[12],得克薩斯農(nóng)工大學(xué)僅有3.1% 的研究生制定過數(shù)據(jù)管理計劃[13].數(shù)據(jù)管理計劃求助途徑方面,克萊姆森大學(xué)受訪者稱最有可能向同事尋求幫助(45.2%),其次是資助機構(gòu)指南(14.6%),向圖書館請求援助僅占9.4%[12],然而,對于圖書館而言,數(shù)據(jù)管理計劃是一項易于提供服務(wù)和拓展的領(lǐng)域,是圖書館服務(wù)新的生長點.
(2)數(shù)據(jù)收集.數(shù)據(jù)收集是通過調(diào)查、實驗、觀測、模擬等方式生成原始數(shù)據(jù),或通過公開或非公開渠道獲取數(shù)據(jù).數(shù)據(jù)生成方面,美國調(diào)研重點在于產(chǎn)出數(shù)據(jù)的類型、格式和數(shù)據(jù)量,調(diào)查發(fā)現(xiàn)科研人員生成的數(shù)據(jù)類型主要有:數(shù)字文本和數(shù)字數(shù)據(jù)、PPT、統(tǒng)計數(shù)據(jù)和視聽數(shù)據(jù)[12];數(shù)據(jù)格式因?qū)W科而異,人文學(xué)科科研人員最常創(chuàng)建和使用的是文本數(shù)據(jù),而其他學(xué)科生成最多的是表格數(shù)據(jù)[14];三項調(diào)查結(jié)果顯示,大多數(shù)研究人員產(chǎn)生的數(shù)據(jù)量不足100GB[12,14-15],與之前的研究結(jié)果相似[16],說明科研人員所創(chuàng)建的數(shù)據(jù)量大小適中,并不屬于“大數(shù)據(jù)”.數(shù)據(jù)獲取方面,現(xiàn)階段越來越多的科研人員利用二手數(shù)據(jù)來充實研究工作,如元分析,只有克萊姆森大學(xué)關(guān)注了數(shù)據(jù)集獲取,43.7%的受訪者在研究中引用過數(shù)據(jù)集,獲取途徑包括向同行請求共享、政府網(wǎng)站、圖書館數(shù)據(jù)庫以及追蹤其他文獻的引證,值得注意的是,73.5%的受訪者表示愿意通過圖書館使用數(shù)據(jù)集[12].
(3)數(shù)據(jù)組織.數(shù)據(jù)組織是對數(shù)據(jù)進行記錄、描述和有序組織的過程,確保數(shù)據(jù)能夠被他人理解、查找和再利用.調(diào)研揭示了科研人員在數(shù)據(jù)組織方面存在的問題:①科研人員普遍缺乏元數(shù)據(jù)知識[13]和經(jīng)驗[13-14],不了解學(xué)科元數(shù)據(jù)標(biāo)準(zhǔn)[17],佛蒙特大學(xué)調(diào)查發(fā)現(xiàn),僅有2.2% 的人采用了諸如都柏林核心集(DC)、生態(tài)元數(shù)據(jù)語言(EML)等公認的元數(shù)據(jù)標(biāo)準(zhǔn),而另一些人則使用個人自創(chuàng)的標(biāo)準(zhǔn)來描述數(shù)據(jù),通常是自述文件或編碼簿[15];②科研人員傾向于根據(jù)個人偏好來組織數(shù)據(jù)[18],尤其是研究生們各自為政,缺乏統(tǒng)一的數(shù)據(jù)組織實踐,導(dǎo)致項目組內(nèi)難以對數(shù)據(jù)進行高效的關(guān)聯(lián)和管理,有學(xué)生指出小組成員的數(shù)據(jù)版本跟蹤的標(biāo)識符并不統(tǒng)一,使得他們接手后會通常只能優(yōu)先查看最近的文件,他們意識到這可能是低效的做法[13].
(4)數(shù)據(jù)分析.數(shù)據(jù)分析指對數(shù)據(jù)進行清洗、處理和分析,挖掘有價值的信息,并以圖表的形式直觀展示出來.在現(xiàn)有的調(diào)研案例中,數(shù)據(jù)分析話題的關(guān)注度最低,得克薩斯農(nóng)工大學(xué)調(diào)查發(fā)現(xiàn),大部分研究生表示他們更依賴于使用專有軟件進行數(shù)據(jù)分析,因為他們在院系開設(shè)的統(tǒng)計學(xué)課程中使用過SPSS 和STATA 等專有軟件,然而,他們同時也表示,如果能夠獲得適當(dāng)?shù)膶W(xué)習(xí)資源,他們愿意將開源分析軟件應(yīng)用于未來的研究中[13].另一項調(diào)查顯示,生物學(xué)家和獸醫(yī)病理學(xué)家通常使用特定領(lǐng)域的軟件(如MacVector、MAKE、FlowJo 等)來查看和分析特定數(shù)據(jù),包括細胞數(shù)據(jù)、顯微鏡數(shù)據(jù)和掃描圖像,而生物統(tǒng)計學(xué)家更偏愛主流的統(tǒng)計工具[18].
(5)數(shù)據(jù)存儲.數(shù)據(jù)存儲指以合適的存儲介質(zhì)來短期備份或長期存檔數(shù)據(jù),確保數(shù)據(jù)不會丟失和損壞.關(guān)于存儲介質(zhì),調(diào)查結(jié)果一致表明:科研人員最常使用的存儲選項包括電腦、外部存儲設(shè)備、云存儲[14,19],較少選用數(shù)據(jù)存儲庫,其中,10.8%的受訪者使用外部數(shù)據(jù)存儲庫,僅有1.6% 的人使用圖書館機構(gòu)存儲庫[14].當(dāng)被問及克萊姆森大學(xué)是否應(yīng)設(shè)立一個數(shù)據(jù)倉儲庫時,80%的受訪者表示支持,但同時也有許多人對存儲庫的功能表示擔(dān)憂[12].阿肯色大學(xué)調(diào)研發(fā)現(xiàn),科研人員在數(shù)據(jù)備份和數(shù)據(jù)保存時有不同的選擇策略,在數(shù)據(jù)備份時他們會優(yōu)先選擇便利的介質(zhì),如云存儲、外部硬盤、辦公室電腦、U盤等,而在數(shù)據(jù)存儲時會考慮到數(shù)據(jù)丟失風(fēng)險,更傾向于選用穩(wěn)定的介質(zhì),如:辦公室電腦、實驗室電腦、云存儲等[19].綜上,科研人員偏好易于使用且熟悉的數(shù)據(jù)存儲介質(zhì).此外,一些案例調(diào)查了科研人員的數(shù)據(jù)備份與數(shù)據(jù)存檔意識,大多數(shù)科研人員具有較強的數(shù)據(jù)備份意識,他們通常依賴于電腦的每日或每周自動備份,或?qū)?shù)據(jù)備份在外部硬盤中,而小規(guī)模研究項目的科研人員往往不太重視數(shù)據(jù)備份,盡管他們認識到備份的重要性,但例行程序并不到位[17].另外,研究生缺乏數(shù)據(jù)長期保存和數(shù)據(jù)安全的意識,他們中很少有人考慮到保留數(shù)據(jù)以供長期使用[13].
(6)數(shù)據(jù)共享.數(shù)據(jù)共享指標(biāo)包括數(shù)據(jù)共享意愿、數(shù)據(jù)共享層次及數(shù)據(jù)共享方式等.共享意愿方面,美國某公立研究型大學(xué)的調(diào)查顯示,52.2% 的受訪者愿意與他人分享自己的研究數(shù)據(jù)[14],佛蒙特大學(xué)定性和定量數(shù)據(jù)也表明,研究人員愿意在研究小組之外分享數(shù)據(jù),然而,另一項調(diào)查發(fā)現(xiàn),大部分科研人員不愿意公開共享數(shù)據(jù)或在項目團隊之外共享數(shù)據(jù)[18],且共享意愿存在學(xué)科差異,人文科學(xué)[14]、社會科學(xué)[15]領(lǐng)域的科研人員共享意愿較低.共享層次方面,克萊姆森大學(xué)的調(diào)查揭示了數(shù)據(jù)共享的知識差距,只有22%的人在存儲庫或其他公共場所公開分享,28.7% 的人會在要求或請求時共享,而43.6%的人從不共享,經(jīng)過三輪調(diào)查,始終共享的比例顯著增長,從2012 年的9% 增長到2016年的15.1%,再到2021 年的22%[12].共享方式方面,美國某公立研究型大學(xué)受訪者最常使用的方式是個人請求共享(68%),其次是作為期刊出版物的補充材料(43.3%)或在網(wǎng)站上發(fā)布數(shù)據(jù)(20.6%)[14],佛蒙特大學(xué)和美國國立研究院的調(diào)查結(jié)果與之相似,期刊發(fā)表是最常見的數(shù)據(jù)共享方法[15,18].然而,盡管數(shù)據(jù)存儲庫具有數(shù)據(jù)共享和數(shù)據(jù)保存的雙重功能,但并沒有被廣泛用作數(shù)據(jù)共享的手段[13-14].
(7)數(shù)據(jù)素養(yǎng)教育.數(shù)據(jù)素養(yǎng)教育是科研人員通過多種途徑獲取數(shù)據(jù)素養(yǎng)技能提升教育.一項針對科學(xué)會議上81 位科學(xué)家的調(diào)查發(fā)現(xiàn),68%的受訪者表示并未接受過數(shù)據(jù)管理培訓(xùn)[20].關(guān)于數(shù)據(jù)素養(yǎng)教育途徑的調(diào)查主要集中在研究生,研究生表示自主學(xué)習(xí)是他們獲取數(shù)據(jù)管理技能最常用的手段,而教師則認為研究生主要通過教師或顧問的指導(dǎo)來學(xué)習(xí)數(shù)據(jù)素養(yǎng),師生一致認為:朋輩學(xué)習(xí)與課程也是數(shù)據(jù)管理技能學(xué)習(xí)的常見方式,而圖書館和信息技術(shù)則較少作為教育來源,另外,教師還指出專業(yè)會議、研討會、項目工作以及資助和倫理審查委員會培訓(xùn)也是學(xué)生學(xué)習(xí)數(shù)據(jù)管理的途徑[21].研究生的信息尋求行為通常局限于研究環(huán)境內(nèi),他們更傾向于咨詢導(dǎo)師、其他教師、實驗室管理者和同行[22].綜合來看,研究生主要通過向內(nèi)汲取的方式接受數(shù)據(jù)素養(yǎng)教育.此外,得克薩斯農(nóng)工大學(xué)的調(diào)研指出數(shù)據(jù)素養(yǎng)教育存在的不足:由圖書館提供的數(shù)據(jù)管理培訓(xùn)主要針對教師、研究人員和圖書館員,而研究生和研究助理作為接觸數(shù)據(jù)最多的人,卻缺少數(shù)據(jù)管理培訓(xùn),因此,教師需要鼓勵或要求學(xué)生在入職時接受數(shù)據(jù)管理入門培訓(xùn),以確保每個人都遵循統(tǒng)一的標(biāo)準(zhǔn)和程序[12].
數(shù)據(jù)管理服務(wù)與教育期望是在調(diào)查中由科研人員主動反饋的、針對數(shù)據(jù)管理服務(wù)和教育提出的解決方案式的需求,主要包括3 個指標(biāo):數(shù)據(jù)管理挑戰(zhàn)、數(shù)據(jù)管理服務(wù)期望和數(shù)據(jù)素養(yǎng)教育期望.
(1)數(shù)據(jù)管理挑戰(zhàn).調(diào)查結(jié)果顯示,研究人員在數(shù)據(jù)管理過程中遇到的挑戰(zhàn)主要有:數(shù)據(jù)分析[21-22]、數(shù)據(jù)組織[17,21-22]、大型數(shù)據(jù)集存儲[17]、數(shù)據(jù)共享[17]以及處理學(xué)生離職或畢業(yè)時遺留的數(shù)據(jù)[17]等.教師和研究生在數(shù)據(jù)管理挑戰(zhàn)的認識上有所差異,教師認為最大的挑戰(zhàn)在于數(shù)據(jù)監(jiān)管與重用以及數(shù)據(jù)保存,而研究生則認為數(shù)據(jù)處理與分析、數(shù)據(jù)規(guī)劃與組織是更大的挑戰(zhàn)[21].研究生指出數(shù)據(jù)分析的困難主要在于:缺乏分析技術(shù)知識、不熟悉分析方法和分析工具的使用,以及統(tǒng)計建模能力和數(shù)據(jù)解析能力較弱,而數(shù)據(jù)組織的挑戰(zhàn)在于:組織工具技術(shù)障礙、工作量大且耗時、難以保持一致和準(zhǔn)確[22].數(shù)據(jù)共享的過程中,最常見的障礙是缺乏足夠的文檔和元數(shù)據(jù)[18],其次是缺乏共享數(shù)據(jù)所需的專業(yè)知識[12,14]、缺少共享數(shù)據(jù)所需的時間和精力[12,14]、擔(dān)心被 誤解誤 用[14-15]、知識產(chǎn)權(quán)問題[14-15]、機密或?qū)S行畔14-15]以及保護隱私信息[12]等.
(2)數(shù)據(jù)管理服務(wù)期望.根據(jù)得克薩斯農(nóng)工大學(xué)的調(diào)查,研究生對大學(xué)圖書館數(shù)據(jù)管理服務(wù)的認知程度不高,超過一半的受訪者表示從未聽說過這項服務(wù),只有三成的受訪者知道數(shù)據(jù)管理服務(wù),大多數(shù)是通過其他教師、學(xué)生和工作人員了解的,少部分是通過研討會得知的[13].從事大規(guī)模研究的教師比小規(guī)模研究的教師更清楚大學(xué)圖書館提供的數(shù)據(jù)服務(wù)[17].
佛蒙特大學(xué)調(diào)查發(fā)現(xiàn),受訪者對圖書館技術(shù)性數(shù)據(jù)服務(wù)(如數(shù)據(jù)分析和統(tǒng)計支持服務(wù)、信息門戶網(wǎng)站、數(shù)據(jù)管理模板和工具)的需求較高[15],但對咨詢性數(shù)據(jù)服務(wù)(如數(shù)據(jù)管理咨詢和研討會)的需求較低.美國某公立研究型大學(xué)受訪者希望在以下領(lǐng)域獲得幫助:量化分析、數(shù)據(jù)可視化、查找合適的存儲庫、數(shù)據(jù)管理計劃、完成資助者共享數(shù)據(jù)的任務(wù)、數(shù)據(jù)收集等,最不需要支持的服務(wù)是數(shù)據(jù)組織和查找現(xiàn)有數(shù)據(jù)集[14].克萊姆森大學(xué)教師和研究生最感興趣的前四項數(shù)據(jù)服務(wù)基本相同,分別是選擇數(shù)據(jù)存儲庫、數(shù)據(jù)共享教育、項目前數(shù)據(jù)管理培訓(xùn)、編寫數(shù)據(jù)管理計劃,不同之處在于:教師希望獲得數(shù)據(jù)長期存儲與獲取的幫助,而研究生則傾向于查找數(shù)據(jù)集并應(yīng)用于研究中[12].綜合來看,數(shù)據(jù)管理服務(wù)需求主要集中在數(shù)據(jù)存儲、數(shù)據(jù)分析與可視化、數(shù)據(jù)共享、數(shù)據(jù)收集和數(shù)據(jù)管理計劃等領(lǐng)域,而且數(shù)據(jù)管理服務(wù)需求在不同群體間存在一定差異,因此在提供服務(wù)時應(yīng)有所側(cè)重,以滿足不同用戶群的需求.
(3)數(shù)據(jù)素養(yǎng)教育期望.主要從教育主題和教育方式兩個方面對數(shù)據(jù)素養(yǎng)教育期望展開調(diào)查.期望的教育主題方面,阿肯色大學(xué)受訪者表示有興趣參加以下主題的培訓(xùn):數(shù)據(jù)管理計劃、日??蒲袛?shù)據(jù)管理、準(zhǔn)備數(shù)據(jù)并創(chuàng)建元數(shù)據(jù)、傳播數(shù)據(jù)等[19];而在社會科學(xué)領(lǐng)域,研究生感興趣的培訓(xùn)主題是:數(shù)據(jù)文檔和組織、數(shù)據(jù)版本跟蹤、使用開源軟件進行數(shù)據(jù)分析,以及數(shù)據(jù)保存和安全[13].研究生更傾向于參加與研究行為密切相關(guān)的培訓(xùn),如數(shù)據(jù)組織最佳實踐、數(shù)據(jù)共享、發(fā)表數(shù)據(jù)集等,這與他們在項目期間承擔(dān)的數(shù)據(jù)管理職責(zé)相對應(yīng)[21].期望的教育方式方面,夏威夷大學(xué)馬諾阿分校的師生希望能在線觀看教學(xué)視頻、PPT 和文本等異步學(xué)習(xí)材料,且學(xué)習(xí)模塊應(yīng)設(shè)計成小段,每個模塊的學(xué)習(xí)時間少于2 小時[23].科學(xué)家們更喜歡研討會和網(wǎng)絡(luò)研討會,而對面對面指導(dǎo)或者書面輔導(dǎo)不太感興趣[20].這些需求和偏好都為數(shù)據(jù)素養(yǎng)教育指明了方向.
綜合上述調(diào)研結(jié)果,探討美國科研人員數(shù)據(jù)管理行為特點,從中析出具體的數(shù)據(jù)管理需求.
(1)科研人員數(shù)據(jù)管理行為呈現(xiàn)出個性化及隨意性特點,這在數(shù)據(jù)組織和數(shù)據(jù)存儲兩個環(huán)節(jié)中尤為明顯.由于缺乏數(shù)據(jù)管理政策、技能培訓(xùn)、基礎(chǔ)設(shè)施等方面的規(guī)范指引,項目組成員按照個人喜好和習(xí)慣制定多種數(shù)據(jù)管理策略,導(dǎo)致組內(nèi)數(shù)據(jù)管理工作分散且無序.在數(shù)據(jù)存儲方面,科研人員更偏好于使用熟悉且易用的存儲介質(zhì),而很少選擇容量更大、功能更豐富的存儲庫,這對數(shù)據(jù)的安全性、長期維護及共享造成了不利影響.
(2)科研人員在數(shù)據(jù)管理方面的知識相對薄弱,主要表現(xiàn)在缺乏數(shù)據(jù)管理計劃、元數(shù)據(jù)、數(shù)據(jù)分析、數(shù)據(jù)存儲、數(shù)據(jù)共享、數(shù)據(jù)服務(wù)等方面的專業(yè)知識,導(dǎo)致數(shù)據(jù)管理效果欠佳.因此,學(xué)校有必要強化數(shù)據(jù)管理教育,幫助科研人員重建數(shù)據(jù)管理知識體系.
(3)科研人員對數(shù)據(jù)存儲量的需求以小數(shù)據(jù)為主.當(dāng)前大多數(shù)科研人員持有的數(shù)據(jù)量較少,對數(shù)據(jù)存儲空間的要求也相對較低,“小數(shù)據(jù)”研究的一個特點是數(shù)據(jù)存儲過度依賴電腦、筆記本電腦或外部硬盤[15],然而,這些存儲設(shè)備無法滿足大型數(shù)據(jù)集的存儲需求.因此,部分科研人員正在尋求大型數(shù)據(jù)集的解決方案.
(4)科研人員的數(shù)據(jù)共享意愿和共享層次普遍不理想,大多數(shù)選擇局部共享或者完全不共享,這主要歸因于他們不了解數(shù)據(jù)共享的好處、缺乏相關(guān)專業(yè)知識以及擔(dān)心數(shù)據(jù)被誤解誤用和泄露隱私信息等問題.同時,數(shù)據(jù)共享所需的時間成本和精力成本也較高,這也是他們不愿意共享數(shù)據(jù)的一個關(guān)鍵因素.
(5)了解和主動使用圖書館數(shù)據(jù)管理服務(wù)的科研人員較少,他們主要關(guān)注與項目啟動和研究進展直接相關(guān)的數(shù)據(jù)服務(wù)支持,如數(shù)據(jù)管理計劃、數(shù)據(jù)收集、數(shù)據(jù)分析、數(shù)據(jù)存儲、數(shù)據(jù)共享等,同時,與咨詢性數(shù)據(jù)服務(wù)相比,他們對技術(shù)性數(shù)據(jù)服務(wù)的需求更大.
(6)科研人員缺乏數(shù)據(jù)素養(yǎng)教育,其數(shù)據(jù)管理知識與技能主要來自于非正式的教育渠道,如自學(xué)、組內(nèi)指導(dǎo)與咨詢、朋輩學(xué)習(xí)等.在培訓(xùn)主題方面,他們更感興趣的是與研究行為相關(guān)的主題,更喜歡在線提供異步學(xué)習(xí)材料、網(wǎng)絡(luò)研討會、研討會等教育方式.
(7)科研人員的數(shù)據(jù)管理實踐和需求受到學(xué)科、項目規(guī)模和學(xué)術(shù)角色等因素的影響,因此,學(xué)校應(yīng)針對各學(xué)科各類型研究人員的需求,開展分類分級的數(shù)據(jù)素養(yǎng)教育.
綜合上述分析可知,科研人員數(shù)據(jù)管理需求主要集中在以下四個方面:①數(shù)據(jù)管理服務(wù)的需求,科研人員對能切實解決數(shù)據(jù)管理難題的數(shù)據(jù)服務(wù)具有最高優(yōu)先級需求,而且希望加強數(shù)據(jù)服務(wù)的宣傳營銷;②基礎(chǔ)設(shè)施保障的需求,包括能同時滿足小數(shù)據(jù)研究和大數(shù)據(jù)研究的數(shù)據(jù)存儲庫、集成數(shù)據(jù)管理資源和工具的數(shù)據(jù)管理平臺等;③數(shù)據(jù)素養(yǎng)教育的需求,科研人員希望獲得實用性強、精準(zhǔn)化的數(shù)據(jù)素養(yǎng)教育;④支持數(shù)據(jù)共享的需求,科研人員作為數(shù)據(jù)生產(chǎn)者和數(shù)據(jù)消費者都有共享數(shù)據(jù)的需求,希望適時獲得幫助.
調(diào)查顯示大多數(shù)科研人員對數(shù)據(jù)管理服務(wù)并不熟悉,也很少利用圖書館提供的數(shù)據(jù)服務(wù),遇到問題時很少向圖書館員尋求幫助.為提高用戶對數(shù)據(jù)管理服務(wù)的認知度和使用率,圖書館應(yīng)拓寬數(shù)據(jù)管理服務(wù)的宣傳渠道,采用院系試點、走訪項目組、發(fā)放調(diào)查問卷、宣傳手冊、海報、網(wǎng)站公告、微信公眾號、QQ 群、微信群、電子屏、學(xué)術(shù)互動社區(qū)等多種方式進行宣傳,以加強數(shù)據(jù)管理服務(wù)的宣傳營銷.
科研人員在數(shù)據(jù)管理方面的薄弱環(huán)節(jié)、挑戰(zhàn)和期望正是圖書館拓展服務(wù)的切入點,包括數(shù)據(jù)獲取、數(shù)據(jù)組織、數(shù)據(jù)分析、數(shù)據(jù)存儲以及數(shù)據(jù)共享等.圖書館應(yīng)以用戶需求為導(dǎo)向,針對用戶在數(shù)據(jù)管理工作中遇到的難題,挖掘新的服務(wù)生長點,不斷豐富服務(wù)內(nèi)容和服務(wù)形式,進一步拓展數(shù)據(jù)管理服務(wù)的廣度.同時,真正高質(zhì)量的數(shù)據(jù)管理服務(wù)應(yīng)貫穿科學(xué)研究全過程,圖書館應(yīng)重點發(fā)展嵌入式數(shù)據(jù)管理服務(wù),融入用戶科研環(huán)境和工作流程,即時捕捉用戶數(shù)據(jù)需求,提供深層次、精細化、個性化的數(shù)據(jù)服務(wù),推動數(shù)據(jù)管理服務(wù)從廣度向深度延伸.
調(diào)查發(fā)現(xiàn)科研人員數(shù)據(jù)組織和數(shù)據(jù)存儲行為具有個性化、隨意性的特點,這與缺乏完善的基礎(chǔ)設(shè)施有關(guān),因此,圖書館應(yīng)著重加強校園數(shù)據(jù)管理基礎(chǔ)設(shè)施的建設(shè),主要從以下兩個方面構(gòu)建一站式數(shù)據(jù)管理平臺:一是建設(shè)資源配置完善的集成式數(shù)據(jù)管理服務(wù)平臺,我國高校圖書館應(yīng)通過按需購買或搜集數(shù)據(jù)集等方式加強數(shù)據(jù)資源建設(shè),在現(xiàn)有的網(wǎng)站基礎(chǔ)上,將數(shù)據(jù)管理作為一個獨立的子模塊,集成數(shù)據(jù)集、數(shù)據(jù)管理培訓(xùn)資源、數(shù)據(jù)服務(wù)內(nèi)容、數(shù)據(jù)管理工具與軟件等資源,實現(xiàn)數(shù)據(jù)資源一站式發(fā)現(xiàn)與獲取,提升數(shù)據(jù)資源與服務(wù)的利用率;二是建設(shè)易用的數(shù)據(jù)存儲庫,易用性是影響科研人員進行數(shù)據(jù)存儲決策的關(guān)鍵因素,圖書館在建設(shè)數(shù)據(jù)存儲庫時,必須重點解決系統(tǒng)易用性問題,此外,圖書館還應(yīng)向科研人員廣泛宣傳存儲庫的獨特功能,包括:能同時滿足小數(shù)據(jù)研究和大數(shù)據(jù)研究的數(shù)據(jù)備份與保存、保護數(shù)據(jù)隱私、數(shù)據(jù)共享、數(shù)據(jù)重用等.
根據(jù)調(diào)研結(jié)果,大部分科研人員并未接受過數(shù)據(jù)管理培訓(xùn),但他們對此類培訓(xùn)比較感興趣,并積極投選所需的數(shù)據(jù)管理培訓(xùn)主題.圖書館應(yīng)以普及數(shù)據(jù)管理知識、提升數(shù)據(jù)素養(yǎng)與技能為目標(biāo),根據(jù)用戶的需求和特征,完善數(shù)據(jù)素養(yǎng)教育內(nèi)容建設(shè),構(gòu)建分層次、多形式的數(shù)據(jù)素養(yǎng)教育體系.第一,教育內(nèi)容方面,在系統(tǒng)覆蓋數(shù)據(jù)管理全生命周期內(nèi)容的基礎(chǔ)上,注重實踐,將教育重點放在用戶當(dāng)前或不久的將來可以實施的內(nèi)容上.第二,教育方式方面,除了傳統(tǒng)的課程、培訓(xùn)、研討會、沙龍、面對面指導(dǎo)等線下的方式,還應(yīng)充分利用網(wǎng)絡(luò)課程、在線提供學(xué)習(xí)資料、在線指導(dǎo)、數(shù)據(jù)管理平臺等線上的方式,圖書館應(yīng)采用線上線下相結(jié)合的方式開展數(shù)據(jù)素養(yǎng)教育,以擴大教育的覆蓋面和影響力.第三,教育層次方面,圖書館應(yīng)針對各學(xué)科各類型用戶的需求和行為傾向,分類開展差異化的數(shù)據(jù)素養(yǎng)教育,如為新入學(xué)的研究生開展數(shù)據(jù)管理入門培訓(xùn),為科研團隊提供嵌入式數(shù)據(jù)管理培訓(xùn).
針對科研人員的數(shù)據(jù)共享意愿和共享層次普遍不高的現(xiàn)象,圖書館應(yīng)采取多種措施促進數(shù)據(jù)共享:首先,圖書館可以與校內(nèi)其他部門合作建設(shè)數(shù)據(jù)共享平臺,整合科研數(shù)據(jù)共享政策、學(xué)科數(shù)據(jù)共享規(guī)范、數(shù)據(jù)共享實踐優(yōu)秀案例、數(shù)據(jù)存儲共享平臺等信息,為用戶提供便捷的數(shù)據(jù)共享資源導(dǎo)航.其次,圖書館可以與學(xué)??蒲胁块T聯(lián)合制定數(shù)據(jù)共享激勵機制,在學(xué)術(shù)任命、晉升、認可和獎勵等方面對共享數(shù)據(jù)者予以激勵,以提高用戶共享數(shù)據(jù)的積極性,并增強機構(gòu)數(shù)據(jù)存儲庫的數(shù)據(jù)完整性.最后,圖書館可以通過提供數(shù)據(jù)共享援助,強化用戶對數(shù)據(jù)共享的理解和認同,重點為用戶提供元數(shù)據(jù)方面的培訓(xùn)與支持,元數(shù)據(jù)是影響數(shù)據(jù)共享與可訪問性的關(guān)鍵因素,科研人員作為數(shù)據(jù)生產(chǎn)者和數(shù)據(jù)消費者都會面臨元數(shù)據(jù)描述與理解的挑戰(zhàn),圖書館應(yīng)提供必要的協(xié)助,幫助科研人員開展元數(shù)據(jù)描述與數(shù)據(jù)文檔利用工作.