陳媛媛 陳志鵬
科研數(shù)據(jù)管理服務(Research Data Management Services,RDMS)是高校圖書館為支持科研工作提供的數(shù)據(jù)管理和相關支持服務。隨著科學研究的發(fā)展和數(shù)據(jù)規(guī)模的快速增長,高校圖書館在科研數(shù)據(jù)的獲取、組織、存儲、分享和利用等方面起到了越來越重要的作用。然而,與發(fā)達國家相比,我國在RDMS 的建設方面起步較晚,存在較大差距,不利于我國科研數(shù)據(jù)的利用和學科發(fā)展[1-3]。一些高校圖書館開展科研數(shù)據(jù)管理服務時,未制定科研數(shù)據(jù)管理政策,或政策虛設,缺乏實質(zhì)性支持,導致相關服務推進緩慢[3,4];同時缺乏對科研數(shù)據(jù)管理安全保障重要性的充分認知和對技術(shù)人員的相關培訓,從而無法滿足部分研究人員對數(shù)據(jù)管理服務的實際需求[5];此外,還存在科研數(shù)據(jù)共享和復用效率低下等問題[3]。
為提供綜合性解決方案,探索高校圖書館RDMS 問題的根本原因,本文采用系統(tǒng)動力學作為主要研究方法進行建模和仿真實驗,結(jié)合共現(xiàn)矩陣、詞頻法等輔助手段。通過動態(tài)分析不同系統(tǒng)變量在運作過程中的作用機理,辨析系統(tǒng)內(nèi)部的正負反饋回路,確認驅(qū)使高校圖書館RDMS 水平提升的主要動力,并對優(yōu)化系統(tǒng)構(gòu)成提出針對性的建議。此外,系統(tǒng)動力學還能模擬和分析系統(tǒng)在長期演化中的動態(tài)變化,揭示問題的長期趨勢和潛在的系統(tǒng)行為[6]。這有助于預測和評估不同決策和政策對RDMS 的長期影響,從而識別高校圖書館RDMS 中的瓶頸和關鍵因素,并制定更有效和可持續(xù)的管理策略。
科研數(shù)據(jù)包括科學研究活動中產(chǎn)生的原始及衍生數(shù)據(jù)[7]??蒲袛?shù)據(jù)管理和科研數(shù)據(jù)服務是相關但側(cè)重點不同的兩個概念[8],前者通過數(shù)據(jù)組織實現(xiàn)數(shù)據(jù)有效管理[9],后者在前者的基礎上為科研人員提供數(shù)據(jù)支持和服務,滿足科研人員在數(shù)據(jù)管理和科學研究過程中的需求[10]??蒲袛?shù)據(jù)管理和服務都關注數(shù)據(jù)權(quán)益,并通過多方參與的權(quán)益博弈形成高效穩(wěn)定的行為模式框架[11]。
RDMS 作為一個更加綜合和深入的概念,融合了科研數(shù)據(jù)管理和科研數(shù)據(jù)服務的核心要素。RDMS 不僅關注數(shù)據(jù)本身的管理,還注重構(gòu)建合作共贏的機制,使科研人員、圖書館等多方參與者在數(shù)據(jù)管理與服務中形成協(xié)同合作的良好格局。科研數(shù)據(jù)管理服務有助于更加高效地利用數(shù)據(jù)資源,推動科學知識的積累和傳播。為評估RDMS 現(xiàn)狀并分析提升策略,國內(nèi)的研究者主要從理論和實踐兩個角度展開研究:在理論研究上,基于前人總結(jié)和本國發(fā)展規(guī)劃,以某一環(huán)節(jié)或整個科研數(shù)據(jù)管理系統(tǒng)為研究對象進行理論分析[12,13];在實踐研究上,通過分析現(xiàn)有案例總結(jié)實踐經(jīng)驗,探索影響科研數(shù)據(jù)管理系統(tǒng)的關鍵因素,并提出對策建議[14,15]。
在研究過程中,國際學界也逐漸形成了一些共識。首先,數(shù)據(jù)生命周期對RDMS 的重要性得到廣泛強調(diào)[16,17],并被視為加速開放科學建設的基礎框架[18,19]。其次,各利益相關者的合作被認為是RDMS 成功的關鍵[20-22],吸引更多的利益相關者參與可以更好地支持RDMS 的數(shù)據(jù)生命周期活動[23],這些利益相關者涵蓋政府、機構(gòu)、高校及科研服務人員等[9,24]。此外,一些研究將數(shù)據(jù)生命周期與利益相關者概念結(jié)合,構(gòu)建了更具普適性的RDMS 內(nèi)容體系框架[25,26]。
然而,現(xiàn)有研究仍然存在一些不足。首先,大多基于個案或特定領域,缺乏系統(tǒng)性,研究視角較為狹窄。其次,多采用描述性和案例分析的方式,缺乏定量分析的支持,導致結(jié)論存在局限性,難以客觀評估科研數(shù)據(jù)管理模型的效果及影響。再者,多以理論探討和經(jīng)驗總結(jié)為主,缺乏對科研數(shù)據(jù)管理應用模型的驗證評估,無法提供科學依據(jù)和實踐指導。因此,有必要以更加系統(tǒng)化的方式開展科研數(shù)據(jù)管理領域研究。本文運用系統(tǒng)動力學方法進行模擬仿真,構(gòu)建科研數(shù)據(jù)管理的動態(tài)模型,分析各個環(huán)節(jié)的相互作用和反饋機制,以更好地理解科研數(shù)據(jù)管理系統(tǒng)的復雜性,并進一步提供科學依據(jù)和決策支持。
高校圖書館RDMS 系統(tǒng)建構(gòu)的前提是系統(tǒng)變量的獲取。為了避免主觀調(diào)查可能帶來的偏差,本文結(jié)合了文獻計量學方法,更全面地捕捉學界對可能影響RDMS 系統(tǒng)運行的主要變量的認知情況。本文從CNKI 檢索發(fā)表在CSSCI 及中文核心期刊中“篇關摘”包含“科研數(shù)據(jù)服務”或“科研數(shù)據(jù)管理”的論文,檢索范圍為2022 年4 月1日之前的所有文獻,共得到246 篇相關文獻。然后導出文獻中所包含的關鍵詞,共得到關鍵詞473 個。利用Python 編寫的程序完成關鍵詞共現(xiàn)矩陣構(gòu)建,得到的結(jié)果如表1 所示。
表1 關鍵詞共現(xiàn)矩陣表(局部)
為了進一步分析各關鍵詞的重要性,本文使用特征向量中心度來衡量它們的重要程度。特征向量中心度是一種同時考慮了節(jié)點本身的重要性和其相鄰節(jié)點的重要性的指標。本文使用Gephi 完成實驗計算,并得到了特征向量中心度排名前30 的關鍵詞如表2 所示。
表2 高頻關鍵詞的特征向量中心度
通過表2 提供的信息,可以得出以下結(jié)論:
(1)“科研數(shù)據(jù)管理”和“科研數(shù)據(jù)服務”是該領域的核心概念。雖然研究重點可能有所偏向,但概念均與具體的服務環(huán)節(jié)密切相關,如數(shù)據(jù)共享、數(shù)據(jù)管理和數(shù)據(jù)保存以及開放科學等,這些環(huán)節(jié)共同構(gòu)成了科研數(shù)據(jù)的生命周期[5,26]。然而,通過對原始文獻的分析,發(fā)現(xiàn)還存在不同的數(shù)據(jù)生命周期劃分方式,如數(shù)據(jù)獲取、數(shù)據(jù)產(chǎn)生、數(shù)據(jù)加工、數(shù)據(jù)應用、數(shù)據(jù)收集發(fā)現(xiàn)和數(shù)據(jù)記錄分析等[5,27-29]。因此,在整合現(xiàn)有研究結(jié)果的基礎上,本文將RDMS 的數(shù)據(jù)生命周期劃分為數(shù)據(jù)獲取、數(shù)據(jù)保存、數(shù)據(jù)開放、數(shù)據(jù)利用、數(shù)據(jù)生成和數(shù)據(jù)共享六個階段。
(2)關鍵詞中大量出現(xiàn)的“高校圖書館”“圖書館”“高校”“大學圖書館”“學術(shù)圖書館”和“iSchools”表明,高校圖書館是進行RDMS 建設的主體[30]。同時,關鍵詞“數(shù)據(jù)館員”表明,科研服務人員同樣被認為是參與其中的重要主體[31-33]。此外,一些研究者通過對政府、機構(gòu)知識庫和科研數(shù)據(jù)知識庫等不同來源的數(shù)據(jù)政策進行研究,強調(diào)政府和第三方機構(gòu)等利益相關者在RDMS系統(tǒng)中能發(fā)揮的關鍵作用[34,35]。因此,本文將利益相關者確定為高校圖書館、科研人員、政府和第三方機構(gòu)四類。
結(jié)合上述對數(shù)據(jù)生命周期的劃分以及利益相關者的確定,本文可以進一步確定系統(tǒng)中可能涉及的關鍵變量。(1)在科研數(shù)據(jù)獲取階段,高校圖書館需要考慮數(shù)據(jù)的重要性和可獲取的共享數(shù)據(jù)量來確定獲取和管理的優(yōu)先級。(2)在科研數(shù)據(jù)保存階段,高校圖書館的數(shù)據(jù)組織能力、數(shù)據(jù)庫建設水平和規(guī)范程度會影響科研數(shù)據(jù)存儲的效果。(3)科研數(shù)據(jù)開放階段涉及多個利益相關者,其中數(shù)據(jù)敏感性、政策支持和存儲服務供應商的能力都是重要考慮因素。(4)在科研數(shù)據(jù)利用階段,高校圖書館提供的服務種類和人員規(guī)模以及科研數(shù)據(jù)的開放程度將影響科研數(shù)據(jù)的利用水平。(5)在科研數(shù)據(jù)生成階段,科研人員的資金投入量、數(shù)據(jù)素養(yǎng)和科研水平對科研數(shù)據(jù)的生成質(zhì)量起到重要作用。(6)在科研數(shù)據(jù)共享階段,數(shù)據(jù)共享環(huán)境、政府政策支持和科研數(shù)據(jù)的生成量都會影響科研數(shù)據(jù)的共享情況。
基于上述分析,結(jié)合數(shù)據(jù)生命周期理論、利益相關者理論,本文得出對RDMS 系統(tǒng)產(chǎn)生影響的主要變量,如表3 所示。
在本文中,內(nèi)在主要變量僅設定為由高校圖書館、第三方機構(gòu)、政府作為行為主體的,對數(shù)據(jù)獲取、數(shù)據(jù)存儲、數(shù)據(jù)開放、數(shù)據(jù)利用、數(shù)據(jù)生成、數(shù)據(jù)共享產(chǎn)生影響的系統(tǒng)變量。行業(yè)合作、社會需求以及輿論環(huán)境等其他直接或間接影響RDMS的外部因素并非研究的重點?;诖?提出以下基本假設:
假設一:高校圖書館RDMS 系統(tǒng)是一個相對封閉穩(wěn)定的系統(tǒng),其增長主要受到科研水平的自然增長驅(qū)動,不受外部變量的影響。
假設二:高校圖書館RDMS 水平只受到數(shù)據(jù)獲取、數(shù)據(jù)保存、數(shù)據(jù)開放和數(shù)據(jù)利用等四個環(huán)節(jié)的影響,其他環(huán)節(jié)并不直接影響其發(fā)展。
假設三:對高校圖書館RDMS 系統(tǒng)產(chǎn)生影響的政策僅包括數(shù)據(jù)開放和數(shù)據(jù)保護政策。不考慮其他可能對系統(tǒng)流程產(chǎn)生潛在影響的政策,如高校圖書館環(huán)境基建和圖書館從業(yè)人員的薪酬福利等政策。
根據(jù)在數(shù)據(jù)生命周期中參與作用環(huán)節(jié)的不同,對系統(tǒng)主要變量進行劃分,構(gòu)建高校圖書館RDMS 系統(tǒng)的動力學因果關系模型,如圖1 所示。
圖1 高校圖書館科研數(shù)據(jù)管理服務系統(tǒng)的因果回路模型
圖1 包括的主要反饋回路如下所示,其中正負號分別代表變量之間的正向影響關系及負向影響關系,若一個變量增加會導致另一變量增加,則關系為正,反之則為負:
(1)高校圖書館科研數(shù)據(jù)獲取量→+高校圖書館科研數(shù)據(jù)存量→+高校圖書館科研數(shù)據(jù)開放量→+高校圖書館開放數(shù)據(jù)利用量→+高校科研數(shù)據(jù)管理服務意愿→+高校圖書館科研數(shù)據(jù)獲取量。
(2)高校圖書館科研數(shù)據(jù)獲取量→+高校圖書館科研數(shù)據(jù)存量→高校圖書館科研數(shù)據(jù)開放量→+高校圖書館開放數(shù)據(jù)利用量→+科研人員科研數(shù)據(jù)生成量→+科研人員科研數(shù)據(jù)共享量→+高校圖書館科研數(shù)據(jù)獲取量。
(3)高校圖書館科研數(shù)據(jù)獲取量→+高校圖書館科研數(shù)據(jù)存量→+科研數(shù)據(jù)管理服務成本→-高校圖書館科研數(shù)據(jù)管理服務意愿→+高校圖書館科研數(shù)據(jù)獲取量。
根據(jù)上文建立的因果回路模型,構(gòu)建高校圖書館RDMS 系統(tǒng)流圖,如圖2 所示。相較于圖1所展示的因果回路關系,系統(tǒng)流圖進一步強化了該系統(tǒng)中的動態(tài)特征,包括狀態(tài)變量(存量)和速率變量(流量),這些是系統(tǒng)動力學的核心概念,也是反映系統(tǒng)動態(tài)變化的重要變量。
圖2 高校圖書館科研數(shù)據(jù)管理服務系統(tǒng)流圖
在該系統(tǒng)中,唯一的驅(qū)動因素是高??蒲兴降淖匀辉鲩L。即科研水平的增長量直接影響科研人員的科研數(shù)據(jù)生成效率,從而導致科研數(shù)據(jù)的總量增加。即使在數(shù)據(jù)獲取、存儲、開放和利用等環(huán)節(jié)的效率保持不變的情況下,整個高校圖書館數(shù)據(jù)生命周期中各環(huán)節(jié)的數(shù)據(jù)量也會增多,從而推動了RDMS 水平的自然增長。
由于系統(tǒng)中各變量難以量化,為使實驗結(jié)果的實踐意義及參考價值最大化,本文將各指標的值量化為與初始時刻值的比值。即各指標值反映的是不同時刻下該指標值與初始時刻指標值相比的變化情況,而非具體的規(guī)模水平指標。
同時,為保證基于二級系統(tǒng)變量計算所得出的一級系統(tǒng)變量,如政策支持水平、科研人員數(shù)據(jù)共享效率、科研人員科研數(shù)據(jù)生成效率等,在二級系統(tǒng)變量不變的情況下保持不變。依據(jù)歸一法設計通用權(quán)重系數(shù)公式,具體如公式(1)所示:
公式(1)中Xi代表第i 個正面系統(tǒng)變量的權(quán)重系數(shù)(i=1,2,……,n),Yj代表第j 個負面系統(tǒng)變量的權(quán)重系數(shù)(j=1,2,……,m)。而各個系統(tǒng)變量的具體權(quán)重系數(shù)來源見表4。
表4 系統(tǒng)變量權(quán)重
此外,對于狀態(tài)變量,如科研人員科研數(shù)據(jù)共享量、科研人員科研數(shù)據(jù)生成量以及高校圖書館開放數(shù)據(jù)利用量等,應有以下關系:
其中,ΔS(t) 為存量在t 時刻的單位時間變化量;k為單位時間增長比例系數(shù),本實驗中取值為0.02;μ為存量S 對應增長效率,如高校圖書館數(shù)據(jù)獲取量對應高校圖書館數(shù)據(jù)獲取效率、高校圖書館數(shù)據(jù)存量對應高校圖書館數(shù)據(jù)存儲效率等;S(t- 1) 為t- 1 時刻的存量。
為確定高校圖書館RDMS 系統(tǒng)動力學模型中各系統(tǒng)變量的權(quán)重系數(shù),本文將選取的246 篇論文轉(zhuǎn)換為文本格式后,再對全文文本進行分詞處理,隨后參考表3 所選取的系統(tǒng)變量確定對應的關鍵詞,并統(tǒng)計各詞的詞頻信息。同時,為避免詞頻差距過大影響最后實驗結(jié)果,本文還對詞頻信息進行對數(shù)化處理,最后再基于公式(1)計算各系統(tǒng)變量的權(quán)重系數(shù),結(jié)果如表4 所示。
結(jié)合上述內(nèi)容,本文構(gòu)建高校圖書館RDMS系統(tǒng)的動力學模型,并使用方程表達系統(tǒng)的基本思路。在模型中,一級系統(tǒng)變量通過將二級系統(tǒng)變量與相應的權(quán)重系數(shù)相乘并求和計算而得。正面指標對應的權(quán)重系數(shù)為正值,負面指標對應的權(quán)重系數(shù)為負值。狀態(tài)變量通過將相應的速率變量、比例系數(shù)0.02 與上一周期狀態(tài)變量值的乘積進行積分計算而得,初始值均設為1。例如:政策支持水平=數(shù)據(jù)保護政策支持* 0.48 +數(shù)據(jù)開放政策支持*0.52;高校圖書館數(shù)據(jù)開放效率=政策支持水平*0.17+數(shù)據(jù)發(fā)布及開放存取水平*0.30+數(shù)據(jù)存儲服務供應商*0.10+科研人員數(shù)據(jù)需求*0.31+高校圖書館科研數(shù)據(jù)存量*0.31-數(shù)據(jù)敏感性*0.19;科研人員科研數(shù)據(jù)共享量=INTEG(科研人員數(shù)據(jù)共享效率*0.02*科研人員科研數(shù)據(jù)共享量,1)。
剩余方程也均按上述方法進行確定,因而不再贅述。
在VensimPLE 平臺上對高校圖書館RDMS系統(tǒng)進行模擬仿真試驗,設定仿真時間為36 個月,仿真步長為1,RDMS 水平初始值為1,在不更改任何系統(tǒng)變量的情況下得到RDMS 水平自然增長曲線,如圖3 所示。
圖3 科研數(shù)據(jù)管理服務水平的自然增長曲線
從圖3 可以看出,RDMS 水平的自然增長趨勢整體保持平緩的指數(shù)增長態(tài)勢,在仿真前期增速較為緩慢,在后期逐漸加速,最終伴隨36 個月的自然增長后,RDMS 水平增長為初始狀態(tài)的2.27 倍。由此可見,科研數(shù)據(jù)量的規(guī)模增長速度會隨著整體規(guī)模的增大而加快,并且這種趨勢會逐漸擴散到科研數(shù)據(jù)生命周期各個環(huán)節(jié)的狀態(tài)變量,從而最終影響高校圖書館RDMS 水平。
通過對關鍵參數(shù)調(diào)整后的仿真運行結(jié)果進行分析比較,可以得到各系統(tǒng)變量與最后系統(tǒng)輸出結(jié)果之間的影響關系。本文選擇對高校圖書館RDMS 水平產(chǎn)生直接影響的四個可控變量,即高校圖書館數(shù)據(jù)的獲取效率、存儲效率、開放效率以及利用效率,分別調(diào)整為初始值的150%及50%進行仿真實驗進行靈敏度分析,得到實驗結(jié)果如圖4 所示。
圖4 調(diào)整各系統(tǒng)變量對科研數(shù)據(jù)管理服務水平的影響
為更好比較不同環(huán)節(jié)對高校圖書館RDMS系統(tǒng)輸出結(jié)果的影響力,本文截取在仿真周期內(nèi)不同時間點的RDMS 水平數(shù)據(jù),結(jié)果如表5所示。
表5 科研數(shù)據(jù)管理水平各系統(tǒng)變量仿真實驗結(jié)果對比
結(jié)合圖4 和表5,對比不同變量的仿真運行結(jié)果可以發(fā)現(xiàn),在初期階段調(diào)整不同系統(tǒng)變量的效果并不明顯,但隨著時間的推移,差距逐漸擴大。這表明高校圖書館RDMS 系統(tǒng)內(nèi)部存在一定的滯后期,對系統(tǒng)中各環(huán)節(jié)的調(diào)整效果需要經(jīng)過較長的數(shù)據(jù)循環(huán)周期才能明顯顯現(xiàn)。
從數(shù)據(jù)層面來看,提升高校圖書館的數(shù)據(jù)獲取效率、數(shù)據(jù)存儲效率、數(shù)據(jù)開放效率和數(shù)據(jù)利用效率都能對RDMS 水平產(chǎn)生明顯的影響,提升比例均超過10%。高校圖書館的數(shù)據(jù)利用效率和數(shù)據(jù)開放效率對整體RDMS 水平的影響最大,其次是數(shù)據(jù)存儲效率,而數(shù)據(jù)獲取效率的影響最小。這可能是因為高校圖書館在提升數(shù)據(jù)獲取效率和數(shù)據(jù)存儲效率方面的手段相對有限,但在提升數(shù)據(jù)開放效率和數(shù)據(jù)利用效率方面有更多樣的方法可供選擇,因此在RDMS 實施階段更加側(cè)重后者。
經(jīng)過對數(shù)據(jù)獲取效率、數(shù)據(jù)存儲效率、數(shù)據(jù)開放效率和數(shù)據(jù)利用效率進行靈敏度分析和比較后,可以得出它們對高校圖書館RDMS 水平的影響。然而,這些影響因素的改變并非由利益相關者直接控制,而是需要通過特定行為活動來影響,如提升數(shù)據(jù)庫建設水平、增加RDMS 種類等。為了展現(xiàn)這些直接行為對最終RDMS 水平的影響關系,本文將進一步從各利益相關者自身的角度進行情境分析。
5.3.1 政府政策維度
政府通過制定政策對高校圖書館RDMS 水平產(chǎn)生影響。在本模型中,政策主要分為數(shù)據(jù)保護政策和數(shù)據(jù)開放政策兩類。為了比較不同政策對高校圖書館RDMS 水平的影響,本文將數(shù)據(jù)保護政策支持水平和數(shù)據(jù)開放政策支持水平分別調(diào)整為自然狀態(tài)的3 倍,并進行仿真實驗,得到的動態(tài)結(jié)果如圖5 所示。
圖5 政府政策支持行為對科研數(shù)據(jù)管理服務水平的影響
由圖5 可知,提升數(shù)據(jù)開放政策支持水平和提升數(shù)據(jù)保護政策支持水平對RDMS 水平的影響差異并不明顯,但均相較于原始狀態(tài)下有著10%左右的提升幅度。這表明數(shù)據(jù)開放政策和數(shù)據(jù)保護政策在政策層面上具有同等重要性。可見,高校圖書館的數(shù)據(jù)開放和數(shù)據(jù)保護行為不適合通過政府政策進行嚴格管控,政府的政策主要在營造環(huán)境和引導趨勢方面發(fā)揮作用。因此,政府的政策支持對提升高校圖書館RDMS 水平的影響有限。在政策趨勢引導上,不應過分偏向數(shù)據(jù)保護或數(shù)據(jù)開放任一方,而是尋求平衡,兼顧數(shù)據(jù)保護和數(shù)據(jù)共享的需求。
5.3.2 第三方機構(gòu)維度
本文認為對高校圖書館RDMS 水平產(chǎn)生影響的第三方機構(gòu)包括:(1)對科研數(shù)據(jù)管理計劃存在一定要求的學術(shù)資助機構(gòu),如跨大學政治和社會研究聯(lián)盟(ICPSR)、國家人文基金會(NEH)等;(2)為高校圖書館提供數(shù)據(jù)存儲服務的供應商,如Dyrad 數(shù)據(jù)知識庫等。前者通過對資助申請者提出DMP 要求來提升科研人員的科研數(shù)據(jù)共享效率,后者通過收集、整理高校圖書館提供的科研數(shù)據(jù),以促進高校圖書館的數(shù)據(jù)開放效率。為體現(xiàn)兩者行為對RDMS 水平的影響差異,現(xiàn)分別將數(shù)據(jù)存儲服務供應商水平與資助機構(gòu)DMP 要求提升至原始狀態(tài)的3 倍進行仿真運行實驗,得到的結(jié)果如圖6 所示。
圖6 第三方機構(gòu)行為對科研數(shù)據(jù)管理服務水平的影響
由圖6 可知,無論是提升數(shù)據(jù)存儲服務供應商水平還是提高資助機構(gòu)的DMP 要求,都對高校圖書館的科研數(shù)據(jù)管理服務水平有積極影響。然而,在其他系統(tǒng)變量不變的情況下,提升數(shù)據(jù)存儲服務供應商水平對高校圖書館的RDMS 水平提升具有更大的正面影響。這可能因為資助機構(gòu)的DMP 要求僅是對申請資助的科研人員的最低要求,影響力有限,而數(shù)據(jù)存儲服務供應商可以為多個高校圖書館提供服務,能夠產(chǎn)生更廣泛的影響。
5.3.3 高校圖書館維度
高校圖書館在開展RDMS 方面的行為選擇多樣化,可以通過增加RDMS 種類、提升科研數(shù)據(jù)存儲規(guī)范程度、改善數(shù)據(jù)發(fā)布和開放存儲水平等措施來提升RDMS 水平。在控制其他系統(tǒng)變量水平不變的情況下,本模型進行了仿真運行實驗,并將觀測目標系統(tǒng)變量的水平調(diào)整到原始狀態(tài)的3倍。實驗結(jié)果如圖7 所示。
圖7 高校圖書館行為調(diào)整對科研數(shù)據(jù)管理服務水平的影響
由圖7 可知,提升數(shù)據(jù)發(fā)布和開放存取水平、增加RDMS 種類可以有效提高高校圖書館RDMS水平,但增強科研數(shù)據(jù)存儲規(guī)范程度的效果相對有限。這是因為數(shù)據(jù)的開放和利用階段處于數(shù)據(jù)生命周期的末期,對下一個周期的數(shù)據(jù)循環(huán)影響更為直接。而且高校圖書館針對數(shù)據(jù)開放和利用的行為可以對科研人員產(chǎn)生更明顯的反饋,從而對高校圖書館的研究數(shù)據(jù)管理水平變化產(chǎn)生更顯著的影響。
提升數(shù)據(jù)發(fā)布和開放存取水平、增加RDMS種類以及增強科研數(shù)據(jù)存儲規(guī)范程度分別對高校圖書館的數(shù)據(jù)開放效率、數(shù)據(jù)利用效率和數(shù)據(jù)存儲效率產(chǎn)生影響。圖7 中展示的高校圖書館行為對RDMS 水平的影響變化幅度與之前進行的靈敏度分析結(jié)果相吻合。同時,通過對比圖5、圖6、圖7,可以發(fā)現(xiàn)高校圖書館行為調(diào)整對RDMS水平變化的影響最為顯著,這也符合實際情況中對高校圖書館作為科研數(shù)據(jù)管理服務主體的期望。因此,本文的實驗設計及仿真結(jié)果存在一定的內(nèi)在邏輯一致性。
通過上述實驗,本文得到以下幾點主要發(fā)現(xiàn):
(1)RDMS 系統(tǒng)作為一個龐大的系統(tǒng),有多個利益相關者參與,存在滯后期。這意味著任何改進措施的有效性需要長時間實踐驗證。因此,利益相關者在調(diào)整行為和策略時需要保持一致,以最大程度發(fā)揮影響力。
(2)科研數(shù)據(jù)的總量隨著科研水平的增長而增加,更多的科研數(shù)據(jù)可以使高校圖書館提供更好的數(shù)據(jù)服務體驗。因此,高校圖書館的RDMS水平也會自然增長。
(3)敏感度分析發(fā)現(xiàn),提升數(shù)據(jù)獲取、存儲、開放和利用效率都可以有效提升高校圖書館的RDMS 水平。在橫向比較中,數(shù)據(jù)管理服務對數(shù)據(jù)開放和利用效率的變化最為敏感,其次是存儲和獲取效率。因此,提高科研數(shù)據(jù)的開放、利用效率是提升高校圖書館RDMS 水平最有效的方法。
(4)從政府政策行為的角度來看,增加數(shù)據(jù)開放和數(shù)據(jù)保護政策的支持都對RDMS 水平有正面效果,差異不大。政府政策對RDMS 水平存在一定影響,但相對于高校圖書館自身所能夠帶來的影響而言,其作用相對有限。這可能是因為政府政策主要在整體環(huán)境和趨勢方面發(fā)揮作用,而不直接干預RDMS 行為。
(5)從第三方機構(gòu)行為的角度來看,提高資助機構(gòu)的DMP 要求和數(shù)據(jù)存儲服務供應商水平都能提升RDMS 水平。提升數(shù)據(jù)存儲服務供應商水平的效果更為明顯,應作為第三方機構(gòu)開展服務的主要方向。然而相對于政府和高校圖書館行為,第三方機構(gòu)的影響仍然較弱,因為他們在RDMS 系統(tǒng)中主要起輔助作用。
(6)從高校圖書館行為的角度來看,增加RDMS 的種類、提升科研數(shù)據(jù)的存儲規(guī)范程度以及提高數(shù)據(jù)發(fā)布和開放存取水平都能提升RDMS水平。不過,提高數(shù)據(jù)發(fā)布和開放存取水平以及增加RDMS 種類對RDMS 水平的提升效果最高,應該是高校圖書館后續(xù)發(fā)展的重點。相對于政府和第三方機構(gòu)行為,高校圖書館的影響效果更為明顯,因為他們直接參與數(shù)據(jù)生命周期的各個環(huán)節(jié),直接影響RDMS 水平的變化。
基于此,本文提出以下幾點建議對策:
(1)整合數(shù)據(jù)資源,拓展數(shù)據(jù)開放共享渠道。開放數(shù)據(jù)對于加速研究進程和最大程度利用公共預算來支持研究數(shù)據(jù)生成具有重要意義[36]。目前,國外高校圖書館已經(jīng)采取了多種形式的數(shù)據(jù)開放服務[37],而國內(nèi)高校圖書館在數(shù)據(jù)開放方面還存在一些不足。因此,高校圖書館需要展開合作,拓展數(shù)據(jù)共享渠道,整合數(shù)據(jù)資源。同時,第三方機構(gòu)如高校機構(gòu)知識庫聯(lián)盟和科學數(shù)據(jù)銀行等也應發(fā)揮作用,打破數(shù)據(jù)共享壁壘,構(gòu)建跨高校、行業(yè)和領域的數(shù)據(jù)開放共享平臺。
(2)制定政策明確責任分配標準,創(chuàng)造良好的數(shù)據(jù)開放和保護環(huán)境。政府行為對于數(shù)據(jù)開放和保護領域的長期發(fā)展至關重要。盡管我國在宏觀層面已經(jīng)提出了一系列政策,如《科學數(shù)據(jù)管理辦法》《科學數(shù)據(jù)共享條例》等[7],但在《數(shù)字版權(quán)保護法》等更為嚴格的法律法規(guī)下,仍存在一些責任分配不夠細致、對數(shù)字資源特殊性認識不足等問題[38]。因此,政府需要穩(wěn)定政策環(huán)境,明確侵權(quán)情形和責任分配標準,積極推動數(shù)據(jù)共享和數(shù)據(jù)保護意識的增強。此外,政府還需要詳細規(guī)定侵權(quán)行為的責任分配標準,以減少數(shù)據(jù)濫用,保障數(shù)據(jù)共享權(quán)益,營造良好的數(shù)據(jù)開放和保護氛圍。
(3)為了促進數(shù)據(jù)管理和共享的發(fā)展,需要從第三方機構(gòu)的角度進一步拓展數(shù)據(jù)存儲服務商的渠道,并制定標準化的DMP 要求。當前,我國高校圖書館尚未形成有效的第三方機構(gòu)參與RDMS 的監(jiān)督機制。雖然部分高校圖書館在網(wǎng)站頁面提及了由中國高等教育文獻保障系統(tǒng)(CALIS)主導的RDMS 規(guī)范,但并未詳細介紹其具體內(nèi)容[39]。然而,高校主導的數(shù)據(jù)共享行為很可能導致不同高校之間存在天然的壁壘,不利于數(shù)據(jù)資源的整合和開放共享。斯普林格·自然與中國科學院文獻情報中心的一項社會調(diào)查顯示,35%的國內(nèi)受訪研究者認為,缺乏期刊等機構(gòu)對DMP 的要求是導致研究人員不愿共享數(shù)據(jù)的主要原因[40]。因此,強化第三方機構(gòu)的參與,進一步拓展數(shù)據(jù)存儲服務商的渠道,并標準化DMP 要求,對于整合數(shù)據(jù)共享資源、提高數(shù)據(jù)共享積極性具有積極意義。
(4)從高校圖書館的角度來看,推動RDMS的發(fā)展進程首先需要增加RDMS 的種類,優(yōu)化開放存取等數(shù)據(jù)共享渠道。目前,我國高校圖書館在RDMS 的種類上與發(fā)達國家存在較大差距。例如,發(fā)達國家高校圖書館通常提供科研數(shù)據(jù)管理、開放存取、學術(shù)出版、研究影響力測量、研究導航、研究咨詢、研究工具推薦等七類RDMS,而在國內(nèi)高校圖書館中,北京大學提供了其中的四類RDMS,清華大學提供了其中的兩類,復旦大學僅提供了研究導航服務[41]。此外,我國高校圖書館與國外在RDMS 深度上也存在明顯差距。例如,開放存取作為上述七類RDMS 中開展比例最高的一類[41],在國外高校圖書館中已經(jīng)形成了較為成熟的應用體系,包括開放存取政策指導、開放存取系統(tǒng)建設等。相比之下,我國大多數(shù)高校還處于信息咨詢階段[42]。
因此,我國高校圖書館可以借鑒發(fā)達國家的先進經(jīng)驗,探索個性化、差異化的服務模式,通過增加RDMS 的種類、優(yōu)化開放存取等數(shù)據(jù)共享渠道,構(gòu)建能充分滿足我國科研人員需求的RDMS系統(tǒng)。