国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

科學(xué)數(shù)據(jù)發(fā)布平臺(tái)的組織管理機(jī)制探析

2022-01-10 08:26:38屈亞杰黃國(guó)彬
中國(guó)科技資源導(dǎo)刊 2021年6期
關(guān)鍵詞:數(shù)據(jù)管理科學(xué)用戶

屈亞杰 黃國(guó)彬

(1. 北京舞蹈學(xué)院圖書館,北京 100081;2. 北京師范大學(xué)政府管理學(xué)院,北京 100875)

0 引言

數(shù)據(jù)密集型科學(xué)的發(fā)現(xiàn)使得科學(xué)數(shù)據(jù)的價(jià)值逐步凸顯,在自下而上的數(shù)據(jù)管理需求和自上而下的共享政策的共同推動(dòng)下,越來(lái)越多地建立了科學(xué)數(shù)據(jù)發(fā)布平臺(tái)。從本質(zhì)上看,科學(xué)數(shù)據(jù)發(fā)布平臺(tái)是科研人員之間交流的載體與渠道。目前,國(guó)內(nèi)外關(guān)于對(duì)科學(xué)數(shù)據(jù)發(fā)布平臺(tái)的表述形式多樣,主要有“科學(xué)數(shù)據(jù)平臺(tái)”“科學(xué)數(shù)據(jù)管理平臺(tái)”“科學(xué)數(shù)據(jù)共享平臺(tái)”“科學(xué)數(shù)據(jù)監(jiān)護(hù)平臺(tái)”“科學(xué)數(shù)據(jù)存儲(chǔ)與共享平臺(tái)”“科學(xué)數(shù)據(jù)管理與共享服務(wù)平臺(tái)”等。從廣義上看,與科學(xué)數(shù)據(jù)管理有關(guān)的項(xiàng)目與服務(wù)也在發(fā)布平臺(tái)的范疇之內(nèi),它們不直接存儲(chǔ)原始科學(xué)數(shù)據(jù),而是通過(guò)收割其他發(fā)布平臺(tái)的數(shù)據(jù)目錄開展各項(xiàng)數(shù)據(jù)服務(wù);從狹義上看,科學(xué)數(shù)據(jù)發(fā)布平臺(tái)指的是存儲(chǔ)、管理與共享科學(xué)數(shù)據(jù)及其元數(shù)據(jù)的知識(shí)庫(kù),通過(guò)訪問(wèn)平臺(tái)能夠直接獲取科學(xué)數(shù)據(jù)本身。相比廣義概念,狹義概念的科學(xué)數(shù)據(jù)發(fā)布平臺(tái)直接存儲(chǔ)科學(xué)數(shù)據(jù),在數(shù)據(jù)采集、分類、描述、質(zhì)量控制等方面都有具體要求,在一定程度上保證了科學(xué)數(shù)據(jù)的質(zhì)量。因此,本文采用狹義概念,即科學(xué)數(shù)據(jù)發(fā)布平臺(tái)指的是依托網(wǎng)絡(luò)數(shù)字化技術(shù)建立,采集、存儲(chǔ)、管理與發(fā)布科學(xué)數(shù)據(jù)及其相關(guān)描述性文件的數(shù)據(jù)倉(cāng)儲(chǔ)。

1 研究綜述

(1)科學(xué)數(shù)據(jù)發(fā)布平臺(tái)的建設(shè)情況調(diào)查分析,調(diào)研的角度可分為總體調(diào)研、單一學(xué)科領(lǐng)域調(diào)研和單一國(guó)家調(diào)研。湯子鈺等[1]選擇了20個(gè)國(guó)外代表性數(shù)據(jù)監(jiān)護(hù)平臺(tái),對(duì)其使用的數(shù)據(jù)生命周期模型、技術(shù)規(guī)范、組件、軟件工具、功能等各方面進(jìn)行了全面的調(diào)研。姜穎[2]以英國(guó)環(huán)境領(lǐng)域數(shù)據(jù)發(fā)布平臺(tái)為調(diào)研對(duì)象,張莎莎等[3]則選取英國(guó)247個(gè)科學(xué)數(shù)據(jù)發(fā)布平臺(tái)為研究對(duì)象,研究了英國(guó)科學(xué)數(shù)據(jù)發(fā)布平臺(tái)的特點(diǎn)。

(2)科學(xué)數(shù)據(jù)發(fā)布平臺(tái)案例分析。王丹丹等[4]以德國(guó)社會(huì)科學(xué)數(shù)據(jù)管理與服務(wù)平臺(tái)Sowi Data Net|Datorium為例,重點(diǎn)闡釋其構(gòu)建情況、功能與特色以及先進(jìn)經(jīng)驗(yàn)。Rousidis等[5]以Dryad科學(xué)數(shù)據(jù)存儲(chǔ)庫(kù)為例,闡釋了Dryad的主題元數(shù)據(jù)元素和數(shù)據(jù)質(zhì)量問(wèn)題。

(3)科學(xué)數(shù)據(jù)發(fā)布平臺(tái)中某方面內(nèi)容建設(shè)的研究,包括數(shù)據(jù)管理、數(shù)據(jù)組織、系統(tǒng)選型、元數(shù)據(jù)等。司莉等[6]分析了國(guó)家科技基礎(chǔ)條件平臺(tái)項(xiàng)目下的6家科學(xué)數(shù)據(jù)共享平臺(tái)在數(shù)據(jù)組織方面的現(xiàn)狀及改進(jìn)意義 。

(4)科學(xué)數(shù)據(jù)發(fā)布平臺(tái)的比較研究,以國(guó)內(nèi)外比較研究為主。袁夢(mèng)雪[7]從建設(shè)基礎(chǔ)和管理過(guò)程兩個(gè)維度對(duì)比分析了國(guó)內(nèi)外11個(gè)健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理平臺(tái)的建設(shè)實(shí)踐。

(5)科學(xué)數(shù)據(jù)發(fā)布平臺(tái)的優(yōu)化與評(píng)價(jià)研究。Silva等[8]提出將Dendro(原型研究數(shù)據(jù)管理平臺(tái))與EUDAT B2Share模塊進(jìn)行整合,以實(shí)現(xiàn)為研究人員提供從數(shù)據(jù)準(zhǔn)備、描述到存儲(chǔ)的簡(jiǎn)化且完整的工作流程的目標(biāo)。李贊梅等[9]研究并構(gòu)建了針對(duì)人口健康平臺(tái)資源的綜合評(píng)價(jià)指標(biāo)體系,從資源主題、資源質(zhì)量、數(shù)據(jù)規(guī)模、服務(wù)能力、服務(wù)成效和來(lái)源版權(quán)等維度對(duì)資源進(jìn)行綜合評(píng)價(jià)。

建設(shè)科學(xué)數(shù)據(jù)發(fā)布平臺(tái)需要考慮選擇何種系統(tǒng)軟件進(jìn)行構(gòu)建、建設(shè)的資金從哪些渠道獲取、科學(xué)數(shù)據(jù)的采集存儲(chǔ)與組織如何開展、平臺(tái)的檢索和使用有哪些注意事項(xiàng)等很多因素。但總的來(lái)說(shuō)包括組織管理、內(nèi)容建設(shè)和功能設(shè)計(jì)3個(gè)層次?,F(xiàn)有文獻(xiàn)對(duì)科學(xué)數(shù)據(jù)發(fā)布平臺(tái)的組織管理問(wèn)題雖有涉及,但系統(tǒng)探討的較少。因此,本文將科學(xué)數(shù)據(jù)發(fā)布平臺(tái)的組織管理作為研究重點(diǎn),以英、美國(guó)家建設(shè)的科學(xué)數(shù)據(jù)平臺(tái)為調(diào)研樣本,探討平臺(tái)的組織管理機(jī)制。

2 調(diào)研對(duì)象與方法

re3data是一個(gè)匯集全球不同學(xué)科與類型科學(xué)數(shù)據(jù)發(fā)布平臺(tái)的注冊(cè)目錄系統(tǒng),由德國(guó)研究基金會(huì)資助,于2013年5月正式啟動(dòng)。截至2021年2月28日,共有2 635個(gè)科學(xué)數(shù)據(jù)發(fā)布平臺(tái)在此注冊(cè)。其中,排名前三位的國(guó)家分別是美國(guó)(1 103個(gè))、德國(guó)(435個(gè))、英國(guó)(297個(gè))。由于受語(yǔ)言的限制,兼顧平臺(tái)類型的均衡性,本文選擇英、美國(guó)家建設(shè)較好的8個(gè)科學(xué)數(shù)據(jù)發(fā)布平臺(tái)為調(diào)研樣本,具體情況如表1。筆者采用網(wǎng)絡(luò)調(diào)查法訪問(wèn)各平臺(tái),并基于調(diào)研結(jié)果,從依托軟件、建設(shè)模式、資金來(lái)源和管理政策等4個(gè)方面分析其組織管理機(jī)制。

表1 科學(xué)數(shù)據(jù)發(fā)布平臺(tái)樣本概況

3 組織管理機(jī)制內(nèi)容剖析

科學(xué)數(shù)據(jù)發(fā)布平臺(tái)的組織管理機(jī)制指的是為保證平臺(tái)的順利建設(shè)所需要的前提條件,是平臺(tái)建設(shè)的基礎(chǔ)保障,可細(xì)分為依托軟件、建設(shè)模式、資金來(lái)源和管理政策。

3.1 依托軟件

科學(xué)數(shù)據(jù)發(fā)布平臺(tái)建設(shè)離不開系統(tǒng)軟件的支撐,這是平臺(tái)建設(shè)的技術(shù)基礎(chǔ)。當(dāng)前,可用于構(gòu)建科學(xué)數(shù)據(jù)發(fā)布平臺(tái)的軟件類型主要有商業(yè)軟件和開源軟件。這些軟件在商業(yè)模式、學(xué)科范圍、核心功能等方面存在差異,而如何選擇適合的依托軟件是建設(shè)科學(xué)數(shù)據(jù)發(fā)布平臺(tái)時(shí)不可忽視的重要問(wèn)題。

所謂商業(yè)軟件,指的是作為商品進(jìn)行交易的軟件,所有權(quán)屬于商業(yè)公司,一般需要付費(fèi)并在嚴(yán)格的商業(yè)協(xié)議下被授權(quán)使用,附有一定年限的技術(shù)支持,不提供源代碼,基本上不能進(jìn)行二次開發(fā)。例如,Nesstar是由UKDA和NSD(挪威社會(huì)科學(xué)數(shù)據(jù)服務(wù)局)共同開發(fā)的商業(yè)軟件,能夠處理調(diào)查數(shù)據(jù)、多維表、文本資源等,支持?jǐn)?shù)據(jù)的檢索、瀏覽、上傳與下載、在線分析、數(shù)據(jù)可視化、數(shù)據(jù)關(guān)聯(lián)文獻(xiàn)等功能。而開源軟件,指的是源代碼可以被公眾使用的軟件,其所有權(quán)一般屬于某個(gè)開源團(tuán)體,用戶可以免費(fèi)使用,雖然沒(méi)有承諾提供免費(fèi)的技術(shù)支持,但可以通過(guò)各種社區(qū)和論壇尋求幫助,并且由于提供了源代碼,具備開發(fā)能力的個(gè)人或機(jī)構(gòu)都可以進(jìn)行二次開發(fā)。目前應(yīng)用較多的開源軟件有Dataverse和DSpace。

調(diào)研發(fā)現(xiàn),樣本平臺(tái)中只有英國(guó)國(guó)家數(shù)據(jù)存儲(chǔ)庫(kù)(UKDA)選擇了商業(yè)軟件,采用Nesstar作為平臺(tái)支撐,其他平臺(tái)選擇開源軟件作為其技術(shù)實(shí)現(xiàn)方式。例如,奧德姆研究所數(shù)據(jù)存儲(chǔ)庫(kù)(Odum Institute Data Archive)依托Dataverse建設(shè)平臺(tái),明尼蘇達(dá)大學(xué)數(shù)據(jù)存儲(chǔ)庫(kù)(DRUM)依托DSpace建設(shè)平臺(tái)??傮w來(lái)說(shuō),開源軟件因其便于開發(fā)、節(jié)省成本等優(yōu)點(diǎn)受到平臺(tái)建設(shè)主體的青睞。但是在進(jìn)行科學(xué)數(shù)據(jù)發(fā)布平臺(tái)建設(shè)時(shí),依托軟件的選擇受到多種因素的制約,包括建設(shè)主體的資金情況、平臺(tái)所存儲(chǔ)和管理數(shù)據(jù)的學(xué)科范圍、平臺(tái)擬實(shí)現(xiàn)的核心功能情況等,因此平臺(tái)建設(shè)主體應(yīng)綜合考慮。

3.2 建設(shè)模式

所謂建設(shè)模式,指的是建設(shè)者協(xié)調(diào)分配所需資源的具體方法和形式。從建設(shè)參與主體類型的角度,可將平臺(tái)的建設(shè)模式分為自行建設(shè)與合作建設(shè)。這兩種建設(shè)模式并無(wú)優(yōu)劣之分,不論何種建設(shè)方式都有其優(yōu)缺點(diǎn)。

自行建設(shè)指的是平臺(tái)建設(shè)主體僅有一種類型(如研究機(jī)構(gòu)),該主體自行解決平臺(tái)建設(shè)中可能遇到的技術(shù)、資金、管理等方面的問(wèn)題。這種建設(shè)模式的優(yōu)點(diǎn)是由于不涉及機(jī)構(gòu)之間的協(xié)調(diào)溝通工作,避免了不必要的溝通協(xié)調(diào)的麻煩,建設(shè)效率較高,而其缺點(diǎn)是資金來(lái)源渠道少,在技術(shù)和管理工作方面存在挑戰(zhàn)。合作建設(shè)指的是平臺(tái)的建設(shè)主體有多種類型(如研究機(jī)構(gòu)、科研資助機(jī)構(gòu)、政府部門、基金會(huì)組織等),在進(jìn)行平臺(tái)建設(shè)時(shí)多種主體之間相互協(xié)作,承擔(dān)的職責(zé)包括提供資金、提供技術(shù)支持和提供一般協(xié)助等。這類建設(shè)方式有兩種類型:一是合作建設(shè)主體中僅有一個(gè)研究機(jī)構(gòu),平臺(tái)的具體建設(shè)和維護(hù)工作主要由該機(jī)構(gòu)負(fù)責(zé),其他主體一般是科研資助機(jī)構(gòu)或政府機(jī)構(gòu)等類型;二是合作建設(shè)主體中存在多個(gè)研究機(jī)構(gòu),一般會(huì)選擇某一個(gè)研究機(jī)構(gòu)負(fù)責(zé)平臺(tái)的具體建設(shè)或維護(hù)工作,其他研究機(jī)構(gòu)和其他類型主體提供資金、技術(shù)或資源方面的協(xié)助。不論何種類型,合作建設(shè)具有無(wú)可比擬的優(yōu)點(diǎn),即有充足的資金來(lái)源與保障、有成熟的技術(shù)支持和管理經(jīng)驗(yàn)。其缺點(diǎn)是由于多種主體之間需要相互溝通協(xié)作,對(duì)建設(shè)效率產(chǎn)生一定影響。

調(diào)研發(fā)現(xiàn),樣本平臺(tái)中僅有明尼蘇達(dá)大學(xué)數(shù)據(jù)存儲(chǔ)庫(kù)和利茲大學(xué)數(shù)據(jù)存儲(chǔ)庫(kù)選擇了自行建設(shè)模式,其他平臺(tái)選擇了合作建設(shè)模式。明尼蘇達(dá)大學(xué)數(shù)據(jù)存儲(chǔ)庫(kù)主要依靠學(xué)??蒲谢鸬闹С?,由明尼蘇達(dá)大學(xué)圖書館進(jìn)行建設(shè);英國(guó)數(shù)據(jù)存儲(chǔ)庫(kù)的建設(shè)模式是多個(gè)主體合作建設(shè),主要是埃塞克斯大學(xué)、經(jīng)濟(jì)和社會(huì)研究理事會(huì)、國(guó)家檔案館、聯(lián)合信息系統(tǒng)委員會(huì)等,其中后三者提供資金支持,埃塞克斯大學(xué)提供技術(shù)支持并負(fù)責(zé)具體建設(shè)和維護(hù)[10]。總結(jié)來(lái)說(shuō),對(duì)于收錄范圍不大和服務(wù)對(duì)象不多的機(jī)構(gòu)級(jí)存儲(chǔ)庫(kù)來(lái)說(shuō),選擇自行建設(shè)方式能夠提高建設(shè)效率;對(duì)于聯(lián)盟性質(zhì)的數(shù)據(jù)存儲(chǔ)庫(kù)或大型數(shù)據(jù)中心而言,合作建設(shè)的方式有助于獲取多個(gè)主體在資金、技術(shù)及管理方面的支持。

3.3 資金來(lái)源

穩(wěn)定、充足、集中的經(jīng)費(fèi)支持是保障科學(xué)數(shù)據(jù)發(fā)布平臺(tái)順利建設(shè)的重要條件之一。那么,能夠從哪些途徑獲取平臺(tái)建設(shè)的所需資金是建設(shè)主體必須思考的問(wèn)題。所謂資金來(lái)源,指的是科學(xué)數(shù)據(jù)發(fā)布平臺(tái)建設(shè)所需資金的獲取渠道。調(diào)研發(fā)現(xiàn),平臺(tái)獲取建設(shè)資金的渠道主要有科研資助機(jī)構(gòu)資助、政府機(jī)構(gòu)撥款、高??蒲谢?、其他渠道(如基金會(huì)、會(huì)員費(fèi)用)等樣本平臺(tái)的資金來(lái)源情況如表2所示。

表2 樣本科學(xué)數(shù)據(jù)發(fā)布平臺(tái)的資金來(lái)源統(tǒng)計(jì)表

3.3.1 科研資助機(jī)構(gòu)資助

不論是學(xué)科型科學(xué)數(shù)據(jù)發(fā)布平臺(tái),還是機(jī)構(gòu)型科學(xué)數(shù)據(jù)發(fā)布平臺(tái),科研資助機(jī)構(gòu)資助都是其開展建設(shè)的主要經(jīng)費(fèi)來(lái)源。這是因?yàn)?,一方面,科研資助機(jī)構(gòu)的職責(zé)就是為科學(xué)研究提供資金支持,而科學(xué)數(shù)據(jù)發(fā)布平臺(tái)是管理科學(xué)數(shù)據(jù)的重要載體;另一方面,很多科研資助機(jī)構(gòu)在其資助政策中明確要求研究人員將產(chǎn)出的科學(xué)數(shù)據(jù)存儲(chǔ)在平臺(tái)中,必然會(huì)支持科學(xué)數(shù)據(jù)發(fā)布平臺(tái)的建設(shè)。例如,英國(guó)科學(xué)數(shù)據(jù)檔案存儲(chǔ)庫(kù)主要由經(jīng)濟(jì)與社會(huì)研究理事會(huì)(ESRC)資助建設(shè),同時(shí)英國(guó)聯(lián)合信息系統(tǒng)委員會(huì)(JISC)、歐盟委員會(huì)第七框架計(jì)劃、環(huán)境研究理事會(huì)(NERC)、工程與物理科學(xué)研究理事會(huì)(EPSRC)及生物技術(shù)和生物科學(xué)研究理事會(huì)(BBSRC)等也提供了資金支持[11]。

3.3.2 政府機(jī)構(gòu)撥款

對(duì)于國(guó)家級(jí)科學(xué)數(shù)據(jù)發(fā)布平臺(tái)而言,其經(jīng)費(fèi)來(lái)源還包括政府機(jī)構(gòu)撥款。這類平臺(tái)所存儲(chǔ)和管理的數(shù)據(jù)通常是國(guó)家大型項(xiàng)目所產(chǎn)出的數(shù)據(jù),服務(wù)范圍一般是面向全國(guó)或全球,因而更容易受到政府部門的重視。如管理和分發(fā)關(guān)于冰凍地區(qū)研究而產(chǎn)出的雪、冰、冰川、冰凍地面、氣候等科學(xué)數(shù)據(jù)的美國(guó)國(guó)家冰雪數(shù)據(jù)中心(NSIDC),該平臺(tái)的建設(shè)受到國(guó)家航空航天局(NASA)、國(guó)家海洋和大氣管理局(NOAA)等聯(lián)邦機(jī)構(gòu)的資金支持[12]。同時(shí),隨著政務(wù)公開實(shí)踐的發(fā)展,行政記錄數(shù)據(jù)和事務(wù)數(shù)據(jù)的共享程度逐步提高,政府機(jī)構(gòu)愿意通過(guò)科學(xué)數(shù)據(jù)發(fā)布平臺(tái)存儲(chǔ)、管理與共享其政務(wù)數(shù)據(jù),因此會(huì)與平臺(tái)建設(shè)者開展合作,相應(yīng)地也會(huì)給予資金支持。

3.3.3 高??蒲谢?/p>

對(duì)于機(jī)構(gòu)型科學(xué)數(shù)據(jù)發(fā)布平臺(tái)而言,高??蒲谢鹗瞧溟_展建設(shè)的重要經(jīng)費(fèi)來(lái)源。這類平臺(tái)一般是由某個(gè)高校主要負(fù)責(zé)建設(shè),建設(shè)目標(biāo)通常是存儲(chǔ)、管理和共享本機(jī)構(gòu)內(nèi)科研人員通過(guò)項(xiàng)目或研究產(chǎn)出的科學(xué)數(shù)據(jù),以提高科學(xué)數(shù)據(jù)的利用價(jià)值,為科研人員提供便利,在某種程度上對(duì)高校科研能力產(chǎn)生積極影響?;诖耍咝T陂_展經(jīng)費(fèi)預(yù)算工作時(shí)會(huì)將部分科研基金用于科學(xué)數(shù)據(jù)發(fā)布平臺(tái)的建設(shè)方面。例如,美國(guó)明尼蘇達(dá)大學(xué)數(shù)據(jù)存儲(chǔ)庫(kù)、英國(guó)布里斯托大學(xué)數(shù)據(jù)存儲(chǔ)庫(kù)的建設(shè)都離不開所在高??蒲谢鸬闹С?。

除了科研資助機(jī)構(gòu)資助、政府機(jī)構(gòu)撥款和高校科研基金,科學(xué)數(shù)據(jù)發(fā)布平臺(tái)建設(shè)的資金來(lái)源還包括基金會(huì)、會(huì)員費(fèi)用等。如英國(guó)布里斯托大學(xué)數(shù)據(jù)存儲(chǔ)庫(kù)的建立還得到了Leverhulme Trust基金會(huì)的資助。美國(guó)校際社會(huì)科學(xué)數(shù)據(jù)共享聯(lián)盟存儲(chǔ)庫(kù)是由密歇根大學(xué)社會(huì)研究中心建立,實(shí)行會(huì)員制管理,目前有750多家科研機(jī)構(gòu)是其會(huì)員,除政府機(jī)構(gòu)和私人基金會(huì)外,會(huì)員費(fèi)用是其重要的資金來(lái)源。

3.4 管理政策

管理政策指的是為促進(jìn)平臺(tái)順利建設(shè)及持續(xù)發(fā)展而制定的關(guān)于平臺(tái)數(shù)據(jù)資源與用戶管理的各項(xiàng)制度與規(guī)則。調(diào)研發(fā)現(xiàn),樣本平臺(tái)的數(shù)據(jù)管理政策主要包括數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)訪問(wèn)、用戶使用條款及隱私等方面的內(nèi)容。這些管理政策一方面有助于平臺(tái)建設(shè)者有序開展科學(xué)數(shù)據(jù)管理工作;另一方面有助于用戶明晰科學(xué)數(shù)據(jù)的管理流程,提升其對(duì)平臺(tái)的信任度,從而愿意將研究中產(chǎn)出的科學(xué)數(shù)據(jù)存儲(chǔ)到相應(yīng)的平臺(tái)進(jìn)行管理。

3.4.1 數(shù)據(jù)采集政策

采集數(shù)據(jù)是平臺(tái)管理或共享科學(xué)數(shù)據(jù)的前提條件,而數(shù)據(jù)采集政策會(huì)對(duì)數(shù)據(jù)來(lái)源、數(shù)據(jù)范圍、數(shù)據(jù)格式、數(shù)據(jù)采集標(biāo)準(zhǔn)等內(nèi)容做出相應(yīng)的規(guī)定。如《ICPSR數(shù)據(jù)收集發(fā)展政策》規(guī)定,ICPSR主要收集社會(huì)學(xué)、政治學(xué)、經(jīng)濟(jì)學(xué)、人類學(xué)、考古學(xué)等人文社科類科學(xué)數(shù)據(jù);在數(shù)據(jù)格式方面,ICPSR傾向于收集可在各種計(jì)算和技術(shù)環(huán)境中訪問(wèn)的數(shù)據(jù)格式,如SAS格式、SPSS格式及Stata格式。非社會(huì)和行為研究數(shù)據(jù)、帶有直接標(biāo)識(shí)符的數(shù)據(jù)、有限訪問(wèn)權(quán)的數(shù)據(jù)等不屬于ICPSR的數(shù)據(jù)收集范圍[13]。《UKDS數(shù)據(jù)收集發(fā)展政策》要求采集的科學(xué)數(shù)據(jù)具有高質(zhì)量、權(quán)威性、可靠性等特點(diǎn),具有重要的科學(xué)或歷史價(jià)值,屬于新的數(shù)據(jù)來(lái)源或類型并對(duì)國(guó)際研究具有價(jià)值等[14]。

3.4.2 數(shù)據(jù)存儲(chǔ)政策

數(shù)據(jù)存儲(chǔ)政策會(huì)對(duì)存儲(chǔ)內(nèi)容、存儲(chǔ)方式、存儲(chǔ)要求等作出規(guī)定。明確的數(shù)據(jù)存儲(chǔ)政策能夠?yàn)檠芯咳藛T提交數(shù)據(jù)提供便利。也能夠減輕平臺(tái)數(shù)據(jù)管理人員的咨詢壓力。如《BODC數(shù)據(jù)存儲(chǔ)通用指南》規(guī)定,BODC提供多種數(shù)據(jù)提交方式,包括電子郵件、DVD,CDROM或軟盤(Zip或軟盤)上的標(biāo)準(zhǔn)郵件、可訪問(wèn)的ftp站點(diǎn)等;提交的數(shù)據(jù)集必須包含相關(guān)描述文件(元數(shù)據(jù))[15]。關(guān)于元數(shù)據(jù),《RDL數(shù)據(jù)存儲(chǔ)指南》規(guī)定,其內(nèi)容應(yīng)包括數(shù)據(jù)集標(biāo)題、創(chuàng)作者、數(shù)據(jù)集描述(抽象)、項(xiàng)目名稱、資助者、授權(quán)號(hào)、學(xué)術(shù)科目等[16]。在存儲(chǔ)要求方面,《DRDR數(shù)據(jù)存儲(chǔ)指南》規(guī)定,除了存儲(chǔ)的數(shù)據(jù)之外,頂級(jí)文件夾還必須包含一個(gè)名為“readme.txt”的文件,該文件包含數(shù)據(jù)集清單信息、使用數(shù)據(jù)所需的任何特定操作系統(tǒng)或軟件信息、表格數(shù)據(jù)的描述信息等。文件格式最好用開放文件格式[17]。

3.4.3 數(shù)據(jù)訪問(wèn)政策

雖然科學(xué)數(shù)據(jù)發(fā)布平臺(tái)盡可能地促進(jìn)科學(xué)數(shù)據(jù)的共享、發(fā)現(xiàn)與重用,但并不是所有的科學(xué)數(shù)據(jù)都適合完全開放的發(fā)布方式,比如有些涉及受試者個(gè)人信息的數(shù)據(jù)就需要設(shè)置一定的限制。因而,數(shù)據(jù)訪問(wèn)政策要對(duì)不同級(jí)別的數(shù)據(jù)設(shè)置相應(yīng)的訪問(wèn)條件。如《UKDS數(shù)據(jù)訪問(wèn)政策》將平臺(tái)發(fā)布的數(shù)據(jù)分為開放數(shù)據(jù)、保護(hù)數(shù)據(jù)和控制數(shù)據(jù)3個(gè)級(jí)別,并規(guī)定了相應(yīng)級(jí)別數(shù)據(jù)的訪問(wèn)條件。開放數(shù)據(jù)不要求用戶在UKDS注冊(cè),但可能需要遵循開放政府許可證(OGL)或知識(shí)共享許可協(xié)議(CC),而受保護(hù)和受控?cái)?shù)據(jù)除要求用戶注冊(cè),還會(huì)有一些附加條件,如填寫特殊許可表單[18]。《DRDR數(shù)據(jù)訪問(wèn)指南》對(duì)受限數(shù)據(jù)的訪問(wèn)申請(qǐng)做了詳細(xì)規(guī)定:受限數(shù)據(jù)不提供給個(gè)人;接受任何組織的任何申請(qǐng);當(dāng)平臺(tái)管理者收到訪問(wèn)申請(qǐng)后,會(huì)檢查申請(qǐng)者所提供信息的完整性和是否滿足相關(guān)條件,如所申請(qǐng)的數(shù)據(jù)集是否可以通過(guò)該存儲(chǔ)卡獲取、是否提供了可驗(yàn)證的機(jī)構(gòu)信息和機(jī)構(gòu)聯(lián)系方式、是否有機(jī)構(gòu)簽署人等;符合條件的申請(qǐng)者所在機(jī)構(gòu)簽署人會(huì)收到數(shù)據(jù)訪問(wèn)協(xié)議,簽署并返回協(xié)議后,平臺(tái)管理者將會(huì)安排對(duì)數(shù)據(jù)集進(jìn)行安全訪問(wèn)[19]。

3.4.4 用戶政策

用戶是科學(xué)數(shù)據(jù)發(fā)布平臺(tái)所存儲(chǔ)和發(fā)布數(shù)據(jù)的使用者,平臺(tái)建設(shè)過(guò)程中除了考慮如何管理數(shù)據(jù)的問(wèn)題,也應(yīng)當(dāng)對(duì)用戶予以重視,制定有關(guān)用戶的相應(yīng)政策,如《用戶使用條款》和《用戶隱私政策》。一方面能夠規(guī)范用戶對(duì)平臺(tái)的使用行為,另一方面能夠保障用戶的合法權(quán)益。如《UNC Dataverse使用條款》在用戶對(duì)象、用戶注冊(cè)、用戶提交數(shù)據(jù)、用戶使用數(shù)據(jù)許可協(xié)議等方面做出了相關(guān)規(guī)定。針對(duì)用戶注冊(cè),要求用戶需向奧德姆研究所數(shù)據(jù)存儲(chǔ)庫(kù)提供準(zhǔn)確、完整和更新的注冊(cè)信息,同時(shí)應(yīng)全權(quán)負(fù)責(zé)個(gè)人賬戶的活動(dòng),確保服務(wù)密碼的機(jī)密性,未經(jīng)其他用戶的明確許可,不得使用其他用戶的賬戶[20]。《DRUM用戶使用條款》規(guī)定了用戶在下載或使用數(shù)據(jù)時(shí)應(yīng)當(dāng)遵循的一些條款,如用戶使用從DRUM獲取的數(shù)據(jù)時(shí)應(yīng)對(duì)數(shù)據(jù)作者標(biāo)注引用;如果數(shù)據(jù)需要獲得許可,請(qǐng)直接聯(lián)系數(shù)據(jù)作者[21]?!禝CPSR隱私政策》指出,除非用戶向ICPSR提供信息,否則ICPSR不收集除了用戶訪問(wèn)平臺(tái)時(shí)自動(dòng)收集和存儲(chǔ)信息之外的任何信息。而平臺(tái)自動(dòng)收集和存儲(chǔ)的信息主要包括訪問(wèn)平臺(tái)的計(jì)算機(jī)IP地址、訪問(wèn)的日期、訪問(wèn)網(wǎng)頁(yè)、訪問(wèn)者計(jì)算機(jī)的操作系統(tǒng)、訪問(wèn)平臺(tái)時(shí)使用的Web瀏覽器版本[22]。

4 對(duì)我國(guó)科學(xué)數(shù)據(jù)發(fā)布平臺(tái)建設(shè)的啟示

4.1 我國(guó)科學(xué)數(shù)據(jù)發(fā)布平臺(tái)的建設(shè)現(xiàn)狀

近年來(lái),我國(guó)政府部門、高校及研究所等主體在平臺(tái)建設(shè)方面做了很多積極的探索。2013年5月,《國(guó)務(wù)院關(guān)于印發(fā)“十二五”國(guó)家自主創(chuàng)新能力建設(shè)規(guī)劃的通知》強(qiáng)調(diào),要加快科學(xué)數(shù)據(jù)平臺(tái)建設(shè),構(gòu)建科技資源從數(shù)據(jù)獲取、存儲(chǔ)、處理、挖掘到開放共享的完整信息服務(wù)鏈[23]。2018年4月,國(guó)務(wù)院辦公廳發(fā)布了《科學(xué)數(shù)據(jù)管理辦法》,指出國(guó)務(wù)院科學(xué)技術(shù)行政部門統(tǒng)籌推進(jìn)科學(xué)數(shù)據(jù)中心建設(shè)與發(fā)展,有關(guān)科研院所、高等院校和企業(yè)等法人單位是科學(xué)數(shù)據(jù)管理的責(zé)任主體,按照有關(guān)標(biāo)準(zhǔn)進(jìn)行科學(xué)數(shù)據(jù)采集生產(chǎn)、加工整理和長(zhǎng)期保存,確保數(shù)據(jù)質(zhì)量[24]??萍疾俊翱茖W(xué)數(shù)據(jù)共享工程”建設(shè)了6家學(xué)科性平臺(tái),并且復(fù)旦大學(xué)社會(huì)科學(xué)數(shù)據(jù)管理平臺(tái)、高??茖W(xué)數(shù)據(jù)共享平臺(tái)、北京大學(xué)開放研究數(shù)據(jù)平臺(tái)等先后建成。

近年來(lái),雖然我國(guó)科學(xué)數(shù)據(jù)發(fā)布平臺(tái)發(fā)展迅速,但是因處于發(fā)展初期階段,與國(guó)外較成熟的科學(xué)數(shù)據(jù)發(fā)布平臺(tái)相比,還存在著諸如資金來(lái)源渠道單一、數(shù)據(jù)管理政策數(shù)量不均衡等組織管理問(wèn)題。具體表現(xiàn):一是我國(guó)科學(xué)數(shù)據(jù)發(fā)布平臺(tái)的建設(shè)經(jīng)費(fèi)主要來(lái)源于國(guó)家財(cái)政支持。如國(guó)家地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺(tái)的建設(shè)資金來(lái)源主要是國(guó)家科技基礎(chǔ)條件平臺(tái)建設(shè)與運(yùn)行服務(wù)經(jīng)費(fèi)。二是數(shù)據(jù)管理政策數(shù)量不均衡。有的平臺(tái)制定了完善的數(shù)據(jù)管理政策,基本涵蓋數(shù)據(jù)管理全生命周期的各個(gè)階段,而有的平臺(tái)的數(shù)據(jù)管理政策僅涉及某個(gè)管理階段。如地震科學(xué)數(shù)據(jù)共享平臺(tái)先后制定了《地震科學(xué)數(shù)據(jù)共享中心運(yùn)行管理規(guī)范》《地震科學(xué)數(shù)據(jù)發(fā)布規(guī)范》等12個(gè)標(biāo)準(zhǔn)規(guī)范,農(nóng)業(yè)科學(xué)數(shù)據(jù)共享中心僅有1個(gè)涉及數(shù)據(jù)管理的規(guī)范。因此,在建設(shè)科學(xué)數(shù)據(jù)發(fā)布平臺(tái)時(shí),我國(guó)相關(guān)主體可借鑒國(guó)外科學(xué)數(shù)據(jù)發(fā)布平臺(tái)組織管理的經(jīng)驗(yàn)。

4.2 我國(guó)科學(xué)數(shù)據(jù)發(fā)布平臺(tái)的建設(shè)思路

4.2.1 理性選擇依托軟件

科學(xué)數(shù)據(jù)發(fā)布平臺(tái)的構(gòu)建方式包括自主開發(fā)軟件系統(tǒng)、購(gòu)買商業(yè)軟件系統(tǒng)和利用開源軟件進(jìn)行二次開發(fā)。由于自主開發(fā)的難度較大,商業(yè)軟件系統(tǒng)價(jià)格昂貴,建議國(guó)內(nèi)科學(xué)數(shù)據(jù)發(fā)布平臺(tái)優(yōu)先選擇利用開源軟件進(jìn)行二次開發(fā)這種構(gòu)建方式。目前,應(yīng)用較廣的開源軟件有Dataverse、DSpace等,這些開源軟件各有特點(diǎn),支持的數(shù)據(jù)管理功能也存在差異。國(guó)內(nèi)科學(xué)數(shù)據(jù)發(fā)布平臺(tái)的建設(shè)者在選擇開源軟件時(shí),需要結(jié)合實(shí)際情況,對(duì)開源軟件在學(xué)科范圍、核心功能、服務(wù)模式等方面進(jìn)行比較評(píng)估,必要時(shí)對(duì)這些軟件進(jìn)行實(shí)地部署測(cè)試,以選擇適合的開源軟件。另外,在二次開發(fā)時(shí)可適當(dāng)增加一些本地化功能,如平臺(tái)與單位統(tǒng)一認(rèn)證系統(tǒng)的對(duì)接、數(shù)據(jù)申請(qǐng)與審核功能的優(yōu)化、權(quán)限管理更加靈活等。

4.2.2 密切機(jī)構(gòu)合作交流

在建設(shè)科學(xué)數(shù)據(jù)發(fā)布平臺(tái)時(shí),無(wú)論是采用自行建設(shè)模式還是合作建設(shè)模式,都離不開多個(gè)機(jī)構(gòu)或部門之間的協(xié)調(diào)配合。在自行建設(shè)模式下,雖然平臺(tái)建設(shè)所需的資金、技術(shù)等要素都來(lái)自于某一個(gè)建設(shè)主體,但具體開展建設(shè)時(shí),依然需要該主體下屬的其他部門的幫助和支持。如明尼蘇達(dá)大學(xué)數(shù)據(jù)存儲(chǔ)庫(kù)主要依靠學(xué)??蒲谢鸬闹С?,由明尼蘇達(dá)大學(xué)圖書館進(jìn)行建設(shè),但數(shù)據(jù)管理的全面性超出了任何一個(gè)單一的大學(xué)單位甚至單一機(jī)構(gòu)的能力,所以該校圖書館努力與明尼蘇達(dá)超級(jí)計(jì)算機(jī)研究所、明尼蘇達(dá)信息學(xué)研究所等協(xié)調(diào)合作。在合作建設(shè)模式下,平臺(tái)的建設(shè)主體通常包括多種類型,如研究機(jī)構(gòu)、科研資助機(jī)構(gòu)、政府部門、基金會(huì)組織等,他們各司其職,或者提供資金支持,或者提供技術(shù)指導(dǎo),或者負(fù)責(zé)平臺(tái)的日常維護(hù)。其典型的案例是英國(guó)數(shù)據(jù)存儲(chǔ)庫(kù),由經(jīng)濟(jì)和社會(huì)研究理事會(huì)、國(guó)家檔案館、聯(lián)合信息系統(tǒng)委員會(huì)等資助機(jī)構(gòu)提供資金支持,由埃塞克斯大學(xué)提供技術(shù)支持,并負(fù)責(zé)具體建設(shè)和維護(hù)。因此,我國(guó)科學(xué)數(shù)據(jù)發(fā)布平臺(tái)在建設(shè)過(guò)程時(shí),無(wú)論是采用何種建設(shè)模式,都要積極加強(qiáng)機(jī)構(gòu)或部門間的合作交流,積極尋求如國(guó)家自然科學(xué)基金委員會(huì)或國(guó)家哲學(xué)社會(huì)科學(xué)規(guī)劃辦公室的經(jīng)費(fèi)支持,或者與單位內(nèi)的技術(shù)部門進(jìn)行合作,以推動(dòng)平臺(tái)的順利建設(shè)。

4.2.3 拓寬資金來(lái)源渠道

建設(shè)科學(xué)數(shù)據(jù)發(fā)布平臺(tái)時(shí),不論是軟件開發(fā)、數(shù)據(jù)處理還是網(wǎng)站設(shè)計(jì)都需要充足的經(jīng)費(fèi),這是平臺(tái)建設(shè)的基礎(chǔ)保障。然而,目前我國(guó)科學(xué)數(shù)據(jù)發(fā)布平臺(tái)的建設(shè)經(jīng)費(fèi)通常來(lái)自國(guó)家財(cái)政支持,存在資金來(lái)源渠道單一的問(wèn)題,一旦國(guó)家財(cái)政的支持力度減小,平臺(tái)建設(shè)就舉步維艱。因此,建議國(guó)內(nèi)科學(xué)數(shù)據(jù)發(fā)布平臺(tái)的建設(shè)者借鑒國(guó)外平臺(tái)的相關(guān)經(jīng)驗(yàn),積極拓寬資金來(lái)源渠道,豐富經(jīng)費(fèi)獲取方式。如除了以申請(qǐng)項(xiàng)目的方式從科研資助機(jī)構(gòu)(國(guó)家自然科學(xué)基金委員會(huì)、國(guó)家哲學(xué)社會(huì)科學(xué)辦公室等)和政府部門獲得經(jīng)費(fèi)支持外,還可以通過(guò)行業(yè)內(nèi)專業(yè)學(xué)會(huì)、公益基金會(huì)尋求建設(shè)資金,部分聯(lián)盟性質(zhì)的平臺(tái)建設(shè)者可以采用收取少量會(huì)員費(fèi)用的方式。

4.2.4 完善平臺(tái)管理政策

明確而完善的平臺(tái)管理政策,為平臺(tái)建設(shè)者在數(shù)據(jù)采集、分類、描述、質(zhì)量控制、存儲(chǔ)等方面提供指導(dǎo),也對(duì)用戶的使用與隱私信息進(jìn)行了規(guī)范,具有重要意義。然而,我國(guó)已建成的科學(xué)數(shù)據(jù)發(fā)布平臺(tái)中僅有少數(shù)制定了較為完善的管理政策,大多數(shù)平臺(tái)缺乏管理政策,存在管理政策不均衡的問(wèn)題。因此,建議科學(xué)數(shù)據(jù)發(fā)布平臺(tái)建設(shè)者應(yīng)重視平臺(tái)管理政策的制定工作,發(fā)揮其對(duì)平臺(tái)建設(shè)的指導(dǎo)與約束作用。具體而言,完善的平臺(tái)管理政策應(yīng)包括數(shù)據(jù)管理政策和用戶管理政策。其中,數(shù)據(jù)管理政策應(yīng)對(duì)數(shù)據(jù)全生命周期的各個(gè)階段予以規(guī)范,包括數(shù)據(jù)采集指南、數(shù)據(jù)分類依據(jù)、數(shù)據(jù)描述標(biāo)準(zhǔn)、數(shù)據(jù)質(zhì)量控制流程、數(shù)據(jù)存儲(chǔ)要求、數(shù)據(jù)訪問(wèn)權(quán)限等;用戶管理政策主要是關(guān)于用戶獲取使用數(shù)據(jù)與用戶個(gè)人信息保護(hù)的相關(guān)規(guī)定,如用戶使用條款、用戶隱私政策等。

5 結(jié)語(yǔ)

本文綜合采用文獻(xiàn)調(diào)研法、網(wǎng)站調(diào)研法、比較分析法等,以英、美國(guó)家發(fā)展較成熟的8個(gè)科學(xué)數(shù)據(jù)發(fā)布平臺(tái)為分析對(duì)象,探析科學(xué)數(shù)據(jù)發(fā)布平臺(tái)建設(shè)的組織管理機(jī)制。創(chuàng)新之處在于對(duì)科學(xué)數(shù)據(jù)發(fā)布平臺(tái)的組織管理機(jī)制內(nèi)容進(jìn)行了系統(tǒng)剖析,盡管已有文獻(xiàn)對(duì)組織管理問(wèn)題有所涉及,但多集中于某一方面的研究,系統(tǒng)探討的較少。而本文通過(guò)調(diào)查分析英、美國(guó)家發(fā)展較成熟的科學(xué)數(shù)據(jù)發(fā)布平臺(tái)在依托軟件、建設(shè)模式、資金來(lái)源、管理政策等方面的內(nèi)容,總結(jié)科學(xué)數(shù)據(jù)發(fā)布平臺(tái)的組織管理機(jī)制,并基于我國(guó)實(shí)際,提出了推動(dòng)科學(xué)數(shù)據(jù)發(fā)布平臺(tái)發(fā)展的建設(shè)策略:理性選擇依托軟件,密切機(jī)構(gòu)交流合作,拓寬資金來(lái)源渠道,完善平臺(tái)管理政策。在樣本對(duì)象上,本文選取了英、美國(guó)家的8個(gè)發(fā)展較成熟的科學(xué)數(shù)據(jù)發(fā)布平臺(tái),后續(xù)相關(guān)研究可以考慮擴(kuò)大樣本對(duì)象,以求研究結(jié)果更加全面。

猜你喜歡
數(shù)據(jù)管理科學(xué)用戶
企業(yè)級(jí)BOM數(shù)據(jù)管理概要
定制化汽車制造的數(shù)據(jù)管理分析
海洋環(huán)境數(shù)據(jù)管理優(yōu)化與實(shí)踐
CTCS-2級(jí)報(bào)文數(shù)據(jù)管理需求分析和實(shí)現(xiàn)
科學(xué)大爆炸
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
科學(xué)
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
科學(xué)拔牙
马公市| 抚松县| 清远市| 天等县| 仪征市| 华亭县| 大竹县| 磐安县| 江口县| 孟村| 三门峡市| 紫云| 江山市| 老河口市| 博罗县| 莎车县| 旅游| 包头市| 故城县| 咸阳市| 阿坝县| 镇远县| 赣州市| 卢龙县| 扎囊县| 神农架林区| 韩城市| 永泰县| 黄龙县| 莱芜市| 斗六市| 桦南县| 金塔县| 萝北县| 荆州市| 昭通市| 土默特左旗| 松潘县| 桐梓县| 隆安县| 繁昌县|