普麗娜 殷曉 謝文嫻
上海市研發(fā)公共服務(wù)平臺(tái)管理中心(上海市科技人才發(fā)展中心) 上海 200031
科學(xué)數(shù)據(jù)作為重要的科技戰(zhàn)略資源,其開(kāi)放共享是更大限度挖掘和發(fā)揮科學(xué)數(shù)據(jù)價(jià)值的重要方式之一。科學(xué)數(shù)據(jù)共享的本質(zhì)是讓數(shù)據(jù)資源能夠在利益相關(guān)者之間合理有效配置[1],伴隨著信息化技術(shù)的進(jìn)步,科學(xué)數(shù)據(jù)的發(fā)展越來(lái)越表現(xiàn)出多學(xué)科領(lǐng)域的交叉融合、多主體參與和大規(guī)模協(xié)作的特點(diǎn),科學(xué)數(shù)據(jù)的治理和開(kāi)放共享制度的制訂需要更加重視和協(xié)調(diào)科學(xué)數(shù)據(jù)各利益主體的權(quán)責(zé)關(guān)系,以更好細(xì)分確認(rèn)數(shù)據(jù)的價(jià)值[2-4]。與此同時(shí),科學(xué)數(shù)據(jù)從產(chǎn)生到消亡的全生命周期[5],具有不同階段和利益主體特點(diǎn)[6,7],因此科學(xué)數(shù)據(jù)共享和管理政策的制定,還應(yīng)結(jié)合科學(xué)數(shù)據(jù)全生命周期特征,充分考慮多元利益相關(guān)者的權(quán)益,作出合適的制度安排。
我國(guó)在2018年3月發(fā)布了首個(gè)國(guó)家層面的《科學(xué)數(shù)據(jù)管理辦法》(國(guó)辦發(fā)〔2018〕17號(hào)),隨后,十余個(gè)各省、市、自治區(qū)以及中科院積極響應(yīng),并出臺(tái)實(shí)施細(xì)則。上海是全國(guó)較早啟動(dòng)科學(xué)數(shù)據(jù)開(kāi)放共享工作的省市,早在2002年就建設(shè)“一網(wǎng)兩庫(kù)”,推進(jìn)科學(xué)數(shù)據(jù)開(kāi)放共享,對(duì)推動(dòng)上海市研發(fā)活動(dòng)起到了積極作用。隨著經(jīng)濟(jì)社會(huì)的發(fā)展、科研組織方式發(fā)生了重要變革,對(duì)科學(xué)數(shù)據(jù)資源管理、共享、利用的目標(biāo)和需求有了新的變化,產(chǎn)生了新的特征。本研究立足上海市科學(xué)數(shù)據(jù)工作現(xiàn)狀,深入調(diào)研科學(xué)數(shù)據(jù)管理與利用主體,全面了解掌握新形勢(shì)下研發(fā)活動(dòng)對(duì)于科學(xué)數(shù)據(jù)的現(xiàn)實(shí)需求,總結(jié)梳理科學(xué)數(shù)據(jù)管理與共享中急需解決的主要矛盾和問(wèn)題,為上海落實(shí)國(guó)家《科學(xué)數(shù)據(jù)管理辦法》,推進(jìn)科學(xué)數(shù)據(jù)更高效的管理與利用提供參考。
科學(xué)數(shù)據(jù)管理是科學(xué)數(shù)據(jù)高效利用的重要基礎(chǔ),科學(xué)數(shù)據(jù)共享是科學(xué)數(shù)據(jù)高效利用的重要方式。國(guó)內(nèi)外學(xué)者根據(jù)科學(xué)數(shù)據(jù)資源特征和管理實(shí)踐提出了數(shù)據(jù)全生命周期理論,并提出了一些經(jīng)典的科學(xué)數(shù)據(jù)管理全生命周期模型[8-10],可以看到,在科學(xué)數(shù)據(jù)管理的過(guò)程中,數(shù)據(jù)采集、數(shù)據(jù)保存、數(shù)據(jù)利用等是核心環(huán)節(jié)[7],同時(shí)在生命周期不同階段需要采用不同的管理策略[11-13]。
科學(xué)數(shù)據(jù)共享本質(zhì)上就是不同角色圍繞科學(xué)數(shù)據(jù)這一資源,從滿足數(shù)據(jù)用戶需求出發(fā),利用各種方式實(shí)現(xiàn)科學(xué)數(shù)據(jù)從數(shù)據(jù)提供者到數(shù)據(jù)用戶對(duì)于其擁有和使用權(quán)利的讓渡,達(dá)到科學(xué)數(shù)據(jù)資源滿足科研活動(dòng)需求的狀態(tài)[14]。由于,科學(xué)數(shù)據(jù)生產(chǎn)和利用的跨區(qū)域、跨部門、跨學(xué)科的大協(xié)作,參與主體的規(guī)模和類型越來(lái)越多元,科學(xué)數(shù)據(jù)共享利益相關(guān)者不僅包括數(shù)據(jù)提供者和數(shù)據(jù)用戶,還包括研究人員、研究機(jī)構(gòu)、數(shù)據(jù)中心、用戶、資助者、出版者等[15-17],共享和管理政策的制定更聚焦到這些多利益相關(guān)者之間權(quán)益的確認(rèn)和平衡。
為深入了解上海市科學(xué)數(shù)據(jù)管理利用需求,本研究基于科學(xué)數(shù)據(jù)全生命周期理論和利益相關(guān)者理論[18-23],構(gòu)建了科學(xué)數(shù)據(jù)管理與開(kāi)放共享需求分析框架(詳見(jiàn)圖 1)。
圖 1 科學(xué)數(shù)據(jù)管理與開(kāi)放共享需求分析框架
在獲取相關(guān)需求的過(guò)程中,重點(diǎn)抓住科學(xué)數(shù)據(jù)全生命周期中采集與獲取、匯交與保存、共享與利用等重要階段,以這些階段的主要利益相關(guān)者對(duì)科學(xué)數(shù)據(jù)共享和管理政策制定的需求和訴求為目標(biāo),針對(duì)科學(xué)數(shù)據(jù)開(kāi)放共享中涉及的主要利益相關(guān)者,設(shè)計(jì)了面向科研人員(數(shù)據(jù)使用者和利用者)、數(shù)據(jù)中心管理人員(傳播者)、期刊編輯管理人員(出版者和傳播者)、政府管理人員(管理者和組織者)的調(diào)研內(nèi)容,主要包括:
(1)科學(xué)數(shù)據(jù)采集和獲取的方式、途徑、可能遇到的困難等。
(2)當(dāng)前從事工作的科學(xué)數(shù)據(jù)保存與管理現(xiàn)狀、可能遇到的困難,以及原因。
(3)對(duì)科學(xué)數(shù)據(jù)共享及現(xiàn)狀的態(tài)度,包括:是否從其他途徑獲得過(guò)科學(xué)數(shù)據(jù)、是否向其他人提供過(guò)科學(xué)數(shù)據(jù),以及對(duì)科學(xué)數(shù)據(jù)共享的動(dòng)機(jī)、態(tài)度和意愿。
(4)對(duì)科學(xué)數(shù)據(jù)管理與共享政策的認(rèn)知、態(tài)度與需求,包括:是否贊成制定科學(xué)數(shù)據(jù)共享政策,對(duì)政策的擔(dān)心、顧慮,以及建議政策應(yīng)包含的內(nèi)容等。
(5)對(duì)科學(xué)數(shù)據(jù)管理平臺(tái)、科學(xué)數(shù)據(jù)中心(庫(kù))布局建設(shè)的認(rèn)識(shí)、需求和建議。
本研究面向上海市科研人員、數(shù)據(jù)中心管理人員、期刊編輯管理人員、政府管理人員開(kāi)展問(wèn)卷調(diào)查,為保障問(wèn)卷調(diào)研的有效性,對(duì)重點(diǎn)關(guān)注的調(diào)研單位開(kāi)展了預(yù)調(diào)研,并根據(jù)預(yù)調(diào)研情況完善問(wèn)卷,通過(guò)上??萍?、上海市研發(fā)公共服務(wù)平臺(tái)的官方網(wǎng)站、官方微信公眾號(hào)發(fā)放了問(wèn)卷,開(kāi)展了較為廣泛的調(diào)查。本次問(wèn)卷調(diào)查時(shí)間為2019年3月28日—2019年4月27日,收回有效問(wèn)卷571份。
從問(wèn)卷回收情況來(lái)看,上海科學(xué)數(shù)據(jù)生產(chǎn)、利用的參與主體呈現(xiàn)出多樣化特征,高校、科研院所和醫(yī)院最多,接近一半的調(diào)研對(duì)象來(lái)自高校,其次是科研院所(23.1%)和醫(yī)院(9.3%),同時(shí)各類企業(yè)也積極參與到科學(xué)數(shù)據(jù)的應(yīng)用中,成為不容小覷的重要力量。
從具體調(diào)研對(duì)象來(lái)看,以26~40歲(含40歲)青年人員為主,其中科研院所這一年齡段的比例最高(76.5%),其次是醫(yī)院(70%),企業(yè)(65.2%),高校(59.1%)。這一年齡階段的從業(yè)者,有活力、有拼搏的動(dòng)力,也積累了相當(dāng)?shù)目蒲?管理經(jīng)驗(yàn),是承擔(dān)和推動(dòng)科學(xué)數(shù)據(jù)工作的重要力量。
從調(diào)研對(duì)象的學(xué)科分布來(lái)看,工學(xué)、理學(xué)、醫(yī)學(xué)最多,而管理學(xué)、哲學(xué)、經(jīng)濟(jì)學(xué)、法學(xué)等人文學(xué)科參與較少,這與各學(xué)科產(chǎn)生、利用科學(xué)數(shù)據(jù)的關(guān)聯(lián)程度基本吻合,自然科學(xué)和工程學(xué)科是大規(guī)模產(chǎn)生、利用科學(xué)數(shù)據(jù)的主要學(xué)科。
從調(diào)研對(duì)象的工作性質(zhì)看,主要從事科研(85.9%),教學(xué)(22.2%)和管理(22.4%)工作,受訪者身兼多職的情況比較普遍,其中醫(yī)院和高校最為顯著,科研院所和企業(yè)受訪者的崗位設(shè)置則較為固定(詳見(jiàn)圖 2)。
圖 2 單位性質(zhì)與調(diào)研對(duì)象工作性質(zhì)
從調(diào)研對(duì)象身份來(lái)看,本次調(diào)查主要包括七類人員:教師、學(xué)生、研究人員、圖書管理員、實(shí)驗(yàn)人員、科研管理人員、醫(yī)生等。其中,占比較多的人員是教師、學(xué)生和研究人員。
總體而言,從科學(xué)數(shù)據(jù)管理與共享利益相關(guān)者年齡、學(xué)科、工作性質(zhì)分析,上海開(kāi)展科學(xué)數(shù)據(jù)生產(chǎn)和應(yīng)用的機(jī)構(gòu)中,科研院所基礎(chǔ)要更好,集聚了更專業(yè)的從業(yè)人員、從業(yè)人員普遍比較年輕,形成了更有活力的有生力量,而且科研院所的科研活動(dòng)主要集中在科學(xué)數(shù)據(jù)普及推動(dòng)較好的自然科學(xué)領(lǐng)域,也更容易積累和推進(jìn)科學(xué)數(shù)據(jù)的使用。同時(shí),科研院所更專業(yè)化和細(xì)分的組織管理方式使明確的數(shù)據(jù)管理崗位設(shè)置成為可能,更有利于科學(xué)數(shù)據(jù)管理工作的專業(yè)化、規(guī)范化。
目前科研人員生產(chǎn)數(shù)據(jù)的方式多種多樣,主要有收集后加工處理(65.9%),人工采集(61.2%),儀器設(shè)備自動(dòng)采集(54.9%)幾種方式,而且科研人員通常采用多種方式生產(chǎn)數(shù)據(jù)。從采集方式來(lái)看,主要以機(jī)構(gòu)/課題組自主生產(chǎn)為主(占77.7%),科學(xué)數(shù)據(jù)由公開(kāi)渠道免費(fèi)獲得的也占有較大比例(占47.8%),進(jìn)而導(dǎo)致目前科學(xué)研究中使用的數(shù)據(jù)主要通過(guò)小范圍的共享來(lái)實(shí)現(xiàn),科學(xué)數(shù)據(jù)共享的意識(shí)需進(jìn)一步提升。
不同學(xué)科領(lǐng)域的科研人員收集獲取科學(xué)數(shù)據(jù)的主要方式有所不同,工學(xué)、理學(xué)獲取方式更為多樣化,以機(jī)構(gòu)/課題組自主產(chǎn)生、公開(kāi)渠道免費(fèi)獲得數(shù)據(jù)為主;醫(yī)學(xué)、農(nóng)學(xué)以機(jī)構(gòu)/課題組自主產(chǎn)生為主;管理學(xué)以公開(kāi)渠道免費(fèi)獲得數(shù)據(jù)為主(詳見(jiàn)圖 3)。
圖 3 不同學(xué)科領(lǐng)域獲取數(shù)據(jù)的方式
科研人員獲取數(shù)據(jù)過(guò)程中的主要困難包括:數(shù)據(jù)質(zhì)量參差不齊(63.9%),沒(méi)有統(tǒng)一的科學(xué)數(shù)據(jù)平臺(tái)(50.9%),數(shù)據(jù)收集成本或獲取成本太高(48.9%),公開(kāi)發(fā)表文獻(xiàn)中找不到原始數(shù)據(jù)(47.8%)等(詳見(jiàn)圖4),這與數(shù)據(jù)中心管理人員認(rèn)為數(shù)據(jù)獲取描述中數(shù)據(jù)質(zhì)量及控制方式(完整性、準(zhǔn)確性)是科研人員獲取數(shù)據(jù)時(shí)最重要的參考標(biāo)準(zhǔn)(詳見(jiàn)圖5)的觀點(diǎn)不謀而合。
圖 4 科學(xué)數(shù)據(jù)獲取的主要困難
圖 5 數(shù)據(jù)獲取的重要指標(biāo)
進(jìn)一步調(diào)查研究發(fā)現(xiàn),高校、科研院所、醫(yī)院認(rèn)為數(shù)據(jù)獲取的最大困難是數(shù)據(jù)質(zhì)量參差不齊,而企業(yè)認(rèn)為最大的困難是沒(méi)有統(tǒng)一的科學(xué)數(shù)據(jù)平臺(tái)。究其原因,高校、科研院所、醫(yī)院以科研為主,科研合作對(duì)象較為固定,獲取的科學(xué)數(shù)據(jù)的領(lǐng)域相對(duì)較集中,在長(zhǎng)期積累過(guò)程中形成了一批領(lǐng)域科學(xué)數(shù)據(jù)中心,而企業(yè)需要通過(guò)數(shù)據(jù)共享獲得技術(shù)研發(fā)新動(dòng)態(tài),促進(jìn)科技成果轉(zhuǎn)化和項(xiàng)目落地[1],需要的數(shù)據(jù)所涉及的領(lǐng)域更加交叉綜合,沒(méi)有明確的合作對(duì)象,但目前能滿足跨學(xué)科、多領(lǐng)域需求的數(shù)據(jù)發(fā)現(xiàn)平臺(tái)目前還較為缺乏。
從數(shù)據(jù)存儲(chǔ)方式來(lái)看,首先上??蒲腥藛T科學(xué)數(shù)據(jù)存儲(chǔ)的方式分散,匯交到統(tǒng)一公共平臺(tái)的還較少,主要是存儲(chǔ)在自己/團(tuán)隊(duì)的計(jì)算機(jī)中(89.5%);其次是U盤或移動(dòng)硬盤(57.4%),圖 6可以看出目前科研人員主要采取的存儲(chǔ)方式較為分散,存在數(shù)據(jù)丟失的隱患,進(jìn)一步調(diào)研發(fā)現(xiàn)近一半的科研人員發(fā)生過(guò)科學(xué)數(shù)據(jù)的丟失情況。從丟失數(shù)據(jù)的科研人員年齡分布來(lái)看,26~40歲(含40歲)數(shù)據(jù)丟失的比例最高,同時(shí)這一年齡段也是科研高產(chǎn)出的年齡段,數(shù)據(jù)的丟失會(huì)對(duì)科研人員持續(xù)的科研活動(dòng)產(chǎn)生不利影響,增加重復(fù)科研的可能性。從數(shù)據(jù)丟失的方式來(lái)看,發(fā)現(xiàn)造成數(shù)據(jù)丟失的主要原因是存儲(chǔ)設(shè)備故障(占比75.6%),其次是誤操作或誤刪除(占比48.8%),第三是計(jì)算機(jī)病毒(25.9%)。
圖6 科學(xué)數(shù)據(jù)存儲(chǔ)方式
在數(shù)據(jù)保存的期限方面,55.8%的科研人員會(huì)將數(shù)據(jù)保存5年以上,27.6%的科研人員會(huì)將數(shù)據(jù)保存3-5年。從機(jī)構(gòu)視角,92%的醫(yī)院科研人員會(huì)將科學(xué)數(shù)據(jù)保存3年以上,70%的醫(yī)院科研人員保存期限達(dá)到5年以上;高校、科研院所、企業(yè)的數(shù)據(jù)保存3年以上的均超過(guò)80%。由此可以看出,各主體對(duì)于科學(xué)數(shù)據(jù)長(zhǎng)期保存的需求較為強(qiáng)烈。
從數(shù)據(jù)保存的規(guī)模來(lái)看,上??茖W(xué)數(shù)據(jù)存儲(chǔ)較為分散,數(shù)據(jù)規(guī)模較小,目前上海課題組/個(gè)人每年產(chǎn)生的原始數(shù)據(jù)總量主要以Gb級(jí)(41%)的為主,其次是500Mb-1Gb(22.9%),再次是Tb級(jí)(占15.5%)。工學(xué)、理學(xué)、醫(yī)學(xué)是產(chǎn)生科學(xué)數(shù)據(jù)較多的領(lǐng)域,且其TB級(jí)的數(shù)據(jù)總量占本領(lǐng)域的比例均達(dá)到了20%左右,超過(guò)了平均水平。在醫(yī)學(xué)領(lǐng)域,超過(guò)70%的科研人員會(huì)將數(shù)據(jù)保存5年以上。從機(jī)構(gòu)來(lái)看,各機(jī)構(gòu)還是以GB級(jí)的數(shù)據(jù)存儲(chǔ)總量為主,TB級(jí)數(shù)據(jù)總量最多的主體依次是企業(yè)(21.7%)、科研院所(18.5%)。
從數(shù)據(jù)備份情況來(lái)看,科研人員和期刊編輯人員對(duì)于數(shù)據(jù)備份有較強(qiáng)的意識(shí)和需求(詳見(jiàn)圖 7和圖 8),87.7%的科研人員會(huì)對(duì)科研活動(dòng)中產(chǎn)生和收集的數(shù)據(jù)進(jìn)行備份,尤其以高校的科研人員意識(shí)最強(qiáng),達(dá)到92.3%;進(jìn)一步對(duì)備份方式調(diào)研,發(fā)現(xiàn)首選備份到課題組/個(gè)人備份設(shè)施(占62.4%),其次是定期磁帶的備份方式(占30.9%)。期刊方提供的科學(xué)數(shù)據(jù)庫(kù)是目前科研人員存取科學(xué)數(shù)據(jù)的主要方式之一[24]。期刊編輯人員首推將論文數(shù)據(jù)遞交至學(xué)科領(lǐng)域內(nèi)的專業(yè)數(shù)據(jù)中心(占比71.1%),其次是政府管理部門或資助機(jī)構(gòu)建立的數(shù)據(jù)平臺(tái)(占比55.6%)。
圖 7 科研人員數(shù)據(jù)備份情況及備份方式
圖8 期刊編輯人員認(rèn)為集成發(fā)現(xiàn)的必要性和對(duì)集成發(fā)現(xiàn)平臺(tái)的建議
從科學(xué)數(shù)據(jù)建設(shè)主體來(lái)看,科研院所和企業(yè)的科學(xué)數(shù)據(jù)庫(kù)建設(shè)已超30%,高校、醫(yī)院的數(shù)據(jù)庫(kù)建設(shè)率雖只有15%左右,但這些機(jī)構(gòu)都充分認(rèn)識(shí)到科學(xué)數(shù)據(jù)庫(kù)的重要作用,絕大多數(shù)已在積極籌建科學(xué)數(shù)據(jù)庫(kù)。
從科學(xué)數(shù)據(jù)共享意愿來(lái)看,上海科研人員具有很強(qiáng)的科學(xué)數(shù)據(jù)共享與利用的意愿(詳見(jiàn)圖 9),94.8%的科研人員愿意或者征得同意后愿意共享數(shù)據(jù)。從機(jī)構(gòu)視角,醫(yī)院的科研人員共享意愿最為強(qiáng)烈,達(dá)到了98%,其次是科研院所(95.2%),不愿意共享的主要原因是出于數(shù)據(jù)安全、隱私、知識(shí)產(chǎn)權(quán)等方面的考慮,以及希望后續(xù)進(jìn)行數(shù)據(jù)價(jià)值挖掘等,可以看出,數(shù)據(jù)權(quán)益保護(hù)是科研人員共享數(shù)據(jù)的重要前提。
圖9 科學(xué)數(shù)據(jù)共享意愿
從科學(xué)數(shù)據(jù)政策需求來(lái)看,各機(jī)構(gòu)的科研人員、數(shù)據(jù)中心管理人員最關(guān)心的政策內(nèi)容一致,體現(xiàn)了對(duì)各自數(shù)據(jù)權(quán)益的充分確權(quán)和保障的重視(詳見(jiàn)圖 10),包括:明確各個(gè)利益相關(guān)方職責(zé)(科研人員82.3%,數(shù)據(jù)中心管理人員87.5%),科研數(shù)據(jù)的歸屬權(quán)(科研人員78.3%,數(shù)據(jù)中心管理人員83.9%),知識(shí)產(chǎn)權(quán)以及科研數(shù)據(jù)的共享方式和范圍的確認(rèn)(科研人員71.5%,數(shù)據(jù)中心管理人員85.78%)。其中,高校更關(guān)注利益平衡和數(shù)據(jù)權(quán)屬問(wèn)題,這與高??蒲腥藛T是科學(xué)數(shù)據(jù)的主要?jiǎng)?chuàng)建者,希望通過(guò)明確共享權(quán)利義務(wù)獲得合理的回報(bào)相關(guān);科研院所、企業(yè)、醫(yī)院更希望通過(guò)政策制訂明確科學(xué)數(shù)據(jù)的共享方式和范圍。
圖10 科學(xué)數(shù)據(jù)政策應(yīng)包含的內(nèi)容
從科學(xué)數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)需求來(lái)看,建設(shè)覆蓋數(shù)據(jù)全生命周期的科學(xué)數(shù)據(jù)中心是各利益相關(guān)者共同的需求(詳見(jiàn)圖 11和圖 12),科研人員、數(shù)據(jù)中心管理人員、政府工作人員都認(rèn)為數(shù)據(jù)管理和數(shù)據(jù)存儲(chǔ)功能是科學(xué)數(shù)據(jù)中心最基礎(chǔ)、最重要的功能,且對(duì)數(shù)據(jù)安全保護(hù)的需求最為突出。各主體都認(rèn)為查找與獲取是數(shù)據(jù)庫(kù)最重要、基礎(chǔ)的服務(wù),高校和科研院所的科研人員對(duì)數(shù)據(jù)價(jià)值交換和共享具有較強(qiáng)需求,企業(yè)和醫(yī)院的科研人員則更需要數(shù)據(jù)分析等增值服務(wù)。
在科學(xué)數(shù)據(jù)共享載體選擇方面,不同利益主體的選擇具有明顯的差異性,科研人員較多選擇自己信任的人進(jìn)行共享,各主體選擇課題組內(nèi)部的數(shù)據(jù)庫(kù)最多,高校和科研院所更多選擇學(xué)科領(lǐng)域公共數(shù)據(jù)庫(kù),企業(yè)和醫(yī)院優(yōu)先選擇本機(jī)構(gòu)的數(shù)據(jù)庫(kù)(詳見(jiàn)圖 13)。由此可以看出,可信任的、權(quán)威的、公益的共享載體是各類主體的共性需求,通過(guò)此共享載體認(rèn)證認(rèn)可的數(shù)據(jù),科研人員才愿意放心使用。
圖 11 不同利益相關(guān)者對(duì)科學(xué)數(shù)據(jù)共享利用平臺(tái)功能的選擇
從圖 14可以看出,各利益主體對(duì)于數(shù)據(jù)中心建設(shè)功能需求各有側(cè)重,基礎(chǔ)性的功能包括數(shù)據(jù)瀏覽、查詢、下載和復(fù)制功能(94.6%),其次是數(shù)據(jù)調(diào)用和分析服務(wù)(85.7%)以及數(shù)據(jù)保存、檢索、統(tǒng)計(jì)服務(wù)(82.1%)。
圖 12 數(shù)據(jù)中心對(duì)于數(shù)據(jù)保存相關(guān)的重要性指標(biāo)評(píng)價(jià)
圖 13 科研人員共享載體的選擇
圖 14 科學(xué)數(shù)據(jù)中心建設(shè)的重點(diǎn)
通過(guò)調(diào)研發(fā)現(xiàn),當(dāng)前上??茖W(xué)數(shù)據(jù)管理與共享已經(jīng)取得重要進(jìn)展,但是與各類主體和個(gè)人強(qiáng)烈的共享意愿和強(qiáng)勁的數(shù)據(jù)需求相比,與對(duì)數(shù)據(jù)多元價(jià)值更深挖掘的要求相比,也存在一些需要不斷提升的空間。從科學(xué)數(shù)據(jù)本身來(lái)看,其產(chǎn)生量逐年增大,參與主體更加多元復(fù)雜,但存儲(chǔ)備份方式較為分散,數(shù)據(jù)安全得不到根本保障;公益、專業(yè)、安全的匯交平臺(tái)缺乏,難以提供數(shù)據(jù)可信度和安全的有效支撐,尚未形成科學(xué)數(shù)據(jù)的開(kāi)放共享合力。
通過(guò)對(duì)上??茖W(xué)數(shù)據(jù)管理與共享現(xiàn)狀的調(diào)研,我們發(fā)現(xiàn)上海各類主體對(duì)科學(xué)數(shù)據(jù)支撐科學(xué)研究已有較深刻的認(rèn)識(shí),需求非常強(qiáng)烈,已形成在各自機(jī)構(gòu)和小范圍的數(shù)據(jù)存儲(chǔ)、共享使用的局面,為上海制定全市層面的科學(xué)數(shù)據(jù)共享和管理政策奠定了良好的基礎(chǔ),但需要看到數(shù)據(jù)的生產(chǎn)和存儲(chǔ)還很分散,數(shù)據(jù)安全和權(quán)益保障缺乏,規(guī)范的數(shù)據(jù)價(jià)值確認(rèn)規(guī)則缺失,極大制約了上??茖W(xué)數(shù)據(jù)價(jià)值的更好發(fā)揮。鑒于此,建議在政策制訂中強(qiáng)化以下幾個(gè)方面。
(1)注重科學(xué)數(shù)據(jù)共治的體系化安排。重視構(gòu)建多元主體對(duì)話共謀機(jī)制,以更好激發(fā)利益相關(guān)主體推動(dòng)科學(xué)數(shù)據(jù)開(kāi)放共享的積極性和創(chuàng)造性;強(qiáng)化政策保護(hù)和規(guī)范數(shù)據(jù)利益相關(guān)者權(quán)責(zé);系統(tǒng)布局基礎(chǔ)設(shè)施(制度、標(biāo)準(zhǔn)、技術(shù)、平臺(tái)載體),倡導(dǎo)數(shù)據(jù)管理計(jì)劃,鼓勵(lì)數(shù)據(jù)出版,組織數(shù)據(jù)競(jìng)賽,鼓勵(lì)各類利益相關(guān)主體先行先試推進(jìn)開(kāi)放共享。
(2)充分重視科學(xué)數(shù)據(jù)的經(jīng)濟(jì)社會(huì)價(jià)值??茖W(xué)數(shù)據(jù)作為價(jià)值最高的新型生產(chǎn)要素,其經(jīng)濟(jì)和社會(huì)的多維價(jià)值將不斷放大,建議以目標(biāo)為導(dǎo)向,打破科技、經(jīng)濟(jì)、社會(huì)領(lǐng)域邊界,促進(jìn)數(shù)據(jù)流動(dòng)和重構(gòu),使其成為創(chuàng)新生產(chǎn)方式、重構(gòu)生產(chǎn)關(guān)系、提升生產(chǎn)能級(jí)的重要要素。
(3)加強(qiáng)科學(xué)數(shù)據(jù)全生命周期管理。在數(shù)據(jù)采集獲取階段,應(yīng)重視數(shù)據(jù)質(zhì)量保障問(wèn)題,建立統(tǒng)一標(biāo)準(zhǔn),強(qiáng)化主體責(zé)任,從源頭上指導(dǎo)數(shù)據(jù)生產(chǎn)單位建立科學(xué)數(shù)據(jù)質(zhì)量控制體系;在數(shù)據(jù)保存匯交階段,要指導(dǎo)主體筑牢數(shù)據(jù)安全意識(shí),確保數(shù)據(jù)得到完整和安全的保存;在數(shù)據(jù)共享利用階段,應(yīng)規(guī)范科學(xué)數(shù)據(jù)開(kāi)放共享目錄建設(shè),鼓勵(lì)采用在線下載、離線共享、定制服務(wù)等多種形式的共享方式,推動(dòng)數(shù)據(jù)使用便利化,保障科學(xué)數(shù)據(jù)使用的可持續(xù)發(fā)展。
(4)加強(qiáng)科學(xué)數(shù)據(jù)統(tǒng)一集成發(fā)現(xiàn)平臺(tái)的建設(shè)??茖W(xué)數(shù)據(jù)發(fā)現(xiàn)作為科學(xué)數(shù)據(jù)管理和價(jià)值提升的重要手段,是實(shí)現(xiàn)數(shù)據(jù)共享的第一步也是最重要的一步,也是各類主體呼吁強(qiáng)烈的需求,應(yīng)加強(qiáng)布局建設(shè)具有公益性、可信度、專業(yè)化的集成發(fā)現(xiàn)平臺(tái),作為共享樞紐,鏈接各類科學(xué)數(shù)據(jù)主體和數(shù)據(jù)庫(kù),推動(dòng)科學(xué)數(shù)據(jù)的使用和開(kāi)放共享。
(5)大力推進(jìn)科學(xué)數(shù)據(jù)中心建設(shè)。應(yīng)充分發(fā)揮科學(xué)數(shù)據(jù)中心在領(lǐng)域內(nèi)的專業(yè)作用,調(diào)動(dòng)其開(kāi)放共享的積極性,建議依托具有優(yōu)勢(shì)資源、已有較好基礎(chǔ)的機(jī)構(gòu)建設(shè)上海市級(jí)科學(xué)數(shù)據(jù)中心,授權(quán)先行形式,探索一套本領(lǐng)域可推廣使用的科學(xué)數(shù)據(jù)管理和開(kāi)放共享實(shí)踐經(jīng)驗(yàn),形成可以借鑒參考的模式,以實(shí)踐示范推動(dòng)政策的落實(shí)。