王安然 吳思竹 錢 慶 李贊梅 鐘 明
(中國(guó)醫(yī)學(xué)科學(xué)院/北京協(xié)和醫(yī)學(xué)院醫(yī)學(xué)信息研究所 北京 100020)
近年來隨著開放科學(xué)的不斷發(fā)展,科學(xué)數(shù)據(jù)已成為世界多個(gè)國(guó)家的重要戰(zhàn)略資源。在各類開放數(shù)據(jù)政策與規(guī)劃的指引下,政府、科研院所、企業(yè)、國(guó)際組織等都積極參與科學(xué)數(shù)據(jù)資源建設(shè),開展各類研究與項(xiàng)目。英、美等發(fā)達(dá)國(guó)家走在科學(xué)數(shù)據(jù)資源建設(shè)與共享的前列,發(fā)布多項(xiàng)政策支持資源建設(shè)與開放共享[1-3]。2018年我國(guó)先后發(fā)布兩個(gè)關(guān)于科學(xué)數(shù)據(jù)的管理辦法。2018年1月中央全面深化改革領(lǐng)導(dǎo)小組第2次會(huì)議審議通過《科學(xué)數(shù)據(jù)管理辦法》并于同年3月17日由國(guó)務(wù)院辦公廳正式印發(fā)[4]?!犊茖W(xué)數(shù)據(jù)管理辦法》首次從國(guó)家層面明確要求各相關(guān)部門應(yīng)圍繞國(guó)際發(fā)展戰(zhàn)略和科技創(chuàng)新需求,統(tǒng)籌規(guī)劃和建設(shè)本行業(yè)的科學(xué)數(shù)據(jù)中心。同年2月科技部、財(cái)政部印發(fā)《國(guó)家科技資源共享服務(wù)平臺(tái)管理辦法》[5],以規(guī)范管理國(guó)家科技資源共享服務(wù)平臺(tái),深入發(fā)展科技創(chuàng)新,推動(dòng)數(shù)據(jù)共享。這一系列舉措可見我國(guó)對(duì)科學(xué)數(shù)據(jù)管理的重視。
本文首先對(duì)《科學(xué)數(shù)據(jù)管理辦法》和《國(guó)家科技資源共享服務(wù)平臺(tái)管理辦法》這兩項(xiàng)政策進(jìn)行分析,闡述兩項(xiàng)管理辦法針對(duì)科學(xué)數(shù)據(jù)管理的要點(diǎn),同時(shí)簡(jiǎn)要分析我國(guó)人口健康領(lǐng)域科學(xué)數(shù)據(jù)管理現(xiàn)狀,為我國(guó)人口健康科學(xué)數(shù)據(jù)管理相關(guān)工作提出建議。
長(zhǎng)期以來,國(guó)外針對(duì)科學(xué)數(shù)據(jù)共享實(shí)行“政府先行”的政策,制定一系列的科學(xué)數(shù)據(jù)開放共享政策法規(guī)[6],而我國(guó)在數(shù)據(jù)共享方面起步較晚,在科學(xué)數(shù)據(jù)管理政策法規(guī)方面有一定的缺失。兩項(xiàng)《辦法》的發(fā)布首次從國(guó)家層面建立關(guān)于科學(xué)數(shù)據(jù)的管理政策,從多方面對(duì)科學(xué)數(shù)據(jù)管理進(jìn)行規(guī)范?!犊茖W(xué)數(shù)據(jù)管理辦法》規(guī)定由國(guó)務(wù)院科學(xué)技術(shù)行政部門負(fù)責(zé)全國(guó)科學(xué)數(shù)據(jù)的統(tǒng)籌和宏觀管理;國(guó)務(wù)院和省級(jí)人民政府相關(guān)部門等作為主管部門協(xié)助分工負(fù)責(zé);由主管部門委托有條件的科研院所等法人單位成立科學(xué)數(shù)據(jù)中心,承擔(dān)科學(xué)數(shù)據(jù)的匯交、管理、共享和安全保障等任務(wù);同時(shí)確定法人單位的主要責(zé)任以及科學(xué)數(shù)據(jù)中心的地位與職責(zé)?!秶?guó)家科技資源共享服務(wù)平臺(tái)管理辦法》也分別對(duì)國(guó)家宏觀管理部門、主管部門和平臺(tái)依托單位的主要職責(zé)進(jìn)行詳細(xì)闡述。兩項(xiàng)《辦法》均明確指出宏觀管理部門、主管部門、法人單位、科學(xué)數(shù)據(jù)中心等各級(jí)部門的職責(zé),使各級(jí)責(zé)任有了明確界定。這種由國(guó)家主導(dǎo)、層層分級(jí)負(fù)責(zé)的責(zé)任制度彌補(bǔ)現(xiàn)今我國(guó)科學(xué)數(shù)據(jù)管理與應(yīng)用的不足。
為推動(dòng)我國(guó)科學(xué)數(shù)據(jù)的開放共享,《科學(xué)數(shù)據(jù)管理辦法》指出應(yīng)統(tǒng)籌規(guī)劃和建設(shè)科學(xué)數(shù)據(jù)中心,《國(guó)家科技資源共享服務(wù)平臺(tái)管理辦法》更加細(xì)致地闡述國(guó)家平臺(tái)(國(guó)家平臺(tái)將統(tǒng)一規(guī)范命名為“國(guó)家XX科學(xué)數(shù)據(jù)中心”)的建立、管理辦法,明確說明宏觀管理部門、主管部門、依托單位等各層級(jí)部門在平臺(tái)建設(shè)中的具體管理責(zé)任。規(guī)定宏觀管理部門應(yīng)制定相關(guān)政策規(guī)范,統(tǒng)籌協(xié)調(diào)國(guó)家平臺(tái)建設(shè)并開展考核工作;主管部門應(yīng)制定部門規(guī)劃標(biāo)準(zhǔn),推動(dòng)國(guó)家平臺(tái)規(guī)范建設(shè);依托單位作為責(zé)任主體應(yīng)建立國(guó)家平臺(tái)標(biāo)準(zhǔn)規(guī)范,保障國(guó)家平臺(tái)運(yùn)行管理。
近年來我國(guó)對(duì)科研創(chuàng)新的投入不斷增加,同時(shí)也產(chǎn)生大量有質(zhì)量的科學(xué)數(shù)據(jù)。但由于沒有統(tǒng)一標(biāo)準(zhǔn)對(duì)各項(xiàng)目科學(xué)數(shù)據(jù)進(jìn)行管理整合,數(shù)據(jù)無法有效共享、利用,造成科學(xué)數(shù)據(jù)的嚴(yán)重浪費(fèi)?!犊茖W(xué)數(shù)據(jù)管理辦法》明確指出主管部門應(yīng)建立科學(xué)數(shù)據(jù)的匯交制度,開展科學(xué)數(shù)據(jù)匯交工作。其第13條要求由政府預(yù)算資金資助的各級(jí)科技計(jì)劃項(xiàng)目所形成的科學(xué)數(shù)據(jù)都要匯交到科學(xué)數(shù)據(jù)中心并在匯交后由科學(xué)數(shù)據(jù)中心出具匯交憑證;要求各級(jí)科技計(jì)劃管理部門實(shí)行先匯交再驗(yàn)收的制度并對(duì)全生命周期的數(shù)據(jù)進(jìn)行匯交?!秶?guó)家科技資源共享服務(wù)平臺(tái)管理辦法》也規(guī)定由財(cái)政性資金資助的各類科技項(xiàng)目的科技資源要匯交到平臺(tái)。兩項(xiàng)《辦法》從各方面詳細(xì)闡述科學(xué)數(shù)據(jù)的強(qiáng)制性匯交政策,以確保科學(xué)數(shù)據(jù)的整合保存,加強(qiáng)數(shù)據(jù)積累。
科學(xué)數(shù)據(jù)的開放共享早已是國(guó)際共識(shí)。長(zhǎng)久以來,我國(guó)科學(xué)數(shù)據(jù)管理工作缺乏清晰的管理機(jī)制,各大高校、科研院所之間不能有效溝通科研進(jìn)展,科學(xué)數(shù)據(jù)無法共享和重復(fù)利用,嚴(yán)重制約科學(xué)研究發(fā)展?!犊茖W(xué)數(shù)據(jù)管理辦法》規(guī)定我國(guó)科學(xué)數(shù)據(jù)的開放共享要秉持“開放為常態(tài)、不開放為例外”的原則,實(shí)現(xiàn)最大限度的開放。除國(guó)家法律法規(guī)有特殊規(guī)定的情況外各類科學(xué)數(shù)據(jù)應(yīng)與國(guó)家共享交換平臺(tái)進(jìn)行及時(shí)交接并面向公眾開放共享,實(shí)現(xiàn)科學(xué)數(shù)據(jù)的最大化利用。同時(shí)兩項(xiàng)《辦法》均指出法人單位和國(guó)家平臺(tái)等應(yīng)為政府決策、公共安全、國(guó)防建設(shè)、環(huán)境保護(hù)、防災(zāi)減災(zāi)、公益性科學(xué)研究等無償提供科學(xué)數(shù)據(jù),以充分發(fā)揮科學(xué)數(shù)據(jù)的重要作用。
大數(shù)據(jù)時(shí)代科學(xué)數(shù)據(jù)成為各個(gè)國(guó)家重要的戰(zhàn)略資源,同時(shí)數(shù)據(jù)的安全問題也接踵而來。國(guó)外陸續(xù)推出諸多針對(duì)信息網(wǎng)絡(luò)安全建設(shè)的戰(zhàn)略舉措[7],我國(guó)新出臺(tái)的兩項(xiàng)《辦法》也將保證數(shù)據(jù)安全放在首要位置。《科學(xué)數(shù)據(jù)管理辦法》對(duì)涉及國(guó)家秘密、國(guó)家安全、公共利益等科學(xué)數(shù)據(jù)的開放方式做了原則性、政策性規(guī)定,各級(jí)部門應(yīng)建立健全相關(guān)制度,做好數(shù)據(jù)的保密審查,加強(qiáng)數(shù)據(jù)監(jiān)管。兩項(xiàng)《辦法》還強(qiáng)調(diào)知識(shí)產(chǎn)權(quán)保護(hù)的重要性?!犊茖W(xué)數(shù)據(jù)管理辦法》要求科學(xué)數(shù)據(jù)的使用者對(duì)使用科學(xué)數(shù)據(jù)的來源和使用情況進(jìn)行明確標(biāo)注,保護(hù)數(shù)據(jù)提供者的權(quán)益。《國(guó)家科技資源共享服務(wù)平臺(tái)管理辦法》也規(guī)定國(guó)家平臺(tái)應(yīng)建立符合國(guó)家知識(shí)產(chǎn)權(quán)保護(hù)和安全保密等有關(guān)規(guī)定的制度,保護(hù)科技資源提供者的知識(shí)產(chǎn)權(quán)和利益。
在平臺(tái)監(jiān)督評(píng)價(jià)方面,英國(guó)于2012年發(fā)布《開放數(shù)據(jù)白皮書》,建立一套對(duì)公共部門開放數(shù)據(jù)程度的評(píng)價(jià)體系,對(duì)各公共部門完成開放數(shù)據(jù)任務(wù)情況進(jìn)行審計(jì),以促進(jìn)英國(guó)公共服務(wù)數(shù)據(jù)的開放性。我國(guó)《科學(xué)數(shù)據(jù)管理辦法》中也提到主管部門和法人單位應(yīng)建立完善的評(píng)價(jià)考核制度。《國(guó)家科技資源共享服務(wù)平臺(tái)管理辦法》詳細(xì)闡述評(píng)價(jià)考核的具體措施。宏觀管理部門對(duì)國(guó)家平臺(tái)進(jìn)行兩年一次的分類評(píng)價(jià)考核;主管部門對(duì)所屬國(guó)家平臺(tái)進(jìn)行年度自評(píng);宏觀管理部門還將委托國(guó)家科技基礎(chǔ)條件平臺(tái)中心對(duì)國(guó)家平臺(tái)進(jìn)行評(píng)價(jià)考核,最終根據(jù)考核結(jié)果動(dòng)態(tài)調(diào)整國(guó)家平臺(tái)的運(yùn)行。建立這種系統(tǒng)、體現(xiàn)導(dǎo)向性的評(píng)價(jià)體系有利于規(guī)范各級(jí)參與方的職責(zé)和行為。將評(píng)價(jià)結(jié)果與績(jī)效考核、經(jīng)費(fèi)申請(qǐng)、獎(jiǎng)勵(lì)相結(jié)合,建立激勵(lì)機(jī)制,有利于規(guī)范科學(xué)數(shù)據(jù)的建設(shè)和運(yùn)行。
國(guó)外針對(duì)人口健康領(lǐng)域的科學(xué)數(shù)據(jù)管理建設(shè)起步較早,已開展大量工作,取得一定經(jīng)驗(yàn)。歐美等國(guó)家在政府的引導(dǎo)下已建立大批具有國(guó)際知名度和影響力的數(shù)據(jù)中心和數(shù)據(jù)平臺(tái)。早在19世紀(jì)80年代,美國(guó)成立國(guó)立生物技術(shù)信息中心(NCBI),負(fù)責(zé)收集、存儲(chǔ)生物醫(yī)學(xué)文獻(xiàn)資料以及生物分子序列、結(jié)構(gòu)數(shù)據(jù)[8]。歐洲分子生物學(xué)實(shí)驗(yàn)室建立核酸序列數(shù)據(jù)庫(kù)并于1992年成立歐洲生物信息研究所(EMBL-EBI)[9]。2007年哈佛大學(xué)定量社會(huì)科學(xué)研究所數(shù)據(jù)科學(xué)團(tuán)隊(duì)研發(fā)Dataverse研究數(shù)據(jù)管理系統(tǒng),已被多個(gè)研究機(jī)構(gòu)采用[10]。2015年美國(guó)、歐洲和日本共同建立國(guó)際核苷酸序列數(shù)據(jù)庫(kù)聯(lián)盟(INSDC)[11],為世界范圍內(nèi)的研究人員提供高效、便捷的生物信息資源獲取方式。2017年12月美國(guó)國(guó)立醫(yī)學(xué)圖書館(NLM)發(fā)布2017-2027戰(zhàn)略規(guī)劃——生物醫(yī)學(xué)發(fā)現(xiàn)和數(shù)據(jù)驅(qū)動(dòng)健康平臺(tái)[12],培育數(shù)據(jù)驅(qū)動(dòng)團(tuán)隊(duì),加強(qiáng)數(shù)據(jù)研究與傳播,加速研究發(fā)現(xiàn)。
我國(guó)人口健康領(lǐng)域科學(xué)數(shù)據(jù)管理建設(shè)與發(fā)展主要受政府財(cái)政支持,相比國(guó)外起步較晚,但多年來已開展大量工作。2002年我國(guó)啟動(dòng)國(guó)家科學(xué)數(shù)據(jù)共享工程,人口健康領(lǐng)域是最早的試點(diǎn)項(xiàng)目之一,目前建成的國(guó)家人口與健康科學(xué)數(shù)據(jù)共享平臺(tái)已投入使用?!笆濉逼陂g我國(guó)衛(wèi)生系統(tǒng)初步建立全國(guó)人口信息、電子健康檔案、電子病歷等數(shù)據(jù)庫(kù),全國(guó)已建立27個(gè)省(區(qū)、市)級(jí)人口健康信息平臺(tái)。2016年我國(guó)將精準(zhǔn)醫(yī)療計(jì)劃列入國(guó)家“十三五”科技發(fā)展重大專項(xiàng)并上升為國(guó)家戰(zhàn)略。專項(xiàng)要求構(gòu)建國(guó)家級(jí)的精準(zhǔn)醫(yī)學(xué)大數(shù)據(jù)管理共享技術(shù)平臺(tái),用于匯集各組織、各部門的醫(yī)學(xué)大數(shù)據(jù)。我國(guó)現(xiàn)有的人口健康科學(xué)數(shù)據(jù)管理平臺(tái)多通過政府主導(dǎo)資助,由高校、科研院所等機(jī)構(gòu)平臺(tái)構(gòu)建。國(guó)家人口與健康
科學(xué)數(shù)據(jù)共享平臺(tái)[13]是首批由科技部支持建設(shè)的國(guó)家級(jí)科學(xué)數(shù)據(jù)中心,項(xiàng)目的總體目標(biāo)是建立一個(gè)物理上分布、邏輯上高度統(tǒng)一的醫(yī)藥衛(wèi)生科學(xué)數(shù)據(jù)管理與共享服務(wù)系統(tǒng)。目前平臺(tái)已集成20多家單位的近800個(gè)數(shù)據(jù)集,共享資源總量超200億條、資源容量達(dá)67TB。2015年中國(guó)科學(xué)院北京基因組研究所開發(fā)并構(gòu)建組學(xué)原始數(shù)據(jù)存儲(chǔ)歸檔系統(tǒng)(GSA)[14],專注于組學(xué)原始數(shù)據(jù)收集與整合并提供免費(fèi)的數(shù)據(jù)存儲(chǔ)、共享與訪問服務(wù)。該系統(tǒng)是國(guó)內(nèi)首個(gè)被國(guó)際期刊認(rèn)可的組學(xué)數(shù)據(jù)發(fā)布平臺(tái),可接收世界各國(guó)的科研數(shù)據(jù)。北京大學(xué)和北京大學(xué)醫(yī)學(xué)部構(gòu)建多個(gè)健康醫(yī)療領(lǐng)域的科學(xué)數(shù)據(jù)管理平臺(tái),如中國(guó)健康醫(yī)療數(shù)據(jù)共享平臺(tái)[15]、中國(guó)隊(duì)列共享平臺(tái)[16]、中國(guó)腎臟疾病數(shù)據(jù)網(wǎng)絡(luò)[17]。這些平臺(tái)旨在整合健康醫(yī)療領(lǐng)域的數(shù)據(jù)資源,實(shí)現(xiàn)數(shù)據(jù)共享,推動(dòng)健康醫(yī)療大數(shù)據(jù)領(lǐng)域關(guān)鍵共性問題的解決。此外,社會(huì)力量也積極參與我國(guó)人口健康領(lǐng)域數(shù)據(jù)資源建設(shè)。創(chuàng)辦于1999年的華大基因目前已發(fā)展成為全球最大的基因組學(xué)研發(fā)機(jī)構(gòu),創(chuàng)建并匯聚海量生物醫(yī)學(xué)數(shù)據(jù),為我國(guó)人口與健康領(lǐng)域科學(xué)數(shù)據(jù)資源建設(shè)做出重大貢獻(xiàn)。2012年華大基因創(chuàng)辦開放型的在線期刊GigaScience[18],其不僅提供文獻(xiàn)全文,還允許用戶直接通過文獻(xiàn)所提供的數(shù)據(jù)和分析工具對(duì)結(jié)果進(jìn)行測(cè)試和驗(yàn)證,實(shí)現(xiàn)數(shù)據(jù)的透明、公開及可重現(xiàn)性。
近年來我國(guó)對(duì)人口健康領(lǐng)域的科學(xué)數(shù)據(jù)管理十分重視,陸續(xù)出臺(tái)一系列法規(guī)政策,將科學(xué)數(shù)據(jù)管理提升到戰(zhàn)略水平,針對(duì)管理平臺(tái)的建設(shè)工作也取得很大進(jìn)步。但是與國(guó)外科學(xué)數(shù)據(jù)管理平臺(tái)和相應(yīng)政策、標(biāo)準(zhǔn)相比還存在一定的問題。第一,我國(guó)現(xiàn)有的人口健康領(lǐng)域科學(xué)數(shù)據(jù)管理的數(shù)據(jù)來源較為固定,多來源于高校自身或下級(jí)數(shù)據(jù)中心的科研產(chǎn)出,有待進(jìn)一步擴(kuò)展更多資源渠道,提升數(shù)據(jù)資源發(fā)現(xiàn)能力,實(shí)現(xiàn)多方資源聯(lián)合,合作共贏。第二,人口健康科學(xué)數(shù)據(jù)管理平臺(tái)的管理內(nèi)容多以科學(xué)數(shù)據(jù)存儲(chǔ)和共享為主,主要對(duì)科研項(xiàng)目中后期產(chǎn)生的結(jié)果數(shù)據(jù)、文檔資料進(jìn)行收集整理和發(fā)布,并未實(shí)現(xiàn)整個(gè)生命周期的科學(xué)數(shù)據(jù)管理。第三,缺乏人口健康科學(xué)數(shù)據(jù)匯交和共享的標(biāo)準(zhǔn),導(dǎo)致現(xiàn)有開放數(shù)據(jù)的整體質(zhì)量和可復(fù)用性都亟待提高。需進(jìn)一步改善科學(xué)數(shù)據(jù)管理的總體環(huán)境,完善政策法規(guī),統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)。第四,我國(guó)數(shù)據(jù)共享建設(shè)正處于起步階段,在國(guó)際的影響力還十分欠缺,尚未建成具有國(guó)際競(jìng)爭(zhēng)力的科學(xué)數(shù)據(jù)中心,導(dǎo)致我國(guó)人口健康領(lǐng)域的科學(xué)研究數(shù)據(jù)多流向海外的權(quán)威數(shù)據(jù)庫(kù),科學(xué)數(shù)據(jù)流失情況嚴(yán)重。第五,我國(guó)科學(xué)數(shù)據(jù)管理起步較晚,缺少針對(duì)科學(xué)數(shù)據(jù)管理方面的人才培養(yǎng),研究人員的數(shù)據(jù)安全、數(shù)據(jù)道德和知識(shí)產(chǎn)權(quán)意識(shí)相對(duì)薄弱。
政府占據(jù)著大量的數(shù)據(jù)資源,因此也常常成為科學(xué)數(shù)據(jù)資源建設(shè)與共享的主體。我國(guó)人口健康領(lǐng)域科學(xué)數(shù)據(jù)管理平臺(tái)建設(shè)主要是由政府主導(dǎo),以及由政府引導(dǎo)高校、科研院所、企業(yè)等進(jìn)行一系列合作,大部分資源建設(shè)活動(dòng)通過政府投資、項(xiàng)目驅(qū)動(dòng)的形式進(jìn)行。以往由于相關(guān)政策法規(guī)的缺失,各大資源占有單位的共享意識(shí)不足,導(dǎo)致資源封閉且分散、影響力明顯不足。隨著兩項(xiàng)《辦法》的推出,在后續(xù)科學(xué)數(shù)據(jù)管理平臺(tái)的建設(shè)中應(yīng)注意進(jìn)一步加強(qiáng)國(guó)家政策引導(dǎo),增強(qiáng)政府的主導(dǎo)力度,建立強(qiáng)有力的全國(guó)性、跨行業(yè)的資源建設(shè)與管理協(xié)調(diào)機(jī)制。具體包括政府應(yīng)對(duì)每一層級(jí)部門(宏觀管理部門、主管部門、科學(xué)數(shù)據(jù)管理平臺(tái)、法人單位等)的管理責(zé)任做出具體指示,使各層級(jí)能夠進(jìn)行更有效的工作對(duì)接。針對(duì)發(fā)放科研項(xiàng)目的宏觀管理部門和主管部門,在項(xiàng)目申報(bào)初期應(yīng)向科研機(jī)構(gòu)等法人單位落實(shí)具體的科學(xué)數(shù)據(jù)匯交標(biāo)準(zhǔn)并明確指出接收該項(xiàng)目數(shù)據(jù)的科學(xué)數(shù)據(jù)管理平臺(tái)。同時(shí)各層級(jí)應(yīng)建立良好的關(guān)聯(lián),宏觀管理部門對(duì)平臺(tái)總體工作進(jìn)行統(tǒng)籌規(guī)劃,主管單位對(duì)法人單位的數(shù)據(jù)工作進(jìn)行相應(yīng)評(píng)價(jià)考核。
我國(guó)人口健康領(lǐng)域的科學(xué)數(shù)據(jù)管理平臺(tái)一般由各高校、科研院所等進(jìn)行獨(dú)立建設(shè),如北京大學(xué)和北大醫(yī)學(xué)部的中國(guó)健康醫(yī)療數(shù)據(jù)共享平臺(tái),中國(guó)科學(xué)院北京基因組研究所的組學(xué)原始數(shù)據(jù)存儲(chǔ)歸檔系統(tǒng)等。而這些管理平臺(tái)通常只針對(duì)院校內(nèi)的科研項(xiàng)目產(chǎn)出數(shù)據(jù)進(jìn)行接收和管理,缺乏合作伙伴的參與,各層級(jí)的共享合作觀念十分淡薄。兩項(xiàng)《辦法》中強(qiáng)調(diào)我國(guó)科學(xué)數(shù)據(jù)的開放共享應(yīng)秉持“開放為常態(tài)、不開放為例外”的原則,因此在后續(xù)平臺(tái)建設(shè)中應(yīng)加強(qiáng)科學(xué)數(shù)據(jù)管理平臺(tái)與各單位間的互聯(lián)互通。平臺(tái)主管部門應(yīng)組織發(fā)布科學(xué)數(shù)據(jù)資源目錄,促進(jìn)數(shù)據(jù)共享和重復(fù)利用。同時(shí)應(yīng)加強(qiáng)區(qū)域內(nèi)、系統(tǒng)內(nèi)的共享合作,以及科研院所、圖書館、信息技術(shù)公司等機(jī)構(gòu)之間的合作,綜合利用各單位資源、服務(wù)、人才和技術(shù)優(yōu)勢(shì)打造更好的資源建設(shè)環(huán)境與網(wǎng)絡(luò)。
《科學(xué)數(shù)據(jù)管理辦法》指出科學(xué)數(shù)據(jù)的管理應(yīng)覆蓋到科學(xué)研究的整個(gè)過程。英國(guó)的Data Archive將科學(xué)數(shù)據(jù)時(shí)代生命周期分成6個(gè)階段,即數(shù)據(jù)創(chuàng)建、數(shù)據(jù)處理、存儲(chǔ)數(shù)據(jù)分析、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)共享和數(shù)據(jù)重用[19]。國(guó)外很多數(shù)據(jù)倉(cāng)儲(chǔ)平臺(tái)要求科研人員從研究開始就提交數(shù)據(jù)管理計(jì)劃,對(duì)全生命周期的科學(xué)數(shù)據(jù)進(jìn)行管理。而我國(guó)目前的人口健康科學(xué)數(shù)據(jù)管理重心多為數(shù)據(jù)匯交、存儲(chǔ)和共享。建議國(guó)內(nèi)科學(xué)數(shù)據(jù)管理平臺(tái)建設(shè)過程中應(yīng)針對(duì)數(shù)據(jù)計(jì)劃、生產(chǎn)、采集、匯交、加工、存儲(chǔ)、保存、分析、出版、再利用、安全、更新等具體環(huán)節(jié)制定詳盡的數(shù)據(jù)管理標(biāo)準(zhǔn),使科研項(xiàng)目與科學(xué)數(shù)據(jù)管理平臺(tái)能互通互認(rèn),數(shù)據(jù)匯交流程能夠透明化,項(xiàng)目組能通過科學(xué)數(shù)據(jù)管理平臺(tái)跟蹤數(shù)據(jù)的匯交狀態(tài),合作完成全生命周期的數(shù)據(jù)管理。
由于標(biāo)準(zhǔn)的不統(tǒng)一,不同單位的數(shù)據(jù)資源采用的數(shù)據(jù)標(biāo)準(zhǔn)也不盡相同,導(dǎo)致我國(guó)人口健康領(lǐng)域的科學(xué)數(shù)據(jù)整合難度較大,嚴(yán)重影響科學(xué)數(shù)據(jù)的共享和復(fù)用?!犊茖W(xué)數(shù)據(jù)管理辦法》提出應(yīng)制定國(guó)家科學(xué)數(shù)據(jù)管理政策和標(biāo)準(zhǔn)規(guī)范,規(guī)定各法人單位的科學(xué)數(shù)據(jù)生產(chǎn)者應(yīng)按照相關(guān)標(biāo)準(zhǔn)規(guī)范進(jìn)行科學(xué)數(shù)據(jù)的生產(chǎn)、采集、整理和加工,使生成的數(shù)據(jù)庫(kù)或數(shù)據(jù)集便于統(tǒng)一管理,使數(shù)據(jù)可利用、可分析。在后續(xù)平臺(tái)建設(shè)中應(yīng)建立包括資源唯一標(biāo)識(shí)符、元數(shù)據(jù)規(guī)范、知識(shí)組織規(guī)范、長(zhǎng)期保存規(guī)范、數(shù)據(jù)質(zhì)量控制、資源評(píng)價(jià)等在內(nèi)的能夠適應(yīng)新環(huán)境下大數(shù)據(jù)服務(wù)需求的資源標(biāo)準(zhǔn)規(guī)范體系。重點(diǎn)加強(qiáng)數(shù)據(jù)加工、描述、長(zhǎng)期存儲(chǔ)與服務(wù)類的標(biāo)準(zhǔn)規(guī)范建設(shè),促進(jìn)資源在更深層次、更廣范圍內(nèi)的共享、互操作和復(fù)用,實(shí)現(xiàn)科學(xué)數(shù)據(jù)的價(jià)值最大化。
國(guó)外大型科學(xué)數(shù)據(jù)管理平臺(tái)已建成成熟的評(píng)估考核體系,而我國(guó)人口健康領(lǐng)域的科學(xué)數(shù)據(jù)管理平臺(tái)缺乏一體化的統(tǒng)籌管理,也缺乏體系化、行之有效的量化考核指標(biāo)。兩項(xiàng)《辦法》也提出應(yīng)對(duì)數(shù)據(jù)中心建立完善的評(píng)價(jià)考核制度。在后續(xù)建設(shè)中,應(yīng)以資源管理視角,建立相對(duì)科學(xué)、客觀且具備一定可操作性的平臺(tái)資源評(píng)價(jià)指標(biāo)體系。融合多維度定量定性指標(biāo),全面反映資源主題的代表性、權(quán)威性及行業(yè)影響力、資源質(zhì)量、規(guī)模、服務(wù)能力及服務(wù)成效等內(nèi)容?;谄脚_(tái)資源評(píng)價(jià)體系,持續(xù)開展數(shù)據(jù)質(zhì)量評(píng)估,發(fā)布年度評(píng)價(jià)報(bào)告,使平臺(tái)資源評(píng)價(jià)常態(tài)化。
科學(xué)數(shù)據(jù)管理與共享的各個(gè)環(huán)節(jié)都離不開專業(yè)人員的操作,但我國(guó)對(duì)專業(yè)數(shù)據(jù)管理和共享方面的人才培養(yǎng)重視度并不足夠。因此大力加強(qiáng)科學(xué)數(shù)據(jù)管理專業(yè)人才隊(duì)伍建設(shè)勢(shì)在必行。國(guó)內(nèi)高校、科研院所、相關(guān)企業(yè)都應(yīng)加強(qiáng)培養(yǎng)研究人員的數(shù)據(jù)素養(yǎng),為研究人員樹立正確的科學(xué)數(shù)據(jù)管理意識(shí)。尤其應(yīng)注重培養(yǎng)研究人員的數(shù)據(jù)安全、數(shù)據(jù)道德和知識(shí)產(chǎn)權(quán)意識(shí)。同時(shí)還應(yīng)加強(qiáng)國(guó)際交流,學(xué)習(xí)國(guó)外科學(xué)數(shù)據(jù)管理經(jīng)驗(yàn)和成果。建立全面、行之有效的人才培養(yǎng)機(jī)制,組建專業(yè)的建設(shè)隊(duì)伍,促進(jìn)我國(guó)科學(xué)數(shù)據(jù)管理、分析、利用、共享等工作的有效開展,對(duì)提高我國(guó)科研產(chǎn)出效率、促進(jìn)研究成果的轉(zhuǎn)換有著十分重要的意義。
綜上所述,為提高我國(guó)科學(xué)數(shù)據(jù)管理平臺(tái)的建設(shè)水平,需進(jìn)一步加強(qiáng)國(guó)家政策引導(dǎo)、建立健全的平臺(tái)建設(shè)與共享機(jī)制、轉(zhuǎn)變平臺(tái)建設(shè)與共享觀念、完善標(biāo)準(zhǔn)體系、加強(qiáng)技術(shù)支持與人才培養(yǎng),建設(shè)覆蓋全球的科學(xué)數(shù)據(jù)管理平臺(tái)。