国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

前沿領(lǐng)域國(guó)內(nèi)外典型數(shù)據(jù)庫調(diào)研與啟示

2023-05-16 02:45:42段博文王卷樂石蕾高孟緒
關(guān)鍵詞:數(shù)據(jù)中心領(lǐng)域數(shù)據(jù)庫

段博文,王卷樂,,石蕾,高孟緒

研究論文

前沿領(lǐng)域國(guó)內(nèi)外典型數(shù)據(jù)庫調(diào)研與啟示

段博文1,王卷樂1,2*,石蕾3,高孟緒3

1. 中國(guó)科學(xué)院地理科學(xué)與資源研究所資源與環(huán)境信息系統(tǒng)國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京 100101;2. 江蘇省地理信息資源開發(fā)與利用協(xié)同創(chuàng)新中心,南京 210023;3. 國(guó)家科技基礎(chǔ)條件平臺(tái)中心,北京 100862

科學(xué)數(shù)據(jù)是“數(shù)據(jù)—信息—知識(shí)—智慧”創(chuàng)新價(jià)值鏈的基礎(chǔ),是最基本的科技資源,對(duì)經(jīng)濟(jì)社會(huì)發(fā)展和科技創(chuàng)新起到重要作用?!吨腥A人民共和國(guó)國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展第十四個(gè)五年規(guī)劃和2035年遠(yuǎn)景目標(biāo)綱要》部署了實(shí)施戰(zhàn)略性科學(xué)計(jì)劃和科學(xué)工程的9大前沿領(lǐng)域。及時(shí)掌握這些前沿領(lǐng)域的科學(xué)數(shù)據(jù)共享現(xiàn)狀和需求,對(duì)于更好地加強(qiáng)我國(guó)科學(xué)數(shù)據(jù)中心建設(shè)并發(fā)揮數(shù)據(jù)對(duì)前沿領(lǐng)域的支撐作用意義重大。文章跟蹤人工智能、量子信息、集成電路、生命健康、腦科學(xué)、生物育種、深地、深海以及可持續(xù)發(fā)展9大領(lǐng)域數(shù)據(jù)庫國(guó)內(nèi)外進(jìn)展,從數(shù)據(jù)資源情況、數(shù)據(jù)庫/平臺(tái)整合能力、應(yīng)用服務(wù)以及典型案例等方面進(jìn)行調(diào)研分析。以在海洋和地球系統(tǒng)科學(xué)領(lǐng)域具有代表性的德國(guó)PANGAEA數(shù)據(jù)庫為代表,剖析其在組織架構(gòu)、技術(shù)運(yùn)維和運(yùn)營(yíng)管理流程等方面的特點(diǎn)??偨Y(jié)提出面向我國(guó)前沿領(lǐng)域需求的科學(xué)數(shù)據(jù)治理和發(fā)展建議。

數(shù)據(jù)共享;科學(xué)數(shù)據(jù);數(shù)據(jù)庫;PANGAEA;前沿領(lǐng)域;十四五規(guī)劃

1 引言

隨著“大數(shù)據(jù)”理念的普及和數(shù)據(jù)驅(qū)動(dòng)科學(xué)研究“第四范式”的興起,世界各國(guó)將科學(xué)數(shù)據(jù)視為一個(gè)國(guó)家重要的戰(zhàn)略性資源和科技實(shí)力競(jìng)爭(zhēng)的重要資本[1]。由各學(xué)科領(lǐng)域科學(xué)數(shù)據(jù)所構(gòu)成的規(guī)范化、集成化和規(guī)?;臄?shù)據(jù)庫體現(xiàn)著一個(gè)國(guó)家的科學(xué)數(shù)據(jù)積累和服務(wù)能力。發(fā)達(dá)國(guó)家已經(jīng)將科學(xué)數(shù)據(jù)的持續(xù)積累和開放利用能力提高到了國(guó)家科技戰(zhàn)略的高度進(jìn)行部署,并投入了大量的人力、物力和財(cái)力,通過多年持續(xù)積累,形成了一批權(quán)威、長(zhǎng)序列和多尺度的科學(xué)數(shù)據(jù)庫,在科研過程中發(fā)揮了重要作用。例如,在農(nóng)業(yè)科學(xué)領(lǐng)域,有被譽(yù)為世界上最古老的農(nóng)業(yè)研究中心之一的英國(guó)洛桑農(nóng)業(yè)實(shí)驗(yàn)站,擁有170年序列的土壤科學(xué)數(shù)據(jù)資料,其數(shù)據(jù)內(nèi)容包括遺傳學(xué)、生物化學(xué)、細(xì)胞生物學(xué)和生態(tài)系統(tǒng)研究等方面。該中心為科學(xué)家研究農(nóng)業(yè)、環(huán)境、生態(tài)平衡和分子生物學(xué)等問題提供了寶貴的信息資源[2]。在地球科學(xué)領(lǐng)域,美國(guó)地球資源觀測(cè)科學(xué)中心(EROS)存放著時(shí)間序列最長(zhǎng)的Landsat等民用遙感衛(wèi)星歸檔資料,并通過美國(guó)地質(zhì)調(diào)查局(USGS)的門戶對(duì)全球共享[3]。在生命科學(xué)領(lǐng)域,國(guó)際核酸序列共享聯(lián)盟(INSDC)包括國(guó)家生物技術(shù)信息中心(NCBI)、歐洲生物信息研究所(EBI)和日本DNA數(shù)據(jù)庫(DDBJ)3大數(shù)據(jù)庫系統(tǒng),形成領(lǐng)域內(nèi)數(shù)據(jù)存儲(chǔ)和共享使用的標(biāo)準(zhǔn),接收并存儲(chǔ)來自全世界科學(xué)家提交的組學(xué)數(shù)據(jù)[4]。

從國(guó)際視野整體來看,全球科學(xué)數(shù)據(jù)中心的發(fā)展仍然是主流態(tài)勢(shì)。世界數(shù)據(jù)系統(tǒng)(WDS)①[https://www.worlddatasystem.org/]是國(guó)際上最大的科學(xué)數(shù)據(jù)組織。截至2020年12月,WDS共建立128個(gè)數(shù)據(jù)中心成員,其中有86個(gè)具有實(shí)體數(shù)據(jù)庫平臺(tái)的正式成員。其推出CoreTrustSeal(CTS)數(shù)據(jù)中心認(rèn)證體系,提出TRUST原則(透明、責(zé)任、面向用戶、可持續(xù)和技術(shù)),推動(dòng)了全球科學(xué)數(shù)據(jù)共享和服務(wù)。Confederation of Open Access Repositories (COAR)②[https://www.coar-repositories.org/]是一個(gè)年輕的、迅速成長(zhǎng)的開放存取知識(shí)庫聯(lián)盟,成立于2009年,是目前最為活躍的開放獲取國(guó)際組織之一。目前,它擁有來自世界各地的140多名成員和合作伙伴,代表圖書館、大學(xué)、研究機(jī)構(gòu)、政府資助者和其他利益相關(guān)方。

我國(guó)自上世紀(jì)80年代起,通過不同渠道建設(shè)了涉及諸多學(xué)科與行業(yè)領(lǐng)域的科學(xué)數(shù)據(jù)庫。2018年3月,國(guó)務(wù)院辦公廳印發(fā)《科學(xué)數(shù)據(jù)管理辦法》[5]。同期,科技部、財(cái)政部印發(fā)《國(guó)家科技資源共享服務(wù)平臺(tái)管理辦法》,規(guī)范管理國(guó)家科技資源共享服務(wù)平臺(tái),推進(jìn)科技資源向社會(huì)開放共享。2019年6月,科技部、財(cái)政部落實(shí)《科學(xué)數(shù)據(jù)管理辦法》和《國(guó)家科技資源共享服務(wù)平臺(tái)管理辦法》的要求,按照《國(guó)家科技創(chuàng)新基地優(yōu)化整合方案》對(duì)原有國(guó)家平臺(tái)開展了優(yōu)化調(diào)整工作,共形成“國(guó)家高能物理科學(xué)數(shù)據(jù)中心”等20個(gè)國(guó)家科學(xué)數(shù)據(jù)中心,逐步在建設(shè)和積累我國(guó)的科學(xué)數(shù)據(jù)庫資源體系和服務(wù)體系[6]。中國(guó)在不同學(xué)科領(lǐng)域的科學(xué)數(shù)據(jù)中心也在蓬勃發(fā)展,例如,有世界可再生資源與環(huán)境數(shù)據(jù)中心(WDC-RRE)、全球變化科學(xué)數(shù)據(jù)出版系統(tǒng)和國(guó)家空間科學(xué)數(shù)據(jù)中心(NSSDC)等9家面向不同領(lǐng)域的數(shù)據(jù)中心進(jìn)入WDS;有中國(guó)地震科學(xué)探測(cè)臺(tái)陣數(shù)據(jù)中心、國(guó)家氣象信息中心(CMDC)和中國(guó)天文數(shù)據(jù)中心(CAsDC)等多領(lǐng)域數(shù)據(jù)中心進(jìn)入re3data.org系統(tǒng)。

圍繞《中華人民共和國(guó)國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展第十四個(gè)五年規(guī)劃和2035年遠(yuǎn)景目標(biāo)綱要》(“十四五”規(guī)劃)的發(fā)展要求,國(guó)內(nèi)數(shù)據(jù)中心的蓬勃發(fā)展發(fā)揮了很大的支撐和促進(jìn)作用。但是這些數(shù)據(jù)中心與“十四五”規(guī)劃中提到的優(yōu)勢(shì)領(lǐng)域?qū)?yīng)性還不強(qiáng),當(dāng)前的科學(xué)數(shù)據(jù)中心還不能完全覆蓋所有的學(xué)科領(lǐng)域,還需要針對(duì)性地加強(qiáng)支撐前沿領(lǐng)域發(fā)展的數(shù)據(jù)庫。為此,本文面向國(guó)家中長(zhǎng)期發(fā)展規(guī)劃中的前沿領(lǐng)域數(shù)據(jù)需求,開展數(shù)據(jù)庫調(diào)研分析和國(guó)際影響力較強(qiáng)的典型領(lǐng)域案例剖析,以助力于我國(guó)科學(xué)數(shù)據(jù)共享的發(fā)展。

2 重點(diǎn)前沿領(lǐng)域?qū)n}數(shù)據(jù)庫調(diào)研情況

“十四五”規(guī)劃提到要實(shí)施戰(zhàn)略性科學(xué)計(jì)劃和科學(xué)工程,要瞄準(zhǔn)9大前沿領(lǐng)域,包括人工智能、量子信息、集成電路、生命健康、腦科學(xué)、生物育種、深地、深海以及可持續(xù)發(fā)展[7]。在此背景下,本次重點(diǎn)專題數(shù)據(jù)庫調(diào)研從9大前沿領(lǐng)域中,分別遴選國(guó)內(nèi)外有影響的數(shù)據(jù)中心,并從數(shù)據(jù)庫概述、數(shù)據(jù)資源情況、數(shù)據(jù)庫/平臺(tái)整合能力、應(yīng)用服務(wù)以及典型案例等多個(gè)方面進(jìn)行調(diào)研與分析。

人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支,屬于自然科學(xué)和社會(huì)科學(xué)的交叉。在實(shí)際應(yīng)用中,人工智能可用于多個(gè)領(lǐng)域,例如在自動(dòng)識(shí)別領(lǐng)域可服務(wù)于機(jī)器視覺、指紋識(shí)別、人臉識(shí)別、視網(wǎng)膜識(shí)別、虹膜識(shí)別和掌紋識(shí)別等。在國(guó)內(nèi)外人工智能領(lǐng)域中,建有較為成熟的數(shù)據(jù)庫/數(shù)據(jù)中心。例如,英國(guó)牛津大學(xué)機(jī)器人研究所的牛津機(jī)器人車數(shù)據(jù)集(Oxford RobotCar Dataset)③[https://robotcar-dataset.robots.ox.ac.uk/]和生物識(shí)別與安全技術(shù)研究中心(CBSR)④[http://www.cbsr.ia.ac.cn/]。前者是由汽車攝像頭拍攝的照片組成的數(shù)據(jù)集,主要呈現(xiàn)行駛路線在一年內(nèi)的變化,包含不同天氣、交通和行人的組合,以及建筑和道路工程的變化。CBSR是國(guó)內(nèi)專業(yè)從事生物特征識(shí)別的研究機(jī)構(gòu)。兩者相比較,牛津機(jī)器人車數(shù)據(jù)平臺(tái)建設(shè)較為完善,提供了數(shù)據(jù)、手冊(cè)、示例等,但數(shù)據(jù)集的應(yīng)用范圍較小,局限于英國(guó)街道。CBSR主要產(chǎn)出生物識(shí)別領(lǐng)域數(shù)據(jù)集,涉及數(shù)據(jù)集較多。此外,在應(yīng)用方面,CBSR的CASIA-FaceV5數(shù)據(jù)集為亞洲人臉數(shù)據(jù)集,常被用于人臉識(shí)別應(yīng)用。

量子信息領(lǐng)域是量子力學(xué)與信息學(xué)交叉形成的一門邊緣學(xué)科。它的發(fā)展在各個(gè)方面影響著人類日常生活。比如,人類使用的互聯(lián)網(wǎng)、計(jì)算機(jī)、手機(jī)導(dǎo)航和醫(yī)院里的磁共振成像等,這些無一不依賴于量子科學(xué)的發(fā)展。在量子信息領(lǐng)域數(shù)據(jù)庫的建設(shè)發(fā)展中,美國(guó)物理研究所的美國(guó)物理學(xué)會(huì)(APS)⑤[https://www.aps.org/]和依托于中國(guó)科學(xué)技術(shù)大學(xué)的合肥微尺度物質(zhì)科學(xué)國(guó)家研究中心⑥[http://www.hfnl.ustc.edu.cn/]是國(guó)內(nèi)外建設(shè)體系成熟、發(fā)展迅速的數(shù)據(jù)庫/數(shù)據(jù)中心之一。APS是一個(gè)非營(yíng)利性會(huì)員組織,它致力于通過學(xué)術(shù)期刊、科學(xué)會(huì)議以及教育、宣傳和國(guó)際活動(dòng)來促進(jìn)和傳播物理知識(shí),是世界上最具聲望的物理學(xué)專業(yè)學(xué)會(huì)之一。APS的成立時(shí)間遠(yuǎn)早于同類型的數(shù)據(jù)中心且人員組成豐富,資源龐大,共有5萬多名成員,包括美國(guó)和世界各地的學(xué)術(shù)界、國(guó)家實(shí)驗(yàn)室和行業(yè)的物理學(xué)家。合肥微尺度物質(zhì)科學(xué)國(guó)家研究中心是科技部在2017年批準(zhǔn)組建的6個(gè)國(guó)家研究中心之一,它的研究方面涉及廣泛,我國(guó)在量子科技領(lǐng)域取得的眾多成果均有該中心的參與。在應(yīng)用方面,合肥微尺度物質(zhì)科學(xué)國(guó)家研究中心利用“墨子號(hào)”量子科學(xué)實(shí)驗(yàn)衛(wèi)星,在國(guó)際上首次實(shí)現(xiàn)千公里級(jí)基于糾纏的量子密鑰分發(fā)。

集成電路是微電子技術(shù)發(fā)展的基礎(chǔ),主要將常用電子元件,包括電阻、電容和晶體管等,通過半導(dǎo)體工藝集成在一起,形成具有特定功能的電路,在各行各業(yè)中發(fā)揮著非常重要的作用,是現(xiàn)代信息社會(huì)的重要基石。集成電路領(lǐng)域的數(shù)據(jù)庫主要作用是關(guān)注半導(dǎo)體的發(fā)展情況,及時(shí)了解動(dòng)態(tài)數(shù)據(jù),來量化相關(guān)業(yè)務(wù)戰(zhàn)略的有效性。國(guó)際典型數(shù)據(jù)庫有總部位于美國(guó)加利福尼亞州圣何塞的世界半導(dǎo)體貿(mào)易統(tǒng)計(jì)數(shù)據(jù)庫(WSTS)⑦[https://www.wsts.org/]。它不僅關(guān)注當(dāng)前的市場(chǎng)狀況,還可以預(yù)測(cè)未來半導(dǎo)體市場(chǎng)的發(fā)展,是提供全行業(yè)市場(chǎng)統(tǒng)計(jì)數(shù)據(jù)的重要來源。此外,這些市場(chǎng)信息還能幫助研究團(tuán)隊(duì)加強(qiáng)分析,并為調(diào)整關(guān)鍵基準(zhǔn)提供重要的參考點(diǎn)。國(guó)內(nèi)在該領(lǐng)域的典型數(shù)據(jù)庫起步較晚,不過有一些潛力較大的數(shù)據(jù)庫,如中國(guó)集成電路材料產(chǎn)業(yè)技術(shù)創(chuàng)新聯(lián)盟參與建設(shè)的聯(lián)合分析監(jiān)測(cè)與技術(shù)合作服務(wù)平臺(tái)⑧[http://www.icmtia.com/]。該平臺(tái)著力于收集、發(fā)布聯(lián)盟成員所屬儀器和設(shè)備等資源,并向社會(huì)開放共享,以求推動(dòng)國(guó)內(nèi)半導(dǎo)體行業(yè)技術(shù)創(chuàng)新發(fā)展。與WSTS相比,該服務(wù)平臺(tái)起步晚,主要通過持續(xù)發(fā)布更新儀器、設(shè)備信息,吸引更多企業(yè)、研究所和高校等能參與其中。

生命健康領(lǐng)域主要是指與人類健康緊密相關(guān)的生產(chǎn)和服務(wù)領(lǐng)域。在國(guó)內(nèi)外數(shù)據(jù)庫的發(fā)展進(jìn)程中,該領(lǐng)域的數(shù)據(jù)庫具有很重要的地位并且擁有成熟的管理體系。例如,在國(guó)際上該領(lǐng)域的典型數(shù)據(jù)庫有國(guó)家生物技術(shù)信息中心(NCBI)⑨[https://www.ncbi.nlm.nih.gov/],國(guó)內(nèi)則是有由深圳華大生命科學(xué)研究院(原深圳華大基因研究院)承建的(深圳)國(guó)家基因庫(CNGB)⑩[https://www.cngb.org/]。NCBI建立于1988年,是公共生物醫(yī)學(xué)數(shù)據(jù)庫、分子及基因組數(shù)據(jù)的軟件工具及計(jì)算機(jī)生物學(xué)研究的領(lǐng)先機(jī)構(gòu)。它的使命是開發(fā)新的信息技術(shù),以幫助理解控制健康和疾病的基本分子和遺傳過程,其網(wǎng)站訪問量每天大約在300萬。CNGB建設(shè)于2011年,是世界領(lǐng)先的國(guó)家級(jí)綜合性基因庫,目前已初步建成了“三庫兩平臺(tái)”的業(yè)務(wù)架構(gòu),擁有10TB+的元信息。從成立時(shí)間看,NCBI的建立早于CNGB,并且用戶訪問量也高于國(guó)內(nèi)數(shù)據(jù)庫。但CNGB擁有一些獨(dú)有的優(yōu)勢(shì),首先,CNGB不僅包括生物信息數(shù)據(jù)庫,還包括生物樣本資源庫、動(dòng)植物資源活體庫、數(shù)字化平臺(tái)和合成與編輯平臺(tái);第二,CNGB不僅僅進(jìn)行樣本和數(shù)據(jù)的存儲(chǔ),還實(shí)現(xiàn)了遺傳資源存、讀和寫的全貫穿;第三,像NCBI、EBI和DDBJ等大多數(shù)國(guó)際數(shù)據(jù)庫更多地面向科研,而CNGB在支撐科研的同時(shí),也面向產(chǎn)業(yè)轉(zhuǎn)化和應(yīng)用。腦科學(xué)既是生物科學(xué)里較為神秘的領(lǐng)域,也是未來生命科學(xué)發(fā)展中很重要的一個(gè)領(lǐng)域。世界各國(guó)普遍重視腦科學(xué)研究,并有相應(yīng)政策扶持。比如,國(guó)際腦研究組織(IBRO)于1995年在日本京都舉辦的第4屆世界神經(jīng)科學(xué)大會(huì)上,提議把21世紀(jì)稱為“腦的世紀(jì)”;美國(guó)在101屆國(guó)會(huì)通過一個(gè)議案“命名1990年1月1日開始的十年為腦的十年”;歐共體成立了“歐洲腦的十年委員會(huì)”及腦研究聯(lián)盟;中國(guó)也提出了“腦功能及其細(xì)胞和分子基礎(chǔ)”的研究項(xiàng)目,并列入了國(guó)家的“攀登計(jì)劃”[8]。腦科學(xué)領(lǐng)域數(shù)據(jù)庫的建立與發(fā)展,在推動(dòng)腦科學(xué)的研究中起到很重要的作用,也是各國(guó)在發(fā)展該領(lǐng)域研究中很重要的前沿基礎(chǔ)。例如,美國(guó)功能性磁共振成像組織2009年啟動(dòng)的1 000個(gè)功能性連接體項(xiàng)目(1000FCP)?[http://fcon_1000.projects.nitrc.org/index.html],目前已發(fā)布1 200多個(gè)靜態(tài)功能磁共振數(shù)據(jù)集。它重視大規(guī)模數(shù)據(jù)集的共享,將腦科學(xué)研究數(shù)據(jù)標(biāo)準(zhǔn)的建立和數(shù)據(jù)平臺(tái)的建設(shè)作為促進(jìn)腦科學(xué)創(chuàng)新的關(guān)鍵。該數(shù)據(jù)在78個(gè)國(guó)家/地區(qū)的1 223個(gè)城市產(chǎn)生了超過9 000次下載和約32 000次頁面瀏覽記錄。該數(shù)據(jù)集在美國(guó)科學(xué)院院刊(PNAS)上的發(fā)表,證明了使用數(shù)據(jù)集進(jìn)行數(shù)據(jù)匯集和發(fā)現(xiàn)科學(xué)的可行性[9]。國(guó)內(nèi)典型數(shù)據(jù)庫有中國(guó)科學(xué)院腦科學(xué)與智能技術(shù)卓越創(chuàng)新中心(CEBSIT)下設(shè)的腦科學(xué)數(shù)據(jù)與計(jì)算中心?[http://www.ion.ac.cn/]。該中心負(fù)責(zé)開發(fā)腦科學(xué)研究相關(guān)的數(shù)據(jù)處理與計(jì)算分析技術(shù),協(xié)助攻克腦與類腦領(lǐng)域的科學(xué)、技術(shù)與工程問題,預(yù)期建成國(guó)際領(lǐng)先水平的多緯度、多層次腦科學(xué)數(shù)據(jù)庫。

生物育種是利用遺傳學(xué)、細(xì)胞生物學(xué)和現(xiàn)代生物工程技術(shù)等方法原理培育生物新品種的過程,因此數(shù)據(jù)庫/數(shù)據(jù)中心更專注于物種信息的收集與整理,以支撐前沿科學(xué)的研究與發(fā)現(xiàn)。例如,美國(guó)馬里蘭州貝茨維爾國(guó)家種質(zhì)資源實(shí)驗(yàn)室運(yùn)營(yíng)的美國(guó)種質(zhì)資源信息網(wǎng)絡(luò)(GRIN)?[https://www.ars-grin.gov/]和中國(guó)科學(xué)院植物研究所創(chuàng)建并負(fù)責(zé)運(yùn)營(yíng)的植物科學(xué)數(shù)據(jù)中心?[https://www.plantplus.cn/]。GRIN最初建立于20世紀(jì)70年代,致力于保護(hù)植物遺傳多樣性,提高作物的品質(zhì)和產(chǎn)量。它專注的重點(diǎn)不僅包括植物種質(zhì)體系,同時(shí)建立了微生物種質(zhì)體系、動(dòng)物種質(zhì)體系以及無脊椎動(dòng)物種質(zhì)體系。植物科學(xué)數(shù)據(jù)中心為國(guó)家植物名錄的建造和相關(guān)科研工作提供了重要支撐。這兩個(gè)典型數(shù)據(jù)庫有一個(gè)共同的特點(diǎn),即數(shù)據(jù)量龐大,且面向群體廣。例如,運(yùn)用植物科學(xué)數(shù)據(jù)中心的彩色照片和物種信息等數(shù)據(jù),研發(fā)出可識(shí)別5000余種植物的花伴侶專業(yè)版拍照識(shí)花APP,助力了對(duì)公眾的科普教育,用戶人群達(dá)1200萬,總識(shí)別量1.6億次。

從地球認(rèn)知的角度,深地主要是探究地表以下的部分。例如,包括淺表的地下空間、地殼、地幔、地核和地心在內(nèi)的整個(gè)固體地球系統(tǒng)。深地領(lǐng)域數(shù)據(jù)庫的建立可以在防災(zāi)減災(zāi)、資源開發(fā)和科學(xué)發(fā)現(xiàn)等方面更好地服務(wù)國(guó)家和社會(huì)。在國(guó)際上,該領(lǐng)域典型數(shù)據(jù)庫有英國(guó)地質(zhì)調(diào)查局建設(shè)的全球地質(zhì)一張圖(One Geology)?[https://onegeology.org/]和美國(guó)國(guó)家科學(xué)基金會(huì)(NSF)資助的地質(zhì)年代(GeoChron)?[https://www.geochron.org]。這兩個(gè)數(shù)據(jù)庫均啟動(dòng)和運(yùn)行于2007年。One Geology致力于在網(wǎng)絡(luò)上以最佳比例尺在全球范圍內(nèi)獲取地質(zhì)和其他地球科學(xué)數(shù)據(jù);GeoChron旨在捕獲完整的數(shù)據(jù)和元數(shù)據(jù)以記錄地球年代。相對(duì)于國(guó)外兩家在深地領(lǐng)域具有成熟運(yùn)營(yíng)管理體系的數(shù)據(jù)庫相比,總部設(shè)在中國(guó)的國(guó)際深時(shí)數(shù)字地球科學(xué)計(jì)劃(DDE)?[https://www.ddeworld.org/]正處于起步階段。DDE計(jì)劃是一項(xiàng)創(chuàng)新的國(guó)際大科學(xué)計(jì)劃,它將為地球科學(xué)的發(fā)展提供新的機(jī)遇和方向[10]。上世紀(jì),我國(guó)錯(cuò)失參與板塊理論提出和建立的機(jī)會(huì),導(dǎo)致在國(guó)際地球科學(xué)學(xué)術(shù)舞臺(tái)上長(zhǎng)期沒有話語權(quán)和影響力。今天,我國(guó)科學(xué)家主導(dǎo)發(fā)起的DDE的順利實(shí)施,將為我國(guó)科學(xué)家在新世紀(jì)數(shù)據(jù)驅(qū)動(dòng)科學(xué)重大突破提供平臺(tái),創(chuàng)造難得機(jī)遇,對(duì)實(shí)現(xiàn)我國(guó)原始創(chuàng)新發(fā)展、顯著提升我國(guó)地球科學(xué)水平和國(guó)際影響力以及實(shí)現(xiàn)地球科學(xué)強(qiáng)國(guó)具有重大的科學(xué)意義。

從字面上講,國(guó)際上對(duì)深海的定義是位于200米以下的區(qū)域就屬于深海區(qū)域。在該領(lǐng)域上,國(guó)際大洋發(fā)現(xiàn)計(jì)劃(IODP)數(shù)據(jù)庫?[https://web.iodp.tamu.edu/]是目前地球科學(xué)領(lǐng)域迄今為止歷時(shí)最長(zhǎng)、成效最大的國(guó)際科學(xué)合作計(jì)劃之一。其中,LIMS數(shù)據(jù)庫是IODP核心的數(shù)據(jù)庫,其整體體系較為成熟,所含數(shù)據(jù)類型及共享方式也日趨完善和體系化。國(guó)內(nèi)該領(lǐng)域的典型數(shù)據(jù)庫有國(guó)家海洋局第一海洋研究所籌建的國(guó)家自然科學(xué)基金青島海洋科學(xué)資料共享服務(wù)中心?[http://www.nsfcodc.cn/]。該中心建立的目的是開展自然科學(xué)基金海洋科學(xué)資料共享服務(wù)工作,建立各類海洋科學(xué)基金項(xiàng)目資料的收集、整編和共享服務(wù)體系。雖然中心起步較晚,但是其數(shù)據(jù)庫的運(yùn)營(yíng)維護(hù)具有獨(dú)特的特點(diǎn)。

2015年9月,聯(lián)合國(guó)193個(gè)成員國(guó)在聯(lián)合國(guó)可持續(xù)發(fā)展峰會(huì)上正式通過17個(gè)可持續(xù)發(fā)展目標(biāo)(SDGs)[11]??沙掷m(xù)發(fā)展的內(nèi)容包括生態(tài)可持續(xù)發(fā)展、經(jīng)濟(jì)可持續(xù)發(fā)展和社會(huì)可持續(xù)發(fā)展3個(gè)方面。開放SDG數(shù)據(jù)樞紐?[https://www.sdg.org/]是聯(lián)合國(guó)通過地理空間數(shù)據(jù)幫助發(fā)展中國(guó)家實(shí)現(xiàn)和跟蹤其可持續(xù)發(fā)展目標(biāo)。它可以提供SDG指標(biāo)的地理空間數(shù)據(jù)Web服務(wù),適用于地圖和其他數(shù)據(jù)可視化和分析表達(dá),并以提供數(shù)據(jù)故事/數(shù)據(jù)案例的方式向用戶展示。在國(guó)內(nèi),中國(guó)科學(xué)院戰(zhàn)略性先導(dǎo)專項(xiàng)“地球大數(shù)據(jù)科學(xué)工程”建立的地球大數(shù)據(jù)科學(xué)工程數(shù)據(jù)共享服務(wù)系統(tǒng)(CASEarth)?[中文網(wǎng)站鏈接:http://www.casearth.cn/;英文網(wǎng)站鏈接:http://english.casearth.com/index.php]致力于構(gòu)建全球領(lǐng)先的地球大數(shù)據(jù)基礎(chǔ)設(shè)施、形成國(guó)際一流的地球大數(shù)據(jù)學(xué)科驅(qū)動(dòng)平臺(tái)和構(gòu)建服務(wù)政府高層的決策支持平臺(tái)[12]。例如,CASEarth全景展示和動(dòng)態(tài)推演“一帶一路”可持續(xù)發(fā)展過程與態(tài)勢(shì),實(shí)現(xiàn)對(duì)全景美麗中國(guó)可持續(xù)發(fā)展的精準(zhǔn)評(píng)價(jià)與決策支持。該數(shù)據(jù)庫的特點(diǎn)是將地球作為一個(gè)對(duì)象,以數(shù)字地球的概念將數(shù)據(jù)組織在一個(gè)平臺(tái)上。

3 地球科學(xué)領(lǐng)域案例——PANGAEA數(shù)據(jù)庫

PANGAEA O2是地球科學(xué)領(lǐng)域的一個(gè)國(guó)際數(shù)據(jù)庫,由德國(guó)阿爾弗雷德韋格納研究所、赫爾姆霍茲極地和海洋研究中心和不萊梅大學(xué)海洋環(huán)境科學(xué)中心共建。它不僅是地球與環(huán)境科學(xué)數(shù)據(jù)的出版平臺(tái),具有歐洲科技計(jì)劃項(xiàng)目數(shù)據(jù)匯交、數(shù)據(jù)出版等數(shù)據(jù)倉儲(chǔ)和服務(wù)功能,同時(shí)也是一個(gè)用于地球系統(tǒng)研究的開放式數(shù)據(jù)圖書館。其數(shù)據(jù)在空間和時(shí)間上都有地理參照,并可以儲(chǔ)存在關(guān)系數(shù)據(jù)庫和長(zhǎng)期磁帶檔案中。

PANGAEA數(shù)據(jù)庫的發(fā)展歷程分為3個(gè)階段。早期,它起源于1993年一個(gè)古氣候數(shù)據(jù)管理的信息系統(tǒng)(科研項(xiàng)目),逐步發(fā)展為一個(gè)通用的工具;在2000年,它加入世界數(shù)據(jù)中心(WDS的前身WDC);在2005年后,與數(shù)字唯一標(biāo)識(shí)符(DOI)和出版界合作,使用DOI來識(shí)別、共享、發(fā)布和引用每個(gè)數(shù)據(jù)集。PANGAEA數(shù)據(jù)庫將數(shù)據(jù)作為科學(xué)論文的補(bǔ)充或作為可引用的數(shù)據(jù)集合與領(lǐng)域數(shù)據(jù)期刊緊耦合。它與Earth System Science Data (ESSD)、Geoscience Data Journal和Scientific Data等數(shù)據(jù)期刊相結(jié)合,并迅速在全球形成高影響力。PANGAEA數(shù)據(jù)庫是ESSD期刊的指定倉儲(chǔ),它在2022年影響因子為11.815,是國(guó)際認(rèn)可的頂級(jí)期刊。通過與ESSD等數(shù)據(jù)期刊合作,不僅迅速帶動(dòng)了其影響力,并且成功匯聚大量精品數(shù)據(jù)資源[13]。截至2022年11月,PANGAEA中有22972數(shù)據(jù)集和ESSD關(guān)聯(lián),并且它也承擔(dān)了歐盟支持的多種項(xiàng)目的數(shù)據(jù)匯交工作,收錄762個(gè)研究計(jì)劃,414678個(gè)數(shù)據(jù)集,超過220億條數(shù)據(jù)。

PANGAEA數(shù)據(jù)庫收錄的數(shù)據(jù)主要為地球科學(xué)數(shù)據(jù),一級(jí)分類以學(xué)科要素為主,包括農(nóng)業(yè)(AGRI- CULTURE)、大氣(ATMOSPHERE)、生物分類(BIO- LOGICAL CLASSIFICATION)、生物圈(BIO-SPHERE)、化學(xué)(CHEMISTRY)、冰凍圈(CRYOSPHERE)、生態(tài)(ECOLOGY)、漁業(yè)(FISHERIES)、地球物理學(xué)(GEOPHYSICS)、人文方面(HUMAN DIMENSIONS)、湖&河(LAKES&RIVERS)、陸地表層(LAND SURFACE)、巖石圈(LITHOSPHERE)、海洋(OCEANS)和古生物學(xué)(PALEONTOLOGY)15個(gè)大類。從數(shù)量上看,PANGAEA數(shù)據(jù)庫更偏向于收錄地球化學(xué)類數(shù)據(jù)和巖石圈數(shù)據(jù),均超過了13萬條;湖&河、人文方面、漁業(yè)、農(nóng)業(yè)類數(shù)據(jù)收較少,均沒有超過千余條(圖1)。

PANGAEA數(shù)據(jù)庫的數(shù)據(jù)提取和存檔工作流程分為4個(gè)部分:前臺(tái)系統(tǒng)、編輯系統(tǒng)、中間件系統(tǒng)和后臺(tái)系統(tǒng)(圖2)[14],符合開放檔案信息系統(tǒng)(OAIS)標(biāo)準(zhǔn)[15]。根據(jù)Diepenbroek等[14]專家的描述,PANGAEA數(shù)據(jù)庫的數(shù)據(jù)首先使用前臺(tái)系統(tǒng)(Jira)提交,并分配給相應(yīng)數(shù)據(jù)領(lǐng)域的專家編輯,通過編輯系統(tǒng)完成輸入數(shù)據(jù)的準(zhǔn)備工作。編輯系統(tǒng)檢查數(shù)據(jù)和元數(shù)據(jù)的有效性和完整性,并根據(jù)PANGAEA的導(dǎo)入格式重新格式化數(shù)據(jù)。編輯部的審查通過邀請(qǐng)作者和外部同行評(píng)價(jià)人員來完成。通過審核的數(shù)據(jù)被接受后,數(shù)據(jù)將被歸檔并提供DOI。該系統(tǒng)的元數(shù)據(jù)統(tǒng)一在DataCite內(nèi)注冊(cè),提高數(shù)據(jù)的互操作性。除了人工提交和收錄數(shù)據(jù)外,該系統(tǒng)還支持外部經(jīng)過認(rèn)證的程序訪問。

非常值得一提的是,PANGAEA數(shù)據(jù)管理團(tuán)隊(duì)人員組成豐富,總計(jì)包括約50余人。運(yùn)營(yíng)團(tuán)隊(duì)由數(shù)據(jù)管理者、數(shù)據(jù)編輯和IT專家構(gòu)成。領(lǐng)導(dǎo)管理層由4人構(gòu)成且分工明確,職務(wù)分別為主任、人力團(tuán)隊(duì)負(fù)責(zé)人、技術(shù)團(tuán)隊(duì)負(fù)責(zé)人和主任助理。數(shù)據(jù)編輯5人,IT技術(shù)研發(fā)10人,項(xiàng)目和數(shù)據(jù)管理12人,數(shù)據(jù)咨詢和服務(wù)12人,對(duì)外合作5人以及學(xué)術(shù)兼職人員4人。其中IT技術(shù)、數(shù)據(jù)管理和數(shù)據(jù)服務(wù)人員是其團(tuán)隊(duì)主體。

4 重點(diǎn)領(lǐng)域科學(xué)數(shù)據(jù)發(fā)展工作建議

4.1 繼續(xù)加強(qiáng)和普及科學(xué)數(shù)據(jù)共享和治理的政策

面對(duì)國(guó)際科學(xué)數(shù)據(jù)治理態(tài)勢(shì),我國(guó)迫切需要進(jìn)一步完善數(shù)據(jù)政策和生態(tài)體系。這包括科學(xué)數(shù)據(jù)全鏈條管理體系的健全和分類分組管理、科學(xué)數(shù)據(jù)的持續(xù)積累和增值開發(fā)利用、科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)體系的完善及其國(guó)際化接軌、科學(xué)數(shù)據(jù)處理軟件和工具自主開發(fā)等。發(fā)達(dá)國(guó)家重視科學(xué)數(shù)據(jù)庫的建設(shè),并形成了相對(duì)成熟的建設(shè)體系,這為我國(guó)數(shù)據(jù)生態(tài)的構(gòu)建提供了一定的借鑒。美國(guó)在法律和制度保護(hù)下,依托國(guó)家航空航天局(NASA)、大氣和海洋局(NOAA)和USGS等成立若干涉及地球科學(xué)、環(huán)境科學(xué)、生命科學(xué)等領(lǐng)域的數(shù)據(jù)中心[16]。英國(guó)研究理事會(huì)(RCUK)、英國(guó)癌癥研究中心(CRUK)、歐盟委員會(huì)(EC)和維康信托(WT)等科研資助機(jī)構(gòu)對(duì)英國(guó)科學(xué)數(shù)據(jù)庫進(jìn)行注資,并依托相應(yīng)的國(guó)家部門構(gòu)建,如隸屬于司法部的英國(guó)國(guó)家檔案館[17]。澳大利亞通過高校系統(tǒng)促進(jìn)科學(xué)數(shù)據(jù)庫建設(shè),尤其是在《Australian Code for the Responsible Conduct of Research》頒布后,更加推動(dòng)了高校數(shù)據(jù)政策制定[18]。

圖1 PANGAEA數(shù)據(jù)庫各領(lǐng)域數(shù)據(jù)收錄量(截止時(shí)間:2022-11-29)

圖2 PANGAEA收錄和歸檔工作流程的UML活動(dòng)圖[14]

4.2 權(quán)威科學(xué)數(shù)據(jù)中心要有權(quán)威的精品數(shù)據(jù)資源

科學(xué)數(shù)據(jù)中心是有信譽(yù)的數(shù)據(jù)銀行,是數(shù)字化的科學(xué)研究基礎(chǔ)設(shè)施。有信譽(yù)的數(shù)據(jù)銀行,要求這個(gè)科學(xué)數(shù)據(jù)中心要有足夠的影響力,要有標(biāo)志性的精品科學(xué)數(shù)據(jù)庫。例如,國(guó)際上的一些數(shù)據(jù)中心都有自己有影響力的數(shù)據(jù)產(chǎn)品。USGS的遙感衛(wèi)星數(shù)據(jù)中心是地理學(xué)、地質(zhì)學(xué)和水文學(xué)領(lǐng)域的全球重要數(shù)據(jù)中心之一,擁有自1972年開始的全球30m Landsat衛(wèi)星系列的影像數(shù)據(jù)產(chǎn)品。哥倫比亞大學(xué)的國(guó)際地球系統(tǒng)科學(xué)信息網(wǎng)絡(luò)中心(CIESIN)作為美國(guó)的分布式國(guó)家數(shù)據(jù)中心(DAACs)之一,擁有權(quán)威的全球人口空間數(shù)據(jù)集、城市極端高溫?cái)?shù)據(jù)集等。

4.3 可持續(xù)發(fā)展的科學(xué)數(shù)據(jù)中心要有穩(wěn)定的能力結(jié)構(gòu)

科學(xué)數(shù)據(jù)中心要具有長(zhǎng)期可持續(xù)發(fā)展能力,需要重點(diǎn)加強(qiáng)3個(gè)方面建設(shè)。一是數(shù)據(jù)匯聚和存儲(chǔ)能力,即要有足夠的數(shù)據(jù)資源存量,例如PANGAEA數(shù)據(jù)中心擁有40多萬個(gè)數(shù)據(jù)集,其數(shù)據(jù)量超過220億條。二是數(shù)據(jù)處理分析能力,即,要有增值分析加工的能力,例如世界遙感大氣數(shù)據(jù)中心(WDC-RSAT)研發(fā)和大氣相關(guān)的遙感衛(wèi)星數(shù)據(jù)產(chǎn)品,不但提供基礎(chǔ)遙感科學(xué)數(shù)據(jù)和大氣數(shù)據(jù),而且提供再加工參數(shù)數(shù)據(jù)信息。三是,現(xiàn)代化的基礎(chǔ)設(shè)施和用戶界面,要有足夠便捷的服務(wù)能力,例如英國(guó)國(guó)家檔案館數(shù)據(jù)中心的門戶網(wǎng)站設(shè)計(jì)十分簡(jiǎn)潔、直接,完全按照用戶需求定位服務(wù)項(xiàng)目,擁有良好的用戶體驗(yàn)。

4.4 加強(qiáng)科學(xué)數(shù)據(jù)中心群體之間的合作

在全球治理的框架下,需要兼顧同一問題在不同學(xué)科領(lǐng)域和區(qū)域的多樣化認(rèn)知,加強(qiáng)多個(gè)領(lǐng)域和區(qū)域科學(xué)數(shù)據(jù)中心間的協(xié)同。各科學(xué)數(shù)據(jù)中心之間應(yīng)避免重復(fù)建設(shè)和低水平的競(jìng)爭(zhēng),加強(qiáng)數(shù)據(jù)中心之間的優(yōu)勢(shì)互補(bǔ)。例如結(jié)合自身的學(xué)科或區(qū)域優(yōu)勢(shì),推出本數(shù)據(jù)中心的關(guān)鍵參考型和資源型數(shù)據(jù)庫;圍繞重大國(guó)家或用戶需求,提供有特色的專題數(shù)據(jù)服務(wù);通過不間斷的合作交流,提升各科學(xué)數(shù)據(jù)中心之間的協(xié)作水平。

4.5 對(duì)標(biāo)國(guó)際加強(qiáng)國(guó)內(nèi)前沿領(lǐng)域科學(xué)數(shù)據(jù)中心建設(shè)

在前沿領(lǐng)域調(diào)研中,發(fā)現(xiàn)國(guó)外數(shù)據(jù)中心在影響力和訪問量等方面呈現(xiàn)3個(gè)等級(jí)。首先,美國(guó)物理學(xué)會(huì)、NCBI、IODP、One Geology和開放SDG數(shù)據(jù)樞紐可位于首級(jí)。例如,NCBI作為生命健康領(lǐng)域國(guó)際地位很強(qiáng)的數(shù)據(jù)庫,其每天的網(wǎng)站訪問量達(dá)到了300萬,下載量達(dá)到了27TB;深海領(lǐng)域的IODP是地球科學(xué)領(lǐng)域迄今為止歷時(shí)最長(zhǎng)、成效最大的國(guó)際科學(xué)合作計(jì)劃。影響力相對(duì)一般的包括WSTS、GRIN和Geo-Chron數(shù)據(jù)庫。最后,由于牛津機(jī)器人車數(shù)據(jù)集和1000FCP在各領(lǐng)域的數(shù)據(jù)種類較為單一,影響力較為薄弱。結(jié)合這些認(rèn)識(shí),我國(guó)可更多借鑒優(yōu)勢(shì)數(shù)據(jù)中心的經(jīng)驗(yàn),加大在該領(lǐng)域投入力度,提升我國(guó)自身能力。

4.6 提早謀劃國(guó)內(nèi)前沿領(lǐng)域科學(xué)數(shù)據(jù)中心建設(shè)

結(jié)合國(guó)內(nèi)十四五前沿領(lǐng)域科學(xué)數(shù)據(jù)中心調(diào)研,發(fā)現(xiàn)不同領(lǐng)域數(shù)據(jù)中心的學(xué)科、區(qū)域差異性明顯,可以根據(jù)自身?xiàng)l件及時(shí)推動(dòng)更多數(shù)據(jù)庫和數(shù)據(jù)中心建設(shè)。例如,就國(guó)際大科學(xué)計(jì)劃而言,DDE是由我國(guó)科學(xué)家主導(dǎo)發(fā)起的首批國(guó)際大科學(xué)計(jì)劃之一,通過構(gòu)建固體地球科學(xué)全領(lǐng)域知識(shí)體系與知識(shí)圖譜,整合過去數(shù)十億年地球時(shí)空大數(shù)據(jù),為地球演化重大科學(xué)問題提供全球服務(wù),因此具有很大的發(fā)展?jié)摿?。圍繞人類命運(yùn)共同體和可持續(xù)發(fā)展,可以考慮加強(qiáng)地球大數(shù)據(jù)支持可持續(xù)發(fā)展的相關(guān)數(shù)據(jù)平臺(tái)建設(shè),提升我國(guó)對(duì)支持聯(lián)合國(guó)可持續(xù)發(fā)展目標(biāo)的貢獻(xiàn)度。在人工智能、量子信息以及集成電路領(lǐng)域,需要考慮扶持和培育更多有條件的數(shù)據(jù)中心建設(shè),提升這些數(shù)據(jù)的大數(shù)據(jù)支撐能力。

[1] 盧雨生. 論大數(shù)據(jù)背景下科學(xué)發(fā)展的第四范式[J]. 現(xiàn)代交際, 2020, 13: 244-245.

Lu Y S. The Fourth Paradigm of scientific development in the context of big data [J]. Modern Communication, 2020, 13: 244-245.

[2] 黃丹丹, 李冬初, 張陸彪, 等. 湖南祁陽紅壤實(shí)驗(yàn)站與英國(guó)洛桑實(shí)驗(yàn)站比較分析[J]. 世界農(nóng)業(yè), 2014(4): 146-151. DOI: 10. 13856/j. cn11-1097/s. 2014. 04. 029.

Huang D D, Li D C, Zhang L B, et al. Comparative analysis of Hunan Qiyang Red Soil Experimental Station and the British Lausanne Experimental Station [J]. World Agriculture, 2014 (4): 146-151. DOI: 10. 13856/j. cn 11-1097/ s. 2014. 04. 029.

[3] United States Geological Survey (USGS). (2021). https:// www. usgs. gov/centers/eros.

[4] Karsch-Mizrachi I, Takagi T, Cochrane G, et al. The international nucleotide sequence database collaboration[J]. Nucleic Acids Research, 2018, 46(D1): D48-D51.

[5] 科學(xué)數(shù)據(jù)管理辦法(國(guó)辦發(fā)〔2018〕17號(hào))[EB/OL]. http:// www. gov. cn/zhengce/content/2018-04/02/content_5279272. htm.

Administrative Measures for Scientific Data (GBF [2018] No. 17) [EB/OL]. http://www. gov. cn/zhengce/content/2018- 04/02/content_ 5279272. htm.

[6] 科技部財(cái)政部關(guān)于發(fā)布國(guó)家科技資源共享服務(wù)平臺(tái)優(yōu)化調(diào)整名單的通知(國(guó)科發(fā)基〔2019〕194號(hào))[EB/OL]. http://www.most.gov.cn/ xxgk/xinxifenlei/fdzdgknr/qtwj/qtwj2019/201906/t20190610_ 147031. html.

Notice of the Ministry of Science and Technology and the Ministry of Finance on Issuing the List of Optimization and Adjustment of the National Science and Technology Re-source Sharing Service Platform (GKFJ [2019]No. 194) [EB/ OL]. https://www.most.gov.cn/xxgk/ xinxifenlei/fdzdgknr/qt-wj/qtwj2019/201906/t20190610_147031. html.

[7] 中華人民共和國(guó)國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展第十四個(gè)五年規(guī)劃和2035年遠(yuǎn)景目標(biāo)綱要[EB/OL]. https://www.ndrc.gov.cn/xxgk/ zcfb/ghwb/202103/t20210323_1270124.html?code=&state=123.

Outline of the 14th Five-Year Plan (2021-2025) for National Economic and Social Development and Vision 2035 of the People's Republic of China[EB/OL]. https://www.ndrc.gov.cn/ xxgk/zcfb/ghwb/202103/t20210323_1270124.html?code=&state= 123.

[8] 傅俊英, 趙蘊(yùn)華, 王道仁, 等. 基于論文和專利的中美腦科學(xué)領(lǐng)域?qū)Ρ妊芯縖J]. 現(xiàn)代生物醫(yī)學(xué)進(jìn)展, 2017, 17(1): 170-176.

Fu J Y, Zhao Y H, Wang D R, et al. Study on gaps between China and the U. S. based on paper and patent in the field of brain science[J]. Progress in Modern Biomedicine, 2017, 17 (1): 170- 176.

[9] Biswal B B, Mennes M, Zuo X N, et al. Toward discovery science of human brain function[J]. Proceedings of the National Academy of Sciences, 2010, 107(10): 4734-4739.

[10] Wang C S, Hazen R M, Cheng Q M, et al. The Deep-Time-Digital Earth program: data-driven discovery in geosciences [J]. National Science Review, 2021, 8(9): nwab027.

[11] UN. Transforming Our World: The 2030 Agenda for Sustainable Development. (2015-09-02) [2022-11-29]. https://sdgs.un. org/ 2030agenda.

[12] 郭華東, 梁棟, 陳方, 等. 地球大數(shù)據(jù)促進(jìn)聯(lián)合國(guó)可持續(xù)發(fā)展目標(biāo)實(shí)現(xiàn)[J]. 中國(guó)科學(xué)院院刊, 2021, 36(8): 874-884.

Guo H D, Liang D, Chen F, et al. Big earth data facilitates sustainable development goals[J]. Bulletin of Chinese Academy of Sciences, 2021, 36(8): 874-884.

[13] Schumacher S, Sieger R. An introduction to the Data Library PANGAEA [C]. 2012.

[14] Diepenbroek M, Schindler U, Huber R, et al. Terminology supported archiving and publication of environmental science data in PANGAEA [J]. Journal of biotechnology, 2017, 261: 177-186.

[15] Lee C A. Open archival information system (OAIS) reference model[J]. Encyclopedia of library and information Sciences, 2010, 3: 4020-4030.

[16] 王卷樂, 王明明, 石蕾, 等. 科學(xué)數(shù)據(jù)管理態(tài)勢(shì)及其對(duì)我國(guó)地球科學(xué)領(lǐng)域的啟示[J]. 地球科學(xué)進(jìn)展, 2019, 34(03): 306-315. DOI: 10. 11867/j. issn. 1001-8166. 2019. 03. 0306.

Wang J L, Wang M M, Shi L, et al. The situation of scientific data management and its enlightenment to earth sciences of China [J]. Advances in Earth Science, 2019, 34 (3 ) : 306-315. DOI: 10. 11867/j. issn. 1001-8166. 2019. 03. 0306.

[17] 王卷樂, 石蕾, 王淑強(qiáng), 等. 國(guó)際科學(xué)數(shù)據(jù)管理概述[M], 北京:科學(xué)技術(shù)文獻(xiàn)出版社, 2021.

Wang J L, Shi L, Wang S Q, et al. Overview of International Scientific Data Management [M], Beijing: Scientific and Technical Documentation Press, 2021.

[18] 完顏鄧鄧. 澳大利亞高??茖W(xué)數(shù)據(jù)管理與共享政策研究 [J]. 信息資源管理學(xué)報(bào), 2016, 6(1): 30-37.

Wanyan D D. Research on the scientific data management and sharing policies in Australian universities [J]. Journal of Information Resources Management, 2016, 6(1):30-37.

Research and Analysis of Typical Databases in Major Frontier Fields at Domestic and International Level

DUAN Bowen1, WANG Juanle1,2*, SHI Lei3, GAO Mengxu3

1. State Key Laboratory of Resources and Environmental Information System, Institute of Geographic Sciences Natural Re-sources Research, Chinese Academy of Sciences, Beijing 100101, China; 2. Jiangsu Center for Collaborative Innovation in Geographical Information Resource Development and Application, Nanjing 210023, China; 3. National Science and Technology Infrastructure, Beijing 100862, China

Science data is the basis of the innovation value chain "data-information-knowledge-wisdom", and is the most basic science and technology resource, which plays an important role in economic and social development and scientific innovation. “Outline of the 14th Five-Year Plan (2021—2025) for National Economic and Social Development and Vision 2035 of the People's Republic of China”deployed nine frontier areas for the implementation strategic science programs and science projects. A timely grasp of the current situation and demand for science data sharing in these frontier areas was significant for better strengthen the construction of China's Science Data Center and to play the role of data support for the frontier areas. This paper tracked the domestic and foreign progress in nine areas databases including artificial intelligence, quantum information, integrated circuits, life and health, brain science, biological breeding, deep earth, ocean science, and sustainable development, and investigated and analyzed from data resources, database/platform integration capabilities, application services and typical cases. The study took PANGAEA database as a representative case, which in German and in the deep sea and earth system science field, analyzed its characteristics in organizational structure, technical operation and maintenance, and operation and management process. Suggestions for scientific data governance were proposed for the requirements of frontier fields development.

data sharing; science data; database; PANGAEA; frontier areas; 14th Five-Year Plan

段博文,王卷樂,石蕾,等. 前沿領(lǐng)域國(guó)內(nèi)外典型數(shù)據(jù)庫調(diào)研與啟示[J]. 農(nóng)業(yè)大數(shù)據(jù)學(xué)報(bào), 2023,5(1):46-54.

DUAN Bowen,WANG Juanle, SHI Lei, et al. Research and analysis of typical databases in major frontier fields at domestic and international level[J].Journal of Agricultural Big Data,2023,5(1): 46-54.

10.19788/j.issn.2096-6369.230113

2022-11-30

國(guó)家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目(2022YFF0711600);國(guó)家科技基礎(chǔ)條件平臺(tái)委托任務(wù)(2020WT22)

第一作者代段博文,女,研究生,研究方向:環(huán)境科學(xué);E-mail:duanbw@lreis.ac.cn。通信作者王卷樂,男,研究生,研究方向:資源環(huán)境數(shù)據(jù)集成與共享;E-mail:wangjl@igsnrr.ac.cn。

猜你喜歡
數(shù)據(jù)中心領(lǐng)域數(shù)據(jù)庫
酒泉云計(jì)算大數(shù)據(jù)中心
領(lǐng)域·對(duì)峙
青年生活(2019年23期)2019-09-10 12:55:43
民航綠色云數(shù)據(jù)中心PUE控制
數(shù)據(jù)庫
數(shù)據(jù)庫
數(shù)據(jù)庫
數(shù)據(jù)庫
基于云計(jì)算的交通運(yùn)輸數(shù)據(jù)中心實(shí)現(xiàn)與應(yīng)用
新常態(tài)下推動(dòng)多層次多領(lǐng)域依法治理初探
Overlay Network技術(shù)在云計(jì)算數(shù)據(jù)中心中的應(yīng)用
河南科技(2014年11期)2014-02-27 14:16:49
保靖县| 平远县| 罗江县| 德格县| 吉隆县| 垫江县| 孟村| 通山县| 井研县| 图木舒克市| 肃南| 慈溪市| 梁河县| 天津市| 洪泽县| 池州市| 连州市| 民权县| 宣恩县| 盐边县| 福鼎市| 嘉荫县| 榆树市| 和静县| 武陟县| 祁门县| 新营市| 绵竹市| 合肥市| 银川市| 万盛区| 永城市| 通道| 上犹县| 亚东县| 长海县| 开平市| 昌都县| 晋宁县| 德庆县| 恩施市|