郭華東
(中國科學院遙感與數(shù)字地球研究所,北京 100094)
2013年7月17日,習近平總書記指出:“浩瀚的數(shù)據(jù)海洋就如同工業(yè)社會的石油資源,蘊含著巨大生產(chǎn)力和商機。誰掌握了大數(shù)據(jù)技術(shù),誰就掌握了發(fā)展的資源和主動權(quán)?!贝髷?shù)據(jù)已成為信息主權(quán)的一種表現(xiàn)形式,將是繼邊防、海防、空防之后大國博弈的另一個空間。
第二次工業(yè)革命的爆發(fā),導致以文字為載體的數(shù)據(jù)量約每10年翻一番;從工業(yè)化時代進入信息化時代,數(shù)據(jù)量每3年翻一番;現(xiàn)在,隨著計算機技術(shù)和網(wǎng)絡(luò)技術(shù)的快速發(fā)展,半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)的大量涌現(xiàn),數(shù)據(jù)的產(chǎn)生已不受時間和空間的限制。
2008年9月,《Nature》雜志出版“大數(shù)據(jù)”???。大數(shù)據(jù)的發(fā)展不斷得到科技界和國際組織的推動與重視。在政府層面,大數(shù)據(jù)得到高度重視。如,美國發(fā)布了“聯(lián)邦大數(shù)據(jù)研發(fā)戰(zhàn)略計劃”,投建4個“大數(shù)據(jù)區(qū)域創(chuàng)新中心”;歐盟推出“歐洲云計劃”,確??茖W界、產(chǎn)業(yè)界和公共服務(wù)部門均從大數(shù)據(jù)革命中獲益;英國開展大數(shù)據(jù)技術(shù)在政府、高校和公共領(lǐng)域的拓展與應用等。中國提出“實施國家大數(shù)據(jù)戰(zhàn)略,推進數(shù)據(jù)資源開放共享”,大數(shù)據(jù)正式成為國家戰(zhàn)略。中國擁有的數(shù)據(jù)在國際上舉足輕重,截至2012年,中國的數(shù)據(jù)占全球的13%,預計到2020年,中國將產(chǎn)生全球21%的數(shù)據(jù)。中國與大數(shù)據(jù)相關(guān)的論文數(shù)量列全球第2位,僅次于美國。
科學大數(shù)據(jù)具有數(shù)據(jù)密集型范式的特點,它具有數(shù)據(jù)的不可重復性、數(shù)據(jù)的高度不確定性、數(shù)據(jù)的高維特性、數(shù)據(jù)分析的高度計算復雜性等內(nèi)部特征。利用大量數(shù)據(jù)的相關(guān)性可取代因果關(guān)系和理論與模型,基于數(shù)據(jù)間的相關(guān)性能夠獲得新知識、新發(fā)現(xiàn)。比如,早在1609年,第谷·布拉赫的助手約翰尼斯·開普勒從布拉赫對天體運動的系數(shù)觀察記錄中發(fā)現(xiàn)了行星運動定律,并發(fā)表了偉大的著作《新天文學》;再比如,歐洲大型強子對撞機(LHC)幫助物理學家檢驗關(guān)于不同粒子物理和高能物理理論的猜想,并且確定了希格斯波色子的存在?,F(xiàn)在,越來越多科學上的發(fā)現(xiàn)證明,大科學裝置產(chǎn)生海量的數(shù)據(jù)已經(jīng)成為我們認識世界的手段之一,利用大數(shù)據(jù)驅(qū)動科學發(fā)現(xiàn)。
科學大數(shù)據(jù)正在成為一種新的科研方法論,是科學發(fā)現(xiàn)的新引擎,近年來中國提出并重視科學大數(shù)據(jù)的研究。國務(wù)院《促進大數(shù)據(jù)發(fā)展行動綱要》中,對“科學大數(shù)據(jù)”進行了專題論述:發(fā)展科學大數(shù)據(jù),積極推動由國家公共財政支持的公益性科研活動獲取和產(chǎn)生的科學數(shù)據(jù)逐步開放共享,構(gòu)建科學大數(shù)據(jù)國家重大基礎(chǔ)設(shè)施,實現(xiàn)對國家重要科技數(shù)據(jù)的權(quán)威匯集、長期保存、集成管理和全面共享。面向經(jīng)濟社會發(fā)展需求,發(fā)展科學大數(shù)據(jù)應用服務(wù)中心,支持解決經(jīng)濟社會發(fā)展和國家安全重大問題。
地球大數(shù)據(jù)是一種典型的科學大數(shù)據(jù),是具有空間屬性的地球科學領(lǐng)域大數(shù)據(jù),它一方面具有海量、多源、多時相、異構(gòu)、多尺度、非平穩(wěn)等大數(shù)據(jù)的一般性質(zhì),同時具有很強的時空關(guān)聯(lián)和物理關(guān)聯(lián)。這些特征對地學學科的發(fā)展可以起到重大的推動作用,在環(huán)境、資源、災害等領(lǐng)域有重要作用和經(jīng)濟社會價值。地球大數(shù)據(jù)為地球科學的深入研究帶來了重要的發(fā)展機遇,可推動空間地球信息科學,進一步推動地球科學的發(fā)展。地球大數(shù)據(jù)的研究方向主要有4個方面:
空間對地觀測大數(shù)據(jù),涉及海洋衛(wèi)星、氣象衛(wèi)星、資源衛(wèi)星、環(huán)境減災衛(wèi)星、衛(wèi)星數(shù)據(jù)接收等;地球大數(shù)據(jù)處理方法,涉及云計算、智能處理、數(shù)據(jù)同化、數(shù)值模擬等;地球科學學科大數(shù)據(jù),涉及海洋科學、大氣科學、地理科學、地質(zhì)科學、地球物理、地球化學大數(shù)據(jù)等;地球大數(shù)據(jù)與地球科學,涉及地球系統(tǒng)科學、地學發(fā)現(xiàn)等。
地球大數(shù)據(jù)具有重要作用。比如,利用地球大數(shù)據(jù)開展“一帶一路”研究。中國科學家于2016年發(fā)起的數(shù)字絲路(DBAR)國際計劃,就是要建立一個地球大數(shù)據(jù)共享平臺,提供大數(shù)據(jù)匯集、大數(shù)據(jù)服務(wù)、大數(shù)據(jù)分析和大數(shù)據(jù)系統(tǒng),形成“一帶一路”地球觀測數(shù)據(jù)集。這個為期10年的科學計劃最終將不僅貢獻“一帶一路”,還可貢獻聯(lián)合國全球可持續(xù)發(fā)展目標,為糧食安全、生態(tài)環(huán)境保護及風險評估、氣候變化和災害應對以及文化-自然遺產(chǎn)保護與發(fā)展等提供科學的決策。中國科學院正式設(shè)立了“地球大數(shù)據(jù)科學工程”A類先導專項,它的目標是建成國際地球大數(shù)據(jù)科學中心,構(gòu)建全球領(lǐng)先的地球大數(shù)據(jù)基礎(chǔ)設(shè)施,形成國際一流的地球大數(shù)據(jù)學科驅(qū)動平臺,構(gòu)建服務(wù)政府高層的決策支持平臺,它將在地球?qū)W科發(fā)展、政府決策、全球可持續(xù)發(fā)展等方面產(chǎn)生重大意義。
大數(shù)據(jù)是知識經(jīng)濟時代的戰(zhàn)略高地,大數(shù)據(jù)是國家新型戰(zhàn)略資源,大數(shù)據(jù)正在改變?nèi)祟惿罴皩κ澜绲纳顚永斫狻W鳛樯倭恳蕾囈蚬P(guān)系,而主要依靠相關(guān)性發(fā)現(xiàn)新知識的新模式,大數(shù)據(jù)已成為繼經(jīng)驗、理論和計算模式之后的數(shù)據(jù)密集型科學范式的典型代表,帶來科研方法論的創(chuàng)新??茖W大數(shù)據(jù)正在成為科學發(fā)現(xiàn)的新引擎,驅(qū)動學科創(chuàng)新跨越,驅(qū)動地球?qū)W科創(chuàng)新發(fā)展。