應從戰(zhàn)略上重視大數(shù)據(jù)的開發(fā)利用,形成頂層設計,整合國家資源
信息化作為當前社會發(fā)展的主要驅(qū)動力,其效力與政府、科技界、企業(yè)界、社會以及大眾生活都息息相關。政府作為信息資源的主要占有者和使用者,在使用數(shù)據(jù)發(fā)展科技和經(jīng)濟產(chǎn)業(yè)等方面起著至關重要的作用。大數(shù)據(jù)是與自然資源、人力資源一樣重要的戰(zhàn)略資源,是一個國家數(shù)字主權(quán)的體現(xiàn)。在大數(shù)據(jù)時代,國家層面的競爭力將部分體現(xiàn)為一國擁有大數(shù)據(jù)的規(guī)模、活性以及對數(shù)據(jù)的解釋、運用的能力。一個國家在網(wǎng)絡空間的數(shù)據(jù)主權(quán)將是繼海、陸、空、天之后另一個博弈的空間。
郭華東中國科學院院士,發(fā)展中國家科學院院士,中國科學院遙感與數(shù)字地球研究所所長、研究員、博士生導師?,F(xiàn)任國際科技數(shù)據(jù)委員會(CODATA)主席,國際數(shù)字地球?qū)W會(ISDE)秘書長和ISDE中國國家委員會主席,國際科聯(lián)(ICSU)災難風險綜合研究計劃(IRDR)科學委員會委員及IRDR-China專家委員會主任。從事遙感科學研究及應用30余年,在雷達遙感機理、數(shù)字地球科學、空間信息前沿技術研究方面取得系統(tǒng)性的成就。
有數(shù)據(jù)表明,截止到2012年全球數(shù)據(jù)的分布中,中國占13%。預計6年后中國的數(shù)據(jù)量將占全球近五分之一。那么,隨著科技的發(fā)展,未來數(shù)字地球如何發(fā)展?未來15年數(shù)字地球應該怎么構(gòu)架?
圍繞著我們居住的地球,每天有眾多衛(wèi)星在沿著不同的軌道對地球成像,普通民眾關注的海量數(shù)據(jù)不斷涌來?;仡欉^去50年的發(fā)展歷史,可以看到,1980年前的18年,全球一共僅有14顆對地觀測衛(wèi)星;1981年到1990年間,發(fā)展到43顆;2000年為85顆;2012年為174顆。發(fā)展到今天,未來七年中國衛(wèi)星將發(fā)展到近100顆。這意味著未來中國衛(wèi)星數(shù)量將居世界第一。
數(shù)據(jù)是構(gòu)成數(shù)字地球的核心,包括不同的地理數(shù)據(jù),需要改良的數(shù)據(jù)以及地理數(shù)據(jù),其數(shù)據(jù)平臺依托國家基礎設施建設,目前已經(jīng)形成比較大的規(guī)模,加上數(shù)據(jù)互聯(lián)網(wǎng),形成了一個完整的空間數(shù)據(jù)的獲取、傳輸、分析等全流程的數(shù)據(jù)系統(tǒng)。
新一代數(shù)字地球涵蓋大數(shù)據(jù)的4V特征。在數(shù)據(jù)上,新一代數(shù)字地球不僅關注地球現(xiàn)狀,還包括對地球演變歷史的展現(xiàn)和未來發(fā)展的預測,所研究的數(shù)據(jù)十分巨大,涉及的數(shù)據(jù)規(guī)模已達到EB級。在數(shù)據(jù)類型上,所應用的數(shù)據(jù)包括文檔、視頻、圖片、地理位置信息等,并涉及對地觀測、科學模型、社會、經(jīng)濟等多類數(shù)據(jù),類型繁多。新一代數(shù)字地球的數(shù)據(jù)來源多樣,既包括分布全球的觀測網(wǎng)絡實時接收的大量空間數(shù)據(jù),還包括民眾用戶通過互聯(lián)網(wǎng)和帶有地理信息的手持終端設備提供的個性化信息,所獲取的數(shù)據(jù)實時性強、更新快,但是隨著來自互聯(lián)網(wǎng)的數(shù)據(jù)比重迅速增大,也降低了數(shù)據(jù)的價值密度。此外,新一代數(shù)字地球平臺具有對海量數(shù)據(jù)進行快速處理、實現(xiàn)數(shù)據(jù)到信息化快速轉(zhuǎn)化的能力,能夠為人類可持續(xù)發(fā)展面臨的環(huán)境、災害和生態(tài)等問題提供第一時間的信息服務支持。
科學大數(shù)據(jù)計算問題不僅僅是一個數(shù)據(jù)處理與分析的問題,還是一個復雜系統(tǒng)與數(shù)據(jù)共同建模和計算的問題。這個問題需要復雜系統(tǒng)理論、估計理論與本領域的機理模型相結(jié)合來探索解決方法。從方法論上看,地理數(shù)據(jù)需要模擬、高性能大規(guī)模并行空間存儲,基于解析和非解析質(zhì)點的析出,特征與模型,信息理論,動態(tài)數(shù)據(jù)提供的過程、仿真、建模等等這一系列的方法?;诖耍锌圃褐鞒终匍_第一屆國際數(shù)字地球大會時,有記者采訪問到“什么是數(shù)字地球?”這個問題,我的回答是:“數(shù)字地球就是把我們的地球裝入計算機”。這是我12年前的一個認識,而現(xiàn)在從科普的角度來看,仍然可以這么說。當然,今天我們在研討什么是數(shù)字地球的時候,你如果問我什么是數(shù)字地球?我說數(shù)字地球就是地球大數(shù)據(jù)。
從數(shù)字地球本身的研究上,要考慮它的實用性。比如1935年我國地理學家胡煥庸提出“璦琿—騰沖一線”,劃分我國人口密度的對比線,以此線為界,約有94%的人口居住在約占全國土地面積42.9%的東南部地區(qū),約6%的人口居住在約占全國土地面積57.1%的西北部地區(qū)。那么這條線可不可以擴?如何擴?是否能用到大數(shù)據(jù)的理論,空間系統(tǒng)的方法,我們正在組織團隊進行相應的研究。如果能夠找到破解的方法,中國的格局和一些新思路將可能會有一些新的轉(zhuǎn)變,我們期待這一天的到來。
大數(shù)據(jù)時代的到來,能夠進行數(shù)據(jù)挖掘和知識發(fā)現(xiàn),能夠為我們的研究機理做出貢獻。在科研發(fā)現(xiàn)過程中,我們還需要面向國際科技前沿,面向國家重大需求。
我們的分析,未來的數(shù)字地球應該為全球變化、對減災防災、對新能源的開發(fā)、對農(nóng)業(yè)食品安全、對數(shù)字政治的發(fā)展等五個領域做出重要的貢獻。
圖1 大數(shù)據(jù)發(fā)展趨勢
可以看到,當前,大數(shù)據(jù)的發(fā)展任重道遠,雖然存在諸多問題,但大數(shù)據(jù)對科技、經(jīng)濟和社會的推動有著光明的前景。我國應加速發(fā)展大數(shù)據(jù)科學,有序推動大數(shù)據(jù)研究。建議如下:
第一,頂層設計制定國家層面大數(shù)據(jù)戰(zhàn)略。當前大數(shù)據(jù)技術的標準和產(chǎn)業(yè)格局尚未形成,這是我國實現(xiàn)跨越式發(fā)展的寶貴機會,應從戰(zhàn)略上重視大數(shù)據(jù)的開發(fā)利用,形成頂層設計,整合國家資源,制定產(chǎn)業(yè)政策和行業(yè)標準,構(gòu)建大數(shù)據(jù)產(chǎn)業(yè)鏈,使我國大數(shù)據(jù)技術與產(chǎn)業(yè)形成良性、有序、快速的發(fā)展;
第二,配置大數(shù)據(jù)研究資源。構(gòu)建大數(shù)據(jù)的良性生態(tài)環(huán)境,從政策制定、資源投入、人才培養(yǎng)等方面給予大數(shù)據(jù)研究強有力的支持;利用政策引導消除部門壁壘,建立和諧的大數(shù)據(jù)生態(tài)系統(tǒng);構(gòu)建有技術自主權(quán)的大數(shù)據(jù)產(chǎn)業(yè)鏈,有針對性地資助有關大數(shù)據(jù)的重大科研活動;國家在大數(shù)據(jù)平臺的構(gòu)建、典型行業(yè)的應用和研發(fā)人才的培養(yǎng)等方面應提供相應的支持;
第三,開展大數(shù)據(jù)基礎理論研究,建立理論、方法體系。大數(shù)據(jù)科學作為一個新興的交叉學科方向,其共性理論基礎將來自多個不同的學科領域。研究大數(shù)據(jù)的內(nèi)在機理,包括大數(shù)據(jù)的生命周期、演化與傳播規(guī)律,數(shù)據(jù)科學與社會學、經(jīng)濟學等之間的互動機制,以及大數(shù)據(jù)的結(jié)構(gòu)與效能的規(guī)律性(如社會效應、經(jīng)濟效應等)。研究大數(shù)據(jù)表示、數(shù)據(jù)復雜性和大數(shù)據(jù)計算模型。研究大數(shù)據(jù)知識發(fā)現(xiàn)、大數(shù)據(jù)環(huán)境下的實驗與驗證方法、大數(shù)據(jù)的安全與隱私等;
第四,推動大數(shù)據(jù)在各領域的應用。尤其是具有明顯大數(shù)據(jù)驅(qū)動的典型科學和工程領域,以全球變化、高能物理、生物信息等學科為例,注重具有引領示范作用的學科、理論、方法及應用,避免大數(shù)據(jù)成為一種炒作。大數(shù)據(jù)的應用領域甚廣,應涉及國計民生密切相關的領域,如科學決策、環(huán)境與資源管理、金融工程、應急管理(如疾病防治、災害預測與控制、食品安全與群體群體事件)以及知識經(jīng)濟等。