国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

地學領域科學數(shù)據(jù)處理與分析軟件自主性分析

2024-12-01 00:00:00王卷樂李凱段博蘇娜
農業(yè)大數(shù)據(jù)學報 2024年2期
關鍵詞:數(shù)據(jù)中心工具領域

摘要:科學數(shù)據(jù)的重要性已得到廣泛共識,隨著科學數(shù)據(jù)的不斷積累,其數(shù)據(jù)處理分析軟件的能力水平將成為科學數(shù)據(jù)能否高效發(fā)揮作用的關鍵和瓶頸。地球科學領域研究涉及多尺度、多類型、多來源的數(shù)據(jù),其數(shù)據(jù)處理與分析軟件的需求極為強烈。本研究針對地球科學領域的特點,分析其主要數(shù)據(jù)處理和分析軟件的現(xiàn)況,辨識我國的軟件自主程度。調研分析涉及地理、海洋、地質、大氣、生態(tài)、災害、農業(yè)等16個專題,選取了177個主流軟件/工具,重點獲取其軟件/工具名稱、概況、主要功能、應用服務/典型案例、優(yōu)缺點、對標產品等指標。分析發(fā)現(xiàn)地學科學數(shù)據(jù)處理與分析領域軟件/工具完全開放(開源)的占三分之二,商業(yè)的、限制性的或開放程度不明確的占三分之一。主要軟件/工具開發(fā)國家有美國、中國、加拿大、英國等以及一些國際組織。從專題分布看,主要體現(xiàn)在土地退化、人口社會經濟、知識圖譜、遙感處理等。自主保障風險較高的軟件主要在空間化、大氣、野火、凍土等專題。約三分之一的專業(yè)軟件/工具可以直接應用到國家科學數(shù)據(jù)中心,且可與云平臺結合。結合人工智能時代和“數(shù)據(jù)要素×”的發(fā)展,從五個方面提出加強我國自主科學數(shù)據(jù)處理軟件/工具的開發(fā)應用建議。

關鍵詞:地球科學;科學數(shù)據(jù);軟件/工具;自主性;國家科學數(shù)據(jù)中心

1 "引言

科學數(shù)據(jù)是信息時代傳播速度最快、影響面最廣、開發(fā)利用潛力最大的戰(zhàn)略性、基礎性科技資源。隨著大數(shù)據(jù)時代的到來,海量科學數(shù)據(jù)不斷產生,以數(shù)據(jù)驅動為特征的科學研究方法發(fā)生了重要的范式變革[1]。在國際視野下,各國均在加強對科學數(shù)據(jù)的產出匯聚、共享管理和創(chuàng)新應用。美國重視科學數(shù)據(jù)的積累和重用,在立法層面制定國家科學數(shù)據(jù)管理的基本原則,從國家層面管理和部署科學數(shù)據(jù)工作,通過多年持續(xù)積累,形成了一批權威、長序列、多尺度的科學數(shù)據(jù)庫,這些科學數(shù)據(jù)庫在科研過程中發(fā)揮了重要作用[2]。例如,美國航空航天局(NASA) 持續(xù)進行各類太空任務和衛(wèi)星觀測,產生大量對地觀測科學數(shù)據(jù),涉及地球、太陽系和宇宙等多個空間尺度。美國地質調查局(USGS) 開發(fā)的Earth Explorer軟件可以提供衛(wèi)星、飛機和其他遙感產品的在線搜索服務,具有數(shù)據(jù)量大、實時更新、開放共享等特點。歐盟提出的“地平線2020”(Horizon2020)宣布從2017年開始全面實施科學數(shù)據(jù)開放制度,促進知識發(fā)現(xiàn)和科研創(chuàng)新,進一步推動歐盟“開放科學”戰(zhàn)略[3]。日本政府在數(shù)據(jù)開放方面發(fā)展速度也較快。2011年發(fā)生的“3·11”東日本大地震促使日本政府意識到開放數(shù)據(jù)在防災減災領域具有積極作用,推動了政府數(shù)據(jù)開放的進程;至2019年12月,日本內閣會議通過了《數(shù)字政府實施計劃》,旨在到2025年建立一個使國民能夠充分享受信息技術便利的數(shù)字化社會[4]。我國也高度重視科學數(shù)據(jù)的共享和應用。2019年6月,科技部、財政部落實《科學數(shù)據(jù)管理辦法》和《國家科技資源共享服務平臺管理辦法》的要求,組建了“國家高能物理科學數(shù)據(jù)中心”等20個國家科學數(shù)據(jù)中心[5],作為管理和服務數(shù)據(jù)的核心機構。此外,在各政府部門、科研機構也形成了一批層次不同、類型多樣的科學數(shù)據(jù)中心,為推動科學數(shù)據(jù)共享共用、提高資源利用效率發(fā)揮了積極作用[6]。2023年底,國家數(shù)據(jù)局等17部門聯(lián)合印發(fā)《“數(shù)據(jù)要素×”三年行動計劃(2024—2026年)》,其選取科技創(chuàng)新、工業(yè)制造、現(xiàn)代農業(yè)、商貿流通、交通運輸?shù)?2個行業(yè)和領域,推動發(fā)揮數(shù)據(jù)要素乘數(shù)效應,釋放數(shù)據(jù)要素價值,并從提升數(shù)據(jù)供給水平、優(yōu)化數(shù)據(jù)流通環(huán)境、加強數(shù)據(jù)安全保障等3方面,強化保障支撐[7]。

科學數(shù)據(jù)的重要性已得到廣泛認識,但隨著科學數(shù)據(jù)的不斷積累,其數(shù)據(jù)處理軟件/工具的能力逐漸成為科學數(shù)據(jù)能否發(fā)揮作用的關鍵和瓶頸。例如,在發(fā)展中國家中,尼日利亞是非洲大陸上經濟最大的國家之一,擁有豐富的自然資源和人力資源。盡管該國政府機構收集了大量的數(shù)據(jù),包括人口統(tǒng)計數(shù)據(jù)、經濟指標、衛(wèi)生數(shù)據(jù)等,但由于數(shù)據(jù)處理和分析能力不足,這些數(shù)據(jù)未能充分發(fā)揮其潛在的價值[8]??茖W數(shù)據(jù)處理和分析離不開軟件/工具,其發(fā)展水平直接決定著科學數(shù)據(jù)的應用能力。但目前這些軟件/工具在使用過程開放程度不一,存在各種影響和限制因素。例如,Google Earth Engine(GEE) 是一種提供大規(guī)模數(shù)據(jù)處理能力的平臺,利用Google的云計算基礎設施,可監(jiān)測土地利用和土地覆蓋變化、研究氣候變化的影響、監(jiān)測自然災害、分析生態(tài)系統(tǒng)變化、評估水資源變化以及提供農業(yè)決策支持等。然而,對于大規(guī)模數(shù)據(jù)使用會涉及費用問題,并且某些功能受到Google平臺政策限制。ArcGIS 是一款地理信息系統(tǒng)平臺,被廣泛認為是處理地圖及地理信息的領先軟件之一,其特點包括強大的空間分析能力、高效的大數(shù)據(jù)存儲與管理、成熟的技術體系、穩(wěn)定的安全性以及領先的影像管理技術。然而,需要指出的是,ArcGIS是商業(yè)軟件,存在不開源、應用平臺不兼容等問題。

提升軟件的自主保障能力是發(fā)揮數(shù)據(jù)共享利用效益的關鍵,使用國產軟件也是提高本國數(shù)據(jù)安全的一個重要途徑。近年來,隨著信息技術的飛速發(fā)展和數(shù)據(jù)交換的增加,對數(shù)據(jù)安全和隱私保護的需求日益迫切。在《科學數(shù)據(jù)管理辦法》中,明確提出在“加強和規(guī)范科學數(shù)據(jù)管理,保障科學數(shù)據(jù)安全”的基礎上提高開放共享水平,該辦法也專門設立了“保密與安全”這一章節(jié),強調了主管部門、法人單位和科學數(shù)據(jù)中心等主體在數(shù)據(jù)安全方面的責任和要求[9]。此外,為了落實國家安全制度,保障公民信息數(shù)據(jù)權益,我國制定了《中華人民共和國網絡安全法》(2017年)[10]《中華人民共和國數(shù)據(jù)安全法》(2021年)[11]《中華人民共和國個人信息保護法》(2021年)[12]等法律。國家互聯(lián)網信息辦公室等部門又陸續(xù)發(fā)布了《數(shù)據(jù)出境安全評估辦法》《個人信息出境標準合同辦法》《信息安全技術—個人信息安全規(guī)范》《個人信息跨境處理活動安全認證規(guī)范》等管理辦法及標準,全面支撐數(shù)據(jù)跨境流動體系的構建[13]。這些法律對數(shù)據(jù)出境等方面做出了若干原則性規(guī)定,提出了一系列合規(guī)要求,構建起我國數(shù)據(jù)保護的監(jiān)管框架。在這些法律指導下,加強我國自主軟件和自主數(shù)據(jù)的開發(fā)和利用是對國家安全的重要支撐。地球科學領域的數(shù)據(jù)具有突出的復雜性和多樣性,涵蓋了大氣、海洋、陸地、地球內部、人與生態(tài)等多要素數(shù)據(jù),具有學科領域數(shù)據(jù)處理的典型代表性。因此,本研究針對地球科學多個專題,開展數(shù)據(jù)處理與分析軟件的自主安全現(xiàn)狀調研,并預期通過對比分析提出相應建議。

2 "研究方法

2.1 "調研大綱

本次調研主要覆蓋以下幾個關鍵指標:軟件/工具名稱、概況、主要功能、應用服務/典型案例、優(yōu)缺點、國別及國內對標軟件、參考資料等。

(1)軟件/工具名稱

軟件/工具的官方規(guī)范名稱,部分有通用簡稱的亦可提供。

(2)軟件/工具概況

軟件/工具的開發(fā)歷史、版本及其變化、開發(fā)維護團隊、支持語言和平臺。

(3)軟件/工具的主要功能

軟件/工具的核心功能和特色,技術實現(xiàn)和應用場景,以及其滿足特定專題領域的需求情況。

(4)應用服務/典型案例

軟件在實際應用中的具體案例,了解不同場景中的應用效果和用戶反饋。

(5)優(yōu)缺點

客觀分析軟件的優(yōu)勢,如易用性、功能豐富、性能優(yōu)異等。指出軟件的潛在不足,如界面復雜、資源消耗大、兼容性問題等。

(6)國別及國內對標軟件

介紹軟件的來源國家及其在該國的市場地位,

對比國內市場上的類似軟件,分析它們的相似點和差異。

2.2 "軟件/工具分組

結合地球科學的應用領域分布,對調研獲取的177個國內外軟件/工具進行分組,見表1所示。共包括16個專題,分別是遙感處理、土地覆蓋、海洋、地質、大氣、生態(tài)評價、資源承載力、凍土、野火、草地、農業(yè)、土地退化、自然災害、人口社會經濟、空間化以及知識圖譜。

3 "研究結果

3.1 "所屬專題分析

調研到的各專題軟件/工具如表2所示。土地覆蓋、人口社會經濟、草地、知識圖譜、資源承載力、自然災害、海洋、地質、遙感處理和大氣等專題的軟件/工具數(shù)量均超過10個,反映出地學領域的軟件/工具發(fā)展傾向于支持綜合性應用的場景。需要深度專業(yè)知識的專題,如土地退化、空間化和凍土等,則軟件/工具數(shù)量相對較少。與國際開發(fā)的軟件/工具相比,國產軟件主要突顯在土地退化、人口社會經濟、知識圖譜和遙感處理等專題。這反映出我國地學研究的區(qū)域特色,即關注在生態(tài)環(huán)境、土地退化、人口社會經濟可持續(xù)發(fā)展、遙感應用等。

土地覆蓋的主流數(shù)據(jù)產品庫有Radiant MLHub、ESA WorldCover、LandCoverNet等,土地覆蓋模擬模型工具有FLUS、PLUS等。這些數(shù)據(jù)和模型工具揭示了全球地表覆蓋的土地類型歷史、現(xiàn)狀及未來情景的模擬,對地球表層系統(tǒng)、環(huán)境變化和可持續(xù)發(fā)展研究具有重要意義。自然災害方面,現(xiàn)有的軟件/工具在模擬能力方面有很大提高,如泥石流、地震、洪水和雪崩等。它們結合了大數(shù)據(jù)分析、數(shù)值模擬和地理信息系統(tǒng)(GIS)等技術,可為決策者提供實時的災害預警和風險評估。海洋專題軟件/工具多用于分析和可視化數(shù)量龐大的海洋數(shù)據(jù)集,對于海洋生態(tài)系統(tǒng)、氣候變化和全球生物地球化學循環(huán)研究至關重要。地質專題主要是地球科學和地質工程領域中用于數(shù)據(jù)分析、建模和可視化的高級軟件/工具。它們被廣泛應用于自然資源評估、地質建模、環(huán)境分析和礦山規(guī)劃等多種任務中。遙感數(shù)據(jù)處理主要面向于海量科學數(shù)據(jù)的高速計算與處理,近年來遙感處理軟件與云計算、邊緣計算的深度融合使得大批量的數(shù)據(jù)資源得以高效計算。大氣專題軟件多為可對氣候模式、蒸散發(fā)、大氣成分、氣象要素等提供數(shù)據(jù)計算的平臺和方法,例如全球氣候以及近地表環(huán)境參量的模擬、下墊面復雜多樣的地表蒸散發(fā)和干旱指數(shù)計算、氣象數(shù)據(jù)反演、預估水循環(huán)能力,以及氣象災害預測預防能力等。農業(yè)專題使用的軟件/工具不斷演進,不僅可以更好地監(jiān)測農田狀況、作物生長情況和資源利用效率,還支持大規(guī)模數(shù)據(jù)的存儲、處理和分析,提供農業(yè)生產管理決策支持。生態(tài)方面軟件在生態(tài)學研究和生態(tài)系統(tǒng)管理中發(fā)揮著重要作用。這些軟件通常用于模擬、分析、監(jiān)測和管理各種生態(tài)系統(tǒng),以及評估人類活動對生態(tài)系統(tǒng)的影響,主要有AHP、GeoDetector、GWR、SRP等。

這些軟件/工具涉及很多交叉的應用學科領域。對調研軟件/工具的概況、主要功能、應用服務/典型案例等文本信息進行分詞、清洗和梳理,采用了權重分析方法來深入調研軟件/工具的應用專題領域(圖1)。在涉及的177個軟件/工具中,“地理”領域是被應用最多的方向,詞頻超過30次。其次是生態(tài)、災害、海洋和信息學等領域,這些方向的詞頻均在15次以上。從圖1可以看到地理、生態(tài)、災害、海洋、信息、地質、草地等領域具有較鮮明的主流軟件特征。而在農業(yè)、土地利用、凍土、人口等領域的頻次下降,反映出軟件/工具的產品較少。

3.2 "所屬國家分析

調研軟件/工具主要分布在15個國家和區(qū)域,其中包括美國、中國、加拿大、英國和荷蘭等(圖2)。另有19個軟件/工具由國際組織或多國協(xié)作共同開發(fā)或運營。在這些國家中,美國是軟件/工具開發(fā)的巨頭,

其開發(fā)的軟件/工具占比近40%。相較之下,其他國家的軟件/工具開發(fā)相對較為有限,絕大多數(shù)國家的軟件/工具數(shù)量不超過10個(包含10個),美國在地學領域軟件/工具研發(fā)處于主導地位。歐洲在全球范圍內軟件/工具的開發(fā)也處在較為突出地位。非洲、南美洲、“一帶一路”沿線國家缺少在地學領域的軟件/工具研發(fā),呈現(xiàn)出相對較低的集中度。

3.3 "時間區(qū)域專題多維分析

在開發(fā)應用時間方面,在草地及生態(tài)專題中應用較為廣泛的Maximum Entropy Modeling(MaxEnt) 開發(fā)時間最早,可追溯至1957年。從圖3可知,自2000年以后,軟件/工具開發(fā)呈現(xiàn)出較為集中的趨勢。對于一些新興的應用領域,如知識圖譜,其相關軟件/工具的開發(fā)時間主要聚焦在2010年以后;而在遙感處理研究專題,開發(fā)時間主要集中在2005年之后。這一現(xiàn)象表明軟件/工具的開發(fā)時間與學科領域的發(fā)展趨勢密切相關。在農業(yè)、草地等專題,大多數(shù)軟件/工具的開發(fā)時間早于2000年,并且近年幾乎沒有新的軟件/工具開發(fā)。這進一步說明該專題已有的軟件/工具部分較為成熟,基本可以滿足當前需求。美國開發(fā)的軟件/工具幾乎在調研的所有應用專題中都有涉及,其次是中國,覆蓋了11個專題。此外,許多應用專題中有近5個國家(或國際組織)都開發(fā)了不同的軟件/工具,然而在空間化、土地退化、凍土、生態(tài)評價等專題,僅有兩個國家(或國際組織)開發(fā)了不同的軟件/工具。

3.4 "開放程度分析

軟件/工具的開放程度對于全球軟件開發(fā)的知識共享和推廣應用影響顯著。在圖4的軟件/工具開放程度分析中,免費的軟件/工具在地學領域占據(jù)大多數(shù)(占調研總體的67.8%)。美國開源/免費的軟件/工具

達到68%,中國為57%。具體而言,針對海洋大數(shù)據(jù)處理、生態(tài)評價、凍土等大多數(shù)應用專題,相當一部分軟件/工具是以免費形式提供給用戶的。然而,在地質、資源承載力評估、自然災害、知識圖譜等專題,一定數(shù)量的軟件需要用戶支付費用。除此之外,調研過程中也有其他情況,如軟件/工具的特定版本或者特定用途需要支付費用。用戶在選擇和使用時會考慮這些外部因素以衡量是否選用。

對有開發(fā)時間節(jié)點的145個軟件/工具進行以5年為周期的軟件/工具開源情況分析(見圖5,在統(tǒng)計過程中開放訪問數(shù)據(jù)的平臺也視作開源)。軟件/工具總數(shù)、免費軟件/工具以及開源軟件/工具數(shù)量整體趨勢一致,呈現(xiàn)先增長后減少的趨勢??砂l(fā)現(xiàn)開源軟件/工具數(shù)量在2005—2009年達到了峰值,之后有所下降,這可能反映出開源社區(qū)的發(fā)展經歷了一個高速增長期后進入了一個相對平穩(wěn)或調整的階段。開源軟件的減少也可能與開發(fā)者對知識產權、商業(yè)化潛力和安全性等因素的重新評估有關。

3.5 "與云平臺的結合程度

對全球177款地學領域軟件/工具調研中,發(fā)現(xiàn)有60款軟件已經整合了在線云平臺技術或者具備與云平臺技術結合的潛力,占到了總數(shù)的三分之一以上。這一發(fā)現(xiàn)凸顯了云計算在地學研究中的日益重要性。進一步分析指出,中國在地學領域的國家級科學數(shù)據(jù)中心均擁有廣泛的軟件應用空間,包括國家對地觀測科學數(shù)據(jù)中心、國家極地科學數(shù)據(jù)中心、國家青藏高原科學數(shù)據(jù)中心、國家冰川凍土沙漠科學數(shù)據(jù)中心、國家地球系統(tǒng)科學數(shù)據(jù)中心、國家農業(yè)科學數(shù)據(jù)中心、國家林業(yè)和草原科學數(shù)據(jù)中心、國家氣象科學數(shù)據(jù)中心、國家海洋科學數(shù)據(jù)中心,以及國家生態(tài)科學和國家地震科學數(shù)據(jù)中心(圖6)。遙感處理、土地覆蓋、海洋、地質、草地、空間化以及知識圖譜專題的軟件/工具在上述11個地學領域國家數(shù)據(jù)中心均存在應用方向和前景。資源承載力、農業(yè)、土地退化專題的軟件/工具應用面相對較窄,主要可能應用于國家農業(yè)科學數(shù)據(jù)中心、國家林業(yè)科學數(shù)據(jù)中心、國家生態(tài)科學數(shù)據(jù)中心以及國家地球系統(tǒng)科學數(shù)據(jù)中心等。應用面較廣的地學領域科學數(shù)據(jù)中心,如地球系統(tǒng)、對地觀測、農業(yè)等,其可用軟件數(shù)在近100個及以上。各種軟件/工具,包括云計算平臺、隨機森林算法工具、Python等開源分析軟件以及WorldCover等數(shù)據(jù)庫,都能在這些數(shù)據(jù)中心的云計算環(huán)境中提供必要的數(shù)據(jù)、算法和技術支持。時間序列分析顯示,隨著時間的推移,越來越多的軟件和工具開始采納云平臺技術或者支持云平臺技術的開發(fā),反映出地學領域技術進步的發(fā)展趨勢。

4 "討論與建議

4.1 "地學領域軟件/工具布局與領域發(fā)展

在地學領域的軟件/工具布局方面,存在著開源軟件發(fā)展受限、自主研發(fā)能力不足等多個方面的問題。開源軟件雖然一度蓬勃發(fā)展(1990—2009年),但隨后出現(xiàn)增長放緩的現(xiàn)象(2010—2023年),這反映出知識產權保護、商業(yè)化潛力等方面的挑戰(zhàn)。盡管在地學領域中土地退化、人口社會經濟、知識圖譜、遙感處理等專題取得了一定進展,但特定專題如大氣科學

和野火等的軟件/工具開發(fā)高度依賴國外,自主研發(fā)能力不足。從國際視角來看,美國開發(fā)的軟件/工具幾乎涉及所有調研的應用專題,具有明顯的技術優(yōu)勢。在空間化、土地退化、凍土、生態(tài)評價等專題僅有2個國家(或國際組織)參與研發(fā),反映出部分專題的軟件支撐度低。非洲、南美洲以及“一帶一路”沿線國家的軟件支撐度相對較弱,這可能由多個因素的影響所致,如基礎設施和數(shù)字化發(fā)展不足、缺乏教育和人才培養(yǎng)水平等。此外,國內軟件/工具開發(fā)多呈現(xiàn)出模仿國際方案的趨勢,缺乏原創(chuàng)性和創(chuàng)新性,限制了其市場競爭力。

建議:1)增加對開源軟件社區(qū)的支持和參與,以及加強科技軟件的自主研發(fā)能力,特別是在那些自主保障程度較低的關鍵專題,是提高軟件自主性的關鍵。2)鼓勵原創(chuàng)性思維和創(chuàng)新,通過獨立研發(fā)和創(chuàng)新設計的策略來提供多樣化和個性化的服務,從而增強市場競爭力。3)加強與國家科學數(shù)據(jù)中心的合作,通過數(shù)據(jù)共享、云計算資源利用等方式,建立軟件/工具共享

機制,提高軟件/工具的數(shù)據(jù)處理能力和效率。

4.2 "科技軟件/工具的開放與共享發(fā)展建議

當前的軟件/工具中有部分免費軟件/工具,主要體現(xiàn)在海洋大數(shù)據(jù)、生態(tài)評價、凍土等應用專題,但在地質、資源承載力評估、自然災害、知識圖譜等特定專題,還以商業(yè)化的軟件為主,這可能會限制特定領域研究者或企業(yè)的接入和使用。此外,軟件/工具的不同版本以及特定用途下的費用問題,增加了用戶選擇軟件時的復雜度和使用成本。這種開放程度的差異性,不僅影響用戶的使用體驗,也可能影響到軟件的普及率和領域內的研究發(fā)展。

建議:1)加強政府和機構對開發(fā)免費或低成本軟件/工具的資助和支持,尤其是在軟件依存度高的專業(yè)領域。2)鼓勵開發(fā)者提供多版本軟件,包括功能有限的免費版本和高級功能的付費版本,以滿足不同用戶的需求并促進軟件普及,增強用戶體驗。3)鼓勵搭建軟件共享平臺,促進行業(yè)內軟件/工具的交流和共享,特別是針對研究和學術用途的軟件。

4.3 "科技軟件/工具的自主保障上的展望與挑戰(zhàn)

盡管有一部分國產軟件產品在地學領域應用(占調研比例的26.6%),但在關鍵軟件產品研發(fā)中,我國面臨著缺乏具有顛覆性和革命性意義的創(chuàng)新產品問題。例如,在遙感處理和地理信息數(shù)據(jù)處理軟件中的軟件/工具,大多是在國際知名云計算平臺以及空間化產品的影響和啟發(fā)下發(fā)展而來。這種模仿式的發(fā)展策略雖然在一定程度上促進了國內軟件/工具的增長,但也導致了原創(chuàng)性和創(chuàng)新性的不足。由于這些軟件/工具在設計和功能上過度依賴于已有的國際成功方案,它們往往難以形成獨特的競爭優(yōu)勢。相對于那些影響力大的國外軟件,國產軟件的用戶群體規(guī)模較小,進一步導致了這些軟件后期生態(tài)系統(tǒng)的建立和維護變得更為困難。這種情況不僅限制了軟件的普及和應用,也減弱了其在市場上的競爭力和可持續(xù)發(fā)展?jié)摿Α?/p>

建議:1)加強對國產軟件研發(fā)的支持,尤其是在目前參與度較低的專題,如大氣、野火等,可增加研發(fā)投入和政府政策扶持。2)鼓勵國產軟件/工具走向國際,提升國際影響力,通過參與國際合作項目、國際標準制定等方式提高軟件/工具可見度和認可度。3)促進學科領域間的國際交流和合作,鼓勵多學科融合的軟件/工具開發(fā),提高軟件/工具的通用性和適用性。

4.4 "數(shù)據(jù)軟件發(fā)展與國家科學數(shù)據(jù)中心的契合

本次調研的部分軟件/工具與國家科學數(shù)據(jù)中心

的契合度存在不足。盡管部分地學領域的數(shù)據(jù)中心已經在加強軟件/工具的開發(fā)和應用方面取得了一定進展,但是開發(fā)的力度尚不夠,尚未形成明顯的趨勢。隨著科學數(shù)據(jù)的快速增長,現(xiàn)有的軟件/工具可能無法完全滿足高效處理和分析這些數(shù)據(jù)的需求。隨著時間的推移,越來越多的軟件和工具開始采納云平臺技術或支持云平臺技術的開發(fā)?,F(xiàn)有的云平臺大多起到數(shù)據(jù)倉儲的作用,但數(shù)據(jù)利用和開發(fā)能力還有提升空間,尤其是在數(shù)據(jù)分析、處理和應用服務等方面。這說明,云計算技術在國家科學數(shù)據(jù)中心的應用潛力遠未被挖掘。

建議:1)加強軟件/工具與國家科學數(shù)據(jù)中心的合作,特別是在數(shù)據(jù)共享、云計算資源利用等方面,提高軟件/工具的數(shù)據(jù)處理能力和效率。建議進一步探索和優(yōu)化地學領域軟件與國家科學數(shù)據(jù)中心的契合度。2)促進軟件/工具的標準化和模塊化發(fā)展,以便更好地集成到國家科學數(shù)據(jù)中心的技術體系中,提升數(shù)據(jù)利用的靈活性和便捷性。3)加強算法工具與數(shù)據(jù)庫的整合,推動具體專題在開放、協(xié)作和智能化方向的發(fā)展,促進大數(shù)據(jù)與人工智能相結合的科研范式的變革。

4.5 "國家科學數(shù)據(jù)中心軟件/工具開發(fā)利用建議

國家科學數(shù)據(jù)中心是我國科技基礎設施的重要組成部分,其主要分布在地球科學、生物科學、物理學、天文學、農學、林雪、醫(yī)學、材料科學等重點學科領域,各中心根據(jù)學科領域特點建立科學數(shù)據(jù)資源體系。據(jù)2022年中國科學數(shù)據(jù)資源發(fā)展研究報告顯示[14],截至2020年年底,20個國家科學數(shù)據(jù)中心整合的數(shù)據(jù)總量達到104.1PB,發(fā)布共計97 093條資源目錄數(shù)據(jù)。另外,國家科學數(shù)據(jù)中心基于所管理的學科領域數(shù)據(jù),面向科研應用的實際需求,研發(fā)和形成了一大批具有影響力的特色軟件/工具。例如,在空間科學領域,研發(fā)融合處理加工類、分析挖掘類、重大任務支撐類和科普傳播類軟件/工具共40個;在基礎學科領域通用、學科領域分析和挖掘工具近20個;在海洋領域研發(fā)了分析產品制作工具、數(shù)據(jù)自動化清洗工具、研究數(shù)據(jù)處理工具等。許多國家科學數(shù)據(jù)中心同時也是國際數(shù)據(jù)倉儲,承擔著國內外數(shù)據(jù)匯交、期刊論文存檔等重要作用,如國家青藏高原科學數(shù)據(jù)中心 ,國家空間科學數(shù)據(jù)中心 、國家高能物理科學數(shù)據(jù)中心 、國家地球系統(tǒng)科學數(shù)據(jù)中心 等。隨著這些數(shù)據(jù)中心數(shù)據(jù)量的不斷增加,其數(shù)據(jù)資源開發(fā)利用的潛力越來越大。如何挖掘這些資源,加強增值加工和服務,是當前的緊迫需求。

建議:1)參考國際主流軟件的先進經驗和技術,以加強自主研發(fā)能力的提升,特別是在用戶體驗、數(shù)據(jù)安全和處理效率等方面,從而提升國家數(shù)據(jù)中心軟件/工具的國際競爭力。2)培訓和建立跨學科開發(fā)團隊,鼓勵軟件工程師、數(shù)據(jù)科學家、地學研究者等不同背景的專家共同參與軟件/工具的開發(fā),以確保軟件/工具更好地服務于地學領域的研究和應用需求。3)建立更加開放的數(shù)據(jù)和軟件/工具共享機制,鼓勵國內外的科研機構、高校和企業(yè)參與到國家數(shù)據(jù)中心的軟件開發(fā)和改進工作中,共同推進軟件/工具的創(chuàng)新和優(yōu)化。

5 "結語

本文面向地學科學數(shù)據(jù)處理分析工具的自主性問題,開展了地學領域科學數(shù)據(jù)處理分析軟件調研與分析。通過對地學16個專題領域的177個軟件在總體領域分布、國別分布、時間演變、開放程度、與云平臺結合程度等方面分析,初步識別出現(xiàn)有軟件發(fā)展現(xiàn)狀及我國科學數(shù)據(jù)中心與這些軟件/工具之間的契合度。在此基礎上,從地學領域軟件/工具布局與領域發(fā)展、軟件/工具的開放與共享發(fā)展、科技軟件/工具的自主保障、軟件/工具發(fā)展與國家科學數(shù)據(jù)中心的契合、國家科學數(shù)據(jù)中心軟件/工具開發(fā)利用等方面提出相應的發(fā)展建議。需要說明的是,由于檢索語言和檢索方式限制,本研究調研的軟件/工具數(shù)量和范圍尚不充分,還有許多未在線的軟件/工具、多語言的軟件/工具以及未被搜索引擎發(fā)現(xiàn)的軟件/工具未納入統(tǒng)計,未來應進一步結合實踐在更大范圍開展調研和對比。

參考文獻

[1] 王卷樂,王明明,石蕾,等.科學數(shù)據(jù)管理態(tài)勢及其對我國地球科學領域的啟示.地球科學進展[J],2019,34(3):306-315.

[2] 王卷樂,石蕾,王淑強.國際科學數(shù)據(jù)資源管理概述[M].北京:科學技術文獻出版社,2021.

[3] 張玉娥,王永珍.歐盟科研數(shù)據(jù)管理與開放獲取政策及其啟示——以“歐盟地平線2020”計劃為例[J].圖書情報工作,2017,61(13): 70-76.

[4] 黃雨婷,傅文奇.日本政府數(shù)據(jù)開放的政策保障及其啟示[J].數(shù)字圖書館論壇,2020(9):9-17.

[5] 科技部財政部關于發(fā)布國家科技資源共享服務平臺優(yōu)化調整名單的通知(國科發(fā)基〔2019〕194 號)[EB/OL]. http://www.most. gov.cn/xxgk/xinxifenlei/fdzdgknr/qtwj/qtwj2019/201906/t20190610_ 147031.html.

[6] 石蕾,高孟緒,徐波,等.歐美建設發(fā)展科學數(shù)據(jù)中心的經驗及對我國的啟示[J].中國科技資源導刊,2022,54(3):31-36+110.

[7] 國家數(shù)據(jù)局等部門關于印發(fā)《“數(shù)據(jù)要素×”三年行動計劃(2024—2026年)》的通知(國數(shù)政策〔2023〕11號). [EB/OL]. https:// mp.weixin.qq.com/s/YyhLQo4lZIFNMiyupdvO1A.

[8] Oluwaseun O O, Uzochukwu B, Aderemi A. Data Analytics in Nigeria: Challenges, Opportunities and Future Directions[C]//Proceedings of the 2019 2nd International Conference on Computational Intelligence and Intelligent Systems (CIIS 2019) (pp. 110-114). Association for Computing Machinery.

[9] 廖方宇,胡良霖,王健,等.科學數(shù)據(jù)安全標準研究與工作建議[J].科學通報,2024,69(9):1142-1148.

[10] 中華人民共和國網絡安全法[EB/OL]. https://www.cac.gov.cn/2016- 11/07/c_1119867116.htm?eqid=ac15f20d0001418a00000006648a8b25.

[11] 中華人民共和國數(shù)據(jù)安全法[EB/OL]. https://www.gov.cn/xinwen/ 2021-06/11/content_5616919.htm.

[12] 中華人民共和國個人信息保護法[EB/OL]. https://www.gov.cn/ xinwen/2021-08/20/content_5632486.htm?eqid=898a0e2f0002ace800000003648fb2c2.

[13] 王珺,周小林,沈云怡,等.科學數(shù)據(jù)跨境流動治理的現(xiàn)狀、思考與展望[J/OL].科學通報, 2024:1-11.

[14] 國家科技基礎條件平臺中心.中國科學數(shù)據(jù)資源發(fā)展研究報告[M].北京:科學技術文獻出版社,2022.

引用格式:王卷樂,李凱,段博文,蘇娜.地學領域科學數(shù)據(jù)處理與分析軟件自主性分析[J].農業(yè)大數(shù)據(jù)學報,2024,6(2):230-240.DOI: 10.19788/j.issn. 2096-6369.000046.

CITATION: WANG JuanLe, LI Kai, DUAN BoWen, SU Na. Analysis of Autonomy in Geosciences Data Processing and Analysis Software[J]. Journal of Agricultural Big Data, 2024,6(2):230-240. DOI: 10.19788/j.issn.2096-6369.000046.

Analysis of Autonomy in Geosciences Data Processing and Analysis Software

WANG JuanLe1,2,3*, LI Kai1,2, DUAN BoWen1, SU Na4

1. State Key Laboratory of Resources and Environmental Information System, Institute of Geographic Sciences and Natural Resources Research, Chinese Academy of Sciences, Beijing 100101, China; 2. College of Resources and Environment, University of Chinese Academy of Sciences, Beijing 100049, China; 3. Jiangsu Center for Collaborative Innovation in Geographical Information Resource Development and Application, Nanjing 210023, China; 4. Institutes of Science and Development, Chinese Academy of Sciences, Beijing 100190, China

Abstract: The importance of scientific data has been widely recognized, and as scientific data continues to accumulate, the capability of its data processing software will become a key bottleneck in determining whether scientific data can be effectively utilized. The field of Earth science involves multi-scale, multi-type, and multi-source data in research, leading to a strong demand for data processing and analysis software. This study, aimed at the characteristics of the earth science field, analyzes the current state of its main data processing and analysis software, identifies the degree of software autonomy in China, and expects to propose corresponding development suggestions. The survey covers 16 topics including geography, oceanography, geology, atmospheric sciences, ecology, disasters, agriculture, etc., and selects 177 mainstream software/tools, focusing on obtaining indicators such as software/tool names, summaries, main functions, application services/typical cases, advantages and disadvantages, and benchmarking software. The analysis found that these software/tools in the field of geoscience data processing and analysis are completely open (open source) accounting for two-thirds, the last one-thirds are commercial, restrictive, or unknown openness. The main software/tools are developed in countries such as the United States, China, Canada, the United Kingdom, and some international organizations. From the perspective of topic distribution, this is mainly reflected in the following areas: land degradation, socio-economic demographics, knowledge graphs, and remote sensing big data processing. From the perspective of autonomy, the main high-risk software packages are mainly distributed in fields such as spatialization, atmosphere, wildfires, and permafrost. Among the surveyed software/tools, about one-third of the professional software/tool can be applied to the National Science Data Center, and can be used in Cloud Platform. Combining the era of artificial intelligence and the development of \"Data Element X\", the future should strongly enhance the development and deployment application of China's autonomous scientific data processing software/tool from 5 perspectives.

Keywords: earth science; scientific data; software; autonomy; National Scientific Data Center

猜你喜歡
數(shù)據(jù)中心工具領域
酒泉云計算大數(shù)據(jù)中心
波比的工具
波比的工具
領域·對峙
青年生活(2019年23期)2019-09-10 12:55:43
民航綠色云數(shù)據(jù)中心PUE控制
電子測試(2018年11期)2018-06-26 05:56:24
“巧用”工具
讀者(2017年18期)2017-08-29 21:22:03
基于云計算的交通運輸數(shù)據(jù)中心實現(xiàn)與應用
新常態(tài)下推動多層次多領域依法治理初探
Overlay Network技術在云計算數(shù)據(jù)中心中的應用
河南科技(2014年11期)2014-02-27 14:16:49
肯定與質疑:“慕課”在基礎教育領域的應用
彰化市| 泰来县| 潼关县| 子洲县| 武胜县| 祁门县| 正蓝旗| 宜都市| 平凉市| 隆安县| 巨鹿县| 玉溪市| 余干县| 迭部县| 南汇区| 烟台市| 米泉市| 五大连池市| 台南市| 安国市| 玉田县| 共和县| 河东区| 紫阳县| 济源市| 营口市| 蒲城县| 郑州市| 方山县| 洛南县| 临泉县| 马公市| 义马市| 军事| 上蔡县| 商南县| 准格尔旗| 顺昌县| 惠来县| 洱源县| 南澳县|