国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

前沿物理大科學裝置數(shù)據(jù)策略的一些思考

2018-02-08 08:49
中國科學院院刊 2018年8期
關鍵詞:科學家物理裝置

陳 剛

中國科學院高能物理研究所 北京 100049

前沿物理大科學裝置占我國大科學裝置比例最大,對國家科學研究和國家戰(zhàn)略需求尤為重要。這類大科學裝置產(chǎn)生的數(shù)據(jù)規(guī)模最大、數(shù)據(jù)結(jié)構(gòu)最復雜。如何高效地發(fā)揮這些數(shù)據(jù)的最大效益是我們追求的目標。如何將數(shù)據(jù)在科學研究中的應用不是本文的重點。本文試圖對數(shù)據(jù)的管理與應用中涉及的部分政策保障等作簡要討論,希望能為數(shù)據(jù)生產(chǎn)者、使用者、大科學裝置投資者在制定政策和策略時提供參考。

1 前沿物理大科學裝置簡介

前沿物理大科學裝置是當今國內(nèi)外基礎物理及應用科學研究最重要的手段和條件,包括大型粒子物理實驗裝置、中微子實驗、重離子加速器、托卡馬克實驗、FAST 和 LAMOST 等天文望遠鏡、地面及太空宇宙線與天體物理觀測裝置、同步輻射實驗平臺、散裂中子源實驗、穩(wěn)態(tài)強磁場實驗裝置等[1]。粒子物理實驗、聚變實驗、天文望遠鏡及宇宙線觀測裝置基本屬于專用裝置,用于從微觀到宇觀尺度研究物質(zhì)基本結(jié)構(gòu)及宇宙演化等前沿科學問題。同步輻射、散裂中子源及穩(wěn)態(tài)強磁場實驗裝置屬于國家公共實驗平臺,向科研及產(chǎn)業(yè)界開放用于生命科學、材料科學、化學、物理學等領域的微觀研究及高新技術(shù)開發(fā)。

國際高能物理實驗以歐洲核子中心的大型強子對撞機 LHC 實驗[2]為代表,每年產(chǎn)生的數(shù)據(jù)達數(shù)十 PB。北京正負電子對撞機是中國最重要的高能物理實驗裝置,近年來產(chǎn)生的數(shù)據(jù)達到 10 PB 以上。宇宙線與天體物理觀測平臺大致分地面宇宙線觀測平臺及空間科學衛(wèi)星兩大類。羊八井宇宙線觀測站和正在稻城建設的大型高海拔宇宙線觀測站 LHAASO 是國際上最重要的地面觀測站,每年采集的宇宙線數(shù)據(jù)將達到 PB 量級。

我國的同步輻射光源包括運行的北京同步輻射光源、上海同步輻射光源、合肥同步輻射光源,以及(即將開工的)北京高能光源和(在建的)上海硬 X 射線自由電子激光裝置;此外,中國散裂中子源已經(jīng)建成投入運行。這些公共實驗平臺每年將吸引來自各學科領域的數(shù)千名科學家開展實驗,產(chǎn)生的數(shù)據(jù)也達到 PB 量級。所有大科學裝置產(chǎn)生的海量數(shù)據(jù)都是科學研究的第一手資料,是產(chǎn)生科學成果的源泉。

2 數(shù)據(jù)共享與利用

前沿物理大科學裝置的特點是裝置規(guī)模大,建設和運行周期長,其科學技術(shù)目標為瞄準國際科學技術(shù)前沿,為國家經(jīng)濟建設和社會發(fā)展作出戰(zhàn)略性、基礎性和前瞻性貢獻。前沿物理大科學裝置產(chǎn)生的數(shù)據(jù)是產(chǎn)生科學成果的金礦。裝置性質(zhì)的不同,數(shù)據(jù)共享與應用的模式也不同。

(1)粒子物理實驗(包括對撞機實驗、中微子實驗、宇宙線實驗等)。當前我國科學家參與的粒子物理實驗包括以國外為基地的實驗,如歐洲核子中心的 LHC 實驗,以及以中國為基地且中國主導的實驗,如北京正負電子對撞機 BESIII 實驗,大亞灣中微子以及高海拔宇宙線觀測站 LHAASO 實驗等。所有這些粒子物理實驗均采用國際合作的模式,合作各方共同分擔實驗的建設、運行及管理的任務。因此,粒子物理實驗數(shù)據(jù)基本采用合作成員單位內(nèi)自由共享、共同利用的模式,合作組內(nèi)產(chǎn)生的科學成果以集體名義發(fā)表并共同擁有成果。盡管如此,大型粒子物理實驗的合作成員之間存在競爭,合作各方都盡最大的努力爭取首先獲得研究成果,提升自己在合作組內(nèi)及國際上的顯現(xiàn)度。因此,除了投入最優(yōu)秀的科學家以外,需要在數(shù)據(jù)傳輸、計算條件方面創(chuàng)造良好的條件,以便以最快的速度產(chǎn)生科學成果。中國在 LHC 實驗的建設與升級方面作出了重要的貢獻,但是在數(shù)據(jù)傳輸共享及科學計算方面的投入不足,這對中國科學家開展 LHC 物理研究造成不利影響。由于 LHC 開始向高亮度升級,數(shù)據(jù)產(chǎn)生率將有數(shù)十倍的增長,這對數(shù)據(jù)的傳輸和處理提出巨大的挑戰(zhàn)。建議國家在網(wǎng)絡及分布式計算等方面給予 LHC 實驗中國組強有力的支持,促進中國科學家利用 LHC 國際合作實驗數(shù)據(jù)產(chǎn)生一流物理成果。同時,我們在以中國為主導的粒子物理實驗中具有管理主動權(quán)。在公平合作的前提下,我們應采取適當?shù)牟呗院图夹g(shù)手段,在數(shù)據(jù)共享和利用方面取得主動權(quán)。

(2)天文觀測(特別是大型通用型望遠鏡)。在國際上,該研究領域數(shù)據(jù)的共享大部分采用延時公開。天文觀測者在望遠鏡上取得的觀測數(shù)據(jù)經(jīng)過一段保護期后將公開發(fā)布。在保護期內(nèi),觀測者可以獨享數(shù)據(jù)并盡快進行數(shù)據(jù)分析以獲得科學成果。保護期后,數(shù)據(jù)將存放在數(shù)據(jù)庫服務器上供世界各國的天文學家訪問和使用。一般這種延時為 1—2 年。天文觀測數(shù)據(jù)的這種共享方式值得其他領域?qū)W習。一方面,數(shù)據(jù)的公開可以讓更多的科學家充分利用數(shù)據(jù)獲得更多的研究成果;另一方面,把數(shù)據(jù)交給同行更有利于檢驗自己的成果。目前,空間科學衛(wèi)星及宇宙線觀測實驗也借鑒這種模式,以一定的方式將衛(wèi)星觀測數(shù)據(jù)和宇宙線觀測數(shù)據(jù)分批公開,提供給同行用于科學研究。

(3)同步輻射裝置及散裂中子源裝置。此類裝置是國家投資建設的公共實驗平臺。學術(shù)領域的科學家可申請在平臺上開展實驗,實驗產(chǎn)生的數(shù)據(jù)將用于科學研究。國外的同步裝置對實驗數(shù)據(jù)有相應的政策[3]。歐洲同步輻射光源(ESRF)規(guī)定,ESRF 將保存所有實驗的原始數(shù)據(jù)和元數(shù)據(jù)。數(shù)據(jù)有為期 3 年的保護期,必要時可以延長。在保護期內(nèi),實驗者有完全的使用權(quán)。保護期過后,ESRF 根據(jù)相應的許可條件下將數(shù)據(jù)向 ESRF 的注冊用戶公開。用戶使用數(shù)據(jù)產(chǎn)生研究成果在發(fā)表時須標明引用。國內(nèi)的同步輻射裝置及散裂中子源裝置為大學及研究機構(gòu)的科學家開放免費使用。目前,國內(nèi)這些裝置還沒有統(tǒng)一的數(shù)據(jù)政策,這不利于發(fā)揮實驗數(shù)據(jù)的最大利益。由于這些裝置都是國家投資建設和運行,國家對裝置產(chǎn)生的數(shù)據(jù)應該擁有共同所有權(quán)。因此,建議國家建立與國際上類似的數(shù)據(jù)政策,既保護實驗者對數(shù)據(jù)的優(yōu)先使用權(quán),也通過數(shù)據(jù)共享充分發(fā)揮數(shù)據(jù)的作用。公共實驗平臺的數(shù)據(jù)共享可以采取兩種模式:① 建立數(shù)據(jù)保護期,期限 2—3 年,確保實驗者對數(shù)據(jù)的優(yōu)先使用權(quán)。② 對急需使用實驗數(shù)據(jù)的外部用戶,可以與實驗者簽訂合作協(xié)議,建立數(shù)據(jù)共享機制,讓這些用戶在保護期也能及時利用數(shù)據(jù)開展科學研究。

3 數(shù)據(jù)保存及再利用

前沿物理大科學裝置的建造、維護和數(shù)據(jù)采集消耗了大量的人力、物力,因此實驗數(shù)據(jù)是極其寶貴的??茖W家對數(shù)據(jù)的利用不會隨著數(shù)據(jù)采集的結(jié)束而立即停止,很多實驗在數(shù)據(jù)采集結(jié)束后的若干年內(nèi),仍然在進行數(shù)據(jù)分析研究并有相關的論文發(fā)表。不同大科學裝置的數(shù)據(jù)具有唯一性,隨著理論研究的進步和分析手段的提高,舊的實驗數(shù)據(jù)中可能會有新的科學發(fā)現(xiàn)。另外,對不同實驗的新、舊數(shù)據(jù)的聯(lián)合分析和交叉驗證,能夠提高科學發(fā)現(xiàn)的精度和可信度。大科學裝置的數(shù)據(jù)的另一個重要用途是提供給大專院校和中小學校用于教學和科普。由此可見,前沿物理大科學裝置的數(shù)據(jù)的長期保存具有極其重要的意義。

數(shù)據(jù)的保存不僅僅是實驗采集的數(shù)據(jù),還應該包括知識庫。所謂知識庫包含描述實驗條件的參數(shù)、分級數(shù)據(jù)所用的軟件、文檔以及其他數(shù)據(jù)分析所需的資料。所以這些信息是保證正確進行數(shù)據(jù)再利用和分析的必要條件。后續(xù)數(shù)據(jù)分析的類型不同,有些數(shù)據(jù)分析需要使用實驗的原始數(shù)據(jù),有些只需使用經(jīng)過處理的高級數(shù)據(jù),這對數(shù)據(jù)的長期保存提出不同要求。以高能物理為例,國際高能物理領域成立了數(shù)據(jù)長期保存合作組 DPHEP (中國科學院高能物理研究所是發(fā)起單位之一),并編寫了數(shù)據(jù)長期保存技術(shù)白皮書[4]。該白皮書對數(shù)據(jù)和知識庫的保存、相關技術(shù)及策略進行了詳盡的描述。我國前沿物理大科學裝置的數(shù)據(jù)策略缺乏系統(tǒng)的數(shù)據(jù)長期保存及再利用的規(guī)劃及策略,因此該白皮書對國家制定相關政策具有很好的參考意義。此外,我國的經(jīng)費資助基本是針對項目的,當大裝置運行結(jié)束后,很難得到對數(shù)據(jù)保存給予支持的后續(xù)經(jīng)費。因此,應建立相應的資助機制,以確保大科學裝置運行結(jié)束后數(shù)據(jù)的長期保存和高效再利用。

4 人才策略

前沿物理大科學裝置是目前中國規(guī)模最大的一批科學裝置,產(chǎn)生的數(shù)據(jù)規(guī)模也是空前的。管理和分析這些數(shù)據(jù)需要最先進的算法和軟件。這對人才隊伍提出了巨大的挑戰(zhàn)。數(shù)據(jù)分析的算法和軟件一般需要相關物理專業(yè)的人才進行開發(fā)和實現(xiàn)。而大部分物理專業(yè)人員在計算機技術(shù)方面訓練不夠,特別是年輕碩博士畢業(yè)生和博士后在工作中將面臨數(shù)據(jù)分析工具、軟件及編程語言等問題。因此,一個大科學裝置項目應該為這些物理學專業(yè)人員提供在職的計算機技術(shù)培訓。歐洲核子中心每年舉辦高水平的計算技術(shù)暑期學校[5],挑選世界各國的優(yōu)秀青年學生或青年科學家參加,提供科學計算技術(shù)培訓課程和實習。國內(nèi)應針對不同的大科學裝置或者不同的科學計算方法建立高水平的培訓課程,鼓勵科學家參加計算技術(shù)培訓。這將極大地推動科研人員軟件及數(shù)據(jù)分析的水平,促進科學產(chǎn)出。

前沿物理大科學裝置的規(guī)模和復雜度都是空前的。數(shù)據(jù)分析的過程復雜、任務量巨大,僅靠物理學專業(yè)的科學家是不夠的。另外,在光源、散裂中子源等公共實驗平臺上開展實驗的科學家來自不同的專業(yè)領域,對實驗平臺的結(jié)構(gòu)及數(shù)據(jù)結(jié)構(gòu)了解不一定深入。這種情況下,計算機專業(yè)的科研技術(shù)人員與物理學及其他相關領域科學家的合作將變得非常重要。以中國科學院高能物理研究所為例,其組建了一支計算機專家隊伍與物理學家配合和溝通,對數(shù)據(jù)分析軟件進行優(yōu)化;同時,物理學家依據(jù)物理分析計算的需求和特性與計算機專家深入溝通,對計算機硬件平臺、數(shù)據(jù)管理系統(tǒng)、中間件系統(tǒng)進行優(yōu)化。在物理學家開發(fā)數(shù)據(jù)分析軟件時,計算機專家?guī)椭麄儍?yōu)化軟件,提高數(shù)據(jù)訪問的效率和軟件運行的效率。計算機專家同時根據(jù)物理學家訪問數(shù)據(jù)的特點和對 CPU 的利用特點設計和建造數(shù)據(jù)存儲系統(tǒng)以及計算集群的體系結(jié)構(gòu),使數(shù)據(jù)處理達到最高的效率。雙向溝通確保數(shù)據(jù)分析計算系統(tǒng)能以最高效率滿足科學計算的要求。

高水平的軟件是大科學裝置成功的關鍵。軟件開發(fā)人員的工作得到認可并在職業(yè)晉升、待遇等各方面得以保障是吸引高水平軟件人才穩(wěn)定從事大科學裝置數(shù)據(jù)與計算軟件開發(fā)及運行維護的必要條件。以高能物理為例,歐洲核子中心擁有一支高水平的計算機及物理軟件開發(fā)的隊伍。這支隊伍幾十年來專心進行大型通用物理軟件及數(shù)據(jù)分析軟件的研究發(fā)展,其產(chǎn)生的“www 技術(shù)”成為全世界最重要的網(wǎng)絡技術(shù),極大地推動互聯(lián)網(wǎng)的發(fā)展。另外,歐洲核子中心開發(fā)的物理模擬軟件“GEANT4”成為全球粒子物理、核物理、核醫(yī)學以及射線技術(shù)計算的基礎,“ROOT”成為數(shù)據(jù)分析的核心技術(shù)。這說明確??茖W家全心全意投入軟件研究開發(fā)的重要性。一方面,為提升軟件開發(fā)者的顯現(xiàn)度,應鼓勵他們將軟件開發(fā)的技術(shù)和成果寫成文章發(fā)表。另一方面,應該鼓勵或要求領域科學家在發(fā)表文章和論文時恰如其分的引用其使用的軟件。這對正確認可軟件開發(fā)者的貢獻尤其重要。

猜你喜歡
科學家物理裝置
只因是物理
教你辨認槍口裝置
高考物理模擬試題(六)
倒開水輔助裝置
假如我是科學家
處處留心皆物理
轟趴裝置指南
與科學家面對面
當天才遇上科學家(二)
當天才遇上科學家(一)
晴隆县| 合山市| 巴里| 芜湖市| 三门县| 汉源县| 靖西县| 济源市| 涪陵区| 抚远县| 个旧市| 邯郸县| 义乌市| 广州市| 绿春县| 靖边县| 宜兰市| 河东区| 沂南县| 抚顺市| 河津市| 邳州市| 南开区| 望谟县| 广昌县| 霍州市| 神池县| 白玉县| 徐汇区| 历史| 梁平县| 江都市| 宁明县| 永登县| 沁源县| 博罗县| 东乡族自治县| 武穴市| 始兴县| 汝阳县| 宁海县|