国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)驅(qū)動的短臨降水預(yù)報可靠性分析技術(shù)體系研究

2024-01-29 14:42許磊李琪陶雲(yún)余紅楚杜文英陳澤強陳能成
地理信息世界 2023年4期
關(guān)鍵詞:空間數(shù)據(jù)不確定性降水

許磊,李琪,陶雲(yún),余紅楚,杜文英,陳澤強,陳能成

1. 中國地質(zhì)大學(xué)(武漢) 國家地理信息系統(tǒng)工程技術(shù)研究中心,武漢 430074;

2. 武漢理工大學(xué) 航運學(xué)院,武漢 430063

1 引 言

降水是一個與日常生活息息相關(guān)的現(xiàn)象,同時也是地理空間中重要的氣象水文要素。降水作為地理空間信息的重要組成部分,在智慧城市建設(shè)中同樣不可忽視,降水預(yù)報有助于更好地管理城市水利設(shè)施,保障公共安全(龔健雅等,2019)。由于我國處于東亞季風(fēng)區(qū),每到夏天暴雨洪澇災(zāi)害多發(fā)重發(fā),1990~2021 年造成直接經(jīng)濟損失約50813.03 億元(高守亭等,2018;《中國水旱災(zāi)害防御公報》編寫組,2022)。準(zhǔn)確實時地預(yù)測未來0~6 h 的降水量對于區(qū)域防災(zāi)減災(zāi)具有重要的現(xiàn)實意義。

深度學(xué)習(xí)是一種數(shù)據(jù)驅(qū)動的人工智能技術(shù),對研究對象進行深度網(wǎng)絡(luò)建模并逐漸應(yīng)用于多個領(lǐng)域,包括短期降水預(yù)報、圖像識別和目標(biāo)檢測等領(lǐng)域(陳軍等,2023;王詩洋等,2021)。通過在雷達和衛(wèi)星觀測的大數(shù)據(jù)集上訓(xùn)練,來模擬降水現(xiàn)象,繼而實現(xiàn)精準(zhǔn)降水預(yù)測。然而,由于觀測手段、技術(shù)方法和認(rèn)知水平的局限性,數(shù)據(jù)驅(qū)動的人工智能預(yù)測技術(shù)存在低穩(wěn)健性和不確定性,使得短臨降水預(yù)報存在不可靠性(Kasiviswanathan 和Sudheer,2017)。

短臨降水預(yù)報的可靠性是預(yù)報系統(tǒng)在給定時間內(nèi)完成準(zhǔn)確預(yù)測的能力(Shi,2009),其中數(shù)據(jù)可靠性和模型可靠性是提升系統(tǒng)整體可靠性的關(guān)鍵。數(shù)據(jù)可靠性是數(shù)據(jù)表達的內(nèi)容與現(xiàn)實世界的吻合度,但是復(fù)雜的客觀世界、對世界的模糊認(rèn)知,以及存在誤差的數(shù)據(jù)獲取、處理和表達過程,使得數(shù)據(jù)具有不確定性(史文中等,2017;O’sullivan和Unwin,2003)。數(shù)據(jù)可靠性分析在輔助判斷預(yù)測結(jié)果的同時,還對數(shù)據(jù)處理過程進行反饋,是實現(xiàn)短臨降水準(zhǔn)確預(yù)報的支撐(徐振強,2021)。模型可靠性是對數(shù)據(jù)進行持續(xù)準(zhǔn)確預(yù)測的能力。一個可靠的模型應(yīng)該具有高準(zhǔn)確率和低誤報率,同時能夠推廣到新的數(shù)據(jù)集中。準(zhǔn)確理解和表示物理過程的能力是提高可靠性的關(guān)鍵(Weisheimer 和Palmer,2014)。

在降水預(yù)報中,人工智能可用于處理多預(yù)報因子問題,能夠快速吸納多種分散資料源,物理模型和人工智能模型的耦合是未來降水預(yù)報的范式(顧建峰等,2020;李雙林等,2022)。Bonavita 和Laloyaux(2020)討論了人工神經(jīng)網(wǎng)絡(luò)對平流層系統(tǒng)模式誤差的改善,提高了預(yù)測準(zhǔn)確性,同時人工智能和物理模型的結(jié)合,能夠提高模型的模擬能力。Rasp 等(2018)將神經(jīng)網(wǎng)絡(luò)參數(shù)化與動力學(xué)交互,產(chǎn)生接近其訓(xùn)練氣候態(tài)的穩(wěn)定平均氣候。劉忠民(2018)將小波分析、人工神經(jīng)網(wǎng)絡(luò)分析及水文頻率分析相結(jié)合,充分考慮了不確定因素對中長期降水預(yù)報模型的影響。以上研究表明了物理模型和人工智能模型耦合的可行性,也給未來降水預(yù)報研究提供了方向。

現(xiàn)代觀測儀器精度的提高、氣象自動站密度的增大,以及衛(wèi)星、雷達技術(shù)的進步,為短臨降水預(yù)報可靠性分析提供了良好的數(shù)據(jù)基礎(chǔ)。短臨降水預(yù)報的精度和可靠性受到眾多因素的影響,如數(shù)據(jù)不確定性、模型方法、計算平臺等,需要對這些因素進行有效的分析和建模,從而提升整個預(yù)報系統(tǒng)的可靠性(王慧媛,2020;史文中等,2012a)。本文首先分析短臨降水預(yù)報可靠性研究現(xiàn)狀;其次提出數(shù)據(jù)驅(qū)動的短臨降水預(yù)報可靠性分析的總體思路;最后設(shè)計數(shù)據(jù)驅(qū)動的短臨降水預(yù)報可靠性分析技術(shù)體系,并對短臨降水預(yù)報可靠性進行綜合評估和定量關(guān)聯(lián)推理。本研究能夠為高可靠短臨降水預(yù)報提供理論與技術(shù)支撐。

2 短臨降水預(yù)報可靠性研究現(xiàn)狀

短臨降水預(yù)報方法主要分為數(shù)值天氣預(yù)報、基于雷達回波外推和基于人工智能的降水預(yù)報。數(shù)值天氣預(yù)報是長期以來降水預(yù)報的主要方法,但其缺乏利用最新可用信息進行短期預(yù)報的能力,在短臨預(yù)報方面具有一定局限性(Trebing 等,2021)?;诶走_回波外推的降水預(yù)報具有精度高、實時性強和計算量小的特點,可與數(shù)值天氣預(yù)報互作補充(孫杏杏,2020)。基于人工智能的降水預(yù)報主要是通過機器學(xué)習(xí)和深度學(xué)習(xí)方法對雷達回波或者降水圖像在時空上的關(guān)聯(lián)和變化機制進行外推,預(yù)測未來雷達回波或者降水分布(張飛鴻,2020)。

近年來,觀測數(shù)據(jù)的海量增長使得短臨降水預(yù)報面臨著兩大挑戰(zhàn):①從海量數(shù)據(jù)中提取信息;②推導(dǎo)出能主動從數(shù)據(jù)中學(xué)習(xí)的模型,同時仍遵循自然規(guī)律(Reichstein 等,2019)。人工智能的飛速發(fā)展為應(yīng)對上述挑戰(zhàn)提供了機遇。深度神經(jīng)網(wǎng)絡(luò)在降水預(yù)報方面有許多優(yōu)勢,如數(shù)據(jù)不需要人工注釋、滿足大量計算需求和利用數(shù)據(jù)豐富的時空結(jié)構(gòu)(Espeholt 等,2022)。循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)、卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)、長短時記憶(long short term memory,LSTM)等數(shù)據(jù)驅(qū)動的深度學(xué)習(xí)模型的提出,提升了預(yù)測的準(zhǔn)確性和精度,但其仍舊為黑箱模型,存在可解釋性差的問題,缺乏物理意義(秦昆等,2023)。

人工智能和物理模型在一定程度上可以進行互補,物理模型提供了可解釋性,而數(shù)據(jù)驅(qū)動的方法在從大數(shù)據(jù)中提取可解釋的信息和知識方面具有高度的靈活性(Reichstein 等,2019)。人工智能和物理模型可以從三個方面進行耦合:①物理模型預(yù)測作為先驗輸入;②深度學(xué)習(xí)替換物理模型;③深度學(xué)習(xí)用于物理模型后處理。物理模型的先驗知識能夠幫助人工智能更好地模擬現(xiàn)實世界,當(dāng)前耦合研究大都是在人工智能算法中添加物理約束,研究不同的耦合方式可以推動短臨降水預(yù)報技術(shù)的發(fā)展(胡羽聰?shù)龋?023)。

數(shù)據(jù)驅(qū)動的短臨降水預(yù)報可靠性分析的主要內(nèi)容:①分析預(yù)測過程中的關(guān)鍵影響因素及其邏輯關(guān)系,包括空間數(shù)據(jù)、模型參數(shù)、計算框架、評價方法等方面的眾多影響因素(史文中和張敏,2021);②建立從預(yù)測輸入可靠性至預(yù)測結(jié)果可靠性之間的可靠性關(guān)聯(lián)推理模型;③構(gòu)建可靠性綜合評估指標(biāo)體系,全面評估短臨降水預(yù)報過程和結(jié)果的可靠性,闡明可靠性傳播的規(guī)律,包括隨機性和關(guān)聯(lián)性、時間和空間分異、影響因素重要度和不確定性等(張效康,2017)??煽啃栽u估的內(nèi)容是針對具體研究對象,構(gòu)建相應(yīng)的可靠性評估指標(biāo),計算整體可靠性。現(xiàn)有可靠性評估研究在空間數(shù)據(jù)質(zhì)量、遙感圖像識別和地理國情監(jiān)測等方面開展了相關(guān)探索,提出了空間數(shù)據(jù)與人工智能算法可靠性評估的內(nèi)容和指標(biāo)(史文中等,2012b;張璨和張明英,2018)。在可靠性分析模型方面,已有故障樹、馬爾可夫鏈、貝葉斯網(wǎng)絡(luò)等方法,在可靠性分析中具有廣泛應(yīng)用(林佳宇,2016)。

然而,由于空間數(shù)據(jù)的不確定性、模型參數(shù)的多樣性和人工智能技術(shù)的不透明性等諸多因素的存在,當(dāng)前短臨降水預(yù)報存在不可靠性。盡管對降水預(yù)報的研究逐漸成熟,但是仍有不足之處。

(1)降水在空間中的運動蘊含著內(nèi)在的物理規(guī)律,基于人工智能的短臨降水預(yù)報模型需正確捕獲數(shù)據(jù)的時空結(jié)構(gòu),深入結(jié)合降水形成特征和物理過程才可得到準(zhǔn)確預(yù)測(郭曉萌等,2021)?,F(xiàn)有研究多為缺乏物理過程指導(dǎo)的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),可解釋性較低(Reichstein 等,2019)。

(2)短臨降水預(yù)報需要數(shù)據(jù)和模型作為輸入,然而數(shù)據(jù)與模型的不確定性和誤差,會傳至預(yù)測結(jié)果,帶來預(yù)測結(jié)果的不確定性。現(xiàn)有人工智能降水預(yù)測方法往往僅給出一個確定性的預(yù)測結(jié)果,忽略了預(yù)測過程中數(shù)據(jù)和模型不確定性對預(yù)測結(jié)果的影響,缺乏預(yù)測過程的可靠性建模(Yuan 等,2020;Ravuri 等,2021)。

(3)短臨降水預(yù)報精度受到眾多因素的影響,如數(shù)據(jù)質(zhì)量、模型結(jié)構(gòu)、參數(shù)優(yōu)化、計算平臺等?,F(xiàn)有研究主要集中于分析單一影響因素對預(yù)測結(jié)果的影響,缺乏對預(yù)測影響因素的關(guān)聯(lián)分析、過程推理和綜合評估,難以對預(yù)測過程進行可靠性控制(王勁峰和徐成東,2017;高松,2020)。

綜上所述,國內(nèi)外研究針對短臨降水預(yù)報精度和預(yù)測影響因素進行了評估與分析。在空間精度評價和人工智能方法優(yōu)化方面取得了較大的進展(劉瑞霞,2016;Sharma 等,2018)。然而,當(dāng)前研究存在可靠性過程建模不足、可靠性評估方法片面和可靠性傳播機制不明等問題,具有片面性、不連續(xù)、離散性等特征,忽略了可靠性傳播分析的整體性、連續(xù)性和關(guān)聯(lián)性。因此,如何構(gòu)建科學(xué)合理的可靠性綜合評估指標(biāo)體系,建立有效的可靠性定量關(guān)聯(lián)推理模型,是短臨降水預(yù)報可靠性分析的前沿問題。

3 短臨降水預(yù)報可靠性分析總體思路

可靠性分析是通過識別具體研究問題的影響因素,對具有隨機性和關(guān)聯(lián)性的事件進行描述與分析,確定不同事件之間的邏輯關(guān)系,建立可靠性推理模型,分析可靠性傳播過程中的規(guī)律,進而提出相應(yīng)的改進措施,提高預(yù)報的可靠性(史文中和張敏,2021)。本研究提出的短臨降水預(yù)報可靠性分析總體思路,如圖1 所示。短臨降水預(yù)報的目標(biāo)是預(yù)報未來0~6 h 的降水強度信息、降水時間信息和降水位置信息等。預(yù)報過程中,可靠性的影響因素來源于諸多因素的不確定性,如多源數(shù)據(jù)的誤差、預(yù)測方法的不完善性和建模方法的不準(zhǔn)確性等,而不同因素的可靠性會隨著模型的前向運行而傳播。短臨降水預(yù)報可靠性分析的方法是過程建模、綜合評估和關(guān)聯(lián)推理,通過神經(jīng)網(wǎng)絡(luò)、殘差建模和注意力機制等人工智能技術(shù)進行預(yù)測建模,從而提升短臨降水預(yù)報可靠性定量過程建模的整體性、可解釋性和精度等。

圖1 短臨降水預(yù)報可靠性分析總體思路Fig.1 Overall approach for reliability analysis of precipitation nowcasting

3.1 短臨降水時變概率預(yù)報

針對短臨降水預(yù)報過程中的不確定性因素,可以從數(shù)據(jù)與模型不確定性表征、模型結(jié)構(gòu)設(shè)計和不確定性傳播三個方面進行可靠性過程建模。首先,研究概率–非概率聯(lián)合時變不確定性分析方法,對空間數(shù)據(jù)和模型參數(shù)中存在的隨機和認(rèn)知不確定性進行聯(lián)合建模,從時空維度上表征空間數(shù)據(jù)和模型參數(shù)的不確定性;其次,提出基于物理過程指導(dǎo)的短臨降水概率預(yù)測方法,通過考慮天氣動力學(xué)基本理論和短臨降水形成特征,利用卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、殘差建模和注意力機制等人工智能技術(shù),構(gòu)建基于深度學(xué)習(xí)的短臨降水預(yù)報模型;最后,基于預(yù)測模型和不確定性傳播理論,提出空間數(shù)據(jù)和模型參數(shù)不確定性的前向傳播方法,生成短臨降水時變概率預(yù)測結(jié)果,以概率視角量化預(yù)測結(jié)果不確定性。

3.2 短臨降水預(yù)報綜合評估

針對現(xiàn)有短臨降水預(yù)報可靠性評估存在的片面性問題,研究空間數(shù)據(jù)、模型參數(shù)和預(yù)測結(jié)果的可靠性評估方法,建立短臨降水預(yù)報可靠性綜合評估體系。首先,提出短臨降水預(yù)報可靠性指標(biāo)及計算方法,對影響短臨降水預(yù)報可靠性的不同因素進行可靠性計算;其次,針對預(yù)測算法,計算目標(biāo)函數(shù)、訓(xùn)練數(shù)據(jù)和對抗樣本等因素對算法可靠性的影響;針對空間數(shù)據(jù)和預(yù)測結(jié)果,計算現(xiàn)勢性、準(zhǔn)確性、一致性、完整性和穩(wěn)健性指標(biāo);最后,基于專家經(jīng)驗和指標(biāo)信息,設(shè)計主客觀賦權(quán)方法,對短臨降水預(yù)報可靠性指標(biāo)進行主客觀賦權(quán)融合。構(gòu)建短臨降水預(yù)報可靠性綜合評估模型,實現(xiàn)短臨降水預(yù)報過程和結(jié)果可靠性的綜合評估。

3.3 短臨降水預(yù)報可靠性關(guān)聯(lián)推理

長期以來,可靠性研究范式是根據(jù)輸入及相關(guān)約束條件,利用已經(jīng)建立的物理模型或者函數(shù)關(guān)系,得到期望的輸出結(jié)果(肖立志,2022)。這忽略了可靠性影響因素關(guān)聯(lián)關(guān)系不清的問題。因此,本研究分析短臨降水預(yù)報可靠性影響因素,包括空間數(shù)據(jù)、模型參數(shù)、訓(xùn)練樣本、計算平臺、任務(wù)需求等因素,基于相關(guān)分析和專家經(jīng)驗,對可靠性傳播過程中的關(guān)鍵影響因子進行識別;基于故障樹分析理論,分析影響因素可靠性與預(yù)測結(jié)果可靠性之間的邏輯關(guān)系,建立短臨降水預(yù)報可靠性推理模型,通過邏輯運算方法、因素可靠性計算方法和采樣技術(shù),定量計算可靠性傳播過程;分析可靠性傳播過程中的分異性、關(guān)聯(lián)性與不確定性,探究可靠性影響因素之間的相互作用關(guān)系,計算可靠性影響因素的重要度,揭示短臨降水預(yù)報過程中的可靠性傳播規(guī)律。

4 短臨降水預(yù)報可靠性分析方法體系

本文提出的短臨降水預(yù)報可靠性分析總體技術(shù)路線,如圖2 所示。首先,基于多源氣象空間數(shù)據(jù)和人工智能預(yù)測方法,分析可靠性傳播中的影響因素和不確定性。其次,研究短臨降水預(yù)報可靠性過程建模方法,對空間數(shù)據(jù)和模型參數(shù)中的隨機和認(rèn)知不確定性進行表征建模,提出概率–非概率時變不確定性表征方法。根據(jù)短臨降水形成特征,提出深度智能網(wǎng)絡(luò),對短臨降水時空特征進行建模,根據(jù)短臨降水預(yù)測模型,對空間數(shù)據(jù)和模型參數(shù)的不確定性進行前向傳播,開展短臨降水集合概率預(yù)測。再次,研究短臨降水預(yù)報可靠性綜合評估方法,提出空間數(shù)據(jù)可靠性、模型參數(shù)可靠性和預(yù)測結(jié)果可靠性評估指標(biāo)。對不同因素的可靠性指標(biāo)進行組合賦權(quán)融合,計算短臨降水預(yù)報整體可靠性,構(gòu)建短臨降水預(yù)報可靠性綜合評估模型。最后,研究短臨降水預(yù)報可靠性關(guān)聯(lián)推理模型,對短臨降水預(yù)報可靠性影響因素進行識別和分析。構(gòu)建不同影響因素之間的邏輯關(guān)聯(lián)關(guān)系,提出預(yù)測可靠性關(guān)聯(lián)推理模型。分析可靠性傳播的分異性、關(guān)聯(lián)性、不確定性及影響因素重要度,揭示可靠性傳播規(guī)律。

圖2 短臨降水預(yù)報可靠性分析總體技術(shù)路線Fig.2 Overall technical route for reliability analysis of precipitation nowcasting

4.1 短臨降水預(yù)報可靠性過程建模

短臨降水預(yù)報可靠性過程建模方法技術(shù)路線,如圖3 所示。首先對空間數(shù)據(jù)和模型參數(shù)的隨機和認(rèn)知不確定性進行聯(lián)合表征,獲得時變概率邊界。進一步針對短臨降水影響因素和形成特征,建立物理過程指導(dǎo)的深度神經(jīng)網(wǎng)絡(luò)方法,對未來6 h 降水的發(fā)生發(fā)展和運動過程進行建模。在模型訓(xùn)練的過程中,將數(shù)據(jù)和參數(shù)的不確定性融入訓(xùn)練過程,得到短臨降水時變概率預(yù)測結(jié)果。

圖3 短臨降水預(yù)報可靠性過程建模方法技術(shù)路線Fig.3 Technical route for process modeling methods in the reliability analysis of precipitation nowcasting

1)隨機和認(rèn)知不確定性時變表征方法

研究概率–非概率聯(lián)合時變不確定性建模方法,對空間數(shù)據(jù)與模型參數(shù)的隨機和認(rèn)知不確定性進行聯(lián)合表征。隨機不確定性因素,如多源空間數(shù)據(jù)的隨機測量誤差或模型參數(shù)的隨機擾動,通過擬合合適的概率密度分布來表示不確定性分布。對于認(rèn)知不確定性,如數(shù)據(jù)不完整、信息模糊、知識缺乏、模型結(jié)構(gòu)不完善和參數(shù)經(jīng)驗不足等,通過定義認(rèn)知不確定性的區(qū)間或上下概率邊界,即概率盒的形式來表征認(rèn)知不確定性。概率方法可以作為概率邊界方法的特例,即上下概率邊界相同,進而對隨機和認(rèn)知不確定性開展概率–非概率聯(lián)合不確定性表征??紤]不確定性在時間上的分異性,開展空間數(shù)據(jù)和模型參數(shù)不確定性時變建模研究,即在每個時刻對數(shù)據(jù)或參數(shù)構(gòu)建概率盒,獲得時變概率邊界。在對每個時刻進行不確定性表征時,通過元數(shù)據(jù)、專家經(jīng)驗、地面站點和多源數(shù)據(jù)四重組合等先驗信息對空間數(shù)據(jù)不確定性進行時變表征,通過增量學(xué)習(xí)、模型微調(diào)、隨機正則化等方法對模型參數(shù)進行時變表征。

2)基于深度學(xué)習(xí)的短臨降水概率預(yù)測

首先,根據(jù)影響短臨降水發(fā)生發(fā)展的中尺度天氣系統(tǒng),如槽、氣旋、鋒面、切變線、低渦和急流等模式,以及大氣運動方程,包括運動方程、連續(xù)方程、水汽方程、狀態(tài)方程和熱力學(xué)方程,研究短臨降水影響因素和形成特征,深入分析不同天氣系統(tǒng)的形成機制和動力學(xué)過程;然后,結(jié)合現(xiàn)有深度學(xué)習(xí)框架和技術(shù),包括卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、轉(zhuǎn)換器(transformer)、殘差網(wǎng)絡(luò)和生成對抗網(wǎng)絡(luò),將短臨降水物理過程及其特征映射到深度網(wǎng)絡(luò)結(jié)構(gòu)中,使得網(wǎng)絡(luò)結(jié)構(gòu)更符合短臨降水形成的時空傳播和響應(yīng)機制;最后,對短臨降水形成及發(fā)展的時空特征進行建模,包括多因素三維空間耦合、短臨降水過程時間記憶、多因素時空全局關(guān)聯(lián)、預(yù)測過程殘差以及混沌過程,建立物理過程指導(dǎo)的深度神經(jīng)網(wǎng)絡(luò)方法,設(shè)計用于捕捉短臨降水信號的結(jié)構(gòu)單元。對短臨降水未來6 h 的發(fā)生發(fā)展和運動過程進行建模,提升短臨降水智能預(yù)測模型結(jié)構(gòu)的合理性。

3)短臨降水預(yù)報不確定性傳播方法

基于空間數(shù)據(jù)和模型參數(shù)時變表征方法,在模型訓(xùn)練的過程中,將數(shù)據(jù)和參數(shù)的不確定性融入訓(xùn)練過程,隨著網(wǎng)絡(luò)結(jié)構(gòu)逐層前向傳播。在傳播過程中,通過雙層蒙特卡羅方法對數(shù)據(jù)和參數(shù)的時變不確定性進行采樣,在外層采樣中,對時變概率盒的分布參數(shù)進行采樣,得到一系列采樣點的集合,在內(nèi)層抽樣中,對模型和參數(shù)的概率密度分布進行采樣,獲得函數(shù)響應(yīng)值。在預(yù)測的每個時刻,均通過雙層采樣對數(shù)據(jù)和模型參數(shù)不確定性進行傳播。通過模型的逐層傳播,將輸入數(shù)據(jù)和參數(shù)的時變不確定性傳播到輸出層。根據(jù)短臨降水智能預(yù)報模型,輸出層為0~6 h 的降水量空間預(yù)測值集合,代表降水量預(yù)測的概率分布,即短臨降水概率預(yù)測結(jié)果,通過蒙特卡羅采樣可以獲得降水量預(yù)測的均值和方差。

4.2 短臨降水預(yù)報可靠性綜合評估

短臨降水預(yù)報可靠性綜合評估方法技術(shù)路線,如圖4 所示。首先研究空間數(shù)據(jù)、模型參數(shù)和預(yù)測結(jié)果可靠性指標(biāo)設(shè)計和計算方法,進而根據(jù)專家經(jīng)驗、指標(biāo)關(guān)聯(lián)性和可靠性融合方法對短臨降水預(yù)報可靠性進行綜合評估,建立短臨降水預(yù)報可靠性綜合評估指標(biāo)體系。

圖4 短臨降水預(yù)報可靠性綜合評估方法技術(shù)路線Fig.4 Technical route for comprehensive evaluation methods in the reliability analysis of precipitation nowcasting

可靠性評估的內(nèi)容是針對具體研究對象,構(gòu)建相應(yīng)的可靠性評估指標(biāo),計算整體可靠性。在可靠性評估過程中,需要考慮空間數(shù)據(jù)和模型參數(shù)的不可靠性及可靠性評估的整體性(Lin 等,2018)。設(shè)計綜合評估體系的關(guān)鍵在于評估指標(biāo)的選取和權(quán)重設(shè)計。評價指標(biāo)的權(quán)重體現(xiàn)了各個評價指標(biāo)的相對重要程度,會直接影響整個評估的可信度(任紀(jì)安等,2019)。

1)空間數(shù)據(jù)可靠性評估指標(biāo)及計算方法

降水?dāng)?shù)據(jù)的可靠性研究應(yīng)從以下五個方面考慮。

(1)完整性,空間數(shù)據(jù)的位置和屬性信息與實際情況相比較,是否存在和缺失。

(2)準(zhǔn)確性,空間數(shù)據(jù)的位置和屬性信息與實際情況相比較的準(zhǔn)確程度。

(3)一致性,空間數(shù)據(jù)在空間上的分布、時間趨勢和季節(jié)變化上的一致程度。

(4)現(xiàn)勢性,空間數(shù)據(jù)生成時間與實際情況觀測時刻的差別程度。

(5)穩(wěn)健性,空間數(shù)據(jù)由不同傳感器進行觀測時的抗干擾能力。

2)模型參數(shù)可靠性評估指標(biāo)及計算方法

對于降水預(yù)報模型,計算目標(biāo)函數(shù)、訓(xùn)練數(shù)據(jù)、對抗樣本、平臺依賴和算法性能對模型參數(shù)可靠性的影響。

(1)在目標(biāo)函數(shù)中,分析收斂能力和擬合程度對模型可靠性的影響。若模型在這些數(shù)據(jù)集上的擬合程度都達到較高的水平,則擬合能力較強。

(2)在訓(xùn)練數(shù)據(jù)中,分析數(shù)據(jù)均衡和數(shù)據(jù)規(guī)模對模型參數(shù)可靠性的影響。

(3)在對抗樣本中,分析以黑盒和白盒方式生成的樣本對模型可靠性的影響。在黑盒方式中,目標(biāo)模型未知,通過代理模型按照白盒方式生成樣本。在白盒方式中,目標(biāo)模型已知,按照梯度下降方法生成樣本。

(4)在平臺依賴中,分析不同學(xué)習(xí)框架和操作系統(tǒng)對模型可靠性的影響。在學(xué)習(xí)框架中,分析不同框架在利用模型開展預(yù)測時的差異程度。對于操作系統(tǒng),分析預(yù)測模型在不同操作系統(tǒng)上的差異程度。

(5)在算法性能方面,分析模型在響應(yīng)時間和完成任務(wù)指標(biāo)方面的能力。

3)預(yù)測結(jié)果可靠性評估指標(biāo)及計算方法

計算預(yù)測結(jié)果的完整性、準(zhǔn)確性、一致性、 現(xiàn)勢性和穩(wěn)健性指標(biāo)。

(1)完整性,預(yù)測結(jié)果與現(xiàn)實世界待預(yù)測時段在空間和時間的符合及缺失程度。

(2)準(zhǔn)確性,預(yù)測結(jié)果和現(xiàn)實世界真實觀測的差別程度。除了絕對預(yù)測誤差之外,進一步計算短臨降水事件預(yù)測的成功率、漏報率、誤報率及綜合預(yù)報得分。

(3)一致性,預(yù)測結(jié)果和現(xiàn)實世界真實觀測在空間分布與時間趨勢上的一致性程度。

(4)現(xiàn)勢性,預(yù)測結(jié)果是否能滿足空間上每個時刻實時預(yù)測的需求。

(5)穩(wěn)健性,預(yù)測結(jié)果對于樣本分布和樣本規(guī)模等因素的依賴程度。

利用以上指標(biāo),根據(jù)氣象專家經(jīng)驗和指標(biāo)本身關(guān)聯(lián)信息,分別計算主觀和客觀權(quán)重,進而權(quán)衡主客觀權(quán)重進行組合賦權(quán),對可靠性指標(biāo)進行加權(quán)融合,最終計算短臨降水預(yù)報整體可靠性指數(shù)。在主觀權(quán)重確定方面,通過多個氣象專家在短臨降水預(yù)測方面的經(jīng)驗與領(lǐng)域規(guī)范要求,綜合確定不同可靠性指標(biāo)的重要性;對于客觀權(quán)重,通過信息熵方法構(gòu)建權(quán)重。通過主客觀評價方法的融合,可以分別對數(shù)據(jù)、模型和預(yù)測結(jié)果進行可靠性評估,同時基于數(shù)據(jù)與模型可靠性計算過程可靠性。

4.3 短臨降水預(yù)報可靠性關(guān)聯(lián)推理

短臨降水預(yù)報可靠性關(guān)聯(lián)推理模型技術(shù)路線,如圖5 所示?;诳煽啃栽u估結(jié)果,分析短臨降水預(yù)報的可靠性影響因素,建立短臨降水預(yù)報可靠性推理模型,對預(yù)測過程的可靠性影響因素進行關(guān)聯(lián)推理,分析可靠性傳播規(guī)律。

圖5 短臨降水預(yù)報可靠性關(guān)聯(lián)推理模型技術(shù)路線Fig.5 Technical route for relational inference model in the reliability analysis of precipitation nowcasting

1)短臨降水預(yù)報可靠性影響因素識別

分析影響短臨降水預(yù)報可靠性的關(guān)鍵因素,包括空間數(shù)據(jù)、模型參數(shù)、訓(xùn)練過程、計算平臺和評價方法中的因素與指標(biāo)。

(1)針對空間數(shù)據(jù),選擇完整性、準(zhǔn)確性、一致性、現(xiàn)勢性和穩(wěn)健性指標(biāo)因素。

(2)針對模型參數(shù),選擇模型結(jié)構(gòu)合理性、參數(shù)賦值準(zhǔn)確性、對抗樣本生成方式和目標(biāo)函數(shù)指標(biāo)因素。

(3)針對訓(xùn)練過程,選擇參數(shù)優(yōu)化算法、迭代終止準(zhǔn)則、訓(xùn)練數(shù)據(jù)規(guī)模和訓(xùn)練數(shù)據(jù)均衡性因素。

(4)對于計算平臺,包括系統(tǒng)穩(wěn)健性和計算框架因素。

(5)對于評價方法,包括加權(quán)方式和指標(biāo)設(shè)置因素。

研究可靠性影響因素計算方法,對眾多影響因素進行可靠性計算。例如,模型結(jié)構(gòu)合理性是在其他參數(shù)不變的情況下,模型結(jié)構(gòu)的變化在訓(xùn)練和驗證數(shù)據(jù)集上能達到的最優(yōu)精度。參數(shù)賦值準(zhǔn)確性是參數(shù)不可靠性情況下的預(yù)測精度和最優(yōu)參數(shù)情況下的預(yù)測精度差別。類似地,對所有可靠性影響因素進行可靠性計算。

2)短臨降水預(yù)報可靠性過程推理模型

基于故障樹方法對影響可靠性的因子進行可靠性關(guān)聯(lián)建模,建立可靠性推理模型。將可靠性研究目標(biāo)和不同因素劃分為頂事件、中間事件與底事件,構(gòu)建底事件之間、底事件與中間事件、中間事件之間,以及中間事件和頂事件的邏輯關(guān)系,包括與、或、非、順序、加權(quán)等關(guān)系。在可靠性計算中,考慮影響因素可靠性的不確定性,對可靠性進行時變概率表征,即在不同時刻構(gòu)建影響因素可靠性的區(qū)間分布,而不是固定的數(shù)值。通過蒙特卡羅采樣對可靠性傳播過程進行計算,根據(jù)可靠性推理模型最終推理出預(yù)測結(jié)果可靠性。考慮可靠性傳播在空間和時間上的分異性,計算可靠性傳播過程??紤]可靠性傳播在時間上的記憶性,利用馬爾可夫鏈構(gòu)建可靠性影響因素在不同預(yù)測時長(0~6 h)的狀態(tài)轉(zhuǎn)移概率。

3)短臨降水預(yù)報可靠性傳播規(guī)律分析

根據(jù)可靠性推理模型,挖掘短臨降水預(yù)報可靠性傳播規(guī)律,包括可靠性影響因素關(guān)聯(lián)性、可靠性傳播空間分異、可靠性傳播時間分異、可靠性傳播不確定性、影響因素重要度和可靠性傳播時間記憶。其中,影響因素關(guān)聯(lián)性是不同影響因素在可靠性傳播過程中的關(guān)聯(lián)性,包括邏輯關(guān)系和可靠性轉(zhuǎn)移程度;可靠性傳播空間分異是可靠性傳播過程在空間上的分異程度,如可靠性傳播空間異質(zhì)性、空間相關(guān)性、空間一致性等;可靠性傳播時間分異是可靠性傳播在不同時間上的分布規(guī)律,包括趨勢性、季節(jié)性、平穩(wěn)性、隨機性等特征;可靠性傳播不確定性包括隨機因素的影響、采樣方法合理性、影響因素完整性和準(zhǔn)確性等因素;影響因素重要度是影響因素在不可靠的情況下對預(yù)測結(jié)果的概率分布的影響,影響程度越大則重要度越大;可靠性傳播時間記憶是影響因素的可靠性隨著預(yù)測時長(0~6 h)的變化如何轉(zhuǎn)移。

本文提出了短臨降水預(yù)報可靠性分析的技術(shù)體系,而技術(shù)體系的有效性則需要后續(xù)進一步的實驗驗證。例如,可以通過建立對照實驗來驗證提出的可靠性過程建模體系的有效性。實驗組基于概率–非概率聯(lián)合時變不確定性進行建模,對空間數(shù)據(jù)和模型參數(shù)的隨機和認(rèn)知不確定性進行聯(lián)合表征,而后開展預(yù)測實驗得到預(yù)測結(jié)果。對照組與實驗組使用同一數(shù)據(jù)集、同一預(yù)測方法,不考慮預(yù)測過程的不確定性或者只對其中一種不確定性進行建模,通過比較實驗組和對照組的預(yù)測結(jié)果與實際觀測數(shù)據(jù)的擬合效果,評估可靠性過程建模的有效性。同樣地,可以對可靠性綜合評估思路和可靠性關(guān)聯(lián)推理進行驗證。在可靠性評估驗證中,運用本文提出的可靠性評估指標(biāo)和加權(quán)方法,和傳統(tǒng)可靠性評估方法進行對比,分析本文提出的評估體系的有效性。在可靠性關(guān)聯(lián)推理方面,運用本文提出的可靠性影響因素和推理模型,和傳統(tǒng)可靠性推理方法進行對比,定性和定量比較二者在因素推理方面的能力。

5 結(jié)束語

目前,人工智能技術(shù)在短臨降水預(yù)報方面得到了廣泛的應(yīng)用,如LSTM、RNN、CNN、Transformer方法等。主流的短臨降水預(yù)報方法,從傳統(tǒng)的數(shù)值天氣預(yù)報、光流法到人工智能和物理模型耦合的天氣預(yù)報,預(yù)報方法復(fù)雜多樣,然而預(yù)報的可靠性尚未進行全面有效的分析、評估和控制,亟需進一步的研究。

現(xiàn)有的短臨降水預(yù)報可靠性分析研究存在單一性、片面性和不完整性等問題,僅集中于分析某個影響因素(如模型結(jié)構(gòu)和參數(shù)優(yōu)化方法)對預(yù)測結(jié)果的影響,忽略了可靠性分析的整體性。本文提出短臨降水預(yù)報可靠性過程建模方法、短臨降水預(yù)報可靠性多方位多指標(biāo)綜合評估方法與短臨降水預(yù)報可靠性全生命周期過程推理模型,充分考慮了數(shù)據(jù)和模型的不確定性,提出了預(yù)測過程可靠性綜合評估和定量推理的基本思路。

觀測大數(shù)據(jù)、高性能計算技術(shù)的發(fā)展為可靠性分析提供了良好的數(shù)據(jù)基礎(chǔ)和堅實的計算支撐,氣象理論的不斷完善和人工智能的飛速發(fā)展使得人工智能與物理模型的耦合能創(chuàng)造更多可能,可靠性分析有望為數(shù)據(jù)驅(qū)動的短臨降水預(yù)報提供更可靠的信息和知識,為預(yù)報精度和模型健壯性的提升提供理論指導(dǎo)。針對本文提出的短臨降水預(yù)報可靠性分析總體思路,在后續(xù)研究中進行實驗驗證并加以完善,推動短臨降水預(yù)報的研究進展。

猜你喜歡
空間數(shù)據(jù)不確定性降水
法律的兩種不確定性
黑龍江省玉米生長季自然降水與有效降水對比分析
英鎊或繼續(xù)面臨不確定性風(fēng)險
為什么南極降水很少卻有很厚的冰層?
具有不可測動態(tài)不確定性非線性系統(tǒng)的控制
降水現(xiàn)象儀模擬軟件設(shè)計與實現(xiàn)
元數(shù)據(jù)驅(qū)動的多中心空間數(shù)據(jù)同步方法研究
ESSENTIAL NORMS OF PRODUCTS OF WEIGHTED COMPOSITION OPERATORS AND DIFFERENTIATION OPERATORS BETWEEN BANACH SPACES OF ANALYTIC FUNCTIONS?
基于文件系統(tǒng)的分布式海量空間數(shù)據(jù)高效存儲與組織研究
客戶端空間數(shù)據(jù)緩存策略