周康輝 鄭永光 韓 雷 董萬(wàn)勝
1 國(guó)家氣象中心,北京 100081 2 中國(guó)海洋大學(xué)信息科學(xué)與工程學(xué)院,青島 266100 3 中國(guó)氣象科學(xué)研究院,北京 100081
提 要: 近年來,機(jī)器學(xué)習(xí)理論和方法應(yīng)用蓬勃發(fā)展,已在強(qiáng)對(duì)流天氣監(jiān)測(cè)和預(yù)報(bào)中廣泛應(yīng)用。各類機(jī)器學(xué)習(xí)算法,包括傳統(tǒng)機(jī)器學(xué)習(xí)算法(如隨機(jī)森林、決策樹、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)等)和深度學(xué)習(xí)方法,已在強(qiáng)對(duì)流監(jiān)測(cè)、短時(shí)臨近預(yù)報(bào)、短期預(yù)報(bào)領(lǐng)域發(fā)揮了積極的重要作用,其應(yīng)用效果往往明顯優(yōu)于依靠統(tǒng)計(jì)特征或者主觀經(jīng)驗(yàn)積累的傳統(tǒng)方法。機(jī)器學(xué)習(xí)方法能夠更有效提取高時(shí)空分辨率的中小尺度觀測(cè)數(shù)據(jù)的強(qiáng)對(duì)流特征,為強(qiáng)對(duì)流監(jiān)測(cè)提供更全面、更強(qiáng)大的自動(dòng)識(shí)別和追蹤能力;能夠有效綜合應(yīng)用多源觀測(cè)數(shù)據(jù)、分析數(shù)據(jù)和數(shù)值預(yù)報(bào)模式數(shù)據(jù),為強(qiáng)對(duì)流臨近預(yù)報(bào)預(yù)警提取更多有效信息;能夠有效對(duì)數(shù)值模式預(yù)報(bào)進(jìn)行釋用和后處理,提升全球數(shù)值模式、高分辨率區(qū)域數(shù)值模式在強(qiáng)對(duì)流天氣預(yù)報(bào)上的應(yīng)用效果。最后,給出了目前機(jī)器學(xué)習(xí)方法應(yīng)用中存在的問題和未來工作展望。
人工智能的迅速發(fā)展將深刻改變?nèi)祟惿鐣?huì)生活,改變世界。機(jī)器學(xué)習(xí)屬于人工智能范疇,是人工智能領(lǐng)域的一個(gè)重要分支,主要研究對(duì)象是如何在經(jīng)驗(yàn)學(xué)習(xí)中改善具體算法的性能。自1956年達(dá)特茅斯會(huì)議上,機(jī)器學(xué)習(xí)(machine learning)的概念被首次提出以來,成為數(shù)學(xué)、計(jì)算機(jī)科學(xué)、神經(jīng)科學(xué)等多學(xué)科的活躍研究方向(萬(wàn)赟,2016),其算法也被廣泛應(yīng)用到大氣、海洋等眾多學(xué)科領(lǐng)域。傳統(tǒng)機(jī)器學(xué)習(xí)算法主要包括邏輯回歸、決策樹、隨機(jī)森林、人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、貝葉斯分類器、聚類算法等。雖然其發(fā)展歷程跌宕起伏,經(jīng)歷了多個(gè)發(fā)展高潮與低谷,但是在不同的發(fā)展時(shí)期,機(jī)器學(xué)習(xí)均展示了旺盛的生命力,在各個(gè)發(fā)展領(lǐng)域得到廣泛的應(yīng)用。
Hinton and Salakhutdinov(2006)提出“深度學(xué)習(xí)(deep learning)”的概念,證明了深層神經(jīng)網(wǎng)絡(luò)的可訓(xùn)練性,展現(xiàn)了深層神經(jīng)網(wǎng)絡(luò)更強(qiáng)大的特征提取和非線性擬合能力,奠定了此次人工智能發(fā)展浪潮的基礎(chǔ)。但該論文主要以理論分析為主,當(dāng)時(shí)并未有重要的應(yīng)用產(chǎn)生,因此在計(jì)算機(jī)學(xué)界并未立刻產(chǎn)生重大影響。在接下來的十年中,直到兩個(gè)標(biāo)志性事件的出現(xiàn),才使得深度學(xué)習(xí)分別取得了計(jì)算機(jī)領(lǐng)域內(nèi)和全世界范圍內(nèi)的認(rèn)可。第一個(gè)事件是2012年Alex Krizhevsky與Geoffrey Hinton在國(guó)際上著名的ILSVRC(ImageNet Large Scale Visual Recognition Challenge)圖像識(shí)別競(jìng)賽中,用深度學(xué)習(xí)方法(即AlexNet)以絕對(duì)優(yōu)勢(shì)取得第一名。2013年起幾乎所有參加該競(jìng)賽的隊(duì)伍全部采用深度學(xué)習(xí)方法。在ILSVRC這種世界級(jí)的競(jìng)賽中,一種方法幾乎能夠在一夜之間完全勝出,這在以前是無法想象的。另一事件是2016年基于深度學(xué)習(xí)的圍棋程序AlphaGo戰(zhàn)勝世界冠軍李世石,這不僅引起了全世界范圍內(nèi)對(duì)人工智能技術(shù)巨大進(jìn)步和未來發(fā)展?jié)撃艿年P(guān)注,也引發(fā)了世界范圍內(nèi)對(duì)人工智能產(chǎn)業(yè)的投資潮。目前,深度學(xué)習(xí)及其他人工智能技術(shù)仍在以前所未有的速度發(fā)展著。
根據(jù)訓(xùn)練數(shù)據(jù)是否有標(biāo)記信息,機(jī)器學(xué)習(xí)任務(wù)可分為監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。常見的無監(jiān)督學(xué)習(xí)算法如聚類算法、主成分分析等算法。監(jiān)督學(xué)習(xí)又可分為回歸和分類?;貧w問題預(yù)測(cè)連續(xù)值,如氣溫、降水量;分類問題則預(yù)測(cè)的是離散值,如晴或雨。目前,機(jī)器學(xué)習(xí),尤其是深度學(xué)習(xí),在分類問題上取得了巨大的成功,如圖片分類競(jìng)賽中其效果超越人類(Russakovsky et al,2015),在回歸問題中效果次之。無監(jiān)督學(xué)習(xí)仍亟待更進(jìn)一步突破(LeCun et al,2015)。
機(jī)器學(xué)習(xí)算法,特別是深度學(xué)習(xí),需要大量的歷史數(shù)據(jù)進(jìn)行建模并訓(xùn)練,從而從歷史數(shù)據(jù)中學(xué)習(xí)到規(guī)律。天氣預(yù)報(bào),經(jīng)過長(zhǎng)時(shí)間的發(fā)展,積累了海量歷史觀測(cè)數(shù)據(jù)、數(shù)值預(yù)報(bào)模式數(shù)據(jù),具備“大數(shù)據(jù)”屬性,能夠?yàn)闄C(jī)器學(xué)習(xí)提供訓(xùn)練所需的大量數(shù)據(jù),因此,一直以來,機(jī)器學(xué)習(xí)在天氣預(yù)報(bào)領(lǐng)域有眾多成功應(yīng)用(Karpatne et al,2019)。
強(qiáng)對(duì)流天氣預(yù)報(bào)主要關(guān)注時(shí)空尺度較小、發(fā)展劇烈的天氣現(xiàn)象,如冰雹、雷暴大風(fēng)、短時(shí)強(qiáng)降水、龍卷等惡劣天氣。由于局地性強(qiáng)、發(fā)展迅速,強(qiáng)對(duì)流天氣具有極高的預(yù)報(bào)難度(鄭永光等,2015)。由于其強(qiáng)度強(qiáng),易于造成嚴(yán)重的人員和財(cái)產(chǎn)損失(王秀榮等,2007),比如2015年“東方之星”翻沉事件(鄭永光等,2016a)和2016年江蘇阜寧EF4級(jí)龍卷事件(鄭永光等,2016b)。
由于強(qiáng)對(duì)流天氣系統(tǒng)的中小尺度特性,因此強(qiáng)對(duì)流天氣預(yù)報(bào)特別關(guān)注監(jiān)測(cè)和臨近預(yù)報(bào)。對(duì)于天氣雷達(dá)、氣象衛(wèi)星、閃電探測(cè)儀、自動(dòng)氣象站等具備高時(shí)空分辨率的數(shù)據(jù)使用,提出很高的要求。然而,海量的觀測(cè)數(shù)據(jù),已經(jīng)很難完全由預(yù)報(bào)員主觀監(jiān)測(cè)識(shí)別。傳統(tǒng)的客觀做法,根據(jù)物理機(jī)理、預(yù)報(bào)員經(jīng)驗(yàn)和統(tǒng)計(jì)結(jié)果,通過對(duì)觀測(cè)數(shù)據(jù)設(shè)置一定閾值,對(duì)強(qiáng)對(duì)流天氣進(jìn)行識(shí)別和監(jiān)測(cè),通常會(huì)造成虛警率偏高(Schultz et al,2009;Harris et al,2010)。目前,強(qiáng)對(duì)流天氣臨近預(yù)報(bào)極大地依賴實(shí)況監(jiān)測(cè),以雷達(dá)或者衛(wèi)星觀測(cè)結(jié)果進(jìn)行線性或非線性外推預(yù)報(bào)為主,尤其缺乏對(duì)流生消演變的預(yù)報(bào)能力,因此應(yīng)用效果具有較大的局限性(俞小鼎等,2012;鄭永光等,2015)。
與強(qiáng)對(duì)流監(jiān)測(cè)和臨近預(yù)報(bào)不同的是,強(qiáng)對(duì)流短時(shí)(2~12 h預(yù)報(bào))和短期預(yù)報(bào)(12~72 h預(yù)報(bào))更側(cè)重于對(duì)數(shù)值預(yù)報(bào)模式的釋用。近年來,隨著高分辨率數(shù)值預(yù)報(bào)模式的發(fā)展,強(qiáng)對(duì)流天氣預(yù)報(bào)更多地依賴高分辨率數(shù)值模式預(yù)報(bào)。隨著時(shí)空分辨率越來越高,高分辨率數(shù)值模式預(yù)報(bào)信息量越來越大,對(duì)預(yù)報(bào)員的信息提取能力提出極高的要求。目前,很多強(qiáng)對(duì)流天氣(如雷暴大風(fēng)、龍卷等)并沒有直接的模式輸出產(chǎn)品。經(jīng)驗(yàn)豐富的預(yù)報(bào)員需要從大量數(shù)據(jù)中,提取動(dòng)力、水汽、能量、地形影響等強(qiáng)對(duì)流天氣形成條件,最終形成一份可用的強(qiáng)對(duì)流預(yù)報(bào)。
由此可見,強(qiáng)對(duì)流監(jiān)測(cè)預(yù)報(bào),目前仍大量依靠傳統(tǒng)的統(tǒng)計(jì)結(jié)果和預(yù)報(bào)員經(jīng)驗(yàn)。長(zhǎng)期的應(yīng)用結(jié)果表明,以上方法具有較大的局限性。首先,不同季節(jié)、不同地勢(shì)分布、不同氣候背景區(qū)域之間,強(qiáng)對(duì)流天氣發(fā)生發(fā)展條件與特征閾值范圍必然會(huì)存在差異,難以使用一套統(tǒng)一的特征物理量閾值組合來實(shí)現(xiàn)不同區(qū)域的分類強(qiáng)對(duì)流天氣的預(yù)報(bào)(王婷波等,2020);其次,天氣預(yù)報(bào)過程中需要使用大量數(shù)據(jù),依靠預(yù)報(bào)員統(tǒng)計(jì)或者主觀提取特征物理量和閾值范圍,難以完全發(fā)現(xiàn)數(shù)據(jù)中有價(jià)值的細(xì)節(jié)信息或者細(xì)微差別,特別是一些中小尺度信息;再次,強(qiáng)對(duì)流天氣復(fù)雜多變,如果預(yù)報(bào)員對(duì)于強(qiáng)對(duì)流發(fā)生發(fā)展規(guī)律認(rèn)識(shí)不夠深刻、全面,也會(huì)忽視其中的有效信息。傳統(tǒng)基于物理機(jī)理的統(tǒng)計(jì)模型等客觀方法,由于基于主觀認(rèn)識(shí)建立,也難以避免地存在上述問題。
近年來,以深度學(xué)習(xí)為代表的機(jī)器學(xué)習(xí)算法的興起,有效結(jié)合各類氣象大數(shù)據(jù),已經(jīng)成為強(qiáng)對(duì)流天氣預(yù)報(bào)的有效手段(McGovern et al,2017;Reichstein et al,2019)。與淺層神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等傳統(tǒng)機(jī)器學(xué)習(xí)算法相比,深度神經(jīng)網(wǎng)絡(luò)不僅能夠?yàn)閺?fù)雜非線性系統(tǒng)提供建模,更能夠?yàn)槟P吞峁└叩某橄髮哟?,從而提高模型的特征提取能力;其?yōu)勢(shì)在于能以更加緊湊簡(jiǎn)潔的方式來表達(dá)比淺層網(wǎng)絡(luò)大得多的函數(shù)集合,并在圖像識(shí)別、語(yǔ)音處理等領(lǐng)域相比傳統(tǒng)方法的性能有了顯著提升(Krizhevsky et al,2012;LeCun and Bengio,1995;Szegedy et al,2013)。
本文梳理了機(jī)器學(xué)習(xí)在強(qiáng)對(duì)流天氣監(jiān)測(cè)、短時(shí)臨近預(yù)報(bào)、短期預(yù)報(bào)等領(lǐng)域的應(yīng)用和存在的問題,并給出了未來工作展望,以期更清晰地了解機(jī)器學(xué)習(xí)在強(qiáng)對(duì)流天氣領(lǐng)域的應(yīng)用情況,為更好地結(jié)合物理機(jī)理、數(shù)值預(yù)報(bào)等來發(fā)展強(qiáng)對(duì)流天氣領(lǐng)域的機(jī)器學(xué)習(xí)技術(shù)提供參考。
強(qiáng)對(duì)流天氣監(jiān)測(cè)依賴于氣象衛(wèi)星、天氣雷達(dá)、閃電定位儀、自動(dòng)氣象站等具備高時(shí)空分辨率的中小尺度監(jiān)測(cè)網(wǎng), 是強(qiáng)對(duì)流預(yù)警預(yù)報(bào)的基礎(chǔ)。
靜止氣象衛(wèi)星觀測(cè)具有覆蓋范圍廣、時(shí)空分辨率高的特點(diǎn),是監(jiān)測(cè)強(qiáng)對(duì)流天氣的重要手段。目前,國(guó)內(nèi)外利用衛(wèi)星遙感技術(shù),進(jìn)行強(qiáng)對(duì)流云團(tuán)識(shí)別的研究已經(jīng)取得了一定的成果。
白慧卿等(1998)通過人工神經(jīng)網(wǎng)絡(luò)方法進(jìn)行了地球靜止氣象衛(wèi)星(GMS)云圖中的4類云系[冷鋒、靜止鋒、雹暴云團(tuán)、強(qiáng)對(duì)流復(fù)合體(MCC)]識(shí)別,識(shí)別準(zhǔn)確率超過99%,優(yōu)于貝葉斯方法,認(rèn)為神經(jīng)網(wǎng)絡(luò)方法更適合于云系的特征識(shí)別。Tebbi and Haddad(2016)利用支持向量機(jī),輸入歐洲第二代靜止氣象衛(wèi)星(Meteosat Second Generation,MSG)自旋增強(qiáng)可見光和紅外成像儀(spinning enhanced visible and infrared imager,SEVIRI)的12個(gè)頻譜參數(shù),構(gòu)建不分晝夜的云分類模型,并對(duì)比了神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)的分類效果,最終發(fā)現(xiàn)支持向量機(jī)具有更好的效果,其對(duì)于層云和對(duì)流云的分類臨界成功指數(shù)(CSI)達(dá)到0.55,命中率(POD)達(dá)到0.74.
Kim et al(2017a)利用Himawari-8衛(wèi)星云圖,選取與對(duì)流云發(fā)展密切相關(guān)的相關(guān)因子(interest fields,IF),構(gòu)建了隨機(jī)森林、極端隨機(jī)樹(extremely randomized trees,ERT)、邏輯回歸等模型,有效地識(shí)別了對(duì)流系統(tǒng)的上沖云頂特征,相對(duì)于傳統(tǒng)的紅外云圖紋理識(shí)別、紅外與水汽通道亮溫差等算法,有了明顯的提高。胡凱等(2017)利用遷移學(xué)習(xí)中的多源加權(quán)Tradaboost算法(內(nèi)部采用極限學(xué)習(xí)機(jī)作為分類器)對(duì)環(huán)境與災(zāi)害監(jiān)測(cè)預(yù)報(bào)衛(wèi)星(HJ-1A/B)的數(shù)據(jù)進(jìn)行云的檢測(cè),利用人工(多源)標(biāo)注的大量厚云的樣本構(gòu)成多源輔助樣本集,利用少量標(biāo)注的薄云樣板構(gòu)成目標(biāo)樣本集。結(jié)果表明遷移學(xué)習(xí)可以充分利用容易獲得的大樣本厚云輔助樣本知識(shí),對(duì)同類型有關(guān)聯(lián)的小樣本薄云分類器進(jìn)行識(shí)別提高。
利用雷達(dá)進(jìn)行對(duì)流降水的分類,同樣是監(jiān)測(cè)對(duì)流發(fā)生發(fā)展的有效方式。王靜和程明虎(2007)利用BP神經(jīng)網(wǎng)絡(luò)模型對(duì)單站雷達(dá)進(jìn)行了三種降水類型(對(duì)流云降水、層狀云降水和混合云降水)的分類。Xu et al(2009)將臺(tái)風(fēng)外圍螺旋云系降水的分割識(shí)別化為機(jī)器學(xué)習(xí)的分類問題,利用支持向量機(jī),在雷達(dá)反射率圖像上,實(shí)現(xiàn)了云系降水區(qū)域類型的分割,為大風(fēng)和強(qiáng)降水區(qū)域的監(jiān)測(cè)提供了實(shí)時(shí)依據(jù),算法效果優(yōu)于最大熵、圖像邊沿檢測(cè)等傳統(tǒng)算法,具有更好的準(zhǔn)確性和魯棒性。Gagne II et al(2009)基于多普勒雷達(dá)資料,利用集成K-means和決策樹算法,實(shí)現(xiàn)對(duì)流風(fēng)暴識(shí)別和對(duì)流降水識(shí)別。K-means算法實(shí)現(xiàn)從線性對(duì)流系統(tǒng)中聚類分離出對(duì)流系統(tǒng)。決策樹則對(duì)對(duì)流風(fēng)暴進(jìn)行分類,將對(duì)流單體分為“孤立脈沖風(fēng)暴”“孤立強(qiáng)風(fēng)暴單體”“多單體風(fēng)暴”,將線性對(duì)流系統(tǒng)實(shí)現(xiàn)“前導(dǎo)層狀云”“尾隨層狀云”“平行層狀云”的分類。
綜合利用衛(wèi)星和雷達(dá)等多源數(shù)據(jù),可以綜合獲取云和降水分類信息??锴锩鞯?2017)提出了一種基于雷達(dá)、衛(wèi)星、地面觀測(cè)等多源數(shù)據(jù)的多視角學(xué)習(xí)晴雨分類方法,該方法應(yīng)用隨機(jī)森林方法分別對(duì)多視角進(jìn)行樣本學(xué)習(xí),得到晴雨分類模型。結(jié)果表明,與單獨(dú)使用衛(wèi)星、雷達(dá)、地面觀測(cè)站等單一數(shù)據(jù)源相比,該方法提高了1 km×1 km和6 min時(shí)空分辨率晴雨分類的準(zhǔn)確率,降低了漏報(bào)率和空?qǐng)?bào)率。
利用衛(wèi)星、雷達(dá)等遙感探測(cè)資料,進(jìn)行定量降水估計(jì),能夠有效提高降水觀測(cè)的時(shí)間和空間分辨率,同時(shí)對(duì)于無氣象觀測(cè)站點(diǎn)的區(qū)域,也是很好的補(bǔ)充。利用機(jī)器學(xué)習(xí),能夠有效擬合遙感探測(cè)數(shù)據(jù)與降水量的非線性關(guān)系,實(shí)現(xiàn)更精確和精細(xì)的降水估計(jì)結(jié)果。
基于MSG衛(wèi)星的成像儀SEVIRI探測(cè)的云頂頂高、云頂溫度、云相態(tài)和云水路徑等因子,Kühnlein et al(2014a;2014b)利用隨機(jī)森林、Meyer et al(2016) 利用4種機(jī)器學(xué)習(xí)算法(RF、神經(jīng)網(wǎng)絡(luò)、平均神經(jīng)網(wǎng)絡(luò)、SVM)進(jìn)行定量降水估計(jì)。他們首先區(qū)分降水區(qū)與非降水區(qū),然后實(shí)現(xiàn)對(duì)流降水與非對(duì)流降水區(qū)域劃分,最后對(duì)不同降水區(qū)域使用不同的降水反演因子,實(shí)現(xiàn)對(duì)中緯度地區(qū)全天候的定量降水估計(jì)。其中,各種降水區(qū)域的降水反演因子由機(jī)器學(xué)習(xí)通過衛(wèi)星云圖和雨量計(jì)觀測(cè)到的降水量擬合得到(Ouallouche et al,2018)。在此基礎(chǔ)上,Lazri and Ameur(2018)將算法進(jìn)行了升級(jí),將支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)和隨機(jī)森林等算法進(jìn)行了集成,同樣利用MSG-SEVIRI數(shù)據(jù)集,改進(jìn)了訓(xùn)練方式,將分類效果欠佳的樣本進(jìn)行了二次訓(xùn)練和預(yù)測(cè),從而達(dá)到了比單個(gè)分類器更好的訓(xùn)練效果,最終其分類準(zhǔn)確率可達(dá)到97.4%。
Meyer et al(2017)認(rèn)為,如果將衛(wèi)星云圖上降水反演點(diǎn)周圍的紋理特征等信息加入機(jī)器學(xué)習(xí)模型,將能有效地改進(jìn)定量降水估計(jì),因此構(gòu)建了基于MSG和GLCM(grey level co-occurance matrix)的神經(jīng)網(wǎng)絡(luò)模型,結(jié)果卻發(fā)現(xiàn),在增加了反演格點(diǎn)周圍紋理信息的情況下,可能由于神經(jīng)網(wǎng)絡(luò)模型無法有效提取空間紋理信息等原因,降水反演效果并沒有明顯改善。
利用雷達(dá)Z-R關(guān)系進(jìn)行定量降水估計(jì)仍然具有較大的改進(jìn)空間。邵月紅等(2009)利用多普勒雷達(dá)的回波強(qiáng)度資料及相應(yīng)的雨量計(jì)觀測(cè)資料,通過前向反饋(BP)神經(jīng)網(wǎng)絡(luò)方法來估測(cè)臨沂地區(qū)的降雨量,對(duì)比了Z-R關(guān)系估測(cè)的降雨量,表明BP神經(jīng)網(wǎng)絡(luò)估測(cè)精度要明顯優(yōu)于固定Z-R關(guān)系式,BP神經(jīng)網(wǎng)絡(luò)估測(cè)的降雨量與站點(diǎn)實(shí)測(cè)雨量吻合性較好,而固定Z-R關(guān)系式估測(cè)的降雨量存在不同程度的低估現(xiàn)象。Grams et al(2014) 在雷達(dá)估測(cè)降水的基礎(chǔ)上,引入快速更新循環(huán)分析場(chǎng)中的環(huán)境變量,對(duì)比了各種變量對(duì)于改善定量降水估計(jì)的作用,最后發(fā)現(xiàn)零度層高度和溫度遞減率對(duì)于改進(jìn)雷達(dá)估測(cè)降水最為重要。利用決策樹,融合雷達(dá)觀測(cè)數(shù)據(jù)和數(shù)值分析場(chǎng)數(shù)據(jù),得到比傳統(tǒng)固定Z-R關(guān)系更為精確的降水估算。
基于雙偏振雷達(dá)觀測(cè)利用機(jī)器學(xué)習(xí)方法更進(jìn)一步提高了雷達(dá)估測(cè)降水的精度。Islam et al(2012) 集合并對(duì)比了支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)、決策樹、鄰近聚類等算法,利用雙偏振雷達(dá)觀測(cè)反射率因子、差分反射率因子、交叉相關(guān)系數(shù)、速度和譜寬等,實(shí)現(xiàn)了地面雜波、海浪雜波以及其他異常回波的識(shí)別,識(shí)別準(zhǔn)確率可達(dá)98%~99%,在去除雜波的基礎(chǔ)上有效改進(jìn)了雨量監(jiān)測(cè)。
冰雹和雷暴大風(fēng)往往在局地性極強(qiáng)的對(duì)流性系統(tǒng)中發(fā)展而來,由于局地性很強(qiáng),現(xiàn)有觀測(cè)網(wǎng)依然難以完全捕捉(鄭永光等,2017),具有很大的觀測(cè)難度。在目前我國(guó)大范圍取消人工觀測(cè)的趨勢(shì)下(中國(guó)氣象局,2013),使得冰雹和雷暴大風(fēng)的直接觀測(cè)數(shù)據(jù)更顯稀少。因此,采用雷達(dá)和衛(wèi)星等觀測(cè)資料進(jìn)行冰雹和雷暴大風(fēng)的識(shí)別,既非常重要,也顯得很有必要。
目前氣象業(yè)務(wù)中,由單站雷達(dá)PUP(principal user processor)系統(tǒng)生成的強(qiáng)冰雹指數(shù),通常強(qiáng)冰雹空?qǐng)?bào)率過高。王萍和潘躍(2013)為了解決這個(gè)問題, 依據(jù)概念模型對(duì)強(qiáng)冰雹回波單體特點(diǎn)的描述, 設(shè)計(jì)并實(shí)現(xiàn)了 “懸垂度” 等多個(gè)特征提取算法。以此為基礎(chǔ), 選用基于徑向基核函數(shù)的非線性支持向量機(jī)得到強(qiáng)冰雹識(shí)別模型, 將待測(cè)樣本遠(yuǎn)離最優(yōu)分類超平面的相對(duì)程度定義為新冰雹指數(shù)。試驗(yàn)表明, 本方法較目前業(yè)務(wù)上普遍使用的冰雹指數(shù)法具有更高的命中率, 同時(shí)空?qǐng)?bào)率大大降低。另外,為了區(qū)分短時(shí)強(qiáng)降水和冰雹天氣,王萍等(2016)利用決策樹算法,基于系統(tǒng)結(jié)構(gòu)疏密性特征、移出率、液態(tài)水含量及累加液態(tài)水含量等特征,實(shí)現(xiàn)對(duì)冰雹和短時(shí)強(qiáng)降水的分類識(shí)別。試驗(yàn)表明,本文方法對(duì)雷達(dá)站50 km以內(nèi)范圍的雷暴系統(tǒng)產(chǎn)生的短時(shí)強(qiáng)降水擊中率達(dá)到89.1%,誤報(bào)率為9.5%;冰雹的擊中率為79.8%,誤報(bào)率為3.5%;平均臨界成功指數(shù)達(dá)到80.0%。
相對(duì)于冰雹探測(cè),雷暴大風(fēng)的探測(cè)可借助我國(guó)稠密的自動(dòng)氣象站觀測(cè)數(shù)據(jù),在大風(fēng)觀測(cè)基礎(chǔ)上,利用雷達(dá)、衛(wèi)星資料進(jìn)行質(zhì)量控制,能夠較好地實(shí)現(xiàn)雷暴大風(fēng)的識(shí)別。李國(guó)翠等(2013)、周康輝等(2017)在地面氣象觀測(cè)站大風(fēng)記錄的基礎(chǔ)上,結(jié)合多源數(shù)據(jù)(包括雷達(dá)、衛(wèi)星、閃電、溫度、露點(diǎn)等觀測(cè)數(shù)據(jù)),利用模糊邏輯算法,實(shí)現(xiàn)對(duì)雷暴大風(fēng)與非雷暴大風(fēng)的有效識(shí)別,可在全國(guó)范圍對(duì)雷暴大風(fēng)進(jìn)行實(shí)時(shí)監(jiān)測(cè)。楊璐等(2018)基于雷達(dá)基數(shù)據(jù)和加密自動(dòng)氣象站數(shù)據(jù),利用支持向量機(jī)算法建立了雷暴大風(fēng)天氣的有效識(shí)別模型。
基于衛(wèi)星、雷達(dá)、閃電等觀測(cè)數(shù)據(jù),利用機(jī)器學(xué)習(xí)算法,能夠有效實(shí)現(xiàn)對(duì)對(duì)流系統(tǒng)的識(shí)別和追蹤,提取對(duì)流系統(tǒng)的移動(dòng)方向、移動(dòng)速度等信息,為對(duì)流預(yù)警提供重要信息。
雷達(dá)觀測(cè)能夠提供近地面的風(fēng)暴的三維結(jié)構(gòu)特征,因此利用雷達(dá)數(shù)據(jù)可有效進(jìn)行風(fēng)暴的識(shí)別和追蹤。Lakshmanan et al(2000)利用遺傳算法,從雷達(dá)圖像中逐層識(shí)別,進(jìn)而實(shí)現(xiàn)對(duì)風(fēng)暴的識(shí)別,能有效分辨對(duì)流系統(tǒng)的分裂和合并情況。在此基礎(chǔ)上,Lakshmanan et al(2005)發(fā)展了中氣旋識(shí)別算法,在三維雷達(dá)圖像上識(shí)別風(fēng)暴尺度的旋轉(zhuǎn),并建立神經(jīng)網(wǎng)絡(luò),將中氣旋特征和環(huán)境條件特征作為輸入,進(jìn)一步識(shí)別中氣旋風(fēng)暴是否會(huì)發(fā)展成龍卷,在實(shí)際應(yīng)用中取得了很好的效果。
Haberlie and Ashley (2018a;2018b)基于雷達(dá)拼圖數(shù)據(jù),利用機(jī)器學(xué)習(xí)算法,構(gòu)建了對(duì)流識(shí)別、追蹤算法。首先,將雷達(dá)回波進(jìn)行分割,識(shí)別并分割水平尺度大于100 km的深對(duì)流系統(tǒng)的連續(xù)或半連續(xù)區(qū)域。將分割好的對(duì)流系統(tǒng),根據(jù)降水人為主觀地為每個(gè)樣本分配下列標(biāo)簽之一:(1)中緯度MCS,(2)無組織對(duì)流,(3)熱帶系統(tǒng),(4)天氣系統(tǒng),(5)地面雜波和/或噪音。然后訓(xùn)練隨機(jī)森林,梯度增強(qiáng)(gradient boosting)和XGBoost,結(jié)果表明算法具有良好的對(duì)流云識(shí)別效果。最后,在此基礎(chǔ)上,利用空間匹配的方式,實(shí)現(xiàn)對(duì)MCS的追蹤。
基于閃電數(shù)據(jù)的雷暴識(shí)別,追蹤與外推算法也有一些嘗試。侯榮濤等(2012)、周康輝等(2016)分別利用K近鄰法(k-Nearest Neighbor,kNN)、密度極大值搜索算法等聚類算法,實(shí)現(xiàn)對(duì)閃電簇的識(shí)別,從而實(shí)現(xiàn)對(duì)雷暴活動(dòng)區(qū)域的識(shí)別,進(jìn)而分別利用路徑曲線擬合、Kalman濾波器等算法,實(shí)現(xiàn)對(duì)雷暴的追蹤與臨近預(yù)報(bào)。
雷達(dá)、衛(wèi)星等觀測(cè)數(shù)據(jù)本質(zhì)屬于圖像的范疇,而深度學(xué)習(xí)近年來在圖像識(shí)別領(lǐng)域取得極大成功。因此,利用深度學(xué)習(xí)可以有效從雷達(dá)圖像、衛(wèi)星云圖中識(shí)別出強(qiáng)對(duì)流天氣。
利用深度學(xué)習(xí),可以有效利用雷達(dá)探測(cè)的三維空間數(shù)據(jù),提取冰雹事件的三維結(jié)構(gòu)特征,如冰雹在即將發(fā)生或者發(fā)展過程中,在雷達(dá)回波圖像上,具有很明顯的諸如三體反射、弱回波區(qū)(WER)、回波懸垂等特征。Wang et al(2018)利用深度學(xué)習(xí)算法,基于單站雷達(dá)的三維探測(cè)數(shù)據(jù),輸入不同高度的雷達(dá)掃描切面,提取產(chǎn)生冰雹的對(duì)流云中的有界弱回波區(qū)等特征,從而取得比傳統(tǒng)方法更好的冰雹識(shí)別效果。
最近,鄭益勤等(2020)利用Himawari-8衛(wèi)星圖像,構(gòu)建了用深度信念網(wǎng)絡(luò)(DBN)進(jìn)行強(qiáng)對(duì)流云團(tuán)自動(dòng)識(shí)別的方法,該方法可以有效識(shí)別處于初生到消散不同階段的強(qiáng)對(duì)流云團(tuán),并在一定程度上去除卷云。與單波段閾值法、多波段閾值法和支持向量機(jī)這三種方法相比,其提出的方法能夠提高強(qiáng)對(duì)流云團(tuán)的識(shí)別精度(對(duì)流區(qū)域識(shí)別效果如圖1)。
圖1 2017年3月14日08時(shí)使用深度學(xué)習(xí)進(jìn)行強(qiáng)對(duì)流云識(shí)別的結(jié)果(鄭益勤等,2020)(a)TBB08-TBB13,(b)初始識(shí)別結(jié)果,(c)閉運(yùn)算后結(jié)果Fig.1 The identical results of convective storm of satellite images with deep learning method at 08:00 BT 14 March 2017 (Zheng et al, 2020)(a) TBB08-TBB13, (b) initial recognition result, (c) result of closed operation
深度學(xué)習(xí)也可以從氣象要素場(chǎng)中識(shí)別天氣系統(tǒng)。Lagerquist et al(2019)利用深度卷積神經(jīng)網(wǎng)絡(luò),從溫度、比濕、風(fēng)場(chǎng)、位勢(shì)高度等變量中,成功實(shí)現(xiàn)對(duì)冷鋒和暖鋒識(shí)別,通過與人工標(biāo)記的冷鋒和暖鋒對(duì)比后發(fā)現(xiàn),如果誤差250 km以內(nèi)算正確,其命中率達(dá)到73%,虛警率為35%,臨界成功指數(shù)達(dá)到52%。
2005年,世界氣象組織(WMO)定義的臨近預(yù)報(bào)(或稱為甚短時(shí)預(yù)報(bào))為0~6 h的天氣預(yù)報(bào),現(xiàn)已得到了廣泛認(rèn)可(俞小鼎等,2012;Wilson et al,2010;Sun et al,2014)。不過我國(guó)預(yù)報(bào)業(yè)務(wù)通常將0~2 h的天氣預(yù)報(bào)稱為臨近預(yù)報(bào)(俞小鼎等,2012),因此,本文將0~2 h的預(yù)報(bào)稱為臨近預(yù)報(bào),2~12 h稱為短時(shí)預(yù)報(bào),12~72 h為短期預(yù)報(bào)。傳統(tǒng)的線性外推算法無法判斷對(duì)流的生消演變,利用機(jī)器學(xué)習(xí)算法,能夠從雷達(dá)反射率因子、衛(wèi)星云圖等觀測(cè)數(shù)據(jù)中,提取對(duì)流初生、發(fā)展、消散等特征,從而為判斷對(duì)流演變起到一定作用。
將機(jī)器學(xué)習(xí)應(yīng)用于強(qiáng)對(duì)流臨近預(yù)報(bào),最直觀的設(shè)想是利用機(jī)器學(xué)習(xí)改進(jìn)雷達(dá)回波外推預(yù)報(bào)。傳統(tǒng)的外推方法,如TITAN(Dixon and Wiener,1993)、SCIT(Johnson et al,1998)以及光流法(Bechini and Chandrasekar,2017)等等,能夠有效判斷對(duì)流的移動(dòng)趨勢(shì),但是無法判斷對(duì)流系統(tǒng)的生消演變等特征,因此無法給出對(duì)流初生、增強(qiáng)或減弱等預(yù)報(bào)(Wilson et al,1998)。利用機(jī)器學(xué)習(xí),一定程度上能夠克服上述問題。
Yu et al(2017)將過去時(shí)次的雷達(dá)回波反演的降水量、海拔、經(jīng)緯度作為預(yù)報(bào)因子,構(gòu)建隨機(jī)森林和支持向量機(jī),進(jìn)行0~3 h降水量預(yù)報(bào),并對(duì)比了隨機(jī)森林和支持向量機(jī)的預(yù)報(bào)效果,結(jié)果表明兩種算法都能較好地實(shí)現(xiàn)0~3 h降水量預(yù)報(bào),而支持向量機(jī)在此任務(wù)中表現(xiàn)更好。Foresti et al(2019)從10年的雷達(dá)組合反射率圖片中,識(shí)別和追蹤對(duì)流系統(tǒng),提取包括位置、風(fēng)場(chǎng)、凍結(jié)層高度和時(shí)間等變量作為預(yù)報(bào)因子,應(yīng)用神經(jīng)網(wǎng)絡(luò),預(yù)報(bào)降水系統(tǒng)的加強(qiáng)與減弱。預(yù)報(bào)結(jié)果表明,神經(jīng)網(wǎng)絡(luò)能夠有效預(yù)報(bào)對(duì)流系統(tǒng)的增強(qiáng)和減弱,預(yù)報(bào)均方根誤差相對(duì)拉格朗日外推降低20%~30%。
靜止氣象衛(wèi)星能夠監(jiān)測(cè)對(duì)流云形成初始階段的相關(guān)特征,如云體厚度快速增加、云頂溫度急劇下降、云頂相態(tài)的變化(Mecikalski et al,2010a;2010b)。因此,應(yīng)用靜止氣象衛(wèi)星監(jiān)測(cè)數(shù)據(jù),能夠有效實(shí)現(xiàn)對(duì)對(duì)流初生(CI)的監(jiān)測(cè)預(yù)警(Mecikalski and Bedka,2006;Mecikalski et al,2013;Walker et al,2012)。
國(guó)內(nèi)外研究人員開展了相關(guān)工作,基于靜止氣象衛(wèi)星數(shù)據(jù),開發(fā)了大量對(duì)流初生預(yù)報(bào)算法。但傳統(tǒng)方法很大程度上依賴于研究人員的物理認(rèn)識(shí)、統(tǒng)計(jì)結(jié)果和經(jīng)驗(yàn),針對(duì)衛(wèi)星觀測(cè)數(shù)據(jù)的物理特性,設(shè)計(jì)對(duì)流初生的判據(jù)。如當(dāng)前美國(guó)靜止氣象衛(wèi)星的CI采用的判據(jù)包括10.7 μm通道亮溫低于0℃,10.7 μm通道亮溫時(shí)間變化趨勢(shì)小于-4℃/15 min等等。
基于衛(wèi)星數(shù)據(jù),應(yīng)用機(jī)器學(xué)習(xí)方法能夠自動(dòng)實(shí)現(xiàn)CI的預(yù)測(cè)。Han et al(2015)利用通信與海洋氣象衛(wèi)星(COMS)成像儀數(shù)據(jù),應(yīng)用決策樹、隨機(jī)森林、支持向量機(jī)等方法,提取了衛(wèi)星紅外、可見光、水汽等通道中的對(duì)流初生特征,成功實(shí)現(xiàn)了對(duì)流初生判斷與預(yù)報(bào),對(duì)流初生預(yù)報(bào)的提前量達(dá)30~45 min。Bessho et al(2016)利用Himawari-8衛(wèi)星中的多通道信息和通道變化趨勢(shì),以及簡(jiǎn)單的邏輯回歸模型,實(shí)現(xiàn)對(duì)快速發(fā)展的對(duì)流區(qū)域(RDCAs)的識(shí)別,為即將發(fā)展的對(duì)流提供提前告警信息。Lee et al(2017)利用決策樹、隨機(jī)森林、邏輯回歸等模型,基于Himawari-8成像儀的多通道數(shù)據(jù),選取12個(gè)IF,提取其變化特征,進(jìn)行對(duì)流初生的預(yù)報(bào)。
靜止氣象衛(wèi)星具備對(duì)對(duì)流初生的觀測(cè)能力,觀測(cè)對(duì)流云頂?shù)陌l(fā)生發(fā)展特征;天氣雷達(dá)觀測(cè)對(duì)流風(fēng)暴的內(nèi)部分布特征;數(shù)值模式預(yù)報(bào)數(shù)據(jù)可提供對(duì)流發(fā)展的環(huán)境條件。多源觀測(cè)數(shù)據(jù)表現(xiàn)形式、物理意義各異,如何將多源數(shù)據(jù)實(shí)現(xiàn)有效融合,也是當(dāng)前面臨的挑戰(zhàn)之一。
機(jī)器學(xué)習(xí)算法能夠自動(dòng)學(xué)習(xí)并提取特征,為多源數(shù)據(jù)融合提供了新的思路。如Mecikalski et al(2015)基于靜止氣象衛(wèi)星數(shù)據(jù)結(jié)合數(shù)值模式數(shù)據(jù),選取了25個(gè)相關(guān)要素,利用邏輯回歸和隨機(jī)森林,實(shí)現(xiàn)了歐洲地區(qū)的對(duì)流初生預(yù)報(bào)。 Ahijevych et al(2016)利用隨機(jī)森林,融合雷達(dá)、衛(wèi)星云圖和數(shù)值模式數(shù)據(jù),進(jìn)行0~2 h的對(duì)流初生預(yù)報(bào),模型有效探測(cè)了99%以上(總數(shù)550個(gè))的初生系統(tǒng)。Han et al(2017)利用支持向量機(jī)算法,基于多普勒雷達(dá)數(shù)據(jù)和高分辨率分析場(chǎng),自動(dòng)提取雷暴發(fā)生發(fā)展特征,訓(xùn)練了預(yù)報(bào)模型,基于多普勒雷達(dá)四維變分分析系統(tǒng)(VDRAS)預(yù)報(bào)場(chǎng)實(shí)現(xiàn)了雷暴的臨近預(yù)報(bào)(流程見圖2)。
圖2 基于多源數(shù)據(jù)(雷達(dá)和VDRAS數(shù)據(jù)),利用支持向量機(jī)進(jìn)行對(duì)流臨近預(yù)報(bào)的流程(Han et al,2017)Fig.2 Flow chart of SVM for convective weather nowcasting with VDRAS data (Han et al, 2017)
Marzban and Witt(2001)和Lagerquist et al(2017)利用機(jī)器學(xué)習(xí)算法,融合使用雷達(dá)資料追蹤的雷暴特征和對(duì)流系統(tǒng)附近的探空觀測(cè)特征,對(duì)對(duì)流性大風(fēng)和冰雹進(jìn)行臨近預(yù)報(bào),結(jié)果表明,其不僅能夠有效預(yù)測(cè)對(duì)流單體內(nèi)部的大風(fēng)(提前0~15 min),而且能夠預(yù)測(cè)對(duì)流系統(tǒng)10 km以內(nèi)范圍的陣風(fēng)鋒大風(fēng)(提前60~90 min),具有較好的實(shí)用價(jià)值。Czernecki et al(2019)利用隨機(jī)森林,融合了雷達(dá)數(shù)據(jù)、閃電數(shù)據(jù)和再分析數(shù)據(jù)的對(duì)流參數(shù),進(jìn)行大冰雹的預(yù)報(bào)。結(jié)果表明,雷達(dá)數(shù)據(jù)在冰雹預(yù)報(bào)中起到主要作用,而對(duì)流參數(shù)作用也不可被忽視。McGovern et al(2014)構(gòu)建了時(shí)空決策樹模型,基于多源數(shù)據(jù)包括雷達(dá)、地面觀測(cè)數(shù)據(jù)、飛機(jī)觀測(cè)數(shù)據(jù)等,進(jìn)行強(qiáng)對(duì)流天氣(龍卷和對(duì)流顛簸)的預(yù)測(cè)。其預(yù)測(cè)模型能夠清晰地顯示各個(gè)預(yù)報(bào)因子的作用,從而為更好地理解強(qiáng)對(duì)流發(fā)展原因,提供較好的思路。
Apke et al(2015) 則用機(jī)器學(xué)習(xí)方法分析了對(duì)流環(huán)境對(duì)于對(duì)流初生的作用,研究是否可以將對(duì)流參數(shù)引入,改進(jìn)利用衛(wèi)星進(jìn)行對(duì)流初生的預(yù)報(bào)效果。他們應(yīng)用主成分分析(PCA) 和二次判別分析(QDA)進(jìn)行了相關(guān)性分析。結(jié)果發(fā)現(xiàn),CAPE和CIN對(duì)于改進(jìn)衛(wèi)星的對(duì)流初生預(yù)報(bào)具有積極的作用。在高CAPE、低CIN的環(huán)境下,對(duì)流初生具有更好的預(yù)報(bào)性。用QDA方法驗(yàn)證了,在實(shí)現(xiàn)衛(wèi)星數(shù)據(jù)和數(shù)值模式預(yù)報(bào)數(shù)據(jù)融合應(yīng)用的情況下,CI預(yù)報(bào)效果更好。
利用深度學(xué)習(xí)強(qiáng)大的特征提取能力,能夠提取對(duì)流系統(tǒng)在雷達(dá)回波上生消演變特征,進(jìn)而為預(yù)報(bào)其生消演變提供有效參考。Shi et al(2015;2017)、Kim et al(2017b)、Wang et al(2017)、郭瀚陽(yáng)等(2019)、施恩等(2018)、吳昆等(2018)針對(duì)雷達(dá)回波外推問題,根據(jù)對(duì)流系統(tǒng)的演變特征,提出相適應(yīng)的深度學(xué)習(xí)網(wǎng)絡(luò),主要基于卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò),自動(dòng)學(xué)習(xí)對(duì)流系統(tǒng)的回波演變特征(典型深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)如圖3),實(shí)現(xiàn)了雷達(dá)回波的外推預(yù)報(bào),并具備一定對(duì)流系統(tǒng)生消演變的預(yù)報(bào)能力,檢驗(yàn)表明,在TS評(píng)分上優(yōu)于光流法、TITAN等傳統(tǒng)外推方法。然而,目前深度學(xué)習(xí)外推隨著時(shí)間推移,其空間分辨率呈現(xiàn)明顯的下降,回波平滑問題較為嚴(yán)重,一定程度上影響業(yè)務(wù)應(yīng)用效果。
圖3 基于深度學(xué)習(xí)的雷達(dá)外推流程(郭瀚陽(yáng)等,2019)(a)訓(xùn)練過程, (b)預(yù)報(bào)過程Fig.3 Flow chart of radar reflectivity image extrapolation with deep learning method (Guo et al,2019)(a) training, (b) forcasting
深度學(xué)習(xí)也可提取VDRAS等快速變分同化分析場(chǎng)中的對(duì)流發(fā)生發(fā)展特征。Zhang et al(2017)基于雷達(dá)與實(shí)況再分析場(chǎng),構(gòu)建了深度卷積網(wǎng)絡(luò),實(shí)現(xiàn)了對(duì)流區(qū)(雷達(dá)反射率>35 dBz)的有效臨近預(yù)報(bào),由于算法自動(dòng)提取了對(duì)流系統(tǒng)的時(shí)空演變特征,因此也具有對(duì)流發(fā)展的預(yù)報(bào)能力。
深度學(xué)習(xí)在融合多源觀測(cè)數(shù)據(jù)進(jìn)行臨近預(yù)報(bào)方面,也存在巨大的潛力。深度學(xué)習(xí)能夠綜合提取多源觀測(cè)數(shù)據(jù)中時(shí)間、空間上的有效信息。Zhou et al(2020)構(gòu)建深度學(xué)習(xí)三維語(yǔ)義分割模型,從雷達(dá)回波、衛(wèi)星云圖、閃電密度等觀測(cè)數(shù)據(jù)中提取閃電的時(shí)空發(fā)生、發(fā)展特征,實(shí)現(xiàn)了有效的0~1 h的閃電預(yù)報(bào),且具備一定的對(duì)對(duì)流生消演變的預(yù)報(bào)能力。S?nderby et al(2020)構(gòu)建了深度學(xué)習(xí)模型Metnet,綜合使用卷積、LSTM(long short-term memory)、注意力機(jī)制等方法,利用衛(wèi)星、雷達(dá)、降水等觀測(cè)數(shù)據(jù),實(shí)現(xiàn)了更長(zhǎng)時(shí)效(未來0~8 h)的降水預(yù)報(bào)模型。Metnet預(yù)報(bào)的時(shí)空分辨率可達(dá)到2 min、1 km,預(yù)測(cè)的1 mm降水準(zhǔn)確率超過了快速更新同化高分辨率數(shù)值模式(HRRR),展示了深度學(xué)習(xí)方法巨大的應(yīng)用潛力。
相對(duì)于臨近預(yù)報(bào)中主要使用實(shí)時(shí)觀測(cè)數(shù)據(jù),短時(shí)和短期預(yù)報(bào)則更專注于數(shù)值預(yù)報(bào)模式的使用。目前,中央氣象臺(tái)強(qiáng)對(duì)流短期預(yù)報(bào),主觀預(yù)報(bào)使用的主要是“配料法”。該方法由Doswell III et al(1996)提出,在我國(guó)有了較多的發(fā)展與應(yīng)用(張小玲等,2010;俞小鼎,2011)。
配料法確定預(yù)報(bào)的基本構(gòu)成要素或“配料”,構(gòu)成要素一般是相對(duì)獨(dú)立的氣象變量,給預(yù)報(bào)員提供了天氣預(yù)報(bào)的清晰思路?;诓煌鞖獾奈锢砟P秃汀芭淞戏ā?,中央氣象臺(tái)預(yù)報(bào)員設(shè)計(jì)了不同類型強(qiáng)對(duì)流天氣發(fā)生發(fā)展的對(duì)流環(huán)境(水汽、動(dòng)力、能量等方面)物理參數(shù)組合,給出了分類概率預(yù)報(bào)產(chǎn)品。強(qiáng)對(duì)流天氣“配料法”等主觀預(yù)報(bào)產(chǎn)品評(píng)估表明(吳蓁等,2011;唐文苑等,2017),預(yù)報(bào)員主觀統(tǒng)計(jì)提取對(duì)流特征并經(jīng)過“配料組合”得出的強(qiáng)對(duì)流預(yù)報(bào)結(jié)果具有較好的有效性和預(yù)報(bào)能力,但必然也會(huì)存在一定的局限性。在觀測(cè)和模式預(yù)報(bào)產(chǎn)品越來越龐大的今天,預(yù)報(bào)員主觀分析,提取對(duì)流發(fā)生發(fā)展特征,難度越來越大。因此,有必要利用各種機(jī)器學(xué)習(xí)算法進(jìn)行上述工作。
探空數(shù)據(jù)能夠提供當(dāng)?shù)氐拇髿鈱咏Y(jié)環(huán)境特征,為判斷短時(shí)預(yù)報(bào)時(shí)效內(nèi)對(duì)流是否發(fā)生提供有效依據(jù)。Sánchez et al(1998)、趙旭寰等(2009)、陳勇偉等(2013)、楊仲江等(2013)利用探空數(shù)據(jù),基于神經(jīng)網(wǎng)絡(luò)建立了不同的地區(qū)的雷暴或冰雹預(yù)報(bào)模型,取得了較好的預(yù)報(bào)效果。Manzato(2013)同樣利用探空反演的對(duì)流指數(shù)因子,構(gòu)建多個(gè)神經(jīng)網(wǎng)絡(luò)模型,并用集成學(xué)習(xí)的思維、Bagging算法,實(shí)現(xiàn)集成學(xué)習(xí),得到更有效的冰雹預(yù)報(bào)。
探空數(shù)據(jù)還能與其他數(shù)據(jù)進(jìn)行綜合使用。Billet et al(1997),利用探空數(shù)據(jù)(T850、零度層溫度、平均風(fēng)暴相對(duì)入流),結(jié)合雷達(dá)反演的VIL,構(gòu)建回歸模型,進(jìn)行對(duì)冰雹和直徑大于1.9 cm的大冰雹的概率預(yù)測(cè)。然而探空觀測(cè)僅能代表當(dāng)前的大氣環(huán)境特征,因此預(yù)報(bào)的時(shí)效更短,更長(zhǎng)時(shí)效的預(yù)報(bào)則依賴于數(shù)值天氣預(yù)報(bào)。
李文娟等(2018)將隨機(jī)森林算法應(yīng)用于分類強(qiáng)對(duì)流的潛勢(shì)預(yù)測(cè),建立了四分類(短時(shí)強(qiáng)降水、雷暴大風(fēng)、冰雹和無強(qiáng)對(duì)流天氣)預(yù)報(bào)模型。選取物理意義明確的對(duì)流指數(shù)和物理量,開展強(qiáng)對(duì)流天氣的分類訓(xùn)練,利用實(shí)時(shí)的NCEP預(yù)報(bào)場(chǎng)進(jìn)行預(yù)報(bào),結(jié)果表明整體誤判率為21.9%,85次強(qiáng)對(duì)流過程基本無漏報(bào),模型尤其適用于較大范圍強(qiáng)對(duì)流天氣。 Herman and Schumacher(2018)利用NOAA全球集合預(yù)報(bào)系統(tǒng)數(shù)據(jù),構(gòu)建了隨機(jī)森林模型,能夠?qū)崿F(xiàn)2~3 d的極端降水預(yù)報(bào)。為了應(yīng)對(duì)極端降水的極端性,他們不僅將數(shù)值預(yù)報(bào)的對(duì)流指數(shù)和溫壓濕風(fēng)等因子作為預(yù)報(bào)因子,同時(shí)選擇了眾多背景預(yù)報(bào)因子。背景預(yù)報(bào)因子包括1年和10年的格點(diǎn)ARI(average recurrence intervals)最大、最小、中位數(shù)值,1年和10年的區(qū)域ARI(average recurrence intervals)最大、最小、中位數(shù)值,以及經(jīng)度和緯度值。Liu et al(2019),應(yīng)用ERA-Interim再分析數(shù)據(jù),用貝葉斯方法分析熱力和動(dòng)力因子與高頻次閃電雷暴云的相關(guān)性,發(fā)現(xiàn)CAPE、CIN、底層風(fēng)切變、暖云厚度等變量與高頻次閃電雷暴云最為相關(guān),為高頻次閃電雷暴云的預(yù)報(bào)給予了啟發(fā)。
高分辨率數(shù)值模式,具有更高的時(shí)空分辨率,能夠提供更精細(xì)的對(duì)流風(fēng)暴系統(tǒng)結(jié)構(gòu)特征,從而為強(qiáng)對(duì)流短時(shí)與短期預(yù)報(bào)提供更多的有效信息。Collins and Tissot (2015) 選取了43個(gè)高分辨率數(shù)值模式預(yù)報(bào)的預(yù)報(bào)因子,訓(xùn)練了18個(gè)神經(jīng)網(wǎng)絡(luò)模型,其中9個(gè)做了特征選擇,另外9個(gè)包含所有預(yù)測(cè)因子,展示了特征選取工作的重要性。最終得到預(yù)報(bào)效果最好的雷暴預(yù)報(bào)模型,其預(yù)報(bào)效果媲美于業(yè)務(wù)預(yù)報(bào)員。Gagne II(2016)基于CAPS(Center for Analysis and Prediction of Storms)的SSEF(Storm-Storm Scale Ensemble Forecast)集合預(yù)報(bào)模式,基于決策樹算法,構(gòu)建了方便預(yù)報(bào)員理解的冰雹預(yù)測(cè)決策樹(圖4),能夠直觀展示通過決策樹算法從大量數(shù)據(jù)中提取的判斷流程。Whan and Schmeits(2018) 利用對(duì)流可分辨模式HARMONIE-AROME數(shù)值模式的大量對(duì)流參數(shù)作為預(yù)報(bào)因子,訓(xùn)練了邏輯回歸、決策樹等模型,實(shí)現(xiàn)了荷蘭地區(qū)的降水預(yù)報(bào),結(jié)果表明其對(duì)于降水量大于30 mm·h-1的短時(shí)強(qiáng)降水也具有較好的預(yù)報(bào)效果。
圖4 利用決策樹算法生成決策樹,實(shí)現(xiàn)對(duì)冰雹的自動(dòng)化預(yù)報(bào)(Gagne II, 2016)Fig.4 Visualization of judging process in decide-tree for hail forecasting (Gagne II, 2016)
Gagne II et al(2015;2017)對(duì)快速更新的高時(shí)空分辨率的數(shù)值模式預(yù)報(bào)做了更精細(xì)化的處理,將NWP輸出的結(jié)果進(jìn)行了風(fēng)暴識(shí)別,將其識(shí)別結(jié)果與實(shí)況的雷達(dá)回波風(fēng)暴單體進(jìn)行匹配,然后對(duì)其是否發(fā)生冰雹進(jìn)行預(yù)測(cè)。利用機(jī)器學(xué)習(xí)模型,從風(fēng)暴的結(jié)構(gòu)特征和對(duì)流參數(shù)特征,學(xué)習(xí)風(fēng)暴單體是否會(huì)產(chǎn)生冰雹的特征,進(jìn)而實(shí)現(xiàn)對(duì)冰雹的精細(xì)化預(yù)報(bào)。
短時(shí)預(yù)報(bào)可利用深度學(xué)習(xí)融合實(shí)況觀測(cè)數(shù)據(jù)和高分辨率數(shù)值模式數(shù)據(jù)。Geng et al(2019)和Lin et al(2019)利用數(shù)值預(yù)報(bào)模式WRF(Weather Research and Forecasting)和閃電觀測(cè)實(shí)況,構(gòu)建了基于ConvLSTM(convolutional long short-term memory)的深度學(xué)習(xí)模型,用于提取數(shù)值模式數(shù)據(jù)和觀測(cè)數(shù)據(jù)的時(shí)空變化特征,進(jìn)而實(shí)現(xiàn)未來6 h或12 h的閃電預(yù)報(bào)。由于深度學(xué)習(xí)能夠有效綜合提取觀測(cè)數(shù)據(jù)和數(shù)值預(yù)報(bào)模式數(shù)據(jù)的信息,因此其預(yù)報(bào)性能顯著優(yōu)于單純依賴數(shù)值預(yù)報(bào)模式對(duì)流參數(shù)化方案的預(yù)報(bào)效果。而且,綜合應(yīng)用觀測(cè)數(shù)據(jù)和數(shù)據(jù)預(yù)報(bào)模式數(shù)據(jù)的深度學(xué)習(xí)方法預(yù)報(bào)效果,也明顯優(yōu)于使用單一數(shù)據(jù)的深度學(xué)習(xí)方法效果。周康輝等(2021)基于多源觀測(cè)數(shù)據(jù)和高分辨率數(shù)值天氣預(yù)報(bào)數(shù)據(jù)的特性,構(gòu)建了一個(gè)雙輸入單輸出的深度學(xué)習(xí)語(yǔ)義分割模型,使用了包括閃電密度、雷達(dá)組合反射率拼圖、衛(wèi)星成像儀6個(gè)紅外通道,以及GRAPES-3 km模式預(yù)報(bào)的雷達(dá)組合反射率等共9個(gè)預(yù)報(bào)因子。結(jié)果表明,深度學(xué)習(xí)模型能夠較好地實(shí)現(xiàn)0~6 h的閃電落區(qū)預(yù)報(bào),具備比單純使用多源觀測(cè)數(shù)據(jù)、HNWP數(shù)據(jù)更好的預(yù)報(bào)結(jié)果。深度學(xué)習(xí)能夠有效實(shí)現(xiàn)多源觀測(cè)數(shù)據(jù)和NWP數(shù)據(jù)的融合,預(yù)報(bào)時(shí)效越長(zhǎng),融合的優(yōu)勢(shì)體現(xiàn)的越明顯。
短期預(yù)報(bào)可使用深度學(xué)習(xí)對(duì)全球數(shù)值天氣預(yù)報(bào)模型進(jìn)行釋用。Zhou et al(2019)建立了6層的卷積神經(jīng)網(wǎng)絡(luò),應(yīng)用于分類強(qiáng)對(duì)流的潛勢(shì)預(yù)測(cè)。利用NCEP再分析資料計(jì)算的超過100個(gè)對(duì)流指數(shù)和物理量,開展強(qiáng)對(duì)流天氣的分類訓(xùn)練。訓(xùn)練好的模型接入實(shí)時(shí)的NCEP預(yù)報(bào)場(chǎng)進(jìn)行預(yù)報(bào)。結(jié)果表明(如表1),其預(yù)報(bào)效果能夠?yàn)轭A(yù)報(bào)員給出有價(jià)值的參考。Zhou et al(2019)基于卷積神經(jīng)網(wǎng)絡(luò)的分類強(qiáng)對(duì)流預(yù)報(bào)產(chǎn)品已經(jīng)成為中央氣象臺(tái)強(qiáng)對(duì)流天氣預(yù)報(bào)重要的業(yè)務(wù)參考產(chǎn)品(張小玲等,2018)。
表1 2015—2017年4—9月08時(shí)起報(bào)的12 h基于卷積神經(jīng)網(wǎng)絡(luò)的分類對(duì)流潛勢(shì)預(yù)報(bào)(DL)和預(yù)報(bào)員主觀預(yù)報(bào)(HF)的對(duì)比情況(Zhou et al, 2019)Table 1 Evaluation of deep CNN (DL) forecasts and human forecasts (HF) from April to September of 2015, 2016 and 2017 (12 h forecast was initiated at 08:00 BT; Zhou et al, 2019)
目前,機(jī)器學(xué)習(xí)在強(qiáng)對(duì)流監(jiān)測(cè)、強(qiáng)對(duì)流短時(shí)臨近預(yù)報(bào)與短期預(yù)報(bào)中,已經(jīng)發(fā)揮了重要的積極作用,其應(yīng)用效果往往優(yōu)于原有的傳統(tǒng)經(jīng)驗(yàn)和方法。在樣本標(biāo)記充足、標(biāo)記準(zhǔn)確的情況下(如對(duì)流云識(shí)別、雷達(dá)回波外推、閃電預(yù)報(bào)等),機(jī)器學(xué)習(xí)尤其是深度學(xué)習(xí),能夠從海量數(shù)據(jù)中有效提取特征,進(jìn)而進(jìn)行有效預(yù)報(bào);在樣本稀缺且樣本標(biāo)記不確定性較大的情況下(如冰雹、龍卷等極端強(qiáng)對(duì)流天氣),不管是深度學(xué)習(xí)或傳統(tǒng)機(jī)器學(xué)習(xí)解決此類問題的能力有待進(jìn)一步提高。總體而言,機(jī)器學(xué)習(xí)目前存在以下問題,未來在以下方面會(huì)繼續(xù)發(fā)展。
(1)相對(duì)對(duì)流天氣未發(fā)生(負(fù)樣本)頻率,對(duì)流天氣的發(fā)生(正樣本)頻率明顯偏低。因此存在嚴(yán)重的正負(fù)樣本不平衡問題。而且,由于對(duì)流系統(tǒng)尺度較小,觀測(cè)網(wǎng)絡(luò)經(jīng)常存在漏觀測(cè)的情況,因此正負(fù)樣本不平衡的問題進(jìn)一步突出。目前,有一些相關(guān)的算法可解決正負(fù)樣本不平衡問題,然而對(duì)于極端天氣事件,其樣本不平衡問題仍然非常顯著,對(duì)于機(jī)器學(xué)習(xí)模型的訓(xùn)練屬于一大挑戰(zhàn)。
(2)由于機(jī)器學(xué)習(xí)各類算法,本質(zhì)在于提取特征和標(biāo)記的相互聯(lián)系,因此對(duì)于特征和標(biāo)記的質(zhì)量要求極高。特征和標(biāo)記的質(zhì)量越高,其算法分類的效果越好。因此,算法仍然非常依賴觀測(cè)數(shù)據(jù)、數(shù)值模式預(yù)報(bào)等輸入數(shù)據(jù)質(zhì)量。而這些基本數(shù)據(jù)也是大氣科學(xué)發(fā)展的基礎(chǔ),由此可見,機(jī)器學(xué)習(xí)在大氣科學(xué)中的應(yīng)用效果,仍然與大氣科學(xué)的發(fā)展基礎(chǔ)息息相關(guān)。
(3)在強(qiáng)對(duì)流監(jiān)測(cè)預(yù)報(bào)中,大部分問題可以歸為分類問題,如對(duì)流云識(shí)別、強(qiáng)對(duì)流天氣識(shí)別、對(duì)流初生預(yù)報(bào)、基于數(shù)值預(yù)報(bào)模式的強(qiáng)對(duì)流分類預(yù)報(bào)等。目前從各項(xiàng)研究結(jié)果看來,強(qiáng)對(duì)流監(jiān)測(cè)預(yù)報(bào)中的分類問題,應(yīng)用機(jī)器學(xué)習(xí)算法效果顯著(Zhou et al,2019; Wang et al,2018)。降水量預(yù)報(bào)屬于回歸問題,應(yīng)用機(jī)器學(xué)習(xí)方法也有較明顯的改進(jìn)(邵月紅等,2009;Meyer et al,2017))。深度學(xué)習(xí)雷達(dá)回波外推也屬于回歸問題,雖然檢驗(yàn)指標(biāo)優(yōu)于傳統(tǒng)方法,但是始終存在圖像模糊的問題(Shi et al,2015;2017),應(yīng)用效果仍待進(jìn)一步改進(jìn)。無監(jiān)督學(xué)習(xí),如聚類算法、主成分分析等,在強(qiáng)對(duì)流天氣領(lǐng)域應(yīng)用場(chǎng)景有限。由此可見,借鑒目前深度學(xué)習(xí)等技術(shù)的發(fā)展趨勢(shì),未來可側(cè)重用分類的思路解決強(qiáng)對(duì)流監(jiān)測(cè)預(yù)報(bào)中的相關(guān)問題。
(4)根據(jù)“沒有免費(fèi)的午餐定理(No Free Lunch Theorem)”(Wolpert and Macready,1997),沒有一種機(jī)器學(xué)習(xí)算法,包括深度學(xué)習(xí),能夠在所有氣象應(yīng)用場(chǎng)景中都取得最好的應(yīng)用效果。因此,我們?nèi)匀恍枰媪私飧鞣N機(jī)器學(xué)習(xí)的算法的優(yōu)缺點(diǎn),根據(jù)使用場(chǎng)景選取最合適的算法。未來,各種傳統(tǒng)算法依然會(huì)在各自擅長(zhǎng)的領(lǐng)域中頻繁現(xiàn)身。此外,我們也可以使用多種機(jī)器學(xué)習(xí)算法集成的方法,以達(dá)到更好的預(yù)報(bào)效果。
(5)極端強(qiáng)對(duì)流天氣事件,比如阜寧龍卷(鄭永光等,2016b)、開原龍卷(張濤等,2020;鄭永光等,2020)、2017年5月7日廣州暴雨(田付友等,2018)等,一直以來,屬于天氣預(yù)報(bào)領(lǐng)域的重大挑戰(zhàn)。對(duì)于機(jī)器學(xué)習(xí)而言,由于極端天氣樣本極其稀缺,因此,直接構(gòu)建這樣的預(yù)報(bào)模型可能具有較大的難度。這種大氣科學(xué)的難題,同樣也是機(jī)器學(xué)習(xí)的重要挑戰(zhàn),必須通過熟練使用各類機(jī)器學(xué)習(xí)算法,嘗試采用遷移學(xué)習(xí)等方法對(duì)此問題進(jìn)行研究。
(6)深度學(xué)習(xí)訓(xùn)練過程涉及到大量的并行運(yùn)算,因此,目前對(duì)于高端GPU顯卡或者云計(jì)算資源的使用不可或缺。對(duì)于深度學(xué)習(xí)網(wǎng)絡(luò),其運(yùn)算需求往往非常巨大。因此,可以預(yù)見,未來高性能計(jì)算能力建設(shè)中,高性能GPU并行計(jì)算能力或者云計(jì)算資源的建設(shè)應(yīng)該會(huì)加速推進(jìn)。
(7)目前,機(jī)器學(xué)習(xí)算法可以基于雷達(dá)或者衛(wèi)星觀測(cè)資料提取對(duì)流初生等特征,進(jìn)行有效的臨近預(yù)報(bào)。然而,其尚不能完全考慮大氣運(yùn)動(dòng)的基本物理規(guī)律,因此短期內(nèi)不能代替數(shù)值預(yù)報(bào)模式進(jìn)行基于物理方程的數(shù)值預(yù)報(bào)。
盡管目前機(jī)器學(xué)習(xí)在強(qiáng)對(duì)流監(jiān)測(cè)和預(yù)報(bào)中依然存在一些制約,但機(jī)器學(xué)習(xí)所展示出來的性能表現(xiàn),表明其在未來應(yīng)該會(huì)成為我們?cè)絹碓接辛Φ墓ぞ?Reichstein et al,2019)。未來機(jī)器學(xué)習(xí)應(yīng)當(dāng)會(huì)在以下幾個(gè)強(qiáng)對(duì)流天氣監(jiān)測(cè)和預(yù)報(bào)方面進(jìn)一步發(fā)展:
(1)利用機(jī)器學(xué)習(xí)方法進(jìn)行多源數(shù)據(jù)的更有效融合應(yīng)用,從而更好地實(shí)現(xiàn)強(qiáng)對(duì)流的監(jiān)測(cè)和臨近預(yù)報(bào)。衛(wèi)星、雷達(dá)、閃電、自動(dòng)氣象站等觀測(cè)數(shù)據(jù),各有優(yōu)勢(shì)與劣勢(shì),如果充分發(fā)掘各自的優(yōu)點(diǎn),進(jìn)行綜合應(yīng)用,最大化地體現(xiàn)觀測(cè)數(shù)據(jù)的優(yōu)勢(shì)將成為未來強(qiáng)對(duì)流監(jiān)測(cè)和臨近預(yù)報(bào)的一大挑戰(zhàn)。此外,高頻次的觀測(cè)數(shù)據(jù)還可以與高時(shí)空分辨率、快速更新同化的數(shù)值模型進(jìn)行有效融合,實(shí)現(xiàn)臨近預(yù)報(bào)到短時(shí)預(yù)報(bào)的無縫過渡。
(2)如果能對(duì)風(fēng)暴的不同階段的演變特征實(shí)現(xiàn)有效識(shí)別,將能更好地實(shí)現(xiàn)強(qiáng)對(duì)流天氣的提前預(yù)警??梢試L試?yán)脵C(jī)器學(xué)習(xí),進(jìn)行中氣旋、上沖云頂、弓狀回波等特征的識(shí)別,相對(duì)于直接利用天氣現(xiàn)象作為標(biāo)記,對(duì)于冰雹、雷暴大風(fēng)、龍卷等強(qiáng)烈對(duì)流天氣能起到更加提前的預(yù)警效果。
(3)依托數(shù)值預(yù)報(bào)模式,利用機(jī)器學(xué)習(xí),進(jìn)行數(shù)值模式預(yù)報(bào)訂正和釋用,將進(jìn)一步提升和改進(jìn)預(yù)報(bào)水平。數(shù)值模式依靠大氣運(yùn)動(dòng)規(guī)律,對(duì)大氣運(yùn)行進(jìn)行計(jì)算,而機(jī)器學(xué)習(xí)通常只是擬合預(yù)報(bào)因子和標(biāo)記間的相關(guān)關(guān)系,并不注重其物理規(guī)律。將數(shù)值模式與機(jī)器學(xué)習(xí)相結(jié)合,能實(shí)現(xiàn)物理規(guī)律和相關(guān)關(guān)系的更好結(jié)合,進(jìn)一步提升模式預(yù)報(bào)結(jié)果的深度應(yīng)用。機(jī)器學(xué)習(xí)算法如何與物理規(guī)律相結(jié)合進(jìn)一步提升監(jiān)測(cè)和預(yù)報(bào)能力依然任重道遠(yuǎn)
(4)利用機(jī)器學(xué)習(xí)可實(shí)現(xiàn)強(qiáng)對(duì)流規(guī)律和物理原理的進(jìn)一步認(rèn)識(shí)。目前,除了決策樹等算法,大部分算法擬合過程猶如“黑箱”,雖然其預(yù)報(bào)效果較通常的統(tǒng)計(jì)方法或者主觀方法有所提升,但是其過程通常無法理解。目前,將深度學(xué)習(xí)特征提取過程可視化,也已經(jīng)成為一個(gè)熱點(diǎn)研究方向(Yosinski et al,2015; Rudin,2019; McGovern et al,2019),通過這樣的可視化與解釋,應(yīng)當(dāng)會(huì)對(duì)氣象學(xué)者進(jìn)一步理解中小尺度天氣現(xiàn)象有啟發(fā)。
強(qiáng)對(duì)流天氣監(jiān)測(cè)和預(yù)報(bào)一直是氣象學(xué)中最具挑戰(zhàn)的領(lǐng)域之一。為了提升其水平,氣象學(xué)和相關(guān)領(lǐng)域的專家在不斷求索,迄今為止已經(jīng)取得了重大進(jìn)展(張小玲等,2018;McGovern et al,2017;Haupt et al,2018),但與窮究大氣變化規(guī)律的終極目標(biāo)仍很遙遠(yuǎn)(許小峰,2018)。以機(jī)器學(xué)習(xí)為代表的人工智能的運(yùn)用,為強(qiáng)對(duì)流的監(jiān)測(cè)和應(yīng)用提供了新的途徑和方法(Karpatne et al,2019)。
盡管目前機(jī)器學(xué)習(xí)等人工智能技術(shù)在多個(gè)行業(yè)中的應(yīng)用都如火如荼,但是機(jī)器學(xué)習(xí)并不是萬(wàn)能的。機(jī)器學(xué)習(xí)在大氣科學(xué)領(lǐng)域的應(yīng)用基礎(chǔ)仍然依賴于高質(zhì)量的觀測(cè)數(shù)據(jù)、可靠的數(shù)值模式預(yù)報(bào)結(jié)果以及深刻的天氣原理認(rèn)識(shí),且要根據(jù)不同的應(yīng)用場(chǎng)景結(jié)合物理機(jī)理選擇合適的機(jī)器學(xué)習(xí)方法。究其本質(zhì),機(jī)器學(xué)習(xí)只是一個(gè)工具,并不能替代基礎(chǔ)天氣觀測(cè)數(shù)據(jù)、數(shù)值預(yù)報(bào)模式、天氣學(xué)和大氣動(dòng)力學(xué)基礎(chǔ)理論發(fā)展的研究。在利用人工智能技術(shù)發(fā)展天氣預(yù)報(bào)技術(shù)的同時(shí),也需時(shí)刻牢記大氣科學(xué)基礎(chǔ)理論才是強(qiáng)對(duì)流天氣預(yù)報(bào)的基礎(chǔ)和土壤。