朱玉祥,劉海文,萬文龍,姜曉飛,尕藏程林
① 中國氣象局 氣象干部培訓(xùn)學(xué)院,北京 100081;
② 中國民航大學(xué),天津 300300;
③ 東營市氣象局,山東 東營 257091
飛機(jī)顛簸,是指水平尺度介于100 m~1 km的大氣湍流所導(dǎo)致的飛機(jī)飛行中突然出現(xiàn)的忽上忽下、左右搖晃及機(jī)身震顫等現(xiàn)象,也稱為飛機(jī)尺度湍流(Sharman and Lane,2016)。飛機(jī)在航路上飛行時(shí)遇到顛簸而產(chǎn)生的機(jī)體搖晃和震顫,對飛機(jī)的安全會(huì)產(chǎn)生影響,嚴(yán)重時(shí)甚至?xí)?dǎo)致人員傷害和財(cái)產(chǎn)損失(Williams and Joshi,2013;申艷玲等,2017)。胡伯彥等(2022)對東亞地區(qū)晴空湍流的變化趨勢進(jìn)行了預(yù)估,指出未來東亞地區(qū)垂直風(fēng)切變作用的增強(qiáng)可能是引起晴空湍流增多的重要原因之一。Prosser et al.(2023)的研究表明,受氣候變化的影響,晴空湍流有增加的趨勢。這意味著未來乘坐飛機(jī)時(shí)可能會(huì)遇到更多的強(qiáng)烈顛簸。因此,對飛機(jī)顛簸的預(yù)報(bào)具有十分重要的意義和價(jià)值。最近幾年,人工智能(AI)技術(shù)在天氣預(yù)報(bào)和氣候預(yù)測中的應(yīng)用取得了迅速發(fā)展,并且有多篇綜述性論文對其進(jìn)行了介紹(楊淑賢等,2022;楊絢等,2022)。但目前為止,尚未見到人工智能在飛機(jī)顛簸預(yù)報(bào)中應(yīng)用的綜述性論文,這不利于該領(lǐng)域相關(guān)科研和業(yè)務(wù)的深入開展。
因此,本文將對飛機(jī)顛簸的預(yù)報(bào)方法進(jìn)行回顧,特別是人工智能(AI)方法在飛機(jī)顛簸預(yù)報(bào)中的最新應(yīng)用。在此基礎(chǔ)上,歸納總結(jié)AI方法在飛機(jī)湍流預(yù)報(bào)中存在的主要問題和解決思路。
飛機(jī)顛簸來自大氣中的湍流,其產(chǎn)生的原因有很多,最常見的是由風(fēng)的垂直切變和氣流的變形引起的晴空湍流(Sharman and Lane,2016)。根據(jù)物理機(jī)理,可以將湍流分為3種類型:晴空湍流、對流湍流、山地波湍流(Storer et al.,2019)。其中晴空湍流是由6 000 m以上自由大氣中的小尺度湍流渦流(100~2 000 m)直接產(chǎn)生的,與對流云(不包括非對流卷云)無關(guān)(Chambers,1955)。
飛機(jī)顛簸發(fā)生的范圍往往是區(qū)域性的,其水平范圍可以從幾千米到幾百千米。在高空槽脊、切變線、鋒區(qū)的彎曲部分及急流兩側(cè)容易發(fā)生顛簸。飛機(jī)顛簸和大氣湍流多發(fā)生在具有以下特性的區(qū)域:1)風(fēng)的垂直切變區(qū);2)風(fēng)的水平切變區(qū);3)流場的輻合或輻散區(qū);4)流場的水平變形區(qū);5)流場變化的不連續(xù)區(qū);6)強(qiáng)的水平溫度梯度區(qū)(干全等,2002)。
飛機(jī)顛簸的預(yù)報(bào)方法大致可以分為兩類:一類是通過對天氣環(huán)流形勢、氣象環(huán)境因子和氣象要素進(jìn)行總結(jié)得到的物理特征做預(yù)報(bào),這類方法稱為定性預(yù)報(bào);另一類是通過高分辨率的數(shù)值模式,以及在數(shù)值模式預(yù)報(bào)基礎(chǔ)上的數(shù)值產(chǎn)品釋用做預(yù)報(bào),這類方法稱為定量預(yù)報(bào)(李耀東等,1997;干全等,2002;Kim et al.,2011,2018;黃儀方和馬婷,2012;Pearson and Sharman,2017;Sharman and Pearson,2017;Storer et al.,2019;楊波等,2021;閆文輝等,2022;蔡雪薇等,2023)。圖1是這兩類飛機(jī)顛簸預(yù)報(bào)方法的示意圖,其中數(shù)值產(chǎn)品的釋用分為動(dòng)力釋用和統(tǒng)計(jì)釋用,機(jī)器學(xué)習(xí)釋用可以歸類為統(tǒng)計(jì)釋用。
圖1 飛機(jī)顛簸預(yù)報(bào)分類Fig.1 Classification of aircraft turbulence forecast
預(yù)報(bào)員基于衛(wèi)星、雷達(dá)等數(shù)據(jù)進(jìn)行經(jīng)驗(yàn)外推做2 h以內(nèi)的臨近預(yù)報(bào),是航空氣象預(yù)報(bào)業(yè)務(wù)的常用方法,這種預(yù)報(bào)也可以歸為定性預(yù)報(bào)。對于民用航空運(yùn)營來說,為了合理地計(jì)劃與調(diào)整在有限空域中航班的空中流量和飛機(jī)起降,需要航空公司、機(jī)場和空管動(dòng)態(tài)地把握分鐘和小時(shí)時(shí)間分辨率的天氣信息。因此重要天氣預(yù)報(bào)的實(shí)時(shí)化、準(zhǔn)確化和定量化對于民航運(yùn)營極其重要。這種民航空運(yùn)業(yè)務(wù)的要求,已經(jīng)超過了人工定性經(jīng)驗(yàn)加外推式預(yù)報(bào)的極限(周斌斌等,2016)。
隨著計(jì)算機(jī)能力的提高和衛(wèi)星、雷達(dá)等更多觀測數(shù)據(jù)在數(shù)值模式中的同化應(yīng)用,數(shù)值預(yù)報(bào)取得了迅速的發(fā)展。當(dāng)今發(fā)達(dá)國家的航空氣象業(yè)務(wù)預(yù)報(bào),都是在數(shù)值模式和數(shù)值模式后處理產(chǎn)品的基礎(chǔ)上開展的,而飛機(jī)顛簸預(yù)報(bào)的主流趨勢也是建立在數(shù)值預(yù)報(bào)基礎(chǔ)之上的定量預(yù)報(bào)(李耀東等,1997;Gill and Buchanan,2014;周斌斌等,2016;朱玉祥等,2016)。
數(shù)值天氣預(yù)報(bào)(Numerical Weather Prediction,NWP)是對“臨近預(yù)報(bào)”時(shí)間范圍(即0~2 h)以外航空湍流發(fā)生和時(shí)空分布進(jìn)行預(yù)報(bào)的主要手段。NWP是指根據(jù)已知的控制大氣演化的數(shù)學(xué)和物理規(guī)律,對一組離散方程在時(shí)間上進(jìn)行數(shù)值積分,從而預(yù)報(bào)大氣的未來狀態(tài)(Kalnay,2002)。最終的NWP預(yù)報(bào)是一個(gè)三維大氣狀態(tài)的集合,包括風(fēng)速、氣壓、濕度、位勢高度和水汽含量等變量,并在預(yù)報(bào)期內(nèi)的指定時(shí)間點(diǎn)輸出預(yù)報(bào)結(jié)果。由于數(shù)值預(yù)報(bào)方程組不存在解析解,所以在進(jìn)行NWP計(jì)算時(shí),需要將預(yù)報(bào)區(qū)域離散化到網(wǎng)格框中。對于大多數(shù)實(shí)時(shí)的實(shí)際業(yè)務(wù)應(yīng)用,這些網(wǎng)格框的水平間距的量級為100~101km。例如,全球NWP模式(覆蓋整個(gè)地球)通常水平網(wǎng)格間距為10~30 km(Bauer et al.,2015),而許多區(qū)域(只覆蓋全球的一部分區(qū)域)數(shù)值天氣預(yù)報(bào)模式只在幾千米的水平網(wǎng)格距上運(yùn)算(Benjamin et al.,2018)。相比之下,這種水平網(wǎng)格間距比航空湍流的尺度要大得多(Lindborg,1999),并且航空湍流可能在幾秒鐘內(nèi)發(fā)生,這意味著實(shí)時(shí)運(yùn)行的NWP模式將無法完全分辨直接導(dǎo)致航空湍流的大氣環(huán)流特征。為了克服這些局限性,形式為“湍流診斷量”或“指數(shù)”的解決方案已經(jīng)被開發(fā)出來?!巴牧髟\斷量”或“指數(shù)”是由代表大尺度大氣環(huán)境的NWP預(yù)報(bào)變量導(dǎo)出的物理量,這些物理量是通過推測或經(jīng)驗(yàn)確定的,與航空湍流的發(fā)生有關(guān)。例如,Ellrod-Knapp湍流指數(shù)是一種著名的、被廣泛使用的湍流診斷方法;它是根據(jù)Kelvin-Helmholtz不穩(wěn)定理論,基于風(fēng)場的變形和垂直切變所導(dǎo)致的湍流生成而定義的(Ellrod and Knapp,1992)。多年來,對航空湍流背后不同物理機(jī)制的考慮產(chǎn)生了許多湍流診斷公式(Dutton,1980)。
NCEP采用單模式和多模式集合所做的美國顛簸預(yù)報(bào)采用的是Ellrod方法,英國氣象局做的全球預(yù)報(bào)采用的也是Ellrod方法,該方法通過計(jì)算風(fēng)場的切變和變形來診斷顛簸的弱、中和強(qiáng)三個(gè)等級(Ellrod and Knapp,1992;Turp et al.,2006)。NCAR發(fā)展了一種綜合性的顛簸診斷方法(Graphical Turbulence Guidance,GTG)(Sharman et al.,2006;Sharman and Lane,2016),該方法不是用一種方法來診斷湍流,而是對12種湍流診斷方法進(jìn)行權(quán)重集合,這種權(quán)重集合可以提高預(yù)報(bào)的準(zhǔn)確率和信心(用概率給出)。比如,如果12種湍流診斷方法中有10種預(yù)報(bào)會(huì)出現(xiàn)強(qiáng)湍流,則強(qiáng)湍流出現(xiàn)的概率為10/12=83%。
人工智能是指通過計(jì)算機(jī)復(fù)現(xiàn)人類的智能。一般認(rèn)為,1956年夏天在達(dá)特茅斯學(xué)院召開的會(huì)議(Dartmouth Conference)是人工智能的起源。當(dāng)然,關(guān)于人工智能方面的研究更早就開始了。1950年,圖靈發(fā)表了一篇?jiǎng)潟r(shí)代的論文,文中預(yù)言了創(chuàng)造出真正具有智能的機(jī)器的可能性(Turing,1950)。由于注意到“智能”這一概念難以確切定義,所以他提出了著名的圖靈測試:如果一臺(tái)機(jī)器能夠與人類展開對話(通過電傳設(shè)備)而不能被辨別出其機(jī)器身份,那么就可以稱這臺(tái)機(jī)器具有智能。這一簡化的定義使得圖靈能夠令人信服地說明“思考的機(jī)器”是可能的。
人工智能問世60多年來,在語音識(shí)別、圖形處理、機(jī)器翻譯、智能搜索等很多領(lǐng)域都得到了廣泛的應(yīng)用(張鈸等,2020;吳焦蘇和李真真,2022a,b)。在氣象領(lǐng)域,人工智能也取得了一系列創(chuàng)新性成果和應(yīng)用嘗試(Shi et al.,2017;Ham et al.,2019;賀圣平等,2021;黃亮等,2022;雷蕾等,2022;劉泉宏等,2022;謝文鴻等,2022;楊淑賢等,2022;Bi et al.,2023;Ham et al.,2023;Zhang et al.,2023)。
機(jī)器學(xué)習(xí)使用計(jì)算機(jī)從數(shù)據(jù)中學(xué)習(xí)規(guī)律,是人工智能領(lǐng)域最能體現(xiàn)智能的一個(gè)分支學(xué)科(周志華,2022)。機(jī)器學(xué)習(xí)的主要算法包括:線性回歸、決策樹、集成學(xué)習(xí)(Boosting、Bagging、隨機(jī)森林等)、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、貝葉斯分類器、聚類、主成分分析、奇異值分解等。機(jī)器學(xué)習(xí)也被稱統(tǒng)計(jì)學(xué)習(xí)(李航,2019)。機(jī)器學(xué)習(xí)在飛機(jī)湍流預(yù)報(bào)中也得到了應(yīng)用,并且取得了相對較好的效果(Hon et al.,2020;Muoz-Esparza et al.,2020)。
21世紀(jì)以來,深度學(xué)習(xí)從各種機(jī)器學(xué)習(xí)算法中脫穎而出。深度學(xué)習(xí)的概念源于人工神經(jīng)網(wǎng)絡(luò)的研究,含多個(gè)隱含層的多層感知器就是一種深度學(xué)習(xí)結(jié)構(gòu),深度學(xué)習(xí)也屬于機(jī)器學(xué)習(xí)。深度學(xué)習(xí)通過組合低層特征形成更加抽象的高層表示屬性類別或特征,以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。深度學(xué)習(xí)的研究動(dòng)機(jī)源自建立模擬人腦進(jìn)行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),它試圖模仿人腦的機(jī)制來對數(shù)據(jù)進(jìn)行學(xué)習(xí)和解釋。深度學(xué)習(xí)是目前科學(xué)界研究最為活躍的領(lǐng)域,新方法新進(jìn)展層出不窮。常見的深度學(xué)習(xí)算法包括:卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)、長短期記憶網(wǎng)絡(luò)(Long Short Term Memory Networks,LSTM)、遞歸神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNN)、生成對抗網(wǎng)絡(luò)(Generative Adversarial Networks,GAN)、多層感知機(jī)(Multilayer Perceptrons,MLP)、自組織映射神經(jīng)網(wǎng)絡(luò)(Self Organizing Maps,SOM)、深度信念網(wǎng)絡(luò)(Deep Belief Networks,DBN)等。Hinton and Salakhutdinov(2006)提出了深度信念網(wǎng)絡(luò),并運(yùn)用反向傳播算法成功地訓(xùn)練了一個(gè)具有多個(gè)隱含層的神經(jīng)網(wǎng)絡(luò),這種算法能夠?yàn)槎鄬勇?lián)合訓(xùn)練過程找到一個(gè)好的初始值,甚至可以訓(xùn)練全連接結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò),突破了此前只能訓(xùn)練深度卷積神經(jīng)網(wǎng)絡(luò)(DCNN)或深度循環(huán)神經(jīng)網(wǎng)絡(luò)(DRNN)這類特殊結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)的局限性,使訓(xùn)練一般的深度神經(jīng)網(wǎng)絡(luò)變得具有可行性,為工業(yè)界大規(guī)模應(yīng)用深度學(xué)習(xí)做好了準(zhǔn)備。這標(biāo)志著深度學(xué)習(xí)進(jìn)入了一個(gè)新時(shí)代。Hinton由于在深度學(xué)習(xí)領(lǐng)域的杰出貢獻(xiàn),被稱為“深度學(xué)習(xí)之父”。深度學(xué)習(xí)具體的技術(shù)細(xì)節(jié)可參考Ian et al.(2016)?,F(xiàn)在大家談到的人工智能算法,往往指的就是深度學(xué)習(xí)。
綜上可見,深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)子集,而機(jī)器學(xué)習(xí)又是人工智能的一個(gè)子集,即:深度學(xué)習(xí)<機(jī)器學(xué)習(xí)<人工智能。圖2為它們之間關(guān)系的示意圖。
圖2 人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)之間關(guān)系的示意圖Fig.2 Schematic diagram of relationship among artificial intelligence,machine learning,and deep learning
淺層學(xué)習(xí)和深度學(xué)習(xí)通常都是基于人工神經(jīng)網(wǎng)絡(luò)(ANN)開展的,二者之間的區(qū)別如圖3所示。與深度學(xué)習(xí)(圖3b)相對應(yīng)的是淺層學(xué)習(xí)(圖3a)。淺層學(xué)習(xí)中間的隱層只有一層,而深度學(xué)習(xí)中間的隱層可以有多層。當(dāng)然,這只是二者之間關(guān)系的一個(gè)簡單的示意圖,現(xiàn)在深度學(xué)習(xí)算法的變種有很多,構(gòu)造也十分復(fù)雜。
圖3 淺層學(xué)習(xí)(a)與深度學(xué)習(xí)(b)的對比示意圖Fig.3 Contrast diagram between (a) shallow learning and (b) deep learning
人工神經(jīng)網(wǎng)絡(luò)(ANN)是20世紀(jì)80年代人工智能領(lǐng)域興起的研究熱點(diǎn),它對人大腦的神經(jīng)元網(wǎng)絡(luò)進(jìn)行抽象,建立某種數(shù)學(xué)模型,按不同的方式組成不同的網(wǎng)絡(luò)。人工神經(jīng)網(wǎng)絡(luò)是一種數(shù)學(xué)上的運(yùn)算模型,由大量的節(jié)點(diǎn)(或稱神經(jīng)元)之間相互連接而構(gòu)成(圖3)。每個(gè)節(jié)點(diǎn)代表一種特定的輸出函數(shù),稱為激活函數(shù)。每兩個(gè)節(jié)點(diǎn)之間的連接都代表通過該連接的信號的加權(quán)值(稱為權(quán)重),這相當(dāng)于人工神經(jīng)網(wǎng)絡(luò)的記憶。網(wǎng)絡(luò)的輸出值取決于網(wǎng)絡(luò)的連接方式、權(quán)重值和激活函數(shù)。網(wǎng)絡(luò)自身可以是對某種算法或函數(shù)的逼近,也可以是一種邏輯策略的表達(dá)。20世紀(jì)80年代中期,誤差反向傳播算法(Error Back Propagation Training,簡稱BP算法)的提出(Rumelhart et al.,1986),系統(tǒng)解決了多層神經(jīng)網(wǎng)絡(luò)隱含層連接權(quán)重的學(xué)習(xí)問題。Robert(1989)成功證明了多層感知機(jī)(是ANN的一種,結(jié)構(gòu)類似于圖3a)的萬能逼近定理,即對于任何閉區(qū)間內(nèi)的一個(gè)連續(xù)函數(shù),都可以用含有一個(gè)隱含層的BP網(wǎng)絡(luò)來逼近。這一理論上的證明,極大地鼓舞了當(dāng)時(shí)神經(jīng)網(wǎng)絡(luò)的研究人員,使得ANN風(fēng)靡一時(shí)。
但20世紀(jì)90年代BP算法被指出存在梯度消失問題,即在誤差梯度反向傳遞的過程中,后層梯度以乘法方式疊加到前層,誤差梯度傳到前層時(shí)幾乎為0,在更新權(quán)值的時(shí)候,由于誤差梯度太小,導(dǎo)致權(quán)值更新很小,因此無法對前層的參數(shù)進(jìn)行有效的學(xué)習(xí)。這是使用sigmoid激活函數(shù)的一大弊端。這一時(shí)期,符號學(xué)習(xí)中的決策樹、支持向量機(jī)(SVM)等算法被提出并被廣泛應(yīng)用,特別是在處理線性分類的問題上取得了當(dāng)時(shí)最好的成績,而ANN的研究則陷入了低谷。
不過,多倫多大學(xué)的Hinton教授并未放棄ANN的研究。功夫不負(fù)有心人,Hinton and Salakhutdinov(2006)提出了利用RBM編碼的深層神經(jīng)網(wǎng)絡(luò)(深度學(xué)習(xí)),該方法基于樣本數(shù)據(jù),通過一定的訓(xùn)練方法得到了包含多個(gè)層級的深度網(wǎng)絡(luò)結(jié)構(gòu)。傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)隨機(jī)初始化網(wǎng)絡(luò)中的權(quán)值,導(dǎo)致網(wǎng)絡(luò)容易收斂到局部最小值,為了解決這一問題,Hinton and Salakhutdinov(2006)提出使用無監(jiān)督預(yù)訓(xùn)練方法優(yōu)化網(wǎng)絡(luò)權(quán)值的初值,然后再進(jìn)行權(quán)值的微調(diào)。這使得深層神經(jīng)網(wǎng)絡(luò)變得實(shí)用起來,從此拉開了深度學(xué)習(xí)大發(fā)展的序幕。2012年10月,Hinton教授和他的兩個(gè)學(xué)生采用深層的卷積神經(jīng)網(wǎng)絡(luò)模型在著名的ImageNet大規(guī)模視覺識(shí)別挑戰(zhàn)賽上取得了當(dāng)時(shí)世界上的最好成績,這使得對于圖像識(shí)別的研究工作前進(jìn)了一大步,也把深度學(xué)習(xí)的應(yīng)用推向了一個(gè)新高度。
對于淺層模型來說,需要依靠人工經(jīng)驗(yàn)來抽取樣本的特征(對于天氣預(yù)報(bào)和氣候預(yù)測問題來說,就是預(yù)報(bào)因子),模型的輸入是這些已經(jīng)選取好的特征,模型只用來負(fù)責(zé)分類和預(yù)測。在淺層模型中,最重要的工作往往不是模型的構(gòu)建而是特征的選取,這樣就需要花費(fèi)大量的精力用來進(jìn)行特征的開發(fā)和篩選,這限制了淺層模型的應(yīng)用效果。而深度學(xué)習(xí)采取的是端到端(輸入端到輸出端)的學(xué)習(xí)方法,從輸入端經(jīng)過卷積、池化、反向傳播等操作后可以得到原始數(shù)據(jù)的特征表達(dá),基于這種特征表達(dá),可以對原始數(shù)據(jù)進(jìn)行識(shí)別與分類,在這個(gè)過程中,并沒有將學(xué)習(xí)任務(wù)分成一段一段的子任務(wù)進(jìn)行分析和處理??梢?相對于淺層學(xué)習(xí),深度學(xué)習(xí)采取了完全不同的處理手段,它是從輸入端輸入數(shù)據(jù),然后傳到中間層,通過層層抽象的方法直接得到輸入數(shù)據(jù)的特征表達(dá),進(jìn)而對這種特征表達(dá)進(jìn)行分析與處理,因此它是一種端到端的學(xué)習(xí)方法,具有明顯的優(yōu)勢。
根據(jù)學(xué)習(xí)方式,機(jī)器學(xué)習(xí)可以分為監(jiān)督學(xué)習(xí)算法、非監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)算法(杜智濤等,2021)。氣象問題大多都是分類問題和回歸問題,常用的是監(jiān)督學(xué)習(xí)算法,包括:多元線性回歸、邏輯回歸(LR)、隨機(jī)森林(RF)、支持向量機(jī)(SVM)、XGboost、人工神經(jīng)網(wǎng)絡(luò)(ANN)、深度學(xué)習(xí)(DL)等(朱玉祥等,2017;周志華,2022)。
機(jī)器學(xué)習(xí)在氣象領(lǐng)域中得到了廣泛應(yīng)用,代表性工作有:雷暴預(yù)報(bào)(Williams et al.,2008)、中尺度對流系統(tǒng)預(yù)報(bào)(Ahijevych et al.,2016)、對流風(fēng)實(shí)時(shí)預(yù)報(bào)(Lagerquist et al.,2017)、冰雹預(yù)報(bào)(Gagne et al.,2017a;Burke et al.,2020)、太陽輻照度預(yù)報(bào)(Gagne et al.,2017b)、2 m溫度的集合預(yù)報(bào)后處理(Rasp and Lerch,2018)、極端降水預(yù)報(bào)(Herman and Schumacher,2018)、實(shí)時(shí)風(fēng)暴預(yù)報(bào)(McGovern et al.,2019)、風(fēng)功率預(yù)報(bào)(Kosovic et al.,2020)和惡劣天氣預(yù)報(bào)(Hill et al.,2020)。圖4是與數(shù)值天氣預(yù)報(bào)相關(guān)的機(jī)器學(xué)習(xí)文章的統(tǒng)計(jì)結(jié)果,可見使用最多的是深度學(xué)習(xí)(DL)方法。
圖4 與數(shù)值天氣預(yù)報(bào)相關(guān)的機(jī)器學(xué)習(xí)文章統(tǒng)計(jì)(引自Bochenek and Ustrnul(2022))Fig.4 Statistics of machine learning articles related to numerical weather prediction(from Bochenek and Ustrnul(2022))
機(jī)器學(xué)習(xí)在飛機(jī)顛簸預(yù)報(bào)中應(yīng)用的代表性文獻(xiàn)主要有如下一些。
由于數(shù)值天氣預(yù)報(bào)(NWP)模式不能明確預(yù)報(bào)飛機(jī)尺度的湍流,Abernethy et al.(2008)使用支持向量機(jī)和邏輯回歸算法來捕捉大尺度大氣條件與湍流之間的關(guān)系,并應(yīng)用于晴空湍流預(yù)報(bào),結(jié)果表明該算法可以應(yīng)用于實(shí)時(shí)預(yù)報(bào)湍流預(yù)報(bào)系統(tǒng)。
Williams(2014)基于來自商用飛機(jī)的客觀湍流報(bào)告和模式預(yù)報(bào)數(shù)據(jù),采用隨機(jī)森林算法構(gòu)建適合空中交通管理人員、調(diào)度員和飛行員使用的湍流預(yù)報(bào),該算法于2014年在美國國家氣象局航空氣象中心得到應(yīng)用。
Hon et al.(2020)應(yīng)用XGboost算法,通過一個(gè)NWP模式生成的一組傳統(tǒng)“湍流指數(shù)”的優(yōu)化組合,生成了有技巧的航空湍流預(yù)報(bào)。經(jīng)過1 a時(shí)間,對16 000多架飛機(jī)飛行員報(bào)告的驗(yàn)證表明,基于機(jī)器學(xué)習(xí)的多指數(shù)共識(shí)(MIC)在亞太地區(qū)表現(xiàn)出一致的優(yōu)越性能,與單獨(dú)考慮湍流指數(shù)相比,技巧評分的中值提高了3%~17%。
Emara et al.(2021)將分類和回歸監(jiān)督機(jī)器學(xué)習(xí)模型與從6 000次常規(guī)航班收集的飛行運(yùn)營質(zhì)量保證數(shù)據(jù)結(jié)合使用,來估計(jì)未來時(shí)段內(nèi)的EDR以及湍流嚴(yán)重程度。為此,他們收集和分析了航空公司日常運(yùn)營中遇到不同程度湍流的數(shù)據(jù)。結(jié)果表明,在遇到湍流事件前10 s左右,模型能夠很好地預(yù)測EDR和湍流嚴(yán)重程度。該模型可以獲得對未來可能發(fā)生的湍流事件的近乎連續(xù)的預(yù)測,并為飛行員和空乘人員建立了早期預(yù)警系統(tǒng)的能力。
可能是由于受到湍流數(shù)據(jù)在時(shí)間和空間覆蓋范圍上的限制,或者受到學(xué)識(shí)所限,深度學(xué)習(xí)在飛機(jī)顛簸預(yù)報(bào)中應(yīng)用的文獻(xiàn)尚未見到。
目前的數(shù)值預(yù)報(bào)模式,時(shí)空分辨率越來越高,參數(shù)化方案越來越精細(xì),致使模式越來越復(fù)雜。而數(shù)值模式越復(fù)雜,就意味著要搜集更多氣象數(shù)據(jù),進(jìn)行更大量的計(jì)算,這對算力的消耗非常大。如 0.25°×0.25°精度的未來10 d數(shù)值預(yù)報(bào),需在超過3 000個(gè)節(jié)點(diǎn)的超級計(jì)算機(jī)上花費(fèi)數(shù)小時(shí),這讓數(shù)值預(yù)報(bào)的預(yù)測速度難以進(jìn)一步提升(Bi et al.,2023)。而飛機(jī)湍流預(yù)報(bào)更是需要十分精細(xì)的時(shí)空分辨率,采用數(shù)值模式開展飛機(jī)湍流預(yù)報(bào),對計(jì)算資源的花費(fèi)更高。
AI預(yù)報(bào)的出現(xiàn),給天氣預(yù)報(bào)帶來了新思路。AI擅長擬合未知的復(fù)雜數(shù)據(jù)關(guān)系,它不需要熟知大氣運(yùn)動(dòng)中的物理原理,只需要用深度學(xué)習(xí)的方法擬合氣象數(shù)據(jù)中的關(guān)系,就能做天氣預(yù)報(bào)。數(shù)值預(yù)報(bào)無法給出分鐘級的氣象預(yù)報(bào),而AI方法擬合雷達(dá)回波、衛(wèi)星遙感及臺(tái)站觀測等數(shù)據(jù)的能力,超過了光流法等外插方法,這使AI方法能更快(甚至在幾秒鐘內(nèi))做出天氣預(yù)報(bào)。
谷歌公司首次引入注意力機(jī)制,發(fā)展了“MetNet”系列預(yù)報(bào)模型,該模型輸入雷達(dá)和衛(wèi)星等觀測數(shù)據(jù),可以預(yù)報(bào)出降水的概率分布;該模型實(shí)現(xiàn)了1 km空間分辨率、2 min時(shí)間分辨率的12 h時(shí)效降水預(yù)報(bào),回報(bào)性能超過了NOAA的高分辨率快速更新天氣模式(HRRR)(Espeholt et al.,2021)。英偉達(dá)公司憑借其強(qiáng)大的算力資源,構(gòu)建了“FourCastNet”全球預(yù)報(bào)模型,其預(yù)報(bào)性能與歐洲中期天氣預(yù)報(bào)中心(ECMWF)的綜合預(yù)報(bào)系統(tǒng)(IFS)相當(dāng)(Pathak et al.,2022)。
華為開發(fā)的盤古氣象大模型提供的Z500五天預(yù)報(bào)均方根誤差為296.7,顯著低于之前最好的數(shù)值預(yù)報(bào)方法(均方根誤差為333.7)和AI方法(均方根誤差為462.5)。在保持精度的同時(shí),盤古氣象大模型也有著無可比擬的預(yù)報(bào)速度:在一張V100顯卡上只需要1.4 s就能完成24 h的全球氣象預(yù)報(bào),相比傳統(tǒng)數(shù)值預(yù)報(bào)提速10 000倍以上(Bi et al.,2023)。
復(fù)旦大學(xué)人工智能創(chuàng)新與產(chǎn)業(yè)研究院聯(lián)合大氣與海洋科學(xué)系發(fā)布了伏羲氣象大模型(https://arxiv.org/pdf/2306.12873.pdf)。該模型利用AI算法實(shí)現(xiàn)未來15 d的全球天氣預(yù)報(bào),在15 d預(yù)報(bào)中具有與ECMWF集合平均(EM)相當(dāng)?shù)念A(yù)報(bào)性能。伏羲超過了ECMWF高分辨率預(yù)報(bào)(HRES)的預(yù)報(bào)技巧時(shí)效,將Z500的預(yù)報(bào)時(shí)效從9.25 d延長到10.5 d,將2 m溫度的預(yù)報(bào)時(shí)效從10 d延長到14.5 d。
清華大學(xué)軟件學(xué)院王建民、龍明盛團(tuán)隊(duì)提出了極端降水臨近預(yù)報(bào)大模型,將數(shù)據(jù)驅(qū)動(dòng)與物理驅(qū)動(dòng)兩大科學(xué)范式緊密結(jié)合,顯著提高了千米尺度下0~3 h極端降水的預(yù)報(bào)能力,在全國62位氣象預(yù)報(bào)專家的過程檢驗(yàn)中大幅領(lǐng)先國際上的同類方法。目前該大模型已經(jīng)在國家氣象中心短臨預(yù)報(bào)業(yè)務(wù)平臺(tái)(SWAN 3.0)部署上線,將為全國極端降水天氣短臨預(yù)報(bào)業(yè)務(wù)提供支撐(Zhang et al.,2023)。
這些氣象大模型的開發(fā)和業(yè)務(wù)化運(yùn)行,給飛機(jī)湍流預(yù)報(bào)奠定了基礎(chǔ);基于這些大模型的輸出結(jié)果,飛機(jī)湍流預(yù)報(bào)可得實(shí)現(xiàn)。
未來的人工智能必將從通用大模型發(fā)展到行業(yè)或?qū)I(yè)大模型,AI技術(shù)為提升飛機(jī)顛簸預(yù)報(bào)能力提供了難得的機(jī)遇。雖然國內(nèi)外對AI技術(shù)(主要是其中的子集機(jī)器學(xué)習(xí))在飛機(jī)顛簸中的預(yù)報(bào)進(jìn)行了大量研究,但還存在以下幾個(gè)值得重點(diǎn)關(guān)注的問題:
1)飛機(jī)實(shí)況數(shù)據(jù)的開放共享以及多源湍流數(shù)據(jù)的融合構(gòu)建問題。比如,AMDAR(Aircraft Meteorological Data Relay)數(shù)據(jù)是通過民航班機(jī)的自動(dòng)觀測儀器觀測得到的氣象信息,主要包括:觀測時(shí)的經(jīng)度、緯度、飛行高度、氣溫、風(fēng)向、風(fēng)速、導(dǎo)出等效垂直風(fēng)速DEVG、湍流耗散率EDR、飛機(jī)結(jié)冰程度等。其中DEVG和EDR可以作為飛機(jī)顛簸程度的指標(biāo),在AI模型的訓(xùn)練中特別有用。但目前,該數(shù)據(jù)并未開放共享,這給飛機(jī)顛簸預(yù)報(bào)的研究帶來了很大的困難。當(dāng)然,基于這些飛機(jī)觀測數(shù)據(jù),融合飛行員話音報(bào)(PIPEPs)、衛(wèi)星、雷達(dá)等多源數(shù)據(jù)做出一套時(shí)空覆蓋完整的EDR數(shù)據(jù),對于相關(guān)科研和業(yè)務(wù)的開展具有重要意義。深度學(xué)習(xí)在數(shù)據(jù)插補(bǔ)和多源數(shù)據(jù)融合中正在發(fā)揮越來越大的作用,比如Ma et al.(2023)采用深度學(xué)習(xí)方法建立了一套1979年以來北極地區(qū)1°×1°格點(diǎn)月平均地表氣溫資料和2010年之后的北極地區(qū)日平均溫度資料,這為在數(shù)據(jù)稀疏的北極地區(qū)開展科學(xué)研究奠定了堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)。
2)以深度學(xué)習(xí)為代表的大模型和以傳統(tǒng)的統(tǒng)計(jì)學(xué)習(xí)或機(jī)器學(xué)習(xí)為代表的小模型之間的關(guān)系,以及深度學(xué)習(xí)的可解釋性問題?,F(xiàn)在的研究大多數(shù)都表明深度學(xué)習(xí)模型具有優(yōu)勢,但深度學(xué)習(xí)是有代價(jià)的,需要足夠多和足夠精確的數(shù)據(jù)以及昂貴的計(jì)算資源。當(dāng)數(shù)據(jù)和計(jì)算資源都受限時(shí),傳統(tǒng)的統(tǒng)計(jì)學(xué)習(xí)或機(jī)器學(xué)習(xí)可能更實(shí)用。開展飛機(jī)顛簸預(yù)報(bào)研究,能拿到的飛機(jī)觀測數(shù)據(jù)往往只是航路上的,時(shí)間也只是飛機(jī)飛行時(shí)才有,這時(shí)采用統(tǒng)計(jì)學(xué)習(xí)或機(jī)器學(xué)習(xí)的小模型可能更實(shí)用。對于構(gòu)建飛機(jī)顛簸預(yù)報(bào)模型來說,可解釋性也是一個(gè)十分重要的問題,相比于參數(shù)數(shù)量十分龐大的深度學(xué)習(xí)大模型,傳統(tǒng)的統(tǒng)計(jì)模型在可解釋性方面具有明顯優(yōu)勢。
3)基于集合預(yù)報(bào)的概率預(yù)報(bào)值得深入研究。湍流的高瞬態(tài)和局地性意味著飛機(jī)顛簸的確定性預(yù)報(bào)十分困難。從概率論的觀點(diǎn)來看,飛機(jī)顛簸是隨機(jī)變量,因此只有采用概率分布才能對其進(jìn)行準(zhǔn)確的描述。相對于單一預(yù)報(bào),集合預(yù)報(bào)或集成預(yù)報(bào)具有明顯的優(yōu)勢。無論是深度學(xué)習(xí)還是傳統(tǒng)的統(tǒng)計(jì)學(xué)習(xí),集合預(yù)報(bào)的表現(xiàn)往往都比單一預(yù)報(bào)更好,其原因可能是每個(gè)單獨(dú)的模型或成員擅長捕捉不同的模態(tài),將它們的預(yù)報(bào)結(jié)果結(jié)合起來,可以識(shí)別復(fù)雜的模態(tài),因而能夠取得更好的預(yù)報(bào)效果。由于飛機(jī)湍流的尺度小,單一模式或方法的不確定性往往更大。因此,基于集合預(yù)報(bào)或集成預(yù)報(bào),開展飛機(jī)湍流的概率預(yù)報(bào)極具實(shí)用價(jià)值。而更節(jié)省計(jì)算機(jī)機(jī)時(shí)的人工智能大模型為開展飛機(jī)湍流的概率預(yù)報(bào)提供了便利條件。
湍流是飛機(jī)飛行過程中遇到的一種影響巨大的災(zāi)害性天氣,其準(zhǔn)確預(yù)報(bào)對于減輕災(zāi)害影響具有十分重要的意義。但由于受計(jì)算機(jī)資源和數(shù)值模式發(fā)展水平的限制,數(shù)值模式目前尚無法直接模擬出湍流渦旋,所以湍流預(yù)報(bào)的準(zhǔn)確率離防災(zāi)減災(zāi)需求還存在不小差距,人工智能技術(shù)的發(fā)展為開展更加深入的研究并用來提高飛機(jī)顛簸的預(yù)報(bào)準(zhǔn)確率提供了條件。
相比傳統(tǒng)的數(shù)值模式,氣象AI大模型大大節(jié)省了計(jì)算機(jī)時(shí),這為開展高精度的湍流預(yù)報(bào)提供了新的機(jī)遇和條件。目前的人工智能技術(shù)在氣象預(yù)報(bào)和湍流預(yù)報(bào)中的應(yīng)用,大都是基于歷史數(shù)據(jù)的關(guān)系擬合,本質(zhì)上屬于統(tǒng)計(jì)學(xué)習(xí)的范疇。目前的深度學(xué)習(xí)技術(shù),說到底就是對由人工神經(jīng)元網(wǎng)絡(luò)構(gòu)成的非線性函數(shù)在大數(shù)據(jù)上所做的擬合,這種學(xué)習(xí)行為使得它在應(yīng)用的普適性上有很大的優(yōu)勢,滿足了我們讓機(jī)器“做得多”的要求,但是其結(jié)果的可靠性和合理性無法得到完備的驗(yàn)證,這是因?yàn)槲覀兩袩o法理解深度學(xué)習(xí)結(jié)果生成的邏輯,無法完美解釋學(xué)習(xí)的認(rèn)知行為。
人工智能自誕生以來,在其發(fā)展歷程中,一直存在兩種相互競爭的范式,即符號主義與聯(lián)接主義。符號主義認(rèn)為人工智能起源于數(shù)理邏輯,旨在用數(shù)學(xué)和物理學(xué)中的邏輯符號來表達(dá)思維的形成,通過大量的“如果(if)-就(then)”規(guī)則進(jìn)行定義,產(chǎn)生像人一樣的推理和決策。符號主義強(qiáng)調(diào)思維過程的邏輯性,側(cè)重于推理和解決問題的思路。聯(lián)結(jié)主義又稱仿生學(xué)派或生理學(xué)派,其主要原理為神經(jīng)網(wǎng)絡(luò)及神經(jīng)網(wǎng)絡(luò)間的連接機(jī)制與學(xué)習(xí)算法。它通過模擬人類大腦的神經(jīng)系統(tǒng)來實(shí)現(xiàn)學(xué)習(xí)。聯(lián)結(jié)主義認(rèn)為知識(shí)和技能的獲取是通過對大量數(shù)據(jù)進(jìn)行學(xué)習(xí)來實(shí)現(xiàn)的。
符號主義和聯(lián)結(jié)主義幾乎同時(shí)起步,但20 世紀(jì)80 年代之前符號主義一直占據(jù)主導(dǎo)地位,而20 世紀(jì)90 年代之后聯(lián)接主義逐步發(fā)展起來,進(jìn)入21 世紀(jì)后更是迎來了發(fā)展的高潮,大有替代符號主義之勢。張鈸等(2020)稱符號主義為第一代AI,稱聯(lián)接主義為第二代AI,將要發(fā)展的AI 稱為第三代AI。第一代AI是知識(shí)驅(qū)動(dòng)的,即利用知識(shí)、算法、算力3個(gè)要素構(gòu)造AI。第二代AI是數(shù)據(jù)驅(qū)動(dòng)的,即利用數(shù)據(jù)、算法、算力3個(gè)要素構(gòu)造AI。
20世紀(jì)80年代我國就開始了氣象人工智能的研究和業(yè)務(wù)嘗試,包括專家系統(tǒng)、人工神經(jīng)元網(wǎng)絡(luò)、智能數(shù)據(jù)庫、天氣過程的計(jì)算機(jī)理解和仿真、衛(wèi)星云圖的分析識(shí)別等方面(王耀生,1994)。氣象領(lǐng)域大量的觀測、分析、再分析等數(shù)據(jù)為建立人工智能大模型提供了條件和便利,這可能也是目前氣象領(lǐng)域AI大模型如雨后春筍般不斷涌現(xiàn)的一個(gè)原因(Bi et al.,2023;Zhang et al.,2023)。但目前人工智能在氣象領(lǐng)域的應(yīng)用,基本上還是屬于第二代AI。張鈸等(2020)認(rèn)為符號主義和聯(lián)接主義兩種范式只是從不同的側(cè)面模擬人類的心智(或大腦),具有各自的片面性,依靠單個(gè)范式不可能觸及人類真正的智能;他提出第三代人工智能的發(fā)展路徑是融合第一代的知識(shí)驅(qū)動(dòng)和第二代的數(shù)據(jù)驅(qū)動(dòng)的人工智能,同時(shí)利用知識(shí)、數(shù)據(jù)、算法和算力4個(gè)要素,建立新的可解釋和魯棒性的AI理論與方法,發(fā)展安全、可信、可靠和可擴(kuò)展的AI技術(shù)。基于這種思想,我們對氣象領(lǐng)域的第一代和第二代人工智能進(jìn)行了歸納,并提出了氣象領(lǐng)域第三代人工智能的發(fā)展思路(圖5)。
圖5 氣象領(lǐng)域三代人工智能的發(fā)展路徑Fig.5 Development path of the third generation of artificial intelligence in the field of meteorology
對于氣象領(lǐng)域來說,“知識(shí)”可以是物理機(jī)理,也可以是預(yù)報(bào)員的經(jīng)驗(yàn),或者是天氣學(xué)、氣候?qū)W等方面的基本原理。氣象第一代人工智能是采用數(shù)理邏輯、歸納、類比等算法,基于“知識(shí)”自動(dòng)形成推理原則,代表應(yīng)用為氣象專家系統(tǒng)、氣象智能數(shù)據(jù)庫。多元線性回歸、SVM、決策樹、隨機(jī)森林等算法,可以歸為第一代人工智能算法。氣象第二代人工智能主要采用ANN、深度學(xué)習(xí)等算法,基于模式數(shù)據(jù)和觀測數(shù)據(jù)做天氣預(yù)報(bào)和氣候預(yù)測,代表應(yīng)用為華為的盤古氣象大模型。氣象領(lǐng)域未來的第三代人工智能可能要以深度學(xué)習(xí)為主,融合數(shù)理邏輯推理算法,同時(shí)基于“知識(shí)”和“數(shù)據(jù)”,即把聯(lián)結(jié)主義學(xué)派和符號主義學(xué)派的優(yōu)勢結(jié)合起來,開展天氣預(yù)報(bào)和氣候預(yù)測工作。當(dāng)然,氣象第三代人工智能需要具有更高的預(yù)報(bào)準(zhǔn)確率,具有自學(xué)習(xí)、自適應(yīng)(比如適應(yīng)由于氣候變化導(dǎo)致的氣象數(shù)據(jù)規(guī)律的變化等)等特點(diǎn),同時(shí)在機(jī)理上具有較好的可解釋性。
對于氣象預(yù)報(bào)和飛機(jī)湍流預(yù)報(bào)來說,把基于數(shù)據(jù)驅(qū)動(dòng)的人工智能與以牛頓力學(xué)為基礎(chǔ)的物理定律相融合,是增強(qiáng)氣象大模型或湍流預(yù)報(bào)大模型的可解釋性、魯棒性并且提高預(yù)報(bào)準(zhǔn)確率的重要途徑。對于在業(yè)務(wù)上開展概率預(yù)報(bào)來說,人工智能大模型節(jié)省計(jì)算機(jī)時(shí)的優(yōu)越性更是具有重要的實(shí)用價(jià)值。
致謝:國家氣象中心蔡雪薇高工對本文提出了建設(shè)性意見,在此致以最誠摯的感謝!