李 婧,何貞銘,徐佳琪,王晶晶,陳 昊
(長江大學 地球科學學院,湖北 武漢 430100)
在過去的一個世紀里,全球范圍內(nèi)的氣候均呈不斷上升趨勢,過去四年也是有紀錄以來最熱的四年,全球氣候的極端特征明顯,隨之而來的是全球各地頻發(fā)的嚴重極端天氣事件。因極端天氣事件頻繁且突然,許多地區(qū)準備不足或來不及準備,使得生產(chǎn)生活遭受到巨大損失,甚至會危及生命。這些多發(fā)的極端天氣不斷威脅著基礎(chǔ)設(shè)施建設(shè)、人類健康以及生態(tài)系統(tǒng)。
基于科學技術(shù)的飛速發(fā)展,人工智能(Artificial Intelligence)在各個領(lǐng)域大展身手,利用機器學習、深度學習等工具來解決行業(yè)內(nèi)的棘手問題、開拓新的業(yè)務領(lǐng)域。在氣象領(lǐng)域中也逐漸發(fā)揮著巨大的作用,人工智能應用到極端天氣上可以準確預測時間地點同時做好應對措施,減少生命財產(chǎn)損失。
在1956 年美國達特茅斯學院的一個研討會上[1],AI(Artificial Intelligence)正式被提出,如今人工智能呈現(xiàn)出了深度學習、跨界集成、人機協(xié)作等新特征[2-3]。
中國是世界上最早開始進行短期氣候預測研究的國家之一[4]。早在1930 年中國對三大濤動與旱澇之間的關(guān)系進行了研究,但是由于影響氣候變化的因素眾多及相互關(guān)系復雜多變,因此預測過程十分困難。在過去的60 年中,隨著時代發(fā)展氣象數(shù)據(jù)類型逐漸豐富,樣本長度不斷擴大,同時計算機的應用也變得廣泛,計算速度的加快,中國的短期氣候預測技術(shù)經(jīng)歷了逐步完善、改進和持續(xù)發(fā)展的過程??偟膩碚f傳統(tǒng)天氣預測技術(shù)經(jīng)歷了三個主要的發(fā)展階段[5-6]:經(jīng)驗統(tǒng)計,物理統(tǒng)計和動態(tài)統(tǒng)計。
在20 世紀70 年代之前,中國天氣預測剛剛起步,由于當時氣象資料稀少、計算條件十分落后,因此主要采用經(jīng)驗統(tǒng)計技術(shù),借以歷史資料如歷史曲線演變、天氣變化周期、天氣諺語中的經(jīng)驗等進行分析。隨著資料的積累和技術(shù)的發(fā)展,數(shù)理統(tǒng)計方法和更多其他方法也得到了應用,但這一時期天氣預報制作仍然全部由人工完成。
而后伴隨時代的進步,物理統(tǒng)計發(fā)展迅速,建立了基于多種數(shù)理統(tǒng)計方法的統(tǒng)計預測模型,到目前為止統(tǒng)計預報方法的研究和應用一直在不斷進行,并已成為短期氣候預報的主要方法之一[7-11]。通過對短期氣候預測理論的不斷研究發(fā)展,物理因素的分析得到了極大的重視,到了20 世紀80 年代后期,中國氣候業(yè)務部門基于物理統(tǒng)計方法建立了第一代短期氣候預測自動化業(yè)務系統(tǒng),此時基本告別經(jīng)驗統(tǒng)計階段。
動力氣候模式預測系統(tǒng)是繼物理統(tǒng)計分析之后的另一個新階段,在“九五”科技攻關(guān)相關(guān)項目的支持下國家氣候中心建立了第1 代全球海洋資料同化系統(tǒng)(BCC_GODAS1.0),并于2002-10 投入短期氣候預測業(yè)務系統(tǒng)的業(yè)務試運行,在氣候預測業(yè)務系統(tǒng)中發(fā)揮了重要作用[12]。在之后的“十五”“十一五”期間物理統(tǒng)計預測模型的應用和外擴隨著其他各種項目研發(fā)結(jié)果的支持也逐漸增加。
近年來有很多關(guān)于人工智能、機器學習和深度學習的新聞,各個領(lǐng)域都在嘗試與其相結(jié)合,試圖通過機器學習和深度學習等技術(shù)解決行業(yè)中的問題并擴展新業(yè)務。當美國硅谷、國內(nèi)BAT 等互聯(lián)網(wǎng)公司在金融、醫(yī)療、安全、無人駕駛等領(lǐng)域與人工智能完美結(jié)合時[13],人工智能在氣象學領(lǐng)域的應用也開始走進人們的視野。
在數(shù)值天氣預報中[13],對15~30 d 的延伸期預測一直沒有好的方法,因此延伸期預報一直是氣象預報行業(yè)信息研究報中的難點。
國家氣象中心在2012-12 完成了基于貝葉斯和支持向量機(SVM)的高溫、暴雨集合預報概率預報技術(shù)研究以及相應的預警指數(shù)構(gòu)建,利用支持向量機(SVM)方法,通過對徑向基核的核函數(shù)選取,建立暴雨中期預警SVM 數(shù)學模型。2013-10,Earth Risk 發(fā)布了一個40 d 的氣溫概率預報模式TempRisk Apollo[14]。用深度學習的方法先把近一百年的歷史氣象數(shù)據(jù)和數(shù)千億次的計算建立氣候模型,再與目前的氣候條件進行比較,最后運用預測分析的方法計算冷熱天氣的概率,是一種區(qū)別于傳統(tǒng)天氣預報的獨立的預報方法。然而單憑人工智能并不可取,比如在更復雜的天氣進行降雨預報時仍需考慮物理原理,因此該公司也開始重視物理機制和人工智能技術(shù)的結(jié)合。2015 年,Earth Risk 在最新的TempRisk Apollo II 的算法中引入了美國國家環(huán)境預報中心(NCEP)和歐洲中期天氣預報中心(ECMWF)的數(shù)值預報結(jié)果,提供了更加綜合和可靠的預報。
與短期、中期和長期預報相比,短臨預報是天氣預報領(lǐng)域中最年輕的成員。短臨預報比短期預報時間更短,主要集中在0~12 h,重點面向中小尺度的天氣系統(tǒng),特別是強對流天氣系統(tǒng)的預報,具有較高的時效性,準確的短臨預報可以為防災減害提供有力保證。
北京彩徹區(qū)明科技公司在2014 年發(fā)布了一款基于位置的短臨預報APP——“彩云天氣預報”[15],通過地面天氣實時觀測,結(jié)合衛(wèi)星遙感云圖和數(shù)值天氣預報等數(shù)據(jù)的圖像識別、系統(tǒng)外推和深度學習,并與用戶的位置相結(jié)合,把用戶周圍小時內(nèi)的降水短臨預報的準確性提升到了90%及以上,落區(qū)甚至精確到用戶周圍的每一條街道。但由于該APP 的預測方法并未基于天氣過程的物理基礎(chǔ),因此遇到強對流天氣則會漏報。
中國在2015-06,由中國科學院自動化研究所與中國氣象局公共服務氣象服務中心聯(lián)合實驗室針對氣象大數(shù)據(jù)中的機器學習方法進行了氣象多源數(shù)據(jù)融合建模、關(guān)系挖掘、服務行業(yè)大數(shù)據(jù)挖掘等多項研究,研發(fā)并啟動了一系列成果,包括分鐘降水預報、快速循環(huán)地面氣象要素融合、強對流天氣識、能見度監(jiān)測與預報等。其中多源數(shù)據(jù)融合建模已實現(xiàn)分鐘降水預報全國0~2 h、1 km×1 km 和每6 min 一次的降水預報,實現(xiàn)了雨、雪、雨夾雪的混合形態(tài)識別,識別精度超過85%。
而后隨著深度神經(jīng)網(wǎng)絡(luò)的發(fā)展,短臨預報中的人工智能算法應用越來越多。2017 年深圳市氣象局和阿里巴巴共同舉辦了以“智慧城市,智慧國家”為主題的競賽,目的是使用雷達回波數(shù)據(jù)進行短期降水預報。2018 年,深圳市氣象局、香港天文臺與阿里云一起舉辦了全球天氣AI 挑戰(zhàn)賽。從兩次競賽的結(jié)果可知卷積神經(jīng)網(wǎng)絡(luò)(CNN)結(jié)合循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)可以更好地解決時空預測的問題。使用CNN與RNN 方法進行短臨預測源于香港科技大學施行健博士的文章,主要思想是使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)層從輸入的雷達數(shù)據(jù)中提取特征,并與LSTM 結(jié)合以進行序列預測。2017年施行健博士升級了模型框架[16],并在NIPS 上發(fā)布了Trajectory GRU(TrajGRU)。TrajGRU 模型可以解決傳統(tǒng)CNN-LSTM 的短板問題,它能夠主動學習時空遞歸連接結(jié)構(gòu),動態(tài)刻畫時空特征,更貼合短臨的場景。
中國數(shù)值預報的發(fā)展起步較晚,1954 年中國剛開始相關(guān)的理論研究,在1965 年推出了北半球數(shù)據(jù)預報產(chǎn)品,雖然每年都會提出新模式,但基本均為覆蓋全球的大范圍預報,直到1997 年中國才正式推出中尺度數(shù)值天氣預報系統(tǒng)[17]。
MM5 是美國賓夕法尼亞州立大學/國家大氣研究中心從20 世紀80 年代以來共同開發(fā)的第5 代區(qū)域中尺度數(shù)值模式[18]。中尺度數(shù)值模式在全球最廣泛的應用是美國大氣研究中心NCAR、國家環(huán)境預報中心NCEP 等多單位聯(lián)合建立發(fā)展的WRF(Weather Research and Forecasting Model),作為新一代中尺度預報模式和同化系統(tǒng),它可以提高對中尺度天氣系統(tǒng)的認識和預報水平,同時促進了成果向業(yè)務應用的轉(zhuǎn)化[19]。
2018-06-15,由北京氣象部門研發(fā)的“睿圖”短期數(shù)值預報子系統(tǒng)(RMAPS-ST)1 h 循環(huán)系統(tǒng)正式投入實時業(yè)務試運行。系統(tǒng)使用圖像識別和深度學習等新技術(shù),基于雷達資料快速更新四維變分同化技術(shù)和三維數(shù)值云模式,能夠提供10 min 快速更新循環(huán)的區(qū)域高分辨率大氣三維熱動力場的實時快速分析。
AI 在日常天氣預測中的成績斐然,面對危害更大的極端天氣,人們希望借助AI 強大技術(shù)手段繼續(xù)其在極端天氣中的應用。
中國沿海城市是人口稠密和高度城市化的地區(qū),隨著城市建成區(qū)面積不斷擴大,地表持水量、積水和入滲能力減弱,抵御短期強降雨的能力大大降低,極易發(fā)生內(nèi)澇。如果能夠準確預測強降雨雪的時間,對人們的生命財產(chǎn)安全具有重要的意義。
在氣溫預測中SINGH 等[20]研究了氣象溫度屬性及針對于特定數(shù)據(jù)序列的依賴關(guān)系,進而提出神經(jīng)網(wǎng)絡(luò)結(jié)合基于時間序列的遺傳算法(genetic algorithm,GA)的綜合反向傳播溫度預測模型。在考慮了包括降雨量[21]、相對溫度等多各氣象因素后又提出一種基于遺傳算法和BP 神經(jīng)網(wǎng)絡(luò)的實時溫度預測模型。AZNARTE 等[22]綜合使用四種機器學習算法——廣義線性模型、多變量自適應回歸樣條、隨機森林和分位數(shù)隨機森林與數(shù)值天氣預報進行建模、預測,提出了一種動態(tài)線性評估實驗方法。
雖然中國的強降雨雪預報研究相對落后,但也有許多值得借鑒的成就。蘭州大學的陳曉云等[23]利用多維時間序列數(shù)據(jù)挖掘模型,對多維序列進行符號化后按規(guī)則提取降雨天氣模型;黃明明等[24]通過對北京市日降水量數(shù)據(jù)這種不均衡樣本提出一種偽最近鄰算法,與傳統(tǒng)k 最近鄰算法相比,偽最鄰近算法中的降水量預報的準確性和晴雨預報的各項準確率指標顯著提升。在2019 年張遠汀等[25]將決策樹模型與深度學習模型串接,預測強雨雪天氣過程中的積雪以及積雪的深度。重慶市作為曾飽受天災之苦的地區(qū),重慶市氣象局利用百度飛槳深度學習平臺,與百度智能云在2019 年共同構(gòu)建了智能氣象系統(tǒng),但該系統(tǒng)仍處于測試階段,不會作為最終預報數(shù)據(jù)發(fā)布。
2019 年張文海等[26]基于廣東多普勒天氣雷達的三維拼圖資料,利用機器學習開發(fā)了一種冰雹識別和臨近預報的人工智能算法,該算法對冰雹這類非線性強天氣過程具有較強的識別能力。中國氣象AI 公司KuWeather 發(fā)布了最新的基于深度學習的冰雹監(jiān)測和預報的產(chǎn)品,該產(chǎn)品顆粒度直接達到經(jīng)緯度級別,同時其人工智能團隊成功研發(fā)了未來2 h 分鐘級降水短臨預報。平臺能夠?qū)崟r判斷全國任何地理范圍內(nèi)是否有冰雹,并預測未來特定時間段內(nèi)的冰雹。
2014 年DAVID 及其團隊[27]將機器學習應用于冰雹規(guī)模集合進行冰雹尺寸預測,它能夠讓預報員提前數(shù)小時和數(shù)天預測嚴重雷暴的可能性和特征,輸出的模型可以推斷其強度。2019 年DAVID 等[28]利用分析視覺圖像的機器學習模式和人工智能技術(shù)可以改進雷暴及冰雹預報。該研究還利用不同的機器學習模式進行隨機預測,用來改進冰雹預報。隨機預報模式并沒有分析圖像,而是提出一系列問題,像一個流程圖一樣,用來確定冰雹概率。這些問題可能包括露點、氣溫和風是否超過或低于閾值等。2020 年俄克拉荷馬大學的BURKE 等[29]使用機器學習,把來自新的高分辨率整體預報系統(tǒng)版本2(HREFv2)的數(shù)值天氣預報(NWP)數(shù)據(jù)進行處理來改善冰雹預報。
厄爾尼諾/拉尼娜現(xiàn)象指的是熱帶太平洋海表溫度異常上升/下降的氣候現(xiàn)象,2014—2016 年發(fā)生的超強厄爾尼諾事件具有“生命周期長、累計強度大、峰值強度高”三個重要特點,是20 世紀以來最強的厄爾尼諾事件之一。此次厄爾尼諾事件是全球氣候異常變化的重要因素之一,包括中國在內(nèi)的多個國家都經(jīng)歷了嚴重的洪澇災害或旱災,導致多國糧食嚴重減產(chǎn),人民生命財產(chǎn)受損。但由于傳統(tǒng)天氣預報很難對一年后的情況做出準確預測,所以厄爾尼諾的長期預測一直是個難題。
2017 年,許柏寧等[30]通過實驗從設(shè)計的深度學習網(wǎng)絡(luò)模型中挑出一種可以選擇預測區(qū)域海平面溫度異常的模型-序列到序列模型,該模型在中長期(提前7 個月以上)預測上的均方根誤差表現(xiàn)較好。在實際區(qū)域海平面溫度異常預測實驗中,該模型能較好地預測出海平面溫度異常變化趨勢,但峰值處表現(xiàn)較差。2018 年自然資源部國家海洋環(huán)境預測中心與清華大學合作研發(fā)了具有高預測能力的機器深度學習厄爾尼諾預測模型,并在2019 年厄爾尼諾春季預測會議上實現(xiàn)了試驗預測。南京信息工程大學與韓國研究人員YOO-GEUN等[31]三位研究人員在2019年開發(fā)出一種深度學習模型來預測厄爾尼諾事件。與目前已知的預測方法相比,他們的算法模型更為準確且最早可提前一年半預測厄爾尼諾事件。
隨著科技的進步人們已經(jīng)解決了一部分的氣候問題,但氣候預測仍是全世界氣象學家所面臨的難題,極端氣候事件的預測更加困難,氣候時間變化的規(guī)律和形成機理也一直沒有研究徹底,因此今后不僅要發(fā)展預測監(jiān)測能力,也要研究氣候事件的統(tǒng)計特征的變化規(guī)律,而這些問題借助著人工智能都可以更好地實現(xiàn)。盡管人工智能在天氣預報中有著舉足輕重的作用,但招攬人才的時候卻不順利,專家曾說在人工智能領(lǐng)域中人才嚴重失衡,目前行業(yè)熱度和高薪都集中在自動駕駛、計算機視覺等領(lǐng)域,因此大批頂尖人才的首選不是礦產(chǎn)勘探、天氣預報等關(guān)乎國計民生的行業(yè)。氣象領(lǐng)域人工智能的應用雖然已有一定的時日,在某些方面也取得了一定的進展,但總的來說這些應用仍較為基礎(chǔ),大有開發(fā)前景。