国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于概率圖模型的天氣預(yù)測研究

2019-07-23 09:36:32劉麗丹
計算機技術(shù)與發(fā)展 2019年7期
關(guān)鍵詞:平均氣溫高斯降水量

劉麗丹

(南京航空航天大學(xué) 計算機科學(xué)與技術(shù)學(xué)院,江蘇 南京 210018)

0 引 言

天氣變化與人們的生活有著十分密切的關(guān)系,人們總是想方設(shè)法去預(yù)測未來的天氣變化,以期能夠利用有利天氣,防范不利天氣。傳統(tǒng)的天氣預(yù)測方法主要有天氣學(xué)方法、動力學(xué)方法和統(tǒng)計學(xué)方法。到20世紀50年代,數(shù)值預(yù)報的出現(xiàn)使天氣預(yù)測有了革命性的變化,是大氣科學(xué)發(fā)展的一個里程碑,也是近代大氣科學(xué)成為一門精細和定量化科學(xué)的標志[1],直到現(xiàn)在仍是天氣預(yù)報的核心。但是數(shù)值模型并不能完全模擬大氣運動,對于很多天氣現(xiàn)象的發(fā)生、演變的內(nèi)在機理和規(guī)律,人們尚未完全掌握,提高天氣預(yù)報的準確率,仍是一個世界性難題。

目前,隨著人工智能和機器學(xué)習(xí)的蓬勃發(fā)展,天氣預(yù)測也迎來了新的發(fā)展機遇。一方面,機器學(xué)習(xí)方法可以用于解決數(shù)值預(yù)報分辨率低的問題,通過降尺度方法,提高預(yù)測精度。自20世紀90年代統(tǒng)計降尺度方法發(fā)展以來,以人工神經(jīng)網(wǎng)絡(luò)和支持向量機為代表的各種機器學(xué)習(xí)方法被應(yīng)用于統(tǒng)計降尺度研究。1997年,Cavasos用人工神經(jīng)網(wǎng)絡(luò)降尺度預(yù)測墨西哥東北部20個站的冬季日降水[2];2006年,Tripathi等將基于支持向量機的統(tǒng)計降尺度模型用于研究印度月降水[3];2016年,Santri等用基于最小絕對值收縮和選擇算子(Lasso[4])的分位數(shù)回歸建立統(tǒng)計降尺度模型[5],用于預(yù)測印度尼西亞單個站點的極端降水;周璞等用自組織映射神經(jīng)網(wǎng)絡(luò)(SOM)降尺度方法對江淮流域逐日降水量進行了模擬評估[6]。這些方法都取得了較好的效果,但是,此類方法依賴原始天氣模型輸出產(chǎn)品,準確率依然受限于對天氣規(guī)律的模擬程度。

另一方面,由數(shù)據(jù)驅(qū)動的機器學(xué)習(xí)方法可能幫助人們認識到更多的天氣規(guī)律,它不依賴任何物理模型,能夠從歷史觀測數(shù)據(jù)中尋找天氣演變規(guī)律,進而做出預(yù)測。預(yù)測未來時間空間的氣象要素值,是屬于非平穩(wěn)時間序列的預(yù)測問題。非平穩(wěn)時間序列的預(yù)測,可以采用參數(shù)方法或非參數(shù)方法,參數(shù)方法有自回歸(AR)、神經(jīng)網(wǎng)絡(luò)(NN)、支持向量回歸(SVR)和隱馬爾可夫模型(HMM)等,非參數(shù)方法有近鄰(neighborhood)和局部拓撲(local topology)模型、非參數(shù)貝葉斯模型和函數(shù)分解等[7]。由于用于預(yù)測的自變量之間存在相關(guān)性,天氣預(yù)測還要解決多重共線性的問題,適合的方法有Lasso回歸、Ridge回歸[8]和SVR[9]等。將這些方法用于單站天氣預(yù)測,國內(nèi)外研究已有很多,但關(guān)于區(qū)域多站點空間相關(guān)性的研究并不多,大氣作為一個連續(xù)的系統(tǒng),各站點間是有一定聯(lián)系的,如果進行多站點聯(lián)合預(yù)測,加入?yún)f(xié)變量相關(guān)性的考量,理論上應(yīng)該能夠提高預(yù)測準確率。李艷玲等用空間自回歸模型預(yù)測新疆地區(qū)氣溫與降水量[10],對新疆地區(qū)各個測站氣溫和降水量之間的空間關(guān)系進行了研究,研究表明相鄰地區(qū)氣溫和降水量的分布在空間上具有較強的相關(guān)性,但是其中的空間相關(guān)矩陣是人為設(shè)定的。在概率圖模型研究領(lǐng)域,一些方法已經(jīng)被證實可以應(yīng)用于天氣預(yù)測。Wytock M等給出了條件高斯圖模型的一種估計方法,可以學(xué)習(xí)出隨機變量間的相關(guān)關(guān)系[11],最近,Huang等提出了一種基于聯(lián)合條件圖套索(JCGL)的聯(lián)合條件高斯圖模型[12],能夠?qū)W習(xí)異構(gòu)協(xié)變量的條件相關(guān)性,同時預(yù)測不同地域的不同氣象變量。

文中主要嘗試使用易獲取的國際交換站地面觀測數(shù)據(jù),應(yīng)用條件高斯圖模型,學(xué)習(xí)出可以從天氣學(xué)角度解釋的區(qū)域多站點降水量和平均氣溫的空間相關(guān)關(guān)系,并檢驗聯(lián)合條件高斯圖模型聯(lián)合預(yù)測多站點降水量和氣溫在實際應(yīng)用中的準確率和穩(wěn)定性。

1 相關(guān)工作

概率圖模型可以簡潔地刻畫出復(fù)雜分布的結(jié)構(gòu),具有表示、推理和學(xué)習(xí)的能力[13],現(xiàn)已被廣泛應(yīng)用于機器學(xué)習(xí)、計算機視覺、自然語言處理、語音識別、專家系統(tǒng)、用戶推薦、社交網(wǎng)絡(luò)挖掘、生物信息學(xué)等研究領(lǐng)域的最新成果中[14-15]。它以圖為表示工具,最常見的是用一個節(jié)點表示一個或一組隨機變量,節(jié)點之間的邊表示變量間的概率相關(guān)關(guān)系,即“變量關(guān)系圖”。根據(jù)邊的性質(zhì)不同,概率圖模型可大致分為兩類:一類是使用有向無環(huán)圖表示變量間的依賴關(guān)系,稱為有向圖模型或貝葉斯網(wǎng),另一類是使用無向圖表示變量間的相關(guān)關(guān)系,稱為無向圖模型或馬爾可夫網(wǎng)[16]。無向圖中的高斯圖模型,雖帶有強假設(shè),但在數(shù)學(xué)上易于處理,而且根據(jù)中心極限定理,可以較好地近似實際連續(xù)分布[17]。

1.1 高斯圖模型

假設(shè)p維隨機向量Y=(Y(1),Y(2),…,Y(p))服從多元正態(tài)分布N(μ,Σ),給定一個隨機樣本Y(1),Y(2),…,Y(n),希望估計出精度矩陣C=Σ-1,C中元素Cij=0表示Y(i)與Y(j)在給定其他所有變量的條件下相互獨立,可表示為Y(i)⊥Y(j)|YSi,j。

高斯圖模型中,隨機向量Y由圖G=(V,E)表示,其中V為圖的節(jié)點集,包含p個節(jié)點,E為圖中節(jié)點之間的邊集,E=(ei,j)1≤i

1.2 條件高斯圖模型

高斯圖模型中的均值μ是常數(shù),條件高斯圖模型則允許均值μ隨協(xié)變量x改變。Y服從條件分布:

Y|x~N(Γx,Σ)(或Y|x~N(-C-1Θ-1x,C-1))

其中,?!蔙p×q,Θ∈Rq×p,x=(x(1),x(2),…,x(q)),Y(i)與Y(j)條件獨立則表示為Y(i)⊥Y(j)|{YSi,j,x}。這種模型不僅能模擬隨機變量Y(1),Y(2),…,Y(p)之間的條件相關(guān)關(guān)系,也能模擬Y與協(xié)變量x之間的條件相關(guān)關(guān)系。此模型也可由圖G=(V,E)表示。

1.3 聯(lián)合條件高斯圖模型

以上兩種圖模型都是基于獨立同分布的數(shù)據(jù)估計單個圖模型,聯(lián)合條件高斯圖模型則可以針對異構(gòu)數(shù)據(jù)進行多個圖模型的聯(lián)合估計,除具備條件高斯圖模型的優(yōu)點外,還能夠刻畫多個帶噪聲協(xié)方差的多元線性回歸的聯(lián)合學(xué)習(xí)。在條件高斯圖模型的基礎(chǔ)上,增加一維離散隨機變量z∈N+,Y服從條件分布:

Y|x~N(-Σk(Θk)Txk,Σk),k∈N+

Y(i)與Y(j)條件獨立表示為Y(i)⊥Y(j)|{YSi,j,x,z=k}。此模型可由一個無向圖的集合ζ={G(k)=(V,E(k)),k∈N+}表示。

2 空間相關(guān)關(guān)系學(xué)習(xí)模型

輸出變量Y∈Rn×p,輸入變量X∈Rn×q,q=m×p,n為樣本量,p為站點數(shù),m為協(xié)變量維數(shù),即參與預(yù)測的氣象要素個數(shù)。利用條件高斯圖模型,有:

Y=f(X)=-C-1Θ-1X

樣本對{yi,xi}i∈n的對數(shù)似然為:

-log|C|+tr[SyyC+2SyxΘ+C-1ΘTSxxΘ]

應(yīng)用Matt Wytock的估計方法[11],最小化負對數(shù)似然并加入1懲罰項,即:

估計出精度矩陣C,C-1即為空間相關(guān)系數(shù)矩陣。

3 多要素聯(lián)合預(yù)測模型

在上述模型基礎(chǔ)上,應(yīng)用聯(lián)合條件高斯圖模型,聯(lián)合預(yù)測K類氣象要素。

4 實驗與結(jié)果分析

4.1 實驗數(shù)據(jù)與評估標準

為方便實現(xiàn)理論成果向業(yè)務(wù)應(yīng)用的轉(zhuǎn)化,文中應(yīng)用的是1980-2011年汛期(5-9月)中國華東地區(qū)21個國際交換站的日平均氣溫、氣壓、相對濕度、風和24小時降水量等地面觀測數(shù)據(jù),來自于國家氣象科學(xué)數(shù)據(jù)共享服務(wù)平臺的中國地面國際交換站氣候資料日值數(shù)據(jù)集(V3.0)。數(shù)據(jù)經(jīng)過清理、歸一化和中心化處理,以1980-2010年數(shù)據(jù)為訓(xùn)練集,2011年數(shù)據(jù)為測試集。

在模型預(yù)測效果評估中,采用檢驗回歸模型較普遍的兩個評價指標:均方根誤差(RMSE)和絕對誤差(MAE),具體表達式為:

4.2 實驗結(jié)果

4.2.1 空間相關(guān)性學(xué)習(xí)

用處理后的數(shù)據(jù)建立條件高斯圖模型,運行1萬次,取精度矩陣C的均值。如圖1所示,為21個站點間的降水量相關(guān)系數(shù)可視化矩陣,顯示了模型訓(xùn)練出的21站24小時降水量值的相關(guān)性。由于對角線上自相關(guān)性過強,為更好地展示不同站點的相關(guān)性,將對角線值改為0,方便對比。

由圖1可見,對角線附近的地理位置靠近的站點呈正相關(guān),距離越遠相關(guān)性越小,不同氣候區(qū)的站點會有明顯的負相關(guān)。例如:上海、杭州與定海(舟山)地理位置較近,處于長江口到杭州灣一帶,明顯正相關(guān);福建中西部三個站福州、南平和永安也明顯正相關(guān);南京則與江淮流域的幾個站點蚌埠、合肥、霍山、東臺正相關(guān);定海與徐州明顯負相關(guān),前者濱東海,處杭州灣,后者處淮河以北,為蘇魯皖交界,相同的降水過程卻很少能同時影響此兩處;安慶與永安也明顯負相關(guān),安慶(N30°37′,E116°58′)處長江下游,永安(N25°58′,E117°21′)則位于武夷山以南,兩地經(jīng)度相近,南北相差500公里左右,也很少會受相同降水過程影響,相反,夏季當永安處于副熱帶高壓控制時,為晴好天氣,安慶則會處于副熱帶高壓的邊緣多雨帶,而當有臺風影響永安造成降水時,安慶通常會處于臺風北側(cè)高壓控制,沒有降水。

圖2為21站平均氣溫的相關(guān)系數(shù)可視化矩陣,同樣將對角線的自相關(guān)系數(shù)設(shè)置為0。可見華東地區(qū)夏季各站平均氣溫均呈正相關(guān),且距離越近相關(guān)系數(shù)越大,相關(guān)系數(shù)最大的是南京與東臺、景德鎮(zhèn)與南昌、景德鎮(zhèn)與衢州,由國家氣候中心提供的2018年6月平均氣溫距平圖(圖3)可見,南京與東臺氣溫變化同步,景德鎮(zhèn)、南昌和衢州氣溫變化也同步,具體原因尚有待分析。

圖2 華東地區(qū)21個站平均氣溫相關(guān)系數(shù)

圖3 平均氣溫距平圖

4.2.2 地面氣象要素預(yù)測

在使用聯(lián)合條件高斯圖模型預(yù)測的實驗中,不同的滑動窗口大小和預(yù)測類數(shù)會導(dǎo)致不同的預(yù)測誤差,以預(yù)測未來24小時降水量和平均氣溫的誤差做參考,結(jié)果如表1所示。預(yù)測類數(shù)K≤3時,滑動窗口越大,預(yù)測誤差越大,而K越大,降水量預(yù)測誤差越小,平均氣溫預(yù)測誤差越大;當K=4、滑動窗口為5天時,降水量預(yù)測誤差最??;K=2、滑動窗口為3天時,平均氣溫預(yù)測誤差最小,當K>4時,誤差與K=4無明顯變化。說明在輸入變量維數(shù)不變的情況下,并不是輸出類數(shù)越多,預(yù)測效果越好,也不是滑動窗口越大,預(yù)測效果越好,在具體應(yīng)用中,要充分考慮輸出變量間的結(jié)構(gòu)關(guān)系,通過對比,找到最合適的參數(shù)。

表1 聯(lián)合條件高斯圖模型不同參數(shù)預(yù)測效果對比

分別建立SVR回歸模型、Lasso回歸模型、條件高斯圖模型和聯(lián)合條件高斯圖模型,對21個站點進行降水量和氣溫預(yù)測實驗,每個模型重復(fù)實驗100次,取RMSE和MAE的均值進行比較,結(jié)果如表2所示??梢钥闯觯?lián)合條件高斯圖模型好于條件高斯圖模型,也好于SVR和Lasso。

表2 不同模型降水與氣溫預(yù)測性能對比

5 結(jié)束語

概率圖模型在天氣預(yù)測上的應(yīng)用價值已被證實,文中驗證了兩種概率圖模型在天氣預(yù)測實際工作中的應(yīng)用可行性,通過采用從業(yè)者可以實時獲取的國際交換站地面觀測數(shù)據(jù),實現(xiàn)了應(yīng)用條件高斯圖模型學(xué)習(xí)各觀測站點間氣象要素的條件相關(guān)性,并給出了天氣學(xué)解釋和驗證;應(yīng)用聯(lián)合條件高斯圖模型,解決了多站點未來24小時降水量和平均氣溫的聯(lián)合預(yù)測問題。實驗結(jié)果表明,條件高斯圖模型能夠刻畫出響應(yīng)變量之間的條件相關(guān)性,在天氣預(yù)測上可以給出合理解釋;聯(lián)合條件高斯圖模型不僅能夠?qū)崿F(xiàn)多任務(wù)輸出,由于考慮了氣象要素間的相關(guān)性,預(yù)測能力較條件高斯圖模型有所提升,且優(yōu)于SVR和Lasso回歸。

猜你喜歡
平均氣溫高斯降水量
小高斯的大發(fā)現(xiàn)
繪制和閱讀降水量柱狀圖
降水量是怎么算出來的
啟蒙(3-7歲)(2019年8期)2019-09-10 03:09:08
烏蘭縣近38年氣溫變化特征分析
天才數(shù)學(xué)家——高斯
從全球氣候變暖大背景看萊州市30a氣溫變化
1988—2017年呼和浩特市降水演變特征分析
1981—2010年拐子湖地區(qū)氣溫變化特征及趨勢分析
近50年來全球背景下青藏高原氣候變化特征分析
基于小波變換的三江平原旬降水量主周期識別
黔西县| 庆元县| 梁河县| 长武县| 林芝县| 松潘县| 恩平市| 七台河市| 石家庄市| 中山市| 吴忠市| 济南市| 军事| 襄樊市| 来宾市| 施秉县| 大港区| 海城市| 武夷山市| 蓬安县| 渭源县| 鸡东县| 当阳市| 惠来县| 重庆市| 曲水县| 澄江县| 东阿县| 福鼎市| 双城市| 白玉县| 建湖县| 都匀市| 法库县| 临夏市| 乌兰察布市| 库伦旗| 枣阳市| 博白县| 盈江县| 商河县|