国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于深度學(xué)習(xí)的短時(shí)強(qiáng)降水天氣識(shí)別

2018-03-06 05:21:36路志英任一墨孫曉磊賈惠珍
關(guān)鍵詞:物理量強(qiáng)降水天氣

路志英,任一墨,孫曉磊,賈惠珍

?

基于深度學(xué)習(xí)的短時(shí)強(qiáng)降水天氣識(shí)別

路志英1,任一墨1,孫曉磊2,賈惠珍3

(1. 天津大學(xué)電氣自動(dòng)化與信息工程學(xué)院,天津 300072;2. 天津市海洋中心氣象臺(tái),天津 300074;3. 天津市氣象臺(tái),天津 300074)

氣象預(yù)報(bào)人員面臨的問(wèn)題之一是如何準(zhǔn)確有效地識(shí)別短時(shí)強(qiáng)降水天氣.短時(shí)強(qiáng)降水是一種主要由強(qiáng)對(duì)流天氣形成的氣象災(zāi)害,產(chǎn)生原因與空氣濕度、大氣中的水分以及溫濕等物理量參數(shù)有關(guān),由此提出基于物理量參數(shù)和深度學(xué)習(xí)模型DBNs的短時(shí)強(qiáng)降水天氣識(shí)別模型.首先,利用SMOTE算法人工合成短時(shí)強(qiáng)降水少數(shù)類(lèi)(相對(duì)于非短時(shí)強(qiáng)降水天氣類(lèi))樣本,調(diào)整原始數(shù)據(jù)集不均衡分布問(wèn)題;然后通過(guò)含有高斯玻耳茲曼機(jī)的深度學(xué)習(xí)模型對(duì)地面大氣監(jiān)測(cè)站逐小時(shí)加密的觀測(cè)量,以及常用于天氣預(yù)報(bào)分析的物理量等低層特征構(gòu)造出抽象的高層特征,發(fā)現(xiàn)數(shù)據(jù)特征內(nèi)在關(guān)系;最后實(shí)現(xiàn)了DBNs短時(shí)強(qiáng)降水的自動(dòng)識(shí)別模型.結(jié)果表明,該方法能夠較為準(zhǔn)確地識(shí)別短時(shí)強(qiáng)降水,對(duì)于短時(shí)強(qiáng)降水的命中率、誤警率和臨界成功指數(shù),都有著較好的表現(xiàn).

短時(shí)強(qiáng)降水;物理量計(jì)算;SMOTE算法;深度學(xué)習(xí)

短時(shí)強(qiáng)降水是一種突發(fā)性強(qiáng)、降水時(shí)間短、降水量大的天氣過(guò)程,主要由強(qiáng)對(duì)流天氣形成,是一種重要的氣象災(zāi)害.短時(shí)強(qiáng)降水定義為在較短的時(shí)間內(nèi)降水強(qiáng)度較大,其累積降水量數(shù)值達(dá)到或超過(guò)某一量值(通常情況下指1,h累積降水量超過(guò)20,mm)的強(qiáng)對(duì)流天氣.準(zhǔn)確地識(shí)別短時(shí)強(qiáng)降水是氣象研究和從業(yè)人員的重點(diǎn)研究目標(biāo)之一.

強(qiáng)降水會(huì)帶來(lái)很多的氣象災(zāi)害,Jeon[1]使用GIS圖像對(duì)強(qiáng)降水進(jìn)行識(shí)別,從而發(fā)現(xiàn)臺(tái)風(fēng)帶來(lái)的強(qiáng)降水與山坡?lián)p壞的關(guān)系.Luino[2]通過(guò)歷史資料研究了強(qiáng)降水給意大利北部帶來(lái)的一系列危害的過(guò)程.目前,國(guó)內(nèi)外很多區(qū)域使用雷達(dá)回波形成的圖像來(lái)進(jìn)行短時(shí)強(qiáng)降水的識(shí)別,You等[3]使用液滴尺寸分布和偏振雷達(dá)對(duì)降雨類(lèi)型進(jìn)行了分類(lèi).單獨(dú)使用雷達(dá)資料或雷達(dá)回波圖像的強(qiáng)對(duì)流天氣過(guò)程和短時(shí)強(qiáng)降水識(shí)別也取得了較好的效果[4-6].然而單獨(dú)地使用地面觀測(cè)數(shù)據(jù)進(jìn)行強(qiáng)對(duì)流天氣的識(shí)別還存在許多問(wèn)題,例如氣象預(yù)報(bào)時(shí)使用的物理量參數(shù)之間的關(guān)系不明確,識(shí)別精度不高等問(wèn)題.為了進(jìn)一步挖掘短時(shí)強(qiáng)降水的相關(guān)影響因素,本文引入機(jī)器學(xué)習(xí)的方法,在地面觀測(cè)數(shù)據(jù)的基礎(chǔ)上,構(gòu)建以深度學(xué)習(xí)為框架的自動(dòng)識(shí)別?模型.

機(jī)器學(xué)習(xí)在現(xiàn)代社會(huì)的各個(gè)學(xué)科和領(lǐng)域中已經(jīng)得到了廣泛地應(yīng)用,例如,在計(jì)算機(jī)視覺(jué)、模式識(shí)別、數(shù)據(jù)挖掘、人工智能等領(lǐng)域都取得了很好的效果.深度學(xué)習(xí)(deep learning,DL)克服了一般機(jī)器學(xué)習(xí)方法中手工選取特征的過(guò)程,以及需要非常專(zhuān)業(yè)的相關(guān)領(lǐng)域的先驗(yàn)知識(shí)等缺陷.深度學(xué)習(xí)通過(guò)多隱層的層次結(jié)構(gòu)式神經(jīng)網(wǎng)絡(luò),對(duì)容量和維數(shù)非常大的數(shù)據(jù)集進(jìn)行訓(xùn)練,從中獲取相對(duì)簡(jiǎn)單的特征結(jié)構(gòu),從而構(gòu)建出魯棒性非常好的機(jī)器學(xué)習(xí)模型[7].深度學(xué)習(xí)通常也被稱(chēng)為深度特征學(xué)習(xí),目前,深度學(xué)習(xí)模型在行人跟蹤[8]、風(fēng)速預(yù)測(cè)[9-10]等領(lǐng)域有著非常好的效果.

大多數(shù)的機(jī)器學(xué)習(xí)方法同等對(duì)待數(shù)據(jù)集中的所有樣本,以提升分類(lèi)器總體分類(lèi)精度為目標(biāo),適用于樣本分布比較均勻的數(shù)據(jù)集[11].然而,短時(shí)強(qiáng)降水是一種在短時(shí)間內(nèi)突發(fā)的降水強(qiáng)度大的強(qiáng)對(duì)流天氣,實(shí)際觀測(cè)和采集到的數(shù)據(jù)集中,極少數(shù)樣本為短時(shí)強(qiáng)降水天氣,而絕大多數(shù)樣本為非短時(shí)強(qiáng)降水天氣.若直接應(yīng)用深度學(xué)習(xí)模型會(huì)造成其在多數(shù)樣本類(lèi)的分類(lèi)精度較高而在少數(shù)樣本類(lèi)的分類(lèi)精度很低的問(wèn)題.所以,在構(gòu)建短時(shí)強(qiáng)降水深度學(xué)習(xí)識(shí)別模型前,需要通過(guò)某種策略調(diào)整數(shù)據(jù)的分布,使數(shù)據(jù)相對(duì)均衡,從而便于識(shí)別模型的建立.

本文以地面觀測(cè)站點(diǎn)所觀測(cè)的數(shù)據(jù)為基礎(chǔ),首先根據(jù)已有觀測(cè)到的數(shù)據(jù)計(jì)算相關(guān)的溫度和濕度等物理量參數(shù);然后利用短時(shí)強(qiáng)降水樣本人工合成“新”的短時(shí)強(qiáng)降水樣本;并通過(guò)建立深度學(xué)習(xí)模型,將數(shù)據(jù)的原始特征組合為高度抽象的特征,從而構(gòu)建有效的識(shí)別模型;最后對(duì)模型進(jìn)行了檢驗(yàn).結(jié)果表明,本文提出的方法可以較好地依據(jù)地面觀測(cè)站點(diǎn)所觀測(cè)的數(shù)據(jù)實(shí)現(xiàn)對(duì)短時(shí)強(qiáng)降水天氣的識(shí)別.

1?數(shù)據(jù)資料

1.1?數(shù)據(jù)來(lái)源

數(shù)據(jù)來(lái)源于中國(guó)氣象局通過(guò)MICAPS業(yè)務(wù)系統(tǒng)下發(fā)的全國(guó)自動(dòng)站逐小時(shí)加密的觀測(cè)數(shù)據(jù),其存儲(chǔ)形式為AWS格式.

選取2005—2016年每年3—9月間逐小時(shí)觀測(cè)到的海河流域數(shù)據(jù)作為樣本進(jìn)行分析和處理.選取站點(diǎn)為天津境內(nèi)國(guó)家級(jí)別站點(diǎn),具體分布如圖1所示.由于各站點(diǎn)相距足夠遠(yuǎn),因此,各站點(diǎn)的測(cè)試數(shù)據(jù)可以視為相互獨(dú)立.

圖1?天津境內(nèi)國(guó)家站分布

根據(jù)所采用的數(shù)據(jù)和大氣環(huán)境系統(tǒng)的實(shí)際情況,選取1,h累積降水量大于20,mm的天氣情況為短時(shí)強(qiáng)降水天氣.在選取的469,386條樣本數(shù)據(jù)中有390條短時(shí)強(qiáng)降水天氣,每條樣本數(shù)據(jù)含有13個(gè)觀測(cè)到的物理量,分別為緯度(°)、經(jīng)度(°)、地平面氣壓(hPa)、海平面氣壓(hPa)、溫度(℃)、露點(diǎn)(℃)、相對(duì)濕度(%,)、水汽壓(hPa)、2,min平均風(fēng)向(°)、2,min平均風(fēng)速(m/s)、10,min平均風(fēng)向(°)、10,min平均風(fēng)速(m/s)及1,h累積降水量(mm).

1.2?物理量參數(shù)計(jì)算

構(gòu)成天氣的基本要素是溫、壓、濕、風(fēng)、云等等,正是這些基本要素的變化形成了復(fù)雜多變的天氣現(xiàn)象.一些基本的物理量參數(shù)[12]是天氣預(yù)報(bào)所常用的.根據(jù)地面觀測(cè)站采集到的地面參數(shù),可以計(jì)算出如下一些常用的物理量參數(shù).

1) 飽和水汽壓

水汽壓為大氣中由水汽所產(chǎn)生的分壓.它的大小由大氣中水汽含量的多少?zèng)Q定,單位為hPa.

飽和水汽壓的計(jì)算經(jīng)驗(yàn)公式為

???(1)

式中為絕對(duì)溫標(biāo),K.

式(1)將實(shí)際氣象業(yè)務(wù)中可能遇到的情況統(tǒng)一到了一個(gè)公式,其計(jì)算精度也符合氣象業(yè)務(wù)的需要.

2) 水汽密度

???(2)

式中為水汽壓,hPa.

3) 比濕

利用狀態(tài)方程與比濕的定義進(jìn)行推導(dǎo),可得比濕的計(jì)算公式為

???(3)

式中為大氣壓力.

比濕具有保守性,對(duì)于某一空氣團(tuán)在發(fā)生膨脹或壓縮時(shí),如果不存在水分的凝結(jié)或蒸發(fā),則其水汽質(zhì)量和空氣總質(zhì)量并不會(huì)發(fā)生變化,即空氣團(tuán)的體積變化時(shí),它的比濕保持不變.通常用比濕來(lái)表示空氣的濕度.

4) 溫度-露點(diǎn)差

5) 虛溫

???(4)

在實(shí)際情況中,空氣的分子量通常隨環(huán)境水氣量的變化而變化,因此濕空氣的氣體常數(shù)是一個(gè)變數(shù),定義虛溫的用意在于不考慮變動(dòng)的氣體常數(shù),并且便于處理復(fù)雜的水汽效應(yīng).

6) 位溫和虛位溫

???(5)

???(6)

7) 整層大氣水汽含量

整層大氣水汽含量是研究大氣輻射和吸收以及全球熱量輸送的一個(gè)重要參量[13-14],對(duì)短時(shí)強(qiáng)降水的識(shí)別也有著重要的意義.

根據(jù)地面參數(shù),可以大致地計(jì)算整層大氣可降水量,經(jīng)驗(yàn)公式為

???(7)

整層大氣可降水量還可用地面露點(diǎn)溫度表示,具體的經(jīng)驗(yàn)計(jì)算公式為

???(8)

1.3?樣本可視化

為了更好地觀察地面觀測(cè)數(shù)據(jù)與計(jì)算出的物理量參數(shù)對(duì)短時(shí)強(qiáng)降水天氣的識(shí)別結(jié)果,本文從中選取相對(duì)濕度、溫度露點(diǎn)差、2,min平均風(fēng)速、10,min平均風(fēng)速及整層大氣水汽含量(已標(biāo)準(zhǔn)化,無(wú)量綱),以圖像的形式呈現(xiàn)樣本分布特點(diǎn)(如圖2所示),其中紅色點(diǎn)代表短時(shí)強(qiáng)降水天氣,綠色代表非短時(shí)強(qiáng)降水天氣.

從圖2的樣本分布可知,選取的物理量對(duì)于強(qiáng)降水天氣和非強(qiáng)降水天氣的識(shí)別是有一定的作用的,但是存在很多重疊、交叉樣本.因此從不同的物理量入手,將其進(jìn)行有效地組合實(shí)現(xiàn)物理量之間的互補(bǔ)與相關(guān),以增加對(duì)樣本的分類(lèi)效果.這種提取出真正有用的高維抽象的特征,從而增強(qiáng)對(duì)短時(shí)強(qiáng)降水天氣的識(shí)別能力尤為重要.

圖2?三維特征樣本分布

另外,從圖2還可以看出,短時(shí)強(qiáng)降水天氣相對(duì)于非短時(shí)強(qiáng)降水天氣是一種樣本數(shù)極少的樣本.建立在不均衡數(shù)據(jù)集上的模型對(duì)少數(shù)類(lèi)樣本即短時(shí)強(qiáng)降水天氣的分類(lèi)精度造成非常大的影響.因此,本文首先使用合成少數(shù)類(lèi)過(guò)采樣技術(shù)(synthetic minority over-sampling technique,SMOTE)算法人工合成“新”的少數(shù)類(lèi)的樣本,調(diào)整數(shù)據(jù)集中的樣本分布,從而為強(qiáng)降水天氣識(shí)別模型的建立奠定基礎(chǔ).

1.4?特征維數(shù)

為了更加準(zhǔn)確地刻畫(huà)某個(gè)時(shí)刻短時(shí)強(qiáng)降水,本文將某時(shí)刻的12個(gè)物理量(參見(jiàn)第1.1節(jié))(不包括1,h降水量)以及計(jì)算得到的9維相關(guān)物理量(參見(jiàn)第1.2節(jié)),與此時(shí)刻前1,h、前2,h對(duì)應(yīng)的物理量合并,去除重復(fù)的經(jīng)緯度信息后共計(jì)59個(gè)物理量作為當(dāng)前降水量的特征,并以此59維特征構(gòu)建1,h降水量樣本特征數(shù)據(jù)庫(kù),這樣通過(guò)對(duì)樣本數(shù)據(jù)的挖掘,可以更加豐富地刻畫(huà)和描述與該小時(shí)降水量相關(guān)信息.

2?SMOTE算法

SMOTE算法的基本思想是:首先對(duì)少數(shù)類(lèi)樣本進(jìn)行分析,然后根據(jù)少數(shù)類(lèi)樣本的特點(diǎn),人工合成新樣本,最后將新樣本添加到數(shù)據(jù)集中從而實(shí)現(xiàn)調(diào)整不平衡的數(shù)據(jù)集中樣本分布的目的[15].

SMOTE算法流程描述如下:

(1) 對(duì)于少數(shù)類(lèi)中每一個(gè)樣本,計(jì)算它在少數(shù)類(lèi)樣本集中以歐式距離為度量的近鄰;

(2) 對(duì)于每一個(gè)少數(shù)類(lèi)樣本,從其近鄰中隨機(jī)選擇若干個(gè)樣本;

(4) 將人工合成的新樣本添加到原始數(shù)據(jù)集中,形成新的數(shù)據(jù)集.

SMOTE算法相對(duì)于隨機(jī)復(fù)制樣本的算法,可以有效地防止過(guò)擬合問(wèn)題,同時(shí)提高分類(lèi)器的性能.值得注意的是:SMOTE算法中對(duì)少數(shù)類(lèi)樣本的采樣倍率會(huì)影響精度的大小,采樣倍率越大,對(duì)多數(shù)類(lèi)樣本的分類(lèi)精度越低,對(duì)少數(shù)類(lèi)樣本的分類(lèi)精度越高.

在利用SMOTE算法得到新數(shù)據(jù)集的基礎(chǔ)上,本文建立了一個(gè)基于深度學(xué)習(xí)模型深度信念網(wǎng)(deep belief networks,DBNs)的短時(shí)強(qiáng)降水預(yù)報(bào)模型.測(cè)試結(jié)果表明,模型具有性能穩(wěn)定可有效識(shí)別短時(shí)強(qiáng)降水天氣的能力.

3?深度學(xué)習(xí)

有監(jiān)督學(xué)習(xí)是深度學(xué)習(xí)應(yīng)用最廣泛的形式,即利用一組已知類(lèi)別的樣本調(diào)整深度學(xué)習(xí)模型參數(shù),使其達(dá)到所要求性能的學(xué)習(xí).DBNs是一個(gè)由限制玻耳茲曼機(jī)(restricted Boltzmann machine,RBM)為基本單元所組成的多隱層神經(jīng)網(wǎng)絡(luò)模型.其中RBM的訓(xùn)練算法是對(duì)比散度(CD-)算法,DBNs是貪心學(xué)習(xí)算?法[16].深度學(xué)習(xí)模型關(guān)鍵是在于其對(duì)樣本特征提取的能力以及對(duì)復(fù)雜函數(shù)擬合的能力,且比一般的特征提取方法(如主成分分析方法等)有效[17-18].

與傳統(tǒng)的淺層神經(jīng)網(wǎng)絡(luò)模型的不同之處在于:深度學(xué)習(xí)模型首先強(qiáng)調(diào)了模型結(jié)構(gòu)的深度;其次明確突出了特征學(xué)習(xí)的重要性;同時(shí)更加具有通過(guò)逐層特征變換和組合,將樣本在原特征空間的特征表示變換到一個(gè)新的特征空間,從而便于分類(lèi)或預(yù)測(cè)的特點(diǎn).在大數(shù)據(jù)的時(shí)代背景下,深度學(xué)習(xí)在利用大數(shù)據(jù)更好的學(xué)習(xí)特征,挖掘數(shù)據(jù)潛在、豐富的內(nèi)在信息關(guān)系等領(lǐng)域有著很強(qiáng)的優(yōu)勢(shì).

3.1?限制波耳茲曼機(jī)

3.1.1?基本概念

DBNs模型的基本組成單元RBM是一種基于能量概念的模型,是玻耳茲曼機(jī)(Boltzmann machine,BM)[19]的一種改進(jìn).BM是一種來(lái)源于統(tǒng)計(jì)力學(xué)的隨機(jī)神經(jīng)網(wǎng)絡(luò)模型,網(wǎng)絡(luò)中的神經(jīng)元是隨機(jī)神經(jīng)元,并且神經(jīng)元的輸出只有激活和未激活兩種狀態(tài).BM擁有強(qiáng)大的無(wú)監(jiān)督學(xué)習(xí)能力和很強(qiáng)的非線(xiàn)性擬合的能力.RBM在繼承了BM強(qiáng)大的無(wú)監(jiān)督學(xué)習(xí)能力的前提下對(duì)其進(jìn)行了改進(jìn),限制了BM顯層和隱層的連接[20].BM和RBM的模型結(jié)構(gòu)如圖3所示.

圖3?RBM和BM模型結(jié)構(gòu)

相對(duì)于BM來(lái)說(shuō),RBM具有非常好的如下性?質(zhì)[21-22]:

(1) RBM層內(nèi)無(wú)連接、層間全連接,使得各顯元之間的激活條件是獨(dú)立的,各隱元之間的激活條件也是獨(dú)立的.這樣避免了大量的復(fù)雜計(jì)算,可以通過(guò)Gibbs采樣或?qū)Ρ壬⒍?CD-)算法得到隨機(jī)樣本;

(2) 只要隱元的數(shù)目足夠多,RBM可以擬合任意的離散分布;

(3) 使用CD-算法可以近似模擬Gibbs采樣,從而實(shí)現(xiàn)快速訓(xùn)練.

因此,相對(duì)于BM,可以通過(guò)疊加多個(gè)RBM來(lái)建立深度學(xué)習(xí)模型,實(shí)現(xiàn)提取高度抽象特征,發(fā)現(xiàn)數(shù)據(jù)間隱含存在的關(guān)系,避免訓(xùn)練時(shí)間過(guò)長(zhǎng),便于后續(xù)分類(lèi)模型的建立.

3.1.2?伯努利RBM

假設(shè)顯元和隱元均為隨機(jī)二值神經(jīng)元,即

???(9)

式中:1表示神經(jīng)元激活狀態(tài);0表示神經(jīng)元抑制狀態(tài).這樣的RBM為伯努利-伯努利RBM,簡(jiǎn)稱(chēng)伯努利RBM.其能量函數(shù)(energy function)為

???(10)

此時(shí),全概率分布為

???(11)

???(12)

???(13)

???(14)

???(15)

3.1.3?RBM訓(xùn)練算法

???(16)

?????(17)

圖4?CD-算法采樣過(guò)程

Fig.4?Sampling process of CD-algorithm

???(18)

(19)

???(20)

所以RBM的各個(gè)參數(shù)增量為

???(21)

???(22)

???(23)

根據(jù)上述算法求出RBM的每一個(gè)參數(shù)在數(shù)據(jù)集中每個(gè)訓(xùn)練樣本上的增量后,更新各個(gè)參數(shù),即可訓(xùn)練好一個(gè)RBM.

3.1.4?高斯RBM

應(yīng)用伯努利RBM的前提是只有當(dāng)輸入數(shù)據(jù)滿(mǎn)足二值分布也就是伯努利分布時(shí),才能取得一個(gè)較好的重構(gòu),但是實(shí)際的數(shù)據(jù)往往近似于高斯分布而不是伯努利分布,因此需要將伯努利RBM的顯元替換為具有獨(dú)立高斯噪音的線(xiàn)性單元,這樣的RBM稱(chēng)為高斯-伯努利RBM,簡(jiǎn)稱(chēng)高斯RBM.

將式(10)和式(15)改寫(xiě)為

?????(24)

???(25)

改寫(xiě)后的高斯RBM和伯努利RBM有著相同的CD-算法,并且CD-算法對(duì)于高斯RBM的訓(xùn)練也有較好的效果[24].

3.2?DBNs訓(xùn)練算法

DBNs是由若干層RBM組成的神經(jīng)網(wǎng)絡(luò)模型,其訓(xùn)練過(guò)程是:首先通過(guò)貪心算法逐層訓(xùn)練RBM,然后疊加訓(xùn)練好的RBM,最后進(jìn)行微調(diào).DBNs的訓(xùn)練過(guò)程包括預(yù)訓(xùn)練和參數(shù)微調(diào)兩個(gè)過(guò)程.

DBNs的預(yù)訓(xùn)練過(guò)程如下:

(1) 充分訓(xùn)練第1個(gè)RBM;

(2) 固定第1個(gè)RBM的參數(shù)大小,根據(jù)其輸入向量計(jì)算出其隱層狀態(tài),將其作為第2個(gè)RBM的輸入向量;

(3) 充分訓(xùn)練第2個(gè)RBM,將訓(xùn)練好的RBM堆疊在第1個(gè)RBM的上方;

(4) 重復(fù)以上3個(gè)步驟若干次.

值得注意的是:如果是無(wú)監(jiān)督學(xué)習(xí),那么在訓(xùn)練頂層的RBM時(shí),顯層中一起進(jìn)行訓(xùn)練的神經(jīng)元,除了顯元,還需要有代表分類(lèi)標(biāo)簽的神經(jīng)元.

DBNs的微調(diào)過(guò)程采用了Contrastive Wake-Sleep[25-26]算法對(duì)網(wǎng)絡(luò)參數(shù)進(jìn)行微調(diào),從而達(dá)到更好的效果.具體過(guò)程如下.

步驟1除了頂層 RBM,令其他層 RBM 的權(quán)重分別為向上的認(rèn)知權(quán)重和向下的生成權(quán)重.

步驟2Wake 階段:通過(guò)外界的特征輸入和認(rèn)知權(quán)重產(chǎn)生每一層的結(jié)點(diǎn)狀態(tài),并使用梯度下降修改層間生成權(quán)重.

步驟3Sleep 階段:通過(guò)頂層表示和生成權(quán)重,生成底層狀態(tài),同時(shí)修改層間的認(rèn)知權(quán)重.對(duì)于有監(jiān)督的識(shí)別任務(wù),DBNs的訓(xùn)練過(guò)程如圖5所示.

圖5?DBNs訓(xùn)練過(guò)程

4?建立短時(shí)強(qiáng)降水識(shí)別

4.1?數(shù)據(jù)集的選取

將構(gòu)建好的數(shù)據(jù)集分為兩部分和,和分別占原始數(shù)據(jù)集的75%,和25%,.

首先利用SMOTE算法擴(kuò)充數(shù)據(jù)集的正例(短時(shí)強(qiáng)降水)樣本為數(shù)據(jù)集,緩解數(shù)據(jù)集的不平衡;然后將數(shù)據(jù)集歸一化為數(shù)據(jù)集并將數(shù)據(jù)集切分成3個(gè)部分,分別為訓(xùn)練集、驗(yàn)證集和測(cè)試集,各約占數(shù)據(jù)集的50%,、25%,、25%,.訓(xùn)練集用于訓(xùn)練模型,驗(yàn)證集用于對(duì)模型的微調(diào),測(cè)試集用于對(duì)模型結(jié)果的檢驗(yàn).

最后,通過(guò)數(shù)據(jù)集對(duì)模型進(jìn)行測(cè)試.值得注意的是,數(shù)據(jù)集中的數(shù)據(jù)既包括短時(shí)強(qiáng)降雨天氣樣例,又包括非短時(shí)強(qiáng)降雨天氣樣例,均是沒(méi)有參與模型訓(xùn)練過(guò)程的真實(shí)數(shù)據(jù).

4.2?DBNs短時(shí)強(qiáng)降水識(shí)別模型建立

本文構(gòu)造了一個(gè)具有3個(gè)RBM以及頂層為L(zhǎng)R回歸的DBNs短時(shí)強(qiáng)降水識(shí)別模型,其中,DBNs的第1個(gè)RBM為高斯RBM,作為輸入層,其節(jié)點(diǎn)數(shù)為59,分別是地面觀測(cè)站數(shù)據(jù)及物理量參數(shù)計(jì)算結(jié)果;輸出層節(jié)點(diǎn)數(shù)是2,為強(qiáng)降水識(shí)別結(jié)果(是或者不是);隱層節(jié)點(diǎn)數(shù)為100.DBNs模型結(jié)構(gòu)如圖6所示.

DBNs模型的建立過(guò)程如圖7所示.

4.3?評(píng)價(jià)指標(biāo)

為了對(duì)基于DBNs強(qiáng)降水識(shí)別模型的識(shí)別結(jié)果進(jìn)行統(tǒng)計(jì)和分析,引入多個(gè)指標(biāo)進(jìn)行評(píng)價(jià)[27].

圖6?DBNs模型結(jié)構(gòu)

圖7?DBNs訓(xùn)練流程

在氣象領(lǐng)域中,命中率(percent of doom,POD)、誤警率(false alarm rate,F(xiàn)AR)和臨界成功指數(shù)(critical success index,CSI)可以準(zhǔn)確評(píng)價(jià)對(duì)短時(shí)強(qiáng)降水的識(shí)別和預(yù)報(bào)效果.

以強(qiáng)降水為例,POD、FAR和CSI分別定義為

??????(26)

??????(27) ??????(28)

4.4?識(shí)別結(jié)果與分析

為了說(shuō)明本文DBNs短時(shí)強(qiáng)降水識(shí)別模型的性能,將第4.1節(jié)數(shù)據(jù)集作為訓(xùn)練樣本,分別構(gòu)建基于LR和SVM短時(shí)強(qiáng)降水天氣識(shí)別模型,并用數(shù)據(jù)集對(duì)模型進(jìn)行測(cè)試.DBNs、LR和SVM模型的識(shí)別結(jié)果如表1所示.

表1?識(shí)別結(jié)果

由識(shí)別結(jié)果可知,3種機(jī)器學(xué)習(xí)模型輸出識(shí)別結(jié)果的評(píng)價(jià)指標(biāo)均能夠取得較好的識(shí)別效果,說(shuō)明通過(guò)機(jī)器學(xué)習(xí)的方法,在地面觀測(cè)數(shù)據(jù)及物理量參數(shù)計(jì)算的基礎(chǔ)上,能夠準(zhǔn)確有效地識(shí)別短時(shí)強(qiáng)降水天氣,但DBNs模型的各項(xiàng)指標(biāo)均優(yōu)于SVM及LR模型的各項(xiàng)指標(biāo),這說(shuō)明本文DBNs模型以地面觀測(cè)數(shù)據(jù)為基礎(chǔ)上的短時(shí)強(qiáng)降水識(shí)別能力最強(qiáng),性能更加優(yōu)越.

實(shí)驗(yàn)結(jié)果所得DBNs短時(shí)強(qiáng)降水識(shí)別模型的各項(xiàng)指標(biāo)均大大地優(yōu)于LR模型的各項(xiàng)指標(biāo),充分說(shuō)明由于RBM“特征學(xué)習(xí)”和“特征選擇”的作用,DBNs在對(duì)處理天氣觀測(cè)數(shù)據(jù)這種大而全的“大數(shù)據(jù)”時(shí),可以在其豐富的數(shù)據(jù)中,更加有效地提取出有用的信息,將輸入的物理量疊加組合成更高級(jí)更抽象的特征物理量,從而提高了模型識(shí)別的能力.

4.5?預(yù)報(bào)結(jié)果與分析

為了說(shuō)明本文建立的DBNs在短時(shí)強(qiáng)降雨天氣預(yù)報(bào)方面所發(fā)揮的作用,將數(shù)據(jù)的降水量標(biāo)簽提前1,h,即將包括當(dāng)前時(shí)刻在內(nèi)的前3,h地面觀測(cè)數(shù)據(jù)與計(jì)算的相關(guān)物理量作為特征,未來(lái)1,h天氣狀況為標(biāo)簽進(jìn)行模型訓(xùn)練,可獲得1,h提前預(yù)報(bào)模型,從而使其更具有實(shí)際應(yīng)用的意義.表2為采用DBNs、LR和SVM模型對(duì)短時(shí)強(qiáng)降水天氣1,h提前預(yù)報(bào)結(jié)果.

表2?1,h提前預(yù)報(bào)結(jié)果

Tab.2?Results of prediction forcasting in 1,h

由1,h提前預(yù)報(bào)結(jié)果可知,DBNs模型的各項(xiàng)指標(biāo)依然均優(yōu)于SVM及LR模型的各項(xiàng)指標(biāo).

DBNs模型作為一種人工智能的技術(shù),在大數(shù)據(jù)的時(shí)代背景下,能夠滿(mǎn)足實(shí)際的氣象工作人員對(duì)短時(shí)強(qiáng)降雨天氣的1,h提前預(yù)報(bào)的需求.

5?結(jié)?論

本文選取天津市2005—2016年每年3—9月間逐小時(shí)觀測(cè)到的469,386數(shù)據(jù),其中有390條數(shù)據(jù)為短時(shí)強(qiáng)降水天氣,在地面觀測(cè)數(shù)據(jù)及部分計(jì)算物理量的基礎(chǔ)上,提出了基于物理量參數(shù)和深度學(xué)習(xí)模型的DBNs短時(shí)強(qiáng)降水天氣識(shí)別預(yù)報(bào)模型,根據(jù)模型檢驗(yàn)的結(jié)果,可以得出以下結(jié)論.

(1) 以地面觀測(cè)站逐小時(shí)觀測(cè)到的基本天氣數(shù)據(jù)為基礎(chǔ)進(jìn)行部分溫濕度物理量的計(jì)算,并對(duì)其進(jìn)行了分析和處理,從而構(gòu)建出基于物理量參數(shù)的DBNs短時(shí)強(qiáng)降水天氣識(shí)別模型,有效地識(shí)別了短時(shí)強(qiáng)降水.

(2) 利用SMOTE算法在不均衡的數(shù)據(jù)集中人工合成少數(shù)類(lèi)樣本(短時(shí)強(qiáng)降水),有效地保證了本文識(shí)別模型的識(shí)別能力,使DBNs短時(shí)強(qiáng)降水模型能準(zhǔn)確地識(shí)別出短時(shí)強(qiáng)降水.

(3) 疊加的RBM可以提取出高度抽象的特征,從而大大地提高了識(shí)別模型的識(shí)別能力,使得DBNs在已有的數(shù)據(jù)集上可以取得比RBM和LR模型更好的效果.

(4) 本文通過(guò)對(duì)現(xiàn)有數(shù)據(jù)集的處理,用DBNs模型實(shí)現(xiàn)了對(duì)短時(shí)強(qiáng)降雨天氣的1,h提前預(yù)報(bào),實(shí)驗(yàn)結(jié)果表示DBNs模型作為一種天氣預(yù)報(bào)模型,能夠取得較好的提前預(yù)報(bào)的效果.

[1] Jeon S S. Damage pattern recognition of spatially distributed slope damages and rainfall using optimal GIS mesh dimensions[J].,2014,11(2):336-344.

[2] Luino F. Sequence of instability processes triggered by heavy rainfall in the Northern Italy[J].,2005,66(1/2/3/4):13-39.

[3] You C H,Lee D I,Kang M Y,et al. Classification of rain types using drop size distributions and polarimetric radar:Case study of a 2014 flooding event in Korea[J].,2016,181:211-219.

[4] Root B,Yu T Y,Yeary M. Consistent clustering of radar reflectivities using strong point analysis:A prelude to storm tracking[J].,2011,8:273-277.

[5] 胡文東,楊?侃,黃小玉,等. 一次陣風(fēng)鋒觸發(fā)強(qiáng)對(duì)流過(guò)程雷達(dá)資料特征分析[J]. 高原氣象,2015,34(5):1452-1464.

Hu Wendong,Yang Kan,Huang Xiaoyu,et al. Analysis on a severe convection triggered by gust front in Yinchuan with radar data[J].,2015,34(5):1452-1464(in Chinese).

[6] 張家國(guó),王?玨,黃治勇,等. 幾類(lèi)區(qū)域性暴雨雷達(dá)回波模型[J]. 氣象,2011,37(3):285-290.

Zhang Jiaguo,Wang Jue,Huang Zhiyong,et al. Several kinds of region rainstorm radar echo models[J].,2011,37(3):285-290(in Chinese).

[7] Arel I,Rose D C,Karnowski T P. Deep machine learning—A new frontier in artificial intelligence research [research frontier][J].,2010,5(4):13-18.

[8] Kalal Z,Mikolajczyk K,Matas J. Tracking-learning-detection[J].,2012,34(7):1409-1422.

[9] Wan J,Liu J,Ren G,et al. Day-ahead prediction of wind speed with deep feature learning[J].,2016,30(5):433-438.

[10] Zhang C Y,Chen C L P,Gan M,et al. Predictive deep Boltzmann machine for multipored wind speed forecasting[J].,2015,6(4):1416-1425.

[11] 尹?劍,陸程敏,楊貴軍. 判別分析與Logistic回歸組合分類(lèi)[J]. 數(shù)理統(tǒng)計(jì)與管理,2014,33(2):256-265.

Yin Jian,Lu Chengmin,Yang Guijun. Combinations of discriminatory analysis and logistic regression for classification[J].,2014,33(2):256-265(in Chinese).

[12] 劉健文. 天氣分析預(yù)報(bào)物理量計(jì)算基礎(chǔ)[M]. 北京:氣象出版社,2005.

Liu Jianwen.[M]. Beijing:China Meteorological Press,2005(in Chinese).

[13] 楊景梅,邱金桓. 用地面濕度參量計(jì)算我國(guó)整層大氣可降水量及有效水汽含量方法的研究[J]. 大氣科學(xué),2002,26(1):9-22.

Yang Jingmei,Qiu Jinhuan. A method for estimating perceptible water and water vapor content from ground humidity parameters[J].,2002,26(1):9-22(in Chinese).

[14] 李?超,魏合理,劉厚通,等. 合肥整層大氣可降水量與地面露點(diǎn)相關(guān)性分析[J]. 高原氣象,2009,28(2):452-457.

Li Chao,Wei Heli,Liu Houtong,et al. Correlation analyses on total perceptible water and surface dew point temperature over Hefei[J].,2009,28(2):452-457(in Chinese).

[15] Chawla N V,Bowyer K W,Hall L O,et al. SMOTE:Synthetic minority over-sampling technique [J].,2002,16(1):321-357.

[16] Hinton G,Osindero S,Teh Y. A fast learning algorithm for deep belief nets[J].,1989,18(7):1527-1554.

[17] Hinton G E,Salakhutdinov R R. Reducing the dimensionality of data with neural networks[J].,2006,313(5786):504.

[18] Chabiron O,Malgouyres F,Tourneret J Y,et al. Toward fast transform learning[J].,2015,114(2/3):195-216.

[19] Pelillo M,Refice M. Learning compatibility coefficients for relaxation labeling processes[J].,1994,16(9):933-945.

[20] Najafabadi M M,Villanustre F,Khoshgoftaar T M,et al. Deep learning applications and challenges in big data analytics[J].,2015,2(1):1-10.

[21] Roux N L,Bengio Y. Representational power of restricted Boltzmann machines and deep belief networks [J].,2008,20(6):1631-1632.

[22] Hinton G E. A practical guide to training restricted Boltzmann machines[J].,2012,9(1):599-619.

[23] Yamashita T,Tanaka M,Yoshida E,et al. To be Bernoulli or to be Gaussian,for a restricted Boltzmann machine[C]//,. Sweden,2014:1520-1525.

[24] Hinton G E. Training products of experts by minimizing contrastive divergence[J].,2002,14(8):1771-1800.

[25] Karakida R,Okada M,Amari S I. Dynamical analysis of contrastive divergence learning:Restricted Boltzmann machines with Gaussian visible units[J].,2016,79(C):78-87.

[26] Hinton G E,Dayan P,F(xiàn)rey B J,et al. The "wake-sleep" algorithm for unsupervised neural networks[J].,1995,268(268):1158-1161.

[27] 路志英,劉?海,賈惠珍,等. 基于雷達(dá)反射率圖像特征的冰雹暴雨識(shí)別[J]. 物理學(xué)報(bào),2014,63(18):485-496.

Lu Zhiying,Liu Hai,Jia Huizhen,et al. Recognition of hail and rainstorm based on the radar reflectivity image features[J].,2014,63(18):485-496(in Chinese).

(責(zé)任編輯:孫立華)

Recognition of Short-Time Heavy Rainfall Based on Deep Learning

Lu Zhiying1,Ren Yimo1,Sun Xiaolei2,Jia Huizhen3

(1.School of Electrical and Information Engineering,Tianjin University,Tianjin 300072,China;2.Tianjin Marine Meteorological Center,Tianjin 300074,China;3. Tianjin Meteorological Bureau,Tianjin 300074,China)

One of the key studies for meteorological practitioners is how to recognize and predict short-time heavy rainfall accurately and effectively.The short-time heavy rainfall is a severe meteorological disaster that is mainly caused by strong convective weather,which is related to such physical parameters as air humidity,moisture in the atmosphere,temperature and humidity.In this paper,a recognition model of the short-time heavy rainfall based on physical parameters and deep learning model DBNs is constructed.Firstly,SMOTE algorithm is used to synthesize a few samples of the short-time heavy rainfall,which is much less than normal weather,to adjust the distribution of the original data set.Secondly,a deep learning model with a Gaussian Boltzmann machine is constructed based on the observed data from automatic monitoring stations on a local ground and the physical quantities commonly used in weather forecast analysis.Finally,the automatic recognition model of short-term heavy rainfall is obtained.Through the analysis of the experimental results,the model can accurately recognize the short-time heavy rainfall,and have a good performance in the POD,F(xiàn)AR and CSI of short-time heavy rainfall recognition.

short-time heavy rainfall;physical quantity;SMOTE algorithm;deep learning

10.11784/tdxbz201703106

TP29

A

0493-2137(2018)02-0111-09

2017-03-31;

2017-08-22.

路志英(1964—??),女,博士,教授.

路志英,luzy@tju.edu.cn.

國(guó)家自然科學(xué)基金資助項(xiàng)目(41575049);天津市自然科學(xué)基金青年項(xiàng)目(16JQNJC07500).

the National Natural Science Foundation of China(No.,41575049)and the Youth Project of Natural Science Foundation of Tianjin,China(No.,16JQNJC07500).

猜你喜歡
物理量強(qiáng)降水天氣
2020年江淮地區(qū)夏季持續(xù)性強(qiáng)降水過(guò)程分析
天氣冷了,就容易抑郁嗎?
誰(shuí)是天氣之子
盛暑天氣,覓得書(shū)中一味涼
文苑(2020年7期)2020-08-12 09:36:38
一次東移型西南低渦引發(fā)的強(qiáng)降水診斷分析
Weather(天氣)
巧用求差法判斷電路中物理量大小
電場(chǎng)中六個(gè)常見(jiàn)物理量的大小比較
誰(shuí)、啥、怎樣、為什么——對(duì)幾個(gè)物理量的分析與綜合
四川盆地西南部短時(shí)強(qiáng)降水天氣特征分析
彝良县| 松阳县| 垦利县| 四川省| 封丘县| 图们市| 象州县| 巨鹿县| 徐闻县| 济源市| 城步| 宁海县| 夏津县| 蒙自县| 丰宁| 安平县| 宾川县| 健康| 莲花县| 临高县| 武穴市| 沈丘县| 凭祥市| 浙江省| 精河县| 浠水县| 霞浦县| 北川| 登封市| 巴马| 华阴市| 芮城县| 深圳市| 二连浩特市| 康定县| 香格里拉县| 芦溪县| 贺州市| 大英县| 峨眉山市| 石渠县|