国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

Logistic回歸聯(lián)合ROC曲線模型在雷電潛勢(shì)預(yù)報(bào)中的應(yīng)用

2022-05-18 01:30:02吳安坤郭軍成黃天福
中低緯山地氣象 2022年2期
關(guān)鍵詞:潛勢(shì)探空雷暴

吳安坤,郭軍成,黃天福

(1.貴州省氣象災(zāi)害防御技術(shù)中心,貴州 貴陽(yáng) 550081;2.貴州省安順市氣象局,貴州 安順 561000;3.貴州省六盤(pán)水市氣象局,貴州 六盤(pán)水 553000)

0 引言

雷暴活動(dòng)作為常見(jiàn)的強(qiáng)對(duì)流天氣過(guò)程,造成的災(zāi)害是聯(lián)合國(guó)公布的十大最嚴(yán)重的自然災(zāi)害之一。隨著社會(huì)經(jīng)濟(jì)不斷發(fā)展,每年因強(qiáng)對(duì)流天氣過(guò)程造成的損失越加嚴(yán)重。因此,加強(qiáng)雷暴活動(dòng)的預(yù)測(cè)預(yù)報(bào),對(duì)防災(zāi)減災(zāi)有十分重要的指導(dǎo)意義。雷暴云的發(fā)生發(fā)展伴隨著不穩(wěn)定環(huán)境中氣團(tuán)的抬升,探空資料觀測(cè)大氣中的溫濕壓、水汽和抬升等物理量參數(shù),對(duì)研究局地雷電潛勢(shì)預(yù)報(bào)具有很好的指示作用[1-4]。目前采用探空對(duì)流參數(shù)開(kāi)展的雷暴預(yù)報(bào)研究,大多直接采用多元統(tǒng)計(jì)線性回歸方法,需解決雷暴發(fā)生與否的非線性與探空資料之間的線性回歸問(wèn)題。線性回歸模型要求因變量是連續(xù)的正態(tài)分布變量,且自變量和因變量之間呈現(xiàn)線性關(guān)系。當(dāng)因變量為分類(lèi)型變量,且自變量與因變量沒(méi)有線性關(guān)系時(shí),線性回歸模型的假設(shè)條件就會(huì)遭到破壞。而采用Logistic回歸分析模型可以很好地解決此類(lèi)問(wèn)題,它對(duì)因變量的分布沒(méi)有要求,巧妙地避開(kāi)了分類(lèi)型變量的分布問(wèn)題。Logistic回歸作為一種非線性概率性預(yù)測(cè)模型,可實(shí)現(xiàn)對(duì)研究觀察結(jié)果進(jìn)行分類(lèi)、處理協(xié)變量之間的多變量分類(lèi)分析[5],被廣泛用于流行病學(xué)的病因研究中,分析疾病與危險(xiǎn)因素間聯(lián)系,所觀測(cè)的因素常以二分變量取值,如生存與死亡、是否發(fā)病等,即因變量為0或者1。如羅蒙等[6]將具有統(tǒng)計(jì)學(xué)意義的檢查指標(biāo)納入多因素Logistic 回歸分析,預(yù)測(cè)新型冠狀病毒肺炎患者發(fā)生危重癥的風(fēng)險(xiǎn)。而ROC曲線是目前學(xué)術(shù)界公認(rèn)的診斷價(jià)值最佳的方法,其操作簡(jiǎn)便,且具有通過(guò)圖形就能夠判斷分析的診斷性能[7-9]。宗迎迎等[10]應(yīng)用Logistic 回歸和ROC曲線研討血清Dickkopf、高爾基體糖蛋白73和甲胎蛋白對(duì)原發(fā)性肝癌的診斷價(jià)值。張宇等[11]應(yīng)用Logistic 模型聯(lián)合ROC 曲線法對(duì)新型冠狀病毒肺炎嚴(yán)重程度進(jìn)行判別,具有較高的正確率。引入Logistic回歸聯(lián)合ROC曲線模型采用探空物理量資料開(kāi)展雷電潛勢(shì)預(yù)報(bào)研究,分析雷電活動(dòng)有、無(wú)問(wèn)題,目前未見(jiàn)相關(guān)技術(shù)研究。因此,本文選取閃電監(jiān)測(cè)資料和探空觀測(cè)參數(shù),篩選數(shù)據(jù)樣本納入單因素邏輯回歸模型,選取有統(tǒng)計(jì)學(xué)意義的參數(shù)納入多因素邏輯回歸模型,采用ROC曲線聯(lián)合二分類(lèi)Logistic回歸模型開(kāi)展雷暴活動(dòng)潛勢(shì)預(yù)報(bào)研究。

1 數(shù)據(jù)來(lái)源及處理

探空資料來(lái)源于Micaps系統(tǒng)提供的T-lnp探空數(shù)據(jù),提取貴陽(yáng)站2020年1—10月逐日08時(shí)和20時(shí)的修正總指數(shù)、K指數(shù)、沙氏指數(shù)、Faust指數(shù)、最大抬升指數(shù)、對(duì)流穩(wěn)定度指數(shù)等72種物理參數(shù)。為保證數(shù)據(jù)的可靠性,采用四分位檢測(cè)異常值,剔除上四分位+1.5 IQR距離、下四分位-1.5 IQR距離以外時(shí)刻的數(shù)據(jù)。閃電資料來(lái)源于貴州省閃電監(jiān)測(cè)網(wǎng),考慮實(shí)際業(yè)務(wù)中T-lnp探空數(shù)據(jù)每天主要包括08時(shí)和20時(shí)2個(gè)時(shí)次,以及探空站之間的距離。規(guī)定該站當(dāng)日08時(shí)或20時(shí)以后12 h內(nèi)、100 km范圍內(nèi)若發(fā)生50次以上的閃電,則將當(dāng)日08時(shí)或者20時(shí)對(duì)應(yīng)的物理參量作為1個(gè)雷暴天氣樣本,反之為非雷暴天氣。本文通過(guò)篩選得到294個(gè)雷暴、238非雷暴天氣樣本以及對(duì)應(yīng)的72個(gè)物理參數(shù)值、閃電活動(dòng)次數(shù)。

2 分析方法

以篩選的樣本中72個(gè)對(duì)流參數(shù)為因變量,納入單因素邏輯回歸模型,篩選變量,將有顯著性統(tǒng)計(jì)學(xué)意義(P<0.001) 的變量納入多因素邏輯回歸模型,選取滿(mǎn)足一定檢驗(yàn)條件的參數(shù)代入模型計(jì)算概率預(yù)測(cè)值。以此概率預(yù)測(cè)值為檢驗(yàn)變量,樣本雷暴活動(dòng)情況為狀態(tài)變量,繪制ROC曲線,以敏感度與特異性之和最大所對(duì)應(yīng)的概率值作為截?cái)嘀担{入氣象預(yù)報(bào)質(zhì)量評(píng)分檢驗(yàn)。

2.1 Logistic 模型聯(lián)合ROC曲線法

假設(shè)雷暴發(fā)生情況y,發(fā)生為1,未發(fā)生為0。影響雷暴發(fā)生情況y的m個(gè)對(duì)流參數(shù)分別為x1,x2,…,xm。雷暴活動(dòng)發(fā)生的概率記為P(y=1|xi)=Pi,發(fā)生與否的2個(gè)概率分別為:

(1)

(2)

其中Pi代表在第i個(gè)觀測(cè)中雷暴發(fā)生的概率,1-Pi對(duì)應(yīng)雷暴未發(fā)生的概率,均為對(duì)流參數(shù)xi構(gòu)成的非線性函數(shù)。雷暴發(fā)生與不發(fā)生的概率之比Pi/(1-Pi),稱(chēng)為事件的發(fā)生比(Odds),對(duì)Odds取對(duì)數(shù)變換,得到邏輯回歸模型的線性模式如下:

(3)

得到雷暴活動(dòng)發(fā)生概率P如下所示:

(4)

ROC 曲線(receiver operating characteristic curve)分析被認(rèn)為是一種診斷試驗(yàn)評(píng)價(jià)中理想和經(jīng)典的方法。其思路是以邏輯回歸模型所得的預(yù)測(cè)概率為基礎(chǔ),選取不同截?cái)嘀蛋凑毡?描述的雷暴預(yù)報(bào)混淆矩陣進(jìn)行統(tǒng)計(jì),計(jì)算不同截?cái)嘀迪碌拿舾卸扰c特異度。

表2 探空物理量參數(shù)為因變量構(gòu)建單因素、多因素邏輯回歸模型Tab.2 Single factor and multi factor Logistic regression models with sounding physical parameters as dependent variables

2.2 氣象預(yù)報(bào)檢驗(yàn)

對(duì)于雷電等強(qiáng)對(duì)流天氣的小概率時(shí)間檢驗(yàn)采用Donaldson[13]提出的方法,計(jì)算命中率(POD)、虛警率(FAR)、臨界成功指數(shù)(CSI)、失誤率(FOM)衡量預(yù)報(bào)方程的準(zhǔn)確率和進(jìn)行預(yù)報(bào)質(zhì)量評(píng)分。在表1混淆矩陣的基礎(chǔ)上,計(jì)算POD、FAR、CSI、FOM如下所示:

表1 混淆矩陣Tab.1 Confusion matrix

(5)

(6)

(7)

(8)

3 結(jié)果分析

3.1 Logistic回歸分析模型

通過(guò)單因素分析顯示瑞士第二雷暴指數(shù)(SWISS12)、瑞士第一雷暴指數(shù)(SWISS00)、抬升指數(shù)(LI)、最大抬升指數(shù)(BLI)、條件對(duì)流穩(wěn)定度指數(shù)(IL)、沙氏指數(shù)(SI)、通氣管指數(shù)(TQG)、修正杰弗遜指數(shù)(TMJ)、Faust指數(shù)(Faust)、修正對(duì)流指數(shù)(DCI)、修正K指數(shù)(mK)、抬升凝結(jié)處溫度(TCL_T)、對(duì)流凝結(jié)高度處溫度(CCL_T)、整層比濕積分(IntegralQ)14個(gè)對(duì)流參數(shù),有統(tǒng)計(jì)學(xué)意義(均有P<0.001),即以上14個(gè)參數(shù)對(duì)雷暴活動(dòng)趨勢(shì)有指示作用,涉及大氣熱力因子、動(dòng)力條件及綜合指數(shù)等,可綜合反映中低層熱動(dòng)力穩(wěn)定度特性。其中SWISS12、SWISS00、LI、BLI、IL、SI6個(gè)參數(shù)OR<1,表征參數(shù)越小,發(fā)生雷暴活動(dòng)的可能性越大;反之其他8個(gè)參數(shù)值越大,發(fā)生雷暴活動(dòng)的可能性越大。進(jìn)一步對(duì)有統(tǒng)計(jì)學(xué)意義的14個(gè)參數(shù)采用多因素分析,結(jié)果顯示SWISS00(OR=0.74,95%CI:0.58~0.94,P<0.05)、LI(OR=0.65,95%CI:0.45~0.96,P<0.05)、BLI(OR=0.81,95%CI:0.71~0.92,P<0.05)、IntegralQ(OR=1.00,95%CI:0.90~1.20,P<0.05)4個(gè)參數(shù)為雷電潛勢(shì)預(yù)報(bào)多參數(shù)邏輯回歸指標(biāo),即ln(p/(1-p))=0.306×SWISS00+0.424×LI+0.214×BLI-0.001×IntegralQ。

3.2 ROC曲線

在概率截?cái)嘀禐?.5水平下,如表3所示,單因素構(gòu)建邏輯回歸模型預(yù)準(zhǔn)確度介于68.2%~75.4%,ROC曲線的曲線下面積介于0.751~0.793,以整層比濕積分相對(duì)最好、沙氏指數(shù)相對(duì)最差。若以整層比濕積分(IntegralQ)作為單因素指標(biāo)開(kāi)展雷電潛勢(shì)預(yù)報(bào),準(zhǔn)確度為75.4%。

表3 單因素指標(biāo)ROC曲線下的面積Tab.3 Area under ROC curve of single factor index

采用多因素邏輯回歸模型,ROC曲線的曲線下面積為0.839(0.804~0.875),P<0.001,預(yù)測(cè)能力較單因素模型有所提高,具有較好的預(yù)測(cè)價(jià)值(圖1)。當(dāng)Logistic回歸分析模型得到的預(yù)測(cè)值為0.611時(shí),其敏感度為0.789,特異度為0.799,二者之和最大,因此將該值作為最佳臨界點(diǎn)將研究對(duì)象分為2組,即Logistic回歸分析模型預(yù)測(cè)概率值≥0.611認(rèn)為有雷電天氣過(guò)程,在此條件下,準(zhǔn)確度由單因素的75.4%提高到79.5%。

圖1 多因素邏輯回歸ROC曲線Fig.1 Multivariate Logistic regression ROC curve

3.3 預(yù)報(bào)質(zhì)量校驗(yàn)

根據(jù)確定的概率截?cái)嘀?.611,在混淆矩陣的基礎(chǔ)上統(tǒng)計(jì)TP為247、FP為47、FN為62、TN為176,采用氣象預(yù)報(bào)評(píng)分計(jì)算命中率(POD)為84.01%、虛警率(FAR)為26.05%、臨界成功指數(shù)(CSI)69.38%、失誤率(FOM)為20.06%。

4 結(jié)論與討論

本文選取72個(gè)探空物理量參數(shù)作為自變量,閃電監(jiān)測(cè)系統(tǒng)探測(cè)是否發(fā)生閃電作為因變量,將單因素指標(biāo)逐一納入邏輯回歸模型,篩選具有顯著性統(tǒng)計(jì)學(xué)意義(P<0.001)的指標(biāo)進(jìn)入多因素回歸模型,選取滿(mǎn)足檢驗(yàn)條件P<0.05的參數(shù)得到雷電潛勢(shì)預(yù)報(bào)模型ln(p/(1-p))=0.306×SWISS00+0.424×LI+0.214×BLI-0.001×IntegralQ。得到結(jié)論如下:

①多因素邏輯回歸模型預(yù)警效果優(yōu)于單因素模型,預(yù)警準(zhǔn)確度從75.4%提高到79.5%。

②聯(lián)合ROC曲線確定預(yù)報(bào)模型的概率閾值為0.611,雷電潛勢(shì)預(yù)報(bào)的命中率POD為84.01%,虛假警報(bào)率FAR為26.05%,臨界成功指數(shù)CSI為69.38%。準(zhǔn)確率較高,雷電潛勢(shì)預(yù)報(bào)具有較好的預(yù)報(bào)能力。

Logistic回歸模型處理“二分類(lèi)”問(wèn)題,旨在擬合結(jié)果的“有”“無(wú)”問(wèn)題,有效彌補(bǔ)了線性回歸的缺陷;同時(shí)結(jié)合ROC曲線對(duì)模型進(jìn)行檢驗(yàn),確定合適的預(yù)測(cè)概率值,可進(jìn)一步提高預(yù)警準(zhǔn)確率。Logistic回歸模型聯(lián)合ROC曲線法在氣象預(yù)測(cè)預(yù)報(bào),特別是非線性預(yù)測(cè)中有一定的應(yīng)用價(jià)值。

猜你喜歡
潛勢(shì)探空雷暴
探空氣球?yàn)楦呖諝庀蟆鞍衙}”
新德里雷暴
賀蘭山沿山地區(qū)強(qiáng)對(duì)流潛勢(shì)預(yù)報(bào)方法研究
臨渙選煤廠浮選效果評(píng)價(jià)與尾煤再選潛勢(shì)分析
氨對(duì)甲苯二次有機(jī)氣溶膠生成潛勢(shì)影響的實(shí)驗(yàn)研究
能源工程(2021年2期)2021-07-21 08:39:54
阜新地區(qū)雷暴活動(dòng)特點(diǎn)研究
綠色科技(2018年22期)2019-01-15 05:36:08
廣西富川縣雷暴氣候特征分析
“適者生存”?
雜文月刊(2017年24期)2017-03-03 07:42:55
TK-2GPS人影火箭探空數(shù)據(jù)與L波段探空數(shù)據(jù)對(duì)比分析
淺談凈舉力對(duì)探空氣球升速及施放高度的影響
河南科技(2014年14期)2014-02-27 14:12:08
清流县| 延安市| 寿宁县| 常山县| 清镇市| 长海县| 遵义县| 军事| 常州市| 福安市| 凤阳县| 隆回县| 黄大仙区| 苏尼特右旗| 岐山县| 舒兰市| 翁牛特旗| 安丘市| 泰顺县| 新巴尔虎右旗| 临漳县| 仲巴县| 潢川县| 成安县| 蓝山县| 东港市| 崇阳县| 临西县| 新昌县| 广汉市| 革吉县| 吐鲁番市| 红原县| 叶城县| 通州市| 九江市| 隆回县| 广水市| 邹平县| 大同市| 叶城县|