李 海, 張超群, 郭生權, 馮 青
(中國民航大學天津市智能信號與圖像處理重點實驗室, 天津 300300)
降水粒子分類研究對于災害天氣的識別、預警、數(shù)值預報以及人工影響天氣的作業(yè)指揮和效果評估都有十分重要的意義。與傳統(tǒng)多普勒氣象雷達相比,雙偏振氣象雷達可以交替發(fā)射水平和垂直偏振波,并接收2個偏振方向的回波信號,除獲取反射率強度、徑向速度、速度譜寬外,還可探測差分反射率因子、差分傳播相移、相關系數(shù)等參量,具有識別粒子相態(tài)功能,是近年降水粒子分類研究領域的研究熱點。
模糊邏輯方法是最經(jīng)典的降水粒子分類方法,是一種解決不精確和不完全信息問題的有效方法, 最大的特點是可以利用專家經(jīng)驗進行分類,能夠比較自然地處理模糊的概念, 其主要的優(yōu)點是可以處理不確定的信息。20世紀90年代初,Straka等將模糊邏輯應用于雙偏振雷達的降水粒子相態(tài)識別研究中,與經(jīng)典布爾邏輯方法相比,模糊邏輯方法以隸屬函數(shù)代替經(jīng)典布爾邏輯的固定閾值,同時減少了判斷步驟。Zrnic等將隸屬函數(shù)由二維矩陣變成了5個極化參量的矩陣,同時可以識別9種降水粒子。曹俊武等將模糊邏輯方法應用于國內(nèi)的雙偏振雷達。Park等改進了模糊邏輯相態(tài)識別算法(Hydrometeor Classification Algorithm, HCA),將隸屬函數(shù)修改為非對稱的梯形,并引入了置信向量來平衡數(shù)據(jù)誤差。
近幾年,基于模糊邏輯的雙偏振氣象雷達方法在國內(nèi)應用開始興起。文獻[5]中利用模糊邏輯算法對上海的S波段雙極化氣象雷達實測數(shù)據(jù)進行降水分類的業(yè)務分析。文獻[7]中利用模糊邏輯算法對X波段雙極化氣象雷達探測降水數(shù)據(jù)進行分類,分析研究了各降水粒子在雷暴演變過程中的相態(tài)特性。汪舵等建立了一種基于相態(tài)識別的S波段雙線偏振雷達最優(yōu)化定量降水估測算法。文獻[9]以美國HCA方法為基礎,建立了適合廣東S波段雙偏振氣象雷達的分類方法。武崇等對一次超級單體進行討論,用HCA方法識別出雨及冰雹混合物區(qū)域。同年,他通過對颮線過程的分析,對HCA算法的參數(shù)和閾值進行優(yōu)化,得到適用于華南珠海的偏振算法,該研究為發(fā)展適合中國降水特征的 HCA 算法奠定基礎。王洪等將Park的算法簡化并應用于珠澳偏振雷達中,通過S波段雷達對一次超級單體進行分析,有效識別出冰雹區(qū)域,由于僅對一次觀測結果得出結論,因此對各偏振量之間的定量關系也需要進一步研究。楊章等基于HCA-LIQ算法對廣州9次降雨評估,由于該算法低估了中小顆粒的沉淀,過高估計了中等和大顆粒的沉淀,導致對大雨的分類不準確,需要研究極大雨來進一步驗證并改進算法。馮亮等利用雙偏振氣象雷達數(shù)據(jù)建立了基于偏振參量、溫度、紋理參數(shù)的模糊邏輯降水粒子識別算法。文獻[14]基于深度學習和模糊邏輯算法對降水粒子進行分類,該方法提高了水凝物識別的準確性。王金虎等利用模糊邏輯算法和神經(jīng)網(wǎng)絡算法對云雷達聯(lián)合微波輻射計探測數(shù)據(jù)進行降水粒子分類研究,結果表明模糊邏輯算法對退極化比極為敏感。發(fā)展至今,模糊邏輯方法仍存在一定的局限性,例如怎樣確定隸屬函數(shù)參數(shù),以及如何提高降水粒子分類的準確率。
本文使用二維統(tǒng)計分析的方法確定鐘型隸屬函數(shù)的參數(shù)。首先將數(shù)據(jù)進行二維統(tǒng)計,分析得到鐘型隸屬函數(shù)的參數(shù)中心以及寬度的取值,然后取隸屬函數(shù)圖像的臨界值作為鐘型隸屬函數(shù)斜率。再根據(jù)不同極化參數(shù)對降水粒子的貢獻程度以及分類準確率調(diào)節(jié)各極化參數(shù)的權重系數(shù)。最后使用調(diào)節(jié)好的參數(shù)以及權重系數(shù)對一次雷達數(shù)據(jù)進行降水粒子分類。該方法能夠較為準確的調(diào)節(jié)隸屬函數(shù)參數(shù),實現(xiàn)降水粒子分類。
模糊邏輯方法是最經(jīng)典的分類方法,主要分為3個部分:模糊化、規(guī)則計算和退模糊。模糊化主要是對隸屬函數(shù)參數(shù)的確定,而隸屬函數(shù)參數(shù)和權重系數(shù)直接影響規(guī)則計算的準確率,從而影響退模糊后的降水粒子分類準確率,退模糊中引入融化層信息調(diào)節(jié)降水粒子分類結果。隸屬函數(shù)參數(shù)一般是使用專家經(jīng)驗值進行確定,不同隸屬函數(shù)的參數(shù)也不同,本文使用二維統(tǒng)計分析方法對鐘型隸屬函數(shù)參數(shù)進行確定,使用模糊邏輯方法實現(xiàn)降水粒子分類,流程如圖1所示。在模糊化過程中,首先對帶標簽的不同降水粒子各極化參數(shù)的數(shù)據(jù)進行處理,然后對處理后的數(shù)據(jù)進行二維統(tǒng)計分析,對鐘型隸屬函數(shù)的中心、寬度進行確定,再取臨界值作為斜率的取值;在規(guī)則計算過程中,調(diào)節(jié)不同降水粒子各極化參量的權重系數(shù),得到參數(shù)調(diào)整的結果;最后將調(diào)節(jié)好的參數(shù)使用模糊邏輯方法對一次雷達數(shù)據(jù)進行降水粒子分類。
圖1 總體流程圖
本文使用4個極化參數(shù)進行識別、分類:水平反射率因子,差分反射率因子,互相關系數(shù)和差分相移率,其中差分相移率取對數(shù)形式。
1) 水平/垂直反射率因子/(單位:dBz)
雙偏振氣象雷達發(fā)射水平和垂直偏振方向電磁波,通過雷達的回波數(shù)據(jù)可以計算得出水平反射率因子和垂直反射率因子。
2) 差分反射率因子(單位:dBz)
差分反射率表示為和的差,計算方式為
=-
(1)
反映了降水粒子下落過程中的形變程度,形變程度與降水粒子的空間取向和軸比(粒子的長軸與短軸的比值)有關,粒子形狀越接近圓球形時的值越接近于0。
3) 互相關系數(shù)
是水平和垂直偏振波的后向散射特征的相關性。定義為水平與垂直偏振回波信號的互相關系數(shù)。
4) 差分相移率(單位:(°)/km)
不受雷達定標、衰減和波束遮擋等影響,在液態(tài)的降水粒子中一般為正值,在垂直取向的柱狀冰晶處會出現(xiàn)負值。由于參量較大的變化范圍不利于降水粒子的相態(tài)識別,因此在的基礎上引入了,即使用對數(shù)坐標替代線性坐標,具體如下:
(2)
1) 鐘型隸屬函數(shù)
不同降水粒子類型各極化參量的范圍通常以適當?shù)碾`屬函數(shù)為特征,本文使用鐘型隸屬函數(shù),一方面,鐘形隸屬度函數(shù)具有扁平寬闊的區(qū)域,它對應于降水粒子的參數(shù)取值范圍,而不是單一的數(shù)值;另一方面,鐘形隸屬度函數(shù)有一個很寬的過渡區(qū),可以改善模糊邏輯識別算法在過渡區(qū)的可靠性。鐘型隸屬函數(shù)表達式如式(3)所示:
(3)
其中,=1,2,…,6,代表6種分類結果,本文將雙偏振雷達回波識別為6種降水粒子分類:1)冰晶(IC);2)干雪(DS);3)濕雪(WS);4)雨(RA);5)霰(GR);6)冰雹(HA)。=1,2,3,4,代表有4種用于相態(tài)識別的雷達極化參量,代表4種極化參量,分別是:1);2);3);4)。_是隸屬函數(shù)的中心,_是隸屬函數(shù)寬度的一半,_是隸屬函數(shù)的斜率,每個參數(shù)的意義如圖2所示,橫坐標代表極化參數(shù),縱坐標代表隸屬度,其中,不同的分類結果的各極化參數(shù)有不同的隸屬函數(shù)范圍。
圖2 鐘型隸屬函數(shù)
2) 中心值_及寬度_的確定方法
(4)
(5)
圖3 冰晶ZH_ZDR頻次圖
3) 斜率_的確定方法
斜率的取值一般是0~20范圍內(nèi)的數(shù)字,斜率太小,不同降水粒子的隸屬函數(shù)重疊區(qū)域比較大;斜率太大,鐘型隸屬函數(shù)所包含的區(qū)域幾乎不會發(fā)生變化,因此,本文分別將HA和RA、DS和IC、WS和GR的隸屬函數(shù)對比,先畫出斜率值為0.5時的鐘型隸屬函數(shù)圖像,然后不斷以0.5~1的間隔增大斜率的取值,得到多個隸屬函數(shù)圖像,經(jīng)過對斜率取值的調(diào)整使鐘型隸屬函數(shù)所包含區(qū)域幾乎不會發(fā)生變化,確定臨界值,取臨界值作為斜率_。
圖4代表HA和RA的的鐘型隸屬函數(shù),實線代表HA的隸屬函數(shù),虛線代表RA的隸屬函數(shù),不同顏色代表不同斜率的取值。由圖可得,當HA斜率為2,RA斜率為4時,鐘型隸屬函數(shù)之間重疊區(qū)域較大,當HA的斜率大于10,RA的斜率大于12時,鐘型隸屬函數(shù)區(qū)域不會發(fā)生變化,所以選取HA的鐘型隸屬函數(shù)斜率為=10,RA的鐘型隸屬函數(shù)斜率為=12。
圖4 HA和RA的水平反射率因子(ZH)隸屬函數(shù)(實線:紅色斜率為2,藍色斜率為3,綠色斜率為5,藍綠色斜率為8,黑色斜率為10,紫紅色斜率為12;虛線:紅色斜率為4,藍色斜率為6,綠色斜率為8,藍綠色斜率為10,黑色斜率為12,紫紅色斜率為13)
權重系數(shù)一般由綜合理論值與專家的經(jīng)驗確定,本文以文獻[6]給出的權重系數(shù)為參考,如表1所示,權重系數(shù)的取值一般是0,0.2,0.4,0.6,0.8,1.0。根據(jù)極化參數(shù)對降水粒子識別的貢獻程度高低以及分類結果準確率調(diào)節(jié)權重系數(shù)大小,提高識別能力更強的極化參數(shù)的權重能有效提高準確率。本文根據(jù)極化參數(shù)的貢獻程度來調(diào)節(jié)權重系數(shù)大小,并使用混淆矩陣來判別不同分類結果的準確率,取準確率最高的權重系數(shù)作為最終的調(diào)整結果。
表1 原始權重系數(shù)
混淆矩陣如圖5所示,橫坐標代表修改參數(shù)后的分類結果,縱坐標代表數(shù)據(jù)的標簽,對角線代表不同類別的準確率。圖5(a)是未調(diào)節(jié)權重系數(shù)的分類結果準確率,識別效果不好的IC與DS主要在隸屬函數(shù)區(qū)域內(nèi)更容易區(qū)分,在、、隸屬函數(shù)區(qū)域重疊,因此,試驗將IC的權重系數(shù)改為0.8,0.6,0.2,將DS的改為0.8,1.0,0.4,統(tǒng)計混淆矩陣的準確率,將準確率最高的結果對應的權重系數(shù)作為權重系數(shù)調(diào)節(jié)后的結果,確定將IC的權重改為0.6,DS的改為1.0。同理,HA和RA主要依靠隸屬函數(shù)區(qū)域進行識別,考慮到HA的的權重已最高,僅修改RA的權重,試驗將RA的改為1.0,0.6,0.4,0.2,統(tǒng)計混淆矩陣的準確率,確定將RA的權重系數(shù)改為0.6。WS和GR在隸屬函數(shù)區(qū)域內(nèi)更容易區(qū)分,考慮到權重系數(shù)已經(jīng)最大,試驗將GR的權重改為0.8,0.6,0.2,統(tǒng)計混淆矩陣準確率,確定將GR的權重改為0.6。由圖5(b)可知,修改權重系數(shù)后,除雨外的其他降水粒子準確率均有所提高,說明調(diào)整權重系數(shù)后,結果更加準確。
(a) 未調(diào)節(jié)權重準確率
模糊邏輯方法本質(zhì)是簡單的規(guī)則運算,其主要是將各極化參數(shù)對降水粒子的判別信息進行規(guī)則運算,得到分類結果,主要分為3個步驟進行分類:模糊化、規(guī)則計算和退模糊。
模糊化是將極化參數(shù)對應于不同降水粒子的特定范圍,本文使用二維統(tǒng)計分析方法確定鐘型隸屬函數(shù)參數(shù),并使用鐘型隸屬函數(shù)表示不同降水粒子各極化參數(shù)的范圍。
規(guī)則計算是模糊邏輯最重要的一步,使用隸屬函數(shù)的加權求和實現(xiàn)分類,在此過程中,主要確定權重系數(shù)的取值,本文通過混淆矩陣代表準確率來調(diào)節(jié)權重系數(shù),使規(guī)則計算的結果更加準確,提高降水粒子分類準確率。函數(shù)表示來自所有分類的總貢獻,公式如式(6):
(6)
其中()()是鐘型隸屬函數(shù),表示第類極化參數(shù)的范圍;=4,代表4個極化參數(shù);表示某一類的權重系數(shù)。
最后是退模糊,比較不同分類的并找到具有最大值的類,作為最終輸出結果,其中=,代表6種降水粒子。在實際中,此過程應考慮一些物理約束。對于降水粒子分類,最常見的約束來自融化層。根據(jù)融化層頂部高度和底部高度,計算波束中心和-3 dB波束寬度與融化層的相對位置,得到雷達波束在融化層上下界、的投影距離、、、。
根據(jù)融化層的邊界以及融化層的溫度信息,對降水粒子分類結果做一定的限制:雪只能出現(xiàn)在融化層底部及以上的高度;純雨僅能出現(xiàn)在融化層頂部及以下的高度。根據(jù)上述原理,在不同距離范圍內(nèi)可以存在的降水粒子如表2所示。
表2 不同距離范圍內(nèi)存在降水粒子類型
本文通過二維統(tǒng)計分析方法對模糊邏輯鐘型隸屬函數(shù)參數(shù)修改,調(diào)節(jié)權重系數(shù),并引入融化層信息對一次雷達數(shù)據(jù)進行分類,得到降水粒子分類結果。
基于二維統(tǒng)計分析的模糊邏輯雙偏振氣象雷達降水粒子分類方法具體實現(xiàn)步驟如下:
步驟1 對數(shù)據(jù)進行處理,得到本文所需的4種極化參量;
步驟2 根據(jù)數(shù)據(jù)進行二維統(tǒng)計分析,確定鐘型隸屬函數(shù)參數(shù);
步驟3 根據(jù)極化參數(shù)對降水粒子識別的貢獻程度高低以及分類結果準確率調(diào)節(jié)權重系數(shù)大??;
步驟4 利用調(diào)節(jié)后的參數(shù),并引入附加信息使用模糊邏輯方法對一次雷達數(shù)據(jù)進行降水粒子分類。
1)中心_以及寬度_的取值
對不同分類結果數(shù)據(jù)進行二維統(tǒng)計分析,得到不同極化參數(shù)的頻次圖,再根據(jù)圖6~圖11 的邊界值計算得到不同降水粒子各極化參數(shù)的隸屬函數(shù)參數(shù):中心_和寬度_。
圖6 IC頻次圖
圖7 DS頻次圖
圖8 WS頻次圖
圖9 RA頻次圖
圖10 GR頻次圖
圖11 HA頻次圖
2) 斜率_的確定
不同降水粒子各極化參數(shù)的鐘型隸屬函數(shù)圖如圖12~圖14所示,斜率太小,不同降水粒子的隸屬函數(shù)重疊區(qū)域比較大;斜率越大,鐘型隸屬函數(shù)所包含的區(qū)域幾乎不會變化,所以取臨界值作為最終的斜率_。
(a) ZH不同斜率時隸屬函數(shù)圖像
(a) ZH不同斜率時隸屬函數(shù)圖像
(a) ZH不同斜率時隸屬函數(shù)圖像
3) 鐘型隸屬函數(shù)參數(shù)取值
通過數(shù)據(jù)分析確定參數(shù),得到模糊邏輯鐘型隸屬函數(shù)參數(shù)取值如表3所示。
表3 鐘型隸屬函數(shù)參數(shù)修正值
4) 權重系數(shù)取值
權重系數(shù)是為了顯示不同極化參數(shù)對不同降水粒子的貢獻程度,通過混淆矩陣表示準確率來調(diào)整權重系數(shù),調(diào)整后的權重系數(shù)如表4所示。
表4 隸屬函數(shù)權重系數(shù)
選取KTLX雷達2019年6月9日當?shù)貢r間14:55數(shù)據(jù),利用調(diào)節(jié)參數(shù)后的模糊邏輯方法進行降水粒子分類。圖15(b)是調(diào)節(jié)參數(shù)后模糊邏輯的分類結果,同時與NOAA提供的降水粒子分類結果(圖15(a))作為對比和參照。從圖15(a)和圖15(b)的對比中可以看出:調(diào)節(jié)鐘型隸屬函數(shù)參數(shù)后,模糊邏輯方法與NOAA提供的分類結果相似,僅存在一定程度的誤識別,對于冰雹來說,識別區(qū)域要比NOAA提供的區(qū)域大,把少量的雨分為了冰雹。總體來說,與NOAA提供的結果相似度比較高。
(a) NOAA提供結果
針對模糊邏輯鐘型隸屬函數(shù)參數(shù)確定問題,本文使用二維統(tǒng)計分析的方法來確定鐘型隸屬函數(shù)的參數(shù)。首先將雙偏振氣象雷達的極化參數(shù)進行二維統(tǒng)計分析,得到鐘型隸屬函數(shù)參數(shù):中心以及寬度,然后將臨界值作為鐘型隸屬函數(shù)的斜率。再根據(jù)不同極化參數(shù)對降水粒子的貢獻程度以及準確率調(diào)節(jié)降水粒子每一類極化參數(shù)的權重系數(shù)。使用調(diào)節(jié)好的參數(shù)以及權重系數(shù)對一次雷達數(shù)據(jù)進行降水粒子分類,實驗結果表明,該方法能夠較為有效地實現(xiàn)降水粒子分類,具有很好的研究潛質(zhì)和應用價值。