王 華 楊乾鵬/林芝市氣象局
模式識別在氣象探測和信息處理中的應(yīng)用
王華楊乾鵬/林芝市氣象局
隨著模式識別和氣象探測技術(shù)的發(fā)展,模式識別在氣象探測和氣象信息數(shù)據(jù)處理中應(yīng)用較為廣泛。本文主要總結(jié)了在氣象領(lǐng)域內(nèi)應(yīng)用的一些方法,包括在基于聚類算法的雷電數(shù)據(jù)應(yīng)用、神經(jīng)網(wǎng)絡(luò)系統(tǒng)在暴雨預(yù)報中的應(yīng)用以及基于多普勒天氣雷達(dá)探測資料中低空急流、龍卷、下?lián)舯┝骱完囷L(fēng)鋒四種天氣現(xiàn)象的分類識別。
模式識別;氣象探測;聚類;神經(jīng)網(wǎng)絡(luò)
模式識別是20世紀(jì)60年代初迅速發(fā)展起來的一門科學(xué),經(jīng)過幾十年的研究,取的了豐碩的成果,已經(jīng)形成了一個比較完善的理論體系,主要包括統(tǒng)計模式識別、結(jié)構(gòu)模式識別、模糊模式識別、神經(jīng)網(wǎng)絡(luò)模式識別和分類器融合等研究內(nèi)容。模式識別系統(tǒng)由信息獲取、預(yù)處理、特征提取和選擇、分類判決等4個部分組成。模式識別主要是應(yīng)用在其它學(xué)科,尤其是在一些文本分類、語音識別、圖像識別、視頻識別,在本文主要是介紹模式識別在氣象探測和氣象信息處理中的應(yīng)用,從而提高天氣的預(yù)報預(yù)測能力和氣象資料的分析處理能力。
(一)研究雷電的背景和意義
本文分析了一種新的雷電數(shù)據(jù)應(yīng)用方法。在這個方法中將會運(yùn)用一種聚類算法——K-MEANS算法。氣象觀測活動中獲得的雷電數(shù)據(jù)通過該方法進(jìn)行聚類分析,得出理想的雷暴體聚類中心,這些聚類中心是最佳的雷暴體參數(shù)信息的反應(yīng)。通過對這一聚類結(jié)果的研究與分析,可以掌握雷暴活動中雷暴單體的生命演變過程,并可以預(yù)測雷暴的發(fā)展動向。
(二)雷電數(shù)據(jù)應(yīng)用的現(xiàn)狀
雷電與災(zāi)害性天氣(如龍卷、冰雹、超級單體和大風(fēng))的關(guān)系非常密切,這方面已經(jīng)有許多研究。觀測數(shù)據(jù)表明,云地閃的總數(shù)、閃電總數(shù)以及這些因素的綜合指數(shù)與災(zāi)害性天氣有最直接的關(guān)系。天氣預(yù)報人員可以使用云地閃電數(shù)據(jù)進(jìn)行大范圍天氣監(jiān)測和對流天氣短時預(yù)報。因為閃電演變特征能較好地指示對流的存在、產(chǎn)生、移動、消散、結(jié)構(gòu)、范圍、強(qiáng)度和再發(fā)展等重要信息。雷電資料對雷達(dá)低仰角探測被地物遮擋的地區(qū)和國家邊界周圍以及沿海地區(qū)的作用尤為突出。對于因山地和大面積水域產(chǎn)生的局地強(qiáng)對流天氣,雷電數(shù)據(jù)對其演變的監(jiān)測和識別也具有重要意義。研究表明,一定情形下的云地閃與洪水、冰雹、暴雨、龍卷以及微暴流是密切關(guān)聯(lián)的。但這種關(guān)聯(lián)需要對不同的地區(qū)和不同的季節(jié)分別進(jìn)行研究分析。這一課題的廣泛研究必須建立在對雷電網(wǎng)絡(luò)數(shù)據(jù)進(jìn)一步分析的基礎(chǔ)上。
雷電探測網(wǎng)可以24小時連續(xù)監(jiān)測閃電的活動,跟其它探測設(shè)備相比,雷電探測系統(tǒng)還具有以下特點:
(1)雷電數(shù)據(jù)能夠有效地在大面積的雨區(qū)內(nèi)區(qū)分出發(fā)展中的對流云。
(2)當(dāng)衛(wèi)星云圖、氣象雷達(dá)或其它氣象資料缺乏時,雷電數(shù)據(jù)可作補(bǔ)充。
(3)實時的閃電數(shù)據(jù)可在數(shù)秒內(nèi)報告雷暴的監(jiān)測結(jié)果,這是雷達(dá)和衛(wèi)星所不能企及的。
(4)雷電數(shù)據(jù)可以瞬間刷新,以幫助識別強(qiáng)對流天氣的區(qū)域和發(fā)展趨勢。
2.3K-均值法聚類和實現(xiàn)處理的大概步驟
1967年,MacQueen首次提出了K均值聚類算法(K-means算法)。迄今為止,很多聚類任務(wù)都選擇該經(jīng)典算法。該算法的核心思想是找出K個聚類中心 ,使得每一個數(shù)據(jù)點和與其最近的聚類中心的平方距離和被最小化(該平方距離和被稱為偏差 D)。
K均值(K-means)聚類算法(對n個樣本進(jìn)行聚類)
(1)[初始化]:隨機(jī)指定K個聚類中心();
(2)[分配]:對每一個樣本,找到離它最近的聚類中心,并將其分配到所標(biāo)明類;
(3)[修正]:將每一個移動到其標(biāo)明的類的中心;
(4)[計算偏差]: ; (2-1)
(5)[D判斷收斂]:如果D值收斂,則return()并終止本算法;否則,返回步驟(2)。
K-means 算法的優(yōu)點與不足。優(yōu)點:能對大型數(shù)據(jù)集進(jìn)行高效分類,其計算復(fù)雜性為 O(tKmn),其中,t為迭代次數(shù),K為聚類數(shù),m為特征屬性數(shù),n為待分類的對象數(shù),通常,K,m,t<<n。在對大型數(shù)據(jù)集聚類時,K-means 算法比層次聚類算法快得多。不足:通常會在獲得一個局部最優(yōu)值時終止;僅適合對數(shù)值型數(shù)據(jù)聚類;只適用于聚類結(jié)果為凸形(即類簇為凸形)的數(shù)據(jù)集[3]。以經(jīng)典K-means算法為基礎(chǔ),研究者們提出了很多新的改進(jìn)的K-means 算法。
實現(xiàn)的大概步驟:
輸入:聚類個數(shù)k,包含n個數(shù)據(jù)對象的數(shù)據(jù)集。
輸出:k個聚類。
(1)從n個數(shù)據(jù)中任意選擇k個數(shù)據(jù)作為初始的聚類中心。
(2)計算每個數(shù)據(jù)點到聚類中心的距離,把數(shù)據(jù)點歸類到最近的聚類中心的簇。
(3)所有數(shù)據(jù)點分配完成后,再計算其聚類新的中心。
(4)將新的中心和前一次的聚類中心作比較,如果有變化則轉(zhuǎn)到步驟2,否則,轉(zhuǎn)到步驟5。
(5)輸出聚類結(jié)果。
(一)研究暴雨的背景和意義
暴雨是我國夏季常見的一種影響嚴(yán)重的災(zāi)害性天氣。某一地區(qū)連降暴雨或出現(xiàn)大暴雨、特大暴雨,常導(dǎo)致山洪爆發(fā),水庫垮壩,江河橫溢,房屋被沖塌,農(nóng)田被淹沒,交通和電訊中斷,會給國民經(jīng)濟(jì)和人民的生命財產(chǎn)帶來嚴(yán)重危害。暴雨尤其是大范圍持續(xù)性暴雨和集中的特大暴雨,不僅影響工農(nóng)業(yè)生產(chǎn),而且可能危害人民的生命,造成嚴(yán)重的經(jīng)濟(jì)損失。暴雨的研究和預(yù)報,對提高防災(zāi)減災(zāi)能力有著重大的意義。
(二)神經(jīng)網(wǎng)絡(luò)技術(shù)在暴雨中的應(yīng)用
神經(jīng)元網(wǎng)絡(luò)原理模擬人腦的學(xué)習(xí)、記憶、思維、推理機(jī)能,主要是利用其網(wǎng)絡(luò)模擬預(yù)報員從大尺度環(huán)境場中捕捉暴雨信息的能力。神經(jīng)網(wǎng)絡(luò)專家系統(tǒng)與傳統(tǒng)規(guī)則型專家系統(tǒng)亦不相同,傳統(tǒng)型專家系統(tǒng)的規(guī)則基于預(yù)報員長期的工作經(jīng)驗,規(guī)則之間要滿足嚴(yán)格的合諧性和完備性條件才能保證推理的正確性,而這兩點實際是很難達(dá)到的。神經(jīng)元網(wǎng)絡(luò)專家系統(tǒng)利用人工神經(jīng)元來模擬大腦的記憶和思維能力,用網(wǎng)絡(luò)權(quán)系矩陣隱式地表示知識,通過隱單元和節(jié)點作用函數(shù)實現(xiàn)非線性。通過訓(xùn)練獲取知識,利用網(wǎng)絡(luò)對初值的響應(yīng)實現(xiàn)推理功能。
大概步驟:依據(jù)在一段時間內(nèi)暴雨的資料,將分布在一定區(qū)域的暴雨資料按照經(jīng)緯度網(wǎng)格化,組成神經(jīng)元網(wǎng)絡(luò)待選的感應(yīng)神經(jīng)元輸入神經(jīng)元。利用具有一層隱結(jié)點的BP網(wǎng)絡(luò),設(shè)定隱單元的數(shù)目為輸入神經(jīng)元數(shù)據(jù)量的一半,目的是使網(wǎng)絡(luò)具有良好的性能,通過BP網(wǎng)絡(luò)建立模式資料與發(fā)生暴雨發(fā)生所在地的站點降水資料的映射關(guān)系,通過網(wǎng)絡(luò)的學(xué)習(xí)功能,確定網(wǎng)絡(luò)權(quán)系矩陣,由此對大到暴雨以上的降水進(jìn)行預(yù)報。
本文簡單的從基于聚類算法的雷電數(shù)據(jù)應(yīng)用;神經(jīng)網(wǎng)絡(luò)系統(tǒng)在暴雨預(yù)報中的應(yīng)用;上述方法參考了大量前輩的資料,這里只是一些總結(jié)及設(shè)想,有一些簡單的嘗試,還沒有大范圍的應(yīng)用。目前模式識別技術(shù)在氣象領(lǐng)域的應(yīng)用較為廣泛,隨著模式識別技術(shù)的快速發(fā)展,將模式識別技術(shù)應(yīng)用到其中將會推動氣象技術(shù)的更加快速發(fā)展,會更充分利用好氣象資料,提高識別精度和處理效率。
[1]李弼成,邵美珍,等.模式識別原理與應(yīng)用.西安:西安電子科技大學(xué)出版社, 2008
[2]王耀生.人工智能、模式識別在氣象領(lǐng)域應(yīng)用的現(xiàn)狀與展望.北京:氣象,1987
[3]孫吉貴,劉杰,趙連宇.聚類算法研究.2008 Journal of Software, Vol.19, No.1,