国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

張衡一號(hào)感應(yīng)磁力儀數(shù)據(jù)閃電哨聲波自動(dòng)識(shí)別

2021-11-15 07:23袁靜王橋楊德賀劉芹芹澤仁志瑪申旭輝
地球物理學(xué)報(bào) 2021年11期
關(guān)鍵詞:分類器尺度卷積

袁靜, 王橋, 楊德賀, 劉芹芹, 澤仁志瑪, 申旭輝

1 防災(zāi)科技學(xué)院, 河北三河 065421 2 應(yīng)急管理部國(guó)家自然災(zāi)害防治研究院, 北京 100085

0 引言

利用電磁衛(wèi)星監(jiān)測(cè)地震始于20世紀(jì)80年代,現(xiàn)已探測(cè)到了大量的電磁異常信息(Shen et al., 2018;Yan et al., 2018; Larkina, 1983; Chmyrev et al., 1989; Parrot and Mogilevsky, 1989; Pulinets and Legen′ka, 2003; Molchanov, 1993; 蔡軍濤等, 2007),從而為地震電磁擾動(dòng)提供了新的觀測(cè)手段.然而,引起電磁異常擾動(dòng)的因素很多(尼魯帕爾·買買吐孫和張永仙,2012),大量研究結(jié)果顯示,低層大氣氣象活動(dòng)中的一些劇烈的天氣現(xiàn)象也會(huì)引起電離層擾動(dòng),譬如臺(tái)風(fēng)、颶風(fēng)、寒潮、龍卷風(fēng)、閃電等 (劉依謀等, 2006; 肖賽冠等, 2007).在眾多的氣象活動(dòng)中,閃電是發(fā)生最頻繁的一種自然現(xiàn)象,Christian等(2003)使用光學(xué)瞬態(tài)探測(cè)器探測(cè)到全球閃電頻數(shù)為44 fl/s(fl為flash簡(jiǎn)寫,表征閃電發(fā)生的次數(shù)).閃電放電過程中激發(fā)寬頻帶的電磁波,頻率范圍在500 Hz~10 kHz,因類似于口哨的聲音,故被稱為哨聲波(Helliwell, 1965).

閃電哨聲波能夠到達(dá)電離層、磁層,是探測(cè)空間物理環(huán)境的重要媒介(Helliwell, 1965).Záhlava等(2018)通過分析DEMETER衛(wèi)星和RBSP衛(wèi)星的閃電哨聲波發(fā)現(xiàn)等離子體層內(nèi)部的哨聲波模的縱向依賴性很強(qiáng).Bayupati等(2012)通過分析AKEBONO衛(wèi)星的閃電哨聲波的色散發(fā)現(xiàn)閃電哨聲波的色散趨勢(shì)是確定等離子體層中整體電子密度分布的有力方法.Oike等(2014)分析AKEBONO衛(wèi)星探測(cè)的閃電哨聲波發(fā)生頻率證明了電離層中的閃電哨聲波與閃電活動(dòng)、地球周圍的電子密度分布密切相關(guān).Clilverd等(2002)借助全球閃電定位網(wǎng)(WWLLN)來確定閃電的來源位置,再根據(jù)閃電哨聲波從來源點(diǎn)到觀測(cè)點(diǎn)的傳播時(shí)間,最后利用傳播理論導(dǎo)出電子密度沿傳播路徑的函數(shù).可見了解閃電哨聲波的物理參數(shù)和位置等是開發(fā)利用閃電的基礎(chǔ),是研究電離層和磁層等空間環(huán)境的重要技術(shù)手段.

閃電哨聲波觀測(cè)主要有地基觀測(cè)和天基觀測(cè).20世紀(jì)80年代,我國(guó)開始探索地基閃電哨聲波觀測(cè),利用自主研發(fā)的地面哨聲波接收機(jī)對(duì)低緯哨聲波傳播特性進(jìn)行大量的研究(王挺柱等, 1982;徐繼生等, 1989;夏利東和王友善, 1994;田茂等, 1991),但受限于當(dāng)時(shí)模擬電子技術(shù)與計(jì)算機(jī)技術(shù),哨聲波接收機(jī)靈敏度不高,不易存儲(chǔ)(Chen, 2017).武漢大學(xué)于2016年成功研制新型甚低頻接收機(jī)系統(tǒng),已在我國(guó)低緯地區(qū)進(jìn)行多站點(diǎn)(隨州、樂山、武漢)聯(lián)合觀測(cè),取得了突破性進(jìn)展(Chen et al., 2016, 2017; Zhou et al., 2020; Yi et al., 2020).

2018年2月,我國(guó)首顆電磁衛(wèi)星張衡一號(hào)(ZH-1)發(fā)射成功,具備了天基觀測(cè)閃電哨聲波的能力.ZH-1衛(wèi)星覆蓋南北緯65°,在中國(guó)大陸及周邊1000 km區(qū)域及全球兩個(gè)地震帶(太平洋地震帶和歐亞地震帶)進(jìn)行詳查模式的觀測(cè),其他區(qū)域?yàn)檠膊槟J?ZH-1衛(wèi)星在軌飛行高度約507 km,其位置接近電離層頂部和等離子層邊界,這個(gè)區(qū)域有豐富的ELF/VLF頻段波動(dòng)事件,如閃電哨聲波、準(zhǔn)周期輻射等(Zhima et al., 2020).ZH-1軌道傾角97.4°,屬于太陽同步軌道,降交點(diǎn)地方時(shí)為下午2∶00;軌道回歸周期為5 d,即每5 d星下點(diǎn)軌跡相同;在一個(gè)回歸周期內(nèi)能夠?qū)崿F(xiàn)全球約500 km空間分辨率的觀測(cè)(袁仕耿等,2018).衛(wèi)星繞地球飛行一圈約94 min,大部分載荷在±65°緯度范圍開機(jī)工作,觀測(cè)數(shù)據(jù)按升軌(夜晚)和降軌(白天)分別存儲(chǔ),每半軌(升/降軌)觀測(cè)約34 min;在同一天內(nèi)相鄰的升軌(或降軌)空間分辨率約2000 km.所搭載的感應(yīng)磁力儀載荷(SCM),通過法拉第電磁感應(yīng)定律獲得電離層的感應(yīng)磁場(chǎng)數(shù)據(jù),能夠捕獲全球閃電哨聲波信號(hào),其在巡查模式下僅獲得功率譜數(shù)據(jù).到目前為止,ZH-1已經(jīng)在軌觀測(cè)3年多,采集了大量的全球電磁場(chǎng)的波形和功率譜數(shù)據(jù),其中SCM的3分量X/Y/Z包含3個(gè)頻段ULF/ELF/VLF,頻點(diǎn)范圍ULF:10~200 Hz,ELF:200 Hz~2.2 kHz,VLF:12.5 Hz~20 kHz,原始數(shù)據(jù)的采樣率為51.2 kHz,功率譜數(shù)據(jù)的頻點(diǎn)間隔ULF:0.25 Hz,ELF:2.5 Hz,VLF:12.5 Hz,詳查模式VLF波形數(shù)據(jù)80 ms包含4096個(gè)點(diǎn)(Wang et al., 2018;Zhou et al., 2018),每天產(chǎn)生大約10 G的數(shù)據(jù)量.如何從如此龐大的觀測(cè)數(shù)據(jù)中自動(dòng)識(shí)別閃電哨聲波事件尤為關(guān)鍵和緊迫.

圖1 AKEBONO衛(wèi)星閃電形態(tài)圖例(Bayupati et al., 2012)Fig.1 Lightning whistlers of AKEBONO (Bayupati et al., 2012)

目前基于海量閃電哨聲波數(shù)據(jù)開展全球時(shí)空分布規(guī)律和相關(guān)參數(shù)的研究較少,主要存在以下兩個(gè)方面的原因:一是需要足夠的閃電哨聲波事件;二是缺少有效的閃電哨聲波自動(dòng)識(shí)別算法,依靠人工從大量的電磁觀測(cè)數(shù)據(jù)中獲取閃電哨聲波事件是一件極具有挑戰(zhàn)性的工作.比如:Zhou等(2020)針對(duì)武漢VLF地面觀測(cè)數(shù)據(jù)中隱藏的閃電tweek現(xiàn)象,通過設(shè)置能量譜閾值和時(shí)間寬度閾值的方式提出了簡(jiǎn)單快捷的自動(dòng)識(shí)別算法.Yi等(2020)借用該算法對(duì)隨州站2016年2月3日至2月29日的WHU ELF/VLF接收機(jī)數(shù)據(jù)中的所有tweek現(xiàn)象進(jìn)行自動(dòng)識(shí)別和統(tǒng)計(jì)分析,發(fā)現(xiàn)該站tweek事件的日發(fā)生率的差異很大,數(shù)量大約在800至6000個(gè)之間.然而,其采用的識(shí)別算法(Zhou et al., 2020)的誤報(bào)率較高,主要原因是基于閾值匹配的分類策略使干擾噪聲對(duì)識(shí)別結(jié)果的影響較大,該方法明顯不適用于電磁衛(wèi)星數(shù)據(jù).電磁衛(wèi)星的觀測(cè)數(shù)據(jù)中攜帶了復(fù)雜多樣的空間電磁等擾動(dòng)信號(hào),如閃電哨聲波、嘶聲、VLF地面發(fā)射源、磁暴等現(xiàn)象.現(xiàn)有的研究主要是集中在一些明顯的太陽活動(dòng)、地磁活動(dòng)及VLF地面發(fā)射源對(duì)電離層的擾動(dòng)方面(李柳元等2011; Li et al., 2015; Yang et al., 2020; 廖力等,2019; Zhao et al., 2019),較少有研究如何準(zhǔn)確地從觀測(cè)數(shù)據(jù)中自動(dòng)識(shí)別閃電哨聲波.隨著電磁觀測(cè)大數(shù)據(jù)池的形成,自動(dòng)識(shí)別閃電哨聲波是自動(dòng)提取閃電哨聲波軌跡信息及其相關(guān)物理參數(shù)的重要前提,是對(duì)空間物理環(huán)境進(jìn)行全面深入分析的關(guān)鍵環(huán)節(jié).閃電哨聲波源于閃電激發(fā)的寬頻帶電磁波,其高頻和低頻成分的速度差使其在頻譜圖上呈現(xiàn)明顯的“色散”狀特征.當(dāng)路徑長(zhǎng)度較長(zhǎng)或沿傳輸路徑的電子密度較密集時(shí),色散變大,可見色散是反映等離子體層中的電子密度的重要參數(shù).Helliwell(1965)根據(jù)地面VLF觀測(cè)數(shù)據(jù)按照其色散特征將閃電哨聲波的形態(tài)分為9類,詳細(xì)內(nèi)容如表1所示,值得注意的是“多成分”類型中存在兩種不同的子類型.Santolík等(2009)指出地面VLF觀測(cè)站記錄的閃電哨聲波的形態(tài)與衛(wèi)星觀測(cè)到的形態(tài)極其相似且均具有頻散特性,如圖1和圖2所示.

圖2 DEMETER衛(wèi)星閃電形態(tài)圖例 (Parrot et al., 2015, 2019)Fig.2 Lightning whistlers of DEMETER (Parrot et al., 2015, 2019)

表1 閃電哨聲波分類(Helliwell, 1965)Table 1 Type and principal definitions of lightning whistlers (Helliwell, 1965)

目前基于電磁衛(wèi)星閃電哨聲波自動(dòng)識(shí)別的研究主要是針對(duì)AKEBONO衛(wèi)星采集的波形數(shù)據(jù)(Bayupati et al., 2012)、Arase衛(wèi)星采集的數(shù)據(jù)(Ali Ahmad et al., 2019)以及DEMETER衛(wèi)星采集的頻譜數(shù)據(jù)(Parrot et al., 2019).

按照Eckersley′s 的定理(Gurnett et al., 1990),閃電哨聲波的時(shí)間和頻率之間滿足公式(1):

(1)

其中D是閃電哨聲波色散常量;t是以頻率f到達(dá)的時(shí)間,t0是閃電觸發(fā)的時(shí)間.Bayupati等(2012)將該定理應(yīng)用到AKEBONO衛(wèi)星的閃電哨聲波識(shí)別中.傳統(tǒng)的閃電哨聲波自動(dòng)識(shí)別方法是通過識(shí)別功率譜中的直線的方式實(shí)現(xiàn)的,如圖1所示:t1是在頻率f1到達(dá)的時(shí)間,t2是頻率f2到達(dá)的時(shí)間,D的計(jì)算公式如式(2)所示:

(2)

圖1顯示閃電哨聲波是有一定斜率的一條直線,而公式(1)(2)僅僅表示了閃電哨聲波頻率和時(shí)間之間的簡(jiǎn)單關(guān)系.

Ali Ahmad等(2019)認(rèn)為上述方法很難檢測(cè)到Helliwell(1965)總結(jié)的其他閃電哨聲波類型,重新整理了Arase衛(wèi)星的閃電哨聲波的類型,并根據(jù)不同的類型設(shè)計(jì)了不同的模式特征.其識(shí)別的方法是:首先用短時(shí)傅里葉變換(STFT)計(jì)算頻譜,接著采用高斯卷積核對(duì)頻譜圖進(jìn)行模糊處理,再用拉普拉斯算子做邊緣提取,然后用圖像分割算法分割圖像,如圖3所示;并將圖像平均劃分為若干個(gè)格子,如圖4所示;最后,采用Bresenham′s 直線檢測(cè)算法提取特征(Bresenham, 1977)并輸入到?jīng)Q策樹進(jìn)行識(shí)別,識(shí)別精度只有75%.該算法存在以下幾個(gè)問題:(1)識(shí)別過程中需要大量的圖像預(yù)處理操作,比如高斯卷積核的參數(shù)選擇、拉普拉斯算子參數(shù)的選擇、分割算法的參數(shù)選擇等,這些參數(shù)的選擇對(duì)采用Bresenham算法提取特征的影響較大;(2)Bresenham算法中需要設(shè)置參數(shù),該參數(shù)的選擇會(huì)影響特征的魯棒性;(3)該算法的評(píng)測(cè)指標(biāo)只采用精度作為評(píng)價(jià)指標(biāo),該指標(biāo)無法評(píng)估分類器的召回能力和排序能力.

圖3 分割結(jié)果(Ali Ahmad et al., 2019)Fig.3 Segmentation results (Ali Ahmad et al., 2019)

圖4 格線法 (Ali Ahmad et al., 2019)Fig.4 Grid (Ali Ahmad et al., 2019)

總之,目前的電磁衛(wèi)星閃電哨聲波識(shí)別算法存在下列問題:

(1)模式特征過于簡(jiǎn)單導(dǎo)致其魯棒性差;

(2)分類技術(shù)粗糙導(dǎo)致其泛化能力不強(qiáng);

(3)以AKEBONO衛(wèi)星和Arase 衛(wèi)星的數(shù)據(jù)為主,基于ZH-1衛(wèi)星的閃電哨聲波(如圖5所示)的識(shí)別研究未見開展.

圖5 張衡一號(hào)衛(wèi)星的SCM功率譜數(shù)據(jù)的時(shí)頻圖中閃電形態(tài)Fig.5 Lightning whistlers from ZH-1 satellite

綜上,本文在ZH-1衛(wèi)星SCM數(shù)據(jù)的基礎(chǔ)上,探索基于機(jī)器學(xué)習(xí)的閃電哨聲波自動(dòng)識(shí)別框架,根據(jù)閃電哨聲波色散形態(tài)創(chuàng)建L形態(tài)卷積核提高特征魯棒性,采用支持向量機(jī)技術(shù)提高分類的泛化性能.

1 數(shù)據(jù)收集

數(shù)據(jù)主要來自張衡一號(hào)衛(wèi)星在2019年8月份的三個(gè)軌道的SCM載荷的VLF波段的波形數(shù)據(jù),根據(jù)資料:大部分的閃電哨聲波在100~6000 Hz區(qū)域內(nèi)存在L形態(tài),且持續(xù)時(shí)不會(huì)超過20 s(Fiser et al., 2010),因此,本項(xiàng)目的數(shù)據(jù)收集過程如圖6所示:設(shè)計(jì)20 s的時(shí)間滑動(dòng)窗,步長(zhǎng)是4 s,截取波形數(shù)據(jù),做短時(shí)傅里葉變換得到時(shí)頻圖,并創(chuàng)建閃電哨聲波數(shù)據(jù)集.該數(shù)據(jù)集含316個(gè)閃電哨聲波時(shí)頻圖像,8000個(gè)非閃電哨聲波時(shí)頻圖像.由于本研究的重點(diǎn)是識(shí)別時(shí)頻圖像中是否具有色散形態(tài)特征,因此時(shí)頻圖中未繪制橫坐標(biāo)、縱坐標(biāo)和色階欄等輔助信息,其樣本示例如圖7所示.

圖6 數(shù)據(jù)采集Fig.6 Data acquisition

圖7 樣本示例(a) 閃電哨聲波樣例; (b) 無閃電哨聲波樣例.Fig.7 Sample example(a) Lightning whistlers; (b) No lightning whistlers.

2 閃電哨聲波自動(dòng)識(shí)別算法

閃電哨聲波識(shí)別算法的目標(biāo)是識(shí)別每個(gè)時(shí)頻圖中是否有閃電哨聲波.目前深度學(xué)習(xí)模型是機(jī)器學(xué)習(xí)的主流模型,但仍需要大量的數(shù)據(jù)樣本作為基礎(chǔ).而本文目前收集的閃電哨聲波數(shù)據(jù)量較少,基于此仍然用傳統(tǒng)的識(shí)別算法技術(shù)探索閃電哨聲波識(shí)別方案,方案包括訓(xùn)練過程和識(shí)別過程,如圖8所示:實(shí)線是訓(xùn)練流程,虛線是識(shí)別流程.訓(xùn)練流程的主要目的是獲得閃電哨聲波的識(shí)別模型,識(shí)別流程的主要目的是應(yīng)用閃電哨聲波識(shí)別模型.訓(xùn)練過程包括:灰度化處理、尺度處理,模糊卷積處理,L形態(tài)卷積處理,訓(xùn)練SVM模型.其識(shí)別流程包括:灰度化處理、尺度處理,模糊卷積處理,L形態(tài)卷積處理,應(yīng)用SVM模型進(jìn)行閃電識(shí)別.

圖8 識(shí)別算法(實(shí)線是模型訓(xùn)練流;虛線是模型識(shí)別流)Fig.8 Recognition algorithm (the solid line represents training process; the dotted line denotes recognition process)

2.1 灰度化處理

觀察原始的樣本頻譜圖,如圖9所示,發(fā)現(xiàn)識(shí)別閃電哨聲波的依據(jù)是頻譜圖中是否存在L形態(tài)特征,無需顏色特征,則首先采用灰度化處理消除顏色的影響.對(duì)圖9按照公式(3)進(jìn)行灰度化處理(章毓晉, 2016),得到如圖10所示的灰度圖.

圖9 彩色頻譜圖(有閃電)Fig.9 Colorful spectrum (lightning whistlers)

圖10 灰度化(有閃電)Fig.10 Grayscale (lightning whistlers)

Gray=RGB.R×0.3+RGB.G×0.59

+RGB.B×0.11,

(3)

其中RGB表示原始的樣本頻譜圖,RGB.R是其紅色通道的像素值,RGB.G和RGB.B分別是綠色和藍(lán)色通道的值,Gray是灰度化的頻譜圖.

2.2 尺度處理

圖像的尺度越大凸顯的細(xì)節(jié)越明顯,但整體的形態(tài)特征不夠突出,如圖11所示;而尺度越小,容易突出其整體的形態(tài)特征,本文將頻譜圖像尺度縮小到50×50,得到如圖12所示的圖像.對(duì)比圖11和圖12:發(fā)現(xiàn)圖12的L形態(tài)特征較圖11更為明顯,且降低的數(shù)據(jù)維度更有利于計(jì)算.

圖11 原尺度Fig.11 The original scale

圖12 小尺度Fig.12 The smaller scale

2.3 模糊卷積

觀察圖12發(fā)現(xiàn)該圖像條紋狀紋理比較嚴(yán)重,表明該圖具有明顯的階躍邊緣.這些邊緣信息不利于L形態(tài)特征的識(shí)別.為了弱化階躍邊緣對(duì)識(shí)別的影響,本文設(shè)計(jì)如圖13a所示的模糊卷積核,用其對(duì)圖12進(jìn)行卷積處理,得到如圖13b所示的效果:其階躍邊緣信息被弱化了.

圖13 模糊卷積(a) 模糊卷積核; (b) 模糊卷積效果.Fig.13 Fuzzy convolution(a) Kernel; (b) Result.

2.4 L特征提取

為了進(jìn)一步增強(qiáng)閃電哨聲波L形狀特征提高分類性能,根據(jù)L形態(tài)的特點(diǎn),設(shè)計(jì)如圖14a所示的9×9的L形態(tài)卷積核(關(guān)于卷積核尺度為何是9×9,將在討論部分進(jìn)行詳細(xì)分析),采用該卷積核對(duì)圖13b進(jìn)行卷積計(jì)算,得到如圖14b所示的效果,增強(qiáng)了L形態(tài)特征.

圖14 L特征卷積(a) L特征卷積核; (b) 卷積效果.Fig.14 L characteristic convolution(a) Kernel; (b) Result.

2.5 SVM分類

將圖14b的圖像輸入到支持向量機(jī)(SVM)分類器進(jìn)行訓(xùn)練和識(shí)別.SVM是基于統(tǒng)計(jì)理論的監(jiān)督分類器(Sánchez and David, 2003).本文中的類別主要有兩種:閃電哨聲波和非閃電哨聲波.首先,將時(shí)頻圖數(shù)據(jù)分為訓(xùn)練集和測(cè)試集.

訓(xùn)練集的圖像數(shù)據(jù)被表示為:x1,x2,…,xn,其相應(yīng)的類別標(biāo)簽是y1,y2,…,yn,yi∈[-1,1] ,其中-1表示該樣本中無閃電哨聲波,1表示該樣本中有閃電哨聲波.

線性SVM分類器的主要目標(biāo)是找到一個(gè)超平面w=(w1,w2,…,wn),能夠?qū)ⅰ?1”類和“1”類更好地分開.該超平面的數(shù)學(xué)模型如公式(4)所示:

wx+b=0,

(4)

其中x是在超平面上的樣本點(diǎn),b是偏置.

若存在使得分類間隔最大的超平面,其滿足下列條件:閃電哨聲波的樣本正確地落在閃電哨聲波的分類區(qū),則有公式(5);

(wxi+b)≥+1,yi=1.

(5)

非閃電哨聲波的樣本正確落在非閃電哨聲波的分類區(qū),則有公式(6);

(wxi+b)≤-1,yi=-1,

(6)

公式(5)和公式(6)合成一個(gè)公式(7):

yi(wxi+b)-1≥0.

(7)

SVM將在眾多的分類超平面中,自動(dòng)尋找使得特征空間間隔最大的超平面.其數(shù)學(xué)模型表示為公式(8):

max 1/‖w‖ s.t.yi(wxi+b)-1≥0

(i=1,2,…,n).

(8)

訓(xùn)練模型的目的是找到滿足式(8)的w.

由于大部分情況下,數(shù)據(jù)無法滿足線性可分的要求,此時(shí)滿足上述條件的超平面不存在,對(duì)于這種非線性可分的問題,SVM 提供核函數(shù)k(xi,xj)代替公式(5),將原數(shù)據(jù)映射到高維空間,使得其在高維空間線性可分(Sánchez and David, 2003).本文中的核函數(shù)采用的是多項(xiàng)式核函數(shù)如式(9)所示:

(9)

3 實(shí)驗(yàn)和分析

3.1 實(shí)驗(yàn)方案

由于閃電哨聲波的樣本與非閃電哨聲波的樣本不均衡,按照傳統(tǒng)的機(jī)器學(xué)習(xí)的慣例:正負(fù)樣本的比例不能超過1∶3.而本文中的閃電哨聲波樣本是316個(gè),與之對(duì)應(yīng)的非閃電哨聲波的樣本數(shù)據(jù)量不能超過1000個(gè),實(shí)際上本文獲得的非閃電哨聲波的樣本是8000個(gè).為了測(cè)試提出的閃電哨聲波識(shí)別算法是否有效,制定下列實(shí)驗(yàn)方案.

1)數(shù)據(jù)集

數(shù)據(jù)集由316個(gè)閃電哨聲波樣本和1000個(gè)非閃電哨聲波樣本組成.1000個(gè)非閃電哨聲波樣本是從8000個(gè)非閃電哨聲波數(shù)據(jù)中進(jìn)行隨機(jī)選擇而得到.該過程得到316個(gè)閃電哨聲波組成的正樣本集和1000個(gè)非閃電哨聲波組成的負(fù)樣本集.

2)訓(xùn)練集和測(cè)試集

從正樣本集隨機(jī)取80%的數(shù)據(jù)作為訓(xùn)練樣本集,同樣從負(fù)樣本集隨機(jī)取80%作為訓(xùn)練樣本,該過程得到含有正樣本和負(fù)樣本的訓(xùn)練集.

將正樣本集和負(fù)樣本集中剩下的樣本組合為測(cè)試集.

3)特征提取

針對(duì)訓(xùn)練集,用以下三種不同的特征提取方法提取時(shí)頻圖像特征:

(1) 原始灰度圖像特征,用Gray表示.

(2) 對(duì)原始灰度圖像進(jìn)行模糊卷積處理后的特征,用Gray_Blur表示.

(3) 先對(duì)原始灰度圖像進(jìn)行模糊卷積處理,再采用本文提出的L形態(tài)卷積核進(jìn)行處理得到的圖像特征,用Gray_Blur_L表示.

4)訓(xùn)練

用三種不同的特征分別訓(xùn)練SVM模型,得到三種不同的基于SVM的閃電哨聲波識(shí)別模型.

5)測(cè)試

針對(duì)測(cè)試集的數(shù)據(jù),提取三種不同的特征,并分別輸入三個(gè)不同的SVM識(shí)別模型進(jìn)行識(shí)別.

6)評(píng)估識(shí)別效果

對(duì)識(shí)別效果采用四種指標(biāo)進(jìn)行評(píng)估:精度(Precision)、召回率(Recall)、F1值和ROC面積(AUC).

7)重復(fù)實(shí)驗(yàn)

重復(fù)上述實(shí)驗(yàn)過程10000次.

3.2 SVM參數(shù)選擇

本算法中的SVM來自Python的SVC庫.選擇的核函數(shù)是多項(xiàng)式核,如公式(9)所示.通過交叉驗(yàn)證得到的最佳參數(shù)d是13,其他均使用該庫下的默認(rèn)參數(shù).

3.3 評(píng)價(jià)指標(biāo)

采用四種不同的評(píng)價(jià)指標(biāo)評(píng)估每一次實(shí)驗(yàn)的效果,設(shè)P表示正類樣本,N表示負(fù)類樣本,接下來將闡述四種指標(biāo)的定義.

首先,符號(hào)定義如表2所示.

表2 符號(hào)定義Table 2 Symbol definition

(1)精度(Precision)的定義如式(10)所示:

Precision =TP/(FP+TP),

(10)

含義:在預(yù)測(cè)出的所有正例中(TP+FP),真正例(TP)占的比例,通常該指標(biāo)越大越好.

(2)召回率(Recall)的定義如式(11)所示:

Recall =TP/(TP+FN) ,

(11)

含義:在數(shù)據(jù)集中所有的正例中(TP+FN),真正例(TP)占的比例,通常該指標(biāo)越大越好.

(3)F1值(F1-Score)的定義如式(12)所示:

F1=2/(1/ Precision +1/Recall) ,

(12)

其含義:通常情況下,Precision高,Recall就低,Recall高,Precision就低.指標(biāo)F1-score,綜合考慮Precision和Recall的調(diào)和值.Recall不變時(shí),Precision越大,1/Precision越小,從而F1越大.同理: Precision不變時(shí),Recall越大,1/Recall越小,從而F1越大.該指標(biāo)1越大越好.

(4)AUC-ROC:ROC(receiver operating characteristic curve, ROC)曲線下的面積,該值越高意味著分類的排序性能越佳.

3.4 評(píng)價(jià)策略

在每一次實(shí)驗(yàn)的訓(xùn)練集和測(cè)試集上,均使用三種不同的特征提取方法提取圖像特征,并以此訓(xùn)練得到三個(gè)不同的分類器,最后采用精度、召回率、F1和ROC-AUC評(píng)估每一個(gè)分類器的性能.由于每次的訓(xùn)練集和測(cè)試集不同,單次的四個(gè)評(píng)估指標(biāo)難以充分評(píng)價(jià)本文提出的閃電哨聲波識(shí)別算法的效果,因此,開展實(shí)驗(yàn)10000次,并在四個(gè)評(píng)估指標(biāo)的基礎(chǔ)上制定了如下的評(píng)價(jià)策略:

(1)部分識(shí)別結(jié)果展示.

(2)總體識(shí)別效果評(píng)價(jià):對(duì)10000次實(shí)驗(yàn)的四個(gè)評(píng)價(jià)指標(biāo)值分別求平均值,以此來評(píng)價(jià)不同算法的總體識(shí)別效果.

(3)識(shí)別效果穩(wěn)定性評(píng)價(jià):對(duì)10000次實(shí)驗(yàn)的四個(gè)評(píng)價(jià)指標(biāo)采用盒形圖評(píng)估識(shí)別算法的穩(wěn)定性.

(4)識(shí)別效果差異性評(píng)價(jià):為了評(píng)價(jià)不同的特征之間導(dǎo)致的分類效果是否具有明顯差異,采用T檢驗(yàn)進(jìn)行差異性評(píng)價(jià).閾值p=0.05,即小于0.05為具有明顯差異,若大于0.05表明不具有明顯差異.

3.4.1 部分識(shí)別結(jié)果展示

部分識(shí)別結(jié)果如圖15和圖16所示:圖15是識(shí)別閃電哨聲波的部分結(jié)果,(a)是正確識(shí)別的時(shí)頻圖,(b)誤識(shí)別的時(shí)頻圖像.之所以將圖15b識(shí)別錯(cuò)誤的原因是:其L形態(tài)特征(實(shí)線箭頭所示)相比右邊的“嘶吼”(虛線箭頭所示)特征明顯微弱很多,該特點(diǎn)在灰度圖中更為明顯,如圖15c所示,此時(shí)時(shí)頻圖的主要信息體現(xiàn)在嘶吼的特征上,則分類器出現(xiàn)了誤判;圖16是識(shí)別非閃電哨聲波識(shí)別的部分結(jié)果,(a)是正確識(shí)別的結(jié)果,(b)是誤識(shí)別的結(jié)果.識(shí)別錯(cuò)誤的原因是圖像中出現(xiàn)的多重“嘶吼”造成了L形態(tài)特征的假象,如圖(c)(d)(e)所示,分類器出現(xiàn)了誤判.

圖15 閃電識(shí)別(a) 正確識(shí)別; (b) 錯(cuò)誤識(shí)別; (c) 灰度化圖(b).Fig.15 Lightning identification(a) Correct identification; (b) Error identification; (c) The gray image of the (b).

圖16 非閃電識(shí)別(a) 正確識(shí)別; (b) 錯(cuò)誤識(shí)別; (c) 灰度化圖(b); (d) 模糊卷積圖(c); (e) L形態(tài)卷積核處理圖(d).Fig.16 The performance of recognizing the image without lightning whistles(a) Correct identification; (b) Error identification; (c) Grayscale map (b); (d) Processing the (c) with fuzzy convolution; (e) Processing figure (d) with the L morphological convolution kernel.

3.4.2 總體識(shí)別精度評(píng)價(jià)

本小節(jié)主要針對(duì)10000次的Precision、Recall、F1和AUC-ROC求平均值,度量不同圖像特征下的閃電哨聲波分類效果,定量結(jié)果如表3和表4所示.

表3 10000次實(shí)驗(yàn)后的平均效果Table 3 The performance obtained by 10000 experiments

表4 ROC面積AUC的均值Table 4 The mean of the AUC of the ROC area

通過觀察表3和表4可發(fā)現(xiàn):

(1)基于Gray_Blur_L特征的閃電哨聲波分類效果,在Precision、Recall和F1score三個(gè)指標(biāo)上明顯優(yōu)于Gray_Blur特征和Gray特征.比如觀察表3中的精度指標(biāo),Gray_Blur_L特征使閃電哨聲波識(shí)別精度達(dá)到0.945,優(yōu)于Gray_Blur特征的0.915和Gray特征的0.732.

(2)基于Gray_Blur_L特征的閃電哨聲波分類效果,在AUC指標(biāo)上明顯優(yōu)于Gray_Blur特征和Gray特征.比如,Gray_Blur_L特征使得分類器的排序能力達(dá)到0.989,優(yōu)于Gray_Blur特征的0.975和Gray特征的0.882.

總之,本文通過創(chuàng)建L形態(tài)卷積核提取的Gray_Blur_L特征在閃電哨聲波分類的各項(xiàng)性能方面表現(xiàn)最佳.

3.4.3 識(shí)別效果穩(wěn)定性評(píng)價(jià)

為了對(duì)分類的穩(wěn)定性進(jìn)行定性評(píng)價(jià),根據(jù)每個(gè)指標(biāo)的10000個(gè)數(shù)值繪制如圖17和圖18的盒形圖.

圖17 精度、召回率和F1的盒形圖(a) 閃電哨聲波; (b) 非閃電哨聲波.Fig.17 The box diagram of the precision, recall rate and F1(a) Lightning-whistler; (b) Non-lightning-whistler.

圖18 AUC 盒形圖Fig.18 AUC box

(1)Gray_Blue_L特征分類器在精度(Precision)、召回率(Recall)和F1score三個(gè)指標(biāo)上的表現(xiàn)最好且識(shí)別性能最穩(wěn)定.比如圖17a最左邊的精度圖,其橫軸是不同的圖像特征提取方法,縱軸是精度,仔細(xì)觀察發(fā)現(xiàn):Gray_Blur_L特征對(duì)應(yīng)的箱體的高度最小,說明該特征分類器的精度最穩(wěn)定;同時(shí),Gray_Blur_L箱體的中位線均高于Gray_Blur特征和Gray特征的箱體的中位線,表明Gray_Blur_L特征分類器在識(shí)別閃電哨聲波時(shí),其精度最高;按照同樣的方法觀察圖17a中間的圖和最右邊的圖可得結(jié)論:在識(shí)別閃電哨聲波時(shí),Gray_Blur_L特征分類器的召回率和F1score指標(biāo)的值最優(yōu)且分類性能最穩(wěn)定;按照同樣的方式觀察如圖17b的三幅子圖,可以得到如下結(jié)論:在對(duì)非閃電哨聲波進(jìn)行分類時(shí),Gray_Blue_L特征分類器在精度、召回率和F1score值三個(gè)指標(biāo)的值最高,且性能最穩(wěn)定.

(2)觀察三個(gè)分類器的10000個(gè)AUC指標(biāo)的盒形圖,如圖18所示:其橫軸是不同的特征提取方法,縱軸是AUC值.發(fā)現(xiàn):Gray_Blue_L的箱體高度最小中位線的位置最高.這說明Gray_Blue_L特征所訓(xùn)練的分類器不僅僅波動(dòng)較小且具有最好的排序能力.

總之,由Gray_Blur_L圖像特征學(xué)習(xí)得到的分類器,不僅僅具有更可靠的分類效果且分類性能更穩(wěn)定.

3.4.4 識(shí)別效果顯著性差異評(píng)價(jià)

為了檢驗(yàn)不同的特征分類器的性能是否存在明顯差異,采用T檢驗(yàn)方法對(duì)顯著性差異進(jìn)行定量評(píng)價(jià),其顯著性P值越高,表明顯著差異性越小,通常閾值是0.05,其含義是若差異性小于0.05則認(rèn)為存在明顯差異;若大于0.05則認(rèn)為兩組實(shí)驗(yàn)不存在明顯差異.其結(jié)果如表5—8所示.

首先,對(duì)三種不同特征分類器的精度(Precision)指標(biāo)的分布數(shù)據(jù),兩兩進(jìn)行T檢驗(yàn),得到如表5的檢驗(yàn)值.比如對(duì)Gray和Gray_Blur的數(shù)據(jù)進(jìn)行T檢驗(yàn),得到其P值是0,表明:Gray特征分類器和Gray_Blur特征分類器在分類精度方面存在明顯差異.再比如, 對(duì)Gray特征分類器的自身進(jìn)行比較檢驗(yàn),即對(duì)Gray特征分類器和Gray特征分類器進(jìn)行T檢驗(yàn)的P值是1,表明:數(shù)據(jù)之間無顯著性差異.然后,按照上述方法觀察表6—8,發(fā)現(xiàn):三種不同特征的分類器在召回率方面、排序能力等方面均存在明顯差異.

表5 T檢驗(yàn)P值(Precision)Table 5 T tests for Precision

表6 T檢驗(yàn)P值(Recall)Table 6 T tests for Recall

表7 T檢驗(yàn)P值(F1Score)Table 7 T tests for F1Score

表8 T檢驗(yàn)P值(AUC)Table 8 T tests for AUC

總之,采用Gray特征,Gray_Blur特征,Gray_Blur_L特征進(jìn)行閃電哨聲波識(shí)別,其識(shí)別效果在精度、召回率、F1值和AUC值均存在明顯差異,且Gray_Blur_L特征分類器的分類效果最佳.

4 討論

上述實(shí)驗(yàn)表明基于張衡衛(wèi)星SCM數(shù)據(jù)開展自動(dòng)化識(shí)別閃電哨聲波的算法研究具有一定的效果.算法方案中的模糊卷積核和L特征卷積核對(duì)閃電哨聲波識(shí)別具有非常重要的影響.本章節(jié)將對(duì)其產(chǎn)生的影響開展較深入的討論和分析,同時(shí)對(duì)閃電哨聲波自動(dòng)識(shí)別的延伸研究進(jìn)行展望.

4.1 模糊卷積核

實(shí)驗(yàn)結(jié)果表明采用模糊卷積核提取圖像特征進(jìn)行閃電分類的效果優(yōu)于采用原始頻譜圖為特征的識(shí)別效果,本小節(jié)將從視覺觀察角度和特征可分角度對(duì)其展開討論.

4.1.1 視覺觀察角度

原始頻譜圖具有明顯的垂直信息痕跡,如圖19所示:大量的垂直信息的存在對(duì)L形態(tài)特征的識(shí)別產(chǎn)生了巨大的影響,而圖20是采用模糊卷積核對(duì)垂直信息進(jìn)行模糊處理后的圖像,其垂直信息被減弱,同時(shí)凸顯了其L形態(tài)特征.

圖19 含有閃電信息的原始灰度圖Fig.19 Original gray image containing lightning whistlers

圖20 采用模糊卷積核處理后的圖像Fig.20 The resulting image processed by fuzzy convolution kernel

4.1.2 特征可分的角度

為了探索模糊卷積處理后的圖像特征與原始灰度圖的特征是否具有不同的可分性.本小節(jié)將采用主成分分析(Principal Components Analysis, PCA)的降維技術(shù)將316個(gè)閃電哨聲波樣本和1000個(gè)隨機(jī)的非閃電哨聲波樣本降至2維,并繪制出其在2維空間的分布,以觀察特征的可分性趨勢(shì),如圖21所示.

圖21a是閃電哨聲波與非閃電哨聲波數(shù)據(jù)的原始特征分布,其橫坐標(biāo)和縱坐標(biāo)表示降維后的2個(gè)維度;圖21b是被模糊卷積處理后的特征分布;其中1代表閃電哨聲波,-1是非閃電哨聲波,觀察圖21發(fā)現(xiàn):原始圖像特征有大量的正負(fù)樣本聚集在一起的情況,尤其是圖21a中的圓形區(qū)域,這些疊加在一起的正負(fù)樣本增加了識(shí)別閃電哨聲波和非閃電哨聲波的難度,導(dǎo)致分類器識(shí)別閃電的性能下降;相比之下,圖21b的圓形區(qū)域,正負(fù)樣本聚集在一起的數(shù)量較前者有大幅減少,該現(xiàn)象使得正負(fù)樣本的區(qū)分提高,增加了閃電哨聲波和非閃電哨聲波圖像特征的區(qū)分度,使得分類器識(shí)別閃電哨聲波的能力增強(qiáng).

圖21 特征分布趨勢(shì)圖Fig.21 Character distribution

4.2 L特征卷積核對(duì)閃電哨聲波識(shí)別的影響

從實(shí)驗(yàn)結(jié)果發(fā)現(xiàn)在模糊卷積處理圖像的基礎(chǔ)上,再采用9×9的L特征卷積核處理,使得閃電哨聲波分類的效果更優(yōu),接下來針對(duì)L特征卷積核的識(shí)別效果和尺度選擇從兩個(gè)方面進(jìn)行深入討論.

4.2.1 視覺觀察角度

從圖22中發(fā)現(xiàn)相比較原始圖像,模糊核提取的L特征更為明顯,如圖22a和圖22b所示;進(jìn)一步觀察,采用3×3的L卷積核提取的L特征如圖22c所示,由于太暗,將圖22c的矩形區(qū)域進(jìn)行放大如圖22j所示,發(fā)現(xiàn)大部分的細(xì)節(jié)信息被濾除,隱隱約約可看到L特征(如圖22j的橢圓區(qū)域所示),說明其只保留了L特征的主輪廓;隨著L卷積核尺度變大,L特征周圍的細(xì)節(jié)信息越來越多,如圖22(d,e,f)所示;隨著L卷積核的尺度進(jìn)一步增大,不僅L特征周圍的細(xì)節(jié)強(qiáng)度越來越明顯,且與L區(qū)域無關(guān)的地方亦出現(xiàn)了較多的細(xì)節(jié).

圖22 不同卷積核提取的圖像特征(含有閃電哨聲波的圖像)(a) 原始灰度圖; (b) 模糊卷積核處理后的圖像; (c) 尺度3×3的L卷積核處理b后的圖像; (d) 尺度5×5的L卷積核處理b后的圖像; (e) 尺度7×7的L卷積核處理b后的圖像; (f) 尺度9×9的L卷積核處理b后的圖像; (g) 尺度11×11的L卷積核處理b后的圖像; (h) 尺度13×13的L卷積核處理b后的圖像; (i) 尺度15×15的L卷積核處理b后的圖像.Fig.22 Image features extracted by different convolution kernel (containing lightning whistlers)(a) The original grayscale image; (b) The image processed by the fuzzy convolution kernel;(c) The image obtained by processing the (b) with 3×3 L convolution kernel; (d) The image obtained by processing the (b) with 5×5 L convolution kernel; (e) The image obtained by processing the (b) with 7×7 L convolution kernel; (f) The image obtained by processing the (b) with 9×9 L convolution kernel; (g) The image obtained by processing the (b) with 11×11 L convolution kernel; (h) The image obtained by processing the (b) with 13×13 L convolution kernel; (i) The image obtained by processing the (b) with 15×15 L convolution kernel.

進(jìn)一步觀察圖23,小尺度的L卷積核能夠?yàn)V除細(xì)節(jié)信息,如圖23(c,d,e)所示;隨著L卷積核尺度的不斷增加,其細(xì)節(jié)信息越來越明顯,如圖23(f,g)所示;當(dāng)尺度進(jìn)一步增加時(shí),放大的干擾信息產(chǎn)生了與L特征相似的形態(tài),如圖23i的圓形區(qū)域,即大尺度L卷積核容易將該區(qū)域的噪聲放大,容易影響識(shí)別性能.因此,小尺度的L卷積核濾除L特征周圍太多的細(xì)節(jié)信息,太大的L卷積核又容易放大非閃電圖像中的噪聲,如何自動(dòng)選擇尺度合適的L卷積核是一個(gè)需要進(jìn)一步思考的問題.

圖23 不同卷積核提取的圖像特征(含有非閃電哨聲波的圖像)(a) 原始灰度圖; (b) 模糊卷積核處理后的圖像; (c) 尺度3×3的L卷積核處理b后的圖像; (d) 尺度5×5的L卷積核處理b后的圖像; (e) 尺度7×7的L卷積核處理b后的圖像; (f) 尺度9×9的L卷積核處理b后的圖像; (g) 尺度11×11的L卷積核處理b后的圖像; (h) 尺度13×13的L卷積核處理b后的圖像; (i) 尺度15×15的L卷積核處理b后的圖像.Fig.23 Image features extracted by different convolution kernel (not containing lightning whistlers)(a) The original grayscale image; (b) The image processed by the fuzzy convolution kernel; (c) The image obtained by processing the (b) with 3×3 L convolution kernel; (d) The image obtained by processing the (b) with 5×5 L convolution kernel; (e) The image obtained by processing the (b) with 7×7 L convolution kernel; (f) The image obtained by processing the (b) with 9×9 L convolution kernel; (g) The image obtained by processing the (b) with 11×11 L convolution kernel; (h) The image obtained by processing the (b) with 13×13 L convolution kernel; (i) The image obtained by processing the (b) with 15×15 L convolution kernel.

4.2.2 特征可分的角度

為了定性地比較不同特征的可分性,首先采用不同的特征提取方式提取316個(gè)閃電哨聲波樣本和1000個(gè)隨機(jī)的非閃電哨聲波樣本的圖像特征,并采用PCA技術(shù)將特征維度降至二維,最后,將其繪制在二維空間,以觀察其相應(yīng)的特征的分布情況,并分析其可分性的趨勢(shì),其中+1表示閃電樣本數(shù)據(jù),-1表示非閃電樣本數(shù)據(jù),如圖24所示.

圖24 圖像特征降至二維的示意圖(a) 模糊卷積核處理后的圖像; (b)尺度3×3的L卷積核處理a后的圖像; (c) 尺度5×5的L卷積核處理a后的圖像; (d) 尺度7×7的L卷積核處理a后的圖像; (e) 尺度9×9的L卷積核處理a后的圖像; (f) 尺度11×11的L卷積核處理a后的圖像; (g) 尺度13×13的L卷積核處理a后的圖像; (h) 尺度15×15的L卷積核處理a后的圖像.Fig.24 Represent the image characters at two-dimensional space(a) The images obtained by processing the original image with fuzzy convolution kernel; (b) The images obtained by processing (a) with 3×3 L convolution kernel; (c) The images obtained by processing (a) with 5×5 L convolution kernel; (d) The images obtained by processing (a) with 7×7 L convolution kernel; (e) The images obtained by processing (a) with 9×9 L convolution kernel; (f) The images obtained by processing (a) with 11×11L convolution kernel; (g) The images obtained by processing (a) with 13×13 L convolution kernel; (h) The images obtained by processing (a) with 15×15 L convolution kernel.

通過圖24可發(fā)現(xiàn):模糊卷積核提取的圖像特征如圖24a所示,雖然整體上看大部分的正負(fù)樣本均已分開,但在中間仍然存在正負(fù)樣本疊加在一起的情況;圖24b是在通過先采用模糊卷積處理圖像,再采用3×3的L卷積核處理圖像得到的特征在二維空間的分布效果,與圖24a相比,正負(fù)樣本之間的距離拉開了,隨著L卷積核尺度的增加,正負(fù)類之間的可分性均優(yōu)于圖24a,但與圖24b相比其差異不大,如圖24(c,d,f)所示;然而值得一提的是,閃電哨聲波樣本的類內(nèi)越來越積聚,表明閃電哨聲波樣本的類內(nèi)差越來越小,該情況有利于閃電事件的識(shí)別,如圖24f;隨著L特征卷積核的尺度的進(jìn)一步增大,發(fā)現(xiàn)部分閃電哨聲波樣本和非閃電樣哨聲波樣本存在相互重疊的現(xiàn)象,如圖24(g,h)中的圓形區(qū)域所示.而且隨著尺度的增加,這個(gè)重疊現(xiàn)象越來越嚴(yán)重,如圖24h所示.此外,其非閃電哨聲波數(shù)據(jù)的類內(nèi)越來越疏散,表明非閃電哨聲波樣本的類內(nèi)差越來越大,該情況不利于對(duì)非閃電哨聲波進(jìn)行分類.

總之,尺度合適的L卷積核能夠較好地對(duì)閃電哨聲波與非閃電哨聲波進(jìn)行分類.太小的尺度雖然能夠提高分類效果,但是閃電哨聲波的類內(nèi)差大,不利于閃電哨聲波的識(shí)別;太大的尺度容易造成非閃電哨聲波和閃電哨聲波在特征空間發(fā)生重疊,導(dǎo)致類間方差越來越小;亦導(dǎo)致非閃電哨聲波類內(nèi)方差變大;類間方差小和類內(nèi)方差大將嚴(yán)重影響分類器的分類效果.

4.2.3 統(tǒng)計(jì)盒形圖的角度

利用不同尺度的L卷積核提取的圖像特征并訓(xùn)練閃電哨聲波分類器,計(jì)算反映分類器排序能力的AUC值,重復(fù)實(shí)驗(yàn)10000次,得到該特征下的分類器的AUC指標(biāo)的分布情況,如圖25所示:其橫軸是不同的特征提取方法,最左邊是采用模糊卷積核提取的圖像特征,接下來依次是3×3 L形態(tài)卷積核、5×5 L形態(tài)卷積核、…、15×15 L形態(tài)卷積核.發(fā)現(xiàn)原始灰度特征的AUC的箱體遠(yuǎn)遠(yuǎn)高于基于L形態(tài)卷積核的箱體.尤其在卷積核是13×13的時(shí)候,其AUC箱體不僅僅最小而且其中位數(shù)最高.說明采用尺度為13×13的L卷積核提取的特征訓(xùn)練得到的分類器,具有最穩(wěn)定最優(yōu)的排序能力.

圖25 不同特征訓(xùn)練的分類器的AUCFig.25 Use different features to train the different classifier

同樣,采用不同尺度的L卷積核提取的特征訓(xùn)練分類器,重復(fù)10000次,可分別獲得10000個(gè)精度指標(biāo)值(Precision)、召回率值和F1score值,其數(shù)據(jù)分布如圖26a所示,圖中Blur表示采用模糊卷積核提取的特征,L3表示3×3的L形卷積核,以此類推,L15表示15×15的L形卷積核.觀察發(fā)現(xiàn):在識(shí)別閃電哨聲波的過程中,未采用L卷積核提取特征的分類器,其Recall指標(biāo)的箱體均高于采用L形卷積特征的箱體,特別是在圖26a第2幅圖的L9的位置,該位置意味著卷積核的尺度是9×9,同時(shí)發(fā)現(xiàn)該位置的中位線均高于其他位置的箱體的中位線,表明采用該尺度卷積核提取的特征訓(xùn)練分類器,其性能在召回率上不僅僅波動(dòng)最小而且精度最優(yōu).同時(shí)發(fā)現(xiàn),Recall數(shù)據(jù)的箱體均在L3和L15位置,箱體高度變高,且中位線下降.意味著尺度太小的L形卷積核,如尺度為3×3,和尺度太大的卷積核,如尺度為15×15的L形卷積核,均使得閃電哨聲波識(shí)別的性能下降.上述同樣的性能亦體現(xiàn)在F1score的分布圖上.但其精度變化不是很大.圖26b呈現(xiàn)的是識(shí)別非閃電哨聲波的三個(gè)指標(biāo)的數(shù)據(jù),情況分別是:在精度指標(biāo)上,L9位置的中位線達(dá)到最高,表明該尺度的卷積核效果在該位置上最佳,與該位置相比,最小的尺度(L3)和最大的尺度(L15)效果均不理想;在召回率指標(biāo)上,卷積核尺度對(duì)其影響不大;在F1score,最小尺度的卷積核效果較差.

圖26 不同特征訓(xùn)練的分類器的三個(gè)指標(biāo)分布情況(a) 識(shí)別閃電哨聲波; (b) 識(shí)別非閃電哨聲波.Fig.26 Performance of the classifiers(a) Lightning whistlers; (b) Without lightning whistlers.

總之,基于卷積核提取的圖像特征不僅僅具有更好的分類性能且比原始灰度的波動(dòng)小,分類性更穩(wěn)定.

4.3 基于電磁衛(wèi)星SCM數(shù)據(jù)的閃電哨聲波識(shí)別研究的延伸討論

基于電磁衛(wèi)星的SCM數(shù)據(jù)的閃電哨聲波識(shí)別方案可行且魯棒性較好,以此可以獲得大量的閃電哨聲波數(shù)據(jù),在此基礎(chǔ)上,可開展下列四個(gè)方面的研究:

(1)通過式(13)得到質(zhì)子回旋頻率(fc):

(13)

其中q是質(zhì)子電荷,為1.60217733×10-19C,m是質(zhì)子的質(zhì)量,為1.672621637×10-27kg;B是磁感應(yīng)強(qiáng)度,單位是T.繪制質(zhì)子回旋頻率,如圖27中箭頭所指.以質(zhì)子回旋頻率作為參考,分析閃電哨聲波相對(duì)于質(zhì)子回旋頻率的位置,借此,進(jìn)一步分析全球閃電哨聲波隨地點(diǎn)、季節(jié)、年等時(shí)空變化的規(guī)律.

圖27 質(zhì)子回旋頻率Fig.27 Proton cyclotron frequency

(2)從圖27發(fā)現(xiàn)閃電哨聲波存在許多不同類型的色散形態(tài).該現(xiàn)象與閃電哨聲傳播環(huán)境有關(guān).閃電發(fā)射的脈沖輻射沿著地球-電離層波導(dǎo)傳播.在電離層底層一部分輻射溢出地球-電離層波導(dǎo)傳到電離層,并以哨聲模傳播.因?yàn)殡娮訑?shù)陡峭的正梯度,向上傳播的哨聲模波動(dòng)方向角在穿越電離層時(shí)被折射,在F層頂端變成近似垂直.在穿越電離層時(shí),波動(dòng)功率譜密度因?yàn)閹靷悡p失被減弱.當(dāng)波動(dòng)到達(dá)等離子體層的時(shí)候,最初的VLF輻射已經(jīng)遠(yuǎn)離它的源,由等離子體層電子密度梯度和磁場(chǎng)梯度引導(dǎo)傳播(曹晉濱等,2009).當(dāng)上述環(huán)境發(fā)生變化時(shí),其呈現(xiàn)的色散形態(tài)亦不同.可通過對(duì)閃電哨聲波色散形態(tài)進(jìn)一步開展聚類分析來挖掘全球電離層環(huán)境的特點(diǎn).

(3)Fiser等(2010)提出哨聲波幅度可視作經(jīng)過某固定距離閃電的電流強(qiáng)度的函數(shù),并指出歐洲的閃電哨聲波的幅度與閃電源和衛(wèi)星軌道的位置有很大關(guān)系.可以結(jié)合地面閃電觀測(cè)系統(tǒng)與衛(wèi)星觀測(cè)電場(chǎng)數(shù)據(jù),探索閃電源到衛(wèi)星之間的距離與閃電哨聲波幅度的關(guān)系.

(4)本方案可進(jìn)一步拓展到從衛(wèi)星數(shù)據(jù)中去識(shí)別其他具有明確形態(tài)特征的空間物理現(xiàn)象.比如嘶聲、合聲、地面甚低頻發(fā)射機(jī)VLF波動(dòng)、地面電力系統(tǒng)的諧頻輻射、電磁離子回旋波等.這些空間現(xiàn)象的頻譜具有明顯的形態(tài)特征,自動(dòng)識(shí)別這些非震的空間現(xiàn)象有助于剝離非震的電磁擾動(dòng),推動(dòng)自動(dòng)識(shí)別地震電磁擾動(dòng)的發(fā)展.

(5) 本文介紹的方法是提取如圖28所示的時(shí)頻圖像中的L形態(tài)特征(如圖29所示)并進(jìn)一步識(shí)別該時(shí)頻圖中是否存在閃電哨聲波,未直接對(duì)閃電哨聲波進(jìn)行描跡.基于閃電哨聲波軌跡提取的截止頻率、持續(xù)時(shí)間、色散階數(shù)等信息對(duì)認(rèn)知哨聲波的傳播過程、獲取背景參數(shù)信息至關(guān)重要.未來將以本文提出的方法為基礎(chǔ),實(shí)現(xiàn)基于時(shí)頻圖的閃電哨聲波描跡:當(dāng)識(shí)別某時(shí)頻圖中存在閃電哨聲波后,首先將如圖28所示的彩色時(shí)頻圖像中的每個(gè)像素點(diǎn)從RGB顏色空間轉(zhuǎn)化到HSV顏色空間,設(shè)置色調(diào)閾值T0;再通過本文提出的方法將彩色時(shí)頻圖像轉(zhuǎn)換成L特征圖,如圖29所示,并設(shè)置閾值T1;若某像素點(diǎn)在HSV顏色空間中的H值高于該閾值T0,同時(shí)該點(diǎn)在L特征圖中像素值高于T1,則表明該點(diǎn)為閃電哨聲波軌跡點(diǎn),以完成自動(dòng)描跡功能.

圖28 含有閃電哨聲波的時(shí)頻圖Fig.28 Time-Frequency profile

5 結(jié)論

本文在張衡一號(hào)衛(wèi)星的SCM數(shù)據(jù)上開展自動(dòng)化識(shí)別閃電哨聲波的研究.根據(jù)頻譜數(shù)據(jù)的特點(diǎn)和閃電哨聲波的L形態(tài)特征設(shè)計(jì)了模糊卷積核和L形態(tài)卷積核,進(jìn)一步增強(qiáng)了頻譜圖中的閃電形態(tài)特征,并采用SVM分類器對(duì)特征進(jìn)行分類,使得其識(shí)別性能在精度、召回率以及排序能力等方面均處于94%以上.

然而,由于閃電哨聲波樣本(正樣本)量太少,非閃電哨聲波樣本(負(fù)樣本)量大,為了避免分類器在分類的過程中容易出現(xiàn)偏好負(fù)樣本的情況,文中采用的是降采樣負(fù)樣本的策略.為了得到更為魯棒的閃電哨聲波識(shí)別效果,需要增加正樣本數(shù)量,以平衡正負(fù)樣本量.因此,未來的工作主要集中在三個(gè)方面:

(1)在本次探索基礎(chǔ)上進(jìn)一步增加正樣本量,并探索采用卷積神經(jīng)網(wǎng)絡(luò)(CNN)的自動(dòng)化特征提取方法;

(2)當(dāng)獲得大量的閃電哨聲波事件后進(jìn)一步提取其頻率和幅度的變化并聯(lián)合其他載荷數(shù)據(jù),建立閃電哨聲波頻率/幅度與等離子體離子密度、離子溫度、離子速度、等離子體電子溫度、電子密度之間的數(shù)學(xué)模型;

(3)本研究提出的識(shí)別方案,可進(jìn)一步拓展應(yīng)用于從張衡衛(wèi)星的數(shù)據(jù)中自動(dòng)識(shí)別人工發(fā)射源、磁暴等空間事件;

(4) 鑒于我國(guó)地面ELF/VLF接收機(jī)系統(tǒng)獲得的突破性進(jìn)展(Chen et al., 2016, 2017; Zhou et al., 2020; Yi et al., 2020),下一步將利用張衡一號(hào)衛(wèi)星數(shù)據(jù)和我國(guó)地面的ELF/VLF接收機(jī)觀測(cè)數(shù)據(jù)開展閃電哨聲波聯(lián)合觀測(cè)研究.

致謝本文特別感謝來自應(yīng)急管理部國(guó)家自然災(zāi)害防治研究院的張衡一號(hào)衛(wèi)星團(tuán)隊(duì)的所有成員為本研究提供的技術(shù)服務(wù)支持.

猜你喜歡
分類器尺度卷積
基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
財(cái)產(chǎn)的五大尺度和五重應(yīng)對(duì)
從濾波器理解卷積
基于傅里葉域卷積表示的目標(biāo)跟蹤算法
加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機(jī)的TSK分類器
宇宙的尺度
9
基于LLE降維和BP_Adaboost分類器的GIS局部放電模式識(shí)別
一種基于卷積神經(jīng)網(wǎng)絡(luò)的性別識(shí)別方法