韓冰, 吳墨豪,2, 胡澤駿, 王平, 張義生
1 西安電子科技大學(xué)電子工程學(xué)院, 西安 710071 2 中國極地研究中心自然資源部極地科學(xué)重點(diǎn)實(shí)驗(yàn)室, 上海 200136 3 浙江大學(xué)海洋研究院, 浙江舟山 316021 4 北京應(yīng)用氣象研究所, 北京 100029
極光是一種由太陽風(fēng)和地球磁層的能量粒子與極區(qū)大氣粒子發(fā)生碰撞產(chǎn)生的發(fā)光現(xiàn)象,主要出現(xiàn)在地球南北極高緯度地區(qū).極光研究是人們檢測地球近地空間物理過程的重要途徑.不同的空間環(huán)境和動(dòng)力學(xué)過程導(dǎo)致形成不同形態(tài)的極光(Meinel, 1954),例如,地基極光觀測顯示,日側(cè)極光卵的極光可大致分為兩種,即日側(cè)彌散極光和日側(cè)分立極光,這兩大類極光分別與磁層中的粒子捕獲過程和磁層邊界層中的粒子加速過程對應(yīng)(Hu et al., 2009; Wang et al., 2010; Han B et al., 2017a; Shi et al., 2012, 2014; Ohma et al.,2023; Han D S et al.,2023).其中一種發(fā)生于日側(cè)正午極光卵區(qū)域的“極向運(yùn)動(dòng)極光”(Poleward Moving Auroral Forms, PMAFs)被認(rèn)為是脈動(dòng)式的日側(cè)磁重聯(lián)通量傳輸事件的典型電離層特征(Fasel, 1995);另一種是相同區(qū)域內(nèi)發(fā)生在極光卵赤道側(cè)的南北向極光射線帶,命名為“喉區(qū)極光”(Throat aurora),被認(rèn)為是與日側(cè)磁層頂?shù)陌枷萁Y(jié)構(gòu)對應(yīng)(Han D S et al., 2015, 2016, 2017; Chen et al., 2017).因而,對極光形態(tài)進(jìn)行合理分類,并總結(jié)不同形態(tài)極光的發(fā)生規(guī)律有助于我們了解不同形態(tài)極光的發(fā)生機(jī)制,提升對“太陽風(fēng)-磁層耦合過程”的理解.
極光渦旋是一種具有“渦旋”特征的極光形態(tài),即極光呈現(xiàn)出繞著某一中心做圓周運(yùn)動(dòng)的形態(tài)特征.早期的研究認(rèn)為極光渦旋是磁層頂邊界層K-H(Kelvin-Helmholtz開爾文一赫姆霍茨)不穩(wěn)定性造成的磁層邊界層等離子體渦旋的電離層映射(Hallinan,1976;Davis and Hallinan,1976).Keiling等(2009)研究發(fā)現(xiàn),從亞暴擴(kuò)張階段開始時(shí),空間渦旋產(chǎn)生SCW(Substorm Current Wedge亞暴電流楔)場向電流并與電離層耦合,導(dǎo)致電離層渦旋產(chǎn)生,伴生極光渦旋.Hu等(2013)通過對南北極極光渦旋/極光亮斑的共軛觀測,認(rèn)為導(dǎo)致極光弧上形成極光渦旋結(jié)構(gòu)的原因是極光弧相關(guān)的平行電場上方電流片的不穩(wěn)定性.Hiraki(2016)認(rèn)為渦旋的形成與Alfven波及場向電流相關(guān).上述研究成果得到的極光渦旋的產(chǎn)生機(jī)制并不一致,主要是因?yàn)闃O光渦旋存在不同種類,這些不同形態(tài)的極光渦旋產(chǎn)生機(jī)制有可能不一樣.Hu等(2013)所提到的極光渦旋是發(fā)生在日側(cè)極光卵午后扇區(qū)極光弧上的渦旋結(jié)構(gòu),其直徑約50 km,而Keiling等(2009)涉及到的極光渦旋是出現(xiàn)在夜側(cè)極光卵,其直徑超過200 km.由于極光渦旋的空間尺度和發(fā)生區(qū)域的差異,可能會(huì)具有不同的產(chǎn)生機(jī)制.因此,對極光渦旋的形態(tài)進(jìn)行分類研究是非常必要的,通過合理有效的分類,區(qū)分出不同極光渦旋的特性,才能更加精準(zhǔn)的分析出對應(yīng)的空間物理過程.
隨著計(jì)算機(jī)技術(shù)的發(fā)展,大量的機(jī)器學(xué)習(xí)技術(shù)已成功應(yīng)用于極光分類工作(Han B et al.,2014,2016;韓冰等, 2017;嚴(yán)月, 2018;宋亞婷等, 2016;Hu et al.,2021).隨著數(shù)據(jù)量的不斷增加以及人工智能科技的進(jìn)步,深度學(xué)習(xí)技術(shù)逐漸被運(yùn)用到極光影像處理中(Jia et al.,2015; Han B et al.,2015,2017a,2019a;Yang X et al.,2018;Clausen and Nickisch,2018;Yang Q J and Zhou P H,2020;Kvammen et al.,2020;Han Y Y et al.,2020;韓冰等, 2019;胡澤駿等, 2020;韓怡園等, 2023).上述成果都是以大數(shù)據(jù)已標(biāo)記數(shù)據(jù)為基礎(chǔ)的,由于極光渦旋事件發(fā)生較少,數(shù)據(jù)并不充分,如果直接應(yīng)用上述方法進(jìn)行極光渦旋的分類,結(jié)果可能會(huì)導(dǎo)致過擬合且沒有很好的泛化能力.另外,目前還沒有針對極光渦旋序列分類研究的工作.
如何在數(shù)據(jù)有限的情況下利用深度學(xué)習(xí)去解決極光渦旋序列分類的問題是本文主要研究內(nèi)容.大部分現(xiàn)有工作將模型首先在較大規(guī)模數(shù)據(jù)庫上進(jìn)行訓(xùn)練,再將模型在數(shù)據(jù)量較少的數(shù)據(jù)庫上進(jìn)行微調(diào)來解決訓(xùn)練樣本不足的問題,但此類方法的前提是預(yù)訓(xùn)練的數(shù)據(jù)庫和目標(biāo)數(shù)據(jù)庫數(shù)據(jù)類型具有極高的相似性.但是極光數(shù)據(jù)與目前公開的自然數(shù)據(jù)庫(CIFAR-10、ImageNet等)相似度并不高,所以上述方案并不適合直接應(yīng)用于我們的極光分類中.小樣本學(xué)習(xí)是近年來深度學(xué)習(xí)研究的熱門領(lǐng)域之一,主要針對在無法獲得海量訓(xùn)練數(shù)據(jù)時(shí)如何完成模型訓(xùn)練的問題,或者訓(xùn)練集中可供學(xué)習(xí)的標(biāo)記樣本很少的情況.小樣本學(xué)習(xí)的先驗(yàn)知識(shí)來自三個(gè)方面:數(shù)據(jù)、模型和算法,所以小樣本學(xué)習(xí)的方法可以分為基于數(shù)據(jù)增強(qiáng)、模型改進(jìn)、算法優(yōu)化的方法.大多數(shù)研究主要針對基于算法優(yōu)化的方法,包括改善元學(xué)習(xí)參數(shù)(Naik and Mammone,1992;Thrun and Pratt,1998);學(xué)習(xí)更新模型參數(shù)(Thrun and Pratt,1998;Andrychowicz et al.,2016;Ravi and Larochelle,2017);參數(shù)生成方法(Liu et al.,2020;Bertinetto et al.,2016;Cai et al.,2018;Munkhdalai and Yu,2017)和基于度量學(xué)習(xí)方法(Munkhdalai et al.,2018;Snell et al.,2017;Sung et al.,2018;Vinyals et al.,2016;Zhou et al.,2003;Oreshkin et al.,2018).
本文主要利用元學(xué)習(xí)的思想,把極光渦旋分類任務(wù)劃分成為多個(gè)子任務(wù),讓模型在數(shù)據(jù)和任務(wù)兩個(gè)方面都進(jìn)行采樣,從而使模型不斷地適應(yīng)每個(gè)具體任務(wù),讓網(wǎng)絡(luò)具備一種自學(xué)習(xí)的能力.為了增強(qiáng)每個(gè)子任務(wù)中不同類別之間的特征關(guān)系,通過結(jié)合注意力機(jī)制提高網(wǎng)絡(luò)特征選擇的精確性.另一方面,傳統(tǒng)機(jī)器學(xué)習(xí)或者深度學(xué)習(xí)方法的極光影像分類并沒有利用物理參數(shù)信息,因而不能充分地反映物理事件完整的過程,各種物理事件的發(fā)生也會(huì)伴隨著空間環(huán)境參數(shù)的變化,因此將事件發(fā)生時(shí)刻物理參數(shù)的相關(guān)信息與影像分類方法進(jìn)行結(jié)合更符合極光發(fā)生機(jī)制研究.基于此,本文提出一種基于注意力機(jī)制和融合空間物理參數(shù)信息的小樣本極光渦旋序列分類方法,該方法可解決渦旋事件數(shù)據(jù)較少情況下的有效分類,同時(shí)將極光事件發(fā)生時(shí)的空間環(huán)境參數(shù)加入到模型中來探究空間環(huán)境參數(shù)對于極光渦旋事件的影響.本文使用的空間環(huán)境和地磁參數(shù)主要來自美國航空航天局(National Aeronautics and Space Administration,NASA)提供的OMNI(1)https:∥cdaweb.gsfc.nasa.gov/cgi-bin/eval1.cgi.數(shù)據(jù)包含32個(gè)空間環(huán)境參數(shù)和地磁環(huán)境參數(shù)及其他物理量,本文主要選取的物理參數(shù)分別是行星際磁場IMF(Interplanetary Magnetic Field)三分量(Bx,By,Bz),太陽風(fēng)速度(Vp),太陽風(fēng)密度(Np)以及亞暴指數(shù)(AE)、地磁指數(shù)(Dst),這些參數(shù)已經(jīng)被公認(rèn)為是影響極光活動(dòng)的主要參數(shù)(Balan et al., 2019;Hu et al., 2009, 2017a, 2021;胡澤駿等, 2020).
從2003—2017年北極黃河站全天空成像儀(5577波段)拍攝得到的全天空圖像數(shù)據(jù)(Hu et al.,2009)中人工選取85個(gè)極光渦旋序列共1048幅圖像構(gòu)建極光渦旋分類數(shù)據(jù)集.圖像的時(shí)間分辨率是10 s,選取的極光序列中最短持續(xù)時(shí)間為40 s,最長時(shí)間為3分30秒,根據(jù)不同形態(tài),將全天空圖像中具有渦旋結(jié)構(gòu)的極光序列分為四種類型,分別是極光弧渦旋、射線簇渦旋、大扭曲結(jié)構(gòu)的極光弧和大扭曲結(jié)構(gòu)的極光射線帶,各類別序列數(shù)量分別為25,20,20,20.不同類型的渦旋結(jié)構(gòu)示例如圖1所示.
圖1 不同類型的渦旋結(jié)構(gòu)示例(a) 極光弧渦旋; (b) 射線簇渦旋; (c) 大扭曲結(jié)構(gòu)的極光弧; (d) 大扭曲結(jié)構(gòu)的極光射線帶.Fig.1 Different auroral vortex structures(a) Auroral arc vortex; (b) Ray cluster vortex; (c) Auroral arc with large distortion structure; (d) Auroral ray band with large distortion structure.
其中極光弧渦旋發(fā)生在極光弧上且弧上存在明顯的渦狀結(jié)構(gòu),射線簇渦旋是由大量的射線狀極光圍繞某一中心旋轉(zhuǎn)而成,當(dāng)極光弧呈現(xiàn)明顯的扭曲形態(tài)形成大扭曲結(jié)構(gòu)的極光弧,由射線狀的極光所構(gòu)成的類似于弧狀結(jié)構(gòu)稱為大扭曲結(jié)構(gòu)的極光射線帶.
圖2為各類渦旋事件在2003—2017年之間的時(shí)間分布圖,由圖中可以看出極光弧渦旋主要出現(xiàn)午后15—18 MLT(Magnetic Local Time)扇區(qū),午前6—12 MLT扇區(qū)內(nèi),與日側(cè)極光弧的分布特征吻合(Yang and Hu, 2018),而09—15 MLT是具有射線結(jié)構(gòu)的日側(cè)冕狀極光(尤其是輻射型冕狀極光)的高發(fā)區(qū)(Hu et al., 2009; Yang and Hu, 2018),所以射線簇渦旋主要出現(xiàn)在該扇區(qū)內(nèi).而大扭曲結(jié)構(gòu)的極光弧和極光射線帶,推測應(yīng)該與夜側(cè)亞暴過程有關(guān)(例如,西行浪涌就是大扭曲結(jié)構(gòu)的極光弧),所以主要分布在夜側(cè)扇區(qū).
圖2 渦旋事件時(shí)間分布圖Fig.2 Temporal distribution of auroral vortices
極光渦旋各類型的分布與渦旋結(jié)構(gòu)所伴隨發(fā)生的極光弧、極光射線帶、射線簇的分布緊密相關(guān),而這幾類基本的極光類型,其形成受空間環(huán)境的調(diào)制(Hu et al., 2009, 2010, 2012, 2013, 2017b),因而,在本文的分類方法中,加入空間環(huán)境和地磁參數(shù)信息豐富極光渦旋特征來輔助自動(dòng)分類工作.
本文方法流程圖如圖3所示.輸入的圖像序列分為支持集和查詢集,參數(shù)部分為所有輸入圖像序列所對應(yīng)的空間參數(shù).對于各類圖像序列,首先經(jīng)過卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)和長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)提取各自的圖像特征以及序列之間的信息特征,然后將提取到的特征經(jīng)過特征結(jié)合模塊和注意力機(jī)制模塊,最后與序列的空間物理參數(shù)信息進(jìn)行多模態(tài)特征融合之后可得到最終分類結(jié)果.
圖3 算法流程圖Fig.3 The flowchart of our proposed algorithm structure
傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)不會(huì)去特別關(guān)注前后時(shí)刻圖像之間的關(guān)系,只關(guān)注單一時(shí)刻的圖像特征.但是對于序列來說,前后圖像之間存在很強(qiáng)的關(guān)聯(lián)性和相似性,因此采用長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(Long Short Term Memory Networks,LSTM)提取極光序列特征.長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)是由多個(gè)塊串聯(lián)構(gòu)成,通過多個(gè)塊之間長期的信息傳遞來不斷進(jìn)行信息更新,所以處理之后的序列特征信息既包含前一時(shí)刻圖像信息又包含后一時(shí)刻圖像信息,極大程度保留了序列整體的特征.特征融合模塊采用的是在小樣本分類任務(wù)中廣泛使用的深度殘差網(wǎng)絡(luò)(ResNet12),其主要由四個(gè)殘差塊構(gòu)成,其中每個(gè)殘差塊的結(jié)構(gòu)均和文獻(xiàn)(He et al.,2016)中所用結(jié)構(gòu)相同,如公式(1)所示:
Y=(P,Q)=Res(P′ht,Q′ht),
(1)
其中Y是經(jīng)過特征融合模塊之后得到的特征圖,P,Q分別代表支持集和查詢集特征圖,P′ht,Q′ht表示輸入圖像序列經(jīng)過CNN+LSTM模塊提取得到的序列特征.
輸入序列經(jīng)過特征提取后通過注意力模塊將所得特征進(jìn)行進(jìn)一步特征結(jié)合,得到輸出特征圖Fp及Fq,注意力模塊結(jié)構(gòu)如圖4所示.
圖4 注意力模塊結(jié)構(gòu)(其中m,h,w分別代表特征通道數(shù)、高度和寬度)Fig.4 Attention module structure
圖4中關(guān)聯(lián)層用來計(jì)算P(P=[p1,p2,p3,…])和Q(Q=[q1,q2,q3,…])的相關(guān)性,并指導(dǎo)注意力圖的生成,之后進(jìn)一步利用余弦距離計(jì)算二者之間的語義相關(guān)性得到相關(guān)映射,相關(guān)計(jì)算如公式(2)、(3)所示:
(2)
(3)
‖src‖代表的是二范數(shù),公式(3)中通過各自的二范數(shù)計(jì)算出余弦距離,T表示的是矩陣轉(zhuǎn)置.
利用融合層將通過關(guān)聯(lián)層產(chǎn)生的Rp和Rq分別作為輸入得到注意力圖,利用公式(4)得到輸出特征圖Fp,Fq:
(4)
其中Pool(average pooling)表示平均池化操作,σ為激活函數(shù),()conv代表多次卷積操作.
將輸入的空間參數(shù)進(jìn)行特征編碼得到空間參數(shù)信息I,與2.2節(jié)中注意力模塊所得特征圖(Fp,Fq)融合得到多模態(tài)特征信息F·I,多模態(tài)信息融合的具體流程如圖5所示.
圖5 多模態(tài)信息融合的流程Fig.5 The flowchart of multimodal information fusion
通過利用聯(lián)合表示的方式將多個(gè)模態(tài)的信息一起映射到一個(gè)統(tǒng)一的多模態(tài)向量空間,將結(jié)合的特征作為模型損失函數(shù)的約束項(xiàng),從而指導(dǎo)模型完成分類任務(wù).
模型的損失函數(shù)由公式(5)給出,它由三部分構(gòu)成:
L=L1+αL2+βL3,
(5)
其中α和β表示的是不同的權(quán)重系數(shù),L1代表將查詢集特征進(jìn)行全局分類的損失函數(shù),可通過公式(6)計(jì)算:
(6)
其中Ti*Qi表示在(第i個(gè)序列)中查詢集特征圖Q與經(jīng)過one-hot編碼之后的標(biāo)簽T乘積所得結(jié)果,Yt表示的是每一序列i原始標(biāo)簽,n表示序列的總數(shù).
L2是查詢集特征進(jìn)行局部分類的損失函數(shù),由公式(7)和(8)計(jì)算:
(7)
(8)
L3為多模態(tài)信息融合部分損失函數(shù),由公式(9)計(jì)算:
(9)
其中I表示的是經(jīng)過長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)之后提取到的空間參數(shù)信息.
本文所有的實(shí)驗(yàn)均在64位操作系統(tǒng)的Windows下進(jìn)行,選用Pytorch深度學(xué)習(xí)框架.實(shí)驗(yàn)按照1∶1的比例將原始數(shù)據(jù)集劃分為訓(xùn)練集和測試集,模型訓(xùn)練時(shí),學(xué)習(xí)率(learning rate)為0.01,迭代次數(shù)(epoch)為60,每次傳遞樣本數(shù)量(batch size)為4,網(wǎng)絡(luò)優(yōu)化器采用SGD(Stochastic Gradient Descent)并且使用交叉熵作為損失函數(shù).網(wǎng)絡(luò)訓(xùn)練時(shí)對數(shù)據(jù)采用了數(shù)據(jù)增強(qiáng)策略,包括對數(shù)據(jù)隨機(jī)縮放、隨機(jī)遮擋,使用這些方法可以提高模型的泛化能力,防止過擬合,輸入圖像大小為84×84.實(shí)驗(yàn)準(zhǔn)確率是通過在4類數(shù)據(jù)中每次進(jìn)行相同數(shù)量隨機(jī)采樣,構(gòu)成多組數(shù)據(jù)并賦予標(biāo)簽值,構(gòu)建20組共320個(gè)極光圖像序列,實(shí)驗(yàn)準(zhǔn)確率為20組的平均準(zhǔn)確率.
表1列出本文模型和當(dāng)前主流小樣本學(xué)習(xí)方法DN4(Deep Nearest Neighbor Neural Network)(Li et al.,2019)的實(shí)驗(yàn)對比結(jié)果以及不同特征提取網(wǎng)絡(luò)對準(zhǔn)確率的影響,表1“空間參數(shù)”欄中“√”表示實(shí)驗(yàn)時(shí)模型中包含空間物理參數(shù)信息,“×”表示模型中未包含空間物理參數(shù)信息.從表中對比結(jié)果可以看出,我們的方法除了在網(wǎng)絡(luò)結(jié)構(gòu)為ResNet-101時(shí)略低于DN4方法結(jié)果,其余4個(gè)不同的網(wǎng)絡(luò)結(jié)構(gòu),均獲得了較好的結(jié)果,其中在使用ResNet-12網(wǎng)絡(luò)且融合了空間物理參數(shù)時(shí)獲得了最高的準(zhǔn)確率66.25%,比使用ResNet-12但不添加物理參數(shù)時(shí)提升了近10個(gè)百分點(diǎn).當(dāng)采用較深層網(wǎng)絡(luò)結(jié)構(gòu)時(shí)實(shí)驗(yàn)準(zhǔn)確率較低,原因是相比于自然圖像,全天空極光圖像僅包含極光弧、極光射線等簡單的結(jié)構(gòu)并不會(huì)包含過多的語義信息.深層的網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)量較大,復(fù)雜度較高,需要學(xué)習(xí)的參數(shù)量增加,會(huì)遠(yuǎn)遠(yuǎn)超過極光圖像分類任務(wù)自身的復(fù)雜度,使得模型很難從數(shù)據(jù)中進(jìn)行學(xué)習(xí)和優(yōu)化,進(jìn)而導(dǎo)致準(zhǔn)確率降低.基于此本文后續(xù)實(shí)驗(yàn)?zāi)P途臻g物理參數(shù)信息并使用ResNet-12網(wǎng)絡(luò)進(jìn)行特征提取.
表1 不同小樣本模型實(shí)驗(yàn)結(jié)果Table 1 Experimental results of different few shot models
為了研究極光事件不同歷史時(shí)間段的物理參數(shù)信息對模型產(chǎn)生的影響,將7個(gè)空間參數(shù)(Bx,By,Bz,Vp,Np,AE,Dst)按照不同累積時(shí)間段添加至模型中進(jìn)行對比實(shí)驗(yàn),結(jié)果如圖6所示.圖中橫坐標(biāo)Δt表示的是在事件發(fā)生時(shí)刻之前某個(gè)時(shí)間開始到事件發(fā)生時(shí)刻為止的不同時(shí)間段(添加參數(shù)信息進(jìn)行實(shí)驗(yàn)時(shí)需要考慮不同大小Δt,單獨(dú)使用極光序列圖像信息時(shí)則無需考慮),縱坐標(biāo)表示的是實(shí)驗(yàn)準(zhǔn)確率.藍(lán)色虛線表示序列結(jié)合不同歷史時(shí)刻參數(shù)的準(zhǔn)確率,紅色虛線表示單獨(dú)使用序列信息分類的準(zhǔn)確率,由于僅僅使用圖像信息,并不隨時(shí)間變化而變化,準(zhǔn)確率一直為56.37%.
圖6 添加不同時(shí)間段物理參數(shù)實(shí)驗(yàn)結(jié)果Δt表示不同歷史時(shí)間段,其值為0時(shí)表示事件發(fā)生時(shí)刻,Δt=2表示將事件發(fā)生時(shí)刻前2 min至事件發(fā)生時(shí)刻的空間環(huán)境參數(shù)加入至模型中.Fig.6 Experimental results with different physics parameters in different time periodsΔt indicates different historical time periods, when Δt is 0, it indicates the start of the event, and Δt=2 indicates that the model uses all spatial physics parameters from 2 min before the event occurs to the entire time period when the event occurs.
由圖6可以看出,在原模型中加入相關(guān)空間環(huán)境的物理參數(shù)信息之后,準(zhǔn)確率在Δt為1~11 min之間有明顯的提升且呈現(xiàn)上升趨勢,說明了物理參數(shù)對分類準(zhǔn)確率有一定影響,即參數(shù)和事件之間存在相互聯(lián)系.但在Δt>11 min分類準(zhǔn)確率呈現(xiàn)明顯的下降趨勢,其背后的物理原因可能是空間參數(shù)對于極光渦旋事件的影響時(shí)間主要是10 min左右,歷史時(shí)間段較長時(shí)極光渦旋還未形成,參數(shù)變化影響較小.當(dāng)添加參數(shù)的時(shí)間段較短時(shí),會(huì)缺少部分時(shí)間段的參數(shù)變化影響導(dǎo)致結(jié)果較低.其中當(dāng)Δt為11 min時(shí),最高準(zhǔn)確率為66.25%.
不同類型的極光渦旋分類準(zhǔn)確率的混淆矩陣如表2所示.
表2 最高準(zhǔn)確率下的混淆矩陣Table 2 Confusion matrix with the highest accuracy
通過混淆矩陣可以看出,在構(gòu)建的20組320個(gè)數(shù)據(jù)中,各個(gè)類別正確分類的數(shù)目分別為44,69,39和60.其中射線簇渦旋和大扭曲結(jié)構(gòu)的極光射線帶被誤判的次數(shù)比較少,從極光圖像中可以看出,射線簇渦旋中包含大量射線簇結(jié)構(gòu),大扭曲結(jié)構(gòu)極光射線帶呈現(xiàn)大范圍細(xì)小的射線結(jié)構(gòu),所以和其他類別區(qū)分度較高.由于極光弧渦旋大部分產(chǎn)生在極光弧上,所以會(huì)有25次被誤判為大扭曲結(jié)構(gòu)的極光弧.大扭曲結(jié)構(gòu)的極光弧有18次被誤判為和其結(jié)構(gòu)近似的大扭曲結(jié)構(gòu)的極光射線帶.
進(jìn)一步地,對于單一時(shí)刻空間參數(shù)的影響也進(jìn)行實(shí)驗(yàn)對比,結(jié)果如圖7所示.其中藍(lán)色虛線表示的是加入不同歷史時(shí)刻物理參數(shù)信息的準(zhǔn)確率,紅色虛線表示單獨(dú)使用序列信息分類的準(zhǔn)確率.
圖7 添加不同時(shí)刻物理參數(shù)實(shí)驗(yàn)結(jié)果t表示事件發(fā)生前某一具體時(shí)刻,t=2表示將事件發(fā)生前第2 min的空間環(huán)境參數(shù)加入至模型中.Fig.7 Experimental results with different physics parameters in different times t indicates a specific moment before the event occurs, and t=2 indicates that the model uses the spatial physics parameters at the second minute before the event occurs.
圖7中t表示事件發(fā)生前的不同時(shí)刻,當(dāng)t=14時(shí),分類準(zhǔn)確率達(dá)到最高63.12%.從整體結(jié)果可以看出,單獨(dú)時(shí)刻空間參數(shù)對于極光渦旋的影響并不穩(wěn)定.因?yàn)闇u旋的產(chǎn)生自身是處于一個(gè)變化的過程,但是某一時(shí)刻單獨(dú)的參數(shù)變化可能無法從參數(shù)信息方面體現(xiàn)出其具體變化的過程,所以結(jié)果并不表現(xiàn)出上升或者下降的趨勢,但總體上實(shí)驗(yàn)結(jié)果仍優(yōu)于單獨(dú)使用圖像信息的結(jié)果.
為了研究這些物理參數(shù)中,何種組合的物理參數(shù)對于實(shí)驗(yàn)結(jié)果影響較大,這里對于6個(gè)物理參數(shù)的所有組合進(jìn)行實(shí)驗(yàn)對比分析,采用的均是圖6中10 min時(shí)間段的空間參數(shù),表3為不同參數(shù)組合對分類準(zhǔn)確率影響的實(shí)驗(yàn)結(jié)果.
表3 不同空間參數(shù)組合對分類準(zhǔn)確率影響的實(shí)驗(yàn)結(jié)果Table 3 Experimental results with different parameter combinations
續(xù)表3
由表3實(shí)驗(yàn)結(jié)果可以發(fā)現(xiàn),使用單個(gè)參數(shù)信息時(shí),行星際磁場參數(shù)對于分類結(jié)果的提升最明顯,單獨(dú)使用Bz時(shí)效果最好,所以初步分析行星際磁場參數(shù)對渦旋影響效應(yīng)最明顯.
將單獨(dú)使用Bx,By,Vp,Np,AE(No.2—3,5—7)與表3中將這五種參數(shù)和Bz分別結(jié)合相比(No.9,13,17—19),實(shí)驗(yàn)組合(Bz,Vp)可以達(dá)到較好的準(zhǔn)確率和兩種參數(shù)組合中實(shí)驗(yàn)效果最好的組合(Vp,AE)(No.21)基本保持相同準(zhǔn)確率.
觀察三種參數(shù)組合(No.23—42)的實(shí)驗(yàn)結(jié)果可以發(fā)現(xiàn),行星際磁場參數(shù)的組合效果是最好,并且在三種參數(shù)組合中如果僅包含一個(gè)行星際磁場參數(shù),那么實(shí)驗(yàn)結(jié)果會(huì)普遍低于包含兩個(gè)行星際參數(shù)的實(shí)驗(yàn)結(jié)果,進(jìn)一步說明行星際磁場作為整體加入模型中會(huì)有更好的效果.另外,在四種組合的結(jié)果中,行星際磁場參數(shù)與Vp及AE各自的組合也可以達(dá)到比較高的實(shí)驗(yàn)準(zhǔn)確率(No.43,45),也體現(xiàn)出上述結(jié)果.若對比其與Np的實(shí)驗(yàn)結(jié)果(No.44)可以發(fā)現(xiàn),在加入了Np指數(shù)后有了明顯的下降,也再一次說明單一參數(shù)結(jié)果中Np對于極光渦旋分類的影響并不明顯.進(jìn)一步通過觀察五種參數(shù)的實(shí)驗(yàn)組合結(jié)果,可以看出最好的結(jié)果為(No.59)此時(shí)空間參數(shù)并沒有添加Np.
對比五種不同參數(shù)實(shí)驗(yàn)結(jié)果(No.58—63),將行星際磁場參數(shù)作為整體和其他三種參數(shù)結(jié)合時(shí)效果較好,說明了行星際磁場參數(shù)整體對于渦旋事件會(huì)有更強(qiáng)的影響.
通過實(shí)驗(yàn)結(jié)果看出行星際磁場的變化會(huì)對極光渦旋產(chǎn)生明顯的影響,已有研究認(rèn)為這種渦旋形態(tài)極光的產(chǎn)生是因?yàn)榭臻g電場中存在不穩(wěn)定的剪切電流導(dǎo)致的,而行星際磁場相關(guān)參數(shù)變化代表日地空間中的磁場變化,和其有著密切的聯(lián)系,所以行星際磁場和渦旋的發(fā)生有著密切的關(guān)聯(lián)性.
已有研究通常將Dst指數(shù)和AE指數(shù)聯(lián)合分析電離層亞暴事件,根據(jù)3.2小節(jié)實(shí)驗(yàn)結(jié)果,將行星際磁場三分量看作整體與其余參數(shù)進(jìn)行不同組合進(jìn)行實(shí)驗(yàn),添加Dst指數(shù)實(shí)驗(yàn)的實(shí)驗(yàn)結(jié)果如表4所示.
表4 添加Dst指數(shù)的實(shí)驗(yàn)結(jié)果Table 4 Experimental results with Dst parameter and other parameters
將表4中15組實(shí)驗(yàn)和表3中不添加Dst指數(shù)的15組實(shí)驗(yàn)進(jìn)行對比,添加Dst指數(shù)后大部分實(shí)驗(yàn)準(zhǔn)確率都有所下降,如Vp+Dst與只使用Vp相比下降3.75%,Bx+By+Bz+Vp+Np+AE+Dst與不加Dst相比下降9.69%.對于準(zhǔn)確率降低的情況,經(jīng)過分析可能是由于Dst指數(shù)的時(shí)間分辨率為1 h而其余參數(shù)分辨率均為1 min,所以相同時(shí)間內(nèi)Dst指數(shù)保持不變并且對于不同類別事件若發(fā)生在相鄰時(shí)刻Dst指數(shù)可能完全相同,并沒有起到輔助判別的作用.
利用極光受空間環(huán)境參數(shù)調(diào)制的物理特性,本文提出了一種引入空間物理參數(shù)并結(jié)合注意力機(jī)制的小樣本學(xué)習(xí)方法,用于極光渦旋事件的自動(dòng)分類.基于北極黃河站的5577波段全天空極光圖像中渦旋事件分類結(jié)果表明:
(1) 引入空間物理參數(shù)能顯著提高分類結(jié)果的準(zhǔn)確性,例如單獨(dú)使用圖像時(shí)準(zhǔn)確率為56.37%,而引入空間物理參數(shù)后,準(zhǔn)確率都有所提升,最高達(dá)到66.25%,這表明空間環(huán)境參數(shù)對極光渦旋的產(chǎn)生有著明顯的調(diào)制作用;
(2) 在不同時(shí)間范圍內(nèi)空間物理參數(shù)對分類的結(jié)果也有影響,對于極光渦旋事件,采用事件前11 min內(nèi)的空間物理參數(shù),分類的準(zhǔn)確率最高;
(3) 不同空間物理參數(shù)的組合,對分類的準(zhǔn)確率有著顯著的影響.對于行星際磁場(Bx,By和Bz)、太陽風(fēng)參數(shù)(Vp,Np)以及地磁指數(shù)(AE),6種參數(shù)引入時(shí)分類準(zhǔn)確率最高.