劉艷玲 陳卯蒸 李 健 閆 浩 袁建平
(1中國科學(xué)院新疆天文臺 烏魯木齊 830011)
(2中國科學(xué)院大學(xué) 北京 100049)
(3中國科學(xué)院射電天文重點實驗室 南京 210023)
(4新疆微波技術(shù)重點實驗室 烏魯木齊 830011)
快速射電暴(Fast Radio Burst,F(xiàn)RB)是一種明亮的、持續(xù)時間僅為數(shù)毫秒的射電天文瞬變現(xiàn)象[1-3].由于其爆發(fā)時間極短且鮮少重復(fù),捕捉快速射電暴事件非常困難.到目前,F(xiàn)RB的許多屬性仍然未知.因此,需要基于大量的FRB觀測數(shù)據(jù)進行研究,以回答與其起源和發(fā)射機理有關(guān)的問題.FRB是目前射電天文領(lǐng)域的熱點前沿之一,近幾年搜尋FRB的觀測數(shù)據(jù)量急劇增多,特別是多波束接收機、相控陣接收機和望遠鏡陣列所產(chǎn)生的數(shù)據(jù)量呈指數(shù)級增長,如500 m口徑球面射電望遠鏡(Five-hundred-meter Aperture Spherical Telescope,F(xiàn)AST)、澳大利亞平方公里陣探路者(Australian Square Kilometre Array Pathfinder,ASKAP)等,這給FRB的搜尋工作帶來了前所未有的挑戰(zhàn).
傳統(tǒng)技術(shù)上,通常采用自動化、高性能的基于消色散理論的軟件管道進行FRB事件搜尋.如HEIMDALL(取自漫威漫畫中的同名角色)[4]、FDMT(Fast Dispersion Measure Transform)[5]、Presto(Pulsar Exploration and Search Toolkit)[6]和BEAR(Burst Emission Automatic Roger)[7]等.由于射頻干擾(Radio Frequency Interference,RFI)的影響,這些算法面臨著噪聲和RFI導(dǎo)致的假陽性挑戰(zhàn).最初,從大量候選體中篩選FRB事件的審查工作是由人工進行的.但是,隨著FRB觀測數(shù)據(jù)量的急劇增加,假陽性候選體數(shù)量也相應(yīng)增長.因此,目前急需開發(fā)一種自動的FRB候選體高精度識別分類方法,解決人工處理時面對大量候選體難以為繼的現(xiàn)狀.
基于機器學(xué)習(xí)的目標(biāo)檢測與分類識別在射電天文領(lǐng)域已有諸多應(yīng)用場景,如脈沖星候選體識別分類、天體光譜分類、引力透鏡識別等.這也為快速、高效地篩選FRB事件提供了思路.針對FRB瞬態(tài)電波脈沖事件,Wagstaff等[8]、Farah等[9]、Foster等[10]和Michilli等[11]基于傳統(tǒng)的機器學(xué)習(xí)方法實現(xiàn)了FRB候選體的識別分類.近些年,由于計算機技術(shù)的發(fā)展,特別是GPU(Graphics Processing Unit)技術(shù)的發(fā)展,使得深度學(xué)習(xí)在所有數(shù)據(jù)科學(xué)領(lǐng)域的信號分類、模式識別等方面取得了卓越的成績.深度學(xué)習(xí)相較于傳統(tǒng)的機器學(xué)習(xí)方法,它不需要有經(jīng)驗的專家花大量時間提取特征,避免了人工設(shè)計、選取特征造成的不完備性,且深度學(xué)習(xí)對于大數(shù)據(jù)集的學(xué)習(xí)能力已經(jīng)遠遠超過了傳統(tǒng)的機器學(xué)習(xí).Connor等[12]、Zhang等[13]和Agarwal等[14]基于深度學(xué)習(xí)技術(shù)實現(xiàn)了FRB事件的高精度、快速搜尋與識別,為FRB電壓數(shù)據(jù)轉(zhuǎn)儲和多波段跟蹤觀測提供了條件.Connor等[12]基于簡單的兩維卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)、1維CNN和 前 饋 神 經(jīng) 網(wǎng) 絡(luò)(Feedforward Neural Network,F(xiàn)NN)建立了四輸入的網(wǎng)絡(luò)模型,對FRB候選體的消色散動態(tài)譜圖和色散度量(Dispersion Measure,DM)-時間圖,時序輪廓圖以及多波束探測信噪比信息分別提取特征,然后合并特征層,最后再進行識別.Agarwal等[14]基于VGG(Visual Geometry Group)16、VGG19、Densenet(Dense Convolutional Network)121/169/201等經(jīng)典的CNN復(fù)雜網(wǎng)絡(luò)模型,組合建立了11個二輸入(消色散動態(tài)譜和DM-時間強度數(shù)據(jù))的二分類網(wǎng)絡(luò)模型架構(gòu),分別對其進行了訓(xùn)練與測試.Zhang等[13]則將深度學(xué)習(xí)分類器直接應(yīng)用于色散動態(tài)譜數(shù)據(jù)中進行FRB事件搜尋.
本 文綜合Connor等[12]和Agarwal等[14]的 研究結(jié)果,結(jié)合新疆天文臺(Xinjiang Astronomical Observatory,XAO)南山26 m射電望遠鏡XFB(XAO Filter Bank)觀測終端產(chǎn)生的FRB搜尋觀測數(shù)據(jù),基于深度學(xué)習(xí)模型開發(fā)了FRB候選體的自動分類處理算法.該方法能夠節(jié)省人工篩選時間成本,提高FRB候選體的處理速度和效率.在后續(xù)章節(jié)中,將詳細介紹樣本庫的建立、網(wǎng)絡(luò)模型的架構(gòu)設(shè)計、訓(xùn)練和測試及分類器性能的驗證與分析等實驗過程.
目前,已檢測到的FRB信號數(shù)量不足以為深度學(xué)習(xí)模型提供足夠的訓(xùn)練樣本.因此,也還沒有現(xiàn)成的公共訓(xùn)練集可用.來自銀河系脈沖星的單脈沖信號與FRB信號相似,但是直接采用脈沖星的單脈沖作為主要的訓(xùn)練集,可能會導(dǎo)致訓(xùn)練模型對脈沖星特性的過擬合[12].本文參考Connor等[12]的仿真方法,用高斯函數(shù)與散射輪廓卷積來生成FRB信號在每個頻率通道上的脈沖輪廓,然后,注入到僅含有噪聲和干擾的經(jīng)過隨機DM值消色散后的天文觀測數(shù)據(jù)中,生成大量的消色散FRB仿真樣本,DM在100-2000之間隨機取值.天文觀測數(shù)據(jù)是從filterbank或者FITS(Flexible Image Transport System)格式數(shù)據(jù)包中隨機抽取.最終,選取其中信噪比大于8的FRB仿真樣本組成正樣本集.FRB仿真樣本生成過程如圖1所示.負樣本集是由大量的真實觀測數(shù)據(jù)通過HEIMDALL軟件進行單脈沖搜尋處理后,在生成的候選體中提取其中信噪比大于8的干擾數(shù)據(jù)組成.
圖1 FRB仿真樣本生成過程Fig.1 Schematic diagram of simulated FRBs generation process
本文選擇消色散動態(tài)譜數(shù)據(jù)和DM-時間強度數(shù)據(jù)來訓(xùn)練和測試網(wǎng)絡(luò)模型.動態(tài)譜圖信息最為豐富,可以展現(xiàn)FRB事件的頻率結(jié)構(gòu)信息.DM-時間強度圖類似于蝴蝶結(jié)的形狀,辨識度也比較高.通常它是通過對動態(tài)譜數(shù)據(jù)進行不同DM值的消色散處理之后,沿頻率軸求和(或平均)生成的,DM在0-2 dm之間連續(xù)等間隔取值(dm為候選體的色散量).即DM軸對應(yīng)的是動態(tài)譜數(shù)據(jù)經(jīng)指定DM值消色散處理后,沿頻率軸求和(或平均)的時間數(shù)據(jù)流.本文沒有選擇1維的時序輪廓數(shù)據(jù)作為網(wǎng)絡(luò)輸入的原因是它在形態(tài)上與較強的瞬態(tài)干擾區(qū)分度不高.另外,Connor等[12]提到的多波束信噪比信息對于我們的望遠鏡觀測系統(tǒng)也是不適用的.
圖2是兩例FRB仿真樣本(a)和兩例負樣本(b)的示意圖.每幅圖從上到下依次是時序輪廓圖,消色散動態(tài)譜圖,DM-時間強度圖.圖2中的圖(c)是為了更好地展示仿真的FRB形態(tài),將仿真FRB疊加到高斯噪聲上生成的樣本.
圖2 續(xù)Fig.2 Continued
圖2 仿真的FRB樣本和來自真實觀測數(shù)據(jù)的負樣本.(a)仿真的FRB樣本,(b)干擾樣本(負樣本),(c)仿真FRB疊加到高斯噪聲上生成的樣本.Fig.2 Examples of simulated FRBs and negative samples from real observation data.(a)The examples of simulated FRBs on observations,(b)RFI samples(negative samples),(c)the examples of simulated FRBs on Gaussian noise.
本文所用數(shù)據(jù)為新疆天文臺南山基地26 m射電望遠鏡觀測數(shù)據(jù),接收機和終端分別為L波段接收機和XFB數(shù)字終端.XFB數(shù)字終端的頻率帶寬是512 MHz,頻率分辨率可設(shè)置為0.5 MHz和1 MHz,時間分辨率為64μs.由于L波段接收機工作帶寬為320 MHz(1400-1720 MHz),因此,在預(yù)處理過程中,會對超出接收機工作帶寬的數(shù)據(jù)進行刪除.對于頻率分辨率和時間分辨率,我們的卷積神經(jīng)網(wǎng)絡(luò)模型是不敏感的,可以通過在預(yù)處理過程中進行降采樣處理,達到調(diào)整數(shù)據(jù)尺寸的目的.
本文驗證用的候選體樣本是采用HEIMDALL軟件對觀測數(shù)據(jù)進行搜尋處理后生成的,其處理流程見圖3.FRB觀測數(shù)據(jù)經(jīng)HEIMDALL搜尋處理之后,會生成1個FRB單脈沖候選體的文檔.該文檔對每個候選體都提供了信噪比、樣本位置、DM等信息.通過該文檔信息,從原始觀測數(shù)據(jù)中提取候選體的動態(tài)譜數(shù)據(jù),并對動態(tài)譜數(shù)據(jù)進行消色散處理以及DM變換,分別生成消色散動態(tài)譜數(shù)組和DM-時間強度數(shù)組.最后,將其輸入到訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)分類器中進行識別分類.
圖3 FRB候選體處理流程Fig.3 The processing flow chart of FRB candidates
無論是前期網(wǎng)絡(luò)模型訓(xùn)練、測試所需的樣本,還是后期驗證所需的候選體樣本,在其輸入網(wǎng)絡(luò)之前都需要進行預(yù)處理.首先對樣本數(shù)據(jù)進行統(tǒng)一的z-score標(biāo)準(zhǔn)化處理,以消除奇異樣本數(shù)據(jù)可能會對模型訓(xùn)練導(dǎo)致的不良影響.z-score,也叫標(biāo)準(zhǔn)分數(shù)(standard score),是樣本與平均數(shù)的差再除以標(biāo)準(zhǔn)差的過程.z-score標(biāo)準(zhǔn)化處理計算如下:
其中,x為樣本數(shù)據(jù),μ為樣本數(shù)據(jù)的均值,σ為樣本數(shù)據(jù)的標(biāo)準(zhǔn)差,即
其中,N為樣本總的數(shù)據(jù)量,i為數(shù)值的序號.經(jīng)zscore標(biāo)準(zhǔn)化處理后的樣本符合標(biāo)準(zhǔn)正態(tài)分布,即均值為0,標(biāo)準(zhǔn)差為1.然后再對每個樣本進行降采樣和邊緣修剪,調(diào)整消色散動態(tài)譜數(shù)組大小為160×125和DM-時間強度數(shù)組大小為50×125.這樣的尺寸大小既保證了信號質(zhì)量,同時又可以降低網(wǎng)絡(luò)模型運算的復(fù)雜度.
卷積神經(jīng)網(wǎng)絡(luò)是1類包含卷積計算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),是深度學(xué)習(xí)的代表算法之一.由于其在圖像識別方面的出色表現(xiàn),目前已被廣泛應(yīng)用到眾多領(lǐng)域中.目前常見的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)有AlexNet(以第1作者Alex命名)[15]、ZFNet(以兩位作者Zeiler和Fergus的名字首字母命名)[16]、VGGNet[17]、Inception系 列[18-21]、殘 差神經(jīng)網(wǎng)絡(luò)(ResNet,由算法Residual命名)[22]等,這些模型都取得了不錯的成績.LeNet(以作者LeCun命名)[23](或稱LeNet-5)是最早的卷積神經(jīng)網(wǎng)絡(luò)之一,利用卷積、參數(shù)共享、池化等操作提取特征,避免了大量的計算成本,最后再使用全連接神經(jīng)網(wǎng)絡(luò)進行分類識別.該網(wǎng)絡(luò)雖小,但是它包含了深度學(xué)習(xí)的基本模塊:卷積層、池化層以及全連接層,是卷積神經(jīng)網(wǎng)絡(luò)最基礎(chǔ)的模型.對于深度神經(jīng)網(wǎng)絡(luò)而言,增加網(wǎng)絡(luò)層數(shù)可以提升網(wǎng)絡(luò)提取復(fù)雜特征的能力,但是隨著網(wǎng)絡(luò)深度的增加,網(wǎng)絡(luò)會出現(xiàn)梯度消失或者爆炸問題.ResNet是在2015年被提出的,可以稱作是里程碑式的創(chuàng)新.其引入了殘差模塊結(jié)構(gòu)(residual block)和殘差模塊的快捷連接(shortcut connections)解決了其他網(wǎng)絡(luò)模型的訓(xùn)練精度隨著網(wǎng)絡(luò)深度增加而退化的問題.目前基于該模型已經(jīng)提出了許多功能與結(jié)構(gòu)的改進,發(fā)展出了許多變體.2016年,He等[24]修改了ResNet的殘差模塊結(jié)構(gòu).將批量標(biāo)準(zhǔn)化(Batch Normalization,BN)和修正線性單元(Rectified Linear Uints,ReLU)移到了Conv(convolution的縮寫)層的前面,即用BNReLU-Conv替代了傳統(tǒng)的Conv-BN-ReLU結(jié)構(gòu),起到了穩(wěn)定網(wǎng)絡(luò)收斂和防止過擬合的作用,改進后的ResNet被稱為ResNet-V2.此外,更多的網(wǎng)絡(luò)結(jié)構(gòu)還有如寬殘差神經(jīng)網(wǎng)絡(luò)[25](Wide Residual Network,WRN)通過增加寬度提升網(wǎng)絡(luò)性能以及DenseNet[26]通過更密集的連接實現(xiàn)特征重用來提高網(wǎng)絡(luò)性能等.
本文需要建立的是二輸入的二分類網(wǎng)絡(luò)架構(gòu).兩路分支網(wǎng)絡(luò)分別對消色散動態(tài)譜數(shù)據(jù)和DM-時間強度數(shù)據(jù)提取特征,然后合并特征層.在后續(xù)的實驗中也證明,針對本文的應(yīng)用,二輸入模型比單獨使用1個輸入的效果要好.類比于人類大腦,當(dāng)增加1個實物的多種形態(tài)展示時,會提高大腦對該實物正確判斷的概率.
相較于常見的人臉、動植物識別等應(yīng)用場景,F(xiàn)RB的圖像信息相對簡單.雖然增加卷積神經(jīng)網(wǎng)絡(luò)的層數(shù)可以提高模型的性能,但是也增加了模型的復(fù)雜度和訓(xùn)練難度,另外,層數(shù)的增加對模型性能的貢獻也可能會達到飽和.因此,相較于Agarwal等[14]應(yīng)用的復(fù)雜網(wǎng)絡(luò)模型,本文基于相對簡單的18層的ResNet-V2網(wǎng)絡(luò)結(jié)構(gòu)和7層的LeNet網(wǎng)絡(luò)結(jié)構(gòu)建立模型,分別用于完成對消色散動態(tài)譜數(shù)據(jù)和DM-時間強度數(shù)據(jù)的特征提取.在本文實驗過程中,起初嘗試訓(xùn)練ResNet18網(wǎng)絡(luò)模型識別DM-時間強度數(shù)據(jù),其效果并不好,網(wǎng)絡(luò)呈現(xiàn)嚴重過擬合特點,因此,改用更簡單的LeNet網(wǎng)絡(luò).LeNet由1個輸入層、兩個卷積層、兩個池化層和3個全連接層組成,結(jié)構(gòu)雖簡單卻達到了我們想要的效果.ResNet18是由單獨1個卷積層、8個殘差塊和1個全連接層構(gòu)成.ResNet18包含兩種殘差塊結(jié)構(gòu),分別為恒等塊和卷積塊,主要區(qū)別在于快捷連接是否含有卷積模塊.當(dāng)快捷連接的兩組數(shù)據(jù)通道數(shù)不一致時,需要通過卷積塊進行通道數(shù)調(diào)整.
基于ResNet18和LeNet的網(wǎng)絡(luò)模型分別完成消色散動態(tài)譜數(shù)據(jù)和DM-時間強度數(shù)據(jù)的特征提取之后,連接特征層,再增加1個分類層,最后網(wǎng)絡(luò)輸出分類結(jié)果.本文采用基于TensorFlow為后端引擎的Keras快速建立網(wǎng)絡(luò)模型.TensorFlow是端到端的開源機器學(xué)習(xí)平臺,由Tensor和Flow兩個英文單詞構(gòu)成.Keras是用Python編寫的開源人工網(wǎng)絡(luò)庫,命名來自古希臘語,意為將夢境化為顯示的“牛角之門”.模型架構(gòu)如圖4所示,全連接層Dense后面括號內(nèi)為選擇的激活函數(shù).
圖4 設(shè)計的二輸入深度神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)示意圖Fig.4 The schematic diagram of our two-input deep convolutional neural network model
本文研究的是針對FRB-RFI的二分類問題.基于混淆矩陣方法,采用準(zhǔn)確率(Accuracy)、召回率(Recall)、精確率(Precision)來評估模型性能.但是召回率和精確度是1對矛盾的度量,在兩個指標(biāo)不能兼得的情況下,還可以選用F1值(F-Score)指標(biāo)來確定平衡點.針對網(wǎng)絡(luò)模型的測試結(jié)果,TP(True Positive)代表正樣本被正確分類的數(shù)量,TN(True Negative)代表負樣本被正確分類的數(shù)量,F(xiàn)N(False Negative)代表被錯分的負樣本數(shù)量,F(xiàn)P(False Positive)代表被錯分的正樣本數(shù)量.Accuracy反映了模型正確分類樣本的能力,其計算公式如下:
本文的研究目標(biāo)傾向于盡可能少地錯過FRB事件,Recall反映了模型識別正樣本的能力,其計算公式:
另外,在分類結(jié)果中應(yīng)盡量少地出現(xiàn)假陽性候選體,從而降低實時電壓數(shù)據(jù)轉(zhuǎn)儲的壓力和后續(xù)人工審查的工作量,對應(yīng)的評價指標(biāo)是Precision,其計算公式:
F1是對召回率和精確率的調(diào)和平均值,當(dāng)召回率和精確率平衡的時候,F(xiàn)1值取得較高值,取值范圍為[0,1],其計算公式:
為了提高網(wǎng)絡(luò)訓(xùn)練效率和性能,在反復(fù)的訓(xùn)練實驗中,采取了多種措施改進網(wǎng)絡(luò).Dropout層可以提升神經(jīng)網(wǎng)絡(luò)對未知數(shù)據(jù)處理的魯棒性,盡管拋棄了部分神經(jīng)元,網(wǎng)絡(luò)也依然可以朝目標(biāo)進行訓(xùn)練.本文在LeNet的兩個池化層和第2個全連接層后增加了Dropout層,用于預(yù)防網(wǎng)絡(luò)過擬合.BN的使用可以避免因隱含層數(shù)據(jù)分布不均,導(dǎo)致梯度消失或不起作用的情況發(fā)生,進一步提高模型訓(xùn)練過程的穩(wěn)定性,還可以加速模型收斂,減少訓(xùn)練時間.除了ResNet18網(wǎng)絡(luò)模型本身包含的BN處理外,在Flatten層后又增加了BN的使用.訓(xùn)練過程采用簡單交叉驗證方法,將訓(xùn)練集與驗證集的樣本比例設(shè)置為8:2.經(jīng)過多次訓(xùn)練與調(diào)試,選定隨機梯度下降(Stochastic Gradient Descent,SGD)和自適應(yīng)學(xué)習(xí)率(Adaptive Moment Estimation,Adam)分別作為ResNet18和LeNet的優(yōu)化器來優(yōu)化模型,表1顯示了本文最終設(shè)置的網(wǎng)絡(luò)訓(xùn)練參數(shù).另外,為了測試網(wǎng)絡(luò)模型性能,在實驗過程中,應(yīng)用ResNet18和LeNet的網(wǎng)絡(luò)模型分別對消色散動態(tài)譜數(shù)據(jù)和DM-時間強度數(shù)據(jù)進行了訓(xùn)練與測試.其網(wǎng)絡(luò)模型訓(xùn)練參數(shù)與測試準(zhǔn)確率也一并在表1中展示.通過對比,我們發(fā)現(xiàn)二輸入網(wǎng)絡(luò)模型的準(zhǔn)確率是最高的.
表1 網(wǎng)絡(luò)模型的訓(xùn)練參數(shù)配置Table 1 Training parameter configuration of network model
本文的訓(xùn)練和測試任務(wù)是基于1個GPU卡完成的,其型號是NVIDIA GTX 1080.基于ResNet18網(wǎng)絡(luò)模型的消色散動態(tài)譜數(shù)據(jù)訓(xùn)練耗時約25 min,基于LeNet網(wǎng)絡(luò)模型的DM-時間強度數(shù)據(jù)訓(xùn)練耗時約幾十秒.本文采用的二輸入合并網(wǎng)絡(luò)模型在30 min之內(nèi)即可以完成訓(xùn)練過程.訓(xùn)練好的分類器完成單個樣本檢測的時間約為4 ms,運行速度非??欤@為后續(xù)實現(xiàn)電壓數(shù)據(jù)轉(zhuǎn)儲提供了速度上的優(yōu)勢.
本文基于2019年6月2日的觀測數(shù)據(jù),建立了2.08萬個樣本,其中正樣本和負樣本的比例是1:1.訓(xùn)練集與測試集的比例是8:2.通常情況下,網(wǎng)絡(luò)模型在經(jīng)過6次以上的迭代訓(xùn)練之后,即能達到較高的性能,且訓(xùn)練誤差和驗證誤差都能夠收斂,兩者之間相差很小.如圖5顯示了某次模型訓(xùn)練過程中準(zhǔn)確率變化情況(acc)和損失函數(shù)變化情況(loss).
圖5 訓(xùn)練過程中的準(zhǔn)確率變化曲線(左)和損失函數(shù)變化曲線(右)Fig.5 Accuracy(left)and loss(right)change curves with epoch of training process
在置信閾值設(shè)置為0.9時測試結(jié)果的混淆矩陣如表2所示.計算準(zhǔn)確率為99.7%,召回率為99.8%,精確率為99.6%.召回率和精確率均達到了較高值,F(xiàn)1值約為0.997.
表2 具有仿真FRB樣本的測試集的混淆矩陣Table 2 Confusion matrix for test set with simulated FRBs
由于選用的FRB訓(xùn)練樣本由仿真生成,本文選取了新疆天文臺南山26 m射電望遠鏡于2019年1月24日觀測的脈沖星PSR J0332+5434的單脈沖共計300個,對網(wǎng)絡(luò)模型進行測試驗證.圖6為提取的兩個PSR J0332+5434的單脈沖樣本示意圖,每幅圖從上到下依次是色散動態(tài)譜圖、消色散動態(tài)譜圖和DM-時間強度圖.利用§2.2的方法,從歷史觀測數(shù)據(jù)中提取了230個負樣本,與300個來自PSR J0332+5434的單脈沖組成驗證集,輸入§4.2中所述訓(xùn)練好的網(wǎng)絡(luò)模型中進行識別分類,置信閾值設(shè)置為0.9時的分類結(jié)果混淆矩陣如表3所示.該模型針對脈沖星單脈沖的識別準(zhǔn)確率為94.9%、召回率為99.6%、精確率為92.0%.模型能夠?qū)缀跛械拿}沖星單脈沖進行正確識別和分類,模型的召回率完全達到了我們的預(yù)期.
表3 具有脈沖星單脈沖的驗證集的混淆矩陣Table 3 Confusion matrix for validation set with pulses from pulsar
圖6 來自脈沖星PSR J0332+5434的單脈沖Fig.6 Single pulses from PSR J0332+5434
分類結(jié)果顯示,分類錯誤的發(fā)生主要是將部分RFI誤判為FRB.為了分析模型錯判的原因,對錯分樣本單獨進行了分析.發(fā)現(xiàn)在此次驗證實驗中選用的RFI樣本較之前訓(xùn)練時所用的樣本增加了許多變化情況.本次驗證實驗的RFI樣本是從2020年5月4日的觀測數(shù)據(jù)中提取的,而訓(xùn)練樣本選用的是2019年6月2日的觀測數(shù)據(jù).當(dāng)我們將RFI樣本重新從2019年6月的觀測數(shù)據(jù)中提取,再次進行驗證實驗時,分類網(wǎng)絡(luò)對RFI的召回率達到了98%以上.
本文基于卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn)了對FRB候選體的識別與分類.網(wǎng)絡(luò)模型的性能也達到了實驗期望效果.目前的實驗中,本文對于樣本中的RFI并沒有采取任何處理,完全依賴卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和學(xué)習(xí),提高網(wǎng)絡(luò)模型區(qū)分RFI和FRB的能力.在實驗中,我們也發(fā)現(xiàn)訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)分類器的性能對于臺址內(nèi)外RFI環(huán)境或者觀測系統(tǒng)改變引起的觀測數(shù)據(jù)中的RFI變化非常敏感.然而,干擾種類繁多、來源復(fù)雜、特征呈多樣性,單純使用簡單粗暴的刪除方法并不能取得明顯的效果.因此,考慮針對訓(xùn)練樣本中占少數(shù)的RFI類型或者新出現(xiàn)的RFI類型,對訓(xùn)練樣本做進一步的類別平衡處理,可以改善網(wǎng)絡(luò)模型識別RFI的能力.后續(xù),將圍繞觀測數(shù)據(jù)中的RFI問題開展研究工作,以期進一步提高分類器的泛化能力和魯棒性.
致謝 感謝審稿人對文章提出的寶貴建議,使得文章內(nèi)容更加嚴謹和充實.感謝新疆天文臺南山基地26 m射電望遠鏡為本文的研究與實驗提供了觀測數(shù)據(jù).