国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

天文瞬變源快速自動識別系統(tǒng)的研究與實現(xiàn)

2018-01-08 03:00吳潮馬冬田???/span>李鄉(xiāng)儒魏建彥
自動化學報 2017年12期
關(guān)鍵詞:參量光度輪廓

吳潮 馬冬, 田???李鄉(xiāng)儒 魏建彥

天文瞬變源快速自動識別系統(tǒng)的研究與實現(xiàn)

吳潮1馬冬1,2田???李鄉(xiāng)儒3魏建彥1

大視場和高時間采樣率是現(xiàn)代天文光學瞬變源巡天項目的兩個主要發(fā)展方向,相對傳統(tǒng)的巡天項目將會產(chǎn)生更大的數(shù)據(jù)量和要求更快的瞬變源識別處理速度.為滿足新技術(shù)下的瞬變源識別處理要求,本文提出用基于等光度測量星像輪廓等13個新的特征參量取代原有的輪廓擬合參量;使用實際星像輪廓仿真和構(gòu)建較真實的訓練樣本算法;加入基于實測數(shù)據(jù)分析的噪聲過濾判據(jù)等方法.實現(xiàn)了基于隨機林森算法的天文光學瞬變源自動快速識別系統(tǒng).通過仿真和實測數(shù)據(jù)的測試表明:本識別系統(tǒng)較國際主流的同類識別算法提速約10倍,樣本識別的總體正確檢出率和錯誤檢出率都基本相同,而在低信噪比處,本文的識別算法有較良好的表現(xiàn).本識別系統(tǒng)已成功應用于我國的迷你地基廣角相機陣(地基廣角相機陣的先導項目),同時,本系統(tǒng)對于其他天文光學瞬變源巡天項目也有著重要的應用價值.

機器學習,隨機森林,瞬變源自動搜尋,星像輪廓,等光度測光

瞬變源是一種偶發(fā)的短暫的非周期性的天文現(xiàn)象.從觀測上,其持續(xù)時標從數(shù)秒到數(shù)周甚至數(shù)年.目前已知的主要瞬變源為:超新星1、伽瑪暴2、微引力透鏡3、恒星被大質(zhì)量黑洞所瓦解的潮汐瓦解事件4以及引力波的電磁對應體5等.瞬變源對于研究宇宙的起源和極端環(huán)境下的物理現(xiàn)象有著重要意義.宇宙加速膨脹現(xiàn)象的發(fā)現(xiàn)[1?3]正是通過對大樣本瞬變源超新星的觀測研究發(fā)現(xiàn)的.超新星、伽瑪暴等瞬變源爆發(fā)時輻射的能量超過整個星系的光度,這種極高能量的短時大爆發(fā)為研究極端物理環(huán)境下的物理現(xiàn)象提供了難得的觀測條件.

由于瞬變源是偶發(fā)天文事件,要求瞬變源搜索的觀測設備具有大視場(即單位時間內(nèi)能觀測到更大的天區(qū))和高時間采樣率(即對同一天區(qū)的高回訪觀測頻率)的特點.我國建設中的瞬變源搜索設備地基廣角相機陣(Ground wide angle camera,GWAC),由36臺直徑為18cm的廣角相機組成,每個廣角相機配有4k×4k的CCD探測器,整個相機陣的視場達到5000平方度.每15秒產(chǎn)生一幅觀測圖像(10秒曝光+5秒讀出數(shù)據(jù)),即15秒會對原視場作一次回訪.該設備對于未知短時標瞬變源的搜索具有重要的意義,同時也對傳統(tǒng)的瞬變源搜索技術(shù)提出了巨大挑戰(zhàn).相對于國際主流的瞬變源搜索設備,地基廣角相機陣設備在視場和采樣頻率上都將提高1~2個數(shù)量級.

經(jīng)典的瞬變源搜索過程如圖1所示.主要原理是通過將觀測圖像(圖1(a))與模板圖像(圖1(b))進行相減,如果是一個瞬變源(即新出現(xiàn)的源),那么在減完后的殘差圖像(圖1(c))中就是一個類似完整點源的像(如圖1(c)中的o1和o2),而其他殘缺的像斑則為相減過程中產(chǎn)生的噪聲(如圖1(c)中的n1,n2,n3).如何將殘差圖像中的瞬變源從周圍的噪聲中自動快速地識別出來是本文要解決的關(guān)鍵問題.傳統(tǒng)的識別方法是人眼識別,由天文學家對所有觀測圖像進行逐幅識別.這種方法雖然正確率高,但是效率非常低,對于現(xiàn)代的大數(shù)據(jù)瞬變源巡天的處理是無法適用的.

隨著數(shù)據(jù)處理技術(shù)的發(fā)展,不同國家的天文學家曾嘗試開展利用機器學習的自動分類方法進行瞬變源自動分類的研究.最早的開創(chuàng)性工作是2007年Bailey等[4]將監(jiān)督式機器學習分類技術(shù)實驗性地應用于超新星工廠(The nearby supernova factory,SNFactory)巡天項目;2012年,Brink等[5]在Bailey等[4]的算法基礎上,開發(fā)了基于高精隨機森林架構(gòu)下的分類器來識別帕洛馬(Palomar transient factory,PTF)巡天項目的瞬變源;2013年,Brink等[5]利用遞歸方法對Bloom 等[6]使用的特征參量進行了優(yōu)化,提高了分類性能.2014年,Buisson等[7]基于由主成分分析法得到的特征參量對隨機森林、K-近鄰、支持向量機、神經(jīng)網(wǎng)絡、貝葉斯等多種算法進行綜合比較,結(jié)果表明隨機森林算法在瞬變源識別中具有最好性能.最新工作是2015年Goldstein等[8]在文獻[5?6]的基礎上進行特征參量的添加和優(yōu)化,最后選取38個特征參量來進行訓練分類器,基于隨機森林算法,使得分類的正確率和處理效率較前面文獻中的工作都有了較大的提高[8].

本文以文獻[8]的算法為基礎,結(jié)合地基廣角相機陣的數(shù)據(jù)特點,提出基于等光度測量星像輪廓等新的特征參量,使用實際星像輪廓仿真和構(gòu)建較真實的訓練樣本算法;加入基于實測數(shù)據(jù)分析的噪聲過濾判據(jù)等方法,實現(xiàn)一個優(yōu)化的瞬變源快速自動識別系統(tǒng).

本文的組織結(jié)構(gòu)如下:第1節(jié)闡述瞬變源識別系統(tǒng)的特征參量及其提取,著重描述了基于等光度測量星像輪廓的特征參量;第2節(jié)描述訓練樣本的構(gòu)建過程;第3節(jié)和第4節(jié)闡述本識別系統(tǒng)的實現(xiàn)過程和具體的測試與驗證;第5節(jié)對本文提出的識別系統(tǒng)進行討論與總結(jié).

1 瞬變源特征參量的研究

瞬變源的自動識別就是將瞬變源從殘差圖像提取的點源樣本中識別出來.殘差圖像中的識別樣本主要分為真實點源(瞬變源候選體)和噪聲源兩類.其實例的效果如圖1(c)中o1,o2和n1,n2,n3所示.從理論上分析,殘差圖像中的真實點源應具有類似于觀測圖像中點源的能量分布輪廓,即星像的能量從中心到邊緣應具有儀器自身特點的點擴散函數(shù)分布(一般為類似于高斯函數(shù)分布);而殘差圖像中的噪聲則主要來自于個別像元的隨機噪聲、位置及輪廓匹配中的差異引起的殘差像斑、飽和星留下的殘差等.雖然噪聲源的類型多種多樣,但都不具有真實點源所具有的能量分布和形狀等主要特點,因此點源的能量分布及形狀相關(guān)的特征參量是進行自動分類的基本特征參量.如何提取特征參量來表達星像輪廓的特征直接會影響到分類模型的最后識別結(jié)果和數(shù)據(jù)處理速度.

圖1 圖像相減法處理示例Fig.1 An example of diあerence image procedure

分析文獻[8]中的38個特征參量,保留其中與星像輪廓相關(guān)的以及具有高權(quán)重值的18個特征參量.去除如星系相關(guān)星等、CCD編號等與GWAC項目及其科學目標無關(guān)的參量.同時,為了提高處理速度,取消部分耗時過長和權(quán)重較低的特征參量.保留的18個特征參量根據(jù)是否與星像輪廓相關(guān)分成兩組參量,即第II和第III組(詳見表1).第II組特征參量的計算需要對圖像進行預處理.第III組的參量主要是利用點擴散函數(shù)(PSF)擬合方法來確定星像的輪廓.本文新引入13個特征參量記為第I組參量,主要是基于等光度方法測定星像輪廓參量,取代原算法中的第III組參量來獲得更好的性能優(yōu)化.

1.1 殘差圖像的預處理

我們的實測數(shù)據(jù)6對比測試實驗結(jié)果表明:對于地基廣角相機陣做圖像的預處理[5,8],同樣能提高系統(tǒng)的識別正確率,但預處理過程的基本參數(shù)選取與文獻[8]不同,具體處理過程如下:

表1 特征參量Table 1 Feature sets

1)以殘差圖像中找到的星像目標為中心,截取出(2k+1)像素×(2k+1)像素的窗口圖像.我們的實測對比試驗結(jié)果表明:對于GWAC圖像采用k=15(即31像素×31像素)的窗口像圖最為有效.等效于星像輪廓參量半高全寬(FWHM)的大約20倍為經(jīng)驗的合理參量.其中,每個(x,y)處的像元響應量標記為Ix,y.

2)計算表1中第II組參量中涉及的矩陣R和B,計算方法即文獻[8]中的式(1)、式(4)和式(5),具體表述如下:

矩陣Cx,y即為原圖像每相鄰4個像元的壓縮.壓縮處理提高了圖像的對比度,能更容易地區(qū)分出真實像斑與噪聲的輪廓.對矩陣Cx,y做流量的歸一化處理后,即可得到矩陣R.其計算表達式為

其中,med(·)為中值計算符.

矩陣B由未經(jīng)過壓縮的原窗口圖像(GWAC采用:31像素×31像素)的直接處理得到,表示像元響應與中值的偏移量的歸一化值.計算公式為

3)表1第II組中的相關(guān)參量可根據(jù)“參量描述”列中的說明,由前面的相關(guān)矩陣公式計算得出.

1.2 特征參量的優(yōu)化提取

基于GWAC數(shù)據(jù)的特點分析,利用點擴散函數(shù)(Point spread function,PSF)擬合來描述星像輪廓主要有以下不足:1)擬合所需的計算比較耗時;2)對于擬合輪廓所用的數(shù)學模型有依賴性.GWAC的PSF輪廓主要由光學輪廓而非大氣視寧度決定,相比由大氣視寧度占主導的望遠鏡,其PSF比較復雜難以用簡單的高斯模型擬合.因此,通過引入新的基于等光度測量星像輪廓的特征參量取代原有的PSF擬合參量進行優(yōu)化(表1中第I組參量).

圖2顯示了三種不同的星像輪廓測量方法[9].等光度輪廓(ISO)的測量主要將光度水平相同處連結(jié)成一條線構(gòu)成星像的輪廓區(qū)域.第I組參量中的ISO 0~ISO 4表示5組處于不同光度水平的輪廓面積.不同光度Ii的計算公式為

其中,S表示背景漲落標準方差(σ)的5倍,Ip為像斑中最大的像元響應值.ISO 0~ISO 4的光度值計算取i=(0~4)由式(4)計算可得.ISOCOR表示將等光度計算的輪廓等效到高斯模型下的圓形輪廓.

圖2 三種不同的輪廓測量方法示例Fig.2 The pro fi le measurements by three diあerent methods

除了等光度輪廓的測量,第I組新參量中還包含其他的輪廓輔助測量參量.例如參量1~3分別表示占流量20%和10%處的孔徑大小,以及孔徑為2.5像元內(nèi)的總流量;參量9~11表示由不同測光方法得到的光度流量比值;參量12表示星等的測量誤差;參量13表示恒星與星系的分類標識,取值為0~1之間,是一個與星像橢率相關(guān)的量.

2 訓練樣本的構(gòu)建

天文瞬變源自動識別系統(tǒng)使用監(jiān)督式機器學習方法.即在大量訓練樣本類別已知的情況下,通過機器學習訓練分類器.數(shù)學表述為:o[(v1,v2,v3,···),class],o表示一個對象,vi表示對象第i個特征參量,所有特征參量一起構(gòu)成對象的特征參量空間,而class則表示對象o的類別.

天文瞬變源是相對稀有事件,實際觀測瞬變源數(shù)據(jù)難以提供足夠數(shù)量的訓練樣本集,尤其對于無歷史數(shù)據(jù)積累的剛建成的觀測設備.利用仿真的方法構(gòu)建訓練樣本是唯一可行的途徑,但如何使仿真的樣本具有較高的真實性,是要解決問題的關(guān)鍵點.像斑的輪廓是能正確分類的關(guān)鍵因素.因此在仿真重構(gòu)訓練樣本時,采用真實的星像作為星像輪廓模板,而仿真調(diào)整的參數(shù)僅僅是像斑的位置和像斑的響應流量.

主要通過兩種方法仿真瞬變源:1)從去除背景的圖像中選出一批(約400顆/幅圖)從亮到暗不等的星,作為星像輪廓模板.選取星像輪廓模板時需要保證這些星像不受周圍星的干擾,相對比較孤立.將這些星像輪廓模板按隨機位置(或有規(guī)則排列)疊加到原始觀測圖像中構(gòu)建出含有瞬變源的仿真觀測圖像.2)從去除背景的圖像中選出一顆較為孤立的星,以10倍半高全寬7的窗口從圖像中裁剪出來,作為星像輪廓模板.然后,對該模板的流量進行仿真重構(gòu).仿真重構(gòu)的流量從飽和星等開始一直到極限星等附近(最暗星仿真到2.5σ).最后按照隨機方式(或者有規(guī)則排列)將這些仿真的星撒回到實際觀測的圖像中構(gòu)建出含有瞬變源的仿真圖像.

以上兩種方法仿真瞬變源的整個過程如圖3所示,得到的仿真觀測圖像與實測的模板圖像相減得到殘差圖像,然后通過特征參量的提取得到前述的v1,v2,v3,···,vi,而class可由仿真瞬變源注入時的位置信息,利用位置搜索得到相應的瞬變源分類信息.最后加入肉眼識別去除因飽和星帶來的干擾.考慮飽星和變星等干擾因素后,我們的樣本污染程度<5%,而根據(jù)以前的研究[6],樣本的受污染程度<10%都是可靠的.

以上兩種方法各有優(yōu)點.方法1能夠仿真構(gòu)建出多種真實輪廓,因為一幅圖像在不同位置星像輪廓會有一些細小的差異.方法2能根據(jù)需要仿真出任何不同亮度的目標,便于對探測極限附近星像的仿真和探測能力評估.兩種方法相輔相成,共同完成訓練樣本的有效構(gòu)建.

3 系統(tǒng)的實現(xiàn)

天文瞬變源候選體搜索的數(shù)據(jù)處理流程如圖4所示.主要包括如下過程:1)圖像相減過程,即在完成觀測圖像與模板圖的輪廓與流量匹配后進行相減獲取殘差圖像;2)對殘差圖像完成點源提取;3)點源提取的星表和殘差圖像輸入到自動識別系統(tǒng)(虛線框部分).自動識別系統(tǒng)主要完成圖像預處理與特征參量提取、數(shù)值過濾器、自動分類器.4)輸出自動識別出的瞬變源候選體.

圖4 瞬變源候選體的搜索流程圖Fig.4 The fl owchart of transient candidates search

本識別系統(tǒng)的工程化實現(xiàn)主要基于python(2.7)和機器學習處理包python-sklearn以及其他相關(guān)的天文數(shù)據(jù)處理包py fi ts等.除前述算法外,還加入一個數(shù)值過濾器處理模塊,主要實現(xiàn)對亮星相減后殘差噪聲的定向去除.判據(jù)的物理意義是相減后的殘差圖像像斑的相應孔徑內(nèi)存在若干個光度小于(接近)零或者大大小于背景噪聲水平的像元,則認為是噪聲而非真實瞬變源.判斷標準主要通過對實測數(shù)據(jù)的處理分析總結(jié)得出,數(shù)學描述如下:其中,Flux15x,y和Flux8x,y分別表示以像斑中心為中心分別截取的15×15和8×8像元大小的窗口圖像.len(·)表示統(tǒng)計滿足條件像元數(shù)目算符,med(·)為中值計算算符,σ為窗口圖像背景的標準方差.式(5)中的4個判據(jù)條件只要滿足其一即被證偽,從瞬變源候選體中排除出去.

圖3 仿真瞬變源樣本構(gòu)建過程Fig.3 The fl owchart of transients simulation

Buisson等[7]的系統(tǒng)性對比測試表明針對瞬變源識別的數(shù)據(jù)和處理特點,隨機森林(Random forest,RF)[10?12]算法具有較優(yōu)秀的表現(xiàn).隨機森林是利用多棵決策樹對樣本進行訓練和預測的一種分類器.在預測某一個測試樣本類別時,由隨機森林中的所有樹共同投票決定,樣本的類別取決于投票數(shù)多少.該算法具有訓練速度快、容易實現(xiàn)并行化,能夠快速處理高維數(shù)據(jù)、可以處理離散型變量(分類)和連續(xù)型變量(回歸)、分類器訓練完成后能夠給出特征參量的重要性信息、預測時能夠給出測試集中每個實例屬于不同類別的概率等優(yōu)點.因此,采用隨機森林算法實現(xiàn)樣本的訓練與分類.主要的設置參數(shù)取值如表2所示.

表2 隨機森林主要參數(shù)Table 2 The main parameters of random forest

4 自動識別系統(tǒng)的測試與驗證

為了測試與驗證本系統(tǒng)的識別正確率及在處理速度上的表現(xiàn)能力,主要通過兩種途徑:1)在Mini-GWAC的實測數(shù)據(jù)中加入仿真瞬變源的方法.2)Mini-GWAC在實際觀測中的性能表現(xiàn).

測試途徑 1.采用1200幅與訓練樣本不同的分別來自不同觀測夜的數(shù)據(jù).在每一幅實測的觀測圖像中注入大約400顆不同亮度的仿真瞬變源,仿真瞬變源通過實際星像輪廓模板的仿真方法得出.然后按照圖4的流程執(zhí)行處理.為了測試數(shù)值過濾器的性能,對過濾器執(zhí)行過濾的源不做真實剔除而是僅做標識便于前后對比.對比測試主要分成3組:測試A組為本系統(tǒng),采用特征參量為I+II組;測試B組采用特征參量II+III組;測試C組僅采用特征參量第II組.測試平臺的硬件設備CPU為:Core i7 2600K,內(nèi)存15GB.軟件系統(tǒng)為Scienti fi c Linux 6.0版本.

測試的結(jié)果與分析:1)數(shù)據(jù)處理速度:A、B、C三組處理每幅圖像的平均時間為9.7s,98s,8.4s.三組數(shù)據(jù)的比較表明,A組(本系統(tǒng))較B組(文獻[8]的主要參量)提速近10倍.從總的分析來看,主要的數(shù)據(jù)處理耗時來自特征參量的提取.差異的主要原因分析:等光度輪廓測量較PSF做擬合的測量方法處理速度更快.另外,B組部分參量需要對模板圖像進行操作,從過程來說更為復雜,因而增加了數(shù)據(jù)處理時間.C組僅用一組特征參量因此耗時最短.2)篩選樣本的正確檢出率與錯誤檢出率:圖5表示A(I+II)、B(II+III)、C(II)三組方法在對不同信噪比(點源測光提取時的信噪比)瞬變源的正確檢出率.結(jié)果表明,信噪比>20的所有源都能被三組方法100%正確識別.信噪比等于=14時A和B能保持一致的10%識別正確率.隨著信噪降低,A方法相對B方法在低信噪比降低過程中,體現(xiàn)出更高的識別正確率,在信噪比為3.4時8仍有85%以上的正確識別率.錯誤檢出率(不是瞬變源當成瞬變源的數(shù)目占總檢出數(shù)目的比率):A方法為8.6%,B方法為3.6%,C方法為6.4%.A的錯檢率最高,當加入數(shù)值濾波器后,A的錯檢率會降到和B同等水平,接近3%.結(jié)果分析:PSF擬合方法對星像輪廓的描述對于低信噪比不敏感,而等光度輪廓測量不依賴擬合而是直接測量對于低信噪比部份更為敏感,同時對于是否圓形形狀不敏感,導致對部分亮星留下的殘差的錯誤識別.當加數(shù)值過濾處理后,能很好地消除這方面噪聲引起的錯誤檢出.

圖5 新特征參量的有效性Fig.5 Eあectiveness of the new features

測試途徑2.本系統(tǒng)應用于Mini-GWAC實際觀測的實時處理測試.經(jīng)過大約半年的應用測試,結(jié)果表明,能實時地完成瞬變源的自動快速識別,通過與星表交叉法找瞬變源在線處理結(jié)果交叉驗證,對比測試交叉的正確率在99%以上.交叉測試結(jié)果表明,本文的識別方法在暗弱目標及有背景亮星干擾的情況下,具有更好的篩選能力.圖6為實際觀測中,本文的快速自動識別方法發(fā)現(xiàn)的一個真實的瞬變源耀星.

圖6 一個真實的瞬變源耀星Fig.6 An example transient of fl are star

5 討論與總結(jié)

針對現(xiàn)代大數(shù)據(jù)瞬變源巡天要求快速自動搜索瞬變源的技術(shù)需求,結(jié)合我國在建中的地基廣角相機陣的數(shù)據(jù)特點,抓住星像輪廓的光度分布是自動識別的關(guān)鍵特征參量,通過優(yōu)化研究并開發(fā)了天文瞬變源自動識別系統(tǒng).

本識別系統(tǒng)主要通過引入新的13個包括等光度測量星像輪廓的特征參量取代國際主流算法(Goldstein等[8])中的PSF擬合方法測量星像輪廓的參量.同時,去除與模板相關(guān)的特征參量,降低了數(shù)據(jù)處理的復雜度,提高了數(shù)據(jù)處理速度.與Goldstein等[8]的算法相比,處理速度提高近10倍.而正確檢出率具有相同水平,尤其在低信噪比處,等光度測光星像輪廓參量比擬合法測輪廓參量更為敏感.從理論上分析也支持了這一測試結(jié)果.

基于天文瞬變源是相對稀有事件,難以獲取足夠數(shù)量的訓練樣本.利用仿真方法構(gòu)建訓練樣本集,即采用真實的星像作為星像輪廓模板,而仿真調(diào)整的參數(shù)僅是像斑的位置和像斑的響應流量,從而實現(xiàn)較真實的數(shù)據(jù)仿真.研究表明,對于由飽和星(較亮星)相減留下的部分殘差噪聲被誤識別成瞬變源,導致錯誤檢出率較文獻[8]的算法高出5%,表明等光度測量輪廓法相對于PSF擬合法對于星像輪廓是否是圓形形狀不敏感.我們通過引入數(shù)值過濾器專門對此類噪聲進行濾除,最后的錯誤檢出率能控制到與文獻[8]的相同水平.

本識別系統(tǒng)已成功應用于我國已建成的迷你地基廣角相機陣的實際數(shù)據(jù)在線處理.通過與星表交叉法找瞬變源在線處理結(jié)果的交叉驗證,表明正確率在99%以上.在正式的地基廣角相機陣(GWAC)建成以后,只需要根據(jù)GWAC數(shù)據(jù)特點重新構(gòu)建分類訓練器,便可快速實現(xiàn)系統(tǒng)的移植.因而,本系統(tǒng)對于其他類似的天文大視場,要求快速實時處理的天文瞬變源識別的項目也具有應用與參考價值.

致謝

感謝GWAC項目組天文觀測與工程維護人員在本系統(tǒng)開發(fā)測試過程中提供實測數(shù)據(jù)及在硬件設備支撐上給予的幫助.

1 Perlmutter S,Aldering G,Goldhaber G,Knop R A,Nugent P,Castro P G,Deustua S,Fabbro S,Goobar A,Groom D E.Measurements ? of Λ and from 42 high-redshift supernovae.The Astronomical Journal,1999,517(2):565?586

2 Riess A G,Filippenko A V,Challis P,Clocchiatti A,Diercks A,Garnavich P M,Gilliland R L,Hogan C J,Jha S,Kirshner R P,Leibundgut B,Phillips M M,Reiss D,Schmidt B P,Schommer R A,Smith R C,Spyromilio J,Stubbs C,SuntzeあN B,Tonry J.Observational evidence from supernovae for an accelerating universe and a cosmological constant.The Astronomical Journal,1998,116(3):1009?1038

3 Wu Chao,Zhang Tian-Meng,Wang Xiao-Feng,Qiu Yu-Lei.Supernova cosmology:observations and progress.Progress in Astronomy,2013,31(1):37?55(吳潮,張?zhí)烀?王曉峰,裘予雷.超新星宇宙學的觀測與研究進展.天文學進展,2013,31(1):37?55)

4 Bailey S,Aragon C,Romano R,Thomas R C,Weaver B A,Wong D.How to fi nd more supernovae with less work:object classi fi cation techniques for diあerence imaging.The Astronomical Journal,2007,665(2):1246?1253

5 Brink H,Richards J W,Poznanski D,Bloom J S,Rice J,Negahban S,Wainwright M.Using machine learning for discovery in synoptic survey imaging data.Monthly Notices of the Royal Astronomical Society,2013,435(2):1047?1060

6 Bloom J S,Richards J W,Nugent P E,Quimby R M,Kasliwal M M,Starr D L,Poznanski D,Ofek E O,Cenko S B,Butler N R,Kulkarni S R,Gal-Yam A,Law N.Automating discovery and classi fi cation of transients and variable stars in the synoptic survey era.Publications of the Astronomical Society of the Paci fi c,2012,124(921):1175?1196

7 Buisson du L,Sivanandam N,Bassett B A,Smith M.Machine learning classi fi cation of SDSS transient survey images.Monthly Notices of the Royal Astronomical Society,2015,454(2):2026?2038

8 Goldstein D A,D′Andrea C B,Fischer J A,Foley R J,Gupta R R,Kessler R,Kim A G,Nichol R C,Nugent P E,Papadopoulos A,Sako M,Smith M,Sullivan M,Thomas R C,Wester W,Wolf R C,Abdalla F B,Banerji M,Benoit-L′evy A,Bertin E,Brooks D,Rosell A C,Castander F J,Costa L N D,Covarrubias R,DePoy D L,Desai S,Diehl H T,Doel P,Ei fl er T F,Neto A F,Finley D A,Flaugher B,Fosalba P,Frieman J,Gerdes D,Gruen D,Gruendl R A,James D,Kuehn K,Kuropatkin N,Lahav O,Li T S,Maia M A G,Makler M,March M,Marshall J L,Martini P,Merritt K W,Miquel R,Nord B,Ogando R,Plazas A A,Romer A K,Roodman A,Sanchez E,Scarpine V,Schubnell M,Sevilla-Noarbe I,Smith R C,Soares-Santos M,Sobreira F,Suchyta E,Swanson M E C,Tarle G,Thaler J,Walker A R.Automated transient identi fi cation in the dark energy survey.The Astronomical Journal,2015,150(3):Article No.82

9 Bertin E,Arnouts S.SExtractor:software for source extraction.Astronomy and Astrophysics Supplement Series,1996,117:393?404

10 Breiman L,Forests R.Machine Learning.Netherlands:Kluwer Academic Publishers,2001,45:5?32

11 Fang Kuang-Nan,Wu Jian-Bin,Zhu Jian-Ping,Xie Bang-Chang.A review of technologies on random forests.Statistics and Information Forum,2011,26(3):32?38(方匡南,吳見彬,朱建平,謝邦昌.隨機森林方法研究綜述.統(tǒng)計與信息論壇,2011,26(3):32?38)

12 Huang Yan,Zha Wei-Xiong.Comparison on classi fi cation performance between random forests and support vector machine.Software,2012,33(6):107?110(黃衍,查偉雄.隨機森林與支持向量機分類性能比較.軟件,2012,33(6):107?110)

Study and Development of a Fast and Automatic Astronomical-transient-identi fi cation System

WU Chao1MA Dong1,2TIAN Hai-Jun2LI Xiang-Ru3WEI Jian-Yan1

With the development of observational technology,modern transient survey projects are required to select the transient candidates fast and automatically from large volume data with noise.We present a fast and automatic identi fi cation system to search transients by the following methods:introducing 13 new features to measure objects′pro fi les by isophotometry in the place of PSF fi t,using high simulation data based on real objects′pro fi les as training sample,and designing a special noise fi lter function.The identi fi cation system is realized by supervised machine learning technique of random forest.Our test demonstrates that the processing speed is 10 times faster than the popular identi fi cation system in the world,while their true and false positive rates are at the same level.Additionally,our system shows good performance for low signal-to-noise-ratio data due to its isophotometry′s features.Our system has been successfully operating in the Mini-GWAC(Miniature ground wide angle camera)online data processing pipeline.

Machine learning,random forest,robotic identi fi cation of transient,pro fi le of star,isophotometry

Wu Chao,Ma Dong,Tian Hai-Jun,Li Xiang-Ru,Wei Jian-Yan.Study and development of a fast and automatic astronomical-transient-identi fi cation system.Acta Automatica Sinica,2017,43(12):2170?2177

2016-03-24 錄用日期2016-12-10

March 24,2016;accepted December 10,2016

國家自然科學基金(U1431108,U1231123,U1331202,61273248,11503012,U1731124),廣東省自然科學基金(2014A030313425)資助

Supported by National Natural Science Foundation of China(U1431108,U1231123,U1331202,61273248,11503012,U17311 24)and Natural Science Foundation of Guangdong Province(201 4A030313425)

本文責任編委胡清華

Recommended by Associate Editor HU Qing-Hua

1.中國科學院國家天文臺北京100012 2.三峽大學宜昌443002 3.華南師范大學廣州510631

1. National Astronomical Observatories,Chinese Academy of Sciences,Beijing 100012 2.Three Gorges University of China,Yichang 443002 3.South China Normal University,Guangzhou 510631

1https://en.wikipedia.org/wiki/Supernova

2https://en.wikipedia.org/wiki/Gamma-ray burst

3https://en.wikipedia.org/wiki/Gravitational microlensing

4https://en.wikipedia.org/wiki/Tidal disruptionevent

5https://en.wikipedia.org/wiki/Gravitationalwave

6迷你地基廣角相機陣(Mini-GWAC)是GWAC的先導項目,由12個7厘米望遠望組成的陣.其觀測策略、科學目標和數(shù)據(jù)特點與GWAC相同.

7半高全寬(FWHM):二維高斯函數(shù)擬合計算.

8在此信噪比下即使肉眼辨星也有些困難.

吳潮,馬冬,田???李鄉(xiāng)儒,魏建彥.天文瞬變源快速自動識別系統(tǒng)的研究與實現(xiàn).自動化學報,2017,43(12):2170?2177

DOI10.16383/j.aas.2017.c160289

吳 潮 中國科學院國家天文臺副研究員.主要研究方向為數(shù)據(jù)挖掘與瞬變源搜索.E-mail:cwu@nao.cas.cn

(WU Chao Associate professor at National Astronomical Observatories,Chinese Academy of Sciences.His research interest covers data mining and astronomical transient search.)

馬 冬 三峽大學與中國科學院國家天文臺碩士研究生.主要研究方向為數(shù)據(jù)挖掘.E-mail:md201314@yeah.net

(MA Dong Master student at Three Gorges University and National Astronomical Observatories, Chinese Academy of Sciences. His main research interest is data mining.)

田海俊 三峽大學理學院副教授.先后在美國、德國等知名大學或研究機構(gòu)研究訪學.主要研究方向為星系天文學,天文信息學.本文通信作者.

E-mail:hjtian@lamost.org

(TIAN Hai-Jun Associate professor at the College of Science,Three Gorges University.His research interest covers galactic astronomy and astroinformatics.Corresponding author of this paper.)

李鄉(xiāng)儒 華南師范大學教授.2006年獲得中國科學院自動化研究所博士學位.主要研究方向為數(shù)據(jù)挖掘與計算機視覺.E-mail:xiangru.li@gmail.com

(LIXiang-Ru Professor at South China Normal University.He received his Ph.D.degree from the Institute of Automation,Chinese Academy of Sciences in 2006.His research interest covers data mining and robust vision.)

魏建彥 中國科學院國家天文臺研究員.主要研究方向為瞬變源觀測與科學.

E-mail:wjy@nao.cas.cn

(WEIJian-Yan Professor at National Astronomical Observatories,Chinese Academy of Sciences.His research interest covers observation and science of astronomical transients.)

猜你喜歡
參量光度輪廓
一種基于SOM神經(jīng)網(wǎng)絡中藥材分類識別系統(tǒng)
OPENCV輪廓識別研究與實踐
太陽黑子自動識別與特征參量自動提取
含參量瑕積分的相關(guān)性質(zhì)
基于含時分步積分算法反演單體MgO:APLN多光參量振蕩能量場*
乘用車后回復反射器光度性能試驗研究
皎皎月光
高速公路主動發(fā)光輪廓標應用方案設計探討
自然條件下豬只運動參量提取算法
一個改進的CV活動輪廓模型
鄂伦春自治旗| 常州市| 彭水| 清水县| 安徽省| 离岛区| 兖州市| 新竹市| 靖江市| 潜江市| 天门市| 屏东市| 军事| 兰溪市| 瑞安市| 池州市| 汉川市| 鱼台县| 望城县| 宝山区| 抚顺市| 江城| 凌云县| 平邑县| 津南区| 纳雍县| 晋江市| 剑河县| 乌拉特后旗| 西宁市| 江阴市| 新乡市| 田林县| 玛沁县| 奈曼旗| 张家港市| 化州市| 北海市| 义乌市| 无极县| 贵南县|