国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于支持向量機(jī)算法的矮星系分類研究

2020-01-08 02:22楊舟凡楊堯文蔣雙如
現(xiàn)代信息科技 2020年15期
關(guān)鍵詞:卷積神經(jīng)網(wǎng)絡(luò)

楊舟凡 楊堯文 蔣雙如

摘 ?要:矮星系是一類特殊的星系,其對(duì)于研究早期宇宙以及恒星系的形成和演化過(guò)程十分重要。但是目前人類所能觀察到的矮星系有限,如何從巡天項(xiàng)目獲取的海量圖像中識(shí)別出矮星系是研究的熱點(diǎn)問(wèn)題。文章意在通過(guò)人工智能的方法將矮星系與非矮星系圖像進(jìn)行分類,解決矮星系識(shí)別問(wèn)題,提出卷積神經(jīng)網(wǎng)絡(luò)和一類支持向量機(jī)兩種方法。經(jīng)過(guò)實(shí)驗(yàn),一類支持向量機(jī)分類的準(zhǔn)確率更高。

關(guān)鍵詞:天文圖像;卷積神經(jīng)網(wǎng)絡(luò);一類支持向量機(jī)

中圖分類號(hào):TP301.6 ? ? 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2020)15-0101-03

Abstract:Dwarf galaxies are one special kind of galaxies,which are very important for the study of the formation and evolution of the early universe and star systems. However,the number of dwarf galaxies that can be observed is limited. How to identify dwarf galaxies from the massive images obtained by the sky survey project is a hot issue. The purpose of this paper is to classify dwarf galaxy and non dwarf galaxy image by artificial intelligence method,and solve the problem of dwarf galaxy recognition. Two methods of convolution neural network and One-class SVM are proposed. After the experiment,One-class SVM classification accuracy is higher.

Keywords:astronomical image;convolution neural network;One-class SVM

0 ?引 ?言

星系是由恒星系與星際塵埃組成的運(yùn)行系統(tǒng),矮星系是星系的一種,它是光度最弱的一類星系。由于矮星系的特殊性質(zhì),其對(duì)于研究早期銀河系的形成和演化過(guò)程有很大幫助[1]。但是目前人類觀察到的矮星系十分有限,如何從觀測(cè)到的測(cè)光數(shù)據(jù)中將矮星系區(qū)分出來(lái)是亟待解決的問(wèn)題。

隨著天文望遠(yuǎn)鏡的發(fā)展,人類所能觀測(cè)到的天文數(shù)據(jù)越來(lái)越龐大,傳統(tǒng)的數(shù)據(jù)分析方式已經(jīng)不再適用。與天文學(xué)相關(guān)的人工智能領(lǐng)域應(yīng)運(yùn)而生,人工智能的興起為天文數(shù)據(jù)的分析提供了十分有利的條件。機(jī)器學(xué)習(xí)等方式可以快速、高效地對(duì)數(shù)據(jù)進(jìn)行處理與訓(xùn)練,算法和模型可以大大節(jié)省人力、物力和財(cái)力,能夠得到相對(duì)準(zhǔn)確的分析結(jié)果。

R.E.González[2]等提出使用卷積神經(jīng)網(wǎng)絡(luò)和數(shù)據(jù)增強(qiáng)進(jìn)行星系的檢測(cè)和識(shí)別。石超君[3]等提出使用卷積神經(jīng)網(wǎng)絡(luò)對(duì)恒星光譜進(jìn)行分類,并將此算法與SVM和BP算法分類結(jié)果進(jìn)行比較,其中卷積神經(jīng)網(wǎng)絡(luò)分類的準(zhǔn)確率更高。李鄉(xiāng)儒[4]等提出使用最近鄰方法研究正常星系與類星系光譜的識(shí)別問(wèn)題。閆龍、胡曉鵬[5]提出使用上下文特征和單類支持向量機(jī)進(jìn)行人臉活體檢測(cè)。

數(shù)據(jù)增強(qiáng)、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)算法在天文圖像的分類中均有應(yīng)用,且效果較好,但目前對(duì)于矮星系的分類問(wèn)題研究較少。本文基于2019年國(guó)家級(jí)大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目“基于人工智能算法的天文光譜分類”的研究成果,使用數(shù)據(jù)增強(qiáng)、卷積神經(jīng)網(wǎng)絡(luò)、一類支持向量機(jī)算法對(duì)矮星系圖像的自動(dòng)分類問(wèn)題進(jìn)行研究,主要研究如何區(qū)分恒星圖像與矮星系圖像。

1 ?算法介紹

1.1 ?卷積神經(jīng)網(wǎng)絡(luò)

卷積神經(jīng)網(wǎng)絡(luò)廣泛運(yùn)用于模式識(shí)別、圖像處理領(lǐng)域。其優(yōu)點(diǎn)為結(jié)構(gòu)簡(jiǎn)單、訓(xùn)練參數(shù)少、適應(yīng)性強(qiáng)。卷積神經(jīng)網(wǎng)絡(luò)在輸入是多維圖像的情況下優(yōu)點(diǎn)更為明顯,它使圖像可以直接作為網(wǎng)絡(luò)的輸入,無(wú)需數(shù)據(jù)重建過(guò)程。

通用結(jié)構(gòu)包括:輸入層、卷積層、池化層、全連接層和輸出層。

本文使用的卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖1所示。

輸入層為訓(xùn)練集,在預(yù)處理后大小為64×64。C1層有32個(gè)大小為3×3,步長(zhǎng)為3的卷積核,激活函數(shù)為ReLU,各卷積核提取不同特征,加偏置后經(jīng)過(guò)激活函數(shù)得到卷積層C1,生成32張大小為62×62的特征圖,卷積計(jì)算公式為:

其中,n為神經(jīng)網(wǎng)絡(luò)層數(shù),w為卷積核,j為特征圖,b為偏置值,f為激活函數(shù),Nj為輸入特征圖集合,此模型使用的激活函數(shù)ReLU函數(shù)的表達(dá)式為:

S1層為池化層,本文采用最大池化的方法,窗口大小為2×2,S1層生成特征圖數(shù)量與C1層相同,大小為31×31。C2層有64個(gè)大小為3×3,步長(zhǎng)為3的卷積核,激活函數(shù)為ReLU,輸出64張大小為29×29的特征圖。S2層下采樣得到64張大小為14×14的特征圖。C3層有128個(gè)大小為3×3,步長(zhǎng)為3的卷積核,激活函數(shù)為ReLU,輸出128張大小為12×12的特征圖。S3層下采樣得到128張大小為6×6的特征圖,為防止過(guò)擬合使用dropout層隨機(jī)拿掉50%的神經(jīng)元。全連接層神經(jīng)元個(gè)數(shù)設(shè)置為512,每個(gè)神經(jīng)元與S3層dropout后的所有神經(jīng)元連接。輸出層神經(jīng)元個(gè)數(shù)設(shè)置為2,激活函數(shù)采用Sigmoid函數(shù),函數(shù)表達(dá)式為:

1.2 ?一類支持向量機(jī)

一類支持向量機(jī)屬于支持向量機(jī),但是與傳統(tǒng)分類回歸支持向量機(jī)不同,它屬于無(wú)監(jiān)督學(xué)習(xí)方法。此方法可用于奇異點(diǎn)或者異常點(diǎn)檢測(cè)和樣本數(shù)量分布不均勻時(shí)的分類問(wèn)題。本文使用的矮星系與非矮星系數(shù)據(jù)量不平衡,適用此方法。

僅使用一類信息進(jìn)行訓(xùn)練,希望得到球形邊界,并最小化超球體的體積,最終采用超球體進(jìn)行劃分。其本質(zhì)為一個(gè)優(yōu)化問(wèn)題,可表示如下:

2 ?數(shù)據(jù)介紹

本文使用的數(shù)據(jù)來(lái)自于Sloan數(shù)字巡天[6]。Sloan數(shù)字巡天開(kāi)始于2000年,共包括四期,每一期又包含不同的巡天子項(xiàng)目。目前正在進(jìn)行的是四期巡天SDSS Ⅳ,項(xiàng)目時(shí)間是2014—2020年。整個(gè)巡天期間Sloan獲取了超過(guò)10億個(gè)天體的測(cè)光數(shù)據(jù)和超過(guò)400萬(wàn)條天體的光譜數(shù)據(jù),極大擴(kuò)展了人類對(duì)銀河系以及宇宙的認(rèn)知。

實(shí)驗(yàn)使用數(shù)據(jù)來(lái)自于SDSS DR8,實(shí)驗(yàn)數(shù)據(jù)包含11條矮星系數(shù)據(jù)和439條恒星數(shù)據(jù)。由于暗的矮星系與恒星在圖像上難以區(qū)分,因此本文的主要任務(wù)是使用機(jī)器學(xué)習(xí)算法區(qū)分恒星和矮星系。該研究將有助于在未來(lái)的大型巡天望遠(yuǎn)鏡,如LSST中更快速準(zhǔn)確地搜尋矮星系。

3 ?實(shí)驗(yàn)過(guò)程與結(jié)果

3.1 ?卷積神經(jīng)網(wǎng)絡(luò)實(shí)驗(yàn)過(guò)程及結(jié)果

本文采用TensorFlow 2.0框架,軟件編程環(huán)境為Python 3.7,選用G波段數(shù)據(jù)進(jìn)行研究。由于數(shù)據(jù)源以FITS格式保存在文件中,通過(guò)Astropy包解析出數(shù)據(jù),得到多個(gè)ndarray類型的矩陣。

由于數(shù)據(jù)大小不一,但是大多數(shù)都在64×64以下,所以通過(guò)填充0將矩陣統(tǒng)一到64×64的大小。觀察到矩陣每個(gè)元素的值都在1 000左右,通過(guò)乘以1/1 000將每個(gè)元素的值控制在[-1,1]區(qū)間內(nèi)。

對(duì)訓(xùn)練集數(shù)據(jù)進(jìn)行數(shù)據(jù)增強(qiáng),使用隨機(jī)裁剪(random crop),隨機(jī)左右翻轉(zhuǎn)(random flip left right),轉(zhuǎn)動(dòng)90°的整數(shù)倍(ROT90)。增強(qiáng)后訓(xùn)練集的數(shù)據(jù)量為1 600條。

為將多個(gè)矩陣連續(xù)導(dǎo)入到訓(xùn)練集中,將數(shù)據(jù)轉(zhuǎn)化為TFRecord格式,即進(jìn)行編碼,把數(shù)據(jù)轉(zhuǎn)化為字節(jié),存儲(chǔ)在TFRecord文件中,使用時(shí)再對(duì)TFRecord文件進(jìn)行解析。優(yōu)點(diǎn)為高效、節(jié)省內(nèi)存。

實(shí)驗(yàn)采用準(zhǔn)確率A(Accuracy)指標(biāo)評(píng)價(jià)模型性能。準(zhǔn)確率的公式可表示為:

其中,TP(True Positive)為樣本真實(shí)類別為正,預(yù)測(cè)類別為正;TN(True Negative)為真實(shí)類別為正,預(yù)測(cè)類別為負(fù),TP+TN為正確分類的樣本的個(gè)數(shù),P+N為所有樣本的個(gè)數(shù)。A為正確分類的樣本占所有樣本的比例。得到分類的A值為93.30%。

3.2 ?一類支持向量機(jī)實(shí)驗(yàn)過(guò)程及結(jié)果

選用439條G波段恒星數(shù)據(jù)作為訓(xùn)練集,測(cè)試集包含44條G波段恒星數(shù)據(jù),11條G波段矮星系數(shù)據(jù)。將數(shù)據(jù)讀取后均裁剪為64×64大小,再展為一維數(shù)組。

訓(xùn)練誤差設(shè)定為0.1,核函數(shù)使用Linear Kernel。訓(xùn)練后進(jìn)行測(cè)試得到結(jié)果。使用精確率P(Precision)、召回率R(Recall)、準(zhǔn)確率A(Accuracy)、F1分?jǐn)?shù)F1(F1-score)進(jìn)行評(píng)估。

其中,F(xiàn)P(False Positive)為真實(shí)類別為負(fù),預(yù)測(cè)類別為正;FN(False Negative)為樣本真實(shí)類別為負(fù),預(yù)測(cè)類別為負(fù)。

此方法得到的A值為96.36%,同時(shí)計(jì)算出矮星系的P、R和F1,結(jié)果如表1所示。

4 ?結(jié) ?論

本文為解決矮星系圖像分類的問(wèn)題,基于數(shù)據(jù)本身的特點(diǎn)使用了卷積神經(jīng)網(wǎng)絡(luò)和一類支持向量機(jī)兩種方法。在使用卷積神經(jīng)網(wǎng)絡(luò)前對(duì)訓(xùn)練集數(shù)據(jù)進(jìn)行了數(shù)據(jù)增強(qiáng),以增加樣本數(shù)量,提升模型的魯棒性。通過(guò)實(shí)驗(yàn)發(fā)現(xiàn),一類支持向量機(jī)方法分類的準(zhǔn)確率更高。

參考文獻(xiàn):

[1] MATEO M. Dwarf Galaxies of the Local Group [J].Annual Review of Astronomy and Astrophysics,1998,36(1):435-506.

[2] GONZ?LEZ R E,MU?OZ R P,HERN?NDEZ C A. Galaxy detection and identification using deep learning and data augmentation [J].Astronomy and Computing,2018(25):103-109.

[3] 石超君,邱波,周亞同,等.基于卷積神經(jīng)網(wǎng)絡(luò)的恒星光譜自動(dòng)分類方法 [J].光譜學(xué)與光譜分析,2019,39(4):1312-1316.

[4] 李鄉(xiāng)儒,盧瑜,周建明,等.基于最近鄰方法的類星體與正常星系光譜分類 [J].光譜學(xué)與光譜分析,2011,31(9):2582-2585.

[5] 閆龍,胡曉鵬.基于上下文特征與單類支持向量機(jī)的人臉活體檢測(cè) [J].電子技術(shù)應(yīng)用,2020,46(6):32-35.

[6] YORK D G,ADELMAN J,ANDERSON J E,et al. The Sloan Digital Sky Survey:Technical Summary [J].The Astronomical Journal,2007,120(3):1579.

作者簡(jiǎn)介:楊舟凡(1999.09—),女,漢族,安徽合肥人,本科在讀,研究方向:統(tǒng)計(jì)學(xué)、大數(shù)據(jù)分析;楊堯文(1999.12—),男,漢族,四川德陽(yáng)人,本科在讀,研究方向:統(tǒng)計(jì)學(xué)、大數(shù)據(jù)分析;蔣雙如(1999.11—),女,漢族,山東濰坊人,本科在讀,研究方向:統(tǒng)計(jì)學(xué)、大數(shù)據(jù)分析。

猜你喜歡
卷積神經(jīng)網(wǎng)絡(luò)
基于深度神經(jīng)網(wǎng)絡(luò)的微表情識(shí)別
卷積神經(jīng)網(wǎng)絡(luò)中減少訓(xùn)練樣本時(shí)間方法研究
卷積神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型研究
基于卷積神經(jīng)網(wǎng)絡(luò)的車輛檢索方法研究
基于卷積神經(jīng)網(wǎng)絡(luò)溫室智能大棚監(jiān)控系統(tǒng)的研究
基于深度卷積神經(jīng)網(wǎng)絡(luò)的物體識(shí)別算法
深度學(xué)習(xí)算法應(yīng)用于巖石圖像處理的可行性研究
基于深度卷積網(wǎng)絡(luò)的人臉年齡分析算法與實(shí)現(xiàn)
深度學(xué)習(xí)技術(shù)下的中文微博情感的分析與研究
基于卷積神經(jīng)網(wǎng)絡(luò)的樹(shù)葉識(shí)別的算法的研究
尉犁县| 兴山县| 封开县| 乡城县| 县级市| 隆回县| 区。| 邻水| 旅游| 富阳市| 罗平县| 昆山市| 项城市| 陆丰市| 洪江市| 双牌县| 内乡县| 海宁市| 安达市| 安溪县| 准格尔旗| 吕梁市| 澎湖县| 宁陕县| 普宁市| 林西县| 洛南县| 石棉县| 清丰县| 河北省| 马山县| 梅河口市| 北辰区| 五华县| 深泽县| 阳新县| 同德县| 肃宁县| 宁城县| 逊克县| 晋江市|