国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于深度學習的大型隕石坑識別方法研究

2020-06-16 03:27:22鄭磊胡維多劉暢
北京航空航天大學學報 2020年5期
關鍵詞:隕石坑準確率樣本

鄭磊,胡維多,*,劉暢

(1.北京航空航天大學 宇航學院,北京100083; 2.中國科學院深圳先進技術研究院,深圳518055)

人類對月球及更遠的天體或空間環(huán)境開展的探測活動,是如今航天活動的重要方向和空間科學與技術創(chuàng)新的重要途徑,是當前和未來航天領域的發(fā)展重點之一。隕石坑作為反映星體地表情況及地質年齡的重要參考對象,為安全登陸地球以外的其他星球并展開實地考察研究提供了可靠的依據,因此近年來關于月球、火星等星體表面隕石坑情況的研究越來越多。

隕石坑是隕石體高速運動并撞擊到天體表面或天體內部熔巖噴發(fā)后所形成的坑穴。這種坑穴蘊含著豐富的信息,如隕石坑大小和個數的統(tǒng)計形成了月球和火星的地質地層學,并且隕石坑的數目已成為衡量遙遠行星地質形成年齡的唯一工具;隕石坑形態(tài)學促進了自然降解過程、地質的區(qū)域性差異、地下揮發(fā)物質的分布等大量的行星地質問題的研究[1-2];隕石坑因其顯著的地形特征,常常作為深空星體探測時的地面標志物和導航路標,用于探測器的位置定位及著陸避障任務中[3]。隕石坑在星際探測多個方面都得到了廣泛的研究和應用,因此,如何識別星體表面的各種隕石坑,為星際任務提供應用基礎,已成為航天領域研究的熱點和難點。

近年來,國內外學者對星體表面隕石坑的識別方法進行了深入的研究。美國噴氣推進實驗室(JPL)的Cheng等[3]將光照方向與隕石坑邊緣信息相結合,通過隕石坑邊緣錨點之間的幾何相關性實現了隕石坑的識別;Sawabe[4]和Kim[5]等根據隕石坑的特定形狀,構造相對應的隕石坑模板,通過模板匹配實現隕石坑的檢測;馮軍華等[6]基于Canny方法及邊緣配對完成隕石坑檢測;丁萌等[7]利用基于弦中點Hough變換的方法,有效結合Kanade-Luca-Tomasi(KLT)特征檢測算法實現了隕石坑的檢測。這些傳統(tǒng)的基于圖像處理及圖像配準的隕石坑識別方法,雖然有效地對隕石坑進行了較為準確的識別,但工作量大,任務繁瑣,并且缺乏實時性。

得益于近年來人工智能的發(fā)展,現在關于隕石坑識別的研究越來越趨向于機器學習和神經網絡方面的自動識別領域[8-9]。例如,文獻[10]中利用主成分分析(PCA)方法統(tǒng)計紋理測量信息,并應用紋理分析分割圖像達到檢測隕石坑的目的;Boukercha等[11]利用機器學習增強算法對隕石坑進行初步篩選得到隕石坑候選區(qū)域,結合支持向量機(SVM)和多項式分類器對隕石坑進行進一步的檢測;Silburt等[12]利用卷積神經網絡實現了數字高程模型(Digital Elevation Model,DEM)中隕石坑的識別。這些方法雖然實現了隕石坑的自動識別,提高了識別效率和精度,但均將隕石坑統(tǒng)一擬合為橢圓或圓,對小型隕石坑采用正負樣本的二分類方法,對于較大的、形態(tài)不規(guī)則的復雜隕石坑及隕石坑撞擊盆地并不能有效識別。相比小型隕石坑生命周期較短并存在侵蝕、覆蓋、掩埋及轉化問題,大型隕石坑能夠在漫長的時間長河里保持形態(tài)和結構穩(wěn)定性,無論是在天體地質學還是作為路標導航方面的研究,大型隕石坑都具有很強的時效性。因此,本文以星體宏觀視角下的大型隕石坑作為研究對象,創(chuàng)建了不同數據源的隕石坑樣本數據庫,構建了基于深度學習的多尺度隕石坑自動識別網絡框架,改進了目標檢測時常用的非極大值抑制(Non-Maximum Suppression,NMS)算法,提出了一種效率更高的隕石坑多分類識別方法。

1 隕石坑樣本數據庫構建

1.1 數據來源

隕石坑作為本文研究對象及訓練深度學習識別網絡的核心組成部分,其數據來源的真實性和圖片質量的清晰度是選取數據時應該重點考慮的2個因素,但由于能夠查閱到的各天體大型隕石坑圖片資料相對較少,本文選取了人類研究最多且最為熟悉的月球作為數據采集對象。月球表面擁有大量的各類隕石坑,對于很多大型環(huán)形山類型的隕石坑,人類在地球上用肉眼即可觀測到,并且用天文拍攝設備可以取得質量較好的大型隕石坑圖片。因此,本文選取了在不同月相情況下月球表面的多個大型隕石坑作為識別對象。

具體數據來源有2個方面:①公布在美國國家航空航天局(NASA)科學可視化工作室官網[13]的2018年全年高清仿真月相圖,該月相圖的生成參數源自2009年開始執(zhí)行繞月飛行的月球勘測軌道飛行器(Lunar Reconnaissance Orbiter,LRO),其所攜帶的激光高度計和航天照相機使得以前所未有的清晰度來觀察月球成為可能。本文選取了2018年每個月由新月到月盈、再到月虧的月相圖作為大型隕石坑樣本提取和檢測數據源,圖1為2018年2月的部分月相圖[13]。②筆者于2018年11月和12月利用專業(yè)相機拍攝的月相圖,拍攝設備主要由相機、二倍鏡及長鏡頭構成,最大焦距可達400mm,能夠較清晰地拍攝到月球表面眾多大型隕石坑。由于拍攝天氣及環(huán)境等因素影響,本文只選取了部分清晰度高的月相圖作為實驗數據,圖2為2018年12月的部分月相圖。

圖1 NASA官網提供的仿真月相圖[13]Fig.1 Simulated moon phases provided by NASA official website[13]

圖2 專業(yè)相機拍攝的真實月相圖Fig.2 Realmoon phases captured by a professional camera

1.2 隕石坑樣本數據集

本文選擇了月球表面的危海(Mare Crisium)、澄海(Mare Serenitatis)及第谷(Tycho)3個具有代表性的大型隕石坑作為識別的對象。危海是位于月球東北半球的月海,直徑605 km,面積約17.6×104km2[14]。澄海是月球上大型月海隕石坑之一,直徑約600 km,環(huán)形結構可延伸至880 km[15-16],基于其退化的外觀,澄海隕石坑被一些研究者認為是月球上最古老的隕石坑之一[17]。哥白尼時代被廣泛研究的第谷隕石坑,是月球正面最年輕、最顯著的大型隕石坑之一[18]。危海有類似尾巴的部分,澄海有一個突出的三角,而第谷周圍有以其為中心的放射狀溝壑,均具備顯著特征,如圖3所示。

圖3 危海、澄海及第谷隕石坑Fig.3 Mare Crisium,Mare Serenitatis and Tycho craters

通過2個不同的數據源,本文采集了大量隕石坑樣本塊,并構成了樣本數據庫。樣本數據庫具體包含3個不同的隕石坑樣本數據集:①單獨從NASA官網下載的月球圖片中采集樣本構成第1個隕石坑樣本數據集(NASA crater,Ncrater);②單獨從專業(yè)相機拍攝的月球圖片中采集樣本構成第2個隕石坑樣本數據集(Camera crater,Ccrater);③將前2個隕石坑樣本數據集合并,構成同時含有2個不同數據源樣本的第3個隕石坑樣本數據集(NASA and Camera crater,NCcrater)。為了提高識別精度,增加樣本間的差異性,上述每個樣本數據集中除了包含待識別的危海、澄海、第谷這3種隕石坑樣本外,還增加了負樣本,構成用于四分類問題研究的樣本數據集。

由于能夠直接采集得到的隕石坑數量很難滿足訓練識別網絡的需求,本文采用了數據增強的方法,對上述3種樣本數據集中原有的每個樣本分別通過鏡像、均值濾波、加少量椒鹽噪聲和高斯噪聲等9種圖像處理方法來擴充數據,并將新生成的樣本保存到各自對應的樣本數據集中,從而將原來的3個樣本數據集的樣本數擴充了10倍。表1為數據增強后3個樣本數據集各自包含的各類樣本總數。圖4顯示了樣本數據集中各類隕石坑樣本塊,每個樣本塊尺寸為3×227×227。采取數據增強的方法,不僅能大幅度增加每個樣本數據集樣本數量,而且在保持待識別目標主要特征的同時,一定程度上增加了樣本的多樣性,提高了網絡模型的泛化能力。

表1 數據增強后各類樣本數Tab le 1 Num ber of d ifferent types of sam p les after data augm entation

圖4 四類隕石坑樣本Fig.4 Four types of crater samples

2 隕石坑識別網絡框架搭建

2.1 識別網絡的選擇

隨著近年來人工智能領域的飛速發(fā)展,越來越多的深度學習神經網絡模型進入大眾的視野,如卷積神經網絡(CNN)、遞歸神經網絡(RNN)及最近幾年熱門的生成對抗網絡(GAN)等。CNN由于其獨特的卷積結構,在圖像處理領域有著明顯的優(yōu)勢。過去幾年中,CNN已成功應用于許多經典圖像處理問題,如圖像去噪[19]、超分辨率圖像重建[20]、圖像分割[21]、目標檢測[22-24]、物體分類[25-26]等。通常,越深層的網絡將具備越強的學習能力,近年來CNN網絡發(fā)展迅速,并趨向于更加深層次的網絡模型。然而,層數越深的網絡訓練起來就會越困難。一方面,網絡訓練多采用梯度反向傳播算法進行參數學習和優(yōu)化,過深的網絡因為層數太多會出現梯度消失的情況,造成網絡無法收斂;另一方面,越是深層的網絡對訓練設備和訓練樣本數量有著越高的要求,性能普通的設備訓練時間將會十分漫長,而較少的訓練樣本將會造成網絡過擬合。本文選用CNN作為隕石坑識別網絡,并且通過綜合考慮訓練時間消耗、識別精度、現有的訓練設備性能和隕石坑樣本數量等方面因素,發(fā)現相比于GoogLeNet等近年來發(fā)展的新型深層網絡,選擇CaffeNet模型對隕石坑樣本圖像進行分類,不僅能保證較高的識別精度,還能夠節(jié)約大量的時間成本,同時避免了更深層網絡中過擬合現象的出現。CaffeNet模型是基于Krizhevsky等[27]針對數據集ImageNet訓練生成的神經網絡架構AlexNet,并在AlexNet基礎上進行了一定的優(yōu)化,近年來在各種圖像處理任務中仍展現著出色的表現。

2.1.1 卷積神經網絡模型

一個典型的CNN網絡由多個卷積層、池化層及全連接層組成。卷積層是CNN中計算量最大的部分,同時也是最重要的結構。卷積層內部包含多個卷積核,組成卷積核的每個元素都對應著一個權重系數和一個偏差量,卷積核與輸入數據進行卷積運算,從而提取輸入的不同特征,第一層卷積層可能只能提取一些如邊緣、線條和角等低級的特征,深層的卷積網絡能從低級特征中不斷迭代提取更復雜的特征。卷積層的作用多為檢測特征,池化層的作用則是提取、凝煉特征。池化層基本執(zhí)行向下采樣操作,類別得分在全連接層之后計算,正因如此,池化層常常被放置在卷積層之后。全連接層的作用是把所有局部特征進行匯總變成全局特征,用來計算最后每一類的得分。

選用CNN作為隕石坑識別網絡有著多方面的優(yōu)勢。CNN具有極強的通用性,可以近似于任何線性或非線性轉換,能夠有效地提取各類隕石坑特征;CNN不需要通過手工制作的過濾器來進行目標物特征的提取,取而代之的是機器自動學習算法;同時,得益于GPU的并行計算能力,CNN能夠高速處理輸入數據。

2.1.2 隨機梯度下降法

在選擇了用于隕石坑識別的神經網絡模型后,就可以通過一些優(yōu)化策略來進行網絡訓練參數學習。通常用于訓練CNN模型參數的算法是隨機梯度下降(Stochastic Gradient Descent,SGD)法,其使用反向傳播來計算梯度進行權重的更新,通過不斷減小損失函數輸出值來進行參數的自動學習。反向傳播是多層網絡中最常用的算法,該算法的核心是應用鏈式法則計算網絡中各權值對損失函數的影響[28],從而尋找網絡的全局最優(yōu)解。

SGD法的目標是使損失函數最小化,從而在CNN模型中找到對目標問題具有良好泛化能力的最優(yōu)參數[29]。為了量化SGD法的作用,定義損失函數的形式為

式中:w為網絡中權重的集合;b為偏置的集合;n為每個批次中樣本的個數;a為輸入為x時的輸出;y(x)為對應的期望輸出或為每個類別樣本預先貼上的分類標簽值;求和是在總的訓練輸入x上進行的。SGD法的基本思想是:通過隨機選取小批量訓練輸入樣本,不斷計算使損失函數C(w,b)輸出值減小的梯度,同時更新網絡參數,從而尋找損失函數全局最小值時的最優(yōu)解。網絡權重和偏置的具體更新方式為

式中:m為隨機小批量數據樣本大小;η為學習率,是一個很小的正數。

2.2 隕石坑識別網絡框架

在訓練隕石坑識別網絡的過程中,先將包含各類隕石坑的樣本數據集以3×227×227尺寸輸入到網絡,并以CaffeNet的卷積層和全連接層作為各類隕石坑特征的提取器,將提取到的各類特征信息輸入到相當于分類器的Softmax層,并結合預先設置的標簽進行隕石坑分類,對全部輸入的樣本數據集進行3 000次訓練,生成多類隕石坑識別網絡模型,進而利用該模型結合目標檢測算法實現多類隕石坑的識別。具體方法流程如圖5所示。

2.3 隕石坑檢測算法

在實際中,各類隕石坑分布在地形圖的任意位置,同一幅圖片中可能會存在多種隕石坑,但采用的識別網絡輸入尺寸是固定的,訓練網絡時用的只是每類隕石坑的3×227×227樣本塊,因此需要一種有效的檢測算法,在可能存在隕石坑的圖片中判斷是否有待檢測的目標,并對其進行分類和標注。本文在目標檢測研究中常用的NMS算法基礎上,結合隕石坑檢測時的實際情況,對NMS算法進行了優(yōu)化,提出了一種準確率更高的隕石坑檢測算法,經過參數優(yōu)化和實驗驗證構建了基于深度學習的多尺度多類別的隕石坑自動識別網絡框架。

圖5 隕石坑識別流程Fig.5 Flowchart of crater identification

2.3.1 基于NMS的目標檢測算法

通常,基于深度學習的目標檢測算法包括3個步驟:①通過目標樣本集訓練好最優(yōu)的識別和分類網絡模型;②在待檢測的圖中以網絡輸入要求的尺寸,通過遍歷的方式選取待識別對象輸入到訓練好的網絡模型進行分類,并返回位置信息和類別信息;③通過NMS算法選出有效檢測結果,并在原圖中標注。

NMS算法的基本思想為抑制非極大值的元素,是廣泛應用于目標檢測中尋求局部最大值的算法,主要目的是消除冗余(交叉重復)的窗口,找到最佳目標檢測位置。傳統(tǒng)的NMS算法流程如下:

步驟1 對根據識別網絡輸出得到的目標檢測候選框所對應的置信度得分進行排序。

步驟2 選擇置信度最高的檢測框添加到最終輸出列表中,并將其從候選框列表中刪除。

步驟3 計算置信度最高的檢測框與其他候選框的IoU(Intersection over Union),IoU指2個候選框的交集部分與并集部分的面積比值。

步驟4 將IoU小于閾值(一般取0.3~0.5)的候選框按置信度得分重新排序,重復步驟2、步驟3。

步驟5 重復上述過程,直至候選框列表為空,最終輸出框中存有的即為所求的目標檢測框。

當將上述傳統(tǒng)的目標檢測算法運用于本文的隕石坑檢測時,主要存在3點不足:①待檢測的多類隕石坑以相同比例尺呈現在一幅圖中,因此其大小有較大差別的,傳統(tǒng)以網絡輸入尺寸對待測圖片進行遍歷的單個檢測框,并不能將所有不同類別的隕石坑在一次遍歷搜索中檢測出來;②識別網絡模型對目標并不總能做到百分百的正確識別,因此目標候選框中會存在個別與置信度最高的框沒有相交面積,或者相交面積太小的誤檢測框,此時運用NMS算法會將這些誤檢測框作為正確信息輸出;③當對圖片中目標進行分類和標注時只需一個最準確的檢測框就行,但當用到NMS算法時最終往往會輸出多個滿足條件的檢測框,通常解決此問題的方法是不斷改變IoU的閾值直到最終只輸出一個檢測框,這種做法隨機性太大,手動干預太多,效率太低。

2.3.2 檢測算法優(yōu)化

針對基于深度學習的傳統(tǒng)檢測算法的不足,本文提出了多尺度的隕石坑自動識別網絡框架。首先,對識別網絡模型讀取待測圖片的方式進行了改善,設置了一個縮放因子(本文取0.9)。當檢測框每次對待測圖片遍歷后,將當前圖尺寸按縮放因子縮放,進行下一次的遍歷,直到待測圖片接近檢測框尺寸,并在每輪遍歷結束時將得到的目標候選框在原始圖中對應的位置信息及置信度存儲。對NMS算法,本文結合實際情況也進行了相應優(yōu)化,增加了IoU閾值下限,并將閾值固定為

這樣就可以淘汰與置信度最高的框沒有相交面積或者相交面積太小的誤檢測框,并且提高算法的自動檢測效率。

同時,在NMS算法輸出最終檢測框的部分也進行了相應優(yōu)化,增加了最大差值法,即在最終輸出的各檢測框的頂點間實行x軸和y軸2個方向上的差值運算,取差值最大的4個點作為最終輸出的唯一檢測框的頂點,從而在保證檢測準確度的同時,避免了傳統(tǒng)NMS算法帶來的最終檢測結果中多個檢測框框出同一目標的冗余問題。圖6為本文優(yōu)化后的多尺度多分類隕石坑檢測算法的流程。其中,待檢測的原圖像尺寸在實際檢測中均大于3×227×227,craterNMS為優(yōu)化后的NMS算法。

圖6 多尺度隕石坑檢測流程Fig.6 Flowchart ofmulti-scale crater detection

3 實驗結果及分析

為了驗證本文提出的基于深度學習的大型隕石坑識別方法的可行性,主要從以下3方面進行相關實驗:①在不同網絡訓練參數優(yōu)化方法下,隕石坑識別網絡模型的訓練效果;②不同數據來源的訓練集對識別網絡的泛化能力的影響;③基于craterNMS的多尺度多分類的隕石坑檢測算法與傳統(tǒng)方法的檢測結果比較。

在實驗過程中,將3個隕石坑樣本數據集Ncrater、Ccrater和NCcrater,依次按7 ∶3的數量比例構建訓練集和測試集,得到3組單獨的網絡訓練集。分別對本文的隕石坑識別網絡進行訓練,且訓練集和測試集僅用于網絡模型的訓練過程中,不參與訓練完畢后網絡模型泛化能力等性能的驗證。

3.1 網絡參數優(yōu)化方法

訓練一個有效的深度學習網絡,調參是永恒不變的話題。如何讓各個網絡參數隨著訓練數據的輸入自動學習,從而使網絡訓練朝著所需要的方向收斂是當前人工智能領域研究的熱點。因此,越來越多的網絡訓練參數優(yōu)化策略被提出,近年來經常被應用于網絡訓練時參數學習的優(yōu)化方法主要有SGD法、AdaDelta優(yōu)化法[30]、Adam 優(yōu)化法[31]、RMSprop優(yōu)化法[32]等,這些方法均為基于梯度的網絡參數優(yōu)化方法。

SGD法是目前使用最多的一種優(yōu)化方法;AdaDelta是一種“魯棒的學習率方法”,通過把歷史梯度累積窗口限制為固定的大小來調節(jié)參數;Adam是一種自適應學習率的方法,與AdaDelta不同的是,其使用了動量進行學習率衰減;RMSprop與AdaDelta類似,但在調參時添加了衰變因子防止歷史梯度求和過大。

本文分別利用上述4種優(yōu)化方法在構建的3種樣本數據集上進行了隕石坑識別網絡模型的訓練。采用樣本數據集Ncrater和Ccrater時的初始學習率為η=0.000 5,樣本數據集為NCcrater時η=0.001。表2為本文實驗的計算機測試環(huán)境。表3~表5統(tǒng)計了4種優(yōu)化方法在3種樣本數據集上訓練網絡時最終的準確率、最低損失代價值及訓練時間??芍?,4種優(yōu)化方法在3種樣本數據集上訓練網絡都取得了很不錯的效果,最后的訓練結果都相差較小,但依舊不難發(fā)現無論利用哪個樣本數據集,SGD法取得的精度都是最高,最低損失代價值都最小,訓練時間都最少。由此可見,訓練隕石坑識別網絡模型時,SGD法的參數優(yōu)化效果最好,魯棒性最強,因此在其他關于隕石坑識別方法研究的實驗中,均采用SGD法作為網絡參數優(yōu)化策略。

表2 計算機配置參數Table 2 Com puter configuration param eters

表3 樣本數據集Ncrater訓練結果Table 3 Training results of sam p le data set Ncrater

表4 樣本數據集Ccrater訓練結果Tab le 4 Training resu lts of sam p le data set Ccrater

表5 樣本數據集NCcrater訓練結果Tab le 5 T raining resu lts of sam p le data set NCcrater

3.2 不同數據源樣本數據集網絡泛化效果

從3.1節(jié)的實驗結果可以看出,隕石坑識別網絡模型的訓練準確率已經達到了很高的水平,但這并不能充分說明深度學習方法在實際隕石坑檢測中也能有很好的效果。這是由于時間和數據資源的限制,能夠用于本文研究的隕石坑樣本數據集數量并不是很龐大,因此在訓練時可能會出現過擬合的現象;同時,在衡量一個網絡模型的優(yōu)劣時,訓練過程中準確率及最低損失代價值只是一部分的參考指標,主要用于監(jiān)測網絡的訓練情況,而網絡模型的泛化能力才是最為關注的關鍵性指標。泛化能力越強的網絡模型,在未被用于訓練的驗證樣本數據集(以下簡稱驗證集)上的識別準確率就越高,在執(zhí)行實際的識別任務時的效果相應就會越好。因此,選用網絡在驗證集上的識別準確率作為隕石坑識別網絡模型的評估指標,定義Pi為特定隕石坑的識別準確率,Ni為該類隕石坑正確識別數,Si為驗證集中該類隕石坑總數,Pn為網絡模型識別準確率,I為驗證集中樣本類別總數,評價公式為

為了研究通過訓練集和測試集訓練完畢生成的網絡模型的泛化能力等性能,從2個不同數據源重新采樣,構造了2個未參與隕石坑識別網絡訓練過程的驗證集VNcrater(Validation NASA crater)和VCcrater(Validation Camera crater)。驗證集中各類樣本的數量如表6所示。

如表7和表8所示,分別利用構造的3個訓練集訓練網絡模型,然后在2個驗證集上統(tǒng)計每個網絡模型對各類樣本的識別準確率。表中:Nnet、Cnet和NCnet分別代表利用訓練集Ncrater、Ccrater和NCcrater訓練得到的隕石坑識別網絡模型,總準確率即為網絡模型識別準確率Pn。

表6 驗證集中各類樣本數Tab le 6 Num ber of different types of sam p les in verification set

表7 驗證集VNcrater上的識別準確率Table 7 Identification accu racy on verification set VNcrater

表8 驗證集VCcrater上的識別準確率Table 8 Identification accu racy on verification set VCcrater

從實驗結果可知,Nnet、Cnet在與其訓練樣本來自同一個數據源的驗證集上測試時,分別達到了0.985和0.920高識別準確率;由于NCnet的訓練集來自2個數據源,因此在驗證集VNcrater和VCcrater上都展現了不錯的識別效果,分別取得了0.991和0.945的識別準確率;同時,用Nnet、Cnet在與其訓練樣本數據來源完全不同的驗證集上檢驗時,雖然識別準確率有所下降,但還是取得了不錯的效果,特別是Cnet能在異源驗證集VNcrater上準確地識別出第谷和負樣本,并取得了0.863的總準確率。在實驗結果中可以注意到一點,對危海的識別準確率并沒有其他類隕石坑的高,這是由于危海位于月球邊緣地帶,在月相發(fā)生變化時,其形態(tài)特征在地球觀測者視角里將隨之發(fā)生一些變化,因此對識別精度產生了一定的影響。

同時,表7和表8中實驗結果都反映了本文提出的隕石坑識別網絡模型具有較強的泛化能力,不管在同源還是異源的驗證集上實驗都能達到較高的識別準確率。因此,在實際應用中構造網絡對其他隕石坑進行識別時,可以利用由本文建立的隕石坑樣本數據庫訓練得到的網絡模型,結合遷移學習方法進行參數初始化,從而有效避免因待測隕石坑樣本少而出現過擬合的現象,提高識別精度。

3.3 多尺度多分類隕石坑檢測算法

本文優(yōu)化了傳統(tǒng)基于NMS算法的目標檢測算法,并結合隕石坑識別的實際情況,提出了基于craterNMS的多尺度多分類隕石坑檢測算法。為了驗證該算法的有效性,本節(jié)分別用Ccrater和Ncrater這2個樣本數據集訓練網絡模型,并用各自數據源中未用來采集樣本的圖片對上述2種算法進行對比實驗。其中,選自NASA官網的仿真月相測試圖有12張,選自專業(yè)相機拍攝的真實月相測試圖有18張,2類測試圖均包含了從新月到月盈、再到月虧等多種形態(tài)的月相圖。在訓練網絡模型時,選取的參數學習策略為SGD法,初始學習率均為η=0.000 5,Softmax輸出各類隕石坑置信度得分的閾值均為0.5,檢測框滑動步長為45像素。實驗結果如圖7和圖8所示,每一行圖片依次為未采用NMS算法、采用傳統(tǒng)NMS算法(IoU閾值為0.4)和craterNMS算法得到的隕石坑檢測結果,紅色框為危海檢測框,綠色框為澄海檢測框,藍色框為第谷檢測框,同時在craterNMS算法檢測圖中顯示了黃色虛線框表示的真實框標注,用作實驗結果對比。由于受光線、天氣等因素影響,專業(yè)相機拍攝的月相圖比仿真月相圖圖像特征更具多樣化,相應地更能驗證本文隕石坑檢測算法的魯棒性,且篇幅有限,因此圖7僅展示了2幅NASA官網仿真月相圖的隕石坑檢測結果,圖8展示了5幅專業(yè)相機拍攝的月相圖隕石坑檢測結果。

由于Softmax進行隕石坑分類時置信度閾值選取的較低,在未采用NMS算法時會有許多誤檢測框出現,采用NMS算法后效果有所改善,但仍然有一些誤檢測框存在。當然,在前2種算法中可以通過反復調節(jié)識別網絡模型中Softmax分類

圖7 樣本數據集Ncrater的實驗結果Fig.7 Experimental results of sample data set Ncrater

圖8 樣本數據集Ccrater的實驗結果Fig.8 Experimental results of sample data set Ccrater

置信度和NMS算法中IoU這2個閾值的大小來剔除誤檢測框,但需要手動不斷干預檢測過程,效率太低,并且當替換一副不同的隕石坑待測圖進行檢測時,又要重新調試閾值,泛化性能很差。

相比前2種檢測算法的不足,第3種采用craterNMS的多尺度隕石坑檢測算法得到的結果效果顯著,能在分類置信度和IoU這2個閾值都固定的情況下成功得到各類隕石坑唯一的精準檢測框,充分說明本文隕石坑檢測算法的確能在很大程度上改善隕石坑識別效果,并且具有通用性,在不同的樣本數據集上都能實現自動精準檢測隕石坑的目的。同時,圖7和圖8的檢測結果也很好地驗證了本文提出的隕石坑識別方法的有效性。例如,圖8第1行月相圖片中澄海較大部分面積已進入陰影,但仍能被本文方法準確地檢測到。

為了對上述3種隕石坑檢測算法的檢測結果進行定量的數據分析,引入了平均檢測準確率P和平均檢測框冗余數R兩個評價指標,N為2種數據源待測試的月相圖總數,Kj為當前測試圖中正確檢測框數,Ks為該測試圖中檢測框總數,Kr為該測試圖中冗余正確檢測框數,評價公式為式(7)和式(8)。

表9為各類隕石坑置信度得分閾值均為0.5時,總數共30張的2種數據源待測月相圖最后檢測結果的P、R值統(tǒng)計。可知,相對于前2種算法,本文提出的craterNMS的多尺度隕石坑檢測算法不僅能消除冗余檢測框,而且能在分類置信度閾值較低的情況下準確地檢測出各類目標隕石坑。

表9 三種檢測算法數據分析Table 9 Data analysis of three detection algorithm s

4 結 論

本文以星體宏觀視角下的大型隕石坑作為研究對象,結合圖像處理和神經網絡等方面的知識,提出了一種基于深度學習的多尺度隕石坑自動識別網絡框架和隕石坑檢測算法,經實驗驗證主要得出以下結論:

1)從2個不同數據源采集樣本進行實驗,隕石坑識別網絡在與訓練集同源的驗證集上的識別率可以分別達到0.985和0.920,在異源的驗證集上的識別率最高可達到0.863,說明本文的隕石坑識別方法具有良好的泛化能力,同時證明了訓練集的數量及來源對識別網絡模型的泛化能力和識別精度都能產生較大的影響。在條件允許的范圍內,樣本數據集數量越大、數據來源越豐富,將越有利于網絡泛化能力和識別準確率的提高。

2)訓練網絡模型時,網絡參數優(yōu)化方法的選取也十分關鍵,需要根據實驗的具體情況選擇適合當前研究的優(yōu)化策略。通過多種優(yōu)化方法的實驗結果對比,發(fā)現SGD法在基于深度學習的隕石坑識別方法研究中具有良好的參數優(yōu)化效果。

3)通過改進傳統(tǒng)隕石坑二分類方法,以及優(yōu)化基于NMS的目標檢測算法,實現了多種隕石坑的有效分類,并且不同于傳統(tǒng)方法需反復調試閾值,能在分類置信度和IoU這2個閾值都固定的情況下,成功得到各類隕石坑唯一的精準檢測框,節(jié)約了時間成本,提高了隕石坑自動檢測的準確率。

4)通過實驗論證了基于深度學習的大型隕石坑識別方法的可行性。

隨著科技的發(fā)展,將人工智能引入星際探測等領域的研究將具有更為廣闊的應用實踐和發(fā)展前景。

猜你喜歡
隕石坑準確率樣本
乳腺超聲檢查診斷乳腺腫瘤的特異度及準確率分析
健康之家(2021年19期)2021-05-23 11:17:39
不同序列磁共振成像診斷脊柱損傷的臨床準確率比較探討
2015—2017 年寧夏各天氣預報參考產品質量檢驗分析
用樣本估計總體復習點撥
科學家在黑龍江新發(fā)現隕石坑
隕石坑里藏著什么
推動醫(yī)改的“直銷樣本”
高速公路車牌識別標識站準確率驗證法
隨機微分方程的樣本Lyapunov二次型估計
村企共贏的樣本
西乌珠穆沁旗| 丘北县| 华安县| 淮滨县| 东乌珠穆沁旗| 彭阳县| 平乐县| 微博| 缙云县| 宜州市| 彝良县| 普安县| 神木县| 微博| 九寨沟县| 嘉禾县| 岳阳市| 博兴县| 舞钢市| 阜南县| 新民市| 井研县| 怀来县| 恩平市| 冀州市| 梁河县| 芜湖县| 门头沟区| 张家界市| 右玉县| 漯河市| 娱乐| 调兵山市| 荆门市| 富民县| 怀来县| 凌海市| 沧源| 喀喇| 富宁县| 马关县|