高春宇 湯秀章 陳欣南 李雨芃 呂建友
(中國(guó)原子能科學(xué)研究院 北京市 102413)
2003 年,美國(guó)洛斯-阿拉莫斯國(guó)家實(shí)驗(yàn)室LANL (Los Alamos National Laboratory) 根據(jù)模擬和實(shí)驗(yàn)結(jié)果,提出利用μ 子的多重庫(kù)倫散射現(xiàn)象探測(cè)隱藏在集裝箱中的核材料,引起世界上許多科學(xué)家的廣泛關(guān)注,極大地推動(dòng)了μ 子在核探測(cè)領(lǐng)域的研究應(yīng)用。地球上的μ 子大都來(lái)自于太空中的宇宙射線(xiàn),在地球海平面處平均能量為3GeV,平均通量約為10000m·min。μ 子作為一種天然輻射源,沒(méi)有輻照危害,同時(shí)對(duì)高Z 物質(zhì)敏感,穿透能力強(qiáng),在核材料檢測(cè)技術(shù)應(yīng)用中具備天然優(yōu)勢(shì)。
根據(jù)μ 子穿過(guò)被探測(cè)物體后的散射角分布進(jìn)行成像,LANL 等先后提出了多種圖像重建算法,其中最典型的是PoCA 算法和MLSD 算法。由于天然μ 子的通量有限,為了提高μ 子成像的圖像質(zhì)量,通常需要較長(zhǎng)的檢測(cè)時(shí)間,而在集裝箱、貨物核材料走私檢測(cè)等要求時(shí)效性的現(xiàn)場(chǎng)應(yīng)用場(chǎng)景,需要快速地進(jìn)行材料識(shí)別。對(duì)于μ 子材料識(shí)別,清華大學(xué)研究了基于支持向量機(jī)的聚類(lèi)分析和分類(lèi)器,根據(jù)散射密度的平均值和標(biāo)準(zhǔn)偏差進(jìn)行物質(zhì)識(shí)別。中國(guó)科學(xué)技術(shù)大學(xué)通過(guò)計(jì)算待識(shí)別目標(biāo)物與參考物之間散射角的灰色關(guān)聯(lián)度快速識(shí)別材料。
為提高宇宙射線(xiàn)μ 子探測(cè)核材料的實(shí)用性,縮短探測(cè)時(shí)間,我們提出一種將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于μ 子成像材料識(shí)別的方法。利用Geant4 蒙卡程序中的宇宙射線(xiàn)生成器CRY 軟件包,加入角度和能量分布信息模擬產(chǎn)生天然環(huán)境μ 子源,μ 子成像探測(cè)器模型由上下兩部分共4 層100cm×100cm 的探測(cè)器陣列構(gòu)成,10cm×10cm×10cm 的鋁、鐵、鎢作為被探測(cè)樣品放入探測(cè)區(qū)域中心,使用PoCA 算法處理模擬數(shù)據(jù)得到μ 子散射角分布,構(gòu)建基于卷積神經(jīng)網(wǎng)絡(luò)的材料識(shí)別模型,通過(guò)數(shù)據(jù)訓(xùn)練優(yōu)化模型并測(cè)試樣品在1 分鐘、2 分鐘、 5 分鐘和10 分鐘不同探測(cè)時(shí)間下的識(shí)別準(zhǔn)確度。
宇宙線(xiàn)μ 子穿過(guò)被探測(cè)樣品時(shí),會(huì)發(fā)生多次小角度的庫(kù)倫散射,每次小角度散射都會(huì)對(duì)粒子運(yùn)動(dòng)產(chǎn)生一定的影響,多次散射積累使得μ 子的運(yùn)動(dòng)方向產(chǎn)生了偏移,μ 子散射成像利用散射角分布與材料原子序數(shù)的關(guān)系進(jìn)行成像和識(shí)別。根據(jù)莫里埃理論,μ 子的散射角θ 近似服從期望為0 的高斯分布,分布均方根RMS 為:
本文使用Geant4 程序進(jìn)行宇宙射線(xiàn)μ 子散射成像的蒙特卡羅模擬,建立實(shí)驗(yàn)裝置模型。在模擬中,定義上下兩部分共4 層100cm×100cm 的探測(cè)器陣列記錄μ 子的位置信息,上部分探測(cè)器用來(lái)擬合入射徑跡,下部分探測(cè)器用來(lái)擬合出射徑跡,每層探測(cè)器高度間隔30cm,上下兩部分探測(cè)器之間為探測(cè)區(qū)域,高度100cm,探測(cè)面積100cm×100cm,分別將10cm×10cm×10cm 的鋁、鐵、鎢塊放入探測(cè)區(qū)域中心,使用宇宙射線(xiàn)生成器CRY 軟件包,引入海平面宇宙線(xiàn)μ 子能譜及角分布源項(xiàng)進(jìn)行天然環(huán)境模擬。
考慮到地球海平面處μ 子通量約為10000m·min,模擬顯示在100cm×100cm 的探測(cè)區(qū)域上,1 分鐘大約有1600個(gè)μ 子能夠穿過(guò)四層探測(cè)器,重建有效徑跡。在本模型中,1600 條μ 子散射角數(shù)據(jù)等效于1 分鐘的探測(cè)時(shí)間,依次模擬不同的探測(cè)時(shí)間,輸出各層探測(cè)器記錄的μ 子位置信息。
徑跡重建算法PoCA 假設(shè)μ 子的多次庫(kù)倫散射為一次散射的結(jié)果,計(jì)算簡(jiǎn)單,運(yùn)算量小,本文使用PoCA 算法處理Geant4 模擬數(shù)據(jù)并重建μ 子徑跡。對(duì)經(jīng)過(guò)探測(cè)區(qū)域的有效μ子的位置信息進(jìn)行徑跡擬合,重建μ 子入射、出射徑跡,延長(zhǎng)入射、出射徑跡得到的交點(diǎn)認(rèn)為是μ 子的近似散射點(diǎn),即PoCA 點(diǎn),兩條徑跡的夾角作為μ 子的散射角。
根據(jù)聚類(lèi)分析的思想,將100cm×100cm 探測(cè)區(qū)域劃分為50×50 的網(wǎng)格,每個(gè)網(wǎng)格為2cm×2cm,獲取穿過(guò)每個(gè)網(wǎng)格的所有μ 子的散射角,計(jì)算該網(wǎng)格的散射密度。根據(jù)散射密度的定義,得到第i 個(gè)網(wǎng)格散射密度的估計(jì)值為:
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN)是一類(lèi)包含卷積計(jì)算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),是深度學(xué)習(xí)的代表算法之一,通常由卷積層、池化層和全連接層三層結(jié)構(gòu)組成。卷積神經(jīng)網(wǎng)絡(luò)中每個(gè)神經(jīng)元只與輸入神經(jīng)元的部分區(qū)域連接,捕獲局部數(shù)據(jù)信息,保證學(xué)習(xí)后的卷積核能夠?qū)植刻卣饔凶顝?qiáng)的響應(yīng)。同時(shí)卷積核參數(shù)共享,用同一個(gè)卷積核提取特征,進(jìn)一步減少了參數(shù)的數(shù)量。采用局部連接和權(quán)值共享能夠降低網(wǎng)絡(luò)的復(fù)雜度,提高學(xué)習(xí)速率。
我們將散射密度矩陣作為網(wǎng)絡(luò)的輸入數(shù)據(jù),維度由50×50 重置為1×2500,定義了一個(gè)包含兩個(gè)卷積層、兩個(gè)池化層和一個(gè)全連接層的簡(jiǎn)單的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。第一個(gè)卷積層有64 個(gè)(3x3)卷積核,第二個(gè)卷積層有32 個(gè)(3x3)卷積核,卷積層通過(guò)卷積核與輸入數(shù)據(jù)進(jìn)行卷積計(jì)算,以?huà)呙璧姆绞綄?duì)輸入數(shù)據(jù)進(jìn)行特征提取。卷積層輸出的特征圖被傳遞至池化層進(jìn)行特征選擇和信息過(guò)濾,進(jìn)一步降低數(shù)據(jù)維度,加快模型訓(xùn)練速度。如圖1 所示,經(jīng)過(guò)多輪卷積層和池化層的處理后,50×50 的散射密度矩陣被抽象成高階特征,由全連接層對(duì)提取的特征進(jìn)行非線(xiàn)性組合以得到預(yù)測(cè)輸出,給出分類(lèi)結(jié)果。由于線(xiàn)性模型的表達(dá)能力不夠,最后使用激活函數(shù)Softmax 加入非線(xiàn)性因素,把卷積層輸出結(jié)果做非線(xiàn)性映射。
圖1:基于卷積神經(jīng)網(wǎng)絡(luò)的材料識(shí)別模型
卷積神經(jīng)網(wǎng)絡(luò)通過(guò)迭代更新網(wǎng)絡(luò)權(quán)重來(lái)優(yōu)化模型,一次訓(xùn)練迭代包括前向傳播、損失函數(shù)、反向傳播和參數(shù)更新四個(gè)過(guò)程。前向傳播是將訓(xùn)練數(shù)據(jù)從輸入層經(jīng)過(guò)卷積層、池化層與全連接層逐層變換最終到達(dá)輸出層,得到網(wǎng)絡(luò)對(duì)輸入數(shù)據(jù)的預(yù)測(cè)。根據(jù)損失函數(shù)進(jìn)行反向傳播,即確定對(duì)損失貢獻(xiàn)最大的權(quán)重,并使用交叉熵?fù)p失函數(shù)調(diào)整優(yōu)化權(quán)重來(lái)減少損失,表達(dá)式為:其中η 為學(xué)習(xí)率。由式(10)可知,權(quán)重的更新速度與誤差(a-y)呈線(xiàn)性關(guān)系,當(dāng)誤差大的時(shí)候,權(quán)重更新快,當(dāng)誤差小的時(shí)候,權(quán)重更新慢。程序重復(fù)這個(gè)過(guò)程,對(duì)每組訓(xùn)練數(shù)據(jù)進(jìn)行迭代。圖2 給出了模型材料識(shí)別的準(zhǔn)確度和損失函數(shù)隨迭代次數(shù)的變化曲線(xiàn),隨著不斷迭代,準(zhǔn)確度逐漸收斂,最終得到一個(gè)最優(yōu)權(quán)重集合,獲得一個(gè)訓(xùn)練好的預(yù)測(cè)模型,使用該模型執(zhí)行材料分類(lèi)任務(wù)。
圖2:模型準(zhǔn)確度和損失函數(shù)隨迭代次數(shù)的變化
我們對(duì)10cm×10cm×10cm 的鋁、鐵和鎢三種材料分別進(jìn)行1 分鐘、2 分鐘、5 分鐘和10 分鐘探測(cè)時(shí)間的模擬,其中每分鐘約有1600 條有效μ 子徑跡。定義材料x(chóng)正確識(shí)別的準(zhǔn)確度為( X={鋁,鐵,鎢}, x∈X):
定義總體準(zhǔn)確度為:
分別用探測(cè)時(shí)間為1 分鐘、2 分鐘、5 分鐘和10 分鐘的散射密度矩陣測(cè)試網(wǎng)絡(luò)的材料識(shí)別準(zhǔn)確度。結(jié)果如下:
如表1 所示,取鋁、鐵、鎢作為低、中、高原子序數(shù)的代表材料,探測(cè)時(shí)間為1 分鐘時(shí),由于μ 子的散射角數(shù)據(jù)量有限,材料識(shí)別的準(zhǔn)確度較低。2 分鐘時(shí),由于重核材料鎢與輕核材料鋁的原子序數(shù)相差較大,Δ Z(W, Al)=61,材料識(shí)別準(zhǔn)確度均已達(dá)到80%;而鐵與鋁、鐵與鎢均容易混淆,鐵的識(shí)別準(zhǔn)確度較低。5 分鐘時(shí),μ 子穿過(guò)被探測(cè)物體的散射角數(shù)據(jù)較多,用來(lái)訓(xùn)練網(wǎng)絡(luò)的散射密度矩陣中非零網(wǎng)格的比例有所提高,三種材料識(shí)別的準(zhǔn)確度均在80%之上,鋁與鎢的誤報(bào)率t(Al,W)、t(W,Al)均為0,鐵與鋁也能較好地區(qū)分,而鐵與鎢之間的誤報(bào)率仍在15%。探測(cè)時(shí)間為10 分鐘時(shí),總體材料識(shí)別準(zhǔn)確度達(dá)到91.9%。
表1:不同探測(cè)時(shí)間下識(shí)別三種材料的準(zhǔn)確度/%(密度單位:g/cm3)
我們根據(jù)宇宙射線(xiàn)μ 子穿過(guò)被探測(cè)物體時(shí)散射密度與材料原子序數(shù)的相關(guān)性,構(gòu)建了包含兩個(gè)卷積層、兩個(gè)池化層和一個(gè)全連接層的卷積神經(jīng)網(wǎng)絡(luò)材料識(shí)別模型,最終測(cè)試樣品在不同時(shí)間下的識(shí)別準(zhǔn)確度。結(jié)果表明,對(duì)于10cm×10cm×10cm 的鋁、鐵、鎢的探測(cè)樣本,當(dāng)探測(cè)時(shí)間為1 分鐘、2 分鐘、5 分鐘和10 分鐘時(shí),總體識(shí)別準(zhǔn)確度分別為66.4%、79.3%、86.8%和91.9%。
本文證明了采用卷積神經(jīng)網(wǎng)絡(luò)的方法用于μ 子成像材料識(shí)別的有效性,目前建立了簡(jiǎn)單的網(wǎng)絡(luò)模型,還需要進(jìn)一步優(yōu)化算法。