胡創(chuàng)業(yè),何高魁,陳福龍,劉 威
(1.中國原子能科學(xué)研究院 核技術(shù)應(yīng)用研究所,北京 102413;2.南華大學(xué) 核科學(xué)技術(shù)學(xué)院,湖南 衡陽 421001)
目前n/γ甄別的主流方法是數(shù)字脈沖波形甄別方法(DPSD),其主要包括基于時(shí)間域特征的上升時(shí)間[1]、過零時(shí)間[2]、電荷比較[2]和脈沖梯度分析法[3];基于頻率域特征的頻率比較和梯度法[4];基于時(shí)間和頻域局部特征的小波變換甄別法[5];基于支持向量機(jī)(SVM)[6]和BP神經(jīng)網(wǎng)絡(luò)[7]等機(jī)器學(xué)習(xí)甄別方法等。模式識別是人類的一項(xiàng)基本智能,計(jì)算機(jī)模式識別在20世紀(jì)60年代初迅速發(fā)展并成為一門新學(xué)科。模式識別是指對表征事物或現(xiàn)象的各種形式(數(shù)值的、文字的和邏輯關(guān)系的)信息進(jìn)行處理和分析,以對事物或現(xiàn)象進(jìn)行描述、辨認(rèn)、分類和解釋的過程,是信息科學(xué)和人工智能的重要組成部分。數(shù)字相關(guān)模式識別(DCPR)法已被應(yīng)用于文本數(shù)據(jù)挖掘與分類、信息檢索、信息過濾、機(jī)器翻譯和文本查重等文字識別、語音識別、指紋識別和生物認(rèn)證、遙感圖像識別和醫(yī)學(xué)診斷等領(lǐng)域,取得較好的人工智能分類效果。
近幾年來,國內(nèi)外學(xué)者開展了基于DCPR法的n/γ甄別相關(guān)方法研究。文獻(xiàn)[8]在2011年最早開展此方法用于n/γ甄別研究,得到的結(jié)論是低能區(qū)品質(zhì)因子(FOM)小于1;文獻(xiàn)[9]在2015年在討論數(shù)字化儀采用不同采樣率和垂直分辨率對甄別方法FOM影響時(shí)提到了DCPR法,其采用BC501液閃探測器和241Am-9Be源,但并未對DCPR法作重點(diǎn)介紹;文獻(xiàn)[10]在2018年對該方法進(jìn)行了相關(guān)研究得到低能區(qū)FOM在0.82左右。文獻(xiàn)[8]的散點(diǎn)圖隨n和γ射線能量增加發(fā)生明顯彎曲現(xiàn)象,夾角弧度先減小后增大;文獻(xiàn)[10]的散點(diǎn)圖也有彎曲現(xiàn)象,夾角弧度隨n和γ射線能量的增加也是先減小后增大;文獻(xiàn)[9]的樣本數(shù)例相對較少,散點(diǎn)圖亦發(fā)生了輕微彎曲。通過對文獻(xiàn)[8-10]分析發(fā)現(xiàn),三者對DCPR法進(jìn)行研究時(shí)均采用的是以γ射線作為參考脈沖計(jì)算的夾角余弦和弧度,能否采用n作為參考脈沖進(jìn)行夾角相似度計(jì)算,目前國內(nèi)外學(xué)者尚未見研究,本文開展以n作為參考脈沖的DCPR法研究,探討采用n作為參考脈沖后FOM的大小及FOM的影響因素。
本文的數(shù)據(jù)獲取框圖如圖1所示,采用241Am-9Be放射源、美國ELJEN公司φ5×2 inch的EJ301液體閃爍體探測器、CAEN公司的數(shù)字化儀DT5751和PC機(jī),獲得的脈沖波形數(shù)據(jù)采用數(shù)據(jù)平滑、歸一化和最大值對齊等方法進(jìn)行預(yù)處理。
圖1 數(shù)據(jù)獲取框圖Fig.1 Schematic view of data acquisition system
EJ301液體閃爍體探測器主要由C和H等低原子序數(shù)物質(zhì)組成,γ射線與液體閃爍體探測器發(fā)生相互作用主要是康普頓效應(yīng),因此只能利用康普頓邊緣進(jìn)行能量刻度,本工作能量刻度采用137Cs和60Co源,結(jié)合241Am-9Be的12C*第一激發(fā)態(tài)退激γ射線能量為4.439 MeV,最終確定探測器高壓為-1 750 V。
相關(guān)模式識別是通過特征向量提取和相似度計(jì)算將數(shù)據(jù)區(qū)分成不同類別的聚類行為。相似度計(jì)算法有基于歐式、余弦、杰卡德、海明和最小編輯距離等。目前n/γ甄別采用的是余弦相似度計(jì)算法,假設(shè)兩個(gè)向量為a(x1,y1)和b(x2,y2),由余弦定理可得:
(1)
cosθ=
(2)
余弦相似度計(jì)算法中兩個(gè)向量夾角余弦值作為衡量兩個(gè)向量之間差異的大小。余弦值越接近1,表明兩個(gè)向量越相似;余弦值越接近于0,表明兩個(gè)向量越不相似。
多維空間向量X(Xistart,Xistart+1,…,Xistop)和Y(Yistart,Yistart+1,…,Yistop)的余弦函數(shù)為:
(3)
式中,istart、istop為空間向量維數(shù)的起點(diǎn)和終點(diǎn)。在本文中istart和istop分別代表參與運(yùn)算的n和γ脈沖信號空間向量維數(shù)的起點(diǎn)和終點(diǎn)(圖2)。
圖2 參與運(yùn)算的脈沖信號起點(diǎn)和終點(diǎn)Fig.2 istart and istop of pulse signal involved in calculation
DCPR法中參考脈沖的選擇對FOM有較大影響,首先取上升沿最大值10%作為起點(diǎn),下降沿10%作為終點(diǎn)計(jì)算脈沖寬度。選擇參考脈沖時(shí)依據(jù)脈沖寬度的直方圖進(jìn)行篩選,窄的脈沖是γ,寬的脈沖是n。DCPR法計(jì)算時(shí)分別挑選出1個(gè)n和1個(gè)γ作為參考峰。20萬個(gè)樣本中n和γ的脈沖寬度分布如圖3所示。
本文參考脈沖選擇采用以下2種方案。
1) 方案1
選擇圖3中γ和n脈沖寬度頻率最大、脈沖寬度為24 ns的γ和36 ns的n作為參考脈沖,選取istart=36 ns、istop=181 ns計(jì)算出相對n和γ參考脈沖的余弦值直方圖,如圖4所示。由圖4a可看出,余弦值在0.97附近存在一高斯分布,它是γ脈沖和36 ns中子參考脈沖夾角余弦值分布直方圖;余弦值在1附近的直方圖是高斯分布的一半,是由于36 ns參考脈沖附近的中子利用余弦值在利用式(3)計(jì)算時(shí)并無正負(fù)區(qū)別,故造成此分布。
圖3 脈沖寬度分布Fig.3 Histogram of pulse width
a——以36 ns的n作為參考脈沖;b——以24 ns的γ作為參考脈沖圖4 方案1余弦值直方圖Fig.4 Histogram of cosine for case 1
2) 方案2
選擇脈沖寬度較窄的γ和較寬的n作參考脈沖,它們與脈沖寬度頻率較大處的γ和n信號夾角余弦值會(huì)減小,將出現(xiàn)雙高斯峰分布。本文選擇脈沖寬度為13 ns的γ和為61 ns的n作為參考信號,選取istart=36 ns、istop=181 ns進(jìn)行計(jì)算得到的余弦值直方圖如圖5所示。圖5中出現(xiàn)兩個(gè)高斯脈沖,且圖5b的情況優(yōu)于圖5a,這表明當(dāng)選取脈沖寬度61 ns的n作為參考脈沖時(shí),其FOM優(yōu)于選取脈沖寬度13 ns的γ作為參考脈沖。因此,本文最終選取方案2中脈沖寬度為61 ns的n作為參考脈沖。
本文依據(jù)方案2通過將多組61 ns的n信號取平均作為參考脈沖,istart和istop分別取36 ns和181 ns,其n/γ的FOM計(jì)算公式為:
(4)
式中:μn和μγ分別為n峰和γ峰的均值;FWHMn、FWHMγ分別為n峰和γ峰的半高全寬。FOM越大,表明甄別效果越理想,通過高斯擬合計(jì)算得到FOM=1.03(圖6)。
a——以13 ns的γ作為參考脈沖;b——以61 ns的n作為參考脈沖圖5 方案2余弦值直方圖Fig.5 Histogram of cosine for case 2
圖6 計(jì)算的品質(zhì)因子Fig.6 Calculation quality factor
1) istart對FOM的影響
從圖2可看出,n/γ在上升沿和最大值附近差異不大,主要差異在下降沿部分。本文將istop固定為181 ns,計(jì)算出取不同istart時(shí)的FOM,如圖7所示。當(dāng)istart太小時(shí),信號的上升沿和最大值均參與計(jì)算,由于脈沖信號上升階段和最大值附近差異小但對整個(gè)余弦值計(jì)算貢獻(xiàn)大,此時(shí)FOM并不是最好;當(dāng)istart太大時(shí),γ脈沖信號參與余弦值計(jì)算的空間向量維數(shù)太小,不能很好地將γ信號區(qū)分開。因此,istart的取值對FOM影響較大,當(dāng)istop取181 ns、istart取32 ns時(shí)FOM最大。
圖7 不同istart的品質(zhì)因子Fig.7 FOM of different istarts
2) istop對FOM影響
將istart固定為32 ns,改變istop大小計(jì)算得到對應(yīng)的FOM,結(jié)果如圖8所示??煽闯?,istop的取值對FOM的影響較小,當(dāng)istop取150~180 ns之間時(shí)效果相對較好,在161 ns時(shí)FOM取得最大值1.137。
圖8 不同istop的品質(zhì)因子Fig.8 FOM of different istops
通過上述討論可知,F(xiàn)OM對istart的依賴性很大而對istop的依賴性較小,依據(jù)最佳參數(shù)做出余弦值和脈沖積分(電荷量)的散點(diǎn)圖和熱度圖,如圖9所示,可看出,散點(diǎn)圖隨能量升高并未出現(xiàn)彎曲情況。
本文研究結(jié)果表明數(shù)字相關(guān)模式識別法可用于甄別n和γ,脈沖寬度較窄的γ和較寬的n作參考脈沖較脈沖寬度頻率最大的γ和n作參考脈沖效果好,且將n作為參考脈沖較文獻(xiàn)[8-10]選取γ作為參考脈沖的效果更好。istart的取值對FOM影響較大,應(yīng)選取在32 ns最為合適,istop的取值對FOM的影響不大,取150~180 ns的效果相對較好。本文以脈沖寬度為61 ns的n作為參考脈沖,取istart=32 ns、istop=161 ns得到241Am-9Be源最高FOM為1.137,取得了較好的甄別效果。
a——散點(diǎn)圖;b——熱度圖圖9 電荷量和余弦值的散點(diǎn)圖和熱度圖Fig.9 Scatte plot and heatmap plot for charge vs cosine