舒開強(qiáng) 許應(yīng)銅 高智星 樊慶文 段憶翔* 林慶宇*
(1.四川大學(xué) 機(jī)械工程學(xué)院,成都 610065;2.中國原子能科學(xué)研究院 核物理所,北京 102413)
核電是一種清潔、高效的能源,使用核電可以減少對化石燃料的依賴,有利于改善環(huán)境污染狀況以及早日實(shí)現(xiàn)碳達(dá)峰、碳中和。鈾是核能發(fā)電的主要燃料,預(yù)計(jì)在2021年至2030年期間全球?qū)︹欃Y源的需求將增長27%[1]。鈾資源主要來源于鈾礦冶煉,因此,鈾礦的準(zhǔn)確勘探和成分快速檢測對鈾資源的供給意義重大[2]。為實(shí)現(xiàn)鈾礦的快速檢測,核領(lǐng)域迫切需要一種樣品制備簡單、操作安全、檢測快速且準(zhǔn)確的分析技術(shù),以達(dá)到快速完成勘探優(yōu)質(zhì)礦產(chǎn)資源的目的。
傳統(tǒng)元素分析方法主要有滴定法、分光光度法、電感耦合等離子體質(zhì)譜法、X射線熒光光譜法等,它們大多需要復(fù)雜樣品制備過程,對檢測環(huán)境有較高要求,檢測耗時(shí)較長,傳統(tǒng)分析方法更勝任實(shí)驗(yàn)室精準(zhǔn)分析場景,對目標(biāo)元素的現(xiàn)場快速檢測能力略顯不足[3]。激光誘導(dǎo)擊穿光譜(Laser-induced breakdown spectroscopy,簡稱LIBS)是一種基于激光等離子體的原子發(fā)射光譜技術(shù),具有樣品制備簡單、分析速度快[4]、多元素同時(shí)檢測[5]、遠(yuǎn)程分析[6]等突出優(yōu)點(diǎn),廣泛應(yīng)用于材料科學(xué)、生命科學(xué)、地質(zhì)學(xué)、生物醫(yī)學(xué)等諸多科學(xué)領(lǐng)域[7-9]。LIBS探測鈾的可行性于1987年由 WACHTER等[10]首次進(jìn)行了報(bào)道,當(dāng)前LIBS在核工業(yè)中已被用于核材料檢測(如礦石、氧化鈾、裂變產(chǎn)物等)[11]、同位素分析[12]、鋼及合金分析[13]、核聚變設(shè)施檢測[14]等方面。近年來,極限學(xué)習(xí)機(jī)、人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、隨機(jī)森林等機(jī)器學(xué)習(xí)算法被用于LIBS定性和定量分析,在諸多場景都展現(xiàn)出了良好的效果[15]。
本工作以自行搭建的LIBS系統(tǒng)為實(shí)驗(yàn)平臺,結(jié)合機(jī)器學(xué)習(xí)對鈾礦中U進(jìn)行了定量分析。采用偏最小二乘(Partial least squares,PLS)和隨機(jī)森林(Random forest,RF)算法優(yōu)化建立定量模型,通過綜合對比兩種模型在鈾礦中對U的定量效果,建立并優(yōu)化適合U定量分析的機(jī)器學(xué)習(xí)算法,以期望達(dá)到快速、準(zhǔn)確定量目的。本工作的數(shù)據(jù)處理和模型構(gòu)建均基于Python(3.8.8版)的Scikit-learn(1.2.2版)機(jī)器學(xué)習(xí)模塊完成。
LIBS系統(tǒng)采用Nd:YAG激光器(Litron lasers,Nano100,UK)作為激發(fā)源,激光波長1 064 nm、脈沖寬度6 ns、脈沖頻率10 Hz。光譜儀采用中階梯光譜儀(Aryelle 200,Lasertechnik Berlin GmbH,Germany),光譜范圍194 ~ 840 nm,分辨率為λ/Δλ= 9000,配備ICCD相機(jī)(iStar DH334T,Andor,UK)。激光束經(jīng)10倍聚焦物鏡聚焦到樣品表面,等離子體光譜由準(zhǔn)直透鏡和光纖傳輸?shù)焦庾V儀。在采集光譜數(shù)據(jù)時(shí),將光譜儀延遲時(shí)間設(shè)置為2.0 μs,激光能量為100 mJ。
鈾礦粉末標(biāo)準(zhǔn)樣品,編號分別為GBW04101、GBW04103及GBW04104,來自核工業(yè)部北京第五研究所(中國北京)與湖南鈾廠(中國衡陽)。實(shí)驗(yàn)樣本由粉末標(biāo)樣按一定比例配制,再經(jīng)壓片機(jī)16 MPa壓強(qiáng)壓制成直徑為20 mm的片狀樣本,一共壓制12組實(shí)驗(yàn)樣本,標(biāo)號為1#~12#,樣本中U質(zhì)量百分?jǐn)?shù)如表1所示。光譜采集過程中,為減小激光脈沖能量波動的影響,每一個(gè)光譜由脈沖激光燒蝕樣本200次,每個(gè)樣本采集15個(gè)光譜。
表1 樣本中鈾元素質(zhì)量百分比Table 1 Mass percentage of U in the sample /%
PLS算法結(jié)合了主成分分析、典型相關(guān)分析和多元線性回歸分析的優(yōu)點(diǎn),能夠有效克服多重共線性問題。RF是集成學(xué)習(xí)算法的典型代表,在分類和回歸問題上都有較好表現(xiàn)。本工作在構(gòu)建鈾礦中U的LIBS定量模型時(shí),首先對PLS和RF兩種機(jī)器學(xué)習(xí)算法的超參數(shù)進(jìn)行優(yōu)化,再用合適的超參數(shù)建立PLS模型和RF模型。
模型的定量效果用預(yù)測決定系數(shù)(The coefficient of determination,R2)、預(yù)測均方根誤差(Root mean square error of prediction,RMSEP)、相對偏差(Relative standard deviation,RSD)和相對誤差(Relative error,RE)等作為評判指標(biāo)[16],評估出適用于鈾礦中鈾元素的定量模型,以到達(dá)快速、準(zhǔn)確定量目的。
采用PLS和RF兩種算法構(gòu)建定量模型時(shí),將表1中3#、6#及9#三個(gè)樣本設(shè)為驗(yàn)證集,不參與模型的訓(xùn)練,只用于驗(yàn)證兩個(gè)模型的定量效果;其余所有樣本設(shè)為訓(xùn)練集,主要被用于兩種算法的超參數(shù)優(yōu)化以及定量模型訓(xùn)練。在前期對鈾的定量研究中[17],構(gòu)建定量模型時(shí)采用全部光譜數(shù)據(jù)作為輸入特征矩陣,數(shù)據(jù)維度龐大,致使參數(shù)優(yōu)化耗時(shí)較久,因此,本工作選用波長350 ~ 450 nm的光譜數(shù)據(jù)作為輸入特征矩陣,共7 427個(gè)特征值,極大降低了輸入數(shù)據(jù)維度的同時(shí),充分保留U的特征峰,對U進(jìn)行定量分析具有較好的代表性,該波段內(nèi)的光譜如圖1所示。
圖1 波長350 ~ 450 nm的U特征光譜圖Figure 1 Spectral diagram in the wavelength 350—450 nm.
主成分?jǐn)?shù)是影響PLS模型定量效果的關(guān)鍵因素,過多或過少的主成分?jǐn)?shù)都會影響定量準(zhǔn)確度;而影響RF模型定量結(jié)果的主要超參數(shù)則是模型中樹的數(shù)量,恰當(dāng)數(shù)量的樹可以提升模型定量準(zhǔn)確度。在參數(shù)優(yōu)化過程中,采用10折交叉驗(yàn)證方法,以交叉驗(yàn)證均方根誤差(Root mean square error of cross validation,RMSECV)為評估指標(biāo),最終選擇RMSECV最小時(shí)所對應(yīng)超參數(shù)作為模型參數(shù)。RMSECV表達(dá)式如下:
(1)
(2)
圖2 基于交叉驗(yàn)證均方根誤差的偏最小二乘和隨機(jī)森林模型參數(shù)優(yōu)化Figure 2 Parameter optimization of PLS and RF based on cross-validation RMSECV.
基于PLS和RF兩種機(jī)器學(xué)習(xí)算法的超參數(shù)優(yōu)化結(jié)果,構(gòu)建U的LIBS定量模型,模型校準(zhǔn)曲線如圖3所示。PLS模型和RF模型的線性相關(guān)系數(shù)分別達(dá)到了0.997和0.996,展現(xiàn)出兩種定量模型均具有較好的線性相關(guān)性。圖3的誤差棒結(jié)果顯示,訓(xùn)練集預(yù)測值的RSD均較小,表明兩個(gè)模型均具有良好的模型穩(wěn)定性。
圖3 U元素預(yù)測含量與真實(shí)含量的定標(biāo)曲線圖Figure 3 Calibration curves of predicted and true content of U.
使用三個(gè)驗(yàn)證集數(shù)據(jù)對PLS模型和RF模型的定量效果進(jìn)行驗(yàn)證,結(jié)果如表2所示。對于三個(gè)驗(yàn)證集,兩種模型計(jì)算出的RMSEP都較高,表明兩種模型對驗(yàn)證集中U的15次預(yù)測含量與真實(shí)含量之間具有一定的偏差;三個(gè)驗(yàn)證集RMSEP指標(biāo)方面,RF模型在低含量時(shí)表現(xiàn)稍好,RMSEP為24.76%,PLS模型則是在中高含量時(shí)表現(xiàn)稍強(qiáng),RMSEP分別為26.76%和33.05%。此外,驗(yàn)證集預(yù)測含量值的RSD整體稍高,表明同一個(gè)驗(yàn)證集的15次預(yù)測含量值比較分散,這種結(jié)果是由于LIBS采集到的光譜數(shù)據(jù)本身就具有較大波動性造成的,這也是LIBS仍需攻克的難題之一。在定量準(zhǔn)確度方面,PLS模型對三個(gè)驗(yàn)證集的RE分別是4.33%、6.63%和6.85%,RF模型的RE分別為22.33%、12.79%和12.04%,驗(yàn)證結(jié)果表明PLS模型對驗(yàn)證集15次預(yù)測含量的平均值與真實(shí)值更為接近,定量準(zhǔn)確度更高。另一方面,超參數(shù)優(yōu)化過程中,RF模型所消耗的時(shí)間遠(yuǎn)多于PLS模型,這主要是因?yàn)閮煞N定量算法本身復(fù)雜度不同而造成的。
表2 PLS和RF定量模型驗(yàn)證結(jié)果Table 2 Results of PLS and RF quantitative model validation
綜合對比PLS模型和RF模型,發(fā)現(xiàn)兩種模型都具有較好的穩(wěn)定性,在驗(yàn)證集定量準(zhǔn)確度方面,PLS模型效果更好,并且PLS模型的超參數(shù)優(yōu)化過程更快速,因此,在本研究中PLS模型更適合用于鈾礦中U的現(xiàn)場快速定量分析。
本工作結(jié)合機(jī)器學(xué)習(xí)開展了鈾礦中U的LIBS定量分析方法研究,對比了PLS和RF兩種算法對U的定量效果。結(jié)果顯示,PLS模型比RF模型獲得了更好的定量準(zhǔn)確度,同時(shí)PLS算法的檢測速率更快,因此,PLS比RF更適合在鈾礦中U的LIBS定量分析。本工作為后續(xù)研發(fā)鈾礦中U的LIBS現(xiàn)場分析儀器奠定了理論基礎(chǔ),后續(xù)將面向不同鈾礦基質(zhì),開展復(fù)雜基質(zhì)中如何提高LIBS信號穩(wěn)定性和定量準(zhǔn)確度的相關(guān)研究工作。