潘高威,史晉芳,邱 榮,王慧麗,萬 情,張志威,王 凱
(1.西南科技大學 極端條件物質(zhì)特性聯(lián)合實驗室,四川 綿陽 621010;2.西南科技大學 制造科學與工程學院,四川 綿陽621010;3.陸軍勤務學院 教研保障中心,重慶 401331)
激光誘導擊穿光譜(LIBS)技術是上世紀六十年代發(fā)展起來的一種原子發(fā)射光譜檢測技術。LIBS技術同時具有無需專門制樣、對樣品破壞小、靈敏度高、檢測限低等特點,在工業(yè)現(xiàn)場監(jiān)測、環(huán)境污染檢測、深空深海探測、文物鑒定等領域的研究熱度不斷上升[1]。中階梯光柵光譜儀相較于傳統(tǒng)光譜儀,具有分辨率高、衍射效率高的特點[2],是LIBS檢測技術的重要組成部分。但是,在利用中階梯光柵光譜儀作為激光誘導擊穿光譜分析的數(shù)據(jù)采集儀器時,為了增強弱峰信號,原始光譜數(shù)據(jù)中會存在周期性拱形基線,這種具有明顯區(qū)域分布的拱形基線主要來源于激光等離子體的連續(xù)白光背景輻射和中階梯光譜儀的周期性衍射效率差異,這不僅增加了光譜數(shù)據(jù)預處理的難度,也減少了定量分析的精度和準確性。因此為了減少這些特殊的基線對光譜數(shù)據(jù)的影響,基線校正成了LIBS數(shù)據(jù)處理中的一個重要環(huán)節(jié)。
常用的基線校正方法主要有多項式擬合[3-4]、小波變換[5-7]、懲罰最小二乘法[8-11]等。在多項式擬合中,利用最小二乘法對人為主觀選擇的擬合點進行多項式擬合,易導致過擬合或者欠擬合。小波變換通過將光譜信號分解成高頻和低頻2種信號。在低頻信號中刪去基線,針對不同種類的基線時,需要重新對小波函數(shù)和分解層數(shù)進行選擇,該方法也會產(chǎn)生無意義的負值,在處理復雜基線時效果并不理想。2003年,Eilser提出了一種基于whittaker平滑器原理的非對稱權重懲罰最小二乘法基線擬合算法(AsLS)[12],并將其成功運用于飛行時間質(zhì)譜分析的基線校正。趙恒等人將“局部對稱加權”與“非對稱加權”結合,提出了一種基于局部對稱權重加權懲罰最小二乘法(LSRPLS)[13],解決了非對稱懲罰最小二乘法在噪聲情況下擬合拉曼光譜基線時產(chǎn)生的局部抬升問題。但是由于LISB數(shù)據(jù)量大且光譜數(shù)據(jù)復雜,在將其他光譜基線校正方法運用在LIBS數(shù)據(jù)上時,會同時存在局部的欠擬合和過擬合現(xiàn)象。因此本文針對該周期性拱形基線的校正問題,提出了一種改進的懲罰最小二乘方法,在保留光譜數(shù)據(jù)有效信息的基礎上,進行了LIBS光譜數(shù)據(jù)的基線校正。
LIBS光譜數(shù)據(jù)的基線主要由2部分組成,一部分是由等離子在激發(fā)后所帶來的連續(xù)背景導致的光譜數(shù)據(jù)強度的整體抬升;另一部分就是中階梯光柵光譜儀特有的周期性拱形突起所帶來的局部變化。因此,要求基線擬合算法能在擬合連續(xù)背景的同時,不會忽視掉這一系列拱形突起。
LIBS光譜數(shù)據(jù)的基線主要來源于激光等離子體的連續(xù)白光背景輻射,由于中階梯光譜儀的多級衍射和波長間的衍射效率差異,導致連續(xù)白光背景輻射基線被多級衍射調(diào)制從而形成周期性拱形基線。這種周期性拱形基線的存在,會增加光譜數(shù)據(jù)預處理的難度,影響LIBS定量分析的精度。因此,進行基線擬合時必須考慮該因素。
假設有一個數(shù)據(jù)長度為 N的經(jīng)min-max標準化后的光譜數(shù)據(jù)y,設其擬合基線為z,利用 z的二階差分來定義擬合基線的粗糙度:
式中:R表示粗糙度; Δ2zi表示二階差分,Δ2zi=zi-2zi-1+zi-2,i∈[3,N] 。利用光譜強度 y 與擬合基線 z的差值來定義擬合線對于原始數(shù)據(jù)的保真度S (即擬合線對于原始數(shù)據(jù)的偏離程度):
式中:ωi為權重系數(shù)。ωi會隨著迭代的進行而發(fā)生改變,迭代的本質(zhì)是將譜峰視為突變信號而基線視作連續(xù)信號,突變信號會在一次次迭代中逐漸減少,其對應的權重系數(shù)也會減小,即權重的“非對稱性”。ωi的取值方式為
式中:p 為一個極小值,通常使 0.001≤p≤0.1。當yi高 于基線 zi時,則說明這部分數(shù)據(jù)為譜峰,將其權值設置為p;反之則認為這部分數(shù)據(jù)屬于基線部分,權值設置為1 -p,保留這部分數(shù)據(jù)。但是由于LIBS光譜數(shù)據(jù)量大,使用原始方法對 ωi進行賦值會導致在無譜峰位置處產(chǎn)生欠擬合,因此引入新的權值系數(shù)賦值方式:
然而擬合基線 z越光滑,則對理想基線的保真度就越低。為了同時滿足這2個方面的要求,令R作為懲罰項,引入代價函數(shù)Q =S+λR。λ為懲罰項系數(shù),取值在1 02~109之間。代價函數(shù)的矩陣形式為
式中:W 是主對角線為ω 的稀疏矩陣; D為二階差分矩陣 Dz=Δ2zi。因此求基線問題就轉變成了尋找一個能夠使Q達到最小值的z。為了使代價函數(shù)Q 最小化,令其對 z求偏導后等于零,得到:
此外,在用非對稱懲罰最小二乘法擬合LIBS光譜數(shù)據(jù)時,基線會在譜峰處有所抬升,且譜峰峰值越大,此處的基線受影響越大。因此引入懲罰系數(shù)數(shù)組α,在峰值處施加一個較大的懲罰系數(shù),對基線則施加一個較小的懲罰系數(shù),使擬合基線在譜峰位置處更加平滑,從而減小譜峰峰值對基線的影響。懲罰系數(shù)數(shù)組 α的取值方式如(7)式:
式中:dyi=yi+1-yi。α的數(shù)值根據(jù)標準化后光譜數(shù)據(jù)的一階導數(shù)確定,在譜峰數(shù)據(jù)變化率大的位置施加更大的懲罰系數(shù)。
在引入了α和新的ω的取值方式后,(6)式變?yōu)椋?)式:
本文算法流程如圖1所示,步驟如下:
圖1 改進后的算法流程圖Fig.1 Flow chart of improved algorithm
1)輸入預先經(jīng)過min-max標準化后光譜強度部分數(shù)據(jù)y;
2)初始化權重數(shù)組 ω 和懲罰數(shù)組α;
3)計算標準差 σ ,根據(jù)(8)式,計算擬合基線z;
4)根據(jù)光譜數(shù)據(jù) y與擬合基線 z的差值,對權重數(shù)組 ω和懲罰系數(shù)數(shù)組 α中的元素進行重新賦值;重復步驟3和步驟4,直至 ω 中的元素不再發(fā)生明顯變化;
5)迭代終止,將光譜數(shù)據(jù) y與擬合基線z相減得到去基線后的光譜數(shù)據(jù)。
在實際的光譜檢測中無法準確地得知其理論基線,因此需要通過仿真數(shù)據(jù)來模擬基線校正的過程,將改進后的基線校正方法與改進的非對稱懲罰最小二乘法(IAsLS)[14]、懲罰最小二乘法(PLS)、非對稱加權懲罰最小二乘法(asPLS)[8]和自適應迭代重加權懲罰最小二乘法(airPLS)[9]4種基線校正方法在仿真光譜數(shù)據(jù)上進行比較。LIBS光譜數(shù)據(jù)包含眾多重疊峰與強弱不一的峰,為了盡可能還原真實光譜數(shù)據(jù),模擬光譜數(shù)據(jù)由120個位置、半峰寬各不相同的洛倫茲峰、理論基線和信噪比為40的噪聲組成。洛倫茲峰計算公式如(9)式:
式中:N為譜峰個數(shù);Ai為光譜譜峰面積;hi為譜峰半高寬;ri為譜峰中心位置;x為光譜數(shù)據(jù)波長范圍 [200,711.5] (nm)。
圖2為不同基線擬合方法對模擬光譜進行擬合的結果,結合圖2(b)和圖2(c)可以看到,改進后的算法在短波段和長波段對模擬光譜均有良好的擬合效果,并在峰值處的基線抬升問題也得到了緩解。為驗證擬合基線的效果,計算去基線后譜峰峰值與無基線時譜峰峰值之間的均方根誤差Rpeak[15]以及擬合基線和理論基線之間的均方根誤差Rbase[16],計算結果見表1。從表1可知,在處理模擬光譜時,本文算法所估計的基線與理論基線更為接近,且能在一定程度上保留原始譜峰信息。
表1 基線校正前后譜峰峰值的均方根誤差Rpeak以及擬合基線和理論基線之間的均方根誤差RbaseTable 1 Rpeak of peak intensity before and after baseline correction and Rbase between fitting baseline and theoretical baseline
圖2 模擬光譜基線擬合結果Fig.2 Baseline fitting results of simulated spectrum
2.2.1 實驗裝置與樣品配置
實驗中采用的是共線雙脈沖激發(fā)方式,其示意圖如圖3所示,利用DG645控制激光出光的先后順序,第1束激光擊打在樣品表面產(chǎn)生等離子體,第2束激光則是對等離子體進行再加熱,利用光譜儀采集等離子體在冷卻時發(fā)出的光譜。使用的光譜儀為LTB公司的ARYELLE200型中階梯光譜儀,曝光時間設置為4 500 ms,延遲時間設置為3 μs,。制備樣品時,將標準土壤(GBW07386,GSS-32)或二氧化硅粉末(S5631-500)、PE微粉(HDPE,18180)和分析純化合物硝酸鈾酰,在瑪瑙研缽中研磨均勻并烘干,土壤和PE微粉的比例為3:1,共配置6個濃度的標準樣品。2束激光分別為波長1 064 nm、能量90 mJ與波長355 nm、能量50 mJ的激光。
圖3 LIBS實驗示意圖Fig.3 Schematic diagram of LIBS experiment
2.2.2 繪制定標曲線
為驗證本文算法實際應用的可行性,將其與4種不同基線校正方法進行比較。圖4是對整體光譜數(shù)據(jù)去基線后,選取UII 454.36 nm特征譜線作為分析對象繪制的定標曲線,可以看出,5種去基線方法下的定標曲線模型均有良好的性能。再結合表2可知,本文算法得到的定標曲線模型相關系數(shù)R2為0.997 2,且均方根誤差只有347.128 6,小于其他4種去基線方法得到的模型,即改進后的基線校正方法處理后的樣本數(shù)據(jù)偏離定標曲線的程度更小,說明在實際使用定標曲線進行定量分析時,本文方法能使去基線后的定標曲線模型依然有足夠的可靠性,更適合處理LIBS光譜數(shù)據(jù)的基線。
表2 定標曲線模型的相關系數(shù)和均方根誤差Table 2 Correlation coefficients and RMSE of calibration curve model
圖4 采用不同基線校正方法后的定標曲線Fig.4 Calibration curves with different baseline correction methods
本文針對激光誘導擊穿光譜檢測技術中中階梯光柵光譜儀所引起的基線局部拱形突起問題,提出一種改進的懲罰最小二乘基線擬合方法。該方法通過在譜峰區(qū)局部增大懲罰函數(shù)來減小基線擬合方法在譜峰區(qū)域中的局部突起現(xiàn)象,同時還優(yōu)化了權值數(shù)組的判別標準,避免了基線擬合方法在基線區(qū)域出現(xiàn)“欠擬合”現(xiàn)象,并在與其他四種去基線方法的仿真實驗中得到了驗證。通過對實際數(shù)據(jù)進行基線校正和繪制定標曲線,也證明了本文算法在實際應用中能提升定標曲線的回歸效果,有助于后續(xù)對元素進行定量分析。