劉一江 閆春華 李茂剛 張?zhí)忑?湯宏勝 李 華,
(1.西安石油大學(xué) 化學(xué)化工學(xué)院,西安 710065;2.西北大學(xué) 化學(xué)與材料科學(xué)學(xué)院,合成與天然功能分子教育部重點(diǎn)實(shí)驗(yàn)室,西安 710127)
石油焦是由原油中的重質(zhì)碳?xì)浠衔锝?jīng)高溫分解后形成的,在工業(yè)中扮演著重要的角色。隨著化工市場規(guī)模持續(xù)擴(kuò)大,重油加工業(yè)的需求急劇增長[1],導(dǎo)致石油焦(作為渣油延遲焦化的重要副產(chǎn)物[2])的產(chǎn)量顯著上升。這是一種堅(jiān)硬而易碎的多孔材料[3],主要由90%~97%的碳和1.5%~8.0%的氫組成,還含有少量的氧、氮、硫和微量金屬[4]。2020年,我國石油焦產(chǎn)量達(dá)到了2 517萬t,消耗量高達(dá)3 488萬t[5]。目前,大部分石油焦已被廣泛應(yīng)用于石墨生產(chǎn)、電解鋁、煉制等化工領(lǐng)域。
石油焦高碳含量、高熱值、低灰分和低成本等特性使其成為電解鋁工業(yè)的重要原料之一[6]。然而石油焦在生產(chǎn)和運(yùn)輸過程中往往會帶入微量元素,例如Fe、Cu等。這些微量元素對于陽極的質(zhì)量乃至電解出的鋁都可能會帶來危害,它們會增加鋁的電阻率,降低鋁的機(jī)械性能和純度。尤其是Cu,它的含量每增加0.1%,鋁的電阻率就會增加0.4%[7-8]。因此,準(zhǔn)確快速地測定石油焦中微量元素的含量在支持降低石油焦中微量元素含量并提高陽極質(zhì)量方面非常重要。
對石油焦中微量元素的傳統(tǒng)測定分析方法包括火焰原子吸收光譜法(Flame atomic absorption spectrometry,FAAS)[9]、原子吸收光譜法(Atomic absorption spectrometry,AAS)[10]、波長色散X射線熒光光譜法(Wavelength dispersive X-ray fluorescence spectrometry,WD-XRF)[11]和電感耦合等離子體原子發(fā)射光譜(Inductively coupled plasma atomic emission spectroscopy,ICP-AES)[12]法等。這些方法可以對石油焦中微量元素的含量進(jìn)行測定,并可以提供極為準(zhǔn)確的結(jié)果。但它們也有各自的不足。當(dāng)使用AAS、FAAS和ICP-AES時(shí),需要將石油焦溶解至試劑中進(jìn)行檢測,而溶解方法如高溫溶解或微波消解不僅過程復(fù)雜、成本高和耗時(shí)長,還只能由有經(jīng)驗(yàn)的分析師在實(shí)驗(yàn)室中進(jìn)行。這樣大量的預(yù)處理工作還可能導(dǎo)致較大的實(shí)驗(yàn)誤差。GAZULLA等[13-14]均用WD-XRF方法來確定石油焦樣本中微量元素的含量,其測定結(jié)果優(yōu)于美國材料與試驗(yàn)協(xié)會的標(biāo)準(zhǔn)ASTM-D 6376,然而石油類產(chǎn)品的組成具有極高的復(fù)雜性和差異性,仍能觀察到這些因素對該方法產(chǎn)生的干擾。因此,急需一種可快速、準(zhǔn)確且無需對樣本進(jìn)行復(fù)雜處理的分析方法,以實(shí)現(xiàn)樣本的無損或微損檢測。
激光誘導(dǎo)擊穿光譜(LIBS)技術(shù)是一種激光作為激發(fā)源的全新物質(zhì)元素分析技術(shù)。該技術(shù)使用激光脈沖照射待測物體表面,激發(fā)樣本產(chǎn)生等離子體。通過獲取等離子體在產(chǎn)生到消亡過程中發(fā)出的光信號得到LIBS光譜,從而進(jìn)行定性和定量分析。與傳統(tǒng)的分析方法相比,激光誘導(dǎo)擊穿光譜技術(shù)具備以下顯著優(yōu)勢:無需繁瑣的樣本預(yù)處理、可實(shí)現(xiàn)微損或無損檢測、能夠進(jìn)行快速的實(shí)時(shí)在線分析、適用于惡劣環(huán)境,如深空和高輻射區(qū)域中的遠(yuǎn)距離測量以及具備多元素同時(shí)分析的能力。這些特點(diǎn)使得LIBS技術(shù)在科學(xué)研究、工業(yè)應(yīng)用以及其他領(lǐng)域中備受歡迎。因此,LIBS技術(shù)已在古董鑒定和評估、土壤重金屬分析、冶金過程分析、太空和軍事探測、生物醫(yī)學(xué)、爆炸物檢測等領(lǐng)域廣泛應(yīng)用[15-20]。
盡管LIBS在元素分析中具有顯著的優(yōu)勢,但它仍然面臨一些挑戰(zhàn)。例如,對于定量分析,需要建立準(zhǔn)確的標(biāo)定方法,以將LIBS光譜與元素濃度相關(guān)聯(lián)。但由于激光能量波動、樣本表面不均勻以及外部環(huán)境等因素的影響,使得直接定量分析困難?;瘜W(xué)計(jì)量學(xué)方法,如偏最小二乘(PLS)、嶺回歸(Ridge regression)、隨機(jī)森林(Random forest,RF)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural networks,CNN)等對LIBS光譜數(shù)據(jù)進(jìn)行復(fù)雜的多元分析,處理噪聲、校準(zhǔn)光譜信號,并建立精確的濃度模型,幫助識別和定量分析樣本中的化學(xué)成分。LIBS和化學(xué)計(jì)量學(xué)結(jié)合能夠更準(zhǔn)確和穩(wěn)定地用于各種定量分析任務(wù)[21]。
本文擬探究LIBS技術(shù)結(jié)合PLS算法用于石油焦中Fe和Cu定量分析的可行性。首先,采集了石油焦實(shí)際樣本的LIBS光譜,并基于LIBS光譜構(gòu)建用于石油焦中Fe和Cu定量分析的PLS校正模型。其次,考察了不同光譜預(yù)處理方法對PLS校正模型預(yù)測性能的影響。然后,在最優(yōu)的光譜預(yù)處理基礎(chǔ)上優(yōu)化并使用變量選擇算法建立PLS校正模型。最后,比較基于兩種不同變量選擇算法的PLS模型的預(yù)測性能,并選擇最優(yōu)結(jié)果作為石油焦中Fe和Cu定量分析的最優(yōu)預(yù)測模型。
從某石化公司獲得了19個(gè)實(shí)際的石油焦樣本塊。首先使用球磨機(jī)(南京萊步科技QM-3SP2行星式球磨機(jī))將這些樣本研磨成粒徑小于75 μm的粉末,并經(jīng)過74 μm(200目)篩分。然后取出一定量的石油焦樣本粉末,在110 ℃下干燥2 h,待冷卻至室溫后,將每個(gè)樣本依次稱取1.2 g(精確至0.000 1 g)粉末置于離心管中備用。使用壓片機(jī)(Pinchuang Technology,PC-24)以30 MPa的壓力維持5 min,制備Φ20 mm×4 mm的樣片。每個(gè)石油焦樣本制備一個(gè)樣片。采用ICP-MS對19個(gè)石油焦樣本中Fe和Cu進(jìn)行檢測,將所測得的真實(shí)值作為參考值。石油焦中Fe和Cu的參考值如表1所示。
表1 石油焦樣本中Fe和Cu含量的參考值
使用自行搭建的激光誘導(dǎo)擊穿光譜采集裝置(圖1)進(jìn)行光譜采集。采用Q-switched Nd:YAG激光器(Dawa300,鐳寶光電技術(shù)有限公司)作為激發(fā)光源,激發(fā)波長為1 064 nm,激光脈沖電壓為720 V,激光頻率為5 Hz。將19個(gè)石油焦樣本依次放置于三維可調(diào)樣本臺上進(jìn)行LIBS光譜采集。激光束通過50 mm的透鏡聚焦在石油焦樣本表面,激發(fā)等離子體。與激光束45°的石英準(zhǔn)直透鏡收集等離子體產(chǎn)生的光譜信號,通過光纖傳輸至三通道光譜儀(Ocean optics,MX2500,波長200~550 nm),延遲時(shí)間為3 μs,門寬為2 ms。在標(biāo)準(zhǔn)大氣壓下進(jìn)行光譜信號的采集。為了減少誤差,在每個(gè)樣本上隨機(jī)選擇100個(gè)不同的位置進(jìn)行光譜采集。每個(gè)樣本獲得100條光譜。
圖1 激光誘導(dǎo)擊穿光譜實(shí)驗(yàn)裝置示意圖Figure 1 Schematic diagram of the laser-induced breakdown spectroscopy experimental setup.
光譜采集過程中由于基體效應(yīng)的影響或外部環(huán)境等因素的干擾,會導(dǎo)致LIBS光譜異常。這些異常光譜的存在會影響模型的魯棒性和可靠性,因此剔除異常光譜對于獲得高質(zhì)量的分析結(jié)果非常重要。
作為常用的多元統(tǒng)計(jì)技術(shù),主成分分析(Principal component analysis,PCA)的優(yōu)勢在于降維、數(shù)據(jù)可視化和探索多維數(shù)據(jù)集等。其主要目標(biāo)是通過線性變換,在新的坐標(biāo)系中將原始數(shù)據(jù)投影,從而使得數(shù)據(jù)的方差最大化,捕捉到數(shù)據(jù)的主要變化方向。另一方面,馬氏距離(Mahalanobis distance,MD)考慮了特征之間的相關(guān)性和協(xié)方差矩陣,能夠更準(zhǔn)確地測量多維數(shù)據(jù)空間中點(diǎn)之間的距離。這使得MD在多變量數(shù)據(jù)中能夠更好地識別離群點(diǎn)。綜合使用PCA和MD可以有效剔除異常光譜。將每個(gè)樣本的光譜數(shù)據(jù)轉(zhuǎn)換到PCA降維后的特征空間中,通過MD評估數(shù)據(jù)點(diǎn)與其他數(shù)據(jù)點(diǎn)的關(guān)系是否偏離了正常的數(shù)據(jù)分布,設(shè)定閾值對每個(gè)樣本的100條光譜進(jìn)行異常光譜剔除。剔除后,得到剩余光譜的平均值,使每個(gè)樣本得到1條光譜。19個(gè)樣本共獲得19條光譜。
圖2為石油焦樣本的LIBS光譜圖。通過與NIST的光譜數(shù)據(jù)庫對比,對采集到的LIBS光譜進(jìn)行譜線的識別分析。從圖2中可以看出,石油焦的LIBS光譜圖中包含了C、Mg、Cu、Fe等元素的特征譜線,其中Fe和Cu的特征譜線主要集中在200~300 nm波段內(nèi)。為了保證模型的穩(wěn)定性和普遍性,在建立PLS模型時(shí)使用200~500 nm的全波段建模。
圖2 石油焦#3樣本的LIBS光譜圖(a.200~500 nm;b.210~255 nm;c.272~278 nm;d.255~265 nm)Figure 2 LIBS spectrum of petroleum coke #3 samples(a.200—500 nm;b.210—255 nm;c.272—278 nm;d.255—265 nm).
2.2.1 潛變量優(yōu)化
基于原始光譜(RAW)構(gòu)建用于化學(xué)計(jì)量學(xué)分析的PLS模型時(shí),正確選擇潛變量(Latent variables,LVs)的數(shù)量可以確保模型具有良好的預(yù)測性能并避免過度擬合。通過留一交叉驗(yàn)證對PLS模型的潛變量個(gè)數(shù)進(jìn)行優(yōu)化。圖3為不同潛變量個(gè)數(shù)對應(yīng)的交叉驗(yàn)證R2cv和RMSEcv(均方根)值。從圖3可以看出,對于Fe,潛變量為7時(shí)對應(yīng)最佳的R2cv和RMSEcv值分別為0.897 2、14.365 0 mg/kg;對于Cu,潛變量為4時(shí)對應(yīng)最佳的R2cv和RMSEcv值分別為0.819 7、9.581 8 mg/kg。
2.2.2 光譜預(yù)處理方法選擇
由于原始光譜模型獲得的交叉驗(yàn)證準(zhǔn)確度較低,本節(jié)進(jìn)一步研究不同預(yù)處理方法對PLS校正模型預(yù)測性能的影響。表2展示了不同光譜預(yù)處理方法[歸一化(Normalization,Nor)、多元散射校正(Multiple scattering correction,MSC)、標(biāo)準(zhǔn)正態(tài)變換(Standard normal variate,SNV)、一階導(dǎo)數(shù)(First derivative,D1st)和二階導(dǎo)數(shù)(Second derivative,D2nd)]對PLS模型預(yù)測性能的影響。從表2可以看出,對于Fe,D2nd(平滑點(diǎn)數(shù)n=9)對應(yīng)最優(yōu)的R2cv和RMSEcv。Fe的R2cv從0.795 8(原始光譜)提升至0.938 0,RMSEcv從25.405 7 mg/kg(原始光譜)降至14.446 5 mg/kg。對于Cu,使用MSC方法時(shí)模型預(yù)測效果最好,R2cv從0.815 7提升至0.882 8,RMSEcv從12.818 6 mg/kg降至10.361 5 mg/kg。
基于光譜預(yù)處理,模型預(yù)測性能得到進(jìn)一步提升,但全譜中仍然包含大量的冗余信息,可能會影響PLS模型的預(yù)測性能。因此,分別使用PSO和VIP兩種變量選擇算法對原始光譜進(jìn)行篩選,以進(jìn)一步提升PLS模型的預(yù)測性能。
2.3.1 粒子群優(yōu)化算法(PSO)
首先,基于五折交叉驗(yàn)證對PSO的參數(shù)進(jìn)行優(yōu)化,發(fā)現(xiàn)當(dāng)粒子群數(shù)量為20、迭代次數(shù)為200、慣性權(quán)重為0.7、學(xué)習(xí)因子C1和C2均為2時(shí)對應(yīng)最優(yōu)的性能。表3展示了兩種元素在各自最優(yōu)的光譜預(yù)處理方法后再使用PSO進(jìn)行變量選擇的結(jié)果。從表3可以看出,對于Fe,使用PSO進(jìn)行變量選擇之后,Fe的R2cv從0.938 0(D2nd)提升至0.964 0,RMSEcv從14.446 5 mg/kg(D2nd)降至10.703 3 mg/kg。對于Cu,R2cv從0.882 8(MSC)提升至0.955 3,RMSEcv從10.361 5 mg/kg(MSC)降至6.330 0 mg/kg。因此,基于最優(yōu)預(yù)處理和PSO構(gòu)建的PLS校正模型與僅使用光譜預(yù)處理方法構(gòu)建的PLS校正模型相比有較大提升。
表3 基于PSO的PLS校正模型的五折交叉驗(yàn)證結(jié)果Table 3 Five fold cross-validation results of PSO-based PLS calibration models
2.3.2 變量重要性投影(VIP)
VIP算法中合適的閾值k的選擇有助于降低數(shù)據(jù)維度,提高模型訓(xùn)練和預(yù)測的效率,并減少過擬合的風(fēng)險(xiǎn)。用五折交叉驗(yàn)證對閾值k進(jìn)行優(yōu)化,如圖4所示。從圖4可以看出,Fe的閾值為0.22時(shí)模型最佳,Cu的閾值為0.75時(shí)模型最佳?;贔e和Cu兩種元素再各自最優(yōu)光譜預(yù)處理和各自最佳閾值VIP的PLS校正模型預(yù)測性能結(jié)果如表4所示。由表4可知,對于Fe,R2cv為0.966 7,RMSEcv為10.282 1 mg/kg,結(jié)果與基于PSO的PLS模型相比有所提升;對于Cu,R2cv為0.911 4,RMSEcv為9.075 7 mg/kg,結(jié)果與基于PSO的PLS模型相比卻有所下降。由此可知,選擇適當(dāng)?shù)哪P秃头椒ǚ浅V匾?不同的元素和樣品類型可能需要不同的分析策略,這會影響到模型的預(yù)測性能。
圖4 VIP閾值k優(yōu)化圖(a) Fe;(b) CuFigure 4 Optimization of VIP threshold k(a) Fe;(b) Cu.
表4 基于VIP的PLS校正模型的五折交叉驗(yàn)證結(jié)果Table 4 Five fold cross-validation results for VIP-based PLS calibration models
基于最優(yōu)的光譜預(yù)處理和變量選擇方法,構(gòu)建用于石油焦中Fe和Cu元素分析的定量模型對預(yù)測集樣本進(jìn)行分析。圖5(a)和5(b)展示了Fe和Cu元素各自的校正模型對預(yù)測集樣本預(yù)測結(jié)果的線性擬合。從圖5可以看出,對于Fe,基于D2nd和VIP的PLS模型預(yù)測集R2p為0.863 8,RMSEp為14.507 8 mg/kg,MRE為0.075 8;而對于Cu,基于MSC和PSO的PLS模型預(yù)測集R2p為0.926 9,RMSEp為7.650 2 mg/kg,MRE為0.068 7。預(yù)測集樣本的模型預(yù)測值與參考值之間具有良好的線性關(guān)系。
圖5 變量選擇之后的PLS模型預(yù)測結(jié)果的散點(diǎn)圖(a) Fe;(b) CuFigure 5 Scatter plot of PLS model prediction results after feature selection(a) Fe;(b) Cu.
利用LIBS結(jié)合PLS算法,對石油焦中微量元素Fe和Cu進(jìn)行定量分析。首先,基于LIBS光譜構(gòu)建用于石油焦中Fe和Cu定量分析的PLS校正模型并優(yōu)化潛變量個(gè)數(shù)。然后,考察了不同光譜預(yù)處理以及變量選擇算法對PLS校正模型預(yù)測性能的影響。研究結(jié)果顯示,對于Fe基于D2nd和VIP的PLS模型獲得了最優(yōu)的預(yù)測結(jié)果,R2cv從原始光譜的0.795 8提升至0.966 7,RMSEcv從25.405 7 mg/kg降至10.282 1 mg/kg,預(yù)測集R2p為0.863 8,RMSEp為14.507 8 mg/kg;對于Cu,基于MSC和PSO的PLS模型獲得了最優(yōu)的預(yù)測結(jié)果,R2cv從原始光譜的0.815 7提升至0.955 3,RMSEcv從12.818 6 mg/kg降至6.330 0 mg/kg,預(yù)測集R2p為0.926 9,RMSEp為7.650 2 mg/kg。綜上,LIBS結(jié)合變量重要性投影的PLS模型和粒子群優(yōu)化的PLS模型具有良好的預(yù)測性能,該研究成果可為石油焦中微量元素的快速檢測提供理論依據(jù)和技術(shù)參考。