姚曦煜,梁歡,陳凱,候華毅,陳相柏
(1.武漢工程大學(xué) 光電信息與能源工程學(xué)院,湖北 武漢 430205;2.武漢工程大學(xué) 興發(fā)礦業(yè)學(xué)院,湖北 武漢 430205)
磷礦是多種精細(xì)磷化工的物質(zhì)基礎(chǔ)[1],也是我國重要的戰(zhàn)略資源。礦石中P2O5的含量決定磷礦品位[2],我國的磷礦大多為中低品位[3]。當(dāng)前測定磷礦石品位的方法主要有常規(guī)化學(xué)分析法、紅外光譜法、核磁共振法、X射線、等離子體質(zhì)譜法等[4]。但大部分方法不能對大量樣品進(jìn)行快速檢測和滿足礦下檢測的需要。尋找一種快速有效的磷礦品位鑒別和分類方法,提高選礦效率,對我國工業(yè)和農(nóng)業(yè)可持續(xù)發(fā)展具有重要意義。
拉曼光譜作為一種分子指紋分析技術(shù)可獲得樣品的物理化學(xué)信息,具有快速、準(zhǔn)確、無損、無需對樣品進(jìn)行復(fù)雜前處理等優(yōu)點(diǎn),已廣泛應(yīng)用于物理、化學(xué)、材料等領(lǐng)域[5-7]。
磷礦高品位樣品A(P2O531.25%)、B(P2O529.06%),中品位樣品C(P2O522.08%)和低品位樣品D(P2O53.29%)。實驗前對樣品進(jìn)行過濾和壓片處理,并采用60目的篩網(wǎng)對磷礦粉末進(jìn)行過濾,稱取250 mg采用壓片機(jī)進(jìn)行壓片。
Nanobase XperRam200共聚焦顯微拉曼光譜系統(tǒng),激光器波長為532 nm,功率為100 mW,光譜掃描范圍為200~1 950 cm-1,掃描時間為30 s。
在保證測量面平整的前提下,對每面由內(nèi)圈到外圈均勻選取50個點(diǎn)進(jìn)行光譜檢測收集,每種樣品測得100個點(diǎn)的拉曼光譜,并使用硅片對所測光譜進(jìn)行校準(zhǔn),共測得400組磷礦光譜。
1.3.1 基線校正 為降低拉曼光譜的背景噪聲干擾,對拉曼光譜進(jìn)行平滑和基線校正處理。本研究選擇Savitzky-Golay(SG)卷積法對拉曼光譜進(jìn)行多項式為2階的8點(diǎn)平滑處理。平滑后采用自適應(yīng)迭代懲罰最小二乘法[8](airPLS)算法進(jìn)行基線校正,與其他校正方法相比,airPLS 具有一定的優(yōu)勢,包括不需要預(yù)知干擾信息,其通過迭代改變擬合基線和原始信號之間的誤差平方和的權(quán)重,適應(yīng)性地利用預(yù)先擬合的基線和原始信號間的差異,獲得基線估計量。Savitzky-Golay(SG)卷積法平滑采用Origin 2017進(jìn)行,airPLS基線校正的程序采用MATLAB 2016b實現(xiàn)。
1.3.2 分類模型 對平滑和基線校正后的拉曼光譜數(shù)據(jù)進(jìn)行PCA和HCA分析,建立判別模型。主成分分析(PCA)屬于無監(jiān)督模式,在保留原始主要信息變量的前提下,PCA將多指標(biāo)的問題轉(zhuǎn)化為少數(shù)幾個綜合性指標(biāo)的問題[9],降維不但能簡化模型,還可以有效剔除與所測化學(xué)成分不相關(guān)或相關(guān)性小變量,使模型更加準(zhǔn)確和穩(wěn)定,并反映樣本的聚類情況。
系統(tǒng)聚類法(HCA)是以分類依據(jù)的條件作為指標(biāo)或變量,根據(jù)待分析的樣品所表現(xiàn)的變量特征,按樣本之間的距離相似系數(shù)進(jìn)行度量,距離近的相似度高的聚為一類,反之不聚為一類。最后把聚類結(jié)果形象系統(tǒng)地用樹狀圖表示出來。運(yùn)用HCA的離差平方和法(ward’s linage rule)[10]根據(jù)分割距離歐式距離(m維空間兩點(diǎn)之間的真實距離)的平方把磷礦樣品分成不同數(shù)量的集群。
PCA和HCA分析使用SIMCA 14.1軟件進(jìn)行。
3種預(yù)處理方式下的4種磷礦的拉曼光譜見圖1。
3.4 護(hù)士在靜脈輸液過程中職業(yè)防護(hù)的執(zhí)行現(xiàn)狀表2顯示,29名護(hù)士不會正確處理化療藥物藥液溢出;137名護(hù)士不會正確處理化療藥液濺到皮膚或眼內(nèi)的情況;188名護(hù)士在進(jìn)行高危操作時不戴手套;152名護(hù)士在被污染銳器刺破是不會向上級匯報;還有102名護(hù)士在操作中雙手回套針帽;72名護(hù)士不會正確使用銳器盒分離針頭,而89.5%護(hù)士在操作中遇到銳器盒針頭滿溢的情況。這些情況說明護(hù)士在化療藥物防護(hù)、預(yù)防針刺傷、職業(yè)暴露后的處理等操作環(huán)節(jié)上自我防護(hù)行為不足。
圖1 3種預(yù)處理方式下的4種磷礦的拉曼光譜圖Fig.1 Raman spectra of four kinds of phosphoriteunder three kinds of spectral pretreatmentsa.SG平滑+airPLS基線校正后;b.SG平滑+airPLS基線校正+一階導(dǎo)數(shù);c.SG平滑+airPLS基線校正+二階導(dǎo)數(shù)
圖1(b)和1(c)分別是在圖(a)中的5組光譜平均后的一階導(dǎo)數(shù)和二階導(dǎo)數(shù)兩種預(yù)處理后的光譜。從圖中看出,經(jīng)過導(dǎo)數(shù)處理的光譜,部分特征峰消失,但4種磷礦樣品在960 cm-1左右仍然呈現(xiàn)一個較強(qiáng)峰。所以在磷礦的研究中,V1(PO4)對稱伸縮振動的拉曼信號往往用來區(qū)分不同種類或者品位的磷礦石[2]。除此之外,在圖(b)中,樣品A(P2O531.25%)的一階導(dǎo)數(shù)光譜中還存在無序碳的特征峰(1 333,1 572 cm-1),但在二階導(dǎo)數(shù)光譜中,該特征峰消失。樣品B(P2O529.06%)的白云石的特征峰在一階導(dǎo)數(shù)和二階導(dǎo)數(shù)光譜中都存在,是該樣品與其它3種樣品的重要區(qū)別之一。
4種不同品位磷礦之中,磷礦品位越高,含有其它雜質(zhì)越少,光譜峰位更清晰。磷礦品位降低,所含雜質(zhì)增加,光譜峰位、寬度和強(qiáng)度隨著雜質(zhì)的比例不同也會發(fā)生改變,因此不同種類磷礦樣本僅從光譜上直接區(qū)分存在難度,而通過把拉曼光譜和化學(xué)計量學(xué)相結(jié)合,能夠?qū)ふ覚z測變量之間的隱藏關(guān)系[14],達(dá)到對不同品位磷礦聚類的目的。
2.2.1 4種品位磷礦進(jìn)行PCA分析 如圖1所示,由于存在一定背景噪聲和內(nèi)部成分復(fù)雜的特點(diǎn)同一磷礦樣品的5個不同測量點(diǎn)之間光譜也存在差異,直接使用磷礦原始光譜數(shù)據(jù)矩陣建立PCA模型會影響聚類效果,因此,先將單種品位的磷礦樣品100組原始光譜數(shù)據(jù)中按照測量點(diǎn)位的順序,每5組光譜取平均,獲得平均光譜20組,用來表征該類樣品,4種品位磷礦共80組平均光譜構(gòu)成新的樣本矩陣,并經(jīng)過3種不同預(yù)處理方式消除背景噪聲,進(jìn)行主成分分析,得到主成分得分圖,如圖2所示。前3個主成分的方差貢獻(xiàn)度見表1。
圖2 3種預(yù)處理方式后PCA分析得分圖Fig.2 PCA analysis score plot after three pretreatmentsa.SG平滑+airPLS基線校正PC1 VS PC2得分圖;b.SG平滑+airPLS基線校正+一階求導(dǎo)后PC1 VS PC2得分圖;c.SG平滑+airPLS基線校正+二階求導(dǎo)后PC1 VS PC2得分圖
2.2.1.1 SG平滑+airPLS基線校正 由表1和圖2(a)可知,經(jīng)過SG平滑+airPLS基線校正,前3個主成分累計貢獻(xiàn)度達(dá)到83.8%,4種磷礦存在明顯分開的趨勢,且各自聚集,但聚集程度略有差異,樣品D(P2O53.29%)樣本點(diǎn)較為分散,其它3種樣品相對較好。另外,樣本之間也有一些交叉的情況,樣本A(P2O531.25%)和樣本B(P2O529.06%)部分交叉和重疊,分析原因,是由于二者品位值差異較小,光譜相近造成。除此之外,可以看到在第1主成分(PC1)上4種品位的磷礦樣品按照P2O5的濃度從低到高從左到右依次排列。
表1 不同預(yù)處理方式下PCA分析前3個主成分方差貢獻(xiàn)Table 1 The variance contribution of the first threePCs in PCA analysis principal component underdifferent pretreatment methods
2.2.1.2 SG平滑+airPLS基線校正+一階導(dǎo)數(shù) 由表1可知,使用去SG平滑+airPLS基線校正+一階導(dǎo)數(shù)后的光譜數(shù)據(jù)的PCA模型中,前三個主成分所反映的原始光譜信息由83.8%下降到42.6%,與圖1(b)現(xiàn)象一致,求導(dǎo)后存在部分信息丟失和缺損[15]。圖2(b)顯示,在SG平滑和airPLS基線校正的基礎(chǔ)上,經(jīng)一階導(dǎo)數(shù)處理后,采用PC1和PC2兩個主成分時,4類磷礦樣品分布在各自的區(qū)域內(nèi),且不同磷礦樣品在分布的區(qū)域范圍內(nèi)點(diǎn)的離散程度較小。與圖2(a)相同,在第1主成分(PC1)上,4種磷礦仍然是按照品位值的從低到高從左到右依次排列。
2.2.1.3 SG平滑+airPLS基線校正+二階導(dǎo)數(shù) 在SG平滑和airPLS基線校正的基礎(chǔ)上,二階導(dǎo)數(shù)后模型對光譜數(shù)據(jù)的解釋度相比一階導(dǎo)數(shù)損失更大,前3個主成分所保留的原始光譜信息僅為25.1%,信息損失了將近3/4。雖然分類效果較好,如圖2(c)所示,但此預(yù)處理方法不合適。
2.2.2 4種磷礦進(jìn)行HCA分析 對光譜數(shù)據(jù)進(jìn)行降維后,既能反映大部分原始光譜的信息,同時模型中各樣本點(diǎn)之間歐式距離的大小能夠反映每個樣本點(diǎn)的差異程度[16-17]。使用降維后的光譜數(shù)據(jù)能有效壓縮參加計算歐氏距離的變量數(shù)[18]。因此,通過對3種光譜預(yù)處理方法處理后的PCA模型取其主成分得分?jǐn)?shù)據(jù)進(jìn)行HCA分析嘗試后,我們發(fā)現(xiàn)對原始光譜進(jìn)行SG平滑+airPLS基線校正+一階導(dǎo)數(shù)處理后,既能在降維后保留較多的原始信息同時又有較好的聚類效果,選取該模型中對原光譜信息累計解釋度為58.8%的前9個主成分的得分?jǐn)?shù)據(jù)矩陣,選擇離差平方和法(Ward’s linage rule)進(jìn)行相似度聚類生成樹狀圖,如圖3所示。其中編號1~20對應(yīng)樣品A(P2O531.25%),20~40對應(yīng)樣品B(P2O529.06%),40~60對應(yīng)樣品C(P2O522.08%),60~80對應(yīng)樣品D(P2O53.29%)。
表2 磷礦樣本系統(tǒng)聚類分組情況Table 2 Hierarchy clustering groups of phosphorite samples
由圖3和表2可知,80組磷礦樣品被分成 5組,除一個3.29%的樣品被單獨(dú)分到一類外,其余79組數(shù)據(jù)均以100%的準(zhǔn)確度得到了分類。通過離差平方和法,使用磷礦SG平滑+airPLS基線校正+一階導(dǎo)數(shù)處理后PCA模型中前9個主成分得分矩陣建立的HCA樹狀圖,分類效果準(zhǔn)確率達(dá)到了98.75%,成功實現(xiàn)了對4種磷礦的分類。
研究了3類品位磷礦樣品的拉曼光譜特性,并提出了一種將測得的4種磷礦樣品的光譜信息進(jìn)行平滑和基線校正后,結(jié)合化學(xué)計量學(xué)磷礦進(jìn)行快速鑒別和分類的新方法。結(jié)果表明,盡管同種磷礦樣本不同點(diǎn)位之間的光譜存在差異,但是在采用5點(diǎn)的平均原始光譜SG平滑+基線校正、原始光譜SG平滑+基線校正+一階導(dǎo)數(shù)兩種預(yù)處理的PCA模型中,既保持了較高的原始信息,各磷礦樣本點(diǎn)也有著較好的聚類效果,且品位信息在第1主成分上呈現(xiàn)規(guī)律分布。采用SG平滑+基線校正+一階導(dǎo)數(shù)光譜預(yù)處理方法后,進(jìn)行主成分分析,得到的前9個主成分得分?jǐn)?shù)據(jù)矩陣?yán)脀ard法進(jìn)行HCA分析,在事先不知道樣品分組的情況下,成功將4種磷礦樣本分開,準(zhǔn)確率為98.75%。拉曼光譜技術(shù)具有樣品前處理簡單,無損、快速及準(zhǔn)確的鑒別,其結(jié)合化學(xué)計量學(xué)為磷礦品位鑒定和分類提供了一種新方法。使用便攜式拉曼光譜儀,具有現(xiàn)場快速檢測應(yīng)用的前景。然而,由于磷礦種類繁多,且成礦機(jī)理和性質(zhì)不同,在本次研究中的采集的樣本數(shù)量有限,后續(xù)將加大樣品采集數(shù)量建立數(shù)據(jù)庫,并采取其他更高級的分類算法,為磷礦品位鑒定和分類提供更多的信息。