王 欣,張冠男,朱 軍,萬(wàn)一夫,姜 紅,劉占芳
(1. 中國(guó)人民公安大學(xué) 偵查學(xué)院,北京 100038;2. 公安部物證鑒定中心,北京 100038)
縱火是引發(fā)火災(zāi)的一個(gè)重要原因,也是造成生命和財(cái)產(chǎn)損失的重要原因。對(duì)可燃液體等助燃劑的檢測(cè)鑒別對(duì)縱火案件的調(diào)查至關(guān)重要。隨著石油工業(yè)的發(fā)展和汽車的普遍使用,汽油逐漸成為人們?nèi)粘I钪袠O其常見(jiàn)的一類物質(zhì),也是十分常見(jiàn)的可燃液體助燃劑。汽油是一種重要的煉油混合產(chǎn)物,大多數(shù)煉油廠通過(guò)轉(zhuǎn)化其他餾分來(lái)增加汽油的產(chǎn)量,過(guò)程包括化學(xué)轉(zhuǎn)化和重新配方,如高真空蒸餾、催化裂解、異構(gòu)化、烷基化和加氫處理等。煉油廠所采用的工藝各不相同,因此汽油是不同煉油工藝的復(fù)雜混合物[1],對(duì)汽油進(jìn)行研判分析一直是研究的熱點(diǎn)。Balabin等[2]嘗試用近紅外光譜法對(duì)汽油試樣進(jìn)行檢測(cè),結(jié)合多元分類方法,包括K最近鄰法、支持向量機(jī)法、概率神經(jīng)網(wǎng)絡(luò)法,實(shí)現(xiàn)了汽油的質(zhì)量控制和摻假識(shí)別。Li等[3]將拉曼光譜法與局部加權(quán)LSSVM算法相結(jié)合,在選擇相鄰樣本時(shí)既考慮了歐氏距離又考慮了相關(guān)系數(shù),所得汽油型號(hào)的分類效果顯著。目前,在汽油的儀器分析方法中,使用最多的是美國(guó)測(cè)試和材料學(xué)會(huì)(ASTM)制定的GC-MS方法[4]。與國(guó)內(nèi)GB/T 18294.5—2010[5]相比,ASTM標(biāo)準(zhǔn)更趨向于實(shí)驗(yàn)室鑒定標(biāo)準(zhǔn),主要通過(guò)視覺(jué)模式識(shí)別總離子色譜(TIC)圖、提取離子流色譜(EIC)圖并結(jié)合目標(biāo)化合物的存在進(jìn)行分析,而GB/T 18294.5—2010只是一個(gè)單純的方法型規(guī)范,未進(jìn)行細(xì)致的分類。目前,通過(guò)GC-MS檢測(cè)可燃液體的方法主要是基于TIC[6-9]、選定的質(zhì)譜離子[10]或雙向GC-MS數(shù)據(jù)[11]進(jìn)行鑒定或分類。
本工作同時(shí)使用兩臺(tái)GC-MS檢測(cè)儀對(duì)汽油試樣進(jìn)行分析,結(jié)合SIMCA14.1軟件,使用化學(xué)計(jì)量學(xué)方法(主成分分析(PCA)和偏最小二乘判別分析(PLS-DA))對(duì)GC-MS數(shù)據(jù)進(jìn)行處理,根據(jù)型號(hào)、地域、廠家對(duì)汽油試樣進(jìn)行分類分析。
從東北、西北、華南、中部等地區(qū)的各省市主要煉油廠收集89#,92#,95#,98#汽油試樣共一百余種,部分試樣來(lái)源和所屬區(qū)域信息如表1所示。每個(gè)汽油試樣取10 μL,用乙醚稀釋至1 mL,制成含量為1%(φ)的試樣,存放至實(shí)驗(yàn)室防爆柜中。
表1 部分汽油試樣的來(lái)源和所屬區(qū)域Table 1 Sources and areas of some gasoline samples
Agilent公司7010型GC-MS檢測(cè)儀:DBWAX色譜柱(30 mm×0.25 mm×0.25 μm);柱箱起始溫度40 ℃,保持時(shí)間2 min,以5 ℃/min的速率升溫至80 ℃,保持2 min,再以10 ℃/min的速率升溫至300 ℃,保持10 min;進(jìn)樣口溫度280 ℃;進(jìn)樣量1 μL;進(jìn)樣分流比20∶1;淬滅氣(He)流量4 mL/min,碰撞氣(N2)流量1.5 mL/min,電子轟擊電離源,電離能量70 eV;全掃描模式,掃描間隔0.2 s,m/z=40~500;離子源溫度250 ℃;溶劑延遲時(shí)間2.05 min。
Shimadzu公司GCMS-QP2010 SE型GC-MS檢測(cè)儀:DB-5ms色譜柱(30 mm×0.25 mm×0.25 μm);柱箱起始溫度40 ℃,保持時(shí)間2 min,以5 ℃/min的速率升溫至80 ℃,保持2 min,再以10 ℃/min的速率升溫至300 ℃,保持10 min;進(jìn)樣口溫度280 ℃;進(jìn)樣量1 μL;全掃描模式,掃描間隔0.2 s,m/z=15~500;離子源溫度250 ℃;溶劑延遲時(shí)間2.5 min。
通過(guò)結(jié)合SIMCA14.1軟件,將抽象的色譜數(shù)據(jù)轉(zhuǎn)化為可分析的向量。PCA是一種常用的多元變量分析方法[12-14],通過(guò)數(shù)據(jù)降維提取特征分量,從原始空間中順序地找一組相互正交的坐標(biāo)軸,新的坐標(biāo)軸的選擇與數(shù)據(jù)本身密切相關(guān)。PLS-DA是一種數(shù)學(xué)優(yōu)化技術(shù)[15-17],通過(guò)將預(yù)測(cè)變量和觀測(cè)變量投影到一個(gè)新空間,以構(gòu)建一個(gè)線性回歸模型。它通過(guò)最小化誤差的平方和找到一組數(shù)據(jù)的最佳函數(shù)匹配,用最簡(jiǎn)單的方法求得一些絕對(duì)不可知的真值,從而令誤差平方之和為最小。PCA方法難以區(qū)分的數(shù)據(jù)在PLS-DA模型中更易于區(qū)分。
本實(shí)驗(yàn)通過(guò)兩臺(tái)GC-MS檢測(cè)儀相互驗(yàn)證,佐以SIMCA14.1軟件結(jié)合化學(xué)計(jì)量學(xué),對(duì)汽油試樣進(jìn)行研判分析。
2016年,我國(guó)推進(jìn)成品油質(zhì)量升級(jí),全國(guó)施行國(guó)Ⅴ標(biāo)準(zhǔn),根據(jù)抗爆性能(即辛烷值含量)汽油可分為89#,92#,95#,98#。隨機(jī)挑選各類試樣采用Agilent公司和Shimadzu公司的GC-MS檢測(cè)儀進(jìn)行分析,所得譜圖經(jīng)基線校正后,將數(shù)據(jù)信息導(dǎo)入SIMCA14.1軟件中建立工程,對(duì)數(shù)據(jù)信息進(jìn)行預(yù)處理,采用自動(dòng)擬合模型進(jìn)行分類分析,結(jié)果如圖1~3所示。
由圖2和圖3可知,兩臺(tái)儀器數(shù)據(jù)穩(wěn)定,排除了儀器污染、調(diào)諧不合格等儀器誤差;同時(shí)也保證了同一批試樣進(jìn)樣分析,排除了移液帶來(lái)的試樣誤差。同一批試樣在兩臺(tái)儀器上親疏距離的差異可能是由于使用兩臺(tái)儀器進(jìn)行檢測(cè)時(shí),在試樣瓶轉(zhuǎn)移前后,試樣濃度因揮發(fā)發(fā)生了細(xì)微的變化。由圖1~3的分類結(jié)果可以看出,隨機(jī)試樣的型號(hào)都得到了良好的區(qū)分,從而驗(yàn)證了構(gòu)建的PLS-DA和PCA的多元變量分析模型可用于檢測(cè)汽油的型號(hào)。
圖1 不同型號(hào)汽油試樣的Agilent PCA分類結(jié)果Fig.1 Agilent PCA classification results of different types of gasoline samples.
圖2 不同型號(hào)汽油試樣的Agilent PLS-DA分類結(jié)果Fig.2 Agilent PLS-DA classification results of different types of gasoline samples.
圖3 不同型號(hào)汽油試樣的Shimadzu PLS-DA分類結(jié)果Fig.3 Shimadzu PLS-DA classification results of different types of gasoline samples.
汽油發(fā)動(dòng)機(jī)在運(yùn)轉(zhuǎn)時(shí),吸進(jìn)來(lái)的通常是汽油與空氣的混合氣,在壓縮過(guò)程中活塞上行,擠壓混合氣使體積縮小,同時(shí)也發(fā)生渦流和紊流。發(fā)動(dòng)機(jī)的壓縮比越高,它的性能越好,但當(dāng)壓縮比升高時(shí),油氣燃燒所產(chǎn)生的能量就會(huì)更多地轉(zhuǎn)化為動(dòng)能,氣缸壁受到的壓力就越大,對(duì)材料的要求也會(huì)提高。據(jù)調(diào)查顯示,目前發(fā)動(dòng)機(jī)壓縮比為8.6~9.9的汽油汽車最常見(jiàn),而92#汽油適用于這一類汽車。因此,以92#汽油為控制變量,隨機(jī)抽選東北、西北、華南、中部四個(gè)不同地域的汽油試樣,采用Agilent公司的GC-MS的檢測(cè)儀,分別進(jìn)行PLS-DA和PCA分析,結(jié)果如圖4~5所示。
圖4 不同地域92#汽油試樣的Agilent PCA分類結(jié)果Fig.4 Agilent PCA classification results of 92# gasoline samples in different regions.
由圖4和圖5可看出,不同地域的測(cè)試集基本上可以實(shí)現(xiàn)聚類區(qū)分,但中部地區(qū)和華南地區(qū)的部分試樣親疏距離較為接近,為了解其中的差異性和相似性,以2#試樣和3#試樣為例,使用Python構(gòu)建特征峰比較模型。創(chuàng)建DataDrame的分布式數(shù)據(jù)對(duì)象,合并后作為concat輸入,通過(guò)iloc函數(shù)調(diào)取并比較響應(yīng)值強(qiáng)度,從而篩選出差異較大的出峰時(shí)間并集,并在GC-MS譜圖中觀察所得出峰時(shí)間處的響應(yīng)程度,觀察的譜圖差異如圖6所示。
圖5 不同地域92#汽油試樣的Agilent PLS-DA分類結(jié)果Fig.5 Agilent PLS-DA classification results of 92# gasoline samples in different regions.
由圖6(a)可看出,在2.226,3.048,3.401 min處2#試樣的烷烴響應(yīng)結(jié)果比3#試樣強(qiáng),而其他時(shí)間3#試樣的響應(yīng)結(jié)果均明顯強(qiáng)于2#試樣;而由圖6(b)可看出,2#試樣的芳烴響應(yīng)結(jié)果大體上強(qiáng)于3#試樣。通過(guò)分析EIC譜圖,可以清楚地區(qū)別2#試樣和3#試樣在烷烴和芳烴出峰時(shí)間和出峰強(qiáng)度上的差異,從而實(shí)現(xiàn)訓(xùn)練集的區(qū)分。
圖6 2#試樣和3#試樣的EIC譜圖Fig.6 Extraction ion current chromatography of sample 2# and sample 3#.
同一地域有多個(gè)煉油廠,在精煉過(guò)程中,汽油的最終產(chǎn)物是一種復(fù)雜的碳?xì)浠衔锘旌衔?,它的具體成分主要由它的物理性質(zhì)決定,如蒸汽壓、研究法辛烷值和發(fā)動(dòng)機(jī)辛烷值。目前廣為共識(shí)的汽油主要化學(xué)成分是C4~C12的烷烴、芳烴(包括烷基苯、茚滿、萘系物)和含氧化合物(如乙醇、甲基叔丁基醚和乙基叔丁基醚)。然而,不同的煉油廠所采用的原油和煉制工藝不同,煉油流程隨著時(shí)間的推移也會(huì)發(fā)生變化。同一地域不同煉油廠的92#汽油試樣的分類結(jié)果如圖7和圖8所示。
圖7 同一地域不同煉油廠的92#汽油試樣的Agilent PCA分類結(jié)果Fig.7 Agilent PCA classification results of 92# gasoline samples from different refineries in the same region.
圖8 同一地域不同煉油廠的92#汽油試樣的Agilent PLS-DA分類結(jié)果Fig.8 Agilent PLS-DA classification results of 92# gasoline samples from different refineries in the same region.
由于化學(xué)成分基本相似,PCA和PLS-DA均不能給予明確清晰的區(qū)分。使用Python構(gòu)建特征峰比較模型,分析TIC譜圖中特征峰出現(xiàn)的時(shí)間,將每?jī)蓚€(gè)試樣在同一響應(yīng)時(shí)間對(duì)應(yīng)的不同出峰強(qiáng)度進(jìn)行響應(yīng)值分析和比值運(yùn)算,并對(duì)運(yùn)算結(jié)果進(jìn)行逆序排列,發(fā)現(xiàn)1#試樣相較于其他試樣在3.0~3.6 min處出峰強(qiáng)度更弱,同樣對(duì)3#試樣響應(yīng)值進(jìn)行計(jì)量分析,順序排列后發(fā)現(xiàn)3#試樣在2.3~2.4 min處出峰強(qiáng)度明顯強(qiáng)于其他試樣。
將運(yùn)算結(jié)果帶回TIC譜圖,進(jìn)行譜圖分析,結(jié)果如圖9所示。由圖9可見(jiàn),1#試樣在前15 min出峰強(qiáng)度較高,僅在2.444,3.397,11.4~11.7 min處的峰較弱或不出峰,在15~18 min出峰情況不明顯,經(jīng)質(zhì)荷比分析,原因是芳烴含量較少。2#試樣在前11 min出峰強(qiáng)度都處于最強(qiáng)或較強(qiáng)的水平,直到11 min后強(qiáng)度減弱,經(jīng)質(zhì)荷比分析,原因是烷烴含量較多而芳烴含量較少。3#試樣和4#試樣來(lái)自同一廠家,兩者整體出峰情況相似,在2.118,3.979,11.4~11.7 min處出峰較弱或不出峰,而兩者相比較,4#乙醇汽油試樣在一些時(shí)間的出峰強(qiáng)度更強(qiáng)。5#試樣只在前5 min保持一個(gè)較高的響應(yīng)值,而在2.347 min也不出峰,在5~18 min都保持一個(gè)較低的響應(yīng)值。13#試樣在前7 min的出峰強(qiáng)度總體較強(qiáng),僅在個(gè)別時(shí)間點(diǎn)不出峰或響應(yīng)值較弱,如2.247 min和5.896 min,但在后10 min出峰強(qiáng)度整體偏弱。14#試樣和15#試樣都來(lái)自東北油化廠,但14#普通汽油試樣整體響應(yīng)值均大于15#乙醇汽油試樣,這可能與工藝流程和采用的填料等有關(guān)。
圖9 同一型號(hào)同一地域不同廠家的8個(gè)汽油試樣的TIC譜圖Fig.9 Total ion chromatography of eight same type gasoline samples from different manufacturers in the same region.
而6#試樣和7#試樣按照PLS-DA方法的判別結(jié)果與其他試樣差距很明顯,兩者之間也存在一定距離。經(jīng)分析計(jì)算結(jié)果和觀察譜圖,發(fā)現(xiàn)兩者雖來(lái)自同一煉油廠,但6#試樣的烷烴響應(yīng)值卻普遍低于7#試樣。而具體是哪一種烷烴是兩種汽油試樣的區(qū)分依據(jù),則需要使用更高分辨率的儀器進(jìn)行下一步探索。
1)運(yùn)用兩臺(tái)GC-MS檢測(cè)儀交叉驗(yàn)證,克服了普通GC-MS方法在試樣制備中移液帶來(lái)的偶然誤差。構(gòu)建的PLS-DA和PCA多元變量分析模型可以在色譜中更為直觀地觀察到汽油型號(hào)的差異。
2)在對(duì)汽油地域特征的研判分析中,建立了一種將PLS-DA、程序運(yùn)算、TIC譜圖和EIC譜圖相結(jié)合的方法。實(shí)驗(yàn)結(jié)果表明,在2.226,3.048,3.401 min處華南地區(qū)汽油試樣的烷烴響應(yīng)結(jié)果比中部地區(qū)汽油試樣強(qiáng);而在其他時(shí)間,中部地區(qū)汽油試樣的響應(yīng)結(jié)果均明顯強(qiáng)于華南地區(qū)的汽油試樣。從整體看,華南地區(qū)汽油試樣的芳烴響應(yīng)結(jié)果大體上強(qiáng)于中部地區(qū)汽油試樣。通過(guò)分析EIC譜圖,可以清楚地區(qū)別不同地域試樣在烷烴和芳烴出峰時(shí)間和出峰強(qiáng)度上的差異,從而實(shí)現(xiàn)訓(xùn)練集的區(qū)分。
3)在控制變量下對(duì)不同廠家進(jìn)行研判分析時(shí),按所構(gòu)建的模型得到的結(jié)果具有一定的差異性。但同一地區(qū)的不同煉油廠在煉油過(guò)程中采用的填料相近、工藝流程大體相同,需要精確度更高的儀器進(jìn)行離子定量分析。