胡 軍,劉燕德,郝 勇,孫旭東,歐陽愛國
華東交通大學(xué)機電與車輛工程學(xué)院,江西 南昌 330013
汽油、柴油等傳統(tǒng)的燃料在燃燒過程中會產(chǎn)生對環(huán)境有害的氣體及一些固體顆粒,不僅污染環(huán)境,而且會直接影響人類的健康。因此世界各地都在探索新的能源或嘗試減少燃料在燃燒過程中有害物的產(chǎn)生,以此減少對環(huán)境的污染[1]。甲醇汽油和乙醇汽油的使用可以提高汽油的含氧量,從而使得汽油燃燒更加充分,并且能夠有效降低有毒氣體的排放[2]。
甲醇汽油和乙醇汽油雖都可作為燃料,但是由于甲醇和乙醇的理化性質(zhì)并不完全相同,配制而成的甲醇汽油和乙醇汽油也存在很多不同特性[3]。例如,相對于乙醇汽油,甲醇汽油的熱量值高,作為燃料使得汽車的動力更足,但是甲醇具有腐蝕性,乙醇汽油熱量值雖較低于甲醇汽油但卻更加穩(wěn)定[4-5]。但若汽油所含的甲醇或乙醇含量過高,其燃燒易造成氣阻,使得發(fā)動機的氣密性下降,導(dǎo)致動力不足。因此,評估該醇類燃料質(zhì)量的關(guān)鍵之一在于確定其醇類的含量。不同的甲醇汽油和乙醇汽油對其醇的含量有著不同的規(guī)定,因此,探索一種精準(zhǔn)度高、快速性好的方法來判定醇類燃料汽油的類型并同時測定其含量非常重要[6]。
近年來,國內(nèi)外研究工作者開始對燃料汽油的成分開展研究。姚捷等[7]針對甲醇汽油品質(zhì)的檢測,利用了拉曼技術(shù),并且使用一元線性回歸法對其建模,驗證了拉曼技術(shù)對甲醇汽油檢測的可行性。歐陽愛國等[8]利用近紅外光譜和拉曼光譜技術(shù),對汽油中甲醇的含量建立了偏最小二乘模型,該研究的結(jié)論證明了近紅外光譜技術(shù)對甲醇汽油具有較好的檢測效果。李雁如等[9]利用蒸餾水萃取法與氣相色譜分析技術(shù)相結(jié)合測定了不同規(guī)格車用甲醇汽油中的甲醇含量,結(jié)果表明: 該方法可以檢測,但需要對樣品進(jìn)行復(fù)雜的前處理,操作較為復(fù)雜。
目前,使用中紅外光譜技術(shù)檢測醇類汽油中醇含量的研究的報道相對較少,也很少建立甲醇汽油和乙醇汽油定性判別模型。本文采用中紅外光譜檢測技術(shù)結(jié)合隨機森林(random forest, RF)算法[9-10]建立甲醇汽油和乙醇汽油定性判別模型,然后分別建立偏最小二乘支持向量機的甲醇汽油和乙醇汽油定量檢測模型。
實驗用汽油(92號)在某中石化加油站購買,實驗用無水甲醇和無水乙醇純度≥99.7%。為增加實驗的復(fù)雜性,綜合實際情況,甲醇汽油和乙醇汽油設(shè)置不同濃度梯度。每配制一個甲醇樣品,其濃度比例增加0.6%,甲醇的濃度在0.6%~18.6%的范圍; 每配制一個乙醇樣品,其濃度比例增加0.8%,其濃度在0.8%~25%范圍。先按照對應(yīng)的濃度梯度,分別計算出在不同濃度梯度下所需的甲醇、乙醇體積,在容量瓶中加入之前計算出的所需的甲醇、乙醇,然后分別滴入所購買的92號汽油至容量瓶50 mL刻度處, 充分搖勻,使汽油與其完全混合。依次按照同樣的方法,分別配制29個濃度梯度的甲醇汽油、乙醇汽油。每個濃度梯度配制4個樣品,分別配制各116個樣品。
實驗采用中紅外光譜儀(型號為WQF-510A),實驗室的環(huán)境濕度≤30%,溫度設(shè)置為恒溫25 ℃左右,掃描范圍為: 4 000~900 cm-1,分辨率≥0.85 cm-1,開機儀器預(yù)熱約30 min待設(shè)備穩(wěn)定后進(jìn)行相應(yīng)操作。利用中紅外水平衰減全反射(attenuated total reflection,ATR)附件呈放待測樣品,在附件上均勻涂抹對應(yīng)濃度樣品溶液,然后關(guān)閉儀器的艙門,分別采集甲醇汽油、乙醇汽油的中紅外光譜信息。在MATLAB2014b軟件中利用化學(xué)計量學(xué)方法進(jìn)行數(shù)據(jù)處理。為減少測量過程中的隨機誤差,實驗對每個樣品進(jìn)行5次光譜采集,為減少樣本揮發(fā)帶來檢測誤差,每個樣本控制在2min內(nèi)測量完畢,然后求取平均光譜。
首先對甲醇汽油、乙醇汽油樣品的中紅外光譜進(jìn)行預(yù)處理,然后分別建立后續(xù)模型。建模集與預(yù)測集的數(shù)量約為3∶1。預(yù)測相關(guān)系數(shù)R和預(yù)測均方根誤差(root mean square error of prediction,RMSEP)參數(shù)是本模型評價的關(guān)鍵。檢測模型的好壞由預(yù)測集R和RMSEP系數(shù)共同決定,檢測模型預(yù)測均方根誤差越小、相關(guān)系數(shù)越高,則模型的精度越高。此外,校正均方根誤差(root mean square error of calibration, RMSEC)與RMSEP越接近,說明建立的模型越穩(wěn)定。
圖1 汽油、甲醇汽油以及乙醇汽油的中紅外光譜圖Fig.1 The original mid-infrared spectra of gasoline
圖2為甲醇汽油和乙醇汽油的原始中紅外光譜,同濃度的甲醇汽油和乙醇汽油中紅外原始光譜波形基本一致,只是在一定的波段內(nèi)的光強有區(qū)別,同樣含量的乙醇汽油中紅外的透射更強。
圖2 汽油、甲醇汽油以及乙醇汽油的中紅外光譜圖Fig.2 The original mid-infrared spectra of methanolgasoline and ethanol gasoline
在醇類汽油混合樣品的原始光譜數(shù)據(jù)中,波段范圍為1 000~4 000 cm-1,甲醇汽油116個樣品,乙醇汽油116個樣品,共得到了232條中紅外光譜數(shù)據(jù),將甲醇汽油標(biāo)記為“-1”,將乙醇汽油標(biāo)記為“1”,并對其構(gòu)建定性模型進(jìn)行判別分析[11-12]。
隨機森林的實質(zhì)是一個包含了多個決策樹的分類器,隨機森林中的樹之間沒有相互關(guān)聯(lián)。在構(gòu)建決策樹時,采用隨機選取分裂屬性集的方法。Ntree為隨機森林中決策樹的個數(shù)。首先,采用K-S算法[13]將232組中紅外光譜數(shù)據(jù)分成兩組,分別為建模數(shù)據(jù)和預(yù)測數(shù)據(jù),其所占的光譜數(shù)據(jù)分別為174個和58個。再預(yù)先設(shè)置好參數(shù),決策樹的個數(shù)(Ntree)設(shè)為500個,樹節(jié)點預(yù)選變量個數(shù)(Mtry)值是光譜變量數(shù)的平方根(即向下取整),約為39,再構(gòu)造隨機森林分類模型。如圖3所示為帶外錯誤率(OOB)誤差率與決策樹個數(shù)關(guān)系,當(dāng)決策樹個數(shù)為61時,OOB誤差率獲得最小值,為0.034 5。圖4為變量貢獻(xiàn)率的變化圖,波段范圍在1 508,2 298和2 312~2 294 cm-1附近的變量對甲醇汽油、乙醇汽油的分辨具有更佳的作用。
圖3 光譜帶外數(shù)據(jù)誤差率Fig.3 OOB error rate of spectra
圖4 變量貢獻(xiàn)率的變化圖Fig.4 The contribution rate variation chart of the variables
表1為隨機森林(RF)判別模型分類結(jié)果,甲醇汽油、乙醇汽油中模型分類的正確率為98.28%,構(gòu)造的模型對甲醇汽油和乙醇汽油樣品的分類具有較好的效果。
表1 RF判別模型分類結(jié)果Table 1 Classification results of RF discriminant model
2.3.1 甲醇汽油、乙醇汽油樣品前處理
將預(yù)處理后的甲醇汽油和乙醇汽油中紅外光譜數(shù)據(jù),采用最小二乘支持向量機算法構(gòu)建模型,并對不同預(yù)處理后建立的模型的預(yù)估能力進(jìn)行比較。使用KS(kennard-stone)算法按照3∶1的比例,分別對預(yù)處理后的甲醇汽油和乙醇汽油樣品數(shù)據(jù)進(jìn)行劃分(甲醇汽油和乙醇汽油各112個),其中84個光譜數(shù)據(jù)用于建立了模型,28個光譜數(shù)據(jù)用于對模型進(jìn)行檢驗。
表2 甲醇汽油、乙醇汽油的醇含量在建模集和預(yù)測集的真實分布
Table 2 The actual distribution of alcohol content of methanol gasoline and ethanol gasoline in the modeling and prediction
類別樣品集分類數(shù)量N最小值/%最大值/%平均值/%標(biāo)準(zhǔn)差STDEV全部樣本1120.619.9999.544 56.156甲醇汽油建模集840.619.9999.624 86.065預(yù)測集280.619.9999.295 86.206全部樣本1120.824.00012.4146.996乙醇汽油建模集840.824.00012.5457.074預(yù)測集280.824.00012.0006.853
Note:N: Number of samples; STDEV: Standard deviation
2.3.2 甲醇汽油、乙醇汽油LS-SVM定量模型的建立及分析
最小二乘支持向量機是一種針對支持向量機算法的優(yōu)化形式,本模型基于RBF徑向基函數(shù),此建模方法必須確定兩個參數(shù),分別為正則化參數(shù)γ和核參數(shù)σ2。建模效果的評估是基于醇類汽油醇含量的均方根誤差RMSEP和相關(guān)系數(shù)R。
表3為不同預(yù)處理后的LSSVM模型預(yù)測甲醇汽油、乙醇汽油中醇含量的建模結(jié)果。從表中可以得出,無論是甲醇汽油還是乙醇汽油,運用SNV對其光譜數(shù)據(jù)預(yù)處理后,基于RBF函數(shù)構(gòu)造的LS-SVM模型效果更佳,甲醇汽油所對應(yīng)的Rp和RMSEP的值分別是0.951 9和1.766 3; 乙醇汽油此時所對應(yīng)的Rp和RMSEP的值分別是0.951 5和1.770 3(見表6)。說明使用SNV可以較好的消除樣品表面散射以及光程差變化對中紅外光譜的影響。經(jīng)SNV預(yù)處理后,再與LSSVM模型相結(jié)合,可以較為精準(zhǔn)的定量檢測醇類汽油的醇含量。圖5(a,b)分別為LSSVM預(yù)測甲醇和乙醇汽油醇含量的散點圖。
表3 LSSVM模型預(yù)測甲醇汽油、乙醇汽油中醇含量的建模結(jié)果
Table 3 The modeling results of alcohol content in methanol gasoline and ethanol gasoline predicted by LSSVM
類型處理方法γσ2RRMSEP/%甲醇汽油Origin1.179 4×1061.731 9×1030.933 81.919 0SG2.273 5×1051.994 5×1030.929 31.985 3MSC1.263 9×1052.033 4×1030.951 41.774 1SNV4.666 0×1041.915 5×1030.951 91.766 31st derivatives6.010 3×1048.721 6×1040.876 52.774 82nd derivatives6.712 8×1041.602 2×1050.823 53.225 8乙醇汽油Origin5.453 1×106258.020 30.937 82.399 8SG9.438 1×103327.988 00.930 12.643 7MSC40.316 7845.716 70.922 02.614 3SNV1.919 6×1052.025 1×1030.951 51.770 31st derivatives9.895 1×1051.904 7×1040.909 63.146 82nd derivatives3.862 0×1052.943 6×1050.899 83.242 8
圖5 LSSVM預(yù)測醇類汽油醇含量的散點圖(a): 甲醇汽油; (b): 乙醇汽油Fig.5 Scatter diagram of alcohol content inalcohol gasoline predicted by LSSVM(a): Methanol gasoline; (b): Methanol gasoline
表6 預(yù)測甲醇汽油、乙醇汽油中醇含量的模型對比結(jié)果
Table 6 Model comparison results for predicting alcohol content in methanol gasoline and ethanol gasoline
類型PretreatmentModelParameterRpRMSEP/%甲醇汽油SNVLS-SVMγ=4.666 0×104σ2=1.915 5×1030.951 91.766 3乙醇汽油SNVLS-SVMγ=1.919 6×105σ2=2.025 1×1030.951 51.770 3
采用RF對甲醇汽油和乙醇汽油進(jìn)行判別分析,正確率達(dá)到98.23%。對所得的光譜數(shù)據(jù)使用S-G平滑、MSC、SNV,一階導(dǎo)數(shù)以及二階導(dǎo)數(shù)等多種方法進(jìn)行預(yù)處理,應(yīng)用LSSVM方法對其建模,對比模型結(jié)果可知,無論是甲醇汽油還是乙醇汽油,對于LSSVM模型,SNV預(yù)處理效果最好。對于甲醇汽油模型,預(yù)測集相關(guān)系數(shù)Rp為0.951 9,RMSEP為1.766 3,對于乙醇汽油模型,預(yù)測集相關(guān)系數(shù)Rp為0.951 5,RMSEP為1.770 3。為今后現(xiàn)場快速檢測醇類汽油提供了理論參考,具有較為重要的應(yīng)用價值。