何 凡,蔣軍成,潘 勇,倪 磊
?
基于電性拓?fù)錉顟B(tài)指數(shù)的二元液體混合物自燃溫度的預(yù)測(cè)
何凡,蔣軍成,潘勇,倪磊
(南京工業(yè)大學(xué)安全科學(xué)與工程學(xué)院,江蘇省危險(xiǎn)化學(xué)品本質(zhì)安全與控制技術(shù)重點(diǎn)實(shí)驗(yàn)室,江蘇 南京 210009)
摘要:利用AITTA551自燃溫度測(cè)試儀,測(cè)得不同組分和配比下的28組168個(gè)二元可燃混合液體自燃溫度(AIT);基于電性拓?fù)錉顟B(tài)指數(shù)(ETSI)理論,計(jì)算獲得不同原子類(lèi)型所對(duì)應(yīng)的混合 ETSI值;采用添加指數(shù)遞減慣性權(quán)重的改進(jìn)粒子群算法(MPSO)優(yōu)化支持向量機(jī)(SVM)的超平面參數(shù),建立根據(jù)原子類(lèi)型混合ETSI值來(lái)預(yù)測(cè)混合物自燃溫度的MPSO-SVM模型。結(jié)果表明,基于電性拓?fù)錉顟B(tài)指數(shù)能夠有效預(yù)測(cè)二元液體混合物自燃溫度,MPSO-SVM模型的復(fù)相關(guān)系數(shù)R2為0.991,平均絕對(duì)誤差A(yù)AE為3.962 K。MPSO-SVM模型的泛化性能和預(yù)測(cè)精度明顯優(yōu)于多元線(xiàn)性回歸(MLR)、網(wǎng)格搜索法(GSM-SVM)、遺傳算法(GA-SVM)、標(biāo)準(zhǔn)粒子群算法(PSO-SVM)模型。本研究為工程上提供了一種預(yù)測(cè)二元混合物自燃溫度的有效途徑。
關(guān)鍵詞:電性拓?fù)錉顟B(tài)指數(shù);二元混合物;算法;自燃溫度;預(yù)測(cè)
自燃溫度是指可燃物質(zhì)在空氣中無(wú)需任何外在火源就能夠自行燃燒的最低溫度[1]。可燃物質(zhì)的自燃溫度不僅是表征物質(zhì)危險(xiǎn)性的重要參數(shù),也是量化風(fēng)險(xiǎn)評(píng)估的必要參數(shù)。在實(shí)際生產(chǎn)過(guò)程中,可燃混合有機(jī)物被各個(gè)領(lǐng)域廣泛使用,由于環(huán)境溫度或反應(yīng)時(shí)高溫的存在而引起可燃物質(zhì)自燃的事故時(shí)有發(fā)生[2]。因此,在危險(xiǎn)化學(xué)品生產(chǎn)、使用、儲(chǔ)運(yùn)等過(guò)程中,必須要把自燃溫度指標(biāo)考慮在內(nèi)。
國(guó)內(nèi)外自燃溫度的相關(guān)研究還局限于純物質(zhì)或氣態(tài)混合物,對(duì)混合液體自燃溫度研究還相當(dāng)滯后。關(guān)于純物質(zhì)方面,Pan等[3-4]利用多元線(xiàn)性回歸(MLR)、人工神經(jīng)網(wǎng)絡(luò)(ANN)以及支持向量機(jī)(SVM)等方法對(duì)純有機(jī)物的自燃溫度進(jìn)行預(yù)測(cè)。Tsai等[5]選取電性拓?fù)錉顟B(tài)指數(shù)平均數(shù)、芳香比率、旋轉(zhuǎn)聯(lián)接分?jǐn)?shù)、原子中心分段數(shù)作為分子描述符,建立自燃溫度的預(yù)測(cè)模型。Bagheri等[6]利用粒子群算法篩選描述符,提出含硫有機(jī)物的自燃溫度預(yù)測(cè)模型。氣態(tài)混合物方面,Kong等[7]利用體積為1 L的自燃點(diǎn)爆炸裝置對(duì)不同當(dāng)量比的天然氣組分混合物的自燃溫度進(jìn)行了測(cè)定。Rota等[8]建立預(yù)測(cè)工業(yè)混合氣體(NH3/H2/CH4)自燃溫度的動(dòng)力學(xué)模型。Norman 等[9]研究了裝有丙烷和空氣混合物的球形封閉容器內(nèi)的自燃溫度隨初始?jí)毫Φ淖兓?guī)律。van den Schoor等[10]通過(guò)一個(gè)完全攪拌反應(yīng)器模型對(duì)NH3/CH4/Air混合物的自燃溫度進(jìn)行了研究。
混合物自燃溫度雖然可通過(guò)自燃溫度測(cè)試儀進(jìn)行測(cè)定,但常會(huì)遇到實(shí)驗(yàn)設(shè)備昂貴、測(cè)定影響因素多和過(guò)程耗時(shí)耗力的問(wèn)題,導(dǎo)致無(wú)法在實(shí)踐中大規(guī)模推廣運(yùn)用。因此,有必要開(kāi)展混合物自燃溫度的實(shí)驗(yàn)及理論預(yù)測(cè)研究,以期建立簡(jiǎn)單可靠的混合自燃溫度預(yù)測(cè)模型。本文通過(guò)實(shí)驗(yàn)獲取大量可靠的二元可燃混合液體自燃溫度數(shù)據(jù),并基于電性拓?fù)錉顟B(tài)指數(shù)(ETSI)理論和改進(jìn)的粒子群優(yōu)化(MPSO)算法建立了二元混合物自燃溫度的MPSO-SVM理論預(yù)測(cè)模型,能夠快速有效地預(yù)測(cè)二元混合物自燃溫度,給工業(yè)生產(chǎn)安全提供必要的混合物自燃溫度物性數(shù)據(jù)支撐。
1.1 實(shí)驗(yàn)儀器
本實(shí)驗(yàn)使用的儀器為AITTA 551自燃溫度測(cè)試儀,由美國(guó)愛(ài)迪塞恩有限公司設(shè)計(jì)制造,按照ASTM E659-78標(biāo)準(zhǔn)對(duì)試液體的自燃溫度進(jìn)行測(cè)試。如圖1所示,它包括高溫加熱爐、電腦軟件控制以及測(cè)量單元,加熱爐內(nèi)溫度分布均衡,燒瓶通過(guò)爐內(nèi)的熱風(fēng)循環(huán)進(jìn)行加熱,3個(gè)與瓶壁接觸的熱電偶實(shí)時(shí)監(jiān)測(cè)燒瓶的溫度變化,另一個(gè)熱電偶測(cè)定燒瓶?jī)?nèi)部溫度;計(jì)算機(jī)系統(tǒng)控制儀器對(duì)熱電偶和火焰檢測(cè)器的數(shù)據(jù)進(jìn)行采集,并自動(dòng)評(píng)價(jià)測(cè)試結(jié)果。
圖1 AITTA 551自燃溫度測(cè)試儀內(nèi)部結(jié)構(gòu)Fig.1 Internal structure chart of AITTA 551 auto-ignition temperature tester
1.2 實(shí)驗(yàn)原理與步驟
以常見(jiàn)的烷、醇、醚、酮、酸、酯、苯系物等可燃有機(jī)物為實(shí)驗(yàn)對(duì)象,依據(jù)有機(jī)溶劑互溶表,篩選出多組完全互溶的物質(zhì),配制不同組分及濃度的二元可燃混合物。
將自燃溫度實(shí)驗(yàn)測(cè)定步驟歸納如下。
查詢(xún)純物質(zhì)的自燃溫度,對(duì)不同配比的混合液體自燃溫度進(jìn)行預(yù)估;設(shè)置爐溫初始值低于預(yù)估值30 K,爐內(nèi)的熱風(fēng)循環(huán)將燒瓶加熱到設(shè)定值,過(guò)程持續(xù)30 min以上來(lái)保持溫度穩(wěn)定;移取100 μl混合溶液加入 500 ml燒瓶中,檢測(cè)是否發(fā)生自燃,如10 min內(nèi)觀察鏡中出現(xiàn)火焰并伴隨輕微爆鳴聲或燒瓶?jī)?nèi)的溫度瞬間升高,即可認(rèn)為發(fā)生自燃;采用逼近法不斷調(diào)節(jié)燒瓶的溫度,步長(zhǎng)由30 K逐漸降低到3 K,并不斷重復(fù)測(cè)試過(guò)程直到測(cè)得自燃溫度為止;每組實(shí)驗(yàn)結(jié)束后使用熱風(fēng)槍吹掃燒瓶,將殘余樣品清除,以減少實(shí)驗(yàn)誤差。
1 . 3 實(shí)驗(yàn)結(jié)果與分析
通過(guò)實(shí)驗(yàn)測(cè)得 2 8組二元互溶混合液體在不同配比下的混合自燃溫度共1 6 8個(gè)數(shù)據(jù)點(diǎn)。為了進(jìn)一步檢驗(yàn)實(shí)驗(yàn)數(shù)據(jù)的準(zhǔn)確度,利用純物質(zhì)自燃溫度的實(shí)驗(yàn)值同D I P P R[11]以及I C S C s[12]兩大權(quán)威數(shù)據(jù)庫(kù)值進(jìn)行驗(yàn)證對(duì)比,結(jié)果見(jiàn)表1 。
表1 純物質(zhì)自燃溫度實(shí)驗(yàn)值與DIPPR/ICSCs數(shù)據(jù)對(duì)比Table 1 Comparison between experimental and DIPPR/ICSCs database values of AIT for pure substances
由表1可知,純物質(zhì)自燃溫度實(shí)驗(yàn)值與DIPPR 和 ICSCs數(shù)據(jù)庫(kù)值的平均絕對(duì)誤差 AAE分別為24.95、26.00 K,根據(jù)ASTM E659-78的測(cè)試標(biāo)準(zhǔn),自燃溫度實(shí)驗(yàn)絕對(duì)誤差允許在30 K的范圍內(nèi),所以可以認(rèn)為整體的實(shí)驗(yàn)數(shù)據(jù)真實(shí)有效[13]。
2.1 ETSI理論
2.1.1 ETSI理論簡(jiǎn)介 電性拓?fù)錉顟B(tài)指數(shù)(electrotopological state indices,ETSI)是Kier等[14]提出的一種基于分子中各個(gè)原子的原子級(jí)拓?fù)渲笖?shù)。由于ETSI既可以表現(xiàn)原子電子性質(zhì)和拓?fù)湫再|(zhì),又能夠表現(xiàn)該原子所受分子環(huán)境影響,已經(jīng)廣泛應(yīng)用于物質(zhì)的理化性質(zhì)預(yù)測(cè)研究[15]。
2.1.2 混合ETSI值計(jì)算 表2為二元混合物中18種可燃有機(jī)物所包含的9種原子類(lèi)型、ETSI符號(hào)及其固有狀態(tài)值。
根據(jù)前人的研究成果[15],將混合ETSI值的具體計(jì)算步驟總結(jié)如下。
表3 9種原子類(lèi)型、ETSI符號(hào)及其固有狀態(tài)值Table 2 9 kinds of atomic types, ETSI symbols and intrinsic state values
(1) 計(jì)算分子中每一個(gè)非氫骨架原子所對(duì)應(yīng)的固有狀態(tài)值Ii
式中,N為非氫原子價(jià)電子的主量子數(shù);δ、δv分別為分子骨架中原子的價(jià)電子數(shù)和σ軌道價(jià)電子數(shù);σ、π分別為與該原子形成的σ和π軌道電子數(shù);n、h分別為原子的孤對(duì)電子數(shù)和與該原子連接的氫原子數(shù)。
(2) 計(jì)算其他非氫原子對(duì)固有狀態(tài)值I的影響,即求增量ΔIi
式中,i、j分別為相互影響的兩非氫原子的編號(hào);dij為第i和第j原子之間的拓?fù)渚嚯x。
(3) 將各個(gè)原子的固有狀態(tài) Ii與其他非氫原子的擾動(dòng)ΔIi相加即得到分子中原子i的電性拓?fù)錉顟B(tài)指數(shù)Si
(4) 將屬于相同原子類(lèi)型的各非氫原子的電性拓?fù)錉顟B(tài)指數(shù)相加即得到各原子類(lèi)型的 ETSI值,而各原子類(lèi)型混合ETSI值為
式中,x1、x2分別為二元混合物中各組分所占的體積分?jǐn)?shù)(x1+x2=1)。
2.2 SVM回歸理論
支持向量機(jī)(support vector machine,SVM)采用VC維理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,可以較好地解決小樣本、非線(xiàn)性、高維數(shù)、局部極小等問(wèn)題。隨著ε-不敏感損失函數(shù)的引入,已廣泛應(yīng)用于解決數(shù)據(jù)的回歸問(wèn)題,并表現(xiàn)出良好的預(yù)測(cè)性能[16]。
給定樣本為(x1, y1), (x2, y2), …, (xk, yk)∈RN× R,其中 xi∈RN為輸入?yún)?shù),yi∈R為相應(yīng)的輸出參數(shù),k為樣本個(gè)數(shù)。SVM通過(guò)一個(gè)確定的非線(xiàn)性映射θ將輸入數(shù)據(jù)x映射到高維特征空間F,并構(gòu)建最優(yōu)超平面將問(wèn)題轉(zhuǎn)化為線(xiàn)性回歸分析,設(shè)回歸函數(shù)為 f(x)=[w·θ(x)]+b,其中w為權(quán)值矢量,b為閥值。
根據(jù)統(tǒng)計(jì)學(xué)理論,考慮允許擬合誤差的情況,可通過(guò)以下目標(biāo)數(shù)極小化確定SVM的回歸函數(shù)
在樣本數(shù)較少時(shí),可利用拉格朗日方法求解上述約束最優(yōu)化問(wèn)題,將原問(wèn)題轉(zhuǎn)化為對(duì)偶問(wèn)題,令參數(shù)w、b、的偏導(dǎo)數(shù)都等于零,即得
式中,K(xi, xj)是SVM核函數(shù);αi、為二次規(guī)劃問(wèn)題的拉格朗日系數(shù);n為支持向量機(jī)數(shù)。
核函數(shù)K(xi, xj)=[θ(xi), θ(xj)],即得i=1
因此SVM最優(yōu)回歸函數(shù)表示為
目前SVM回歸算法常用的核函數(shù)是徑向基函數(shù)(radial basis function,RBF),可表示為
由SVM回歸理論可知,RBF核函數(shù)的懲罰系數(shù)C、參數(shù)寬度γ以及ε-不敏感損失函數(shù)中ε的取值是影響SVM預(yù)測(cè)性能的關(guān)鍵參數(shù),為獲得最佳的模型預(yù)測(cè)精度和泛化能力,在建模過(guò)程中需要對(duì)SVM超平面參數(shù)進(jìn)行尋優(yōu)。
2.3 MPSO算法
改進(jìn)的粒子群優(yōu)化(modified particle swarm optimization,MPSO)算法引入指數(shù)遞減慣性權(quán)重(exponential decreasing inertia weight,EDIW)和收斂因子來(lái)平衡 PSO算法的全局搜索與局部搜索能力,添加粒子自適應(yīng)變異保持種群多樣性,并選擇訓(xùn)練集交叉驗(yàn)證下的均方差 MSE作為適應(yīng)度函數(shù),在提高標(biāo)準(zhǔn)粒子群算法對(duì)解空間的搜索能力的同時(shí)也保證了最終預(yù)測(cè)模型的精度[17]。
MPSO算法中的粒子通過(guò)個(gè)體極值Pbest和全局極值Gbest更新自身的速度和位置改進(jìn)的速度、位置更新公式如下
Subject to
1
式中,k為當(dāng)前迭代次數(shù);kmax為最大迭代次數(shù);w(k)為慣性權(quán)重指數(shù)函數(shù);β為遞減系數(shù),默認(rèn)取10;φ為收斂因子,由非負(fù)加速度因子c1、c2決定;α為約束因子;d=1,2,…,D,D為粒子維數(shù)。
選擇交叉驗(yàn)證下的均方差MSE為適應(yīng)度函數(shù),計(jì)算公式如下
式中,yi,pred、yi,obs分別為訓(xùn)練樣本的預(yù)測(cè)值和實(shí)驗(yàn)值;n為訓(xùn)練集樣本數(shù)。
采用MPSO算法優(yōu)化SVM超平面參數(shù)流程如圖2所示。
圖2 基于MPSO算法優(yōu)化SVM參數(shù)流程Fig.2 Flowchart of optimizing SVM parameters based on MPSO algorithm
2.4 預(yù)測(cè)模型建立
2.4.1 MPSO-SVM 模型 采用 Lin等[18]開(kāi)發(fā)的Libsvm3.20進(jìn)行SVM回歸運(yùn)算。利用可燃混合液體所包含的9種不同原子類(lèi)型對(duì)應(yīng)的ETSI值對(duì)自燃溫度進(jìn)行表征,選擇測(cè)得的168組自燃溫度實(shí)驗(yàn)數(shù)據(jù)作為樣本集,對(duì)樣本集進(jìn)行劃分,隨機(jī)抽取每組1個(gè)數(shù)據(jù)點(diǎn)作為測(cè)試集,共28個(gè)數(shù)據(jù)點(diǎn)作為測(cè)試集,用于對(duì)模型預(yù)測(cè)能力進(jìn)行驗(yàn)證,其余140個(gè)數(shù)據(jù)點(diǎn)作為訓(xùn)練集,用于建立預(yù)測(cè)模型。
建模前應(yīng)對(duì)訓(xùn)練集、測(cè)試集的輸入和輸出都進(jìn)行歸一化預(yù)處理,經(jīng)過(guò)運(yùn)算驗(yàn)證,歸一化區(qū)間設(shè)為[-1,1]時(shí),建模效果最好。設(shè)置SVM類(lèi)型為ε-SVR;核函數(shù)類(lèi)型為徑向基RBF核;采用“留1/10法”交互驗(yàn)證(10-fold cross validation)結(jié)果作為參數(shù)尋優(yōu)的標(biāo)準(zhǔn);粒子數(shù)量為30,最大迭代次數(shù)Tmax=300;慣性權(quán)重wstart=0.9、wend=0.4;加速度因子c1=2.05,c2=2.05,即收斂因子φ=0.7298,約束因子α=1;C、γ、ε的搜索范圍分別為[10-1,102]、[10-2,103]、[10-2,102];速度和位置之間的關(guān)系式 V=kX,取k=0.6。確定SVM模型的最優(yōu)參數(shù):best C=14.9223,best γ=0.36202,best ε=0.01,根據(jù)SVM最優(yōu)超平面參數(shù)建立MPSO-SVM預(yù)測(cè)模型。
2.4.2 MLR模型 多元線(xiàn)性回歸(multiple linear regression,MLR)分析采用SPSS Statistics 22在95%置信區(qū)間內(nèi)使用全回歸算法進(jìn)行MLR回歸,獲得的MLR預(yù)測(cè)模型如下
其中,復(fù)相關(guān)系數(shù)R2=0.942,F(xiàn)檢驗(yàn)值f=235.14,模型標(biāo)準(zhǔn)誤差SE=21.896,顯著性概率p<0.001,說(shuō)明該方程具有顯著的統(tǒng)計(jì)學(xué)意義。
同時(shí),對(duì)樣本數(shù)據(jù)進(jìn)行了主成分分析(principal component analysis,PCA),在95%的解釋率下,有5個(gè)原子類(lèi)型對(duì)自燃溫度影響顯著,分別是ssCH2> sOH > dO > sCH3> ssO。降維結(jié)果表明,各個(gè)原子類(lèi)型之間存在較強(qiáng)的共線(xiàn)性問(wèn)題,而直接簡(jiǎn)單地運(yùn)用MLR建模并不是最佳的。
2.4.3 GSM-SVM 模型 網(wǎng)格搜索法(gird search method,GSM)是將待搜索參數(shù)在一定的空間范圍中劃分成網(wǎng)格,通過(guò)遍歷網(wǎng)格中所有的點(diǎn)進(jìn)行尋優(yōu)。設(shè)置超平面參數(shù) C、γ、ε的格點(diǎn)搜索范圍分別為[2-10,210]、[2-10,210]、[20.1,210],log2C、log2γ、log2ε對(duì)應(yīng)的步長(zhǎng)分別為1、1、0.1。確定SVM模型的最優(yōu)參數(shù):best C=16,best γ=0.0625,best ε=0.1,記為GSM-SVM模型。
2.4.4 GA-SVM模型 遺傳算法(genetic algorithms,GA)是一類(lèi)借鑒自然界遺傳機(jī)制和生物進(jìn)化論而成的并行隨機(jī)化搜索算法[19]。設(shè)置種群數(shù)量Sizepop=20,最大進(jìn)化終止代數(shù)Maxgen=150;選擇概率pSelection=0.9,交叉概率pCrossover=0.4,變異概率pMutation= 0.02;C、γ、ε的搜索范圍分別為[0,102]、[0,103]、[10-2,1],采用二進(jìn)制對(duì)參數(shù)編碼。最終確定 SVM 模型的最優(yōu)參數(shù):best C=74.174,best γ=0.0572,best ε=0.0496,記為GA-SVM模型。
2.4.5 PSO-SVM模型 采用標(biāo)準(zhǔn)PSO算法來(lái)優(yōu)化SVM的超平面參數(shù)C、γ、ε,設(shè)置粒子數(shù)量N=30,最大迭代終止次數(shù)Tmax=300;慣性權(quán)重w=0.9,加速度因子c1=2.05,c2=2.05,約束因子α=1;其余參數(shù)與MPSO算法一致。確定SVM模型的最優(yōu)參數(shù): best C=100,best γ=0.01,best ε=0.01,記為PSO-SVM模型。
2.5 模型驗(yàn)證和穩(wěn)定性分析
模型驗(yàn)證(model validation,MV)是對(duì)模型的穩(wěn)定性、預(yù)測(cè)及泛化能力的檢驗(yàn)[20]。復(fù)相關(guān)系數(shù)R2用于衡量模型的擬合度,即用于模型建模能力的驗(yàn)證。模型的外部預(yù)測(cè)能力可通過(guò)對(duì)測(cè)試集進(jìn)行外部驗(yàn)證,用交叉驗(yàn)證系數(shù)表示。平均絕對(duì)誤差A(yù)AE,平均相對(duì)誤差A(yù)PE,均方根誤差RMSE也可用來(lái)表示模型的性能。的計(jì)算公式為
式中,yi、?i為測(cè)試樣本的實(shí)驗(yàn)值和預(yù)測(cè)值;為訓(xùn)練樣本實(shí)驗(yàn)值的平均值。
表3 模型的主要性能參數(shù)比較Table 3 Comparison among main statistical parameters of obtained models
由表3可知,MPSO-SVM模型復(fù)相關(guān)系數(shù)R2為0.991,外部驗(yàn)證系數(shù)為0.948,均大于0.9,說(shuō)明模型具備良好的預(yù)測(cè)性能及泛化能力。同時(shí),對(duì)測(cè)試集樣本的平均絕對(duì)誤差A(yù)AE為11.1 K,在自燃溫度實(shí)驗(yàn)絕對(duì)誤差允許范圍內(nèi)。其次,如圖3所示,自燃溫度模型預(yù)測(cè)值與實(shí)驗(yàn)值進(jìn)行比較,訓(xùn)練集和測(cè)試集的數(shù)據(jù)點(diǎn)大部分落在圖中所畫(huà)實(shí)驗(yàn)值和預(yù)測(cè)值等值線(xiàn)上,沒(méi)有太多數(shù)據(jù)點(diǎn)嚴(yán)重偏離等值線(xiàn),說(shuō)明MPSO-SVM模型的預(yù)測(cè)效果很好。
圖3 MPSO-SVM模型自燃溫度預(yù)測(cè)值與實(shí)驗(yàn)值的比較Fig.3 Comparison between predicted and experimental AIT values of MPSO-SVM model
圖4 MPSO-SVM模型自燃溫度預(yù)測(cè)殘差Fig.4 Residuals versus experimental AIT values of MPSO-SVM model
2.5.2 模型穩(wěn)定性分析 為了排除建模過(guò)程中的“偶然相關(guān)性”,確保模型的穩(wěn)定性,對(duì)模型的預(yù)測(cè)殘差進(jìn)行分析,結(jié)果如圖4所示,可知模型的預(yù)測(cè)殘差均勻且隨機(jī)地分布于零基準(zhǔn)線(xiàn)的兩側(cè),不存在明顯的規(guī)律性,可推斷出在建模過(guò)程中未產(chǎn)生系統(tǒng)誤差,具有較強(qiáng)的穩(wěn)定性。殘差分析結(jié)果顯示,隨機(jī)選取的測(cè)試集數(shù)據(jù)中有個(gè)別數(shù)據(jù)點(diǎn)的預(yù)測(cè)誤差高于或接近于均方根誤差RMSE的3倍,屬異常值。理論表明[21],出現(xiàn)異常值的樣本數(shù)量低于樣本數(shù)的10%,可以通過(guò)剔除異常值樣本來(lái)提高模型的相關(guān)性,重新建模后,新的模型復(fù)相關(guān)系數(shù) R2達(dá)到了0.994,外部驗(yàn)證系數(shù)為0.951,模型性能更好。
圖5 MLR模型自燃溫度預(yù)測(cè)值與實(shí)驗(yàn)值的比較Fig.5 Comparison between predicted and experimental AIT values of MLR model
圖6 GSM-SVM模型自燃溫度預(yù)測(cè)值與實(shí)驗(yàn)值的比較Fig.6 Comparison between predicted and experimental AIT values of GSM-SVM model
表4 測(cè)試集自燃溫度模型預(yù)測(cè)值Table 4 Predicted AIT values for test set by obtained models
2.5.3 模型比較 圖5~圖8分別為MLR、GSMSVM、GA-SVM、PSO-SVM模型自燃溫度預(yù)測(cè)值與實(shí)驗(yàn)值的比較分析結(jié)果。表4列出了各個(gè)模型測(cè)試集對(duì)應(yīng)的自燃溫度預(yù)測(cè)值。從誤差角度來(lái)分析,MPSO-SVM模型預(yù)測(cè)性能最佳(以RMSE為標(biāo)準(zhǔn))。從模型擬合效果來(lái)看,MPSO-SVM模型的復(fù)相關(guān)系數(shù)R2也明顯優(yōu)于其他模型。從表4同樣可以看出MPSO-SVM模型預(yù)測(cè)效果最好。綜上所述,MPSO-SVM模型具有較好的擬合效果,較強(qiáng)的泛化能力,可以很好地進(jìn)行自燃溫度的預(yù)測(cè)。
圖7 GA-SVM模型自燃溫度預(yù)測(cè)值與實(shí)驗(yàn)值的比較Fig.7 Comparison between predicted and experimental AIT values of GA-SVM model
圖8 PSO-SVM模型自燃溫度預(yù)測(cè)值與實(shí)驗(yàn)值的比較Fig.8 Comparison between predicted and experimental AIT values of PSO-SVM model
為了確定MPSO-SVM模型中各原子類(lèi)型的對(duì)自燃溫度的貢獻(xiàn)程度,根據(jù)描述符重要度衡量方法(method for measure of descriptor importance,MMDI)方法[22]對(duì)模型中9個(gè)輸入原子類(lèi)型的相對(duì)重要度進(jìn)行了研究,所得各原子類(lèi)型相對(duì)應(yīng)的均方根誤差(RMSE)增量,RMSE增量越大,即認(rèn)為該原子類(lèi)型對(duì)自燃溫度的影響越大,各原子類(lèi)型對(duì)應(yīng)的RMSE增量見(jiàn)表5。根據(jù)表中RMSE增量的大小,各原子類(lèi)型對(duì)自燃溫度的重要度排列如下: ssCH2> sOH > dO > sCH3> ssO > ssdC > aaCH > sssCH > aasC。計(jì)算結(jié)果表明,MPSO-SVM模型與MLR模型的重要度分析吻合。
表5 MPSO-SVM模型各原子類(lèi)型對(duì)應(yīng)的RMSE增量Table 5 Increment in RMSE for each atomic types in MPSO-SVM model
(1)基于電性拓?fù)錉顟B(tài)指數(shù)理論,建立 SVM模型來(lái)預(yù)測(cè)二元可燃混合液體自燃溫度,并對(duì)各原子類(lèi)型對(duì)自燃溫度的重要度進(jìn)行排序。
(2)提出改進(jìn)的粒子群算法(MPSO)對(duì)SVM超平面參數(shù)C、γ、ε進(jìn)行尋優(yōu),引入指數(shù)遞減慣性權(quán)重和收斂因子來(lái)平衡 PSO算法的全局搜索與局部搜索能力,改進(jìn)效果顯著。
(3)將MPSO-SVM模型與MLR、GSM-SVM、GA-SVM、PSO-SVM模型進(jìn)行比較,結(jié)果表明,在獲得的混合自燃溫度數(shù)據(jù)(含9種原子類(lèi)型)的范圍內(nèi),MPSO-SVM模型性能最優(yōu)。
(4)利用電性拓?fù)錉顟B(tài)指數(shù)理論建立簡(jiǎn)單可靠的適用于9種原子類(lèi)型的二元完全互溶體系混合自燃溫度預(yù)測(cè)模型,為工程上提供了一種快速預(yù)測(cè)混合物質(zhì)自燃溫度的有效途徑。
References
[1] 張宏哲, 王寧, 王亞琴, 等. 活化溫度對(duì)活性炭自燃危險(xiǎn)性的影響[J]. 化工學(xué)報(bào), 2012, 63(11): 3730-3735.
ZHANG H Z, WANG N, WANG Y Q, et al. Influence of activation temperature on spontaneous ignition behavior of activated carbon [J]. CIESC Journal, 2012, 63(11): 3730-3735.
[2] YEONG S K, SUNG K L, JAE H K, et al. Prediction of autoignition temperatures (AITs) for hydrocarbons and compounds containing heteroatoms by the quantitative structure-property relationship [J]. Journal of the Chemical Society, Perkin Transactions 2, 2002, 12: 2087-2092.
[3] PAN Y, JIANG J C, WANG R, et al. Advantages of support vector machine in QSPR studies for predicting auto-ignition temperatures of organic compounds [J]. Chemometrics and Intelligent Laboratory Systems, 2008, 92(2): 169-178.
[4] PAN Y, JIANG J C, WANG R, et al. Predicting the auto-ignition temperatures of organic compounds from molecular structure using support vector machine [J]. Journal of Hazardous Materials, 2009, 164(2/3): 1242-1249.
[5] TSAI F, CHEN C, LIAW H. A model for predicting the auto-ignition temperature using quantitative structure property relationship approach [J]. Procedia Engineering, 2012, 45: 512-517.
[6] BAGHERI M, BORHANI T N G, ZAHEDI G. Estimation of flash point and auto-ignition temperature of organic sulfur chemicals [J]. Energy Conversion and Management, 2012, 58(6): 185-196.
[7] KONG D, ECKHOFF R K, ALFERT F. Auto-ignition of CH4/air, C3H8/air, CH4/C3H8/air and CH4/CO2/air using a 1 L ignition bomb [J]. Journal of hazardous materials, 1995, 40(1): 69-84.
[8] ROTA R, ZANOELO E F. Prediction of the auto-ignition hazard of industrial mixtures using detailed kinetic modeling [J]. Industrial and Engineering Chemistry Research, 2003, 42(13): 2940-2945.
[9] NORMAN F, VAN DEN SCHOOR F, VERPLAETSEN F. Auto-ignition and upper explosion limit of rich propane-air mixtures at elevated pressures [J]. Journal of Hazardous Materials, 2006, 137(2): 666-671.
[10] VAN DEN SCHOOR F, NORMAN F, VANDEBROEK L, et al. A numerical study of the influence of ammonia addition on the auto-ignition limits of methane/air mixtures [J]. Journal of Hazardous Materials, 2009, 164(2/3): 1164-1170.
[11] American Institute of Chemical Engineers (AIChE). Design Institute for Physical Properties (DIPPR) [EB/OL]. [2014-09-11]. http://www.aiche.org/dippr/projects/801.
[12] International Safety Intergovernmental Organization. International Chemical Safety Cards (ICSCs) [EB/OL]. [2010-03-11]. http://www.i-nchem. org/pages/icscs.html.
[13] 蔣軍成, 潘勇. 有機(jī)化合物的分子結(jié)構(gòu)與危險(xiǎn)特性[M]. 北京: 科學(xué)出版社, 2011: 231-248.
JIANG J C, PAN Y. The Molecular Structure and Dangerous Properties of Organic Compounds [M]. Beijing: Science Press, 2011: 231-248.
[14] KIER L B, HALL L H. An electro-topological state index for atoms in molecules [J]. Pharmaceutical Research, 1990, 7(8): 801-807.
[15] HALL L H, KIER L B. Electro-topological state indices for atom types: a novel combination of electro-topological and valencestate information [J]. Journal of Chemical Information and Computer Sciences, 1995, 35(6): 1039-1045.
[16] 安劍奇, 陳易斐, 吳敏. 基于改進(jìn)支持向量機(jī)的高爐一氧化碳利用率預(yù)測(cè)方法[J]. 化工學(xué)報(bào), 2015, 66(1): 206-214.
AN J Q, CHEN Y F, WU M. A prediction method for carbon monoxide utilization ratio of blast furnace based on improved support vector regression [J]. CIESC Journal, 2015, 66(1): 206-214.
[17] 張曉南, 劉安心, 劉斌, 等. 基于優(yōu)化PSO-SVM模型的軟件可靠性預(yù)測(cè)[J]. 計(jì)算機(jī)應(yīng)用, 2011, 31(7): 1761-1764, 1772.
ZHANG X N, LIU A X, LIU B, et al. Software reliability prediction based on improved PSO-SVM model [J]. Journal of Computer Applications, 2011, 31(7): 1761-1764, 1772.
[18] CHANG C C, LIN C J. LIBSVM: a library for support vector machines [J]. ACM Transactions on Intelligent Systems and Technology, 2011, 2(3): 389-396.
[19] 王夢(mèng)寒, 李雁召, 夏知姿, 等. 基于 Kriging模型與遺傳算法結(jié)合的 RHCM 成型工藝參數(shù)優(yōu)化[J]. 化工學(xué)報(bào), 2014, 65(12): 5054-5060.
WANG M H, LI Y Z, XIA Z Z, et al. Processing parameters optimization of rapid heat cycle molding based on Kriging meta-model and genetic algorithm [J]. CIESC Journal, 2014, 65(12): 5054-5060.
[20] GRAMATICA P, PILUTTI P, PAPA E. Validated QSAR prediction of OH tropospheric degradation of VOCs: splitting into training_test sets and consensus modeling [J]. Journal of Chemical Information and Computer Sciences, 2004, 44(5): 1794-1802.
[21] LIPNICK R L. Outliers: their origin and use in the classification of molecular mechanisms of toxicity [J]. Science of the Total Environment, 1991, 109: 131-153.
[22] 潘勇. 有機(jī)物定量結(jié)構(gòu)燃爆特性相關(guān)性及預(yù)測(cè)模型研究[D]. 南京:南京工業(yè)大學(xué), 2009.
PAN Y. Research on prediction models and quantitative relationships between the structures and flammability characteristics of organic compounds [D]. Nanjing: Nanjing University of Technology, 2009.
2015-12-02收到初稿,2016-04-06收到修改稿。
聯(lián)系人:蔣軍成。第一作者:何凡(1991—),男,碩士研究生。
Received date: 2015-12-02.
中圖分類(lèi)號(hào):O 621.2;X 937
文獻(xiàn)標(biāo)志碼:A
文章編號(hào):0438—1157(2016)07—3109—09
DOI:10.11949/j.issn.0438-1157.20151811
基金項(xiàng)目:國(guó)家自然科學(xué)基金項(xiàng)目(21436006,21576136);江蘇省自然科學(xué)基金重大項(xiàng)目(12KJA620001)。
Corresponding author:Prof. JIANG Juncheng, j_c_jiang@163.com supported by the National Natural Science Foundation of China (21436006, 21576136) and the Major Project of the Natural Science Foundation of Jiangsu Province (12KJA620001).
Prediction of auto-ignition temperatures for binary liquid mixtures based on electro-topological state indices
HE Fan, JIANG Juncheng, PAN Yong, NI Lei
(Jiangsu Key Laboratory of Hazardous Chemicals Safety and Control, College of Safety Science and Engineering, Nanjing Tech University, Nanjing 210009, Jiangsu, China)
Abstract:The auto-ignition temperature (AIT) values of 168 sets of binary flammable liquid mixtures composed of different components and volume ratios were measured by AITTA 551 auto-ignition temperature tester. The mixed electro-topological state indices (ETSI) values of different atom types were calculated. The modified particle swarm optimization (MPSO) algorithm with exponential decreasing inertia weight (EDIW) was applied to optimize the support vector machine (SVM) hyper-parameters and MPSO-SVM prediction model was established. The model was employed in research for predicting the AIT of mixtures according to the mixed ETSI values of different atom types. The results showed that it could effectively predict the AIT of binary liquid mixtures based on electro-topological state indices. The squared correlation coefficient (R2) and average absolute error (AAE) of MPSO-SVM model were 0.991 and 3.962 K, respectively. In terms of model generalization performance and prediction accuracy, the result of MPSO-SVM model was obviously superior to the results of multiple linear regression (MLR), grid search method (GSM-SVM), genetic algorithm (GA-SVM) and particle swarm optimization (PSO-SVM). This study provided an effective method to predict the AIT of binary liquid mixtures for engineering.
Key words:electro-topological state indices; binary mixture; algorithm; auto-ignition temperature; prediction