柯佳慧 蔡 瓊 田麗歆 周文黎
(江漢大學(xué) 湖北·武漢 430056)
隨著化工醫(yī)藥業(yè)的發(fā)展,烯烴原料具有清潔,可再生等特點,被廣泛應(yīng)用于生產(chǎn)生活中。而C4烯烴作為塑料,香精等主要原材料之一,其制備研究就顯得更有意義。目前最常見的C4烯烴制備方法就是利用乙醇催化偶合,但過程中除了要考慮反應(yīng)物的利用率以及生成物的量之外,還要考慮實際實驗操作難度,以及反應(yīng)生成的一些副產(chǎn)物也最好盡可能的小,那么就需要找到最佳的催化劑組合和溫度,確保實驗在相對安全便捷的情況下,生成盡可能多的有用生成物,以及使烯烴收率最優(yōu)。
現(xiàn)已知某化工實驗室針對兩種催化劑裝料方式1和2,其中分別在不同催化劑組合以及不同溫度下做了一系列試驗,得到生成物結(jié)果記錄。數(shù)據(jù)顯示催化劑是由Co負(fù)載量、Co/SiO2和HAP裝料比以及乙醇滴加速度組合而來,實驗溫度大多為250℃~400℃,生成物也有相關(guān)記載,反應(yīng)性能評價由乙醇轉(zhuǎn)化率與C4烯烴選擇性組成,此二者均為正指標(biāo)。
首先,將數(shù)據(jù)集中的催化劑組合進(jìn)行拆分,并對數(shù)據(jù)無量綱化,標(biāo)準(zhǔn)化處理。其次,利用Pearson相關(guān)系數(shù)分析不同特征之間的相關(guān)性強(qiáng)弱,得出不同特征對試驗結(jié)果的大致影響。將拆分后的各數(shù)據(jù)集,分別按溫度,Co負(fù)載量等等特征分組,將分組后的數(shù)據(jù)分別用TOPSIS模型計算,得到大概的各個特征對催化劑效果的影響趨勢。最后,利用支持向量機(jī)模型對原有的拆分后的數(shù)據(jù)集進(jìn)行訓(xùn)練與測試,用枚舉法對這些特征的取值進(jìn)行重組,得到關(guān)于裝料方式,催化劑組合,溫度的36036個組合,將得到的這些數(shù)據(jù)集放入前面訓(xùn)練過的SVM程序中運(yùn)行計算,便可得出最大的生成物百分?jǐn)?shù),以得到對應(yīng)最優(yōu)的催化劑組合與溫度。
(1)拆分?jǐn)?shù)據(jù)集:首先將催化劑按照Co負(fù)載量,Co/SiO2和HAP裝料之比,乙醇加入的速度這三個特征值進(jìn)行數(shù)據(jù)的拆分。但由于數(shù)據(jù)中含有Co/SiO2和HAP裝料比相同但各自的值不同這一因素,為了消除這種比值相同但質(zhì)量不同的影響,在此還增加了一個HAP的質(zhì)量作為一個特征值,以便隨意組合后可以得到每一個重要的影響因素的具體數(shù)值。其次數(shù)據(jù)集中有一些數(shù)據(jù)沒有直觀的數(shù)值,因此,我們針對每一種拆分?jǐn)?shù)據(jù)進(jìn)行了數(shù)值替代,具體替代方法如下:①feature1:Co負(fù)載量的數(shù)值替代。如Co/SiO2質(zhì)量之比為1wt%=1:100,近似認(rèn)為Co的負(fù)載量為1;②feature2:Co/SiO2和HAP裝料之比的數(shù)值替代。通過查詢資料得知裝料比只有1:2,1:1,2:1三種情況,因此用0.5,1,2來代替。如Co/Si02裝料為200mg,HAP裝料為200mg,用1代替;③feature3:加入HAP的數(shù)值替代。例如數(shù)據(jù)顯示HAP為200mg,則用200代替;④feature4:乙醇加入速度的數(shù)值替代。比如乙醇濃度為1.68ml/min,用1.68代替。
(2)標(biāo)準(zhǔn)化處理:根據(jù)題目需要,我們僅對生成物中乙醇轉(zhuǎn)化率和烯烴選擇性這兩個因素作為實驗好與不好的參考依據(jù),此時該數(shù)據(jù)的顯示方式為百分比,此類數(shù)據(jù)量級等均與其他數(shù)值類型不同,所以此時若直接代入原始數(shù)據(jù),由于量級問題可能會對后續(xù)的結(jié)果造成影響,例如數(shù)值較大的數(shù)據(jù)對結(jié)果影響會較為突出,而數(shù)值小的數(shù)據(jù)對結(jié)果的影響可能會被“忽略不計”等問題。所以為了減小運(yùn)算結(jié)果誤差,我們針對上述問題對進(jìn)行了標(biāo)準(zhǔn)化處理。由于我們的數(shù)據(jù)中,兩個重要需求因素(乙醇轉(zhuǎn)化率和烯烴選擇性)都是正指標(biāo),所以我們是直接對其進(jìn)行了離差標(biāo)準(zhǔn)化處理,使之范圍均控制在區(qū)間[0,1]中。
Pearson相關(guān)系數(shù)的基本思想為任取兩個變量X=[x1,x2,…,xn],Y=[y1,y2,…,yn],當(dāng)變量為連續(xù)性數(shù)值且總體呈正態(tài)分布或接近正態(tài)分布時,通過計算x,y的離差平方和及離差平方和之積,求得相關(guān)系數(shù)r,從而確定其相關(guān)性強(qiáng)度。本文利用Python建立了相關(guān)系數(shù)矩陣,發(fā)現(xiàn)了不同催化劑組合,溫度與乙醇轉(zhuǎn)化率,C4烯烴選擇性都是強(qiáng)相關(guān)的,相關(guān)系數(shù)達(dá)到了0.9左右,因此不需要篩選特征。
針對標(biāo)準(zhǔn)化之后的數(shù)據(jù),首先按溫度由小到大排序,將溫度相同的看作同一組,找到每一組最優(yōu)值和最劣值,然后計算標(biāo)準(zhǔn)化之后的數(shù)據(jù)到這兩個值的歐氏距離,然后得到距離的綜合指標(biāo)。發(fā)現(xiàn)溫度對兩個生成物的影響都是溫度越高越好。同上處理方式,我們對裝料方式等等,也進(jìn)行了相應(yīng)的處理,得到催化劑的裝料方式1明顯優(yōu)于裝料方式2,因此后續(xù)對于尋找最優(yōu)實驗組合時,可以不用考慮第二種裝料方式。另外發(fā)現(xiàn):Co負(fù)載量越小,得到的所需物相對越高;Co/SiO2和HAP裝料之比1:1時對于乙醇的轉(zhuǎn)化率效果較好;當(dāng)HAP的質(zhì)量越多時,轉(zhuǎn)化率與選擇性越高;加入乙醇的速度越慢則實驗結(jié)果越好。
支持向量機(jī)方法是建立在統(tǒng)計學(xué)習(xí)理論的基礎(chǔ)上,對特定訓(xùn)練樣本的學(xué)習(xí)精度,Accuracy和學(xué)習(xí)能力。通俗來說,支持向量機(jī)就是通過給定的數(shù)據(jù)集中,找到一個超平面,使它能夠盡可能的分開兩類數(shù)據(jù)點,使這兩類數(shù)據(jù)點距離該平面的距離最遠(yuǎn),SVM就是要尋找這個最好的超平面,劃分?jǐn)?shù)據(jù)集。
依據(jù)前面針對催化劑組合特征對實驗結(jié)果影響的研究結(jié)果,我們對原始數(shù)據(jù)中所給的5個指標(biāo)進(jìn)行了擴(kuò)充,分別為:
①feature1:[0.3 0.4 0.5 0.7 0.8 1 1.5 1.9 2 2.5 4 4.5 5]
②feature2:[0.5 1 2]
③feature3:[10 25 33 50 67 75 90 100 140 170 200]
④feature4:[0.3 0.9 1.3 1.68 2.1 2.4]
⑤實驗溫度:[250 275 300 325 350 375 400]
利用Python對5組數(shù)據(jù)做笛卡爾積,將數(shù)據(jù)放入了不同的列表中,分別定義對兩組數(shù)據(jù),求笛卡爾積的封裝函數(shù)two()以及n組數(shù)據(jù)(n個列表)求笛卡爾積的封裝函數(shù)process(),其中n組數(shù)據(jù)求笛卡爾積函數(shù)采用遞歸方法,將所得笛卡爾積用for循環(huán)與split()方法以單元格為單位進(jìn)行數(shù)據(jù)切分,最終共有36036個測試數(shù)據(jù)組合。
通過前面已經(jīng)測試檢驗過的支持向量機(jī)回歸模型遍歷所有的36036個組合,用溫度劃分之后進(jìn)行最優(yōu)排序,得到最終結(jié)果為:
試驗方案 催化劑 溫度1 200mg 0.5wt%Co/SiO2-200mg HAP-乙醇濃度0.3ml/min 400 2 200mg 0.8wt%Co/SiO2-200mg HAP-乙醇濃度0.3ml/min 350 3 200mg 1wt%Co/SiO2-200mg HAP-乙醇濃度0.5ml/min 325
出于對試驗安全性,節(jié)約成本等考慮,我們選擇試驗方案2。
(1)SVM模型比直接線性回歸要擬合度更高,實用性較強(qiáng),可以應(yīng)用于許多非線性的實際問題。
(2)本文中創(chuàng)建了封裝函數(shù),即代入任何類似數(shù)據(jù)都可以直接得到計算結(jié)果,用很少的實驗次數(shù),得到最好的實驗結(jié)果,對于實驗評估與實現(xiàn)都有很大的意義,具有很好的推廣性。
由于試驗數(shù)據(jù)過少,導(dǎo)致我們模型的穩(wěn)定性不高;對于化學(xué)反應(yīng)過程中的其他副產(chǎn)品沒做過多研究,實際操作中會面臨許多的不可控因素;支持向量機(jī)(SVM)的測試機(jī)中擬合度r2還不夠高,還有改進(jìn)空間。
后面可以通過詢問化學(xué)老師等,了解一下其他副產(chǎn)物對實驗是否有影響,那樣就會有更多的影響因子,對我們的程序測試也更加有利。針對支持向量機(jī)SVM的情況,我們可以對數(shù)據(jù)集的結(jié)果進(jìn)行分類處理,放在分類器中,得到不同的分類組合,使結(jié)果擬合到這些組合中,以便精度更高,效果更加明顯。