陳祝丹,李大字*,劉 軍,高 科
(1.北京化工大學 信息科學與技術學院,北京 100029;2.北京化工大學 材料科學與工程學院,北京 100029)
玻璃化溫度(Tg)作為聚合物的重要工藝指標,指聚合物高彈態(tài)與玻璃態(tài)之間的轉換溫度。溶聚丁苯橡膠(SSBR)[1]在Tg以上表現(xiàn)為具有高彈性的高彈態(tài),在Tg以下表現(xiàn)為具有脆性的玻璃態(tài)。由于橡膠的Tg會影響其物理性能、阻尼性能、耐熱性能等,其一直是橡膠性質的重要指標。
影響合成橡膠Tg的因素包括聚合物中各組分含量和微觀結構等[2-3]。合成橡膠的Tg通常采用差示掃描量熱儀、動態(tài)熱機械分析儀等測試[4-6],Tg測試值會隨測試方法和條件的變化而改變,且無法預測Tg,即測試缺乏擴展性和靈活性;測試過程需進行重復試驗,消耗大量的人力和物力,測試結果還會受到設備的影響。不同苯乙烯和丁二烯含量的SSBR的Tg不同,要實現(xiàn)其良好表征,目前測試方法的預測分析能力受到極大地限制。
隨著機器學習在材料學科的應用越來越廣泛[7-9],研究學者開始開發(fā)新的方法研究高聚物的Tg測試。通過神經(jīng)網(wǎng)絡來建立高聚物的Tg預測模型是一種普遍且備受關注的方法[10],但神經(jīng)網(wǎng)絡也有很多不足。神經(jīng)網(wǎng)絡需要依賴訓練數(shù)據(jù),數(shù)據(jù)的多樣性和數(shù)量對網(wǎng)絡性能具有重大影響。橡膠每次合成和表征都需要研究人員進行設計和反復試驗,這限制了訓練數(shù)據(jù)的多樣性。
高斯過程回歸[11]是基于統(tǒng)計學理論,可以在模型搭建的過程中自適應地得到超參數(shù),并給予預測輸出明確的概率解釋。因此,與反向傳播(BP)神經(jīng)網(wǎng)絡相比,高斯過程回歸具有更少的參數(shù)和更快的收斂速度,以及對小樣本、非線性問題具有難以取代的優(yōu)勢[12]。
本工作以實例數(shù)據(jù)為樣本,利用高斯過程回歸模型分析苯乙烯和丁二烯含量對SSBR的Tg的影響,從而預測Tg,以期為實際生產(chǎn)過程中預測和控制橡膠的Tg提供參考。
高斯過程回歸是一種貝葉斯學習框架下的無參數(shù)核方法[13-14]。通過直接對函數(shù)建模,產(chǎn)生非參數(shù)模型。對訓練輸入數(shù)據(jù)X=x1,x2,x3,…,xn,x*及其對應輸出數(shù)據(jù)Y=y(tǒng)1,y2,y3,…,yn,y*建立的回歸方程為
式中:回歸函數(shù)f(X)不需要指定具體形式,可以認為是在高斯回歸過程中采樣得到的一個無窮維的點;N(0,n2σ)表示均值為0、方差為n2σ的噪聲;G(0,K)是均值為0、協(xié)方差為K的高斯回歸過程;對于新輸入x*和對應輸出y*仍有相同的映射關系。
利用協(xié)方差函數(shù),即核函數(shù)反映高斯回歸過程中數(shù)據(jù)點之間的相互關系,本課題選取徑向基(RBF)核函數(shù)作為協(xié)方差函數(shù):
式中,K(x,x′)是x與x′之間的協(xié)方差,σf和l為可調節(jié)的參數(shù)。
要求取一個新輸入x*及其對應輸出y*依然滿足上述高斯分布,利用上述協(xié)方差矩陣可以得出式(3)和(4):
根據(jù)貝葉斯回歸方法,預測數(shù)據(jù)y*的條件分布P(y*|y)服從如下高斯分布:
分布的均值可以作為y*的估計值:
分布的協(xié)方差表示預測值的不確定性:
因此,高斯過程回歸模型不僅可以模擬任何黑盒模型,還可以計算置信區(qū)間,即計算模擬的不確定性。
本課題采用數(shù)據(jù)從文獻[15]中獲取,在橡膠合成過程中,采用復合結構調節(jié)劑調節(jié)苯乙烯和丁二烯含量,合成了多種結構的SSBR,研究苯乙烯含量對SSBR的Tg的影響。試樣包含12種苯乙烯含量的SSBR,其苯乙烯含量為5%~45%,丁二烯含量為24%~78%。不同苯乙烯和丁二烯含量SSBR的Tg如表1所示。其中,1#—8#試樣數(shù)據(jù)構建高斯過程回歸模型,9#—12#試樣數(shù)據(jù)驗證模型的有效性。
表1 不同苯乙烯和丁二烯含量的SSBR的TgTab.1 Tg of SSBR with different styrene and butadiene contents
利用表1中1#—8#試樣數(shù)據(jù)作為訓練數(shù)據(jù),參數(shù)設置為σf和l,建立高斯過程回歸模型。同時,利用相同的訓練數(shù)據(jù)和測試數(shù)據(jù),本課題構建BP神經(jīng)網(wǎng)絡模型作為對比試驗。為了提高BP神經(jīng)網(wǎng)絡模型的預測能力,對訓練數(shù)據(jù)和測試數(shù)據(jù)進行了歸一化處理。通過多次試驗,優(yōu)化選取了2-8-1網(wǎng)絡結構,即網(wǎng)絡有3層,輸入層包含2個節(jié)點、隱含層包括8個節(jié)點、輸出層包含1個節(jié)點,學習率設為0.2。
SSBR的Tg測試數(shù)據(jù)和訓練數(shù)據(jù)輸出結果如表2所示。測試誤差采用絕對誤差和相對誤差來表示,前者反映誤差的大小,后者是絕對誤差占真值的百分比,可以反映誤差的偏離程度。
從表2可以看出,BP神經(jīng)網(wǎng)絡模型Tg預測值的最大絕對誤差和最大相對誤差分別高達26.47 ℃和44.9%,高斯過程回歸模型預測的最大絕對誤差和最大相對誤差分別為2.37 ℃和5.5%,后者結果更理想。高斯過程回歸模型的偏差遠小于BP神經(jīng)網(wǎng)絡模型,表明高斯過程回歸模型的可靠性和有效性。
表2 SSBR的Tg測試數(shù)據(jù)和訓練數(shù)據(jù)輸出結果Tab.2 Testing data and train data output results of SSBR
為了了解2種模型的有效性和泛化性,對苯乙烯含量為5%~45%和丁二烯含量為24%~78%的SSBR的Tg進行預測,在設定范圍內(nèi)均勻采取40 000組含量值作為輸入,求高斯過程回歸模型和BP神經(jīng)網(wǎng)絡模型對應預測的Tg,并將預測結果繪制成3D圖像,如圖1和2所示。
圖1 高斯過程回歸模型預測SSBR的Tg的3D圖像Fig.1 3D image of Tg of SSBR by Gaussian process regression model
從圖1可以看出,SSBR的Tg與苯乙烯和丁二烯含量的有關。在苯乙烯含量不變時,Tg隨丁二烯含量增大而升高;在丁二烯含量不變時,Tg隨苯乙烯含量增大而升高。高斯過程回歸模型的輸出結果與試驗數(shù)據(jù)分析結果[15]一致,這也證明了該模型的可靠性和有效性。
從圖2可以看出,BP神經(jīng)網(wǎng)絡模型預測的三維曲面不符合已知的映射關系。根據(jù)BP神經(jīng)網(wǎng)絡的特性推想模型效果不佳的原因是訓練數(shù)據(jù)過少,從而BP神經(jīng)網(wǎng)絡中的參數(shù)訓練不完全。
圖2 BP神經(jīng)網(wǎng)絡模型預測SSBR的Tg的3D圖像Fig.2 3D image of Tg of SSBR by BP neural network model
(1)通過實例數(shù)據(jù)分析表明,高斯過程回歸建立的SSBR的Tg預測模型切實可行,還可對一定范圍內(nèi)苯乙烯和丁二烯含量對SSBR的Tg的影響進行定性和定量分析。
(2)與BP神經(jīng)網(wǎng)絡模型相比,高斯過程回歸模型解決小樣本問題具有優(yōu)越性,可為更多復雜耗時的試驗數(shù)據(jù)預測提供有效解決方案。
(3)高斯過程回歸模型可通過添加更多Tg數(shù)據(jù),即通過增加學習數(shù)據(jù),進一步提高模型的預測精度和可靠性。