翟秀云,陳明通
(攀枝花學院公共實驗中心,四川 攀枝花 617000)
鋼材在海洋環(huán)境中的腐蝕破壞不僅會造成直接或間接的重大經(jīng)濟損失,還會產(chǎn)生人員傷亡的重大事故。隨著海洋資源開發(fā)的深入,人們希望能夠預(yù)測不同海域、海洋環(huán)境條件下鋼材的腐蝕速率,為海洋工程設(shè)施設(shè)計提供依據(jù)[1]。3C鋼是一種造船用的碳素結(jié)構(gòu)鋼,隨著它的廣泛應(yīng)用,其腐蝕問題也引起了工程界的高度關(guān)注[2-4]。
材料腐蝕速率的預(yù)測方法主要有基于機理的公式計算[5]和有限元分析[6],但由于影響因素多且各因素之間又具有很強的線性或非線性相關(guān)性,找到腐蝕速率與各影響因素之間的關(guān)系非常困難,特別是有限元分析法,在計算的整個過程中需要進行大量假設(shè),且耗費大量時間[6]。研究者們發(fā)現(xiàn)基于數(shù)據(jù)驅(qū)動的機器學習模型可以快速、有效地預(yù)測材料的腐蝕速率[2,7-10],并且應(yīng)用前景廣闊。特別是所建立的3C鋼腐蝕速率預(yù)測模型[2,8-10]具有較高的預(yù)測精度,能夠滿足腐蝕速率計算的要求。這些機器學習模型中廣泛使用了神經(jīng)網(wǎng)絡(luò)模型,而適用于解決小樣本、非線性問題的支持向量回歸(Support Vector Regression,SVR)模型很少采用,并且在3C鋼腐蝕速率預(yù)測的研究工作中,未采用過已證明預(yù)測精度高的組合模型[11]。
本工作對文獻中的數(shù)據(jù)進行變量篩選,利用4個參數(shù)建立了3C鋼腐蝕速率的高斯核函數(shù)支持向量回歸(Support Vector Regression with Gaussian Kernel Function,RBF-SVR) 模型[12-14],結(jié)果表明該模型具有較理想的預(yù)測性能。在此基礎(chǔ)上,將已建立的RBF-SVR模型與文獻中的GA-BPNN(Back propagation neural network based on genetic algorithm,基于遺傳算法的反向傳輸神經(jīng)網(wǎng)絡(luò))模型[9]、四層BPNN(Back propagation neural network,反向傳輸神經(jīng)網(wǎng)絡(luò))模型[10]組合為一個模型,結(jié)果表明此組合模型的預(yù)測性能高于以上3種模型。
本工作的數(shù)據(jù)集來源于參考文獻[15,16],由46個3C鋼的腐蝕速率(Y,3.61~22.64 μA/cm2)樣本組成,輸入變量為5個海水環(huán)境參數(shù),分別為溫度(℃)、含氧量(mg/L)、鹽度(mg/L)、pH值、氧化還原電位(mV),用參數(shù)X1、X2、X3、X4、X5表示。數(shù)據(jù)集詳見參考文獻[15]。將數(shù)據(jù)集分成2部分:用于建模的訓練集和用于驗證的測試集。把序號為7、10、14、21的試驗數(shù)據(jù)作為模型的測試集樣本,其余數(shù)據(jù)作為訓練集樣本。
支持向量回歸(SVR)是解決非線性回歸問題的一種有效方法,也是一種有監(jiān)督學習算法,已被成功應(yīng)用于各個領(lǐng)域[17-20]。它在解決小樣本問題的同時,又能解決神經(jīng)網(wǎng)絡(luò)算法中的高維問題和局部極值問題,使其具有更大的優(yōu)勢,其結(jié)構(gòu)也非常簡單。由于考慮了經(jīng)驗風險和預(yù)測風險之間的平衡,使計算模型具有良好的預(yù)測性能和泛化性能。
樣本集為(y1,x1),…,(yl,xl),x∈Rm,y∈R,其中,x為m維特征變量,y為目標變量,l為樣本數(shù),SVR在線性回歸時,用下列方程表示:
f(x)=ωTx+b
(1)
ω為系數(shù)向量,b為常數(shù),目標函數(shù)的原始形式:
(2)
(3)
上式中ε為不敏感損失函數(shù)參數(shù),i=1,2,…,l。
求解:
(4)
通過引入核函數(shù)可以將原始輸入非線性映射到特征空間,然后利用SVR求解復(fù)雜的非線性回歸問題。非線性SVR的解可通過以下方程求解:
(5)
其約束條件為:
(6)
本工作中所建立的SVR模型采用高斯核函數(shù)(RBF),其表達式如下:
(7)
式中:σ2表示高斯核的頻寬。
本工作中對于模型的泛化性能的評價指標主要有2個,分別為均方根誤差(Root Mean Square Error,RMSE)、平均相對誤差(Average Relative Error,MAE)。它們的計算公式如下:
(8)
(9)
式中ei和pi分別為3C鋼的腐蝕速率的實驗值與預(yù)測值;n為樣本的數(shù)量。
本次計算是在材料數(shù)據(jù)挖掘在線計算平臺(OCPMDM)上進行的[12,20]。它可以在上海大學材料數(shù)據(jù)挖掘?qū)嶒炇业木W(wǎng)站上免費使用(http://materials-data-mining.com/ocpmdm )。它的前身是HyperMiner軟件包[21,22],其免費版本可從以下網(wǎng)址下載:http://chemdata.shu.edu.cn:8080/MyLab/Lab/download.jsp。
變量篩選是建立成功模型的關(guān)鍵步驟,它可以降低特征空間的維數(shù),進一步降低過擬合的風險,更好地去除與目標值無關(guān)的變量和噪聲干擾。同時,還可以縮短訓練時間,進一步提高模型的預(yù)測能力和泛化性能。本工作采用了基于支持向量回歸的遺傳算法(GA-SVR)、前進算法(Forward-SVR)和后退算法(Backward-SVR)篩選自變量,形成最優(yōu)特征集。遺傳算法是一種受自然選擇過程啟發(fā)的元啟發(fā)式算法,屬于進化算法的一大類。與其他優(yōu)化算法相比,遺傳算法能夠從響應(yīng)面上的局部最優(yōu)解出發(fā),在不需要響應(yīng)面上的知識或梯度的情況下,可以求解多種優(yōu)化問題。3種算法的評價指標均為RMSE。前進法是回歸方程中的自變量從無到有,由少到多逐個引入來構(gòu)建模型的一種方法。后退法與前進法相反,即先建立全變量模型,然后逐步剔除無統(tǒng)計學意義的自變量,以此構(gòu)建回歸模型的一種方法。
Forward-SVR和Backward-SVR的計算結(jié)果如圖1所示,從圖1可以看出,2個算法獲得的結(jié)果一致,即當變量數(shù)為4時RMSE的值最小。利用GA-SVR進行變量篩選時,進化代數(shù)為100次,變異概率為0.05,計算結(jié)果與前2種方法相同,最優(yōu)的變量子集也相同,由X2、X3、X4、X5組成。此結(jié)果表明,海水溫度(X1)對腐蝕速率的影響較小,這與實際相符。因為海水溫度每升高10 ℃,化學反應(yīng)速度提高約10%,海水中金屬的腐蝕速率將隨之增加;但溫度升高,氧在海水中的溶解度下降,每升高10 ℃,氧的溶解度降低約20%,使金屬的腐蝕速率有所降低。因此,在上述2個過程的共同作用下,溫度對金屬的腐蝕速率的影響變得非常小。
根據(jù)以上3種變量篩選算法的結(jié)果,得到用于建模的數(shù)據(jù)集如表1所示。表中編號帶‘*’號的數(shù)據(jù)為測試集樣本,其余的數(shù)據(jù)為訓練集樣本。
表1 不同海水環(huán)境參數(shù)下的 3C 鋼腐蝕數(shù)據(jù)集Table 1 The dataset of 3C steel corrosion in different seawater environment
(續(xù)表1)
注:表中參數(shù)的含義和單位分別為:Y(腐蝕速率,μA/cm2)、X2(含氧量,mg/L)、X3(鹽度,mg/L)、X4(pH值)、X5(氧化還原電位,mV)。
為了得到性能最佳的 RBF-SVR 模型,需要對模型超參(正則化參數(shù)C、不敏感損失函數(shù)參數(shù)ε、RBF核函數(shù)的系數(shù)γ)進行調(diào)整。如果把C、γ和ε一起看,當C比較大,γ比較大,ε比較小時,會有更少的支持向量,模型會比較復(fù)雜,容易出現(xiàn)過擬合。當C比較小,γ比較小,ε比較大時,則相反。在這里,使用了SVR的留一法交叉驗證(LOOCV)與網(wǎng)格搜索對它們進行調(diào)優(yōu)。設(shè)定C在1~100之間,步長值為1,ε在0.01~0.10之間,增量為0.01,γ從0.5~1.5之間變化,步長為0.1。當評價函數(shù)RMSE最低時,SVR模型最優(yōu),此時對應(yīng)的3個參數(shù)即為建模所用的超參。
模型超參的網(wǎng)格搜索過程如圖2所示。在網(wǎng)格搜索過程中,當模型的RMSE為最小時得到最優(yōu)的超參組合為:ε=0.02、C=22、γ=0.8。基于以上變量篩選以及參數(shù)優(yōu)化的結(jié)果,使用 4 個特征建立RBF-SVR模型,其方程如下所示:
(10)
式中:x是未知向量,xi是模型的支持向量。n和βi分別是支持向量的個數(shù)和拉格朗日乘子。
圖3顯示了訓練集和測試集的3C鋼腐蝕速率實驗值和RBF-SVR模型預(yù)測值的比較,以進一步分析模型的預(yù)測能力。從圖3中可以看出,模型的RMSE為1.431 3,R為0.896。由于4個測試集樣本非??拷鼣M合線,所以模型的預(yù)測性能符合要求。
RBF-SVR模型對于測試集的4組樣本的預(yù)測值及對應(yīng)的相對誤差見表2所示,該表也列出了已發(fā)表文獻中建立的3C鋼腐蝕速率預(yù)測模型對于測試集的預(yù)測情況,主要有PSO-RBFNN[基于粒子群優(yōu)化(PSO)的徑向基神經(jīng)網(wǎng)絡(luò)(RBFNN)]模型、GA-BPNN模型、四層BPNN模型。
表2 不同模型對測試集的預(yù)測結(jié)果Table 2 Prediction results of different models for the testing samples
從表2中可以看出由較少的變量(4個,其它模型變量數(shù)為5個)所建立的RBF-SVR模型只有樣本14的預(yù)測值相對誤差較大,整體來看,其預(yù)測性能較好。將文獻中已建立的GA-BPNN、BPNN模型與本工作中的RBF-SVR模型做為基礎(chǔ)生成組合模型[11]。經(jīng)計算分析可知,組合模型具有最小的相對誤差(MAE=1.46)。由于它將算法在樣本點上錯誤的估計平均化了,使預(yù)測結(jié)果更接近于真實值,即對樣本點的預(yù)測在多個角度評估后會使預(yù)測值變得更為可信。
本工作利用4個特征(含氧量、鹽度、pH值、氧化還原電位)建立了預(yù)測海水環(huán)境中3C鋼腐蝕速率的RBF-SVR模型,并在3種模型(RBF-SVR、GA-BPNN與BPNN)的基礎(chǔ)上建立了3C鋼腐蝕速率的組合模型,經(jīng)比較分析發(fā)現(xiàn)利用多種機器學習算法建立的組合模型具有更高的預(yù)測精度。因此,本工作所提出的方法可以為建立更高效的金屬材料腐蝕速率預(yù)測模型提供有意義的參考,也對3C鋼在海水中的腐蝕監(jiān)測工作提供有價值的指導(dǎo)。此外,如果收集更多的同類型的訓練數(shù)據(jù)時,可以對模型進行進一步的修正,以獲得準確度更高的3C鋼腐蝕速率預(yù)測工具。