吳 迪, 曹培智, 張國英, 焦興強(qiáng)
(沈陽師范大學(xué) 物理科學(xué)與技術(shù)學(xué)院, 沈陽 110034)
傳統(tǒng)的材料科學(xué)研究和材料制備過程大都依賴于大量實(shí)驗(yàn),這個(gè)過程中需要投入大量的時(shí)間、人力、物質(zhì)資源,尤其研究成本較高。專家系統(tǒng)可以利用領(lǐng)域內(nèi)已有的專家經(jīng)驗(yàn)進(jìn)行推理并做出決策,提高了研究效率,但材料中依然存在一些較為復(fù)雜的內(nèi)在規(guī)律很難用明確的數(shù)學(xué)模型描述,因此在一些材料研究中專家系統(tǒng)也不能解決所有現(xiàn)有問題。
近年來計(jì)算機(jī)仿真在材料科學(xué)的研究中發(fā)揮了巨大的作用,計(jì)算材料學(xué)的發(fā)展為材料科學(xué)的研究提供了新的方法,常用的計(jì)算材料學(xué)方法有有限元方法、第一原理法、人工神經(jīng)網(wǎng)絡(luò)等。對于一些結(jié)構(gòu)復(fù)雜很難描述其表達(dá)函數(shù)的材料結(jié)構(gòu),神經(jīng)網(wǎng)絡(luò)直接對實(shí)驗(yàn)數(shù)據(jù)進(jìn)行迭代訓(xùn)練來得到反應(yīng)數(shù)據(jù)內(nèi)在規(guī)律的模型,因此對復(fù)雜的非線性系統(tǒng)有很好的映射能力,人工神經(jīng)網(wǎng)絡(luò)在材料制備、結(jié)構(gòu)分析、性能分析中有很多應(yīng)用。劉貴立等[1]利用BP神經(jīng)網(wǎng)絡(luò)對高Co-Ni二次硬化鋼進(jìn)行結(jié)構(gòu)分析和力學(xué)性能預(yù)測。但BP神經(jīng)網(wǎng)絡(luò)需要重復(fù)迭代訓(xùn)練,速度較慢,可能陷入局部極小值,又有學(xué)習(xí)率不確定的問題。極限學(xué)習(xí)機(jī)(extreme learning machine,ELM)相較于BP神經(jīng)網(wǎng)絡(luò),通過設(shè)置隱層節(jié)點(diǎn)數(shù),隨機(jī)賦予網(wǎng)絡(luò)輸入權(quán)值和閾值,在算法過程中只需計(jì)算隱層輸出權(quán)值,有訓(xùn)練速度快、泛化程度高、訓(xùn)練參數(shù)少的優(yōu)點(diǎn)[2]。針對普通的極限學(xué)習(xí)機(jī)隱層節(jié)的最佳選擇問題,本文采用增量型極限學(xué)習(xí)機(jī)[3](incremental extreme learning machine,I-ELM)對高Co-Ni二次硬化鋼進(jìn)行研究。I-ELM會(huì)逐漸向網(wǎng)絡(luò)中添加節(jié)點(diǎn),然后計(jì)算網(wǎng)絡(luò)輸出誤差,直到達(dá)到滿足誤差要求或到達(dá)最大節(jié)點(diǎn)數(shù)時(shí)算法結(jié)束,既能滿足訓(xùn)練速度快、擬合程度高的條件,又可以避免ELM節(jié)點(diǎn)選取不當(dāng)導(dǎo)致的算法不穩(wěn)定問題。
高Co-Ni二次硬化鋼樣本數(shù)據(jù)取自文獻(xiàn)[1]共41組見表1,合金元素C、Ni、Co、Cr、Mo、Nb、Ti和時(shí)效溫度、淬火溫度為9項(xiàng)輸入指標(biāo)分別用I1~I(xiàn)9表示;屈服強(qiáng)度E0.2(MPa)、抗拉強(qiáng)度Eb(MPa)、韌性Kic(MPam1/2)、延伸率(W)、截面收縮率(ψ)為5項(xiàng)輸出指標(biāo),分別用O1~O5表示。將其劃分為33組訓(xùn)練集,8組測試集見表2。
表1 高Co-Ni二次硬化鋼部分樣本數(shù)據(jù)Table 1 The partial sample data of high Co-Ni secondary hardened steel
表2 高Co-Ni二次硬化鋼數(shù)據(jù)集劃分
圖1 SLFN網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.1 The SLFN network structure
實(shí)驗(yàn)數(shù)據(jù)經(jīng)過歸一化使值域在區(qū)間[0,1]內(nèi),令一組數(shù)據(jù)中最大值為a,最小值為b,則歸一化前數(shù)據(jù)X對應(yīng)歸一化后為
c=(X-b)/(a-b)
(1)
同理,網(wǎng)絡(luò)輸出的數(shù)據(jù)c經(jīng)過反歸一化后是實(shí)際物理數(shù)據(jù):
X=a+c×(b-a)
(2)
BP神經(jīng)網(wǎng)絡(luò)是一種誤差反向傳播結(jié)構(gòu)如圖1所示,在其網(wǎng)絡(luò)結(jié)構(gòu)中有20個(gè)隱層神經(jīng)元,9個(gè)輸入層神經(jīng)元,5個(gè)輸出層神經(jīng)元。
aij表示第i個(gè)輸入層神經(jīng)元到第j個(gè)隱層神經(jīng)元連接權(quán)值,取值范圍是[-1,1];bL表示第L個(gè)隱層神經(jīng)元的閾值,取值范圍是[-1,1]。參考文獻(xiàn)[1]中的網(wǎng)絡(luò)指標(biāo)函數(shù)E為
(3)
其中:Dij表示訓(xùn)練模擬輸出值;Oij表示對應(yīng)的實(shí)際數(shù)據(jù);P為樣本數(shù)。設(shè)置BP網(wǎng)絡(luò)訓(xùn)練的最大循環(huán)次數(shù)為1 000次,期望誤差指標(biāo)E小于0.001。
3.1I-ELM
增量型極限學(xué)習(xí)機(jī)(I-ELM)也是一種單隱層前向傳播神經(jīng)網(wǎng)絡(luò)[6], 其網(wǎng)絡(luò)結(jié)構(gòu)同圖1所示。 I-ELM網(wǎng)絡(luò)結(jié)構(gòu)為m個(gè)輸入神經(jīng)元,n個(gè)輸出神經(jīng)元,L個(gè)隱層神經(jīng)元。 訓(xùn)練樣本為X=[x1,x2,…,xm],X的維數(shù)為m×N;Y=[y1,y2,…,yn],Y的維數(shù)為N×n。 假設(shè)網(wǎng)絡(luò)隱層神經(jīng)元個(gè)數(shù)最大值為N, 網(wǎng)絡(luò)余差為E(指網(wǎng)絡(luò)輸出與實(shí)際數(shù)據(jù)間的差值矩陣), 期望誤差為ε。 則I-ELM訓(xùn)練過程[4]如下:
1) 首先給隱層神經(jīng)元與輸入節(jié)點(diǎn)的連接權(quán)值a和閾值b設(shè)定一個(gè)隨機(jī)值。
2) 計(jì)算當(dāng)前加法隱層神經(jīng)元輸入x公式為:
x=aX+b
(4)
3) 計(jì)算當(dāng)前加法隱層神經(jīng)元輸出:
(5)
4) 由最小二乘法計(jì)算該隱層神經(jīng)元輸出權(quán)值矩陣:
(6)
5) 計(jì)算增加一個(gè)隱層神經(jīng)元后網(wǎng)絡(luò)的余差:
E′=E-βH
(7)
6) 判斷是否超過最大節(jié)點(diǎn)數(shù)L>N或誤差指標(biāo)是否滿足要求E<ε,若是則算法結(jié)束,否則令L=L+1,返回1)繼續(xù)循環(huán)。
文獻(xiàn)[3]中的Theorem Ⅱ.1證明了隨著隱層節(jié)點(diǎn)添加,由式(6)最小二乘法計(jì)算出的權(quán)值可以使網(wǎng)絡(luò)誤差逐漸下降。
I-ELM訓(xùn)練速度快的優(yōu)點(diǎn)對材料數(shù)學(xué)模型進(jìn)行在線預(yù)測有很多的潛在作用[12]。
本文對高Co-Ni二次硬化鋼進(jìn)行了I-ELM模型和BP神經(jīng)網(wǎng)絡(luò)模型的研究,并將其結(jié)果進(jìn)行對比,2種方法均在同一計(jì)算機(jī)的Matlab 2018a版本上完成。
I-ELM模型初始化參數(shù)設(shè)置:隱層節(jié)點(diǎn)最大值3 000,初始隱層節(jié)點(diǎn)數(shù)N=0,初始誤差矩陣E為測試集輸出矩陣,網(wǎng)絡(luò)精度ε為誤差矩陣E的二范數(shù),即矩陣ETE的最大特征值開平方。設(shè)定期望精度ε不高于1.5。表1為高Co-Ni二次硬化鋼數(shù)據(jù)集的劃分。
圖2為I-ELM網(wǎng)絡(luò)對測試集數(shù)據(jù)的預(yù)測結(jié)果與材料實(shí)際數(shù)據(jù)的對比,結(jié)果表明擬合效果良好。圖2中有5組數(shù)據(jù),每一組有2條的數(shù)據(jù)線,其中紅線表示I-ELM模型預(yù)測輸出的數(shù)據(jù)值,藍(lán)線表示實(shí)際數(shù)據(jù)值。為了便于觀察對數(shù)據(jù)繪圖時(shí)進(jìn)行了放縮操作,圖中數(shù)據(jù)與真實(shí)值比例對應(yīng)關(guān)系參照表3。
圖2 5組I-ELM模型預(yù)測結(jié)果Fig.2 Five groups prediction results of I-ELM model
表3 繪圖數(shù)據(jù)值與真實(shí)值對應(yīng)比例Table 3 The corresponding ratio of plot data values to real values
以表1中樣本40數(shù)據(jù)為基礎(chǔ),通過控制變量分別改變微量元素Co含量和時(shí)效溫度,研究微量元素Co和時(shí)效溫度對材料力學(xué)性能的影響。計(jì)算結(jié)果如圖3和圖4所示。為便于觀察,圖中顯示韌性,截面收縮率指標(biāo)為實(shí)際值10倍,延伸率為實(shí)際值100倍。當(dāng)微量元素Co含量由8%逐漸增加時(shí),材料的屈服強(qiáng)度、抗拉強(qiáng)度逐漸增加,而延伸率和韌性會(huì)降低;當(dāng)時(shí)效溫度由480 ℃逐漸增加,材料的屈服強(qiáng)度、抗拉強(qiáng)度會(huì)降低,延伸率和韌性增加。截面收縮率受微量元素Co和時(shí)效溫度變化影響較小。
圖3 Co元素對材料力學(xué)性能影響Fig.3 The effect of Co element on mechanical materials
圖4 時(shí)效溫度對材料力學(xué)性能影響
理論分析:根據(jù)文獻(xiàn)[10]研究,材料中Co元素的加入使得鐵短程有序,降低了鐵自擴(kuò)散系數(shù);元素Co還是一種固溶強(qiáng)化元素,能削減殘余奧氏體量,致使的強(qiáng)度性能降低,增添了馬氏體量。但鐵中Co元素含量不應(yīng)過多,過多會(huì)使韌性下降,I-ELM預(yù)測結(jié)果與文獻(xiàn)[10]結(jié)果相符。文獻(xiàn)[11]指出隨著時(shí)效溫度的提高,強(qiáng)度會(huì)下降,韌性會(huì)提高;時(shí)效溫度對延伸率及截面收縮率影響較小,這與I-ELM網(wǎng)絡(luò)的預(yù)測結(jié)果相符。
(8)
表4表示I-ELM和BP神經(jīng)網(wǎng)絡(luò)對高Co-Ni二次硬化鋼數(shù)據(jù)訓(xùn)練結(jié)束后模型預(yù)測結(jié)果的決定系數(shù)對比。5項(xiàng)評價(jià)指標(biāo)中,對材料的擬合程度I-ELM均優(yōu)于BP神經(jīng)網(wǎng)絡(luò),其中韌性指標(biāo)由于1號和3號樣本存在離群點(diǎn)導(dǎo)致擬合精度較低。
表4 決定系數(shù)R2對比結(jié)果Table 4 The determination coefficient comparison results
還可以通過如下幾項(xiàng)指標(biāo)來衡量I-ELM和BP神經(jīng)網(wǎng)絡(luò)對高Co-Ni二次硬化鋼的訓(xùn)練效果,其結(jié)果列在表5中。
表5 I-ELM和BP神經(jīng)網(wǎng)絡(luò)各項(xiàng)性能對比
1) 決定系數(shù)均值是5組決定系數(shù)R2的平均值,反映網(wǎng)絡(luò)預(yù)測模型的擬合效果。
2) 均方根誤差(RMSE)是指觀察值與真實(shí)值偏差的平方和觀測次數(shù)n比值的平方根,本次試驗(yàn)中反映預(yù)測值和實(shí)際值的關(guān)系,是預(yù)測值與真實(shí)值的誤差的平方的算術(shù)平均值再開方。RMSE反映了預(yù)測數(shù)據(jù)偏離真實(shí)值的程度,RMSE越小,表示模型預(yù)測精度越高。
(9)
3) 誤差矩陣的2范數(shù)(E2)是指即誤差矩陣ETE矩陣的最大特征值的開平方,此次實(shí)驗(yàn)中用來表征模型訓(xùn)練精度。
4) 訓(xùn)練時(shí)間(s)反映網(wǎng)絡(luò)對數(shù)據(jù)訓(xùn)練的速度快慢。
本文采用I-ELM訓(xùn)練高Co-Ni二次硬化鋼材料模型,同BP神經(jīng)網(wǎng)絡(luò)相比,直接計(jì)算隱層神經(jīng)元輸出權(quán)值矩陣可極大地減少計(jì)算量,然后通過增加隱層節(jié)點(diǎn)的方式調(diào)整網(wǎng)絡(luò)結(jié)構(gòu),防止出現(xiàn)過擬合問題。結(jié)果表明,I-ELM對樣本數(shù)量少、材料結(jié)構(gòu)復(fù)雜的高Co-Ni二次硬化鋼材料擬合效果很好。模型預(yù)測的結(jié)果能較好地反映材料力學(xué)性能規(guī)律。下一步I-ELM網(wǎng)絡(luò)模型還可以通過對隱層輸出增加偏置從而提高部分神經(jīng)元輸出權(quán)值,提高網(wǎng)絡(luò)模型的結(jié)構(gòu)效率。綜上,本文為高Co-Ni二次硬化鋼材料力學(xué)性能研究提供了一種在樣本數(shù)量少條件下采用現(xiàn)代優(yōu)化算法進(jìn)行快速高精度擬合的有益參考。