汪雅婷,黎俊良,袁楷峰,陳廣義*
(1 佛山科學(xué)技術(shù)學(xué)院 機(jī)電工程與自動化學(xué)院,廣東 佛山 528200;2 西安熱工研究院有限公司,西安 710054)
與傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)模型相比,遺傳算法(genetic algorithm,GA)的添加能在有限的訓(xùn)練數(shù)據(jù)中進(jìn)行數(shù)據(jù)優(yōu)化,通過優(yōu)化輸入層、隱含層和輸出層的初始權(quán)值、閾值,減少了收斂到局部最優(yōu)的可能性[15],增強(qiáng)實驗數(shù)據(jù)與預(yù)測數(shù)據(jù)的相關(guān)性,避免如BP神經(jīng)網(wǎng)絡(luò)模型在訓(xùn)練學(xué)習(xí)新樣本數(shù)據(jù)時遺忘舊樣本及輸出結(jié)果可能趨于局部最優(yōu)解的缺點。而與蒙特卡羅的隨機(jī)模擬相比,GA通過重組和變異的方式,使得數(shù)據(jù)信息“繁衍進(jìn)化”,優(yōu)化預(yù)測結(jié)果。本實驗通過分析應(yīng)力-應(yīng)變曲線,采用GA對BP神經(jīng)網(wǎng)絡(luò)預(yù)測應(yīng)力-應(yīng)變模型進(jìn)行改進(jìn)優(yōu)化,對比了BP神經(jīng)網(wǎng)絡(luò)模型和改進(jìn)優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)模型的準(zhǔn)確性。GA改進(jìn)型BP神經(jīng)網(wǎng)絡(luò)模型的建立有助于預(yù)測金屬不同變形溫度下的應(yīng)力-應(yīng)變曲線,為實際熱加工提供優(yōu)化工藝、提高產(chǎn)品質(zhì)量的理論指導(dǎo)。
實驗材料為結(jié)構(gòu)用鋼普遍采用的Nb-Ti-V微合金鋼,其主要化學(xué)成分(質(zhì)量分?jǐn)?shù)/%)為:0.12 C,1.47 Mn,0.01 Ti,0.007 V,0.042 Nb,0.25 Si,0.018 P,0.009 S,0.0039 N,Fe余量。利用線切割機(jī)對鑄造樣坯切割出圓柱狀試樣(φ10 mm×15 mm),使用Gleeble-3500熱模擬機(jī)對試樣進(jìn)行等溫恒應(yīng)變速率壓縮實驗,壓縮變形量均為60%,變形溫度分別為1000,1050,1100,1150,1200 ℃;應(yīng)變速率分別為0.01,0.1,0.5,1,3 s-1。將試樣放置熱模擬機(jī)中,以10 ℃/s的升溫速率加熱至變形溫度后保溫30 s,然后以不同的應(yīng)變速率進(jìn)行壓縮實驗,變形結(jié)束后立即水冷至室溫。實驗過程中,熱模擬機(jī)內(nèi)需保持真空環(huán)境,試樣兩端添加金屬墊片,以減少由于端面摩擦而對測試數(shù)據(jù)產(chǎn)生的影響。實驗數(shù)據(jù)通過熱模擬機(jī)中自帶的數(shù)據(jù)采集系統(tǒng)軟件采集,從而得到不同應(yīng)變量下的流動應(yīng)力值。
金屬的熱變形過程中必然存在著加工硬化、動態(tài)回復(fù)甚至動態(tài)再結(jié)晶。圖1為不同應(yīng)變速率下Nb-Ti-V微合金鋼的應(yīng)力-應(yīng)變曲線,從圖中可以明顯看出,隨著應(yīng)變量的增加,變形過程中應(yīng)力急劇升高然后減緩,最后應(yīng)力隨著材料的變形量增加而下降。這是由于在變形的初始階段(ε<0.1),加工硬化隨著應(yīng)變量增加而增強(qiáng),從而導(dǎo)致應(yīng)力的上升;隨著應(yīng)力達(dá)到峰值應(yīng)力后,動態(tài)回復(fù)與動態(tài)再結(jié)晶的相“較量”會導(dǎo)致不同應(yīng)力-應(yīng)變曲線出現(xiàn)。當(dāng)動態(tài)軟化弱于加工硬化時,應(yīng)力會隨著應(yīng)變的增加而持續(xù)上升并無峰值應(yīng)力的出現(xiàn);當(dāng)動態(tài)再結(jié)晶和動態(tài)回復(fù)的軟化效果強(qiáng)于加工硬化時,應(yīng)力會隨著應(yīng)變的增加而下降并出現(xiàn)峰值應(yīng)力,應(yīng)變的持續(xù)增加,材料中的軟化效果會與加工硬化達(dá)到平衡,應(yīng)力-應(yīng)變曲線趨于平穩(wěn),進(jìn)入穩(wěn)態(tài)流變階段。圖1(e)中Nb-Ti-V微合金鋼的部分應(yīng)力-應(yīng)變曲線的應(yīng)力值隨著應(yīng)變在0.7之后的增加而呈現(xiàn)上升趨勢。這是由于在具有較高層錯能的Nb-Ti鋼中,動態(tài)再結(jié)晶的回復(fù)效果發(fā)生一定程度上的減弱,從而導(dǎo)致加工硬化再次占據(jù)主導(dǎo)地位,應(yīng)力-應(yīng)變曲線出現(xiàn)“上翹”[16]。Nb-Ti-V微合金鋼在同一變形溫度不同應(yīng)變速率下的應(yīng)力-應(yīng)變曲線如圖2所示。由圖中可以看出,同一應(yīng)變、同一溫度下流變應(yīng)力隨著應(yīng)變速率的增加而增大,應(yīng)力-應(yīng)變曲線中峰值應(yīng)力隨著應(yīng)變速率的增加而增大,其對應(yīng)的應(yīng)變值也增大;而在同一應(yīng)變和應(yīng)變速率下,流變應(yīng)力隨著變形溫度的升高而降低,峰值應(yīng)力隨著變形溫度的升高而降低,峰值應(yīng)力對應(yīng)的應(yīng)變值減小。應(yīng)變速率的提高意味著完成相同變形量的時間減少,位錯的湮滅速率小于增殖速率,位錯累積導(dǎo)致流變應(yīng)力提高;變形溫度越高,原子的擴(kuò)散和運(yùn)動越劇烈,代表著Nb-Ti-V微合金鋼中的位錯更輕易擺脫第二相粒子的釘扎作用,致使流變應(yīng)力隨著變形溫度的升高而明顯降低。
圖1 不同應(yīng)變速率下不同溫度的應(yīng)力-應(yīng)變曲線
圖2 不同變形溫度下不同變形速率的應(yīng)力-應(yīng)變曲線
(1)
(2)
式中:Z為Zener-Hollomon參數(shù);Qdef為熱變形激活能,J·mol-1;R為氣體常數(shù),J·mol-1·K-1;T為絕對溫度,K;α,A,n均為材料常數(shù)。
在現(xiàn)有的人工神經(jīng)網(wǎng)絡(luò)模型中,BP神經(jīng)網(wǎng)絡(luò)是一種預(yù)測金屬高溫變形行為的有效方法。而溫度、應(yīng)變速率和應(yīng)變作為金屬熱變形過程中影響流變應(yīng)力大小的重要參數(shù),在神經(jīng)網(wǎng)絡(luò)模型中需作為輸入層參數(shù),輸出層為流變應(yīng)力。GA算法在全局范圍內(nèi)搜索得到訓(xùn)練所需的最優(yōu)權(quán)值和閾值,再輸回BP神經(jīng)網(wǎng)絡(luò)模型中進(jìn)行局部搜索從而得到誤差更小的預(yù)測值。本實驗工作所建立的GA改進(jìn)型BP神經(jīng)網(wǎng)絡(luò)模型的運(yùn)行結(jié)構(gòu)示意圖如圖3所示,其中隱藏層結(jié)點個數(shù)為i,輸入層到隱藏層的權(quán)重為U,隱藏層到輸出層的權(quán)重為W。
圖3 GA改進(jìn)型BP神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)
Nb-Ti-V微合金鋼的25組熱模擬數(shù)據(jù)中,為了保證訓(xùn)練數(shù)據(jù)量,選取23組數(shù)據(jù)作為模型訓(xùn)練數(shù)據(jù),2組作為測試數(shù)據(jù)。其中,訓(xùn)練數(shù)據(jù)包含了應(yīng)變速率0.01~3 s-1、變形溫度1000~1200 ℃,而測試數(shù)據(jù)為應(yīng)變速率0.5 s-1、變形溫度1050 ℃和應(yīng)變速率1 s-1、變形溫度1100 ℃的熱模擬數(shù)據(jù),具體數(shù)據(jù)劃分如表1所示。
(3)
式中:X′為歸一化得到的數(shù)據(jù);ymin,ymax為歸一化處理中的兩邊界值,即為0和1;x為樣本數(shù)據(jù);xmin,xmax分別為樣本數(shù)據(jù)中的最小值與最大值。而在模型輸出結(jié)果后,需要將其進(jìn)行反歸一化后,結(jié)果轉(zhuǎn)換為應(yīng)力值再進(jìn)行誤差分析,數(shù)據(jù)反歸一化遵循:
y′=(y-ymin)(xmax-xmin)+xmin
(4)
式中:y′為反歸一化后得到的數(shù)據(jù)。
在評估模型數(shù)據(jù)的多樣性時,均方誤差(RMSE)越低,可顯示模型預(yù)測效果越好。而確定隱藏層的神經(jīng)元數(shù)量是至關(guān)重要的,設(shè)置“合適”的神經(jīng)元數(shù)量能提高模型的計算精度。本模型在確定隱含層神經(jīng)元個數(shù)n1時,遵循的經(jīng)驗公式為[20]:
(5)
式中:m為輸入層節(jié)點數(shù)目;n為輸出層節(jié)點數(shù)目;a在[1,10]范圍內(nèi)取任意自然數(shù)??刂颇P陀?xùn)練次數(shù)為2000,學(xué)習(xí)速率為0.01,目標(biāo)訓(xùn)練誤差為0.0001的條件下,根據(jù)經(jīng)驗公式進(jìn)行窮舉運(yùn)算,得出隱含層神經(jīng)元個數(shù)取[3,12]之間自然數(shù)時的均方根誤差,確定最佳隱含層節(jié)點數(shù),其中均方根誤差(RMSE)公式為:
(6)
式中:Ei為實驗值樣本;Pi為預(yù)測值樣本;N為樣本的總數(shù)。模型運(yùn)行所得均方差結(jié)果如圖4所示,可以看出,隨著神經(jīng)元個數(shù)的增加,訓(xùn)練集均方根誤差顯著減小,當(dāng)隱含層神經(jīng)元個數(shù)為12時,RMSE值達(dá)到最小。因此,可確定最佳BP神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)結(jié)構(gòu)為3-12-1。
圖4 確定過程中隱含層節(jié)點數(shù)與訓(xùn)練集均方根誤差的關(guān)系曲線
構(gòu)建出最佳BP神經(jīng)網(wǎng)絡(luò)模型后進(jìn)行訓(xùn)練,設(shè)置訓(xùn)練次數(shù)為2000,學(xué)習(xí)速率為0.01,動量因子為0.01,訓(xùn)練誤差設(shè)置為0.0001。
各輸出層神經(jīng)元的輸出誤差被計算記錄后,模型會通過誤差梯度下降法對各層的權(quán)值和各層的節(jié)點閾值進(jìn)行調(diào)整,會得到較為優(yōu)異的輸出值,且接近期望值。
每個輸入層的二次型誤差準(zhǔn)則函數(shù)為[15]:
(7)
式中:p為訓(xùn)練數(shù)據(jù)樣本;Ep為神經(jīng)網(wǎng)絡(luò)在第p個樣本輸入下的偏差;L為輸入結(jié)點總數(shù);Tk為第k個節(jié)點的實驗值;Ok為第k個節(jié)點的輸出值。
模型對p個訓(xùn)練數(shù)據(jù)的總誤差準(zhǔn)則函數(shù)為:
(8)
則輸出層權(quán)值的調(diào)整公式為:
(9)
式中:wni為連接輸出層的第n個神經(jīng)元和穩(wěn)藏層的第i個神經(jīng)元的權(quán)值;Δwni為wni的變化量;η為學(xué)習(xí)速率;φ′為輸出層的激勵函數(shù)導(dǎo)數(shù);netk為第k層網(wǎng)絡(luò);yi為輸出層第i個神經(jīng)元的值。
輸出層閾值調(diào)整公式為:
(10)
式中:ak為輸出層閾值;Δak為ak的變化值。
隱含層權(quán)值調(diào)整公式為:
φ′(netk)·wni·?′(netk)·xj
(11)
式中:wij為連接隱藏層的第i個神經(jīng)元和上一個隱藏層的第j個神經(jīng)元的權(quán)值;Δwij為wij的變化量;?′為隱含層的激勵函數(shù)導(dǎo)數(shù);xj為隱藏層第j個神經(jīng)元的值。
隱含層閾值調(diào)整公式為:
φ′(netk)wni·?′(netk)
(12)
式中:θ為隱藏層的閾值;Δθ為隱藏層閾值的變化值。
遺傳算法尋最優(yōu)值閾值參數(shù)設(shè)置為:訓(xùn)練次數(shù)2000,學(xué)習(xí)速率為0.01,動量因子為0.01,訓(xùn)練目標(biāo)誤差0.0001,種族群規(guī)模為30,進(jìn)化迭代次數(shù)為50,交叉概率與變異概率分別為0.8和0.2。
測試數(shù)據(jù)根據(jù)式(3)輸入神經(jīng)網(wǎng)絡(luò)熱變形預(yù)測模型后,應(yīng)變速率為0.5 s-1、變形溫度1050 ℃和應(yīng)變速率為1 s-1、變形溫度1100 ℃兩組測試數(shù)據(jù)經(jīng)不同模型輸出的預(yù)測數(shù)據(jù)誤差結(jié)果如圖5所示。由圖可明顯看出,經(jīng)GA算法改進(jìn)型BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測的數(shù)據(jù)誤差基本以0參考線上下波動,并且波動幅度明顯小于經(jīng)BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測的誤差曲線。
圖5 不同樣本中BP神經(jīng)網(wǎng)絡(luò)模型和GA改進(jìn)型BP神經(jīng)網(wǎng)絡(luò)模型輸出值的訓(xùn)練誤差曲線
測試數(shù)據(jù)經(jīng)BP神經(jīng)網(wǎng)絡(luò)和GA改進(jìn)型BP神經(jīng)網(wǎng)絡(luò)預(yù)測后輸出預(yù)測結(jié)果,并與實驗結(jié)果相比較,如圖6所示。由圖6可以明顯看出,經(jīng)實驗驗證,GA優(yōu)化改進(jìn)后BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測的應(yīng)力值與實驗值有較好的重合度,應(yīng)力應(yīng)變曲線動態(tài)趨勢一致,其重合度要明顯優(yōu)于BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測結(jié)果。證明采用GA優(yōu)化改進(jìn)后的BP神經(jīng)網(wǎng)絡(luò)所預(yù)測的應(yīng)力應(yīng)變曲線具有更優(yōu)異的精度,能為工業(yè)生產(chǎn)軋制工藝提供更好的理論指導(dǎo),能夠大大降低重復(fù)做實驗的時間成本和材料成本。
圖6 BP神經(jīng)網(wǎng)絡(luò)(a)及GA改進(jìn)型BP神經(jīng)網(wǎng)絡(luò)(b)預(yù)測應(yīng)力值與實驗數(shù)據(jù)曲線對比曲線
相關(guān)系數(shù)(R)常用于表示預(yù)測數(shù)據(jù)和實驗數(shù)據(jù)之間的線性關(guān)系。R的計算如下式所示:
(13)
式中:N為采集的分析數(shù)據(jù)點個數(shù);σe為試樣熱壓縮實驗所得到的應(yīng)力值;σp為BP神經(jīng)網(wǎng)絡(luò)模型或GA改進(jìn)型BP神經(jīng)網(wǎng)絡(luò)模型所預(yù)測的應(yīng)力值。通過式(13)對GA改進(jìn)型BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測結(jié)果與BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測結(jié)果進(jìn)行相關(guān)系數(shù)計算,得到結(jié)果如圖7所示,預(yù)測數(shù)據(jù)與實驗數(shù)據(jù)的相對誤差分布如圖中矩形分布圖。模型經(jīng)GA優(yōu)化改進(jìn)后,應(yīng)變速率為0.5 s-1、變形溫度1050 ℃和應(yīng)變速率為1 s-1、變形溫度1100 ℃的預(yù)測應(yīng)力值與實驗應(yīng)力值的相關(guān)系數(shù)分別為0.99202和0.99734,較BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測結(jié)果的相關(guān)系數(shù)要更優(yōu)異。在相對誤差分布上,傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)所預(yù)測的兩組熱模擬數(shù)據(jù)的應(yīng)力值相對誤差范圍較廣,分別在[-2,6]和[-2,4]之間;經(jīng)GA優(yōu)化改進(jìn)后預(yù)測的兩組數(shù)據(jù)預(yù)測應(yīng)力值的相對誤差主要處在[-2,2]范圍內(nèi),占70%以上,且相對誤差平均值均小于BP神經(jīng)網(wǎng)絡(luò)模型的相對誤差平均值。
圖7 不同條件時,BP神經(jīng)網(wǎng)絡(luò)(1)和GA改進(jìn)BP神經(jīng)網(wǎng)絡(luò)(2)預(yù)測的應(yīng)力值與實驗值線性關(guān)系圖、相對誤差比值與相對誤差值分布圖
由于預(yù)測值與其實驗值相比,部分?jǐn)?shù)據(jù)會出現(xiàn)偏高或者偏低的現(xiàn)象,因此需要引入平均相對誤差(δMRE)作為模型的評估條件之一,其可以被認(rèn)為是用于確認(rèn)模型可信度的無偏統(tǒng)計量,評估預(yù)測的準(zhǔn)確性和可靠性[21-22]。平均相對誤差值(δMRE)[11,23]的計算公式為:
(14)
與預(yù)測值和實驗值的擬合相關(guān)系數(shù)相比,平均相對誤差更能體現(xiàn)基于GA改進(jìn)BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型預(yù)測的應(yīng)力值與實際實驗得到的應(yīng)力值之間的偏差,也能定量評價模型的預(yù)測準(zhǔn)確性。由式(14)計算得到由BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測兩組測試數(shù)據(jù)的平均相對誤差分別為3.5346%和11.4829%,而由GA改進(jìn)型BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型所預(yù)測的平均相對誤差僅為2.7816%和2.1703%,結(jié)合上述擬合相關(guān)系數(shù)和相對誤差的分布可說明所建立的GA改進(jìn)型BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型具有良好的預(yù)測能力。
(1)從BP神經(jīng)網(wǎng)絡(luò)模型和GA改進(jìn)型BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測的數(shù)據(jù)與實驗數(shù)據(jù)對比來看,BP神經(jīng)網(wǎng)絡(luò)模型經(jīng)GA優(yōu)化改進(jìn)后,預(yù)測應(yīng)力值與實驗應(yīng)力值的相對誤差在[-2,2]區(qū)間內(nèi)的數(shù)據(jù)占比達(dá)70%,相關(guān)系數(shù)分別達(dá)到0.99202和0.99734,平均相對誤差僅為2.7816%和2.17034%,說明遺傳算法(GA)對BP神經(jīng)網(wǎng)絡(luò)模型有著良好的優(yōu)化改進(jìn),大大提高了模型的預(yù)測精度。
(2)通過測試數(shù)據(jù)與實驗數(shù)據(jù)的對比分析得出,在較大應(yīng)變范圍內(nèi),模型預(yù)測結(jié)果與實驗結(jié)果只有較小的誤差,經(jīng)GA優(yōu)化改進(jìn)后的模型具有良好的穩(wěn)定性和預(yù)測性,能較好地預(yù)測不同熱變形參數(shù)下的應(yīng)力應(yīng)變曲線。