陳歡歡,劉 曄,閆 博
(寶山鋼鐵股份有限公司中央研究院,上海 201999)
軋制過程材料組織性能預(yù)測是利用物理冶金學(xué)、機器學(xué)習(xí)、計算機視覺等模型,對軋制過程中的各種金屬學(xué)現(xiàn)象進行計算機模擬,預(yù)測出軋后產(chǎn)品組織狀態(tài)和力學(xué)性能,進行成分和軋制工藝的優(yōu)化設(shè)計,從而實現(xiàn)對產(chǎn)品的質(zhì)量控制[1]。隨著生產(chǎn)數(shù)據(jù)庫的不斷積累和算法的不斷進步,機器學(xué)習(xí)方法正在被重點關(guān)注,開始被大量地應(yīng)用于組織性能預(yù)測。
本文首先開發(fā)了一種工藝評估模型,它能夠根據(jù)用戶設(shè)置的化學(xué)成分、產(chǎn)品規(guī)格、工藝參數(shù)和所需要的預(yù)測精度,評估產(chǎn)品性能值所在的區(qū)間。此模型的基礎(chǔ)是自主開發(fā)的概率區(qū)間估計算法,它通過全面對比不同機器學(xué)習(xí)回歸模型的效果,和充分考慮歷史生產(chǎn)數(shù)據(jù)的分布規(guī)律,預(yù)測性能值可能落在的區(qū)間,以及落在此區(qū)間的可能性。本文以此算法為基礎(chǔ),以一種微合金高強鋼為例,開發(fā)了PIDAS工藝評估模型。
同時又開發(fā)了一種工藝設(shè)計模型,它能夠根據(jù)用戶設(shè)置的化學(xué)成分、產(chǎn)品規(guī)格以及帶有權(quán)重的性能目標,設(shè)計最優(yōu)的軋制冷卻參數(shù)。此模型的基礎(chǔ)是本文中提出的自定義權(quán)重的模擬退火算法,它是一種基于蒙特卡洛思想設(shè)計的近似求解最優(yōu)化問題的方法。在此算法基礎(chǔ)上,借助于工藝評估模型,又開發(fā)了PIDAS工藝設(shè)計模型。
本章以一種微合金高強鋼為例,介紹所開發(fā)PIDAS工藝評估模型。PIDAS系統(tǒng)已經(jīng)收集了近兩年該鋼種生產(chǎn)過程的大量數(shù)據(jù),其中包含了產(chǎn)品規(guī)格、化學(xué)成分、工藝參數(shù)和組織性能等。根據(jù)該鋼種用途和特點,反映其好壞的基本性能有5項:抗拉強度、屈服強度、屈強比、斷裂延伸率和剪切面積分數(shù)。通過對該鋼種大生產(chǎn)過程進行深入的冶金學(xué)原理分析和大生產(chǎn)數(shù)據(jù)的分析,確定了影響產(chǎn)品性能的20項主要因素:
(1) 產(chǎn)品規(guī)格(3項):中間坯厚度、目標厚度、目標寬度。
(2) 化學(xué)成分(11項):C、Mn、Si、Nb、Ti、V、Cu、B、Cr、Ni、Mo。
(3) 溫度參數(shù)(6項):出爐溫度、開軋溫度、終軋溫度、冷速、開冷溫度、終冷溫度。
工藝評估模型能夠根據(jù)上述20項工藝參數(shù),精準預(yù)測5項性能所在的區(qū)間,以及真實值位于此區(qū)間內(nèi)的概率。
機器學(xué)習(xí)算法的本質(zhì)是在特征和目標之間找到合適的映射關(guān)系[2],分為分類算法和回歸算法兩種[3],其中常見的回歸算法有線性回歸(Linear Regression)、 K近鄰回歸(KNN Regressor)、支持向量回歸(SVR)、嶺回歸(Ridge)、Lasso回歸、多層感知器回歸(MLPRegressor)、決策樹回歸(DecisionTree)、極限樹回歸(ExtraTree)、極限梯度提升回歸(XGBoost)、隨機森林回歸(RandomForest)、AdaBoost、梯度提升樹回歸(Gradient Boost)、引導(dǎo)聚集回歸(Bagging),用REG_Model表示這些回歸算法組成的集合。基于機器學(xué)習(xí)的材料性能預(yù)測流程如圖1所示。
圖1 回歸方法流程圖
(1)
然而,中厚板組織性能的預(yù)測受檢測手段、數(shù)據(jù)通訊、組織性能不均勻等諸多因素的影響[1],使得機器學(xué)習(xí)預(yù)測模型的精度并不是特別高;同時,由于生產(chǎn)過程的多工序性,使得在建立模型的時候不可能把所有特征都考慮在內(nèi),這樣就導(dǎo)致了雖然模型對于相同的特征預(yù)測得到了相同的性能,但與實際性能間還可能會有一定差距,因為并沒有考慮其他特征的影響。于是將機器學(xué)習(xí)方法應(yīng)用到中厚板的組織性能預(yù)測上時,需要做一定改進。
不同于傳統(tǒng)機器學(xué)習(xí)算法預(yù)測得到一個確定的值,區(qū)間估計算法預(yù)測得到的是一個區(qū)間值,以及真實值落在這個區(qū)間的概率,即準確性。文獻[4-8]中分別提出了bootstrap,Bayesian,mean-variance estimation,delta 和 neural network的方法,然而這五種方法并沒有嘗試在不同準確率下的區(qū)間估計,也即調(diào)整準確率得到不同的區(qū)間估計。在這里本文提出了概率區(qū)間估計算法,解決了上述問題,其流程圖如圖2所示。
圖2 概率區(qū)間估計算法流程圖
(2)
這樣最終構(gòu)建的模型一方面綜合對比了常見機器學(xué)習(xí)回歸模型的準確度,并選出最優(yōu)的,另一方面又充分利用了歷史數(shù)據(jù)的分布規(guī)律,用區(qū)間預(yù)測代替常見的單值預(yù)測,這樣便能消除原始數(shù)據(jù)因為受檢測手段、數(shù)據(jù)通訊、組織性能不均勻?qū)е碌牟痪_性以及生產(chǎn)的多工序性帶來的影響。同時通過不同的acc下對應(yīng)不同t值,實現(xiàn)了不同準確率下的區(qū)間估計,這滿足了工藝設(shè)計人員對于不同精度下估計的需求。算法的偽代碼如下:
算法1 概率區(qū)間估計算法
輸入:歷史生產(chǎn)數(shù)據(jù)data,REG_Model,Accuracy.
輸出:最佳回歸模型,不同準確率下的區(qū)間閾值.
1.threshold=?
2.for model in REG_Model do
3. train model on data;
4.end for
5.choose the best modelMas the candidate model.
7.for acc in Accuracy do
8. adjust and findtsuch that
9. threshold=threshold∪{t};
10.end for
11.returnM,threshold.
DWTT是用來檢測材料韌性的試驗,在這里特指DWTT剪切面積分數(shù),其值在0~100之間,DWTT是否大于85(或95)是衡量抗脆性開裂能力的一個重要指標。文中將DWTT評估模型分成了兩個小的模型:分類模型和回歸模型。通過AdaBoost構(gòu)建的分類模型能根據(jù)20個工藝參數(shù)預(yù)測產(chǎn)品DWTT值是否大于85。對于值在85以上的DWTT,本文根據(jù)前文提出的概率區(qū)間估計算法,構(gòu)建了回歸模型。流程圖如圖3所示。
圖3 DWTT工藝評估模型流程圖
從PIDAS數(shù)據(jù)庫中導(dǎo)出近兩年對象鋼種生產(chǎn)數(shù)據(jù),同時只保留-10 ℃試驗環(huán)境下DWTT的測量數(shù)據(jù),刪去空值所在的行后還剩下21 853條數(shù)據(jù),隨機地將數(shù)據(jù)集分成兩部分,其中80%用作訓(xùn)練集,20%用作測試集。為了消除工藝參數(shù)數(shù)量級差別造成的影響,對工藝參數(shù)做了標準化的處理;在構(gòu)建分類模型時,將85以上的DWTT賦為1,總共有21 087條,85以下的賦為0,總共有766條。
1.2.1 DWTT分類模型構(gòu)建
文中采用AdaBoost算法構(gòu)建DWTT的分類模型。AdaBoost算法是基于Boosting思想的機器學(xué)習(xí)算法,其核心思想是針對同一個訓(xùn)練集訓(xùn)練得到不同的決策樹弱分類器,然后把這些弱分類器集合起來,構(gòu)成一個強分類器[9],其中影響模型好壞的重要參數(shù)是弱分類器的個數(shù)(n_estimators)。
分類模型的評價標準除了準確率以外,還有精確率、召回率等,混淆矩陣如表1所示,Positive代表DWTT值超過85,Negative代表DWTT值低于85。
表1 混淆矩陣
準確率Accuracy為分類模型所有判斷正確結(jié)果占總觀測值的比重:
(3)
精確率Precision是模型預(yù)測為Positive的結(jié)果中模型預(yù)測正確的比重:
(4)
僅用準確率來衡量分類模型是不準確的,尤其對于負樣本量比較少的數(shù)據(jù),因為可以構(gòu)建這樣一個模型:預(yù)測全部結(jié)果都為Positive,這依然能達到很高的Accuracy,但這顯然是不合理的。于是對于DWTT分類,除了評估模型的Accuracy,同時評估了模型Precision,即模型預(yù)測DWTT超過85時DWTT真實值超過85的概率。
在具體模型構(gòu)建的過程中,本文采用AdaBoost算法訓(xùn)練了弱分類器個數(shù)從1~400的分類模型,各個模型在訓(xùn)練集和測試集上的Accuracy,以及Precision如圖4所示。
從訓(xùn)練結(jié)果可以看到,分類器的個數(shù)在270時,模型在訓(xùn)練集、測試集上的準確率以及精確率同時達到了最優(yōu),分別為0.960 4、0.971 0和0.972 7,取得了比較精準的預(yù)測。
1.2.2 DWTT概率區(qū)間模型構(gòu)建
上一節(jié)建立DWTT的分類模型,它可以根據(jù)工藝參數(shù)精準地預(yù)測DWTT是否大于85。如果大于85,工藝設(shè)計人員仍關(guān)心其值可能落在的區(qū)間,這節(jié)用第一章提出的概率區(qū)間估計算法構(gòu)建區(qū)DWTT概率區(qū)間估計模型,它能評估DWTT在不同精度下可能落在的區(qū)間。我們逐步地在DWTT數(shù)據(jù)上實施算法1。
圖4 AdaBoost 模型訓(xùn)練
首先是比較常見的回歸模型在DWTT數(shù)據(jù)集上的表現(xiàn),并用模型在訓(xùn)練集和測試集上的r2來找出最優(yōu)模型,其結(jié)果如表2所示。
表2 常見機器學(xué)習(xí)回歸算法在DWTT數(shù)據(jù)集上的訓(xùn)練結(jié)果
由表2可以驗證前文中提到的,沒有模型能夠達到同時在訓(xùn)練集和測試集上達到比較高的準確率。并且可以看出,DecisionTree和ExtraTree 出現(xiàn)了過擬合現(xiàn)象。綜合比較,本文選用Bagging作為下步區(qū)間估計的最優(yōu)模型。
接下來對Bagging回歸做進一步參數(shù)優(yōu)化。BaggingRegressor是一種有放回的抽樣訓(xùn)練的方法,每次從總樣本集中隨機地有放回抽取部分小樣本,用決策樹訓(xùn)練便得到一個回歸模型,最后用取平均的方法得到最終的預(yù)測值,同上節(jié)AdaBoost一樣,影響B(tài)agging模型好壞的重要參數(shù)是弱分類器的個數(shù)(estimators)。我們采用BaggingRegressor算法訓(xùn)練了弱分類器個數(shù)從1~300的分類模型,各個模型在訓(xùn)練集和測試集上的Accuracy如圖5。
于是選取弱分類器的個數(shù)為50,此時模型已經(jīng)在訓(xùn)練集和測試集上達到了比較高的準確率。
接下來根據(jù)算法1的7~10步計算不同精度下的閾值,結(jié)果如表3所示。
圖5 BaggingRegressor模型訓(xùn)練
表3 不同準確率下的閾值
我們以準確率為90%時模型的預(yù)測結(jié)果來展示模型表示的含義。
圖6中任意選取了30個DWTT真實值和其對應(yīng)的模型預(yù)測值,其中黑色實線代表真實值,藍色線段組成的區(qū)間代表模型在該點的預(yù)測值,線段長最多為2·Threshold=5.6。從中可以看到,真實值絕大多數(shù)落在了預(yù)測的藍色區(qū)間中,90%的含義是歷史數(shù)據(jù)以不低于90%的概率落在預(yù)測的區(qū)間中。
圖6 準確率為90%時DWTT真實值和模型預(yù)測的區(qū)間值
同樣地,當(dāng)準確率為80%時,模型預(yù)測的結(jié)果和真實值如圖7所示。
預(yù)測的區(qū)間長度為2·Threshold=3.6,和準確率為90%時相比,真實值不落在預(yù)測區(qū)間中的點的個數(shù)增加了,它損失了一定的準確度,但提升了一定的精度。同樣的解釋對于其他準確度,區(qū)間范圍越小,準確率越低。
圖7 準確率為80%時DWTT真實值和模型預(yù)測的區(qū)間值
同樣地,采用區(qū)間估計的辦法構(gòu)建了頭部和尾部抗拉強度、屈服強度、屈強比、斷裂延伸率的評估模型,其r2和不同準確率下的Threshold如表4所示。
可以看到,單個的機器學(xué)習(xí)預(yù)測模型在性能上預(yù)測的準確率在訓(xùn)練集上并不太好,這也是本文引入?yún)^(qū)間估計的目的。4~14列為對應(yīng)不同精度的區(qū)間范圍值,實現(xiàn)了不同精度下的區(qū)間預(yù)測。
上一章中構(gòu)建了工藝評估模型,它能根據(jù)影響對象鋼種產(chǎn)品性能的20項主要因素來評估產(chǎn)品工藝性能,這章構(gòu)建一個逆向的模型,即通過目標工藝性能和產(chǎn)品規(guī)格、化學(xué)成分來設(shè)計最優(yōu)溫度參數(shù),具體來說就是通過如下參數(shù)來設(shè)計最優(yōu)的6項溫度參數(shù):出爐溫度、開軋溫度、終軋溫度、冷速、開冷溫度、終冷溫度,使用的方法是通過下節(jié)提出的自定義權(quán)重的模擬退火算法和第二章構(gòu)建的評估模型。
表4 工藝評估模型總結(jié)
(1) 工藝性能(9項):DWTT和頭部尾部的抗拉強度、屈服強度、屈強比、斷裂延伸率。
(2) 產(chǎn)品規(guī)格(3項):中間坯厚度、目標厚度、目標寬度。
(3) 化學(xué)成分(11項):C、Mn、Si、Nb、Ti、V、Cu、B、Cr、Ni、Mo。
模擬退火算法是一種解決無約束問題最優(yōu)化的方法,它是通過賦予搜索過程一種時變且最終趨于零的概率突跳性,從而可有效避免陷入局部極小并最趨于全局最優(yōu)的串行結(jié)構(gòu)的優(yōu)化算法[10],其流程如圖8所示。
圖8 模擬退火算法流程圖
對目標函數(shù)E做如下修改,用以解決多目標優(yōu)化的問題,假設(shè)E=(f1,f2,…,fn),以及一組自定義的權(quán)重λ=(λ1,λ2,…,λn),對給定x,定義:
E(x)=∑i(λi*fi(x))/S
(5)
式中:S=λ1+…+λn。設(shè)計模型中加入權(quán)重的意義在于設(shè)計人員可以通過調(diào)節(jié)權(quán)重來調(diào)節(jié)更加關(guān)注的性能。值得注意的是,算法的第 2,3 步隨機生成的x2是在歷史數(shù)據(jù)的最大值和最小值之間的隨機數(shù),保證最后的結(jié)果有意義。
用x1表示3項產(chǎn)品規(guī)格和11項化學(xué)成分,用x2表示6項溫度參數(shù),同時y=(y1,…,y9)表示9項工藝性能,f1,f2,…,f9表示第二章中建立的9個模型,工藝設(shè)計的目標是對給定的x1和y尋找最優(yōu)的x2,使得fi(x1,x2)與yi盡可能地接近,也即尋找x2使得di=|fi(x1,x2)-yi| 盡可能地小,其中i取值從1~9。這樣就是一個多目標的優(yōu)化問題,對于給定的權(quán)重λ=(λ1,λ2,…,λn),定義:
(6)
這樣采用上一節(jié)的自定義權(quán)重的模擬退火算法便能夠找到最優(yōu)的溫度參數(shù)x2,使得預(yù)測值與真實值盡可能地接近。
在歷史數(shù)據(jù)集上做試驗的結(jié)果如下:隨機選取某條生產(chǎn)數(shù)據(jù),其中包括3項產(chǎn)品規(guī)格、11 項化學(xué)成分和9項如下的工藝性能參數(shù) 97、660、639、582、564、888.3、88.1、48、48,分別取λ為(1,1,1,1,1,1,1,1,1)、(1,2,3,4,5,6,7,8,9)和(9,8,7,6,5,4,3,2,1),用此模型做試驗,溫度參數(shù)的真實值和3組預(yù)測值如表5。
由表5可以看到,對于不同的權(quán)重參數(shù),模型尋找到了不同的冷卻方案,經(jīng)對比,試驗一的結(jié)果和真實溫度參數(shù)非常接近,這符合同權(quán)重下設(shè)計值應(yīng)與真實值一致的預(yù)期;試驗二、三根據(jù)側(cè)重的性能不同,設(shè)計了多樣的冷卻方案,這對工藝設(shè)計和新產(chǎn)品的開發(fā)具有一定的輔助意義,能夠在一定程度上降低新產(chǎn)品的研發(fā)成本。同時需要提高的地方是在模型中加入更多的約束條件,從而使其設(shè)計的溫度參數(shù)更有意義。
表5 工藝設(shè)計模型試驗結(jié)果
本文首先以一種微合金高強鋼為例,建立了9個工藝評估模型,它能根據(jù)20個工藝參數(shù)預(yù)測不同精度下頭尾抗拉強度、屈服強度、屈強比、斷裂延伸率和DWTT所在的區(qū)間。它基于本文自主開發(fā)的概率區(qū)間估計算法,該算法綜合了機器學(xué)習(xí)的回歸模型和歷史數(shù)據(jù)的統(tǒng)計特征,能夠?qū)崿F(xiàn)精準預(yù)測。同時本文建立了工藝設(shè)計模型,它能夠根據(jù)9項目標性能和3項產(chǎn)品規(guī)格以及11項化學(xué)成分設(shè)計最優(yōu)的6項溫度參數(shù),使得產(chǎn)品在此工藝設(shè)計下的性能盡可能地接近目標性能。此模型基于本文自主開發(fā)的自定義權(quán)重模擬退火算法。
通過這兩類模型達到產(chǎn)品質(zhì)量預(yù)報和優(yōu)化工藝設(shè)計的目的,從而能夠輔助工藝評定和新產(chǎn)品的工藝開發(fā)。據(jù)我們查文獻所知,這兩種方法都是開創(chuàng)性的。本文后續(xù)的工作是重點考慮參數(shù)意義,對模型中的優(yōu)化問題加入約束條件,使工藝設(shè)計模型中的冷卻參數(shù)更有意義。