李嘉卉,董 波,佟 冰,賈 濤,張 東
(中國重型機械研究院股份公司,陜西 西安 710032)
LF精煉作為轉(zhuǎn)爐煉鋼與連鑄之間的樞紐過程,溫度控制至關(guān)重要,合理的溫度控制能夠減少LF精煉過程中不必要的成本消耗。精煉處理過程中,通電時長、吹氬氣流量等方面的把握,能有效節(jié)約成本,控制節(jié)奏,提高精煉效率。因此為了實現(xiàn)LF精煉智能化,準(zhǔn)確的溫度預(yù)報必不可少。
本文通過對某鋼廠相同狀態(tài)下LF精煉千余爐完整生產(chǎn)數(shù)據(jù)的分析,針對影響LF爐精煉溫度變化的因素深入探究,建立了基于機器學(xué)習(xí)的智能溫度預(yù)報算法,最終實現(xiàn)了對鋼水出站溫度的高準(zhǔn)確度預(yù)報。
為了實現(xiàn)對鋼水溫度的準(zhǔn)確預(yù)報,首先要探究影響溫度變化的因素都有哪些,且如何引起溫度變化。在鋼包處于相同狀態(tài)的情況下(本實驗數(shù)據(jù)均來自舊鋼包冶煉的生產(chǎn)數(shù)據(jù)),LF精煉溫度的影響因素可大體的分為進站起始溫度、電極通電溫變、吹氬攪拌溫變、造渣溫變、合金化溫變和總處理時間這幾個部分。
相同的鋼包狀態(tài)下,鋼液的起始溫度主要是由轉(zhuǎn)爐的出鋼溫度決定。在對所有進站起始溫度數(shù)據(jù)分析后發(fā)現(xiàn)有78.7%的數(shù)據(jù)起始溫度在1 535~1 555 ℃之間,平均起始溫度為1 548 ℃。鋼液的起始溫度作為煉鋼起始階段的重要指標(biāo)會直接影響之后的冶煉操作。
LF精煉通過三相石墨電極與鋼液間產(chǎn)生電弧達到加熱升溫目的。鋼水由轉(zhuǎn)爐出鋼后到達LF處理工位時鋼水表面附著較厚的爐渣,因此造渣階段通電產(chǎn)生的熱能一部分作用于融渣。同時,由于處理的起始階段鋼包和鋼液之間存在溫差(鋼包溫度低于鋼液),兩者間的熱平衡會損耗部分加熱能量。加熱過程中鋼液溫度變化公式
(1)
式中,ΔTPower為電極通電產(chǎn)生的溫變;P1為造渣階段鋼液升溫系數(shù);tp1為造渣階段通電時間,min;P2為合金化階段鋼液升溫系數(shù);tp_i為合金化第i次通電時間,min。
氬氣攪拌環(huán)節(jié)有協(xié)助鋼液脫硫、脫氧,均勻鋼水成分以及去除雜質(zhì)的效果,攪拌強度會直接影響鋼水溫度。根據(jù)吹氬強度的不同,可分為軟吹氬、中吹氬和強吹氬,鋼液的溫降速率也從軟吹到強吹依次遞增。攪拌過程中對鋼液溫度的影響為
(2)
式中,ΔTBlow為吹氬攪拌過程產(chǎn)生的溫變;Bstrong、Bnormal、Bsoft為表示強吹氬、中吹氬和軟吹階段鋼液的溫降系數(shù);tstrong_i、tnormal_i、tsoft_i為第i次強吹氬、中吹氬和軟吹階段用時,min。
如圖1所示為不同氬氣攪拌強度溫變分布圖,從圖1可以看出,精煉階段強吹氬導(dǎo)致的鋼液總溫降與中吹氬總溫降基本重合。
圖1 不同氬氣攪拌強度溫變分布圖
通過加入造渣劑使鋼水深脫氧、脫硫,去除非金屬雜質(zhì),起泡埋弧,抑制鋼液被氧化的同時保溫。本項目所在鋼廠對于LF精煉造渣過程使用的造渣劑主要是石灰(CaO)和鋁渣(Al)。造渣過程中Al發(fā)生氧化反應(yīng)放熱,同時Al作為造渣劑會使鋼液溫度略降低,因此作為造渣劑Al導(dǎo)致的溫度變化可被忽略,僅石灰使鋼液溫度降低。造渣階段的溫變公式為
(3)
式中,ΔTSlag為造潭過程產(chǎn)生的鋼水溫變;SCaO為石灰導(dǎo)致的溫降系數(shù);Wi為每100 kg鋼水第i次加入石灰的重量。
合金化對鋼液成分起到了調(diào)節(jié)的作用,不同合金的加入含量會使鋼液溫度發(fā)生不同的變化。通過分析發(fā)現(xiàn),合金化過程主要加入的成分為碳粉 (C),中錳(Mn)和硅鐵(Si)。硅鐵的加入會使鋼液溫度升高,中錳和碳粉會導(dǎo)致溫度下降,其中相同重量的碳粉導(dǎo)致的溫降大于中錳。具體的合金化過程中溫度變化公式為
(4)
式中,ΔTAlloy為合金化過程產(chǎn)生的鋼水溫變;AC、ASi、AMn分別為碳粉、硅鐵以及中錳導(dǎo)致的溫度變化系數(shù);WC_i、WSi_i、WMn_i分別為每100 kg碳粉,硅鐵和中錳的加入重量。
精煉過程處理時間除了影響連鑄環(huán)節(jié)的正常運轉(zhuǎn),也直接影響了LF爐處理工位鋼包的溫度變化。對于相同狀態(tài)的舊鋼包,自然溫降系數(shù)較小,但如果一爐鋼水在造渣、合金化階段結(jié)束后依然等待調(diào)度(處于無操作狀態(tài)),也會造成一定程度的溫降。在對本次實驗數(shù)據(jù)的分析中,91.3% 的爐次處理中無任何操作的純等待時間小于3 min(其中無純等待時間的爐次占41.6%)。因此在接下來的溫變影響因素對比中,總處理時間所導(dǎo)致的溫降可被忽略,不參與對比。
每爐鋼水中五種溫度變化因素包括進站起始溫度、電極通電溫變、吹氬攪拌溫變、造渣溫變、合金化溫變,均可被轉(zhuǎn)化為溫度變化的數(shù)據(jù)形式呈現(xiàn)。本文將從每爐鋼水處理過程中這五種因素與出站溫度之間的關(guān)系,多方位對比。
為保證預(yù)測模型前期訓(xùn)練數(shù)據(jù)準(zhǔn)確性,首先要分析溫變因素之間是否存在明顯相關(guān)性。獨立的兩個變量之間若存在明顯相關(guān)性,會影響后續(xù)模型的準(zhǔn)確性和穩(wěn)定性,在之后的建模分析中需要將相關(guān)變量二次處理,例如降維或進行必要的合并操作。同時由于五種溫變因素是根據(jù)本文溫變公式計算得到,其中部分溫變因素由內(nèi)部的幾種因素共同作用。為保證變量相關(guān)準(zhǔn)確,需要對所有引起溫度變化的變量進行相關(guān)性檢驗。結(jié)果顯示如圖2所示,除了五種溫變因素內(nèi)部的二級因素之間有相關(guān)性外,并不存在跨變量相關(guān)性。
圖2 溫變因素相關(guān)性熱力圖
為了更好了解每種溫變因素改變溫度的程度,進一步建立了基于隨機森林模型(RandomForest)的特征選擇工程。隨機森林作為目前常用的機器學(xué)習(xí)算法,具有魯棒性好、易于使用和準(zhǔn)確率高等優(yōu)點。針對數(shù)據(jù)特點,本次特征選擇使用了隨機森林模型中平均準(zhǔn)確度下降(mean decrease accuracy)的特征選擇方法。主要思想是通過使用隨機森林模型對每個特征(溫變因素)進行擾頻處理(加入干擾噪聲),衡量每個特征對模型整體精確度的影響,確定特征重要性,即溫變因素改變溫度程度。針對每個特征(記為特征)的重要性計算步驟為
步驟1。隨機森林由N決策樹決策樹,對數(shù)據(jù)集進行隨機抽取(有放回),建立一棵決策樹。對于第i棵決策樹,使用沒有被抽取的數(shù)據(jù)對該樹中數(shù)據(jù)進行誤差計算,得到誤差記為e1_i。
步驟2。對于未被抽中的數(shù)據(jù)隨機的加入噪聲干擾,重復(fù)上一步誤差計算,將新得到的誤差記為e2_i。
步驟3。對于相同特征Tn,如果通過噪聲處理后準(zhǔn)確率降低越明顯,說明該特征對于模型結(jié)果準(zhǔn)確率影響越大,該特征越重要。
具體的特征重要性數(shù)值
(5)
式中,ITn為特征Tn的特征重要性值;n為特征的總決策樹數(shù)量。
如圖3所示為溫變因素重要性排序圖,通過對這13個溫降因素進行特征重要性分析,發(fā)現(xiàn)電極通電溫變、起始溫度及造渣階段溫變是影響LF精煉溫度最重要的三個因素,對溫度變化影響最小的因素是硅鐵加入產(chǎn)生的溫變。
圖3 溫變因素重要性排序圖
在經(jīng)過必要的數(shù)據(jù)清洗、溫變因素相關(guān)性及特征分析后,建立了監(jiān)督式機器學(xué)習(xí)模型來預(yù)報處理結(jié)束時鋼水終點溫度。
監(jiān)督式學(xué)習(xí)是一種機器學(xué)習(xí)的方法,可從訓(xùn)練數(shù)據(jù)中學(xué)到,再通過特定模型學(xué)習(xí)并推測新的實例。其中訓(xùn)練數(shù)據(jù)由輸入數(shù)據(jù)和需要預(yù)測的函數(shù)輸出共同組成。根據(jù)函數(shù)輸出的種類不同,可將預(yù)測問題分為兩類,預(yù)測連續(xù)值(回歸問題)或預(yù)測分類標(biāo)簽(分類問題)預(yù)測鋼水終點溫度屬于回歸問題。
目前針對回歸類問題,比較有代表性的有線性回歸算法(Linear Regression)、MLP(多層感知機)以及Xgboost(Extreme Gradient Boosting:極端梯度提升決策樹)。溫度預(yù)測模型將根據(jù)分別基于這三種算法建立不同模型。
3.1.1 線性回歸模型
線性回歸模型是利用線性回歸方程的最小平方函數(shù)對一個或多個自變量和因變量之間關(guān)系進行建模的一種回歸分析。這種函數(shù)是一個或多個稱為回歸系數(shù)的模型參數(shù)的線性組合。只有一個自變量的情況稱為簡單回歸,大于一個自變量情況的叫做多元回歸。其關(guān)系式可表示為
式中,θ為參數(shù)向量;X為輸入量向量,對于多變量可展開為
hθ(x)=θ0+θ1x1+θ2x2+…+θnxn
3.1.2 MLP回歸模型
多層感知機又名人工神經(jīng)網(wǎng)絡(luò)(ANN:Artificial Neural Network),其包含輸入層、輸出層和一(或多)個隱含層,且層與層之間完全連接(即上一層的某個神經(jīng)元和下一層每個神經(jīng)元相連)。輸入信息在預(yù)測過程中只單向傳播,接收前序反饋信息達到學(xué)習(xí)預(yù)測的目的。
隱藏層輸出為f(W1X+b1)。X為輸入層輸入向量;W1為權(quán)重(連接系數(shù));b1為偏置(等同數(shù)學(xué)函數(shù)中的截距)。
3.1.3 Xgboost模型
Xgboost作為集成學(xué)習(xí)算法,屬于梯度提升樹家族(GBDT)。GBDT的基本思想是讓新的基模型(CART決策樹)去擬合前面模型的偏差,進而逐漸降低模型偏差。相比于經(jīng)典的GBDT,Xgboost做了一些改進,從而在效果和性能上有明顯的提升。一方面Xgboost將目標(biāo)函數(shù)泰勒展開到了二階,保留了更多有關(guān)目標(biāo)函數(shù)的信息,能使模型效果有效提高。另一方面支持特征并行方法,有利于模型的性能提升。
針對本文三種算法各自的原理,分別建立了三種不同的預(yù)測模型。具體步驟為
步驟1。根據(jù)本文溫變因素相關(guān)性和特征重要性結(jié)果,將數(shù)據(jù)中相關(guān)性較強(相關(guān)性大約或等于0.7)的兩個變量里的次重要變量刪除。最終13個溫變因素中只有11個變量參與模型訓(xùn)練。
步驟2。將所有數(shù)據(jù)按照7∶3的比例劃分為訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)。使用基模型選取及調(diào)整參數(shù)對訓(xùn)練數(shù)據(jù)進行訓(xùn)練,得到三種預(yù)測算法。
步驟3。使用三種預(yù)測算法預(yù)測測試數(shù)據(jù),得到不同的預(yù)測結(jié)果。
針對三種溫度預(yù)測回歸模型的預(yù)測結(jié)果,模型評估方法將使用MSE(均方誤差)及RMSE(均方根誤差)作為指標(biāo)進行評估。其工作原理為
(6)
(7)
MSE和RMSE的取值范圍都是[0,+∞],即當(dāng)取值為零時說明預(yù)測值與真實值重合,反之取值越大則預(yù)測誤差越大。三種模型的MSE、RMSE值見表3,可視化預(yù)測誤差散點圖如圖4所示。
表3 模型評估MSE & RMSE值
由圖4可以看出,根據(jù)本文模型評估分析得到預(yù)測誤差從小到大分別是Xgboost、線性回歸和MLP模型,Xgboost模型預(yù)測誤差最小,最終Xgboost模型作為準(zhǔn)確率最高的模型,被選為本項目溫度預(yù)測模型。
圖4 模型實際值與預(yù)測值偏差散點圖
為了實現(xiàn)煉鋼智能化,作為LF精煉過程中的重要的把控目標(biāo),溫度的控制直接影響精煉質(zhì)量和后續(xù)冶煉節(jié)奏。本文通過對某鋼廠千余爐完整精煉生產(chǎn)數(shù)據(jù)深入分析,總結(jié)影響鋼液溫變的重要因素,建立溫度預(yù)報機器學(xué)習(xí)模型,該智能化模型在某鋼廠投入后,經(jīng)過三個月的模型效果追蹤,結(jié)果顯示溫度預(yù)報準(zhǔn)確率(預(yù)測溫度偏差小于等于5℃)可達到95%。智能化溫度預(yù)測模型的推廣是未來發(fā)展趨勢,更是助力煉鋼領(lǐng)域全面智能化的堅實一步。