王振陽(yáng),江德文,王新東,張建良,劉征建,趙寶軍
1)北京科技大學(xué)冶金與生態(tài)工程學(xué)院,北京 100083
2)河鋼集團(tuán)有限公司鋼鐵技術(shù)研究總院,石家莊 050023
3)昆士蘭大學(xué)化學(xué)工程學(xué)院,圣盧西亞 QLD 4072
2000 年以來(lái),我國(guó)生鐵產(chǎn)量快速增加,并于2019 年全年產(chǎn)量達(dá)到8.06 億噸,約占當(dāng)年世界生鐵產(chǎn)量的63%。能耗方面,我國(guó)鋼鐵行業(yè)能耗約占工業(yè)總能耗的16%,而煉鐵工序又占鋼鐵全流程能耗的70%左右。在此背景下,高爐作為煉鐵工序的主反應(yīng)器,其穩(wěn)定順行對(duì)我國(guó)鋼鐵工業(yè)的節(jié)能降耗與高效生產(chǎn)尤為重要。然而高爐原燃料波動(dòng)造成的爐型改變,以及設(shè)備破損導(dǎo)致的不均勻傳熱等多種內(nèi)外因素使高爐爐況波動(dòng)時(shí)有發(fā)生,給煉鐵工序的增產(chǎn)降耗帶來(lái)影響[1?2].
鐵水溫度是高爐煉鐵的一項(xiàng)重要參數(shù),不僅可以反映當(dāng)前鐵水本身質(zhì)量與高爐爐缸熱狀態(tài),且通過(guò)其變化趨勢(shì)和幅度也能預(yù)判高爐運(yùn)轉(zhuǎn)方向。因此,若能通過(guò)當(dāng)前時(shí)刻的各項(xiàng)冶煉參數(shù)預(yù)測(cè)一定時(shí)間后的鐵水溫度變化趨勢(shì)與幅度,則可以提前采取應(yīng)對(duì)調(diào)控措施,減少爐況波動(dòng),穩(wěn)定高爐熱制度,從而促進(jìn)高爐穩(wěn)定順行與煉鐵工序節(jié)能降耗[3?6].
基于此,國(guó)內(nèi)外研究學(xué)者對(duì)鐵水溫度展開(kāi)了多種構(gòu)建機(jī)制條件下的機(jī)器學(xué)習(xí)與模型預(yù)測(cè)研究,取得了一定進(jìn)展。崔桂梅等分別采用模糊神經(jīng)網(wǎng)絡(luò)[7]與分布式神經(jīng)網(wǎng)絡(luò)[8]構(gòu)建鐵水溫度預(yù)測(cè)模型,使鐵水溫度預(yù)測(cè)誤差在±10 ℃內(nèi)的準(zhǔn)確度達(dá)到90%。石琳等[9]基于樣條變換的非線性偏最小二乘回歸方法,控制鐵水溫度預(yù)測(cè)值與測(cè)量值的相對(duì)誤差小于0.11。Zhang 等[10]以均方根誤差和相關(guān)系數(shù)為標(biāo)準(zhǔn),對(duì)比分析了3 種深度學(xué)習(xí)算法與7 種淺層學(xué)習(xí)算法對(duì)高爐鐵水溫度的預(yù)測(cè)效果,認(rèn)為淺層神經(jīng)網(wǎng)絡(luò)(SNN)對(duì)當(dāng)前鐵溫預(yù)測(cè)精度較高,且計(jì)算資源消耗較低,適合在線反饋。此外,Zhang 等[11]還通過(guò)整合單一模式樹(shù)構(gòu)建集合模式樹(shù),并據(jù)此進(jìn)一步將鐵水溫度預(yù)測(cè)均方根誤差降低至7.33。基于多元自適應(yīng)回歸樣條(MARS)算法和滾動(dòng)時(shí)域估計(jì)(MHE),Diaz 等[12]和Hashimoto 等[13]對(duì)鐵水溫度預(yù)測(cè)的平均絕對(duì)誤差分別為11.2 ℃和11.6 ℃。通過(guò)結(jié)合粒子群算法(APSO),Su 等[14]和Zhao 等[15]分別以極限學(xué)習(xí)機(jī)(ELM)和最小二乘支持向量機(jī)(LS-SVM)作為基礎(chǔ)算法預(yù)測(cè)鐵水溫度,模型取得較好預(yù)測(cè)精度和泛化性能.
基于數(shù)據(jù)驅(qū)動(dòng)的預(yù)測(cè)模型還包括基于時(shí)間序列的自回歸算法、貝葉斯網(wǎng)絡(luò)算法等,其中以支持向量回歸(Support vector regression,簡(jiǎn)稱SVR)為基礎(chǔ)的模型在煉鐵領(lǐng)域應(yīng)用較為廣泛[16?18],已成功實(shí)現(xiàn)對(duì)鐵水硅含量[19]和高爐故障的預(yù)判[20]。此外,極限學(xué)習(xí)機(jī)(Extreme learning machine,簡(jiǎn) 稱ELM)因隱藏神經(jīng)元的參數(shù)無(wú)需調(diào)整,而獲得快速的訓(xùn)練速度和良好的工業(yè)適應(yīng)度[21?23]。因此,本研究以支持向量回歸和極限學(xué)習(xí)機(jī)算法為基礎(chǔ),在日平均數(shù)據(jù)的時(shí)間維度下,對(duì)鐵水溫度進(jìn)行模型學(xué)習(xí)和預(yù)測(cè)研究,期望在拓寬時(shí)間維度的基礎(chǔ)上獲得工藝可接受的鐵水溫度預(yù)測(cè)準(zhǔn)確度,為高爐在線實(shí)際應(yīng)用提供基礎(chǔ)模型支撐.
回歸預(yù)測(cè)模型的構(gòu)建一般是基于訓(xùn)練樣本集D={(xm,ym)}而獲得形如f(x)=wTx+b模型中w和b等未知參量,傳統(tǒng)回歸模型通常是直接以預(yù)測(cè)值f(x)與測(cè)量值y之間的差別計(jì)算損失,并通過(guò)優(yōu)化損失函數(shù)以降低誤差,使f(x)與y之間的差別(損失)減小,損失函數(shù)J(θ)如式(1)所示.
其中,m為樣本量,xi為第i個(gè)訓(xùn)練樣本特征值組合,yi為第i個(gè)訓(xùn)練樣本測(cè)量值,hθ(xi)為第i個(gè)訓(xùn)練樣本特征值組合預(yù)測(cè)函數(shù),θ為選定的某個(gè)預(yù)測(cè)函數(shù)標(biāo)號(hào).
對(duì)于SVR 算法,可允許f(x)與y之間存在 ε的偏差,即僅當(dāng)|f(x)?y|>ε才計(jì)算損失。若訓(xùn)練樣本是線性可分的,則在樣本空間中,可通過(guò)式(2)描述其劃分出的超平面.
其中,w為法向量,b為位移項(xiàng)。若將x從低維空間映射到高維空間的特征向量表示為Φ(x),則高維空間劃分的超平面模型如式(3)所示.
此時(shí),樣本空間任意點(diǎn)x到超平面(w,b)的距離r與間隔寬度γ分別如式(4)、(5)所示.
以f(x)為中心,構(gòu)建寬度為2ε的間隔帶,若訓(xùn)練樣本落入此間隔帶,則認(rèn)為是預(yù)測(cè)正確。進(jìn)一步地,將核函數(shù)[24]引入SVR 后如式(6)所示.
式中:
其中,k(xi,x)為核函數(shù),拉格朗日乘子≥0、ai≥0,其中核函數(shù)的選擇至關(guān)重要,通過(guò)優(yōu)化選擇適用的核函數(shù)(例如:徑向基核函數(shù)、線性核函數(shù)、多項(xiàng)式核函數(shù)或Sigmoid 核函數(shù)),從而最終確定基于SVR 的預(yù)測(cè)模型.
ELM 是用于單層前饋神經(jīng)網(wǎng)絡(luò)的訓(xùn)練學(xué)習(xí)方法,單層前饋網(wǎng)絡(luò)擁有三層神經(jīng)元,即輸入層、隱藏層和輸出層。對(duì)于含有N個(gè)樣本的數(shù)據(jù)集(xk,tk),其單層前饋神經(jīng)網(wǎng)絡(luò)數(shù)學(xué)模型如式(8)所示.
其中,xk=[xk1,xk2,···,xkn]表示第k個(gè)樣本的N維特征,tk=[tk1,tk2,···,tkn]表示對(duì)應(yīng)的目標(biāo)向量,βi是輸出權(quán)重矩陣,用于連接第i個(gè)隱藏和輸出節(jié)點(diǎn),g(wi,bi,xk)為非線性分段連續(xù)函數(shù),極限能力滿足ELM 定理,wi和bi為隨機(jī)確定的模型參數(shù)。因而,式(8)可寫成隱含輸出矩陣形式,如式(9)、(10)所示,其中,H為隱含層輸出矩陣,β為輸出權(quán)重矩陣,T為目標(biāo)矩陣.
根據(jù)最小二乘法理論,結(jié)合奇異值分解方法,ELM 的解可表示為式(11).
高爐生產(chǎn)過(guò)程中會(huì)產(chǎn)生兩類參數(shù),即人為調(diào)控的主動(dòng)操作參數(shù)以及反饋爐況的被動(dòng)狀態(tài)參數(shù),均會(huì)對(duì)鐵水溫度的走向變化產(chǎn)生不同程度的影響。本文依據(jù)冶金原理以及現(xiàn)場(chǎng)監(jiān)測(cè)條件,選取國(guó)內(nèi)某4000 m3級(jí)別高爐2014 年至2019 年時(shí)間范圍內(nèi)22 項(xiàng)特征參量的日平均數(shù)據(jù)構(gòu)成初選數(shù)據(jù)集,特征參量與實(shí)際數(shù)據(jù)樣本分別如表1 和圖1 所示.
表 1 鐵水溫度預(yù)測(cè)的初選特征參量Table 1 Primary data items for hot metal temperature prediction
圖1 所示鐵水溫度的初選特征參量共計(jì)22項(xiàng)。特征參量過(guò)多將增加模型計(jì)算復(fù)雜度,并大幅提高計(jì)算時(shí)間,因此需要對(duì)主要特征參量進(jìn)行提取。本文依據(jù)冶金原理、Pearson 相關(guān)系數(shù)以及Spearman 相關(guān)系數(shù)對(duì)初選特征參量進(jìn)一步篩選,以減少后續(xù)模型訓(xùn)練與預(yù)測(cè)過(guò)程中的無(wú)效計(jì)算,降低模型的計(jì)算復(fù)雜度,以適應(yīng)工業(yè)生產(chǎn)條件.Pearson 與Spearman 相關(guān)系數(shù)計(jì)算方法分別如式(12)與(13)所示,式中,X為特征向量,Y為目標(biāo)向量,ρ(X,Y)和Rs分別為X與Y的Pearson 和Spearman相關(guān)系數(shù),cov(X,Y)為X和Y的協(xié)方差,Var(X)與Var(Y)為X與Y的樣本方差,N為樣本數(shù),R(Xi)與R(Yi)分別為元素Xi和Yi在X和Y中的排序。經(jīng)計(jì)算,初選特征參量與鐵水溫度的相關(guān)系數(shù)計(jì)算結(jié)果如圖2 所示.
圖 1 鐵水溫度初選特征參量樣本散點(diǎn)圖Fig.1 Scatter plot of the primary characteristic parameters of hot metal temperature
由圖2 可知,對(duì)鐵水溫度發(fā)展走向的影響因素較多,既包含影響高爐直接與間接還原度的爐腹煤氣指數(shù)、煤氣利用率等,也包含影響高爐物料與熱量平衡的爐料結(jié)構(gòu)、水溫差等。具體來(lái)看,對(duì)后續(xù)鐵水溫度存在顯著正相關(guān)關(guān)系的特征參量主要為當(dāng)前鐵水溫度、煤氣利用率、鐵水硅含量、利用系數(shù)、鐵水日產(chǎn)量和綜合負(fù)荷等,存在顯著負(fù)相關(guān)關(guān)系的特征參量為爐腹煤氣指數(shù)、水溫差、焦丁比、燃料比、焦比和透氣性等。通過(guò)預(yù)實(shí)驗(yàn)計(jì)算,并綜合考量計(jì)算復(fù)雜度與預(yù)測(cè)精準(zhǔn)度,最終選取如表2 所示特征參量進(jìn)行模型擬合,其中1~4 項(xiàng)為操作參數(shù),5~14 項(xiàng)為狀態(tài)參數(shù),刪除相關(guān)度較低的冗余特征參量.
本文使用零–均值規(guī)范法對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,以消除特征參量之間量綱和取值范圍差異的影響。零–均值規(guī)范可以減小噪聲點(diǎn)的影響,且不受特征參量最大值和最小值的限制,在當(dāng)前數(shù)據(jù)標(biāo)準(zhǔn)化中使用較為廣泛,其計(jì)算公式如式(14)所示,其中:為原始數(shù)據(jù)的均值,σ為原始數(shù)據(jù)的標(biāo)準(zhǔn)差,z*為標(biāo)準(zhǔn)化處理后的樣本值.
圖 2 鐵水溫度與初選特征參量之間相關(guān)系數(shù)。(a)Pearson 相關(guān)系數(shù);(b)Spearman 相關(guān)系數(shù)Fig.2 Correlation coefficient between hot metal temperature and primary characteristic parameters:(a)Pearson; (b)Spearman
表 2 鐵水溫度終選特征參量Table 2 Final characteristic parameters of hot metal temperature
鐵水溫度特征參量提取及數(shù)據(jù)標(biāo)準(zhǔn)化處理后,形成的數(shù)據(jù)集將用于模型的訓(xùn)練與測(cè)試。數(shù)據(jù)集中隨機(jī)抽取80%的數(shù)據(jù)用于支持向量回歸與極限學(xué)習(xí)機(jī)模型的訓(xùn)練,使模型不斷學(xué)習(xí)和構(gòu)建特征參量與目標(biāo)參量之間的映射,即將表2 所示特征參量數(shù)據(jù)與下一日鐵水溫度數(shù)據(jù)構(gòu)建關(guān)聯(lián)映射,使模型能夠?qū)崿F(xiàn)預(yù)測(cè)下一階段鐵水溫度變化趨勢(shì)與幅度的目標(biāo)。而后利用剩余20%的數(shù)據(jù)構(gòu)成測(cè)試集,對(duì)模型的預(yù)測(cè)準(zhǔn)確度進(jìn)行驗(yàn)證,并利用測(cè)試集反饋結(jié)果不斷優(yōu)化模型超參數(shù),最終形成鐵水溫度預(yù)測(cè)模型,其中SVR 選用高斯RBF 核函數(shù),寬度系數(shù)為0.01,懲罰系數(shù)為10;ELM 選用Sigmoid 激活函數(shù),隱藏節(jié)點(diǎn)數(shù)設(shè)置為100,在此超參數(shù)設(shè)置下,兩種算法多次預(yù)測(cè)結(jié)果平均值較佳.SVR 與ELM 算法的預(yù)測(cè)結(jié)果與測(cè)量值的比對(duì)如圖3 所示.
由圖3 可知,兩種算法對(duì)鐵水溫度的追蹤結(jié)果較好,部分樣本點(diǎn)預(yù)測(cè)值與測(cè)量值重合度較高。此外,對(duì)于與測(cè)量值有偏差的預(yù)測(cè)樣本點(diǎn),其對(duì)鐵水溫度增減變化趨勢(shì)的預(yù)判也較為理想。事實(shí)上,對(duì)鐵水溫度增加或減少的預(yù)知將有助于高爐操作者預(yù)判下一階段高爐爐缸熱狀態(tài)變化走勢(shì),從而可以提前采取應(yīng)對(duì)操作措施,維持高爐穩(wěn)定順行,促進(jìn)節(jié)能降耗.
圖4(a)和(b)分別為基于SVR 與ELM 兩種算法對(duì)鐵水溫度的預(yù)測(cè)值與測(cè)量值所構(gòu)成的散點(diǎn)圖??梢钥闯?,兩種模型的數(shù)據(jù)點(diǎn)均圍繞對(duì)角線方向延伸分布,且在對(duì)角線區(qū)域數(shù)據(jù)點(diǎn)分布較為緊密,預(yù)測(cè)值與測(cè)量值吻合度較高。此外,散點(diǎn)主要分布在對(duì)角線±10 ℃范圍內(nèi),說(shuō)明預(yù)測(cè)值的偏差多集中在±10 ℃以內(nèi)。圖4(c)為基于SVR 與ELM算法的鐵溫預(yù)測(cè)誤差概率密度分布函數(shù),經(jīng)對(duì)比后發(fā)現(xiàn),相比ELM 算法,SVR 算法預(yù)測(cè)誤差概率函數(shù)分布曲線的延伸范圍較小,曲線散點(diǎn)更加集中,說(shuō)明對(duì)測(cè)量值的追蹤效果較好.
圖 3 鐵水溫度測(cè)量值與預(yù)測(cè)值比對(duì)。(a)基于SVR 算法;(b)基于ELM 算法Fig.3 Comparison of measured and predictive values of hot metal temperature:(a)prediction value based on support vector regression (SVR);(b)prediction value based on extreme learning machine (ELM).
圖 4 鐵水溫度預(yù)測(cè)值與測(cè)量值偏差。(a)基于SVR 的鐵溫預(yù)測(cè)值與測(cè)量值偏差;(b)基于ELM 的鐵溫預(yù)測(cè)值與測(cè)量值偏差;(c)基于SVR 與ELM 預(yù)測(cè)鐵溫誤差概率密度分布函數(shù)Fig.4 Deviation of predictive value of hot metal temperature from the measured value:(a)based on SVR; (b)based on ELM; (c)the probability density distribution function of hot metal temperature error based on SVR and ELM
圖5 為SVR 和ELM 對(duì)鐵水溫度預(yù)測(cè)結(jié)果的百分比誤差散點(diǎn)分布與統(tǒng)計(jì)圖。在±0.5%范圍內(nèi)的點(diǎn)個(gè)數(shù)除上所有點(diǎn)的個(gè)數(shù),即為分布概率。經(jīng)統(tǒng)計(jì)計(jì)算,SVR 和ELM 的預(yù)測(cè)百分比誤差在±0.5%以內(nèi)的分布概率分別為81.0%和78.0%,在±1.0%以內(nèi)的分布概率分別為99.0%和98.3%,說(shuō)明百分比誤差主要集中在±0.5%,基本不超過(guò)±1.0%。對(duì)比兩種算法預(yù)測(cè)誤差散點(diǎn)分布圖,SVR 算法更好地控制了誤差偏離嚴(yán)重預(yù)測(cè)點(diǎn)的數(shù)量,因而百分比誤差點(diǎn)波動(dòng)較低.
圖 5 鐵水溫度預(yù)測(cè)的百分比誤差散點(diǎn)分布統(tǒng)計(jì)圖。(a)SVR;(b)ELMFig.5 Scatter distribution statistics of percentage error in hot metal temperature prediction:(a)SVR; (b)ELM
對(duì)SVR 和ELM 算法預(yù)測(cè)結(jié)果進(jìn)行綜合分析.算法預(yù)測(cè)準(zhǔn)確度一般應(yīng)從多方面予以定量化衡量與表征[25],本文選取平均絕對(duì)誤差(Mean absolute error,MAE)用以表征模型預(yù)測(cè)值與測(cè)量值之間整體偏差的絕對(duì)值;選取平均絕對(duì)百分比誤差(Mean absolute percentage error,MAPE)用以表征模型預(yù)測(cè)值與測(cè)量值之間整體偏差的相對(duì)值;選取均方根誤差(RMSE,Root mean square error)用以表征模型預(yù)測(cè)值相較測(cè)量基準(zhǔn)值的偏差波動(dòng);選取命中率(Hit rate,HR)用以表征在工藝可接受范圍內(nèi)的模型預(yù)測(cè)可信度,其計(jì)算方法分別如式(15)至(18)所示:
其中,n為測(cè)試集中樣本總數(shù)量,和yi分別為鐵水溫度預(yù)測(cè)值與測(cè)量值,c為命中率判定邊界值,本文選取c值為10 ℃,即以誤差(?10 ℃,10 ℃)范圍內(nèi)為基準(zhǔn)進(jìn)行命中率計(jì)算,計(jì)算結(jié)果如表3 所示。由此可知,無(wú)論是從偏差絕對(duì)值與相對(duì)值角度,亦或是從偏差波動(dòng)與命中率角度,SVR 與ELM算法均對(duì)鐵水日平均溫度實(shí)現(xiàn)了較好的預(yù)測(cè)。相較而言,SVR 算法對(duì)鐵水溫度的預(yù)測(cè)優(yōu)于ELM 算法,其平均絕對(duì)誤差、平均絕對(duì)百分比誤差、均方根誤差與±10 ℃以內(nèi)的命中率表現(xiàn)較佳.
表 3 SVR 與ELM 算法鐵水溫度預(yù)測(cè)結(jié)果綜合定量表征Table 3 Quantitative characterization of SVR and ELM model prediction results of hot metal temperature
(1)正相關(guān)影響鐵水溫度變化的特征參量主要為煤氣利用率、鐵水硅含量和利用系數(shù)等;負(fù)相關(guān)影響鐵水溫度變化的特征參量主要為爐腹煤氣指數(shù)、水溫差和焦丁比等。鐵水溫度受到高爐直接與間接還原度以及熱量平衡相關(guān)特征參量的影響較大.
(2)基于SVR 與ELM 算法構(gòu)建的模型均對(duì)鐵水溫度實(shí)現(xiàn)了較好的預(yù)測(cè)效果,前者在預(yù)測(cè)值與誤差值散點(diǎn)分布,平均絕對(duì)誤差和百分比誤差,以及誤差波動(dòng)方面表現(xiàn)較佳,對(duì)鐵水溫度±10 ℃范圍內(nèi)的預(yù)測(cè)命中率為94%.