曹宇軒 劉惠康 江典蔚
(武漢科技大學教育部冶金自動化與檢測技術(shù)工程研究中心 武漢 430081)
LF(ladle furnace)精煉爐是煉鋼生產(chǎn)的主要工序,作為煉鋼過程的重要一環(huán),位于轉(zhuǎn)爐和連鑄之間,具有承上啟下調(diào)節(jié)生產(chǎn)節(jié)奏的作用[1]。生產(chǎn)中鋼水溫度控制、合金加入、底吹氬氣的控制精度和準確性,直接影響鋼水的質(zhì)量和工序的順序進行。傳統(tǒng)煉鋼中主要是操作工依據(jù)經(jīng)驗來預測鋼水溫度,只能通過多次測溫來判斷是否需要電機升溫或者加廢鋼降溫,該預估方法不可靠且多次測溫效率不高,可能會帶來很大誤差,直接影響吹氬壓力大小和加合金時間,致使鋼成分不達標,嚴重情況下可能會由于溫度過低導致鋼水報廢,造成極大的經(jīng)濟損失[2]。
因此建立精確的LF爐溫度控制模型具有很強的實際意義。從國內(nèi)外溫度模型的研究實例可以看出,常用的建模方法分為3類,分別是經(jīng)驗建模、機理建模和數(shù)據(jù)建模[3,4]。經(jīng)驗建模是操作工經(jīng)長期的現(xiàn)場冶煉過程和經(jīng)驗總結(jié)的經(jīng)驗公式,它忽略了一些內(nèi)在和外在的因素,因此經(jīng)驗公式準確性勢必受到影響。機理建模主要考慮精煉過程中物理反應和化學反應發(fā)生的熱量變化、鋼包散熱、冶煉過程中的吹氬攪拌和耗電量,運用公理或定理及數(shù)學方法進行推導得出數(shù)學模型,但精煉環(huán)節(jié)過多的物理化學反應導致推導過程復雜,勢必影響到建模的準確性[5]。數(shù)據(jù)建模是從生產(chǎn)數(shù)據(jù)中找出冶煉過程中影響鋼水溫度的各種工藝參數(shù)及其之間的必然聯(lián)系,在人工智能快速發(fā)展的今天,數(shù)據(jù)建模相對于經(jīng)驗建模和機理建模來說具有明顯的優(yōu)勢,運用最多的是使用BP神經(jīng)網(wǎng)絡(luò)來預測鋼水終點溫度,但傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的構(gòu)建嚴重依賴于人的經(jīng)驗和專業(yè)知識,缺乏明確的理論指導,因此如何構(gòu)建出精確、高效、泛化能力強的溫度預報模型具有很強的現(xiàn)實意義[6]。
本文參考經(jīng)驗建模和機理建模確定了影響鋼水終點溫度的主要參數(shù),采用鄰近爐次法和最大似然法對數(shù)據(jù)進行篩選建立準確的樣本數(shù)據(jù)庫,并引入蒙特卡洛算法生成神經(jīng)網(wǎng)絡(luò)架構(gòu),省去了確定神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)時需要由人工實驗的方法來不斷嘗試的復雜過程。最后再用遺傳算法對生成的BP神經(jīng)網(wǎng)絡(luò)進行優(yōu)化。通過仿真分析,該預報模型精確度較高,對于實現(xiàn)LF爐“一鍵精煉”具有較大意義。
準確制鋼液溫度是LF精煉過程的主要任務(wù)。溫度預報模型主要根據(jù)鋼液進站溫度、目標精煉溫度及時間、吹氬流量、加入的合金、渣料的加入量及各種熱損失,根據(jù)能量守恒原理計算不同處理階段需要投入的電能,并預測鋼液溫度,最終達到控制鋼液溫度的目的[7]。
傳統(tǒng)煉鋼中經(jīng)驗建模主要是操作工依據(jù)工作經(jīng)驗總結(jié)的經(jīng)驗公式來預測鋼水溫度,如下為某鋼廠第二煉鋼分廠經(jīng)驗公式。
T=T0-▽T
(1)
▽T=▽T1+▽T2-▽T3+▽T4-▽T5
(2)
其中,T0為初始值,▽T為過程溫降量,▽T1為與時間有關(guān)的溫降量,▽T2為加入合金造成的溫降量,▽T3為脫氧產(chǎn)生的升溫,▽T4為其他因素(罐況等)造成的溫降,▽T5為電極加熱產(chǎn)生的升溫。
在機理建模中,首先要求清楚整個系統(tǒng)單位時間內(nèi)的熱量吸收和流失情況,并清楚電極加熱的升溫效率及所有會導致鋼水溫度變化的因素,最終根據(jù)能量守恒定律來計算任意時刻的鋼水溫度。LF爐精煉過程中輸入的能量主要是電極加熱產(chǎn)生的熱量及少量合金的溶解熱和化學反應熱[8]。進入熔池的熱量又分為如下幾個去向。
第1部分是用于鋼液的升溫及精煉過程中添加的合金及渣料的升溫熔化。
第2部分為通過包襯損失的熱量,其中又包括2部分,分別為使包襯溫度升高的包襯耐火材料蓄熱及鋼殼與周圍大氣之間的熱交換。
第3部分是通過渣層損失的熱量,其中包括由渣面的輻射和對流傳熱導致的熱損失以及由熔池的高溫氣體通過渣面帶走的熱量。
由以上分析可知影響鋼水溫度的主要因素有:
(1) 鋼水初始溫度。一般將實際測量的溫度作為初始溫度。
(2) 鋼水重量。每爐鋼包中鋼水的重量存在差異,將會對LF爐的溫度產(chǎn)生一定的影響。
(3) 鋼包處理時間。指鋼包到達工作站點到鋼包離開工作站點之間的處理時間。
(4) 鋼水氧含量。在傳統(tǒng)機理建模中往往只考慮合金加入時對鋼水降溫的影響,而忽略氧化反應放出的熱量對鋼水升溫的影響。在某些特殊鋼種的冶煉中,鋼水加入合金時有部分脫氧合金(AL或硅錳合金)與鋼水中的氧反應會產(chǎn)生大量的熱,為保證模型精度和適用性要求,此部分不可忽略。
(5) 渣厚。渣層可以防止鋼液溫度的散發(fā),由于渣的導熱系數(shù)相對較小,使渣層起到隔熱保溫作用,可有效減少鋼水熱損失。
(6) 罐況。新鋼包和舊鋼包對LF爐的溫度也有不同程度的影響,鋼包的使用次數(shù)也稱包齡,在此溫度模型中根據(jù)每個鋼包的包齡和保溫效果將其從好到壞依次分為A、B、C、D 4類。
(7) 電極加熱。LF爐是通過三相石墨電極進行加熱的,電極的加熱是爐內(nèi)熱量的主要來源。
(8) 吹氬量。氬氣的攪拌可以均勻爐內(nèi)鋼水溫度,使鋼水和加入的合金進行充分的化學反應,同時將鋼液中的雜質(zhì)送入渣層進行化學反應,達到成分微調(diào)的目的。但是該過程也帶走一部分熱量,尤其是強吹氬時,對LF爐的溫度影響較大。
(9) 加入合金量。對鋼水進行成分微調(diào)或者脫氧時加入的合金與鋼水反應、溶解也會對鋼水溫度產(chǎn)生一定影響。
(10) 渣料加入量。當鋼水溫度過高時會加入廢鋼進行調(diào)溫。
神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)搜索(neural architecture search, NAS)是自動機器學習(automated machine learning, AutoML)中的熱點問題之一。通過設(shè)計經(jīng)濟高效的搜索方法,自動獲得泛化能力強、硬件友好的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),可以大量節(jié)省人工。
圖1展示了基于人工的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計和NAS的對比。完全基于人工的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計一般包括以下關(guān)鍵流程。
(1)由已知的神經(jīng)變換(operations)如卷積(convolution)池化(pooling)等設(shè)計一些拓撲結(jié)構(gòu);
(2)在所給定訓練集上訓練這些網(wǎng)絡(luò)至收斂;
(3)在測試集上測試這些網(wǎng)絡(luò)收斂結(jié)果;
(4)根據(jù)測試準確率選擇網(wǎng)絡(luò)結(jié)構(gòu);
(5)人工優(yōu)化拓撲結(jié)構(gòu)設(shè)計并回到步驟(1)。
其中,步驟(5)需要消耗大量的人力和時間,而且在探索網(wǎng)絡(luò)結(jié)構(gòu)時更多的來自于經(jīng)驗,缺乏明確的理論指導。將該步驟自動化,轉(zhuǎn)交給計算機完成是NAS的核心目的。
圖1 人工的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計和NAS對比
蒙特卡羅方法(Monte Carlo method),也稱統(tǒng)計模擬方法,是20世紀40年代中期隨著科學技術(shù)的發(fā)展和電子計算機的發(fā)明,而被提出的一種以概率統(tǒng)計理論為指導的一類重要的數(shù)值計算方法,使用隨機數(shù)(或更常見的偽隨機數(shù))來解決很多計算問題的方法。蒙特卡羅方法的解題過程可以歸結(jié)為3個主要步驟,構(gòu)造或描述概率過程、實現(xiàn)從已知概率分布抽樣及建立各種估計量。
計算機技術(shù)的發(fā)展使得蒙特卡羅方法在最近10年得到快速的普及?,F(xiàn)代的蒙特卡羅方法,已經(jīng)不必親自動手做實驗,而是借助計算機的高速運轉(zhuǎn)能力,使得原本費時費力的實驗過程變成了快速和輕而易舉的事情。從理論上來說,蒙特卡羅方法需要大量的實驗。實驗次數(shù)越多,所得到的結(jié)果越精確。本文將以蒙特卡洛方法來實現(xiàn)BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計,省去了BP神經(jīng)網(wǎng)絡(luò)設(shè)計中由人工實驗不斷嘗試來確定網(wǎng)絡(luò)結(jié)構(gòu)的復雜過程。
BP(back propagation)神經(jīng)網(wǎng)絡(luò)是一種在誤差反向傳播算法的指導下進行訓練的多層前饋網(wǎng)絡(luò),經(jīng)過多年的發(fā)展已經(jīng)成為目前應用最廣泛的神經(jīng)網(wǎng)絡(luò)模型。BP網(wǎng)絡(luò)可以在事前未揭示輸入輸出之間映射關(guān)系的條件下,通過訓練數(shù)據(jù)的學習,逼近可以描述問題中輸入輸出關(guān)系的數(shù)學方程[9]。網(wǎng)絡(luò)以最速下降法作為學習規(guī)則,網(wǎng)絡(luò)的輸出誤差沿著網(wǎng)絡(luò)逐層反向傳播,每層神經(jīng)元根據(jù)誤差關(guān)系不斷調(diào)整連接權(quán)值和閾值,以不斷降低網(wǎng)絡(luò)輸出誤差為目標,最終達到誤差平方和的最小值。BP神經(jīng)網(wǎng)絡(luò)模型拓撲結(jié)構(gòu)包括輸入層(input layer)、隱含層(hidden layer)和輸出層(output layer)。
遺傳算法是模擬種群在自然界中的遺傳和進化過程而建立起來的一種高度并行的全局性概率搜索算法,體現(xiàn)著―優(yōu)勝劣汰、適者生存的自然界法則[10]。遺傳算法運行效率高,可以并行處理問題而且是從全局出發(fā)進行搜索,能在搜索中主動學習和積累其空間的知識,不斷縮小搜索范圍以最終達到最優(yōu)解[11,12]。
遺傳算法主要由編解碼規(guī)則、遺傳算子和適應度函數(shù)等幾個部分組成。其中,遺傳算子包含選擇算子、交叉算子和變異算子。
通過對印度比萊鋼鐵廠LF爐現(xiàn)場工藝分析結(jié)合經(jīng)驗建模和機理建模,得出影響溫度變化的主要因素有鋼包初始溫度、鋼水重量、鋼包處理時間、鋼水氧含量、渣厚、罐況、電耗、冶煉過程中的吹氬量、加入合金量和廢鋼加入量10個輸入量。
神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)搜索一般包括3步。首先定義搜索空間;然后通過搜索策略找出候選網(wǎng)絡(luò)結(jié)構(gòu),對它們進行評估;根據(jù)反饋進行下一輪的搜索[13]。
(1) 定義搜索樣本空間
為了縮小樣本空間,本文對網(wǎng)絡(luò)結(jié)構(gòu)做如下規(guī)定:
1)網(wǎng)絡(luò)輸入層輸出層神經(jīng)元個數(shù):與輸入輸出數(shù)據(jù)參數(shù)個數(shù)對應,分別取10和1。
隱藏層層數(shù)及神經(jīng)元個數(shù):理論上一個3層的BP神經(jīng)網(wǎng)絡(luò)可以完成任意n到m維的映射。因此本文為縮小樣本空間隱藏層層數(shù)設(shè)定為1。隱藏層神經(jīng)元個數(shù)在1至50之間隨機取值。
2)激活函數(shù)選擇:在logsig、tansig、relu、purelin、hardlim函數(shù)中選擇。
3)訓練函數(shù)選擇:在traimlm、trainbr、trainrp、trainscg中選擇。
(2) 確定搜索策略
本文搜索策略采用蒙特卡洛方法進行模擬隨機搜索。通過多次實驗發(fā)現(xiàn)通過對搜索策略做如下定義可提高搜索效率:每次隨機生成3個網(wǎng)絡(luò)結(jié)構(gòu)并記錄最好的網(wǎng)絡(luò)結(jié)構(gòu),剩下的2個網(wǎng)絡(luò)結(jié)構(gòu)中1個在保持當前最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)的隱藏層神經(jīng)元個數(shù)不變的情況下,對各層網(wǎng)絡(luò)的激活函數(shù)和訓練函數(shù)隨機生成,另一個在保證與當前最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)中激活函數(shù)和訓練函數(shù)相同的情況下對于隱藏層神經(jīng)元個數(shù)隨機生成。
(3) 網(wǎng)絡(luò)結(jié)構(gòu)評估
本文中神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)隨機搜索以實際輸出與期望輸出之間的均方根誤差值(RMSE)為評估函數(shù),如式(3)所示。
(3)
(1) 輸入變量編碼和種群初始化
本文采用遺傳算法進行BP網(wǎng)絡(luò)權(quán)值和閾值的優(yōu)化過程中,對初始種群采取實數(shù)編碼,每個個體由一組實數(shù)串組成。當通過蒙特卡洛方法確定BP網(wǎng)絡(luò)結(jié)構(gòu)后,個體編碼長度也隨權(quán)值和閾值個數(shù)確定。本文將種群大小初始化為20,最大進化代數(shù)設(shè)置為100,遺傳算法以這20個個體作為初始點進行迭代。
(2) 適應度函數(shù)計算
BP神經(jīng)網(wǎng)絡(luò)的誤差絕對值越小越好,而遺傳算法中,適應度值越大越好,因此本文選取測試集數(shù)據(jù)誤差平方和的倒數(shù)作為適應度函數(shù),以便使遺傳算法朝向適應度函數(shù)增大的方向進化。
(3) 選擇交叉變異
選擇交叉變異是遺傳算法的核心[14]。本文選擇操作采用輪盤賭法,首先產(chǎn)生0與1之間的隨機數(shù)確定種群中個體被選中次數(shù),然后根據(jù)上述適應度函數(shù)計算,選擇適應度大的進入下一代種群。在權(quán)值和閾值優(yōu)化過程中,交叉操作采用交叉算子,利用一對個體根據(jù)給定的概率重組產(chǎn)生新的種群后代。算法流程如圖2所示。
本文實驗數(shù)據(jù)以印度比萊鋼鐵廠某一鋼種的400組冶煉數(shù)據(jù)為原始樣本,通過最大似然法剔除當中有明顯誤差的不合理數(shù)據(jù),采用鄰近爐次法去除時間太久的不具有參考價值的歷史數(shù)據(jù)。經(jīng)過挑選之后剩下360組數(shù)據(jù)建立新的數(shù)據(jù)庫進行仿真分析,其中240組數(shù)據(jù)用作訓練集進行訓練,120組用作驗證集進行驗證,結(jié)果發(fā)現(xiàn),NAS-GA-BP溫度模型預測LF終點溫度的預測數(shù)據(jù)與實際數(shù)據(jù)的預報誤差在±5 ℃的命中率達到90.52%,在±10 ℃以內(nèi)的命中率達到了96.93%。通過對比孫小強[8]采用BP神經(jīng)網(wǎng)絡(luò)與修正方法相結(jié)合的方法預報誤差處于±10 ℃以下的數(shù)據(jù)為85%,±15 ℃以內(nèi)的數(shù)據(jù)為90%;李強等人[14]采用人工神經(jīng)網(wǎng)絡(luò)和專家系統(tǒng)相結(jié)合建立的LF溫度預報模型,預報誤差在±5 ℃的命中率為85%;李軍等人[7]采用遺傳算法(GA)和粒子群算法(PSO)混合優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值建立的GA-PSO-BP溫度預報模型的預報誤差在±5 ℃的誤差為88%,可知該模型比傳統(tǒng)的幾種算法具有更高的預測精度和學習能力,其部分仿真預測數(shù)據(jù)與實際數(shù)據(jù)對比如圖3所示,可知此溫度預報模型可以滿足大部分鋼種甚至某些特殊鋼種的實際生產(chǎn)需要。
圖2 算法流程圖
本文通過對傳統(tǒng)的經(jīng)驗建模和機理建模的研究發(fā)現(xiàn),鋼水脫氧時的升溫對鋼水溫度的影響較大,在考慮特殊鋼水加合金進行調(diào)成份和脫氧的工藝條件下,加入鋼水氧含量這一關(guān)鍵輸入?yún)?shù)增加了該模型的適用性和精確性。
圖3 預測數(shù)據(jù)與實際數(shù)據(jù)對比圖
針對神經(jīng)網(wǎng)絡(luò)方法對結(jié)構(gòu)設(shè)計要求很高,比較依賴結(jié)構(gòu)和設(shè)計使用者的經(jīng)驗的問題,本文提出了一種基于蒙特卡羅方法實現(xiàn)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)自生成的基礎(chǔ)上使用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)權(quán)值和閾值的LF溫度預報模型。該模型的應用節(jié)省了人力,具有更好的泛化能力。
表1 實驗數(shù)據(jù)(20組)
用最大似然法和鄰近爐次法對原始數(shù)據(jù)進行挑選之后,通過對BP網(wǎng)絡(luò)、GA-BP網(wǎng)絡(luò)和NAS-GA-BP網(wǎng)絡(luò)預測LF終點溫度的比較發(fā)現(xiàn),該模型相比于傳統(tǒng)的幾種算法要好,本模型的預報誤差在±5 ℃的命中率達到90.52%,在±10 ℃以內(nèi)的命中率達到了96.93%,具有較高的預測精度,能夠滿足LF爐爐外精煉生產(chǎn)需要。