劉進進,周 平,溫 亮
(東北大學流程工業(yè)綜合自動化國家重點實驗室,遼寧沈陽 110819)
鋼鐵是國民經(jīng)濟的重要支柱,高爐煉鐵是鋼鐵生產(chǎn)的重要環(huán)節(jié).典型的高爐煉鐵系統(tǒng)如圖1所示,可分為高爐本體、供料系統(tǒng)、煤粉噴吹系統(tǒng)、熱風系統(tǒng)、出鐵系統(tǒng)以及高爐煤氣處理系統(tǒng)等子系統(tǒng),其中高爐本體又由爐喉、爐身、爐腰、爐腹、爐缸等部分組成[1–3].在進行高爐煉鐵時,由上料系統(tǒng)提供的焦炭、熔劑及鐵礦石按照一定比例經(jīng)傳送皮帶從高爐頂部裝載到爐喉處,隨后,形成混合后的焦炭層和鐵礦石爐料層在爐身處交替填充進行布料操作;同時,在高爐的下部,熱風系統(tǒng)和煤粉噴吹系統(tǒng)組合作業(yè),將預熱的空氣、氧氣、和煤粉沿爐周的風口鼓入爐腹中,使其在高溫的作用下發(fā)生物理化學反應,生成大量的高溫還原性氣體;作為熱量載體和還原劑的高爐煤氣與不斷下降的爐料經(jīng)歷復雜的物理化學反應,使得鐵水從鐵礦石中還原出來,不斷向下滴落;上升的高爐煤氣經(jīng)過煤氣處理系統(tǒng)得以回收利用,而最終生成的液體生鐵和爐渣則從出鐵口排出[4–6].
圖1 高爐煉鐵過程示意圖Fig.1 Schematic diagram of blast furnace ironmaking process
為了實現(xiàn)高爐生產(chǎn)的優(yōu)質、高產(chǎn)、低耗和長壽運行的目標,需要對高爐內部狀態(tài)進行實時監(jiān)測和有效控制.然而高爐煉鐵過程是具有大時滯的非線性動態(tài)過程,爐內環(huán)境十分惡劣,反應核心區(qū)域溫度高達兩千多度,壓強高達4倍的標準大氣壓,且存在固–液、固–固、氣–液、氣–固的轉化以及固、液、氣多態(tài)共存的狀態(tài),使得對高爐內部狀態(tài)進行直接實時監(jiān)測存在困難,進而影響高爐的優(yōu)化控制[1–2].目前,鐵水質量參數(shù)可以間接反應高爐內部狀態(tài),因此被廣泛應用于高爐內部狀態(tài)的監(jiān)測和控制中,綜合性的鐵水質量指標通常采用鐵水溫度(molten iron temperature,MIT)、硅含量([Si])、磷含量([P])和硫含量([S])來衡量.
1)MIT是反應高爐煉鐵過程能量消耗和爐內熱狀態(tài)的主要參數(shù).若MIT過低,將導致高爐的順行受到影響,進而影響后續(xù)的轉爐煉鋼的運行性能,致使綜合冶煉成本上升.通常,高爐的出鐵溫度一般需要控制在1480?C~1530?C.
2)鐵水[Si]反映鐵水的化學熱,是鐵水質量參數(shù)中最為重要的的指標.若[Si]過高,不僅會導致生鐵的收縮率降低,引起鐵水噴濺,而且還會影響石灰渣化的速度,延長吹煉時間.生產(chǎn)經(jīng)驗表明,低硅冶煉可以有效改善鐵水質量,提高生產(chǎn)效率.
3)鐵水[P]和鐵水[S]是危害鐵水質量的主要因素.[P]含量過高,會增加氧氣和造渣材料的消耗,并且還會加重爐襯的蝕損;[S]含量過高,會增加生鐵的脆硬性,降低鐵水的流動性,從而影響鐵水品質.
采用以上4鐵水質量參數(shù)作為高爐運行狀態(tài)的評價指標,可以比較全面的了解高爐內部的運行狀態(tài),為高爐生產(chǎn)日常操作和調節(jié)提供指導.但是,由于高爐內部環(huán)境惡劣、外部環(huán)境存在較大干擾,且受現(xiàn)有檢測技術的限制,直接對高爐鐵水質量進行準確的在線檢測存在困難,且耗時耗力,通常的離線化驗需要1~2 h,存在較長的滯后.因此,建立準確可靠的鐵水質量模型來反映當前及預測的內部溫度和指標參數(shù)變化顯得尤為重要.
目前常見的鐵水質量模型有機理模型[5–6]、推理模型[7–8]以及數(shù)據(jù)驅動的智能模型[9–10].基于數(shù)據(jù)驅動的鐵水質量建模方法是一種黑箱建模方法,并不需要深入了解高爐內部復雜的機理變化,僅僅通過數(shù)學工具和智能算法通過對過程數(shù)據(jù)進行處理,便可建立所需鐵水質量模型,因而成為近年來高爐鐵水質量建模研究的熱點.現(xiàn)有數(shù)據(jù)驅動建模方法主要有多元統(tǒng)計分析方法[11–12]、神經(jīng)網(wǎng)絡(neural network,NN)建模方法[13–14]和支持向量回歸(support vector regression,SVR)建模方法[15]等.但這些鐵水質量預測模型大多只是對單一鐵水質量參數(shù)硅含量或鐵水溫度的建模[16–17],并不能全面地反映高爐內部復雜的狀態(tài),且部分模型并未考慮高爐系統(tǒng)的非線性與動態(tài)特性.另外,鐵水質量預測模型的建模速度和精度也是不容忽略的環(huán)節(jié).為此,本文從實際高爐煉鐵應用的角度出發(fā),將致力于建立一種考慮非線性和動態(tài)特性,并且模型結構簡單、速度較快、精度較高且易于工程實現(xiàn)的高爐煉鐵過程多元鐵水質量預測模型.從面向預測和軟測量的建模角度來看[18],建立多元鐵水質量指標預測模型需要解決如下幾個方面的問題:1)問題1:如何更有效的提升高爐建模數(shù)據(jù)質量和從眾多影響變量中選擇最有效的建模輸入變量;2)問題2:如何更好的擬合高爐煉鐵過程非線性動態(tài)特性和提高數(shù)據(jù)建模的精度.
針對以上問題,本文從高爐煉鐵實際應用的角度出發(fā),提出圖2所示的多元鐵水質量非線性建模策略.針對問題1:首先,對高爐本體原始數(shù)據(jù)進行時間粒度的統(tǒng)一、正常數(shù)據(jù)的篩選和數(shù)據(jù)的歸一化等數(shù)據(jù)預處理操作;其次,采用灰色關聯(lián)分析法提取與鐵水質量指標關聯(lián)度最強的關鍵過程變量作為建模輸入變量.針對問題2:首先,為了更好的反映高爐煉鐵系統(tǒng)的非線性動態(tài)特性,引入非線性自回歸模型(nonlinear autoregressive model,NARX);最重要的是為了提高數(shù)據(jù)建模的精度,提出一種基于Bagging 的均方根誤差概率加權集成隨機權神經(jīng)網(wǎng)絡(random vector functional-link networks,RVFLNs)算法,用于建立多元鐵水質量指標模型.
圖2 所提算法的建模策略圖Fig.2 Modeling strategy diagram of the proposed algorithm
本文所提的均方根誤差概率加權集成RVFLNs算法,其基本的思想是:1)為了提升集成學習的效率問題,采用具有快速建模速度的RVFLNs為子模型;2)為了解決傳統(tǒng)基于Bagging的集成模型把所有好的和差的模型都分配相同比重的問題,本文所提算法提出一種均方根誤差概率加權的思想進行子模型權重的分配.為此,本文使用核密度估計方法估計出子模型均方根誤差集的概率密度函數(shù)(probability distribution function,PDF),進一步求出每個子模型均方根誤差的概率分布情況,并把每個子模型的概率作為自身的權重,然后加權求和得到最終的均方根誤差概率加權集成RVFLNs模型.隨后,進行數(shù)值仿真驗證和工業(yè)建模試驗,并和其他幾類鐵水質量建模算法進行對比,結果表明,相對于對比算法,本文所提算法不僅具有很快的計算速度,而且具有更高的精度.
為了提高建模的數(shù)據(jù)質量,對高爐原始數(shù)據(jù)進行數(shù)據(jù)的預處理操作,具體過程如下:
步驟1時間粒度的統(tǒng)一.
由于各個過程變量是由不同采樣頻率的傳感器測量而來,那么采集的數(shù)據(jù)的時間粒度是不一致的,必須將高爐鐵水的出鐵時間與本體參數(shù)的時間點進行對應.為此,依據(jù)數(shù)據(jù)時間標注及最近鄰時間原則,進行人工匹配得到時間粒度一致的高爐煉鐵過程的相關數(shù)據(jù).
步驟2正常數(shù)據(jù)的篩選.
正常數(shù)據(jù)的篩選包括休風數(shù)據(jù)的剔除和采集異常值的剔除.由于每月需要對煉鐵設備進行計劃檢修,屬于可預見性的異常工況,檢修時會進行休風操作,無出鐵信息,無法作為建模數(shù)據(jù),因此需要篩選出該部分數(shù)據(jù)將其刪除.具體方式為:首先,依據(jù)交班記錄確定高爐計劃檢修時間段;然后,剔除此時間段的高爐本體休風數(shù)據(jù).
在高爐煉鐵過程高溫高壓、多場多相耦合的惡劣的環(huán)境下,采集的數(shù)據(jù)存在異常值.使用異常的數(shù)據(jù)進行訓練會增大模型的泛化誤差,降低模型的精度.為了保證數(shù)據(jù)的合理性和有效性,必須對數(shù)據(jù)進行異常值的處理.本文選用具有簡單的計算公式和可靠性能的3σ準則(拉依達準則)方法進行異常值的剔除,即數(shù)據(jù)偏差大于3σ的數(shù)據(jù)應該剔除.σ為上述篩選出的高爐本體數(shù)據(jù)的標準差,如式(1)所示:
步驟3數(shù)據(jù)歸一化.
為了有效的消除特征間的量綱不一致問題以及加速算法的收斂性能和一定程度上減小模型誤差,本文選用最小、最大歸一化,對高爐數(shù)據(jù)進行數(shù)據(jù)歸一化處理[3].轉化函數(shù)如下:
其中:xi,分別為第i個變量歸一化前、后的取值,max(xi),min(xi)分別為第i個變量的最大值、最小值.歸一化處理的到的數(shù)據(jù)xi∈(0,1).
為了從高爐眾多過程變量中選擇最有效的建模輸入變量,從而提高建模的效率,本文引入灰色關聯(lián)分析法.該方法通過對動態(tài)過程發(fā)展趨勢的量化分析,求出參考數(shù)列和比較數(shù)列之間的灰色關聯(lián)度,然后完成對系統(tǒng)內時間序列有關統(tǒng)計數(shù)據(jù)的幾何關系的比較[19].與參考數(shù)列關聯(lián)度越大的比較數(shù)列,則與參考數(shù)列同步變化的程度就越高,反之,則越低.具體實現(xiàn)過程如下:
步驟1確定分析數(shù)列.
反映系統(tǒng)行為特征的數(shù)據(jù)序列稱為參考數(shù)列,影響系統(tǒng)行為的因素組成的數(shù)據(jù)序列稱比較數(shù)列.設參考數(shù)列為式(3)中Z,比較數(shù)列為式(4)中Xi.對于高爐煉鐵多元鐵水質量建模系統(tǒng),[Si]含量、[P]含量、[S]含量、鐵水溫度分別作為系統(tǒng)的參考數(shù)列,比較數(shù)列為m個影響多元鐵水質量指標的關鍵過程變量.
步驟2變量的無量綱化.
為了消除高爐數(shù)據(jù)之間的量綱差異對灰色關聯(lián)度分析結果的影響,本文選用歸一化處理進行數(shù)據(jù)的無量綱化操作.
步驟3計算關聯(lián)系數(shù).
關聯(lián)系數(shù)是比較數(shù)列和參考數(shù)列在各個時刻的關聯(lián)程度,即高爐多元鐵水質量與m個過程變量的各個對應點的關聯(lián)程度.其數(shù)學表達式如式(5)所示:
在表達式(5)之中:|z(k)?xi(k)|被稱為絕對值之差,被稱為兩級最小絕對值之差,被稱為兩級最大絕對值之差,ρ∈(0,∞),稱為分辨系數(shù).當ρ0.5463時,分辨力最好,本文取ρ=0.5.
步驟4計算關聯(lián)度.
由于比較數(shù)列和參考數(shù)列曲線相應的點眾多,使得信息過于分散不便進行整體比較.為此,把各個時刻的關聯(lián)系數(shù)求平均,用于衡量比較數(shù)列和參考數(shù)列的相似程度,即關聯(lián)度.關聯(lián)度ri公式如下:
步驟5關聯(lián)度排序.
關聯(lián)度按大小排序,若r1>r2,則參考數(shù)列Z與比較數(shù)列X1幾何關系更相似.
1)集成策略子模型的選擇.眾所周知,基于Bagging思想的集成模型相比單個模型建模會有更好的穩(wěn)定性和更小的方差等優(yōu)越性能.但是由于它是多個子模型進行建模,必然會犧牲一定的建模時間.如何提高集成模型的效率,是不容忽視的問題.解決此類問題,可以從兩方面入手:第一,精簡子模型的個數(shù),即使用相對較少的子模型便可以達到集成模型該有的優(yōu)越性能;第二,選擇具有快速建模速度的子模型,從而挺高集成模型的效率.對于第1點,本文通過實驗確定了滿足精度要求的最小子模型個數(shù).對于第2點,本文采用具有快速建模能力的隨機權神經(jīng)網(wǎng)絡為子模型.
隨機權神經(jīng)網(wǎng)絡是由Pao和Takefuji于1992年提出的具有快速計算能力的人工神經(jīng)網(wǎng)絡[20–21].與傳統(tǒng)基于梯度學習并需要通過誤差反向傳播迭代尋優(yōu)的人工神經(jīng)網(wǎng)絡不同,RVFLNs算法是采用隨機給定輸入權值和偏置,以全局逼近理論為基礎,采用Moore-Penrose廣義逆矩陣方法一步求得輸出權重.因此,該算法具有訓練參數(shù)少、訓練速度快等優(yōu)點,其計算速度為傳統(tǒng)BP–NN的數(shù)千倍.這樣,為實際工業(yè)過程更快速的線軟測量和在線控制奠定了基礎[22].
給定M組集合(xi,yi),
則帶有L個隱層節(jié)點,以g(x)為激活函數(shù)的標準RVFLNs可以表示為
其中:OL,i(xi)為RVFLNs的輸出值;wj∈,j=1,…,L為連接輸入層與隱層的權值矩陣;βj為連接第j個隱含層節(jié)點與輸出層神經(jīng)元的輸出權重向量;bj為第j個隱含層節(jié)點的偏置;
矩陣形式為
式中:
一般,訓練樣本個數(shù)要多于隱含節(jié)點個數(shù),這樣,H并不是方陣.于是式(9)方程組無解.此時,就需要采用最小二乘方法求解式(9)中方程組,結果如下:
式(10)中H?是由Moore-Penrose方法計算得到的H偽逆矩陣.
2)子模型模型結構的確立.考慮到常規(guī)的靜態(tài)神經(jīng)網(wǎng)絡不能很好的反映高爐煉鐵系統(tǒng)的大滯后、強耦合及復雜非線性動態(tài)特性,不能很好的包含高爐煉鐵過程輸入輸出變量的時序及時滯關系,為了更好的反映高爐煉鐵系統(tǒng)的復雜非線性特征,本文引入非線性自回歸模型.假設多元鐵水質量參數(shù)指標與高爐主體參數(shù)變量之間符合如下非線性關系[4]:
式中:X為建模輸入變量集,Y為待估計的鐵水質量指標集,p和q分別為過程輸入輸出變量的時序系數(shù).本文采用我國柳鋼2號高爐的本體數(shù)據(jù)與鐵水質量數(shù)據(jù)(采樣間隔為1 h)對所提方法進行數(shù)據(jù)測試.且取時序系數(shù)p=1和q=1.即將前一采樣時刻的輸入測量值X(t?1)以及前一采樣時刻鐵水質量指標值Y(t?1)連同當前采樣時刻的輸入測量值X(t)作為動態(tài)模型的綜合輸入.即建立的動態(tài)軟測量模型用于實現(xiàn)的非線性動態(tài)映射關系為
3)所提算法的實現(xiàn).對于N個子模型的權重分配問題,傳統(tǒng)基于Bagging的集成模型一般把N分之一作為每個子模型的權重.這樣,雖然在一定程度上能夠提高系統(tǒng)的穩(wěn)定性,但是,只是簡單的把不好的欠擬合和過擬合的子模型以及真正好的子模型分配相同的比重,顯然是存在一定的問題,并不是最優(yōu)的權重分配方案.針對此點,本文提出一種均方根誤差概率加權的思想進行子模型的權重分配.首先,利用核密度估計方法估計出N子模型的均方根誤差集的概率密度函數(shù)曲線,然后,由得到的均方根誤差概率密度函數(shù)曲線求解出每個子模型的概率,最后把各個子模型的概率作為自身的權重分配給每個子模型,進而進行加權求和得到最終的均方根誤差概率加權集成RVFLNs模型[23].本文所提算法流程圖如圖3所示.
圖3 所提建模算法流程圖Fig.3 Flow chart of the proposed algorithm
由圖3中的均方根誤差概率密度曲線和均方根誤差曲線分布可以看出,對于欠擬合和過擬合的子模型,本文所提方法會降低其所占有的比重,而真正好的子模型則會給出相應大分量的權值.這樣,不僅可以提高集成模型的穩(wěn)定性,還會使得模型的精度更高.所提算法具體實現(xiàn)步驟如下:
步驟1子樣本集的產(chǎn)生.
進行基于Bootstrap思想的有放回抽樣實驗,對總體樣本進行m次有放回隨機采樣實驗,共進行N組,得到N個子樣本集,且子樣本集容量為m個.
步驟2子模型的選取.
為了提高集成模型的建模效率,一方面通過實驗驗證取得合適的子模型個數(shù),另一方面選取具有快速建模速度的RVFLNs作為子模型進行建模.
步驟3求取每個子模型的均方根誤差.計算每次子模型的RMSE公式如下:
其中:yji為第j個子模型中第i個輸出變量的實際值,為第j個子模型中第i個輸出變量的估計值,RMSEj為所求第j個子模型的均方根誤差.
步驟4核密度估計方法的計算.
核密度估計(kernel density estimation,KDE)方法由Parzen首次提出,它是求解給定隨機變量集合分布密度問題的非參數(shù)估計方法[24].其基本思想是假設xi∈,i=1,…,n為獨立同分布隨機變量,其所服從分布密度函數(shù)為f(x),x∈,則f(x)的核密度估計(x)定義為
本文選取高斯核函數(shù),其表達式如下:
窗寬hp的選擇對核函數(shù)的密度估計起著局部光滑的作用,如果hp過大會使模型誤差PDF形狀很光滑,使其主要部分的某些特征(如多峰性)被掩蓋起來,從而增加估計量的偏差;若hp過小,則整個密度函數(shù)表現(xiàn)粗糙,尤其是在密度估計的尾部會出現(xiàn)較大干擾時[26].于是,窗寬hp選擇設置為hp=1.06θ×其中θ由min{S,0.746Q}估計,S表示樣本標準差,Q為4分位數(shù)間距,K為RMSE樣本集個數(shù).
步驟5均方根誤差的概率計算.
利用核密度估計方法對于均方根誤差樣本集{RMSEi|i=1,2,…,K}進行PDF估計,得到均方根誤差概率密度函數(shù)ΓRMSE如式(16)所示,然后根據(jù)均方根誤差概率密度函數(shù)求解出每個子模型的均方根誤差概率.
步驟6所提算法模型的求解.
均方根誤差概率加權集成RVFLNs模型的求解如下:
其中:wi為在所提均方根概率加權思想下求得的權重,即由步驟5求得的每個子模型的概率作為自身的權重分配給每個子模型,且滿足的條件為所有權重之和為1.代表每個子模型,N代表子模型的個數(shù),而則為最終求得的均方根誤差概率加權集成RVFLNs模型.
為了驗證所提算法的有效性、優(yōu)越性和普適性,進行如下數(shù)值仿真驗證實驗.考慮如下4輸入4輸出非線性系統(tǒng):
式中:[t1,t2,t3,t4]為隨機產(chǎn)生的400組在[?1,1]范圍內的隨機數(shù),[e1,e2,e3,e4,e5,e6,e7,e8]為均值為0、方差為0.01的高斯噪聲序列.
針對數(shù)學表達式(18)所述的非線性系統(tǒng),選取輸入的樣本數(shù)據(jù)集為輸出的樣本數(shù)據(jù)集為=[y1y2y3y4],得到400輸入輸出數(shù)據(jù)集[].選取前300組作為訓練數(shù)據(jù)集,用來訓練均方根誤差概率加權集成RVFLNs模型,選取后100組作為測試集,用來驗證模型的預測擬合效果.按照第2.2節(jié)中本文所提算法的實現(xiàn)步驟1–6對式(18)中非線性系統(tǒng)進行建模.
其中:子模型的個數(shù)N為9,子樣本集的容量m為300.使用核密度估計方法估計出均方根誤差集的概率密度曲線如圖4 所示,由均方根誤差的概率密度曲線求解出表征每個子模型所占比重的均方根誤差概率曲線如圖5所示,所提建模算法的訓練效果如圖6所示.可以看出,本文所提算法得到的模型訓練值能夠很好的擬合式(18)非線性系統(tǒng)實際值的變化趨勢,且能保證較高的精度.
圖4 均方根誤差的概率密度函數(shù)曲線圖Fig.4 Probability density function curve of root mean square error
圖5 均方根誤差的概率分布曲線圖Fig.5 Probability distribution curve of root mean square error
圖6 所提方法建模效果圖Fig.6 Modeling effect diagram of the proposed method
為了驗證所提算法的有效性和優(yōu)越性,采用新的后100組測試集對模型進行測試.在設置同等條件下,分別對本文所提算法和RVFLNs算法進行對比實驗.圖7為兩種算法下的測試跟蹤曲線,從圖7可以看出,在兩種建模算法下,模型的預測值都能很好的跟蹤真實值的變化,有較高的精度.但是,所提算法能夠更好更精確的跟蹤真實值曲線變化.
圖7 不同建模方法下的預測效果對比圖Fig.7 Comparison of prediction effects under different modeling methods
為了進一步說明所提算法擁有更高的精度,繪制兩種算法下的建模誤差PDF曲線如圖8所示.從圖8的PDF曲線圖可以直觀的看出所提算法的PDF曲線更加窄且高,建模誤差以大概率集中在零均值附近.說明所提算法相比于RVFLNs算法擁有更好的跟蹤真實值的性能和更高的預測精度.
圖8 不同建模方法下的預測誤差PDF曲線圖Fig.8 Forecasting error PDF graph under different modeling methods
此外,表1列出了兩種算法所建模型的均方根誤差、命中率(%)兩方面的統(tǒng)計指標.其中命中率(hit rate,HR)求取如式(19)所示,其中e0為絕對預測誤差設定值.其中把y1~y4的絕對預測誤差分別設定為0.1,0.1,0.01,0.02.從表2中,可以看出,所提均方根誤差概率加權集成RVFLNs算法相對于RVFLNs建模方法,擁有更小的RMSE和更高的命中率,進一步驗證了所提算法的有效性和優(yōu)越性.
表1 不同建模算法相關統(tǒng)計指標比較Table 1 Comparison of statistical indicators related to different modeling algorithms
本文采用柳鋼2號高爐的實際生產(chǎn)數(shù)據(jù)進行工業(yè)實驗,建立多元鐵水質量指標模型.為了提高建模數(shù)據(jù)質量,對高爐原始數(shù)據(jù)進行數(shù)據(jù)的預處理,具體做法包括對高爐本體原始數(shù)據(jù)進行時間粒度的統(tǒng)一、正常數(shù)據(jù)的篩選和數(shù)據(jù)的歸一化等數(shù)據(jù)預處理操作.
針對高爐建模輸入變量的選取,本文根據(jù)柳鋼2號高爐煉鐵工藝過程及相關儀器儀表的設置,確定影響多元鐵水質量指標的19個關鍵過程變量為:冷風流量、送風比、熱風壓力、頂壓、壓差、頂壓風量比、透氣性、阻力系數(shù)、熱風溫度、富氧流量、富氧率、設定噴煤量、鼓風濕度、理論燃燒溫度、標準風速、實際風速、鼓風動能、爐腹煤氣量、爐腹煤氣指數(shù)[1,4].考慮到影響高爐鐵水質量的過程變量眾多,并且各變量對鐵水質量影響相差較大,若將其全部引入模型,一方面變量維數(shù)過高,導致模型訓練時間延長和實時性差;另一方面過多的變量將引入較多的干擾,影響建模精度.為此,引入灰色關聯(lián)分析法進行輸入變量的選取.首先,用影響多元鐵水質量指標的19個關鍵過程變量分別與作為輸出變量的[Si](%)、[P](%)、[S](%)、鐵水溫度MIT(?C)進行灰色關聯(lián)度分析并計算出各自的關聯(lián)度;然后,把這些關聯(lián)度進行求和得到表2所示結果.最后,確定與鐵水質量關聯(lián)度最大的關鍵過程變量阻力系數(shù)x1頂壓風量比x2、透氣性x3、壓差x4、鼓風動能x5、熱風壓力x6、實際風速x7為影響多元鐵水質量指標的主要因素,并將這7個過程變量作為鐵水質量模型的輸入變量.
表2 灰色關聯(lián)度分析結果Table 2 Gray correlation analysis results
將預處理得到的500組數(shù)據(jù)分為二個樣本集D1,D2,其中:D1為訓練樣本集,用來訓練并建立鐵水質量模型,取前400組數(shù)據(jù).D2為測試樣本集,用來測試鐵水質量模型,取剩下的后100組數(shù)據(jù)[3].按照第2.2節(jié)中本文所提算法的實現(xiàn)步驟1–6對鐵水質量指標進行建模.
其中,子樣本集的個數(shù)N為9,即子模型個數(shù)為9,子樣本集的容量m為400.圖9為核密度估計方法估計出的子模型的均方根誤差的概率密度函數(shù)曲線,圖10為每個子模型的均方根誤差的概率分布曲線,圖11為均方根誤差概率加權集成RVFLNs建模算法的訓練效果圖,可以看出,本文所提算法得到的鐵水質量指標模型的訓練值能夠很好的擬合實際值的變化趨勢,且能保證較高的精度.
圖9 均方根誤差的概率密度函數(shù)曲線圖Fig.9 Probability density function curve of root mean square error
圖10 均方根誤差的概率分布曲線圖Fig.10 Probability distribution curve of root mean square error
圖11 所提方法鐵水質量指標建模效果圖Fig.11 Shows the method of modeling the quality of molten iron quality
采用新的后100組工業(yè)數(shù)據(jù)對模型進行測試,為此將本文所提建模算法與常見RVFLNs算法、BP神經(jīng)網(wǎng)絡(back propagation neural network,BP–NN)算法、多輸出支持向量回歸機(multi-output support vector regression,MSVR)算法進行多方面對比,相關模型參數(shù)選取如下所示:
1)RVFLNs算法隱含層節(jié)點和輸出層節(jié)點的傳輸函數(shù)分別選取Sigmod函數(shù)和線性purelin函數(shù),隱含節(jié)點數(shù)選取為30.
2)為了不失一般性,對本文所提算法也設置和RVFLNs算法同樣的條件.即隱含層節(jié)點和輸出層節(jié)點的傳輸函數(shù)分別選取Sigmod函數(shù)和線性purelin函數(shù),隱含節(jié)點數(shù)選取為30.
3)同理,對BP–NN算法隱含層節(jié)點和輸出層節(jié)點的傳輸函數(shù)也分別選取Sigmod函數(shù)和線性purelin函數(shù),隱含節(jié)點數(shù)選取為30.
4)MSVR激活函數(shù)選為Sigmod函數(shù).另外有,MSVR中的懲罰因子C表示對誤差的容忍度,而核函數(shù)參數(shù)σ表示所選的支持向量的影響范圍.這里采用交叉驗證法將其分別確定為C=1和σ=0.01.
圖12為不同建模方法下的多元鐵水質量指標的預測效果圖.可以看出MSVR算法擬合值不能很好的跟蹤實際值的變化趨勢,模型的預測精度最差.而RVFLNs和BP–NN模型輸出的預測值基本能后跟蹤實際值的變化趨勢,但是模型的預測誤差較大,精度還有待提高.相對而言,本文所提算法下的多元鐵水質量模型的預測精度最高,其模型預測值能夠準確的跟蹤實際值的變化趨勢,模型預測效果最好.
為了進一步說明這一問題,并刻畫具有隨機特性的建模預測誤差更多的統(tǒng)計信息,引入概率密度函數(shù)對建模預測誤差的二維空間分布情況進行評價.圖13為不同建模方法下的預測誤差PDF曲線圖,從圖13顯示的信息,可以看出,相對于其他建模算法,本文所提算法的預測誤差PDF曲線更加高且窄,更加接近零均值高斯分布的白色噪聲.從而進一步驗證了本文所提算法的有效性和優(yōu)越性.
圖12 不同建模方法下的鐵水質量指標預測效果對比圖Fig.12 Comparison of prediction results of hot metal quality indicators under different modeling methods
圖13 不同建模方法下的預測誤差PDF曲線圖Fig.13 Prediction error PDF graph under different modeling methods
此外,本文實驗運行在64位Windows 7操作系統(tǒng),i7–3770,3.40 GHz的4核CPU,且內存為8 GB的電腦上,表3列出了不同算法所建模型的運行時間(s)、均方根誤差、命中率(%)3方面的統(tǒng)計指標.結合實際工程應用的指標精度,并把[Si]、[P]、[S]、MIT絕對預測誤差設定為0.1,0.006,0.003,5.從表3中,可得在運行時間上,所提算法僅比RVFLNs算法多出0.0074 s,但是要遠優(yōu)于MSVR算法和BP–NN算法,尤其是BP–NN算法,提高了近400倍的速度,可知所提算法有更高的建模效率.在RMSE和命中率上,本文所提算法相對于其他建模方法,擁有更小的RMSE和更高的命中率.綜合以上分析,本文所提算法能夠很好的預測多元鐵水質量指標的變化趨勢,擬合精度高、建模速度快、算法簡單且易于工程實現(xiàn)和工業(yè)應用.
表3 不同建模算法相關統(tǒng)計指標比較Table 3 Comparison of statistical indicators related to different modeling algorithms
本文結合高爐煉鐵的實際過程,旨在建立一種建??焖?、精度較高且易于工程實現(xiàn)的高爐多元鐵水質量指標預測模型,主要工作包括:1)為了提高建模數(shù)據(jù)的質量,對高爐實際數(shù)據(jù)進行預處理,從而得到高質量的高爐建模數(shù)據(jù);2)為了提高建模效率和降低計算復雜度,采取灰色關聯(lián)分析法,從影響多元鐵水質量指標的19個關鍵過程變量中提取與之關聯(lián)度最強的7過程變量作為建模輸入變量;3)為了更好的反映高爐煉鐵的非線性動態(tài)特性,引入NARX模型;4)為了提高建模的精度,提出一種均方根誤差概率加權集成RVFLNs算法,用于建立基于數(shù)據(jù)驅動的多元鐵水質量預測模型.數(shù)值仿真驗證、工業(yè)實驗及對比分析表明:所提算法具有更高的預測精度,能夠根據(jù)高爐煉鐵過程實時輸入數(shù)據(jù)的變化,實現(xiàn)對多元鐵水質量進行快速準確的預測.