(合肥工業(yè)大學 電氣與自動化工程學院,安徽 合肥 230009)
水泥工業(yè)是我國國民經(jīng)濟建設(shè)的重要基礎(chǔ)材料產(chǎn)業(yè),也是高能源消耗和高污染排放的行業(yè)之一[1],所以節(jié)能環(huán)保的生產(chǎn)方式尤為重要。預分解是新干法水泥生產(chǎn)技術(shù)的核心步驟[2],而分解爐出口溫度是反映分解爐運行工況優(yōu)劣的關(guān)鍵指標,對水泥生產(chǎn)的質(zhì)量、產(chǎn)量及能耗起著至關(guān)重要的作用,所以對分解爐出口溫度的研究具有重要意義[3]。近年來,許多學者圍繞分解爐溫度的預測和控制展開研究。文獻[4]提出基于遺傳算法優(yōu)化的BP網(wǎng)絡(luò)出口溫度預測模型,并進行了仿真驗證;文獻[5]在極限學習機與回歸分析的基礎(chǔ)上,建立了出口溫度的T-S模糊模型;文獻[6]和文獻[7]分別運用神經(jīng)網(wǎng)絡(luò)與自適應(yīng)PID的方法,實現(xiàn)了對分解爐溫度的控制;文獻[8]提出一種基于參數(shù)優(yōu)化的支持向量回歸的方法預測分解爐溫度,取得了預期的預測效果。但是上述研究在關(guān)于影響分解爐溫度的變量選擇上,大都是采用傳統(tǒng)的經(jīng)驗法,以風(三級風)、料(生料量)、煤(喂煤量)等主要變量對分解爐系統(tǒng)進行研究。由于分解爐內(nèi)部結(jié)構(gòu)復雜、變量眾多、理化反應(yīng)交織,人為經(jīng)驗法選取的少數(shù)變量難以全面概括分解爐系統(tǒng)的內(nèi)部規(guī)律,易造成預測精度不高,模型的泛化能力較弱等問題。而將多元統(tǒng)計分析方法與神經(jīng)網(wǎng)絡(luò)算法相結(jié)合的數(shù)據(jù)驅(qū)動建模方法,由于包含可能影響系統(tǒng)的全部變量,又具有神經(jīng)網(wǎng)絡(luò)強大的計算擬合能力,所以能夠更為科學準確地把握系統(tǒng)特性,因此更適用于多變量、非線性和不確定性的分解爐出口溫度建模預測。
本文提出基于動態(tài)主元分析(Dynamic Principal Component Analysis,DPCA)與極限學習機(Extreme Learning Machine,ELM)相結(jié)合的DPCA-ELM預測模型對分解爐出口溫度進行預測。利用DPCA消除變量之間的相關(guān)性,計算出各輸入變量在不同時序下對輸出的影響,降低數(shù)據(jù)的冗余和噪聲,減少ELM的輸入維度。然后將降維所得的主元作為極限學習機的輸入層,再通過PSO粒子群尋優(yōu)算法求得ELM網(wǎng)絡(luò)的最優(yōu)權(quán)值和偏置,再由方程組計算確定隱含層至輸出層的權(quán)值,經(jīng)訓練、調(diào)參,從而完成對出口溫度的建模預測。經(jīng)仿真驗證表明,基于DPCA-ELM的分解爐出口溫度預測模型具有良好的預測精度,同時也為其他復雜、非線性、多變量工業(yè)系統(tǒng)建模提供參考。
主元分析(PCA)的基本原理就是將多維的線性相關(guān)的原始數(shù)據(jù)Xn×m轉(zhuǎn)化為低維且線性無關(guān)的新數(shù)據(jù)Tn×k,其中k
(1)
X的標準化S又可以表示為得分矩陣和相關(guān)系數(shù)矩陣的外積形式:
S=Tn×mRm×m
(2)
式中,矩陣R=(r1,r2,…,rm)為S的相關(guān)系數(shù)矩陣;T=(t1,t2,…,tm)為S的得分矩陣。若‖t1‖>‖t2‖>…>‖tm‖,則t1即為第一主元,代表X在其對應(yīng)方向的投影最大。
取前k個主元,可得S=TkRk+E,式中E為殘差矩陣,主元Tn×k=(t1,t2,…,tk)即為降維后的新數(shù)據(jù)。
雖然傳統(tǒng)的PCA算法可以降低變量維度,減少數(shù)據(jù)冗余,但是對于有時序的系統(tǒng)模型,傳統(tǒng)的PCA會忽略某些變量對模型輸出的動態(tài)影響,從而影響模型的可靠性,而DPCA可以通過添加前h時刻的增廣矩陣彌補傳統(tǒng)PCA的靜態(tài)不足的問題。增廣矩陣為
(3)
式中,x為t時刻在訓練集中的m維觀測向量對于滯后因子h的確定,由遞推公式(4)遞推至rn(h)>0:
(4)
經(jīng)計算當h=2時,rn(h)>0,故確定滯后因子為2。
極限學習機算法是由新加坡學者黃廣斌等人在2004年提出的一種單隱含層前饋神經(jīng)網(wǎng)絡(luò)學習算法,具有預測精度高,訓練速度快等優(yōu)點。
對于單隱含層神經(jīng)網(wǎng)絡(luò),設(shè)有n組多變量輸入樣本Xi=[xi1,xi2,…,xin]T∈Rn,多變量輸出樣本Ti=[ti1,ti2,…,tim]T∈Rm。則網(wǎng)絡(luò)的輸出可以表示為
(5)
式中,j=1,2,…,n;L為隱含層節(jié)點數(shù);βi為輸出權(quán)值;f(x)為網(wǎng)絡(luò)的激活函數(shù);Wi=[wi,1,wi,2,…,wi,n]T為輸入層到隱含層權(quán)值;Xj為網(wǎng)絡(luò)輸入;bi為第i個隱含層節(jié)點的偏置。網(wǎng)絡(luò)學習的目的是實際輸出Oj與目標的誤差盡可能的逼近于0,可以表示為
(6)
等價于存在βi,Wi和bi,使得式(7)成立。
(7)
式(7)又可以等價表示為Hβ=T,其中,H是隱含層節(jié)點的輸出,β為輸出層的權(quán)值,T為網(wǎng)絡(luò)期望輸出。式中,β、T、H可以表示為[12]
(8)
(9)
(10)
式中,i=1,2,…,L,求解式(10)等價于求解損失函數(shù)的最小值:
(11)
(12)
水泥分解爐作為新干法水泥生產(chǎn)的核心部分,承擔了燃燒加熱、氣固換熱、物料反應(yīng)與分解等多個步驟。因此機理建模預測在水泥分解爐系統(tǒng)中的建立顯得尤為困難。故本文采用數(shù)據(jù)驅(qū)動建模的方法,建立了基于水泥生產(chǎn)過程中所采集的生產(chǎn)數(shù)據(jù)的DPCA-ELM分解爐出口溫度預測模型,并在Matlab環(huán)境下,完成仿真驗證。
本文數(shù)據(jù)來自2014年6月,某水泥公司6000 t/d水泥生產(chǎn)線的現(xiàn)場數(shù)據(jù),采集數(shù)據(jù)的時間間隔為1 min。從穩(wěn)定工況下選取400組作為訓練樣本,再選取100組測試樣本用來測試模型的有效性。水泥分解爐的系統(tǒng)結(jié)構(gòu)復雜,其內(nèi)部理化反應(yīng)眾多,故本文參考水泥生產(chǎn)實際過程和文獻確定與模型輸出相關(guān)的輸入變量,其中包括:生料量、喂煤量、三級風風溫和風壓、各級旋風筒出口溫度以及氣壓、高溫風機電流、轉(zhuǎn)速等。訓練樣本原始數(shù)據(jù)見表1。
表1 訓練集樣本原始數(shù)據(jù)
選取如上輸入變量中生料量、喂煤量等19個變量,經(jīng)計算滯后因子h=2,故添加前兩個時刻的數(shù)據(jù)構(gòu)成主元分析的增廣矩陣,再采用DPCA算法對輸入變量進行降維,以簡化ELM網(wǎng)絡(luò)輸入單元個數(shù)。
在進行主元分析前,首先要判斷各變量之間是否存在相關(guān)性,以檢驗主元分析的適用與否。所以本文采用KMO統(tǒng)計檢驗方法,KMO的值δ越接近1,數(shù)據(jù)越適宜采用主元分析。其檢驗公式如下:
(13)
式中,rij為所有變量的簡單相關(guān)系數(shù);aij為所有變量的偏相關(guān)系數(shù)。經(jīng)檢驗計算,篩選后變量的KMO值δ=0.9518,故篩選后的變量非常適宜使用主元分析進行降維。
將篩選后的數(shù)據(jù)標準化,消除因量綱不同所產(chǎn)生的不利影響。再求出相關(guān)系數(shù)陣的特征值λ1,λ2,…,λi,…,λ57,及其對應(yīng)的特征向量p1,p2,…,pi,…,p57,并將特征向量按其對應(yīng)特征值由大到小排列。計算特征值累積貢獻率(Cumulative Percent Variance,CPV)其公式為
(14)
式中,分母為所有特征值的累加值;分子為主元的累加值。設(shè)定CPV的期望值為85%,經(jīng)計算得k為18時,CPV的值達到85.8077%,故取主元個數(shù)為18,其特征值及主元貢獻率見表2。
表2 特征值及主元貢獻率
最后由原始數(shù)據(jù)X和主元的特征向量的乘積求得降維后的主元Tn×k=(t1,t2,…,ti,…,t43),式中,ti=Xpi。
將主元作為極限學習機網(wǎng)絡(luò)的輸入層,即網(wǎng)絡(luò)有18個輸入節(jié)點。選取激活函數(shù)為sigmoid函數(shù),其表達式為
(15)
選取性能函數(shù)為均方誤差MSE(Mean Squared Error)與擬合優(yōu)度R2(R-square),其表達式為
(16)
(17)
在ELM中,輸入權(quán)值與隱含層偏置隨機產(chǎn)生,無需迭代,輸出權(quán)值由式(12)確定。但由此產(chǎn)生的參數(shù)隨機性較大,且所需隱含層節(jié)點數(shù)過多,易導致模型復雜度加大,泛化能力下降。故本文采用粒子群尋優(yōu)算法(PSO)代替ELM權(quán)值偏置隨機產(chǎn)生。
PSO優(yōu)化算法的參數(shù)設(shè)置參考文獻[14]所述,并驗證其在本模型的可行性。其具體設(shè)置為:粒子數(shù)30;最大和最小慣性權(quán)重分別為0.9和0.4;學習因子c1,c2同為1.4961;最大迭代次數(shù)為80次;激活函數(shù)為sigmoid函數(shù);適應(yīng)度函數(shù)為MSE。
PSO算法適應(yīng)度隨迭代次數(shù)變化曲線如圖1所示,當?shù)螖?shù)在70次左右時,適應(yīng)度值穩(wěn)定在0.0373不再變化,訓練收斂,權(quán)值和偏置尋優(yōu)過程結(jié)束。
圖1 適應(yīng)度隨迭代次數(shù)變化曲線
對于ELM隱含層節(jié)點個數(shù)的確定,參考文獻[15],設(shè)定初始隱含層節(jié)點數(shù)為20,再以5為增幅進行訓練預測,每個節(jié)點重復預測20次,并對所得性能指標取平均值。不同隱含層節(jié)點個數(shù)預測的平均性能指標如表3所示。
表3 不同隱含層節(jié)點個數(shù)性能指標
由表3看出,隨著隱含層節(jié)點個數(shù)的增加,訓練樣本預測效果越好,測試樣本預測效果在節(jié)點數(shù)為80時預測效果最佳,當隱含層節(jié)點個數(shù)由80繼續(xù)增加時,測試樣本預測效果變差。其性能函數(shù)隨節(jié)點數(shù)變化趨勢如圖2所示。
圖2 預測效果隨節(jié)點個數(shù)變化趨勢
由圖2可以看出,在節(jié)點個數(shù)為80時,測試集MSE最小,擬合優(yōu)度R2最大,對測試樣本數(shù)據(jù)的預測結(jié)果最佳。故確定隱含層節(jié)點數(shù)為80時,模型預測與泛化能力最佳,其訓練時間為50.8255 s。出口溫度預測模型如圖3所示。
圖3 DPCA-ELM預測模型
其中,Zi為時滯h為2的原始變量,Xi為動態(tài)主元分析降維所得的18個主元,即ELM的輸入層,W為輸入層權(quán)值,bi為第i個隱含層節(jié)點的偏置,βi為第i個隱含層節(jié)點的輸出權(quán)值,y為輸出的預測出口溫度。
將選取的100組測試集樣本變量數(shù)據(jù)導入DPCA-ELM預測模型,100組測試集樣本如表4所示。
表4 測試集樣本原始數(shù)據(jù)
經(jīng)DPCA-ELM模型預測后,得到測試集預測輸出。100組出口溫度預測結(jié)果與實際數(shù)據(jù)對比及誤差如表5所示。由表5可以看出測試集預測效果良好且穩(wěn)定。
經(jīng)計算,DPCA-ELM模型預測的最大誤差約為5.1294 ℃,平均預測誤差約為1.2013 ℃,相對誤差平均值約為0.1285%。
表5 測試樣本預測結(jié)果與誤差
為了進一步驗證DPCA-ELM模型的有效性與優(yōu)勢,將其與文獻[4]所提出的GA-BP模型的預測效果進行對比。
設(shè)置遺傳算法參數(shù):進化代數(shù):100;種群規(guī)模:50;交叉概率:0.7;變異概率:0.1。
重復試驗觀察后,設(shè)置BP神經(jīng)網(wǎng)絡(luò)的隱含層數(shù)為45;激活函數(shù)設(shè)置為動量梯度下降法(Gradient Descent with Momentum)函數(shù)traingdm;迭代次數(shù)為200;學習步長為0.01;性能函數(shù)為MSE;目標值為0.001。
GA-BP模型的訓練時間為21.7242 s。經(jīng)訓練后,建立了遺傳算法優(yōu)化的BP網(wǎng)絡(luò)的出口溫度預測模型,將測試樣本數(shù)據(jù)導入模型,得到測試樣本預測輸出。DPCA-ELM模型和GA-BP模型預測結(jié)果與測試樣本實際對比如圖4所示。
由圖4可以看出,基于DPCA-ELM模型的出口溫度預測效果良好,GA-BP模型預測效果稍差。其預測結(jié)果與誤差對比如表6所示。
由表6可以得出:基于DPCA-ELM的出口溫度預測模型具有精度高、擬合度好、訓練速度快等優(yōu)勢?;贕A-BP網(wǎng)絡(luò)的預測模型,由于輸入維度高,遺傳算法編碼復雜,所需迭代參數(shù)較多,故訓練速度較慢,泛化能力較弱,影響對出口溫度預測的精度。
圖4 測試樣本預測效果對比
模型MSER2EmaxEmeanGA-BP10.57910.63257.08122.8773DPCA-ELM2.36750.91315.12941.2013
本文提出了一種數(shù)據(jù)驅(qū)動建模方法:首先進行KMO統(tǒng)計檢驗,驗證PCA的適用性,然后計算出滯后因子,使用DPCA降低影響分解爐出口溫度變量的維度,消除變量之間的相關(guān)性。在此基礎(chǔ)上,構(gòu)建以低維數(shù)據(jù)為輸入層的ELM預測模型,再使用PSO算法優(yōu)化參數(shù),通過訓練、調(diào)參,最終求得最優(yōu)DPCA-ELM出口溫度預測模型,并使用該模型對測試樣本進行預測。最后通過與GA-BP神經(jīng)網(wǎng)絡(luò)預測模型的對比分析,體現(xiàn)DPCA-ELM預測模型良好的預測精度和泛化能力。