齊愛玲, 王雨, 馬宏偉
(1.西安科技大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,陜西 西安 710054;2.西安科技大學(xué) 機(jī)械工程學(xué)院,陜西 西安 710054)
無人化智能開采是煤礦智能化建設(shè)的中心目標(biāo)[1]。當(dāng)前煤礦智能化建設(shè)過程中,綜采工作面的智能化水平制約著煤礦智能化向更高水平發(fā)展[2]。作為綜采工作面的核心設(shè)備之一,采煤機(jī)的截割精度直接關(guān)系到采煤的質(zhì)量和效率。隨著開采工作向著少人化、無人化的目標(biāo)邁進(jìn),采煤機(jī)滾筒自動(dòng)調(diào)高技術(shù)成為亟需攻克的技術(shù)難題。采煤機(jī)滾筒自動(dòng)調(diào)高是指根據(jù)截割作業(yè)中工作面工況的變化自動(dòng)對(duì)截割滾筒高度進(jìn)行調(diào)整,以避免截割頂?shù)装鍘r石。
截割軌跡與煤巖邊界線的擬合程度對(duì)于截割精度具有關(guān)鍵性影響[3],因此煤巖界面的精準(zhǔn)識(shí)別可作為采煤機(jī)滾筒自動(dòng)調(diào)高的依據(jù)。針對(duì)煤巖界面識(shí)別問題,學(xué)者們提出了基于反射光譜[4]、紅外成像[5]等的直接識(shí)別方法,但由于井下環(huán)境復(fù)雜惡劣,這些方法無法實(shí)現(xiàn)常態(tài)化精準(zhǔn)應(yīng)用[6-8]。為解決這些問題,間接感知煤巖界面的記憶截割技術(shù)被提出。傳統(tǒng)的記憶截割技術(shù)將重復(fù)再現(xiàn)目標(biāo)軌跡作為控制目標(biāo),不考慮軌跡本身的合理程度,雖然提高了采煤機(jī)的自動(dòng)化程度,但是對(duì)于頂板起伏差異較大的煤層,仍需要人工調(diào)整截割路徑[9]。為減少人工干預(yù)頻率,田立勇等[10]提出了一種基于灰色預(yù)測(cè)理論的采煤機(jī)截割路徑規(guī)劃方法,提高了采煤機(jī)滾筒適應(yīng)煤層的能力。王廷棟[11]提出一種基于遺傳算法的采煤機(jī)截割路徑優(yōu)化方法,使截割過程更加平穩(wěn)?;谛拚呗缘慕馗钴壽E預(yù)測(cè)方法雖然在一定程度上提高了截割精度,但是當(dāng)前狀態(tài)參數(shù)傳遞及計(jì)算需要時(shí)間,并且特征參數(shù)容易冗余,容易導(dǎo)致采煤機(jī)無法及時(shí)調(diào)整姿態(tài)并快速適應(yīng)煤層變化,不可避免會(huì)截割到巖石。這些缺陷促使采煤機(jī)自適應(yīng)截割技術(shù)從識(shí)別走向預(yù)測(cè),最好在當(dāng)前位置獲知下一段煤層邊界狀況。
近年來人工智能等前沿技術(shù)被應(yīng)用到采煤機(jī)截割軌跡預(yù)測(cè)中,支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)等智能技術(shù)可自動(dòng)從具有多特征參數(shù)的軌跡數(shù)據(jù)中學(xué)習(xí)到復(fù)雜的特征表示,捕捉軌跡數(shù)據(jù)中的時(shí)序信息、空間關(guān)系及其他相關(guān)特征,從而提高截割軌跡預(yù)測(cè)的準(zhǔn)確性和魯棒性[12-14]。煤層作為空間分布的一種層狀地質(zhì)實(shí)體,有較強(qiáng)的全局規(guī)律性。綜采工作面動(dòng)態(tài)生產(chǎn)時(shí)的采煤機(jī)歷史截割軌跡數(shù)據(jù)可反映煤層分布形態(tài)隨煤層空間幾何形態(tài)變化而不斷變化的趨勢(shì),這些數(shù)據(jù)實(shí)質(zhì)上是時(shí)間序列數(shù)據(jù)[15],并且具有較強(qiáng)的波動(dòng)性和非線性。為進(jìn)一步提高預(yù)測(cè)效率及精度,研究人員嘗試使用時(shí)間序列預(yù)測(cè)技術(shù)提取截割軌跡中所隱含的特征信息,采用長短時(shí)記憶(Long Short-term Memory,LSTM)神經(jīng)網(wǎng)絡(luò)構(gòu)建采煤機(jī)截割軌跡預(yù)測(cè)模型,取得了較好的效果,但仍存在輸入?yún)?shù)過多、計(jì)算成本增加等問題[16-18]。
在實(shí)際采煤過程中,煤層起伏不定,需要進(jìn)行迭代式預(yù)測(cè),為保證誤差不會(huì)逐級(jí)累計(jì),對(duì)預(yù)測(cè)模型的實(shí)時(shí)性提出了較高要求。因此,本文提出一種用因果卷積改進(jìn)的門控循環(huán)神經(jīng)網(wǎng)絡(luò)(Causal Convolution Gated Recurrent Unit, CC-GRU),并基于CC-GRU實(shí)現(xiàn)采煤機(jī)滾筒調(diào)高量預(yù)測(cè)。首先,采用滑動(dòng)窗口方法將輸入數(shù)據(jù)劃分為連續(xù)、大小可調(diào)的子序列,同時(shí)處理橫向、縱向的特征信息;其次,構(gòu)造CC-GRU預(yù)測(cè)模型,對(duì)輸入數(shù)據(jù)進(jìn)行雙重特征提取和雙重?cái)?shù)據(jù)過濾,其中因果卷積模塊使用卷積核獲取輸入特征圖的局部特征表示,以減少計(jì)算冗余,門控循環(huán)神經(jīng)網(wǎng)絡(luò)(Gated Recurrent Unit,GRU)處理迭代序列數(shù)據(jù),以發(fā)揮其捕捉長期依賴關(guān)系的能力;最后,通過全連接層輸出最終預(yù)測(cè)結(jié)果。
采煤機(jī)滾筒調(diào)高量預(yù)測(cè)可定義為一個(gè)多元時(shí)間序列預(yù)測(cè)問題。多元時(shí)間序列數(shù)據(jù)具有高維度和復(fù)雜性,單一模型無法捕捉到數(shù)據(jù)中的所有復(fù)雜結(jié)構(gòu)和關(guān)系,會(huì)導(dǎo)致模型在預(yù)測(cè)未來時(shí)間序列數(shù)據(jù)時(shí)精度不足,所以需將多個(gè)模型融合或多個(gè)結(jié)構(gòu)層疊加來克服這一缺陷。因此,本文采用因果卷積疊加遞歸神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的方式進(jìn)行特征提取,盡可能地讓模型挖掘到數(shù)據(jù)的多形態(tài)、多狀態(tài)特征。
傳統(tǒng)預(yù)測(cè)方法忽略了采煤機(jī)截割軌跡數(shù)據(jù)的時(shí)序性,不能根據(jù)數(shù)據(jù)的差異性為不同時(shí)刻的數(shù)據(jù)賦予相應(yīng)權(quán)重。遞歸神經(jīng)網(wǎng)絡(luò)由于本身結(jié)構(gòu)與時(shí)間序列數(shù)據(jù)特性的契合性,將其用于搭建預(yù)測(cè)模型可大幅提高預(yù)測(cè)精度,但所需參數(shù)較多,預(yù)測(cè)效率低。因果卷積捕捉序列數(shù)據(jù)的依賴關(guān)系,采用并行計(jì)算方式同時(shí)處理多個(gè)時(shí)間步的信息,解決了遞歸神經(jīng)網(wǎng)絡(luò)逐個(gè)時(shí)間步順序處理的低效問題。
本文融合時(shí)域卷積網(wǎng)絡(luò)(Temporal Convolutional Network,TCN)及GRU構(gòu)建CC-GRU預(yù)測(cè)模型。通過一維因果卷積對(duì)歷史數(shù)據(jù)提取局部時(shí)序特征,GRU利用門控機(jī)制對(duì)卷積得到的特征進(jìn)行序列化建模,捕捉元素之間的長期依賴關(guān)系。與單一模型相比,CC-GRU預(yù)測(cè)模型減少了過擬合的風(fēng)險(xiǎn),提高了模型的泛化能力,使預(yù)測(cè)結(jié)果更加穩(wěn)定可靠。
基于CC-GRU的采煤機(jī)滾筒調(diào)高量預(yù)測(cè)流程如圖1所示。首先,獲取原始采高數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行歸一化處理,然后采用滑動(dòng)窗口方法劃分?jǐn)?shù)據(jù),構(gòu)建輸入數(shù)據(jù)樣本。然后, 將樣本劃分為訓(xùn)練集和測(cè)試集,訓(xùn)練集數(shù)據(jù)用于訓(xùn)練CC-GRU預(yù)測(cè)模型學(xué)習(xí)時(shí)序特征,測(cè)試集數(shù)據(jù)用于測(cè)試最終訓(xùn)練完成的模型性能。最后,輸出模型預(yù)測(cè)結(jié)果,并進(jìn)行反歸一化處理,得到真實(shí)的預(yù)測(cè)結(jié)果。
圖1 基于CC-GRU的采煤機(jī)滾筒調(diào)高量預(yù)測(cè)流程Fig.1 Prediction process of height adjustment of shearer drum based on causal convolution gated recurrent unit (CC-GRU)
CC-GRU預(yù)測(cè)模型結(jié)構(gòu)如圖2所示。通過一維因果卷積層有效提取序列數(shù)據(jù)中的局部關(guān)聯(lián)特征,并將特征映射到多維度特征向量。通過多層門控機(jī)制對(duì)特征序列進(jìn)行更精細(xì)的特征提取,捕獲全局長期依賴關(guān)系。經(jīng)過因果卷積層第1次特征過濾后,數(shù)據(jù)雜質(zhì)顯著減少,為后續(xù)特征提取和數(shù)據(jù)過濾提供了有利條件。使用GRU層對(duì)剩余特征進(jìn)行選擇性保留,完成第2次特征過濾。CC-GRU的雙層結(jié)構(gòu)實(shí)現(xiàn)了多次特征提取和多次數(shù)據(jù)雜質(zhì)過濾,有效提升了網(wǎng)絡(luò)性能。
圖2 CC-GRU預(yù)測(cè)模型結(jié)構(gòu)Fig.2 Structure of CC-GRU prediction model
影響當(dāng)前采樣點(diǎn)采高的因素除不同刀同位置采樣點(diǎn)的高度數(shù)據(jù)外,還有鄰近采樣點(diǎn)的高度數(shù)據(jù)。如果將所有數(shù)據(jù)無差別地輸入到單個(gè)模型中進(jìn)行訓(xùn)練,不能有效提取出截割軌跡縱向的時(shí)間特征及橫向相鄰數(shù)據(jù)之間的相關(guān)特征,因此,采用滑動(dòng)窗口方法進(jìn)行預(yù)處理。使用固定大小的滑動(dòng)窗口沿著時(shí)間序列滑動(dòng),截取歷史數(shù)據(jù)。對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理后,得到輸入樣本:
式中:Xi(i=1,2,···,T)為采煤機(jī)進(jìn)行第i刀截割時(shí)的高度序列;T為輸入序列中的截割總刀數(shù);xij為第i刀的第j個(gè)采樣點(diǎn)的高度;s為1刀的總采樣點(diǎn)數(shù)。
2018年,Bai Shaojie等[19]提出一種用于分析時(shí)間序列數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)——TCN。TCN通過擴(kuò)展因果卷積和殘差模塊并行處理輸入序列,不僅避免了梯度爆炸和梯度消失等現(xiàn)象,提高了模型訓(xùn)練速度,而且有效抑制了循環(huán)神經(jīng)網(wǎng)絡(luò)中的誤差累計(jì)問題,在時(shí)間序列數(shù)據(jù)預(yù)測(cè)任務(wù)中表現(xiàn)出良好性能。TCN由多個(gè)殘差模塊組成,殘差模塊中最為重要的擴(kuò)張因果卷積結(jié)構(gòu)如圖3所示。
圖3 擴(kuò)張因果卷積結(jié)構(gòu)Fig.3 Causal dilated convolutional structure
對(duì)于輸入時(shí)間序列X,通過因果卷積進(jìn)行特征提取,即滑動(dòng)卷積核F=(f1,f2,···,fK)(fk為位置k處的權(quán)重,k=1,2,···,K,K為卷積核尺寸)分別與輸入序列的不同部分進(jìn)行卷積運(yùn)算,得到的卷積值為
式中:d為擴(kuò)張因子,當(dāng)d=1時(shí),對(duì)輸入數(shù)據(jù)進(jìn)行常規(guī)因果卷積運(yùn)算,當(dāng)d≠1時(shí),對(duì)輸入數(shù)據(jù)進(jìn)行擴(kuò)張因果卷積運(yùn)算。
為更好地捕捉序列中的長期依賴關(guān)系,在卷積層后添加殘差連接:
式中?(·)為ReLU 激活函數(shù)。
殘差連接將輸入序列的信息直接傳遞到卷積層的輸出中,能幫助網(wǎng)絡(luò)更好地學(xué)習(xí)并保留輸入序列的重要特征,同時(shí),使用非線性激活函數(shù)可增強(qiáng)模型的非線性建模能力。
2014年,K.Cho等[20]提出更易于計(jì)算的GRU。與LSTM相比,GRU需要的訓(xùn)練參數(shù)更少,收斂速度更快,并且可在時(shí)間序列數(shù)據(jù)有限的情況下降低模型過度擬合的風(fēng)險(xiǎn)[21]。GRU單元主要由重置門和更新門組成,結(jié)構(gòu)如圖4所示。重置門決定前一時(shí)刻與當(dāng)前時(shí)刻輸入的結(jié)合程度,更新門決定前一時(shí)刻狀態(tài)信息在當(dāng)前時(shí)刻中的保留程度。將作為GRU神經(jīng)網(wǎng)絡(luò)的輸入,GRU單元第t個(gè)時(shí)間步的輸入為,輸出為ht。
圖4 GRU結(jié)構(gòu)Fig.4 Structure of gated recurrent unit
首先,將當(dāng)前時(shí)刻輸入與前一時(shí)刻隱藏狀態(tài)ht-1的拼接矩陣輸入到GRU單元中,得到t時(shí)刻重置門門控狀態(tài)rt及更新門門控狀態(tài)ut:
式中:σ(·)為Sigmoid激活函數(shù);Wr,Wu分別為重置門與更新門的權(quán)值矩陣; []為向量拼接操作符號(hào);br,bu分別為重置門與更新門的偏置向量;p為激活函數(shù)自變量。
然后,重置門可對(duì)ht-1選擇性地重置,決定上一時(shí)刻信息的保留程度。將ht-1經(jīng)過重置門處理后與相加,并應(yīng)用tanh激活函數(shù)得到當(dāng)前時(shí)刻候選狀態(tài):
式中:?(·)為tanh激活函數(shù);Wh為候選狀態(tài)的權(quán)值矩陣;⊙為逐元素乘法符號(hào);bh為對(duì)應(yīng)的偏置向量。
最后,GRU單元結(jié)合ut和處理當(dāng)前時(shí)刻信息,結(jié)合I-ut(I為單位矩陣)和ht-1處理歷史時(shí)刻信息,兩者相加得到當(dāng)前時(shí)刻GRU單元的輸出:
GRU能夠有效捕獲長期序列中的關(guān)鍵信息。在每個(gè)時(shí)刻,GRU都能夠動(dòng)態(tài)保留和更新相關(guān)信息,并傳遞到網(wǎng)絡(luò)的下一個(gè)時(shí)間步,直到模型處理完整個(gè)序列。最后一個(gè)時(shí)間步的隱藏狀態(tài)hT會(huì)作為輸入傳遞給全連接層,通過線性映射產(chǎn)生最終預(yù)測(cè)結(jié)果。
實(shí)驗(yàn)使用的硬件配置為Intel(R) Core(TM) i5-8265U CPU @ 1.80 GHz,運(yùn)行內(nèi)存為8 GiB。實(shí)驗(yàn)過程基于深度學(xué)習(xí)Pytorch框架,使用的編程語言為Python。
為驗(yàn)證CC-GRU預(yù)測(cè)模型的有效性,選用實(shí)際截割數(shù)據(jù)進(jìn)行實(shí)驗(yàn)。本文所使用的數(shù)據(jù)是某礦采煤機(jī)實(shí)際截割過程中記錄的數(shù)據(jù),即采煤機(jī)多次截割過程中在各采樣點(diǎn)的前滾筒高度。采樣間隔為3 m,采煤機(jī)截深為0.8 m,每一次走刀包含40個(gè)采樣點(diǎn)。由于已知數(shù)據(jù)較少,采用克里金插值算法對(duì)實(shí)際數(shù)據(jù)進(jìn)行插值,得到的插值曲面如圖5所示。
圖5 插值曲面Fig.5 Interpolation surface
由于原始采高數(shù)據(jù)中存在噪聲,且不同截割循環(huán)采高數(shù)據(jù)沒有統(tǒng)一標(biāo)準(zhǔn),所以在進(jìn)行采高預(yù)測(cè)前需要對(duì)原始數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,以提高數(shù)據(jù)的質(zhì)量和可靠性。數(shù)據(jù)的預(yù)處理主要包括數(shù)據(jù)標(biāo)準(zhǔn)化、基于滑動(dòng)窗口構(gòu)造樣本數(shù)據(jù)2個(gè)部分。
3.2.1 數(shù)據(jù)標(biāo)準(zhǔn)化
為消除特征間單元差異和尺度差異的影響,需對(duì)采煤機(jī)采高數(shù)據(jù)進(jìn)行歸一化處理,使采高數(shù)據(jù)限定在[0,1]區(qū)間。本文采用min-max歸一法進(jìn)行采高數(shù)據(jù)歸一化,歸一化公式為
式中:z*為歸一化后的數(shù)據(jù);z為歸一化前某刀某采樣點(diǎn)的截割滾筒高度;zmin為訓(xùn)練集中最小采高;zmax為訓(xùn)練集中最大采高。
為評(píng)估模型性能,需對(duì)模型輸出的預(yù)測(cè)結(jié)果進(jìn)行反歸一化處理,即將預(yù)測(cè)值還原到原始數(shù)據(jù)的尺度上,以計(jì)算真實(shí)誤差。反歸一化公式為
式中y*為反歸一化后的數(shù)據(jù);y為模型直接輸出的預(yù)測(cè)值。
3.2.2 滑動(dòng)窗口
在實(shí)際生產(chǎn)中,采煤機(jī)需要在工作面進(jìn)行循環(huán)截割,且每刀截割的相隔時(shí)間一般較短。為了保證采煤機(jī)工作的實(shí)時(shí)性,預(yù)測(cè)模型需對(duì)截割軌跡進(jìn)行連續(xù)預(yù)測(cè)。因此,選擇在預(yù)測(cè)前根據(jù)滾動(dòng)方式構(gòu)造多元樣本數(shù)據(jù)。
在原始高度序列數(shù)據(jù)H={H1,H2,···,HT}中,Hi為第i刀40個(gè)采樣點(diǎn)的截割滾筒高度數(shù)據(jù)。設(shè)置滑動(dòng)窗口大小為m,將Hi作為目標(biāo)輸出,前m刀數(shù)據(jù){Hi-m,Hi-m+1,···,Hi-1}作為輸入,以此構(gòu)建1個(gè)樣本,而后將窗口后移,即將樣本輸入中的第1個(gè)向量Hi-m剔除,加入第i刀數(shù)據(jù)Hi,則輸入為{Hi-m+1,Hi-m+2,···,Hi},輸出為第i+1刀數(shù)據(jù)Hi+1,構(gòu)建1個(gè)新的樣本,依此類推,構(gòu)建所需樣本集合。每組樣本中包含m刀輸入數(shù)據(jù)及對(duì)應(yīng)的1刀輸出數(shù)據(jù)。所構(gòu)建的樣本形式為
為準(zhǔn)確評(píng)估模型的預(yù)測(cè)效果,采用平均絕對(duì)誤差(Mean Absolute Error,MAE)、平均絕對(duì)百分比誤差(Mean Absolute Percentage Error,MAPE)、均方根誤差(Root Mean Squared Error,RMSE)、決定系數(shù)R2作為評(píng)價(jià)指標(biāo),其計(jì)算公式分別為
式中:n為測(cè)試樣本數(shù);yj為第j個(gè)樣本的實(shí)際值;為第j個(gè)樣本的預(yù)測(cè)值;為樣本實(shí)際值的平均值。
CC-GRU涉及的超參數(shù)主要包括網(wǎng)絡(luò)層數(shù)、隱層節(jié)點(diǎn)數(shù)等,不同的超參數(shù)對(duì)于訓(xùn)練效果有較大影響。依據(jù)經(jīng)驗(yàn)將隱層節(jié)點(diǎn)數(shù)的搜索范圍限制為[16,64]。首先通過對(duì)比實(shí)驗(yàn)確定CC-GRU的網(wǎng)絡(luò)層數(shù)及隱層節(jié)點(diǎn)數(shù)。設(shè)定模型迭代次數(shù)均為50,在相同訓(xùn)練數(shù)據(jù)集下選取3個(gè)指標(biāo)值為對(duì)照標(biāo)準(zhǔn)。不同參數(shù)下CC-GRU模型的預(yù)測(cè)結(jié)果見表1。
表1 不同參數(shù)下CC-GRU模型的預(yù)測(cè)結(jié)果Table 1 Prediction results of CC-GRU model under different parameters
由表1可知,在網(wǎng)絡(luò)層數(shù)為2且每個(gè)隱層節(jié)點(diǎn)數(shù)為32時(shí),模型各項(xiàng)評(píng)價(jià)指標(biāo)值均相對(duì)較低,MAE為43.80 mm,MAPE為1.90%,RMSE為50.35 mm,R2為0.65,表明該模型預(yù)測(cè)效果最佳。從整體趨勢(shì)來看,隨著各隱層節(jié)點(diǎn)數(shù)的增加,預(yù)測(cè)誤差呈現(xiàn)先增后減的趨勢(shì)。這是由于網(wǎng)絡(luò)結(jié)構(gòu)過于簡(jiǎn)單時(shí)可能導(dǎo)致欠擬合,而過于復(fù)雜時(shí)又會(huì)出現(xiàn)過擬合問題。并且,如果各隱層節(jié)點(diǎn)數(shù)相同,網(wǎng)絡(luò)層數(shù)增加反而會(huì)降低模型性能。
不同參數(shù)下CC-GRU模型的預(yù)測(cè)結(jié)果對(duì)比如圖6所示??煽闯?,隱層節(jié)點(diǎn)數(shù)為(32,32)(第1層、第2層節(jié)點(diǎn)數(shù)均為32)時(shí),全局差異波動(dòng)較小,預(yù)測(cè)值更符合實(shí)際滾筒調(diào)高量變化趨勢(shì)。
圖6 不同參數(shù)下CC-GRU模型的預(yù)測(cè)結(jié)果對(duì)比Fig.6 Comparison of prediction results of CC-GRU model under different parameters
為對(duì)比CC-GRU模型與其他模型的性能差別,設(shè)置以下實(shí)驗(yàn):在相同實(shí)驗(yàn)條件下,設(shè)置滑動(dòng)窗口大小為4,采用LSTM,GRU,TCN,CC-GRU在同一數(shù)據(jù)集下對(duì)滾筒調(diào)高量進(jìn)行預(yù)測(cè)。不同模型預(yù)測(cè)結(jié)果對(duì)比如圖7所示。由圖7可知:TCN模型的預(yù)測(cè)效果最差,所得預(yù)測(cè)值均低于實(shí)際值;GRU及LSTM模型效果次之,在采樣點(diǎn)為[20,30]的折線中可看出明顯偏差;CC-GRU模型預(yù)測(cè)結(jié)果最接近實(shí)際值,更符合變化趨勢(shì)。
圖7 不同模型預(yù)測(cè)結(jié)果對(duì)比Fig.7 Comparison of prediction results of different models
不同模型的評(píng)價(jià)指標(biāo)見表2。分析表2可知,與其他模型相比,CC-GRU模型預(yù)測(cè)效果最佳,誤差較小且決定系數(shù)較高。CC-GRU模型相較于LSTM模型,MAE降低了14.1%,MAPE降低了13.9%,RMSE降低了21.1%,決定系數(shù)提高了78.9%;相較于GRU模型,MAE降低了9.2%,MAPE降低了9.4%,RMSE降低了15.5%,決定系數(shù)提高了69.3%;相較于TCN模型,MAE降低了28.5%,MAPE降低了28%,RMSE降低了24.2%,決定系數(shù)提高了99.6%。這表明CC-GRU模型具有較強(qiáng)的魯棒性,泛化性能較好。
評(píng)價(jià)指標(biāo)對(duì)比如圖8所示??煽闯觯琓CN模型的MAE較LSTM,GRU模型明顯增大,說明循環(huán)神經(jīng)網(wǎng)絡(luò)更能關(guān)注到序列的關(guān)鍵特征信息;CC-GRU模型的決定系數(shù)最高,說明CC-GRU模型的擬合能力較強(qiáng),能夠很好地解釋變化趨勢(shì)。
圖8 評(píng)價(jià)指標(biāo)對(duì)比Fig.8 Comparison of evaluation indicators
不同模型預(yù)測(cè)時(shí)間對(duì)比見表3。由表3可知,與其他模型相比,CC-GRU模型的預(yù)測(cè)速度較快,每次預(yù)測(cè)時(shí)間僅為0.17 s,可滿足采煤機(jī)實(shí)際工作需求。相較于LSTM,GRU模型,其訓(xùn)練時(shí)間分別減少了82.2%,80.5%;相較于TCN模型,其訓(xùn)練時(shí)間增加了103.3%,但預(yù)測(cè)精度取得了較大提升。
表3 不同模型預(yù)測(cè)時(shí)間對(duì)比Table 3 Comparison of prediction time of different models
TCN模型可快速處理多個(gè)時(shí)間步的信息,但在每個(gè)時(shí)間步上只在局部區(qū)域內(nèi)提取特征,對(duì)于具有復(fù)雜長期依賴關(guān)系的序列,無法捕捉到所有的相關(guān)信息;循環(huán)神經(jīng)網(wǎng)絡(luò)相比TCN網(wǎng)絡(luò)結(jié)構(gòu)更為復(fù)雜,更適于處理長序列依賴關(guān)系,其中GRU比LSTM所需要的參數(shù)更少,但訓(xùn)練階段計(jì)算復(fù)雜度過高,時(shí)間成本增加;具有雙層結(jié)構(gòu)的CC-GRU模型既關(guān)注序列中的局部特征,又可捕捉序列的長期依賴關(guān)系,在計(jì)算效率和性能之間取得了平衡。
實(shí)驗(yàn)結(jié)果表明,CC-GRU模型可更好地提取學(xué)習(xí)滾筒高度的非線性變化特征,能夠精準(zhǔn)、快速進(jìn)行預(yù)測(cè),并取得良好的預(yù)測(cè)效果。
1) 提出了一種基于CC-GRU的采煤機(jī)滾筒調(diào)高量預(yù)測(cè)方法。通過因果卷積提前聚焦序列的局部時(shí)序特征,并行處理輸入序列,輸出特征向量,并將其輸入到多層GRU中對(duì)非線性和非平穩(wěn)數(shù)據(jù)進(jìn)行擬合。通過CC-GRU的雙層結(jié)構(gòu)實(shí)現(xiàn)了雙重特征提取和雙重?cái)?shù)據(jù)雜質(zhì)過濾,在保證精度的同時(shí),滿足了實(shí)時(shí)性要求。
2) 使用真實(shí)數(shù)據(jù)對(duì)采煤機(jī)滾筒調(diào)高量進(jìn)行預(yù)測(cè),CC-GRU預(yù)測(cè)模型的MAE為43.80 mm,MAPE為1.90%,RMSE為50.35 mm,決定系數(shù)為0.65,預(yù)測(cè)時(shí)間僅為0.17 s。實(shí)驗(yàn)結(jié)果表明,該模型可快速、有效預(yù)測(cè)滾筒調(diào)高量。
3) 與LSTM模型、GRU模型、TCN模型進(jìn)行對(duì)比實(shí)驗(yàn),結(jié)果表明,CC-GRU預(yù)測(cè)模型的MAE,MAPE,RMSE均低于其他模型,決定系數(shù)更高,預(yù)測(cè)時(shí)間更短,表明CC-GRU預(yù)測(cè)模型具有較高的可靠性,能夠在采煤機(jī)滾筒調(diào)高量預(yù)測(cè)中提供更為準(zhǔn)確的結(jié)果。