童亮,陳雪梅,鄭朋飛
(重慶交通大學(xué) 航運與船舶工程學(xué)院,重慶 400074)
由于不斷增長的航運需求,船舶溫室氣體排放量預(yù)計將在2050年前較2018年增加50%[1]。因此,作為《船舶能效管理計劃》(ship energy efficiency management plan,SEEMP)的重要組成部分,越來越多的國際規(guī)則的制定已集中于船舶能源效率的提高。在船舶實際運營過程中,燃油費用占運營總成本的30%~60%[2],而內(nèi)河船舶多變的通航環(huán)境使其油耗過程更具復(fù)雜性。因此,在一定的航程和有限的時間內(nèi)使船舶油耗最低是我國內(nèi)河航運業(yè)技術(shù)改造和產(chǎn)業(yè)升級迫切需要解決的重要問題之一。
船舶油耗預(yù)測的建模方法可分為:理論公式建模和統(tǒng)計數(shù)據(jù)建模。理論建模,模型的建立需要完整的船舶設(shè)計參數(shù)和實驗數(shù)據(jù),分析過程中涉及環(huán)境因素過多且建模難度相對較大[3-4],因此理論公式建模無法囊括所有船型,實用性需進一步提高。統(tǒng)計數(shù)據(jù)的建模主要通過分析船舶油耗相關(guān)因素,將數(shù)學(xué)方法和機器學(xué)習(xí)相結(jié)合,擯棄冗雜的機理分析,建立實測數(shù)據(jù)的預(yù)測模型,準(zhǔn)確度高,實用性好。
因此,針對復(fù)雜的能耗特征和多變的內(nèi)河環(huán)境,考慮以內(nèi)河某散貨船為例,對目標(biāo)船舶安裝多個傳感器測得實船數(shù)據(jù),采用多個模型(SVR模型、BP模型和ELM模型)分別對油耗進行預(yù)估,對比分析網(wǎng)絡(luò)模型對實船油耗的預(yù)測結(jié)果;利用支持向量回歸機(support vector regression,SVR)與模糊信息?;?fuzzy information granulation,FIG)結(jié)合的方法對船舶未來一段時間內(nèi)的油耗進行回歸于預(yù)測分析。
內(nèi)河運輸節(jié)能降耗面臨著以下問題[5]:①量大面廣,船型雜亂;②船齡偏老,信息化不高;③管理水平低較,運輸效率有待提高;④能耗管控不力,綜合油耗相對偏高,排放高。列舉影響船舶油耗的主要因素見表1。
表1 影響船舶油耗的主要因素
船舶航行時,系統(tǒng)采集到的多維數(shù)據(jù)具有樣本大、準(zhǔn)確度低的特點。為了得到精準(zhǔn)的預(yù)測模型和有效的預(yù)測結(jié)果,通常使用區(qū)間縮放法將輸入數(shù)據(jù)、輸出數(shù)據(jù)線性壓縮至[0,1]區(qū)間內(nèi)的量綱值,以消除多維數(shù)據(jù)不同量綱的影響。歸一化處理見下式[6]。
(1)
式中:x*為歸一化處理后的數(shù)據(jù);x為輸入數(shù)據(jù);xmax為輸入數(shù)據(jù)最大值;xmin為輸入數(shù)據(jù)最小值。
模型的輸入?yún)?shù)眾多,變量之間有一定的相互作用和關(guān)聯(lián)性。因此,采用主成分分析法(principal component analysis,PCA)對變量進行降維處理,提取影響油耗的關(guān)鍵特征。
Fp=a1i·ZX1+a2i·ZX2+…+api·ZXp
(2)
式中:FP為影響油耗的主成分;a1i,a2i,…,api(i=1,2,…,m)為輸入變量的協(xié)方差陣Σ對應(yīng)的特征向量,ZX1,ZX2,…,ZXp為輸入變量的標(biāo)準(zhǔn)化值。
在航船舶的燃油消耗時間序列具有較強的非線性和隨機性,采用SVR模型對船舶油耗進行預(yù)測,該模型具有以下優(yōu)勢[7]:①SVR模型得到的是理論上的全局最優(yōu)解,可避免局部最優(yōu)問題;②SVR模型通過非線性變換將原始變量映射到高維特征空間構(gòu)造線性分類函數(shù),既可保證模型的良好泛化能力,又可解決向量“維數(shù)災(zāi)難”問題。模型中關(guān)于油耗預(yù)測的非線性回歸問題的尋優(yōu)實施步驟為:
1)在高維特征空間建立線性回歸函數(shù)。
f(x)=wΦ(x)+b
(3)
式中:Ф(x)為非線性映射函數(shù)。
2)定義ε線性不敏感損失函數(shù)。
(4)
式中:f(x)為預(yù)測值;y為對應(yīng)的實際值。若預(yù)測值與實際值之間的差值小于等于ε,則損失為0。
(5)
式中:Ф(x)為非線性映射函數(shù),C為懲罰因子,ε規(guī)定了回歸函數(shù)的誤差要求。
f(x)=w*Φ(x)+b*=
(6)
選取徑向基核函數(shù)
K(xi,xj)=Φ(xi)Φ(xj)
(7)
5)帶入核函數(shù),求解回歸函數(shù)。
f(x)=w*Φ(x)+b*=
(8)
傳統(tǒng)油耗預(yù)測模型只對數(shù)據(jù)進行預(yù)處理,未對其影響因素進行特征分析,使得預(yù)測結(jié)果不精確、波動性大;預(yù)測大多停留在點時間上,忽視了對油耗一段時間內(nèi)的波動情況和變化范圍。因此,通過信息粒化(information granulation, IG)對大量油耗數(shù)據(jù)的內(nèi)部特征進行分析,將整體劃分為個體。
FIG將油耗數(shù)據(jù)劃分成2 h一個窗口并對其模糊化處理,選用三角型的模糊粒子在窗口上建立模糊集,代替原窗口數(shù)據(jù),使實船油耗數(shù)據(jù)中不確定的變量轉(zhuǎn)換成確定數(shù)值,很好地解決了模糊數(shù)中無法準(zhǔn)確度量只能模糊處理的矛盾。三角型隸屬函數(shù)如下。
(9)
式中:x為輸入的時間變量;a、m、b分別為輸入數(shù)據(jù)?;蟮淖钚≈礚ow、平均值average和最大值Up。
基于模糊信息?;腟VR組合預(yù)測模型的流程見圖1。
圖1 基于模糊信息?;腟VR組合模型流程
運用三角型函數(shù)對記錄的油耗時序值進行FIG處理,得到?;礚ow、R、Up,利用SVR模型對?;蟮臄?shù)據(jù)進行回歸預(yù)測,得到預(yù)測的每個窗口油耗范圍RLow、Raverage和RUp,將預(yù)測數(shù)據(jù)與實際數(shù)據(jù)的變化趨勢和變化范圍進行比較,驗證模型預(yù)測效果。
以長江某散貨船為研究對象,該輪主要參數(shù)和主機相關(guān)參數(shù)見表2。
表2 目標(biāo)船舶主要參數(shù)
運用PCA對表1中的油耗相關(guān)參數(shù)進行分析,得到10個主成分的特征值、貢獻(xiàn)率。通過式(2),計算主成分與相關(guān)參數(shù)的對應(yīng)關(guān)系,得到各參數(shù)的主成分貢獻(xiàn)率見表3。
表3 相關(guān)參數(shù)主成分貢獻(xiàn)率
從表3知,Z1~Z7的累積貢獻(xiàn)率達(dá)到96.367 2%,Z8~Z10的貢獻(xiàn)率則很小。因此,油耗預(yù)測模型的輸入維數(shù)降為以下7維:雙機轉(zhuǎn)速n2、單機轉(zhuǎn)速n1、航速V、水流速Vw、載貨量W、風(fēng)速Vs、風(fēng)向Vd。
選取目標(biāo)船舶江陰-南家坨航次,總計1 320組上水航行數(shù)據(jù),以每30 min內(nèi)主機累積消耗的燃油作為分析對象。為不失一般性,采用隨機的方法產(chǎn)生1 000組數(shù)據(jù)作為訓(xùn)練集和320組數(shù)據(jù)作為測試集分別對模型的性能進行評價。按照時間序列的燃油消耗數(shù)據(jù)集見圖2。
圖2 目標(biāo)船舶燃油消耗時間序列
觀察圖2燃油消耗時間序列,可知油耗波動起伏明顯,多個無序的峰值給預(yù)測帶來了難度。運用SVR模型對數(shù)據(jù)集進行預(yù)測,過程如下:首先對輸入的多維參數(shù)作歸一化處理,默認(rèn)核函數(shù)為徑向基核函數(shù)(RBF),采用交叉驗證的方法尋找中間參數(shù)C(懲罰因子)和參數(shù)g(RBF核函數(shù)中的方差),運用GS算法得到精細(xì)尋優(yōu)的最佳C和g來訓(xùn)練SVR模型,記錄輸入?yún)?shù)的回歸預(yù)測值,輸出真實值與預(yù)測值的對比結(jié)果。本次精細(xì)尋優(yōu)下的最優(yōu)參數(shù)bestC=16,bestg=0.250 0,數(shù)據(jù)集的預(yù)測結(jié)果見圖3、4。
圖3 SVR訓(xùn)練集預(yù)測結(jié)果
圖4 SVR測試集預(yù)測結(jié)果
由圖3、4所示,SVR模型訓(xùn)練集和測試集的均方誤差分別為0.000 991 15和0.007 124 99,決定系數(shù)分別達(dá)到0.985 65和0.976 54。這表明,所建立的SVR油耗回歸模型具有非常好的泛化能力,預(yù)測效果良好。
對320組測試集分別運用BP模型、ELM模型進行預(yù)測。BP模型參數(shù)設(shè)置如下:最大訓(xùn)練次數(shù)為1 000、訓(xùn)練要求精度為10-3、學(xué)習(xí)率為0.1;ELM模型的激活函數(shù)為sigmoid、隱含層神經(jīng)元個數(shù)為7、性能函數(shù)為mse。測試集的預(yù)測結(jié)果見圖5、6。
圖5 BP模型測試集預(yù)測結(jié)果
圖6 ELM極限學(xué)習(xí)機測試集預(yù)測結(jié)果
將SVR模型的測試集預(yù)測結(jié)果對比BP神經(jīng)網(wǎng)絡(luò)、ELM極限學(xué)習(xí)機,結(jié)果見表4。表4表明4VR模型的預(yù)測誤差最小且準(zhǔn)確度最高。
表4 SVR、BP模型和Elman測試集結(jié)果對比
將記錄的1 320組油耗時序值作為輸入數(shù)據(jù),以每2 h為1個?;翱趯τ秃倪M行?;Y(jié)果見圖7。其中,Low粒子描述的是油耗2 h內(nèi)變化的最小值;R粒子描述的是油耗2 h內(nèi)變化的平均值;Up粒子描述的是油耗2 h內(nèi)變化的最大值。
圖7 模糊?;Y(jié)果
將粒化結(jié)果Low、R、Up作為SVR模型的輸入?yún)?shù),構(gòu)建FIG_SVR組合預(yù)測模型,結(jié)果見圖8。
圖8表明組合模型的Low參數(shù)、Up參數(shù)預(yù)測準(zhǔn)確率較高且符合參數(shù)走勢,但R參數(shù)預(yù)測值普遍高于?;?。這是由于目標(biāo)船舶的主機分為左機、右機,航行時當(dāng)只開單機(左機或者右機)時,速度低,油耗小;雙機(左右機)航行時,速度高,油耗大。因此,進行預(yù)測時,對于單雙機的油耗并未能區(qū)分預(yù)測,導(dǎo)致數(shù)據(jù)之間的跳躍性大,降低了組合模型的魯棒性,所以平均值R參數(shù)的預(yù)測結(jié)果偏高。以Low參數(shù)為例詳解FIG_SVR組合模型回歸預(yù)測:選用三角型函數(shù)對油耗時序值進行FIG處理,對?;礚ow參數(shù)作歸一化處理,利用交叉驗證(CV)方法得到最佳參數(shù)組合C=35,g=0.125 0,根據(jù)最佳參數(shù)訓(xùn)練SVR模型,得到Low參數(shù)的擬合預(yù)測值,將預(yù)測值與實際值進行差值計算,誤差結(jié)果見圖8d)。
圖8 粒化值Up、R和Low的SVR預(yù)測結(jié)果
通過對油耗數(shù)據(jù)進行FIG_SVR組合模型的預(yù)測得到波動范圍RLow、Raverage和RUp,將預(yù)測值與2 h內(nèi)的實際油耗值進行比較,結(jié)果見表5。
表5 船舶油耗變化趨勢和變化空間預(yù)測
真實值與預(yù)測值的相對誤差不超過4%,由模糊粒子提供的預(yù)測范圍也符合油耗的真實波動范圍。由此可見,基于模糊信息?;闹С窒蛄炕貧w機組合預(yù)測模型能夠準(zhǔn)確地描述油耗未來2 h內(nèi)的波動態(tài)勢。
通過FIG對數(shù)據(jù)進行窗口劃分和模糊化處理,以粒子為單位對油耗數(shù)據(jù)進行Low、R和Up粒子的分類。與原始數(shù)據(jù)相比,該方法對實船2 h內(nèi)的油耗波動情況進行了有效的挖掘,解決了以往預(yù)測模型中大量數(shù)據(jù)模糊分類和粗糙處理的弊??;根據(jù)挖掘得到的Low、R和Up粒子通過歸一化和預(yù)處理后作為輸入建立泛化功能良好的SVR油耗動態(tài)預(yù)測模型,該組合模型良好的預(yù)測結(jié)果得到了合理驗證。
基于支持向量回歸機的油耗預(yù)測模型具有較優(yōu)的預(yù)測性能,模型的預(yù)測精度為SVR模型>ELM模型>BP模型;通過FIG_SVR組合預(yù)測模型得到了較為精確的未來油耗的變化趨勢和波動情況。