国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于數(shù)據(jù)驅(qū)動(dòng)的船舶油耗預(yù)測(cè)模型研究

2020-05-05 02:01尹石軍林召凱高海波廖林豪
江蘇船舶 2020年1期
關(guān)鍵詞:黑箱油耗平均值

尹石軍,林召凱,高海波,廖林豪

(1.招商局重工(江蘇)有限公司,江蘇 南通 226100;2.武漢理工大學(xué) 能源與動(dòng)力工程學(xué)院,湖北 武漢 430063)

0 引言

在全球貿(mào)易前所未有的高度發(fā)達(dá)體系下,整個(gè)航運(yùn)業(yè)的運(yùn)營(yíng)船舶排放大約占據(jù)當(dāng)前全球二氧化碳排放量的3%、氮氧化物的15%、硫氧化物的4%~9%[1-2]。船舶排放的根本原因在于工作中使用的燃料:船用重油和輕柴油,所以降低船舶的油耗就是降低排放。同時(shí),船舶的燃料消耗也與船舶運(yùn)營(yíng)成本直接相關(guān),伴隨著國(guó)際油價(jià)的持續(xù)上漲,燃油消耗的成本也越來(lái)越高,帶給航運(yùn)企業(yè)的壓力也越來(lái)越大。

油耗模型的研究有許多方法,可大致分為三類:第一類是以分析船舶內(nèi)部各物理量關(guān)系為基礎(chǔ)建立的白箱模型,如HOLTROP等[4]給出的回歸模型,但該模型僅在船舶設(shè)計(jì)階段用于分析船舶內(nèi)部物理量關(guān)系有很好的效果;第二類是直接通過(guò)數(shù)據(jù)關(guān)系建模的黑箱模型,如葉睿等[5-6]建立多層感知機(jī)網(wǎng)絡(luò)的黑箱模型,但需要對(duì)網(wǎng)絡(luò)設(shè)置大量的結(jié)構(gòu)參數(shù);第三類是將以上兩者結(jié)合的灰箱模型,如LEIFSSON等[7]通過(guò)前饋神經(jīng)網(wǎng)絡(luò)建立的灰箱模型,也可對(duì)船舶油耗進(jìn)行較準(zhǔn)確的預(yù)測(cè),但不具有普適性。本文將采用深度學(xué)習(xí)方法建立黑箱模型。

深度學(xué)習(xí)是一種受大腦結(jié)構(gòu)和功能啟發(fā)的算法(稱為人工神經(jīng)網(wǎng)絡(luò)),通過(guò)使用反向傳播算法來(lái)發(fā)現(xiàn)大型數(shù)據(jù)集當(dāng)中的復(fù)雜結(jié)構(gòu),以指示機(jī)器應(yīng)如何更改其內(nèi)部參數(shù),并根據(jù)前一圖層的數(shù)據(jù)計(jì)算后面圖層中的數(shù)據(jù)。它與傳統(tǒng)機(jī)器學(xué)習(xí)技術(shù)的不同之處在于,它們可以自動(dòng)從數(shù)據(jù)(如圖像、視頻或文本)中學(xué)習(xí),而無(wú)需引入手動(dòng)編碼規(guī)則或人類領(lǐng)域知識(shí)[3]。本研究正是基于上述背景,將長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)運(yùn)用到船舶油耗預(yù)測(cè)建模中來(lái)。以某客滾輪實(shí)船采集的數(shù)據(jù)為基礎(chǔ),分析航行中各種參數(shù)與油耗數(shù)據(jù)相關(guān)度的大小,量化之間的權(quán)重關(guān)系,預(yù)測(cè)燃油消耗。

1 LSTM 神經(jīng)網(wǎng)絡(luò)

本文選取基于循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)的變種LSTM神經(jīng)網(wǎng)絡(luò)來(lái)建立黑箱模型進(jìn)行油耗的預(yù)測(cè)。RNN與普通的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和原理并不相同,RNN結(jié)構(gòu)見圖1[8]。圖中:X表示當(dāng)前節(jié)點(diǎn)狀態(tài)下的輸入,h為當(dāng)前節(jié)點(diǎn)狀態(tài)下的輸出,A表示神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn)。

圖1 RNN結(jié)構(gòu)

RNN結(jié)構(gòu)可以看作是一個(gè)鏈?zhǔn)浇Y(jié)構(gòu),其本質(zhì)是可以像人腦一樣擁有對(duì)數(shù)據(jù)特征的記憶能力。神經(jīng)網(wǎng)絡(luò)會(huì)對(duì)前面輸入的信息進(jìn)行記憶并將其應(yīng)用于當(dāng)前信息的計(jì)算中。但RNN的不足在于無(wú)法學(xué)習(xí)太長(zhǎng)的序列特征,即在數(shù)據(jù)過(guò)于龐大時(shí)無(wú)法長(zhǎng)時(shí)間地對(duì)所需要的信息進(jìn)行有效的記憶,LSTM神經(jīng)網(wǎng)絡(luò)應(yīng)運(yùn)而生。LSTM神經(jīng)網(wǎng)絡(luò)核心思想在于,在神經(jīng)網(wǎng)絡(luò)中引入了一個(gè)叫做細(xì)胞狀態(tài)的連接,這個(gè)細(xì)胞狀態(tài)用來(lái)存放想要記憶的東西,同時(shí)加入了3個(gè)“門”。圖2為“門”結(jié)構(gòu)。圖中:σ表示sigmoid激活函數(shù),用于控制輸入信息X的通過(guò)。

圖2 LSTM“門”結(jié)構(gòu)

在LSTM神經(jīng)網(wǎng)絡(luò)中這3個(gè)“門”分別是:

(1)忘記門:決定什么時(shí)候需要把以前的狀態(tài)忘記。

(2)輸入門:決定什么時(shí)候加入新的狀態(tài)。

(3)輸出門:決定什么時(shí)候需要把狀態(tài)和輸入放在一起輸出。

在簡(jiǎn)單的循環(huán)神經(jīng)網(wǎng)絡(luò)中,僅僅把上一次的狀態(tài)當(dāng)作本次的輸入,而LSTM在狀態(tài)的更新和狀態(tài)是否參與輸入的過(guò)程中都做了靈活的選擇,這就使得LSTM神經(jīng)網(wǎng)絡(luò)避免了RNN無(wú)法學(xué)習(xí)太長(zhǎng)的序列特征問(wèn)題[8]。

基于對(duì)數(shù)據(jù)的采集是按時(shí)間順序進(jìn)行的特點(diǎn)和考慮到數(shù)據(jù)量的大小,本文決定采用LSTM神經(jīng)網(wǎng)絡(luò)建立對(duì)油耗進(jìn)行預(yù)測(cè)的黑箱模型。

2 數(shù)據(jù)預(yù)處理及分析

MS Smyril號(hào)是運(yùn)營(yíng)于法羅群島首府托爾斯港至蘇德島航線的客滾輪,單程航行時(shí)間約1.92 h,每日往返兩地2~3次。本文采用該船于2010年2月至4月共246次航行中所采集并公布于網(wǎng)絡(luò)的數(shù)據(jù)[9]。這些數(shù)據(jù)包括13類參數(shù),分別是:船舶對(duì)水航速、船舶對(duì)地航速、船舶縱傾、船舶橫傾、左槳螺距、右槳螺距、左舷吃水、右舷吃水、船首風(fēng)速、船側(cè)風(fēng)速、左舷舵角、右舷舵角和船舶油耗,每類數(shù)據(jù)的總量都為1 048 576條。

2.1 數(shù)據(jù)預(yù)處理

在利用收集到的原始數(shù)據(jù)建模之前,需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。采樣數(shù)據(jù)可表示為包含NR個(gè)數(shù)據(jù)點(diǎn)的三元數(shù)組。

T={(i1,t1,v1),(i2,t2,v2),…,(in,tn,vn),…,(iNR,tNR,vNR)}

(1)

式中:T為采集的數(shù)據(jù)集;in為輸入?yún)?shù);tn為時(shí)間戳,即采樣數(shù)據(jù)的時(shí)間;vn為所采樣的值。

在數(shù)據(jù)采樣的過(guò)程中,絕大多數(shù)設(shè)備都會(huì)將數(shù)據(jù)直接傳遞給收集系統(tǒng),而忽略了對(duì)采樣時(shí)間的控制。由于不同的傳感器采樣的參數(shù)在頻率和幅度上都不同,并且異步數(shù)據(jù)序列在任何時(shí)候都不一定具有相應(yīng)的值。因此在數(shù)據(jù)分析之前,必須執(zhí)行頻率降低和特征提取以使得數(shù)據(jù)的格式統(tǒng)一。對(duì)此,建立一個(gè)可以處理這些異步數(shù)據(jù)的框架,使得模型變得更加靈活。將所有傳感器采集數(shù)據(jù)的時(shí)間長(zhǎng)度定為3 min,每個(gè)時(shí)間段為一個(gè)數(shù)據(jù)采樣窗口,即在t1

Wt1,t2,j={(in,tn,vn)∣t1≤tn≤t2,in=j}

(2)

式中:Wt1,t2,j為該窗口內(nèi)采樣的合集;j為參數(shù)類型。

當(dāng)任何傳感器在部分或全部航程中的窗口某一項(xiàng)參數(shù)采樣完全缺失時(shí),該窗口中所有數(shù)據(jù)將被視為無(wú)效數(shù)據(jù)并從樣本中剔除[10]。

另外,系統(tǒng)收集的數(shù)據(jù)可能有時(shí)會(huì)突然出現(xiàn)與其他數(shù)據(jù)點(diǎn)有明顯偏差的異常值,這可能是設(shè)備中的異常造成的。在數(shù)據(jù)分析的過(guò)程中為了保證數(shù)據(jù)的準(zhǔn)確性,需要指定數(shù)據(jù)范圍,并將超出此范圍的數(shù)據(jù)點(diǎn)去掉。

在經(jīng)過(guò)上述預(yù)處理過(guò)程后得到可用于建立油耗模型的148 961個(gè)數(shù)據(jù)。每個(gè)窗口中所采樣的數(shù)據(jù)經(jīng)過(guò)以下計(jì)算來(lái)提取平均值、方差和平均差分這3個(gè)特征值[5-6]:

平均值:

(3)

方差:

(4)

平均差分:

(5)

式(3)~ 式(5)中:u為數(shù)據(jù)類型;I為數(shù)據(jù)在時(shí)間段內(nèi)數(shù)據(jù)點(diǎn)的個(gè)數(shù);Δt為時(shí)間間隔;xi為在該段時(shí)間內(nèi)的第i個(gè)數(shù)據(jù)。

2.2 輸入?yún)?shù)的選定

通常在船舶運(yùn)營(yíng)過(guò)程中會(huì)有許多因素影響船舶的油耗,各個(gè)因素對(duì)船舶油耗影響的權(quán)重是不同的,在此通過(guò)斯皮爾曼等級(jí)相關(guān)(Spearman Rank Correlation)方法[11]來(lái)分析各因素與船舶油耗的相關(guān)性。斯皮爾曼等級(jí)相關(guān)公式如下:

(6)

式中:ρ為相關(guān)系數(shù);n為等級(jí)個(gè)數(shù);d為二列成對(duì)變量的等級(jí)差數(shù);di為對(duì)油耗產(chǎn)生影響的各個(gè)因素。

斯皮爾曼等級(jí)相關(guān)分析結(jié)果見圖3。

圖3 相關(guān)性分析

從圖3中可以看出,船舶航行時(shí)其油耗受到左舷螺距、右舷螺距、對(duì)水航速、對(duì)地航速、船舶縱傾、船首風(fēng)速、左舷舵角和右舷舵角的影響較大。

在選定輸入?yún)?shù)的過(guò)程中,首先要分析船舶油耗與擬輸入?yún)?shù)的相關(guān)性。相關(guān)性有高有低,選用相關(guān)性高的參數(shù)輸入有利于體現(xiàn)數(shù)據(jù)特征;反之,選用相關(guān)度低的參數(shù)會(huì)增加數(shù)據(jù)序列中的復(fù)雜程度。另一方面對(duì)于神經(jīng)網(wǎng)絡(luò)來(lái)說(shuō),系統(tǒng)輸入維度過(guò)大會(huì)出現(xiàn)梯度爆炸現(xiàn)象;輸入維度過(guò)小則會(huì)容易出現(xiàn)模型過(guò)擬合現(xiàn)象,因此選擇相關(guān)度高的參數(shù)和合適的輸入維度是非常必要的。

本模型中每類參數(shù)只選擇一種特征值輸入黑箱模型,這樣可以避免重復(fù)輸入某相關(guān)度高的參數(shù)的不同特征值使得模型精度偏離實(shí)際。經(jīng)過(guò)相關(guān)性分析之后,剔除4類與油耗相關(guān)度不大的參數(shù),包括船舶左右舷吃水、船舶橫傾和船側(cè)風(fēng)速。選取8類參數(shù)作為模型的輸入?yún)?shù),即左舷螺距的平均值、右舷螺距的平均值、對(duì)水航速的平均值、對(duì)地航速的平均值、縱傾的平均值、船首風(fēng)速的平均值、左舷舵角的平均值和右舷舵角的平均值。選取油耗作為黑箱模型的輸出參數(shù)。整個(gè)黑箱模型具體結(jié)構(gòu)見圖4。

在選定好輸入?yún)?shù)和完成數(shù)據(jù)預(yù)處理之后,開始建立模型,然后進(jìn)行訓(xùn)練。

3 試驗(yàn)結(jié)果分析

本文運(yùn)用Python代碼和深度學(xué)習(xí)框架Tensorflow建立LSTM神經(jīng)網(wǎng)絡(luò),對(duì)完成預(yù)處理的數(shù)據(jù)進(jìn)行學(xué)習(xí),確定神經(jīng)網(wǎng)絡(luò)參數(shù)及權(quán)值,使用Adam優(yōu)化算法訓(xùn)練模型,學(xué)習(xí)率為0.001。選取樣本數(shù)量80%作為訓(xùn)練集訓(xùn)練網(wǎng)絡(luò),20%作為測(cè)試集用于驗(yàn)證模型精度,得到的訓(xùn)練誤差與測(cè)試誤差見圖5。

由圖5可知,網(wǎng)絡(luò)在訓(xùn)練與測(cè)試過(guò)程中誤差均下降較快,具有很好的泛化能力。

在完成訓(xùn)練之后,選取測(cè)試集中的500個(gè)樣本數(shù)據(jù)作為預(yù)測(cè)結(jié)果展示,見圖6。圖中,“+”為油耗真實(shí)值,“*”為相同輸入情況下的預(yù)測(cè)值。由圖可知,兩者吻合度較好,其預(yù)測(cè)的相對(duì)誤差僅為2.11%。

圖6 LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果

為了證明LSTM神經(jīng)網(wǎng)絡(luò)具有良好的精度,將同樣的數(shù)據(jù)經(jīng)過(guò)BP神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)(SVM)訓(xùn)練得出的預(yù)測(cè)結(jié)果分別見圖7、圖8。

圖7 BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果

圖8 SVM預(yù)測(cè)結(jié)果

上述3種算法的預(yù)測(cè)相對(duì)誤差見表1。

表1 算法相對(duì)誤差對(duì)比

由圖6、圖7、圖8與表1看出,BP 神經(jīng)網(wǎng)絡(luò)具有訓(xùn)練時(shí)間短的優(yōu)點(diǎn),但是其預(yù)測(cè)精度相對(duì)較低。SVM算法不僅精度低,并且在處理大量訓(xùn)練樣本時(shí)所耗費(fèi)的時(shí)間多。相比上述兩種算法, LSTM神經(jīng)網(wǎng)絡(luò)耗時(shí)較少,且預(yù)測(cè)精度較高。綜合上述原因表明,LSTM神經(jīng)網(wǎng)絡(luò)更適用于船舶的油耗預(yù)測(cè)。

4 結(jié)語(yǔ)

本文通過(guò)分析船舶航行各因素的影響,篩選出對(duì)地與對(duì)水航速、左右舷螺距、船舶縱傾、船首風(fēng)速和左右舷舵角8類與船舶油耗相關(guān)度高的輸入數(shù)據(jù)。采用LSTM神經(jīng)網(wǎng)絡(luò)建立油耗模型,通過(guò)對(duì)比實(shí)驗(yàn)進(jìn)行模型參數(shù)優(yōu)化,得到的模型預(yù)測(cè)精度較高,具有較高的可信度。本文采用深度學(xué)習(xí)方法所建立的黑箱模型可以用于油耗預(yù)測(cè),可為船舶運(yùn)營(yíng)人員提供一定參考,合理制定運(yùn)營(yíng)計(jì)劃,提高航運(yùn)能效。

猜你喜歡
黑箱油耗平均值
拒絕黑箱
失蹤的黑箱
巧用1mol物質(zhì)作標(biāo)準(zhǔn) 快速確定混合物組成
變力做功時(shí)運(yùn)用F=F1+F2/2的條件
哪款汽車更省油?——百款汽車真是油耗數(shù)據(jù)對(duì)比
平面圖形中構(gòu)造調(diào)和平均值幾例
這道電學(xué)黑箱題有誤嗎?
2007/2008年度桑蠶干繭質(zhì)量分析報(bào)告
汽車冬季油耗為何會(huì)增加?
電學(xué)黑箱問(wèn)題例析
衢州市| 黄大仙区| 耿马| 昔阳县| 彩票| 广元市| 越西县| 全州县| 逊克县| 海晏县| 洛隆县| 广元市| 和静县| 东明县| 霍城县| 瓦房店市| 宁强县| 怀柔区| 北京市| 五家渠市| 文化| 青冈县| 凤台县| 隆回县| 临澧县| 嘉定区| 曲麻莱县| 比如县| 咸宁市| 南汇区| 贵州省| 长汀县| 大庆市| 息烽县| 延庆县| 泰宁县| 会泽县| 青海省| 绥江县| 曲麻莱县| 海晏县|