徐宏偉,葛 沛
(南通中遠(yuǎn)海運(yùn)川崎船舶工程有限公司,江蘇 南通 226005)
“大數(shù)據(jù)”是數(shù)據(jù)的集合,其特點(diǎn)是數(shù)據(jù)的體量大、速度快、類別多、潛在的價(jià)值含量高,且數(shù)據(jù)量不斷增長。目前,越來越多的應(yīng)用涉及大數(shù)據(jù),通過對(duì)大數(shù)據(jù)的分析可以獲取更具價(jià)值的信息。隨著互聯(lián)網(wǎng)、云計(jì)算、物聯(lián)網(wǎng)等信息技術(shù)的快速發(fā)展,有些大型航運(yùn)公司逐步建立了覆蓋全球的船舶營運(yùn)數(shù)據(jù)中心,監(jiān)控管理船舶的位置、航行狀態(tài)及設(shè)備狀況。
近年來,一批國際知名船企和相關(guān)研究機(jī)構(gòu)已經(jīng)啟動(dòng)了大數(shù)據(jù)應(yīng)用項(xiàng)目的研究。2014年日本船舶技術(shù)研究協(xié)會(huì)開展大數(shù)據(jù)應(yīng)用項(xiàng)目,采集船舶的航行數(shù)據(jù)形成大數(shù)據(jù),并應(yīng)用于船舶的節(jié)能航行和船型開發(fā)[1]。我國首艘智能示范船“i-DOLPHIN”號(hào)是一艘38 800載重噸散貨船,該船以大數(shù)據(jù)為基礎(chǔ),運(yùn)用實(shí)時(shí)數(shù)據(jù)的傳輸匯集結(jié)合數(shù)字建模、遠(yuǎn)程控制等信息化技術(shù),實(shí)現(xiàn)船舶感知、分析和決策的智能化,從而提升船舶運(yùn)行效率[2]。但大數(shù)據(jù)技術(shù)應(yīng)用于智能化船舶仍然是一個(gè)高度復(fù)雜、計(jì)算量大、可靠性要求極高的過程,很多相關(guān)理論和技術(shù)仍需進(jìn)一步研究和應(yīng)用,數(shù)據(jù)作用的發(fā)揮還需進(jìn)一步驗(yàn)證。
本文基于大數(shù)據(jù)分析的理論和方法,深度挖掘船舶運(yùn)營數(shù)據(jù)的應(yīng)用價(jià)值,并以開發(fā)的船舶能源監(jiān)控系統(tǒng)為例,研究大數(shù)據(jù)分析處理的過程。
大數(shù)據(jù)分析的理論和方法,從人機(jī)相互協(xié)作的角度,可以分為以下2類。
(1)第1類是從機(jī)器的角度出發(fā),重視機(jī)器的計(jì)算能力、人工智能,如各類面向大數(shù)據(jù)的機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘方法等,主要研究各種挖掘算法、智能搜索及高性能處理算法等。這類方法目前是大數(shù)據(jù)分析領(lǐng)域的研究主流。
(2)第2類認(rèn)為人是分析和需求的主體,重視基于機(jī)器與人之間相互協(xié)作的、人類更加易于認(rèn)識(shí)理解的分析方法,此分析方法則在分析過程中融入人類特有的且機(jī)器無法替代的認(rèn)知能力,如大數(shù)據(jù)可視化分析[3]。
傳統(tǒng)數(shù)據(jù)分析方法為了節(jié)約計(jì)算資源和時(shí)間,摒棄對(duì)所有原始數(shù)據(jù)的全面分析,通過復(fù)雜精確的算法,從部分樣本空間中獲取能夠反映全局的信息。隨著計(jì)算機(jī)技術(shù)的發(fā)展,對(duì)大量數(shù)據(jù)進(jìn)行計(jì)算分析已成為可能,因此大數(shù)據(jù)分析方法不追求算法的復(fù)雜性,而追求高效地對(duì)所有數(shù)據(jù)集進(jìn)行分析[4]。目前,船舶數(shù)據(jù)分析中應(yīng)用的大數(shù)據(jù)分析方法主要有以下3種。
(1)深度學(xué)習(xí)法。該方法能夠發(fā)掘多維數(shù)據(jù)中錯(cuò)綜復(fù)雜的關(guān)系,具體方法有人工神經(jīng)網(wǎng)絡(luò)法、模糊系統(tǒng)、演化計(jì)算和群體智能算法。人工神經(jīng)網(wǎng)絡(luò)法采用多層次架構(gòu)來分析表達(dá)數(shù)據(jù),借助于龐大的數(shù)據(jù)量,模擬數(shù)據(jù)時(shí)可以用更精確復(fù)雜的模型來表達(dá)。目前人工神經(jīng)網(wǎng)絡(luò)法在船舶的碰撞預(yù)警、風(fēng)險(xiǎn)分析領(lǐng)域中得到廣泛的應(yīng)用。以遺傳算法為代表的演化計(jì)算和以粒子群優(yōu)化、蟻群優(yōu)化等為代表的群體智能算法主要用于解決數(shù)據(jù)量太大而不易解決的復(fù)雜優(yōu)化問題。
(2)知識(shí)計(jì)算法。該方法從大數(shù)據(jù)庫中抽取有價(jià)值的知識(shí),并將其構(gòu)建為可查詢分析和計(jì)算的知識(shí)庫。其中多源知識(shí)融合的方法考慮了知識(shí)的共享和復(fù)用,并且通過數(shù)據(jù)的不斷更新有效提高了數(shù)據(jù)分析的實(shí)時(shí)性和有效性,因此該技術(shù)被廣泛應(yīng)用在船舶能耗決策中。
(3)可視化法。該方法將大規(guī)模、多維度的數(shù)據(jù)分析結(jié)果直觀、動(dòng)態(tài)化地實(shí)時(shí)展示給用戶,輔助用戶進(jìn)行實(shí)時(shí)決策。其流程是通過物聯(lián)網(wǎng)獲取數(shù)據(jù)源,對(duì)原始數(shù)據(jù)進(jìn)行必要的篩選和修復(fù),然后對(duì)數(shù)據(jù)進(jìn)行深度處理,找出數(shù)據(jù)間的關(guān)聯(lián)性,預(yù)測(cè)數(shù)據(jù)的發(fā)展趨勢(shì),最后通過直觀圖形的展示讓用戶更直接地觀察和分析數(shù)據(jù),從而為決策提供數(shù)據(jù)支持。
大數(shù)據(jù)的重要來源就是物聯(lián)網(wǎng)。船舶物聯(lián)網(wǎng)(船聯(lián)網(wǎng))是通過在船舶上安裝定位、通信、監(jiān)控等設(shè)備來組建的。隨著全球定位系統(tǒng)GPS、船舶自動(dòng)識(shí)別系統(tǒng)AIS、電子海圖顯示與信息系統(tǒng)ECDIS、ARPA雷達(dá)、射頻識(shí)別RFID、綜合船橋系統(tǒng)等信息化技術(shù)的發(fā)展,船聯(lián)網(wǎng)已應(yīng)用于船舶管理體系中。它以企業(yè)、船員、船舶、貨物為對(duì)象,以數(shù)據(jù)為中心,實(shí)現(xiàn)航運(yùn)管理的精細(xì)化,未來將實(shí)現(xiàn)更為重要的船船互聯(lián)、船岸互聯(lián)。船舶管理公司從已建立的數(shù)據(jù)庫獲取船舶的靜態(tài)數(shù)據(jù),然后依靠衛(wèi)星通訊設(shè)備獲取船舶自身的實(shí)時(shí)動(dòng)態(tài)數(shù)據(jù)(如航速、航向、機(jī)器油耗等),并且依靠岸基航道局、氣象及測(cè)繪部門等機(jī)構(gòu)和航道助航設(shè)施的功能,獲取氣象、航道、海況等外界環(huán)境數(shù)據(jù)[5]。
船舶的大數(shù)據(jù)分析對(duì)船舶的運(yùn)營管理可產(chǎn)生許多價(jià)值。以常用的能效管理為例,其價(jià)值如下:
(1)通過基于大數(shù)據(jù)技術(shù)開發(fā)出的船舶能源監(jiān)控系統(tǒng),能夠監(jiān)控船舶的方位、主機(jī)油耗和轉(zhuǎn)速,以便實(shí)時(shí)遠(yuǎn)程監(jiān)測(cè)燃油消耗狀況。然后對(duì)測(cè)量的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,并消除外界干擾力(如風(fēng)、波浪、水流等)的影響,得到船舶排水量、船速與主機(jī)油耗量之間的關(guān)系,優(yōu)選出船舶的經(jīng)濟(jì)油耗,給出船舶的最佳航速建議,從而實(shí)現(xiàn)降低船舶油耗的目標(biāo)。
(2)通過分析航速要求、航線上實(shí)時(shí)的氣象狀況和水文條件等,以靠泊港口的日程時(shí)間要求為限制條件,計(jì)算出油耗最低的航線。
(3)航運(yùn)商通過能源監(jiān)控系統(tǒng)提供的船舶運(yùn)營數(shù)據(jù),構(gòu)建船舶實(shí)時(shí)監(jiān)控?cái)?shù)據(jù)管理平臺(tái),并將數(shù)據(jù)管理平臺(tái)與運(yùn)輸生產(chǎn)調(diào)度系統(tǒng)相結(jié)合,整合航運(yùn)產(chǎn)業(yè)流程,從而優(yōu)化船舶在航線上的配置和減少航運(yùn)業(yè)的燃油消耗量。
船舶大數(shù)據(jù)還可以應(yīng)用于船舶的水動(dòng)力性能設(shè)計(jì)及節(jié)能裝置的效果驗(yàn)證。
(1)通過對(duì)船舶航行數(shù)據(jù)分析處理,將不同等級(jí)波浪下的數(shù)據(jù)進(jìn)行分類統(tǒng)計(jì),了解波浪對(duì)船舶航速的影響,獲知船舶在波浪中消耗功率的相關(guān)數(shù)據(jù)信息后,就能驗(yàn)證與評(píng)價(jià)不同船型的氣象因子。
(2)為驗(yàn)證船舶節(jié)能裝置的效果,分別收集并統(tǒng)計(jì)安裝節(jié)能裝置前后的航行數(shù)據(jù)。通過大數(shù)據(jù)分析得到相關(guān)數(shù)據(jù)之間的關(guān)系,在消除自身因素(吃水、浮態(tài))和外界干擾因素(如風(fēng)、波浪、水流等)的影響后,就能評(píng)估節(jié)能裝置的效果。
本文以開發(fā)的船舶能源監(jiān)控系統(tǒng)為例,依托可視化、知識(shí)計(jì)算、深度學(xué)習(xí)3種方法,利用大數(shù)據(jù)分析技術(shù)從龐大的數(shù)據(jù)中快速抽出關(guān)鍵的信息,挖掘出對(duì)決策有潛在價(jià)值的模式和趨勢(shì),為船舶的運(yùn)營提供數(shù)據(jù)支撐。能源監(jiān)控系統(tǒng)構(gòu)架見圖1。
圖1 能源監(jiān)控系統(tǒng)構(gòu)架
系統(tǒng)通過數(shù)據(jù)記錄儀采集航速、航向、位置、風(fēng)速、風(fēng)向、舵角、吃水等航行數(shù)據(jù)和主機(jī)、發(fā)電機(jī)等機(jī)器的油耗、功率數(shù)據(jù),同時(shí)系統(tǒng)還能接收第三方機(jī)構(gòu)提供的氣象水文數(shù)據(jù)。利用大數(shù)據(jù)分析技術(shù),將油耗、功率、航速等信息以折線的形式進(jìn)行可視化,實(shí)時(shí)監(jiān)控主機(jī)油耗信息,挖掘有價(jià)值的信息,提供船舶優(yōu)化轉(zhuǎn)速建議,以達(dá)到節(jié)能減排的效果。
由于環(huán)境因素影響或采集器故障可能導(dǎo)致數(shù)據(jù)偏差過大,因此,為保證數(shù)據(jù)的質(zhì)量和最終挖掘模型的質(zhì)量,需要對(duì)所采集的數(shù)據(jù)進(jìn)行探索、審核和必要的加工處理。數(shù)據(jù)處理前需要設(shè)定異常數(shù)據(jù)的識(shí)別規(guī)則,將數(shù)據(jù)進(jìn)行閾值比對(duì),若數(shù)據(jù)偏離閾值范圍則被作為異常值刪除。
本文將大數(shù)據(jù)技術(shù)應(yīng)用于智能船舶領(lǐng)域中,主要采用了索引、數(shù)據(jù)規(guī)約、數(shù)據(jù)分割等技術(shù)。在管理數(shù)據(jù)庫的技術(shù)方面,索引技術(shù)不僅能減少磁盤讀寫開銷,還可以提高增刪改查的速度。在大數(shù)據(jù)集上直接進(jìn)行復(fù)雜的數(shù)據(jù)分析和挖掘需要很長的時(shí)間,數(shù)據(jù)規(guī)約能產(chǎn)生更小的但保持原始數(shù)據(jù)完整性的新數(shù)據(jù)集。在規(guī)約后的數(shù)據(jù)集上進(jìn)行分析和挖掘?qū)⒏咝?。?shù)據(jù)規(guī)范可以降低無效、錯(cuò)誤數(shù)據(jù)對(duì)建模的影響,提高建模的準(zhǔn)確性,縮減數(shù)據(jù)挖掘所需要的時(shí)間,降低存儲(chǔ)數(shù)據(jù)的成本。以采集頻率15 s為例,單船每年采集的數(shù)據(jù)記錄多達(dá)200多萬條,如果直接對(duì)大批量的數(shù)據(jù)進(jìn)行操作,會(huì)使數(shù)據(jù)庫的執(zhí)行時(shí)間長、壓力大。一般將大批量數(shù)據(jù)分割成多塊較小的數(shù)據(jù),再對(duì)數(shù)據(jù)進(jìn)行操作。本文實(shí)際采用的方法是首先創(chuàng)建臨時(shí)的數(shù)據(jù)表,將3 d的數(shù)據(jù)放入,對(duì)每天的數(shù)據(jù)進(jìn)行取平均值等運(yùn)算,再將運(yùn)算完的1 d的數(shù)據(jù)存放入到新創(chuàng)建的數(shù)據(jù)表,降低了存儲(chǔ)數(shù)據(jù)的規(guī)模。
應(yīng)用C#語言編寫程序?qū)Σ杉臄?shù)據(jù)進(jìn)行處理分析,并將數(shù)據(jù)保存在SQL數(shù)據(jù)庫中。在大數(shù)據(jù)應(yīng)用中,繁雜的數(shù)據(jù)本身是難以輔助決策的,需要運(yùn)用可視化的分析方法,將分析后的結(jié)果以圖形、圖像處理、計(jì)算機(jī)視覺及用戶界面等形式展現(xiàn),更容易被船員接受并加以利用。從SQL數(shù)據(jù)庫中提取相關(guān)聯(lián)的數(shù)據(jù),并用折線圖實(shí)時(shí)表示出來,以便船員能夠直觀地了解到船舶性能參數(shù)變化。分析后的數(shù)據(jù)依靠衛(wèi)星通迅網(wǎng)絡(luò)和互聯(lián)網(wǎng)傳輸至岸基系統(tǒng),實(shí)現(xiàn)船舶與岸基的數(shù)據(jù)共享。岸基人員可以對(duì)船舶的狀態(tài)進(jìn)行遠(yuǎn)程監(jiān)控及故障診斷。
大數(shù)據(jù)挖掘是從大量的、不完全的數(shù)據(jù)中,通過一定的算法揭示隱藏于其中的、未知的并有潛在價(jià)值的信息的過程。數(shù)據(jù)挖掘是一種決策支持過程,主要基于人工智能、機(jī)器學(xué)習(xí)、模式識(shí)別、統(tǒng)計(jì)學(xué)、數(shù)據(jù)庫、可視化技術(shù)等,高度自動(dòng)化地分析大量數(shù)據(jù),作出歸納性的推理,從中挖掘出潛在的模式[6]。
本文以船舶能源監(jiān)控系統(tǒng)采集的船舶航行數(shù)據(jù)為例,進(jìn)行了深層次數(shù)據(jù)挖掘。依據(jù)船舶航行數(shù)據(jù),結(jié)合航次計(jì)劃(出港、靠泊港口時(shí)間)、航線特點(diǎn)、船舶效率,評(píng)估船舶燃料消耗及航行成本,給出最經(jīng)濟(jì)的航速方案,以降低燃油消耗。航速優(yōu)化系統(tǒng)界面見圖2。在航速優(yōu)化系統(tǒng)內(nèi)輸入預(yù)定的航行線路、艏艉吃水、燃油價(jià)格、出港及到港的預(yù)定時(shí)間,系統(tǒng)根據(jù)航線的形狀特點(diǎn),將預(yù)定的航線分成許多航段。每個(gè)航段自動(dòng)生成各自的初始航速,根據(jù)第三方機(jī)構(gòu)通過VAST衛(wèi)星網(wǎng)絡(luò)提供的氣象預(yù)報(bào)信息,得到每個(gè)航段內(nèi)考慮環(huán)境影響的速度功率關(guān)系,再根據(jù)功率與油耗率的關(guān)系得到每個(gè)航段內(nèi)的油耗。以總航程的油耗最低為目標(biāo)條件,采用遺傳算法進(jìn)行優(yōu)化,從而獲得每個(gè)航段內(nèi)的最優(yōu)航速。
圖2 船舶航速優(yōu)化系統(tǒng)
本文闡述了大數(shù)據(jù)的概念及其分析理論和方法,探討了大數(shù)據(jù)技術(shù)在船舶智能化中的應(yīng)用,深度挖掘了船舶運(yùn)營數(shù)據(jù)信息的內(nèi)在價(jià)值。得出以下3點(diǎn)結(jié)論:
(1)大數(shù)據(jù)處理中具體采用的索引、數(shù)據(jù)規(guī)約、數(shù)據(jù)分割等技術(shù),對(duì)采集的數(shù)據(jù)進(jìn)行必要的加工處理,有效保證了數(shù)據(jù)和挖掘模型的質(zhì)量。
(2)運(yùn)用可視化的分析方法,將分析后的數(shù)據(jù)結(jié)果以多媒體形式在船上展現(xiàn)。依靠衛(wèi)星通訊系統(tǒng)和互聯(lián)網(wǎng)實(shí)現(xiàn)船舶與岸基之間大數(shù)據(jù)的共享,開展岸端遠(yuǎn)程監(jiān)控、故障診斷等,以輔助船員決策。
(3)從采集的大量航行及設(shè)備數(shù)據(jù)中,通過一定的算法,深入挖掘出有價(jià)值的信息,實(shí)現(xiàn)船舶的智能化管理。