国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

通過Hadoop分析AIS數(shù)據(jù)預測船舶在航道中的航行行為

2019-11-25 16:56談承杰
珠江水運 2019年19期
關(guān)鍵詞:目的地航行可視化

談承杰

摘 要:面向大數(shù)據(jù)的分布式系統(tǒng),如apache Hadoop,在存儲和分析數(shù)量呈指數(shù)增長的各種數(shù)據(jù)(如傳感器數(shù)據(jù)、客戶生成的媒體、web日志等)方面已被證明是有效的。本文采用分布式可擴展大數(shù)據(jù)存儲apache Hadoop對船載AIS應(yīng)答機產(chǎn)生的大量時空數(shù)據(jù)進行存儲、處理和分析。為了預測船舶在繁忙港口周圍擁擠的航道中航行行為,實驗使用了大約40GB真實南海海區(qū)AIS數(shù)據(jù)。這些數(shù)據(jù)經(jīng)過處理形成歷史船舶的航跡,并根據(jù)船舶的類型、航行目的地等屬性進行分類。最后,根據(jù)目標船的屬性和運動特性,實現(xiàn)了一種簡單的目標船行為預測算法。結(jié)果,得到了目標船舶運動預測。實驗結(jié)果還表明,在數(shù)據(jù)處理速度方面,該技術(shù)明顯優(yōu)于傳統(tǒng)的gis應(yīng)用軟件。

關(guān)鍵詞:Apache Hadoop 自動識別系統(tǒng) 運動預測 地理信息系統(tǒng) 軌跡可視化 船舶軌跡分析 大數(shù)據(jù)

如今,在處理大量增長的AIS數(shù)據(jù)時面臨著復雜性,這是相當普遍的現(xiàn)象。我們需要對數(shù)據(jù)進行管理和分析,需要從不斷增長的、已經(jīng)達到傳統(tǒng)數(shù)據(jù)處理應(yīng)用極限的海量數(shù)據(jù)流中提取價值或意義。這種數(shù)據(jù)目前被稱為大數(shù)據(jù),指的是巨大的數(shù)據(jù)集,這些數(shù)據(jù)集在存儲、搜索、共享、可視化和分析方面面臨挑戰(zhàn)。目前,大數(shù)據(jù)通常被定義為三個特征:容量、變化和速度。如何解決如此復雜的大數(shù)據(jù)處理呢?我們在海區(qū)中心機房搭建了Apache Hadoop 分布式數(shù)據(jù)處理平臺。在此平臺上存儲和分析著數(shù)千萬億字節(jié)的AIS數(shù)據(jù)。AIS是船舶通過無線電波向其他船舶以及內(nèi)陸基站傳送數(shù)據(jù)的一種手段。傳輸?shù)臄?shù)據(jù)可分為三類:(1)靜態(tài)數(shù)據(jù),包括船舶名稱、國際海事組織(IMO)編號、海事移動服務(wù)標識(MMSI)編號。(2)動態(tài)數(shù)據(jù),包括船舶位置、離地速度(SOG)、離地航向(COG)、當前狀態(tài)和轉(zhuǎn)彎速度。(3)航次數(shù)據(jù),包括目的地、預計到達時間(ETA)和吃水量。

1. 研究目的及可行性

本次研究目的僅僅是利用AIS數(shù)據(jù)集的分析結(jié)果,預測船舶在港口附近航道上航行的移動。希望通過對船舶行為的近距離預測,為船舶運營商和港口運輸管理者提供有價值的信息。分析數(shù)據(jù)的過程是在假設(shè)船舶運動行為形成其軌跡是由船舶的航向、速度、類型、時間和航行目的地等參數(shù)決定的情況下開始的。因此,從邏輯上講,可以根據(jù)這些參數(shù)預測任何船舶的航跡。然后,根據(jù)確定船舶航跡的參數(shù)建立統(tǒng)計數(shù)據(jù)和可視化。在此統(tǒng)計數(shù)據(jù)的基礎(chǔ)上,結(jié)合可視化技術(shù),通過實現(xiàn)一個簡單的算法,對目標船的未來位置進行了預測。通過反復的實驗驗證了結(jié)果的正確性。

2.場景和數(shù)據(jù)建模

2.1場景假設(shè)

假設(shè)在航道上航行進入或離開港口必須根據(jù)其屬性遵循一定的運動規(guī)律以及特點。具有完全相同或相似的屬性和特征很可能遵循相似的移動模式。船舶的屬性和特征用作確定船舶移動的參數(shù)模式和預測其未來位置,場景參數(shù)如下:

(1)當前位置。這個參數(shù)是需要收集目標的k近鄰(knn)用于確定其移動模式的船舶。

(2)航向和速度。假設(shè)具有相同航向和速度的船舶可能在一段時間內(nèi)到達同一地點。

(3)船舶類型。不同的類型的船舶通常有不同的航線

(4)目的地。目的地不同的船將通過不同的航線路線

(5)船舶狀態(tài)。此參數(shù)指示船舶是否在航行、錨泊、擱淺等移動狀態(tài)。

2.2設(shè)計數(shù)據(jù)庫htable模型并創(chuàng)建統(tǒng)計可視化

當所需的數(shù)據(jù)集準備就緒時,下一步是設(shè)計hbase表模式的方式應(yīng)確保提供對空間查詢(如knn查詢和船舶軌跡查詢。有三張表需要創(chuàng)建,即BroadcastTable、VesselTable和VoyageTable。broadcastTable是保存AIS數(shù)據(jù),并將回答傳入的查詢。VesselTable可存儲船舶航行時只保存船舶的靜態(tài)數(shù)據(jù)VoyageTable存儲船舶航行的特定信息數(shù)據(jù)。這兩個表只有BroadcastTable更新或者增加的時候才會用上。broadcastTable的結(jié)構(gòu)如下:船舶類型、吃水深度、狀態(tài)和MMSI的組合為選擇為BroadcastTable的行鍵,因為它啟用對船舶軌跡查詢的快速有效響應(yīng),可以是查詢請求的船舶軌跡。這些軌跡是利用基于java的開源gis軟件實現(xiàn)可視化從而對船舶運動模式進行可視化分析。船舶軌跡的統(tǒng)計可視通過自定義船舶軌跡參數(shù)查詢生成。geohash由船舶位置坐標生成(經(jīng)度,緯度)構(gòu)造broadcastTable的列鍵。geohash是一種轉(zhuǎn)換二維位置的技術(shù)一維經(jīng)緯坐標排序字符串類似于z階空間填充曲線。這個算法使我們能夠簡單地執(zhí)行前綴搜索以及進行關(guān)鍵字搜索。

2.3簡單預測算法的實現(xiàn)

研究的主要思想是預測船舶的未來基于相似屬性船舶過去軌跡的定位以及特點。因此,算法邏輯很簡單,找到與目標船相似的船只并假設(shè)目標船將遵循相同的軌道船舶。船舶類型被選為實現(xiàn)算法。其中4種不同類型代碼的船舶。預測算法如下:(1)將目標船舶位置坐標p(x,y)轉(zhuǎn)換為geohash,其中x是經(jīng)度值,y是緯度值。目標船必須有目的地。(2)使用行鍵前綴“vesseltype”掃描BroadcastTable?!癲raft. status”作為掃描行鍵和目標發(fā)貨位置geohash字符串作為列鍵。結(jié)果將是目標船knn,鄰近的將是相同類型,相似吃水,同樣的地位。(3)只選擇并返回滿足下列要求:具有相同的目的地和目標船國籍相同,它的航向和速度與目標相似船。(4)計算目標船位置之間的距離p(x,y)和得到的每個鄰域位置n(x,y)。(5)從BroadcastTable中檢索鄰近的軌跡。每艘船的軌跡都表示為幾何圖形表示的linestring類型線串由鍵入以經(jīng)緯度坐標表示的點。構(gòu)成線串的點按時間排序間隔60秒。(6)計算目標船的未來位置使用以下公式:

P(xt, yt) = Nt(xt, yt) ? D(dxt0, dyt0) 公式一、D(dxt0, dyt0) = N(xt0, yt0) ? P(xt0, yt0) 公式二。

式中t=t0+Δt是未來時間,t0是當前時間,而Δt是t0和t.p(xt0,yt0)和p(xt,yt)是當前以及目標船的未來位置。n1(xt0,yt0),n2(xt0,yt0),…,nk(xt0,yt0)是k當前時間的最近鄰位置和n1(xt,yt),n2(xt,yt),…,nk(xt,yt)是它們的位置在時間t時,可從其對應(yīng)的軌跡。在當前位置,dx和dy是目標和各自的鄰近船。因此,d(dx,dy)是從目標船到其每艘鄰近船舶,如圖1所示。

計算了目標船的預計位置,然后,可以通過簡單的計算目標實際位置與預測的位置。

3.實驗

為了檢驗所提出方法的有效性以及評估預測結(jié)果,真實南海海區(qū)的AIS數(shù)據(jù),在Hadoop上以完全分布式模式處理。真實南海海區(qū)的AIS數(shù)據(jù)是由交通運輸部南海航海保障中心廣州航標處海區(qū)導航中心提供的。覆蓋南海海區(qū)轄區(qū)范圍,一年內(nèi)(2018年1月1日至2018年12月31日)的數(shù)據(jù)。數(shù)據(jù)geodatabase(gd b)文件轉(zhuǎn)換為sh ap ef i le(shp)格式之后為了進一步的處理,數(shù)據(jù)大小達到780GB。以2018年11月為測試數(shù)據(jù)。通過船舶的運動預測算法,可視化結(jié)果所示觀察可視化船舶的運行軌跡,我們發(fā)現(xiàn)船舶的類型對船舶的航線格局有重大影響,如圖所示南海海區(qū)的油船運行目的地集中前往洋浦港、欽州港、高欄港等港口,在前往這些港口的過程中已經(jīng)形成了明顯的船舶軌跡。這就意味著船舶的運動模式一般可以通過船舶類型來預測其航行。

4.結(jié)語

今后我們遇到類似的問題可利用apache Hadoop的優(yōu)點,在處理大型數(shù)據(jù)集時。檢驗其可行性和方法的有效性,并利用AIS的實際數(shù)據(jù)進行實驗。根據(jù)實驗結(jié)果,提出的方法有兩個好處:(1)方法優(yōu)于傳統(tǒng)的gis桌面應(yīng)用程序在快速處理大量ais數(shù)據(jù)以生成船舶軌跡可視化。(2)僅僅通過實現(xiàn)了一個簡單的算法,就能夠在相對廣闊的海域預測船舶的航行行為。但是,仍然有很多需要改進的工作, 如更先進的算法,其中在預測中使用的每個參數(shù)都分配了適當?shù)臋?quán)重,以便預測精度可以提高。

參考文獻:

[1]Ariel Cary,“在大型空間數(shù)據(jù)庫中擴展地理空間搜索”,佛羅里達國際大學,2011年.

[2]Hadoop權(quán)威指南:大數(shù)據(jù)的存儲與分析(第4版) Tom White著 2017年.

[3]Hadoop大數(shù)據(jù)實戰(zhàn)權(quán)威指南 黃東軍 編著2017-07-01.

猜你喜歡
目的地航行可視化
基于CiteSpace的足三里穴研究可視化分析
向目的地進發(fā)
戀愛中的城市
基于Power BI的油田注水運行動態(tài)分析與可視化展示
到慧骃國的航行
迷宮彎彎繞
基于CGAL和OpenGL的海底地形三維可視化
“融評”:黨媒評論的可視化創(chuàng)新
動物可笑堂
小舟在河上航行
攀枝花市| 扎鲁特旗| 滨海县| 南江县| 武平县| 乳源| 新安县| 福海县| 铜山县| 南溪县| 合作市| 遂昌县| 大渡口区| 禄丰县| 绿春县| 申扎县| 开远市| 勐海县| 安顺市| 定边县| 巴楚县| 罗甸县| 临澧县| 庆云县| 罗山县| 齐齐哈尔市| 望江县| 新沂市| 华阴市| 屏南县| 莎车县| 宁津县| 锡林浩特市| 河池市| 洛浦县| 肇源县| 广饶县| 华坪县| 长沙市| 南靖县| 汉寿县|