国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于改進廣義回歸神經(jīng)網(wǎng)絡(luò)的漁船流量預測

2021-01-18 04:37蔣慶朝陳孟婕
現(xiàn)代計算機 2020年33期
關(guān)鍵詞:交通流量廣義漁船

蔣慶朝,陳孟婕

(中國水產(chǎn)科學研究院漁業(yè)工程研究所,北京 100141)

0 引言

近年來,隨著我國漁業(yè)和水運的迅猛發(fā)展,漁船的數(shù)量也越來越多,對交通繁忙的水道產(chǎn)生了極大的壓力,使得許多港口的船舶交通流量猛增,航道變得擁擠,船舶在港等候時間和非作業(yè)時間延長,造成水上事故頻發(fā),產(chǎn)生了大量的經(jīng)濟損失。因此,為了提高漁港的調(diào)度管理和規(guī)劃設(shè)計,必須建立一個船舶流量的預測模型[1]。

漁港船舶交通流量是指在一定時間內(nèi)通過港口的所有船舶數(shù)量。交通流量越大,說明漁港的交通越繁忙。通過流量統(tǒng)計可以掌握漁船具體的進出港動態(tài)以及錨泊信息,了解航道的擁堵情況,并且可以根據(jù)流量統(tǒng)計信息,對水道的規(guī)劃設(shè)計以及船舶的管理進行優(yōu)化,合理分配資源[2]。船舶交通流量的預測一般基于統(tǒng)計的方法,可以分為定性和定量兩種[3]。其中,定性方法是依靠過往經(jīng)驗人為的對流量進行分析預測,例如經(jīng)驗分析和專家判斷。因此,這種方法的預測結(jié)果在細節(jié)上比較模糊,預測的準確性不高。定量預測方法則是采用數(shù)學模型對歷史數(shù)據(jù)進行分析計算而得到具體數(shù)值的方法。通常有回歸分析法[4]、灰色分析法、神經(jīng)網(wǎng)絡(luò)方法[5]以及組合預測模型。回歸分析法是一種數(shù)理統(tǒng)計方法,建立了因變量和自變量之間的函數(shù)關(guān)系。自變量的選取會極大地影響預測結(jié)果的準確性,因此,需要先對變量的相關(guān)性進行分析,排除相關(guān)性較低的變量?;疑治龇ㄊ菑挠邢薜碾x散數(shù)據(jù)中找到規(guī)律,建立動態(tài)模型的方法。它可以通過少量的、離散的數(shù)據(jù),建立微分方程模型,對具有成長性的系統(tǒng)進行模糊性的長期預測。神經(jīng)網(wǎng)絡(luò)模型能充分逼近復雜的非線性關(guān)系,具有較高的容錯能力。BP神經(jīng)網(wǎng)絡(luò)是常用的預測模型,通過誤差因子的反饋調(diào)節(jié),逐漸減小誤差函數(shù)的值,獲得預測結(jié)果。組合預測模型是將多種定性與定量的方法相結(jié)合,綜合考慮了難以定量的影響因素來進行預測的方法[6]。

本文選擇廣義回歸神經(jīng)網(wǎng)絡(luò)(General Regression Neural Network)算法建立漁船進出港流量的預測模型[7]。針對歷史數(shù)據(jù)不斷增多以及GRNN適用于小樣本數(shù)據(jù)的特點,提出了一種基于聚類算法的改進模型,使改進后的GRNN模型也能適用于數(shù)據(jù)量較大的樣本。并且在模型中引入環(huán)境變量因素進行分析,提高預測結(jié)果的準確性。

1 原理與方法

1.1 廣義回歸神經(jīng)網(wǎng)絡(luò)

徑向基網(wǎng)絡(luò)是使用徑向基函數(shù)作為激活函數(shù)的神經(jīng)網(wǎng)絡(luò)模型,它是一種三層前饋神經(jīng)網(wǎng)絡(luò)。徑向基作為神經(jīng)元的隱含基,構(gòu)成了隱含空間的主要元素。在隱含層中可以改變輸入的向量,實現(xiàn)向量從低維到高維的映射,處理在低維度空間中難以解決的問題,從而整體上實現(xiàn)了非線性映射。而廣義回歸神經(jīng)網(wǎng)絡(luò)則是建立在非參數(shù)回歸的基礎(chǔ)上,徑向基網(wǎng)絡(luò)的一種模型,由一個徑向基網(wǎng)絡(luò)和一個線性網(wǎng)絡(luò)組成[8]。并且以樣本數(shù)據(jù)作為后驗條件,通過非參數(shù)估計方法計算概率密度函數(shù),獲得網(wǎng)絡(luò)的最大概率輸出。相較于徑向基神經(jīng)網(wǎng)絡(luò),廣義回歸網(wǎng)絡(luò)模型的訓練過程不需要迭代,不僅收斂速度更快,逼近非線性連續(xù)函數(shù)的精度更高,預測效果更好,而且具有全局逼近的性質(zhì)[9]。

GRNN在結(jié)構(gòu)上與徑向基網(wǎng)絡(luò)比較相似。它由四層構(gòu)成,分別是輸入層、模式層、求和層和輸出層,其結(jié)構(gòu)如圖1所示。

圖1 廣義回歸神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

在GRNN的結(jié)構(gòu)中,輸入層的節(jié)點是簡單的分布單元,直接把輸入的變量傳遞到模式層,節(jié)點的數(shù)量等于輸入向量X={x1,x2,x3…xn}的維度。模式層的節(jié)點數(shù)量等于樣本的數(shù)量,每一個節(jié)點都對應一個樣本,節(jié)點i對應的傳遞函數(shù)為:

Xi是第i個節(jié)點對應的學習樣本,X是網(wǎng)絡(luò)輸入變量,節(jié)點i的傳遞函數(shù)表示的是學習樣本與輸入變量X之間歐氏距離平方的指數(shù)平方。求和層中有兩種類型的節(jié)點,每個節(jié)點都與模式層所有的點相連接:一類是模式層所有節(jié)點輸出的算術(shù)和,與模式層節(jié)點的連接權(quán)值為1,這種節(jié)點的數(shù)量為1;另一類節(jié)點是模式層所有節(jié)點的加權(quán)和,使用輸出樣本Y的值作為連接權(quán)值,節(jié)點的數(shù)量與輸出樣本Y的維度相同。輸出層節(jié)點數(shù)量與輸出樣本Y的維度相同,每一個節(jié)點計算的是求和層中兩種節(jié)點相除的商,對應輸出結(jié)果中相應的元素,最終獲得網(wǎng)絡(luò)期望的輸出值[10]。

廣義回歸神經(jīng)網(wǎng)絡(luò)的原理是參數(shù)最大似然估計,利用密度函數(shù)來預測輸出[11]。假設(shè)x,y是兩個隨機變量,他們的聯(lián)合概率密度函數(shù)為f(x,y),若是已知x的觀測值為x0,則y的在x條件下的回歸為:

若概率密度函數(shù)f(x0,y)已知的情況下,則可以得到x0對應的估計值y,應用Parzen非參數(shù)估計,估算密度函數(shù)f(x0,y)。

公式(3)中n為數(shù)據(jù)集的樣本數(shù)量,σ為光滑因子。用式(3)的f(x0,y)代替f(x,y),并進行化簡,可得:

從公式(4)可以看出,對于y的估值,可以認為是所有觀測值的加權(quán)和。廣義回歸神經(jīng)網(wǎng)絡(luò)不需要訓練,并且回歸曲線的光滑程度由光滑因子控制。如果光滑因子取值非常大,y的估值接近于所有樣本因變量的平均值,如果光滑因子取值趨向于0,估計值就越接近學習樣本的值,觀測的誤差值也就越小。因此,選擇一個合適的光滑因子σ就可以確定一個適用廣泛的廣義神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)。本文采用模擬退火法尋找最優(yōu)的光滑因子。它是一種通用的概率算法,尋找全局的最優(yōu)解,并且在搜索過程中引入隨機因素。核心是利用具有概率突跳特性的抽樣策略進行隨機的搜索,以一定的概率接受比現(xiàn)在解更差的結(jié)果,隨著反復抽樣的過程,算法有可能跳出局部的極值點,在其鄰范圍繼續(xù)求解,最終達到全局的最優(yōu)解。

1.2 改進的廣義回歸神經(jīng)網(wǎng)絡(luò)

GRNN具有很強的非線性映射能力和學習速度,并且對于小樣本數(shù)據(jù)有很好的預測效果。但是在實際預測中,樣本數(shù)據(jù)逐年增多,這使得它的計算復雜度和空間復雜度高的缺點也暴露出來。因此,本文提出了一種基于聚類方法的改進廣義回歸神經(jīng)網(wǎng)絡(luò)模型,提高對大量樣本的預測效率和準確性。改進算法的核心是在樣本數(shù)據(jù)輸入網(wǎng)絡(luò)前進行聚類,然后從聚類結(jié)果里提取新的學習樣本。新樣本的數(shù)據(jù)規(guī)模相對于原始數(shù)據(jù)的規(guī)模較小,更加適用于GRNN模型的訓練[12-13]。

通過對采集的漁船進出港數(shù)據(jù)的特性進行分析,選擇基于密度的聚類算法(DBSCAN)對原始數(shù)據(jù)進行壓縮[14-15]。這種方法的優(yōu)點是能夠在有異常的數(shù)據(jù)中發(fā)現(xiàn)各種形狀和大小的簇,并且不需要預先設(shè)定簇的數(shù)量,因此適合不確定聚類最終數(shù)量的集合。DBSCAN的核心思想是尋找被低密度區(qū)域分割的高密度區(qū)域,只要一個區(qū)域中點的密度大于某個閾值,就把它放到相近的簇中,以獲得最終的聚類結(jié)果。算法中有兩個參數(shù),分別是點周圍鄰近區(qū)域的半徑eps和鄰近區(qū)域內(nèi)至少包含的點的個數(shù)MinPts[16]。根據(jù)這兩個參數(shù),可以把樣本中的數(shù)據(jù)分為三類。半徑eps內(nèi)點的數(shù)量超過MinPts數(shù)目的點稱為核心點;半徑內(nèi)點的數(shù)量小于MinPts但是在核心點的鄰域內(nèi)的點稱為邊界點;噪音點是不屬于核心點和邊界點的樣本。核心點鄰域內(nèi)所有的點都由核心點直接密度可達,而且其具有傳遞性,稱為密度可達,DBSCAN的目的就是找到密度相連對象的最大集合[17]。

改進的GRNN預測模型的流程步驟如下:

Step1對樣本進行歸一化處理,降低不同數(shù)據(jù)量綱對預測模型結(jié)果的影響。

Step2從樣本中任意選擇一個數(shù)據(jù),如果是核心點,則建立一個新的簇A,A包含核心點以及它鄰域內(nèi)的數(shù)據(jù)。

Step3對簇A中沒有標記的數(shù)據(jù)點q,如果它是一個核心點且直接密度可達的數(shù)據(jù)點不在A中,則加入到簇A中,直到A中所有的對象被標記。

Step4重復前兩個步驟直到所有對象被標記。然后提取每個簇的中心點作為新的樣本。

Step5把新的樣本數(shù)據(jù)輸入到GRNN的模式層。

Step6對輸入數(shù)據(jù)進行預測。

改進的GRNN算法除了平滑參數(shù)σ,還需要對參數(shù)eps和MinPts進行調(diào)整,使得獲取的樣本數(shù)量在合適的范圍,在減少誤差的情況下提高模型的效率。

2 預測與分析

2.1 漁船流量影響因素分析

漁船交通流量影響條件錯綜復雜,它的大小是經(jīng)濟、政策、運輸,甚至漁港本身硬件條件等多方面因素共同作用的結(jié)果,不能單一的從某個因素來預測交通流量的變化。并且不同的因素對漁船交通流量的影響方式各異,表現(xiàn)形式復雜,呈現(xiàn)出線性和非線性的相關(guān)性。一般船舶交通流量不僅與經(jīng)濟的繁榮程度有著密切的關(guān)系,而且還和貨運量以及船舶的數(shù)量有著直接的聯(lián)系。因此,以研究的漁港對象,對漁業(yè)統(tǒng)計年鑒,港口統(tǒng)計中的數(shù)據(jù)進行相關(guān)性分析,最終選取漁業(yè)生產(chǎn)總值、捕撈量、漁船總數(shù)、碼頭泊位擁有量、已在港漁船數(shù)量、日期作為預測漁港船舶交通流量的輸入變量。

在把變量輸入到神經(jīng)網(wǎng)絡(luò)之前,需要對各項數(shù)據(jù)進行歸一化處理,避免不同因素的量綱對預測結(jié)果產(chǎn)生影響,歸一化公式為:

其中x是需要歸一化處理的數(shù)據(jù),是標準化后神經(jīng)網(wǎng)絡(luò)的輸入樣本,xmax和xmin是這項因素中取極值的數(shù)據(jù)。

通過改進的神經(jīng)網(wǎng)絡(luò)模型獲取預測結(jié)果之后,需要對算法的性能進行評價。在本文研究中使用3個指標進行評測,分別是平均絕對預測誤差(MAPE,預測值與實際交通流量數(shù)據(jù)的平均絕對偏差值),平均相對預測誤差(MRPE)和均方根預測誤差(S),計算公式為:

yi是輸入樣本的實際觀測值,是輸入樣本的預測值,n是輸入樣本的總數(shù)量。

2.2 漁船交通流量預測分析

使用改進的廣義回歸神經(jīng)網(wǎng)絡(luò)對漁港船舶流量進行預測,預測結(jié)果如圖2所示。

圖2 基于改進廣義回歸神經(jīng)網(wǎng)絡(luò)漁船流量預測

在實驗中,構(gòu)建了另外2種模型進行預測,并且與改進的廣義回歸神經(jīng)網(wǎng)絡(luò)模型預測結(jié)果進行對比分析,其預測結(jié)果如圖3所示。

圖3 回歸分析法和BP神經(jīng)網(wǎng)絡(luò)漁船流量預測

表1是3種算法各自預測結(jié)果的性能指標平均絕對預測誤差MAPE、平均相對預測誤差MRPE以及均方根預測誤差S的對比。

表1 三種預測方法的性能對比

從表1和圖2、圖3可以看出,回歸分析法的準確程度最低,在預測過程中容易出現(xiàn)較大偏差,表現(xiàn)出不穩(wěn)定性。從3個評價指標來看,BP神經(jīng)網(wǎng)絡(luò)的預測精度和算法穩(wěn)定性都高于回歸分析法。而相對于回歸分析法和BP神經(jīng)網(wǎng)絡(luò)[18-19],本文提出的改進廣義回歸神經(jīng)網(wǎng)絡(luò)模型在預測結(jié)果上精度最高,并且因為縮小了樣本空間的規(guī)模,提高了網(wǎng)絡(luò)結(jié)構(gòu)的學習速度。

在實驗過程中,針對相關(guān)研究較少考慮自然環(huán)境對船舶流量的影響,在模型中又引入了天氣因素對漁船交通流量進行預測分析。預測結(jié)果如圖4所示。

圖4 融合新數(shù)據(jù)源的模型預測結(jié)果

與圖2進行對比,可以看出部分時期的預測雖然出現(xiàn)一些偏差,但是三項性能指標都得到提升,整體的預測精度更加準確。通過分析,3和4兩天天氣較為惡劣,進出漁港避風的船舶數(shù)量迅速增加,融合了新的數(shù)據(jù)源提高了模型預測的準確性和魯棒性。

3 結(jié)語

本文對漁港船舶進出港交通流量開展了預測研究,分析了影響交通流量的因素,并且針對預測模型廣義回歸神經(jīng)網(wǎng)絡(luò)在大數(shù)據(jù)樣本上應用的不足,提出了一種基于聚類方法的改進模型。通過對比回歸分析法和BP神經(jīng)網(wǎng)絡(luò)的預測結(jié)果,可以看出基于聚類的廣義回歸神經(jīng)網(wǎng)絡(luò)模型預測結(jié)果誤差較小,預測值精確度較高,在漁港船舶交通流量預測方面有巨大的應用潛力。研究針對的是短期船舶交通流量的預測,下一步會在長期預測領(lǐng)域上展開研究。

猜你喜歡
交通流量廣義漁船
The Last Lumberjacks
一類特別的廣義積分
任意半環(huán)上正則元的廣義逆
燕山路與曹雪芹西道交叉口運行有軌電車可行性研究
無人車對交通流的影響分析
交通流量增長下的空管安全預警系統(tǒng)研究
漁船上的謀殺
城市道路交叉口仿真評價及優(yōu)化配時
临湘市| 曲周县| 绥江县| 青龙| 肥西县| 内乡县| 仪陇县| 泸溪县| 宜良县| 集安市| 西乡县| 新沂市| 江津市| 霍林郭勒市| 乐平市| 渝中区| 乌审旗| 佛冈县| 武隆县| 合江县| 盈江县| 雷波县| 水富县| 桑日县| 同德县| 宁蒗| 磐石市| 泾川县| 雷州市| 德惠市| 吴桥县| 尖扎县| 大田县| 昌吉市| 师宗县| 松溪县| 卓尼县| 黑龙江省| 旬阳县| 霍城县| 叶城县|