国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于特征選擇和神經(jīng)網(wǎng)絡(luò)的鐵路貨運(yùn)量預(yù)測(cè)

2018-09-20 08:23
物流技術(shù) 2018年9期
關(guān)鍵詞:貨運(yùn)量特征選擇神經(jīng)元

(華中科技大學(xué) 土木工程與力學(xué)學(xué)院,湖北 武漢 430074)

1 引言

鐵路貨運(yùn)量是確定鐵路基礎(chǔ)設(shè)施建設(shè)規(guī)模、安排貨物運(yùn)輸計(jì)劃的重要依據(jù),是鐵路貨運(yùn)市場(chǎng)體系的重要指標(biāo)。貨運(yùn)量預(yù)測(cè)的準(zhǔn)確性對(duì)制定未來(lái)鐵路貨運(yùn)發(fā)展戰(zhàn)略、貨運(yùn)設(shè)施的投資和效益都有著重要的意義。鐵路貨運(yùn)部門一直力圖及時(shí)、準(zhǔn)確地對(duì)鐵路貨運(yùn)量進(jìn)行預(yù)測(cè)和分析。鐵路貨運(yùn)體系是一個(gè)復(fù)雜系統(tǒng),受社會(huì)、經(jīng)濟(jì)、自然等多種因素的綜合影響,鐵路貨運(yùn)量是一個(gè)非線性時(shí)間序列,這就導(dǎo)致了建立預(yù)測(cè)模型十分困難。

就整個(gè)交通預(yù)測(cè)問(wèn)題而言,已經(jīng)有了大量研究成果。大體可以把它們分為兩類[1-2]:一類是動(dòng)力模型,包括時(shí)間序列模型、卡爾曼濾波模型、參數(shù)回歸模型、指數(shù)平滑模型等;另一類是統(tǒng)計(jì)模型,包括非參數(shù)回歸模型、KARIMA算法、基于小波理論的方法、基于多維分形的方法、譜分析法、狀態(tài)空間重構(gòu)模型和神經(jīng)網(wǎng)絡(luò)模型等。前者試圖在預(yù)測(cè)依據(jù)與預(yù)測(cè)對(duì)象之間建立明確的函數(shù)解析式關(guān)系,后者主要通過(guò)對(duì)數(shù)據(jù)的學(xué)習(xí),發(fā)現(xiàn)預(yù)測(cè)依據(jù)與預(yù)測(cè)對(duì)象之間的多層嵌套的相關(guān)性,并不追求嚴(yán)格的數(shù)學(xué)形式和明確的物理意義,而更重視對(duì)預(yù)測(cè)對(duì)象的擬合效果。

無(wú)論采用何種預(yù)測(cè)模型,若僅僅依據(jù)被預(yù)測(cè)對(duì)象自身的時(shí)間序列數(shù)據(jù)進(jìn)行預(yù)測(cè),則預(yù)測(cè)精度達(dá)不到預(yù)期效果,畢竟單變量的時(shí)間序列提供的信息是有限的。考慮到多變量時(shí)間序列包含更豐富的預(yù)測(cè)對(duì)象所隸屬的系統(tǒng)相關(guān)信息,能重構(gòu)出更為準(zhǔn)確的相空間,引入除預(yù)測(cè)對(duì)象以外的其他指標(biāo)構(gòu)成多維時(shí)間序列,可體現(xiàn)預(yù)測(cè)對(duì)象受多種因素共同驅(qū)動(dòng)的本質(zhì)[3-5]。

有一些學(xué)者已經(jīng)將多維時(shí)間序列用于交通預(yù)測(cè),例如用于交通事故預(yù)測(cè)[6]、駕駛狀態(tài)檢測(cè)[7]、交通流狀態(tài)預(yù)測(cè)[8]以及短時(shí)交通流量預(yù)測(cè)[9]。其中,文獻(xiàn)[6-8]采用的是分段線性回歸的方法,與非線性預(yù)測(cè)仍有較大差異。文獻(xiàn)[9]采用了相空間重構(gòu)方法,在理論上較為先進(jìn),但基于貝葉斯的相點(diǎn)融合在應(yīng)用上十分繁瑣。

作為一種經(jīng)典的統(tǒng)計(jì)學(xué)習(xí)模型,人工神經(jīng)網(wǎng)絡(luò)可以任意逼近復(fù)雜函數(shù),因此,它在時(shí)間序列的學(xué)習(xí)和預(yù)測(cè)中具有天然的優(yōu)勢(shì)。正因如此,神經(jīng)網(wǎng)絡(luò)在交通預(yù)測(cè)領(lǐng)域得到廣泛應(yīng)用,例如,朱中[10]等人采用神經(jīng)網(wǎng)絡(luò)實(shí)時(shí)預(yù)測(cè)交叉口的交通流量;譚滿春[11]等人將自回歸求和滑動(dòng)平均與人工神經(jīng)網(wǎng)絡(luò)組合模型用于短時(shí)交通流預(yù)測(cè)。這些研究屬于早期研究,受數(shù)據(jù)來(lái)源的限制,神經(jīng)網(wǎng)絡(luò)所處理的是單個(gè)時(shí)間序列而不是多維時(shí)間序列。利用神經(jīng)網(wǎng)絡(luò)對(duì)多維時(shí)間序列進(jìn)行學(xué)習(xí)和預(yù)測(cè)可較為輕松地取得較好的效果[12]。一方面,神經(jīng)網(wǎng)絡(luò)具有強(qiáng)大的特征提取與抽象能力,能夠整合多維信息,處理異構(gòu)數(shù)據(jù),捕捉變化動(dòng)態(tài),是分析多維數(shù)據(jù)的有力工具;另一方面,多維數(shù)據(jù)也可為神經(jīng)網(wǎng)絡(luò)提供充足的訓(xùn)練樣本。但是,如何明確神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和大小,以及如何克服數(shù)據(jù)中的矛盾和錯(cuò)誤對(duì)神經(jīng)網(wǎng)絡(luò)訓(xùn)練和學(xué)習(xí)造成的干擾仍然未得到解決。

本文將基于神經(jīng)網(wǎng)絡(luò)的時(shí)間序列預(yù)測(cè)分為兩個(gè)階段。第一階段,對(duì)輸入神經(jīng)網(wǎng)絡(luò)的指標(biāo)項(xiàng)進(jìn)行特征選擇。首先,對(duì)指標(biāo)項(xiàng)進(jìn)行篩選,降低時(shí)間序列的維數(shù),只保留與鐵路貨運(yùn)量具有較強(qiáng)相關(guān)性的那些指標(biāo)。然后,對(duì)所保留的指標(biāo)項(xiàng)進(jìn)行模糊聚類,以增強(qiáng)那些與除鐵路貨運(yùn)量之外的其他指標(biāo)高度相關(guān)的指標(biāo)在神經(jīng)網(wǎng)絡(luò)訓(xùn)練和預(yù)測(cè)中的作用。第二階段,建立基于廣義回歸神經(jīng)網(wǎng)絡(luò)(GRNN)的預(yù)測(cè)模型。經(jīng)由廣州市的年報(bào)統(tǒng)計(jì)數(shù)據(jù)驗(yàn)證,將特征選擇與基于GRNN的預(yù)測(cè)模型相結(jié)合,會(huì)大大提高預(yù)測(cè)精度。

2 特征選擇

2.1 指標(biāo)篩選

神經(jīng)網(wǎng)絡(luò)建模所需的信息完全由訓(xùn)練樣本提供,這就決定了建模效果的好壞依賴于訓(xùn)練樣本的數(shù)量和質(zhì)量[13]。通常情況下多維時(shí)間序列具有較多特征指標(biāo),由于特征空間維數(shù)較大,使得多維時(shí)間序列預(yù)測(cè)存在“維數(shù)災(zāi)難”的問(wèn)題。因此選取對(duì)預(yù)測(cè)具有一定作用的特征指標(biāo)是預(yù)測(cè)的前提和難點(diǎn)。特征選擇是指從原始特征集中選擇使某種評(píng)估標(biāo)準(zhǔn)最優(yōu)的特征子集,是一種常見(jiàn)的降維方法,其目的是使選出的最優(yōu)特征子集所構(gòu)建的分類或回歸模型達(dá)到和特征選擇前近似甚至更好的預(yù)測(cè)精度。

本文首先對(duì)各項(xiàng)指標(biāo)進(jìn)行篩選,只保留與鐵路貨運(yùn)量的線性相關(guān)性≥0.7的指標(biāo)。大量經(jīng)驗(yàn)表明,相關(guān)性在0.7以上即是具有較強(qiáng)的相關(guān)性[14]。相關(guān)性的計(jì)算公式:

式中:r—相關(guān)性系數(shù);y—鐵路貨運(yùn)量;—鐵路貨運(yùn)量均值;x—需要計(jì)算的指標(biāo);—需要計(jì)算指標(biāo)的均值。

2.2 指標(biāo)的模糊聚類

2.2.1 模糊聚類方法。大多數(shù)事物的屬性并不是完全確定的,它們?cè)谛詰B(tài)和類屬方面存在著亦此亦彼的模糊性。模糊聚類允許對(duì)元素的分類存在交叉性,即允許一個(gè)元素同時(shí)出現(xiàn)在多個(gè)類中。對(duì)指標(biāo)進(jìn)行模糊聚類,本質(zhì)上是允許指標(biāo)的相似性和差異性同時(shí)存在,以抵消指標(biāo)之間的矛盾給訓(xùn)練神經(jīng)網(wǎng)絡(luò)帶來(lái)的干擾。多維時(shí)間序列中的矛盾很多,對(duì)指標(biāo)進(jìn)行聚類顯得尤為必要。

對(duì)隸屬度的計(jì)算方法有很多種,本文假定各指標(biāo)之間的相關(guān)性就是隸屬度,相關(guān)系數(shù)越接近1則隸屬度越強(qiáng)。隸屬度(相關(guān)性)可作為對(duì)集合中的元素進(jìn)行分類的標(biāo)準(zhǔn)[15]。設(shè)指標(biāo)集合X={x1,x2,x3,x4,x5},根據(jù)X中各元素的相關(guān)性給出模糊相似關(guān)系R,由于模糊相似關(guān)系滿足自反性與對(duì)稱性,所以其對(duì)應(yīng)的矩陣主對(duì)角線上全部為1,且具有對(duì)稱性。模糊相似矩陣如圖1所示。取截集水平λ=0.7,令圖1矩陣中大于等于λ的值變?yōu)?,小于λ的值變?yōu)?,如圖2所示。根據(jù)圖2中的矩陣所反映的相關(guān)關(guān)系,可將X中的元素分為{x1,x2}、{x1,x4}、{x2,x3}、{x2,x5}四類。

圖1 模糊相似矩陣

圖2 截集矩陣

2.2.2 模糊聚類步驟。與鐵路貨運(yùn)量相關(guān)的若干個(gè)指標(biāo)之間并不一定兩兩相關(guān),所以把類中各指標(biāo)必須兩兩相關(guān)作為分類的標(biāo)準(zhǔn),以保證類中的指標(biāo)較為緊湊。在進(jìn)行模糊聚類時(shí),搜索起點(diǎn)采用隨機(jī)選取,搜索方向使用前向搜索,即初始集合為空集S,隨機(jī)選取初始指標(biāo)后按照一定的搜索順序從未包含在S的指標(biāo)集中按照一定規(guī)則選取新的指標(biāo)加入S構(gòu)成一個(gè)類。搜索策略采用隨機(jī)搜索,即選擇特征的順序?yàn)殡S機(jī)順序。停止準(zhǔn)則是當(dāng)所有特征都進(jìn)行分類后則結(jié)束模糊聚類。聚類過(guò)程如下:

(1)從全部指標(biāo)項(xiàng)中隨機(jī)選取一項(xiàng)作為初始類的第一個(gè)元素。

(2)把剩下的指標(biāo)按照隨機(jī)順序依次與已有類中的每一個(gè)指標(biāo)比較相關(guān)系數(shù),若相關(guān)系數(shù)都≥λ則將該指標(biāo)添加進(jìn)這個(gè)類中,若不滿足則不對(duì)該指標(biāo)進(jìn)行分類。

(3)檢查是否所有指標(biāo)都進(jìn)行了分類,若是,則結(jié)束聚類;若否,則分別計(jì)算所有未分類指標(biāo)與已分類指標(biāo)的距離,即相關(guān)系數(shù)之和。選取距離最遠(yuǎn)的未分類指標(biāo)作為新類的第一個(gè)元素并且返回第(2)步。

由于聚類時(shí)挑選指標(biāo)的順序存在隨機(jī)性,因此每次聚類結(jié)果不完全相同,但經(jīng)過(guò)多次分類發(fā)現(xiàn),每次分類的數(shù)量和類中的指標(biāo)數(shù)量均較為穩(wěn)定。

3 基于GRNN的時(shí)間序列預(yù)測(cè)模型

3.1 GRNN模型

鑒于政府統(tǒng)計(jì)部門所提供的年報(bào)數(shù)據(jù)含特征項(xiàng)數(shù)量較多而年份項(xiàng)數(shù)量較少,本文選用具有學(xué)習(xí)速率快、人為確定參數(shù)少特點(diǎn)的廣義回歸神經(jīng)網(wǎng)絡(luò)(GRNN)建立學(xué)習(xí)和預(yù)測(cè)模型。GRNN收斂于樣本量積聚較多的優(yōu)化回歸面,并且在樣本數(shù)據(jù)較少時(shí),預(yù)測(cè)效果也較好。而另一種常見(jiàn)的神經(jīng)網(wǎng)絡(luò)—BP神經(jīng)網(wǎng)絡(luò),在訓(xùn)練時(shí)存在收斂速度慢和容易陷入局部極小的缺點(diǎn)。

廣義回歸神經(jīng)網(wǎng)絡(luò)(GRNN)由四層構(gòu)成,分別為輸入層、模式層、求和層和輸出層。當(dāng)一個(gè)神經(jīng)網(wǎng)絡(luò)模型“學(xué)習(xí)”得到輸入和輸出變量的關(guān)系之后,即可用于對(duì)給定輸入的預(yù)測(cè)。一個(gè)預(yù)測(cè)樣本個(gè)數(shù)為N、預(yù)測(cè)樣本輸入量維數(shù)為M、預(yù)測(cè)樣本輸出量維數(shù)為K的GRNN結(jié)構(gòu)如圖3所示。

圖3 廣義回歸神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖

(1)輸入層。輸入層接收樣本的輸入,即預(yù)測(cè)年份的除鐵路貨運(yùn)量以外的其他各項(xiàng)指標(biāo),將它們歸一化后通過(guò)線性函數(shù)直接傳遞給模式層。

(2)模式層。模式層中的神經(jīng)元為徑向基神經(jīng)元,其個(gè)數(shù)與訓(xùn)練樣本數(shù)相同。模式層的本質(zhì)是利用徑向基函數(shù)計(jì)算預(yù)測(cè)樣本與訓(xùn)練向量之間的相似程度。它接受輸入層的輸出向量xn=[xn,1,xn,2…xn,M]T,然后計(jì)算輸入向量xn與該層訓(xùn)練向量的歐氏距離‖dist‖,訓(xùn)練向量為cj=[cj,1,cj,2…cj,M]T(其中j表示第j個(gè)神經(jīng)元)。

式中:xn-第n個(gè)輸入樣本;cj-第j個(gè)徑向基神經(jīng)元訓(xùn)練向量。

最后,以輸入向量和訓(xùn)練向量之間的距離‖‖dist作為自變量傳遞給該神經(jīng)元的激活函數(shù)。徑向基神經(jīng)元的激活函數(shù)采用徑向基函數(shù),通常定義為空間任一點(diǎn)到某一中心之間的歐氏距離的單調(diào)函數(shù),一般表達(dá)式為:

徑向基神經(jīng)元中常用的徑向基函數(shù)是高斯函數(shù),因此徑向基神經(jīng)元的激活函數(shù)可表示為:

式中:xn-第n個(gè)輸入樣本;cj-第j個(gè)徑向基神經(jīng)元訓(xùn)練向量;σ-高斯函數(shù)的方差,即光滑因子。

則第n個(gè)輸入樣本的第j個(gè)神經(jīng)元的輸出值即Pn,j=R(xn-cj)。其中σ由人為確定。

(3)求和層。求和層包括兩種類型神經(jīng)元,其中一類為分母單元,另一類為分子單元。分母單元是對(duì)模式層的輸出進(jìn)行算術(shù)求和,模式層各神經(jīng)元與分母單元神經(jīng)元的連接權(quán)值為1,其輸出為:

式中:Pnj-第n個(gè)輸入樣本的第j個(gè)神經(jīng)元的輸出值。

分子單元是對(duì)所有模式層神經(jīng)元的輸出進(jìn)行加權(quán)求和,求和神經(jīng)元的個(gè)數(shù)為預(yù)測(cè)樣本輸出向量的維數(shù)K,在本例中需要預(yù)測(cè)的只有鐵路貨運(yùn)量即K=1。分子單元與模式層神經(jīng)元的連接權(quán)重為訓(xùn)練向量中當(dāng)年的鐵路貨運(yùn)量yj,即wj,k=yj。分子求和神經(jīng)元的輸出為:

式中:Pn,j-第n個(gè)輸入樣本的第j個(gè)神經(jīng)元的輸出值;wj,k-第k個(gè)分子單元與第j個(gè)模式層神經(jīng)元的連接權(quán)重。

(4)輸出層。所謂輸出就是預(yù)測(cè)結(jié)果。輸出層中的神經(jīng)元個(gè)數(shù)等于預(yù)測(cè)樣本中輸出向量的維數(shù)K,這里只有鐵路貨運(yùn)量需要預(yù)測(cè),所以K=1。神經(jīng)元將求和層的分子單元輸出除以分母單元輸出,得輸出層神經(jīng)元的鐵路貨運(yùn)量輸出為:

式中:yn-第n個(gè)預(yù)測(cè)樣本的鐵路貨運(yùn)量預(yù)測(cè)值;Sn-第n個(gè)預(yù)測(cè)樣本的分子單元輸出;STn-第n個(gè)預(yù)測(cè)樣本的分母單元輸出。

從廣義回歸神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)可以看出,其實(shí)質(zhì)就是能夠?qū)崿F(xiàn)不同模式下的局部響應(yīng),從而達(dá)到全局逼近的訓(xùn)練效果。因此廣義回歸神經(jīng)網(wǎng)絡(luò)可進(jìn)行模式識(shí)別下的預(yù)測(cè)。

3.2 模糊聚類對(duì)于GRNN的作用

需要指出,對(duì)指標(biāo)進(jìn)行模糊聚類與構(gòu)建模糊神經(jīng)網(wǎng)絡(luò)是兩種不同的技術(shù)方法。前者將具有較高相關(guān)性的指標(biāo)歸為一類,旨在梳理數(shù)據(jù)空間本身的結(jié)構(gòu)。后者將模糊規(guī)則引入神經(jīng)網(wǎng)絡(luò),使網(wǎng)絡(luò)的訓(xùn)練過(guò)程具有模糊性。由于GRNN的實(shí)質(zhì)是度量某個(gè)樣本與其他樣本之間的相似性,而樣本之間的相似性本來(lái)就不互相排斥,所以,GRNN等價(jià)于模糊神經(jīng)網(wǎng)絡(luò),沒(méi)有必要再通過(guò)模糊化來(lái)提高對(duì)訓(xùn)練樣本的兼容性。

雖然GRNN具有等價(jià)于模糊神經(jīng)網(wǎng)絡(luò)的功能,但樣本內(nèi)部數(shù)據(jù)本身的矛盾,仍會(huì)影響GRNN的效果。相互矛盾的數(shù)據(jù)將對(duì)計(jì)算樣本之間的距離造成影響,而神經(jīng)網(wǎng)絡(luò)的模糊化不能解決數(shù)據(jù)樣本本身的矛盾,可以通過(guò)對(duì)訓(xùn)練樣本進(jìn)行模糊聚類來(lái)解決這個(gè)問(wèn)題。

聚類使導(dǎo)致矛盾的異常數(shù)據(jù)落入少數(shù)幾個(gè)類甚至是1個(gè)類中,降低了它們?cè)谟?xùn)練中出現(xiàn)的次數(shù)和影響,同時(shí)增加關(guān)聯(lián)性較強(qiáng)的數(shù)據(jù)出現(xiàn)的次數(shù)和影響。神經(jīng)網(wǎng)絡(luò)的優(yōu)勢(shì)是經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化[14],聚類的本質(zhì)是降低數(shù)據(jù)帶來(lái)的結(jié)構(gòu)風(fēng)險(xiǎn),恰好彌補(bǔ)了神經(jīng)網(wǎng)絡(luò)固有的不足。

4 預(yù)測(cè)案例

4.1 數(shù)據(jù)預(yù)處理

廣州市1999至2015年的宏觀年報(bào)共統(tǒng)計(jì)了人口、產(chǎn)業(yè)、物價(jià)指數(shù)、投資、消費(fèi)、運(yùn)輸與郵電等方面的1 294項(xiàng)指標(biāo),為避免其中部分指標(biāo)在部分年份缺失對(duì)神經(jīng)網(wǎng)絡(luò)訓(xùn)練效果的影響,只選用了缺失年份少于等于2年的906個(gè)指標(biāo)。再按與鐵路貨運(yùn)量線性相關(guān)性≥0.7的標(biāo)準(zhǔn),最后保留92項(xiàng)指標(biāo)。將兩兩之間線性相關(guān)性≥0.7的指標(biāo)歸入一類,92項(xiàng)指標(biāo)共被分為15個(gè)不同的類,每一類的元素個(gè)數(shù)從幾個(gè)到幾十個(gè)不等。為了描述方便,將1號(hào)指標(biāo)設(shè)置為鐵路貨運(yùn)量。

數(shù)據(jù)在輸入神經(jīng)網(wǎng)絡(luò)前需要被歸一化處理,這里使用最大-最小標(biāo)準(zhǔn)化公式對(duì)每一數(shù)據(jù)項(xiàng)的時(shí)間序列進(jìn)行歸一化處理:

式中:A-需要?dú)w一化的指標(biāo);x-指標(biāo)中的年份數(shù)據(jù);x'-指標(biāo)中歸一化后的年份數(shù)據(jù)。

在進(jìn)行歸一化處理后,以廣州市1999-2009年11年間的數(shù)據(jù)作為11個(gè)訓(xùn)練樣本,并以當(dāng)年鐵路貨運(yùn)量為目標(biāo),以2010-2015年6年間的數(shù)據(jù)作為預(yù)測(cè)樣本,預(yù)測(cè)相應(yīng)年份的鐵路貨運(yùn)量并計(jì)算誤差。

4.2 預(yù)測(cè)結(jié)果

為說(shuō)明特征選擇的作用,分別將進(jìn)行指標(biāo)篩選和模糊聚類、進(jìn)行指標(biāo)篩選但不模糊聚類、未進(jìn)行指標(biāo)篩選但模糊聚類、未進(jìn)行指標(biāo)篩選和未模糊聚類四種不同的特征選擇方案的結(jié)果輸入GRNN網(wǎng)絡(luò)進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果如圖4所示,四種特征選擇方案所對(duì)應(yīng)的預(yù)測(cè)誤差見(jiàn)表1。

表1 不同特征選擇方案對(duì)應(yīng)的預(yù)測(cè)誤差

圖4 鐵路貨運(yùn)量預(yù)測(cè)結(jié)果

當(dāng)特征選擇手段既包括指標(biāo)篩選又包括模糊聚類時(shí),根據(jù)指標(biāo)所分成的15個(gè)類共得到15個(gè)不同的預(yù)測(cè)結(jié)果,取平均值得到最后鐵路貨運(yùn)量的預(yù)測(cè)結(jié)果。

當(dāng)特征選擇不進(jìn)行模糊聚類分析,直接將篩選過(guò)后留下的92項(xiàng)線性相關(guān)指標(biāo)帶入神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練時(shí),神經(jīng)網(wǎng)絡(luò)沒(méi)有給出有效的預(yù)測(cè)值。

當(dāng)特征選擇對(duì)指標(biāo)不進(jìn)行篩選但進(jìn)行模糊聚類時(shí),906項(xiàng)指標(biāo)共被分為154個(gè)不同的類,每一類的元素個(gè)數(shù)從1個(gè)到幾百個(gè)不等。由于此時(shí)數(shù)據(jù)樣本數(shù)量較少,但類的個(gè)數(shù)很多,進(jìn)行預(yù)測(cè)時(shí),對(duì)所有類取同一光滑因子σ將產(chǎn)生問(wèn)題。較小的σ導(dǎo)致神經(jīng)網(wǎng)絡(luò)擬合能力較好,但外推預(yù)測(cè)效果較差,較大的σ會(huì)使那些與鐵路貨運(yùn)量之間存在簡(jiǎn)單對(duì)應(yīng)關(guān)系的類所產(chǎn)生的預(yù)測(cè)結(jié)果的精度不夠。因此,難以找到一個(gè)適合所有類的光滑因子σ。

當(dāng)特征選擇未對(duì)指標(biāo)進(jìn)行篩選和未模糊聚類時(shí),直接將906項(xiàng)數(shù)據(jù)項(xiàng)帶入神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)。訓(xùn)練樣本數(shù)量較少且維數(shù)較大,存在數(shù)據(jù)錯(cuò)誤和數(shù)據(jù)矛盾,神經(jīng)網(wǎng)絡(luò)幾乎沒(méi)有預(yù)測(cè)效果。

由圖4和表1可以看出,采用既數(shù)據(jù)項(xiàng)篩選又模糊聚類的特征選擇方法能使神經(jīng)網(wǎng)絡(luò)對(duì)鐵路貨運(yùn)量進(jìn)行有效的預(yù)測(cè)。

5 結(jié)論

鐵路貨運(yùn)量是鐵路基礎(chǔ)設(shè)施投資建設(shè)、安排貨物運(yùn)輸計(jì)劃的重要依據(jù)。本文首先簡(jiǎn)述了傳統(tǒng)鐵路貨運(yùn)量預(yù)測(cè)方法的不足以及多項(xiàng)指標(biāo)構(gòu)成多維時(shí)間序列對(duì)預(yù)測(cè)帶來(lái)的數(shù)據(jù)融合問(wèn)題。然后介紹了在將數(shù)據(jù)輸入基于廣義回歸神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型之前,采用數(shù)據(jù)篩選和模糊聚類相結(jié)合的特征選擇方法。指標(biāo)篩選保證了指標(biāo)與鐵路貨運(yùn)量之間的相關(guān)性,指標(biāo)聚類則增強(qiáng)了那些與其他指標(biāo)高度相關(guān)的指標(biāo)在神經(jīng)網(wǎng)絡(luò)訓(xùn)練和預(yù)測(cè)中的作用。

將廣州市1999至2009年的1 294項(xiàng)年報(bào)指標(biāo)進(jìn)行篩選和模糊聚類后,保留其中92項(xiàng),并將它們分為15類,然后輸入廣義回歸神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,對(duì)2010至2015年的鐵路貨運(yùn)量進(jìn)行預(yù)測(cè),誤差在1.5%-8.2%之間。同時(shí),本文從反面驗(yàn)證了不進(jìn)行數(shù)據(jù)篩選或不模糊聚類的特征選擇方法將使預(yù)測(cè)結(jié)果產(chǎn)生較大誤差,說(shuō)明進(jìn)行指標(biāo)篩選和模糊聚類的特征選擇對(duì)于基于廣義回歸神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型是非常必要的。

猜你喜歡
貨運(yùn)量特征選擇神經(jīng)元
躍動(dòng)的神經(jīng)元——波蘭Brain Embassy聯(lián)合辦公
2017年上半年拉脫維亞港口貨運(yùn)量同比增長(zhǎng)7%
Kmeans 應(yīng)用與特征選擇
聯(lián)合互信息水下目標(biāo)特征選擇算法
基于特征選擇聚類方法的稀疏TSK模糊系統(tǒng)
ERK1/2介導(dǎo)姜黃素抑制STS誘導(dǎo)神經(jīng)元毒性損傷的作用
毫米波導(dǎo)引頭預(yù)定回路改進(jìn)單神經(jīng)元控制
側(cè)腦室注射DIDS對(duì)缺血再灌注腦損傷大鼠神經(jīng)元凋亡的拮抗作用
基于特征選擇和RRVPMCD的滾動(dòng)軸承故障診斷方法
璧山县| 汝城县| 甘肃省| 神木县| 闽侯县| 锡林浩特市| 南通市| 日土县| 游戏| 卫辉市| 长武县| 三原县| 瓮安县| 沙湾县| 精河县| 永康市| 安泽县| 吴忠市| 夹江县| 原阳县| 漳州市| 延寿县| 陈巴尔虎旗| 阜新市| 曲阳县| 永宁县| 玉环县| 会东县| 南宫市| 林周县| 上犹县| 女性| 西乌珠穆沁旗| 内江市| 东乡| 鸡东县| 通州市| 桐乡市| 沧州市| 银川市| 宁乡县|