歐陽帆
(交通運輸部水運局,北京 100736)
目前運量預測中應用得比較多的模型優(yōu)化方法是組合預測模型,它是綜合利用各種預測方法,如運輸彈性系數法、時間序列分析法、回歸分析方法、灰色模型預測等,以適當加權平均形式得出的綜合預測模型。其基本思路是:首先分別利用上述幾種單項預測模型得到幾組基礎預測值,通過比較各個預測值與原值之間的誤差,給定每組預測值的加權系數,最后通過加權平均得出最終的預測值。這種方法是一種線性的預測模型,存在一定的局限性,而且權重的分配也存在較大的主觀性,特別是當實際值與預測值存在非線性關系時,該模型就無法進行預測。
本文將探討人工神經網絡技術在運量預測中的可行性,通過建立非線性組合預測模型,并結合實例分析,研究基于人工神經網絡的運量預測模型的實用性。
人工神經網絡(Artificial Neural Network)是一種理論化的人腦神經網絡的數學模型,是基于模仿大腦神經網絡結構和功能而建立的一種信息處理系統,具有高度的非線性,能夠進行復雜的邏輯操作和非線性關系實現的系統。BP(Back-Propagation)神經網絡是一種前向型神經網絡,在人工神經網絡的實際應用中,有80%的人工神經網絡模型采用的是BP網絡或它的變化形式。由于BP算法具有強大的非線性映射能力,在許多實際應用中發(fā)揮了重要的作用[1]。
從結構上看,BP神經網絡是典型的多層網絡,分為輸入層、隱層和輸出層。其中,隱層可以有多層,層與層之間多采用權連接方式,同一層單元之間不存在相互連接。圖1給出了一個三層BP網絡結構。BP神經網絡模型實現了多層網絡學習的設想。當給定網絡的一個輸入模式時,它由輸入層單元傳到隱含層單元,經過隱含層單元逐個處理后,傳輸到輸出層單元,由輸出層單元處理產生一個輸出模式,將誤差值沿著連接通路逐層傳送并修正各層連接權值。對于給定的一組訓練模式,不斷用一個個訓練模式訓練網絡,重復前向傳播和誤差反向傳播過程,直到各個訓練模式都滿足要求。具體過程和算法如下[2]。
步驟1:初始化。輸入、輸出樣本為{xki,dk│k=1,2,…,n;i=1,2,…,ni}。其中,xki為輸入的樣本數據;dk為樣本數據的期望輸出;k為樣本容量,在樣本輸入時要對其進行歸一化處理,取值范圍限制在0~1之間。
步驟2:k=1,把樣本對(xki,dk)提供給網絡。步驟3:計算隱層各節(jié)點的輸入xj,輸出yj,其中j=1,2,…,nj。
步驟4:計算輸出層節(jié)點的輸入xk,輸出yk。
步驟5:計算單樣本點誤差Ek的變化率。
步驟6:修正各連接線的權值和閾值,計算公式略。
步驟7:k=k+1,重復步驟2~步驟6,直至網絡全局誤差E小于預先設定的一個較小值或學習次數大于預先設定的某個值,結束學習。
步驟8:對己經學習好的BP網絡加載檢驗樣本,輸出分析結果,至此BP算法運行結束。
目前,BP神經網絡模型的計算可以利用DPS、MATLAB等數據處理軟件來完成。
圖1所示為一個三層的BP網絡模型。
圖1 一個三層的BP網絡模型
利用BP神經網絡優(yōu)化進行預測優(yōu)化的思路與組合預測模型基本相同,只是加權通過BP神經網絡來完成。首先將各種單項預測方法的預測值作為BP神經網絡的輸入層,將代表相應年份的實際值作為輸出層,然后用足夠多的預測樣本訓練這個網絡,使不同的輸入向量得到相應的輸出值,從而在各參加組合的單項預測方法的預測結果與實際值之間建立一種非線性映射關系,經過不斷的學習及測試,滿足一定的精度要求之后,該網絡就可以作為非線性組合預測的有效工具,用于預測并得到最終預測結果[3]。
本文以1990~2009年全國水路貨物運輸量為實例進行具體說明。基礎數據見表1,表中數據來源于1991~2010年出版的《中國統計年鑒》。
表1 1990~2009年全國GDP與水路貨運量指標[4-23]
本文選取一元線性回歸模型、一次指數平滑法和灰色系統GM(1,1)模型分別建立預測模型,對原始數據進行預測,預測模型如下:
a)一元線性回歸模型(以GDP作為自變量,運量作為因變量);
b)一次指數平滑法,取α=0.98進行計算;
c)灰色系統GM(1,1)模型。
預測結果見表2。
表2 各預測模型的運量預測值及優(yōu)化值 單位:萬噸
表2(續(xù))
利用DPS統計軟件自帶的BP神經網絡模型進行計算,將2.1中3個模型的預測數據(1991~2009年)作為輸入量,選擇“標準化變換”(歸一化),隱層神經元數量取30(經多次訓練,發(fā)現神經元為30個左右時精度相對較高),訓練過程見圖2。訓練完畢得到最終預測優(yōu)化結果見表2,殘差為0.00082。由于得到的各層神經元的權重太多,這里就不再一一列舉了。
圖2 預測模型優(yōu)化的訓練過程
通過計算標準誤差與平均絕對百分比誤差,來反映不同模型的精確程度,計算方法如下[24]。
標準誤差(均方誤差):
平均絕對百分比誤差:
式中,σ為標準誤差;μ為平均百分比誤差;ε為單個預測值與實際值之間的誤差。
計算結果見表3。
表3 各預測模型的標準誤差
根據表3可知,采用基于BP神經網絡優(yōu)化的預測模型計算得出均方誤差為6523.37,平均絕對百分誤差為0.034824,均小于各單項預測方法的誤差值。由此證明,采用基于BP神經網絡的運量預測模型優(yōu)化了單項預測模型,提高了預測精度。
本文論述了BP神經網絡的理論,以及基于BP神經網絡的運量預測模型的優(yōu)化問題。以時間序列分析法、回歸分析方法、灰色模型預測方法為基礎,以1990~2009年全國水路貨物運量為樣本數據,充分利用BP神經網絡的非線性映射能力,建立實際運量發(fā)展趨勢與各種單項預測方法的有用信息之間的一種復雜的關聯,并通過數據的學習和訓練實現預測精度的提高。實例分析證明,基于BP神經網絡的運量預測優(yōu)化模型,能有效克服單個預測方法的局限性,更好地反映實際運量的發(fā)展情況,這種方法在運量預測中是可行的。但是,基于BP神經網絡進行預測優(yōu)化是以大量的歷史數據為前提的,在數據樣本較少的情況下,預測精度可能會受影響。
[1]易帆.神經網絡預測研究[D].成都:西南交通大學,2005.
[2]張慶年.交通運輸系統分析與優(yōu)化[Z].武漢:武漢理工大學,2005.
[3]宋玉強.人工神經網絡在時間序列預測中的應用研究[D].西安:西安建筑科技大學,2005.
[4]中華人民共和國國家統計局.中國統計年鑒[M].北京:中國統計出版社,1991.
[5]中華人民共和國國家統計局.中國統計年鑒[M].北京:中國統計出版社,1992.
[6]中華人民共和國國家統計局.中國統計年鑒[M].北京:中國統計出版社,1993.
[7]中華人民共和國國家統計局.中國統計年鑒[M].北京:中國統計出版社,1994.
[8]中華人民共和國國家統計局.中國統計年鑒[M].北京:中國統計出版社,1995.
[9]中華人民共和國國家統計局.中國統計年鑒[M].北京:中國統計出版社,1996.
[10]中華人民共和國國家統計局.中國統計年鑒[M].北京:中國統計出版社,1997.
[11]中華人民共和國國家統計局.中國統計年鑒[M].北京:中國統計出版社,1998.
[12]中華人民共和國國家統計局.中國統計年鑒[M].北京:中國統計出版社,1999.
[13]中華人民共和國國家統計局.中國統計年鑒[M].北京:中國統計出版社,2000.
[14]中華人民共和國國家統計局.中國統計年鑒[M].北京:中國統計出版社,2001.
[15]中華人民共和國國家統計局.中國統計年鑒[M].北京:中國統計出版社,2002.
[16]中華人民共和國國家統計局.中國統計年鑒[M].北京:中國統計出版社,2003.
[17]中華人民共和國國家統計局.中國統計年鑒[M].北京:中國統計出版社,2004.
[18]中華人民共和國國家統計局.中國統計年鑒[M].北京:中國統計出版社,2005.
[19]中華人民共和國國家統計局.中國統計年鑒[M].北京:中國統計出版社,2006.
[20]中華人民共和國國家統計局.中國統計年鑒[M].北京:中國統計出版社,2007.
[21]中華人民共和國國家統計局.中國統計年鑒[M].北京:中國統計出版社,2008.
[22]中華人民共和國國家統計局.中國統計年鑒[M].北京:中國統計出版社,2009.
[23]中華人民共和國國家統計局.中國統計年鑒[M].北京:中國統計出版社,2010.
[24]錢芳.基于ANN的非線性組合預測方法在水運貨運量預測中的應用[J].港口裝卸,2003,(5):31-34.