胡震天,陳啟華,李正通(南寧市勘察測(cè)繪地理信息院,廣西南寧 530023)
改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)在高速鐵路變形分析中的應(yīng)用
胡震天?,陳啟華,李正通
(南寧市勘察測(cè)繪地理信息院,廣西南寧 530023)
摘 要:將BP(back propagation)神經(jīng)網(wǎng)絡(luò)應(yīng)用于高速鐵路變形分析中,依據(jù)BP算法的特性,采用通過加入動(dòng)量項(xiàng)的方法來提高BP算法的運(yùn)算速度,并對(duì)此改進(jìn)方法進(jìn)行了實(shí)例論證。
關(guān)鍵詞:高速鐵路;變形分析;BP神經(jīng)網(wǎng)絡(luò)
由于我國(guó)地質(zhì)結(jié)構(gòu)比較復(fù)雜,作為長(zhǎng)大線型的高速鐵路,線下工程的沉降變形監(jiān)測(cè)和分析顯得極為重要。高速鐵路線下工程沉降的安全監(jiān)測(cè)、監(jiān)測(cè)數(shù)據(jù)處理及變形分析,是確保施工及運(yùn)營(yíng)安全的重要保障,必須選擇有效的監(jiān)測(cè)手段和變形分析方法。神經(jīng)網(wǎng)絡(luò)所反映的函數(shù)關(guān)系不必用顯式的函數(shù)表達(dá)式表示,而是通過調(diào)整網(wǎng)絡(luò)本身的權(quán)值和閾值來適應(yīng),具有很強(qiáng)的非線性映射能力[1,2]。目前,BP神經(jīng)網(wǎng)絡(luò)研究已在大壩的變形分析應(yīng)用方面取得了一定的成果,但同時(shí)我們還應(yīng)看到,標(biāo)準(zhǔn)的BP神經(jīng)網(wǎng)絡(luò)仍具有訓(xùn)練速度慢的特點(diǎn)[3~5],本文對(duì)BP算法進(jìn)行了改進(jìn),并將其運(yùn)用到高速鐵路變形分析中,并與改進(jìn)前的BP算法進(jìn)行了比較分析。
BP網(wǎng)絡(luò)是一個(gè)多層的單向傳播的前向網(wǎng)絡(luò)。網(wǎng)絡(luò)除了輸入和輸出節(jié)點(diǎn)外,還存在隱層節(jié)點(diǎn),而且在同層之間不存在耦合。工作信號(hào)從輸入節(jié)點(diǎn)通過隱層節(jié)點(diǎn)傳輸?shù)捷敵龉?jié)點(diǎn)。每層節(jié)點(diǎn)的輸出只受上一層節(jié)點(diǎn)的輸入影響。隱層節(jié)點(diǎn)通常激活函數(shù)是Sigmoid型(f(x)= 1/ (1+exp(-Bx))(B〉0)),而輸出輸入節(jié)點(diǎn)有時(shí)也可以是線性的(f(x)= x)。
從輸入到輸出的BP神經(jīng)網(wǎng)絡(luò)是一個(gè)高度的非線性的映射,即F:Rn→Rm,F(X)= Y。對(duì)于樣本集合:輸入xi(∈Rn)和輸出yi(∈Rm),可看作存在某一映射g 使:g(xi)= yii =1,2,…,n,現(xiàn)在要求出某映射f,使其在某種條件下(通常為最小二乘),f認(rèn)為是g的最佳逼近。運(yùn)用神經(jīng)網(wǎng)絡(luò)對(duì)簡(jiǎn)單的線性函數(shù)不斷地復(fù)合,就可以逼近一些復(fù)雜的非線性函數(shù)。
BP網(wǎng)絡(luò)包括輸入層、隱層和輸出層,各層之間都是相互連接的,如圖1所示。
圖1 BP網(wǎng)絡(luò)結(jié)構(gòu)
網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計(jì)沒有可以遵循的固定的步驟,還要依靠經(jīng)驗(yàn)來選取一定的參數(shù),是一個(gè)綜合性的問題。利用基于BP算法的神經(jīng)網(wǎng)絡(luò)解決一些實(shí)際問題,成功的關(guān)鍵取決于是否能提高網(wǎng)絡(luò)的特性以及能否優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)。對(duì)于三層的BP網(wǎng)絡(luò),初始權(quán)值的設(shè)置、激活函數(shù)的選擇、隱含層節(jié)點(diǎn)數(shù)的確定,這些內(nèi)容決定了其網(wǎng)絡(luò)的結(jié)構(gòu)。
BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練學(xué)習(xí)過程由兩個(gè)部分組成,分別是正向傳播和誤差反向傳播。BP網(wǎng)絡(luò)算法的一般步驟如下:
(1)選擇網(wǎng)絡(luò)輸入,設(shè)置變量和參量;
(2)確定網(wǎng)絡(luò)結(jié)構(gòu)參數(shù);
(3)對(duì)網(wǎng)絡(luò)的連接權(quán)系數(shù)和神經(jīng)元閾值的初值進(jìn)行賦值;
(4)輸入樣本的評(píng)價(jià)模型和期望值;
(5)計(jì)算樣本輸出層和隱含層中各單元的實(shí)際輸出值并計(jì)算方差Ei和E:對(duì)每一個(gè)輸入模式i,其誤差為:
系統(tǒng)總誤差為:
其中dik為對(duì)應(yīng)于第i個(gè)輸入模式第k個(gè)輸出層節(jié)點(diǎn)的期望值,yik為相應(yīng)的網(wǎng)絡(luò)輸出值;
(6)若給定的收斂值E〈ε,則結(jié)束學(xué)習(xí),否則調(diào)整權(quán)值讓網(wǎng)絡(luò)進(jìn)一步學(xué)習(xí),直到系統(tǒng)平均誤差小于規(guī)定的要求為止;
(7)權(quán)值調(diào)整,使用遞歸從輸出層開始逆向傳播誤差,直到第一隱含層為止,并用下式調(diào)整權(quán)值:
Wij(t+1)= Wij(t)+IrδjXi(3)
式中的Xi是第i節(jié)點(diǎn)的輸出,IrδjXi是增益項(xiàng),Wij為連接權(quán)值,δj為第j節(jié)點(diǎn)的誤差,Ir為學(xué)習(xí)步長(zhǎng),t為迭代次數(shù);
(8)轉(zhuǎn)到(5)步;
(9)向?qū)W習(xí)好的網(wǎng)絡(luò)輸入要評(píng)價(jià)樣本的評(píng)價(jià)因子。
BP算法雖然在大多數(shù)情況下可以得到滿意的結(jié)果,但是仍存在一些不足,如:
①由于BP算法的本質(zhì)其實(shí)是一個(gè)非線性優(yōu)化問題,局部極小的問題會(huì)常常不可避免地出現(xiàn),以至于得不到最優(yōu)解;
②學(xué)習(xí)算法收斂速度慢;
③隱含層節(jié)點(diǎn)個(gè)數(shù)的選取缺少理論依據(jù),學(xué)習(xí)訓(xùn)練時(shí)都是根據(jù)經(jīng)驗(yàn)來選取;
④BP網(wǎng)絡(luò)有時(shí)在學(xué)習(xí)新樣本常常會(huì)忘了已學(xué)樣本,同時(shí)也要求每個(gè)樣本有相同的特征數(shù)目。
本文采用加入動(dòng)量項(xiàng)算法對(duì)標(biāo)準(zhǔn)的BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行改進(jìn):
由于BP神經(jīng)網(wǎng)絡(luò)在學(xué)習(xí)過程中,只需要改變權(quán)重,而權(quán)重和權(quán)重誤差導(dǎo)數(shù)成正比。比例系數(shù)μ是學(xué)習(xí)過程的速率,它是一個(gè)常數(shù)。若我們能增大μ,則權(quán)重的改變也將加大,若能選擇合適的速率,使μ的值盡可能大但又不至于引起振蕩。這樣就可以為系統(tǒng)提供一個(gè)最快的學(xué)習(xí),增大學(xué)習(xí)率而又不導(dǎo)致振蕩的方法,就是修改反傳中的學(xué)習(xí)速率,使它包含一個(gè)動(dòng)量項(xiàng),具體地說,就是每個(gè)加權(quán)調(diào)節(jié)量加上一項(xiàng)正比于前次加權(quán)變化的量(即本次權(quán)重的修改表達(dá)式中引入前次加權(quán)的權(quán)重修改)。這就要求每次調(diào)節(jié)完成后,要把該調(diào)節(jié)量記住,以便在下面的加權(quán)調(diào)節(jié)中使用。帶有動(dòng)量項(xiàng)的加權(quán)調(diào)節(jié)公式為:
其中α為動(dòng)量系數(shù),一般取0.9左右。
引入動(dòng)量項(xiàng)相當(dāng)于在網(wǎng)絡(luò)的學(xué)習(xí)過程中等效地改變了μ,μ不再是恒定的值。引入這個(gè)動(dòng)量項(xiàng)后,使得調(diào)節(jié)向著底部的平均方向變化,不致產(chǎn)生大的擺動(dòng),即動(dòng)量項(xiàng)起到緩沖平滑的作用。若系統(tǒng)進(jìn)入誤差函數(shù)面的平坦區(qū),那么誤差將變化很小。
為了體現(xiàn)改進(jìn)方法的優(yōu)越性,現(xiàn)結(jié)合某高鐵橋墩沉降變形監(jiān)測(cè)數(shù)據(jù)來進(jìn)行分析驗(yàn)證?,F(xiàn)取橋墩變形監(jiān)測(cè)網(wǎng)中的兩個(gè)墩身觀測(cè)標(biāo)DK1252+590D2和DK1252 +614D1的20期數(shù)據(jù)進(jìn)行分析,利用前15期觀測(cè)數(shù)據(jù)序列作為訓(xùn)練樣本,分別采用傳統(tǒng)BP算法模型和對(duì)數(shù)據(jù)歸一化后加入動(dòng)量項(xiàng)的改進(jìn)BP算法模型對(duì)后5期觀測(cè)數(shù)據(jù)進(jìn)行預(yù)測(cè),如表1、表2所示。
DK1252+590D2沉降觀測(cè)標(biāo)的沉降量 表1
DK1252+614D1沉降觀測(cè)標(biāo)的沉降量 表2
傳統(tǒng)BP算法和改進(jìn)的BP算法預(yù)測(cè)結(jié)果:
DK1252+590D2沉降觀測(cè)標(biāo)的沉降量預(yù)測(cè)結(jié)果 表3
DK1252+614D1沉降觀測(cè)標(biāo)的沉降量預(yù)測(cè)結(jié)果 表4
圖2 DK1252+590D2沉降觀測(cè)標(biāo)的沉降量預(yù)測(cè)結(jié)果比較圖
圖3 DK1252+614D1沉降觀測(cè)標(biāo)的沉降量預(yù)測(cè)結(jié)果比較圖
從表3和表4中的計(jì)算結(jié)果可以看出,改進(jìn)的BP算法的絕對(duì)誤差中小于0.1的比例比傳統(tǒng)BP算法的大,由于對(duì)數(shù)據(jù)進(jìn)行了歸一化處理以及加入了動(dòng)量項(xiàng),使得改進(jìn)后的算法精度更高,訓(xùn)練學(xué)習(xí)速度加快,并且使學(xué)習(xí)避免陷入局部最小。圖2和圖3說明了改進(jìn)后的BP算法在沉降數(shù)據(jù)預(yù)測(cè)中的預(yù)測(cè)曲線比傳統(tǒng)BP算法的預(yù)測(cè)曲線更符合實(shí)測(cè)值的曲線趨勢(shì),體現(xiàn)了改進(jìn)算法的優(yōu)勢(shì)。
從實(shí)例可以得出改進(jìn)的BP算法由于對(duì)數(shù)據(jù)進(jìn)行了歸一化處理以及加入了動(dòng)量項(xiàng),使得改進(jìn)后的算法精度更高,訓(xùn)練學(xué)習(xí)速度加快,并且使學(xué)習(xí)避免陷入局部最小,說明改進(jìn)的算法優(yōu)于傳統(tǒng)BP算法。
參考文獻(xiàn)
[1] 袁曾任.人工神經(jīng)元網(wǎng)絡(luò)及其應(yīng)用[M].北京:清華大學(xué)出版社,南寧:廣西科學(xué)技術(shù)出版社,1999.
[2] 樊琨.基于人工神經(jīng)網(wǎng)絡(luò)的大壩位移預(yù)測(cè)[J].長(zhǎng)江科學(xué)院院報(bào),1998,15(5):45~48.
[3] 楊杰,吳中如,顧沖時(shí).大壩變形監(jiān)測(cè)的BP網(wǎng)絡(luò)模型與預(yù)報(bào)研究[J].西安理工大學(xué)學(xué)報(bào),2001,17(1):25~29.
[4] 吳秀娟.人工神經(jīng)網(wǎng)絡(luò)在大壩監(jiān)測(cè)數(shù)據(jù)分析中的應(yīng)用研究[D].武漢大學(xué),2003.
[5] 胡上尉.多層前饋神經(jīng)網(wǎng)絡(luò)算法的改進(jìn)及研究[D].重慶大學(xué),2006:21~23.
[6] 周紅曉,蔡俊,任德官.一種優(yōu)化多層前饋神經(jīng)網(wǎng)絡(luò)中隱節(jié)點(diǎn)數(shù)的算法[J].浙江師范大學(xué)學(xué)報(bào)·自然科學(xué)版, 2002,25(3):268~271.
[7] 張正祿,黃全義,文鴻雁等.工程的變形監(jiān)測(cè)分析與預(yù)報(bào)[M].北京:測(cè)繪出版社,2007.
[8] 樂紅,余飛,韓卓等.武廣鐵路客運(yùn)專線超載預(yù)壓路基沉降評(píng)估技術(shù)[J].鐵道標(biāo)準(zhǔn)設(shè)計(jì),2010(2):11~14.
[9] 王新征,鄭偉花.人工神經(jīng)網(wǎng)絡(luò)在預(yù)測(cè)軟基沉降中的應(yīng)用研究[J].路基工程,2010(1):128~130.
[10] 羅波,遠(yuǎn)禎.改進(jìn)BP網(wǎng)絡(luò)在深基坑變形預(yù)測(cè)中的應(yīng)用[J].工業(yè)建筑,2006(S):79~81.
[11] 賀昌政,李曉峰,俞海.人工神經(jīng)網(wǎng)絡(luò)模型的新改進(jìn)及其應(yīng)用[J].?dāng)?shù)學(xué)的實(shí)踐與認(rèn)識(shí),2002,7(4):554~561.
[12] 陳啟華.小波神經(jīng)網(wǎng)絡(luò)在高速鐵路變形監(jiān)測(cè)中的應(yīng)用[D].桂林理工大學(xué),2012.
The Application of Improved BP Neural Network in the High-speed Railway Deformation Analysis
Hu Zhentian,Chen Qihua,Li Zhengtong
(Nanning Exploration & Survey Geoinformation Institute,Nanning 530023,China)
Abstract:In this paper,BP neural network can be used in the high-speed railway deformation analysis.Based on the character of BP algorithm,this dissertation uses a method to improve calculation speed of BP algorithm by adding a momentum and further prove this method by example analyze.
Key words:the high-speed railway;deformation analysis;BP neural network
文章編號(hào):1672-8262(2015)04-145-03中圖分類號(hào):TU196+.1
文獻(xiàn)標(biāo)識(shí)碼:B
收稿日期:?2015—01—12
作者簡(jiǎn)介:胡震天(1983—),男,工程師,主要從事攝影測(cè)量與遙感生產(chǎn)、研發(fā)及技術(shù)管理工作。