張鑫盛業(yè)譜鄧祥文李書蓉李秀榮
(1.山東建筑大學土木工程學院,山東濟南 250101;2.山東建筑大學建筑結構加固改造與地下空間工程教育部重點實驗室,山東 濟南 250101;3.山東建大工程鑒定加固研究院,山東 濟南 250014)
強夯法[1]是法國Menard公司在20世紀70年代創(chuàng)造的一種經(jīng)濟有效的地基處理方法。為了確保處理后地基場地工程可靠性,有必要對強夯作用過程進行深入研究,而強夯過程是高速瞬時沖擊的動力學歷程,整個過程作用機理復雜、影響因素繁多且具有高度的非線性,近半個世紀以來,工程界在其力學模型、能量響應的仿真模擬及理論解析課題上仍面臨許多困難。
在圍繞強夯法的研究中,有效加固深度的標定是應用強夯實現(xiàn)地基處理時的核心環(huán)節(jié)。強夯有效加固深度[2]是指經(jīng)強夯處理后的地基土力學指標滿足設計要求的深度范圍,是關系到地基處理質量的一項決定性指標,有效加固深度的研究由最初強夯理論提出時的Menard公式系數(shù)修正法[3],逐步發(fā)展出BILLAM經(jīng)驗計算法、劉海沖經(jīng)驗公式法等諸多基于試驗與工程現(xiàn)場數(shù)據(jù)的計算方法。近年來,學者們從能量守恒[4]、量綱匹配[5]、相關性分析等方面對強夯的有效加固深度理論進行了更深層次的數(shù)值解析預測與分析[6]。強夯過程過于復雜且非線性程度很高,相關經(jīng)驗公式、力學模型等存在較大的局限性,同時諸多經(jīng)驗公式的簡化與調參過程不可避免地產(chǎn)生誤差,因而對于有效加固深度預測模型與算法研究仍是當前亟待解決的難題。
隨著現(xiàn)代電子計算機的發(fā)展以及科學計算語言的進步,許多學者采用基于機器學習及智能算法預測了有效加固深度,如基于模糊信息優(yōu)化處理技術[7]、BP人工神經(jīng)網(wǎng)絡技術(Back Propagation-Artificial Neural Networks,BP-ANN)[8]。其中,神經(jīng)網(wǎng)絡算法在預測領域得到了廣泛的應用,但是由于其在局部極小值的處理以及學習訓練過程中過分依賴經(jīng)驗或大量樣本數(shù)據(jù)集等方面的缺陷,降低了該算法在強夯有效加固深度問題上應用的準確性與有效性。在工程數(shù)值問題的回歸分析中,許多學者應用支持向量機算法的研究取得了進展,改進支持向量機算法在機械系統(tǒng)故障自動化診斷[9]、隧道結構行為分析[10]、航空航天器服役狀態(tài)評估[11]等研究課題中得到重視和發(fā)展。
文章提出了應用異于傳統(tǒng)機器學習方法的支持向量機算法模型回歸預測強夯有效加固深度,是支持向量機算法在該工程問題上的初步嘗試。通過編程構建(Support Vector Machines,SVM)模型,并設計遺傳算法程序模塊優(yōu)化模型中的關鍵參數(shù),實現(xiàn)了對數(shù)據(jù)的最優(yōu)分析與預測,并將工程現(xiàn)場實測數(shù)據(jù)在SVM模型的回歸預測精度和BP神經(jīng)網(wǎng)絡模型中的回歸預測精度進行對比,評價了這類模型的預測精確度和可靠性。
1995年,VAPNIK等[12]提出支持向量機理論SVM。SVM是一種在統(tǒng)計學習理論基礎上發(fā)展出來的全新機器學習算法,基于VC維(Vapnik-Chervonenkis Dimension)理論和結構風險最小化(Structural Risk Minimization,SRM)原則,通過尋找最優(yōu)分隔超平面的過程實現(xiàn)對樣本數(shù)據(jù)的分類或者回歸預測[13]。最優(yōu)超平面建立的過程使得模型對于小樣本問題仍能較好地適用,并且泛化能力得到保證,支持向量機算法具有較高的準確性及穩(wěn)定性,成為解決有限樣本數(shù)據(jù)處理、高維模式識別、非線性回歸擬合問題的一種新方式。
支持向量機的基本原理是通過尋找一個能將現(xiàn)有樣本集按照模式類型分開且能同時滿足分類間隔最大的最優(yōu)分類超平面完成數(shù)據(jù)處理。對于非線性問題,需將數(shù)據(jù)映射到高維度的特征空間后圍繞選擇得到的支持向量(Support Vectors,SV)進行回歸分析,進而尋找最優(yōu)分類超平面,將線性支持向量機的應用推廣至非線性解空間。
圖1為平面數(shù)據(jù)高維映射后線性可分示意圖,表示了在二維平面線性不可分的兩類數(shù)據(jù)映射至三維空間后可被Z=KX+b形式的平面劃分,其中X={x1,x2}。圖1中,x1軸表示第一維度數(shù)值,x2軸表示第二維度數(shù)值,z軸表示映射后的高維數(shù)值。。 其中,xi(i=1,2,
圖1 平面數(shù)據(jù)高維映射后線性可分示意圖
在回歸擬合問題上,假設給定一個樣本集S=…,n)為輸入變量,由n個d維向量構成;yi為對應的期望輸出值。故該樣本集回歸函數(shù)f(x)的形式由式(1)表示為
式中ω∈Rd為權值矢量;b∈R為標量閾值;ω·xi表示ω與xi的點積。求解ω和b的優(yōu)化問題由式(2)和(3)表示為
式中ε為引入的不敏感因子;C為懲罰因子,表示對超出誤差式中達ε的樣本的懲罰程度;ξi、ξ*i為松弛變量,是樣本偏離不敏感區(qū)間ε的上、下限界。
支持向量機數(shù)據(jù)回歸擬合示意圖如圖2所示,展示了支持向量機算法回歸擬合分析的計算規(guī)則,坐標中的3條曲線分別為f(x)和擬合區(qū)間上、下界。
圖2 支持向量機數(shù)據(jù)回歸擬合示意圖
根據(jù)非線性規(guī)劃對偶性理論,引入拉格朗日乘子建立優(yōu)化約束方程,將最小約束整理為凸二次規(guī)劃最大值問題,由式(4)表示為
由最優(yōu)化理論(Karush-Kuhn-Tucker,KKT)條件可知,令式(4)對ω、b、ξi、偏導為0,可將其轉化成對偶形式求解,由式(5)和(6)表示為
對式(5)的方程進行求解得式(7)為
式中K(xi,xj)=Φ(xi)·Φ(xj),是支持向量機的核函數(shù)。
綜上映射操作,可得泛化回歸函數(shù),由式(8)表示為
針對地基處理工程問題的數(shù)據(jù)分析與預測問題,應選取容錯性好,可泛化程度高的算法模型。復雜工程回歸預測中常應用BP神經(jīng)網(wǎng)絡模型進行分析,BP神經(jīng)網(wǎng)絡模型的研究成果在大樣本、多變量、高度非線性預測問題上得到了較高水平的肯定;BP神經(jīng)網(wǎng)絡利用數(shù)學關系構建神經(jīng)元網(wǎng)絡結構,并通過對大量樣本數(shù)據(jù)的訓練學習,逆向確定修正出各隱含層神經(jīng)元間的連接強度,基于經(jīng)驗數(shù)據(jù)的學習過程使其預測準確率達到工程可接受水平;但是其算法存在過分依賴于原始經(jīng)驗數(shù)據(jù)、較早地收斂于局部極值點、較高頻率的過擬合現(xiàn)象等問題。當選擇應用優(yōu)化支持向量機算法預測強夯有效加固深度時,由于該算法通過尋找樣本中的支持向量,確定出距離樣本的間距最大的超平面而實現(xiàn)數(shù)據(jù)處理,且基于VC維理論實現(xiàn)矩陣變換使得原線性不可分的數(shù)據(jù)在足夠高的維度空間中線性可分,因此支持向量機具有機器學習算法中最高的樣本泛化能力與非線性適應能力,算法即使在小樣本的數(shù)據(jù)分析中仍能發(fā)揮出較大的準確度優(yōu)勢。
文章基于計算軟件MATLAB平臺LIBSVM[14]工具箱編寫強夯有效加固深度的預測回歸程序,對SVM回歸預測進行現(xiàn)實工程數(shù)據(jù)的仿真分析;同時編程構建BP人工神經(jīng)網(wǎng)絡模型并完成建模、訓練、仿真和預測,對同一樣本集進行訓練,使神經(jīng)網(wǎng)絡模型達到與SVM模型同等的精度水平后,以地基處理工程現(xiàn)場實測數(shù)據(jù)為例,分析對比GA-SVM與BPANN兩種機器學習模型在強夯有效加固深度預測精度上的性能表現(xiàn)。
支持向量機回歸試驗中擬合結果的精度與算法中數(shù)據(jù)嵌入維數(shù)m、懲罰因子C、損失參數(shù)(不敏感因子)ε、核函數(shù)K類型及核函數(shù)相關參數(shù)之間存在一定聯(lián)系,確定最優(yōu)的模型參數(shù)組合可以使擬合誤差降至最低,且滿足測試樣本的檢驗精度要求。計算模型中與運算效率、計算精度有關的參數(shù)為C、ε和σ,其中C在特征空間中控制模型復雜度和經(jīng)驗誤差風險比值,其值越大,SVM對樣本數(shù)據(jù)的擬合程度越高[15];ε控制樣本中支持向量的數(shù)量,其取值越大支持向量越少。3個影響參數(shù)間相互制約且無明確函數(shù)相關性,應用進化啟發(fā)式尋優(yōu)算法—遺傳算法(Genetic Algorithm,GA)[16]對C、ε、σ共3個參數(shù)的取值優(yōu)化。
支持向量機的遺傳算法優(yōu)化部分具體通過以下步驟實現(xiàn):
(1)遺傳算法參數(shù)初始化并定義初始種群
確定種群數(shù)目為40,最大迭代次數(shù)為250次,交叉率單點交叉法取0.58,變異率取0.01,選擇范圍取0.9。
(2)確定GA-SVM參數(shù)尋優(yōu)范圍并編碼
C、ε、σ的尋優(yōu)區(qū)間分別設為[0,60],[0.000 01,0.1],[0,10],將其按二進制形式進行遺傳算法的種群染色體基因編碼,初始隨機產(chǎn)生基因型為該二進制編碼序列的種群。
(3)適應度函數(shù)定義
設定該模型中種群適應度為SVM回歸結果的均方誤差。
(4)選擇、交叉、變異
根據(jù)個體適應度,通過輪盤賭法將具有較低適應度值的個體淘汰,較高適應度值的染色體被復制;以交叉率交換染色體結構中信息以得到子代基因,在種群進化過程中,設定基因突變率以一定概率隨機改變染色體編碼序列中的基因點。按照遺傳進化策略,對種群運用選擇、交叉、變異,并逐代進化。
(5)進化終止尋優(yōu)求解結束并解碼
當種群進化代數(shù)達到設定的上限時,尋優(yōu)結束,將求解過程中適應度值最佳的種群解碼,得到滿足條件的全局最優(yōu)解C、ε、σ,參數(shù)最優(yōu)化GA-SVM模型建立完成。
使用優(yōu)化后的GA-SVM算法進行樣本集數(shù)據(jù)回歸與測試集數(shù)據(jù)預測,可以實現(xiàn)SVM算法的理論最優(yōu)性能。將其應用于具體工程問題,應當有較高的預測精度與泛化能力。GA-SVM算法模型的回歸預測流程圖如圖3所示。
圖3 GA-SVM模型回歸預測流程圖
為了驗證GA-SVM回歸預測模型在強夯法有效加固深度預測應用上的性能,現(xiàn)從我國地基處理工程現(xiàn)場及相關文獻資料中選取36個強夯地基處理樣本集合,確定其輸入?yún)?shù)為地基土的干重度、含水量、夯錘夯擊能量和夯錘面積,期望其輸出值為有效加固深度一項。此樣本數(shù)據(jù)具有較高的離散性和獨特性,擁有一定程度的代表性。采用選取的36個工程樣本[17-18]經(jīng)過數(shù)據(jù)歸一化處理后組成的訓練樣本集(見表1)對模型進行訓練,直到模型針對訓練樣本集的訓練預測結果的均方誤差降低至設定范圍后,應用該模型進行全新測試樣本集的仿真預測。
表1 實測原始數(shù)據(jù)及歸一化處理數(shù)據(jù)結果表
GA-SVM的完整應用過程具體分為以下步驟:
(1)對輸入數(shù)據(jù)歸一化處理,將不同量綱的數(shù)據(jù)按種類分別歸一化至區(qū)間[-1,1]內,可由式(9)表示為
式中Kmax、Kmin分別為1、-1;Xmax、Xmin分別為實測原始數(shù)據(jù)每列的最大值、最小值組成的矩陣;Xout為歸一化值。
(2)將36組多維數(shù)據(jù)參數(shù)輸入初始化后的GA-SVM參數(shù)尋優(yōu)環(huán)節(jié),當均方誤差低至閾值時,輸出C、ε、σ值,以確定具體的SVM模型。
(3)預測深度值逆歸一化,將數(shù)據(jù)“放大”回原量綱數(shù)量級,將該SVM模型對于樣本集的擬合程度與精確率列式計算;將結果繪圖展示,觀測誤差偏離程度與擬合可信度。
(4)選取全新工程測試數(shù)據(jù)集代入GA-SVM預測模型以測試其對全新樣本的回歸能力與泛化水平,計算預測準確率。選取深度數(shù)據(jù)相對誤差R與平均絕對均方誤差A反映結果的精度,分別由式(10)和(11)表示為
式中yi為預測值,為實測值。
歸一化數(shù)據(jù)輸入支持向量機后,支持向量機3參數(shù)C、ε、σ經(jīng)優(yōu)化后取值分別為3.00、0.00、和1.44。參數(shù)組成的支持向量機對原始36個五維數(shù)據(jù)的擬合精度表征為均方誤差值等于0.005,平方相關系數(shù)為0.973;重復優(yōu)化過程至結果收斂。均方誤差和相關系數(shù)的數(shù)據(jù)表明,GA-SVM對訓練數(shù)據(jù)的回歸擬合程度達到相當精確的預測程度。使用SVM訓練階段未學習過的工程實測測試數(shù)據(jù)集代入檢驗,觀測該模型能否對于工程實測數(shù)據(jù)的預測達到與真值相近的準確率水平。
校驗步驟中用于測試的實測數(shù)據(jù)[17]來自山西省化肥廠工程、化工部第二化工建設公司、山西化肥廠、化工部北京重機公司、化工部第二設計院及太原工業(yè)大學等。測試數(shù)據(jù)見表2,其中A、B、C組工程場地及土質等具體如下:
表2 測試數(shù)據(jù)表
A組:山西化肥廠濕陷性黃土地基強夯處理工程,Ⅰ區(qū),濕陷性黃土地質,干重度為14.2 kN/m3、含水量為20.18%、強夯夯擊能量為3 500 kN·m、夯錘面積為7.00 m2,其實測有效加固深度為6.90 m(該深度數(shù)據(jù)不代入預測模型,用作最終預測值的驗證與誤差檢驗)。
B組:場地Ⅱ區(qū),濕陷性黃土地質,干重度組16.24 kN/m3、含水量為20.30%、強夯夯擊能量為2 500 kN·m、夯錘面積為4.52 m2,其實測有效加固深度為7.21 m。
C組:場地Ⅰ區(qū),濕陷性黃土地質,干重度為14.10 kN/m3、含水量為22.35%、強夯夯擊能量為5 000 kN·m、夯錘面積為7.00 m2,其實測深度為8.00 m。
檢驗步驟中,將GA-SVM的預測數(shù)據(jù)與BPANN模型的對比,BP-ANN基于MATLAB平臺編程實現(xiàn),為保證對比有效客觀,選用訓練至同GA-SVM一樣誤差(均方誤差為0.005)水平的BP-ANN進行仿真預測。其中,BP-ANN模型選用含3個隱含層共50個神經(jīng)元構成的誤差反向傳播網(wǎng)絡進行訓練,模型簡圖如圖4所示。
圖4 含3個隱含層的ANN結構圖
圖5 為BP-ANN模型和GA-SVM模型的計算深度與夯擊能量關系圖。對GA-SVM模型與BPANN模型多次重復仿真預測,選取具有代表性且客觀可信的數(shù)據(jù),并對比了兩個模型計算測試樣本集的誤差,見表3。
表3 模型計算測試樣本集的誤差對比表
圖5 不同模型計算深度與夯擊能量關系圖
計算數(shù)據(jù)相對誤差的絕對值≤3%時,說明該模型精度較高[19]。由表3可知,GA-SVM的測試集預測值最大偏離真值為3.28%,其平均偏離為1.72%,其預測性能能夠滿足較高的精度且算法穩(wěn)定性較好,反映出其經(jīng)小樣本學習后的模型泛化能力同樣具有較高可信度;而BP-ANN預測模型,大量的神經(jīng)元組成的處理非線性數(shù)據(jù)的網(wǎng)絡結構對訓練數(shù)據(jù)量要求很高,從結果數(shù)據(jù)中反映出其對于測試樣本的預測精度偏離較大,波動性過強,存在過擬合現(xiàn)象。GA-SVM和BP-ANN測試集預測的均方誤差分別為0.024 1、1.184 9,GA-SVM模型預測的均方誤差僅為BP-ANN的2%,達到了不同量級的精度,試驗過程多次重復后表明結果客觀可信,故GA-SVM模型的工程問題的泛化精度得到了有效地保證。
通過編程構建的應用遺傳算法優(yōu)化支持向量機理論的數(shù)值擬合、回歸預測模型準確、高效地實現(xiàn)了對強夯有效加固深度的計算分析,并將模型應用到工程問題中,得到的主要結論如下:
(1)遺傳算法優(yōu)化的支持向量機算法模型能夠在訓練樣本上實現(xiàn)準確的回歸擬合,數(shù)據(jù)擬合精度達到均方誤差值0.005,平均相關系數(shù)為0.973。
(2)GA-SVM模型對測試樣本數(shù)據(jù)預測精度較高,預測結果均方誤差為0.024 1,相對誤差<3%,優(yōu)于BP神經(jīng)網(wǎng)絡模型預測結果。數(shù)據(jù)證明,基于遺傳算法優(yōu)化的支持向量機模型在強夯有效加固深度問題上的擬合精度更高,預測準確性更強。