趙沛泓,孫大鵬,吳 浩
(大連理工大學(xué) 海岸和近海工程國家重點實驗室,大連 116024)
開孔沉箱結(jié)構(gòu)能夠顯著降低波浪能量,改善工程海域的波況并減輕結(jié)構(gòu)自重,在保證結(jié)構(gòu)安全可靠的前提下產(chǎn)生良好的經(jīng)濟(jì)效益,目前,在海域海岸工程中已有廣泛的設(shè)計應(yīng)用。
自20世紀(jì)60年代Jarlan[1]等提出開孔沉箱概念以來,國內(nèi)外學(xué)者對開孔沉箱的消浪特性做了很多物模試驗研究[2-6]。然而以往試驗數(shù)據(jù)通常采用傳統(tǒng)的多元線性回歸方法,分析給出特征物理量和諸多影響因素的計算關(guān)系式。這種方法首先要進(jìn)行單變量分析,將非線性問題線性化,逐一確定每個單變量對特征物理量影響的函數(shù)關(guān)系(以冪函數(shù)為主),進(jìn)而利用最小二乘法給出最終的擬合公式。擬合公式的擬合精度與泛化性能有著天然的內(nèi)在矛盾,用何種策略平衡這一矛盾,使兩者都能達(dá)到令人滿意的結(jié)果,是許多學(xué)者關(guān)注的重點。對于傳統(tǒng)的多元回歸分析方法,通過單變量分析+最小二乘估計的操作過程給出最后的回歸函數(shù)表達(dá)式,由于最小二乘估計是一固定過程不存在分歧,回歸函數(shù)的擬合精度和泛化性能,幾乎全部由單變量分析決定,然而恰恰是這一過程完全由人工完成,存在著很強(qiáng)的隨意性。
傳統(tǒng)多元回歸分析方法存在缺陷的根源是缺乏保證回歸函數(shù)擬合精度與泛化性能同時滿足條件的機(jī)制或說“策略”。而具有相應(yīng)“策略”指導(dǎo)的機(jī)器學(xué)習(xí)方法無疑是另外一種可行的選擇。
支持向量機(jī)SVM是Vapmik等人在1995年[7]基于統(tǒng)計學(xué)習(xí)理論提出的一種新型的機(jī)器學(xué)習(xí)方法,它用結(jié)構(gòu)風(fēng)險最小化策略代替?zhèn)鹘y(tǒng)的經(jīng)驗風(fēng)險最小化策略,使之較傳統(tǒng)的機(jī)器學(xué)習(xí)方法具有更好的泛化性能。支持向量回歸機(jī)SVR是SVM在估計函數(shù)、處理回歸問題上的推廣。在港口工程領(lǐng)域,SVR的應(yīng)用較少,2011年P(guān)atil S G[8]等利用遺傳算法優(yōu)化的SVR研究了浮水管式防波堤的透射系數(shù)與相關(guān)變量間的關(guān)系,結(jié)果表明,通過SVR學(xué)習(xí)得到的模型能夠很好地描述各物理量的非線性關(guān)系。
本文利用帶有外部存檔的差分進(jìn)化算法(JADE)優(yōu)化的SVR對開孔沉箱波浪反射系數(shù)及所受波浪力與各影響因子的關(guān)系進(jìn)行回歸分析,對比傳統(tǒng)多元回歸分析方法,評價兩種回歸模型的擬合精度和泛化性能,探討SVR在港口建筑物設(shè)計領(lǐng)域旳應(yīng)用前景。研究結(jié)果表明:SVR方法對開孔沉箱波浪反射系數(shù)及波浪力的分析具有適用性,與物模試驗值相比,其結(jié)果優(yōu)于傳統(tǒng)多元回歸方法的分析結(jié)果。
本文中物理模型試驗在大連理工大學(xué)海岸和近海工程國家重點實驗室的波浪水槽內(nèi)進(jìn)行,如圖1所示,水槽長56 m、寬0.7 m、最大試驗水深0.7 m。造波端安裝有液壓伺服推板式造波機(jī),模型布置在距離造波機(jī)35 m處,水槽末端鋪設(shè)消能緩坡裝置。
圖1 二維試驗波浪水槽Fig.1 The flume used in the experiment
開孔沉箱模型采用1.0 cm厚的有機(jī)玻璃制成,模型設(shè)計為無頂板形式,前墻開孔、后墻實體,消浪室寬度bc分別為0.15 m、0.20 m、0.30 m。開孔形式為矩形開孔,開孔率μ采用20%、40%兩種型式,開孔位置從水下0.2 m至頂部,等間距開4排孔,不開孔部分均用石子填充?;睬霸囼炈頳保持0.4 m不變,基床前后肩寬W均為0.25 m。沉箱模型放置在不同高度的基床上,基床高度hm分別為0 m、0.10 m、0.15 m、0.20 m。圖2為模型外觀示意圖。
圖2 開孔沉箱模型示意圖Fig.2 Perforated caisson used in the experiment
為了計算開孔沉箱前波浪反射系數(shù),在沉箱前不等間距布置5個浪高儀,其位置如圖3所示,對于不同的試驗波要素選取適當(dāng)?shù)睦烁邇x組合進(jìn)行數(shù)據(jù)分析,采用合田良實的兩點法分離入、反射波,進(jìn)而計算出反射系數(shù)。
為了計算開孔沉箱所受波浪力,如圖4、圖5所示,在沉箱開孔板迎浪面、背浪面、后實體板和底板的上面和下面布置多點壓力傳感器,點壓力布置情況如圖3所示。圖中●表示前墻迎浪面和底板測量浮托力點壓力布置情況;○表示前墻背浪面和底板測量滲流力點壓力布置情況。通過采集各個點壓力儀的同步時間序列,積分得到結(jié)構(gòu)受到的總水平力和總垂直力。
圖3 試驗?zāi)P筒贾脠DFig.3 Wave flume and the setup of the model experiment
試驗過程中的波浪條件和模型尺寸變化由表1給出。
表1 試驗條件及試驗參數(shù)變化范圍Tab.1 Experimental conditions and the scope of experimental parameters
根據(jù)LI[9]的分析,開孔沉箱波浪反射系數(shù)Kr與相對基床高度hm/L1/3、相對消浪室寬度bc/L1/3、相對水深d/L1/3、波陡H1/3/L1/3及開孔率μ有關(guān),最終反射系數(shù)Kr可表示為
(1)
而開孔沉箱所受波浪力可分為總水平力與總垂直力??偹搅槌料溆嗣?、背浪面與消浪室后實體板所受波浪力合力;總垂直力為消浪室中動水壓力與沉箱底部所受浮托力的合力。如圖6所示,由于開孔沉箱的結(jié)構(gòu)特性,其所受到的總垂直力與總水平力之間存在一定的相位差,即兩者不在同一時刻到達(dá)峰值或谷值。用Pv表示沉箱所受總水平力達(dá)到極值時刻對應(yīng)所受的總垂直力,Pv0表示沉箱在全時間段內(nèi)所受的總垂直力極值,定義Pv/Pv0為水平力極值時刻對應(yīng)的總垂直力相對于總垂直力極值的折減系數(shù),可表示為
圖6 不規(guī)則波作用下開孔沉箱受力的時間過程線Fig.6 Time series data of total wave forces acting on perforated caisson by irregular waves
(2)
假設(shè)有訓(xùn)練樣本集{(xk,yk)|xk∈Rd,yk∈R,k=1,2…n},在SVR算法中,目標(biāo)是尋找一個函數(shù)f(x)=wTx+b,使其盡可能平坦且允許樣本值的最大偏差為ε,其中w∈Rn,b∈R,對于容量為l的樣本集,采用ε-不敏感損失函數(shù)度量經(jīng)驗風(fēng)險,即有
(3)
(4)
式中:常數(shù)C體現(xiàn)了f(x)的平坦程度與允許樣本最大偏離程度的折衷。上式是典型的二次規(guī)劃問題,可以引入Lagrange函數(shù)
(5)
(6)
也等價于拉格朗日對偶問題形式
(7)
根據(jù)KKT條件,該極值可通過對拉格朗日函數(shù)求導(dǎo)得到
(8)
(9)
(10)
(11)
(12)
通過求解上述最大化問題,可得線性回歸函數(shù)為
(13)
當(dāng)樣本為非線性時,可以先通過非線性映射將原空間中的輸入量x映射到高維Hilbert空間,即x→φ(x),其中φ(x)∈H,然后在H空間中構(gòu)造最優(yōu)超平面
(14)
然而對φ(x)進(jìn)行顯式表達(dá)是困難的,根據(jù)Mercer定理,可以找到一個對稱半正定的有效核函數(shù),直接表達(dá)出映射函數(shù)的內(nèi)積形式,即
K(xi,x)=<φ(xi)·φ(x)>
(15)
非線性回歸優(yōu)化問題和線性回歸優(yōu)化問題形式相同,不同之處僅在于樣本輸入向量變成了向量的映射函數(shù),可以發(fā)現(xiàn)映射函數(shù)及核函數(shù)的引入不影響優(yōu)化過程,最后,SVR給出的非線性回歸函數(shù)為
(16)
本文采用徑向基函數(shù)(RBF)作為核函數(shù),即
(17)
SVR的泛化性能與求解過程中幾個參數(shù)的取值密切相關(guān),這些參數(shù)分別是懲罰系數(shù)C、損失函數(shù)中的參數(shù)ε和核函數(shù)參數(shù)g,常采用啟發(fā)式算法優(yōu)化這些參數(shù)。常見的啟發(fā)式算法包括遺傳算法、粒子群算法、差分進(jìn)化算法、模擬退火算法等。
本文采用Zhang[10]提出的帶有外部存檔的差分進(jìn)化算法對C、ε、g三個參數(shù)進(jìn)行尋優(yōu),尋優(yōu)過程可以概括為以下幾步:
(1) 隨機(jī)生成20組參數(shù)初始值{(Ci,εi,gi)|i=1,2,…,20},每一組參數(shù)初始值可以看做是種群中的一個個體,20則代表種群規(guī)模;
(2)將訓(xùn)練樣本集分為5份,取第1份作為預(yù)測數(shù)據(jù),其余4份作為訓(xùn)練數(shù)據(jù);
(3)將參數(shù)值代入優(yōu)化問題(12),求解回歸模型,利用模型對預(yù)測數(shù)據(jù)進(jìn)行計算,得到均方誤差值;
(4)再依次取訓(xùn)練樣本集中的第2、3、4、5份作為預(yù)測數(shù)據(jù),其余作為訓(xùn)練數(shù)據(jù),重復(fù)上一過程,得到4個均方誤差值;
(5)計算總共5個均方誤差值的均值,作為一步進(jìn)化過程的個體適應(yīng)度值,20組參數(shù)得到20個適應(yīng)度,其均值為種群平均適應(yīng)度,最小值為種群最優(yōu)適應(yīng)度;
(6)利用差分進(jìn)化算法原理進(jìn)行變異,交叉,選擇操作,得到下一步進(jìn)化過程的種群,計算新的種群平均適應(yīng)度,種群最優(yōu)適應(yīng)度;
澳大利亞不同年齡段消費者對于酒種的偏好具有較大差異:14~17歲年齡段消費者更偏愛喝預(yù)調(diào)烈酒,但隨著年齡增長,喜愛瓶裝葡萄酒的消費者占比逐漸增加,而預(yù)調(diào)烈酒的占比逐漸減少。對于烈酒,14~17歲年齡段消費者消費烈酒比例占該群體總消費酒精飲料的60%,為各年齡階段群體中最高。但隨著年齡的增加,消費者飲用烈酒的比例總體上呈下降趨勢,18~24歲年齡段消費者消費烈酒的比例占該人群總消費酒精飲料的22%,為各年齡階段群體中最高。25~29歲及30~39歲消費者消費普通烈度啤酒占該人群總消費酒精飲料的27%,為各年齡層最高。具體情況見圖2。
(7)重復(fù)上一過程,則種群不斷進(jìn)化,最終達(dá)到最大進(jìn)化步數(shù)。這時具有最優(yōu)適應(yīng)度的個體代表的參數(shù)值,可以認(rèn)為是最優(yōu)參數(shù)組合。
參數(shù)尋優(yōu)過程中的(2)~(5)即為通常所說的K-折交叉驗證,本文取K=5。
現(xiàn)有波浪和開孔沉箱相互作用的試驗數(shù)據(jù)216種工況組合,其可分為兩部分,一部分作為SVR模型的訓(xùn)練數(shù)據(jù),一部分作為模型的測試數(shù)據(jù),這里隨機(jī)抽取162組數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),其余54組數(shù)據(jù)作為測試數(shù)據(jù)。事實上,前人基于傳統(tǒng)多元回歸分析方法擬合公式,是將全部試驗數(shù)據(jù)進(jìn)行擬合,而沒有劃分另外的數(shù)據(jù)進(jìn)行驗證,所以JADE-SVR中提到的“訓(xùn)練數(shù)據(jù)”和“測試數(shù)據(jù)”的概念對這些回歸模型沒有意義,但是為了便于比較,仍然給出傳統(tǒng)模型對“訓(xùn)練數(shù)據(jù)”和“預(yù)測數(shù)據(jù)”的計算結(jié)果,這也相當(dāng)于在一定程度上高估了傳統(tǒng)多元回歸分析模型的預(yù)測性能。
以反射系數(shù)試驗中162組“訓(xùn)練數(shù)據(jù)”為例,進(jìn)行JADE-SVR模型參數(shù)尋優(yōu),圖7給出了尋優(yōu)過程中最優(yōu)適應(yīng)度和平均適應(yīng)度的收斂情況,圖7橫坐標(biāo)表示差分進(jìn)化算法的迭代次數(shù),縱坐標(biāo)表示適應(yīng)度值,根據(jù)前述參數(shù)尋優(yōu)過程可知,適應(yīng)度即為SVR模型的均方誤差平均值,其值越小,則SVR模型預(yù)測性能越好。由圖可以看出,一方面,種群平均適應(yīng)度下降平緩,表示進(jìn)化過程中種群多樣性沒有突然性的降低,減少了算法發(fā)生“早熟”的可能性,另一方面,迭代后期,平均適應(yīng)度收斂于最優(yōu)適應(yīng)度,表示種群中優(yōu)良個體保存良好,避免了算法陷入類似隨機(jī)搜索的可能。
圖7 JADE算法適應(yīng)度曲線Fig.7 Fitness curves of optimizing SVR parameters using JADE algorithms
根據(jù)求得的最優(yōu)參數(shù),建立JADE-SVR回歸模型,對訓(xùn)練數(shù)據(jù)和預(yù)測數(shù)據(jù)進(jìn)行計算,并與傳統(tǒng)回歸分析模型給出的計算值作比較。為了量化比較結(jié)果,引入四個評測指標(biāo),分別為偏移率Bias、均方根誤差RMSE、散射指數(shù)SI和相關(guān)系數(shù)R,其定義如下
(18)
(19)
(20)
(21)
關(guān)于反射系數(shù),分別采用SVR模型、行天強(qiáng)[11]推薦計算公式及2011年《防波堤設(shè)計與施工規(guī)范》[12]推薦計算公式,對訓(xùn)練數(shù)據(jù)和預(yù)測數(shù)據(jù)進(jìn)行計算,所得結(jié)果與試驗值對比,其中,SVR模型與行天強(qiáng)[11]推薦計算公式是由相同試驗數(shù)據(jù)擬合得到的,2011年《防波堤設(shè)計與施工規(guī)范》推薦計算公式是由暗基床開孔沉箱試驗數(shù)據(jù)擬合得到的。各統(tǒng)計評價指標(biāo)如表2~3所示。由表可知,無論對訓(xùn)練數(shù)據(jù)和預(yù)測數(shù)據(jù),JADE-SVR性能都顯著超過傳統(tǒng)多元回歸模型。由圖8所示,利用JADE-SVR模型所得計算值更加接近真實值,故而能很好地描述反射系數(shù)與各無因次變量間的函數(shù)關(guān)系;另外,JADE-SVR模型不僅對訓(xùn)練數(shù)據(jù)的計算達(dá)到很高精度,對預(yù)測數(shù)據(jù)也有良好的計算精度,沒有出現(xiàn)機(jī)器學(xué)習(xí)過程中易發(fā)生的“欠擬合”和“過擬合”現(xiàn)象。
表2 三種模型關(guān)于波浪反射系數(shù)計算性能對比(訓(xùn)練數(shù)據(jù))Tab.2 Comparison on computing the wave reflection using three different models (train data)
表3 三種模型關(guān)于波浪反射系數(shù)計算性能對比(預(yù)測數(shù)據(jù))Tab.3 Comparison on computing the wave reflection using three different models (test data)
圖8 反射系數(shù)計算值與試驗值比較Fig.8 Comparison of Kr between measured and calculated results
表4 三種模型關(guān)于水平力峰值時刻垂直波浪力折減系數(shù)計算性能對比(訓(xùn)練數(shù)據(jù))Tab.4 Comparison of computing the wave reflection using three different models (train data)
表5 三種模型關(guān)于水平力峰值時刻垂直波浪力折減系數(shù)計算性能對比(預(yù)測數(shù)據(jù))Tab.5 Comparison of computing the wave reflection using three different models (test data)
圖9 水平力峰值時刻垂直力折減系數(shù)Pv/Pv0計算值與試驗值比較Fig.9 Comparison of Pv/Pv0between measured and calculated results
關(guān)于垂直波浪力折減系數(shù)Pv/Pv0,分別采用SVR模型、馮延奇[13]推薦計算公式及2011年《防波堤設(shè)計與施工規(guī)范》推薦計算公式,對訓(xùn)練數(shù)據(jù)和預(yù)測數(shù)據(jù)進(jìn)行計算,所得結(jié)果與試驗值對比,其中,SVR模型與馮延奇[13]推薦計算公式是由相同試驗數(shù)據(jù)擬合得到的,2011年《防波堤設(shè)計與施工規(guī)范》推薦計算公式是由暗基床開孔沉箱試驗數(shù)據(jù)擬合得到的。表4~5給出關(guān)于水平力峰值時刻對應(yīng)垂直力折減系數(shù)計算評價結(jié)果,表6~7給出水平力谷值時刻對應(yīng)垂直力折減系數(shù)計算評價結(jié)果。與反射系數(shù)計算結(jié)果類似,SVR模型給出的計算結(jié)果仍好于傳統(tǒng)回歸分析方法計算結(jié)果,而《防波堤設(shè)計與施工規(guī)范》推薦公式計算結(jié)果精度偏低,原因在于其沒有考慮基床高度的影響,只適用于暗基床形式開孔沉箱的計算。
表6 三種模型關(guān)于水平力谷值時刻垂直波浪力折減系數(shù)計算性能對比(訓(xùn)練數(shù)據(jù))Tab.6 Comparison of computing Pv/Pv0 using three different models (train data)
表7 三種模型關(guān)于水平力谷值時刻垂直波浪力折減系數(shù)計算性能對比(預(yù)測數(shù)據(jù))Tab.7 Comparison of computing Pv/Pv0 using three different models (test data)
值得注意的是,在以往的工作中,無論是行天強(qiáng)[11]對反射系數(shù)Kr或是馮延奇[13]對垂直波浪力折減系數(shù)Pv/Pv0給出的多元回歸分析模型,都是將全部216組試驗數(shù)據(jù)進(jìn)行擬合,而沒有像本文一樣,只取其中一部分作為擬合數(shù)據(jù),另一部分單獨劃出作為預(yù)測數(shù)據(jù),對擬合后的公式進(jìn)行預(yù)測精度的驗證。因此可以認(rèn)為在本文中這些多元回歸分析模型的預(yù)測精度在一定程度上被高估了。
圖10 水平力谷值時刻垂直力折減系數(shù)Pv/Pv0計算值與試驗值比較Fig.10 Comparison of Pv/Pv0between measured and calculated results
綜合來看,JADE-SVR模型相比傳統(tǒng)回歸分析模型,回歸預(yù)測性能更佳。其一體現(xiàn)在計算結(jié)果更加接近真實值,能更加精確地模擬復(fù)雜非線性物理問題,其二在于JADE-SVR作為一種機(jī)器學(xué)習(xí)方法,將回歸分析的全過程交予計算機(jī),省去大量人工工作量。
一般的機(jī)器學(xué)習(xí)方法有可能過高的估計回歸模型的復(fù)雜程度,從而發(fā)生“過擬合”現(xiàn)象。SVR理論上用結(jié)構(gòu)風(fēng)險最小化策略代替?zhèn)鹘y(tǒng)的經(jīng)驗風(fēng)險最小化策略,使之較傳統(tǒng)機(jī)器學(xué)習(xí)方法具有更好的泛化性能,在編程實現(xiàn)上利用交叉驗證進(jìn)行參數(shù)尋優(yōu),進(jìn)一步降低了出現(xiàn)“過擬合”的可能。本文選用試驗數(shù)據(jù)樣本數(shù)量在200~300區(qū)間內(nèi),從數(shù)據(jù)分析的結(jié)果來看,SVR模型給出的預(yù)測精度并沒有顯著低于擬合精度,故而沒有出現(xiàn)“過擬合”的現(xiàn)象,這說明JADE-SVR對本文涉及的開孔沉箱波浪反射系數(shù)、垂直力折減系數(shù)的回歸分析是適用的。
傳統(tǒng)回歸分析方法,在擬合回歸公式之前還要進(jìn)行單變量分析,從而一一確定各變量的影響階數(shù),這一過程是人工完成的,有一定的隨意性,為了保證擬合公式的泛化性能,通常將各變量的影響階數(shù)確定的較低,偏于保守。利用本文建立的JADE-SVR模型對開孔沉箱反射系數(shù)、垂直力折減系數(shù)進(jìn)行擬合,對比傳統(tǒng)多元回歸分析法可以發(fā)現(xiàn),JADE-SVR模型對擬合精度和泛化性能都有所改進(jìn),可以利用其對波浪-開孔沉箱相互作用問題進(jìn)行深入研究。
隨著科技的不斷進(jìn)步和大數(shù)據(jù)的興起,各行業(yè)的分析研究工作都傾向于依靠更加龐大豐富的試驗數(shù)據(jù)樣本。在港口工程領(lǐng)域,數(shù)值模擬方法的不斷完善也為物理模型試驗提供了有益補(bǔ)充,使得數(shù)據(jù)分析的樣本容量大大增加,這樣機(jī)器學(xué)習(xí)方法具有的高效率、高精確度的優(yōu)勢將越來越明顯。