高 騰,許煥敏
(河海大學(xué) 機(jī)電工程學(xué)院,江蘇 常州 213022)
絞吸挖泥船產(chǎn)量決定了工程效益,同時(shí)也是評(píng)價(jià)其性能最為重要的指標(biāo)之一[1]。預(yù)測(cè)產(chǎn)量有助于疏浚作業(yè)過(guò)程中選擇最優(yōu)的作業(yè)參數(shù),實(shí)現(xiàn)挖泥船的作業(yè)優(yōu)化。由于挖泥船的作業(yè)過(guò)程由多因素共同作用,產(chǎn)量的影響因素眾多,導(dǎo)致對(duì)挖泥船產(chǎn)量的預(yù)測(cè)十分困難。丁樹(shù)友等[2]研發(fā)疏浚作業(yè)輔助決策系統(tǒng)并用于疏浚產(chǎn)量的現(xiàn)場(chǎng)尋優(yōu),從而提高施工效率;王其松等[3]通過(guò)分析大量挖泥船作業(yè)反饋的數(shù)據(jù),提出將施工經(jīng)驗(yàn)與施工數(shù)據(jù)分析相結(jié)合,對(duì)挖泥船產(chǎn)量進(jìn)行優(yōu)化。目前,針對(duì)挖泥船產(chǎn)量的優(yōu)化已經(jīng)做了大量研究,但產(chǎn)量與工藝參量之間仍缺乏一種可量化的數(shù)學(xué)關(guān)系模型。
因此,本文針對(duì)疏浚作業(yè)反饋數(shù)據(jù),通過(guò)Relief權(quán)重算法篩選出影響挖泥船產(chǎn)量的主要工藝參量,并在此基礎(chǔ)上利用偏最小二乘回歸建立產(chǎn)量與主要工藝參量之間的一種可量化的數(shù)學(xué)模型,為預(yù)測(cè)挖泥船的產(chǎn)量提供一種方法,對(duì)疏浚作業(yè)優(yōu)化具有重要的現(xiàn)實(shí)意義。
根據(jù)文獻(xiàn)[3]可知,挖泥船的產(chǎn)量可由下式表示:
W=QC=πr2vC
(1)
(2)
式中:W為挖泥船的產(chǎn)量(m3s);Q為泥漿流量(m3s);C為泥漿濃度,以質(zhì)量百分比表示(%);r為挖泥船排泥管的半徑(m);v為泥漿流速(ms);ρs為泥漿密度(kgm3);ρw為水的密度(kgm3);ρn為泥沙的干密度(kgm3);ε為泥沙孔隙率。
根據(jù)式(1)、(2)可得:
(3)
根據(jù)式(3)可得,挖泥船的產(chǎn)量與排泥管半徑、泥漿流速、泥漿密度、泥沙干密度、泥沙孔隙率有關(guān)。其中除去排泥管半徑、泥沙干密度及泥沙孔隙率這些不可控的因素外,泥漿流速、密度與泥泵功率和絞刀性能密切相關(guān)。因此,總結(jié)影響挖泥船作業(yè)產(chǎn)量的工藝參量有:絞刀轉(zhuǎn)速(rmin)、泵軸轉(zhuǎn)速(rmin)、橫移速度(ms)、管路平均濃度(%)、管路流速(ms)、出口流速(ms)、絞刀切泥厚度(m)、絞刀前進(jìn)距離(m)和臺(tái)車(chē)行程(m),共9個(gè)參量。
基于“天獅號(hào)”絞吸挖泥船實(shí)時(shí)反饋的數(shù)據(jù),隨機(jī)提取100組上述工藝參量的數(shù)據(jù),見(jiàn)表1。
表1 產(chǎn)量與各工藝參量數(shù)據(jù)
由于所提取的產(chǎn)量及各工藝參量的數(shù)值不在同一個(gè)數(shù)量級(jí),因此,為消除不同量綱帶來(lái)的影響,首先需要對(duì)所提取的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。標(biāo)準(zhǔn)化變換如下:
(4)
產(chǎn)量的影響因素眾多,提取對(duì)產(chǎn)量影響較大的參量對(duì)降低挖泥船作業(yè)復(fù)雜度具有重要意義。對(duì)原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理后,利用Relief權(quán)重算法[4],對(duì)工藝參量進(jìn)行篩選。Relief算法由Kira提出,是目前最為有效的特征選擇方法之一,該算法依據(jù)特征和類(lèi)別的相關(guān)性賦予特征不同的權(quán)重,權(quán)重小于某個(gè)閾值的特征將被剔除[5],以此作為特征篩選的理由。Relief算法流程如圖1所示。
算法實(shí)現(xiàn)過(guò)程使用MATLAB實(shí)現(xiàn)。將表1的數(shù)據(jù)隨機(jī)劃分為兩類(lèi),每一類(lèi)各50組數(shù)據(jù),不設(shè)置權(quán)重的閾值。按照每個(gè)參量權(quán)重的大小進(jìn)行排序,提取權(quán)重較大的工藝參量。由于兩類(lèi)數(shù)據(jù)是隨機(jī)劃分的,為避免程序運(yùn)行導(dǎo)致的試驗(yàn)誤差,將程序運(yùn)行20次,取平均值作為最終計(jì)算結(jié)果。如圖2所示。其中垂直矩形越高,則表示該參量的權(quán)重越大。
根據(jù)圖2,將各參量按權(quán)重大小進(jìn)行排序,從大到小依次為:管路平均濃度、管路流速、絞刀前進(jìn)距離、絞刀切泥厚度、絞刀轉(zhuǎn)速、橫移速度、臺(tái)車(chē)行程、出口流速、泵軸轉(zhuǎn)速。
由權(quán)重大小可知,大部分的參量權(quán)重都高于0.1,所以將權(quán)重低于0.1的剔除。因此,保留的工藝參量有:管路平均濃度、管路流速、絞刀前近距離、絞刀切泥厚度、絞刀轉(zhuǎn)速、橫移速度。根據(jù)文獻(xiàn)[6],挖泥船作業(yè)產(chǎn)量主要與泥泵特性和管路特性有關(guān),所以提取出的主要工藝參量符合疏浚工程中的實(shí)際應(yīng)用。
圖1 Relief算法流程
圖2 參量權(quán)重
偏最小二乘回歸是一種多元統(tǒng)計(jì)數(shù)據(jù)分析方法,它的研究?jī)?nèi)容主要是多因變量與多自變量之間的回歸建模,特別是當(dāng)自變量?jī)?nèi)部存在著多重相關(guān)性時(shí),而疏浚作業(yè)中各工藝參量之間相互影響,關(guān)系復(fù)雜,因此,采用偏最小二乘回歸進(jìn)行建模則會(huì)更加有效。
1)從標(biāo)準(zhǔn)化自變量矩陣中提取第一個(gè)主成分t1,其中w1為標(biāo)準(zhǔn)化自變量矩陣的第一主軸,且
(5)
t1=E0w1
(6)
E0=t1pT1+E1
(7)
(8)
F0=t1rT1+F1
(9)
式中:E1為標(biāo)準(zhǔn)化自變量矩陣的殘差矩陣;p1為E0在第一主成分上的回歸系數(shù);F1為標(biāo)準(zhǔn)化因變量矩陣的殘差矩陣;r1為F0在第一主成分上的回歸系數(shù)。
2)以E1取代E0、F1取代F0,用同樣的方法重復(fù)步驟1),有:
(10)
t2=E1w2
(11)
E1=t2pT2+E2
(12)
(13)
F1=t2rT2+F2
(14)
以此類(lèi)推,從步驟2)開(kāi)始,可以使用交叉有效性確定偏最小二乘回歸所提取的成分個(gè)數(shù)。
3)確定所提取的成分t1,t2,…,tm后,進(jìn)行回歸分析。首先實(shí)施F0關(guān)于t1,t2,…,tm的回歸:
F0=r1t1+r2t2+…+rmtm
(15)
由于所提取的成分th(h=1,2,…,m)均為E0的線性組合,因此
(16)
F0=r1E0w*1+…+rmE0w*m=E0(r1w*1+…+rmw*m)
(17)
y*=β1x*1+β2x*2+…+βpx*p
(18)
式中:β1、β2、…、βp為標(biāo)準(zhǔn)化數(shù)據(jù)的系數(shù)。
最后,通過(guò)數(shù)據(jù)標(biāo)準(zhǔn)化的逆過(guò)程,可得到因變量y關(guān)于自變量xj的回歸方程為
y=α0+α1x1+…+αpxp
(19)
式中:α0、α1、…、αp為回歸方程的回歸系數(shù)。
偏最小二乘回歸一般來(lái)說(shuō)不需要采用所有的成分進(jìn)行建模,選擇成分的個(gè)數(shù)可通過(guò)增加一個(gè)成分,判斷新增的成分能否對(duì)模型的預(yù)測(cè)精度有明顯的提升來(lái)確定。
記yi為原始數(shù)據(jù),t1,t2,…,th是偏最小二乘回歸分析中提取的所有成分,yh(-i)表示在建模過(guò)程中,除去第i個(gè)樣本點(diǎn)后,用t1,t2,…,th這些成分進(jìn)行建模,再根據(jù)此模型計(jì)算第i個(gè)樣本的預(yù)測(cè)值;yh(i)表示在建模過(guò)程中,選取所有的樣本點(diǎn)并使用成分t1,t2,…,th進(jìn)行建模后,根據(jù)此建模模型預(yù)測(cè)的第i個(gè)樣本點(diǎn)的擬合值。PRESSh為因變量的預(yù)測(cè)誤差平方和,SSh表示誤差平方和,Q2h定義為交叉有效性,計(jì)算公式為:
(20)
(21)
(22)
一般情況下認(rèn)為,當(dāng)Q2h≥0.097 5時(shí),表明增加的成分對(duì)于改善回歸模型的精度有著顯著的作用,因此可以繼續(xù)增加偏最小二乘回歸的成分,直至當(dāng)Q2h< 0.097 5時(shí),可不再增加回歸模型的成分,這時(shí)提取的成分個(gè)數(shù)即為偏最小二乘回歸的最佳成分個(gè)數(shù)[7]。
以“天獅號(hào)”絞吸挖泥船實(shí)時(shí)反饋數(shù)據(jù)為例,共1 000組作為試驗(yàn)數(shù)據(jù)。基于主要工藝參量篩選后的結(jié)果,根據(jù)偏最小二乘回歸原理,建立如下的數(shù)學(xué)模型:
y=1.838 8+0.014 6x1+0.010 8x2-0.001 6x3-
0.106 4x4-0.008 7x5-0.075 7x6
(23)
式中:y為產(chǎn)量(m3s);x1為絞刀轉(zhuǎn)速(rmin);x2為橫移速度(ms);x3為管路平均濃度(%);x4為管路流速(ms);x5為絞刀切泥厚度(m);x6為絞刀前進(jìn)距離(m)。
為避免偶然誤差,從1 000組數(shù)據(jù)中隨機(jī)選取50組作為試驗(yàn)樣本,比較預(yù)測(cè)產(chǎn)量與實(shí)際產(chǎn)量,如圖3所示。
圖3 預(yù)測(cè)產(chǎn)量與實(shí)際產(chǎn)量比較
1)為了篩選出影響產(chǎn)量的主要工藝參量,降低作業(yè)復(fù)雜度。本文利用Relief權(quán)重算法,根據(jù)各工藝參量的權(quán)重大小提取出權(quán)重較大的主要工藝參量作為數(shù)學(xué)模型的自變量。
2)通過(guò)偏最小二乘回歸分析建立產(chǎn)量與主要工藝參量之間的數(shù)學(xué)模型,并對(duì)模型的擬合效果進(jìn)行分析,該方法建立的數(shù)學(xué)模型能夠較好地對(duì)產(chǎn)量進(jìn)行預(yù)測(cè)。
3)本文中利用偏最小二乘回歸建立的產(chǎn)量與主要工藝參量之間的數(shù)學(xué)模型,不僅可用于對(duì)挖泥船的產(chǎn)量進(jìn)行預(yù)測(cè),同時(shí)也能選擇最優(yōu)作業(yè)參數(shù),實(shí)現(xiàn)挖泥船的作業(yè)優(yōu)化,從而提高作業(yè)效率。