張 琴,蔡慧茹,蘭明東,浦 克,胡 雄
(上海海事大學(xué)物流工程學(xué)院,上海 201306)
在“雙碳”目標(biāo)以及海上風(fēng)電“十四五”規(guī)劃的推動(dòng)下,沿海各省相繼開展了海上風(fēng)電機(jī)組的研發(fā)與安裝工作,14~16兆瓦級(jí)的大型海上風(fēng)機(jī)相繼問世。其不斷增大的規(guī)模以及在吊運(yùn)、安裝過程中海浪對(duì)船舶產(chǎn)生的持續(xù)影響,都會(huì)導(dǎo)致安裝的精度和效率大幅下降,甚至?xí)?duì)人員安全以及財(cái)產(chǎn)帶來(lái)重大損失[1–2]。因此,如何在工程船上提供一個(gè)穩(wěn)定的環(huán)境,以保證各項(xiàng)作業(yè)高效、高質(zhì)量地完成成為了一個(gè)有價(jià)值的研究課題。
建立補(bǔ)償機(jī)構(gòu)及模型是進(jìn)行優(yōu)化控制的基礎(chǔ),補(bǔ)償機(jī)構(gòu)的模型可以根據(jù)控制力執(zhí)行方式的不同分為被動(dòng)式補(bǔ)償和主動(dòng)式補(bǔ)償[3–4]。被動(dòng)式波浪補(bǔ)償主要是根據(jù)已有的受力變化來(lái)控制補(bǔ)償參數(shù),屬于單自由度的恒力補(bǔ)償,不需要消耗動(dòng)力,但精度低并且存在較大滯后[5–6];主動(dòng)式波浪補(bǔ)償是通過傳感器獲得船舶位姿,進(jìn)而求解得到補(bǔ)償所需要的驅(qū)動(dòng)力信號(hào),最終通過控制器執(zhí)行來(lái)達(dá)到補(bǔ)償效果,其在模型設(shè)計(jì)、補(bǔ)償精度以及響應(yīng)速度上都要優(yōu)于前者,滿足復(fù)雜海況下海洋作業(yè)的需求[7–8]。對(duì)于主動(dòng)式波浪補(bǔ)償,胡永攀等[9]提出一種基于繩牽引并聯(lián)機(jī)構(gòu)的波浪補(bǔ)償結(jié)構(gòu),在弱干擾下達(dá)到了較好的控制效果,然而在復(fù)雜海況下,該結(jié)構(gòu)不能夠很好地控制精度,且其部署在起重機(jī)末端,難以提供足夠的承重區(qū)域進(jìn)行風(fēng)機(jī)的吊運(yùn)安裝工作。對(duì)此,梅江平等[10]提出了3–SPR(three–spherical paral lel robot)補(bǔ)償結(jié)構(gòu),該結(jié)構(gòu)可安裝于甲板上,彌補(bǔ)了空間不足的缺陷;并通過實(shí)驗(yàn)驗(yàn)證了該結(jié)構(gòu)的正確性和可行性。隨后,詹勇等[11]對(duì)此結(jié)構(gòu)進(jìn)行了優(yōu)化,并采用規(guī)則波進(jìn)行4級(jí)海況下的仿真實(shí)驗(yàn),結(jié)果表明,該設(shè)備在此波形下可以保證足夠的響應(yīng)速度和控制精度,但3個(gè)支鏈?zhǔn)瞧叫蟹植?,在?qiáng)度和穩(wěn)定性上存在一定的不足。Salzmann等[12]提出一種6自由度補(bǔ)償平臺(tái)(Stewart平臺(tái))結(jié)構(gòu),并驗(yàn)證了其可行性。通過控制6個(gè)支鏈伸縮,基于其耦合關(guān)系達(dá)到控制上平臺(tái)位姿轉(zhuǎn)變的目的,可以進(jìn)行全自由度補(bǔ)償。針對(duì)此結(jié)構(gòu)研發(fā)出的設(shè)備在剛度、承載力及穩(wěn)定性等方面都頗為優(yōu)秀,被廣泛應(yīng)用在航天、海洋作業(yè)及制造業(yè)等領(lǐng)域。根據(jù)Stewart平臺(tái)的機(jī)械結(jié)構(gòu)及傳動(dòng)模式建立動(dòng)力學(xué)模型,該模型可以更好地表示平臺(tái)運(yùn)動(dòng)與各驅(qū)動(dòng)單元輸入力的關(guān)系。
在模型建立的基礎(chǔ)上,波浪補(bǔ)償控制方法的選擇也成為影響最終控制效果的關(guān)鍵因素。李世振等[13]在單自由度升沉運(yùn)動(dòng)補(bǔ)償?shù)难芯恐惺褂昧唆敯?、滑模等智能控制,取得了不錯(cuò)的控制效果,但在復(fù)雜海況下,僅單自由度補(bǔ)償不足以提供穩(wěn)定的作業(yè)環(huán)境。苗夢(mèng)亮[14]基于廣義預(yù)測(cè)控制(MPC)對(duì)主動(dòng)式波浪補(bǔ)償進(jìn)行控制,研究達(dá)到不錯(cuò)的效果,但MPC過于依賴模型,不適合復(fù)雜多變的對(duì)象,且優(yōu)化過程是比較耗時(shí)的,在實(shí)際工作中可能會(huì)帶來(lái)較大的滯后[15–16]。Zinage等[17]提出了一種基于強(qiáng)化學(xué)習(xí)(RL)的控制器,采用深度確定性策略梯度算法(DDPG)對(duì)單自由度進(jìn)行主動(dòng)升沉補(bǔ)償,取得了很好的效果,但學(xué)習(xí)過程耗時(shí)較長(zhǎng)且存在振蕩。
中國(guó)在波浪補(bǔ)償領(lǐng)域還處于研發(fā)階段,在模型已知的情況下,可靠性高、過程簡(jiǎn)化的PID控制器仍是實(shí)際應(yīng)用中的研究熱點(diǎn)。針對(duì)波浪補(bǔ)償平臺(tái)而言,PID控制器參數(shù)的整定是控制效果的關(guān)鍵,因此,將優(yōu)化算法與PID控制器結(jié)合進(jìn)行優(yōu)化控制。周明建等[18]對(duì)波浪補(bǔ)償系統(tǒng)的PID參數(shù)使用遺傳算法(GA)進(jìn)行優(yōu)化,獲得較好的控制精度和抗干擾能力,以此證明該方法的準(zhǔn)確性。唐剛等[19]建立了波浪補(bǔ)償平臺(tái)單通道模型,并使用粒子群算法(PSO)對(duì)PID控制器參數(shù)進(jìn)行整定優(yōu)化,結(jié)果表明,優(yōu)化得到的參數(shù)可以起到不錯(cuò)的效果。上述研究為波浪補(bǔ)償系統(tǒng)的優(yōu)化控制提供了可行的方向,但沒有結(jié)合整個(gè)波浪補(bǔ)償平臺(tái),因此,無(wú)法驗(yàn)證最終補(bǔ)償?shù)男Ч徊⑶?,針?duì)PID控制器參數(shù)范圍大的特點(diǎn),現(xiàn)有的優(yōu)化算法并沒有采用跳出局部最優(yōu)的策略。為此,薛建凱等[20]提出麻雀搜索算法(SSA),該算法在精度、收斂速度及魯棒性方面較遺傳算法、粒子群算法等都有了一定的提升。隨后,針對(duì)SSA易陷入局部最優(yōu)的問題,t分布變異策略、基于差異的局部搜索和動(dòng)態(tài)自適應(yīng)加權(quán)等方法被應(yīng)用到SSA中,在全局尋優(yōu)能力及收斂速度方面較原算法都取得了較大的提升[21–23]。
從提高收斂速度及增強(qiáng)全局尋優(yōu)能力的角度出發(fā),本文提出一種改進(jìn)麻雀搜索算法,即結(jié)合circle混沌映射、動(dòng)態(tài)加權(quán)、柯西突變和反向?qū)W習(xí)策略的麻雀搜索算法(circle cauchyreverselearningbased sparrow search algorithm,CCRSSA),并將其應(yīng)用于波浪補(bǔ)償平臺(tái)PID控制器參數(shù)的整定中。首先,根據(jù)Stewart結(jié)構(gòu)建立了Stewart平臺(tái)動(dòng)力學(xué)及運(yùn)動(dòng)學(xué)反解模型;隨后,使用麻雀搜索算法對(duì)PID參數(shù)進(jìn)行整定優(yōu)化,并在麻雀搜索算法中引入circle混沌映射、動(dòng)態(tài)加權(quán)及柯西突變和反向?qū)W習(xí)策略,提高了算法對(duì)參數(shù)的優(yōu)化能力;最后,生成PM譜下4~6級(jí)海況的工程船運(yùn)動(dòng)數(shù)據(jù),比較了在數(shù)據(jù)集下GA、PSO、SSA等方法對(duì)PID參數(shù)的優(yōu)化效果,結(jié)果表明,改進(jìn)麻雀搜索算法能夠較好地應(yīng)用于波浪補(bǔ)償平臺(tái)的優(yōu)化控制。
本文使用Stewart平臺(tái)作為研究對(duì)象,圖1為Stewart平臺(tái)的實(shí)物圖。在Simulink軟件中使用SimMechanics工具集,根據(jù)Stew art平臺(tái)的機(jī)械結(jié)構(gòu)及傳動(dòng)模式建立動(dòng)力學(xué)模型,將上、下層分別作為波浪補(bǔ)償系統(tǒng)和船舶運(yùn)動(dòng)模擬系統(tǒng),相鄰平臺(tái)間由6個(gè)電缸驅(qū)動(dòng)的支鏈連接支撐,平臺(tái)與支鏈由虎克鉸連接,通過對(duì)6個(gè)支鏈進(jìn)行控制,可以使平臺(tái)實(shí)現(xiàn)6個(gè)自由度位姿的運(yùn)動(dòng),包括:橫搖、縱搖、艏搖、橫蕩、縱蕩及升沉,其中,橫蕩、縱蕩、艏搖都可以借助船舶自身的動(dòng)力定位或者錨泊技術(shù)實(shí)現(xiàn)補(bǔ)償[24–25]。故本文僅對(duì)橫搖、縱搖、升沉運(yùn)動(dòng)進(jìn)行控制補(bǔ)償,其中,升沉運(yùn)動(dòng)會(huì)引起貨物與甲板的碰撞,橫搖和縱搖則是造成設(shè)備搖晃的主要原因[26]。因此,補(bǔ)償升沉、橫搖、縱搖這3個(gè)自由度上的運(yùn)動(dòng)是實(shí)現(xiàn)海上安全作業(yè)的關(guān)鍵技術(shù)。
圖1 Stewart波浪補(bǔ)償控制平臺(tái)Fig.1 Stewart wave compensation platform
圖2為補(bǔ)償系統(tǒng)模型設(shè)計(jì)波浪補(bǔ)償控制策略。首先,將生成的工程船3自由度運(yùn)動(dòng)信號(hào)輸入船舶運(yùn)動(dòng)模擬系統(tǒng),以此來(lái)模擬船舶運(yùn)動(dòng);通過正解模型對(duì)船舶運(yùn)動(dòng)模擬平臺(tái)進(jìn)行反解計(jì)算,求得使補(bǔ)償平臺(tái)保持穩(wěn)定的6個(gè)支鏈位移,作為波浪補(bǔ)償系統(tǒng)的參考輸入,同時(shí),根據(jù)編碼器檢測(cè)到的支鏈實(shí)際位移,采用PID進(jìn)一步控制6個(gè)電缸;隨后,根據(jù)編碼器采集到的實(shí)際位移,通過正解模型求解補(bǔ)償平臺(tái)3個(gè)自由度,驗(yàn)證其穩(wěn)定性。下面對(duì)波浪補(bǔ)償系統(tǒng)模型進(jìn)行分析計(jì)算。
圖2 波浪補(bǔ)償控制示意圖Fig.2 Wave compensation control schematic
對(duì)Stewart平臺(tái)進(jìn)行正反解分析,需要6個(gè)參數(shù)建立平臺(tái)坐標(biāo)系:波浪補(bǔ)償系統(tǒng)上平臺(tái)外接圓半徑r及偏轉(zhuǎn)角a、下平臺(tái)外接圓半徑R及偏轉(zhuǎn)角b、基準(zhǔn)位上下平臺(tái)垂直距離h及此時(shí)支鏈初始長(zhǎng)度l0。將圖1中波浪補(bǔ)償系統(tǒng)的下、上平臺(tái)分別作為動(dòng)平臺(tái)(Base)和靜平臺(tái)(Platform),以其中心OB、OP為原點(diǎn)分別建立兩個(gè)坐標(biāo)系:動(dòng)坐標(biāo)系OB-XBYBZB,靜坐標(biāo)系OPXPYPZP,兩個(gè)坐標(biāo)系如圖3所示。其中,靜平臺(tái)偏轉(zhuǎn)角a=(∠P1OPP6)/2,絞點(diǎn)P1~P6為靜平臺(tái)與支鏈連接點(diǎn);動(dòng)平臺(tái)偏轉(zhuǎn)角b=(∠B3OBB4)/2,絞點(diǎn)B1~B6為動(dòng)平臺(tái)與支鏈連接點(diǎn)。
圖3 波浪補(bǔ)償系統(tǒng)的平臺(tái)坐標(biāo)系Fig.3 Platform coordinate system for wave compensation system
由圖3可得靜平臺(tái)各鉸點(diǎn)Pi(i=1,2,···,6)在靜坐標(biāo)系中的坐標(biāo),以及動(dòng)平臺(tái)各鉸點(diǎn)Bi在動(dòng)坐標(biāo)系中的坐標(biāo),分別以P1和B1為例表示如下:
求得坐標(biāo)后,通過坐標(biāo)旋轉(zhuǎn)矩陣進(jìn)行反解計(jì)算。
當(dāng)動(dòng)平臺(tái)繞XB軸、YB軸、ZB軸做橫搖、縱搖、艏搖運(yùn)動(dòng)時(shí),可通過坐標(biāo)旋轉(zhuǎn)矩陣將動(dòng)坐標(biāo)系中的點(diǎn)在慣性坐標(biāo)系中表示出來(lái),其中,慣性坐標(biāo)系以圖1中基座外接圓圓心為原點(diǎn)建立,從而進(jìn)行同一坐標(biāo)系下的運(yùn)算,其中旋轉(zhuǎn)矩陣T可以表示為:
式中,s為正弦,c為余弦, α為橫搖角度, β為縱搖角度,γ為艏搖角度。通過將加速度計(jì)、陀螺儀檢測(cè)到的船舶運(yùn)動(dòng)模擬平臺(tái)3自由度信號(hào)帶入,可求得動(dòng)平臺(tái)在做橫搖、縱搖以及升沉復(fù)合運(yùn)動(dòng)時(shí),其絞點(diǎn)在慣性坐標(biāo)系中的坐標(biāo)為:
式中,B0=[0 0Z+h]T,其中,Z為升沉引起的動(dòng)平臺(tái)高度位移值,h為Stewart平臺(tái)處于中間(home)位置時(shí)的上下平臺(tái)垂直距離。而補(bǔ)償平臺(tái)目的是保持穩(wěn)定,因此,其絞點(diǎn)坐標(biāo)固定,絞點(diǎn)在慣性坐標(biāo)系中坐標(biāo)如下:
此時(shí),波浪補(bǔ)償系統(tǒng)6個(gè)支鏈(第i個(gè)絞點(diǎn)對(duì)應(yīng)第i個(gè)支鏈)的長(zhǎng)度向量l i在慣性坐標(biāo)系中可表示為:
并可由長(zhǎng)度向量求得支鏈位移 ?ls:
式中,||l i||2為對(duì)l i進(jìn)行2范數(shù)求解,為第i個(gè)支鏈的初始長(zhǎng)度,最終, ?l i作為圖2所示的波浪補(bǔ)償系統(tǒng)控制器的輸入信號(hào)。
綜上,當(dāng)已知Stewart平臺(tái)的尺寸和位姿時(shí),通過式(3)~(6)求解出6個(gè)支鏈位移的過程即為運(yùn)動(dòng)學(xué)反解。通過運(yùn)動(dòng)學(xué)反解,求得使補(bǔ)償平臺(tái)保持穩(wěn)定時(shí)波浪補(bǔ)償系統(tǒng)6個(gè)支鏈的位移,作為補(bǔ)償控制參考輸入。
正解模型用于對(duì)補(bǔ)償平臺(tái)的穩(wěn)定性進(jìn)行驗(yàn)證。通過編碼器測(cè)得的補(bǔ)償系統(tǒng)6個(gè)支鏈位移,求解其3自由度的過程稱為正解。求解方程如下:
式中,γ1、α1、β1分別為運(yùn)動(dòng)軌跡中初始時(shí)刻的升沉位移、橫搖角度、縱搖角度,Ui(α1,β1,γ1)′為波浪補(bǔ)償系統(tǒng)第s個(gè)支鏈位移求解值,Ei(α1,β1,γ1)為波浪補(bǔ)償系統(tǒng)第s個(gè)支鏈位移求解誤差,F(xiàn)為對(duì)6個(gè)支鏈位移求解誤差求和,di為編碼器采集到的第i個(gè)支鏈的實(shí)際位移,Ei為第i個(gè)支鏈的位移求解誤差。通過將上一時(shí)刻3自由度求解結(jié)果作為該時(shí)刻初始值,分別帶入下列公式中進(jìn)行迭代:
式中,k1、k2、k3分別為升沉、橫搖和縱搖運(yùn)動(dòng)的迭代步長(zhǎng),可根據(jù)不同海況等級(jí)進(jìn)行設(shè)定,Rand(0,1)為0和1之間的隨機(jī)數(shù)。求得在F最小時(shí)的解,以此獲得補(bǔ)償平臺(tái)3自由度。該算法流程圖如圖4所示。
設(shè)定迭代次數(shù)上限kmax,k為迭代項(xiàng)數(shù),F(xiàn)(k)為第k次迭代后的誤差,當(dāng)進(jìn)行kmax次迭代后沒有更優(yōu)解出現(xiàn)時(shí),輸出當(dāng)前α、β、Z作為最優(yōu)解,并將此解作為下一時(shí)刻初始值。設(shè)置不同的上限可以實(shí)現(xiàn)不同精度的求解,通過以上算法解決連續(xù)運(yùn)動(dòng)軌跡下的正解模型求解問題[27]。
對(duì)船舶運(yùn)動(dòng)模擬系統(tǒng)進(jìn)行上述算法求解,將結(jié)果與傳感器采集到的信號(hào)進(jìn)行比對(duì)來(lái)驗(yàn)證算法的可行性。在動(dòng)力學(xué)及正反解模型建立后,對(duì)波浪補(bǔ)償系統(tǒng)的6個(gè)支鏈進(jìn)行PID控制。
圖4 正解模型迭代求解Fig.4 Iterative solution of the positive solution model
海況是指風(fēng)力影響下的海面狀況,可進(jìn)行海上作業(yè)的最高海況等級(jí)為6級(jí),故本文選擇在4~6級(jí)海況下進(jìn)行仿真實(shí)驗(yàn)。其中,PM譜是一種長(zhǎng)期觀測(cè)得到的海浪頻譜,符合廣闊海域下工程船舶的作業(yè)環(huán)境,因此本文選擇用其生成4~6級(jí)的海浪運(yùn)動(dòng)??紤]到船舶和海水的邊界關(guān)系,選用基于勢(shì)流理論計(jì)算浮式結(jié)構(gòu)水動(dòng)力學(xué)特性的Ansys–AQWA軟件,通過將船模置于4~6級(jí)海況下得到對(duì)應(yīng)的船舶運(yùn)動(dòng),進(jìn)而控制補(bǔ)償平臺(tái),驗(yàn)證其穩(wěn)定性,圖5為使用的工程船模型示意圖。
圖5 某工程船模型示意圖Fig.5 Schematic diagram of an engineering ship
針對(duì)風(fēng)機(jī)安裝等大型海上作業(yè)的某工程船模型船舶主尺度見表1。
表1 船舶主尺度Tab.1 Vessel master scale
通過正解模型對(duì)船舶運(yùn)動(dòng)模擬平臺(tái)進(jìn)行3自由度求解,進(jìn)行求解效果驗(yàn)證,結(jié)果如圖6所示。
圖6 4~6級(jí)海況下的船舶運(yùn)動(dòng)Fig. 6 Ship movemnt from sea state four to six
從圖6中可以看出,算法求解結(jié)果與檢測(cè)到的工程船運(yùn)動(dòng)基本吻合,驗(yàn)證了求解算法的可行性,用于后續(xù)對(duì)波浪補(bǔ)償系統(tǒng)的正解模型求解。
將反解得到的波浪補(bǔ)償系統(tǒng)6個(gè)支鏈位移作為參考輸入,在與編碼器檢測(cè)到的實(shí)際位移做差的基礎(chǔ)上,對(duì)波浪補(bǔ)償系統(tǒng)的6個(gè)支鏈進(jìn)行PID協(xié)同控制:
式中,ei為波浪補(bǔ)償系統(tǒng)第i個(gè)支鏈的位移誤差,、pi分別為第i個(gè)支鏈參考位移及編碼器檢測(cè)到的第i個(gè)支鏈實(shí)際位移,為輸入給第i個(gè)支鏈的驅(qū)動(dòng)力,t為連續(xù)運(yùn)動(dòng)軌跡時(shí)長(zhǎng),KP、KI、KD為比例、積分、微分系數(shù)。
通過PID對(duì)支鏈位移信號(hào)進(jìn)行求解,獲得驅(qū)動(dòng)信號(hào),其3個(gè)參數(shù)決定著控制性能但又難以確定,故使用麻雀搜索算法對(duì)其進(jìn)行整定?;谑剑?)中的位移誤差,構(gòu)建時(shí)間絕對(duì)誤差積分(ITAE),記為EITA,作為優(yōu)化算法的適應(yīng)度值函數(shù),如式(10)所示:
麻雀種群中包含發(fā)現(xiàn)者、跟隨者和警戒者3種麻雀,其不同個(gè)體之間會(huì)相互監(jiān)視。發(fā)現(xiàn)者指獲得了更好食物來(lái)源的麻雀,跟隨者通常會(huì)奪取發(fā)現(xiàn)者同伴的食物,而一部分麻雀會(huì)作為警戒者警惕天敵的到來(lái),基于此來(lái)模擬麻雀覓食的過程。
在進(jìn)行比例積分微分控制器參數(shù)優(yōu)化時(shí),優(yōu)化變量為KP、KI、KD3個(gè)參數(shù),因此算法的解空間為3維。若存在N只麻雀[,則第m]只麻雀在3維解空間中的位置為X m,X m=,其處于上下限[bl,bu]之間,表示第m只麻雀在3維解空間中的比例增益、積分時(shí)間、微分時(shí)間的參數(shù)值。在每次迭代后,都會(huì)根據(jù)種群中不同麻雀的適應(yīng)度值,按照從高到低進(jìn)行排序,并選擇適應(yīng)度值較低的后20%的麻雀作為發(fā)現(xiàn)者,其余麻雀作為跟隨者,分類完成后再?gòu)乃新槿钢须S機(jī)選取10%~20%的麻雀作為警戒者,用于防止陷入局部最優(yōu)。
發(fā)現(xiàn)者為了獲得更低的適應(yīng)度值,要進(jìn)行的位置更新如下:
跟隨者則按照當(dāng)前位置a與中間位置N/2間的大小關(guān)系,向最優(yōu)或者最差區(qū)域移動(dòng)來(lái)獲得更低的適應(yīng)度值,其位置更新公式為:
同時(shí)在整個(gè)種群中選擇一定比例的麻雀作為警戒者,其不論當(dāng)前位置好壞,都會(huì)移動(dòng)到一個(gè)新的位置:
每次迭代后不同麻雀會(huì)基于適應(yīng)度值高低在發(fā)現(xiàn)者和跟隨者之間轉(zhuǎn)化,但發(fā)現(xiàn)者和跟隨者在種群中所占比例是固定的。基本麻雀搜索算法在PID參數(shù)初始化時(shí)較大的隨機(jī)性會(huì)導(dǎo)致分布不均勻,進(jìn)而降低后期迭代尋優(yōu)能力;此外,在進(jìn)行位置更新時(shí)容易陷入局部最優(yōu),錯(cuò)過其他最優(yōu)解,針對(duì)這兩點(diǎn)問題做出如下改進(jìn)。
1)改進(jìn)的circle混沌映射初始化混沌映射具有分形的特征,可以在對(duì)麻雀位置進(jìn)行初始化時(shí)產(chǎn)生更均勻的分布效果,以此來(lái)獲得較好的初始值[28]。這里選用效果穩(wěn)定且初始化分布均勻的circle混沌映射:
式中,Ym,j為第m只麻雀在第j維的比例系數(shù),mod為模運(yùn)算,Xm,j為混沌映射初始化后的麻雀位置, ⊕為矩陣點(diǎn)乘運(yùn)算。
2)動(dòng)態(tài)自適應(yīng)加權(quán)更新發(fā)現(xiàn)者
在前幾代中,發(fā)現(xiàn)者會(huì)更趨向于局部最優(yōu)解,導(dǎo)致尋優(yōu)范圍小、尋優(yōu)能力不足。因此,引入權(quán)重系數(shù)α,在迭代初期較大的權(quán)重會(huì)增加搜索范圍,提高尋優(yōu)能力,在末期較小的權(quán)重可以增強(qiáng)算法的深入開發(fā)能力,將式(11)更新為:
式(15)~(16)中, α為權(quán)重系數(shù)。
3)改進(jìn)警戒者更新模式
為了擴(kuò)大尋優(yōu)范圍,不局限于當(dāng)前最優(yōu)解,對(duì)警戒者進(jìn)行改進(jìn),將式(13)改為:
警戒者會(huì)根據(jù)當(dāng)前適應(yīng)度值,在最優(yōu)、最差以及目前位置之間進(jìn)行搜索。
4)結(jié)合柯西突變和反向?qū)W習(xí)策略
為了防止陷入局部最優(yōu),提升算法的全局尋優(yōu)能力,在每代麻雀更新結(jié)束后加入了柯西突變與反向?qū)W習(xí)選擇策略??挛魍蛔儊?lái)自于柯西分布,柯西分布公式如下:
式中:f(x)表示柯西分布的概率密度函數(shù);x為柯西分布隨機(jī)變量,其生成函數(shù)為x=tan[(ζ-0.5)],其中ζ ∈(0,1)。
以標(biāo)準(zhǔn)柯西分布為基礎(chǔ),在麻雀更新中引入柯西突變,提高算法的全局優(yōu)化能力:
將求得的f(x)代入式(19)中,以此得到經(jīng)過柯西突變后的麻雀位置。
反向?qū)W習(xí)策略通過計(jì)算當(dāng)前解的反向解,以增大尋優(yōu)范圍,過程如下:
柯西突變可以使算法跳出局部最優(yōu)解,而反向?qū)W習(xí)可以增強(qiáng)全局尋優(yōu)能力,為了進(jìn)一步改進(jìn)算法的優(yōu)化能力,通過引入概率Ps做出決定:
式中, θ為用于調(diào)整概率偏移率的參數(shù),設(shè)置為0.05。
通過生成隨機(jī)數(shù)Rand與Ps進(jìn)行比較,概率選擇策略如下:
1)如果Ps>Rand,選擇反向?qū)W習(xí)策略更新;
2)如果Ps 3)更新前后的結(jié)果進(jìn)行比較,保留最優(yōu)值。 本文提出的改進(jìn)麻雀搜索算法CCRSSA流程圖如圖7所示。 圖7 改進(jìn)麻雀搜索算法流程圖Fig.7 Improved sparrow search algorithm flow chart 改進(jìn)麻雀搜索算法CCRSSA流程的步驟為: 1)設(shè)置種群數(shù)量、變量上下限、種類占比等參數(shù),使用circle混沌映射進(jìn)行初始化; 2)計(jì)算每只麻雀的ITAE值作為適應(yīng)度值,按照從低到高排序并進(jìn)行分類; 3)根據(jù)式(16)、(12)和(17)進(jìn)行發(fā)現(xiàn)者、跟隨者和警戒者的位置更新; 4)根據(jù)式(23)中的結(jié)果,進(jìn)行柯西突變和反向?qū)W習(xí)策略的選擇及更新計(jì)算,并對(duì)比更新前后的適應(yīng)度值,保留較低適應(yīng)度值對(duì)應(yīng)的解; 5)判斷是否滿足結(jié)束條件,否則跳轉(zhuǎn)步驟2),滿足則結(jié)束,得到經(jīng)過算法優(yōu)化后的KP、KI、KD參數(shù)。 使用上述算法優(yōu)化得到的PID參數(shù)進(jìn)行控制,進(jìn)行3自由度補(bǔ)償穩(wěn)定性驗(yàn)證: 使用MATLAB和Simulink軟件進(jìn)行優(yōu)化控制仿真,經(jīng)過多次實(shí)驗(yàn)為基礎(chǔ),設(shè)置種群規(guī)模為10,最大迭代次數(shù)為10,分別在4、5、6級(jí)PM譜海況下及浪向角為90°和180°的重力波下比較circle混沌初始化、circ le混沌初始化+動(dòng)態(tài)自適應(yīng)加權(quán)更新發(fā)現(xiàn)者、circle混沌初始化+動(dòng)態(tài)自適應(yīng)加權(quán)更新發(fā)現(xiàn)者+警戒者更新、CCRSSA算法的優(yōu)化PID的波浪補(bǔ)償效果,以上算法在不同條件下的EMA和均方根誤差(ERMS)見表2。 表2 不同海況下不同浪向角的補(bǔ)償方法效果對(duì)比Tab.2 Comparison of the compensation method effects 表2結(jié)果表明,不論是在PM不規(guī)則波下的4~6級(jí)海況中的船舶運(yùn)動(dòng),還是規(guī)則重力波的不同浪向角的6級(jí)海況下的船舶升沉,每步改進(jìn)策略優(yōu)化PID控制后的補(bǔ)償精度都在不斷提高,而且CCRSSA的EMA和ERMS的值最小,驗(yàn)證了改進(jìn)后的麻雀搜索算法比基本麻雀搜索算法對(duì)PID具有更好的優(yōu)化效果,適用于不同浪向角下的復(fù)雜海況。 為了更好地驗(yàn)證CCRSSA的優(yōu)化控制效果,在每級(jí)海況下分別對(duì)比了遺傳算法GA、粒子群算法PSO、麻雀搜索算法SSA及基于混合策略的麻雀搜索算法(HSSA)的優(yōu)化效果,5個(gè)方法在4~6級(jí)海況下的適應(yīng)度值如圖8所示。 圖8 不同算法的適應(yīng)度值迭代結(jié)果Fig.8 Optimization results of different algorithm fitness values with iterations 由圖8可知:在引入circle混沌映射初始化策略后,CCRSSA較SSA在初始化階段有較大提升,可以加快后續(xù)尋優(yōu)速度;此外,在不同海況下,CCRSSA始終可以在相同迭代次數(shù)內(nèi)取得最小適應(yīng)度值,使平臺(tái)實(shí)現(xiàn)更精確的跟蹤;另外在4、6級(jí)海況下,改進(jìn)的麻雀搜索算法在第4次迭代中基本可以達(dá)到最優(yōu),在5級(jí)海況下的第6次迭代中也基本達(dá)到最優(yōu)。4~6級(jí)海況下各算法的ITAE收斂結(jié)果比較見表3。 表3 各算法ITAE收斂結(jié)果Tab.3 Convergence results of ITAE for each algorithm 通過對(duì)比表3數(shù)據(jù)可知,CCRSSA的ITAE指標(biāo)在5種算法中最小,可知其控制精度最高。在4級(jí)海況下,相比于PSO和SSA,CCRSSA的ITAE分別減小約15.2%和4.3%;在5級(jí)海況下,較PSO、SSA減小約0.3%;在6級(jí)海況下,較PSO和SSA減小約2.2%。綜合收斂速度和收斂精度,CCRSSA表現(xiàn)要比GA、PSO、SSA及HSSA更優(yōu)異。 表4為使用CCRSSA優(yōu)化得到的PID參數(shù),將參數(shù)帶入模型中進(jìn)行4~6級(jí)海況下的仿真實(shí)驗(yàn),通過正解模型求解式(7),將得到的運(yùn)動(dòng)模擬平臺(tái)3自由度位姿與傳感器采集到的位姿數(shù)據(jù)做差后,獲得補(bǔ)償平臺(tái)3自由度補(bǔ)償結(jié)果,以6級(jí)海況為例說(shuō)明,圖9為6級(jí)海況優(yōu)化后補(bǔ)償平臺(tái)穩(wěn)定性效果驗(yàn)證。其中,縱坐標(biāo)為補(bǔ)償平臺(tái)在3個(gè)自由度上的運(yùn)動(dòng),目標(biāo)是保持為零。 表4 CCRSSA優(yōu)化的PID參數(shù)Tab.4 CCRSSA optimization of PID parameters 圖9 6級(jí)海況優(yōu)化后補(bǔ)償平臺(tái)穩(wěn)定性驗(yàn)證Fig.9 Optimized compensation stability validation 從圖9可以看出:在起始階段,由于KP、KI較大的原因,會(huì)產(chǎn)生一個(gè)較大的波動(dòng),但在2 s內(nèi)會(huì)消除;在之后的時(shí)間內(nèi),補(bǔ)償平臺(tái)在4~6級(jí)海況下的6個(gè)自由度基本都保持在0附近。 結(jié)合算法優(yōu)化結(jié)果及最后的補(bǔ)償效果,證明了在4~6級(jí)海況下,CCRSSA算法要更適用于波浪補(bǔ)償平臺(tái)的優(yōu)化控制,可以提供穩(wěn)定的作業(yè)環(huán)境,滿足復(fù)雜海域下長(zhǎng)時(shí)間、高精度的海上作業(yè)要求。 強(qiáng)化學(xué)習(xí)具有模型無(wú)關(guān)性,在波浪補(bǔ)償控制中,海洋環(huán)境通常非常復(fù)雜且難以建模,強(qiáng)化學(xué)習(xí)可以通過與環(huán)境的交互來(lái)直接學(xué)習(xí)最優(yōu)的波浪補(bǔ)償策略。但是,強(qiáng)化學(xué)習(xí)的性能很大程度上依賴于獎(jiǎng)勵(lì)函數(shù)的設(shè)計(jì),同時(shí),需要進(jìn)行大量的訓(xùn)練和學(xué)習(xí),使得其需要大量的樣本數(shù)據(jù),且訓(xùn)練過程相對(duì)較長(zhǎng)。圖10為6級(jí)海況下3自由度的補(bǔ)償控制方法效果對(duì)比,表5為6級(jí)海況下PID和強(qiáng)化學(xué)習(xí)控制誤差對(duì)比。由圖10和表5可知,在第6秒之前,強(qiáng)化學(xué)習(xí)并沒有及時(shí)對(duì)船舶運(yùn)動(dòng)進(jìn)行補(bǔ)償控制,而在第6秒之后補(bǔ)償誤差逐漸減小,其ERMS為0.005 4。而PID控制可以對(duì)船舶運(yùn)動(dòng)做到很好的補(bǔ)償,ERMS達(dá)到4.969 2×10-4。相比之下,PID控制具有實(shí)時(shí)響應(yīng)的優(yōu)勢(shì)。 圖10 波浪補(bǔ)償控制方法效果對(duì)比Fig.10 Comparison of wave compensation control 表5 波浪補(bǔ)償控制方法誤差對(duì)比Tab.5 Comparison of error 使用圖1所示的實(shí)驗(yàn)室硬件設(shè)備進(jìn)行試驗(yàn),硬件主要包括控制臺(tái)以及波浪補(bǔ)償平臺(tái)部分,其各部分之間的關(guān)系如圖11所示。 首先,上位機(jī)通過通訊協(xié)議將數(shù)據(jù)指令發(fā)送給控制器,由控制器讀取指令后轉(zhuǎn)換為脈沖控制信號(hào)發(fā)送給6個(gè)伺服驅(qū)動(dòng)器;然后,通過其控制對(duì)應(yīng)的伺服電機(jī)運(yùn)行;最后,通過絲桿等裝置將其轉(zhuǎn)化為電動(dòng)缸相應(yīng)的位移。通過6個(gè)電動(dòng)缸之間的協(xié)同運(yùn)動(dòng),來(lái)表現(xiàn)平臺(tái)的自由度變化,同時(shí)通過伺服電機(jī)固定的編碼器對(duì)電機(jī)進(jìn)行轉(zhuǎn)數(shù)測(cè)量,計(jì)算后得到電動(dòng)缸位移。 圖11 波浪補(bǔ)償平臺(tái)控制原理圖Fig.11 Wave compensation platform control schematic 為了驗(yàn)證本文方法的適用性和泛化性,在4~6級(jí)海況下選取與第4.2節(jié)仿真數(shù)據(jù)的波高、周期都各不相同的數(shù)據(jù),生成新的4~6級(jí)海況下的船舶運(yùn)動(dòng)數(shù)據(jù),其波高、周期數(shù)據(jù)見表6。 表6 船舶運(yùn)動(dòng)數(shù)據(jù)的波高和周期Tab.6 Wave height and period of ship motion 然后,使用AQWA軟件重新生成船舶在該波高和周期下的3自由度運(yùn)動(dòng)數(shù)據(jù),以6級(jí)海況為例,船舶運(yùn)動(dòng)如圖12所示。 圖12 6級(jí)海況下對(duì)比實(shí)驗(yàn)船舶運(yùn)動(dòng)數(shù)據(jù)Fig.12 Comparison of experimental ship motion data under sea state 6 對(duì)以上船舶運(yùn)動(dòng)數(shù)據(jù)分別使用CCRSSA和PSO優(yōu)化后的參數(shù)進(jìn)行波浪補(bǔ)償試驗(yàn),對(duì)采集到的電動(dòng)缸長(zhǎng)度數(shù)據(jù)進(jìn)行正解計(jì)算,求得3自由度補(bǔ)償結(jié)果,以6級(jí)海況為例,CCRSSA和PSO控制實(shí)驗(yàn)結(jié)果如圖13、14所示。 圖13 CCRSS在6級(jí)海況優(yōu)化控制試驗(yàn)結(jié)果Fig.13 CCRSSA optimized control test results 圖14 PSO在6級(jí)海況優(yōu)化控制實(shí)驗(yàn)結(jié)果Fig.14 PSO optimized control test results 進(jìn)行補(bǔ)償誤差以及補(bǔ)償效率的計(jì)算,4~6級(jí)海況下CCRSSA和PSO的對(duì)比結(jié)果見表7。 表7 優(yōu)化控制試驗(yàn)補(bǔ)償誤差及補(bǔ)償效率對(duì)比Tab.7 Comparison of compensation error and compensation efficiency for optimal control tests 對(duì)表7中的補(bǔ)償誤差和效率進(jìn)行分析。首先,在6級(jí)海況下,CCRSSA的優(yōu)化補(bǔ)償效率稍低于PSO約(0.2%),與其優(yōu)化得到的KD參數(shù)較小、波動(dòng)稍大有關(guān),這使EMA誤差僅增大了0.001。其次,CCRSSA優(yōu)化得到的參數(shù)在4級(jí)和5級(jí)海況下補(bǔ)償控制中的補(bǔ)償效率要比PSO分別高1.22%和0.92%。故綜合3種海況來(lái)看,CCRSSA在不同海況下的補(bǔ)償控制結(jié)果具有優(yōu)勢(shì),雖然隨著海況等級(jí)的增加,其補(bǔ)償效率稍有下降,不過都達(dá)到了95%以上,可以滿足高精度波浪補(bǔ)償?shù)男枰?/p> 本文以波浪補(bǔ)償平臺(tái)為研究對(duì)象進(jìn)行主動(dòng)式波浪補(bǔ)償研究。首先,建立Stewart平臺(tái)動(dòng)力學(xué)及反解模型,并基于隨機(jī)搜索設(shè)計(jì)正解模型求解算法,同時(shí)基于某工程船在PM譜下4~6級(jí)海況的運(yùn)動(dòng)姿態(tài)在補(bǔ)償仿真平臺(tái)進(jìn)行正解求解驗(yàn)證;然后,用PID對(duì)其進(jìn)行控制,并使用麻雀搜索算法優(yōu)化參數(shù);隨后,提出一種改進(jìn)麻雀搜索算法用于優(yōu)化控制,通過circle混沌映射、動(dòng)態(tài)加權(quán)、柯西突變及反向?qū)W習(xí)策略改進(jìn)算法尋優(yōu)效果。接下來(lái),基于某工程船在PM譜下4~6級(jí)海況的運(yùn)動(dòng)姿態(tài)進(jìn)行補(bǔ)償仿真和硬件平臺(tái)控制驗(yàn)證?;赑M譜下的4~6級(jí)海況和6級(jí)海況下浪向角為90°和180°的重力波,對(duì)改進(jìn)麻雀搜索算法做了消融實(shí)驗(yàn),驗(yàn)證了CCRSSA對(duì)PID控制的參數(shù)優(yōu)化具有更好的效果。最后,基于補(bǔ)償仿真和硬件平臺(tái),與強(qiáng)化學(xué)習(xí)控制方法對(duì)比證明了PID控制可以對(duì)船舶運(yùn)動(dòng)做到更好的補(bǔ)償,具有實(shí)時(shí)響應(yīng)的優(yōu)勢(shì)。并與GA、PSO、SSA、HSSA的優(yōu)化效果進(jìn)行比較,結(jié)果證明了CCRSSA在4~6級(jí)不同海況下都具有良好的優(yōu)化控制效果和收斂速度,能較好應(yīng)用于船舶波浪補(bǔ)償控制中,可以對(duì)以后相關(guān)方面的研究提供一定的參考,后續(xù)可以研究應(yīng)用于多種海況下的自適應(yīng)模型,并以此為基礎(chǔ)設(shè)計(jì)在線補(bǔ)償控制方案。4 仿真與硬件試驗(yàn)
4.1 消融實(shí)驗(yàn)
4.2 波浪補(bǔ)償優(yōu)化控制
4.3 波浪補(bǔ)償控制方法對(duì)比
4.4 硬件試驗(yàn)
5 結(jié) 論