吳宗秀,吳 超
(1. 上海交通大學(xué) 船舶海洋與建筑工程學(xué)院,上海 200240; 2. 上海交通大學(xué) 海洋工程國(guó)家重點(diǎn)實(shí)驗(yàn)室,上海 200240)
水下尋源著眼于解決利用單個(gè)或編隊(duì)水下航行器對(duì)未知分布的信號(hào)場(chǎng)進(jìn)行信號(hào)源搜索問(wèn)題。水下工程領(lǐng)域的許多問(wèn)題都可以歸結(jié)為水下尋源問(wèn)題。包括:失事飛行器黑匣子的尋找、天然氣或者水下礦藏的定位、熱液噴口搜索[1]等。在這些問(wèn)題中,未知信號(hào)場(chǎng)則相應(yīng)地可以具體化為聲學(xué)信號(hào)場(chǎng)、化學(xué)物質(zhì)濃度信號(hào)場(chǎng)及溫度信號(hào)場(chǎng)等。水下尋源問(wèn)題的解決方案對(duì)于擴(kuò)展水下航行器的應(yīng)用而言有著重大的意義,該領(lǐng)域的解決方法一般有瞬態(tài)決策方法、極值搜索算法、高斯過(guò)程回歸以及神經(jīng)網(wǎng)絡(luò)等。
Holland等[2]、Russell[3]分別就未知信號(hào)場(chǎng)的尋源問(wèn)題提出了六邊形和Z字型前進(jìn)路線的搜索策略,通過(guò)離散的信號(hào)測(cè)量以及簡(jiǎn)單的信號(hào)強(qiáng)度對(duì)比進(jìn)行搜索路徑的規(guī)劃。Russell[4]后續(xù)將工作拓展到三維場(chǎng)源搜索問(wèn)題中,瞬態(tài)極值策略可以作為尋源問(wèn)題一種相對(duì)穩(wěn)定的解決方案,但是其決策得出的方向精度不足。自動(dòng)控制領(lǐng)域的方法在場(chǎng)源搜索問(wèn)題中亦得到了廣泛的應(yīng)用,Mellucci等[5]、Matveev等[6-7]均運(yùn)用了滑模控制方法來(lái)控制水下航行器的首向進(jìn)行信號(hào)場(chǎng)的極值搜索,其結(jié)果顯示,滑模控制方法生成的搜錄路徑相對(duì)較長(zhǎng)。Cochran等[8]將極值搜索算法(extreme value search algorithm, 簡(jiǎn)稱ESA)運(yùn)用到水下尋源問(wèn)題中,通過(guò)控制航行器的轉(zhuǎn)向引導(dǎo)航行器進(jìn)行搜索,該團(tuán)隊(duì)在其他研究[9]中增加前進(jìn)速度為控制參數(shù)并且得到了更好的結(jié)果,但同時(shí)也指出該算法收斂速度較慢的問(wèn)題。
高斯過(guò)程回歸(gaussian process regression, 簡(jiǎn)稱GPR)具有良好的函數(shù)逼近能力,常用于解決未知信號(hào)場(chǎng)的擬合問(wèn)題。Ai等[10]結(jié)合高斯過(guò)程回歸、Armijo步長(zhǎng)準(zhǔn)則、遞歸最小二乘方法和非線性模型預(yù)測(cè)控制(nonlinear model predictive control, 簡(jiǎn)稱NMPC)進(jìn)行完備的水下航行器場(chǎng)源搜索仿真。其研究結(jié)果表明航行器在搜索過(guò)程前期受先驗(yàn)信號(hào)場(chǎng)影響明顯,在接近先驗(yàn)信號(hào)場(chǎng)的最大值區(qū)域后轉(zhuǎn)向正確的路徑并收斂到真實(shí)場(chǎng)源。閻述學(xué)等[11]的研究著眼于利用高斯過(guò)程回歸進(jìn)行水下信號(hào)場(chǎng)的熱點(diǎn)采樣,通過(guò)定義一種與均方差相關(guān)的引力模型引導(dǎo)航行器進(jìn)行多熱點(diǎn)未知信號(hào)場(chǎng)的自適應(yīng)采樣。相較于傳統(tǒng)的割草機(jī)和梳型路徑,該算法能夠以較短的路徑實(shí)現(xiàn)更準(zhǔn)確的擬合。
徑向基神經(jīng)網(wǎng)絡(luò)(radial basis function neural network,簡(jiǎn)稱RBFNN)具備無(wú)限精度的函數(shù)逼近能力,能夠運(yùn)用于信號(hào)場(chǎng)的估計(jì)并且具有結(jié)構(gòu)簡(jiǎn)單、易于理解的優(yōu)點(diǎn)。Jeon等[12]通過(guò)推導(dǎo)連續(xù)時(shí)間形式的遞歸最小二乘法對(duì)RBFNN進(jìn)行在線訓(xùn)練,并控制裝有多個(gè)傳感器的雙連桿機(jī)械手進(jìn)行二維灰度圖的極值尋找。然而利用RBFNN的尋源算法研究很少考慮神經(jīng)網(wǎng)絡(luò)的正則化,實(shí)際上正則化對(duì)于神經(jīng)網(wǎng)絡(luò)的穩(wěn)定性和泛化性非常重要。
以水下自主航行器(autonomous underwater vehicle, 簡(jiǎn)稱AUV)在熱泉區(qū)域的硫化氫濃度分布場(chǎng)場(chǎng)源搜索為背景,使用具有增長(zhǎng)式結(jié)構(gòu)的RBFNN對(duì)未知信號(hào)場(chǎng)進(jìn)行在線無(wú)先驗(yàn)漸進(jìn)擬合,并通過(guò)增量式奇異值分解算法加速神經(jīng)網(wǎng)絡(luò)的正則化計(jì)算,此外還利用動(dòng)量梯度法解決AUV路徑容易陷入局部最優(yōu)區(qū)域的問(wèn)題。算法的有效性通過(guò)單峰值和多峰值硫化氫濃度場(chǎng)中的場(chǎng)源搜索模擬計(jì)算進(jìn)行驗(yàn)證。
徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(RBFNN),具有結(jié)構(gòu)簡(jiǎn)單、學(xué)習(xí)速度快、擬合精度高、泛化能力較強(qiáng)和不易陷入?yún)?shù)局部最優(yōu)等優(yōu)點(diǎn),被廣泛應(yīng)用于函數(shù)逼近、分類、時(shí)間序列預(yù)測(cè)等諸多領(lǐng)域,其網(wǎng)絡(luò)結(jié)構(gòu)示意如圖1所示。
圖1 RBFNN結(jié)構(gòu)示意Fig. 1 View of RBFNN’s construction
RBFNN在結(jié)構(gòu)上是嚴(yán)格的三層網(wǎng)絡(luò),分別為輸入層、隱藏層和輸出層。輸入層負(fù)責(zé)信號(hào)傳遞,隱藏層通過(guò)徑向基函數(shù)(radial basis function, 簡(jiǎn)稱RBF)進(jìn)行從輸入層到隱藏層空間的非線性變換,輸出層對(duì)隱藏層的響應(yīng)進(jìn)行加權(quán)求和。
選用高斯型徑向基函數(shù):
(1)
其中,ωj為權(quán)重系數(shù),cj為核函數(shù)中心,rj為高斯函數(shù)半徑。
設(shè)計(jì)矩陣H,其元素Hi,j=hj(xi),行數(shù)記作p,列數(shù)記作m:
(2)
權(quán)重向量W可表示為:
(3)
(4)
權(quán)重向量可以通過(guò)計(jì)算偽逆或最小二乘法求取。為了避免矩陣求解中的病態(tài)問(wèn)題以及神經(jīng)網(wǎng)絡(luò)的過(guò)擬合問(wèn)題,引入全局正則化操作,對(duì)應(yīng)權(quán)重向量求解公式如下:
(5)
其中,參數(shù)λ為全局正則化系數(shù),該參數(shù)能夠提高神經(jīng)網(wǎng)絡(luò)的泛化性和計(jì)算穩(wěn)定性,λ的數(shù)值需要在網(wǎng)絡(luò)結(jié)構(gòu)和數(shù)據(jù)集變化的時(shí)候進(jìn)行優(yōu)化。
綜上,RBFNN對(duì)任意輸入x∈R2的信號(hào)值預(yù)測(cè)為:
(6)
徑向基神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)性能取決于RBF中心{C1C2……Cm}、權(quán)重向量W、全局正則化參數(shù)λ等。為了實(shí)現(xiàn)RBFNN的在線訓(xùn)練,算法應(yīng)當(dāng)能夠在尋源過(guò)程中實(shí)時(shí)進(jìn)行以上參數(shù)的優(yōu)化。
1.3.1 徑向基函數(shù)分配
通過(guò)資源分配網(wǎng)絡(luò)算法(resource-allocating network, 簡(jiǎn)稱RAN)[13]進(jìn)行徑向基函數(shù)中心的分配。RAN算法開始時(shí)具有較少?gòu)较蚧瘮?shù)中心,根據(jù)新增樣本的新穎性決定是否添加徑向基函數(shù)進(jìn)行誤差消減。
條件1:當(dāng)前樣本位置xp+1與最近的徑向基函數(shù)中心Cnear的歐式距離超過(guò)閾值δ。
‖xp+1-Cnear‖>δ
(7)
條件2:神經(jīng)網(wǎng)絡(luò)對(duì)當(dāng)前輸入樣本xp+1的預(yù)測(cè)與實(shí)測(cè)數(shù)值偏差大于閾值ε。
(8)
添加徑向基函數(shù)后神經(jīng)網(wǎng)絡(luò)發(fā)生變化,需要通過(guò)更新正則化參數(shù)λ和計(jì)算權(quán)重向量W進(jìn)行神經(jīng)網(wǎng)絡(luò)的優(yōu)化。
1.3.2 在線正則化參數(shù)迭代計(jì)算
神經(jīng)網(wǎng)絡(luò)的性能取決于預(yù)測(cè)的準(zhǔn)確度和泛化性,正則化參數(shù)λ的引入能夠在一定程度上實(shí)現(xiàn)二者的平衡,而λ的取值可以通過(guò)廣義交叉驗(yàn)證誤差(generalized cross-validation, 簡(jiǎn)稱GCV)的最小化來(lái)決定。首先給出徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的廣義交叉驗(yàn)證誤差表達(dá)式:
(9)
其中,p為當(dāng)前路徑點(diǎn)個(gè)數(shù),P為RBFNN中的投影矩陣:
P=I-HA-1HT
(10)
(11)
值得注意的是若直接使用公式(11)會(huì)導(dǎo)致每次迭代計(jì)算都需進(jìn)行多次復(fù)雜度為O(m3)的矩陣逆運(yùn)算。觀察與矩陣A相關(guān)的表達(dá)式(5)可以發(fā)現(xiàn),通過(guò)設(shè)計(jì)矩陣H的奇異值分解能夠有效簡(jiǎn)化A的求逆過(guò)程進(jìn)而簡(jiǎn)化公式(11)各部分的計(jì)算復(fù)雜度。
首先設(shè)截?cái)嗥娈愔捣纸?truncated SVD)H=USVT,其中U=[u1u2…ur]∈Rp×r、V∈Rm×r為正交矩陣,S∈Rr×r且有如下形式:
(12)
式(11)各部分簡(jiǎn)化結(jié)果如下[14]:
(13)
通過(guò)以上簡(jiǎn)化計(jì)算,能夠?qū)⑹?11)的復(fù)雜度從O(m3)降低到O(p2),并且只需要在迭代計(jì)算前進(jìn)行一次復(fù)雜度為O(p3)的奇異值分解計(jì)算,對(duì)于重復(fù)迭代的計(jì)算而言能夠節(jié)省大量算力,算法的偽代碼如下:
Algorithm 1 基于SVD的正則化系數(shù)求解Require:SVD分解USVT=H,函數(shù)值Y^Ensure:正則化系數(shù)λ,權(quán)重向量:W1:function REGULARIZE(U,S,V,Y^)2:λ0,λp1,μdiag(S),yUTY^3:while(abs(λ-λp)>0.000 1)do4. λpλ5:λ∑pi=1uiy2i(ui+λp)3∑pi=1λpui+λp∑pi=1λ2py2i(ui+λp)2∑pi=1ui(ui+λp)26:end while7:WV(STS+λI)-1Sy8:return[λ W]9:end function
對(duì)不同規(guī)模的設(shè)計(jì)矩陣H利用原版迭代算法和基于SVD改進(jìn)的迭代算法進(jìn)行正則化參數(shù)求解,設(shè)定矩陣H為方陣。設(shè)置初始λ=1,并進(jìn)行50次的迭代。統(tǒng)計(jì)改進(jìn)算法中,總耗時(shí)、SVD分解耗時(shí)以及迭代耗時(shí)與原算法耗時(shí)的比值,結(jié)果如圖2所示。
圖2 迭代公式計(jì)算耗時(shí)對(duì)比Fig. 2 Time cost of different re-estimation method
從結(jié)果中可以觀察到,改進(jìn)算法中迭代計(jì)算的耗時(shí)與原算法的耗時(shí)比值隨著神經(jīng)網(wǎng)絡(luò)規(guī)模的增大而減小,改進(jìn)算法中的SVD分解耗時(shí)與原算法的耗時(shí)比值卻維持在1/50附近。整體而言改進(jìn)算法的耗時(shí)遠(yuǎn)小于原算法,但是其中SVD分解耗時(shí)的復(fù)雜度階數(shù)與原算法相似,需要進(jìn)一步簡(jiǎn)化。
1.3.3 設(shè)計(jì)矩陣H增量式SVD分解
對(duì)設(shè)計(jì)矩陣H進(jìn)行奇異值分解能夠顯著降低正則化系數(shù)求解的復(fù)雜度,卻引入了SVD分解的計(jì)算復(fù)雜度隨神經(jīng)網(wǎng)絡(luò)階數(shù)增加而增加的問(wèn)題。因此奇異值分解的簡(jiǎn)化變得至關(guān)重要。觀察式(2)中設(shè)計(jì)矩陣H的結(jié)構(gòu)能夠發(fā)現(xiàn),增加樣本數(shù)據(jù)和增加徑向基函數(shù)實(shí)質(zhì)上是在增加設(shè)計(jì)矩陣H的行數(shù)或者列數(shù)。這意味著每次神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)變化時(shí)H的主體部分不發(fā)生變動(dòng)。結(jié)合Brand的工作[15]利用Hp,m的奇異值分解結(jié)果對(duì)Hp,m+1或Hp+1,m進(jìn)行增量式SVD分解,定義Hp,m+1和Hp+1,m分別為增加徑向基函數(shù)和增加樣本數(shù)據(jù)后的設(shè)計(jì)矩陣。以下以Hp,m+1為例簡(jiǎn)述增量式SVD的計(jì)算過(guò)程。
對(duì)設(shè)計(jì)矩陣Hm有截?cái)嗥娈愔捣纸?,其中Sm階數(shù)為r:
Hp,m=USVT
(14)
Hp,m+1與Hp,m之間存在如下關(guān)系:
Hp,m+1=[Hp,mhm+1],hm+1=[hm+1(x1) ……h(huán)m+1(xp)]T
(15)
計(jì)算:
(16)
對(duì)M進(jìn)行歸一化處理:
J=M/K,K=‖M‖
(17)
設(shè)計(jì)矩陣運(yùn)算如下:
(18)
Q=U′S′V′T
(19)
可以得到更新后的奇異值分解:
Hp,m+1=U″S″V″T
(20)
其中,
(21)
通過(guò)以上的分解能夠?qū)p,m的奇異值分解轉(zhuǎn)化為Qr+1,r+1的奇異值分解。并且值得注意的是Q實(shí)際上為邊對(duì)角矩陣,其奇異值分解的計(jì)算復(fù)雜度可以通過(guò)O″ Leary[16]的工作從O(r3)簡(jiǎn)化到O(r2)。通過(guò)以上的簡(jiǎn)化計(jì)算能夠?qū)⒃O(shè)計(jì)矩陣奇異值分解的計(jì)算復(fù)雜度降低到O((m+p)r2),在計(jì)算中設(shè)定比值r/p=0.25。
Algorithm 2 增量式SVD分解Require:原分解:USVT=H新增列:hm+1Ensure:增量SVD: U″,S″,V″,h″T=[H h]1:function INC SVD(U,S,V,h)2:[U'S'V']SVDSUThS|h-UUTh| 3:U″[U(h-UUTL)/|h-UUTh|]U'4:S″S'5:V″V001 V'6:return[U″,S″,V″]7:end function
對(duì)不同階數(shù)的設(shè)計(jì)矩陣增加列數(shù)據(jù)并求取新設(shè)計(jì)矩陣的奇異值分解。計(jì)算結(jié)果如圖3所示,能夠直觀地看到增量式分解顯著降低了計(jì)算耗時(shí)并且效果隨著神經(jīng)網(wǎng)絡(luò)規(guī)模的增大而增大,計(jì)算過(guò)程在Matlab2019 中進(jìn)行,考慮到數(shù)學(xué)計(jì)算軟件對(duì)于計(jì)算過(guò)程的優(yōu)化,結(jié)果中呈現(xiàn)的計(jì)算耗時(shí)比例未必能夠完全與理論上的計(jì)算復(fù)雜度分析完全對(duì)應(yīng)。
圖3 SVD分解耗時(shí)對(duì)比Fig. 3 Time cost of different SVD method
第1節(jié)的工作能夠支持航行器進(jìn)行在線的信號(hào)場(chǎng)擬合,如何規(guī)劃航行器的航行路徑則是本節(jié)重點(diǎn)。算法的主體思想實(shí)際上是代理優(yōu)化,通過(guò)擬合場(chǎng)的梯度信息進(jìn)行未知場(chǎng)的探索,首先應(yīng)該進(jìn)行擬合場(chǎng)的梯度求解。
由函數(shù)之和的求導(dǎo)法則可知,路徑點(diǎn)梯度為所有組成函數(shù)在該路徑點(diǎn)梯度之和:
(22)
已知徑向基函數(shù)形式,可得徑向基函數(shù)hj在當(dāng)前路徑點(diǎn)梯度:
(23)
對(duì)式(23)進(jìn)行求和可以得擬合函數(shù)在路徑點(diǎn)xi的梯度gi為:
(24)
在AUV自主尋優(yōu)的研究中,航行器陷入局部最優(yōu)區(qū)域是難以避免的問(wèn)題。類似于遺傳算法、模擬退火、粒子群算法等群體智能優(yōu)化算法可能適用于多航行器的尋優(yōu)問(wèn)題,而對(duì)于單航行器的尋優(yōu)問(wèn)題而言,考慮到航行路徑、搜索時(shí)間等約束,應(yīng)用以上群體優(yōu)化算法是不切實(shí)際的。
采用RBFNN對(duì)未知分布場(chǎng)進(jìn)行“擬合估計(jì)—最大梯度搜索—重新擬合”的迭代擬合搜索方法,實(shí)際上是一種局部鄰域搜索算法,相應(yīng)的存在著拓展算法如禁忌搜索算法和動(dòng)量梯度算法。禁忌搜索[17]算法的關(guān)鍵思想是通過(guò)禁忌表標(biāo)記已經(jīng)搜索過(guò)的區(qū)域并在后續(xù)步驟中避免訪問(wèn),通過(guò)限制訪問(wèn)區(qū)域來(lái)迫使算法接受次優(yōu)解,并有一定幾率訪問(wèn)到局部最優(yōu)解之外的區(qū)域并借此脫離局部最大值區(qū)域。該算法的以上特性會(huì)導(dǎo)致AUV路徑在局部最優(yōu)區(qū)域附近滯留,而且脫離局部區(qū)域的路徑具有隨機(jī)性,不適用于文中研究。
動(dòng)量梯度法作為梯度法的拓展[18],其算法核心是當(dāng)前路徑點(diǎn)xi并非直接采用梯度方向作為前進(jìn)方向,而是選擇計(jì)算所有歷史路徑點(diǎn)梯度的指數(shù)加權(quán)平均數(shù)作為前進(jìn)方向。記當(dāng)前路徑點(diǎn)梯度為gi=?fpre(xi,D),則求取下一路徑點(diǎn)步驟可由式(25)~(26)表示。
(25)
xi+1=xi+hDiri
(26)
其中,μ=0.9為衰減系數(shù),h=10為航行器航行步長(zhǎng),Diri為路徑點(diǎn)對(duì)應(yīng)前進(jìn)方向。
動(dòng)量梯度算法借鑒了物理學(xué)的概念,使得AUV在搜索過(guò)程中通過(guò)計(jì)算梯度指數(shù)加權(quán)平均數(shù)積攢“能量”。其中衰減系數(shù)μ起著至關(guān)重要的作用,當(dāng)衰減系數(shù)μ=0時(shí),動(dòng)量梯度法和正常的梯度法相同,當(dāng)μ=1時(shí),情況類似于無(wú)摩擦運(yùn)動(dòng),路徑難以在極大值附近收斂。相比于梯度法,動(dòng)量梯度法具有易于逃脫局部最優(yōu)區(qū)域和更好通過(guò)信號(hào)場(chǎng)高原區(qū)的優(yōu)點(diǎn)。
文中算法主要內(nèi)容形成流程如圖4所示,首先進(jìn)行神經(jīng)網(wǎng)絡(luò)的初始化:選擇出發(fā)點(diǎn)坐標(biāo),在出發(fā)點(diǎn)附近生成一個(gè)徑向基函數(shù);然后進(jìn)行流程的循環(huán)直至航行器的二維坐標(biāo)收斂:網(wǎng)絡(luò)正則化迭代—權(quán)重向量計(jì)算—當(dāng)前路徑點(diǎn)梯度計(jì)算—使用動(dòng)量梯度法生成航行器下一步的前進(jìn)方向—獲取下一路徑點(diǎn)信號(hào)值—判定新樣本的新穎性并決定是否添加徑向基函數(shù)。
圖4 尋源算法流程Fig. 4 Flow diagram of source-seeking algorithm
為驗(yàn)證尋源算法的有效性,模擬了一個(gè)熱液噴口附近硫化氫濃度的單極值信號(hào)場(chǎng)S,如圖5(a)所示,該分布場(chǎng)坐標(biāo)范圍為1 000 m×1 000 m,最大值為Smax=25.06 mmol/kg,位于坐標(biāo)點(diǎn)Pglomax(629,327)。海洋環(huán)境中許多信號(hào)值隨距離增加有極大的衰減[19],在遠(yuǎn)離場(chǎng)源的區(qū)域信號(hào)場(chǎng)梯度較小,文中設(shè)計(jì)的硫化氫場(chǎng)便具有如此的性質(zhì),對(duì)該信號(hào)場(chǎng)求取梯度,得場(chǎng)梯度分布如圖5(b)所示。
圖5 單峰硫化氫分布場(chǎng)Fig. 5 Single-peak field of H2S distribution
設(shè)置出發(fā)點(diǎn)分別為P1(100,100)、P2(100,500)、P3(100,900)、P4(500,900)、P5(900,900)、P6(900,500)、P7(900,100)、P8(500,100)進(jìn)行尋源過(guò)程的模擬計(jì)算,為了驗(yàn)證算法穩(wěn)定性,在真實(shí)信號(hào)中添加均值為0,方差為0.1的高斯噪聲。每次出發(fā)點(diǎn)進(jìn)行1 000次仿真并計(jì)算平均路徑長(zhǎng)度、最大值誤差、最大值坐標(biāo)誤差、神經(jīng)網(wǎng)絡(luò)的GCV誤差及全場(chǎng)均方誤差MSE等,計(jì)算結(jié)果如表1所示。注意到,不同出發(fā)點(diǎn)的最大值以及最大值坐標(biāo)誤差基本相同,說(shuō)明該算法的收斂結(jié)果與出發(fā)點(diǎn)無(wú)關(guān),收斂的精度實(shí)際上與航行器的步長(zhǎng)相關(guān)。徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)無(wú)法對(duì)遠(yuǎn)離樣本的區(qū)域進(jìn)行準(zhǔn)確預(yù)測(cè),因此盡管GCV誤差僅為0.01的水平,但是全場(chǎng)的均方誤差卻相對(duì)要高。由于神經(jīng)網(wǎng)絡(luò)能夠?qū)颖緟^(qū)域進(jìn)行精準(zhǔn)地預(yù)測(cè),該算法對(duì)于信號(hào)場(chǎng)路徑點(diǎn)上的梯度估計(jì)有著誤差低于20°的精度,能夠?yàn)楹叫衅髑斑M(jìn)方向的計(jì)算提供良好基礎(chǔ)。
表1 單峰場(chǎng)尋源算法仿真結(jié)果Tab. 1 Results of source-seeking simulation in single-peak field
文中將文獻(xiàn)[10,20]中的尋源算法進(jìn)行相同出發(fā)點(diǎn)的尋源過(guò)程模擬并對(duì)比其結(jié)果。文獻(xiàn)[20]通過(guò)控制航行器執(zhí)行圓形路徑機(jī)動(dòng)進(jìn)行梯度的最小二乘估計(jì)并尋找場(chǎng)源。文獻(xiàn)[10]方法基于考慮先驗(yàn)場(chǎng)的高斯過(guò)程回歸(GPR),進(jìn)行場(chǎng)源搜索仿真。將3種尋源算法的路徑點(diǎn)分布(出發(fā)點(diǎn)3)、尋源過(guò)程路徑長(zhǎng)度、路徑點(diǎn)梯度估計(jì)誤差以及GPR方法和RBF方法的全場(chǎng)均方誤差MSE進(jìn)行對(duì)比,如圖6~9所示。
圖6 單峰值信號(hào)場(chǎng)不同算法尋源過(guò)程路徑點(diǎn)分布(P3)Fig. 6 Way point distribution of different source-seeking algorithms in single-peak field (P3)
圖7 均方誤差MSEFig. 7 Mean square error
圖8 路徑點(diǎn)梯度方向預(yù)測(cè)誤差Fig. 8 Average gradient direction error of track
圖9 尋源過(guò)程平均路徑Fig. 9 Average length of seeking procedure
分析以上數(shù)據(jù)可以發(fā)現(xiàn),圓形機(jī)動(dòng)估計(jì)梯度算法的路徑點(diǎn)梯度估計(jì)誤差最大,GPR算法由于存在先驗(yàn)信號(hào)場(chǎng)的影響,梯度估計(jì)不如使用無(wú)先驗(yàn)信息的RBFNN算法準(zhǔn)確,圖6中顯示基于RBFNN算法產(chǎn)生的路徑集中于連接出發(fā)點(diǎn)和極值點(diǎn)的直線上,并且由于采用了動(dòng)量梯度法,其路徑往往會(huì)在經(jīng)過(guò)極值點(diǎn)后向前延伸一段;GPR算法生成的路徑大部分會(huì)經(jīng)過(guò)先驗(yàn)信號(hào)場(chǎng)的極值區(qū)域,這導(dǎo)致其路徑相對(duì)較長(zhǎng)并且均方誤差大于基于RBFNN的算法。而基于圓形估計(jì)梯度的算法生成的路徑散亂,在梯度較小的區(qū)域由于信號(hào)噪聲的存在不能夠準(zhǔn)確地估計(jì)梯度,又由于圓形路徑估計(jì)梯度的過(guò)程存在,其路徑遠(yuǎn)大于其他兩個(gè)算法。
改變?cè)璈2S濃度分布場(chǎng),在原有的H2S濃度分布場(chǎng)S上添加信號(hào)場(chǎng)S1:
(27)
該分布場(chǎng)(圖10)中局部最大值區(qū)域位于Qlocmax(450,750)附近,全局極大值位于Qglomax(629,329)??紤]到本小節(jié)旨在測(cè)試尋源算法脫離局部最優(yōu)區(qū)域的能力,設(shè)計(jì)可能陷入局部最大值區(qū)域的出發(fā)點(diǎn)Q1(200,900)、Q2(300,900)、Q3(400,900)以及Q4(500,900),對(duì)其尋源路徑進(jìn)行多次模擬計(jì)算,直至每個(gè)出發(fā)點(diǎn)的尋源成功率收斂。最后得出不同出發(fā)點(diǎn)的平均路徑長(zhǎng)度、脫離局部最優(yōu)區(qū)域的成功率等數(shù)據(jù)如表2所示,并繪制出發(fā)點(diǎn)1和出發(fā)點(diǎn)4的尋源過(guò)程路徑分布如圖11所示。結(jié)果顯示算法能夠以較高的成功率通過(guò)局部最大值區(qū)域,但是由于局部最大值區(qū)域梯度的干擾,AUV的路徑可能在該區(qū)域彎曲,導(dǎo)致整個(gè)尋源過(guò)程總路徑長(zhǎng)度的增加。
圖10 多峰場(chǎng)硫化氫分布場(chǎng)Fig. 10 Multi-peaks field of H2S distribution
圖11 多峰值信號(hào)場(chǎng)不同出發(fā)點(diǎn)尋源路徑點(diǎn)分布Fig. 11 Distribution of source seeking way points from different starting points in multi-peak field
表2 多峰場(chǎng)尋源算法仿真結(jié)果Tab. 2 Results of source-seeking simulation in multi-peak field
針對(duì)水下航行器在未知環(huán)境中的場(chǎng)源搜索問(wèn)題進(jìn)行了研究,利用徑向基神經(jīng)網(wǎng)絡(luò)對(duì)未知信號(hào)場(chǎng)進(jìn)行擬合,通過(guò)引入正則化參數(shù)提高神經(jīng)網(wǎng)絡(luò)的泛化性,以廣義交叉驗(yàn)證誤差為準(zhǔn)則優(yōu)化正則化參數(shù),并以增量式奇異值分解降低正則化參數(shù)求解過(guò)程的計(jì)算復(fù)雜度,最后通過(guò)擬合場(chǎng)的梯度信息以及動(dòng)量梯度法規(guī)劃水下航行器的運(yùn)動(dòng)方向。
與其他研究中的尋源算法進(jìn)行尋源模擬對(duì)比發(fā)現(xiàn):文中方法能夠?qū)β窂近c(diǎn)的梯度進(jìn)行更為準(zhǔn)確的估計(jì),從而生成從出發(fā)點(diǎn)到場(chǎng)源更短的搜索路徑,并且在全場(chǎng)范圍內(nèi)的均方誤差更小。此外進(jìn)行了多峰值信號(hào)場(chǎng)的搜索模擬計(jì)算,結(jié)果顯示文中的自主尋源算法能夠以較高的成功率脫離局部最優(yōu)區(qū)域。在這里僅考慮單航行器對(duì)未知信號(hào)場(chǎng)的搜索問(wèn)題,后續(xù)的工作將基于現(xiàn)有的神經(jīng)網(wǎng)絡(luò)在線預(yù)測(cè)算法針對(duì)多航行器的協(xié)同搜索問(wèn)題開展。