俞國燕,王 濤,郭國全,劉皞春,3
(1.廣東海洋大學(xué)機(jī)械工程學(xué)院,廣東 湛江 524088;2.廣東省海洋裝備及制造工程技術(shù)研究中心,廣東 湛江 524088;3.廣東省南海海洋牧場(chǎng)智能裝備重點(diǎn)實(shí)驗(yàn)室,廣東 湛江 524088)
自動(dòng)化投喂系統(tǒng)在深海少人化、無人化養(yǎng)殖中不可或缺。本研究關(guān)注飼料顆粒流落點(diǎn)問題,旨在提供優(yōu)化投喂系統(tǒng)參數(shù),為全自主投料系統(tǒng)奠定基礎(chǔ)[1-2]。
飼料顆粒流落點(diǎn)預(yù)測(cè)研究尚未見報(bào)道,現(xiàn)有研究側(cè)重于彈道和消防水射流。魏五洲等[3]利用外彈道學(xué)理論構(gòu)建質(zhì)點(diǎn)彈道數(shù)學(xué)模型,通過多傳感器融合提高了落點(diǎn)預(yù)測(cè)精度;Song 等[4]通過考慮多因素建立了二次修正模型,提高了彈丸落點(diǎn)預(yù)測(cè)準(zhǔn)確性;吳朝峰等[5]結(jié)合遺傳算法和BP 神經(jīng)網(wǎng)絡(luò),提升了預(yù)測(cè)精度;Zhang等[6]采用雙向長短期記憶網(wǎng)絡(luò)提高了預(yù)測(cè)的實(shí)時(shí)性。相對(duì)于炮彈,飼料顆粒微小,顆粒間存在相互作用力導(dǎo)致飼料顆粒流形態(tài)不固定,使其初速度難以準(zhǔn)確測(cè)量,運(yùn)動(dòng)模型更為復(fù)雜。因此,將彈道落點(diǎn)預(yù)測(cè)方法直接用于飼料顆粒流的落點(diǎn)預(yù)測(cè)具有一定困難。
此外,消防水炮水射流落點(diǎn)預(yù)測(cè)研究大多通過受力分析、質(zhì)點(diǎn)運(yùn)動(dòng)學(xué)和外彈道學(xué)理論等原理建立水射流運(yùn)動(dòng)模型[7-11]。部分研究采用圖像處理方法分割水射流軌跡并預(yù)測(cè)落點(diǎn)。例如,Zhu 等[12]通過圖像處理算法成功分割了水射流軌跡并預(yù)測(cè)其落點(diǎn);Zhu 等[13]利用混合高斯背景算法克服了復(fù)雜場(chǎng)景中提取水射流軌跡的挑戰(zhàn),從而提高了預(yù)測(cè)穩(wěn)定性;周俊杰等[14]則采用深度學(xué)習(xí)方法進(jìn)行水射流軌跡分割及落點(diǎn)識(shí)別。飼料顆粒流雖與水射流的落點(diǎn)預(yù)測(cè)相似,但水射流的動(dòng)力學(xué)特性相對(duì)穩(wěn)定,易于建模[15-16]。傳統(tǒng)圖像處理方法用于水射流軌跡分割的穩(wěn)定性較差,不及深度學(xué)習(xí)方法在復(fù)雜場(chǎng)景中的出色表現(xiàn),然而在實(shí)際生產(chǎn)中,水面情況復(fù)雜落點(diǎn)難以識(shí)別。
為此,本研究提出一種結(jié)合混合網(wǎng)絡(luò)模型與BP 神經(jīng)網(wǎng)絡(luò)的飼料顆粒流落點(diǎn)預(yù)測(cè)方法(MLBP),根據(jù)飼料顆粒流特點(diǎn)及傳統(tǒng)圖像分割方法的局限性,利用混合網(wǎng)絡(luò)模型對(duì)飼料顆粒流軌跡進(jìn)行分割,并提取關(guān)鍵軌跡參數(shù)信息,作為BP 神經(jīng)網(wǎng)絡(luò)的輸入,實(shí)現(xiàn)對(duì)飼料顆粒流落點(diǎn)的精準(zhǔn)預(yù)測(cè),并搭建實(shí)驗(yàn)樣機(jī)驗(yàn)證該模型在預(yù)測(cè)精度和實(shí)時(shí)性方面的優(yōu)勢(shì)。
為構(gòu)建數(shù)據(jù)集,在廣東海洋大學(xué)工程訓(xùn)練基地搭建實(shí)驗(yàn)平臺(tái)(圖1)。該平臺(tái)由氣力輸送動(dòng)力源(羅茨鼓風(fēng)機(jī))、下料機(jī)、變頻器、高速相機(jī)、鋼絲軟管和噴嘴構(gòu)成。為降低成本和避免飼料顆粒浪費(fèi),本研究采用常見塑料顆粒作為飼料的模擬物(以下簡(jiǎn)稱為飼料),其粒徑為4 mm。實(shí)驗(yàn)平臺(tái)的設(shè)備型號(hào)、參數(shù)和功能詳見表1。
表1 實(shí)驗(yàn)裝置及相關(guān)參數(shù)Table 1 Experimental setup and specific parameters
圖1 實(shí)驗(yàn)平臺(tái)及主要設(shè)備Fig.1 Schematic Diagram of Main Components and Experimental Equipment
在飼料顆粒流軌跡圖像分割中,須盡可能獲取高質(zhì)量軌跡圖像。為此,本研究采用文獻(xiàn)[12]提到的近場(chǎng)視覺(near-field computer vision,NFCV)傳感器裝置(圖2)。該裝置由視覺傳感器裝置和計(jì)算機(jī)組成。視覺傳感器裝置包括高速相機(jī)和支架,其中高速相機(jī)被固定于支架。由于飼料顆粒流的噴射距離較遠(yuǎn),飼料顆粒流下落位置遠(yuǎn)離投料口,難以在投料口拍攝到完整的軌跡圖像,且利用遠(yuǎn)離投料裝置的視覺傳感器來捕獲軌跡圖像也不現(xiàn)實(shí),導(dǎo)致完全捕獲軌跡圖像難度極高。經(jīng)測(cè)試,本研究將高速工業(yè)相機(jī)安裝在距離投料口1.5 m 處,并傾斜25°拍攝飼料顆粒流軌跡來解決此問題。
圖2 近場(chǎng)視覺結(jié)構(gòu)示意Fig.2 Schematic diagram of near-field vision structure
此外,本研究利用計(jì)算機(jī)采集軟件獲取高速相機(jī)捕捉的軌跡圖像,記錄飼料顆粒流落點(diǎn)中心位置距離飼料噴嘴正下方的直線距離,將數(shù)據(jù)保存至計(jì)算機(jī)硬盤。實(shí)驗(yàn)共采集3 750 張軌跡圖像,將其統(tǒng)一處理為384像素×384像素。將3 750張軌跡圖像按照8∶1∶1 的比例[17]劃分為卷積網(wǎng)絡(luò)模型訓(xùn)練數(shù)據(jù)集(3 000 張)、驗(yàn)證數(shù)據(jù)集(325 張)和測(cè)試數(shù)據(jù)集(325張)。
數(shù)據(jù)集構(gòu)建流程如圖3。首先,對(duì)原始圖像進(jìn)行透視變換[18-19],校正采用圖3 方法獲取的軌跡圖像與相機(jī)成像平面之間的夾角,將軌跡圖像轉(zhuǎn)換到前視圖平面。其次,利用labelme[20]軟件對(duì)獲取的3 750 張軌跡圖像打標(biāo)簽,得到初步的標(biāo)簽圖像。最后,為解決實(shí)驗(yàn)中發(fā)現(xiàn)軌跡邊緣的像素更易出現(xiàn)錯(cuò)誤預(yù)測(cè),使用距離變換(DT)算法對(duì)標(biāo)簽進(jìn)行處理[21-22]。通過DT算法將軌跡圖像的標(biāo)簽進(jìn)行解耦,得到主體標(biāo)簽圖(BLI)和細(xì)節(jié)標(biāo)簽圖(DLI)。
圖3 數(shù)據(jù)集構(gòu)架流程Fig.3 Flowchart of dataset construction process
將得到的二值標(biāo)簽圖像I劃分為前景Ifg和背景Ibg,對(duì)每個(gè)像素p,假設(shè)I(p)是其對(duì)應(yīng)像素值,那么p∈Ifg,則I(p)等于1;p∈Ibg,則I(p)等于0。為使用DT 算法,采用歐氏距離計(jì)算像素之間的距離。如果像素p屬于前景,DT 將首先在背景中查找最近的像素q,使用歐氏距離來計(jì)算像素p和q之間的距離;如果像素p屬于背景,則它們的最小距離被設(shè)置為零,以便生成新圖像I′的像素。距離變換后,原圖像I被變換成I′,其中像素值I′(p)不再等于0 或1。故采用離差標(biāo)準(zhǔn)化算法將I′像素值映射到[0,1]區(qū)間。與原圖像I相比,I′的像素不僅取決于前景或背景,也與其在軌跡圖像中的相對(duì)位置有關(guān)。此時(shí)軌跡圖像的中心像素值最大,遠(yuǎn)離軌跡中心的像素值較小,故可將I′作為主體圖,則I′去除主體圖后將得到細(xì)節(jié)圖。此外,為消除背景帶來的干擾,將新生成的標(biāo)簽與原圖像I相乘,如此便得到主體標(biāo)簽圖BLI和細(xì)節(jié)標(biāo)簽圖DLI(公式1)。最終經(jīng)過DT 算法處理軌跡圖像的結(jié)果如圖4所示。
圖4 距離變換算法處理結(jié)果Fig.4 DT(Distance transform)algorithm processing result
另外,本研究還采用圖像標(biāo)準(zhǔn)化、隨機(jī)反轉(zhuǎn)和隨機(jī)裁剪以擴(kuò)充訓(xùn)練數(shù)據(jù)集,增強(qiáng)模型的泛化性能,并提升對(duì)不確定性的處理能力,從而提高模型的魯棒性[23]。
本研究基于標(biāo)簽解耦框架(LDF)[24]模型(圖5),提出一種改進(jìn)的LDF 模型(混合標(biāo)簽解耦框架,Mix-LDF),用于飼料顆粒流的軌跡分割。
圖5 LDF網(wǎng)絡(luò)結(jié)構(gòu)Fig.5 LDF(Label decoupling framework)Network Architecture
2.1.1 輕量化LDF 模型 LDF 模型由主干網(wǎng)絡(luò)、主體解碼網(wǎng)絡(luò)、細(xì)節(jié)解碼網(wǎng)絡(luò)和融合編碼網(wǎng)絡(luò)組成,通過各分支間的信息交流,以更好的促進(jìn)特征表達(dá),提高分割精度。然而,其自身參數(shù)量較大,難以滿足實(shí)時(shí)系統(tǒng)(尤其是嵌入式系統(tǒng))的快速響應(yīng)需求。為解決此問題,本研究選取MobileNetV3[25]結(jié)構(gòu)中的倒殘差結(jié)構(gòu),用于改進(jìn)LDF 模型的主干網(wǎng)絡(luò)。由于倒殘差結(jié)構(gòu)具有更少的參數(shù)和計(jì)算量,故其推理速度更快。且在滿足需求的前提下,可在計(jì)算資源受限的嵌入式設(shè)備中運(yùn)行。
此外,為提高網(wǎng)絡(luò)對(duì)于重要特征的關(guān)注度,本研究在LDF 模型主干網(wǎng)絡(luò)的后四個(gè)卷積層之后均引入了通道注意力擠壓-激勵(lì)(SE)模塊[27]。這樣的設(shè)計(jì)有助于網(wǎng)絡(luò)在學(xué)習(xí)過程中更加聚焦于關(guān)鍵特征,從而提升整體性能。為減少網(wǎng)絡(luò)的計(jì)算參數(shù)使其更輕量化,本研究將LDF 模型中所有使用3 × 3卷積核的操作均替換為深度可分離卷積,進(jìn)一步提高模型的運(yùn)行速度,有效降低資源消耗,使網(wǎng)絡(luò)更適用于計(jì)算資源有限的環(huán)境。
2.1.2 視覺多頭自注意力模塊 通過2.1.1節(jié)的改進(jìn)有效改善系統(tǒng)運(yùn)行的實(shí)時(shí)性,但也導(dǎo)致系統(tǒng)的分割性能略微下降。為提高模型的分割性能,本研究提出利用自注意力機(jī)制在特征間交互作用的能力,以十字交叉注意力模塊[28](CCAM)為基礎(chǔ)構(gòu)建一種視覺多頭自注意力模塊(MHSA)。與自然語言中的自注意力機(jī)制相比,MHSA 可有效降低參數(shù)量,從而能更好適用于嵌入式系統(tǒng)。同時(shí),MHSA 模塊能對(duì)圖像中不同特征子空間進(jìn)行建模,并在解碼階段融合這些不同的特征表示,從而更好捕捉圖像中不同尺度和語義層次的信息,提升分割網(wǎng)絡(luò)的表達(dá)能力和分割精度[29-31]。
以CCAM 為基礎(chǔ)構(gòu)建的MHSA 模塊(圖6),用其捕捉圖像中的長程依賴關(guān)系,擴(kuò)展解碼器的感知范圍,以解決分割任務(wù)中上下文信息不足的問題。MHSA 設(shè)計(jì)允許信息的非局部傳播,從而一定程度上減少網(wǎng)絡(luò)的參數(shù)量和計(jì)算量,提高訓(xùn)練和推理速度。因此,選用視覺多頭自注意力機(jī)制替換LDF 模型中的主體解碼網(wǎng)絡(luò)和細(xì)節(jié)解碼網(wǎng)絡(luò)部分??紤]到主體解碼網(wǎng)絡(luò)和細(xì)節(jié)解碼網(wǎng)絡(luò)的結(jié)構(gòu)相同,本研究僅展示改進(jìn)后的主體解碼器網(wǎng)絡(luò)結(jié)構(gòu)(圖6(a))。圖6(b)顯示每個(gè)多頭自注意力結(jié)構(gòu)的具體形式,其中輸入經(jīng)過三個(gè)CCAM 模塊以增強(qiáng)不同子空間的特征表示及模型的表達(dá)能力,隨后將這些輸出沿通道維度進(jìn)行拼接操作,最終通過一個(gè)卷積操作輸出。改進(jìn)后的Mix-LDF網(wǎng)絡(luò)結(jié)構(gòu)見圖7。
圖6 多頭自注意力架構(gòu)Fig.6 Proposed multi-head self-attention architecture
圖7 Mix-LDF框架Fig.7 Mix-LDF framework
采用經(jīng)2.1 節(jié)改進(jìn)后的Mix-LDF 網(wǎng)絡(luò)分割飼料顆粒流軌跡圖像后。在預(yù)測(cè)飼料顆粒流落點(diǎn)時(shí),仍需計(jì)算軌跡信息以預(yù)測(cè)最終的落點(diǎn)位置。鑒于BP神經(jīng)網(wǎng)絡(luò)[32-33]的多層結(jié)構(gòu)和激活函數(shù)能夠更好地適應(yīng)數(shù)據(jù)的復(fù)雜模式和關(guān)系,且在處理復(fù)雜數(shù)據(jù)模式和關(guān)系時(shí)表現(xiàn)更出色,因此,本研究構(gòu)建一個(gè)四層BP 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)來進(jìn)行落點(diǎn)預(yù)測(cè)。其結(jié)構(gòu)包括:4個(gè)輸入層節(jié)點(diǎn)變量、兩個(gè)隱藏層(分別為16 個(gè)節(jié)點(diǎn)和8 個(gè)節(jié)點(diǎn)),以及輸出層的2 個(gè)節(jié)點(diǎn)(用于表示落點(diǎn)的二維坐標(biāo)點(diǎn))。
2.2.1 軌跡信息提取 飼料顆粒流軌跡信息是預(yù)測(cè)落點(diǎn)基礎(chǔ)。為解決隨機(jī)噪聲對(duì)軌跡信息提取的干擾,本研究采用平均位置法[12]來處理數(shù)據(jù),達(dá)到在真實(shí)信號(hào)部分保持穩(wěn)定的前提下,使隨機(jī)噪聲帶來的偏差趨于平衡。平均位置法的具體計(jì)算方法如下:
其中,n代表在圖像列方向上屬于軌跡的像素點(diǎn)數(shù)目,yi代表列方向上屬于軌跡像素點(diǎn)的列坐標(biāo)值。比較基于平均位置法的射流軌跡曲線與同一坐標(biāo)系下的二值圖像射流軌跡,顯示基于平均位值法的軌跡曲線基本上位于二值圖中的射流軌跡中間(圖8),且兩者基本彼此重疊,從側(cè)面說明該方法的有效性和準(zhǔn)確性。
圖8 飼料顆粒流軌跡曲線Fig.8 Feed flow trajectory curve
基于平均位值法獲得了符合軌跡圖像的曲線走勢(shì)。為了預(yù)測(cè)飼料顆粒流落點(diǎn)位置,需計(jì)算軌跡整體斜率Sot、軌跡初始拋射斜率Sit和軌跡末端斜率Set參數(shù)作為落點(diǎn)預(yù)測(cè)BP 網(wǎng)絡(luò)輸入,Sot、Sit和Set計(jì)算公式分別如下:
其中,n代表選取的點(diǎn)數(shù),x0和x1分別代表軌跡中點(diǎn)的起始點(diǎn)和終點(diǎn),ym和xm分別代表軌跡終點(diǎn)的y軸坐標(biāo)和x軸坐標(biāo),yn和xn分別表示計(jì)算過程中所選點(diǎn)y軸坐標(biāo)和x軸坐標(biāo)。
此外,投料口高度也是落點(diǎn)預(yù)測(cè)的重要參數(shù),其通過測(cè)量獲取,并與Sot、Sit和Set共同作為預(yù)測(cè)網(wǎng)絡(luò)的輸入?yún)?shù)。經(jīng)實(shí)驗(yàn),本研究選擇n=5。此外,當(dāng)Sit=0.56 時(shí),計(jì)算得到的射流軌跡初始角度為29.24°。其與測(cè)量得到的初始角度30°,誤差僅為2.5%,表明其可行。
本研究訓(xùn)練模型在服務(wù)器中運(yùn)行,其配置為128 GB 運(yùn)行內(nèi)存以及兩塊i7 CPU,基于Windows Server 2019 操作系統(tǒng),軟件為VsCode,編程語言為Python 3.10,深度學(xué)習(xí)框架為Pytorch 1.13.0。
為評(píng)估Mix-LDF 模型在軌跡分割方面的性能。本研究使用F度量值(F-measure,F(xiàn)m)、平均絕對(duì)誤差(Mean absolute error,MAE)以及結(jié)構(gòu)度量值(Structure measure,Sm)來評(píng)估該模型在分割飼料顆粒流軌跡方面的準(zhǔn)確性及結(jié)構(gòu)相似性。同時(shí),為評(píng)估模型的檢測(cè)速度、計(jì)算復(fù)雜度以及大小,本研究還使用單位時(shí)間圖像檢測(cè)數(shù)量(Frames per second,F(xiàn)PS)、浮點(diǎn)數(shù)計(jì)算量(Floating point operations,F(xiàn)LOPs)以及模型參數(shù)量。
另外,為驗(yàn)證飼料顆粒流落點(diǎn)預(yù)測(cè)的準(zhǔn)確性,本研究使用平均誤差范圍(Average error margin,AEM)、平均絕對(duì)百分比誤差(Average absolute percentage error,MAPE)及殘差圖來評(píng)估預(yù)測(cè)準(zhǔn)確性。這些評(píng)價(jià)指標(biāo)從多個(gè)不同方面評(píng)估了模型的性能,從而全面展示了MLBP 方法預(yù)測(cè)飼料顆粒流落點(diǎn)的效果。
為評(píng)估改進(jìn)Mix-LDF 模型在飼料顆粒流軌跡分割的性能,本研究通過消融實(shí)驗(yàn)及對(duì)比實(shí)驗(yàn)進(jìn)行分析。
4.1.1 消融實(shí)驗(yàn)分析 為評(píng)估和驗(yàn)證改進(jìn)Mix-LDF模型中各個(gè)組件對(duì)性能的貢獻(xiàn)。以LDF 模型為基礎(chǔ),在實(shí)驗(yàn)中逐步移除或添加不同的組件,并通過不同的組件組合進(jìn)行4 組實(shí)驗(yàn),分析各個(gè)組件對(duì)性能的影響。實(shí)驗(yàn)結(jié)果見表2。
表2 不同算法的性能比較Table 2 Performance comparison of different algorithms
由表2 可知,組1 在LDF 模型引入MV3 網(wǎng)絡(luò),使得FLOPs 及參數(shù)量分別降低77%、67%,F(xiàn)PS 達(dá)到41 幀/s。雖其分割性能略微降低,但模型的復(fù)雜度和計(jì)算負(fù)載都得到有效改善,其參數(shù)量和計(jì)算量減少對(duì)提高算法的效率和工程實(shí)踐應(yīng)用具有重要意義。為改善輕量化LDF 模型后分割性能下降的問題,在組1 的基礎(chǔ)上分別引入SE 注意力機(jī)制及MHSA 模塊作為組2 和組3。組2 引入SE 注意力機(jī)制模塊后,加強(qiáng)了輸入細(xì)節(jié)解碼器和主干解碼器特征圖的表達(dá)性和區(qū)分度,其Fm和Sm分別提高0.7%和1.3%,MAE 降低2.9%。與組1 相比,組3 引入MHSA 模塊,F(xiàn)m和Sm分別提高1.7%和2.4%,MAE降低11.8%,這證明了將MHSA 作為解碼器的混合網(wǎng)絡(luò)模型能夠有效融合不同特征的表示,提升分割網(wǎng)絡(luò)的表達(dá)能力,從而改善分割精度。組4 將所有改進(jìn)整合在一起,其Fm相較于基礎(chǔ)模型LDF 下降0.4%,但具有較高的幀率及較小的參數(shù)量,故在滿足系統(tǒng)需求的前提下,仍能實(shí)現(xiàn)實(shí)時(shí)運(yùn)行。綜上所述,消融實(shí)驗(yàn)結(jié)果證明Mix-LDF 網(wǎng)絡(luò)中各組件的有效性,也驗(yàn)證本實(shí)驗(yàn)方案的可行性。
4.1.2 不同模型分割模型的性能對(duì)比 為評(píng)估及驗(yàn)證Mix-LDF 模型的有效性,將分割性能較好的顯著性檢測(cè)模型EDN[34]、SelfReformer[35]、U2-Net[36]和F3Net[37]進(jìn)行對(duì)比實(shí)驗(yàn)。為確保公平,實(shí)驗(yàn)均使用相關(guān)作者發(fā)布的原代碼。通過消除數(shù)據(jù)差異的影響,以準(zhǔn)確評(píng)估算法性能。實(shí)驗(yàn)結(jié)果見表3。
表3 定量分析不同模型Table 3 Quantitative analysis of different models
由表3 可知,Mix-LDF 模型在所有實(shí)驗(yàn)組中,F(xiàn)m和Sm評(píng)價(jià)指標(biāo)最高,顯示出其在軌跡分割任務(wù)中,具有較高的準(zhǔn)確性及更好的提取細(xì)節(jié)信息的能力。通過MAE 指標(biāo)對(duì)比,可觀察到Mix-LDF 模型具有最低的MAE 值(0.028),表明其在預(yù)測(cè)顯著性時(shí)具有更小的平均誤差。同時(shí),Mix-LDF 模型還具有最少的浮點(diǎn)數(shù)計(jì)算量(5.6)、參數(shù)量(9.8)和最大的幀率(31),這意味著Mix-LDF 模型在運(yùn)行過程中所需的計(jì)算資源更少,具有更快的推理速度。故本研究所提改進(jìn)Mix-LDF 更適合飼料顆粒流軌跡分割。
5 種模型在不同閾值下的準(zhǔn)確率和召回率之間的關(guān)系,即PR 曲線(圖9),這有助于進(jìn)一步對(duì)比算法的魯棒性和穩(wěn)定性??梢?,Mix-LDF 模型的PR曲線幾乎完全包圍其他4 個(gè)模型的曲線,表明在分割飼料顆粒流軌跡方面,其具有更高的準(zhǔn)確性和召回率。通過對(duì)PR 曲線的觀察和分析,證明Mix-LDF 模型在不同閾值下表現(xiàn)出一定的優(yōu)勢(shì),這對(duì)于需要準(zhǔn)確檢測(cè)和分割軌跡的工程實(shí)踐應(yīng)用具有重要意義。
圖9 5種方法的精度-召回率曲線Fig.9 Precision-Recall curve plots for five models
不同模型分割飼料顆粒流軌跡的可視化結(jié)果見圖10,可見,Mix-LDF 模型不僅正確分割飼料顆粒流軌跡,還呈現(xiàn)出更清晰的邊界和連貫軌跡。與之相比,EDN、SelfReformer、U2-Net和F3Net模型存在不同程度的邊緣模糊和軌跡不連貫等問題,這會(huì)導(dǎo)致軌跡參數(shù)的準(zhǔn)確性受到影響,從而影響飼料顆粒流落點(diǎn)的預(yù)測(cè)精度。故Mix-LDF 模型在軌跡分割方面表現(xiàn)最佳。
圖10 不同模型分割飼料顆粒流軌跡結(jié)果Fig.10 Segmented feed flow trajectory results of different models
為評(píng)估MLBP 方法在飼料顆粒流落點(diǎn)預(yù)測(cè)中的有效性,將其與NFCV方法在預(yù)測(cè)誤差范圍、樣本數(shù)量和平均誤差等方面進(jìn)行對(duì)比,實(shí)驗(yàn)結(jié)果見表4。
表4 預(yù)測(cè)飼料顆粒流軌跡著陸點(diǎn)的兩種方法比較Table 4 Comparison of two methods for predicting the impact points of jet trajectories
由表4 可知,NFCV 方法誤差范圍小于0.1 m時(shí),共有35 個(gè)樣本,平均誤差為0.05 m,平均絕對(duì)百分比誤差為0.6%,平均處理時(shí)間為910.0 ms,但誤差范圍大于0.5 m的樣本占比近50%,表明NFCV方法預(yù)測(cè)落點(diǎn)的不穩(wěn)定性較高,且無法實(shí)時(shí)預(yù)測(cè)。相比之下,MLBP 方法在誤差范圍小于0.1 m 時(shí),有48個(gè)樣本,平均誤差為0.04 m,平均絕對(duì)百分比誤差為0.50%,平均處理時(shí)間為44.4 ms,此外,誤差范圍大于0.5 m 的樣本數(shù)僅為不到33%,表明MLBP 方法相較于NFCV 方法更穩(wěn)定且具有更高的實(shí)時(shí)性,更能符合對(duì)實(shí)時(shí)性有要求的系統(tǒng)。故MLBP 方法在所有誤差范圍內(nèi)均表現(xiàn)出更低的平均誤差和平均絕對(duì)百分比誤差,顯示出其具有較高的穩(wěn)定性。MLBP 方法平均處理時(shí)間僅為44.4 ms,表明其可用于實(shí)時(shí)的軌跡分析和落點(diǎn)預(yù)測(cè)。
NFCV 與MLBP 兩種方法的殘差分布對(duì)比(圖11)顯示,采用MLBP 方法的殘差主要集中在± 0.3 之間,而NFCV 的殘差則主要集中在± 0.5 范圍內(nèi),這表明采用MLBP 方法在殘差方面更加穩(wěn)定,且殘差的整體離散程度較小,相對(duì)接近真實(shí)值。相比之下,NFCV 方法殘差整體離散程度較大,相對(duì)較遠(yuǎn)離真實(shí)值。綜上所述,MLBP 方法在誤差控制方面表現(xiàn)出更好的效果,其殘差更為集中且離散程度較小,與真實(shí)值更為接近。這些結(jié)果進(jìn)一步驗(yàn)證MLBP方法在本研究中的有效性。
圖11 殘差分布Fig.11 Residual Plot
飼料顆粒流落點(diǎn)的反饋是實(shí)現(xiàn)飼料投喂系統(tǒng)的精準(zhǔn)自主控制的作為控制決策的關(guān)鍵,本研究提出一種MLBP 方法。該方法通過相機(jī)捕獲飼料顆粒流軌跡,并利用本研究改進(jìn)的Mix-LDF 網(wǎng)絡(luò)模型對(duì)飼料顆粒流軌跡進(jìn)行分割。通過深入分析并計(jì)算了影響落點(diǎn)的相關(guān)參數(shù),作為落點(diǎn)預(yù)測(cè)模型BP神經(jīng)網(wǎng)絡(luò)的輸入,從而實(shí)現(xiàn)對(duì)飼料顆粒流落點(diǎn)位置的精準(zhǔn)預(yù)測(cè),解決了飼料顆粒流落點(diǎn)難以獲取的問題,為飼料顆粒流落點(diǎn)的精準(zhǔn)控制提供參考。得到如下結(jié)論:
1)本研究基于LDF 模型,采用MobileNetV3 網(wǎng)絡(luò)的基礎(chǔ)組件,實(shí)現(xiàn)LDF 模型主干網(wǎng)絡(luò)的輕量化,使其容易在資源受限的嵌入式設(shè)備上進(jìn)行部署;為緩解改進(jìn)主干網(wǎng)絡(luò)帶來的分割精度略微下降的問題,針對(duì)主干網(wǎng)絡(luò)的后四個(gè)卷積層輸出,引入SE 注意力機(jī)制模塊,以增強(qiáng)特征圖的表達(dá)能力,從而提高分割精度;為更好地理解全局上下文信息,提高分割精度,采用CCAM 構(gòu)建一個(gè)輕量級(jí)的視覺多頭自注意力解碼器模塊,并將其與卷積網(wǎng)絡(luò)構(gòu)成的主干網(wǎng)絡(luò)相結(jié)合,形成混合網(wǎng)絡(luò)模型(Mix-LDF),其融合卷積網(wǎng)絡(luò)的局部特征提取能力和多頭自注意力的全局上下文理解能力,從而提高模型的表現(xiàn)能力,使其能夠更好地分割飼料射流軌跡。
2)在成功利用Mix-LDF 模型準(zhǔn)確分割飼料顆粒流軌跡后,采用平均位置法計(jì)算軌跡曲線,并利用BP 神經(jīng)網(wǎng)絡(luò)的優(yōu)勢(shì)擬合軌跡曲線并預(yù)測(cè)落點(diǎn)。將軌跡曲線中的整體斜率Sot、初始拋射斜率Sit、末端斜率Set及投料口高度作為BP 神經(jīng)網(wǎng)絡(luò)的輸入,用于預(yù)測(cè)飼料顆粒流的落點(diǎn),即MLBP 方法。與NFCV 方法相比,MLBP 方法的準(zhǔn)確率提高3%,達(dá)到96%。同時(shí),殘差圖也表明MLBP方法更為穩(wěn)定。
本研究集中關(guān)注MLBP 方法的開發(fā)和性能評(píng)估,主要解決飼料顆粒流落點(diǎn)預(yù)測(cè)的關(guān)鍵問題,故當(dāng)前僅在陸地環(huán)境進(jìn)行模擬。未來的研究將重點(diǎn)關(guān)注相關(guān)干擾因素(如風(fēng)速、風(fēng)向)以及在海洋中的海浪等問題,這將有助于提高M(jìn)LBP 方法的魯棒性,使其更好地適應(yīng)多樣化的海洋環(huán)境。