【關(guān)鍵詞】摘鉤機(jī)器人;深度學(xué)習(xí);多傳感器融合
隨著電力工業(yè)的發(fā)展,電廠摘鉤作業(yè)的智能化需求日益增加,傳統(tǒng)人工操作方式存在效率低、誤差大等問題[1]。為滿足電廠復(fù)雜環(huán)境中的高精度定位要求,開發(fā)具備自動(dòng)識(shí)別與定位能力的摘鉤機(jī)器人系統(tǒng)顯得尤為重要。本研究通過結(jié)合深度學(xué)習(xí)算法和多傳感器技術(shù),實(shí)現(xiàn)了摘鉤機(jī)器人在電廠作業(yè)中的自動(dòng)化與精準(zhǔn)定位,為電力行業(yè)智能化發(fā)展提供了重要的技術(shù)支持。
(一)系統(tǒng)架構(gòu)設(shè)計(jì)
本系統(tǒng)采用分層架構(gòu),包括感知層、處理層和執(zhí)行層。系統(tǒng)的整體架構(gòu)如圖1所示。感知層由高分辨率攝像頭和深度傳感器組成,用于捕獲環(huán)境信息;處理層包含邊緣計(jì)算單元和云端服務(wù)器,通過深度學(xué)習(xí)算法進(jìn)行目標(biāo)檢測(cè)和定位;執(zhí)行層由機(jī)器人控制單元和執(zhí)行機(jī)構(gòu)組成,能夠精確定位和抓取[2]。系統(tǒng)通過高速工業(yè)以太網(wǎng)實(shí)現(xiàn)各層間的實(shí)時(shí)數(shù)據(jù)傳輸,確保低延遲響應(yīng);采用冗余設(shè)計(jì)和故障檢測(cè)機(jī)制,以提高系統(tǒng)可靠性。
(二)硬件與軟件平臺(tái)設(shè)計(jì)
本系統(tǒng)采用高性能硬件和先進(jìn)軟件平臺(tái),以滿足電廠環(huán)境下實(shí)時(shí)目標(biāo)檢測(cè)和精確定位的需求。硬件核心采用NVIDIA Jetson AGX Xavier計(jì)算模塊,配備高分辨率攝像頭和深度傳感器,結(jié)合多自由度機(jī)械臂,實(shí)現(xiàn)精準(zhǔn)操作。軟件平臺(tái)基于Ubuntu系統(tǒng)和ROS2框架,集成深度學(xué)習(xí)算法和微服務(wù)架構(gòu),實(shí)現(xiàn)高效的任務(wù)處理和系統(tǒng)監(jiān)控。
(三)人工智能算法選擇
本系統(tǒng)選用改進(jìn)的YOLOv5s作為目標(biāo)檢測(cè)算法,通過增加注意力機(jī)制和特征金字塔網(wǎng)絡(luò)(Feature Pyramid Network,F(xiàn)PN)提高檢測(cè)精度。定位算法采用基于PointNet++的3D點(diǎn)云分割網(wǎng)絡(luò),結(jié)合迭代最近點(diǎn)(Iterative Closest Point,ICP)算法實(shí)現(xiàn)亞毫米級(jí)精度;為適應(yīng)電廠復(fù)雜環(huán)境,引入基于ResNet50的場(chǎng)景分類網(wǎng)絡(luò),動(dòng)態(tài)調(diào)整檢測(cè)和定位參數(shù)。系統(tǒng)還集成了基于長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)的時(shí)序預(yù)測(cè)模型,用于預(yù)估目標(biāo)物體的運(yùn)動(dòng)軌跡,提高抓取成功率。所有模型均經(jīng)過知識(shí)蒸餾和量化,以適應(yīng)邊緣計(jì)算環(huán)境。
(一)YOLO算法原理與改進(jìn)
YOLO算法將目標(biāo)檢測(cè)問題轉(zhuǎn)化為回歸問題,通過一次前向傳播同時(shí)預(yù)測(cè)多個(gè)邊界框和類別概率[3]。本系統(tǒng)基于YOLOv5s進(jìn)行改進(jìn),引入注意力機(jī)制和FPN。具體改進(jìn)措施包括:在骨干網(wǎng)絡(luò)中加入即插即用的卷積塊注意力模塊(Convolutional Block Attention Module,CBAM),增強(qiáng)關(guān)鍵特征提?。徊捎酶倪M(jìn)的PANet結(jié)構(gòu)替代原FPN,實(shí)現(xiàn)更有效的多尺度特征融合;引入Focal Loss,緩解類別不平衡問題;使用DIoU Loss優(yōu)化邊界框回歸。這些改進(jìn)顯著提高了模型在小目標(biāo)和密集場(chǎng)景下的檢測(cè)性能。
(二)目標(biāo)檢測(cè)網(wǎng)絡(luò)訓(xùn)練
1.數(shù)據(jù)集構(gòu)建與預(yù)處理
數(shù)據(jù)集由30,000張電廠環(huán)境圖像組成,包含5類關(guān)鍵部件標(biāo)注;采用多源數(shù)據(jù)增強(qiáng)策略,包括隨機(jī)裁剪、旋轉(zhuǎn)、翻轉(zhuǎn)、光照調(diào)整和拼接增強(qiáng);使用K-Means聚類算法優(yōu)化先驗(yàn)框尺寸,提高模型對(duì)不同尺度目標(biāo)的適應(yīng)性。數(shù)據(jù)預(yù)處理步驟包括:圖像縮放至640x640分辨率;歸一化像素值至[0,1]區(qū)間;標(biāo)簽平滑處理,緩解過擬合情況;采用StratifiedKFold交叉驗(yàn)證以確保模型泛化性。
2.損失函數(shù)設(shè)計(jì)
損失函數(shù)由三部分組成:類別損失、邊界框回歸損失和客觀性損失。類別損失采用Focal Loss[4]:
其中,pt是預(yù)測(cè)概率值,α是平衡參數(shù),γ是可調(diào)的聚焦參數(shù)。λcls、λbox和λobj為權(quán)重系數(shù),分別設(shè)置為1.0、0.05和0.5。該損失函數(shù)在訓(xùn)練中平衡分類、定位與置信度的優(yōu)化目標(biāo),提升模型在復(fù)雜場(chǎng)景下的魯棒性和精確性。
3.訓(xùn)練策略與參數(shù)優(yōu)化
研究采用分階段訓(xùn)練策略。第一階段,凍結(jié)骨干網(wǎng)絡(luò),訓(xùn)練檢測(cè)頭20輪。第二階段,解凍全網(wǎng)絡(luò),使用余弦退火學(xué)習(xí)率進(jìn)行100輪微調(diào):初始學(xué)習(xí)率設(shè)為0.01,批量大小設(shè)為64;使用AdamW優(yōu)化器,權(quán)重衰減系數(shù)為設(shè)為0.0005;引入指數(shù)平均數(shù)指標(biāo)(Exponential Moving Average,EMA)機(jī)制穩(wěn)定訓(xùn)練過程;采用學(xué)習(xí)率預(yù)熱和梯度裁剪,防止訓(xùn)練初期不穩(wěn)定;使用混合精度訓(xùn)練加速計(jì)算并節(jié)省顯存。最后,通過Grid Search方法優(yōu)化超參數(shù),包括anchor尺寸、NMS閾值和置信度閾值等。
(三)基于深度學(xué)習(xí)的精確定位算法
1.深度估計(jì)網(wǎng)絡(luò)設(shè)計(jì)
研究采用經(jīng)過改進(jìn)的基于深度學(xué)習(xí)的立體匹配網(wǎng)絡(luò)(Pyramid Stereo Matching Network,PSMNet)進(jìn)行深度估計(jì)。網(wǎng)絡(luò)由特征提取、代價(jià)體構(gòu)建和3D卷積細(xì)化三部分組成。特征提取使用帶有空間金字塔池化的ResNet-34,增強(qiáng)多尺度特征表達(dá);代價(jià)體構(gòu)建采用改進(jìn)的相關(guān)層,引入注意力機(jī)制提高匹配準(zhǔn)確性;3D卷積細(xì)化模塊使用3D Hourglass結(jié)構(gòu),通過跳躍連接保留細(xì)節(jié)信息。損失函數(shù)結(jié)合L1損失和結(jié)構(gòu)相似性損失,兼顧全局一致性和局部細(xì)節(jié)。
2. 3D坐標(biāo)轉(zhuǎn)換算法
3D坐標(biāo)轉(zhuǎn)換算法基于深度估計(jì)結(jié)果,使用針孔相機(jī)模型進(jìn)行3D坐標(biāo)轉(zhuǎn)換:首先通過相機(jī)內(nèi)參矩陣K將像素坐標(biāo)轉(zhuǎn)換為歸一化坐標(biāo),然后結(jié)合深度信息得到相機(jī)坐標(biāo)系下的3D點(diǎn),最后通過外參矩陣[R|t]將點(diǎn)轉(zhuǎn)換到世界坐標(biāo)系。考慮到鏡頭畸變,研究引入Brown-Conrady模型進(jìn)行校正。為提高定位精度,研究結(jié)合IMU數(shù)據(jù)進(jìn)行多傳感器融合,采用擴(kuò)展卡爾曼濾波算法實(shí)現(xiàn)亞毫米級(jí)精度;同時(shí),通過基于圖優(yōu)化的SLAM技術(shù)構(gòu)建環(huán)境3D地圖,實(shí)現(xiàn)全局一致性定位。
(一)系統(tǒng)實(shí)現(xiàn)
本系統(tǒng)采用模塊化設(shè)計(jì),通過硬件和軟件緊密集成,實(shí)現(xiàn)高效性能。硬件系統(tǒng)以NVIDIA Jetson AGX Xavier為核心,配備高分辨率攝像頭、深度相機(jī)和IMU模塊,通過工業(yè)級(jí)機(jī)器人執(zhí)行精確操作。軟件系統(tǒng)基于ROS2 Foxy框架,采用微服務(wù)架構(gòu)實(shí)現(xiàn)圖像處理、目標(biāo)檢測(cè)、3D定位、軌跡規(guī)劃和機(jī)器人控制等核心功能。系統(tǒng)集成了先進(jìn)的深度學(xué)習(xí)算法和即時(shí)定位與地圖構(gòu)建(Simultaneous Localization and Mapping,SLAM)技術(shù),并通過TensorRT加速推理過程;采用分布式通信中間件確保各模塊間的低延遲、高可靠通信,同時(shí)集成數(shù)據(jù)管理和可視化功能,為系統(tǒng)運(yùn)行提供全面監(jiān)控和分析支持。
(二)實(shí)驗(yàn)設(shè)計(jì)
實(shí)驗(yàn)在某火力發(fā)電廠給煤系統(tǒng)環(huán)境中進(jìn)行,選取5種典型部件作為檢測(cè)對(duì)象:給煤機(jī)、輸送帶、煤斗、閥門和管道。實(shí)驗(yàn)分為以下三個(gè)階段進(jìn)行。
1.目標(biāo)檢測(cè)性能評(píng)估階段
這一階段構(gòu)建了包含5000張電廠真實(shí)場(chǎng)景圖片的測(cè)試集,覆蓋光照(10 lux至2000 lux)、粉塵(PM10范圍50~150μg/m3)以及物體角度(0°至90°)等多種工況條件。這一階段通過統(tǒng)一尺寸(分辨率為640x640像素)和歸一化的預(yù)處理,確保圖片質(zhì)量的一致性;使用專業(yè)標(biāo)注工具對(duì)關(guān)鍵部件進(jìn)行精確標(biāo)注,提升數(shù)據(jù)集質(zhì)量;最終利用改進(jìn)的YOLOv5s模型對(duì)測(cè)試圖片進(jìn)行檢測(cè),并全面記錄模型的mAP、精確率和召回率,為系統(tǒng)性能評(píng)估提供了可靠依據(jù)。
2. 3D定位精度測(cè)試階段
這一階段通過構(gòu)建模擬實(shí)驗(yàn)場(chǎng)景,在10個(gè)預(yù)定位置放置高精度標(biāo)定板,用于驗(yàn)證3D坐標(biāo)輸出的精確性。實(shí)驗(yàn)首先利用針孔相機(jī)模型進(jìn)行初步坐標(biāo)轉(zhuǎn)換,獲取深度估計(jì)數(shù)據(jù);隨后結(jié)合IMU和SLAM技術(shù),通過多傳感器融合優(yōu)化定位結(jié)果;最后,使用高精度激光跟蹤儀作為基準(zhǔn),比較算法輸出與實(shí)際位置之間的差異,全面計(jì)算平均誤差和均方根誤差(Root Mean Squared Error,RMSE),以評(píng)估系統(tǒng)定位性能。
3.系統(tǒng)整體性能測(cè)試階段
這一階段通過模擬50次全自動(dòng)摘鉤任務(wù),涵蓋檢測(cè)、定位、抓取和搬運(yùn)四個(gè)步驟,全面評(píng)估機(jī)器人系統(tǒng)的綜合能力。實(shí)驗(yàn)設(shè)計(jì)包括隨機(jī)化摘鉤對(duì)象位置與遮擋情況的初始設(shè)置,記錄每次任務(wù)的耗時(shí)、抓取成功率及定位精度;并在低光(10 lux)、高粉塵(PM10gt;150μg/m3)和高溫(45℃)等極端工況下重復(fù)測(cè)試系統(tǒng)適應(yīng)性;此外,通過24小時(shí)連續(xù)任務(wù)測(cè)試,監(jiān)測(cè)設(shè)備運(yùn)行狀態(tài)和精度漂移,以驗(yàn)證其長(zhǎng)期穩(wěn)定性。
(三)系統(tǒng)性能測(cè)試與分析
1.目標(biāo)檢測(cè)準(zhǔn)確率分析
目標(biāo)檢測(cè)性能使用mAP和召回率評(píng)估技術(shù)。改進(jìn)后的YOLOv5s模型在測(cè)試集上的mAP@0.5達(dá)到93.7%,比基線模型提升4.2個(gè)百分點(diǎn),如圖2所示。對(duì)于小目標(biāo)(面積小于32x32像素),檢測(cè)性能提升尤為顯著,mAP從78.5%提高到86.3%。模型在不同光照條件下表現(xiàn)穩(wěn)定,在10 lux低光環(huán)境下,mAP僅下降2.1%。處理速度方面,TensorRT優(yōu)化后,在Jetson AGX Xavier上達(dá)到30FPS,滿足了實(shí)時(shí)性要求。
2.定位精度評(píng)估
3D定位精度評(píng)估結(jié)果如表1所示,可見系統(tǒng)在正常工作條件下達(dá)到了毫米級(jí)精度。在10個(gè)測(cè)試位置中,平均絕對(duì)誤差為0.87 mm,誤差不超過2.3 mm。深度估計(jì)的均方根誤差(RMSE@5m)為1.2 cm距離。在高粉塵環(huán)境下,通過多傳感器融合和濾波算法,系統(tǒng)仍保持了2.1 mm的平均精度。溫度變化對(duì)系統(tǒng)影響較小,在45℃高溫環(huán)境下,定位精度僅下降5.3%。長(zhǎng)時(shí)間(8小時(shí))連續(xù)運(yùn)行測(cè)試結(jié)果顯示,系統(tǒng)精度漂移小于0.5 mm,證明了其良好的穩(wěn)定性。
3.系統(tǒng)整體性能評(píng)估
在50次完整摘鉤任務(wù)測(cè)試中,系統(tǒng)展現(xiàn)出優(yōu)秀的綜合性能,任務(wù)成功率達(dá)到98%,平均單次任務(wù)耗時(shí)37.2秒,比人工操作效率提高約40%。系統(tǒng)對(duì)不同形狀和材質(zhì)的部件均能實(shí)現(xiàn)穩(wěn)定抓取,在最大負(fù)載測(cè)試(200 kg)下,定位精度保持在±3 mm范圍內(nèi)。在模擬的24小時(shí)連續(xù)運(yùn)行過程中,系統(tǒng)均未出現(xiàn)嚴(yán)重故障,平均每8小時(shí)進(jìn)行一次簡(jiǎn)單維護(hù)即可。與傳統(tǒng)機(jī)器視覺方法相比,本系統(tǒng)在復(fù)雜光照和部分遮擋的情況下仍能保持高精度,體現(xiàn)了深度學(xué)習(xí)算法的魯棒性。綜合評(píng)估表明,該系統(tǒng)滿足電廠實(shí)際需求,具備工業(yè)級(jí)應(yīng)用能力。
(四)當(dāng)前系統(tǒng)的局限與優(yōu)化策略
雖然本系統(tǒng)在實(shí)驗(yàn)中展現(xiàn)了較高的精度和穩(wěn)定性,但在實(shí)際應(yīng)用中仍可能面臨一些挑戰(zhàn),有待進(jìn)一步優(yōu)化,尤其是在復(fù)雜環(huán)境下的魯棒性和實(shí)時(shí)性,以及資源平衡計(jì)算方面。復(fù)雜環(huán)境中的高粉塵、高濕度、動(dòng)態(tài)光照等條件,會(huì)對(duì)目標(biāo)檢測(cè)模型的性能產(chǎn)生顯著影響,特別是在小目標(biāo)識(shí)別和遮擋物處理時(shí),檢測(cè)精度下降的問題較為突出。同時(shí),環(huán)境噪聲和傳感器誤差進(jìn)一步增加了檢測(cè)與定位的不確定性。為此,電廠可以引入在線域自適應(yīng)技術(shù),實(shí)時(shí)調(diào)整模型參數(shù)以適應(yīng)動(dòng)態(tài)環(huán)境變化,并增加傳感器多樣性,例如結(jié)合紅外傳感器與激光雷達(dá),提供多模態(tài)信息支持,提升系統(tǒng)的整體魯棒性。
另外,系統(tǒng)在邊緣計(jì)算環(huán)境中為實(shí)現(xiàn)高精度推理,需要消耗大量計(jì)算資源,這可能對(duì)實(shí)時(shí)性和任務(wù)執(zhí)行效率造成影響。針對(duì)這一問題,電廠可以采用模型壓縮技術(shù),如量化和剪枝,以降低計(jì)算復(fù)雜度;并結(jié)合動(dòng)態(tài)推理框架,根據(jù)實(shí)際任務(wù)需求靈活調(diào)整推理負(fù)載,進(jìn)一步優(yōu)化實(shí)時(shí)性能。這些改進(jìn)措施能夠有效提升系統(tǒng)在復(fù)雜環(huán)境中的適用性和運(yùn)行效率,為其在更廣泛的工業(yè)場(chǎng)景中的應(yīng)用奠定技術(shù)基礎(chǔ)。
基于先進(jìn)的深度學(xué)習(xí)算法與多傳感器融合技術(shù)的融合應(yīng)用,摘鉤機(jī)器人自動(dòng)定位系統(tǒng)已經(jīng)在電廠領(lǐng)域展現(xiàn)出了高精度、高可靠性和高效率的顯著優(yōu)勢(shì),充分滿足了電廠復(fù)雜環(huán)境下的應(yīng)用需求。該系統(tǒng)通過深度學(xué)習(xí)算法對(duì)大量數(shù)據(jù)進(jìn)行智能分析,結(jié)合多傳感器融合技術(shù)提供的豐富環(huán)境信息,實(shí)現(xiàn)了對(duì)摘鉤機(jī)器人位置的精準(zhǔn)定位與自動(dòng)控制。
面對(duì)復(fù)雜多變的工業(yè)環(huán)境,特別是高溫、高濕、強(qiáng)電磁干擾等惡劣條件時(shí),系統(tǒng)的穩(wěn)定性將受到更嚴(yán)峻的考驗(yàn)。因此,未來的工作仍需對(duì)算法進(jìn)行持續(xù)優(yōu)化,以進(jìn)一步提升系統(tǒng)的魯棒性,確保其在各種極端條件下都能保持高精度和高可靠性。