陳 麒,梁銳城
(1.汕頭職業(yè)技術(shù)學(xué)院機(jī)電工程系,廣東 汕頭 515041;2.汕頭大學(xué)工學(xué)院,廣東 汕頭 515068)
無人機(jī)巡檢已經(jīng)成為電力線路巡檢工作中的重要組成之一,該手段巡檢范圍廣、受地形影響較小,有效提高了巡檢效率[1-2].但是,目前輸電線路巡檢大多采取人工操作無人機(jī)拍攝線路視頻,待無人機(jī)返航后再將視頻導(dǎo)入電腦,通過人工進(jìn)行隱患排查.該方法不僅加大了運(yùn)維人員的工作量,還會(huì)由于不同人員飛行控制能力差異而導(dǎo)致巡檢質(zhì)量相差較大.此外,巡檢過程中,無人機(jī)易受風(fēng)吹干擾飛行姿態(tài)難以控制,并且為保證電力線路的安全運(yùn)行,無人機(jī)需要與帶電設(shè)備保持一定放電間隙距離(國家電網(wǎng)公司要求5 m以上).由于上述限制,巡檢影像往往因?yàn)槟繕?biāo)識(shí)別不穩(wěn)定、飛行姿態(tài)難以自由調(diào)整、拍攝距離遠(yuǎn),以及背景干擾等導(dǎo)致線路巡檢視頻不完整等問題,進(jìn)而引發(fā)影像中設(shè)備難以準(zhǔn)確分割、識(shí)別較低的問題.因此,利用無人機(jī)實(shí)現(xiàn)線路自動(dòng)化、智能化的高可靠巡檢具有極強(qiáng)的工程實(shí)際意義.
目前,基于目標(biāo)分割算法掩碼-區(qū)域卷積神經(jīng)網(wǎng)絡(luò)(Mask-region convolutional neural network,Mask-RCNN)的目標(biāo)識(shí)別方法通過使用基礎(chǔ)網(wǎng)絡(luò)生成特征圖,再采取區(qū)域選取網(wǎng)絡(luò)(region proposal network,RPN)基于既定規(guī)則提供感興趣區(qū)域(region of interesting,ROI),然后利用分類網(wǎng)絡(luò)判定目標(biāo)類型,并使用掩碼網(wǎng)絡(luò)進(jìn)行像素分類.這一方法將傳統(tǒng)目標(biāo)識(shí)別方案的分類、回歸兩個(gè)步驟進(jìn)一步優(yōu)化為分類、回歸、分割三個(gè)任務(wù),即通過解耦多個(gè)子任務(wù)關(guān)系的方式提高了在復(fù)雜背景下的目標(biāo)識(shí)別準(zhǔn)確率[3-5].這使得Mask-RCNN在目標(biāo)識(shí)別準(zhǔn)確度上明顯優(yōu)于基于灰度信息的模板匹配算法[6-8];基于局部特征的SURF、SIFT等算法[9-12];以及以SSD與YOLO為代表的單階段深度學(xué)習(xí)目標(biāo)檢測算法[13-14].但由于解耦步驟的增加,使得Mask-RCNN在運(yùn)算成本上消耗較大,即存在運(yùn)算時(shí)長長、運(yùn)算資源占用多等問題.
針對(duì)Mask-RCNN存在的問題,本文提出采用間接性幀減對(duì)Mask-RCNN的損失函數(shù)進(jìn)行改進(jìn).具體方法為,將檢測周期分為4個(gè)時(shí)刻,每次識(shí)別時(shí),將上一時(shí)刻的識(shí)別結(jié)果作為下一時(shí)刻的背景,以變化部分為目標(biāo).該方法不僅降低了計(jì)算難度,還通過相同部分省略、不相同部分檢測的形式克服了復(fù)雜背景下小型設(shè)備難以識(shí)別的問題,識(shí)別速度與準(zhǔn)確率得到顯著提高.為驗(yàn)證本文算法的實(shí)用性與魯棒性,本文以目標(biāo)設(shè)備不明顯、環(huán)境背景復(fù)雜的導(dǎo)線為對(duì)象開展測試.結(jié)果表明,本文算法在較高目標(biāo)識(shí)別率的前提下,較大程度地降低了運(yùn)算成本.以相較Mask-RCNN出現(xiàn)0.325%識(shí)別準(zhǔn)確率降低(本文算法實(shí)際識(shí)別準(zhǔn)確率為95.775%)的代價(jià),減少了44.4%的CPU占用率.同時(shí),相比運(yùn)算成本較低的NCC算法,本文算法以增加21.25%的CPU占用率為代價(jià),實(shí)現(xiàn)了目標(biāo)識(shí)別準(zhǔn)確率提高60%的效果.
從圖1中可知,由于輸電線路處于圖傳信號(hào)較差的山丘中,常采用類似邊緣計(jì)算的方法,即無人機(jī)利用自帶處理器STM32對(duì)輸電線路進(jìn)行目標(biāo)識(shí)別.雖然基于ARM Cortex-M3內(nèi)核設(shè)計(jì)的STM32具有較高的運(yùn)算性能,但無人機(jī)巡檢線路時(shí)產(chǎn)生海量的實(shí)時(shí)數(shù)據(jù)加大了計(jì)算任務(wù),并且基于邊緣計(jì)算的線路巡檢對(duì)實(shí)時(shí)線路識(shí)別結(jié)果要求嚴(yán)苛.同時(shí)由于無人機(jī)飛行控制和線路識(shí)別均通過STM32處理,為了保證飛行安全,用于線路識(shí)別的CPU占用率不得高于50%.因此,在保證無人機(jī)在復(fù)雜環(huán)境下飛行安全的基礎(chǔ)上,如何在降低計(jì)算代價(jià)的同時(shí)有效識(shí)別出目標(biāo)成為了研究難點(diǎn).如圖1所示,Mask-RCNN通過引入ROIandAlign代替了FastRcnn的ROIPooling,雖然提高了常規(guī)狀態(tài)下的識(shí)別精度,但是難以確定ROI中的較小特征圖,以至于難以有效識(shí)別復(fù)雜背景下的小型目標(biāo).此外,當(dāng)無人機(jī)受環(huán)境影響導(dǎo)致偏離航線時(shí),標(biāo)準(zhǔn)的Mask-RCNN將卷積神經(jīng)網(wǎng)絡(luò)提取到輸電線路最終特征在輸入到RPN網(wǎng)絡(luò)的過程中,會(huì)由于目標(biāo)過小被中間隱層當(dāng)作噪聲過濾.針對(duì)上述問題,為提高算法的檢測速度和精度、優(yōu)化運(yùn)算空間,本文對(duì)Mask-RCNN進(jìn)行改進(jìn).
圖1 無人機(jī)巡檢線路時(shí)的視頻截圖
圖2 Mask-RCNN主干示意圖
標(biāo)準(zhǔn)的Mask-RCNN的ROIAlign基于以下公式選擇最適合的特征圖:
式中:k0、w、h分別為特征圖面積、特征圖寬、特征圖高.不同于 Fast_Rcnn,Mask-RCNN的ROIAlign通過雙線性插值法對(duì)感興趣的區(qū)域進(jìn)行量化.如圖3所示,在已知A11、A12、A21、A22的前提下,Mask-RCNN通過線性插值得到B1和B2,再利用得到的B1和B2插值得到最終插值點(diǎn)P,即:
圖3 Mask-RCNN的ROI Align雙線性插值示意圖
訓(xùn)練時(shí),為擬合圖片中的導(dǎo)線的ROIAlign特征分布,需通過損失函數(shù)檢測目標(biāo)及其位置,損失函數(shù)Lmask_rcnn可描述為:
式中:Lcls、Lbox和Lmask分別為分類誤差、檢測誤差和分割誤差.m、k、K、Pki*和Pki分別為ROI經(jīng)過匹配層處理后的長、寬、模型檢測目標(biāo)總數(shù)、第k個(gè)目標(biāo)真實(shí)掩碼中第i個(gè)像素值和第k個(gè)目標(biāo)預(yù)測掩碼中第i個(gè)像素值.根據(jù)公式(4)和公式(5)可知,由于Lmask函數(shù)通過檢測結(jié)果與標(biāo)注圖像逐像素對(duì)比,完成圖像特征針對(duì)性學(xué)習(xí),雖然提高了Mask-RCNN的檢測精度,但是增大了運(yùn)算量,檢測速度難以有效保障.為此,本文利用間接性幀減法的思想進(jìn)行改進(jìn),即識(shí)別一次后,將上一識(shí)別結(jié)果作為背景,下一時(shí)刻的變化作為目標(biāo),以此減少計(jì)算量.具體方法為,將一個(gè)檢測周期分為一個(gè)4個(gè)時(shí)刻t0、t1、t2、t3,t0時(shí)刻為Mask-RCNN的目標(biāo)預(yù)測掩碼,而t1、t2、t3的則將上一采集時(shí)刻t0的真實(shí)掩碼Pki′作為背景,此時(shí)的公式(7)修改為:
修改后得到的損失函數(shù)L′mask_rcnn為:
改進(jìn)Mask-RCNN后一個(gè)完整周期的損失函數(shù)為:
該方法不僅降低了計(jì)算難度,還通過相同部分省略、不相同部分檢測的形式克服了復(fù)雜背景下小型設(shè)備難以識(shí)別的問題,識(shí)別速度與準(zhǔn)確率得到顯著提高.
試驗(yàn)數(shù)據(jù)來源為巡線無人機(jī)搭載intelD455攝像頭拍攝的影像,并采用目標(biāo)識(shí)別準(zhǔn)確率、識(shí)別時(shí)間成本以及圖像處理過程中的CPU平均利用率作為評(píng)價(jià)指標(biāo).試驗(yàn)對(duì)象如圖4所示,分別展示了在樹木、灌木背景下無人機(jī)拍攝的導(dǎo)線情況.此處需說明,為了驗(yàn)證本文模型在實(shí)時(shí)巡檢的優(yōu)越性,采取了每分鐘內(nèi)平均CPU占用率p′和平均識(shí)別率q′作為評(píng)價(jià)指標(biāo),即1 min內(nèi)采集6次CPU占用率,并以平均CPU占用率作為評(píng)價(jià)指標(biāo),以及60 s內(nèi)輸電線路出現(xiàn)的時(shí)間(輸電線路在視頻丟失,則視為識(shí)別失敗):
式中:pi為以10 s為采樣周期進(jìn)行采樣的當(dāng)前CPU占用率,tj為輸電線路出現(xiàn)的視頻時(shí)間.由于輸電線路識(shí)別和飛行控制均是實(shí)時(shí)進(jìn)行,為了保證飛行安全本文實(shí)驗(yàn)的識(shí)別部分CPU占用率不高于40%,為了直觀的以100分制進(jìn)行性能評(píng)價(jià),公式(11)的pi需除以40%.
由于導(dǎo)線線徑小、且無人機(jī)與導(dǎo)線距離保持5 m以上,被識(shí)別物體的尺寸與拍攝距離共同導(dǎo)致了難以裸眼直接觀測得到巡檢圖像中的全部導(dǎo)線位置.從圖4中可知,RPN網(wǎng)絡(luò)的特征選取策略較好地保留了導(dǎo)線特征,在即使因?yàn)榈匦纹鸱?、環(huán)境復(fù)雜等因素影響無人機(jī)航線的情況下,本文方法依然保持了較高的識(shí)別準(zhǔn)確率,基本與Mask-RCNN保持在相同水平.
圖5可見,在圖4中的4種場景下,本文算法最低識(shí)別率為95.775%,雖然相較Mask-RCNN算法低0.325%,但在CPU占用率這一數(shù)據(jù)上明顯占優(yōu),僅為后者地55.6%.此外,本文方法的CPU占用率雖然比NCC高出了21.25%,但是復(fù)雜背景情況下的識(shí)別率卻高出了60%.并且,由于采取了間接性識(shí)別的方法,識(shí)別速度也比SURF提高了43%.此外,在現(xiàn)實(shí)巡檢中發(fā)現(xiàn),當(dāng)出現(xiàn)圖5(1)中t2時(shí)刻的情況,并且長時(shí)間處于100%占有率時(shí),系統(tǒng)會(huì)由于視頻輸入與目標(biāo)識(shí)別時(shí)差不斷增大而導(dǎo)致部分巡檢視頻丟失.而本文方法在保證識(shí)別準(zhǔn)確率保持95%以上的基礎(chǔ)上,分配的CPU平均占用率均在60%以下、總的CPU占有率24%以下,不僅較好的完成巡檢任務(wù),還可將富余的CPU計(jì)算力用于飛控模塊,提高了飛行安全.
圖4 本文改進(jìn)方法識(shí)別結(jié)果
圖5 本文改進(jìn)方法與Mask-RCNN、SURF、NCC模板匹配法性能對(duì)比結(jié)果
1)針對(duì)電力線路無人機(jī)巡檢過程中對(duì)于電力設(shè)備的影像拍攝質(zhì)量受制于拍攝姿態(tài)與設(shè)備放電間隙距離,而Mask-RCNN算法運(yùn)算成本大的問題,提出一種間接性幀減法對(duì)Mask-RCNN算法損失函數(shù)進(jìn)行改進(jìn).
2)在保證Mask-RCNN算法目標(biāo)識(shí)別準(zhǔn)確率的基礎(chǔ)上,通過改變算法運(yùn)算對(duì)象,即逐次改變背景影像,降低運(yùn)算時(shí)間與CPU占用率,同時(shí)提高復(fù)雜環(huán)境下的不明顯目標(biāo)識(shí)別能力.
3)試驗(yàn)結(jié)果表明,基于本文改進(jìn)的Mask-RCNN算法,能以近乎95%的準(zhǔn)確率快速識(shí)別輸電線路,同時(shí)CPU占用率降低至24%以內(nèi),在保證了飛行安全的前提下提高了巡檢質(zhì)量,為后續(xù)輸電線路隱患識(shí)別提供了基礎(chǔ).