蘇超,楊強(qiáng)
(1.廣東電網(wǎng)有限責(zé)任公司清遠(yuǎn)供電局,廣東 清遠(yuǎn) 511500;2.浙江大學(xué) 電氣工程學(xué)院,浙江 杭州 310000)
電能通過輸電線路輸送到各個用戶,輸電線路包括線路桿塔、輸電線、絕緣子、線路金具、拉線、接地裝置等。輸電線路里程長,跨越復(fù)雜多變的地形和氣候區(qū)域,并且受冰霜雨雪、高海拔、污穢等自然條件和天氣因素影響,絕緣子容易出現(xiàn)自爆、閃絡(luò)、破損、裂紋等缺陷,導(dǎo)致絕緣失效。為了保證整個電網(wǎng)安全穩(wěn)定運(yùn)行,必須對絕緣子狀態(tài)進(jìn)行監(jiān)測,迅速、高效地發(fā)現(xiàn)缺陷和隱患并進(jìn)行消缺。因此,定期巡檢了解線路的運(yùn)行狀態(tài),及時發(fā)現(xiàn)設(shè)備缺陷和其他安全隱患,已經(jīng)成為確保輸電線路及其設(shè)備可靠運(yùn)行的必要手段[1-6]。
在直升機(jī)或無人機(jī)上搭載攝影設(shè)備拍攝巡檢線路的圖像,通過分析圖像信息掌握線路基本運(yùn)行狀況,是現(xiàn)代化輸電線路維護(hù)工作中一種先進(jìn)、實用的技術(shù)手段。但航拍巡檢過程采集到的圖像數(shù)據(jù)量非常龐大,輸電走廊的自然環(huán)境和地貌變化大,獲得的航拍圖像背景復(fù)雜多變、干擾多,絕緣子、線路金具、鳥巢等目標(biāo)主體不明顯。工作人員通過肉眼方式進(jìn)行圖像讀取與判斷工作量大,受主觀因素影響大,且長時間工作易產(chǎn)生視覺疲勞、精力不足,導(dǎo)致誤判或漏判,無法準(zhǔn)確、可靠地發(fā)現(xiàn)線路安全隱患。因此,將直升機(jī)或者無人機(jī)與計算機(jī)視覺相結(jié)合實現(xiàn)自主巡檢已成為智能電網(wǎng)自動巡檢的研究熱點。
絕緣子定位就是在一幅圖像中標(biāo)出絕緣子位置,它是實現(xiàn)絕緣子缺陷檢測的重要環(huán)節(jié)。利用可見光圖像進(jìn)行絕緣子定位的研究已有很多,主要包括:
a)基于圖像分割的定位。文獻(xiàn)[7]對玻璃絕緣子在色調(diào)、飽和度、亮度(hue,saturation,intensity,HSI)色彩空間的飽和度分量進(jìn)行閾值分割,利用連通區(qū)域法確定絕緣子輪廓。該類方法對于背景簡單、不同目標(biāo)之間像素值差異明顯的圖像分割效果好,但對于復(fù)雜背景圖像分割效果不理想。
b)基于邊緣和輪廓檢測的定位。文獻(xiàn)[8]采用邊緣檢測完成絕緣子定位。文獻(xiàn)[9]利用非下采樣輪廓波變換進(jìn)行絕緣子圖像邊緣提取。由于巡檢圖像非常復(fù)雜,除了絕緣子,還包含桿塔及金具等其他目標(biāo),而且拍攝角度和拍攝距離的改變造成圖像中的絕緣子邊緣和輪廓的不確定性,使得該類方法的定位準(zhǔn)確度受影響。
c)基于紋理特征的定位。文獻(xiàn)[10]利用MPEG-7邊緣直方圖法對絕緣子紋理特征提取與識別。文獻(xiàn)[11]采用基于主成分分析(principal components analysis,PCA)和全局最小主動輪廓模型進(jìn)行圖像紋理分割,該方法有一定的識別效果,但模型參數(shù)需要大量實驗才能獲取。基于紋理特征的定位方法計算復(fù)雜度高,圖像中絕緣子紋理特征清晰且與背景目標(biāo)紋理區(qū)別明顯時,定位效果好;反之,絕緣子紋理不清,或絕緣子紋理與其他目標(biāo)的紋理接近時,定位效果不好。
綜上可見,已有方法能夠在一定的條件下實現(xiàn)絕緣子定位,但還存在不足,為滿足智能巡檢的要求,急需結(jié)合絕緣子自身特點,深入研究準(zhǔn)確率更高、實時性更好的絕緣子定位方法。本文利用云臺角度自動控制技術(shù)和SSD(single shot multibox detector)深度學(xué)習(xí)算法研制了一種基于目標(biāo)圖像識別技術(shù)的絕緣子前端定位系統(tǒng),在兼顧高檢測速度的同時,準(zhǔn)確率也較高,實現(xiàn)無人機(jī)前端定位判斷。研究成果可以幫助提升輸電線路巡檢的自動化、智能化水平,具有一定的實際意義。
絕緣子前端定位系統(tǒng)由無人機(jī)平臺、飛行控制系統(tǒng)、圖像采集系統(tǒng)、圖像識別系統(tǒng)、地面站系統(tǒng)以及無線通信系統(tǒng)組成。系統(tǒng)結(jié)構(gòu)如圖1所示。
圖1 系統(tǒng)結(jié)構(gòu)Fig.1 System structure
地面操作人員通過地面站系統(tǒng)操控?zé)o人機(jī)飛往指定目的地,無人機(jī)到達(dá)檢測地點后進(jìn)入自動懸停狀態(tài),操控圖像采集系統(tǒng)對目標(biāo)區(qū)域進(jìn)行拍攝,拍攝的圖片實時發(fā)送到圖像識別系統(tǒng),圖像識別系統(tǒng)由樹莓派機(jī)載電腦和現(xiàn)場可編程門陣列(field-programmable gate array,F(xiàn)PGA)人工智能(artificial intelligence,AI)計算平臺組成,收到拍攝的圖片后,樹莓派先對其進(jìn)行預(yù)處理,將預(yù)處理的圖片發(fā)送給FPGA計算平臺,平臺內(nèi)置的卷積神經(jīng)網(wǎng)絡(luò)對圖片進(jìn)行目標(biāo)物檢測識別,并反饋目標(biāo)物的位置信息(圖像像素坐標(biāo))給樹莓派,樹莓派基于位置信息及相機(jī)的焦距參數(shù)進(jìn)行坐標(biāo)轉(zhuǎn)換計算云臺偏轉(zhuǎn)角,并將計算出的云臺偏轉(zhuǎn)角發(fā)送給飛行控制系統(tǒng)。飛行控制系統(tǒng)收到云臺控制參數(shù)后發(fā)送給云臺,以控制云臺轉(zhuǎn)動,使攝像機(jī)逐一拍攝圖片中的目標(biāo)物,且目標(biāo)物處于圖片中心位置。目標(biāo)定位拍攝流程如圖2所示。
在飛機(jī)懸停后,對目標(biāo)區(qū)域進(jìn)行拍攝,AI計算平臺獲取云臺攝像機(jī)視頻流,對目標(biāo)物進(jìn)行檢測識別,根據(jù)像素坐標(biāo)位置計算偏轉(zhuǎn)角。云臺控制系統(tǒng)的核心是通過控制云臺在水平和俯仰這2個方向上的轉(zhuǎn)動,帶動負(fù)載攝像機(jī),使拍攝的目標(biāo)物保持在攝像機(jī)視野的中心位置。首先計算目標(biāo)物在圖像像素坐標(biāo)系中的位置坐標(biāo),然后分別計算該位置在X方向和Y方向與圖像中心的位移偏差值Δx、Δy;再將Δx、Δy通過坐標(biāo)轉(zhuǎn)換關(guān)系計算轉(zhuǎn)化為2個偏轉(zhuǎn)方向上的偏轉(zhuǎn)角Δθx、Δθy;最后將偏轉(zhuǎn)角信息作為控制參數(shù)反饋給云臺,驅(qū)動電動機(jī)完成攝像機(jī)的轉(zhuǎn)動。目標(biāo)定位偏轉(zhuǎn)流程如圖3所示。
圖2 目標(biāo)定位拍攝流程Fig.2 Target location filming process
圖3 目標(biāo)定位偏轉(zhuǎn)流程Fig.3 Target location deflection process
飛行平臺選用大疆M210 RTK V2無人機(jī),如圖4所示。該飛行平臺的機(jī)身可靠耐用,適用于嚴(yán)苛的作業(yè)環(huán)境。
圖4 大疆M210 RTK V2無人機(jī)Fig.4 DJI M210 RTK V2 UAV
另外,飛行平臺還設(shè)有移動端、機(jī)載端和視覺導(dǎo)航系統(tǒng)的軟件開發(fā)工具包(software development kit,SDK)。
移動端SDK(Mobile SDK)幾乎全線支持大疆的硬件產(chǎn)品,在開發(fā)平臺上支持現(xiàn)在主流的兩大移動端系統(tǒng)平臺——iOS和Android,通過Mobile SDK開發(fā)出來就是常見的手機(jī)平板應(yīng)用程序,此應(yīng)用程序在開發(fā)的時候調(diào)用了部分Mobile SDK的應(yīng)用程序編程接口并封裝成一個個可以用于操控?zé)o人機(jī)的功能。
機(jī)載端SDK(Onboard SDK)則更強(qiáng)調(diào)在妙算、禪思系列鏡頭和飛行控制等機(jī)載平臺上進(jìn)行開發(fā),屬于硬件開發(fā)的范疇,主要是處理數(shù)據(jù)通信協(xié)議,通過發(fā)送碼流來達(dá)到控制無人機(jī)的目的,數(shù)據(jù)處理速度較高。
視覺導(dǎo)航系統(tǒng)SDK(Guidance SDK)是為導(dǎo)航系統(tǒng)而設(shè)置的,通過Guidance SDK可以從導(dǎo)航系統(tǒng)的硬件上獲取各種輸出數(shù)據(jù),包括實時三維速度、慣性測量單元(inertial measurement unit,IMU)數(shù)據(jù)、超聲波距離等。
本系統(tǒng)需要在機(jī)載端對視頻數(shù)據(jù)進(jìn)行實時計算,逐幀進(jìn)行目標(biāo)識別,數(shù)據(jù)處理運(yùn)算量大,大疆M210提供串口和Onboard SDK,通過串口可以獲取無人機(jī)的視頻流、控制權(quán),同時可以讀取無人機(jī)的姿態(tài)和速度信息。
云臺的性能是保證拍攝照片質(zhì)量的關(guān)鍵,本系統(tǒng)采用禪思Z30型工業(yè)級增穩(wěn)云臺,將三軸增穩(wěn)技術(shù)提升至全新高度,攝像機(jī)抖動控制在0.01°以內(nèi),在高倍變焦時也能保證圖像清晰穩(wěn)定。三軸增穩(wěn)云臺不僅能大幅降低抖動,還能補(bǔ)償飛行器姿態(tài)的變化,使攝像機(jī)保持水平,在高速運(yùn)動中捕捉穩(wěn)定、流暢的影像。
對于使用外部處理器與無人機(jī)進(jìn)行串口通信,本文系統(tǒng)選用基于ATmega644單片機(jī)樹莓派開發(fā)板作為機(jī)載電腦。
本項目使用的樹莓派3代B型電腦板是基于ARM架構(gòu)的電腦主板,具有1.2 GHz主頻的四核64位中央處理器、1 GB隨機(jī)存取存儲器(random access memory,RAM),以MicroSD卡作為硬盤,可外掛接通用串行總線(universal serial bus,USB)移動硬盤,主板上帶有一個10 Mbps/100 Mbps的以太網(wǎng)接口和4個USB數(shù)據(jù)接口,可連接網(wǎng)線和鍵盤、鼠標(biāo),板載無線WiFi模塊和藍(lán)牙模塊,高清多媒體接口。只需要接通顯示器及鍵盤、鼠標(biāo),就可以像其他任何一臺運(yùn)行Linux系統(tǒng)的個人電腦或者筆記本電腦,實現(xiàn)編程及辦公文檔、瀏覽網(wǎng)頁、播放視頻、控制硬件等諸多功能。
采用FPGA計算平臺,支持深度學(xué)習(xí)網(wǎng)絡(luò)實時計算。機(jī)載FPGA計算平臺采用Intel Arria 10芯片,包含雙核ARM Cortex-A9,并包含156個數(shù)字信號處理計算單元、160 Kbps邏輯單元的FPGA可編程邏輯。支持多層深度學(xué)習(xí)模塊實時并行計算,并可通過重構(gòu)可編程邏輯部分更新硬件模塊功能,其中FPGA芯片配置散熱模塊,支持FPGA芯片在0~60 ℃溫度下工作。硬件計算平臺上運(yùn)行Ubuntu 16.04系統(tǒng)。平臺質(zhì)量不大于150 g,平均功耗9 W,圖像輸入到結(jié)果輸出的檢測時間在190 ms以內(nèi)。板卡尺寸、功耗、性能各方面都能滿足機(jī)載前端的要求,支持基于深度學(xué)習(xí)的輸電線路目標(biāo)圖像分析[12]。
a)飛行控制系統(tǒng)獲取云臺攝像機(jī)數(shù)據(jù),經(jīng)USB口將圖像數(shù)據(jù)發(fā)送到樹莓派;通過無線傳輸實時將圖像數(shù)據(jù)回傳地面站;經(jīng)異步收發(fā)傳輸器接口將云臺攝像機(jī)參數(shù)發(fā)送到樹莓派。
b)樹莓派將圖像數(shù)據(jù)處理成鯤云AI加速卡所需格式后,經(jīng)網(wǎng)口發(fā)送給鯤云AI加速卡。
c)鯤云AI加速卡對圖像進(jìn)行目標(biāo)檢測。若發(fā)現(xiàn)目標(biāo),將目標(biāo)位置信息通過網(wǎng)口發(fā)送給樹莓派。樹莓派將目標(biāo)位置信息發(fā)送到飛行控制系統(tǒng)并回傳地面站,地面端顯示的是目標(biāo)標(biāo)注后的實時畫面。
d)樹莓派基于目標(biāo)位置信息及云臺攝像機(jī)的參數(shù)計算云臺控制參數(shù)。
e)地面端觸發(fā)拍照功能,飛行控制系統(tǒng)收到地面端指令后,將云臺控制指令發(fā)送給云臺。
f)云臺接收控制指令,在俯仰、航向2個維度進(jìn)行偏轉(zhuǎn),對準(zhǔn)目標(biāo)并拍照,使目標(biāo)物處于照片中心位置[13-16]。
通信流程如圖5所示。
現(xiàn)實物體處于三維立體世界中,經(jīng)過相機(jī)成像系統(tǒng)變成二維圖像,其過程如圖6所示。
三維立體世界中的物體P、二維圖像P′以及相機(jī)光心點O之間實際是相似三角形的關(guān)系,如圖7所示。
圖5 通信流程Fig.5 Communication flow chart
圖6 相機(jī)成像原理Fig.6 Camera imaging principle
圖7 相似三角形Fig.7 Similar triangles
云臺攝像機(jī)主要成像原理是小孔成像。其過程和4個坐標(biāo)系有關(guān),分別是世界坐標(biāo)系、相機(jī)坐標(biāo)系、圖像物理坐標(biāo)系和圖像像素坐標(biāo)系。
世界坐標(biāo)系是現(xiàn)實的三維地球的絕對坐標(biāo)系。因為攝像機(jī)是安裝在三維世界,要想確定它的位置,必須要用這個基準(zhǔn)坐標(biāo)來描述,而且還需要用它來確定其他任何被放在三維世界的物體并描述出來,用(X,Y,Z)表示其坐標(biāo)。
相機(jī)坐標(biāo)系也稱光心坐標(biāo)系,其坐標(biāo)原點是相機(jī)的中心位置,其坐標(biāo)值用(XC,YC,ZC)表示,XC軸和YC軸分別與世界坐標(biāo)系的X軸和Y軸平行,相機(jī)的光軸作為坐標(biāo)系的ZC軸。
圖像物理坐標(biāo)系是將所拍攝圖像的中心位置作為坐標(biāo)原點(O1),其坐標(biāo)值用(x,y)表示,x軸和y軸與圖像的兩條邊平行。圖像物理坐標(biāo)系采用物理單位來表示像素在圖片中的位置。
圖像像素坐標(biāo)系以攝像機(jī)拍攝的圖像的左上角為原點(O0),其坐標(biāo)值用(u,v)表示,u軸與v軸分別與世界坐標(biāo)系的X軸和Y軸平行。攝像機(jī)采集圖像首先得到的是電信號,然后轉(zhuǎn)換成數(shù)字信號。所有圖像都是以數(shù)組的形式存儲,每一個元素的數(shù)值就是圖像的灰度值,即像素。
假設(shè)一個三維世界中的物體點在世界坐標(biāo)系中的坐標(biāo)為(X,Y,Z),經(jīng)過攝像機(jī)拍到圖片,在圖片上的像素坐標(biāo)為(u,v),在圖像坐標(biāo)系中的坐標(biāo)為(x,y),在相機(jī)坐標(biāo)系中的坐標(biāo)為(XC,YC,ZC),則以上各個坐標(biāo)之間存在3種轉(zhuǎn)換關(guān)系:圖像像素坐標(biāo)系與圖像物理坐標(biāo)系的關(guān)系、圖像物理坐標(biāo)系與相機(jī)坐標(biāo)系的關(guān)系、相機(jī)坐標(biāo)系與世界坐標(biāo)系的關(guān)系。
a)圖像像素坐標(biāo)系與圖像物理坐標(biāo)系的關(guān)系。要把攝像機(jī)拍攝的圖片轉(zhuǎn)換成數(shù)字信號,然后將結(jié)果輸入到計算機(jī)當(dāng)中,計算機(jī)中的數(shù)字圖像都應(yīng)該顯示為M×N的數(shù)組,即有M行N列個元素,其中每一個元素稱為像素。圖像像素坐標(biāo)系與圖像物理坐標(biāo)系的關(guān)系如圖8所示。
圖8 圖像坐標(biāo)系Fig.8 Image coordinates system
圖像像素坐標(biāo)系中的單位是像素,坐標(biāo)表示為(u,v),分別代表該像素在計算機(jī)中的行數(shù)和列數(shù)。由于以像素為單位的圖像像素坐標(biāo)系沒能顯示像素在圖像中的位置,因此定義了一個以物理單位表示的圖像物理坐標(biāo)系(x,y)。每一個像素在x軸與y軸的物理尺寸為dx和dy,中心位置為(u0,v0),那么得到圖像中任意像素在這2個圖像坐標(biāo)系的關(guān)系可表示為:
(1)
(2)
用齊次坐標(biāo)與矩陣的形式可表示為:
(3)
(4)
式中A為攝像機(jī)的內(nèi)參矩陣。
b)圖像物理坐標(biāo)系與相機(jī)坐標(biāo)系的關(guān)系為:
(5)
(6)
用齊次坐標(biāo)系和矩陣的形式表示為
(7)
c)相機(jī)坐標(biāo)系與世界坐標(biāo)系的關(guān)系為:
(8)
式中:R為3×3正交旋轉(zhuǎn)矩陣;t為三維平移向量;[Rt]為攝像機(jī)的外參矩陣;O為[0 0 0],是為了補(bǔ)齊數(shù)學(xué)運(yùn)算,形成4×4矩陣。
綜上所述,轉(zhuǎn)換過程總公式為:
(9)
由于本系統(tǒng)研究的是基于固定的云臺攝像機(jī)純旋轉(zhuǎn)運(yùn)動,即攝像機(jī)只繞光心旋轉(zhuǎn),沒有平移向量,因此t為0。
設(shè)目標(biāo)檢測算法計算輸出的目標(biāo)物的圖像像素坐標(biāo)為(ut,vt),中心位置為(u0,v0),位置偏差分別為Δx、Δy,如圖9所示。
圖9 云臺攝像機(jī)視場圖Fig.9 Field of view of camera platform
根據(jù)轉(zhuǎn)換過程總公式可得:
(10)
無人機(jī)飛行過程中受光照、角度、采集位置等因素的影響,采集到的圖像存在亮度不足和模糊等質(zhì)量問題,在數(shù)據(jù)上的表現(xiàn)如圖10所示。不穩(wěn)定的圖像質(zhì)量會影響后續(xù)絕緣子定位的分析效果,增大運(yùn)算量。深度學(xué)習(xí)可以模擬人類視覺系統(tǒng)的層次結(jié)構(gòu),通過復(fù)雜非線性結(jié)構(gòu)對數(shù)據(jù)進(jìn)行高層抽象提取深層特征,與其他機(jī)器學(xué)習(xí)方法相比,在復(fù)雜背景的環(huán)境下識別絕緣子的效率和魯棒性有明顯優(yōu)勢[17-20]。
深度學(xué)習(xí)在物體檢測領(lǐng)域應(yīng)用較多的是Faster R-CNN算法,該算法具有較高的檢測精度,然而存在的主要問題是雙階段結(jié)構(gòu)的時間復(fù)雜度較高,速度較慢,不適合需要實時檢測的場景。另外雙階段結(jié)構(gòu)并行性不好,在FPGA平臺上實現(xiàn)性能不高。為了解決以上問題,本系統(tǒng)應(yīng)用SSD深度學(xué)習(xí)網(wǎng)絡(luò)框架完成絕緣子定位。首先,利用數(shù)據(jù)集預(yù)訓(xùn)練SSD深度學(xué)習(xí)網(wǎng)絡(luò)模型;接著,根據(jù)絕緣子形狀調(diào)整默認(rèn)邊界框的寬高比設(shè)置比例,在SDD中增加多尺度感興趣區(qū)域池化層;微調(diào)SSD模型參數(shù),獲得絕緣子識別定位模型,實現(xiàn)從電網(wǎng)巡檢圖像中自動定位絕緣子。SSD的網(wǎng)絡(luò)框架有以下3個主要特點:
圖10 不同條件下的絕緣子Fig.10 Insulators under different conditions
a)多尺度特征圖。在圖像基線網(wǎng)基礎(chǔ)上,將全連接層變?yōu)榫矸e層,并添加了一些大小逐漸減小的卷積層,用于進(jìn)行多尺度預(yù)測。
b)卷積預(yù)測器。對每個新添加的卷積層和之前的部分卷積層,使用一系列的卷積核進(jìn)行預(yù)測。對于一個m×n大小的p通道卷積層,使用3×3的p通道卷積核作為基礎(chǔ)預(yù)測元素進(jìn)行預(yù)測,在某個位置上預(yù)測出一個值,該值可以是某一類別的得分,也可以是相對于默認(rèn)邊界框的偏移量,并且在圖像的每個位置都將產(chǎn)生一個值。
c)默認(rèn)框和比例。在特征圖的每個位置預(yù)測K個Box。對于每個Box,預(yù)測C個類別得分,以及相對于默認(rèn)邊界框的4個偏移值,這樣需要(C+4)×K個預(yù)測器,在m×n的特征圖上將產(chǎn)生(C+4)×K×m×n個預(yù)測值。
本系統(tǒng)采用的SSD網(wǎng)絡(luò)采用VGG16卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),采用3×3的卷積核結(jié)合最大池化作為基本層。通過把全連接層轉(zhuǎn)化為卷積操作將SSD網(wǎng)絡(luò)轉(zhuǎn)化為一個全卷積網(wǎng)絡(luò),從而使得SSD可以適用于任意大小和尺度的輸入圖片。在不同尺度的特征圖上,SSD采用卷積核來預(yù)測一系列默認(rèn)邊界框的類別、坐標(biāo)偏移。為了提高檢測準(zhǔn)確率,SSD 在不同尺度的特征圖上進(jìn)行預(yù)測。大特征圖檢測小目標(biāo),小特征檢測大目標(biāo)。與YOLO(you only look once)算法不同,SSD算法跳過了區(qū)域提案網(wǎng)絡(luò)的階段,直接在特征圖上回歸出目標(biāo)框的位置和識別目標(biāo)框的類別,并且融合了多尺度特征圖上的結(jié)果,提升了對于小物體的檢測召回率。采用SSD算法既保持了YOLO算法速度快的特性,也保證了窗口預(yù)測與Faster R-CNN算法一樣精準(zhǔn),YOLO、Faster R-CNN和SSD在PASCAL VOC2007數(shù)據(jù)集上的精度和速度對比見表1。SSD-300在基本不損失精度的情況下,速度較Faster R-CNN(VGG16)提升將近8倍,SSD-500最高精度達(dá)75.1%,滿足對絕緣子實時定位的要求。無人機(jī)可結(jié)合絕緣子位置實現(xiàn)對絕緣子的進(jìn)一步定位拍照以獲取質(zhì)量更好的圖片,對于后續(xù)的分析處理有很大的幫助。
表1 不同算法的精度與速度Tab.1 Accuracy and speed of different algorithms
利用電網(wǎng)巡檢絕緣子圖像數(shù)據(jù)庫對系統(tǒng)進(jìn)行訓(xùn)練學(xué)習(xí),訓(xùn)練圖像共45 656張,訓(xùn)練過程中引入了顏色、噪聲、旋轉(zhuǎn)、縮放等大量數(shù)據(jù)擾動方法。訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)以9∶1的比例從上述數(shù)據(jù)中隨機(jī)選取,并保證訓(xùn)練集與測試集沒有交叉。最終模型測試集的精確率達(dá)90%,召回率達(dá)90%。
絕緣子定位如圖11所示,可以看出系統(tǒng)實現(xiàn)了對圖中所有絕緣子實時自動定位打框。矩形框中絕緣子填充率高,定位矩形中絕緣子完整,說明定位位置精準(zhǔn)。從圖11還可以看到,定位到的絕緣子具有各種類型,既包含玻璃材質(zhì)的絕緣子,又包含陶瓷絕緣子,顏色有綠色、灰色、褐色,圖中的背景有樹林、原野、河流,桿塔、輸電線。圖像中絕緣子大小不同,角度各異,存在不同程度的模糊,但都獲得了很好的定位結(jié)果,表明本文研究的基于目標(biāo)圖像識別技術(shù)的絕緣子前端定位系統(tǒng)具有很好的適用性,且定位精確度高。
圖11 絕緣子定位Fig.11 Insulator location
利用相同的網(wǎng)絡(luò)架構(gòu),通過使用鳥巢的圖片對模型進(jìn)行訓(xùn)練也可以實現(xiàn)鳥巢的檢測,如圖12所示,系統(tǒng)能夠?qū)B巢準(zhǔn)確定位打框。這說明本系統(tǒng)設(shè)計的SSD網(wǎng)絡(luò)是一個具備通用性的目標(biāo)檢測架構(gòu),在后續(xù)工作中可利用該網(wǎng)絡(luò)架構(gòu)拓展檢測其他特定的目標(biāo)物。
圖12 鳥巢定位Fig.12 Bird nest location
本文利用云臺角度自動控制技術(shù)和SSD深度學(xué)習(xí)算法,研制了一種基于目標(biāo)圖像識別技術(shù)的絕緣子前端定位系統(tǒng)。該系統(tǒng)能夠在復(fù)雜的背景環(huán)境下對不同類型的絕緣子進(jìn)行識別定位,適用于輸電線路的定期巡檢,可為缺陷診斷、設(shè)備狀態(tài)評價提供參考。然而此項工作更為重要的意義在于利用研發(fā)的前端定位系統(tǒng)可以準(zhǔn)確、清晰地拍攝輸電線路部件設(shè)備,從而有效地提升后端設(shè)備缺陷圖像識別的準(zhǔn)確度,為輸電線路可見光缺陷自動診斷技術(shù)的改進(jìn)提供了幫助。本文系統(tǒng)在減少線路計劃停電時間、優(yōu)化電網(wǎng)設(shè)備檢修方式、提高電網(wǎng)設(shè)備壽命和減少重復(fù)性工作的人力投入等方面具有重要意義。