呂曉麗,姜 航,李文輝
(長春工程學(xué)院電氣與信息工程學(xué)院, 長春 130000)
近幾年,由于無人飛行器可降低每公里基礎(chǔ)設(shè)施檢查成本,被廣泛應(yīng)用于電力基礎(chǔ)設(shè)施檢查和監(jiān)控[1-2]。在某些情況下,機(jī)載傳感器不僅用于檢查或數(shù)據(jù)收集,同時(shí)也用于導(dǎo)航,特別是在執(zhí)行更精確的檢查任務(wù)時(shí)更具優(yōu)勢?,F(xiàn)有無人機(jī)大多具有衛(wèi)星定位系統(tǒng),可以提供高度精確的實(shí)時(shí)位置信息。但在實(shí)際工作中,地理信息系統(tǒng)的數(shù)據(jù)往往是不完整的、不準(zhǔn)確的,甚至某些地區(qū)的信息并不存在。所以,在某些無法收到衛(wèi)星定位信號(hào)的環(huán)境中,基于視覺方法為無人機(jī)直接在電力線網(wǎng)絡(luò)上導(dǎo)航提供了一種很好的選擇。機(jī)載攝像機(jī)拍攝的圖像可用于估計(jì)飛機(jī)相對(duì)于目標(biāo)的位置,并協(xié)助無人機(jī)導(dǎo)航。而基于視覺的導(dǎo)航面臨的主要問題是實(shí)時(shí)檢測和定位。
本研究利用電力線實(shí)現(xiàn)無人機(jī)主動(dòng)導(dǎo)航,有利于執(zhí)行更先進(jìn)、更優(yōu)化的空中檢查任務(wù)。從傳感器的角度來看,電力線具有一種線性特征,其特定寬度和長度隨傳感器高度的變化而線性變化。
線性特征檢測是計(jì)算機(jī)視覺的一個(gè)重要領(lǐng)域。文獻(xiàn)[3-4]中提出了一種基于核的Hough變換,但它產(chǎn)生無限長的直線,而不是線段,此外,它檢測到更多的假陽性線,并且線位置相對(duì)原始位置有偏移。文獻(xiàn)[5]中提出利用線段檢測器(LSD),一種在量化梯度方向上使用連通分量分析(CCA)以獲得共線像素的技術(shù),將這些像素的特征向量計(jì)算為線段。盡管LSD能產(chǎn)生精確的直線段,但由于所涉及的區(qū)域在整個(gè)圖像上的增長,使得它的計(jì)算成本很高,不適合實(shí)時(shí)應(yīng)用。文獻(xiàn)[6]中基于最小二線擬合方法從邊緣像素鏈中提取線條,即邊緣繪制算法(EDLines),這是最快的直線段方法。由于上述算法對(duì)各種邊緣都作出響應(yīng),一條線生成兩條邊緣線,這使得它們不適合電力線檢測。文獻(xiàn)[7]中提出分別用兩個(gè)高斯一階導(dǎo)數(shù)作為左右線邊,將兩個(gè)濾波器的響應(yīng)以非線性方式組合為線的最終響應(yīng),也可以通過提取中心線或脊線來估計(jì)直線。文獻(xiàn)[8]中通過使用高斯導(dǎo)數(shù)的圖像卷積二次多項(xiàng)式來近似圖像來計(jì)算脊點(diǎn),并可以檢測出亞像素精度的中心線。同樣,文獻(xiàn)[9]中提出一種新的思路,即從邊緣圖上執(zhí)行歐幾里得距離變換生成的距離圖中提取脊點(diǎn),但對(duì)于大圖像而言,距離變換速度較慢。
一般來說,現(xiàn)有的線檢測方法要么計(jì)算量大,要么無法獲得魯棒的特征檢測性能。本研究對(duì)幾種較先進(jìn)的航空圖像電力線檢測算法進(jìn)行了比較,提出了一種新的電力線實(shí)時(shí)檢測算法,該算法利用可控濾波器和電力線所在環(huán)境周圍物體的先驗(yàn)知識(shí)進(jìn)行檢測。
二維定向?yàn)V波器,如高斯濾波器和Gabor濾波器,已經(jīng)被廣泛用于魯棒梯度邊緣和嶺谷信息檢測[10-12]。方法是將定向?yàn)V波器與每個(gè)方向的圖像卷積,并分析每個(gè)濾波器響應(yīng)。向多個(gè)方向旋轉(zhuǎn),濾波非常耗時(shí),尤其是當(dāng)一個(gè)濾波器與另一個(gè)濾波器的旋轉(zhuǎn)相差很小時(shí)。為了解決這一計(jì)算成本,文獻(xiàn)[9]中提出了可控濾波器。
可控濾波器是基于在預(yù)定方向上定義的基濾波器,在任意方向上旋轉(zhuǎn)的濾波器響應(yīng)由這些基濾波器的線性組合合成。這些濾波器可以通過基濾波器的適當(dāng)插值有效地旋轉(zhuǎn)。給定f(x,y)作為濾波器響應(yīng),并且作為fθ(x,y)濾波器旋轉(zhuǎn)一定角度的響應(yīng),可控濾波器可以寫入等式(1):
(1)
其中:θi是第i個(gè)基角,i∈1,2,…,M;ki(θ)是第i個(gè)插值函數(shù);fθi(x,y)是第i個(gè)基函數(shù);M是基濾波器的數(shù)量。
高斯導(dǎo)數(shù)由于其良好的可控性,在計(jì)算機(jī)視覺中得到了廣泛的應(yīng)用。此外,其為帶通濾波器,可以增強(qiáng)沿其方向的響應(yīng),同時(shí)抑制與其方向正交的響應(yīng)。一般采用奇數(shù)階濾波器進(jìn)行邊緣檢測,偶數(shù)階濾波器用于脊線檢測,高斯二階導(dǎo)數(shù)用于電力線檢測的脊線檢測。該濾波器由可控的四層濾波器對(duì)(高斯二階導(dǎo)數(shù)及其希爾伯特變換)構(gòu)成。這可以確定線條類型和方向。
設(shè)G2為可控濾波器,其正交對(duì)可控正交濾波器H2是G2的希爾伯特變換的近似。通過找到適合多項(xiàng)式的最小二乘解乘以(x,y)中的高斯來實(shí)現(xiàn)H2。通過使用三階奇偶校驗(yàn)多項(xiàng)式可以實(shí)現(xiàn)令人滿意的近似。這意味著四個(gè)基本濾波器足以在任意方向上控制正交濾波器H2,并且G2需要三個(gè)基函數(shù)。圖1表示為G2和H2的基本濾波器。實(shí)現(xiàn)了在任何方向θ上的可控正交濾波器對(duì):
(2)
圖1 G2和H2的基本濾波器
在可控的正交濾波器對(duì)的實(shí)現(xiàn)中,第一步是創(chuàng)建2D基濾波器。高斯函數(shù)G(x,y)是具有線性可分性的唯一旋轉(zhuǎn)對(duì)稱函數(shù),即G(x,y)=g(x)*g(y)。為了便于計(jì)算,在一維中計(jì)算高斯函數(shù)的一階和二階導(dǎo)數(shù)及其希爾伯特變換以及希爾伯特變換的多項(xiàng)式擬合。
通過將圖像中的每一行與水平投影卷積,然后將每列與垂直投影卷積來實(shí)現(xiàn)與圖像的2D濾波卷積。
本節(jié)利用可控濾波器理論,針對(duì)線性特征檢測,提出了電力線檢測算法。其主要思想是根據(jù)可轉(zhuǎn)向?yàn)V波器的能量函數(shù)求取脊點(diǎn)而不是邊緣,然后對(duì)共線脊點(diǎn)進(jìn)行分組,提取線性特征。此外,應(yīng)區(qū)分電線和周圍的線性物體。其特點(diǎn)概括如下:① 對(duì)稱性:沿主軸的幾何相似性。左右兩側(cè)的大小相似。② 延伸率:平均長度>>平均寬度。③ 平行度:左右邊界應(yīng)局部平行。④ 均勻性:區(qū)域應(yīng)均勻,區(qū)域強(qiáng)度的輪廓類似于墨西哥帽。
電力線段可以通過檢測線性圖案的脊點(diǎn)來識(shí)別。大多數(shù)以前的電力線檢測方法使用基于邊緣檢測的方法,我們認(rèn)為這是不合適的,因?yàn)椋孩?在邊緣檢測之后,圖像中由兩個(gè)以上像素表示的粗電力線段將被檢測為兩條平行的邊緣線;② 由于環(huán)境的復(fù)雜性(例如,柵欄和道路等附近的線性物體),也將檢測到許多假陽性邊緣線。本研究提出了一種面向高斯濾波的圖像脊線點(diǎn)檢測方法。
高斯導(dǎo)數(shù)能夠很好地檢測沿其軸寬度變化很小的細(xì)長結(jié)構(gòu),主要原因有如下兩點(diǎn):① 它們是抑制寬度小于閾值的線的帶通濾波器;② 使用濾波器內(nèi)核中的所有像素,可有效抑制噪聲[7,9,13]。為了確定脊點(diǎn),分析和比較兩種能量函數(shù),定向能和脊能。
使用二維高斯函數(shù)G(x,y):
(3)
令G2(θ)和H2(θ)為角度θ的可控正交對(duì)濾波器,?為卷積運(yùn)算,對(duì)濾波器與圖像的卷積可以得到:
(4)
定向能量E2(θ),即G2(θ)和H2(θ)的響應(yīng)的組合,定義為[9]:
E2o(θ)=[G2(θ)]2+[H2(θ)]2
(5)
對(duì)于任何像素j,存在角度θd的最大定向能量。該角度是像素的主要方向。
(6)
為了提取脊點(diǎn)并排除更多邊緣點(diǎn),脊能量函數(shù)E2r(θ)定義為[13]:
(7)
可控正交濾波器H2(θ)的輪廓用于邊緣檢測,而可控濾波器G2(θ)的形狀用于脊線檢測。脊點(diǎn)會(huì)增加G2(θ)的響應(yīng)并抑制H2(θ)的響應(yīng)。脊能量可以被視為像素的脊強(qiáng)度。如果像素的脊能量小于0,則像素j被分類為邊緣像素,否則它是脊像素。像素j具有最大脊能量的方向是像素的主要方向。
(8)
可控的正交濾波器對(duì)沿著濾波器對(duì)的方向增強(qiáng)能量,同時(shí)抑制垂直于該方向的能量,因此脊點(diǎn)將具有比其周圍像素更大的能量。識(shí)別脊點(diǎn)的過程:
1) 通過操縱正交濾波器對(duì)計(jì)算每個(gè)方向上每個(gè)像素的定向和脊能量E2(θ,j);
2) 設(shè)定定向能量和脊能量的最大值E2(θ,j)用作像素j的值。如果E2(θ,j)大于預(yù)定閾值,則像素j被分類為脊點(diǎn)。本文將[0,π]分為8個(gè)方向
θ=(i/8)π,i=0,1,…,7
用于計(jì)算效率,并從這8個(gè)方向定位最大能量值。
圖2給出了脊點(diǎn)檢測的一個(gè)例子,其中圖2(a)列代表原始圖像,圖2(b)列和圖2(c)列分別是定向?yàn)V波器和脊能量的脊點(diǎn)檢測結(jié)果。由于正交濾波器對(duì)的卷積涉及內(nèi)核中的所有像素,因此可以清楚地看到噪聲被濾除以及寬度小于感興趣線寬度的細(xì)線。應(yīng)該注意的是,脊檢測器僅運(yùn)行一次,并且脊不會(huì)像其他方法那樣被稀疏為一個(gè)像素寬度。原因在于:① 電力線可能太弱而不能變薄,否則電力線可能會(huì)被分解成許多細(xì)段,這使得檢測過程變得更加冗長,困難和不準(zhǔn)確。② 執(zhí)行脊形檢測器以檢測一個(gè)像素寬度脊,顯著增加了計(jì)算負(fù)擔(dān),這不適合于實(shí)時(shí)應(yīng)用。
圖2 脊點(diǎn)檢測示例
脊點(diǎn)被檢測為候選電力線,但是電力線的數(shù)量和哪些脊點(diǎn)屬于電力線仍然是未知的。并非所有線性特征都是電源線,因此應(yīng)去除這些噪聲線性特征,因?yàn)樗鼈儗⒂绊戨娫淳€的方向和位置的計(jì)算。無人機(jī)的姿勢是根據(jù)機(jī)載萬向相機(jī)捕獲的電力線進(jìn)行調(diào)整的,因此電力線的方向和位置對(duì)于引導(dǎo)無人機(jī)直接在電力線上方飛行至關(guān)重要。在本節(jié)中,將重點(diǎn)介紹如何從候選脊點(diǎn)提取電力線。
霍夫變換(HT)是最廣泛使用的線檢測方法。HT的主要缺點(diǎn)是線的多次響應(yīng)和邊緣圖上具有一個(gè)像素寬度的無限線檢測,這使得它不適合于電力線檢測[6]。受文獻(xiàn)[5]的啟發(fā),本研究采用了區(qū)域增長和連通分量分析的思想。連接的脊點(diǎn)被分組為連接區(qū)域,并被視為電力線的子集。由于電力線區(qū)域是均勻的,如果像素值和平均像素值之間的差小于閾值,則該像素屬于相同的電力線區(qū)域。重復(fù)合并過程直到不能添加新像素。
每個(gè)連通區(qū)域是一條線,其方向和位置可以從其協(xié)方差矩陣和特征值計(jì)算[15]。
設(shè)Ri={pj(xj,yj)|j= 1,2,…,m是帶有m像素的第i個(gè)像素的連通區(qū)域,其協(xié)方差矩陣由下式計(jì)算:
(9)
其中,xm,ym是連通區(qū)域Ri的質(zhì)心,
線角度θ定義為
(10)
其中,λ1是協(xié)方差矩陣的小特征值。
在檢測到連通分量之后,通過使用線擬合算法將共線線段鏈接以形成長線。圖3顯示了線檢測結(jié)果的示例。
圖3 線性特征檢測結(jié)果
假設(shè)無人機(jī)具有至少兩個(gè)自由度(例如平移和傾斜)的萬向節(jié)攝像機(jī)。無人機(jī)通過兩個(gè)控制回路被引導(dǎo),萬向節(jié)和無人機(jī)。首先控制萬向節(jié)的位置,使電力線在攝像機(jī)的視場內(nèi)(θ=0和T1=1)。為了完成這個(gè)控制任務(wù),從行中提取兩個(gè)變量。它們到圖像中心(T1)的距離以及它們相對(duì)于垂直方向的方向(θ)。圖4顯示了圖像平面中的估計(jì)變量。
圖4 從圖像平面獲得的用于控制性的變量
圖4中,θ是關(guān)于垂直的角度,T1是到圖像中心的距離。當(dāng)萬向節(jié)主動(dòng)跟蹤電力線,使用其姿勢產(chǎn)生適當(dāng)?shù)目刂泼?,使得飛機(jī)在電力線上方移動(dòng)并飛行。這是通過將實(shí)際萬向節(jié)姿勢與所需姿勢(90°傾斜和0°平移)進(jìn)行比較來實(shí)現(xiàn)的。如果無人機(jī)飛行在高度直接電力線上方并且萬向節(jié)向下看,那么所需的萬向節(jié)姿勢被視為萬向節(jié)所具有的姿勢。圖5中示出了控制架構(gòu),其中虛線表示無人機(jī)方向,萬向節(jié)姿勢和圖像平面中的特征位置之間的交叉耦合。其中,子指數(shù)d表示期望值,δ是指令值。
圖5 主動(dòng)導(dǎo)航的高級(jí)控制架構(gòu)框圖
總的來說,控制任務(wù)將同時(shí)命令萬向節(jié)和飛機(jī)達(dá)到所需的飛行軌跡(直接在電力線上方)。
本測試中采用了無人機(jī)飛行試驗(yàn)中拍攝的航空圖像,照片拍攝于離電力線20~60 m的高空。圖像中的電力線表示為至少2個(gè)像素。
采用LSD[5]和EDLines[3]作為評(píng)估本文所提出算法的標(biāo)準(zhǔn)。LSD和EDLines都是基于邊緣來檢測線的。為了說明在線檢測中使用脊的優(yōu)勢,合成圖像的結(jié)果如圖6所示。從左到右,帶有粗線的輸入圖像、使用本文算法的線檢測和使用EDLines的線檢測分別顯示為圖6(a)、圖6(b)和圖6(c)。從結(jié)果來看,很明顯,對(duì)于表示為多于2個(gè)像素的線,基于邊緣的線檢測產(chǎn)生兩條邊緣線。而對(duì)于基于脊線的線檢測,一條線只有一個(gè)響應(yīng)。
圖6 合成圖像上基于脊線和基于邊緣的線檢測結(jié)果
圖7顯示了本文算法和真實(shí)圖像中的兩種基線算法的更多結(jié)果。圖7中的(a)~(f)分別代表6個(gè)測試集,(1)~(4)分別是原始輸入圖像和EDLines、LSD以及本文算法的結(jié)果??偟膩碚f,本文算法獲得了比EDLines和LSD更好的檢測結(jié)果,并且假陽性線更少。此外,如前所述,EDLines 和LSD不能用于估計(jì)電力線的數(shù)量,因?yàn)樗鼈兪腔谶吘壍摹S捎诓荒軆H從圖像中使用高程線索,區(qū)分這些非常相似的線路特征和電力線可能非常困難,本文算法也檢測到一些圍欄線[圖7(d)]和道路中心線[圖7(c)]。
為實(shí)現(xiàn)基于視覺的無人機(jī)實(shí)時(shí)導(dǎo)航,計(jì)算機(jī)視覺算法的處理速度至關(guān)重要。由于本文中線擬合使用可控濾波器在濾波圖像中進(jìn)行的,故與EDLines和LSD相比,本文所提出的算法要快得多,表1是關(guān)于不同方式計(jì)算時(shí)間的比較。而直線擬合和像素搜索被應(yīng)用于直線的所有邊緣,耗時(shí)的區(qū)域生長方法被應(yīng)用于LSD的整個(gè)圖像的梯度圖上。
圖7 結(jié)果比較
表1 計(jì)算時(shí)間的比較
提出了一種基于無人機(jī)主動(dòng)導(dǎo)航的快速電力線檢測與定位方法。所提出的檢測算法的兩個(gè)主要方面:其一是從可控濾波器的能量函數(shù)中識(shí)別脊點(diǎn);其二是使用連通分量分析對(duì)檢測到的脊點(diǎn)進(jìn)行線擬合。實(shí)驗(yàn)結(jié)果表明所提出的算法可以有效減少假陽性線并且計(jì)算速度有所提高。