成 怡,田文斌,鄭騰龍
1.天津工業(yè)大學(xué) 控制科學(xué)與工程學(xué)院,天津 300387
2.天津工業(yè)大學(xué) 天津市電氣裝備智能控制重點(diǎn)實(shí)驗(yàn)室,天津 300387
我國(guó)電力供電系統(tǒng)中,電力輸送主要由高壓架空輸電方式實(shí)現(xiàn)。高壓架空線路由大型基桿塔搭建,基桿塔與線路的巡檢是保障高壓輸電網(wǎng)絡(luò)安全運(yùn)行的基本技術(shù)保證。輸電線路所處地形一般復(fù)雜、惡劣,人工巡檢時(shí)存在安全風(fēng)險(xiǎn)、效率低下等諸多不利因素。因此,無(wú)人機(jī)逐漸成為電力巡檢的主力軍[1]。無(wú)人機(jī)在目前電力巡檢工作時(shí),普遍采用人工遙控方式巡檢,在某些復(fù)雜惡劣的地形情況下難以避障,且人工操作巡檢時(shí),不穩(wěn)定因素較多、危險(xiǎn)性高,容易導(dǎo)致巡檢過(guò)程中無(wú)人機(jī)與基桿塔發(fā)生碰撞或電擊穿,為此,基于圖像處理的深度學(xué)習(xí)智能無(wú)人機(jī)在避障與航向識(shí)別方面的研究越來(lái)越受到重視[2]。
在深度學(xué)習(xí)的圖像識(shí)別與檢測(cè)領(lǐng)域,Inception-Resnet-V2網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)秀、精度較高,被國(guó)內(nèi)外學(xué)者廣泛研究和應(yīng)用。北京科技大學(xué)鄧能輝等[3]在表面缺陷檢測(cè)的研究中,用Inception-Resnet-V2模型進(jìn)行遷移學(xué)習(xí),提出的檢測(cè)方法在中厚板表面常見(jiàn)缺陷實(shí)現(xiàn)了大于98%的檢出率,平均識(shí)別率也大于88%。南京農(nóng)業(yè)大學(xué)袁培森等[4]利用Inception-Resnet-V2網(wǎng)絡(luò)的特征提取能力,結(jié)合雙線性回合操作,開發(fā)了基于Flask框架的在線菌類識(shí)別系統(tǒng),實(shí)現(xiàn)了較高精度的細(xì)粒度菌類表型在線識(shí)別。復(fù)旦大學(xué)王云軍等[5]在一次大規(guī)模的初步研究中,使用深度卷積神經(jīng)網(wǎng)絡(luò)通過(guò)組織病理學(xué)對(duì)甲狀腺腫瘤進(jìn)行多分類。其中Inception-Resnet-V2網(wǎng)絡(luò)模型可以達(dá)到94.42%的平均診斷準(zhǔn)確率。華北電力大學(xué)朱有產(chǎn)等[6]在一種基于改進(jìn)的NIC算法的圖像字幕生成研究中,利用Inception-Resnet-V2網(wǎng)絡(luò)更好的特征提取能力和避免網(wǎng)絡(luò)深化所造成的性能退化的特點(diǎn),改進(jìn)后的算法具有良好的圖像描述生成效果。
Inception-Resnet-V2網(wǎng)絡(luò)雖然圖像識(shí)別精度較高,但網(wǎng)絡(luò)參數(shù)、計(jì)算量較大、實(shí)時(shí)性較差。而無(wú)人機(jī)在復(fù)雜環(huán)境下進(jìn)行電力巡檢作業(yè)的過(guò)程中,避障和航向預(yù)測(cè)功能對(duì)圖像識(shí)別的精度、時(shí)效性都有較高的要求。因此,本文引入深度可分離卷積,研究并優(yōu)化了Inception-Resnet-V2網(wǎng)絡(luò),改進(jìn)后的網(wǎng)絡(luò)保證了在對(duì)基桿塔圖像識(shí)別精度基本不變的情況下降低了計(jì)算量。在實(shí)際電力巡檢實(shí)驗(yàn)中,驗(yàn)證了提出的無(wú)人機(jī)航向識(shí)別方法的有效性。
Inception網(wǎng)絡(luò)[7]通過(guò)將稀疏矩陣聚類成相對(duì)密集的子矩陣來(lái)提高計(jì)算性能。使用1×1的卷積把相關(guān)性高、同一空間位置不同通道的特征連接在一起,構(gòu)建出符合Hebbian原理的高效稀疏網(wǎng)絡(luò)結(jié)構(gòu)[8-9]。
結(jié)構(gòu)更深的網(wǎng)絡(luò)往往有更好的表現(xiàn),但普遍存在梯度彌散的問(wèn)題,且網(wǎng)絡(luò)結(jié)構(gòu)的參數(shù)與計(jì)算量較大,消耗計(jì)算成本并不利于模型在集成芯片上的搭載。Google提出在Inception模塊中加入殘差結(jié)構(gòu)的Inception-Resnet-V2網(wǎng)絡(luò)[10],充分利用了Resnet網(wǎng)絡(luò)結(jié)構(gòu)恒等映射的特性,提高了網(wǎng)絡(luò)的精度并解決了網(wǎng)絡(luò)退化和梯度消失的問(wèn)題[11],因此可以拓展成更深的模型。為保證網(wǎng)絡(luò)模型的優(yōu)越性并進(jìn)一步降低網(wǎng)絡(luò)的計(jì)算復(fù)雜度,本文基于可分離卷積核的卷積形式,引用三層Resnet卷積模塊的卷積結(jié)構(gòu),對(duì)Inception-Resnet-V2網(wǎng)絡(luò)結(jié)構(gòu)中Stem、Inception-Resnet-A、Reduction的各網(wǎng)絡(luò)模塊3×3的卷積層進(jìn)行卷積核和卷積結(jié)構(gòu)的改進(jìn)。
當(dāng)網(wǎng)絡(luò)結(jié)構(gòu)中的3×3卷積核進(jìn)行卷積運(yùn)算時(shí),對(duì)應(yīng)圖像區(qū)域內(nèi)的所有通道同時(shí)參與運(yùn)算。深度可分卷積對(duì)不同的輸入通道采用不同的卷積核,通過(guò)先深度卷積后逐點(diǎn)卷積的方法降低了計(jì)算復(fù)雜度[12]。Inception-Resnet-A模塊的部分3×3卷積輸入尺寸為h×w×c,卷積層有k個(gè)3×3卷積核,輸出為h×w×k。計(jì)算量為h×w×k×3×3,參數(shù)量為c×3×3×k。本文將3×3卷積核改進(jìn)為深度可分離卷積核,將普通卷積操作分解為深度卷積和逐點(diǎn)卷積兩個(gè)過(guò)程[13],將Inception-Resnet-V2網(wǎng)絡(luò)結(jié)構(gòu)中3×3卷積層的計(jì)算量壓縮為:
改進(jìn)后的卷積模塊如圖1所示。在可分離卷積核卷積操作之前,使用1×1的卷積核將該卷積層輸入進(jìn)行降維,可分離卷積操作后再次使用1×1的卷積核還原維度,優(yōu)化了時(shí)間復(fù)雜度和空間復(fù)雜度,并進(jìn)一步減少計(jì)算成本、加深網(wǎng)絡(luò)結(jié)構(gòu)。
圖1 改進(jìn)后卷積結(jié)構(gòu)Fig.1 Improved convolution
本文的提出的卷積層計(jì)算量壓縮為:
本文用提出的卷積層代替了Inception-Resnet-V2網(wǎng)絡(luò)中Inception-Resnet-A模塊的3×3卷積層,并在Resnet-A模塊中,通過(guò)添加layer-add,將layer2中改進(jìn)3×3卷積層卷積后的特征進(jìn)行融合,增加圖像特征下的信息量,再進(jìn)行l(wèi)ayer3改進(jìn)3×3卷積層的卷積操作,加深網(wǎng)絡(luò)結(jié)構(gòu)、減小計(jì)算量,從而有利于網(wǎng)絡(luò)模型的識(shí)別效果。
為驗(yàn)證改進(jìn)后的Inception-Resnet-V2網(wǎng)絡(luò)模型的特性,本文選取VGG的Fine-Grain Recognition Datasets數(shù)據(jù)集中的四個(gè)類別進(jìn)行圖像識(shí)別,其中每個(gè)類別由800張圖片組成,驗(yàn)證集每個(gè)類別160張圖片,測(cè)試集每個(gè)類別160張圖片,共計(jì)3 200個(gè)樣本。Inception-Resnet-V2網(wǎng)絡(luò)模型定義的輸入尺寸大小為299×299,故本文將數(shù)據(jù)集中的所有樣本像素大小預(yù)處理為299×299。將預(yù)處理后的數(shù)據(jù)作為輸入數(shù)據(jù),訓(xùn)練改進(jìn)的網(wǎng)絡(luò)模型。訓(xùn)練網(wǎng)絡(luò)策略中關(guān)鍵的參數(shù)設(shè)置及其說(shuō)明,如表1所示。
表1 訓(xùn)練網(wǎng)絡(luò)策略中關(guān)鍵的參數(shù)設(shè)置及其說(shuō)明Table 1 Key parameters and instructions
訓(xùn)練結(jié)果如圖2所示。改進(jìn)后的網(wǎng)絡(luò)在迭代次數(shù)達(dá)到一定數(shù)量時(shí)訓(xùn)練和驗(yàn)證的精度都開始大幅提升,經(jīng)過(guò)多次迭代后網(wǎng)絡(luò)最終收斂。模型在驗(yàn)證集上的損失值逐漸衰減,最后穩(wěn)定在0.69,驗(yàn)證精度最終達(dá)到0.88,訓(xùn)練精度達(dá)到1.0。
圖2 改進(jìn)網(wǎng)絡(luò)模型訓(xùn)練結(jié)果Fig.2 Improved training results
訓(xùn)練后的改進(jìn)Inception-Resnet-V2網(wǎng)絡(luò)模型,在Fine-Grain Recognition Datasets測(cè)試集中的樣本識(shí)別結(jié)果示例如圖3、圖4所示。
圖3 對(duì)房屋樣本數(shù)據(jù)的識(shí)別Fig.3 Recognition of housing sample data
圖4 對(duì)雕塑樣本數(shù)據(jù)的識(shí)別Fig.4 Recognition of sculpture sample data
由圖3可知,改進(jìn)后Inception-Resnet-V2網(wǎng)絡(luò)模型對(duì)測(cè)試集中房屋測(cè)試樣本能夠準(zhǔn)確地預(yù)測(cè)標(biāo)簽值,得分約為0.86。圖4中改進(jìn)的網(wǎng)絡(luò)模型能正確地識(shí)別測(cè)試集中雕塑類別,預(yù)測(cè)得分約為0.99。改進(jìn)后的模型對(duì)測(cè)試集其他樣本類別也成功識(shí)別并獲得了較高的預(yù)測(cè)得分。
為了測(cè)試與分析改進(jìn)網(wǎng)絡(luò)結(jié)構(gòu)與其他網(wǎng)絡(luò)結(jié)構(gòu)的識(shí)別結(jié)果,本文采用準(zhǔn)確率、召回率、F1_score、參數(shù)量、計(jì)算量指標(biāo)對(duì)網(wǎng)絡(luò)模型的識(shí)別性能進(jìn)行分析。其中準(zhǔn)確率為識(shí)別正確的樣本數(shù)與總樣本數(shù)之比,召回率的公式為:
其中,TP表示預(yù)測(cè)為正且判斷正確,F(xiàn)P表示預(yù)測(cè)為負(fù)且判斷錯(cuò)誤。
F1_score是模型精確率和召回率的一種加權(quán)平均數(shù),F(xiàn)1_score的計(jì)算公式為:
其中,F(xiàn)N表示預(yù)測(cè)為負(fù)且判斷錯(cuò)誤。本文選取Alexnet[14]、VGG[15]、Inception-V4、Inception-Resnet-V2、X-ception[16]網(wǎng)絡(luò)與改進(jìn)后的Inception-Resnet-V2網(wǎng)絡(luò)進(jìn)行對(duì)比。在同一數(shù)據(jù)集下,各網(wǎng)絡(luò)模型的性能評(píng)價(jià)結(jié)果如表2所示。
在表2中,改進(jìn)的Inception-Resnet-V2網(wǎng)絡(luò)模型在測(cè)試集中準(zhǔn)確率為92.50%,召回率達(dá)到92.52%,F(xiàn)1_score達(dá)到了92.51%,綜合性能做到了平衡。改進(jìn)后的網(wǎng)絡(luò)模型精度高于Alexnet、VGG等經(jīng)典網(wǎng)絡(luò)模型的精度,與X-ception網(wǎng)絡(luò)模型精度相同,但參數(shù)量與計(jì)算量得到了進(jìn)一步降低且具有其優(yōu)良的網(wǎng)絡(luò)結(jié)構(gòu)。與Inception-Resnet-V2網(wǎng)絡(luò)模型相比,在保證達(dá)到92%以上高精度的同時(shí),只損失了3個(gè)百分點(diǎn)的精度,卻降低了參數(shù)量和計(jì)算量。故對(duì)比本文所選的其他經(jīng)典網(wǎng)絡(luò)模型,改進(jìn)的Inception-Resnet-V2網(wǎng)絡(luò)模型能夠在保證較高精確度與優(yōu)越網(wǎng)絡(luò)結(jié)構(gòu)的同時(shí),減少網(wǎng)絡(luò)模型的參數(shù)量與計(jì)算量,提高時(shí)效性。
表2 改進(jìn)Inception-Resnet-V2與其他網(wǎng)絡(luò)模型的對(duì)比Table 2 Comparison of performance between improved network and other network models
Inception-Resnet-V2網(wǎng)絡(luò)模型的計(jì)算總量為9.06 GFlops,參數(shù)總量為2.752×107。改進(jìn)后的網(wǎng)絡(luò)模型的計(jì)算總量為6.25 GFlops,參數(shù)總量為2.228×107。改進(jìn)后的網(wǎng)絡(luò)模型stem模塊中的參數(shù)總量約為1.2×105,而Inception-Resnet-A、Reduction-A和Reduction-B模塊的參數(shù)總量分別約為3.4×104、5.3×105和1.42×106。在Incepon-Resnet-V2網(wǎng)絡(luò)中,stem模塊中的參數(shù)總量約為6.0×105,Inception-Resnet-A、Reduction-A和Reduction-B模塊的參數(shù)總量分別約為8.8×104、2.9×106和3.54×106。改進(jìn)后網(wǎng)絡(luò)模型和原網(wǎng)絡(luò)各組成模塊的參數(shù)量對(duì)比如圖5所示,改進(jìn)后的網(wǎng)絡(luò)模型在stem層、Inception-Resnet-A以及Reduction-A、B層的參數(shù)量明顯降低。
圖5 改進(jìn)網(wǎng)絡(luò)模型與原網(wǎng)絡(luò)各模塊參數(shù)量的對(duì)比Fig.5 Comparison of parameters between improved network and original network
改進(jìn)后網(wǎng)絡(luò)模型各模塊的卷積計(jì)算量如表3所示。綜合網(wǎng)絡(luò)的識(shí)別精度與計(jì)算復(fù)雜度,改進(jìn)后的網(wǎng)絡(luò)模型與其他網(wǎng)絡(luò)模型相比得到了有效的提升。
表3 改進(jìn)Inception-Resnet-V2網(wǎng)絡(luò)模型各模塊的卷積計(jì)算量Table 3 Convolutional computation for each module of improved Inception-Resnet-V2 network
為直觀地展現(xiàn)改進(jìn)后網(wǎng)絡(luò)模型的優(yōu)越性,繪制了Improved Inception-Resnet-V2網(wǎng)絡(luò) 與VGG網(wǎng)絡(luò)基于測(cè)試集實(shí)驗(yàn)結(jié)果的ROC曲線。該曲線根據(jù)網(wǎng)絡(luò)模型的預(yù)測(cè)結(jié)果,從閾值選取的角度評(píng)價(jià)網(wǎng)絡(luò)模型的泛化性能與精度。ROC曲線的縱軸是真正例率TPR,是指正確預(yù)測(cè)為正例的樣本占所有正例的比例。橫軸是假正例率FPR,是指錯(cuò)誤預(yù)測(cè)為正例的樣本占所有負(fù)例的比例。兩者分別定義為:
ROC曲線將真正例率和假正例率以圖示方法結(jié)合在一起,可準(zhǔn)確反映改進(jìn)Inception-Resnet-V2真正例率和假正例率的關(guān)系,是檢測(cè)網(wǎng)絡(luò)模型準(zhǔn)確性的綜合代表。通過(guò)該曲線可以簡(jiǎn)單、直觀地分析網(wǎng)絡(luò)模型的準(zhǔn)確性。本文將測(cè)試集中各樣本數(shù)據(jù)的預(yù)測(cè)得分值,從小到大依次排列作為閾值,計(jì)算FPR、TPR并繪制了各類別的ROC曲線,如圖6、圖7所示。
由圖6、圖7所示的ROC曲線分析可知,在同一測(cè)試集下,改進(jìn)的Inception-Resnet-V2網(wǎng)絡(luò)對(duì)應(yīng)于測(cè)試集中各類別的ROC曲線,比VGG網(wǎng)絡(luò)對(duì)應(yīng)類別的ROC曲線,更靠近坐標(biāo)系的左上角,這一特性表明了改進(jìn)的Inception-Resnet-V2網(wǎng)絡(luò)比VGG網(wǎng)絡(luò)有更高的準(zhǔn)確性。綜上可知,改進(jìn)后的Inception-Resnet-V2網(wǎng)絡(luò)在參數(shù)量與MACC計(jì)算總量縮減的同時(shí)仍具有較好的識(shí)別效果。
圖6 改進(jìn)的Inception-Resnet-V2的ROC曲線Fig.6 ROC curve of improved Inception-Resnet-V2
圖7 VGG網(wǎng)絡(luò)模型的ROC曲線Fig.7 ROC curve of VGG network model
為驗(yàn)證無(wú)人機(jī)搭載改進(jìn)后網(wǎng)絡(luò)模型進(jìn)行實(shí)際電力巡檢時(shí)航向識(shí)別的效果,本文采用大疆無(wú)人機(jī)M210RTK進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)的操作環(huán)境為64位Windows7操作系統(tǒng)、GTX 1080Ti GPU、Pycharm2018、MagicEXIFv1.08、Visual Studio2017。
首先對(duì)復(fù)雜環(huán)境下的基塔圖像進(jìn)行采集,對(duì)其預(yù)處理并制作數(shù)據(jù)集。數(shù)據(jù)集共有1 600個(gè)樣本,其中包含訓(xùn)練集1 280個(gè)樣本、驗(yàn)證集160個(gè)樣本、測(cè)試集160個(gè)樣本。使用MagicEXIF元數(shù)據(jù)編輯器分析樣本圖像,得到訓(xùn)練集中每個(gè)樣本圖像數(shù)據(jù)標(biāo)題的標(biāo)簽值,從而獲得位置信息。無(wú)人機(jī)航向下行偏移量、左下偏移量、左偏移量、左上偏移量、右下偏移量、右偏移量、右上偏移量、上升偏移量的標(biāo)值分別設(shè)置為0~7。測(cè)試集中左右標(biāo)題的樣本圖像如圖8、圖9所示。
圖8 無(wú)人機(jī)左偏移航向數(shù)據(jù)集樣本Fig.8 Sample of left offset heading dataset
圖9 無(wú)人機(jī)右偏移航向數(shù)據(jù)集樣本Fig.9 Sample of right offset heading dataset
為了直觀地體現(xiàn)出改進(jìn)卷積結(jié)構(gòu)的效果,將改進(jìn)后的卷積層卷積操作后得到的特征圖可視化。圖8、圖9所示的樣本圖像分別被改進(jìn)后Inception-Resnet-V2網(wǎng)絡(luò)的Stem層第一層3×3的卷積層卷積操作后,得到的特征圖如圖10、圖11所示??梢?jiàn)輸出特征圖的紋理、細(xì)節(jié)特征都很清晰,便于后續(xù)深層網(wǎng)絡(luò)的卷積運(yùn)算。
圖10 圖8的特征圖Fig.10 Feature map of Fig.8
圖11 圖9的特征圖Fig.11 Feature map of Fig.9
無(wú)人機(jī)搭載訓(xùn)練后的網(wǎng)絡(luò),在對(duì)有方向標(biāo)簽的圖像進(jìn)行識(shí)別后,輸出的航向預(yù)測(cè)結(jié)果如圖12、圖13所示。其中圖8的測(cè)試樣本實(shí)際方向?yàn)樽笃坪较?,圖12中對(duì)應(yīng)的預(yù)測(cè)結(jié)果標(biāo)簽值為2,航向?yàn)長(zhǎng)eft,預(yù)測(cè)概率約為0.99。圖9中實(shí)際方向是右偏移航向,圖11中對(duì)應(yīng)的預(yù)測(cè)結(jié)果的標(biāo)簽值為5,航向?yàn)镽ight,預(yù)測(cè)概率約為0.99,準(zhǔn)確預(yù)測(cè)了無(wú)人機(jī)的航向。測(cè)試集中其他樣本也具有較高精度的預(yù)測(cè)結(jié)果,可見(jiàn)本文提出的方法能使無(wú)人機(jī)在復(fù)雜環(huán)境下電力巡檢時(shí)高精度的識(shí)別出基桿塔,并且以較高預(yù)測(cè)分?jǐn)?shù)進(jìn)行航向識(shí)別。
圖12 左偏移航向數(shù)據(jù)集樣本的預(yù)測(cè)結(jié)果Fig.12 Prediction results for offset heading dataset sample
圖13 右偏移航向數(shù)據(jù)集樣本的預(yù)測(cè)結(jié)果Fig.13 Prediction results for right offset heading dataset sample
將測(cè)試集的預(yù)測(cè)結(jié)果用混淆矩陣表示,圖像橫軸為航向的預(yù)測(cè)結(jié)果,縱軸為真實(shí)的航向,其中0~7分別表示8個(gè)方向的標(biāo)簽值,分別為垂直下降、左下偏移、左下偏移、左上偏移、右下偏移、右上偏移和垂直上升。在混淆矩陣中,正確的預(yù)測(cè)結(jié)果都在對(duì)角線上,預(yù)測(cè)錯(cuò)誤的數(shù)據(jù)量呈現(xiàn)在對(duì)角線外面。當(dāng)混淆矩陣的預(yù)測(cè)結(jié)果大量集中于混淆矩陣的對(duì)角線時(shí),航向識(shí)別的預(yù)測(cè)結(jié)果較好。
針對(duì)不同的航向,本文共進(jìn)行20次無(wú)人機(jī)實(shí)驗(yàn)。航向預(yù)測(cè)的混淆矩陣如圖14所示,圖中右側(cè)為樣本數(shù)量與混淆矩陣色圖顏色對(duì)應(yīng)示意,樣本最大值20對(duì)應(yīng)圖中最深顏色,樣本最小值0對(duì)應(yīng)圖中最淺顏色。其中,對(duì)下左偏移量、左偏移量、右偏移量、垂直上升量的樣本數(shù)據(jù)進(jìn)行了正確預(yù)測(cè)。對(duì)于垂直下降、左上偏移和右下偏移的樣本數(shù)據(jù),每類中有兩個(gè)樣本數(shù)據(jù)的預(yù)測(cè)是錯(cuò)誤的,左上偏移航向中的一個(gè)樣本數(shù)據(jù)的預(yù)測(cè)是錯(cuò)誤的。
圖14 測(cè)試集的預(yù)測(cè)結(jié)果混淆矩陣Fig.14 Confusion matrix of test set prediction results
對(duì)混淆矩陣進(jìn)行分析可得各航向的精度,如圖15所示。各航向的預(yù)測(cè)準(zhǔn)確率都較高,其中最高預(yù)測(cè)準(zhǔn)確率為100%,最低預(yù)測(cè)準(zhǔn)確率為90%。在實(shí)際飛行實(shí)驗(yàn)中,共對(duì)160幅樣本圖像進(jìn)行預(yù)測(cè),其中正確預(yù)測(cè)了153幅圖像,平均預(yù)測(cè)準(zhǔn)確率為95.63%,召回率為96.31%。
圖15 各航向的預(yù)測(cè)精度Fig.15 Prediction accuracy of each heading
因此,改進(jìn)后的Inception-Resnet-V2網(wǎng)絡(luò)模型在實(shí)際復(fù)雜的環(huán)境下進(jìn)行電力巡檢時(shí),可以高精度地識(shí)別基桿塔并能夠較好地預(yù)測(cè)無(wú)人機(jī)的飛行航向。在實(shí)際應(yīng)用中表明,改進(jìn)的網(wǎng)絡(luò)模型不僅具有Inception優(yōu)秀的網(wǎng)絡(luò)結(jié)構(gòu),而且能夠較好地兼顧航向識(shí)別精度與實(shí)時(shí)性。
本文基于Inception-Resnet-V2網(wǎng)絡(luò),引入深度可分離卷積,對(duì)其結(jié)構(gòu)中Stem層以及各網(wǎng)絡(luò)模塊中3×3卷積層進(jìn)行改進(jìn)。優(yōu)化了Inception-Resnet-V2網(wǎng)絡(luò)結(jié)構(gòu),降低了參數(shù)量與計(jì)算量,在保持網(wǎng)絡(luò)模型對(duì)圖像高精度識(shí)別的同時(shí)提高了運(yùn)行的實(shí)時(shí)性。通過(guò)在標(biāo)準(zhǔn)數(shù)據(jù)集上與其他同類網(wǎng)絡(luò)的性能進(jìn)行對(duì)比,取得了明顯的優(yōu)勢(shì)。在實(shí)際復(fù)雜環(huán)境下電力巡檢的實(shí)驗(yàn)中能夠準(zhǔn)確識(shí)別基桿塔,依據(jù)識(shí)別后的圖像信息還原位置信息從而預(yù)測(cè)出無(wú)人機(jī)航向,預(yù)測(cè)精度高達(dá)95.63%。因此,本文提出的基于改進(jìn)Inception-Resnet-V2網(wǎng)絡(luò)的無(wú)人機(jī)航向識(shí)別方法具有實(shí)際應(yīng)用價(jià)值。