王凱, 王健, 劉剛, 周文青, 何卓陽
(1. 華南理工大學(xué) 電力學(xué)院,廣東 廣州 510640;2. 廣東省輸變電工程有限公司,廣東 廣州 510160)
電力金具作為架空輸電線路不可缺少的一部分,在電力系統(tǒng)中負(fù)責(zé)地線與桿塔、輸電導(dǎo)線與絕緣子、桿塔與絕緣子等電力部件的連接,對系統(tǒng)的安全穩(wěn)定運行起著重要作用[1-2]。然而由于多數(shù)電力金具除了要在環(huán)境惡劣的戶外工作,還要長期承受外部機械負(fù)荷張力和電力系統(tǒng)內(nèi)部的電力負(fù)荷的作用,使得金具上的銷釘容易出現(xiàn)缺失或者松動等缺陷,影響電網(wǎng)的穩(wěn)定運行。
近些年,為了提高對架空輸電線路的巡檢效率,無人機巡檢技術(shù)得到了廣泛的應(yīng)用。針對電網(wǎng)設(shè)備的外在缺陷,無人機攜帶數(shù)據(jù)采集裝置沿著線路走廊飛行獲取大量可見光圖片,人工尋找相應(yīng)缺陷[3-4]。在此過程中,人工標(biāo)注缺陷存在以下局限性:首先,在大數(shù)據(jù)環(huán)境下,即使是富有專業(yè)經(jīng)驗的人員進行標(biāo)注,效率也是十分低下的;其次,銷釘在圖片中所占比例是十分微小的并且單張圖片中可能存在多個銷釘,致使人工標(biāo)注經(jīng)常出現(xiàn)漏檢的情況;最后,由于無人機拍攝角度的原因,松動的銷釘和正常情況下的銷釘是十分相似的,這使得容易出現(xiàn)錯標(biāo)的情形。因此,針對該類缺陷,有必要研究一種準(zhǔn)確而又高效的缺陷智能識別方法。
傳統(tǒng)的電力元件以及缺陷識別方法主要集中于手工特征的設(shè)計,如借助圖像增強、去噪等方法對圖像預(yù)處理后,采用Harr特征、不變矩、彩色空間等特征并結(jié)合支持向量機、級聯(lián)Adaboost等算法實現(xiàn)防振錘、絕緣子等電力元件以及相應(yīng)缺陷的識別[5-7]。這類方法除了需要豐富的專業(yè)知識支撐外,往往只能針對某一特定類別起作用且可擴展性差。近幾年,隨著深度學(xué)習(xí)的迅速發(fā)展,有人提出了采用深度學(xué)習(xí)算法實現(xiàn)對電力部件以及相應(yīng)的缺陷進行識別[8-10],然而這類研究多是集中于絕緣子、防振錘等元件的識別以及與之相關(guān)的絕緣子缺失、自爆等缺陷的識別,對于銷釘級別缺陷的研究卻是少之又少,甚至空白。另外,考慮到深度學(xué)習(xí)中的“單階”檢測算法RetinaNet在識別精度和實時性均要優(yōu)于Faster R-CNN[11],本文提出一種基于RetinaNet的銷釘缺陷智能識別方法;同時,考慮到銷釘松動類樣本的嚴(yán)重不足以及無人機收集該類樣本代價高昂,本文采用人工采集的相關(guān)輔助數(shù)據(jù)對少數(shù)樣本進行補充訓(xùn)練,并討論了相關(guān)輔助數(shù)據(jù)量對閉口銷松動類的平均準(zhǔn)確率(average precision,AP)的影響,結(jié)果表明添加適宜的相關(guān)輔助數(shù)據(jù)量能夠明顯增加檢測模型對少數(shù)類的重視程度。
缺陷識別中最為棘手的問題是如何從大量的候選窗口中挑選出包含缺陷的候選區(qū),迄今為止的目標(biāo)識別算法可以分為兩大類[12]:一類是以Faster R-CNN為代表的“雙階”檢測器;另一類是所謂的“單階”檢測器,如YOLOv1、YOLOv2等。后者在實時性上優(yōu)于前者,但是精度卻沒有“雙階”檢測器那么高。為了提高“單階”檢測器的精度,以損失函數(shù)Focal Loss為核心、特征金字塔網(wǎng)絡(luò)(feature pyramid network,F(xiàn)PN)為主要框架的RetinaNet檢測器應(yīng)運而生。
RetinaNet檢測器由主網(wǎng)絡(luò)和2個具有特定功能的子網(wǎng)絡(luò)復(fù)合而成。其中,主網(wǎng)絡(luò)借助卷積神經(jīng)網(wǎng)絡(luò)計算輸入圖像的特征圖,并且采用FPN結(jié)構(gòu)將頂層特征和低層特征相融合,而與之相連接的2個子網(wǎng)絡(luò)分別對FPN的輸出進行分類和回歸。在FPN出現(xiàn)之前的多數(shù)目標(biāo)識別算法通常使用頂層特征進行預(yù)測,原因在于頂層特征蘊含豐富的語義信息,而低層特征的語義信息遠沒有高層的豐富。然而低層特征的高分辨率能夠較為精確地反映待測目標(biāo)的位置,因此FPN在不同的特征層采用融合后的特征進行獨立地預(yù)測,其結(jié)構(gòu)如圖1所示[13]。
FPN綜合考慮了低分辨率但語義信息豐富的高層特征和語義信息不足但分辨率高的低層特征,采用圖1所示的結(jié)構(gòu)使得各尺度下的特征都有豐富的語義信息。自下而上表示卷積神經(jīng)網(wǎng)絡(luò)的前向過程,在此過程中,部分層不會改變輸入特征圖的大小,于是將這些連續(xù)的不改變特征圖大小的層視為一個階段,每次抽取的特征正是每個階段的最后輸出,從而構(gòu)成了特征金字塔結(jié)構(gòu);自頂向下的過程將分辨率較低的高層特征圖進行2倍的上采樣。上采樣采用的是內(nèi)插值方法,在像素點之間使用合適的插值算法插入新的元素,從而擴大特征圖,確保上采樣的特征圖和下一層的特征圖大小一致;隨后對卷積神經(jīng)網(wǎng)絡(luò)前向過程生成的對應(yīng)層的特征圖進行1×1的卷積操作,將之與經(jīng)過上采樣的特征圖融合,得到具有更加豐富信息的特征圖。
圖1 特征金字塔網(wǎng)絡(luò)架構(gòu) Fig.1 Feature pyramid network architecture
“單階”檢測器的精度偏低歸因于候選區(qū)域的類別不平衡,即圖片中待識別目標(biāo)通常只占整張圖片的小部分,使得早期生成的候選窗口中絕大多數(shù)都屬于負(fù)類(背景),只有極少部分包含前景物。背景類占優(yōu)掩蓋了包含識別對象的候選框的作用,使得訓(xùn)練過程無法充分學(xué)習(xí)到所需要的信息。對于Faster R-CNN,其包含的區(qū)域建議網(wǎng)絡(luò)(region proposal network,RPN)事先對候選區(qū)域進行簡單的二分類,從而屬于背景的候選窗口將會大幅減少,這樣在某種程度上降低了候選區(qū)域的類別不平衡所帶來的影響,但其操作的復(fù)雜性卻放慢了識別速度。
以二分類為例,常用的交叉熵?fù)p失函數(shù)
fCE(pt)=-log(pt).
(1)
其中pt定義為:
(2)
式中:p∈[0,1],表示模型將類別預(yù)測為y=1的概率;y為類別參變量。
為了能夠從包含目標(biāo)的候選區(qū)域?qū)W到更多的信息,文獻[11]提出一種新的損失函數(shù)Focal Loss,在原有的交叉熵?fù)p失函數(shù)的基礎(chǔ)上增加一個權(quán)重控制系數(shù)αt;另外,為了保證檢測器能夠有效區(qū)分難分樣本和易分樣本,增大難分樣本的比重,在實際中,F(xiàn)ocal Loss損失函數(shù)
fFL(pt)=-αt(1-pt)γlog(pt).
(3)
式中γ為調(diào)節(jié)因子。
銷釘作為電力金具不可或缺的部分,使得金具之間的連接更加穩(wěn)固,銷釘?shù)乃蓜由踔寥笔鶗黾与娏ο到y(tǒng)運行風(fēng)險。圖2給出了不同狀態(tài)銷釘?shù)氖纠龍D。在外部因素(如環(huán)境因素)和內(nèi)部因素(如負(fù)荷長期運行)綜合作用下,有少數(shù)的正常狀態(tài)下的銷釘會蛻變?yōu)閳D2中所示的松動狀態(tài),甚至缺失狀態(tài)。在沒有了銷釘保護的情況下,螺栓會進一步出現(xiàn)松動﹝如圖2(b)所示﹞,這一連鎖反應(yīng)嚴(yán)重影響電力系統(tǒng)運行的可靠性。
電力系統(tǒng)絕大部分時間處于正常穩(wěn)定運行狀態(tài),致使無人機巡檢時采集到的絕大多數(shù)的數(shù)據(jù)樣本都是正常樣本,只有小部分樣本存在缺陷;另外,銷釘?shù)乃蓜右约叭笔峭獠繖C械張力和系統(tǒng)內(nèi)部負(fù)荷長期作用的結(jié)果,短時間內(nèi)很難獲取到大量缺陷樣本,從而進一步體現(xiàn)出銷釘缺陷數(shù)據(jù)的稀缺性。實際情況中,無人機巡檢采集到的數(shù)據(jù)正常樣本偏多,銷釘缺失類樣本次之,而松動類數(shù)據(jù)量是非常少的。缺陷數(shù)據(jù)的不足使得各類別數(shù)據(jù)量失衡,而機器學(xué)習(xí)相關(guān)算法通常假定訓(xùn)練用的數(shù)據(jù)中各類包含樣本數(shù)都是均衡的,訓(xùn)練數(shù)據(jù)本身的失衡導(dǎo)致訓(xùn)練出來的模型更加傾向于數(shù)據(jù)量居多的正常類,而“忽視”樣本中數(shù)據(jù)量偏少的銷釘松動類,這樣訓(xùn)練出的模型在測試數(shù)據(jù)上的表現(xiàn)是欠佳的。
圖2 無人機巡檢采集到的銷釘狀態(tài)示例Fig.2 Examples of the status of pin collected by UAV inspection
另外,無人機本身的特性也增加了缺陷識別的難度:如無人機采集數(shù)據(jù)雖然具有較高的分辨率,但銷釘在整張圖片占據(jù)很小的比例[14-17];無人機航拍角度的隨機性使得圖片中的銷釘形態(tài)發(fā)生變化;無人機本身飛行的不穩(wěn)定性影響圖片的清晰度等等。
針對銷釘缺陷識別問題,提高缺陷類AP的意義遠高于提高整體類的,然而缺陷數(shù)據(jù)較少出現(xiàn)、收集代價高昂給該類缺陷的識別帶來了極大困難。倘若采用部分相關(guān)輔助數(shù)據(jù)樣本彌補這一不足,對原有不平衡的數(shù)據(jù)集進行遷移學(xué)習(xí),能夠在某種程度上解決缺陷數(shù)據(jù)稀缺問題。但是,其他領(lǐng)域的數(shù)據(jù)與電力系統(tǒng)領(lǐng)域數(shù)據(jù)之間的差異較大,共享因素偏少,如果直接使用不相關(guān)輔助數(shù)據(jù)極易出現(xiàn)“負(fù)遷移”現(xiàn)象[18-19],并產(chǎn)生副作用。
針對銷釘松動缺陷,參考架空輸電線路實物模型的金具連接方式,在確保主要前景物(金具)一致的前提下,構(gòu)建簡易實物模型;隨后將構(gòu)建的實物模型放置在室外的任意環(huán)境中,人工模擬缺陷并采集相應(yīng)缺陷樣本;最后挑選出符合要求的數(shù)據(jù)構(gòu)建輔助數(shù)據(jù)集,圖3給出了部分試驗用的相關(guān)輔助數(shù)據(jù)樣本。由圖3可知:前景物僅使用了瓷質(zhì)絕緣子、玻璃絕緣子、U型掛環(huán)等金具,構(gòu)造簡單且易于實現(xiàn);另外,由于可以實時模擬出銷釘?shù)母鞣N狀態(tài),并且能保證背景的多樣性,故完成了在短時間內(nèi)獲取大量銷釘缺陷樣本。
圖3 人工采集的輔助數(shù)據(jù)樣本Fig.3 Manually collected auxiliary data
對于一般的數(shù)據(jù)集,準(zhǔn)確率、錯誤率等傳統(tǒng)評價指標(biāo)就能夠?qū)?shù)據(jù)處理方法的性能進行衡量。然而,當(dāng)面對數(shù)據(jù)不平衡的銷釘缺陷識別問題時,以上評價指標(biāo)可能會失效。在正常類別樣本數(shù)占優(yōu)的情況下,倘若將所有樣本預(yù)測為正常類,這樣準(zhǔn)確率就會很高,顯然訓(xùn)練出來的模型毫無用處。相關(guān)研究表明,查準(zhǔn)率P與查全率R曲線(P-R曲線)可以明顯地體現(xiàn)出不平衡數(shù)據(jù)的識別效果[20-21],針對每一類,都會有一條對應(yīng)的P-R曲線,為此,本文采用對數(shù)據(jù)傾斜度十分敏感的P-R曲線作為評價指標(biāo),相關(guān)指標(biāo)可根據(jù)表1數(shù)據(jù)進行定義。
表1 銷釘缺陷識別的三類別混淆矩陣參變量Tab.1 Parameters of three-category confusion matrix for defect identification of pins
以松動類為例,查準(zhǔn)率P和查全率R分別定義如下:
(4)
(5)
P-R曲線即是以R為橫坐標(biāo)、P為縱坐標(biāo)繪制而成的曲線。對于每一條P-R曲線,其與坐標(biāo)軸圍成的面積即為該類別對應(yīng)的AP。同時,采用AP的整體的平均準(zhǔn)確率(mean average precision,MAP)對整體識別效果進行衡量。
實驗在64位Windows操作系統(tǒng)上進行,所用的處理器型號為Intel(R)Xeon(R) CPU E5-2660 v4 @2.00GHz,運行內(nèi)存為128 GB;顯卡型號為NVIDIA Quadro M4000,顯存為8GB;算法均在Keras框架中開展。
針對銷釘缺陷識別問題,數(shù)據(jù)標(biāo)簽包括3類,分別為正常(標(biāo)記為“normal”)、缺失(標(biāo)記為“l(fā)ost”)和松動(標(biāo)記為“l(fā)oose”)。實驗用的數(shù)據(jù)可以劃分為目標(biāo)數(shù)據(jù)集和輔助數(shù)據(jù)集:前者是無人機現(xiàn)場巡檢采集而得,具有較高的分辨率,并且單張圖片可能包括多類標(biāo)簽,另外,待測目標(biāo)在整張圖片中占據(jù)很小的比例;輔助數(shù)據(jù)樣本由人工采集而得。考慮到現(xiàn)實情況中銷釘松動類樣本較少出現(xiàn)、采集代價偏高,為了分析少數(shù)類輔助數(shù)據(jù)的量對測試結(jié)果的影響,本文分多次向訓(xùn)練集添加相同數(shù)量(137張)的松動類輔助數(shù)據(jù)。表2列出了實驗用的數(shù)據(jù)分布狀況,其中,測試集是從目標(biāo)數(shù)據(jù)集中隨機抽取而得,后續(xù)模型性能測試均采用這一測試集。
表2 銷釘缺陷識別試驗用的數(shù)據(jù)分布表Tab.2 Data distribution table for defect identification of pins
為了避免主網(wǎng)絡(luò)初始化的權(quán)重給實驗結(jié)果造成不確定性影響,F(xiàn)PN的主網(wǎng)絡(luò)均采用在ImageNet預(yù)先訓(xùn)練過的ResNet-50,且采用隨機梯度下降算法實現(xiàn)模型參數(shù)的更新。鑒于少數(shù)類(松動類)的正確識別的意義遠超過數(shù)據(jù)占優(yōu)的類別,通過觀測少數(shù)類AP以及MAP完成銷釘缺陷檢測模型參數(shù)的優(yōu)化。為了選取合適的學(xué)習(xí)率,本文以目標(biāo)數(shù)據(jù)集為訓(xùn)練對象,采用學(xué)習(xí)率分別為1×10-2、1×10-3、1×10-4、1×10-5、1×10-6等5個不同的訓(xùn)練模型。其他參數(shù)設(shè)置如下:最大訓(xùn)練輪數(shù)為50,每一輪包含10 000次迭代,且αt=0.25、γ=2。圖4為AP變化曲線。
圖4 不同學(xué)習(xí)率下的AP與訓(xùn)練次數(shù)的關(guān)系曲線Fig.4 Relationship between AP and training times under different learning rates
根據(jù)圖4可知,在銷釘松動類數(shù)據(jù)樣本嚴(yán)重缺乏的情況下,當(dāng)學(xué)習(xí)率設(shè)置為合適的數(shù)值時,適當(dāng)?shù)挠?xùn)練次數(shù)不僅可以提高少數(shù)類的識別率,還可以有效提高總體AP。當(dāng)學(xué)習(xí)率過高或者過低時,即設(shè)置為1×10-2、1×10-6時,模型在訓(xùn)練時越過局部最優(yōu)值以及全局最優(yōu),使得測試精度趨于0;當(dāng)學(xué)習(xí)率為1×10-4時,由圖4可以直觀地看到無論是少數(shù)類AP還是MAP,相對于學(xué)習(xí)率為1×10-3、1×10-5來說總體偏低;而當(dāng)學(xué)習(xí)率設(shè)置為1×10-3時,經(jīng)過前15輪訓(xùn)練的模型,測試精度均要高于1×10-5時的情況,但隨著訓(xùn)練次數(shù)增加,會出現(xiàn)較大的波動,最終無論是少數(shù)類的AP穩(wěn)定值,還是MAP穩(wěn)定值均要低于1×10-5的情況。
損失函數(shù)值作為缺陷識別算法的重要部分,能夠直觀地反映出模型在訓(xùn)練過程中的收斂狀況。如圖5(a)所示,當(dāng)學(xué)習(xí)率為1×10-2時,過大的學(xué)習(xí)率使得損失值趨于無窮大,已無法達到收斂;從圖5(b)可知,當(dāng)學(xué)習(xí)率設(shè)置為1×10-6時,損失函數(shù)值出現(xiàn)異常,經(jīng)過50萬次的迭代,模型仍無法收斂。學(xué)習(xí)率為1×10-3、1×10-4、1×10-5時,損失值隨著模型訓(xùn)練的進行最終穩(wěn)定在較低的值域范圍內(nèi),并且在學(xué)習(xí)率為1×10-3與1×10-5這2種情況下的收斂情況十分接近,在前15輪訓(xùn)練中,收斂速率明顯快于學(xué)習(xí)率為1×10-4的速度。
圖5 不同學(xué)習(xí)率下?lián)p失值的變化曲線Fig.5 Variation curves of loss value under different learning rates
為了驗證本文的相關(guān)輔助數(shù)據(jù)樣本對檢測模型性能的影響,分別使用目標(biāo)數(shù)據(jù)集和混合數(shù)據(jù)集訓(xùn)練模型,隨后使用同一批測試集對經(jīng)過訓(xùn)練的模型進行測試,得到如圖6所示的P-R曲線。
根據(jù)圖6可知:在添加相關(guān)輔助數(shù)據(jù)之前,正常類別數(shù)據(jù)樣本占據(jù)極大優(yōu)勢,而缺陷類別,尤其是銷釘松動類樣本不足,導(dǎo)致檢測模型在訓(xùn)練過程中側(cè)重于學(xué)習(xí)正常類別樣本特征,松動類的特征并沒有得到有效的提取,最終松動類的AP值僅為0.64,而正常類別以及缺失類別的AP分別達到0.80、0.71。圖7給出了類別失衡情況下缺陷類別的部分典型錯分樣本,在類別失衡的情況下,錯分樣本大多集中于少數(shù)類中,它們被錯誤地識別為數(shù)據(jù)占優(yōu)的正常類別。在添加適量的人工采集的相關(guān)輔助數(shù)據(jù)后,盡管輔助數(shù)據(jù)樣本與目標(biāo)數(shù)據(jù)集之間存在一定程度的差異,但其在某種程度上緩解了類別不平衡所造成的“偏移”現(xiàn)象,即在保證正常類別AP變化不大的前提下,大幅度增加了缺陷類AP,其中松動類AP由原先的0.64上升為0.70,缺失類別AP也上升了0.3。
圖6 對經(jīng)過50輪訓(xùn)練的模型進行測試得到的各類別的P-R曲線Fig.6 Various P-R curves of the model tested by 50 rounds of training
圖7 類別失衡情況下識別錯誤的缺陷樣本Fig.7 Misidentified defect samples under category imbalance
為了進一步分析少數(shù)類的相關(guān)輔助數(shù)據(jù)的量對測試結(jié)果的影響,在原先的參數(shù)設(shè)置下,分別向原始目標(biāo)數(shù)據(jù)集添加不同數(shù)量的輔助數(shù)據(jù)樣本進行模型訓(xùn)練,最后使用同一批測試機對每一輪訓(xùn)練后的模型進行測試,得到圖8所示的結(jié)果。
圖8 AP與輔助數(shù)據(jù)樣本數(shù)量的關(guān)系Fig.8 Relationship between AP and numbers of auxiliary data samples
根據(jù)圖8測試結(jié)果可知:添加輔助數(shù)據(jù)后,模型在訓(xùn)練過程中可以學(xué)習(xí)到更多的松動類的特征,對松動類的重視程度有所提高,無論是MAP,還是少數(shù)類的AP,都有明顯的提高。因此,當(dāng)銷釘缺陷數(shù)據(jù)樣本數(shù)量不足以支持深度學(xué)習(xí)缺陷識別訓(xùn)練的情況下,可以通過添加相關(guān)輔助數(shù)據(jù)樣本來提高模型的泛化能力。然而,當(dāng)輔助數(shù)據(jù)樣本數(shù)量達到原先少數(shù)類的5倍時,松動類的AP達到峰值0.80,MAP達到了最大值0.82;如果進一步增加輔助數(shù)據(jù)樣本,鑒于目標(biāo)數(shù)據(jù)集與輔助數(shù)據(jù)集之間存在某種程度的差異,當(dāng)輔助數(shù)據(jù)樣本的數(shù)量達到6倍,甚至6倍以上時,松動類的AP或MAP均有所下降。
為了分析目標(biāo)數(shù)據(jù)集與輔助數(shù)據(jù)樣本之間的差異性,以包含5倍輔助數(shù)據(jù)的訓(xùn)練集(記為A5)和不包含輔助數(shù)據(jù)集的訓(xùn)練集(記為A0)為研究對象,分別對前12輪訓(xùn)練輸出的模型進行測試。對于前者,分別采用A5中只包含少數(shù)類(松動類)的輔助數(shù)據(jù)的測試集(記為T5)以及A5中只包含少數(shù)類的目標(biāo)數(shù)據(jù)集(記為T6)進行測試,后者使用A0中銷釘松動類作為測試集(記為T0)進行測試,輸出圖9所示的AP值變化曲線。
根據(jù)圖9可以看出:由于輔助數(shù)據(jù)集無論是前景物還是背景,其復(fù)雜度均要低于無人機采集到的數(shù)據(jù)樣本。因此,使用訓(xùn)練集A5經(jīng)過1輪的訓(xùn)練后,在T5上就能夠達到0.99的AP;但在T0和T6上AP要到達0.99,卻需要經(jīng)過多輪的訓(xùn)練才行。另外,通過圖9中的曲線走勢可以直觀地發(fā)現(xiàn)模型在T0上的測試結(jié)果與在T5測試輸出的曲線走勢大致相同,并且后者曲線位于前者曲線上方,表明了輔助數(shù)據(jù)可以在某種程度上增強模型的泛化能力,但輔助數(shù)據(jù)樣本與目標(biāo)數(shù)據(jù)集之間的差異性對模型測試精度的影響也是不容忽視的。
圖9 不同測試集下的AP值變化曲線Fig.9 AP value curves under different test sets
考慮到人工標(biāo)注電力金具上銷釘?shù)某R娙毕輹r耗時耗力,并且經(jīng)常出現(xiàn)漏檢的情況,本文首先采用深度學(xué)習(xí)RetinaNet算法實現(xiàn)銷釘缺陷的智能識別,并分析了學(xué)習(xí)率對實驗結(jié)果的影響,為今后缺陷智能識別技術(shù)提供了理論依據(jù);其次,針對銷釘缺陷識別中缺陷樣本不足導(dǎo)致的類別失衡問題,分析了類別不平衡給缺陷識別造成的影響,并得出結(jié)論:類別失衡致使大量松動類銷釘被錯分為數(shù)據(jù)量占優(yōu)的正常類,設(shè)置合適的學(xué)習(xí)率以及迭代次數(shù),不僅可以加快模型訓(xùn)練時的收斂速度,還可以在某種程度上緩解數(shù)據(jù)樣本不足帶來的不利影響,提高少數(shù)類的AP。另外,考慮到現(xiàn)實情況中銷釘缺陷樣本出現(xiàn)較少和采集代價高,本文提出了一種簡單易行的相關(guān)輔助數(shù)據(jù)樣本的采集方法,形成輔助數(shù)據(jù)樣本庫,為后續(xù)研究打下堅實基礎(chǔ);最后,考慮到人工采集到的輔助數(shù)據(jù)樣本與無人機采集到的目標(biāo)數(shù)據(jù)之間的差異,對相關(guān)輔助數(shù)據(jù)以及目標(biāo)數(shù)據(jù)和輔助數(shù)據(jù)之間的差異進行了量化分析,結(jié)果表明對于少數(shù)類樣本數(shù)量,添加適量的輔助數(shù)據(jù)有利于提高檢測模型的泛化能力,但當(dāng)輔助數(shù)據(jù)遠遠超過目標(biāo)數(shù)據(jù)數(shù)量時,輔助數(shù)據(jù)中的冗余數(shù)據(jù)使得兩者間的差異明顯放大,致使檢測模型的精度反而有所下降,不利于模型訓(xùn)練的開展。
本文雖然得出了AP與輔助數(shù)據(jù)樣本數(shù)量之間的數(shù)據(jù)關(guān)系,但對造成這種結(jié)果的原因仍缺乏深入分析;同時,本文只是在數(shù)據(jù)層面展開研究,而在算法層面并未提出相應(yīng)改進策略。因此,這些問題均可以作為后續(xù)的研究內(nèi)容。