国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

變電站多尺度異常入侵目標輕量化檢測方法

2024-09-19 00:00:00潘磊趙枳晴傅強鄭遠田俊
無線電工程 2024年6期

摘 要:智能電網(wǎng)的建設思路決定了遠郊變電站異常入侵監(jiān)測的無人化趨勢,促進了變電站異常入侵智能檢測方法的快速發(fā)展?,F(xiàn)階段尚未擁有該場景下異常入侵目標數(shù)據(jù)集,且現(xiàn)有的目標檢測方法也未針對變電站邊緣計算端進行輕量化優(yōu)化設計,不適用于需要全天候?qū)崟r監(jiān)測的變電站邊緣設備。針對上述問題,從實際應用需求出發(fā),構建變電站異常入侵目標數(shù)據(jù)集(Dataset for Anomaly Invasion Targets in Substations,SAITD),基于YOLOv5s 模型提出適用于變電站邊緣檢測設備的輕量化異常入侵目標檢測網(wǎng)絡YOLOv5-Substation。添加微小尺度目標特征提取層與上采樣輕量化算子CARAFE,在擴大感受野的同時,充分保留特征圖中多尺度目標的語義信息,從架構端提高原有模型的檢測精度。基于知識蒸餾模型,使用網(wǎng)絡剪枝(Network-slimming) 策略對原有模型進行輕量化改進,在保證原模型檢測精度的同時,加速模型推理。仿真實驗表明,輕量化后的邊緣端計算模型精度相較于YOLOv5s 提高了3. 3% ,推理速度提升了41. 9% ,可為智能電網(wǎng)的全速運行提供強有力的數(shù)據(jù)基礎、技術支撐與安全保障。

關鍵詞:異常入侵目標檢測;網(wǎng)絡剪枝;知識蒸餾;邊緣計算平臺;輕量化模型

中圖分類號:TP391. 4 文獻標志碼:A 開放科學(資源服務)標識碼(OSID):

文章編號:1003-3106(2024)06-1584-11

0 引言

我國“十四五”規(guī)劃明確提出建設智能電網(wǎng)[1],無人值守變電站在構建智能電網(wǎng)中起到了至關重要的作用。無人值守變電站多建于距離城市較遠的野外環(huán)境中,因此常有各類動物入侵變電站導致變電站設備嚴重故障甚至發(fā)生火災,極大地影響了社會穩(wěn)定和經(jīng)濟發(fā)展。伴隨視覺監(jiān)控系統(tǒng)的廣泛應用,利用變電站內(nèi)安裝的攝像頭,加載異常入侵目標檢測算法,對其進行全天候智能化監(jiān)測是大勢所趨[2]。然而,目前尚未擁有針對變電站場景下的完整異常入侵目標數(shù)據(jù)庫,且現(xiàn)使用的目標檢測算法模型也未針對此場景進行輕量化改進設計,并不適合部署在對檢測速度要求極高的變電站邊緣檢測設備上。

現(xiàn)階段的異常入侵目標檢測方法可分為傳統(tǒng)檢測方法與基于深度學習的異常入侵目標檢測方法。傳統(tǒng)的異常入侵目標檢測方法一般采用背景模板與圖像對比來進行異常目標檢測。Stauffer 等[3]提出了高斯混合模型來檢測前景目標,但高斯分布并不能充分的概括表達背景特征,限制了該算法的使用場景和檢測精度。Lin 等[4]提出了一種基于特征匹配的局部運動穩(wěn)定算法減少檢測前景中由樹木和花草引起的誤報,但本質(zhì)上仍然依賴于手工設計的特征,在復雜環(huán)境下依然會存在較多誤檢。傳統(tǒng)檢測方法計算復雜度通常較低,檢測速度較快,無需大量先驗信息和監(jiān)督,但易受光影變化、風吹草動等環(huán)境噪聲的干擾。遂開始研究基于深度學習的異常入侵目標檢測方法。Lim 等[5]提出了一種基于多尺度編解碼網(wǎng)絡的FgSegNet 模型,但這種方法時常漏檢較小尺寸的異常入侵目標。Braham 等[6]提出了一種基于背景補丁的訓練方式,可以在同一段訓練視頻數(shù)據(jù)中獲得良好的檢測效果,但由于數(shù)據(jù)高度冗余計算量過大,無法實時檢測異常入侵目標。以上提及的基于機器學習的異常入侵目標檢測方法和基于深度學習的檢測方法,在變電站這一特殊場景下均無法較好地兼顧模型輕量化與檢測準確率。

目前常見的異常入侵目標檢測與識別技術都集中在主機平臺上,伴隨著移動互聯(lián)網(wǎng)的崛起和邊緣計算的發(fā)展,許多研究者結合邊緣計算,開始研究移動設備上的目標檢測技術。Chen 等[7] 開發(fā)了Glimpse 系統(tǒng)通過卸載部分計算任務在手機上執(zhí)行目標檢測任務。Liu 等[8]等在邊緣計算協(xié)助下為增強現(xiàn)實系統(tǒng)設計了目標檢測系統(tǒng)。Ren 等[9]提出了一種分布式的邊緣計算場景下的目標檢測解決方案。由于在移動設備執(zhí)行高性能目標檢測算法有著極為廣闊的發(fā)展前景,大量研究者投身于此。但是這些研究很少能在工業(yè)場景下實現(xiàn)落地,并且在變電站場景下的相關應用更是稀缺,基本沒有利用邊緣計算平臺針對此應用場景開展異常入侵目標檢測與識別研究,因此這個領域整體仍處于研究的早期階段。

現(xiàn)有的異常入侵目標數(shù)據(jù)集,大部分是針對公路、鐵路或軌道等場景建立異常入侵目標數(shù)據(jù)集,例如王瑞等[10]針對鐵路周界異常入侵目標泥石流、落石等進行研究。郭保青等[11]細化鐵路異常入侵目標分類,針對鐵路內(nèi)部的行人進行研究。何文玉等[12]將研究重心放在軌道上的異常入侵目標,如塑料瓶、行人、自行車和汽車等。然而,通過實地考察,可能會對變電站產(chǎn)生安全隱患的異常入侵目標主要是尺寸相差較大的鳥、貓、狗、人、蛇、鼠和松鼠等。不同的應用場景、不同異常入侵目標類別與不同于常見數(shù)據(jù)集的目標尺度均無法對變電站場景下的異常入侵目標檢測提供助力。

針對上述問題,本文以YOLOv5s 模型為基礎,首先引入微小尺度目標特征提取層與上采樣輕量化算子CARAFE,充分利用特征圖中多尺度目標的語義信息,從架構端提高原有模型的檢測精度;其次,使用網(wǎng)絡剪枝(Networkslimming)策略和知識蒸餾對原有模型進行輕量化改進,在保證原模型檢測精度的同時加速模型推理,滿足變電站場景下異常入侵目標實時檢測需求。

1 基于YOLOv5s 改進的多尺度異常入侵目標輕量化檢測方法

YOLOv5 目標檢測模型由于較高的檢測精度和強大的泛化能力,備受工業(yè)界青睞。根據(jù)應用場景和應用需求的不同,YOLOv5 共有5 種不同大小的網(wǎng)絡模型供以選擇,從小到大分別是YOLOv5n、YOLOv5s、YOLOv5m、YOLOv5L、YOLOv5XL。每個版本的模型結構均一致,唯一區(qū)別在于網(wǎng)絡的深度和寬度不盡相同。鑒于YOLOv5s 在模型檢測性能和模型計算量兩方面較為均衡,本文選擇YOLOv5s作為應用于變電站場景下實時檢測的基礎模型。在此基礎上不斷優(yōu)化改進,獲得輕量化的網(wǎng)絡模型,便于部署在邊緣計算平臺上進行實時快速準確檢測。

多尺度異常入侵目標輕量化檢測方法框架如圖1 所示。首先,在模型頸部添加160 pixel ×160 pixel 的特征提取層,增加的檢測頭用于檢測微小尺度異常入侵目標,再結合YOLOv5s 原有大、中、?。?種尺度檢測頭,實現(xiàn)多尺度異常入侵目標檢測;其次,引入CARAFE 上采樣輕量化算子替換YOLOv5s中原有的最近鄰上采樣,在不引入過多參數(shù)量前提下,擴大感受野,充分利用多尺度特征圖中原本被忽略的豐富語義信息;最后,使用Network-slimming 方法與知識蒸餾對改進后的網(wǎng)絡模型進行剪枝壓縮和蒸餾,對于多尺度異常入侵目標,在保證了較高檢測精度的同時有效地降低了網(wǎng)絡參數(shù)量和計算量。

1. 1 多尺度特征提取層

YOLOv5s 網(wǎng)絡模型檢測頭部分本身涵蓋3 個不同尺度的目標檢測頭。假設圖片輸入尺寸為640 pixel×640 pixel,則頸部提取出的淺層特征圖尺寸為80 pixel×80 pixel,其包含比較多的淺層級信息,適用于檢測小目標;尺寸為20 pixel×20 pixel 的深層特征圖,容納了更豐富的深層次信息,例如環(huán)境信息、外貌特征等,適用于檢測大目標;而尺寸介于二者之間的40 pixel×40 pixel 特征圖,則適合用于檢測中等大小的目標。由于變電站實際場景中常出現(xiàn)尺寸差異較大的異常入侵目標,而目前已有的目標檢測方法時常漏檢較小尺寸的目標。因此,修改網(wǎng)絡中的特征提取層,在網(wǎng)絡模型的頸部連續(xù)3 次下采樣,使得底層特征圖放大至160 pixel×160 pixel,含有更多且更豐富的底層特征信息。在添加小尺度特征提取層的同時,也在檢測頭部分添加對應小尺寸檢測頭,如圖2 所示。

新添加的小尺寸檢測頭對于微小目標會更加敏感,需重新分配錨框來解決小尺度目標漏檢問題。YOLOv5s 初始錨框大小的設置是基于MS COCO 數(shù)據(jù)集目標尺寸預設。在訓練時,模型會基于初始錨框輸出預測框數(shù)值,再將其與真實框數(shù)值相減后,反向更新,以此不停迭代網(wǎng)絡參數(shù)。由于變電站異常入侵目標與COCO 數(shù)據(jù)集目標尺寸差異較大,本算法將關閉YOLOv5s 的自動計算錨框功能,采用K 均值(K-means)聚類方法重新獲取更加適配于變電站異常入侵目標尺寸的錨框,使改進后的網(wǎng)絡模型對于不同尺度的異常入侵目標檢測效果更佳。錨框大小分配如表1 所示。

1. 2 輕量化上采樣算子CARAFE

YOLOv5s 采用最直接的上采樣方法———最近鄰插值,也稱為零階插值,其核心思想是使得圖像變換后,某像素的灰度值與其距離最近的輸入像素灰度值相同。這種上采樣方法僅以像素點的空間位置作為決定上采樣核的唯一元素,完全忽略特征圖中豐富的語義信息,感受野也被嚴重限制在1×1 的范圍內(nèi)?;谏鲜鲈?,引入Wang 等[13]提出的CA-RAFE 上采樣算子,在不引入過多參數(shù)量和計算量的前提下,帶來較大的感受野,同時充分利用各層次特征圖中的語義信息進行上采樣。CARAFE 由上采樣核預測模塊和特征重組模塊兩部分組成。假設給定上采樣倍率為σ(設σ 為整數(shù)),輸入特征圖χ 尺寸為H×W×C,CARAFE 將產(chǎn)生尺寸為σH×σW×C 的新特征圖。對于χ′中的任何目標位置l′= (i′,j′),在輸入特征圖χ 中都有與其對應的源位置l = (i,j),其中i 與j 的關系如式(1)和式(2)所示:

i = |i′/ σ| , (1)

j = |j′/ σ |。(2)

N = (χl,k)表示在χ 中以l 為中心的k×k 范圍的鄰域。

CARAFE 上采樣算子示意如圖3 所示。第一步,上采樣核預測模塊Ψ 基于χl 的鄰域為每個位置預測重組核wl′,如式(3)所示;第二步,特征重組模塊Φ 利用上一步預測出的核wl′ 重組特征,輸出特征圖χ′,如式(4)所示:

wl′ = Ψ(N(χl,kencoder )), (3)

χ′l′ = Φ(N(χl,kup ),wl′ ), (4)

式中:kup 表示內(nèi)核的尺寸,kencoder 表示內(nèi)容編碼器中卷積層內(nèi)核的尺寸。

上采樣核預測模塊負責以內(nèi)容感知的方式生成重組內(nèi)核,主要由通道壓縮模塊、內(nèi)容編碼器和歸一化模塊3 個子模塊組成。首先是通道壓縮模塊,為減少計算量,H×W×C 的特征圖會經(jīng)過通道壓縮變?yōu)椋取粒住粒茫?。其次是內(nèi)容編碼器將壓縮的特征圖作為輸入,使用內(nèi)核大小為kencoder 的卷積層在輸入特征的內(nèi)容基礎上預測新上采樣核。kencoder 的大小與感受野的大小呈正相關,越大的kencoder 可以利用越大范圍內(nèi)的上下文信息。但是,模型整體的計算復雜度也會伴隨kencoder 的增大而增加。經(jīng)過實驗證明,當kup = 3,kencoder = 1 時,模型在性能與計算量之間取得了一個較好的折衷。最后,將通道維在空間維展開,得到σH×σW ×k2up 的上采樣核然后利用歸一化指數(shù)函數(shù)將其進行歸一化處理,使得卷積核權重和為1。在特征重組模塊中,將輸出特征圖中的每個像素都映射回初始輸入的特征圖中,取出以l =(i,j)為中心點的對應N = (χl,kup )區(qū)域,并與在上采樣核預測模塊中得到的預測該像素點的上采樣核wl′作點積操作,加強了特征圖的語義信息,如式(5)所示,最后得到輸出為σH ×σW ×C 的特征圖χ′。

將CARAFE 上采樣算子替換原有的最近鄰上采樣算子后,網(wǎng)絡模型對于圖像特征提取和融合的能力得到了一定的提升,有效地保留了多尺度異常入侵目標的特征信息,同時也并未引入過多的計算量,使融合后的多尺度特征具有了更為豐富的表達能力。整體優(yōu)化改進后的網(wǎng)絡結構如圖4 所示。

1. 3 Network-slimming 策略

添加了新的特征提取層和CARAFE 上采樣算子的網(wǎng)絡模型在訓練好后,仍然存在大量冗余的參數(shù),因此無法移植部署至邊緣計算平臺上,實現(xiàn)實時檢測異常入侵目標的功能,如何對改進后的模型剪枝是輕量化模型的關鍵所在。本算法采用Network-slimming 策略[14]實施剪枝,由于每個尺度參數(shù)與卷積通道是一一映射的,因此,批歸一化(Batch Nor-malization,BN)使用比例因子對歸一化后的特征通道進行整體縮放,而縮放范圍在一定程度上反映了通道的重要性,可以根據(jù)比例因子的絕對值對通道重要性進行評估,將重要性相對較低的通道進行剪枝,從而減少網(wǎng)絡參數(shù)量,獲得一個更加緊湊的網(wǎng)絡模型,圖5 展示了模型參數(shù)剪枝策略的基本流程。設zin 與zout 分別表示BN 層的輸入和輸出,B 表示當前的最小批,BN 層將執(zhí)行以下變換:

式中:μB 和σB 表示B 的平均值和標準偏差值,γ 表示每個通道的比例因子,β 表示可訓練的仿射變換參數(shù)。通過式(7)可以看出每個通道的zout 與比例因子γ 呈正相關。

在網(wǎng)絡中BN 層的比例因子都具備一定的絕對值大小,這意味著每個通道都具有不可忽略的重要性,因此在稀疏訓練中對尺度參數(shù)添加L1 正則化,稀疏化部分通道。因此,剪枝流程整體為首先使用每個通道的比例因子γ 乘以該通道的輸出;其次,聯(lián)合訓練網(wǎng)絡權重,并為通道添加稀疏正則化;最后,剪去比例因子較小的,貢獻較少,并微調(diào)剪枝后的網(wǎng)絡,損失函數(shù)由下式給出:

式中:(x,y)表示訓練輸入和執(zhí)行目標,W 表示可訓練的權重,第一個求和項表示卷積網(wǎng)絡的正常訓練損失,g(·)表示計算L1 范數(shù)對比例因子的損失。

本文采用Fang 等[15]提出的Torch-Pruning 工具,一種通用的結構化剪枝庫,可快速實現(xiàn)Network-slimming 策略,降低模型推理成本。當網(wǎng)絡模型通過一次完整的稀疏化訓練、剪枝、微調(diào)后,還可以多次遍歷重復該流程,如圖6 所示,以此獲得更為緊湊的模型,運行占用內(nèi)存和計算操作也會相應地大大減少。

1. 4 知識蒸餾微調(diào)

經(jīng)過剪枝后的模型雖然網(wǎng)絡參數(shù)量和計算量都大大減少,但是檢測精度劣化是一個難以避免的情況。為了克服此困難,本小節(jié)將知識蒸餾(Knowledgedistillation)[16]與模型微調(diào)有機充分結合,盡可能消除網(wǎng)絡模型剪枝后所帶來的負面影響。知識蒸餾使用教師-學生訓練模式,由完成預訓練的大型教師模型對小型學生模型進行知識蒸餾,以輕微的性能損失為代價,將非常復雜的教師模型中的知識完全遷移到學生模型中,不但學習了教師模型的泛化能力,也獲得了近似于教師模型的性能。其中,蒸餾損失函數(shù)式(9)將計算教師模型與學生模型預測結果的差異:

L = δLhard + (1 - δ)Lsoft, (9)

式中:Lhard 為使用真實值訓練輸出的硬樣本損失函數(shù),Lsoft 為教師模型預測的軟樣本損失函數(shù),δ 為平衡軟、硬樣本二者損失函數(shù)的參數(shù)。

圖7 全面展示了本文網(wǎng)絡模型知識蒸餾過程。教師模型采YOLOv5XL 網(wǎng)絡,是YOLOv5 系列中性能最好、模型參數(shù)最大的網(wǎng)絡,學生模型則使用改進并剪枝后的YOLOv5s 模型。

2 實驗數(shù)據(jù)集及評估指標

2. 1 變電站異常入侵目標數(shù)據(jù)集

現(xiàn)有的異常入侵目標數(shù)據(jù)集,均不適用于變電站場景下的訓練與測試,理由有以下3 點:

(1)獨特應用場景

具有實際應用場景的數(shù)據(jù)集是網(wǎng)絡模型訓練測試的關鍵,而目前現(xiàn)有的異常入侵目標數(shù)據(jù)集并沒有針對變電站這一特殊場景建立。

(2)獨特異常入侵目標

常見異常入侵目標數(shù)據(jù)集多數(shù)針對鐵路或軌道中的泥石流、落石、行人、汽車和自行車等異常入侵目標建立。然而本文所提出的數(shù)據(jù)庫是針對變電站場景下專有的異常入侵目標:鳥、貓、狗、人、松鼠、鼠和蛇,與現(xiàn)有的異常入侵數(shù)據(jù)集中的類別并無關聯(lián)。

(3)獨特異常入侵目標尺度

經(jīng)過實地勘探發(fā)現(xiàn),變電站異常入侵目標的尺寸相較于鐵路場景下的入侵目標尺寸差距較大,如圖8 所示。

由于變電站場景下的異常入侵檢測目標類別和尺寸均與普通異常入侵目標差異較大,并且檢測場景也完全不同,因此,現(xiàn)有的異常入侵目標數(shù)據(jù)集不能用于變電站的異常入侵檢測。本文在變電站實際場景下收集數(shù)據(jù)建立了一個變電站異常入侵目標數(shù)據(jù)集(Dataset for Anomaly Invasion Targets in Substa-tions,SAITD),以保證后續(xù)實驗研究結果具有較高的可靠性。

SAITD 通過在變電站實際場景下安裝攝像頭拍攝的真實視頻,通過Potplayer 軟件跳幀剪成共2 310 張圖片,每張圖片尺寸為640 pixel×640 pixel,共涵蓋7 類目標,分別為鳥(bird)、狗(dog)、貓(cat)、人(person)、蛇(snake)、松鼠(squirrel)和鼠(mouse)。異常入侵目標類別及對應數(shù)量如表2所示。

按照8 ∶ 1 ∶ 1 的比例將SAITD 劃分為訓練集、驗證集和測試集。

2. 2 性能評價指標

由于改進后的算法可根據(jù)需要實地部署在變電站場景中,應從檢測準確度、模型復雜度、計算量和檢測實時性等方面評估算法性能。因此,本實驗采用交并比閾值為0. 5 的平均精度均值(meanAverage Precision,mAP)、單張圖片推理時間、模型計算量(GFLOPs)和模型參數(shù)量(Parameters)等性能評價指標從多維度評估算法。

3 實驗及結果分析

3. 1 實驗環(huán)境

本算法在服務器上運行訓練,在英偉達JestonNano 開發(fā)板上部署測試,具體如圖9 所示。英偉達Jeston Nano 操作系統(tǒng)為Ubuntu 20. 04,GPU 為Max-well2. 0,網(wǎng)絡模型是基于PyTorch1. 11. 0 版本深度學習框架進行搭建,CUDA 版本為11. 6,Python 語言版本為3. 7。

3. 2 模塊對比實驗分析

為了驗證改進模型算法的可行性和有效性,針對改進模塊和知識蒸餾進行橫向?qū)Ρ葘嶒?,在保持模型其余部分不變的基礎之上,對相同位置不同改進點或不同教師模型進行對比實驗。所有實驗均在YOLOv5-6. 0 版本基礎上進行改進,迭代次數(shù)為300。

3. 2. 1 CARAFE 中kup 與kencoder 取值對比

由于內(nèi)容編碼器需要較大的kencoder ×kencoder 感受野來利用更大范圍內(nèi)的上下文信息預測上采樣核wl′,所以kup 的大小需要對應增加。但是,模型整體的計算復雜度也會伴隨kencoder 的增大而增加。

為了使得模型能夠兼顧更快的檢測速度和較高的檢測精度,針對kencoder 和kup 的不同取值進行模型性能對比。設定一般場景下:kencoder = kup -2。實驗結果如表3 所示,模型計算量和參數(shù)量隨著kencoder 的增大而逐漸增加,當kencoder = 1,kup = 3 時,模型能在保證較高mAP 的情況下,獲得較少的參數(shù)量和計算量開銷,更有利于輕量化模型的構建和部署。

3. 2. 2 不同上采樣算子對比分析

將CARAFE 上采樣算子替代模型原有的最近鄰插值法,并同時與雙線性插值法(Bilinear Interpola-tion)轉(zhuǎn)置卷積法(convTranspose2d)這2 種上采樣方法進行對比,實驗結果如表4 所示。可以看出,CA-RAFE 上采樣算子相較于其余上采樣方法對于改進后的模型貢獻更大,在計算量與參數(shù)量增加不多的前提下,檢測精度提升最多。引入的CARAFE 上采樣算子可以充分利用不同尺寸特征圖中的語義信息,擴大感受野,使小尺寸異常入侵目標的特征更為明顯,位置信息更加清晰,能夠更好地融合多尺度特征。

3. 2. 3 知識蒸餾對比分析

為了驗證使用YOLOv5XL 模型作為教師模型的有效性,針對知識蒸餾微調(diào)模型中使用不同的教師模型進行實驗對比分析。分別使用YOLOv5L、YOLOv7 兩種中大型網(wǎng)絡模型作為知識蒸餾中的教師模型,實驗結果如圖10 所示。使用YOLOv5XL作為教師模型對改進且剪枝后的網(wǎng)絡模型進行蒸餾,模型計算量下降了32. 08% ,檢測精度提升了1. 8% ,證明該教師模型可使學生模型在保障模型復雜度較低的前提下,獲得更好的檢測性能。

3. 3 消融實驗分析

為了驗證模型改進的有效性,本節(jié)對模型改進處在SAITD 上進行消融實驗。實驗結果如表5 所示,YOLOv5s 加入新的特征提取層后,對于小尺度異常入侵目標漏檢的情況有明顯改善,相較于基準模型平均檢測精度提升了1. 37% ,相應的參數(shù)量和計算量都有一定的增加。在此基礎上引入了CARAFE 算子后,模型參數(shù)量明顯增多,檢測精度提升了2. 2% 。使用Network-slimming 策略對改進后的模型進行剪枝,由圖11 可說明,參數(shù)量直線下降了約49. 2% ,證明剪枝策略效果較好,但會損失一定的檢測精度作為剪枝壓縮模型的代價。使用知識蒸餾微調(diào)模型后,不但保持了較低的參數(shù)量和計算量,還恢復了一定的檢測精度。實驗證明,所提改進模塊在SAITD 上展示的性能均有一定幅度的提升,YOLOv5-Substation 在保證較高檢測準確度時,也具有較快的檢測速度,實現(xiàn)了輕量化實時檢測異常入侵目標的功能。

3. 4 模型對比實驗分析

使用YOLOv5n、YOLOv7[17]等5 款主流模型與YOLOv5-Substation 在SAITD 上進行對比實驗。分別從mAP、模型計算量、模型參數(shù)量和單張圖片推理時間4 個維度來評估6 個模型的性能。實驗數(shù)據(jù)結果如表6 和圖12 所示,可視化結果如圖13 所示。YOLOv5n 雖然是6 種網(wǎng)絡模型中最輕量、推理時間最快的模型,但是檢測精度卻非常不理想,出現(xiàn)漏檢場景里出現(xiàn)的小尺寸異常入侵目標的情況。YOLOv5L、YOLOv5XL、YOLOv7 作為中大型模型,相比于輕量化模型,中大型模型的檢測精度展示出了較高標準,但由于模型整體計算開銷和占用內(nèi)存較大,并不適合部署于邊緣計算平臺上。改進后的YOLOv5Substation 極大地改善了其余模型漏檢較小尺寸異常入侵目標的情況,相比于YOLOv5s,有效提高了多尺度目標檢測精度,減少了近26% 計算開銷,擁有了更為輕量化的模型參數(shù),能夠滿足無人值守變電站下實時檢測的需求。

4 結束語

本文針對無人值守變電站場景下異常入侵目標檢測方法無法兼顧檢測精度與實時性能的問題,從實際應用需求出發(fā),基于YOLOv5s 模型提出適用于變電站邊緣檢測設備的輕量化異常目標檢測網(wǎng)絡YOLOv5-Substation。有效緩解了小尺度目標漏檢問題,在保證模型對于多尺度目標較高檢測精度的同時,加速模型推理,使得輕量化后的邊緣端計算模型推理速度相較于原有YOLOv5s 提升了41. 9% ,SAITD 的建立也為后續(xù)研究變電站異常入侵目標提供了強有力的數(shù)據(jù)支撐,為智能電網(wǎng)的建設提供了切實可行的方法。

參考文獻

[1] 新華社. 中華人民共和國國民經(jīng)濟和社會發(fā)展第十四個五年規(guī)劃和2035 年遠景目標綱要[EB / OL ].(2021-03-13)[2023-08-27]. https:∥www. gov. cn /xinwen / 2021-03 / 13 / content_5592681. htm.

[2] TANG W J,CHEN H G. Research on IntelligentSubstation Monitoring by Image Recognition Method[J].International Journal of Emerging Electric Power Systems,2021,22(1):1-7.

[3] STAUFFER C,GRIMSON W E L. Adaptive BackgroundMixture Models for Realtime Tracking[C]∥1999 IEEEComputer Society Conference on Computer Vision andPattern Recognition. Fort Collins:IEEE,1999:246-252.

[4] LIN Y W,TONG Y,CAO Y,et al. VisualattentionbasedBackground Modeling for Detecting Infrequently MovingObjects[J]. IEEE Transactions on Circuits and Systemsfor Video Technology,2017,27(6):1208-1221.

[5] LIM L A,KELES H Y. Foreground Segmentation Using aTriplet Convolutional Neural Network for Multiscale Feature Encoding [EB / OL]. (2018 - 01 - 07)[2023 - 08 -27]. https:∥arxiv. org / abs / 1801. 02225.

[6] BRAHAM M,DROOGENBROECK M V. Deep BackgroundSubtraction with Scenespecific Convolutional Neural Networks[C]∥2016 International Conference on Systems,Signals and Image Processing. Bratislava:IEEE,2016:1-4.

[7] CHEN T Y H,RAVINDRANATH L,DENG S,et al.GLIMPSE:Continuous,Realtime Object Recognition onMobile Devices [C ] ∥ 13th ACM Conference onEmbedded Networked Sensor Systems. Seoul:ACM,2015:155-168.

[8] LIU L Y,LI H Y,GRUTESER M. Edge Assisted Realtime Object Detection for Mobile Augmented Reality[C]∥The 25th Annual International Conference on Mobile Computing and Networking. Los Cabos:ACM,2019:1-16.

[9] REN J,GUO Y D,ZHANG D Y,et al. Distributed and Efficient Object in Edge Computing:Challenges andSolutions[J]. IEEE Network,2018,32(6):137-143.

[10] 王瑞,李霄峰,史天運,等. 基于視頻深度學習的鐵路周界入侵檢測算法研究[J]. 交通運輸系統(tǒng)工程與信息,2020,20(2):61-68.

[11] 郭保青,王寧. 基于改進深度卷積網(wǎng)絡的鐵路入侵行人分類算法[J ]. 光學精密工程,2018,26 (12 ):3040-3050.

[12] 何文玉,楊杰,張?zhí)炻叮?基于深度學習的軌道異物入侵檢測算法[J]. 計算機工程與設計,2020,41 (12 ):3376-3383.

[13] WANG J Q,CHEN K,XU R,et al. CARAFE:Contentaware Reassembly of Features[C]∥2019 IEEE / CVF International Conference on Computer Vision. Seoul:IEEE,2019:3007-3016.

[14] LIU Z,LI J G,SHEN Z Q,et al. Learning Efficient Convolutional Networks through Network Slimming[C]∥ 2017IEEE International Conference on Computer Vision (ICCV). Venice:IEEE,2017:2755-2763.

[15] FANG G F,MA X Y,SONG M L,et al. Dep Graph:Towards Any Structural Pruning[C]∥ Proceedings of theIEEE Conference on Computer Vision and Pattern Recognition. Vancouver:IEEE,2023:16091-16101.

[16] HINTON G,VINYALS O,DEAN J. Distilling theKnowledge in a Neural Network [EB / OL]. (2015 - 03 -09)[2023-08-27]. https:∥arxiv. org / abs / 1503.

[17] WANG C Y,BOCHKOVSKIY A,LIAO H Y M. YOLOv7:Trainable Bagoffreebies Sets New Stateoftheart forRealtime Object Detectors [C ]∥ Proceedings of theIEEE Conference on Computer Vision and Pattern Recognition. Vancouver:IEEE,2023:7464-7475.

作者簡介

潘 磊 男,(1982—),博士,副教授,碩士生導師。主要研究方向:智慧民航、計算機視覺和情感計算等。

(*通信作者)趙枳晴 女,(1997—),碩士研究生。主要研究方向:運動目標檢測、小目標檢測。

傅 強 男,(1969—),碩士,研究員,碩士生導師。主要研究方向:計算機技術與民航行業(yè)應用。

鄭 遠 男,(1993—),博士,講師。主要研究方向:計算機視覺、軌跡規(guī)劃等。

田 俊 男,(1998—),碩士研究生。主要研究方向:圖像增強、目標檢測。

基金項目:中國民用航空飛行學院智慧民航專項(ZHMM2022-005);民航飛行技術與飛行安全重點實驗室開放基金(FZ2022KF10);民航飛行技術與飛行安全重點實驗室自主研究項目(FZ2022ZZ06);中國民用航空飛行學院重點面上項目(ZJ2021-11);中國民用航空飛行學院2023 研究生創(chuàng)新項目(X2023-29)

秦皇岛市| 潞城市| 应用必备| 潜江市| 八宿县| 陆丰市| 孟州市| 涿鹿县| 水富县| 江西省| 民权县| 信丰县| 长沙县| 渝中区| 龙游县| 莱阳市| 商水县| 新蔡县| 望奎县| 青冈县| 巴林右旗| 大冶市| 浦江县| 萝北县| 滕州市| 中牟县| 皋兰县| 炎陵县| 肇东市| 镇坪县| 宁国市| 东丽区| 铅山县| 长丰县| 靖边县| 临海市| 光山县| 玉林市| 建水县| 永福县| 富源县|