摘 要:在電力桿塔作業(yè)過程中,規(guī)范設置安全圍欄是保證施工過程安全順利的重要手段。當前,人工智能技術已經(jīng)較為廣泛地應用于電力桿塔作業(yè)中安全圍欄設置規(guī)范性的檢測。通過圖像分割手段將施工區(qū)域從背景圖像中提取出來,可以有效降低圖像復雜度,提高人工智能檢測技術的準確度?;谏疃壬窠?jīng)網(wǎng)絡的圖像分割是實現(xiàn)此目標的有效方法,但是深度神經(jīng)網(wǎng)絡結(jié)構(gòu)復雜、參數(shù)量大,需要大量的計算資源和計算時間。因此,文章提出一種輕量化的深度神經(jīng)網(wǎng)絡模型,用于安全圍欄圖像的分割,并使用超參數(shù)優(yōu)化手段自動調(diào)整超參數(shù)設置,提高網(wǎng)絡模型性能,達到更好的分割效果。實驗結(jié)果表明,所提方法可以大幅降低網(wǎng)絡模型參數(shù)量,同時分割精度達到90%以上。
關鍵詞:電力安全圍欄;圖像分割;深度學習;輕量化
中圖分類號:TP301 文獻標識碼:A 文章編號:2096-4706(2024)16-0123-04
Safety Fence Image Segmentation Technology Based on Hyperparameter-optimized Lightweight Deep Neural Networks
Abstract: Standardizing the installation of safety fences during power poles and towers operation is an important means to ensure safety. Currently, Artificial Intelligence technology is widely used in the detection of safety fence installation in power poles and towers operation. Using image segmentation to extract the construction region from the background image can effectively reduce image complexity and improve accuracy of Artificial Intelligence detection technology. The image segmentation based on Deep Neural Networks is an effective way to achieve this goal, but the Deep Neural Networks has complex structures and large parameters, which needs lots of computing resources and time. Therefore, this paper proposes a lightweight Deep Neural Networks for segmentation of safety fence images, and uses Hyperparameter-optimized means to automatically adjust the hyperparameter settings, so as to improve network model performance and achieve better segmentation results. Experimental results show that the proposed method can significantly reduce the amount of network model parameters while achieving a segmentation accuracy higher than 90%.
Keywords: electric power safety fence; image segmentation; Deep Learning; lightweight
0 引 言
電力桿塔作業(yè)安全圍欄是保障作業(yè)人員安全的重要設施,設置安全圍欄可以防止無關人員誤入作業(yè)區(qū)域,避免發(fā)生意外事故,提醒作業(yè)人員注意作業(yè)過程中的安全;有效隔離作業(yè)區(qū)域,避免設備損壞和觸電事故的發(fā)生;提高作業(yè)效率,減少不必要的延誤和資源浪費。高永鍵[1]通過調(diào)查發(fā)現(xiàn),供電企業(yè)對現(xiàn)場作業(yè)安全的把控仍然存在非常突出的問題。因此,施工現(xiàn)場的安全監(jiān)督檢查非常有必要?,F(xiàn)有施工現(xiàn)場的檢查中,主要依靠安排監(jiān)督人員在現(xiàn)場進行監(jiān)督,但是電力桿塔作業(yè)數(shù)量龐大,逐一檢查耗時耗力,且現(xiàn)場地理位置特殊,檢查難度大,易受天氣、環(huán)境等因素影響,導致檢查不及時。
近年來人工智能技術蓬勃發(fā)展,已有較多研究應用人工智能技術解決上述問題。例如,孫倩等[2]設計了一種電力施工安全規(guī)范模型的驗證方法,使用基于目標檢測模型YOLOv5的深度學習技術,對作業(yè)工程中的視頻監(jiān)控進行分析,從而實現(xiàn)實時監(jiān)測以及對違章場景進行預警提醒。最終通過對作業(yè)工程中易發(fā)多發(fā)并且有一定危險性的違章場景進行建模,提早發(fā)現(xiàn)并糾正相應的違章場景,實現(xiàn)電力作業(yè)施工的過程管控,避免發(fā)生事故。胡明輝[3]將深度學習用于改進使用無人機進行的電路巡檢。由于無人機得到的桿塔圖像背景復雜,導致桿塔異常檢測準確度不高。胡明輝通過將多元特征混合訓練與基于遷移學習的目標檢測模型相結(jié)合,在小樣本數(shù)據(jù)下實現(xiàn)了高效的桿塔異常圖像檢測。余萍等[4]使用人工智能方法對電力施工過程中的圍欄擺放合規(guī)性檢測進行研究,使用OpenCV分析施工現(xiàn)場的圖像及視頻,提取圍欄輪廓并設計算法判斷圍欄是否存在缺口,從而發(fā)現(xiàn)施工現(xiàn)場中安全圍欄合規(guī)性擺放問題,保證電力系統(tǒng)工程安全、順利進行。張懷軍等[5]設計了智能型安全圍欄,在傳統(tǒng)圍欄的基礎上增加了紅外感應功能,從而可以主動判斷人員非法闖入,并且增加了聲光警示模式以警告非法闖入人員,提高了傳統(tǒng)圍欄的警示作用、解決了傳統(tǒng)圍欄只能被動防護等問題。
人工智能技術已經(jīng)較為廣泛地應用于電力桿塔作業(yè)中安全圍欄的設置檢測,但是基于人工智能方法的檢測效率和精度受到圖像復雜度的嚴重影響,而圖像分割技術可以將感興趣區(qū)域從圖像中提取出來,再進行檢測,從而降低輸入檢測算法部分的圖像復雜度,提高人工智能檢測方法的效果和效率。本文提出使用基于U-Net的輕量化深度神經(jīng)網(wǎng)絡進行電力桿塔作業(yè)安全圍欄圖像的分割,在保證圖像分割精度的同時,通過使用SqueezeNet的Fire模塊降低模型復雜度、減少參數(shù)數(shù)量,提高模型計算效率。同時使用基于貝葉斯優(yōu)化的超參數(shù)優(yōu)化策略,自動調(diào)整優(yōu)化模型超參數(shù),達到更好的分割效果。
1 相關工作
基于深度學習的圖像分割技術通常可以達到較好的圖像分割效果。Long等[6]設計并提出了全卷積神經(jīng)網(wǎng)絡(FCN),它可以快速地對不同大小的圖像進行分割。Ronneberger等[7]提出了U-Net網(wǎng)絡,該網(wǎng)絡結(jié)構(gòu)由編碼器和解碼器組成,成字母U型網(wǎng)絡結(jié)構(gòu)。編碼器用于提取圖像特征,而解碼器用于將特征映射回輸入圖像空間以生成分割結(jié)果。編碼器和解碼器之間的Skip-Connection結(jié)構(gòu)使得U-Net具有很強的語義信息抓取能力,從而實現(xiàn)精確的分割。
盡管上述基于深度學習的圖像分割技術雖然取得了較好的分割效果,但其網(wǎng)絡結(jié)構(gòu)往往較為復雜,參數(shù)量非常大,計算復雜度高,需要大量的計算資源。因此,需要通過網(wǎng)絡輕量化技術手段對深度學習模型進行壓縮、優(yōu)化和簡化,減小模型參數(shù)和計算量,從而使模型具有較小的尺寸和更高的運行速度。常見的網(wǎng)絡輕量化模塊包括MobileNet、ShuffleNet、SqueezeNet等。MobileNet[8]是由Google團隊于2017年提出的輕量級卷積神經(jīng)網(wǎng)絡,通過深度可分離卷積來減少參數(shù)量和計算量,如圖1(a)所示,從而實現(xiàn)模型的輕量化。ShuffleNet[9]的設計思路是通過使用通道重排和組卷積來減少參數(shù)量和計算量,從而實現(xiàn)模型的輕量化,如圖1(b)所示。SqueezeNet是在深度學習領域具有里程碑意義的AlexNet的基礎上發(fā)展來,SqueezeNet在保持與AlexNet相同精度的前提下,參數(shù)量減少了50倍。SqueezeNet由若干個Fire模塊結(jié)合卷積網(wǎng)絡中的卷積層、降采樣層、全連接等組成。Fire模塊是SqueezeNet的主要創(chuàng)新點,由Squeeze和Expand兩部分組成,如圖1(c)所示。Squeeze部分采用1×1卷積核對上一層特征圖進行卷積,其主要目的是降低特征圖的通道數(shù),從而減少參數(shù)量;Expand部分使用Inception結(jié)構(gòu),包括1×1和3×3卷積,然后拼接,通過使用1×1卷積來替代部分3×3卷積,可以將參數(shù)減少至原來的1/9。
2 基于U-Net的輕量化深度神經(jīng)網(wǎng)絡圖像分割模型
U-Net模型是一種廣泛應用于圖像分割領域的模型,其核心是由編碼器和解碼器組成的U形結(jié)構(gòu)。編碼器由多層卷積和池化操作構(gòu)成,它的作用是將輸入圖像的空間分辨率逐漸降低,并提取出越來越高級別的特征表示。編碼器中的每一層都可以看作是一個特征提取器,它通過卷積操作將輸入特征映射到高維特征空間,從而實現(xiàn)對圖像的信息提取。解碼器由多層反卷積和上采樣操作構(gòu)成,它的作用是逐漸恢復空間分辨率,并利用編碼器提取的特征對圖像進行分割。解碼器中的每一層都可以看作是一個特征重建器,它通過反卷積和上采樣操作將高維特征映射到低維特征空間,從而實現(xiàn)對圖像的分割。通過編碼器和解碼器的結(jié)合,U-Net模型能夠充分利用輸入圖像的特征信息,從而實現(xiàn)對復雜圖像的高效分割和分析。
U-Net神經(jīng)網(wǎng)絡在前向傳播的過程中,涉及大量的矩陣運算,由于Skip-Connection的存在,需存儲大量中間結(jié)果。神經(jīng)網(wǎng)絡的每個神經(jīng)元都與前一層的所有神經(jīng)元相連,這意味著神經(jīng)網(wǎng)絡中會有大量的權(quán)重參數(shù)需要存儲。這些權(quán)重參數(shù)通常以大型權(quán)重矩陣形式存儲,該矩陣的大小與神經(jīng)網(wǎng)絡的層數(shù)、神經(jīng)元數(shù)量等因素有關??紤]到以上因素,為了解決安全圍欄圖像分割網(wǎng)絡模型計算復雜度高、模型龐大等問題,本文提出了一種基于輕量化卷積神經(jīng)網(wǎng)絡的圖像分割方法,如圖2所示。該方法采用SqueezeNet[10]中的Fire模塊輕量化網(wǎng)絡結(jié)構(gòu),在保證較高分割準確率的前提下,大幅降低了計算復雜度和運行時間。為進一步提升分割性能,本文引入了注意力機制,使網(wǎng)絡能夠?qū)W習不同空間位置的重要性。此外,還采用了基于貝葉斯優(yōu)化的超參數(shù)自動調(diào)優(yōu)算法,以自動獲取最優(yōu)超參數(shù)設置。
Fire模塊通過以1×1卷積代替3×3卷積,將參數(shù)減少至原來的1/9。同時,在SqueezeLayer中通過1×1卷積減少輸入通道數(shù)量,進一步減少參數(shù)數(shù)量。在解碼器部分,引入Attention結(jié)構(gòu),對編碼器各分辨率上的特征與解碼器中對應特征進行拼接,重新調(diào)整編碼器的輸出特征。通過迭代學習調(diào)節(jié)門控信號,控制不同空間位置特征的重要性,使網(wǎng)絡模型更專注于感興趣區(qū)域,從而提高圖像分割效果。
超參數(shù)在深度神經(jīng)網(wǎng)絡中具有重要作用,合理設置超參數(shù)值可提升模型性能并加速收斂。然而,超參數(shù)優(yōu)化面臨驗證評估目標函數(shù)計算量大的難題,每次嘗試新超參數(shù)均需重新訓練完整模型。貝葉斯優(yōu)化[11]利用先驗過程調(diào)整參數(shù),可以更快地進行參數(shù)搜索并找到具有最佳泛化能力的參數(shù)組合,避免花費大量時間來評估“壞”超參數(shù)。貝葉斯優(yōu)化首先為目標函數(shù)建立先驗知識,在訓練過程中不斷更新先驗知識,形成后驗分布,并根據(jù)選擇函數(shù)選擇下一組超參數(shù)進行訓練。選擇函數(shù)通常使用預期改進法,以選擇一組超參數(shù)x最大化其預期的改進:
其中,y*表示目標函數(shù)的閾值,x表示給定的超參數(shù),p(y|x)表示代理函數(shù),用以表示y的概率的替代概率模型。
3 實驗及結(jié)果
3.1 實驗驗證數(shù)據(jù)
本文使用的數(shù)據(jù)集為電力桿塔作業(yè)過程圍欄圖像自建數(shù)據(jù)集,包含774幅圖片實現(xiàn)施工現(xiàn)場拍攝的場景。圖片經(jīng)過專業(yè)人員進行標注施工安全區(qū)域。實驗中,圖像數(shù)據(jù)按照8:1:1比例隨機分為訓練集、驗證集和測試集,分別用來進行模型的訓練、驗證以及測試模型效果,能夠更全面地評估模型在新數(shù)據(jù)上的表現(xiàn)。
3.2 評價指標
Dice系數(shù)是一種常用于評估兩個集合相似度的指標,通常用于圖像分割等領域。Dice系數(shù)的計算式如下:
其中,A和B表示兩個集合,|A|表示集合A的元素個數(shù),|B|表示集合B的元素個數(shù),||表示A和B的交集中元素的個數(shù)。需要注意的是,Dice系數(shù)的取值范圍為0到1,值越接近1表示預測分割結(jié)果和真實標簽結(jié)果越相似,值越接近0表示預測分割結(jié)果和真實標簽結(jié)果差異越大。
3.3 實驗驗證結(jié)果
與U-Net網(wǎng)絡模型相比,本文輕量化網(wǎng)絡參數(shù)數(shù)量僅為2.6M,比U-Net模型31.4M參數(shù)數(shù)量減少了12倍。通過在電力桿塔作業(yè)的安全圍欄區(qū)域圖像上的試驗驗證,本文提出的輕量化網(wǎng)絡在分割精度上達到了0.904 4,相比U-Net模型的0.911 5,降低了約0.78%。因此,本文的輕量化深度神經(jīng)網(wǎng)絡在保證分割精度的同時,有效減少了網(wǎng)絡參數(shù)量。圖3展示的4幅隨機選擇的實例圖像,是本文所提方法的分割效果與金標準(人工標注結(jié)果)及U-Net方法分割效果對比圖。通過對比可以發(fā)現(xiàn),本文方法與U-Net方法分割效果非常接近,同時與金標準相比存在過分割現(xiàn)象。
超參數(shù)設置對于深度神經(jīng)網(wǎng)絡性能有重要影響。以學習率為例,圖4為不同學習率下模型訓練過程的Loss曲線,當學習率設置過小時,網(wǎng)絡模型不容易收斂,需要較長時間訓練;而如果學習率過大,模型可能不收斂。因此,需要通過超參數(shù)優(yōu)化算法自動調(diào)整超參數(shù),以在更短時間內(nèi)達到更好的網(wǎng)絡模型效果。本文使用貝葉斯優(yōu)化方法,其可以使用先驗知識選擇下一組超參數(shù)進行驗證,并且支持早停策略,以避免在驗證全部可能的超參數(shù)上花費過多時間。通過圖5所示的貝葉斯優(yōu)化過程中不同d4c4a3b1a80dcea81093ce98a74e65af超參數(shù)下的驗證效果,可以發(fā)現(xiàn)絕大部分超參數(shù)的驗證只需要5個以下Epoch,從而可以更快地進行參數(shù)搜索并找到具有最佳泛化能力的超參數(shù)。
4 結(jié) 論
本文提出了一種輕量化的深度神經(jīng)網(wǎng)絡,用于電力桿塔作業(yè)中安全圍欄圖像的分割。通過本文提出的方法,網(wǎng)絡模型的參數(shù)量相對于基礎網(wǎng)絡模型降低了12倍,同時保持與原網(wǎng)絡模型基本一致的分割效果。此外,通過使用貝葉斯算法自動優(yōu)化超參數(shù)設置,能夠快速搜索并找到具有最優(yōu)效果的超參數(shù),提高網(wǎng)絡模型的收斂速度以及整體性能。本文所提出的方法可以有效地進行電力桿塔作業(yè)過程中安全圍欄圖像分割,簡化圖像復雜度,從而提高安全圍欄設置規(guī)范性檢測方法的效果。這有助于避免電力桿塔作業(yè)的安全隱患,提高施工作業(yè)安全性。因此,本文方法具有重要的理論研究研究意義以及實用價值。
參考文獻:
[1] 高永鍵.現(xiàn)場供電作業(yè)風險評估方法研究 [D].廣州:華南理工大學,2019.
[2] 孫倩,趙李強,高雪林.一種電力施工安全規(guī)范模型驗證方法 [J].云南電力技術,2022,50(3):9-14.
[3] 胡明輝.基于遷移學習的無人機桿塔巡檢圖像異常識別技術及實驗對比 [J].粘接,2023,50(6):136-139.
[4] 余萍,宋祥宇.基于Open CV圍欄合規(guī)性擺放檢測方法研究 [J].科學技術與工程,2022,22(28):12449-12459.
[5] 張懷軍,曹付民,彭梓元,等.智能型電力施工安全圍欄的設計與應用 [J].湖北科技學院學報,2018,38(3):7-11.
[6] LONG J, SHELHAMER E, DARRELL T. Fully Convolutional Networks for Semantic Segmentation [C]//2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR).Boston:IEEE,2015:3431-3440.
[7] RONNEBERGER O,F(xiàn)ISCHER P,BROX T. U-Net: Convolutional Networks for Biomedical Image Segmentation [C]//Medical Image Computing and Computer-Assisted Intervention - MICCAI 2015. Munich:Springer,2015:234-241.
[8] HOWARD A G,ZHU M L,CHEN B,et al. MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications [J/OL].arXiv:1704.04861 [cs.CV].[2023-09-20].https://doi.org/10.48550/arXiv.1704.04861.
[9] ZHANG X Y,ZHOU X Y,LIN M X,et al. ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices [C]//2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition.Salt Lake City:IEEE,2018:6848-6856.
[10] IANDOLA F N,HAN S,MOSKEWICZ M W,et al. SqueezeNet: AlexNet-level accuracy with 50x fewer parameters and <0.5MB model size [J/OL].arXiv:1602.07360 [cs.CV].[2023-09-20].https://arxiv.org/abs/1602.07360v4.
[11] TURNER R,ERIKSSON D,MCCOURT M,et al. Bayesian Optimization is Superior to Random Search for Machine Learning Hyperparameter Tuning: Analysis of the Black-Box Optimization Challenge 2020 [J/OL].arXiv:2104.10201 [cs.LG].[2023-09-20].https://arxiv.org/abs/2104.10201v2.