一種邊緣環(huán)境下基于EfficientDet的施工人員安全帽檢測方法

2020-10-09 09:09:30梅國新姚慶華

數(shù)字通信世界 2020年9期

梅國新，姚慶華，陳瑤，劉華

（1.云南省交通投資建設(shè)集團有限公司，云南昆明 650228；2.云南省交通科學(xué)研究院有限公司，云南昆明 650011）

目前，檢測方法由于監(jiān)控攝像機的位置距離監(jiān)控場景較遠(yuǎn)，視頻內(nèi)工作人員圖像像素尺寸?。ㄒ话?0像素左右），同時背景較為復(fù)雜，這對于檢測安全帽佩戴構(gòu)成了重大挑戰(zhàn).針對以上問題，本項目提出了一種邊緣環(huán)境下面向大監(jiān)控視頻背景的安全帽檢測方法。針對邊緣環(huán)境下面向復(fù)雜背景遠(yuǎn)距離監(jiān)控視頻中安全帽檢測問題，本文討論了jetson tx2環(huán)境下基于EfficientDet的檢測方法的性能。

1 基于EfficientDet的安全帽檢測

EfficientDet包含兩部分：特征提取網(wǎng)絡(luò)EfficientNet和面向多目標(biāo)檢測的加權(quán)雙向特征金字塔網(wǎng)絡(luò)。該架構(gòu)解決了深度網(wǎng)絡(luò)的深度、寬度和分辨率之間的平衡問題，可以提高生成模型的泛化能力。如圖1所示，單一提高某個參數(shù)，模型對圖像的分類準(zhǔn)確率很快會達(dá)到上限。

圖1 單獨提升模型寬度、深度、以及圖像分辨率的效果

為了有效調(diào)整深度、寬度和分辨率參數(shù)，EfficientNet使用了“復(fù)合系數(shù)”來動態(tài)調(diào)整這3個參數(shù)。（α，β，γ）分別代表網(wǎng)絡(luò)的深度、寬度和輸入分辨率。根據(jù)前期研究可知網(wǎng)絡(luò)寬度和分辨率每增加一倍，計算代價會多四倍，因此EfficientNet對目標(biāo)函數(shù)的約束相進(jìn)行了調(diào)整，分別考慮了網(wǎng)絡(luò)深度、網(wǎng)絡(luò)寬度和分辨率三個維度：網(wǎng)絡(luò)深度約束網(wǎng)絡(luò)深度約束分辨率約束其中圖2給出了達(dá)到同樣檢測準(zhǔn)確率，使用增加網(wǎng)絡(luò)寬度、網(wǎng)絡(luò)深度、分辨率的策略和使用EfficientNet策略的不同結(jié)果。

圖2 （a）baseline model，(b)-（d）單一提參數(shù)策略，（e）EfficientNet策略

同時，谷歌大腦團隊對EfficientNet網(wǎng)絡(luò)進(jìn)行了優(yōu)化，使之適應(yīng)多種目標(biāo)檢測，提出加權(quán)雙向特征金字塔網(wǎng)絡(luò)，從而快速地實現(xiàn)多尺度特征融合，對小目標(biāo)的檢測起到了顯著的作用。其次采用了EfficientNet作為特征提取網(wǎng)絡(luò)，大大減少了參數(shù)量，為我們將模型部署到移動邊緣計算設(shè)備上提供了可能性。

2 實驗

2.1 實驗數(shù)據(jù)

實驗數(shù)據(jù)集來自于（https：//github.com/njvisionpower/Safety-Helmet-Wearing-Dataset），該數(shù)據(jù)集總共有7581張圖像，包含9044個佩戴安全帽圖像（正類圖像），以及111514個未佩戴安全帽的圖像（負(fù)類圖像），所有的圖像都標(biāo)注出了目標(biāo)區(qū)域及類別。

2.2 算法評價指標(biāo)

本文采用mAP（Mean Average Precision）作為算法的性能評價指標(biāo)，平均精度均值（mAP）是預(yù)測目標(biāo)位置以及類別的這一類算法的性能度量標(biāo)準(zhǔn)。mAP指標(biāo)能較好地評估目標(biāo)定位模型、目標(biāo)檢測模型以及實例分割模型性能。

mAP指標(biāo)定義如下，其中C為檢測類別數(shù)目，AP為每一個檢測類的平均檢測精度。

AP值刻畫了檢測準(zhǔn)確率和召回率（precision-recall）曲線面積

準(zhǔn)確率和召回率計算公式如下：

式中，TP表示真正例（True Positives）；TF表示假正例（False Positives）；TN表示真負(fù) 例（True Negatives）；FN表示假負(fù)例（False Negatives）。

2.3 實驗結(jié)果

本文將CascadeRCNN、YOLO V3作為基線算法，對比了不同參數(shù)設(shè)置的EfficientDet（即EfficientDet-D0、EfficientDet-D3，EfficientDet-D4）在jetson tx2邊緣環(huán)境下的性能。其與基線方法模型大小及性能對比情況分別如圖3、圖4所示：

圖3 模型大小對比

圖4 模型性能對比

如下表1所示，EfficientDet在同等精度的前提下，模型只使用了52M參數(shù)，僅為主流模型的十幾分之一，計算量為326B FLOPS的EfficientDet-D7在COCO數(shù)據(jù)集上實現(xiàn)了當(dāng)前最優(yōu)的51.0 mAP，準(zhǔn)確率超越之前最優(yōu)檢測器（+0.3% mAP），其規(guī)模僅為之前最優(yōu)檢測器的1/4，而后者的計算量FLOPS更是EfficientDet-D7的9.3倍。從實際檢測效果來看，EfficientDet模型克服了檢測目標(biāo)間存在著明顯遮擋、重疊率高、圖像分辨率低等問題，取得了比較好的效果，達(dá)到了推理速度更快，模型占用空間較小的要求，也為部署在邊緣計算環(huán)境上提供了可能。