劉攀,文漢云
摘要:在新冠病毒(COVID-19)全球肆虐的大背景下,為有效阻止新冠病毒在人群中傳播,多地要求在公眾場(chǎng)合佩戴口罩,針對(duì)這一問(wèn)題,提出一種基于FasterRCNN算法的口罩佩戴檢測(cè)方法,手動(dòng)通過(guò)labelimg進(jìn)行數(shù)據(jù)集標(biāo)定,再對(duì)深度學(xué)習(xí)模型進(jìn)行訓(xùn)練,實(shí)驗(yàn)結(jié)果表明,該深度學(xué)習(xí)算法的檢測(cè)的準(zhǔn)確率達(dá)到97.57%,可以有效檢測(cè)人員的口罩佩戴情況。
關(guān)鍵詞:深度學(xué)習(xí);口罩佩戴檢測(cè);計(jì)算機(jī)視覺(jué)
中圖分類號(hào):TP18? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2021)21-0014-03
開(kāi)放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
Research on Mask Wearing Detection Based on Faster RCNN
LIU Pan, WEN Han-yun
(School of Computer Science, Yangtze University, Jingzhou 434000, China)
Abstract: In the context of the global raging COVID-19 virus (COVID-19), in order to effectively prevent the spread of the new coronavirus among the population, many places require masks to be worn in public. To address this problem, a mask wearing test based on the Faster RCNN algorithm is proposed. Methods: Manually calibrate the data set through labelimg, and then train the deep learning model. The experimental results show that the detection accuracy of the deep learning algorithm reaches 97.57%, which can effectively detect the wearing of masks.
Keywords: deep learning; mask wearing detection; computer vision
引言
自新冠病毒在全球爆發(fā)以來(lái),世界各國(guó)的社會(huì)生產(chǎn)生活活動(dòng)陷入停滯,人民的生命健康、財(cái)產(chǎn)都遭受極大的威脅,為有效阻止新冠病毒[1]在人群中進(jìn)一步傳播,各地各部門要求人們出行佩戴口罩,本文提出的利用FasterRCNN[2-3]深度學(xué)習(xí)算法來(lái)進(jìn)行口罩佩戴檢測(cè)可以與紅外測(cè)溫系統(tǒng)結(jié)合起來(lái),組成一個(gè)口罩佩戴檢測(cè)加紅外測(cè)溫的門禁系統(tǒng),可以廣泛應(yīng)用于各大高中院校、公司、公園、商超等人流量大的場(chǎng)合,不僅可以有效避免檢測(cè)人員與他人近距離接觸,還可以對(duì)未佩戴口罩的人員進(jìn)行標(biāo)識(shí),以便檢測(cè)人員實(shí)時(shí)進(jìn)行提醒。
用于口罩佩戴檢測(cè)的FasterRCNN深度學(xué)習(xí)算法是一種典型的two-stage目標(biāo)檢測(cè)算法,整個(gè)目標(biāo)檢測(cè)過(guò)程分為兩步,先由主干特征提取網(wǎng)絡(luò)生成特征層之后,再由其他算法生成一系列的候選框,two-stage目標(biāo)檢測(cè)算法的特點(diǎn)是檢測(cè)精度高,但檢測(cè)速度相對(duì)較慢,與之相對(duì)應(yīng)的有YOLO[4]、SSD等一些one-stage目標(biāo)檢測(cè)算法,one-stage算法直接將先驗(yàn)框的定位問(wèn)題轉(zhuǎn)化為回歸問(wèn)題一起處理,因此具有出色的檢驗(yàn)速度,但相對(duì)的檢測(cè)精度卻有所下降。本文所選擇的FasterRCNN算法是由何凱明等人在2015年提出的,該算法是在RCNN和FastRCNN算法的基礎(chǔ)上改進(jìn)而來(lái)的,該算法解決了RCNN[5]和FastRCNN[6]算法訓(xùn)練速度慢,檢測(cè)時(shí)間長(zhǎng)的問(wèn)題,將主干特征提取網(wǎng)絡(luò)生成的特征層共享,大大減少了計(jì)算量,提高了訓(xùn)練速度和檢測(cè)速度,為了保證口罩佩戴檢測(cè)的精度和準(zhǔn)度,本文選擇了FasterRCNN目標(biāo)檢測(cè)算法。
1 FasterRCNN目標(biāo)檢測(cè)算法
與RCNN和FastRCNN算法相比,F(xiàn)asterRCNN算法創(chuàng)造性地使用RPN(Region Proposal Network)代替原來(lái)的Selective Search方法產(chǎn)生建議窗口,通過(guò)共享特征層大大減少了計(jì)算量,從而提高了算法的檢測(cè)速度,F(xiàn)asterRCNN算法的原理如圖1所示。
FasterRCNN算法對(duì)輸入進(jìn)來(lái)的圖片在保持原有縱橫比的前提下重新調(diào)整為固定尺寸大小,然后通過(guò)主干網(wǎng)絡(luò)進(jìn)行特征提取得到特征層,將特征層輸入到RPN網(wǎng)絡(luò)中,經(jīng)過(guò)3x3的卷積,再分別對(duì)每個(gè)先驗(yàn)框進(jìn)行分類(前景和后景)和計(jì)算對(duì)應(yīng)先驗(yàn)框的偏移量,然后計(jì)算出proposals,而Roi Pooling層則利用proposals從特征層中提取的proposal feature送入后續(xù)全連接層和Softmax網(wǎng)絡(luò)進(jìn)行分類。
1.1主干特征提取網(wǎng)絡(luò)
FasterRCNN可以采取多種主干特征提取網(wǎng)絡(luò),常見(jiàn)的有VGG、Resnet和Xception等,本文采用的是Resnet50網(wǎng)絡(luò)。Resnet網(wǎng)絡(luò)是一種深度殘差網(wǎng)絡(luò),該網(wǎng)絡(luò)將前面若干層的某一層的數(shù)據(jù)輸出直接跳過(guò)多層引入到后面數(shù)據(jù)層的輸入部分,這意味著后面特征層的內(nèi)容會(huì)有一部分由前面的某一層線性貢獻(xiàn),深度殘差網(wǎng)絡(luò)可以有效解決因網(wǎng)絡(luò)深度加深而產(chǎn)生的學(xué)習(xí)效率下降而準(zhǔn)確率無(wú)法有效提升的問(wèn)題,其結(jié)構(gòu)如圖2所示。