国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

適用于地鐵異物前景檢測(cè)的神經(jīng)網(wǎng)絡(luò)
——DifferentNet

2021-12-07 08:12劉偉銘溫俊銳鄭仲星戴愿李泓道
關(guān)鍵詞:解碼異物前景

劉偉銘 溫俊銳? 鄭仲星 戴愿 李泓道

(1.華南理工大學(xué) 土木與交通學(xué)院,廣東 廣州 510640;2.廣州地鐵集團(tuán)有限公司,廣東 廣州 510030)

地鐵是大中型城市的主要交通工具之一,為了保障運(yùn)營(yíng)安全,地鐵站在列車與站臺(tái)之間安裝屏蔽門,在保護(hù)了乘客的同時(shí),也產(chǎn)生了新的問題。屏蔽門與列車門之間存在間隙空間,乘客通過屏蔽門時(shí),不慎掉落的物品會(huì)遺留在間隙之中,車門關(guān)閉時(shí),也可能將乘客隨身物品夾在間隙空間中。這些物體屬于間隙空間中的異物,會(huì)對(duì)地鐵的運(yùn)行帶來安全隱患。為解決該問題,各大地鐵公司開始安裝異物檢測(cè)系統(tǒng),廣州、深圳等地的地鐵公司已開始部署相關(guān)設(shè)備,在間隙空間上方安裝傳感器和邊緣計(jì)算設(shè)備對(duì)風(fēng)險(xiǎn)異物進(jìn)行檢測(cè)。屏蔽門與列車門的間隙空間環(huán)境復(fù)雜,干擾因素眾多,列車來臨時(shí)帶來的高壓氣流、間隙空間內(nèi)的光照變化、粉塵流動(dòng)等因素都會(huì)對(duì)異物檢測(cè)造成影響。因此,要求異物檢測(cè)算法具備較強(qiáng)的抗干擾能力。

目前,檢測(cè)屏蔽門與列車門間隙空間異物的方式可以分為兩種:使用紅外或激光傳感器直接測(cè)量,使用圖像傳感器間接測(cè)量?;谥苯訙y(cè)量傳感器的方案[1-2]安裝要求嚴(yán)格,成本高且受振動(dòng)影響較大,對(duì)于間隙較大的站臺(tái)存在檢測(cè)盲區(qū)?;趫D像傳感器間接測(cè)量的方案主要通過計(jì)算機(jī)視覺方法分析間隙區(qū)域的圖像來實(shí)現(xiàn)異物檢測(cè),該方案成本較低,易于安裝與維護(hù)。

傳統(tǒng)的計(jì)算機(jī)視覺技術(shù)常采用幀差對(duì)比的方式進(jìn)行異物檢測(cè),文獻(xiàn)[3]中通過幀差法結(jié)合形態(tài)學(xué)處理進(jìn)行異物檢測(cè),這種方法的檢測(cè)速度快,但要求參與對(duì)比的兩幅圖像在背景區(qū)域無明顯變化,導(dǎo)致抗干擾能力低,為改善這個(gè)問題,文獻(xiàn)[4]中使用了GMM[5]算法,對(duì)多幀圖像進(jìn)行高斯混合建模以建立背景模型,并通過3δ準(zhǔn)則判斷前景得到檢測(cè)結(jié)果。文獻(xiàn)[6]中使用了Vibe[7]算法,以鄰域采樣的方式對(duì)背景建模,為每個(gè)位置的像素建立背景樣本庫,通過對(duì)待檢測(cè)圖片與背景樣本庫的對(duì)比得到異物檢測(cè)結(jié)果。文獻(xiàn)[8]中提出SuBSENSE算法,通過Color-LBSP的像素級(jí)建模方式,進(jìn)一步提高檢測(cè)準(zhǔn)確性。傳統(tǒng)方法雖然在發(fā)展的歷程中逐步提高了性能,但受限于模型的泛化能力,準(zhǔn)確性和抗干擾能力仍較低,只能應(yīng)對(duì)單一模式的干擾,無法適應(yīng)光照、背景復(fù)雜多變的地鐵環(huán)境。

基于深度學(xué)習(xí)的語義分割技術(shù)近年來發(fā)展迅速,該方法能對(duì)圖像像素進(jìn)行精細(xì)分類,并具有較強(qiáng)的泛化能力,適用于地鐵異物檢測(cè)。該場(chǎng)景的主要關(guān)注點(diǎn)在于區(qū)分圖像中的異物與非異物部分,屬于二分類問題,異物部分的像素視為前景,非異物部分的像素視為背景。

FCN[9]的提出奠定了語義分割神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu),即編碼-解碼結(jié)構(gòu),這一結(jié)構(gòu)通過編碼部分提取數(shù)據(jù)特征,再經(jīng)解碼部分對(duì)特征分類并恢復(fù)尺寸,從而實(shí)現(xiàn)對(duì)像素的劃分。FCN提出后,后續(xù)的語義分割研究在該結(jié)構(gòu)的基礎(chǔ)上改進(jìn),UNet[10]與SegNet[11]調(diào)整了編碼部分與解碼部分之間的對(duì)稱度,使得分割圖恢復(fù)邊緣信息更加精細(xì),UNet++[12]通過密集連接結(jié)構(gòu)提高了網(wǎng)絡(luò)對(duì)不同尺度信息的利用率,GCN[13]權(quán)衡了分類與定位之間的精度矛盾,并提高了前景邊界的定位精度,DeepLab系列網(wǎng)絡(luò)[14-17]通過使用空洞卷積提高了編碼部分的感受野。這些研究提高了語義分割網(wǎng)絡(luò)的定位和分類性能,從中可以看到,神經(jīng)網(wǎng)絡(luò)擁有較強(qiáng)的前景檢測(cè)能力,這一能力可應(yīng)用于地鐵異物檢測(cè)任務(wù)中。

本文提出假設(shè),在這一任務(wù)中,神經(jīng)網(wǎng)絡(luò)在額外獲取背景圖片作為參考的情況下,對(duì)異物的前景檢測(cè)將更加準(zhǔn)確?;谠摷僭O(shè),本文將差異對(duì)比的思想與語義分割方法相結(jié)合,提出一種新的異物前景檢測(cè)方法,并在實(shí)驗(yàn)中驗(yàn)證了該假設(shè)。本文方法的核心是一個(gè)新的前景檢測(cè)網(wǎng)絡(luò)DifferentNet,通過對(duì)比背景圖片和待檢測(cè)圖片的局部特征差異得到待檢測(cè)圖片的前景熱力圖,再經(jīng)閾值分割并剔除面積較小的輪廓得到最終的前景檢測(cè)結(jié)果。在地鐵異物前景檢測(cè)實(shí)驗(yàn)中,本文方法取得了比其他語義分割方法更好的效果。

1 地鐵異物前景檢測(cè)方法

屏蔽門與列車門間隙的監(jiān)控?cái)z像頭安裝位置如圖1所示,攝像頭從間隙空間上方垂直向下拍攝,以保證拍攝范圍覆蓋整個(gè)間隙區(qū)域。本文方法由3部分組成,包括前景熱力圖生成、置信度判斷、前景輪廓篩選。

圖1 攝像頭安裝位置示意圖Fig.1 Schematic diagram of location of camera installation

本文的檢測(cè)方案是:當(dāng)列車進(jìn)站后,將減速并停穩(wěn)。在車門未開啟時(shí),間隙空間處在封閉且無異物的狀態(tài),采集此時(shí)圖像作為背景圖片。背景圖片記錄了列車門與屏蔽門等背景物的位置與形態(tài)信息,對(duì)前景判斷起參考作用。列車停穩(wěn)后列車門與屏蔽門將開啟,并在上下乘客后再次關(guān)閉,完全關(guān)閉后間隙空間回到封閉的狀態(tài),此時(shí)列車門與屏蔽門的位置和形態(tài)與背景圖片相同,但是否存在異物未知。采集此時(shí)的圖像作為待檢測(cè)圖片,若存在風(fēng)險(xiǎn)異物,待檢測(cè)圖片與背景圖片之間會(huì)存在局部信息差異,通過這種差異可檢測(cè)異物。將背景圖片和待檢測(cè)圖片輸入本文提出的網(wǎng)絡(luò)DifferentNet中,網(wǎng)絡(luò)的編碼部分通過骨干網(wǎng)絡(luò)分別提取兩幅圖片的局部特征,解碼部分通過局部特征的差異計(jì)算異物前景熱力圖。前景熱力圖表示了網(wǎng)絡(luò)預(yù)測(cè)待檢測(cè)圖片中各像素為異物像素的置信度,使用全局閾值分割熱力圖初步判斷前景,并通過篩選剔除面積較小的輪廓,得到最終的檢測(cè)結(jié)果。整個(gè)前景檢測(cè)總體流程如圖2所示。

圖2 前景檢測(cè)流程圖Fig.2 Flowchart of foreground detection

1.1 基于多尺度特征差異分析的前景檢測(cè)網(wǎng)絡(luò)

前景檢測(cè)網(wǎng)絡(luò)根據(jù)背景圖片與待檢測(cè)圖片的局部特征信息差異產(chǎn)生前景熱力圖,需具備把兩幅圖片關(guān)聯(lián)起來進(jìn)行語義分割的能力。在已提出的語義分割網(wǎng)絡(luò)中,UNet[10]是一個(gè)高效而簡(jiǎn)潔的網(wǎng)絡(luò),有著相對(duì)對(duì)稱的“編碼-解碼”結(jié)構(gòu),能綜合不同尺度的特征圖信息,在圖像分割任務(wù)中有著優(yōu)秀的表現(xiàn),廣泛地應(yīng)用在醫(yī)學(xué)圖像處理及其他領(lǐng)域當(dāng)中[18-20]。FlowNet[21]及其它網(wǎng)絡(luò)[22-24]采用了“雙路圖片輸入與關(guān)聯(lián)”結(jié)構(gòu),這種結(jié)構(gòu)通常使用相同的骨干網(wǎng)絡(luò)對(duì)兩幅不同的輸入圖片進(jìn)行特征提取,并在后續(xù)的部分對(duì)它們的特征進(jìn)行分析,能有效地根據(jù)兩幅圖片之間的關(guān)聯(lián)推斷出任務(wù)所需信息。

本文將“雙路圖片輸入與關(guān)聯(lián)結(jié)構(gòu)”融入“對(duì)稱‘編碼-解碼’結(jié)構(gòu)”之中,設(shè)計(jì)了一個(gè)新的前景檢測(cè)網(wǎng)絡(luò)DifferentNet。與UNet通過單幀信息推斷前景不同,DifferentNet通過并行處理提取兩幅圖片不同尺度的特征,并將同一尺度的特征按位置相關(guān)聯(lián),這一關(guān)聯(lián)能使網(wǎng)絡(luò)根據(jù)兩幅圖片的內(nèi)在特征信息及其對(duì)比差異推斷前景像素。此外,與UNet相比,DifferentNet的編碼與解碼部分擁有更強(qiáng)的對(duì)稱性,從而提升編碼與解碼部分之間的信息傳遞完整性。網(wǎng)絡(luò)整體結(jié)構(gòu)如圖3所示。

圖3 網(wǎng)絡(luò)整體結(jié)構(gòu)Fig.3 Structure of the whole network

DifferentNet以待檢測(cè)圖片和背景圖片作為輸入,在編碼部分使用相同參數(shù)的骨干網(wǎng)絡(luò)分別對(duì)兩幅圖片提取特征,得到一系列不同尺度的特征圖,再把兩幅圖片中同一尺度的特征圖連接,從而關(guān)聯(lián)它們的特征。解碼部分根據(jù)不同尺度關(guān)聯(lián)后的特征圖逐步上采樣恢復(fù)尺寸,得到前景熱力圖。上采樣通過轉(zhuǎn)置卷積進(jìn)行,并從尺度最小的特征圖開始。每次上采樣后得到的結(jié)果與上一尺度的特征信息相連并再次上采樣,使解碼部分能夠根據(jù)不同尺度的特征信息分析并推斷結(jié)果。在上采樣過程中,為了減少信息丟失,在增大特征圖尺度的同時(shí)減少其通道數(shù)。在多尺度特征融合過程中,先使用卷積層對(duì)關(guān)聯(lián)后的特征圖進(jìn)一步提取特征,再與上采樣后的特征圖相連,從而使該過程具有更強(qiáng)的可學(xué)習(xí)性。

圖4 VGG16的卷積部分Fig.4 Convolution part of VGG16

(1)

(2)

最后輸出的特征圖通道數(shù)為k,k由任務(wù)的分類數(shù)決定,當(dāng)k>1時(shí)輸出層使用Softmax激活函數(shù)。本文中的應(yīng)用場(chǎng)景為前景/背景分類,是一個(gè)二分類任務(wù),因此定義k=1,輸出層使用Sigmoid激活函數(shù)。根據(jù)該定義,網(wǎng)絡(luò)輸出一幅與輸入圖片大小相同的前景熱力圖,記為M,M上每個(gè)元素的值代表了網(wǎng)絡(luò)預(yù)測(cè)該處的像素點(diǎn)為前景像素的置信度。記圖5中的輸出層運(yùn)算為ΨOut,則M的計(jì)算如下:

圖5 解碼部分結(jié)構(gòu)Fig.5 Stucture of decoding part

(3)

1.2 損失函數(shù)

圖像中背景區(qū)域的占比較大,造成正負(fù)樣本不均衡,因此使用由Focal Loss[27]和線性權(quán)重?fù)p失組成的損失函數(shù)L:

L=βLfl+(1-β)Lfw

(4)

式中:Lfl代表Focal Loss,其計(jì)算如式(5)所示。Lfw代表線性權(quán)重?fù)p失,如式(6)所示,β代表Focal Loss的權(quán)重系數(shù),取值范圍為[0,1]。

(5)

(6)

式中:y代表Ground Truth,y′代表預(yù)測(cè)值。式(5)中α1為正樣本的權(quán)重系數(shù),取值范圍為[0,1],γ為調(diào)制系數(shù)。式(6)中α2為正樣本的權(quán)重系數(shù)。

根據(jù)參考文獻(xiàn)[27]給出的建議,定義損失函數(shù)各參數(shù)的取值:β=0.5,α1=0.98,α2=0.98,γ=2。

1.3 前景分割與篩選

獲取前景熱力圖后,需要經(jīng)過后端處理完成前景推斷。首先進(jìn)行前景/背景分類,使用全局閾值法分割熱力圖M,設(shè)定閾值t=50%,則置信度大于t的像素分類為前景,小于等于t的像素分類為背景。分割后的圖像記為MS。

前景異物在圖像中的輪廓具有一定面積,構(gòu)成風(fēng)險(xiǎn)異物的最小尺寸[28-29]為50 mm×50 mm×50 mm。記物體在圖片中的像素面積占圖片像素總面積之比為δ,根據(jù)攝像機(jī)線性模型[30],物體離攝像機(jī)投影面越遠(yuǎn)δ越小,經(jīng)測(cè)試,實(shí)驗(yàn)現(xiàn)場(chǎng)中最小風(fēng)險(xiǎn)異物在測(cè)試區(qū)域內(nèi)最小的δ=0.055 339%,因此使用輪廓提取法[31]提取MS中所有前景輪廓,并剔除δ<0.05%的輪廓連通域,得到最終的前景分割結(jié)果。

2 數(shù)據(jù)集

2.1 數(shù)據(jù)采集

本實(shí)驗(yàn)在廣州地鐵公司的配合下進(jìn)行專門的數(shù)據(jù)采集。每次采集前關(guān)閉列車門與屏蔽門,拍攝此時(shí)的圖像作為背景圖片,然后打開列車門與屏蔽門,在保證安全的前提下手動(dòng)放置異物在間隙區(qū)域,再關(guān)閉列車門與屏蔽門,拍攝此時(shí)的圖像作為待檢測(cè)圖片,由此得到一組樣本,本實(shí)驗(yàn)一共采集了158組樣本。

2.2 數(shù)據(jù)增廣

對(duì)原樣本進(jìn)行以下3個(gè)步驟的處理:

步驟1 添加前景異物貼圖。為了更好地引導(dǎo)模型學(xué)習(xí)通過對(duì)比特征差異推斷前景的能力,在待檢測(cè)圖片中加入異物貼圖。一共準(zhǔn)備了16個(gè)異物貼圖,在待檢測(cè)圖片的間隙區(qū)域中隨機(jī)添加1~3個(gè)異物貼圖,每個(gè)貼圖隨機(jī)旋轉(zhuǎn)并覆蓋在隨機(jī)位置,根據(jù)其位置調(diào)整縮放尺寸,添加異物貼圖的同時(shí)修改該區(qū)域的標(biāo)簽。

步驟2 添加高斯光斑。為提高模型抵抗光線干擾的能力,在背景圖片和待檢測(cè)圖片中添加5個(gè)位置、尺寸、強(qiáng)度隨機(jī)的噪聲區(qū)域。每個(gè)噪聲區(qū)域服從二維高斯分布。

步驟3 添加高斯噪聲。為了提高泛化能力,對(duì)背景圖片和待檢測(cè)圖片中的所有像素添加隨機(jī)強(qiáng)度的一維微小高斯噪聲。

為了更好地評(píng)估算法,增大測(cè)試集的選取比例,在所采集的樣本中隨機(jī)選取60組樣本,每組樣本應(yīng)用以上方法生成20組新樣本,由此得到1 200組樣本,將這些樣本作為訓(xùn)練集。將原樣本中剩下的98組樣本作為測(cè)試集,組成一共1 298組樣本的數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)。圖6展示了一組樣本數(shù)據(jù)增廣前后的對(duì)比圖片。

圖6 數(shù)據(jù)增廣前后對(duì)比Fig.6 Comparison before and after data augmentation

3 實(shí)驗(yàn)

所有實(shí)驗(yàn)在一臺(tái)計(jì)算機(jī)上進(jìn)行,計(jì)算機(jī)的參數(shù)為:CPU,Intel 9700K;GPU,Nvidia RTX2070s;內(nèi)存,16 GB。數(shù)據(jù)集中所有圖片的分辨率均為480×640,將其調(diào)整為240×320輸入網(wǎng)絡(luò),使用Adam[32]優(yōu)化器對(duì)網(wǎng)絡(luò)參數(shù)進(jìn)行訓(xùn)練,初始學(xué)習(xí)率0.001,衰減率0.98。

3.1 評(píng)價(jià)指標(biāo)

文中采用5個(gè)指標(biāo)對(duì)模型進(jìn)行評(píng)價(jià),包括準(zhǔn)確性指標(biāo):精確率P、召回率R、調(diào)和均值F1、交并比cIoU,和速度指標(biāo):運(yùn)行用時(shí)。

精確率、召回率、調(diào)和均值是機(jī)器學(xué)習(xí)常用的評(píng)價(jià)指標(biāo),計(jì)算式如下,

(7)

(8)

(9)

圖像分割任務(wù)常使用交并比作為算法的準(zhǔn)確性指標(biāo),它的計(jì)算如式(10)所示,本文任務(wù)更關(guān)心的是對(duì)異物的分類,因此計(jì)算前景類的交并比:

(10)

式(7)~(10)中:NTP表示分類正確的正樣本數(shù)量,NFP表示分類錯(cuò)誤的正樣本數(shù)量,NFN表示分類錯(cuò)誤的負(fù)樣本數(shù)量,所有樣本皆以像素為單位。

3.2 與傳統(tǒng)方法對(duì)比

本文通過實(shí)驗(yàn)將DifferentNet與傳統(tǒng)計(jì)算機(jī)視覺方法進(jìn)行對(duì)比,參與對(duì)比的傳統(tǒng)方法有:幀差法、GMM[5]、Vibe[7]、SuBSENSE[8]。實(shí)驗(yàn)結(jié)果如表1所示,其中傳統(tǒng)方法在CPU環(huán)境中運(yùn)行,基于深度學(xué)習(xí)的DifferentNet在GPU環(huán)境中運(yùn)行??梢钥闯觯瑐鹘y(tǒng)方法的準(zhǔn)確性較低,而DifferentNet在準(zhǔn)確性上大幅領(lǐng)先于其他方法。圖7展示了一組DifferentNet與傳統(tǒng)方法的檢測(cè)結(jié)果對(duì)比,從中可以看到,傳統(tǒng)計(jì)算機(jī)視覺方法的抗干擾能力差,光照變化會(huì)對(duì)檢測(cè)結(jié)果造成較大影響,其中幀差法的抗干擾能力最低,GMM、SuBSENSE的抗干擾能力略優(yōu)于幀差法,但檢測(cè)準(zhǔn)確性仍非常低,而本文的方法DifferentNet較好地克服了光照干擾,并準(zhǔn)確檢測(cè)出了異物輪廓。

表1 DifferentNet與傳統(tǒng)方法的性能對(duì)比Table 1 Performance comparison between DifferentNet and se-veral traditional methods

圖7 DiferentNet與幾種傳統(tǒng)方法檢測(cè)結(jié)果示例Fig.7 Examples of detection results from DiferentNet and se-veral traditional methods

3.3 不同網(wǎng)絡(luò)對(duì)比

為證明本文假設(shè),即:神經(jīng)網(wǎng)絡(luò)在有背景圖片參考的情況下,對(duì)異物的前景檢測(cè)將更加準(zhǔn)確;并證明本文網(wǎng)絡(luò)在地鐵異物前景檢測(cè)中的優(yōu)勢(shì)。將DifferentNet與6種語義分割網(wǎng)絡(luò)進(jìn)行對(duì)比,參與對(duì)比的網(wǎng)絡(luò)有UNet[10]、GCN[13]、SegNet[11]、PSPNet[33]、RefineNet[34]、DeepLabV3+[16]。這些網(wǎng)絡(luò)屬于單圖片輸入網(wǎng)絡(luò),因此它們?cè)谥猾@取待檢測(cè)圖片作為輸入的情況下進(jìn)行訓(xùn)練和測(cè)試,輸出前景熱力圖,并進(jìn)行與1.3節(jié)相同的閾值分割和輪廓篩選步驟,實(shí)驗(yàn)結(jié)果如表2所示。通過更改前景分割的置信度閾值t,得到各網(wǎng)絡(luò)的P-R曲線,如圖8所示。由實(shí)驗(yàn)結(jié)果,較新的分割網(wǎng)絡(luò)DeepLabV3+與RefineNet、GCN、PSPNet的表現(xiàn)優(yōu)于UNet與SegNet,而本文中提出的網(wǎng)絡(luò)在精確率、召回率、F1與cIoU上明顯高于其他網(wǎng)絡(luò),準(zhǔn)確性最高,但由于要對(duì)兩幅圖片進(jìn)行特征編碼與解碼,運(yùn)行用時(shí)比其他網(wǎng)絡(luò)長(zhǎng),大約為其他網(wǎng)絡(luò)的兩倍。

表2 DifferentNet與幾種語義分割網(wǎng)絡(luò)的性能對(duì)比Table 2 Performance comparison between DifferentNet and se-veral semantic segmentation networks

圖8 DifferentNet與幾種語義分割網(wǎng)絡(luò)的P-R曲線Fig.8 P-R curves of DifferentNet and several semantic segmentation networks

圖9展示了各網(wǎng)絡(luò)的部分檢測(cè)結(jié)果??梢钥吹剑珼ifferentNet檢測(cè)到的前景輪廓更加準(zhǔn)確。圖中第1、2行各圖片之間的光照有很大變化,這種變化是間隙區(qū)域內(nèi)的照明設(shè)備運(yùn)作變化導(dǎo)致,是對(duì)異物檢測(cè)造成干擾的因素之一。圖中的第1、2、6列,待檢測(cè)圖片中,屏蔽門與列車門的間隙底部的照明燈打開,而背景圖片中,照明燈未打開,使得待檢測(cè)圖片的亮度偏高,并出現(xiàn)了藍(lán)色的燈帶區(qū)域,在第4列中,側(cè)面的紅色照明燈閃爍造成背景圖片色調(diào)偏紅。這些光照因素會(huì)對(duì)檢測(cè)造成干擾,而由第4行的檢測(cè)結(jié)果看到,DifferentNet能很好地克服這一干擾。而其他網(wǎng)絡(luò),在無照明燈直射的情況下,有較好的檢測(cè)效果(如第3列),但在有照明燈干擾的情況下,會(huì)出現(xiàn)較多的偽陽性誤檢區(qū)域(如第6列)。

圖9 DifferentNet與幾種語義分割網(wǎng)絡(luò)的檢測(cè)結(jié)果示例Fig.9 Examples of detection results from DifferentNet and several segmentation networks

3.4 有無背景參考對(duì)比

為了進(jìn)一步證明本文的假設(shè),將DifferentNet在移除背景圖片影響的情況下進(jìn)行訓(xùn)練與測(cè)試,但原網(wǎng)絡(luò)在只輸入待檢測(cè)圖片的情況下無法正常進(jìn)行前向傳播,因此按以下思路分別設(shè)計(jì)兩組實(shí)驗(yàn)。

實(shí)驗(yàn)A:更改網(wǎng)絡(luò)結(jié)構(gòu)。將原網(wǎng)絡(luò)結(jié)構(gòu)中與背景圖片有關(guān)的部分移除。對(duì)待檢測(cè)圖片在編碼部分進(jìn)行特征提取后,直接將特征圖輸入解碼部分進(jìn)行后續(xù)計(jì)算。此時(shí)由于缺少背景圖片的特征圖與之連接,輸入解碼部分的各特征圖通道數(shù)減少一半,與原網(wǎng)絡(luò)解碼部分結(jié)構(gòu)不兼容,因此將解碼部分各卷積層的卷積核通道和數(shù)量縮減一半,使網(wǎng)絡(luò)能正常運(yùn)行。

實(shí)驗(yàn)B:保留原網(wǎng)絡(luò)結(jié)構(gòu)。在不改動(dòng)原網(wǎng)絡(luò)結(jié)構(gòu)的情況下,將背景圖片輸入替換為同尺寸的隨機(jī)噪聲輸入,噪聲強(qiáng)度服從均勻隨機(jī)分布,從而在訓(xùn)練過程中使網(wǎng)絡(luò)與背景圖片有關(guān)的參數(shù)向零回歸。

按以上思路分別進(jìn)行實(shí)驗(yàn),以相同的超參數(shù)重新訓(xùn)練與測(cè)試,實(shí)驗(yàn)結(jié)果如表3所示,P-R曲線對(duì)比如圖10所示。分析實(shí)驗(yàn)結(jié)果可得,實(shí)驗(yàn)A與實(shí)驗(yàn)B的各項(xiàng)準(zhǔn)確性指標(biāo)相對(duì)于原實(shí)驗(yàn)都有一定程度的下降,其中實(shí)驗(yàn)A的準(zhǔn)確性下降幅度更大,但速度得到了明顯提升,該現(xiàn)象可能是減少通道數(shù)所導(dǎo)致的。由此得出,在缺少背景圖片作為輸入的情況下,網(wǎng)絡(luò)的準(zhǔn)確性有所下降。實(shí)驗(yàn)A由于縮減了網(wǎng)絡(luò)規(guī)模,運(yùn)行速度得到提升,但更改了網(wǎng)絡(luò)結(jié)構(gòu),因此本文認(rèn)為實(shí)驗(yàn)B與原實(shí)驗(yàn)的對(duì)比更具公平性。

表3 DifferentNet有/無背景參考的性能對(duì)比Table 3 Performance comparison of DifferentNet with or without background reference

圖10 DifferentNet有/無背景參考下的P-R曲線Fig.10 P-R curves of DifferentNet with or without background reference

實(shí)驗(yàn)A的方法與3.2節(jié)中的其他單圖片輸入網(wǎng)絡(luò)相比,在速度較快的同時(shí)在各項(xiàng)準(zhǔn)確性指標(biāo)上總體處于領(lǐng)先位置。實(shí)驗(yàn)B與原實(shí)驗(yàn)對(duì)比,精確率下降并不明顯,但召回率、cIoU都有較大下滑,這表明在缺少背景參考的情況下,神經(jīng)網(wǎng)絡(luò)的前景檢測(cè)性能有所下降,雖保持較高的精確率,但會(huì)遺漏部分前景區(qū)域。通過分析,該現(xiàn)象的原因可能是在缺少背景參考的情況下,網(wǎng)絡(luò)無法辨別部分與背景差異不明顯的前景區(qū)域所導(dǎo)致。圖11展示了一個(gè)上述情況的案例,圖中異物的邊緣部分與背景區(qū)域相似,在缺少背景參考的情況下,網(wǎng)絡(luò)對(duì)邊緣部分的檢測(cè)效果不佳,而在有背景參考的情況下,網(wǎng)絡(luò)能更準(zhǔn)確地判斷這部分區(qū)域。

圖11 DifferentNet有/無背景參考下的檢測(cè)結(jié)果示例Fig.11 Examples of detection results for DifferentNet with or without background references

3.5 解碼部分卷積核數(shù)量對(duì)比

通過3.2節(jié)的實(shí)驗(yàn)發(fā)現(xiàn),DifferentNet在準(zhǔn)確性指標(biāo)上有著較好的表現(xiàn),并達(dá)到了實(shí)時(shí)運(yùn)行的要求,但速度低于表3中的其他網(wǎng)絡(luò)。通過3.3節(jié)實(shí)驗(yàn)A發(fā)現(xiàn),在移除網(wǎng)絡(luò)中與背景圖片有關(guān)的部分并減少解碼部分卷積核數(shù)量的情況下,網(wǎng)絡(luò)的準(zhǔn)確性下降但運(yùn)行速度得到了較大提升。通過對(duì)表3的分析,得知性能下降的主要原因與缺少背景參考有關(guān),同時(shí),本文認(rèn)為網(wǎng)絡(luò)的準(zhǔn)確性與卷積核數(shù)量之間可能存在聯(lián)系。為了在保持準(zhǔn)確性的同時(shí)提高DifferentNet的運(yùn)行速度,并探究卷積核數(shù)量對(duì)原網(wǎng)絡(luò)的影響,設(shè)計(jì)了以下實(shí)驗(yàn):保留背景圖片作為參考,并保持編碼部分與原實(shí)驗(yàn)相同,減少解碼部分的卷積核數(shù)量與通道數(shù),以相同的步驟重新進(jìn)行訓(xùn)練與測(cè)試,一共進(jìn)行了2組實(shí)驗(yàn)。

實(shí)驗(yàn)C:通過減少解碼部分的卷積核通道與數(shù)量,將圖5中各模塊輸出特征圖的通道數(shù)減少到原來的1/4,此時(shí)解碼部分的卷積核數(shù)量為原來的39.3%。

實(shí)驗(yàn)D:通過減少解碼部分的卷積核通道與數(shù)量,將圖5中各模塊輸出特征圖的通道數(shù)減少到原來的1/2,此時(shí)解碼部分的卷積核數(shù)量為原來的57.0%。

實(shí)驗(yàn)結(jié)果如表4所示,其P-R曲線如圖12所示。由實(shí)驗(yàn)結(jié)果得知,在實(shí)驗(yàn)D中,相較于原實(shí)驗(yàn),除召回率有輕微提升外,準(zhǔn)確性指標(biāo)總體有較小下降,而運(yùn)行速度有明顯提升,參數(shù)量也大幅降低。在實(shí)驗(yàn)C中,相較于原實(shí)驗(yàn),準(zhǔn)確性指標(biāo)總體降幅較大,相較于實(shí)驗(yàn)D,運(yùn)行速度雖有提升,但提升的幅度較小。本文認(rèn)為造成該現(xiàn)象的原因是,隨著卷積核數(shù)量的下降,當(dāng)其低于必要的數(shù)目后,解碼部分的分析能力會(huì)出現(xiàn)明顯下降,而且,輸入解碼部分的特征圖通道數(shù)不變,導(dǎo)致解碼部分中一部分卷積核的通道數(shù)無法縮減,使得參數(shù)量和運(yùn)行用時(shí)的降幅也受到制約。

圖12 DifferentNet在不同卷積核數(shù)量的解碼器下的P-R曲線Fig.12 P-R curves of DifferentNet decoder with different number of convolution kernels

表4 DifferentNet在不同數(shù)量卷積核的解碼器下的性能對(duì)比Table 4 DifferentNet performance comparison for decoders with different number of convolution kernels

綜合以上分析,原實(shí)驗(yàn)中的卷積核數(shù)量是必要的,在算力充足的情況下應(yīng)采用原實(shí)驗(yàn)的方案,在實(shí)時(shí)性要求較高的場(chǎng)合可采用實(shí)驗(yàn)D的方案。

3.6 不同上采樣方式對(duì)比

在計(jì)算機(jī)視覺算法中,通常使用上采樣操作對(duì)特征圖進(jìn)行解碼,一些文獻(xiàn)中[33-34]使用雙線性插值+卷積的方式進(jìn)行上采樣,而另一些文獻(xiàn)中[10-12]則通過轉(zhuǎn)置卷積上采樣。本文在解碼模塊的設(shè)計(jì)中,通過實(shí)驗(yàn)探究了DifferentNet在兩種上采樣方式下的性能差異,實(shí)驗(yàn)結(jié)果如表5所示,P-R曲線如圖13所示。實(shí)驗(yàn)表明,本文方法采用轉(zhuǎn)置卷積進(jìn)行上采樣具有更好的效果。

表5 DifferentNet在不同上采樣方式下的性能對(duì)比Table 5 DifferentNet performance comparison in different upsampling modes

4 結(jié)語

為解決地鐵屏蔽門與列車門間隙區(qū)域異物檢測(cè)問題,本文中提出假設(shè):在有背景參考的情況下神經(jīng)網(wǎng)絡(luò)能更好的檢測(cè)異物,并基于該假設(shè)提出了一種新的前景檢測(cè)方法,主要通過深度神經(jīng)網(wǎng)絡(luò)對(duì)比待檢測(cè)圖片與背景圖片的差異,從而分割得到前景區(qū)域。為了有效關(guān)聯(lián)兩幅圖片的特征并計(jì)算特征差異,本文網(wǎng)絡(luò)在各尺度上連接兩幅圖片在編碼部分得到的特征圖,在解碼部分通過跳躍連接和逐步轉(zhuǎn)置卷積的方式恢復(fù)特征尺寸,得到前景熱力圖,最后經(jīng)閾值分割和輪廓篩選得到前景檢測(cè)結(jié)果。為有效訓(xùn)練和測(cè)試網(wǎng)絡(luò),在地鐵現(xiàn)場(chǎng)進(jìn)行了專門的數(shù)據(jù)采集,并通過一系列數(shù)據(jù)增廣方法提高網(wǎng)絡(luò)的泛化能力。通過實(shí)驗(yàn),證明了本文的假設(shè),并在與傳統(tǒng)方法及其他分割網(wǎng)絡(luò)的對(duì)比中證明了本文方法在準(zhǔn)確性上的優(yōu)勢(shì)。本文方法在RTX2070s上的運(yùn)行速度為30幀/s,可實(shí)時(shí)運(yùn)行,但與其他方法相比,運(yùn)行速度仍較慢,因此本文探討了縮減解碼部分卷積核數(shù)量對(duì)本文方法的影響,并得到一種較為可行的優(yōu)化方案。本文方法在地鐵異物檢測(cè)任務(wù)中取得了較好的效果,同時(shí)為其他前景檢測(cè)任務(wù)算法設(shè)計(jì)提供了新的參考。

猜你喜歡
解碼異物前景
食管異物不可掉以輕心
如何處理異物進(jìn)入眼睛
農(nóng)業(yè)好前景 品牌來引領(lǐng)
我國旅游房地產(chǎn)開發(fā)前景的探討
文化解碼
解碼eUCP2.0
離岸央票:需求與前景
文化 解碼
文明 解碼
眼耳鼻進(jìn)異物咋處理
海城市| 马山县| 彰化县| 朝阳市| 综艺| 贺兰县| 南溪县| 项城市| 繁昌县| 台中县| 淮滨县| 怀仁县| 电白县| 栾城县| 郯城县| 封开县| 金昌市| 普陀区| 淮阳县| 金堂县| 延安市| 霍城县| 固安县| 香格里拉县| 南涧| 延边| 磴口县| 九龙城区| 台南市| 阳山县| 南漳县| 桦川县| 伊吾县| 洛南县| 卢氏县| 凤阳县| 伊宁市| 卓资县| 托克托县| 磐石市| 西丰县|