国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于卷積神經(jīng)網(wǎng)絡(luò)的多分支軌道區(qū)域檢測(cè)算法

2022-07-29 06:54陳雨潤(rùn)張軒雄
關(guān)鍵詞:卷積分支實(shí)例

陳雨潤(rùn),張軒雄

(上海理工大學(xué) 光電信息與計(jì)算機(jī)工程學(xué)院,上海 200093)

0 引言

隨著科學(xué)技術(shù)的不斷進(jìn)步,軌道交通的發(fā)展也受到了學(xué)界的高度重視,國(guó)內(nèi)在軌道交通的研究與建設(shè)上也取得了一系列可觀的成就。由于鐵路交通網(wǎng)的覆蓋網(wǎng)絡(luò)愈加復(fù)雜以及列車(chē)行駛速度的提升,軌道交通不僅在物流領(lǐng)域占據(jù)著舉足輕重的位置,在客運(yùn)出行方面也發(fā)揮著日益重要的作用。與之相適應(yīng),社會(huì)各界對(duì)軌道交通安全性方面的要求也不斷提高。在各種軌道交通系統(tǒng)中,軌道交通事故大多是人為操作不當(dāng)或列車(chē)與軌道區(qū)域內(nèi)發(fā)生障礙碰撞造成的。因此,使列車(chē)能夠主動(dòng)感知障礙已成為一種趨勢(shì)。為了解決上述問(wèn)題,軌道交通主動(dòng)障礙物感知系統(tǒng)的基本功能之一就是軌道區(qū)域檢測(cè),即確定列車(chē)前方的軌道區(qū)域。準(zhǔn)確的軌道區(qū)域檢測(cè)不僅可以提供列車(chē)的精確行駛區(qū)域,還可以為檢測(cè)障礙物劃定感興趣區(qū)域。此外,準(zhǔn)確的軌道區(qū)域檢測(cè)可以確定圖像中軌道面積的最大范圍,從而為列車(chē)提供速度推薦。因此,如何快速、準(zhǔn)確地檢測(cè)軌道區(qū)域是本文研究的重點(diǎn)。

在過(guò)去的幾十年里,雖然軌道區(qū)域檢測(cè)的研究取得了豐富的成果,但仍存在許多挑戰(zhàn)亟待克服。如:在開(kāi)放的軌道環(huán)境中運(yùn)行,列車(chē)將面臨光線變化,主要表現(xiàn)在陰影、反射、進(jìn)入隧道、與地面對(duì)比度差等方面;軌道區(qū)域除直線外,往往存在彎道較大,曲率不固定的問(wèn)題;此外,多個(gè)軌道結(jié)構(gòu)混亂也使得軌道區(qū)域的檢測(cè)更加困難。

盡管基于視覺(jué)的鐵路檢測(cè)方法仍然需要進(jìn)行許多改進(jìn),但由于圖像信息豐富、視覺(jué)傳感器成本低,基于視覺(jué)的軌道區(qū)域檢測(cè)仍是一種有前景的方法。隨著計(jì)算機(jī)視覺(jué)的快速發(fā)展、尤其是深度學(xué)習(xí)的發(fā)展,使得利用視覺(jué)方法解決上述問(wèn)題已成為可能。

目前,針對(duì)鐵路軌道區(qū)域的研究相對(duì)較少,而傳統(tǒng)的軌道區(qū)域檢測(cè)主要采用形態(tài)學(xué)的方法,提取出待檢測(cè)鐵路的軌道區(qū)域圖像和鐵路圖像的特征差異,如方向、紋理、輪廓、灰度等方面,針對(duì)差異對(duì)軌道區(qū)域進(jìn)行檢測(cè),并將結(jié)果進(jìn)行閾值化處理;通過(guò)調(diào)整閾值參數(shù),分割出軌道內(nèi)區(qū)域和軌道外區(qū)域,最終配合提取的梯度特征,對(duì)真實(shí)軌道進(jìn)行曲線擬合。傳統(tǒng)方法的原理,本質(zhì)上是將軌道區(qū)域檢測(cè)的研究抽象成為求解模型最優(yōu)參數(shù)的問(wèn)題。文獻(xiàn)[4]中提出了一種通過(guò)對(duì)邊緣特征點(diǎn)進(jìn)行聚類(lèi)的檢測(cè)方法,提取出車(chē)道線的邊緣特征點(diǎn),并對(duì)其進(jìn)行聚類(lèi)、從而擬合出車(chē)道線。文獻(xiàn)[5]改進(jìn)了一種隨機(jī)抽樣一致性算法,實(shí)現(xiàn)軌道線識(shí)別。但此類(lèi)型的算法仍然避免不了對(duì)噪聲的敏感性,在惡劣的場(chǎng)景下、如軌道區(qū)域模糊或受到遮擋時(shí)穩(wěn)定性不高。

近年來(lái),隨著深度神經(jīng)網(wǎng)絡(luò)熱潮的興起,深度神經(jīng)網(wǎng)絡(luò)在軌道交通中的應(yīng)用也受到研究學(xué)界的普遍青睞。雖然基于CNN 的方法通過(guò)強(qiáng)大的學(xué)習(xí)能力將場(chǎng)景理解推向了一個(gè)新的水平,但CNN 并沒(méi)有充分探索圖像行與列之間像素空間關(guān)系,而這些關(guān)系對(duì)于模型學(xué)習(xí)具有強(qiáng)形狀先驗(yàn)、弱外觀(圖像像素)連貫性的語(yǔ)義對(duì)象來(lái)說(shuō)是非常重要的。由于軌道線在圖像視頻中出現(xiàn)的形式一般是修長(zhǎng)的細(xì)弧線或直線,所以需要高、低層次的特征融合來(lái)獲得大感受野的結(jié)構(gòu)信息,以及精準(zhǔn)定位細(xì)節(jié)處。SCNN改進(jìn)了CNN 卷積層之間的卷積的方式,采用逐層卷積,使得上下文信息能夠在行與列之間傳遞。SCNN 的結(jié)構(gòu)更適用檢測(cè)修長(zhǎng)的連續(xù)形狀、但外觀線索較少的物體。例如,電線桿、墻壁和軌道線等,但其推理時(shí)間上也相應(yīng)地有了明顯增加。VPGNet提出一個(gè)統(tǒng)一的端到端的可訓(xùn)練多任務(wù)網(wǎng)絡(luò),可以檢測(cè)到極端惡劣天氣下的消失點(diǎn)引導(dǎo)的車(chē)道和道路標(biāo)記,并在其貢獻(xiàn)的數(shù)據(jù)集上取得了不錯(cuò)的表現(xiàn)。但是此方法依賴于人工標(biāo)注消失點(diǎn)信息,加大了研究的工作量。

為了高效解決軌道區(qū)域檢測(cè)的問(wèn)題,并針對(duì)其場(chǎng)景復(fù)雜多變的特點(diǎn),本文提出了一種多分支多尺度的軌道區(qū)域檢測(cè)算法。該方法通過(guò)對(duì)多尺度輸入的圖像進(jìn)行語(yǔ)義分割,充分利用在編碼階段產(chǎn)生的大量特征信息,并將部分編碼后的結(jié)果進(jìn)行實(shí)例分割,再融合兩分支結(jié)果得到分割的結(jié)果。方法中還加入輕量級(jí)CNN 分類(lèi)網(wǎng)絡(luò)用于實(shí)例數(shù)量預(yù)測(cè),最終得到圖像中多個(gè)軌道區(qū)域經(jīng)過(guò)分割后的實(shí)例。

1 基本原理

本文以軌道區(qū)域?yàn)檠芯繉?duì)象,設(shè)計(jì)了一種三分支軌道區(qū)域?qū)嵗指钌疃染矸e神經(jīng)網(wǎng)絡(luò),模型整體結(jié)構(gòu)如圖1 所示。算法基于laneNet的設(shè)計(jì)思想,將軌道區(qū)域的實(shí)例分割任務(wù)進(jìn)行拆分。其中,一條分支用于語(yǔ)義分割,主要負(fù)責(zé)提取出軌道區(qū)域的特征;一條分支用于實(shí)例分割,主要負(fù)責(zé)在類(lèi)別上區(qū)別軌道區(qū)域和背景,將特征映射到多維空間;一條分支用于對(duì)列車(chē)當(dāng)前所處軌道進(jìn)行預(yù)測(cè)。本文提出的多分支軌道區(qū)域檢測(cè)算法,根據(jù)語(yǔ)義分割分支所預(yù)測(cè)出的二值結(jié)果,提取實(shí)例分割結(jié)果中的車(chē)道線位置像素的多維特征,以實(shí)例數(shù)預(yù)測(cè)分支的結(jié)果為監(jiān)督信息,對(duì)結(jié)果進(jìn)行多邊形擬合,最終得到預(yù)測(cè)的軌道預(yù)測(cè)區(qū)域。

圖1 模型整體架構(gòu)Fig.1 Overall architecture of the model

1.1 語(yǔ)義分割分支

語(yǔ)義分割分支作為整個(gè)網(wǎng)絡(luò)的主干分支,首要功能就是提取特征信息。語(yǔ)義分割是像素級(jí)別的分類(lèi)任務(wù),目前主流的方式是通過(guò)編碼-解碼網(wǎng)絡(luò)。FCN通過(guò)全卷積的方式保留了圖像空間信息,丟棄傳統(tǒng)CNN 的全連接層,網(wǎng)絡(luò)的輸出不再是類(lèi)別標(biāo)量而是heatmap。通過(guò)跳級(jí)、連接融合不同深度層的結(jié)果,即是提高模型整體的魯棒性和穩(wěn)定性。同時(shí),F(xiàn)CN 網(wǎng)絡(luò)恢復(fù)階段采用上采樣的方式,來(lái)削減池化和卷積對(duì)于圖像尺寸所帶來(lái)的影響。語(yǔ)義分割分支的主體網(wǎng)絡(luò)結(jié)構(gòu)由多尺度融合輸入與FCN 網(wǎng)絡(luò)結(jié)合改進(jìn)的ASPP 模塊組成。在已有的軌道區(qū)域檢測(cè)研究基礎(chǔ)上,針對(duì)車(chē)載高清攝像頭清晰度不夠、列車(chē)嵌入式設(shè)備計(jì)算資源有限導(dǎo)致的精度受損、實(shí)時(shí)性較差等問(wèn)題,本文語(yǔ)義分割分支在經(jīng)典FCN 像素級(jí)別語(yǔ)義分割網(wǎng)絡(luò)的基礎(chǔ)上進(jìn)行了改進(jìn)。整體采用輕量級(jí)的全卷積網(wǎng)絡(luò),實(shí)現(xiàn)軌道區(qū)域的檢測(cè);加入改進(jìn)后的空間空洞金字塔池化模塊(ASPP)以保留上下文信息,而后又利用多尺度特征融合的方式,提高模型整體語(yǔ)義分割的效果。

多尺度的含義包括3 個(gè)方面:

(1)圖像輸入多尺度。網(wǎng)絡(luò)輸入圖像使用64×128 像素、128×256 像素、256×512 像素三種分辨率。

(2)串行融合多尺度。模型將淺層語(yǔ)義和深層語(yǔ)義進(jìn)行跳接,將2 種尺度的信息進(jìn)行融合。

(3)并行融合多尺度。通過(guò)改進(jìn)空洞空間金字塔池化模塊,融合多個(gè)并行分支的特征信息。設(shè)計(jì)實(shí)現(xiàn)過(guò)程具體如下。

(1)編碼階段:首先對(duì)高分辨率、低輸入圖像進(jìn)行33 卷積預(yù)提取特征,再使用ResNet 基礎(chǔ)模塊進(jìn)行深度編碼和特征提取、并進(jìn)行1/2 下采樣,同時(shí)又與經(jīng)過(guò)中分辨率預(yù)提取后的特征進(jìn)行融合,融合后將以類(lèi)似方式與低分辨率預(yù)提取后的特征進(jìn)行融合。

(2)解碼階段:對(duì)融合特征圖使用改進(jìn)后的ASPP 模塊提取深度特征的同時(shí)擴(kuò)大感受野,使用反卷積進(jìn)行上采樣;解碼過(guò)程中通過(guò)跳級(jí)連接的方式,融合淺層信息和原始信息,而后恢復(fù)特征圖,進(jìn)而得到語(yǔ)義分割分支的結(jié)果。

1.2 改進(jìn)的空洞空間金字塔池化

池化是卷積神經(jīng)網(wǎng)絡(luò)中非常重要的基礎(chǔ)操作,能夠在保持特征圖尺度不變的情況下,增加特征圖的感受野,并減少神經(jīng)網(wǎng)絡(luò)的計(jì)算參數(shù)。在VGG這種中小規(guī)模級(jí)別的網(wǎng)絡(luò)中,常使用最大池化(max-pooling)或平均池化(average-pooling)的方式,而大型、重型規(guī)模的網(wǎng)絡(luò)中、如ResNet,往往選擇使用帶有步長(zhǎng)的卷積來(lái)增大特征圖的感受野,但上述2 種下采樣方式均會(huì)丟失上下文的信息,最終影響模型精度??臻g金字塔池化(Spatial Pyramid Pooling)通過(guò)拼接上下多層特征圖的金字塔信息,用于進(jìn)行全連接計(jì)算,在算法開(kāi)銷(xiāo)幾乎不變的情況下,使精度得到提升。Chen 等人首次將ASPP 模塊引入到deeplab 系列中,使得在不進(jìn)行下采樣的情況下能實(shí)現(xiàn)更精準(zhǔn)的特征映射。增大了的卷積核的感受野,能夠收集到更大跨度的上下文語(yǔ)義信息,可以更有效地捕捉物體多尺度的特征,同時(shí)并行處理不同采樣率的空洞卷積,如此可達(dá)到加速運(yùn)算目的。ASPP 模塊結(jié)構(gòu)如圖2 所示。

圖2 ASPP 模塊結(jié)構(gòu)圖Fig.2 The architecture of ASPP model

為了降低網(wǎng)絡(luò)的參數(shù)量、從而加速模型推理速度,本文對(duì)空洞卷積操作進(jìn)行了簡(jiǎn)化,使用采樣率8、4、2 的卷積層分別可得到31×31、15×15、7×7 尺寸的感受野,并且使用跳層連接的方式,既減少了上下文語(yǔ)義信息的丟失,同時(shí)也有助于模型訓(xùn)練時(shí)加速收斂。改進(jìn)后的ASPP 模塊如圖3 所示。

圖3 改進(jìn)后的ASPP 模塊結(jié)構(gòu)圖Fig.3 The architecture of improved ASPP model

1.3 實(shí)例分割分支

Brabandere 等人提出一種基于度量學(xué)習(xí)用于實(shí)例分割的算法。研究中,訓(xùn)練了CNN 神經(jīng)網(wǎng)絡(luò)并通過(guò)自定義的損失函數(shù)得到一種度量標(biāo)準(zhǔn)(Metric),其本質(zhì)是將圖像從像素空間映射到高維度空間。在高維度空間中,經(jīng)過(guò)映射后的像素點(diǎn),若屬于相同的實(shí)例或者同類(lèi),則、距離接近,反之,、距離較遠(yuǎn),基于此將通過(guò)聚類(lèi)的方式完成不同實(shí)例間的分割。為了使得圖像中同實(shí)例的像素在映射空間中的向量相互接近,不同實(shí)例的像素在映射空間中聚類(lèi)的中心點(diǎn)要盡可能地相互遠(yuǎn)離。損失函數(shù)設(shè)計(jì)的原理公式如下:

其中,為實(shí)例總數(shù)(軌道線);S為該實(shí)例(軌道線數(shù)目)的像素點(diǎn)數(shù); x為像素點(diǎn)映射之后在高維空間的坐標(biāo);μ為實(shí)例像素映射后在高維空間的中心坐標(biāo);C、C表示不同的實(shí)例;‖ * ‖ 表示距離;[]max(0,);L表示該分支總損失;L表示方差損失;L表示距離損失;L為正則項(xiàng);超參數(shù)設(shè)置為δ=0.75、δ=2.0、1、0.005。

在此方法基礎(chǔ)上,由于語(yǔ)義分割分支和實(shí)例分割分支特征大部分相同,為提高網(wǎng)絡(luò)推理速度,本文將實(shí)例分割分支和語(yǔ)義分割分支在網(wǎng)絡(luò)初始階段的部分編碼網(wǎng)絡(luò)進(jìn)行共享,使得2 個(gè)分支在分別擁有獨(dú)立編碼網(wǎng)絡(luò)結(jié)構(gòu)的情況下,整體網(wǎng)絡(luò)結(jié)構(gòu)相似。2個(gè)不同任務(wù)分支的最大差別在于,實(shí)例分割分支最后一層卷積所使用的卷積核個(gè)數(shù)的含義是上述方法中多維空間所代表的維度數(shù)量。經(jīng)過(guò)實(shí)驗(yàn)比對(duì),選用X=5,在五維空間下的效果最好。

1.4 實(shí)例數(shù)預(yù)測(cè)分支

軌道區(qū)域預(yù)測(cè)分支的任務(wù),是預(yù)測(cè)出當(dāng)前視頻畫(huà)面中所存在的軌道數(shù)目。為了盡可能降低網(wǎng)絡(luò)的復(fù)雜度,提高網(wǎng)絡(luò)整體的運(yùn)算速度,網(wǎng)絡(luò)整體的架構(gòu)選為輕量級(jí)CNN 分類(lèi)網(wǎng)絡(luò),大量采用深度可分離卷積進(jìn)行計(jì)算量上的優(yōu)化,并且該分支圖像的輸入尺寸縮小為原始圖像的1/4。研究給出的網(wǎng)絡(luò)設(shè)計(jì)如圖4 所示,網(wǎng)絡(luò)的最終輸出為預(yù)測(cè)的分支數(shù)量。

圖4 實(shí)例數(shù)預(yù)測(cè)分支網(wǎng)絡(luò)圖Fig.4 Example number prediction branch network diagram

由于訓(xùn)練集中的軌道線數(shù)量的分布嚴(yán)重不平衡,多數(shù)情況下結(jié)果為1。日常圖像分類(lèi)的場(chǎng)景下,損失函數(shù)大多選擇多分類(lèi)交叉熵函數(shù)(cross entropy,CE)函數(shù),如下所示:

針對(duì)上述問(wèn)題,本文對(duì)交叉熵函數(shù)引入正則項(xiàng),避免部分標(biāo)簽擁有過(guò)高的置信度,增加類(lèi)別的內(nèi)聚,減少類(lèi)間耦合。經(jīng)過(guò)修正后的函數(shù)如下所示:

其中,為修正系數(shù)。修正后的損失函數(shù)使用標(biāo)簽平滑(Label Smoothing)技術(shù),該技術(shù)在圖像分類(lèi)任務(wù)上表現(xiàn)優(yōu)秀,結(jié)合本文方法的特點(diǎn),本分支選用的損失函數(shù)為修正后的交叉熵?fù)p失函數(shù)。

1.5 擬合算法

網(wǎng)絡(luò)輸出及擬合后輸出如圖5 所示。通過(guò)本文的方法可以很好地提取出鐵路區(qū)域,但此時(shí)的區(qū)域邊緣并不是特別精確(參見(jiàn)圖5(b)),需要加以改進(jìn),其效果見(jiàn)圖5(c)。因此,本文改進(jìn)了多邊形擬合方法,用于進(jìn)一步優(yōu)化軌道區(qū)域。盡管多邊形擬合方法在曲線多邊形擬合中應(yīng)用廣泛,但由于鐵路區(qū)域多邊形的特殊性,且對(duì)需要擬合的鐵路輪廓有豐富的先驗(yàn)知識(shí)。本文通過(guò)擬合軌道區(qū)域的2 側(cè)來(lái)簡(jiǎn)化擬合過(guò)程,提出了一種快速多邊形擬合方法來(lái)擬合道路區(qū)域??焖俣噙呅螖M合算法圖解如圖6所示。研究實(shí)現(xiàn)步驟具體如下:

圖5 網(wǎng)絡(luò)輸出及擬合后輸出Fig.5 The output image through convolutional neural network and the output image after fitting

由圖6(a)可知,提取鐵路區(qū)域輪廓的4 個(gè)邊界點(diǎn),分別用、、、表示。

從直線中找出離直線最遠(yuǎn)的點(diǎn),計(jì)算到直線的距離。如果大于預(yù)設(shè)的距離閾值,則將設(shè)置為新的邊界點(diǎn)。

重復(fù)步驟2,繼續(xù)尋找曲線和曲線之間的邊界點(diǎn),直至找到直線的所有邊界點(diǎn)。以同樣的方式尋找直線之間的邊界點(diǎn)。最終擬合出的多邊形見(jiàn)圖6(c)。

圖6 快速多邊形擬合算法圖解Fig.6 Illustration of fast polygon fitting

2 實(shí)驗(yàn)

2.1 數(shù)據(jù)集

由于對(duì)鐵路軌道區(qū)域檢測(cè)的研究相對(duì)較少,相關(guān)的開(kāi)源數(shù)據(jù)集十分有限,相比之下公路交通的車(chē)道線檢測(cè)研究上就豐富很多。本文數(shù)據(jù)來(lái)源于真實(shí)的鐵路軌道實(shí)驗(yàn)段線路,利用專(zhuān)業(yè)高清攝像頭進(jìn)行錄制采集,并通過(guò)專(zhuān)業(yè)軟件對(duì)視頻的每一幀進(jìn)行截取。一般情況下,鐵路軌道區(qū)域處于圖像的中下部分,標(biāo)注時(shí)盡量使圖片內(nèi)容與真實(shí)拍攝保持一致。此外,由于所采集的視頻中部分圖像幀比較模糊,需要?jiǎng)h除某些無(wú)法識(shí)別的幀。最終在盡可能保證不丟失原始場(chǎng)景細(xì)節(jié)的條件下,總計(jì)生成1 500張?jiān)紙D像,分辨率為1 920像素×1 080像素。部分圖像數(shù)據(jù)如圖7 所示。

圖7 數(shù)據(jù)樣例Fig.7 Data samples

本文使用的圖像數(shù)據(jù)的標(biāo)注,主要借鑒公路無(wú)人駕駛領(lǐng)域的標(biāo)注方式,使用專(zhuān)業(yè)的標(biāo)注軟件labelme,由專(zhuān)業(yè)人士對(duì)每張圖片的上軌道區(qū)域逐張標(biāo)注,最大程度地?cái)M合軌道區(qū)域,符合肉眼所觀察的效果。此后,將標(biāo)注點(diǎn)的坐標(biāo)與每張圖片逐一對(duì)應(yīng),保存為數(shù)據(jù)-標(biāo)簽對(duì)文件。

經(jīng)過(guò)數(shù)據(jù)處理與標(biāo)注后,為了提高神經(jīng)網(wǎng)絡(luò)的訓(xùn)練效果,本文結(jié)合實(shí)際情況,對(duì)圖像在垂直方向和水平方向上進(jìn)行翻轉(zhuǎn),并適當(dāng)調(diào)整圖像的對(duì)比度、亮度、飽和度,對(duì)數(shù)據(jù)進(jìn)行擴(kuò)充和增強(qiáng)處理,最終得到了3 000張圖像數(shù)據(jù)用于模型的訓(xùn)練。

2.2 評(píng)價(jià)標(biāo)準(zhǔn)

本文分割算法效果的評(píng)價(jià)標(biāo)準(zhǔn)選擇平均交并比()和類(lèi)別平均像素準(zhǔn)確率(),其計(jì)算公式如下:

其中,(1)表示類(lèi)別總數(shù);p表示類(lèi)的像素預(yù)計(jì)屬于類(lèi)的個(gè)數(shù),即真正;pp分別表示假正和假負(fù)像素的個(gè)數(shù)。由于本文算法的輸入分辨率是多尺度的,輸出分辨率為1 920×1 080 尺寸的圖像,評(píng)判結(jié)果時(shí)需要將圖像真實(shí)大小調(diào)整為與輸出相同的分辨率,以1 920×1 080 為基準(zhǔn)分辨率進(jìn)行計(jì)算評(píng)估。

2.3 模型訓(xùn)練

研究階段結(jié)合傳統(tǒng)算法和深度學(xué)習(xí)相關(guān)理論完成算法構(gòu)建,實(shí)驗(yàn)階段基于Intel i7-8750、Nvidia Titan X、Nvidia GeForceGTX 960 顯卡、CUDA8.0,并采用Python3 編程語(yǔ)言、OpenCV 庫(kù)函數(shù)與Pytorch框架實(shí)現(xiàn)算法內(nèi)容。本文將準(zhǔn)備好的訓(xùn)練數(shù)據(jù)和標(biāo)簽數(shù)據(jù)輸入到網(wǎng)絡(luò)中用來(lái)訓(xùn)練模型。

2.4 實(shí)驗(yàn)結(jié)果與分析

實(shí)驗(yàn)結(jié)果表明,在不同場(chǎng)景下都能很好地應(yīng)用本文方法,包括陰影、反射、隧道環(huán)境、高架環(huán)境和軌道切換場(chǎng)景。為了進(jìn)一步評(píng)價(jià)本文方法的有效性,特別是文中提出的多尺度融合方法和改進(jìn)的ASPP模塊。這里分別對(duì)未采用多尺度輸入模塊的模型和未使用改進(jìn)ASPP 模塊的模型進(jìn)行了對(duì)比實(shí)驗(yàn)。此外,將本文方法與目前最具代表性的語(yǔ)義分割方法SegNet、LaneNet、SCNN、Enet在SaQiang 數(shù)據(jù)集上進(jìn)行了精度的比較,實(shí)驗(yàn)比對(duì)結(jié)果見(jiàn)表1。部分實(shí)驗(yàn)結(jié)果可視化如圖8、圖9 所示。

表1 不同算法檢測(cè)結(jié)果對(duì)比Tab.1 Comparison results of different detection methods %

圖8 實(shí)驗(yàn)結(jié)果1Fig.8 Experimental results 1

圖9 實(shí)驗(yàn)結(jié)果2Fig.9 Experimental results 2

由表1 所見(jiàn),本文軌道區(qū)域檢測(cè)方法取得了較好的效果。文中提出的方法在SaQiang 數(shù)據(jù)集上取得了最好的精度,Mean達(dá)到94.54%,達(dá)到95.19%。主要原因是本文采用的多尺度融合和多分支方式,綜合考慮了軌道區(qū)域的整體特征和局部特征,從而充分挖掘了軌道區(qū)域的特征。此外,算法最后階段使用的多邊形擬合算法進(jìn)一步優(yōu)化了網(wǎng)絡(luò)模型的輸出,從而使得推理出的軌道區(qū)域的邊緣更加精確。SegNet、SCNN 和Enet 是目前比較流行的語(yǔ)義分割網(wǎng)絡(luò),據(jù)相關(guān)研究分析可知,這2 種網(wǎng)絡(luò)在大多數(shù)的語(yǔ)義分割任務(wù)中都能獲得很高的準(zhǔn)確率,但是在鐵路區(qū)域的檢測(cè)中的準(zhǔn)確率并不好,歸根究底就是這些網(wǎng)絡(luò)沒(méi)有充分考慮鐵路區(qū)域的特點(diǎn),因此在軌道區(qū)域檢測(cè)上也未能獲得良好性能。

除了性能上的分析,還通過(guò)實(shí)驗(yàn)評(píng)價(jià)了本文方法速度上的優(yōu)勢(shì)。實(shí)驗(yàn)中測(cè)試了該方法在單個(gè)廣泛使用的NVIDIA Titan X GPU 上的運(yùn)行性能,同時(shí),為了評(píng)價(jià)該方法在普通配置平臺(tái)上的運(yùn)行能力,還在Nvidia GeForceGTX 960 顯卡上進(jìn)行了實(shí)驗(yàn)。結(jié)果見(jiàn)表2。

表2 不同算法檢測(cè)速度對(duì)比Tab.2 Speed comparison of different detection methods

由表2 的對(duì)比結(jié)果可知,本文的方法在檢測(cè)速度方面達(dá)到了中等的性能。該網(wǎng)絡(luò)在單個(gè)Titan X上達(dá)到了23 幀以上的,在Nvidia GeForceGTX 960 上達(dá)到了6.5 幀以上的。雖然速度分?jǐn)?shù)不是唯一的評(píng)價(jià)標(biāo)準(zhǔn),但考慮到精度的原因,該方法在性能和速度之間取得了很好的平衡。

3 結(jié)束語(yǔ)

本文針對(duì)軌道區(qū)域檢測(cè)的問(wèn)題,運(yùn)用深度學(xué)習(xí)和傳統(tǒng)算法,提出了一種高性能的多分支的軌道區(qū)域檢測(cè)方法。該方法通過(guò)語(yǔ)義分割、實(shí)例分割、分類(lèi)網(wǎng)絡(luò)以及多邊形擬合算法獲取軌道區(qū)域信息,得到優(yōu)異的鋼軌區(qū)域輪廓。實(shí)驗(yàn)結(jié)果表明,該方法能夠在陰影、反射、隧道環(huán)境、高架環(huán)境和軌道切換場(chǎng)景等各種條件下實(shí)現(xiàn)高效的軌道區(qū)域檢測(cè)和對(duì)軌道區(qū)域的像素級(jí)分類(lèi),同時(shí)還一并兼顧了檢測(cè)的精度和速度。

通過(guò)實(shí)驗(yàn)結(jié)果分析,本文提出的檢測(cè)方法在某些場(chǎng)景中仍然存在不足。如:在道岔區(qū)域?qū)壍绤^(qū)域的檢測(cè)還存有一些偏差,效果不是特別理想;算法在速度上的性能還需要進(jìn)一步提高等。之后的研究中,將致力于克服上述缺點(diǎn),進(jìn)一步研究更輕量的網(wǎng)絡(luò),將軌道區(qū)域識(shí)別和障礙物檢測(cè)相結(jié)合,實(shí)現(xiàn)列車(chē)的實(shí)時(shí)主動(dòng)障礙物感知,為深度學(xué)習(xí)算法在軌道區(qū)域檢測(cè)的應(yīng)用落地提供一種可行的技術(shù)方案。

猜你喜歡
卷積分支實(shí)例
基于全卷積神經(jīng)網(wǎng)絡(luò)的豬背膘厚快速準(zhǔn)確測(cè)定
基于圖像處理與卷積神經(jīng)網(wǎng)絡(luò)的零件識(shí)別
基于深度卷積網(wǎng)絡(luò)與空洞卷積融合的人群計(jì)數(shù)
基于git工具的多分支并行開(kāi)發(fā)上線流程
用“分散數(shù)論”對(duì)“哥德巴赫猜想”的初等證明
含有二階冪零鞍點(diǎn)的雙同宿環(huán)附近的極限環(huán)分支
卷積神經(jīng)網(wǎng)絡(luò)概述
完形填空Ⅱ
完形填空Ⅰ
碩果累累