摘 要 視頻目標(biāo)跟蹤一直是計(jì)算機(jī)領(lǐng)域的熱點(diǎn)問題,近些年,深度學(xué)習(xí)等技術(shù)的發(fā)展使得目標(biāo)跟蹤算法的正確率獲得很大提升,但是目標(biāo)發(fā)生變化如被遮擋等情景時(shí),易導(dǎo)致跟蹤錯(cuò)誤,為了進(jìn)一步提高目標(biāo)跟蹤算法的準(zhǔn)確性,文中將在目標(biāo)跟蹤中引入新的算法,并對(duì)該流程做了系統(tǒng)概述。
關(guān)鍵詞 計(jì)算機(jī)領(lǐng)域;深度學(xué)習(xí);目標(biāo)跟蹤
本文主要通過基于目標(biāo)檢測(cè)的跟蹤算法,將視頻中的每一幀的目標(biāo)檢測(cè)出來,并將結(jié)果關(guān)聯(lián)成軌跡,從而確定每個(gè)行人目標(biāo)各自的運(yùn)動(dòng)軌跡。
基于目標(biāo)檢測(cè)的跟蹤分為兩大部分:行人檢測(cè)和行人跟蹤,行人檢測(cè)利用目標(biāo)檢測(cè)算法對(duì)視頻序列中的目標(biāo)進(jìn)行自動(dòng)檢測(cè)、確定其位置。行人跟蹤則主要根據(jù)檢測(cè)的結(jié)果跟蹤和識(shí)別目標(biāo),精準(zhǔn)地估計(jì)目標(biāo)的位置、尺寸和運(yùn)動(dòng)軌跡等。但是由于視頻場(chǎng)景存在復(fù)雜的非線性變化,有很大的不確定性 ,例如目標(biāo)遮擋等情況,因此,還引入了行人再識(shí)別[1]。
1Yolov3行人檢測(cè)算法
目標(biāo)檢測(cè)是將圖像中的目標(biāo)與其余區(qū)域分離開,判斷是否存在目標(biāo),如果存在目標(biāo)則確定目標(biāo)的位置[2]。
Yolov3算法并沒有使用darknet-53的全部層數(shù),Yolov3網(wǎng)絡(luò)是個(gè)全卷積的網(wǎng)絡(luò),利用大量殘差的跳層相連,而且為了減小池化帶來的梯度負(fù)面效果,直接放棄了池化,用步長(zhǎng)為2的卷積進(jìn)行降采樣。同時(shí)為了增強(qiáng)算法對(duì)小目標(biāo)檢測(cè)的精確度,Yolov3融合了FPN算法,在多個(gè)尺度的特征圖上做檢測(cè)。
采用darknet-53網(wǎng)絡(luò)結(jié)構(gòu)的Yolov3目標(biāo)檢測(cè)算法相對(duì)于采用ResNet網(wǎng)絡(luò)結(jié)構(gòu)的Faster rcnn目標(biāo)檢測(cè)算法,不僅在分類精度上差不多,計(jì)算速度還比Faster rcnn強(qiáng)多了。
2利用DeepSort跟蹤算法的確定行人軌跡
DeepSort跟蹤的思路是現(xiàn)在主要流行的跟蹤思路:基于目標(biāo)檢測(cè)的跟蹤。以Yolov3目標(biāo)檢測(cè)結(jié)果為DeepSort的輸入:bounding box、confidence、feature 。卷積主要用于篩選出一部分的檢測(cè)框;bounding box與feature用于后面與跟蹤器的match計(jì)算;首先是預(yù)測(cè)模塊,會(huì)對(duì)跟蹤器使用卡爾曼濾波器進(jìn)行預(yù)測(cè)。在這里使用的是卡爾曼濾波器的勻速運(yùn)動(dòng)和線性觀測(cè)模型(意味著只有四個(gè)量且在初始化時(shí)會(huì)使用檢測(cè)器進(jìn)行恒值初始化)。其次是更新模塊,包括匹配,追蹤器更新與特征集更新。在更新模塊的部分,根本的方法還是使用IOU來進(jìn)行匈牙利算法的匹配。圖1是DeepSort對(duì)路人進(jìn)行跟蹤的結(jié)果,每一個(gè)框的上的數(shù)字都是用來標(biāo)記行人的唯一ID號(hào)。
3行人再識(shí)別糾正DeepSort算法的行人軌跡
但是利用DeepSort進(jìn)行行人跟蹤會(huì)存在如圖1所示的問題:圖中1號(hào)人物目標(biāo)和2號(hào)人物目標(biāo)相互疊加在一起時(shí),行人檢測(cè)無法準(zhǔn)確地確定每個(gè)人的位置,所以會(huì)導(dǎo)致行人追蹤在二者相互疊加錯(cuò)開時(shí)可能會(huì)發(fā)生ID改變(即ID-Switch)。
行人相互疊加遮擋一直是行人檢測(cè)和行人追蹤中的一個(gè)難題,依據(jù)現(xiàn)有的資料無法從算法上將其解決,所以只能從工程上尋找突破口,繼而打算在行人跟蹤模塊引入行人再識(shí)別。
行人再識(shí)別的實(shí)現(xiàn)思路是先抽取特征在進(jìn)行比對(duì),首先檢索經(jīng)過網(wǎng)絡(luò)抽取圖片特征,然后底庫中里的所有圖片全部抽取圖片特征,接著將檢索圖與底庫圖中的特征計(jì)算距離(例如歐氏距離),最后根據(jù)計(jì)算的距離進(jìn)行排序,排序越靠前表示相似率越高。從而改正跟蹤中的一些錯(cuò)誤。
4結(jié)果展示
行人追蹤能通過行人再識(shí)別在一定程度上可以使準(zhǔn)確率提高。行人再識(shí)別-跟蹤改正結(jié)果如圖2所示
5結(jié)束語
雖然目標(biāo)跟蹤的方法種類不少,但每一類方法或算法都有其不足,距離實(shí)用性還有不少的難題。主要集中于以下幾點(diǎn):
(1)運(yùn)動(dòng)目標(biāo)頻繁變動(dòng)的干擾
(2)遮擋與陰影問題。
所以,要依據(jù)實(shí)際的情況,選擇合適的目標(biāo)跟蹤算法。
參考文獻(xiàn)
[1] 陳星,李郴.C語言組卷系統(tǒng)中重復(fù)問題研究[J].電腦知識(shí)與技術(shù),2016(1):214-216.
[2] 任立平. 智能視頻監(jiān)控系統(tǒng)在民航機(jī)場(chǎng)的應(yīng)用研究[J]. 自動(dòng)化應(yīng)用,2010,47(3):377-389.
作者簡(jiǎn)介
王克(1995-),男,江蘇省徐州市人;學(xué)歷:碩士,現(xiàn)就職單位:沈陽理工大學(xué),研究方向:大數(shù)據(jù)與智能信息處理技術(shù)。