技術(shù)宅
說到人臉識(shí)別,可能很多朋友都非常了解了,無論是支付寶的登錄,還是iPhone X的解鎖,甚至ATM的取款,通過人臉識(shí)別都可以完成。不過這些人臉識(shí)別都只是對靜態(tài)位置的人臉進(jìn)行識(shí)別,現(xiàn)在有一個(gè)更為實(shí)用的研究應(yīng)用——行人再識(shí)別。行人再識(shí)別是利用計(jì)算機(jī)視覺技術(shù)在圖像或視頻中檢索特定行人的任務(wù),從而在行動(dòng)影像中識(shí)別對應(yīng)的人物。
行動(dòng)中的識(shí)別——了解行人再識(shí)別技術(shù)
如上所述,現(xiàn)在人臉識(shí)別大多只是對靜態(tài)位置的人臉進(jìn)行識(shí)別。在實(shí)際生活中,人很多時(shí)候是在行走的狀態(tài)。如何識(shí)別行走的人物?這就是行人再識(shí)別技術(shù),它通過攝像頭或者監(jiān)控視頻,對行走的人體攝像按照指定要素進(jìn)行匹配,從而實(shí)現(xiàn)對行動(dòng)人像的識(shí)別,在視頻中找到符合要素的人物(圖1)。
顯然行人再識(shí)別技術(shù)和常見的人臉識(shí)別不同,人臉識(shí)別是人們主動(dòng)提供自己的臉型數(shù)據(jù)和選題預(yù)設(shè)數(shù)據(jù)進(jìn)行匹配,從而完成臉型的驗(yàn)證。行人再識(shí)別則需要在眾多視頻影像中找出符合要求的人物,比如在某商場孩子走丟了,家長們通過提供孩子的體貌信息,然后根據(jù)這些信息在商場監(jiān)控視頻中去匹配特征,從而通過視頻影像識(shí)別,并找到孩子的最終位置。
行動(dòng)中的識(shí)別——行人再識(shí)別技術(shù)原理
如上所述,行人再識(shí)別技術(shù)主要是對視頻影像中的行人進(jìn)行識(shí)別。因?yàn)檫@些影像大多是攝像頭捕捉的,這樣和普通的人臉識(shí)別相比,一是捕捉的角度不同,攝像頭捕捉到的可能是行人的背影或者側(cè)面等影像;二是它在采集圖像時(shí)不需要行人主動(dòng)配合,而且采集的是動(dòng)態(tài)行走的影像;三是對于行人識(shí)別可能需要在不同場景進(jìn)行識(shí)別,比如在機(jī)場采集A的影像,當(dāng)在商場再次出現(xiàn)A的影像時(shí),同樣需要對A實(shí)現(xiàn)精準(zhǔn)識(shí)別(圖2)。
顯然行人再識(shí)別技術(shù)的識(shí)別難度就遠(yuǎn)遠(yuǎn)比人臉識(shí)別要難得多。那么這種技術(shù)是怎樣實(shí)現(xiàn)對行人的精準(zhǔn)識(shí)別的呢?
我們來了解一下識(shí)別技術(shù)的基本原理。無論是人臉識(shí)別、指紋識(shí)別還是行人再識(shí)別,從識(shí)別理論上來說大同小異。以人臉識(shí)別為例,首先是樣本學(xué)習(xí),根據(jù)人的臉型數(shù)據(jù),按照一定的標(biāo)準(zhǔn)讓機(jī)器學(xué)習(xí)大量的樣本數(shù)據(jù),同時(shí)借助AI技術(shù),讓機(jī)器學(xué)會(huì)自主學(xué)習(xí)。在完成大量的樣本數(shù)據(jù)學(xué)習(xí),機(jī)器可以精準(zhǔn)識(shí)別人臉后,開發(fā)者就生成一套算法,然后使用這個(gè)算法就可以部署到識(shí)別服務(wù)器。這樣機(jī)器預(yù)先將獲取的人臉數(shù)據(jù)保存在數(shù)據(jù)庫,再次采集到人臉數(shù)據(jù)后就會(huì)和原始數(shù)據(jù)匹配,匹配成功即可完成一次人臉識(shí)別(圖3)。
回到行人再識(shí)別技術(shù),它的原理與之類似。行人識(shí)別這種技術(shù)主要是依靠行人特征進(jìn)行識(shí)別,首先是給定某人的一張圖片,從多張圖片中找到屬于他/她的那一張或多張,最后通過行人整體特征實(shí)現(xiàn)的人員比對技術(shù)。因此行人再識(shí)別技術(shù)關(guān)鍵是要確定特定人物的整體特征,然后把它作為識(shí)別點(diǎn)和其他人物比對,這里整體特征就相當(dāng)于“人臉”數(shù)據(jù)。
同樣的該技術(shù)首先也是樣本學(xué)習(xí),通過制定一定的標(biāo)準(zhǔn)讓機(jī)器去學(xué)習(xí)識(shí)別視頻里的人物特征。當(dāng)然這個(gè)標(biāo)準(zhǔn)是多維度,比如將人按照頭、身、腿分成三部分分別標(biāo)記其特征信息,或者先通過人體骨架估計(jì),然后再通過骨架信息來對齊,這樣就可以將每個(gè)人相對獨(dú)立的特征提取出來(圖4)。
當(dāng)然由于人體特征點(diǎn)非常多,科研人員同時(shí)借助深度卷積神經(jīng)網(wǎng)絡(luò)去提取特征和自主學(xué)習(xí),最終形成一套識(shí)別人物特征的算法。這樣借助這套算法就可以對視頻中的人物進(jìn)行比對識(shí)別了。舉個(gè)簡單的例子,當(dāng)在逛商場的時(shí)候,4歲孩子走丟了,孩子特征是4歲,下肢較長,當(dāng)天穿著紅色上衣。那么利用行人再識(shí)別技術(shù)尋找孩子時(shí),只要在識(shí)別系統(tǒng)中輸入上述特征,系統(tǒng)就會(huì)去和視頻中符合這些要素的人物進(jìn)行比對,很快就可以找到你家孩子最近(或者現(xiàn)在)出現(xiàn)的視頻影像,從而快速找到孩子。
行人再識(shí)別 不僅僅和安防相關(guān)
說到行人再識(shí)別技術(shù),很多人想到的就是警察追捕嫌疑犯的場景。確實(shí)該技術(shù)在當(dāng)今的安防領(lǐng)域已經(jīng)有著很多的應(yīng)用,比如各地公安部門借助“天網(wǎng)”系統(tǒng)和行人再識(shí)別技術(shù)可快速找到嫌疑人的蹤跡(圖5)。
其實(shí)除了這些專業(yè)區(qū)域外,行人再識(shí)別技術(shù)還可以運(yùn)用在我們生活里的很多場景。如現(xiàn)在很多朋友出外旅游都喜歡給拍照,拍攝人物多了以后照片就不好歸類。現(xiàn)在借助行人再識(shí)別對拍攝的人物進(jìn)行追蹤,很容易就可以將照片按照自己、孩子、朋友的類別進(jìn)行相冊的分類整理。對于零售商來說,借助自己攝像頭拍攝的視頻結(jié)合行人再識(shí)別技術(shù),則可以輕松知道哪位顧客經(jīng)常光臨自己的店面,喜歡在哪些柜臺(tái)前逗留等詳細(xì)信息(圖6)。endprint