国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于深度學(xué)習(xí)跨清晰度的鞋面檢索
——從足跡圖像到視頻中鎖定犯罪嫌疑人的應(yīng)用

2022-08-05 02:16:26金益鋒孫晰銳吳文達(dá)李岱熹蔣雪梅耿小鵬
科學(xué)技術(shù)與工程 2022年19期
關(guān)鍵詞:鞋樣鞋面清晰度

金益鋒, 孫晰銳, 吳文達(dá), 李岱熹, 蔣雪梅, 耿小鵬

(1.中國人民公安大學(xué)偵查學(xué)院, 北京 100038; 2.公安部物證鑒定中心, 北京 100038; 3.大連恒銳科技股份有限公司, 大連 116085; 4.甘肅省公安廳刑事警察總隊(duì), 蘭州 730030)

目前,中國的智慧安防系統(tǒng)建設(shè)日趨完善,視頻信息在案件偵破過程中正發(fā)揮出越來越大的作用。國內(nèi)外的主流視頻應(yīng)用主要集中在視頻中的人臉檢測與跟蹤技術(shù),該技術(shù)近年來越來越受到研究人員的廣泛關(guān)注。就視頻監(jiān)控領(lǐng)域而言,人臉檢測與跟蹤的研究大大提高了視頻監(jiān)控系統(tǒng)的智能化,使得系統(tǒng)能夠在不需要人為干預(yù)的情況下鎖定目標(biāo),實(shí)現(xiàn)對監(jiān)控場景中的目標(biāo)檢測與跟蹤。然而視頻人臉的檢測跟蹤往往由于背景干擾和面部遮擋而變得非常困難,所以需要新的技術(shù)手段來應(yīng)對復(fù)雜場景下的公安視頻監(jiān)控應(yīng)用。足跡是犯罪現(xiàn)場遺留率最高的痕跡物證之一,通過“全國公安機(jī)關(guān)鞋樣本數(shù)據(jù)庫應(yīng)用系統(tǒng)”可以快速獲取到鞋子種類、樣式等信息[1]。利用獲取到的鞋樣本信息鎖定關(guān)聯(lián)視頻中穿用與該鞋樣本相似鞋子的嫌疑人,與此同時(shí)進(jìn)一步結(jié)合視頻的動(dòng)態(tài)行人分析,完成從足跡到嫌疑人的快速鎖定,可為案件的偵破節(jié)省大量的時(shí)間。人工智能的突破式發(fā)展,圖像、視頻等相關(guān)領(lǐng)域煥然一新,直接推動(dòng)了智能化刑偵技術(shù)發(fā)展。

VGG[2]、LE-NET等基于深度學(xué)習(xí)的分類網(wǎng)絡(luò)將物體識別技術(shù)提升到新的高度,訓(xùn)練完畢的網(wǎng)絡(luò)不僅可以完成分類和識別的任務(wù)。其頂層top(n)層輸出亦可作為圖像的特征參與特征比對。如史文韜等[3]提出了基于VGG-16網(wǎng)絡(luò)及選擇性卷積特征描述子融合的鞋印檢索算法以提升現(xiàn)場殘缺鞋印的檢索精度。

近幾年,深度視覺以目標(biāo)不同產(chǎn)生了不同的技術(shù)分支。例如,以Yolo[4]、Faster RCNN[5]為代表的目標(biāo)檢測算法,以Unet等編碼解碼思路的語義分割算法,以孿生網(wǎng)絡(luò)Siamese Network為代表的度量學(xué)習(xí)更好地支持多類別小樣本識別,以Cycle GAN[6]為代表的生成網(wǎng)絡(luò)可以生成各種風(fēng)格的新數(shù)據(jù)。得益于此,圖片檢索方向近年來也在飛速發(fā)展之中。如以孿生網(wǎng)絡(luò)為基礎(chǔ)的全局表征檢索網(wǎng)絡(luò)[7],依托對抗網(wǎng)絡(luò)思想的深度對抗度量學(xué)習(xí)網(wǎng)絡(luò)[8],基于定位優(yōu)化思想的行人檢索網(wǎng)絡(luò)[9]。

雖然行人等的大目標(biāo)、高清晰度圖片的檢索得到了充分的研究,但對于鞋這樣的小目標(biāo)同時(shí)涉及高清-低清的跨域檢索的研究較為少見。姜衡等[10]提出了一種針對低分辨率情境基于深度學(xué)習(xí)的鞋類識別網(wǎng)絡(luò)模型。Zhan等[11]基于相似度學(xué)習(xí)的思想,利用RP-CNN+WI-CNN的雙網(wǎng)絡(luò)模型完成了街景鞋圖片到高清鞋樣的檢索任務(wù)。

基于深度學(xué)習(xí)跨清晰度的鞋面檢索算法,依靠深度學(xué)習(xí)強(qiáng)大的表達(dá)能力,在跨域檢索的網(wǎng)絡(luò)框架加入適合跨清晰度的特征描述方法,結(jié)合全局特征和局部特征分支的單獨(dú)處理再整合的思想,提出了適合高清到低清跨清晰度的鞋面檢索網(wǎng)絡(luò)。結(jié)合后處理重排序,完成算法。實(shí)驗(yàn)結(jié)果顯示,算法克服了高清到低清跨清晰度的難點(diǎn),在更高難度、更大數(shù)據(jù)量的測試數(shù)據(jù)集上取得了大幅優(yōu)于RP-CNN+WI-CNN[11]的表現(xiàn),實(shí)現(xiàn)了由高清鞋樣到低清視頻鞋的準(zhǔn)確檢索,進(jìn)而使得“現(xiàn)場足跡-鞋樣-視頻鞋-視頻嫌疑人”的自動(dòng)快速鎖定成為可能,推動(dòng)智能化刑偵技術(shù)的發(fā)展。

1 數(shù)據(jù)集制備

算法所在的檢索流程如圖1所示,虛線部分為數(shù)據(jù)預(yù)處理部分,其中B鞋樣數(shù)據(jù)處理部分中的足跡圖片指現(xiàn)場提取的足跡圖片,如圖2所示;實(shí)線部分(C檢索算法流程)為重點(diǎn)研究內(nèi)容。

數(shù)據(jù)從來源上分為兩部分:①從分辨率為400萬像素的攝像頭采集的視頻幀中截取的低清鞋圖片; ②手機(jī)、相機(jī)、采集設(shè)備近距離拍攝的高清鞋面照片以及人工從網(wǎng)絡(luò)獲取的高清鞋面照片。數(shù)據(jù)示例如圖3所示,同一雙鞋的低清圖與高清圖從屬于同一類別,具有同樣的類別標(biāo)簽。

數(shù)據(jù)集從用途上分為訓(xùn)練集與測試集兩部分。每類包含一款獨(dú)有的、跟其他類別均不同的鞋子型號(如某品牌2021款輕運(yùn)動(dòng)黃白相間男款鞋)的高清和低清鞋面。數(shù)據(jù)集情況如表1所示。

圖1 跨清晰度的鞋面檢索流程Fig.1 Cross-resolution retrieval flow diagram

圖3 高清鞋面圖和低清鞋面圖Fig.3 High & low resolution vamps

表1 數(shù)據(jù)集信息

2 算法解析

網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示,每個(gè)部分對應(yīng)其專屬功能。其中實(shí)線部分為模型訓(xùn)練與推理共用流程,虛線箭頭為模型訓(xùn)練流程。

2.1 網(wǎng)絡(luò)整體結(jié)構(gòu)

2.1.1 骨干網(wǎng)絡(luò)

ResNet[12]網(wǎng)絡(luò)又名殘差網(wǎng)絡(luò),2015年提出時(shí)將ImageNet的識別錯(cuò)誤率降低到3.57%,其主要網(wǎng)絡(luò)結(jié)構(gòu)如圖5所示,殘差模塊有效避免了反向傳播計(jì)算時(shí)梯度消失。在此基礎(chǔ)上,ResNet-IBN[13]探索了實(shí)例歸一化(instance norm)和批歸一化(batch norm),提升了模型對圖像外觀變化的適應(yīng)能力。其細(xì)節(jié)對比如圖5所示。

2.1.2 廣義池化層

如圖4中特征提取網(wǎng)絡(luò)的部分所示,在網(wǎng)絡(luò)結(jié)構(gòu)中均使用了廣義平均池化層(generalized mean pooling,GeM)替換了平均池化層(average pooling,AP)。廣義最大池化層不僅有效保留紋理,選擇性降低冗余的作用,同時(shí)還可有效學(xué)習(xí)到不同分辨率下圖像的通用特征。公式為

(1)

式(1)中:ω為當(dāng)前特征圖的尺寸;C表示通道數(shù);p為超參,p>0。當(dāng)p>1時(shí)強(qiáng)制增加池化后的特征對比,突出激活視覺顯著區(qū)域;當(dāng)p=1時(shí),即為平均池化層;p=∞時(shí)變?yōu)榭臻g最大池化層。本文設(shè)定p=2。

2.1.3 全局特征描述分支

圖4 網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.4 The structure of model

全局特征主要提取輪廓、顏色、方向信息,屏蔽背景信息。輸入的特征圖為骨干網(wǎng)絡(luò)的GeM廣義池化層輸出,經(jīng)卷積-歸一化-ReLU激活模塊生成2 048維的全局特征。在模型訓(xùn)練過程中,該特征除直接用于計(jì)算circle loss(見2.1.5節(jié))外,還作為輸入,經(jīng)歸一化-全連接層生成分類特征用于交叉熵?fù)p失函數(shù)(cross entropy loss)的計(jì)算,如圖4所示。

圖5 ResNet與ResNet-IBN對比Fig.5 Comparison between ResNet and ResNet-IBN

2.1.4 局部特征描述分支

局部特征部分主要作用是提取紋理細(xì)節(jié)信息。本文參考BFENET[14],訓(xùn)練時(shí)輸入的特征圖會(huì)隨機(jī)擦除0~25%的特征區(qū)域,提高局部特征對鞋面的表征能力以及遮擋情況的適應(yīng)能力,這里為了方便計(jì)算,擦除區(qū)域設(shè)定為隨機(jī)位置矩形覆蓋。后邊連接的全局最大池化層增加局部突出的信息的表達(dá)。之后經(jīng)卷積-歸一化-ReLU激活模塊生成2 048維的局部特征,該特征與2.1.3節(jié)所述全局特征拼接形成2 048+2 048=4 096維的檢索特征用于最終的比對檢索環(huán)節(jié),如圖4所示。

2.1.5 損失函數(shù)

算法的損失函數(shù)部分如圖4中特征融合部分區(qū)域所示,本文中采用的損失函數(shù)被用于訓(xùn)練過程中,指導(dǎo)模型收斂的方向,進(jìn)而影響整個(gè)模型的訓(xùn)練速度和精度。本文中采用如下?lián)p失函數(shù)。triplet loss[15]解決困難樣本的度量學(xué)習(xí),拉大相似樣本的特征距離,讓相似不同類的特征更容易區(qū)分。center loss[16]計(jì)算樣本經(jīng)過推理后特征空間與類中心的距離約束,同時(shí)兼顧到同類聚集和不同類的相互區(qū)分。circle loss[17]通過平均不同類別的分類角度距離,平均化各個(gè)類別的相似性差異。

2.1.6 數(shù)據(jù)增廣

為了防止訓(xùn)練過擬合,訓(xùn)練時(shí)輸入圖像采用-5°~5°隨機(jī)旋轉(zhuǎn)、HSV色彩模型編碼中-10°~10°的顏色隨機(jī)變化、-5%~5%的飽和度隨機(jī)變化、-1%~1%隨機(jī)平移的數(shù)據(jù)增廣方式,以滿足不同場景下算法的適應(yīng)能力,如圖6所示。推理測試時(shí)需保證數(shù)據(jù)真實(shí)性,此時(shí)不需要圖像的隨機(jī)變化過程。

圖6 數(shù)據(jù)增廣示例Fig.6 Samples of data augment

2.1.7 特征融合和比對方法

圖像經(jīng)過網(wǎng)絡(luò)映射(推理),全局特征和局圖特征兩個(gè)分支的特征各2 048維,以向量形式鏈接,形成4 096維特征,如圖4所示。

特征比對方法采用歐式距離判定。假設(shè)圖像I1、I2經(jīng)過模型M映射后,產(chǎn)生特征F1、F2。F1包含為全局特征F1_global和局部特征F1_local,同理特征F2包含F(xiàn)2_global和F2_local。則比較方法為

F1=M(I1),F2=M(I2)

(2)

n=4 096

(3)

式中:Dist表示兩個(gè)向量的距離度量,其值越小,表示兩個(gè)向量越相近。

2.2 檢索評估方法

采用累計(jì)查中率(cumulative match characteristic, CMC)作為評價(jià)指標(biāo)。CMC表示返回的前m個(gè)結(jié)果中正例的概率。無論數(shù)據(jù)庫中實(shí)際有多少匹配,計(jì)算中只計(jì)算第一個(gè)查中項(xiàng)。CMC曲線是一種細(xì)粒度度量,顯示了精度隨等級的變化。通常情況下,檢索排名越靠前,效果越好,CMC的曲線下面積(area under curve, AUC)越大。

查中:假設(shè)現(xiàn)有庫中有5枚圖片,分別屬于(“蘋果”“香蕉”“橘子”“西瓜”“芒果”)?,F(xiàn)有一枚待查“芒果”,算法提取特征并比對后根據(jù)距離度量,得到如下排序[“香蕉”“橘子”“西瓜”“芒果”“蘋果”]。即認(rèn)為,查詢的圖與“香蕉”最像,“橘子”次之,在第4位查中“芒果”。

3 實(shí)驗(yàn)

3.1 訓(xùn)練細(xì)節(jié)

實(shí)驗(yàn)的機(jī)器硬件為CPU i9 9900K,內(nèi)存容量64 G,固態(tài)硬盤1 T存儲(chǔ)空間,GTX 1080Ti 11 G顯存顯卡1片,850 W供電電源。軟件方面采用docker container+pytorch1.7+Cuda8.0深度學(xué)習(xí)框架搭建網(wǎng)絡(luò)并訓(xùn)練,訓(xùn)練時(shí)單次批量輸入32枚圖像,3 000次全數(shù)據(jù)集迭代。學(xué)習(xí)率(learning rate)在前1 000次訓(xùn)練迭代設(shè)置為0.01,以達(dá)到快速收斂的目的,之后固定學(xué)習(xí)率為0.000 1,通過學(xué)習(xí)過程微調(diào)和優(yōu)化網(wǎng)絡(luò)參數(shù)。推理測試時(shí),單次批量輸入若干枚圖像,不進(jìn)行數(shù)據(jù)擴(kuò)增步驟,不進(jìn)行損失函數(shù)計(jì)算。

3.2 推理性能

推理測試檢索性能時(shí)采用與訓(xùn)練相同的硬件環(huán)境。測試推理平均耗時(shí),如表2所示。

表2 推理測試時(shí)間

實(shí)驗(yàn)說明,平均單次推理大致時(shí)間是60 ms/枚。1 h可提取6萬枚圖像特征。特征比對可達(dá)到實(shí)時(shí)響應(yīng)的效果。

3.3 檢索性能

測試數(shù)據(jù)集1 172類檢索測試,CMC評價(jià)方法評估檢索效果,如表3所示。

實(shí)驗(yàn)1和實(shí)驗(yàn)2對比了不同骨干網(wǎng)絡(luò)的檢索效果。通過實(shí)驗(yàn)證明,ResNet-IBN優(yōu)于ResNet。實(shí)驗(yàn)3~實(shí)驗(yàn)5進(jìn)行了若干技巧的消融實(shí)驗(yàn),圖7所示為幾組實(shí)驗(yàn)所對應(yīng)的曲線。曲線與表3數(shù)據(jù)對應(yīng)。從圖7的實(shí)驗(yàn)結(jié)果可見Res-IBN-ACG曲線所代表的ResNet-IBN+DA+GeM+Circle Loss的組合最優(yōu),Top1達(dá)到66.2%,top5達(dá)到了85.8%,Top10達(dá)到90.8%。

表3 檢索性能實(shí)驗(yàn)

圖7 幾組實(shí)驗(yàn)對應(yīng)的CMC曲線Fig.7 CMC curve of experiments

圖8 檢索結(jié)果示例Fig.8 Retrieval results

3.4 實(shí)驗(yàn)可視化結(jié)果

高清-低清鞋檢索結(jié)果如圖8所示,待查鞋樣001類中的RANK1和待查鞋樣012類中的RANK2表示查中的低清鞋樣圖??梢娝惴ㄓ行W(xué)習(xí)到了鞋子圖片的輪廓、顏色、紋理信息,對彩色鞋與純色鞋的檢索都有較好的主觀效果。

4 總結(jié)與展望

針對從高清鞋面到視頻中行人的低清鞋面的跨域匹配查找問題,提出了基于深度學(xué)習(xí)跨清晰度的鞋面檢索算法,以解決視頻提取的低清鞋子信息與高清鞋面信息比對檢索的難題,從而打通從現(xiàn)場足跡到視頻中鎖定嫌疑人的通路。算法中的網(wǎng)絡(luò)采用了全局和局部特征融合的方式,加上廣義池化、數(shù)據(jù)增廣等技巧,實(shí)現(xiàn)高效檢索。該算法在實(shí)現(xiàn)過程中,加入了網(wǎng)絡(luò)分支、特定損失函數(shù)、隨機(jī)變換等手段。在1 172組樣本檢索測試中累計(jì)查中率首位達(dá)到66.2%,前5達(dá)到85.8%,雖然該算法在客觀指標(biāo)和主觀驗(yàn)證上均達(dá)到較高的應(yīng)用級別水準(zhǔn),但仍需在更大的數(shù)據(jù)集上進(jìn)行驗(yàn)證優(yōu)化。未來的工作將圍繞以下幾個(gè)方面展開:①結(jié)合視頻與鞋樣數(shù)據(jù)中鞋子的朝向角度信息進(jìn)行檢索算法的改進(jìn);②擴(kuò)充多場景數(shù)據(jù)進(jìn)一步測試算法的泛用性。

當(dāng)前隨著大數(shù)據(jù)、深度學(xué)習(xí)、視頻檢索等新技術(shù)的高速發(fā)展,為刑事技術(shù)突破式、跨越式發(fā)展創(chuàng)造了有利條件,同時(shí)各地天網(wǎng)工程以及雪亮工程等的建設(shè)也為視頻應(yīng)用提供了數(shù)據(jù)基礎(chǔ)。在公安部智慧新刑技快速發(fā)展的新形勢下,基于深度學(xué)習(xí)跨清晰度的鞋面檢索算法為刑事技術(shù)融合應(yīng)用奠定了技術(shù)基礎(chǔ),有效實(shí)現(xiàn)了足跡+視頻一體化融合應(yīng)用,實(shí)現(xiàn)了從“室內(nèi)到室外,從痕跡到人”的創(chuàng)新應(yīng)用,有效提升了公安機(jī)關(guān)刑事技術(shù)一體化作戰(zhàn)能力。

4.1 鞋樣自動(dòng)化檢索比對

通過現(xiàn)場足跡查詢鞋樣信息,再結(jié)合周邊監(jiān)控等視頻信息,檢索到其中穿著同類鞋樣信息的人員,進(jìn)而鎖定嫌疑人的技戰(zhàn)法已在公安基層實(shí)戰(zhàn)中得到了廣泛應(yīng)用。然而,從海量的視頻數(shù)據(jù)中檢索目標(biāo)人員這一過程異常繁雜,通常需要耗費(fèi)大量的人、財(cái)、物,其投入與產(chǎn)出往往難成正比,而且也嚴(yán)重影響了案件的偵破效率。

利用基于深度學(xué)習(xí)跨清晰度的鞋面檢索算法,通過現(xiàn)場足跡查詢到的鞋樣,對案件現(xiàn)場周邊視頻進(jìn)行自動(dòng)分析、檢索嫌疑目標(biāo),并將目標(biāo)的鞋樣、人身圖像以及目標(biāo)出現(xiàn)的時(shí)空信息等線索實(shí)時(shí)推送,可以實(shí)現(xiàn)足跡視頻追蹤的自動(dòng)檢索和融合應(yīng)用。

4.2 視頻高效化識別追蹤

近年來,隨著社會(huì)經(jīng)濟(jì)的快速發(fā)展,刑事犯罪專業(yè)化、團(tuán)伙化、流動(dòng)化等特點(diǎn)日益明顯,案發(fā)后通過視頻監(jiān)控等傳統(tǒng)方式查找線索工作量巨大、效率不高,且難以有效依托視頻圖像實(shí)現(xiàn)對重點(diǎn)關(guān)注目標(biāo)和異常情況的預(yù)知、預(yù)測、預(yù)警?;谏疃葘W(xué)習(xí)跨清晰度的鞋面檢索算法,密切結(jié)合公安實(shí)戰(zhàn)應(yīng)用需求,充分運(yùn)用鞋樣識別技術(shù)、高清監(jiān)控技術(shù)、視頻分析技術(shù)、業(yè)務(wù)系統(tǒng)集成技術(shù)等先進(jìn)技術(shù),未來可以實(shí)現(xiàn)在海量視頻信息中有目的地提取有效信息,對目標(biāo)人員的動(dòng)態(tài)活動(dòng)軌跡進(jìn)行分析。

4.3 刑偵一體化協(xié)同作戰(zhàn)

應(yīng)用基于深度學(xué)習(xí)跨清晰度的鞋面檢索算法,可以實(shí)現(xiàn)智能化快速反饋與現(xiàn)場足跡關(guān)聯(lián)鞋樣的視頻目標(biāo)人員軌跡、目標(biāo)人員鞋樣信息,通過視頻鞋樣檢索的遠(yuǎn)距離、跨視角、非受控等優(yōu)勢,打通專業(yè)壁壘,有效提升刑事技術(shù)一體化作戰(zhàn)能力,為公安部門實(shí)戰(zhàn)提供高效的技術(shù)支撐,為案件的快速偵破提供方向,從而大幅提升含足跡案件的破案率,最終實(shí)現(xiàn)刑事技術(shù)數(shù)據(jù)“強(qiáng)度整合、高度共享、深度應(yīng)用”的要求。

猜你喜歡
鞋樣鞋面清晰度
鮮明細(xì)膩,擁有更好的清晰度 Ascendo Immersive Audio CCRM-12 MKII/CCRM-6P/SMS-15
家有老鞋樣
橫編鞋面分類與組織結(jié)構(gòu)探討
針織鞋面的分類與特點(diǎn)探討
母親的鞋樣書
西江月(2016年5期)2016-11-26 20:36:02
電子墨水高跟鞋:鞋面圖案隨心換
母親的鞋樣書
聽音訓(xùn)練對漢語單音節(jié)聽感清晰度的影響
一種無參考監(jiān)控視頻圖像清晰度評價(jià)方法
童年的鞋樣
青春(2012年12期)2012-04-29 09:19:16
隆尧县| 柳林县| 耒阳市| 阿图什市| 珲春市| 股票| 彭阳县| 亳州市| 宁南县| 黄龙县| 多伦县| 绍兴县| 科尔| 兴和县| 东台市| 滕州市| 桂平市| 文昌市| 汉川市| 绍兴市| 张家口市| 土默特右旗| 许昌市| 瑞昌市| 都昌县| 三都| 邹平县| 阿荣旗| 阳谷县| 冕宁县| 阿拉善左旗| 揭东县| 白沙| 阜平县| 新乐市| 三穗县| 江城| 交城县| 鄂温| 常德市| 华蓥市|