国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大規(guī)模人臉聚類評(píng)測(cè)技術(shù)初探

2021-08-03 08:58:02公安部檢測(cè)中心林川張翔劉軍蘇智睿
關(guān)鍵詞:測(cè)系統(tǒng)評(píng)測(cè)人臉識(shí)別

■ 文/公安部檢測(cè)中心 林川 張翔 劉軍 蘇智睿

關(guān)鍵字:人臉聚類 效果 評(píng)測(cè)

1 引言

近年來(lái),深度卷積神經(jīng)網(wǎng)絡(luò)的出現(xiàn)極大地提升了人臉識(shí)別算法的精度,促使人臉識(shí)別技術(shù)在公共安全行業(yè)廣泛落地應(yīng)用。各地公安部門陸續(xù)興建大量人臉識(shí)別系統(tǒng),每天產(chǎn)生海量人臉抓拍數(shù)據(jù)。以國(guó)內(nèi)某一線城市為例,單日人臉抓拍數(shù)據(jù)規(guī)??蛇_(dá)千萬(wàn)級(jí)別。在如此海量數(shù)據(jù)面前,傳統(tǒng)的單純依靠人力查看人員軌跡數(shù)據(jù)挖掘案件線索的辦案手段已無(wú)法滿足公安實(shí)戰(zhàn)業(yè)務(wù)需求。通過(guò)大數(shù)據(jù)分析模型在海量人臉抓拍數(shù)據(jù)中實(shí)現(xiàn)人員出行規(guī)律、同行關(guān)系等高價(jià)值信息的自動(dòng)化挖掘,提升人臉識(shí)別系統(tǒng)的實(shí)戰(zhàn)價(jià)值,是未來(lái)公共安全行業(yè)視頻分析系統(tǒng)智能化建設(shè)的新目標(biāo)。通過(guò)人臉聚類技術(shù)將零散的人員軌跡點(diǎn)位信息匯聚起來(lái)形成人員檔案是實(shí)現(xiàn)人員軌跡大數(shù)據(jù)分析的基礎(chǔ)條件。因此,2020年以來(lái),各地公安部門逐步加快了人臉聚類能力的建設(shè)步伐。

隨著人臉聚類技術(shù)應(yīng)用落地的快速發(fā)展,人臉聚類效果評(píng)測(cè)標(biāo)準(zhǔn)的匱乏愈發(fā)凸顯出來(lái)。公安部門在推進(jìn)智能化建設(shè)的過(guò)程中,由于沒(méi)有合適的參考標(biāo)準(zhǔn),往往難以設(shè)計(jì)出合理有效的評(píng)測(cè)方案遴選人臉聚類算法。造成這種情況的主要原因是目前人臉聚類效果評(píng)測(cè)尚無(wú)國(guó)家標(biāo)準(zhǔn)文件可供參考,僅有一篇發(fā)布于2016年的公共安全行業(yè)標(biāo)準(zhǔn)GA/T 1344-2016《安防人臉識(shí)別應(yīng)用視頻人臉圖像提取技術(shù)要求》提及人臉聚類效果評(píng)測(cè)方法,但受限于當(dāng)時(shí)行業(yè)內(nèi)對(duì)人臉聚類技術(shù)的認(rèn)知水平,行標(biāo)文件中提出的聚類評(píng)測(cè)體系對(duì)可能出現(xiàn)的聚類效果考慮不夠周全,在一些特定情況下,評(píng)測(cè)結(jié)果會(huì)與實(shí)際預(yù)期產(chǎn)生較大偏差。

為了推動(dòng)行業(yè)內(nèi)人臉聚類算法評(píng)測(cè)體系的科學(xué)建設(shè),本文對(duì)人臉聚類算法評(píng)測(cè)技術(shù)進(jìn)行了初步探討,希望能夠?yàn)榇笠?guī)模人臉聚類效果評(píng)測(cè)認(rèn)證提供參考依據(jù),促進(jìn)公共安全行業(yè)健康發(fā)展。

2 人臉聚類評(píng)測(cè)數(shù)據(jù)準(zhǔn)備

在人臉聚類實(shí)際應(yīng)用中,人臉抓拍數(shù)據(jù)中的人臉普遍存在一定程度的偏轉(zhuǎn),一些照片還會(huì)存在人臉被部分遮擋的情況。另外,參與聚類的人臉抓拍數(shù)據(jù)通常是跨時(shí)空采集的,采集時(shí)的光照條件、背景復(fù)雜度會(huì)存在較大差異,以上這些因素都可能對(duì)人臉聚類效果產(chǎn)生一定的影響。為使評(píng)測(cè)結(jié)果能夠真實(shí)反應(yīng)人臉聚類算法的優(yōu)劣,人臉聚類評(píng)測(cè)數(shù)據(jù)集應(yīng)盡可能模擬實(shí)際場(chǎng)景,并達(dá)到一定的量級(jí)規(guī)模,至少達(dá)到百萬(wàn)級(jí)數(shù)據(jù)規(guī)模,采集對(duì)象應(yīng)盡可能覆蓋不同年齡段和性別,采集場(chǎng)景要覆蓋室外、室內(nèi)、晴天、陰天等多種環(huán)境條件,同一個(gè)采集對(duì)象需采集多張不同偏轉(zhuǎn)角度和遮擋程度的抓拍照,遮擋方式包含但不限于戴口罩、墨鏡、帽子等。

3 人臉聚類評(píng)測(cè)指標(biāo)

在GA/T 1344-2016《安防人臉識(shí)別應(yīng)用視頻人臉圖像提取技術(shù)要求》標(biāo)準(zhǔn)中,針對(duì)人臉聚類效果評(píng)測(cè)提出了誤聚率和漏聚率兩個(gè)評(píng)價(jià)指標(biāo)。其中誤聚率定義為人臉聚類結(jié)果中不同人次人臉圖像聚類為同一分組的組數(shù)占聚類分組總數(shù)的比例;漏聚率定義為人臉聚類結(jié)果中同人次人臉圖像未聚類為同一分組的人次數(shù)占應(yīng)聚類人次總數(shù)的比例。從定義上看,這兩個(gè)指標(biāo)將人臉聚類后形成的分組結(jié)果簡(jiǎn)單地分為正確分組和錯(cuò)誤分組兩類。但由于人口流動(dòng)性大、身份庫(kù)數(shù)據(jù)不足等原因,各地公安實(shí)戰(zhàn)業(yè)務(wù)應(yīng)用中形成的人員檔案通常是匿名檔案。對(duì)于匿名檔案而言,若同一個(gè)人的人臉抓拍照被分到兩個(gè)不同檔案里,是缺乏依據(jù)認(rèn)定哪個(gè)檔案作為正確分組目標(biāo)的。另外,這種評(píng)測(cè)方法對(duì)于聚類效果的評(píng)測(cè)角度也是不完善的,假設(shè)聚類產(chǎn)生的某個(gè)分組中有10張人臉圖片可能存在兩種分區(qū)情況,一種是10張圖片有7張屬于甲,其余3張屬于乙;另一種是10張圖片中有7張屬于甲,其余3張分別屬于乙、丙、丁。這種情況下,實(shí)戰(zhàn)中會(huì)認(rèn)為前者的聚類效果好于后者,但兩種情況按照GA/T 1344-2016的評(píng)測(cè)方案計(jì)算出來(lái)的評(píng)價(jià)指標(biāo)可能是相同的。

為推動(dòng)行業(yè)內(nèi)人臉聚類算法評(píng)測(cè)體系的科學(xué)建設(shè),本文參考國(guó)際權(quán)威學(xué)術(shù)期刊論文資料,提出了一套相對(duì)科學(xué)完整的人臉聚類算法評(píng)測(cè)體系。本評(píng)測(cè)體系包含聚類準(zhǔn)確率、聚類召回率、聚類擴(kuò)散率三個(gè)評(píng)測(cè)指標(biāo),指標(biāo)定義如下:

聚類準(zhǔn)確率(Precision):反映一個(gè)聚類簇中屬于同一個(gè)人的抓拍照樣本占比有多少,是否存在不同人的抓拍照樣本聚合在同一個(gè)聚類簇的情況。

聚類召回率(Recall):反映一個(gè)聚類簇中是否聚合了同一個(gè)人的所有抓拍照樣本,召回的比例有多少,是否存在漏聚的情況。

聚類擴(kuò)散率(Expansion):反映同一個(gè)人的抓拍照樣本被聚合到多少個(gè)聚類簇中,是否存在一人多類的情況。

本文提出的聚類效果評(píng)測(cè)體系采用先計(jì)算單一樣本的聚類準(zhǔn)確率和聚類召回率,再計(jì)算加權(quán)平均值作為整體聚類效果評(píng)測(cè)指標(biāo)的方案。該方案充分考慮了每個(gè)樣本的聚類結(jié)果對(duì)聚類效果的貢獻(xiàn),并且不需要指定對(duì)于抓拍照樣本哪個(gè)類簇才是它正確的歸屬,更符合公安實(shí)戰(zhàn)場(chǎng)景中的匿名檔情況。同時(shí)通過(guò)加入聚類擴(kuò)散率的評(píng)測(cè)指標(biāo),從更為豐富的維度對(duì)聚類效果進(jìn)行了評(píng)測(cè),較好地避免了前文中提到的聚類結(jié)果不同但得到的相同評(píng)測(cè)結(jié)果的情況。

4 人臉聚類評(píng)測(cè)流程

將人臉聚類算法評(píng)測(cè)平臺(tái)、被測(cè)系統(tǒng)、測(cè)試電腦通過(guò)IP網(wǎng)絡(luò)連通,在測(cè)試電腦登錄人臉聚類算法評(píng)測(cè)平臺(tái)客戶端,創(chuàng)建人臉聚類評(píng)測(cè)數(shù)據(jù)集,并上傳評(píng)測(cè)數(shù)據(jù)至服務(wù)端,創(chuàng)建人臉聚類評(píng)測(cè)任務(wù),配置任務(wù)名稱、被測(cè)系統(tǒng)IP地址、被測(cè)系統(tǒng)服務(wù)端口號(hào),指定本次評(píng)測(cè)任務(wù)使用的評(píng)測(cè)數(shù)據(jù)集,參考被測(cè)系統(tǒng)人臉聚類接口說(shuō)明填寫(xiě)JSON報(bào)文,向被測(cè)系統(tǒng)下發(fā)人臉聚類評(píng)測(cè)任務(wù),被測(cè)系統(tǒng)接收人臉聚類評(píng)測(cè)數(shù)據(jù)集后啟動(dòng)人臉聚類服務(wù),完成人臉聚類,并將人臉聚類結(jié)果按照格式要求寫(xiě)入結(jié)果文件后回傳至人臉聚類算法評(píng)測(cè)平臺(tái)。人臉聚類算法評(píng)測(cè)平臺(tái)接收、解析聚類結(jié)果文件,與評(píng)測(cè)數(shù)據(jù)集標(biāo)注文件對(duì)照分析,計(jì)算出聚類準(zhǔn)確率、聚類召回率、聚類擴(kuò)散率三個(gè)評(píng)測(cè)指標(biāo)后在客戶端展示評(píng)測(cè)結(jié)果。

5 結(jié)語(yǔ)

為推動(dòng)公安行業(yè)內(nèi)人臉聚類效果評(píng)測(cè)體系科學(xué)建設(shè),滿足日益增長(zhǎng)的視頻監(jiān)控系統(tǒng)智能化建設(shè)需要,本文參考國(guó)際權(quán)威學(xué)術(shù)期刊論文資料,結(jié)合公安實(shí)戰(zhàn)應(yīng)用場(chǎng)景,提出了一套包含人臉聚類測(cè)試數(shù)據(jù)集要求及聚類效果評(píng)測(cè)指標(biāo)的完整評(píng)測(cè)體系。該評(píng)測(cè)體系相較于原有公安行業(yè)標(biāo)準(zhǔn)中的人臉聚類評(píng)測(cè)方案,評(píng)價(jià)指標(biāo)更為科學(xué)、嚴(yán)謹(jǐn)、更為貼合公安實(shí)際業(yè)務(wù)場(chǎng)景。希望能夠?yàn)榻窈蟠笠?guī)模人臉聚類效果評(píng)測(cè)認(rèn)證提供參考依據(jù),促進(jìn)公共安全行業(yè)健康發(fā)展。

猜你喜歡
測(cè)系統(tǒng)評(píng)測(cè)人臉識(shí)別
人臉識(shí)別 等
次時(shí)代主機(jī)微軟XSX全方位評(píng)測(cè)(下)
次時(shí)代主機(jī)微軟XSX全方位評(píng)測(cè)(上)
揭開(kāi)人臉識(shí)別的神秘面紗
攻坡新利器,TOKEN VENTOUS評(píng)測(cè)
Canyon Ultimate CF SLX 8.0 DI2評(píng)測(cè)
防洪非工程措施設(shè)計(jì)實(shí)例——嘉興市水文巡測(cè)系統(tǒng)項(xiàng)目設(shè)計(jì)
電快速瞬變脈沖群對(duì)核測(cè)系統(tǒng)的影響及對(duì)策
基于類獨(dú)立核稀疏表示的魯棒人臉識(shí)別
基于廣域量測(cè)系統(tǒng)的電力系統(tǒng)綜合負(fù)荷辨識(shí)模型的研究
昆明市| 葵青区| 宁南县| 长治市| 肥西县| 泰宁县| 万荣县| 阿勒泰市| 武安市| 工布江达县| 策勒县| 蒲江县| 莲花县| 天长市| 张掖市| 华池县| 姜堰市| 体育| 南丰县| 汶川县| 曲阜市| 隆子县| 镇原县| 平谷区| 安达市| 绥宁县| 曲麻莱县| 土默特左旗| 恩施市| 汉寿县| 民权县| 孝感市| 奉新县| 南京市| 保康县| 云梦县| 开鲁县| 仁怀市| 承德市| 宿迁市| 连平县|