□ 文/丁立新
人臉識(shí)別,隨著技術(shù)的應(yīng)用和普及,已經(jīng)走入了每一個(gè)人的生活中,從最常見(jiàn)的手機(jī)人臉解鎖,到酒店刷臉、金融刷臉、火車(chē)站刷臉等等,一時(shí)間,似乎人臉識(shí)別已經(jīng)到了無(wú)所不能的地步。實(shí)際上,對(duì)于人臉識(shí)別的應(yīng)用,因?yàn)檎J(rèn)識(shí)深度的不同,不同的人有著不同的態(tài)度,有些人將人臉識(shí)別神話(huà),有些人對(duì)人臉識(shí)別的不準(zhǔn)確性存在巨大的恐懼。在人工智能發(fā)展的如火如荼的今天,需要以客觀的態(tài)度看待人臉識(shí)別,就必然需要認(rèn)清人臉識(shí)別在應(yīng)用中的技術(shù)難點(diǎn),并從產(chǎn)品、工程、解決方案等多角度理解人臉識(shí)別的應(yīng)用。
一般來(lái)說(shuō),人臉識(shí)別被分為主動(dòng)識(shí)別和被動(dòng)識(shí)別。
張張嘴、搖搖頭,這是金融核驗(yàn)最典型的方式,也是最成熟的主動(dòng)識(shí)別方式。通過(guò)在線(xiàn)的智能分析,完成1:1的高精度核驗(yàn),同時(shí)完成了配合式的真人核驗(yàn),能夠節(jié)省大量人工核驗(yàn)的工作,節(jié)約柜臺(tái)排隊(duì)辦理業(yè)務(wù)的時(shí)間。
但是,這樣的核驗(yàn)方式的體驗(yàn)較差,對(duì)于所處場(chǎng)合的環(huán)境要求高,要求的配合度較高,效率較低;考慮金融核驗(yàn)應(yīng)用的頻度不高,這種方式仍然有較長(zhǎng)的生命力。
金融核驗(yàn)的本質(zhì)在于證明“鏡頭前你是不是真的你”,這一類(lèi)的1:1的人員核驗(yàn),結(jié)合配合式的活體檢驗(yàn),以及嚴(yán)格的場(chǎng)景要求,是人臉識(shí)別的最佳場(chǎng)景。除此以外的一些應(yīng)用,往往會(huì)面臨更大的困難。
通俗的分解一下人臉的屬性,人臉是可見(jiàn)的、有表情變化的、有年齡變化的、有可能被遮擋的、有光線(xiàn)影響的。由于其核心的屬性是視覺(jué)可見(jiàn)的,所以,人臉識(shí)別需要光,同時(shí)也懼怕光。
早期普遍采用的近紅外人臉識(shí)別技術(shù),利用高強(qiáng)度的近紅外補(bǔ)光將鏡頭前的人臉打亮,由于人眼對(duì)紅外光的不可見(jiàn)特性,在提升識(shí)別效果的同時(shí),不會(huì)對(duì)人眼造成任何影響。近紅外人臉識(shí)別,逐漸成為室內(nèi)小庫(kù)容人臉識(shí)別的主要方式。
但是,由于紅外識(shí)別太依賴(lài)于近紅外補(bǔ)光技術(shù),在室外的太陽(yáng)光下,由于太陽(yáng)全光譜的影響,近紅外對(duì)于人臉的補(bǔ)光無(wú)法對(duì)人臉的紅外成像向室內(nèi)那樣清晰穩(wěn)定。所以,面臨室外的應(yīng)用和大庫(kù)容的應(yīng)用,開(kāi)始廣泛使用可見(jiàn)光識(shí)別方法。
可見(jiàn)光人臉識(shí)別,基于可見(jiàn)光下的彩色成像,圖像效果好,像素高,特征點(diǎn)足夠多,采用可見(jiàn)光算法的識(shí)別,往往可以達(dá)到萬(wàn)級(jí)別的庫(kù)容,并且支持高達(dá)95%以上的識(shí)別率。
可見(jiàn)光識(shí)別優(yōu)勢(shì)非常明顯,但是,對(duì)于圖像采集系統(tǒng)的依賴(lài)也更強(qiáng),需要更高感光的圖像傳感器,夜間黑暗場(chǎng)景下過(guò)高的白光補(bǔ)光也可能引起人眼的不適;相比依賴(lài)近紅外補(bǔ)光的紅外識(shí)別,可見(jiàn)光的識(shí)別基本上沒(méi)有距離的要求(只要光線(xiàn)足夠,可以通過(guò)鏡頭的焦距彌補(bǔ)),對(duì)于室外的應(yīng)用,要比紅外識(shí)別具有更好的適應(yīng)性,但是,仍然無(wú)法避免太陽(yáng)本身進(jìn)入畫(huà)面所產(chǎn)生的超高寬動(dòng)態(tài)場(chǎng)景。 但是,仍然是最佳的識(shí)別方式。
通過(guò)大光圈鏡頭、高感光sensor、高性能芯片等硬件的綜合作用,同時(shí),用于室外,需要考慮防水、防塵、高濕、高溫、極低溫的多種場(chǎng)景適應(yīng)性,同時(shí),有需要保證精準(zhǔn)的人臉識(shí)別。綜合性的產(chǎn)品化能力,是考驗(yàn)室外人臉門(mén)禁的核心命題。甚至用于速通門(mén)場(chǎng)景的全露天門(mén)禁,將產(chǎn)品化的要求推到了新的高度。
門(mén)禁是主動(dòng)、配合式的核驗(yàn),為了通過(guò)核驗(yàn)而進(jìn)門(mén),人們可以摘下墨鏡、湊近、正臉配合。被動(dòng)式核驗(yàn),由于各類(lèi)安全管控的需要,逐漸成為新的人臉識(shí)別熱點(diǎn)方向,由于其非配合性,甚至是故意躲避的特點(diǎn),被動(dòng)式人臉識(shí)別的高準(zhǔn)確率和低誤報(bào)率,一直是各大安防廠家的追逐的制高點(diǎn)。
非配合式核驗(yàn),除了高精度的算法外,更講究的是相機(jī)的架設(shè)位置、角度、鏡頭焦段、補(bǔ)光等。
安防行業(yè)流傳這一句話(huà),三分產(chǎn)品七分安裝,雖然聽(tīng)上去有些夸張,但從工程上讓每一個(gè)被動(dòng)式人臉抓拍相機(jī)發(fā)揮最大的效用是一門(mén)學(xué)問(wèn)。
宇視科技首創(chuàng)的3D工程仿真技術(shù),精確模擬桿高、角度、焦距、鏡頭等,減少在實(shí)際場(chǎng)景勘點(diǎn)的工作量,提升工作效率。自應(yīng)用以來(lái),讓城市每一個(gè)角落的相機(jī)更清晰準(zhǔn)確的工作,這就是工程性帶來(lái)的好處。
▲圖1 工程化仿真設(shè)計(jì)圖
2018年9月28日晚,張學(xué)友經(jīng)典巡回演唱會(huì)在河北奧體中心舉行,宇視科技人臉識(shí)別系統(tǒng)部署在場(chǎng)館及周邊重點(diǎn)區(qū)域,秒級(jí)識(shí)別布控系統(tǒng)中的黑名單人員并觸發(fā)報(bào)警,協(xié)助警方快速抓獲3名網(wǎng)上在逃人員,實(shí)現(xiàn)了演唱會(huì)追逃的“十連殺”!安防廠家在這場(chǎng)戰(zhàn)役中取得了最大的曝光度,體現(xiàn)了安防行業(yè)的算法水平和產(chǎn)品方案能力。
在中國(guó),對(duì)于作奸犯科者,自古以來(lái)流傳的老話(huà)是“寧可錯(cuò)殺一千,不可放過(guò)一個(gè)”,安排大量的侍衛(wèi)挨個(gè)仔細(xì)盤(pán)查,必然可以將每一個(gè)罪犯繩之以法。但是,在現(xiàn)今的社會(huì),如何在不經(jīng)意間,利用高科技手段完成高精度預(yù)警,安保人員進(jìn)行針對(duì)性盤(pán)查,這才是文明社會(huì)的主流,也是其中的難點(diǎn)。
人臉本身并不是天然具備將其數(shù)字化的方法,當(dāng)代的深度學(xué)習(xí)通過(guò)建立模型和訓(xùn)練,模擬了人類(lèi)記憶和識(shí)別人臉的方法。
約克大學(xué)的Rob Jenkins博士曾經(jīng)做過(guò)一個(gè)專(zhuān)門(mén)的研究,第一次確定了人類(lèi)可以記住的面孔數(shù)量——平均達(dá)到驚人的5000張臉,不同的人記錄的人臉數(shù)量分布在1000到10000之間。對(duì)于人類(lèi)而已,上萬(wàn)張人臉的記憶,已經(jīng)是絕大多數(shù)人類(lèi)的極限了。
計(jì)算機(jī)科學(xué),把所有事物轉(zhuǎn)化為二進(jìn)制進(jìn)行記錄,對(duì)于人臉通過(guò)建模,也是針對(duì)每一張人臉進(jìn)行記錄,經(jīng)歷模型的升級(jí)、樣本的訓(xùn)練,可以逐步提升計(jì)算機(jī)認(rèn)識(shí)人臉的水平,但是,受著模型、芯片和樣本的限制,從幾百?gòu)埲四樀淖R(shí)別到幾萬(wàn)張人臉的準(zhǔn)確識(shí)別,基于目前的水平,很難持續(xù)快速的發(fā)展。
與之矛盾的是,在人臉識(shí)別的持續(xù)熱度下,更多大庫(kù)容、高精度要求的領(lǐng)域開(kāi)始呼喚人臉識(shí)別技術(shù)的融入。
地鐵刷臉乘車(chē)就是一個(gè)典型的案例。
深圳地鐵,通過(guò)本地APP的注冊(cè)人數(shù)約661萬(wàn)人,其中每天約有100萬(wàn)人次的使用量。假定目前頂級(jí)的人臉識(shí)別算法,對(duì)于萬(wàn)人臉庫(kù)的識(shí)別準(zhǔn)確率有99.5%,那么,如果采用人臉識(shí)別來(lái)實(shí)現(xiàn)扣費(fèi)乘車(chē),那每天都有數(shù)萬(wàn)人被識(shí)別錯(cuò)誤,是一場(chǎng)災(zāi)難。如果解決這個(gè)問(wèn)題?
先來(lái)認(rèn)清刷臉乘車(chē)的核心需求,是希望采用人臉識(shí)別技術(shù),提高效率,提升安全性,減少高峰期的擁堵。
如果直接面對(duì)661萬(wàn)注冊(cè)人員,那么,任何人都會(huì)覺(jué)得茫然。需要分解。
第一,地鐵內(nèi)會(huì)出現(xiàn)哪幾類(lèi)人?
首先是工作人員,每個(gè)站內(nèi)少量的本地工作人員,加上總公司的輪崗人員,總?cè)藬?shù)不搞錯(cuò)千人;
然后是65歲以上人群,不需要買(mǎi)票,只需要通過(guò)刷身份證和人臉,完成年齡核驗(yàn)和本人核驗(yàn);
接著對(duì)普通乘客,可分為通勤乘客和單次乘客。
對(duì)于單次乘客,可提前通過(guò)身份證與支付寶的綁定,采用人證比對(duì)核驗(yàn)過(guò)閘,信用支付;
對(duì)于通勤乘客,通過(guò)設(shè)定特定的通勤時(shí)間和通勤站點(diǎn),完成通勤人員刷臉過(guò)閘。
綜上,如果提高通勤乘客的使用體驗(yàn)和效率是目前可以處理的重點(diǎn)。
第二,通勤乘客的人臉識(shí)別如何控制識(shí)別精度;
由于地鐵不同站點(diǎn)的特點(diǎn),其客流量差異較大。我們假定一個(gè)兩個(gè)地鐵中轉(zhuǎn)站,進(jìn)站客流和出站客流日均在5萬(wàn)人次。
有幾種方法進(jìn)行進(jìn)一步的分流:
有效時(shí)段預(yù)約法;
通勤人員一般具有規(guī)律的上下班時(shí)間,通過(guò)限定有效的通行時(shí)間,可大幅度減少同一時(shí)段內(nèi)的人員底庫(kù)數(shù)量;
入口編號(hào)通行法;
對(duì)于大型站點(diǎn),人流量極大的,可以在一排閘機(jī)上編號(hào),對(duì)于預(yù)約通道區(qū)分單號(hào)和雙號(hào),進(jìn)一步把人員庫(kù)數(shù)量減半;
進(jìn)出站點(diǎn)匹配法;
不管如何,如果做單次識(shí)別就確認(rèn)信用支付,那么一次誤識(shí)就會(huì)導(dǎo)致支付異常;然而,通過(guò)進(jìn)、出站點(diǎn)的匹配,做雙重校驗(yàn),原本1‰的誤識(shí),就變成了百萬(wàn)分之一,可極大幅度減少支付異常;單次識(shí)別錯(cuò)誤導(dǎo)致的收費(fèi)損失,需要不斷的算法優(yōu)化提升;
預(yù)約名額限定法;
最后一招,根據(jù)運(yùn)營(yíng)的情況,結(jié)合實(shí)際的預(yù)約人數(shù),為了將錯(cuò)誤識(shí)別控制在一定比例之下,可通過(guò)名額限制預(yù)約人數(shù),確保識(shí)別率。
第三, 刷臉記錄留存3個(gè)月,可確保異常支付數(shù)據(jù)隨時(shí)可查詢(xún)和回溯。
本文只是通過(guò)問(wèn)題分解,描述了一種地鐵刷臉應(yīng)用的可行性。不代表任何已運(yùn)行的地鐵應(yīng)用方式。通過(guò)行業(yè)理解,把大批量人員分解為小批量,把大庫(kù)容分解為小庫(kù)容,用綜合解決方案把不可能變?yōu)榭赡堋?/p>
▲圖2 地鐵業(yè)務(wù)模型分解圖
人臉識(shí)別技術(shù)本身,還需要更多的時(shí)間發(fā)展和完善,更優(yōu)的模型、海量的樣本訓(xùn)練、更出色的處理芯片,將人臉的年齡變化、喜怒的變化都更精準(zhǔn)的識(shí)別。與此同時(shí),在未來(lái)很長(zhǎng)一段時(shí)間內(nèi),優(yōu)秀的產(chǎn)品化能力,工程能力和綜合性的解決方案,都是決定人工智能成敗的核心因素。每一個(gè)都不可或缺。