国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

深度學(xué)習(xí)提升智能IPC準(zhǔn)確率的一線曙光

2016-06-05 14:58:16周宇杰
中國(guó)公共安全 2016年17期
關(guān)鍵詞:圖像識(shí)別人臉識(shí)別準(zhǔn)確率

□ 文/周宇杰

深度學(xué)習(xí)提升智能IPC準(zhǔn)確率的一線曙光

□ 文/周宇杰

究其根本,智能IPC的核心為圖像識(shí)別技術(shù)。通過(guò)各類(lèi)視頻智能分析技術(shù),解決傳統(tǒng)視頻監(jiān)控必須依賴人工查看視頻的問(wèn)題,實(shí)現(xiàn)有效信息的結(jié)構(gòu)化數(shù)據(jù)提取,讓視頻監(jiān)控的使用者真正告別人工安防,走進(jìn)自動(dòng)化安防的新時(shí)代。而現(xiàn)在,深度學(xué)習(xí)正帶動(dòng)圖像識(shí)別技術(shù)的一大變革,對(duì)智能IPC而言,也許能夠解決困擾其多年的難題——準(zhǔn)確率。

圖像識(shí)別,智能IPC的技術(shù)核心

圖像識(shí)別的能力來(lái)源于人類(lèi),圖像刺激作用于感覺(jué)器官,人們辨認(rèn)出它是經(jīng)驗(yàn)過(guò)的某一圖形,甚至能感知到圖像距離或者形狀的改變,這一過(guò)程叫做圖像再認(rèn)。簡(jiǎn)單來(lái)說(shuō),就是“之前見(jiàn)過(guò)一只狗,再看到類(lèi)似狗的目標(biāo)時(shí),能夠?qū)⑵湔J(rèn)出來(lái)”的過(guò)程。在圖像識(shí)別中,既要有當(dāng)時(shí)進(jìn)入感官的信息,也要有記憶中存儲(chǔ)的信息,只有通過(guò)存儲(chǔ)的信息與當(dāng)前信息進(jìn)行比較的加工過(guò)程,才能實(shí)現(xiàn)對(duì)圖像的再認(rèn)。

計(jì)算機(jī)的圖像識(shí)別技術(shù),則是利用計(jì)算機(jī)對(duì)圖像進(jìn)行處理、分析和理解,以識(shí)別各種不同模式目標(biāo)和對(duì)象的技術(shù)。圖像識(shí)別所研究的問(wèn)題,是如何用計(jì)算機(jī)代替人類(lèi)去自動(dòng)處理大量的無(wú)力信息,解決人類(lèi)所無(wú)法識(shí)別或者識(shí)別過(guò)于耗費(fèi)資源的問(wèn)題,從而很大程度上解放人類(lèi)的勞動(dòng)力。

圖像識(shí)別技術(shù)可應(yīng)用于各行各業(yè),而對(duì)于安防行業(yè)而言,它的意義是顯而易見(jiàn)的。隨著國(guó)家對(duì)平安城市建設(shè)力度的加大,監(jiān)控覆蓋面、密度越來(lái)越大,這在提升城市整體防控能力的同時(shí),也給公安工作人員帶來(lái)了巨大的負(fù)擔(dān)——單獨(dú)一個(gè)高清視頻監(jiān)控點(diǎn)每天約產(chǎn)生40G的視頻圖像數(shù)據(jù),一個(gè)城市的監(jiān)控體量達(dá)到萬(wàn)級(jí)也不少見(jiàn),要全部看完這些監(jiān)控視頻,并提取、保存其中的重點(diǎn)線索,工作量可想而知。利用計(jì)算機(jī)圖像識(shí)別技術(shù),就能對(duì)這些視頻進(jìn)行智能分析,提取出其中關(guān)鍵的圖片、語(yǔ)義信息,并進(jìn)行以圖搜圖、語(yǔ)義搜圖等大數(shù)據(jù)應(yīng)用,避免“99%的視頻還沒(méi)經(jīng)過(guò)梳理采集,就被自動(dòng)覆蓋”的窘?jīng)r。

在安防領(lǐng)域,以圖像識(shí)別技術(shù)為核心的視頻智能分析主要有兩種產(chǎn)品形態(tài):前端智能和后端智能。而隨著IPC內(nèi)置運(yùn)算芯片性能的不斷提升,智能前端化已成為監(jiān)控行業(yè)發(fā)展的大趨勢(shì),在某些前端建設(shè)的項(xiàng)目中,已有客戶明確提出“智能IPC要占到全部建設(shè)點(diǎn)位數(shù)20%~40%”的要求。以科達(dá)感知型攝像機(jī)為代表,智能IPC通過(guò)將智能分析算法嵌入到前端攝像機(jī)中,前端攝像機(jī)在采集高清視頻的同時(shí),對(duì)視頻內(nèi)容進(jìn)行實(shí)時(shí)分析,提取出畫(huà)面中關(guān)鍵的、感興趣的、有效的信息,形成結(jié)構(gòu)化的數(shù)據(jù),并傳送給后端大數(shù)據(jù)平臺(tái)做存儲(chǔ)或深入分析。

目前,智能IPC主要能夠?qū)θ?、?chē)目標(biāo)進(jìn)行分析,且針對(duì)不同的目標(biāo)、應(yīng)用場(chǎng)景擁有不同的類(lèi)別。科達(dá)感知型攝像機(jī)分為車(chē)輛卡口、人員卡口、結(jié)構(gòu)化、槍球聯(lián)動(dòng)4大類(lèi)別:

● 車(chē)輛卡口主要針對(duì)機(jī)動(dòng)車(chē)道監(jiān)控,能提供車(chē)輛目標(biāo)檢測(cè)、車(chē)牌識(shí)別、車(chē)輛顏色識(shí)別、車(chē)型識(shí)別等功能;

● 人員卡口主要針對(duì)人形通道監(jiān)控,能提供人臉檢測(cè)抓拍、行人檢測(cè)抓拍、行人基本屬性分析(包括性別、行進(jìn)方向、顏色、有無(wú)口罩等)功能;

● 結(jié)構(gòu)化攝像機(jī)主要針對(duì)一般監(jiān)控場(chǎng)景,如人車(chē)混行的道路,提供車(chē)輛/人員目標(biāo)檢測(cè)抓拍,結(jié)構(gòu)化屬性分析功能;

● 槍球聯(lián)動(dòng)主要針對(duì)廣場(chǎng)類(lèi)的開(kāi)闊場(chǎng)景,槍機(jī)負(fù)責(zé)檢測(cè)監(jiān)控視野中的運(yùn)動(dòng)目標(biāo),球機(jī)在槍機(jī)的指令下對(duì)目標(biāo)進(jìn)行跟蹤特寫(xiě)以及抓拍,同時(shí)分析目標(biāo)的結(jié)構(gòu)化屬性。

這4類(lèi)攝像機(jī)基本覆蓋了平安城市項(xiàng)目中各類(lèi)監(jiān)控場(chǎng)景,通過(guò)智能前端化,實(shí)現(xiàn)智能視頻監(jiān)控的規(guī)?;渴?。

準(zhǔn)確率,智能IPC的應(yīng)用難點(diǎn)

圖像識(shí)別技術(shù)應(yīng)用智能IPC的市場(chǎng)前景以及意義是非凡的,然而,從目前來(lái)看,大部分智能IPC在實(shí)際應(yīng)用中仍受到各種各樣的質(zhì)疑,其中最為突出的問(wèn)題就是準(zhǔn)確率。智能IPC識(shí)別準(zhǔn)確率根本上取決于圖像識(shí)別技術(shù)所使用的算法,而在很長(zhǎng)一段時(shí)間里,“圖像識(shí)別模型”為主流方法。

圖像識(shí)別模型,是人們?yōu)榱司幹颇M人類(lèi)圖像識(shí)別活動(dòng)的計(jì)算機(jī)程序而提出的,模板匹配模型為其中之一。這種模型認(rèn)為,識(shí)別某個(gè)圖像,必須在過(guò)去的經(jīng)驗(yàn)中有這個(gè)圖像的記憶模式(又叫模板),當(dāng)前的刺激如果能與大腦中的模板相匹配,這個(gè)圖像也就被識(shí)別了。但這種模型強(qiáng)調(diào)圖像必須與腦中的模板完全符合才能加以識(shí)別,有一定的局限性,為此,格式塔心理學(xué)家又據(jù)此提出了一個(gè)原型匹配模型。原型匹配模型認(rèn)為,在長(zhǎng)時(shí)記憶中存儲(chǔ)的并不是所要識(shí)別的無(wú)數(shù)個(gè)模板,而是圖像的某些“相似性”,從圖像中抽象出來(lái)的“相似性”就可作為原型,拿它來(lái)檢驗(yàn)所要識(shí)別的圖像;如果能找到一個(gè)相似的原型,這個(gè)圖像也就被識(shí)別了。但是,這種模型沒(méi)有說(shuō)明人是怎樣對(duì)相似的刺激進(jìn)行辨別和加工的,它也難以在計(jì)算機(jī)程序中得到實(shí)現(xiàn)。因此又有人提出了一個(gè)更復(fù)雜的模型,即“泛魔”識(shí)別模型……

應(yīng)用圖像識(shí)別模型,安防行業(yè)已有較為成熟的應(yīng)用案例,如車(chē)牌識(shí)別。對(duì)車(chē)牌識(shí)別而言,在標(biāo)準(zhǔn)卡口的架設(shè)條件下,車(chē)牌識(shí)別率普遍可以達(dá)到98%以上,甚至99%。這是因?yàn)?,在?chē)牌識(shí)別的過(guò)程中,車(chē)輛通過(guò)卡口時(shí)的姿態(tài)一般是固定的,車(chē)牌的安裝位置也比較固定,這為識(shí)別創(chuàng)造了很好的條件;同時(shí),車(chē)牌識(shí)別只需識(shí)別幾十個(gè)漢字、10個(gè)數(shù)字和26個(gè)字母,這進(jìn)一步降低了識(shí)別的難度。

與車(chē)牌識(shí)別出色、穩(wěn)定的準(zhǔn)確率相比,人臉識(shí)別的準(zhǔn)確率最難把控,而人臉識(shí)別卻也是安防市場(chǎng)中最受關(guān)注、應(yīng)用范圍最廣的智能模塊。所謂人臉識(shí)別的“準(zhǔn)確率”,是指基于全世界最權(quán)威的人臉數(shù)據(jù)庫(kù)LFW進(jìn)行比對(duì)測(cè)試的成績(jī)。LFW由美國(guó)馬薩諸塞大學(xué)阿默斯特分校管理,可以認(rèn)為是一個(gè)考察深度學(xué)習(xí)系統(tǒng)人臉識(shí)別能力的“題庫(kù)”,它從互聯(lián)網(wǎng)上提取6000張不同朝向、表情和光照環(huán)境下的人臉照片作為考題,可以讓任何系統(tǒng)在里面“跑分”。跑分過(guò)程如下:LFW給出一組照片,詢問(wèn)測(cè)試中的系統(tǒng)兩張照片是不是同一個(gè)人,系統(tǒng)給出yes或no的答案。99%的準(zhǔn)確率,意味著在測(cè)試的所有題目中,人臉識(shí)別系統(tǒng)答對(duì)了99%的題目。

然而問(wèn)題的關(guān)鍵是,LFW以及類(lèi)似數(shù)據(jù)庫(kù)FDDB等,只是一個(gè)純粹實(shí)驗(yàn)室級(jí)別、學(xué)術(shù)性質(zhì)的測(cè)試工具,在樣本量可能達(dá)到十萬(wàn)級(jí)、百萬(wàn)級(jí)的實(shí)際商業(yè)場(chǎng)景下,測(cè)試得分高的系統(tǒng)不一定能保持已有成績(jī),其誤識(shí)率將直線上升,甚至可能根本沒(méi)法用。部分真實(shí)復(fù)雜場(chǎng)景測(cè)試中,十萬(wàn)分之一的誤識(shí)率下,98%的人臉識(shí)別準(zhǔn)確率會(huì)直線下降到70%左右。且人臉識(shí)別系統(tǒng)在安防實(shí)際應(yīng)用中,對(duì)安裝環(huán)境、安裝角度等要求較高,目前距離用戶實(shí)戰(zhàn)要求仍有一定距離。

深度學(xué)習(xí),攻克準(zhǔn)確率難題的曙光

現(xiàn)階段比較受歡迎的圖像識(shí)別基礎(chǔ)算法為深度學(xué)習(xí)法,深度學(xué)習(xí)模型屬于神經(jīng)網(wǎng)絡(luò),而神經(jīng)網(wǎng)絡(luò)的歷史可追溯至上世紀(jì)四十年代,曾經(jīng)在八九十年代流行。神經(jīng)網(wǎng)絡(luò)試圖通過(guò)模擬大腦認(rèn)知的激勵(lì),解決各種機(jī)器學(xué)習(xí)的問(wèn)題。

后來(lái),由于種種原因,大多數(shù)學(xué)者在相當(dāng)長(zhǎng)的一段時(shí)間內(nèi)放棄了神經(jīng)網(wǎng)絡(luò),轉(zhuǎn)而采用諸如支持向量機(jī)、Boosting、最近鄰等分類(lèi)器。這些分類(lèi)器可以用具有一個(gè)或兩個(gè)隱含層的神經(jīng)網(wǎng)絡(luò)模擬,因此被稱(chēng)作淺層機(jī)器學(xué)習(xí)模型。它們不再模擬大腦的認(rèn)知機(jī)理;相反,針對(duì)不同的任務(wù)設(shè)計(jì)不同的系統(tǒng),并采用不同的手工設(shè)計(jì)的特征,例如語(yǔ)音識(shí)別采用高斯混合模型和隱馬爾可夫模型,物體識(shí)別采用SIFT特征,人臉識(shí)別采用LBP特征,行人檢測(cè)采用HOG特征。

深度學(xué)習(xí)在計(jì)算機(jī)視覺(jué)領(lǐng)域最具影響力的突破發(fā)生在2012年,Hinton的研究小組采用深度學(xué)習(xí)贏得了ImageNet圖像分類(lèi)的比賽。ImageNet是當(dāng)今計(jì)算機(jī)視覺(jué)領(lǐng)域最具影響力的比賽之一,它的訓(xùn)練和測(cè)試樣本都來(lái)自于互聯(lián)網(wǎng)圖片,訓(xùn)練樣本超過(guò)百萬(wàn),任務(wù)是將測(cè)試樣本分成1000類(lèi)。自2009年,包括工業(yè)界在內(nèi)的很多計(jì)算機(jī)視覺(jué)小組都參加了每年一度的比賽,各個(gè)小組的方法逐漸趨同;2012年,排名2到4位的小組都采用的傳統(tǒng)模擬識(shí)別方法,他們準(zhǔn)確率的差別不超過(guò)1%,而首次參賽的Hiton研究小組采用的是深度學(xué)習(xí)的方法,且準(zhǔn)確率超出第二名10%以上。這個(gè)結(jié)果在計(jì)算機(jī)視覺(jué)領(lǐng)域產(chǎn)生了極大的震動(dòng),掀起了深度學(xué)習(xí)的熱潮。

與傳統(tǒng)模式識(shí)別相比,深度學(xué)習(xí)最大的不同在于它是從大數(shù)據(jù)中自動(dòng)學(xué)習(xí)特征,而非采用手工設(shè)計(jì)的特征模型。在過(guò)去幾十年模式識(shí)別的各種應(yīng)用中,手工設(shè)計(jì)的特征處于統(tǒng)治地位,它主要依靠設(shè)計(jì)者的經(jīng)驗(yàn)知識(shí),很難利用大數(shù)據(jù)的優(yōu)勢(shì);由于依賴手工調(diào)整參數(shù),特征的設(shè)計(jì)中只允許出現(xiàn)少量參數(shù)。深度學(xué)習(xí)的優(yōu)勢(shì)則顯而易見(jiàn)——大數(shù)據(jù)中可以包含成千上萬(wàn)的參數(shù),用來(lái)訓(xùn)練深度學(xué)習(xí)的數(shù)據(jù)越多,深度學(xué)習(xí)算法的魯棒性、泛化能力就越強(qiáng)。

目前,深度學(xué)習(xí)算法的數(shù)據(jù)普遍都是幾十萬(wàn)、上百萬(wàn)級(jí),像一些互聯(lián)網(wǎng)行業(yè)的IT巨頭們,他們的訓(xùn)練數(shù)據(jù)會(huì)是上千萬(wàn)、甚至上億級(jí)別,這也是國(guó)外如Google、FaceBook、Microsoft等,國(guó)內(nèi)如百度、騰訊等IT巨頭在深度學(xué)習(xí)算法的應(yīng)用效果上有著一定優(yōu)勢(shì)的原因。但I(xiàn)T企業(yè)與安防企業(yè)所用的訓(xùn)練數(shù)據(jù)不同:IT巨頭擁有的是互聯(lián)網(wǎng),安防企業(yè)擁有的則是安防大數(shù)據(jù)。二者圖像識(shí)別技術(shù)的關(guān)注點(diǎn)也有不同,IT巨頭的人臉識(shí)別技術(shù)是服務(wù)于他們的商業(yè)目標(biāo),比如圖像檢索、身份認(rèn)證、無(wú)人駕駛等,而安防企業(yè)主要關(guān)注的是人臉識(shí)別技術(shù)在公共安全領(lǐng)域的應(yīng)用。

經(jīng)過(guò)龐大數(shù)據(jù)量的訓(xùn)練后,深度學(xué)習(xí)不斷積累多種場(chǎng)景下的樣本數(shù)據(jù),可逐步提升圖像識(shí)別的準(zhǔn)確率。在車(chē)輛分析方面,原先車(chē)輛卡口攝像機(jī)只能做到車(chē)輛檢測(cè)、車(chē)牌檢測(cè)、車(chē)型分析等功能,依托深度學(xué)習(xí),除了可以提升原有的智能算法的準(zhǔn)確性,還可以擴(kuò)展更多的智能分析領(lǐng)域,例如車(chē)輛子型號(hào)、年款的分析、車(chē)內(nèi)司乘人員的檢測(cè)、安全帶檢測(cè)、打電話檢測(cè)等;對(duì)于最難的人臉檢測(cè),深度學(xué)習(xí)基于海量的經(jīng)驗(yàn)積累,可明顯改善復(fù)雜場(chǎng)景下人臉識(shí)別技術(shù)的準(zhǔn)確率。

理論上講,深度學(xué)習(xí)可以取代現(xiàn)有的很多傳統(tǒng)特征提取、目標(biāo)檢測(cè)技術(shù),在大幅提升圖像識(shí)別準(zhǔn)確率上已有成功案例,我們有理由期待深度學(xué)習(xí)讓人臉識(shí)別等復(fù)雜的識(shí)別技術(shù)落地于實(shí)際項(xiàng)目應(yīng)用中。

作者單位:蘇州科達(dá)科技股份有限公司

猜你喜歡
圖像識(shí)別人臉識(shí)別準(zhǔn)確率
人臉識(shí)別 等
乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
健康之家(2021年19期)2021-05-23 11:17:39
不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
2015—2017 年寧夏各天氣預(yù)報(bào)參考產(chǎn)品質(zhì)量檢驗(yàn)分析
揭開(kāi)人臉識(shí)別的神秘面紗
基于Resnet-50的貓狗圖像識(shí)別
電子制作(2019年16期)2019-09-27 09:34:50
高速公路圖像識(shí)別技術(shù)應(yīng)用探討
圖像識(shí)別在物聯(lián)網(wǎng)上的應(yīng)用
電子制作(2018年19期)2018-11-14 02:37:04
高速公路車(chē)牌識(shí)別標(biāo)識(shí)站準(zhǔn)確率驗(yàn)證法
圖像識(shí)別在水質(zhì)檢測(cè)中的應(yīng)用
電子制作(2018年14期)2018-08-21 01:38:16
姚安县| 临沭县| 漳州市| 邻水| 丹棱县| 麦盖提县| 囊谦县| 保亭| 金堂县| 宁波市| 新泰市| 多伦县| 清镇市| 青浦区| 芮城县| 无锡市| 郸城县| 自贡市| 西林县| 恩平市| 南平市| 长子县| 朝阳市| 鲁甸县| 张家界市| 安丘市| 庄河市| 饶平县| 天津市| 德庆县| 酉阳| 阿瓦提县| 富裕县| 浠水县| 大庆市| 竹溪县| 井研县| 托里县| 美姑县| 威海市| 井陉县|