国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

面向監(jiān)控視頻的人群異常事件檢測(cè)綜述

2023-03-24 01:44:35黃少年文沛然全琪
電腦知識(shí)與技術(shù) 2023年4期
關(guān)鍵詞:深度學(xué)習(xí)

黃少年 文沛然 全琪

關(guān)鍵詞:人群異常事件;深度學(xué)習(xí);無(wú)監(jiān)督學(xué)習(xí)

0 引言

由于人群聚集的情況經(jīng)常在各種城市公共場(chǎng)所中出現(xiàn),一旦在人群聚集的公共場(chǎng)所出現(xiàn)突發(fā)異常事件,很容易造成因人群擁擠引發(fā)的災(zāi)難性事件。另一方面,隨著視頻監(jiān)控系統(tǒng)的日益普及,基于監(jiān)控視頻內(nèi)容分析技術(shù)對(duì)公共場(chǎng)所的人群行為進(jìn)行分析、挖掘和管理成為可能。因此,分析并建模城市公共場(chǎng)所下密集人群的行為動(dòng)態(tài),預(yù)警并檢測(cè)人群場(chǎng)景的突發(fā)異常事件,避免人群災(zāi)難性事件的發(fā)生,成為亟待解決的一個(gè)研究課題。

本文從監(jiān)控視頻場(chǎng)景下的人群異常事件檢測(cè)的定義出發(fā),對(duì)現(xiàn)有的視頻異常檢測(cè)方法進(jìn)行綜述,詳細(xì)闡述了其研究現(xiàn)狀及各類方法的優(yōu)劣,介紹視頻異常檢測(cè)常用的數(shù)據(jù)集及評(píng)價(jià)指標(biāo),最后面向監(jiān)控視頻的人群異常檢測(cè)的未來(lái)的發(fā)展方向進(jìn)行總結(jié)和展望。

1 人群異常事件檢測(cè)概述

1.1 人群異常事件定義

面向監(jiān)控視頻的人群異常事件檢測(cè)技術(shù)是指:從海量監(jiān)控視頻數(shù)據(jù)中檢測(cè)出與大多數(shù)人不一致的少量異常事件。如:在養(yǎng)老院等機(jī)構(gòu)的監(jiān)控系統(tǒng)中,實(shí)現(xiàn)對(duì)老人跌倒事件的遠(yuǎn)程監(jiān)控;在機(jī)場(chǎng)、車站以及地鐵站等公共安防監(jiān)控系統(tǒng),檢測(cè)打架斗毆、異常奔跑、包裹滯留以及逃票等異常事件;在智能交通監(jiān)控系統(tǒng)中,實(shí)現(xiàn)對(duì)超速、闖紅燈、逆行等交通違章事件的檢測(cè)等;在不同的人群場(chǎng)景下,其人群異常事件的含義可能不同。

1.2 人群異常事件分類

根據(jù)應(yīng)用場(chǎng)景的不同,現(xiàn)有研究將通常把人群異常事件分成4種類型[1]:

(1) 外觀異常。如:人行道上的騎自行車者,或馬路上的障礙物。

(2) 短期運(yùn)動(dòng)異常。這類異??杀徽J(rèn)為是場(chǎng)景中不尋常的物體運(yùn)動(dòng)。如:一個(gè)人在圖書(shū)館跑步。

(3) 長(zhǎng)期軌跡異常。這類異常通常在場(chǎng)景中具有不尋常的物體軌跡。如:在人行道上拐來(lái)拐去的人,或在車流中不斷加塞的汽車。

(4) 群體異常。這類異常在場(chǎng)景中具有不尋常的相互作用。如:一群人突然向四周跑動(dòng)。

2 基于深度學(xué)習(xí)的視頻異常檢測(cè)方法

相較于計(jì)算機(jī)視覺(jué)領(lǐng)域其他檢測(cè)任務(wù),視頻異常事件檢測(cè)任務(wù)的挑戰(zhàn)性在于:異常事件定義具有場(chǎng)景依賴性、異常事件的稀少性、異常樣本的不確定性及視頻信息的多樣性[2-3]。不同于圖像以及文本數(shù)據(jù),視頻數(shù)據(jù)不僅僅具備空間信息同時(shí)也具備極強(qiáng)的時(shí)序信息。伴隨著深度學(xué)習(xí)的發(fā)展,針對(duì)視頻異常檢測(cè)任務(wù)所面臨的挑戰(zhàn),利用深度學(xué)習(xí)方法可以在一定程度上弱化異常檢測(cè)任務(wù)對(duì)場(chǎng)景地依賴性,增加模型的泛化能力。同時(shí),無(wú)監(jiān)督的方法也能一定程度上解決樣本不均衡引發(fā)的問(wèn)題。目前,利用無(wú)監(jiān)督的深度學(xué)習(xí)方法對(duì)視頻進(jìn)行異常事件檢測(cè)已成為主流的研究趨勢(shì)。現(xiàn)有的無(wú)監(jiān)督視頻異常檢測(cè)方法可大致分為基于重構(gòu)的方法、基于預(yù)測(cè)的方法及混合方法。

2.1 基于重構(gòu)的方法

基于重構(gòu)的方法通常假設(shè)異常事件具有較高的重構(gòu)誤差,并根據(jù)重構(gòu)誤差的閾值判斷異常。該類方法基于大量的正常樣本訓(xùn)練網(wǎng)絡(luò),學(xué)習(xí)正常事件的特征模式;測(cè)試時(shí),由于異常事件模式難以被網(wǎng)絡(luò)很好的重構(gòu),生成較大的重構(gòu)誤差,從而被判定為異常。

自動(dòng)編碼器(Auto Encoder,AE) 是基于重構(gòu)方法的常見(jiàn)結(jié)構(gòu),通過(guò)采用編碼器提取正常事件模式進(jìn)行編碼,采用解碼器將編碼后的特征表示解碼回它的原始形式,形成對(duì)正常事件進(jìn)行重構(gòu)。Hasan等[4]通過(guò)訓(xùn)練全連接自動(dòng)編碼器進(jìn)行視頻序列重構(gòu),并基于重構(gòu)誤差計(jì)算異常分?jǐn)?shù)。Luo等[5]則采用卷積長(zhǎng)短期記憶網(wǎng)絡(luò)(Convolutional Long Short Term Memory , ConvLSTM)) 作為卷積AE的主干結(jié)果進(jìn)行視頻序列重構(gòu)。Hu等[6]提出了一種時(shí)空融合的視頻異常檢測(cè)方法。首先通過(guò)對(duì)象檢測(cè)網(wǎng)絡(luò)進(jìn)行對(duì)象提取,然后提取光流信息和可視信息,并基于時(shí)空雙流網(wǎng)絡(luò)進(jìn)行視頻幀的重構(gòu)。Ber?gaoui等[7]提出了一種以對(duì)象為中心的正常事件模式學(xué)習(xí)模型,采用基于對(duì)象動(dòng)作特征的cosine距離函數(shù)進(jìn)行異常估計(jì),并在重構(gòu)框架引入了幾何限制。通過(guò)記憶模塊平衡對(duì)象的外觀信息和運(yùn)動(dòng)信息,從而捕獲事件的原型模式。Wang等[8]針對(duì)現(xiàn)有基于重構(gòu)方法的時(shí)序依賴性差和訓(xùn)練樣本過(guò)擬合問(wèn)題,提出時(shí)空Trans?formmer編碼器進(jìn)行連續(xù)幀重構(gòu)。采用可學(xué)習(xí)的卷積自注意力模塊學(xué)習(xí)時(shí)序相關(guān)性。在測(cè)試過(guò)程中提出了一種新的基于重建的輸入擾動(dòng)策略,以進(jìn)一步區(qū)分異常幀。Ouyang等[9]提出了一種無(wú)需離線訓(xùn)練模型的視頻異常檢測(cè)方法。采用隨機(jī)初始化多層感知機(jī)的方法進(jìn)行視頻幀重構(gòu)。基于相鄰幀間的信息偏移,采用增量學(xué)習(xí)進(jìn)行參數(shù)更新,在線訓(xùn)練模型。

除AE模型之外,生成對(duì)抗模型GAN和變分編碼器模型VAE也被引入到視頻異常檢測(cè)問(wèn)題中。Rav?anbakhsh等[10]提出了基于GAN的視頻異常檢測(cè)方法, 基于對(duì)抗損失生成器與判別器, 使得異常幀具有較大的重構(gòu)誤差。Dong等[11]提出了一種雙判別器生成對(duì)抗網(wǎng)絡(luò),基于半監(jiān)督學(xué)習(xí)方式進(jìn)行視頻異常檢測(cè)。Feng等[12]針對(duì)視頻異常檢測(cè)中正常模式的時(shí)空有效性問(wèn)題,提出了基于雙對(duì)抗生成網(wǎng)絡(luò)的卷積Trans?former模型。Fang等[13]提出了一種基于全卷積VAE的端-端視頻異常檢測(cè)框架,基于高斯混合模型對(duì)正常事件模式進(jìn)行編碼,并采用雙流網(wǎng)絡(luò)提取視頻的可視特征及運(yùn)動(dòng)特征進(jìn)行異常檢測(cè)。

2.2 基于預(yù)測(cè)的方法

由于異??梢员灰暈椴环夏承╊A(yù)期的事件,研究者認(rèn)為基于預(yù)測(cè)的方法可能是看待異常檢測(cè)問(wèn)題的更自然的方式?;陬A(yù)測(cè)的方法采用過(guò)去一段時(shí)間內(nèi)視頻幀的特征預(yù)測(cè)當(dāng)前幀;為增強(qiáng)預(yù)測(cè)效果,通?;谝曨l幀間的時(shí)序依賴性增強(qiáng)特征表示。

Huang等[14]基于幀可視信息與光流運(yùn)動(dòng)信息的一致性進(jìn)行視頻異常檢測(cè)。采用雙流編碼器編碼可視信息與運(yùn)動(dòng)信息,并引入一致性損失增強(qiáng)語(yǔ)義特征的一致性,從而使得具有較低可視、運(yùn)動(dòng)信息一致性的異常事件能被檢測(cè)。最后,結(jié)合一致性損失與預(yù)測(cè)損失進(jìn)行異常檢測(cè)。Leery等[15]提出了一種自監(jiān)督的同步預(yù)測(cè)模型。與現(xiàn)有的單幀預(yù)測(cè)方法不同的是,該模型可以一次性預(yù)測(cè)連續(xù)幀中的遮擋幀,因此該模型可以充分考慮視頻的上下文信息。這種同時(shí)進(jìn)行自我監(jiān)督的未來(lái)幀預(yù)測(cè)有助于模型產(chǎn)生預(yù)測(cè)輸出更加接近訓(xùn)練數(shù)據(jù)分布,而不是簡(jiǎn)單地學(xué)習(xí)特征函數(shù),從而緩解了泛化的問(wèn)題。針對(duì)基于重構(gòu)的方法均假設(shè)異常事件具有較大的重構(gòu)誤差的問(wèn)題,Zhao等[16]設(shè)計(jì)了卷積LSTM自動(dòng)編碼器預(yù)測(cè)網(wǎng)絡(luò)增強(qiáng)時(shí)空記憶交換。雙向網(wǎng)絡(luò)結(jié)構(gòu)通過(guò)前向預(yù)測(cè)和反向預(yù)測(cè)學(xué)習(xí)時(shí)序規(guī)律,獨(dú)特的高階機(jī)制進(jìn)一步加強(qiáng)了編碼器和解碼器之間的空間信息互動(dòng)。并采用注意力模塊進(jìn)行預(yù)測(cè)。針對(duì)現(xiàn)有工作現(xiàn)有考慮幀級(jí)局部一致性以及時(shí)序動(dòng)態(tài)的全局相關(guān)性問(wèn)題,F(xiàn)eng等[17]提出了基礎(chǔ)雙生成對(duì)抗網(wǎng)絡(luò)的卷積Transformer模型。首先采用卷積Trans?former進(jìn)行將來(lái)幀預(yù)測(cè);再采用雙生成對(duì)抗網(wǎng)絡(luò)進(jìn)行訓(xùn)練,該網(wǎng)絡(luò)判別器在保持圖像幀局部一致性的同時(shí),增強(qiáng)視頻的時(shí)序全局一致性。

基于預(yù)測(cè)的視頻異常檢測(cè)方法可以對(duì)運(yùn)動(dòng)信息進(jìn)行建模,并且可以學(xué)習(xí)到不同類型的時(shí)空依賴。但這類方法局限于序列數(shù)據(jù)異常檢測(cè),并且序列預(yù)測(cè)的計(jì)算成本高,由于其潛在目標(biāo)是序列預(yù)測(cè)而不是異常檢測(cè),因此學(xué)習(xí)的結(jié)果可能是次優(yōu)的。

2.3 混合方法

部分研究者采用混合方法實(shí)現(xiàn)視頻異常檢測(cè),取得了較好的檢測(cè)效果。Cao等[18]提出了一種根據(jù)測(cè)試事件和正常事件知識(shí)一致性的異常事件檢測(cè)方法,采用基于上下文恢復(fù)和知識(shí)檢索的雙流框架進(jìn)行異常檢測(cè)。在上下文恢復(fù)分支中,采用時(shí)空U-Net網(wǎng)絡(luò)預(yù)測(cè)將來(lái)幀,并提出了最大恢復(fù)誤差機(jī)制緩解由前景對(duì)象引起的較大恢復(fù)誤差問(wèn)題。在知識(shí)檢索分支中,采用Siamese 網(wǎng)絡(luò)和交互差異損失,基于可學(xué)習(xí)的locality-sensitive hashing 策略,從而編碼正常事件知識(shí)并存儲(chǔ)在hash表中。測(cè)試事件和知識(shí)表示的差異被用來(lái)進(jìn)行異常檢測(cè)。Wang等[19]提出了一種基于時(shí)空拼圖的視頻異常檢測(cè)方法,將視頻異常檢測(cè)問(wèn)題作為一個(gè)多標(biāo)簽的細(xì)粒度分類問(wèn)題來(lái)解決。時(shí)空拼圖分別負(fù)責(zé)捕捉高辨識(shí)度的外觀和運(yùn)動(dòng)特征。完整的排列組合被用來(lái)提供豐富的涵蓋不同難度的拼圖,使網(wǎng)絡(luò)能夠區(qū)分正常和異常事件之間微妙的時(shí)空差異。Barbalau等[20]提出了一種基于多任務(wù)自監(jiān)督學(xué)習(xí)的視頻異常檢測(cè)框架。首先采用Yolov3進(jìn)行目標(biāo)檢測(cè),并采用卷積transformer網(wǎng)絡(luò)作為主干網(wǎng)絡(luò)。同時(shí),引入自監(jiān)督學(xué)習(xí)任務(wù)提升模型性能,如:通過(guò)知識(shí)蒸餾解決拼圖問(wèn)題,預(yù)測(cè)人體姿態(tài)等。

基于預(yù)測(cè)重構(gòu)的混合方法也引起了研究者的興趣。Liu等[21]提出了一種基于記憶增強(qiáng)重構(gòu)和光流幀重構(gòu)的視頻異常檢測(cè)方法,首先進(jìn)行可視特征及預(yù)測(cè)特征的重構(gòu),然后采用條件變分自動(dòng)編碼器進(jìn)行幀預(yù)測(cè)。Morais 等[22]則基于行人的骨架軌跡特征同時(shí)進(jìn)行預(yù)測(cè)和重構(gòu),并學(xué)習(xí)正常時(shí)間模式。Zhao等[23]提出了一種時(shí)空自動(dòng)編碼器(STAE) ,并同時(shí)采用重構(gòu)損失和預(yù)測(cè)損失訓(xùn)練3D卷積網(wǎng)絡(luò)。Ye等[24]提出了基于預(yù)測(cè)編碼網(wǎng)絡(luò)的視頻異常檢測(cè)方法,引入誤差修正單元對(duì)預(yù)測(cè)誤差進(jìn)行重構(gòu),從而提升預(yù)測(cè)精度。以上基于預(yù)測(cè)重構(gòu)混合的方法均取得了較好的檢測(cè)性能,但模型較復(fù)雜。

3 常用數(shù)據(jù)集與評(píng)價(jià)標(biāo)準(zhǔn)

3.1 常用數(shù)據(jù)集

基準(zhǔn)數(shù)據(jù)集在計(jì)算機(jī)視覺(jué)任務(wù)中起到重要作用,包括:定義問(wèn)題范圍、為算法性能比較提供途徑等?;鶞?zhǔn)數(shù)據(jù)集的建立需要考慮數(shù)據(jù)集大小、數(shù)據(jù)大小、標(biāo)簽數(shù)據(jù)的可獲得性及數(shù)據(jù)多樣性等多種因素。由于實(shí)際監(jiān)控場(chǎng)景中,人群的異?;顒?dòng)較少見(jiàn),因此,人群異常行為基準(zhǔn)數(shù)據(jù)集的數(shù)量較少。常見(jiàn)的人群異?;鶞?zhǔn)數(shù)據(jù)集包括:UCSD行人數(shù)據(jù)集①、Avenue數(shù)據(jù)集② 、UMN 數(shù)據(jù)集③ 、Street Scene 數(shù)據(jù)集④ 、ShanghaiTech數(shù)據(jù)集⑤、UCF Crime數(shù)據(jù)集⑥、RLVS數(shù)據(jù)集⑦。本文從數(shù)據(jù)集場(chǎng)景、視頻數(shù)目、分辨率、異常樣例、是否包含像素級(jí)標(biāo)注等方面對(duì)以上數(shù)據(jù)集進(jìn)行描述,表1 展示了常見(jiàn)人群異常數(shù)據(jù)集的具體特性。

3.2 評(píng)價(jià)標(biāo)準(zhǔn)

通常來(lái)說(shuō),人群異常檢測(cè)和定位的性能評(píng)估標(biāo)準(zhǔn)有3種:(1)幀級(jí)標(biāo)準(zhǔn):以幀為單位判斷幀中是否存在異常;(2) 像素級(jí)標(biāo)準(zhǔn):至少40%真實(shí)異常區(qū)域的像素被檢測(cè)為異常;(3) 雙像素級(jí)標(biāo)準(zhǔn):至少10%真實(shí)異常區(qū)域的像素被檢測(cè)為異常。人群異常檢測(cè)的定量評(píng)價(jià)指標(biāo)則一般采用接收器操作特性曲線(receiver oper?ating characteristic curve,ROC) 及其對(duì)應(yīng)的曲線下面積(Area Under Curve,AUC) 兩種形式[25]。此外,等錯(cuò)誤率(Equal Error Rate,EER) 也被用來(lái)作為異常檢測(cè)評(píng)價(jià)的性能指標(biāo),EER 是指當(dāng)假陽(yáng)性率(False PositiveRate,F(xiàn)PR) 等于假陰性率(False Negative Rate失誤率)時(shí),被錯(cuò)誤分類的幀的百分比。

最近,一些研究者還提出了基于區(qū)域的異常檢測(cè)標(biāo)準(zhǔn)和基于軌跡的異常檢測(cè)標(biāo)準(zhǔn)[26]?;趨^(qū)域的檢測(cè)標(biāo)準(zhǔn)即計(jì)算所有異常區(qū)域被正確檢測(cè)的比率;而基于軌跡的檢測(cè)標(biāo)準(zhǔn)則計(jì)算行人異常軌跡被正確檢測(cè)的比率。以上兩種評(píng)價(jià)標(biāo)準(zhǔn)均需要進(jìn)行異常區(qū)域和異常軌跡的標(biāo)注,且同樣采用ROC和AUC進(jìn)行定量評(píng)價(jià)。

4 總結(jié)

人群異常事件檢測(cè)是現(xiàn)階段視頻監(jiān)控領(lǐng)域的重要應(yīng)用,本文對(duì)基于深度學(xué)習(xí)的人群視頻異常檢測(cè)問(wèn)題的常用方法、主流數(shù)據(jù)集及評(píng)價(jià)標(biāo)準(zhǔn)進(jìn)行了概述?;谏疃葘W(xué)習(xí)的異常行為檢測(cè)在常用數(shù)據(jù)集上展現(xiàn)出優(yōu)異的性能,展現(xiàn)出深度學(xué)習(xí)模型在人群異常事件檢測(cè)中的巨大優(yōu)勢(shì)。但多數(shù)模型僅針對(duì)特定場(chǎng)景下的異常檢測(cè),更具泛化性能的模型有待進(jìn)一步研究。

猜你喜歡
深度學(xué)習(xí)
從合坐走向合學(xué):淺議新學(xué)習(xí)模式的構(gòu)建
面向大數(shù)據(jù)遠(yuǎn)程開(kāi)放實(shí)驗(yàn)平臺(tái)構(gòu)建研究
基于自動(dòng)智能分類器的圖書(shū)館亂架圖書(shū)檢測(cè)
搭建深度學(xué)習(xí)的三級(jí)階梯
有體驗(yàn)的學(xué)習(xí)才是有意義的學(xué)習(xí)
電子商務(wù)中基于深度學(xué)習(xí)的虛假交易識(shí)別研究
利用網(wǎng)絡(luò)技術(shù)促進(jìn)學(xué)生深度學(xué)習(xí)的幾大策略
考試周刊(2016年94期)2016-12-12 12:15:04
MOOC與翻轉(zhuǎn)課堂融合的深度學(xué)習(xí)場(chǎng)域建構(gòu)
大數(shù)據(jù)技術(shù)在反恐怖主義中的應(yīng)用展望
深度學(xué)習(xí)算法應(yīng)用于巖石圖像處理的可行性研究
裕民县| 鄢陵县| 成都市| 余庆县| 分宜县| 景宁| 连云港市| 澄江县| 宿迁市| 宜都市| 云阳县| 宝清县| 临沧市| 通州区| 余江县| 明水县| 松原市| 清河县| 临泽县| 宁城县| 安顺市| 永安市| 秦安县| 白玉县| 双辽市| 客服| 商丘市| 班玛县| 南木林县| 衡山县| 双辽市| 化州市| 环江| 长治市| 乐业县| 崇文区| 绩溪县| 罗源县| 宁波市| 体育| 定边县|