楊常華
(山西省信息產(chǎn)業(yè)技術(shù)研究院有限公司, 山西 太原 030012)
視頻事件檢測(cè)是一種基于機(jī)器視覺的車輛檢測(cè)和跟蹤技術(shù),現(xiàn)階段國(guó)內(nèi)高速公路視頻事件檢測(cè)算法,基本以模式識(shí)別為主,但是由于高速公路路況復(fù)雜,雨、雪、霧等惡劣天氣、日照光影變化、視頻畫面抖動(dòng)(如路基震動(dòng)引起的高桿攝像機(jī)震動(dòng))等現(xiàn)象的影響,都會(huì)對(duì)模式識(shí)別算法產(chǎn)生很大干擾,造成采用傳統(tǒng)算法的視頻事件檢測(cè)系統(tǒng)在實(shí)際使用中頻繁產(chǎn)生誤報(bào)、漏報(bào)現(xiàn)象,影響系統(tǒng)的正常監(jiān)測(cè)功能。
近年來,隨著人工智能技術(shù)的發(fā)展和引入,高速公路行業(yè)也已經(jīng)出現(xiàn)基于深度學(xué)習(xí)技術(shù)的視頻事件檢測(cè)系統(tǒng)。深度學(xué)習(xí)的概念源于人工神經(jīng)網(wǎng)絡(luò)的研究,含多層的多層感知器就是一種深度學(xué)習(xí)結(jié)構(gòu),深度學(xué)習(xí)通過組合低層次特征形成更加抽象的高層表示屬性類別或特征,以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。基于深度學(xué)習(xí)的高速公路視頻事件檢測(cè)系統(tǒng),就是以人工構(gòu)造的一套神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),預(yù)先使用海量不同類型車輛、行人、非機(jī)動(dòng)車的圖片素材對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,由神經(jīng)網(wǎng)絡(luò)自動(dòng)總結(jié)出不同目標(biāo)的特征和規(guī)律,從而在實(shí)際使用時(shí)對(duì)視頻中的目標(biāo)進(jìn)行準(zhǔn)確識(shí)別和分類,再結(jié)合其他算法對(duì)車輛軌跡、行為進(jìn)行分析判斷,從而實(shí)現(xiàn)對(duì)各類異常交通事件,如車輛違停、逆行、占用應(yīng)急車道、擁堵、行人/非機(jī)動(dòng)車進(jìn)入、拋灑物等的準(zhǔn)確識(shí)別,并進(jìn)行實(shí)時(shí)告警、錄像。
基于深度學(xué)習(xí)的視頻事件檢測(cè)系統(tǒng)以高速公路監(jiān)控系統(tǒng)數(shù)字視頻作為輸入,通過對(duì)視頻的實(shí)時(shí)分析為道路安全、暢通運(yùn)行提供幫助,系統(tǒng)主要由外場(chǎng)攝像機(jī)、視頻傳輸網(wǎng)絡(luò)、深度學(xué)習(xí)功能視頻事件檢測(cè)器、用于交通信息管理的計(jì)算機(jī)等組成。系統(tǒng)結(jié)構(gòu)圖見圖1。
圖1 深度學(xué)習(xí)視頻事件檢測(cè)系統(tǒng)結(jié)構(gòu)圖
深度學(xué)習(xí)視頻事件檢測(cè)系統(tǒng)采用后端檢測(cè)方式,道路沿線攝像機(jī)視頻圖像通過視頻傳輸設(shè)備以網(wǎng)絡(luò)視頻流方式傳輸至就近隧管站(或收費(fèi)站),可在隧管站就地進(jìn)行視頻檢測(cè),或通過視頻傳輸網(wǎng)絡(luò)將視頻進(jìn)一步匯聚到監(jiān)控中心,在監(jiān)控中心進(jìn)行集中視頻檢測(cè)。
提前采集高速公路不同場(chǎng)景(包括主線、匝道、隧道、收費(fèi)站、服務(wù)區(qū))、不同季節(jié)、不同天氣、不同時(shí)段、不同地域、不同拍攝角度等多種場(chǎng)景下的車輛、行人、非機(jī)動(dòng)車等目標(biāo)圖像素材,素材量至少達(dá)到十萬級(jí)別以上。再利用人工構(gòu)造的一套神經(jīng)網(wǎng)絡(luò)對(duì)這些素材進(jìn)行反復(fù)學(xué)習(xí),并檢驗(yàn)識(shí)別準(zhǔn)確率,待準(zhǔn)確率達(dá)到一定程度,便可得到一套可用的目標(biāo)識(shí)別模型。隨著素材的不斷采集和積累,該識(shí)別模型還可以不斷迭代學(xué)習(xí),逐步提高識(shí)別準(zhǔn)確率。見圖2。
圖2 高速公路主線、匝道、隧道、收費(fèi)站等不同場(chǎng)景
從上述過程可以看出,利用深度學(xué)習(xí)算法,學(xué)習(xí)時(shí)提取和總結(jié)的是目標(biāo)特征和運(yùn)動(dòng)規(guī)律,識(shí)別時(shí)也是利用目標(biāo)特征和運(yùn)動(dòng)規(guī)律進(jìn)行識(shí)別,與畫面背景無任何關(guān)系,因此可以不受畫面背景變化干擾(如畫面抖動(dòng)、光影變化、異物掠過等)。并且在實(shí)際使用中,還可對(duì)識(shí)別錯(cuò)誤的樣本進(jìn)行再訓(xùn)練,不斷提高識(shí)別的準(zhǔn)確率。見圖3。
圖3 目標(biāo)識(shí)別不受背景變化干擾
一是部分高速公路監(jiān)控視頻圖像質(zhì)量不佳,依然沿用標(biāo)清攝像機(jī),且使用年限久遠(yuǎn),畫面模糊、偏色、虛焦現(xiàn)象嚴(yán)重,人眼分辨目標(biāo)都相對(duì)困難。除此之外,更為常見的是外場(chǎng)道路夜間圖像采集問題,由于外場(chǎng)道路夜間基本無照明,使用的監(jiān)控?cái)z像機(jī)也基本不帶任何補(bǔ)光,夜間圖像采集效果很差,只能依靠車燈光分辨車輛,而且當(dāng)畫面中正對(duì)車頭的行車方向有車輛駛過時(shí),還由于受車輛遠(yuǎn)光燈照射影響,畫面出現(xiàn)白色光斑,更加影響分辨。對(duì)于上述這些實(shí)際場(chǎng)景,無論是AI算法還是傳統(tǒng)算法,在畫面質(zhì)量本身較差的情況下,都很難實(shí)現(xiàn)高準(zhǔn)確率的檢測(cè)。但我們也看到,全國(guó)高速公路視頻監(jiān)控系統(tǒng)都在陸續(xù)進(jìn)行高清化改造,紅外補(bǔ)光、激光補(bǔ)光、甚至熱成像等夜間視頻采集手段也有所應(yīng)用,視頻監(jiān)控系統(tǒng)一定是由“看得見”往“看得清”的方向發(fā)展,最后再由人工智能等技術(shù)手段使其能夠“看得懂”。
二是在應(yīng)用深度學(xué)習(xí)方法進(jìn)行視頻事件檢測(cè)時(shí),樣本數(shù)據(jù)庫(kù)的多樣性起著非常重要的作用,在大量數(shù)據(jù)中不斷的學(xué)習(xí)和訓(xùn)練,才能達(dá)到一個(gè)滿意的識(shí)別準(zhǔn)確率并不斷提高。而目前,能夠獲得的高速公路視頻數(shù)據(jù)資源還比較分散,數(shù)據(jù)差異性也較大,即使幾十萬張的素材量也無法涵蓋全國(guó)高速公路不同條件下的場(chǎng)景,數(shù)據(jù)采集仍有大量工作要做。另一方面,采集來的數(shù)據(jù),深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)不具備自主學(xué)習(xí)能力,需要由數(shù)據(jù)標(biāo)注工程師對(duì)數(shù)據(jù)進(jìn)行標(biāo)注(標(biāo)注出素材畫面中不同的車輛類型和位置),這一過程就像是需要“老師”整理好“教材”再給“學(xué)生”學(xué)習(xí)一樣,需要大量人員投入,且是一個(gè)漫長(zhǎng)的過程。
三是深度學(xué)習(xí)技術(shù)雖然在目標(biāo)識(shí)別和分類的準(zhǔn)確率上比傳統(tǒng)算法有了質(zhì)的提高,為視頻數(shù)據(jù)的結(jié)構(gòu)化提供了幫助,但我們要看到現(xiàn)階段人工智能完成的這類工作還較為基礎(chǔ),只是對(duì)畫面中的目標(biāo)進(jìn)行檢測(cè),并對(duì)應(yīng)輸出量化了的信息和數(shù)據(jù),如車輛行為、車流量、車輛速度、車輛占有率等,而將這么多結(jié)構(gòu)化數(shù)據(jù)組合起來,用于對(duì)交通狀況的綜合研判和預(yù)測(cè),用于對(duì)異常事件處置流程的改進(jìn)和增效,甚至是直接提出交通管理改進(jìn)措施等,還停留在淺層次。真正的人工智能不只是取代人員的部分繁瑣工作,更應(yīng)該為管理者提供輔助決策依據(jù)和建議。
基于深度學(xué)習(xí)的視頻事件檢測(cè)系統(tǒng)作為智慧高速公路的重要組成部分也在不斷地更新和發(fā)展,其在事件檢測(cè)的準(zhǔn)確率上已經(jīng)完全超越了傳統(tǒng)算法的視頻事件檢測(cè)系統(tǒng),但其定位不能只局限于事件檢測(cè),而是通過對(duì)高速公路監(jiān)控視頻內(nèi)容的不斷分析,能夠比監(jiān)控人員感知到更多有價(jià)值的結(jié)構(gòu)化數(shù)據(jù),并將這些數(shù)據(jù)在空間上形成關(guān)聯(lián),實(shí)時(shí)呈現(xiàn)整個(gè)路段甚至是路網(wǎng)的交通狀況,提示造成異常交通狀況的原因;再將這些數(shù)據(jù)在時(shí)間上形成關(guān)聯(lián),又可以分析出交通狀況漸變、突變規(guī)律,對(duì)未來交通狀況做出預(yù)測(cè),如易擁堵時(shí)段/路段、事故高發(fā)時(shí)段/路段等,輔助管理者提前做好分流誘導(dǎo)措施和應(yīng)急響應(yīng)預(yù)案。
基于深度學(xué)習(xí)的視頻事件檢測(cè)系統(tǒng)的精度會(huì)隨著所應(yīng)用的網(wǎng)絡(luò)結(jié)構(gòu)深度的增加而提高,但同時(shí)也極大地增加了算法的計(jì)算量,降低了模型的實(shí)時(shí)性,因此可以通過對(duì)模型的壓縮進(jìn)行研究,在保持精度的前提下有效減少模型的大小,以提高算法的運(yùn)算速度,降低硬件配置要求,有效地節(jié)約應(yīng)用成本。
在應(yīng)用形式上,要根據(jù)深度學(xué)習(xí)的特點(diǎn),利用互聯(lián)網(wǎng)、云計(jì)算等相關(guān)技術(shù)整合高速公路現(xiàn)有各類數(shù)據(jù)資源,為視頻事件檢測(cè)系統(tǒng)提供深度學(xué)習(xí)的海量資源,不斷積累各種條件下的“經(jīng)驗(yàn)”,并在系統(tǒng)之間進(jìn)行“經(jīng)驗(yàn)”共享,以使系統(tǒng)能不斷完善提升,能力更強(qiáng)、效率更高。
綜上所述,基于深度學(xué)習(xí)的高速公路事件檢測(cè)系統(tǒng)與傳統(tǒng)的視頻事件檢測(cè)系統(tǒng)對(duì)比具有以下優(yōu)點(diǎn):背景對(duì)比升級(jí)為目標(biāo)識(shí)別、行為識(shí)別,多場(chǎng)景海量數(shù)據(jù)的訓(xùn)練保證了對(duì)交通參數(shù)和事件的精準(zhǔn)感知;除對(duì)交通事件進(jìn)行識(shí)別外,還對(duì)不同監(jiān)控點(diǎn)的交通參數(shù)進(jìn)行全面采集,并關(guān)聯(lián)起來形成對(duì)路段、路網(wǎng)交通狀況全面、實(shí)時(shí)的展現(xiàn)和分析;兼容各類視頻設(shè)備或平臺(tái),多系統(tǒng)聯(lián)動(dòng)能力強(qiáng),適應(yīng)性高。通過在視頻事件檢測(cè)中引入人工智能深度學(xué)習(xí)技術(shù),有效地彌補(bǔ)了傳統(tǒng)模式識(shí)別技術(shù)的不足,為提高高速公路管理效率,保障高速公路安全通行,構(gòu)建真正意義上的“智慧”高速公路奠定了堅(jiān)實(shí)基礎(chǔ)。