王寧 王靜 郝貴發(fā) 汪祝慶 倪樹新
1.鎮(zhèn)江市公路事業(yè)發(fā)展中心;2.江蘇蘇信交通科技有限公司;3.南京慧筑信息技術(shù)研究院有限公司
普通國省干線公路運行過程中,受到客觀因素與主觀因素影響會存在各種落物,包括從車輛上掉落的輪胎、鋼管、生活垃圾以及其他物品等。為了降低此類落物的影響,提高管理效率,需要增強對此類物質(zhì)的識別。本文以此為出發(fā)點,概述了普通國省干線公路落物識別的重要性,剖析了普通國省干線公路落物識別技術(shù)流程,并以此為基礎(chǔ),分別從圖割法、MOG2算法、YOLOv5+閾值法、KCF跟蹤與識別四個方面,對其具體情況進行了討論。
普通國省干線公路路段具有一定的封閉性,車輛行駛速度快,車流量較大,當(dāng)存在落物情況時容易引發(fā)交通事故。輕者出現(xiàn)車輛追尾、撞護欄,嚴重時會導(dǎo)致翻車等,給駕駛員與乘客的生命安全造成了較大威脅。為了有效規(guī)避此類交通事故,將風(fēng)險降至最低點,一方面需要加強道路交通安全宣傳教育;另一方面則應(yīng)采用配置技術(shù)要素的方式,增強對基于視頻的普通國省干線公路落物識別技術(shù)的應(yīng)用。尤其在當(dāng)前階段,交通行業(yè)進入了高質(zhì)量發(fā)展階段,擴大了對數(shù)字化技術(shù)的運用,因此,有必要結(jié)合新技術(shù)提高落物識別技術(shù)的應(yīng)用水平,為普通國省干線公路的安全運行保駕護航。
普通國省干線公路落物引發(fā)交通安全事故會進一步造成交通擁堵,降低管理效率。因而,需要根據(jù)該方面存在的因果關(guān)系鏈,增強落物識別。目前,主要按照現(xiàn)代經(jīng)濟學(xué)中的要素配置理論,建立了技術(shù)要素主導(dǎo)的資源配置方式,旨在通過提高技術(shù)要素應(yīng)用比例,輔助普通國省干線公路管理主體,高效、精準的完成落物識別,從而在控制落物風(fēng)險及其影響的情況下,達到提高公路管理效率的目標(biāo)。
普通國省干線公路運營管理單位,除了承擔(dān)社會責(zé)任之外,也需要提高運營效益,以此保障公路的可持續(xù)運營[1]。當(dāng)普通國省干線公路管理過程中,因落物造成交通事故、交通擁堵,造成嚴重傷亡的情況下,不僅會影響單位的社會聲譽,降低公信力。而且在對交通事故進行處理的過程中,需要投入大量的人力、物力、財力,從而增加運營管理成本,影響運營效益。
落物識別監(jiān)測預(yù)警是現(xiàn)代普通國省干線公路路網(wǎng)運行安全管理中的重要組成部分,在當(dāng)前應(yīng)用的多種識別技術(shù)中,主要是應(yīng)用“傳感器+人工智能”的基本方案,借助配置適用性較強、適配性較高的技術(shù),實現(xiàn)對路面落物的自動識別[2]。需要注意的是,在落物識別技術(shù)應(yīng)用時并不是單一的應(yīng)用一種技術(shù),而是需要配置多種技術(shù),才能達到有效識別、監(jiān)測、跟蹤、預(yù)警等。以基于視頻的普通國省干線公路落物識別技術(shù)為例,其中就需要配置圖割法、MOG2算法、YOLOv5+閾值法、KCF跟蹤與識別技術(shù)等,下面先對其流程進行說明。
(1)在基于視頻的普通國省干線公路路面落物識別時,需要按照“道路區(qū)域分割—公路落物前景背景分離—道路物體目標(biāo)檢測—道路物體目標(biāo)跟蹤”的基本路線進行操作,四大環(huán)節(jié)中通??梢苑譃?個基本的流程進行操作:1)利用圖割法從整個圖像中分割出有效的公路區(qū)域;2)采用背景建模及背景差分算法得到所有的運動目標(biāo);3)用深度學(xué)習(xí)算法檢測出車輛,以排除車輛目標(biāo);4)在排除掉車輛目標(biāo)后,對剩下的目標(biāo)采用閾值法篩選、排除掉一些小目標(biāo)和噪聲目標(biāo),得到有效目標(biāo);5)對篩選出的目標(biāo)初始化,使用目標(biāo)跟蹤算法跟蹤目標(biāo),跟蹤過程中目標(biāo)可能會被其他物體短暫性遮擋,所以對跟蹤算法進行改進,使其具有目標(biāo)丟失判別能力,識別丟失的目標(biāo);6)根據(jù)軌跡信息判斷目標(biāo)是否為落物,當(dāng)軌跡連續(xù)若干幀移動較小,輸出落物提醒并報警。
(2)在6個基本流程的實踐過程中包括若干步驟,具體而言,在確定幀序列后一方面應(yīng)按照“分割出公路區(qū)域并對公路背景建?!尘安罘帧祷c形態(tài)學(xué)處理—運動目標(biāo)”的順序進行操作;另一方面則需要通過深度學(xué)習(xí)檢測出車輛目標(biāo)。在此基礎(chǔ)上,完成對車輛之外目標(biāo)的排除后,根據(jù)像素點設(shè)置閾值。當(dāng)閾值大于設(shè)置好的閾值T時,則進入到下一環(huán)節(jié),篩選出目標(biāo)。當(dāng)閾值等于、小于閾值T時,則需要對其中的噪聲進行去除,待其符合具體要求后篩選出目標(biāo),再初始化跟蹤篩選出的目標(biāo),借助KCF/TLD跟蹤、提取軌跡信息,并在計算出等間隔數(shù)據(jù)幀中目標(biāo)的歐氏距離后,根據(jù)設(shè)置好的距離L,進行落物提醒并報警。當(dāng)歐氏距離小于距離L時,進行落物提醒并報警,反之則需要先進行其他的運動目標(biāo)處理,再實施落物提醒并報警。基于視頻的落實識別技術(shù)流程如圖1所示。
該方法旨在分離公路區(qū)域,其中應(yīng)用的Graph Cut(圖形切割)技術(shù)看,主要是用于解決計算機視覺領(lǐng)域各種低級計算機視覺問題[3]。例如:圖像分割問題、立體對應(yīng)問題、圖像平滑問題等。實踐經(jīng)驗表明,應(yīng)用此類方法時,可以將圖像分割問題與圖的最小割(Min Cut)問題相關(guān)聯(lián),借助最小能量(Minimum Energy)方案,對應(yīng)解決最大后驗估計(Maximum Posterior Estimate)等情況。進一步講,利用最小割最大流算法分割圖像,可以將圖像分割為前景和背景,進而分離出有效的公路區(qū)域。應(yīng)用圖像切割中的最小割最大流算法過程中,要求輸入時先在背景與前景中進行畫像,再利用該算法構(gòu)建各像素點,完成相似度方面的“賦權(quán)圖”,從而實現(xiàn)區(qū)分目標(biāo)。
(1)在短時間內(nèi)圍繞某一中心值,于一定距離內(nèi)進地各像素點的分布時,通常會通過均值取代中心值,利用方差表示距離。因而,分布時會形成一定的規(guī)律,并通過統(tǒng)計定律加以處理。例如:在足量的數(shù)據(jù)點確定的前提下可以呈現(xiàn)出高斯分布(具體呈現(xiàn)為正態(tài)分布)。因而根據(jù)該特點,當(dāng)像素點的值偏離中心值較遠時,可以將該像素值歸于前景。當(dāng)在一定方差范圍內(nèi)此類值比較接近中心值時,可以將該點作為背景之中。從理論上講,如果不存在任何干擾的條件下,能夠?qū)崿F(xiàn)準確區(qū)分前景和背景目標(biāo)。但是,理想狀態(tài)并不能實現(xiàn),當(dāng)畫面中光線存在變化的情況下,高斯分布的中心位置往往會發(fā)生改變,因此,需要應(yīng)用混合高斯模型。
(2)在描述背景的單一模式方面,單高斯模型具有較大優(yōu)勢,然而當(dāng)背景中存在樹葉晃動等多模態(tài)的情況后,應(yīng)用該模型容易發(fā)生檢錯的現(xiàn)象。因此,在這種情況下,應(yīng)該采用推廣單高斯模型的辦法,先獲取混合高斯模型再利用多個新模型,從而滿足多模態(tài)背景中每一個像素位置的監(jiān)測并滿足其魯棒性,達到對緩慢移動物體的有效檢測。進一步講,背景本身作為一個高斯分布,在停車的狀態(tài)下,如果聚集一定的前景數(shù)據(jù)會得到新的高斯分布。此時,停車時的實際前景與背景重合,由此導(dǎo)致停車狀態(tài)與運行狀態(tài)車輛的混淆[4]。需要說明的是,當(dāng)車緩慢行駛時,形成高斯分布的時間相對較長,并不能立即實現(xiàn)分布,所以應(yīng)用混合高斯分布可以實現(xiàn)對緩慢行駛車輛的有效檢測。高斯混合背景建模流程如下:1)通過初始化完成對多個高斯模型的預(yù)先定義,再對模型參數(shù)實施初始化并求將用參數(shù);2)處理每一幀中的每一個像素,查看匹配情況。在匹配的情況下歸入匹配模型,并根據(jù)新像素值更新參數(shù)。反之,則以該像素建立高斯模型并對參數(shù)進行初始化處理;3)選出背景模型所用的高斯模型,做好提取準備工作。
(3)MOG2算法結(jié)合不同輸入場景自動選擇高斯分量的個數(shù),建立背景像素模型并進行權(quán)重設(shè)置(如使用顏色存在時間的長短進行設(shè)置)??紤]到權(quán)重中的顏色具有持續(xù)時間長的特點與靜止屬性,而且在具體操作時以時間序列為基礎(chǔ),因此,可以將時間序列中每個像素占有的位置,通過時間與空間的基本形式完成分布構(gòu)建。
圖像目標(biāo)檢測方面深度學(xué)習(xí)具有較大優(yōu)勢,從實踐經(jīng)驗看,YOLOv5技術(shù)不僅名列前茅,而且學(xué)者們將它應(yīng)用于不同對象的檢測時,可以選擇不同的改進方案進行應(yīng)用。在高斯背景建模識別并輸出全部運動目標(biāo)ID標(biāo)號條件下,應(yīng)用YOLOv5識別技術(shù),能夠識別每一幀圖像中的車輛目標(biāo),達到排除目標(biāo)。同時計算剩余運動目標(biāo)的像素數(shù),采用閾值法篩選掉小目標(biāo)及噪聲目標(biāo)。
目標(biāo)跟蹤的任務(wù)在于,找出被關(guān)注目標(biāo)在每幀視頻圖像中的位置。從功能上看,與目標(biāo)檢測相似,旨在尋找目標(biāo)位置,但是,在“跟蹤”時需要配套提升運行速度。實踐經(jīng)驗與實驗比較結(jié)果顯示,目標(biāo)跟蹤運行速度往往大于目標(biāo)檢測,然而,在目標(biāo)位置定位精度方面容易出現(xiàn)偏差。因此,實踐過程中,通常會犧牲少量定位精度,以此換取成倍的運行速度。
該算法主要分為生成式(Generative Model)與判別式(Discriminative Model)兩種。在前一種方法下,將目標(biāo)跟蹤視為二元分類問題,通過訓(xùn)練關(guān)于跟蹤目標(biāo)的分類器來從候選目標(biāo)中找出正確的目標(biāo)(如CSK、KCF算法)。在后一種方法下,采用特征模型描述目標(biāo)的外觀特征,再最小化跟蹤目標(biāo)與候選目標(biāo)之間的誤差來確認目標(biāo)(如LK光流法)。根據(jù)跟蹤目標(biāo)的數(shù)量看,可以將目標(biāo)跟蹤算法分為單目標(biāo)跟蹤與多目標(biāo)跟蹤。與單目標(biāo)跟蹤相比,多目標(biāo)跟蹤問題相對復(fù)雜,操作難度相對較大[5]。所以,在多目標(biāo)跟蹤時,需要考慮視頻圖像幀中多個獨立目標(biāo)的不同類別、位置、大小、外觀、運動方向、動態(tài)光照、相互遮擋等因素(此類因素是目標(biāo)跟蹤領(lǐng)域的研究難點)。經(jīng)綜合考慮公路圖像的特點及工程實際情況,可以選用性價比較高的KCF算法實現(xiàn)目標(biāo)跟蹤。
KCF是英文Kernel Correlation Filter的首字母縮寫形式,中文翻譯為核相關(guān)濾波,屬于判別式方法。從原理看,主要是通過物體在當(dāng)前幀的位置,迅速預(yù)測物體在下一幀的位置。由于該算法具有循環(huán)矩陣和相關(guān)濾波這兩個特點,因而可以將運行速度提高到150FPS。具體應(yīng)用時以循環(huán)矩陣與相關(guān)濾波為主。分述如下:
(1)循環(huán)矩陣:KCF算法將圖像沿著上下、左右的方向進行平移,以產(chǎn)生更多的樣本用于訓(xùn)練。同時這種平移可以通過循環(huán)矩陣來表示,循環(huán)矩陣可以對角化,計算時僅需關(guān)注對角線上的非零元素,因此能夠大幅加快矩陣與矩陣的計算速度。
(2)相關(guān)濾波:相關(guān)是衡量兩個信號相似值的度量,相關(guān)值越高,表示這兩個信號越相似。KCF輸入往往通過其他檢測手段,得到物體在某一幀圖像上的準確位置(如應(yīng)用MOG2算法得到box)。假定,該準確位置為patch_0,在后續(xù)圖像幀上, [patch_1, patch_n]中共有n個patch,此時,KCF預(yù)測的位置即為與patch_0相關(guān)值最高的patch。由于兩個patch的相關(guān)卷積相當(dāng)于傅里葉域中的元素乘積(時域卷積=頻域點積),而乘積計算大大快于卷積運算。因此,在計算patch_0與patch_k(1≤k≤n)的相關(guān)值時需轉(zhuǎn)換到傅里葉域進行。最后,通過計算不同幀間相同目標(biāo)中心點坐標(biāo)的歐氏距離,借助設(shè)定閾值的方式判斷目標(biāo)是否為落物。
總之,普通國省干線公路落物種類較多,會給公路管理單位與車輛駕駛?cè)藛T產(chǎn)生較多危害。在新時期交通行業(yè)高質(zhì)量發(fā)展階段,應(yīng)進一步增強對基于視頻的公路落實識別技術(shù)應(yīng)用。通過以上初步分析可以看出,公路落物識別既具有現(xiàn)實意義,也是提升公路管理效率,擴增運營效益的重要途徑。因此,建議在“傳感器+人工智能”的基本應(yīng)用思路,結(jié)合技術(shù)要素主導(dǎo)的資源配置方式,合理推進落物識別監(jiān)測預(yù)警技術(shù)的實踐工作。