高武,刁欣然,張余豪,姬光,王艷輝,6,7,8
(1.北京京城地鐵有限公司,北京 101300;2.北京交通大學(xué) 交通運(yùn)輸學(xué)院,北京 100044;3.北京交通大學(xué) 先進(jìn)軌道交通自主運(yùn)行全國(guó)重點(diǎn)實(shí)驗(yàn)室,北京 100044;4.北京市軌道交通建設(shè)管理有限公司,北京 100068;5.北京聲迅電子股份有限公司,北京 100094;6.北京交通大學(xué) 北京市城市交通信息智能感知與服務(wù)工程技術(shù)研究中心,北京 100044;7.北京交通大學(xué) 城市軌道交通運(yùn)營(yíng)安全管理技術(shù)及裝備交通運(yùn)輸行業(yè)研發(fā)中心,北京 100044;8.運(yùn)營(yíng)主動(dòng)安全保障與風(fēng)險(xiǎn)防控鐵路行業(yè)重點(diǎn)實(shí)驗(yàn)室,北京 100044)
近年隨著城市軌道交通線路長(zhǎng)度的快速增長(zhǎng),線網(wǎng)的織密,城市軌道交通客運(yùn)量占全國(guó)公共交通客運(yùn)總量的分擔(dān)比率逐年提高。截至2021 年底,共有50 個(gè)城市開(kāi)通城市軌道交通運(yùn)營(yíng)線路283 條,運(yùn)營(yíng)線路總長(zhǎng)度9 206.8 km。2021 年全年累計(jì)完成客運(yùn)量236.9 億人次,同比增長(zhǎng)34.7%,總進(jìn)站量146.3 億人次,同比增長(zhǎng)33.7%,總客運(yùn)周轉(zhuǎn)量1 981.8億人公里[1]。在北京、上海、廣州、深圳這些超大城市中,平均每座車站日均進(jìn)站量1萬(wàn)人次,并且由于城市軌道交通系統(tǒng)網(wǎng)絡(luò)化運(yùn)營(yíng)的特點(diǎn),車站之間會(huì)相互影響,一個(gè)車站運(yùn)營(yíng)中斷甚至?xí)斐删€網(wǎng)大范圍運(yùn)營(yíng)受阻。
安全是城市軌道交通完成其根本任務(wù)、根本使命的前提和基礎(chǔ)??土鳡顟B(tài)是影響車站安全事件發(fā)生的1個(gè)主要因素,科學(xué)合理地對(duì)客流狀態(tài)進(jìn)行評(píng)價(jià)對(duì)城軌運(yùn)營(yíng)安全起著重要作用。目前雖然北京、上海等國(guó)內(nèi)城市軌道交通行業(yè)頭部運(yùn)營(yíng)公司都對(duì)城市軌道交通安全保障與風(fēng)險(xiǎn)管控方面有了長(zhǎng)足的研究,但其中對(duì)客流狀態(tài)的辨識(shí)大部分仍是車站乘務(wù)員、車站管理人員以目視的方法來(lái)進(jìn)行監(jiān)測(cè),而由于車站乘客數(shù)量較多且客流狀態(tài)易受外界環(huán)境的干擾而復(fù)雜多變,這種方式不能及時(shí)地發(fā)現(xiàn)問(wèn)題所在,因此有必要采用先進(jìn)的信息化手段對(duì)客流狀態(tài)進(jìn)行監(jiān)測(cè)[2]??土魉俣取⒖土髅芏仁悄壳俺擒壙土飨嚓P(guān)研究中反映客流狀態(tài)的重要屬性,對(duì)客流狀態(tài)信息的獲取方法進(jìn)行研究,通過(guò)對(duì)目前相關(guān)領(lǐng)域算法的研究,形成基于優(yōu)化YOLOv5 和Deep-SORT 的客流狀態(tài)識(shí)別方法,并對(duì)此方法進(jìn)行驗(yàn)證,有助于實(shí)現(xiàn)客流狀態(tài)的有效識(shí)別,進(jìn)而提高城軌車站的安全水平。
對(duì)客流狀態(tài)進(jìn)行識(shí)別首先要通過(guò)監(jiān)控設(shè)備檢測(cè)到乘客的存在,這個(gè)過(guò)程就是目標(biāo)檢測(cè),現(xiàn)如今基于深度學(xué)習(xí)的方法在目標(biāo)檢測(cè)領(lǐng)域成為主流,并且YOLO系列算法取得了良好的效果,是當(dāng)前研究的熱點(diǎn)。在YOLO 系列算法中,YOLOv5 算法的總體性能指標(biāo)位于前列[3],但在乘客密集場(chǎng)景的應(yīng)用還存在改進(jìn)空間,在密集場(chǎng)景下目標(biāo)檢測(cè)算法經(jīng)常會(huì)發(fā)生將多個(gè)目標(biāo)檢測(cè)為1個(gè)目標(biāo)的問(wèn)題,同時(shí)檢測(cè)到的單個(gè)目標(biāo)也會(huì)受到相近其他目標(biāo)的影響,導(dǎo)致預(yù)測(cè)效果不佳,從提高預(yù)測(cè)精度與檢測(cè)效果的角度對(duì)YOLOv5算法進(jìn)行優(yōu)化,主要通過(guò)網(wǎng)絡(luò)結(jié)構(gòu)、損失函數(shù)、檢測(cè)框后處理算法3個(gè)方面進(jìn)行優(yōu)化。
1.1.1 網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化
對(duì)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化主要考慮提高對(duì)原網(wǎng)絡(luò)結(jié)構(gòu)提取到的特征利用能力,在深度學(xué)習(xí)領(lǐng)域,注意力機(jī)制由于其能夠?qū)χ匾卣鬟M(jìn)行更多的權(quán)重分配、降低重要性低的特征權(quán)重、能夠?qū)Ω鞣N網(wǎng)絡(luò)模型起到優(yōu)化作用,因此嘗試通過(guò)在網(wǎng)絡(luò)的骨干部分引入注意力機(jī)制來(lái)提高特征提取能力。SE(Squeeze-and-Excitation Networks)[4]、CBAM (Convolutional Block Attention Module)[5]、ECA (Efficient Channel Attention)[6]、CA(Coordinate Attention)[7]都是近些年取得較好效果的注意力機(jī)制。
在不同應(yīng)用場(chǎng)景和不同數(shù)據(jù)集條件下,對(duì)網(wǎng)絡(luò)結(jié)構(gòu)的修改會(huì)取得不同效果,為了選取更有效的改進(jìn)方法,在相同超參數(shù)條件下,使用自制數(shù)據(jù)集對(duì)加入SE、CBAM、ECA 和CA 注意力機(jī)制的不同模型分別訓(xùn)練500epoch,訓(xùn)練結(jié)果對(duì)比見(jiàn)表1。
表1 注意力機(jī)制訓(xùn)練結(jié)果對(duì)比
經(jīng)過(guò)對(duì)比,CBAM注意力機(jī)制添加后對(duì)模型精度的提高在4種注意力機(jī)制中取得了最好的效果,因此選取CBAM機(jī)制來(lái)提高模型的特征提取性能。
1.1.2 損失函數(shù)優(yōu)化
早期的目標(biāo)檢測(cè)工作使用經(jīng)典損失函數(shù)進(jìn)行預(yù)測(cè)框回歸,隨著研究的發(fā)展,目標(biāo)檢測(cè)領(lǐng)域直接采用定位性能度量損失,即將交并比IoU(Intersection over Union)作為定位損失。He 等[8]為了獲得更準(zhǔn)確的邊界框回歸和目標(biāo)檢測(cè),在2021 年提出了一種統(tǒng)一GIoU、DIoU、CIoU這3種基于IoU的損失函數(shù)的新?lián)p失函數(shù)α-IoU,通過(guò)對(duì)IoU 損失加上額外的power 正則化項(xiàng),使得其能夠概括現(xiàn)有基于IoU的損失,計(jì)算方法見(jiàn)式(1),以CIoU 為例,α-CIoU 損失函數(shù)可以表示為式(2)。
式中:Pα2(B,Bgt)為根據(jù)檢測(cè)框B和Bgt計(jì)算的懲罰因子;b、bgt分別代表了檢測(cè)框B和Ground truth G 的中心點(diǎn),且ρ為2 個(gè)中心點(diǎn)間的歐式距離;c為能夠同時(shí)覆蓋檢測(cè)框B和Ground truth G 的最小矩形的對(duì)角線距離;。
實(shí)證研究表明,在大多數(shù)情況下使用α=3 的α-IoU損失會(huì)在目標(biāo)檢測(cè)任務(wù)中取得較好的效果。采用α-CIoU 對(duì)原模型進(jìn)行修改,α取3,修改后效果對(duì)比見(jiàn)表2。
表2 α-CIoU損失函數(shù)效果對(duì)比
可以看出應(yīng)用α-CIoU損失函數(shù)后相比原CIoU損失函數(shù)模型精度有一定的提高,因此選取α-CIoU 損失函數(shù)來(lái)提高模型的檢測(cè)框精度。
1.1.3 檢測(cè)框后處理算法優(yōu)化
現(xiàn)有的檢測(cè)模型在檢測(cè)框后處理階段多采用NMS算法來(lái)對(duì)網(wǎng)絡(luò)預(yù)測(cè)到的多個(gè)預(yù)測(cè)框進(jìn)行篩選。在使用NMS算法篩選預(yù)測(cè)框時(shí),先給定閾值來(lái)對(duì)檢測(cè)框的IoU范圍進(jìn)行評(píng)價(jià)判斷,然后在給定閾值范圍內(nèi),高置信度預(yù)測(cè)框被保留,較低置信度預(yù)測(cè)框被刪除。這種篩選預(yù)測(cè)框的方法依賴設(shè)定的閾值好壞,在原模型中閾值為基于IoU 的閾值,根據(jù)前文分析,IoU 的效果并不如改進(jìn)后的α-IoU,考慮將后處理算法中的閾值更改為基于α-IoU 的閾值,形成α-CIoU-NMS,修改后效果見(jiàn)表3。
表3 α-CIoU-NMS效果對(duì)比
通過(guò)引入注意力機(jī)制對(duì)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行優(yōu)化,使用α-CIoU損失函數(shù)對(duì)原模型損失函數(shù)優(yōu)化,將α-CIoU引入NMS 形成α-CIoU-NMS 后處理方法對(duì)原模型進(jìn)行優(yōu)化,改進(jìn)后模型精度得到一定提高。
城軌車站是一個(gè)乘客密集的場(chǎng)所,因此利用優(yōu)化YOLOv5算法對(duì)城軌車站區(qū)域的乘客進(jìn)行檢測(cè),以提高檢測(cè)效果。在得到目標(biāo)檢測(cè)模型后可以對(duì)監(jiān)控視頻中乘客數(shù)量進(jìn)行識(shí)別,進(jìn)一步實(shí)現(xiàn)車站區(qū)域客流密度識(shí)別主要利用目標(biāo)檢測(cè)得到的當(dāng)前監(jiān)控區(qū)域的乘客數(shù)量N與設(shè)置的當(dāng)前監(jiān)控區(qū)域?qū)嶋H面積S,根據(jù)密度計(jì)算公式得到,具體方法如下:
(1)接入監(jiān)控視頻;
(2)設(shè)置待檢測(cè)區(qū)域,輸入待檢測(cè)區(qū)域面積S;
(3)監(jiān)控視頻處理,對(duì)原圖像進(jìn)行裁剪,得到設(shè)定的檢測(cè)區(qū)域圖像作為待檢測(cè)圖像;
(4)將待檢測(cè)圖像送入目標(biāo)檢測(cè)模型對(duì)該區(qū)域進(jìn)行行人檢測(cè),此過(guò)程輸入為待檢測(cè)區(qū)域的圖像,輸出為待檢測(cè)區(qū)域內(nèi)的每個(gè)行人的檢測(cè)框坐標(biāo)信息及行人總數(shù)N;
(5)得到行人總數(shù)N之后與待檢測(cè)區(qū)域的面積S按照客流密度公式進(jìn)行計(jì)算;
(6)輸出該區(qū)域的客流密度ρ。
目標(biāo)追蹤領(lǐng)域目前主流方法是基于深度學(xué)習(xí)和相關(guān)濾波的算法,在各種深度學(xué)習(xí)目標(biāo)跟蹤算法中Deep-SORT 作為SORT 算法的改進(jìn),其在多目標(biāo)追蹤任務(wù)中速度和精度都位于前列,并且可以較好地處理遮擋帶來(lái)的目標(biāo)丟失問(wèn)題,因此被廣泛應(yīng)用于各種多目標(biāo)追蹤任務(wù)中,因此選取Deep-SORT 算法作為客流速度獲取過(guò)程中的目標(biāo)跟蹤算法。
Deep-SORT 是在SORT 算法的基礎(chǔ)上進(jìn)行深化的,SORT 先在連續(xù)圖像序列之間利用卡爾曼濾波方法進(jìn)行目標(biāo)位置預(yù)測(cè)與更新,主要利用目標(biāo)的位置和運(yùn)動(dòng)特征,再采用匈牙利算法對(duì)檢測(cè)框與預(yù)測(cè)框的分配通過(guò)IoU 進(jìn)行優(yōu)化求解實(shí)現(xiàn)目標(biāo)前后信息匹配[9],Deep-SORT 算法額外考慮了追蹤目標(biāo)的外觀信息,引入重識(shí)別領(lǐng)域的目標(biāo)外觀特征提取模型,將外觀特征與運(yùn)動(dòng)特征級(jí)聯(lián)匹配,解決了SORT在面對(duì)遮擋時(shí)目標(biāo)變化的問(wèn)題[10]。Deep-SORT 算法流程見(jiàn)圖1,主要有3 個(gè)部分內(nèi)容,目標(biāo)檢測(cè)提取候選框、特征提取、數(shù)據(jù)關(guān)聯(lián)匹配。
圖1 Deep-SORT算法流程
由于通過(guò)視頻圖像獲取的行人坐標(biāo)為圖像的像素坐標(biāo),其與真實(shí)坐標(biāo)存在區(qū)別,需要獲取二者的換算模型,將圖像的像素坐標(biāo)與真實(shí)世界坐標(biāo)對(duì)應(yīng)。由于只需要得到像素坐標(biāo)與真實(shí)坐標(biāo)的轉(zhuǎn)化關(guān)系,不需要對(duì)相機(jī)各個(gè)參數(shù)進(jìn)行求解,所以化簡(jiǎn)后得到式(3):
式中:M即為投影矩陣,由攝像機(jī)焦距光心等內(nèi)部結(jié)構(gòu)和攝像機(jī)擺放位置和拍攝角度等外部參數(shù)決定,由于是在齊次坐標(biāo)系中進(jìn)行變換,對(duì)矩陣M乘以任意一個(gè)非零常數(shù)對(duì)坐標(biāo)對(duì)應(yīng)關(guān)系沒(méi)有影響,所以設(shè)m34為1。獲取6組對(duì)應(yīng)的像素坐標(biāo)與真實(shí)坐標(biāo),將其帶入式(3)進(jìn)行方程組求解,即可得到投影矩陣。在得到投影矩陣后即可將像素坐標(biāo)與真實(shí)坐標(biāo)轉(zhuǎn)換,所采集的行人速度只需要得到真實(shí)的二維平面坐標(biāo),行人是在一個(gè)平面上進(jìn)行移動(dòng),zw在平面上恒為0,將式(3)展開(kāi)后可以得到式(4):
則與(xw,yw)與(u,v)對(duì)應(yīng)關(guān)系可以用式(5)表示:
在利用目標(biāo)檢測(cè)加目標(biāo)追蹤得到城軌車站行人移動(dòng)的軌跡后,結(jié)合像素坐標(biāo)與真實(shí)坐標(biāo)的轉(zhuǎn)換關(guān)系即可得到行人的真實(shí)移動(dòng)速度,具體流程如下:
(1)YOLOv5 對(duì)圖像序列進(jìn)行目標(biāo)檢測(cè),得到監(jiān)控圖像內(nèi)當(dāng)前時(shí)刻每個(gè)行人檢測(cè)框的像素坐標(biāo);
(2)Deep-SORT 算法對(duì)連續(xù)圖像序列中的行人進(jìn)行追蹤,得到下一時(shí)刻行人所處位置及檢測(cè)框的像素坐標(biāo);
(3)利用像素坐標(biāo)與真實(shí)坐標(biāo)的轉(zhuǎn)換關(guān)系對(duì)得到的行人檢測(cè)框坐標(biāo)進(jìn)行轉(zhuǎn)換,得到當(dāng)前時(shí)刻與下一時(shí)刻行人檢測(cè)框的真實(shí)坐標(biāo);
(4)計(jì)算當(dāng)前時(shí)刻與下一時(shí)刻檢測(cè)框底部中心點(diǎn)真實(shí)坐標(biāo);
(5)利用速度計(jì)算公式得到該行人的真實(shí)移動(dòng)速度;
(6)對(duì)當(dāng)前區(qū)域所有行人移動(dòng)速度進(jìn)行平均得到當(dāng)前區(qū)域客流速度。
基于改進(jìn)的YOLOv5 算法對(duì)車站客流密度和客流持續(xù)時(shí)間進(jìn)行識(shí)別,首先要對(duì)目標(biāo)數(shù)量進(jìn)行統(tǒng)計(jì)。基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法應(yīng)用效果受數(shù)據(jù)集影響很大,如果數(shù)據(jù)集內(nèi)樣本單一,場(chǎng)景單一,則訓(xùn)練出來(lái)的網(wǎng)絡(luò)模型各項(xiàng)指標(biāo)只能夠在該數(shù)據(jù)集下取得,在其他場(chǎng)景中的應(yīng)用效果可能達(dá)不到在驗(yàn)證集上的評(píng)估效果,要確保在某一場(chǎng)景下的實(shí)際應(yīng)用效果良好,最可靠的方式就是建立該場(chǎng)景下的數(shù)據(jù)集,構(gòu)建的數(shù)據(jù)集來(lái)源是某站內(nèi)各區(qū)域的實(shí)際監(jiān)控視頻,分屬于步梯、扶梯、閘機(jī)、站臺(tái),基本覆蓋了車站內(nèi)各個(gè)區(qū)域。
為了保證行人樣本的充足,在各區(qū)域內(nèi)選取行人較多的視頻樣本,對(duì)視頻進(jìn)行按幀提取圖片的操作,考慮到視頻為25 幀/s,每幀之間行人變化極小,對(duì)每幀圖片進(jìn)行提取會(huì)導(dǎo)致數(shù)據(jù)集的冗余。因此選擇每10 幀提取1 次圖片,最終提取出3 916 張樣本圖片,經(jīng)過(guò)篩選剔除無(wú)人圖片以及重復(fù)圖片,最終將3 000 張圖片納入車站乘客數(shù)據(jù)集,樣本見(jiàn)圖2。
圖2 車站乘客數(shù)據(jù)集樣本
將數(shù)據(jù)集按照9∶1的比例劃分為訓(xùn)練集和驗(yàn)證集,在Windows10系統(tǒng),11G顯存GeForceRTX2080Ti顯卡的環(huán)境中設(shè)置Batch_size 為16,epoch 為1 000,經(jīng)過(guò)13 h訓(xùn)練后損失值趨于平穩(wěn),此時(shí)繼續(xù)訓(xùn)練優(yōu)化效果不大,停止訓(xùn)練,從訓(xùn)練過(guò)程中選取最優(yōu)的模型文件保存,訓(xùn)練過(guò)程損失變化見(jiàn)圖3,900epoch 后基本損失函數(shù)平穩(wěn),結(jié)束訓(xùn)練。
圖3 模型訓(xùn)練過(guò)程損失變化
由于所采用的客流密度識(shí)別方法中的監(jiān)控區(qū)域面積是根據(jù)實(shí)際情況給定的,客流密度和客流持續(xù)時(shí)間識(shí)別都是對(duì)乘客數(shù)量進(jìn)行檢測(cè),因此對(duì)客流密度和客流持續(xù)時(shí)間識(shí)別方法有效性進(jìn)行評(píng)估可以等價(jià)于對(duì)目標(biāo)檢測(cè)的有效性進(jìn)行評(píng)估。
選取訓(xùn)練數(shù)據(jù)之外的閘機(jī)、站臺(tái)、扶梯、步梯4個(gè)區(qū)域不同密度等級(jí)的100張圖片分別進(jìn)行測(cè)試,檢測(cè)效果見(jiàn)圖4。在站臺(tái)區(qū)域由于監(jiān)控范圍過(guò)大,遠(yuǎn)處小目標(biāo)人體可由另一端相機(jī)進(jìn)行檢測(cè),所以只檢測(cè)靠近相機(jī)的一半?yún)^(qū)域的乘客,遮擋不嚴(yán)重的大部分人體都可以被檢測(cè)到,但在人群極度密集環(huán)境如站臺(tái)等,會(huì)存在漏檢的情況,同時(shí)由于監(jiān)控視頻畫面中還會(huì)存在一些不屬于監(jiān)控范圍的較遠(yuǎn)區(qū)域的人體,在檢測(cè)過(guò)程中也會(huì)對(duì)這些人體進(jìn)行檢測(cè)造成誤檢,導(dǎo)致檢測(cè)到的人體比畫面中的實(shí)際人體數(shù)量還要更多,此部分誤檢可以在實(shí)際應(yīng)用中設(shè)定監(jiān)控范圍進(jìn)行控制。
圖4 行人檢測(cè)效果
將優(yōu)化后模型與原模型在各區(qū)域識(shí)別到的人數(shù)與真實(shí)人數(shù)進(jìn)行對(duì)比,結(jié)果見(jiàn)表4 與圖5,其中站臺(tái)區(qū)域檢測(cè)到的人體數(shù)量為剔除誤檢人體之后的數(shù)據(jù)。可以看出在利用車站乘客數(shù)據(jù)集對(duì)優(yōu)化后模型進(jìn)行針對(duì)訓(xùn)練后,優(yōu)化后模型效果相比原模型更好,平均精度達(dá)到86.82%。
圖5 不同區(qū)域檢測(cè)結(jié)果對(duì)比
表4 不同區(qū)域檢測(cè)精度對(duì)比
在城軌車站監(jiān)控視頻中對(duì)客流速度識(shí)別方法進(jìn)行驗(yàn)證,車站監(jiān)控視頻標(biāo)定情況見(jiàn)圖6。首先對(duì)坐標(biāo)變換進(jìn)行驗(yàn)證,對(duì)其中導(dǎo)向標(biāo)識(shí)L1、L2兩點(diǎn)的距離進(jìn)行換算,選取O、A、B、C、D、E六點(diǎn)作為特征點(diǎn)進(jìn)行標(biāo)定,根據(jù)標(biāo)定得到的投影矩陣及式(5)將L1、L2的像素坐標(biāo)轉(zhuǎn)為真實(shí)坐標(biāo)(見(jiàn)表5),求得2 個(gè)導(dǎo)向標(biāo)識(shí)之間的距離長(zhǎng)度為1.02 m,L1、L2的真實(shí)距離1 m,在監(jiān)控視頻中坐標(biāo)換算的誤差為2%。
圖6 車站監(jiān)控視頻標(biāo)定情況
表5 L1、L2坐標(biāo)換算結(jié)果
對(duì)速度識(shí)別方法進(jìn)行驗(yàn)證(見(jiàn)圖7),該場(chǎng)景下乘客P在27 s時(shí)坐標(biāo)為(375,214),33 s時(shí)坐標(biāo)為(317,539),進(jìn)行坐標(biāo)轉(zhuǎn)換后坐標(biāo)換算結(jié)果見(jiàn)表6,計(jì)算可得行人P速度為1.02 m/s,行人真實(shí)的速度為0.95 m/s,在監(jiān)控視頻中乘客速度的識(shí)別精度為93.2%。
圖7 單人速度計(jì)算示例
表6 乘客P前后時(shí)刻坐標(biāo)換算結(jié)果
多人場(chǎng)景速度檢測(cè)見(jiàn)圖8,對(duì)檢測(cè)框能完全覆蓋的乘客,識(shí)別到的速度較為可靠,由于個(gè)別位于樓梯或扶梯的乘客,其坐標(biāo)點(diǎn)不在標(biāo)定平面,因此坐標(biāo)換算存在誤差,從而導(dǎo)致速度準(zhǔn)確度較低,在實(shí)際應(yīng)用中可以預(yù)設(shè)檢測(cè)范圍以確保檢測(cè)區(qū)域在標(biāo)定的平面來(lái)改善此問(wèn)題。
圖8 多人場(chǎng)景速度檢測(cè)示例
對(duì)車站客流信息獲取方法進(jìn)行研究,首先通過(guò)對(duì)目標(biāo)檢測(cè)算法進(jìn)行分析,選取目前工程效果較好的YOLOv5 算法作為行人檢測(cè)模型,以實(shí)現(xiàn)對(duì)客流密度信息的獲??;其次從網(wǎng)絡(luò)結(jié)構(gòu)修改、損失函數(shù)改進(jìn)、后處理方法改進(jìn)3 個(gè)方面對(duì)YOLOv5 算法進(jìn)行改進(jìn),提高了檢測(cè)精度,同時(shí)自制城軌乘客數(shù)據(jù)集進(jìn)行訓(xùn)練,提高了YOLOv5算法在城軌車站場(chǎng)景中的檢測(cè)準(zhǔn)確率;最后選取目前時(shí)效比最好的Deep-SORT 目標(biāo)追蹤算法作為行人追蹤模型,并結(jié)合單目相機(jī)標(biāo)定實(shí)現(xiàn)對(duì)客流真實(shí)速度信息的獲取,為基于視頻數(shù)據(jù)的車站客流狀態(tài)信息獲取提供了基礎(chǔ)。