謝海瑩
(廣州方緯智慧大腦研究開發(fā)有限公司,廣東 廣州 511458)
卡口數(shù)據(jù)是指通過公路車輛智能監(jiān)測(cè)記錄系統(tǒng)(簡(jiǎn)稱卡口系統(tǒng))采集獲得的數(shù)據(jù)。卡口數(shù)據(jù)包括但不限于車輛號(hào)碼、車輛類型、號(hào)牌顏色、過車時(shí)間、入庫時(shí)間、設(shè)備信息、行駛方向、車道編號(hào)等信息,如表1所示。
表1 卡口數(shù)據(jù)詳細(xì)信息示例
由于車牌識(shí)別系統(tǒng)在處理過程中不同環(huán)節(jié)、不同的應(yīng)用類型,對(duì)卡口數(shù)據(jù)的質(zhì)量要求不同,并影響到最終輸出的數(shù)據(jù)質(zhì)量,因此依據(jù)車牌識(shí)別系統(tǒng)原理以及卡口的應(yīng)用需求,可選取數(shù)據(jù)的有效性、穩(wěn)定性、準(zhǔn)確性和實(shí)時(shí)性作為數(shù)據(jù)監(jiān)測(cè)的內(nèi)容,并進(jìn)一步確定指標(biāo)進(jìn)行監(jiān)測(cè)[1-3]。
有效性是指滿足一定的可用性判別標(biāo)準(zhǔn)的數(shù)據(jù)所占比例。評(píng)估卡口數(shù)據(jù)的有效性主要是評(píng)估卡口數(shù)據(jù)在時(shí)間上、信息上的有效性。具體是指經(jīng)剔除重復(fù)記錄、時(shí)間無效后的可以被使用的記錄。內(nèi)容包括:(1)時(shí)間有效性判別,即剔除相同的設(shè)備編號(hào)、抓拍時(shí)間、車牌號(hào)碼、車輛類型的數(shù)據(jù)記錄;(2)剔除時(shí)間戳無效的數(shù)據(jù)記錄,即時(shí)間日期是很久以前的或者超出當(dāng)前時(shí)間很久的數(shù)據(jù);(3)剔除車牌號(hào)碼無效的數(shù)據(jù)。
數(shù)據(jù)穩(wěn)定性是衡量數(shù)據(jù)波動(dòng)性與離散性的指標(biāo),數(shù)據(jù)波動(dòng)越小,離散程度越小,則穩(wěn)定性越高。而卡口數(shù)據(jù)的穩(wěn)定性是指統(tǒng)計(jì)周期內(nèi),卡口數(shù)據(jù)在時(shí)間維度上的變化程度和持續(xù)程度??跀?shù)據(jù)的穩(wěn)定性判斷,主要有以下幾種方法:最值差值法、統(tǒng)計(jì)學(xué)方法、百分?jǐn)?shù)衡量法[4]。
準(zhǔn)確性又稱為精度,表明系統(tǒng)接收到的數(shù)據(jù)與真實(shí)情況的接近程度。準(zhǔn)確性越高,表明系統(tǒng)輸出的數(shù)據(jù)質(zhì)量越高,對(duì)數(shù)據(jù)后續(xù)的應(yīng)用越有利??跀?shù)據(jù)的準(zhǔn)確性,主要包括:(1)數(shù)據(jù)量上的準(zhǔn)確性,即卡口識(shí)別的車輛數(shù)量與實(shí)際通行的數(shù)據(jù)越接近,則準(zhǔn)確性越高;(2)卡口識(shí)別的車牌號(hào)碼、種類、號(hào)牌顏色、經(jīng)過時(shí)間等與實(shí)際通過的車輛保持一致,尤其是車牌號(hào)碼和車輛種類,兩者合并作為車輛身份的唯一標(biāo)識(shí),錯(cuò)一字則差之千里,更應(yīng)該準(zhǔn)確,大部分的應(yīng)用如違法布控、個(gè)體軌跡出行分析等都需要準(zhǔn)確的車牌號(hào)碼才能進(jìn)行下一步的計(jì)算。
實(shí)時(shí)性,是指卡口數(shù)據(jù)從前端抓拍經(jīng)過圖像識(shí)別后,形成的識(shí)別結(jié)果進(jìn)入到對(duì)應(yīng)系統(tǒng)的時(shí)間足夠短。時(shí)間越短,實(shí)時(shí)性越好。目前,關(guān)于卡口信息采集的實(shí)時(shí)性,根據(jù)資料,在各標(biāo)準(zhǔn)中只規(guī)定了完成一輛車的車牌識(shí)別時(shí)間在0.5~1 s以內(nèi)[5],圖像捕獲、圖片合成的耗時(shí),以及傳輸?shù)浇K端系統(tǒng)數(shù)據(jù)庫的時(shí)間等均未有規(guī)定,因此對(duì)于整個(gè)完整采集、識(shí)別、傳輸、入庫的總過程的耗時(shí)缺乏參考標(biāo)準(zhǔn)。在實(shí)際應(yīng)用當(dāng)中,例如利用卡口數(shù)據(jù)進(jìn)行交通運(yùn)行評(píng)價(jià)、流量預(yù)測(cè)、信控評(píng)價(jià)、違法布控等均對(duì)卡口數(shù)據(jù)的實(shí)時(shí)性有著較高的要求,因此對(duì)卡口數(shù)據(jù)的實(shí)時(shí)性監(jiān)測(cè)也十分重要。
數(shù)據(jù)冗余、數(shù)據(jù)不符合標(biāo)準(zhǔn)的比例越高,說明數(shù)據(jù)的質(zhì)量越差,不但占用了數(shù)據(jù)存儲(chǔ)空間,還會(huì)影響數(shù)據(jù)的應(yīng)用和效率,因此需要對(duì)數(shù)據(jù)有效率進(jìn)行分析和監(jiān)測(cè),有效率低說明前端設(shè)備存在異常,應(yīng)當(dāng)及時(shí)排查??梢葬槍?duì)每個(gè)設(shè)備,選取不同的統(tǒng)計(jì)時(shí)段,初步統(tǒng)計(jì)數(shù)據(jù)的有效率。具體計(jì)算公式如下
(1)
式中:Pe為統(tǒng)計(jì)時(shí)段內(nèi)數(shù)據(jù)記錄有效率,%;o為統(tǒng)計(jì)時(shí)段內(nèi)入庫記錄總數(shù),條;b為統(tǒng)計(jì)時(shí)段內(nèi)入庫記錄數(shù)據(jù)中,車牌號(hào)碼、時(shí)間重復(fù)的記錄以及時(shí)間戳無效、車牌無效等數(shù)據(jù)記錄總數(shù),條。
卡口數(shù)據(jù)因不同時(shí)段、不同設(shè)備、不同位置的車輛流量不同,短周期內(nèi)數(shù)據(jù)量可能變化較大,如果直接采用傳統(tǒng)的三種方法計(jì)算,誤差較大。在參考百分?jǐn)?shù)衡量法的基礎(chǔ)上,增加持續(xù)判斷的方法,來減小數(shù)據(jù)的誤差影響。根據(jù)卡口數(shù)據(jù)的特點(diǎn),利用歷史數(shù)據(jù)計(jì)算出合理的歷史經(jīng)驗(yàn)均值,并將當(dāng)前統(tǒng)計(jì)周期內(nèi)的數(shù)據(jù)與歷史均值進(jìn)行對(duì)比。具體計(jì)算公式如下
(2)
式中:μ為用于判斷單個(gè)時(shí)間節(jié)點(diǎn)數(shù)據(jù)異常、不穩(wěn)定的指標(biāo),可通過分析歷史數(shù)據(jù)和經(jīng)驗(yàn)設(shè)置,在0到1之間;oi為第i個(gè)時(shí)間節(jié)點(diǎn)在統(tǒng)計(jì)時(shí)段內(nèi)的入庫記錄總數(shù),條;Vavg為相同日期、相同時(shí)段下的,相同統(tǒng)計(jì)區(qū)間內(nèi)的歷史均值數(shù)據(jù)量,條;fi為第i個(gè)時(shí)間節(jié)點(diǎn)的異常結(jié)果,1表示正常,0表示異常;n為從第i個(gè)時(shí)間節(jié)點(diǎn)往前推的n個(gè)時(shí)間節(jié)點(diǎn),n≥1,n說明需要連續(xù)n個(gè)連續(xù)的時(shí)間節(jié)點(diǎn)出現(xiàn)滿足不穩(wěn)定指標(biāo)的情況時(shí),才會(huì)被判斷為數(shù)據(jù)不穩(wěn)定,作為異常進(jìn)行報(bào)警,此值的大小根據(jù)實(shí)際需要按經(jīng)驗(yàn)設(shè)定。
Vavg可以采用歷史一個(gè)星期內(nèi)的數(shù)據(jù)平穩(wěn)的卡口數(shù)據(jù),分日期、分時(shí)段、分設(shè)備求得的歷史平均值,保存在數(shù)據(jù)庫中作為歷史均值表,該表可以定期更新。統(tǒng)計(jì)時(shí)段可以按照一個(gè)小時(shí)、半個(gè)小時(shí)、十五分鐘等劃分,由于夜晚流量少,不具有參考性,可以不分析夜晚時(shí)段,時(shí)段長度可以根據(jù)實(shí)際數(shù)據(jù)分析評(píng)估確定。日期按照周一至周日來劃分。如果有節(jié)假日,還需要根據(jù)節(jié)假日劃分。統(tǒng)計(jì)節(jié)點(diǎn)可以按照五分鐘統(tǒng)計(jì)一次,則一個(gè)小時(shí)統(tǒng)計(jì)12次,統(tǒng)計(jì)長度由統(tǒng)計(jì)時(shí)段確定,采用滑動(dòng)統(tǒng)計(jì)的方式。如果當(dāng)前統(tǒng)計(jì)時(shí)間段內(nèi)的數(shù)量與歷史均值之比低于指定的閾值μ,并且持續(xù)n個(gè)時(shí)間節(jié)點(diǎn),則說明數(shù)據(jù)不穩(wěn)定,出現(xiàn)了異常,應(yīng)當(dāng)及時(shí)報(bào)警排查,以免影響數(shù)據(jù)應(yīng)用。
實(shí)踐中,數(shù)據(jù)的準(zhǔn)確性評(píng)價(jià)采用抽樣、視頻幀人工對(duì)比法、大數(shù)據(jù)量化計(jì)算分析法進(jìn)行監(jiān)測(cè)。不同的設(shè)備等級(jí),由于其建設(shè)標(biāo)準(zhǔn)和技術(shù)不同,例如電警卡口、治安卡口、視頻結(jié)構(gòu)化三種不同類型的設(shè)備,其對(duì)設(shè)備的識(shí)別精度要求就不盡相同,電警卡口要求最高,視頻結(jié)構(gòu)化最低,但是都可以作為卡口數(shù)據(jù)為系統(tǒng)所用。因此不能要求所有的卡口設(shè)備其流水?dāng)?shù)據(jù)都使用一致的檢測(cè)標(biāo)準(zhǔn),而是應(yīng)當(dāng)根據(jù)不同類型設(shè)備采用不同的閾值進(jìn)行判斷。
(1)車牌檢測(cè)率。
車牌檢測(cè)率是指車輛經(jīng)過卡口檢測(cè)路段時(shí),車輛能夠被卡口設(shè)備抓拍到圖片,同時(shí)進(jìn)行圖像識(shí)別、獲得一條信息記錄的數(shù)據(jù)傳輸?shù)较鄳?yīng)的數(shù)據(jù)存儲(chǔ)中,即車輛圖像捕獲識(shí)別后所記錄的有效車輛數(shù)與實(shí)際通過車輛數(shù)的百分比。正常情況下,每一輛車的經(jīng)過都應(yīng)當(dāng)有一條數(shù)據(jù)記錄,但是由于環(huán)境、系統(tǒng)等因素復(fù)雜,可能會(huì)存在車輛經(jīng)過后,沒有被抓拍到的情況。其中原因可能是卡口捕獲不到車輛圖像,也可能是系統(tǒng)傳輸過程數(shù)據(jù)丟失等,即車輛漏檢。對(duì)于卡口數(shù)據(jù)使用方來說,沒有在系統(tǒng)中生成對(duì)應(yīng)的車輛通過記錄的就應(yīng)當(dāng)視作車牌漏檢。由于車牌檢測(cè)率需要對(duì)比實(shí)際通過的情況才能獲得結(jié)果,故而需要采用抽樣、人工統(tǒng)計(jì)的方式進(jìn)行??梢猿闃舆x取具有監(jiān)控視頻的卡口設(shè)備,通過視頻幀人工分析統(tǒng)計(jì)出實(shí)際通過該路口的車輛次數(shù),然后與相同時(shí)間段內(nèi)的入庫系統(tǒng)的記錄總數(shù)進(jìn)行對(duì)比。
(3)
式中:Pdet為車牌檢測(cè)率,%;Nr為通過視頻幀人工分析出的統(tǒng)計(jì)時(shí)段內(nèi)實(shí)際車次數(shù),車次;Ol為通過對(duì)比視頻,在統(tǒng)計(jì)時(shí)段內(nèi)在接收的數(shù)據(jù)庫中,未能生成數(shù)據(jù)記錄入庫的車次數(shù)量,車次。
(2)車牌識(shí)別率。
車牌識(shí)別率是指系統(tǒng)在抓拍圖片后,經(jīng)過圖像處理,能夠準(zhǔn)確地將圖中的車牌號(hào)碼識(shí)別出來的比率??梢圆捎贸闃?、人工對(duì)比的方式統(tǒng)計(jì)車牌識(shí)別率。但是,抽樣獲得的車牌識(shí)別率具有明顯的局限性,一個(gè)中小城市,少則幾百個(gè)卡口設(shè)備,多則幾萬個(gè)設(shè)備,而且每個(gè)設(shè)備識(shí)別率的高低會(huì)受到類型、光線、角度、遮擋、比例、形變、背景等因素影響,通過抽樣、人工的方式,無法將識(shí)別率差的設(shè)備及時(shí)排查出來。隨著大數(shù)據(jù)技術(shù)應(yīng)用,可以使用全量的方式,采用自動(dòng)化的方法計(jì)算車牌的識(shí)別率?!吨腥A人民共和國機(jī)動(dòng)車號(hào)牌》(GA 36—2018)[6]中,對(duì)車牌有嚴(yán)格的規(guī)定,因此可以根據(jù)已有規(guī)定建立車牌合法性統(tǒng)計(jì),例如從車牌長度、車牌第一個(gè)文字字符、第二第三個(gè)數(shù)字規(guī)律等進(jìn)行合法性判斷,隨著新能源車牌照越來越多,歷史的車牌識(shí)別系統(tǒng)對(duì)新能源車牌的識(shí)別支持不夠,就更加有必要對(duì)車牌識(shí)別率進(jìn)行監(jiān)測(cè)。
(4)
式中:Prec為車牌識(shí)別率,%;n為根據(jù)車牌的規(guī)則判斷的不合規(guī)車牌記錄數(shù),條;o為統(tǒng)計(jì)時(shí)段內(nèi)入庫記錄總數(shù),條。
這種方法計(jì)算的車牌識(shí)別率并不能百分之一百地等于實(shí)際,但也比較靠近實(shí)際,甚至可以將識(shí)別車牌與車駕管數(shù)據(jù)進(jìn)行比對(duì)判斷,從而進(jìn)一步提高車牌識(shí)別率的準(zhǔn)確度。實(shí)際使用中可以按照不同設(shè)備進(jìn)行計(jì)算,達(dá)到全量、全域、全時(shí)監(jiān)測(cè),能夠有效篩選出問題設(shè)備,以便及時(shí)修復(fù)和升級(jí)卡口設(shè)備,為后續(xù)應(yīng)用提供保障。
影響數(shù)據(jù)實(shí)時(shí)性,導(dǎo)致延遲的原因非常復(fù)雜,各環(huán)節(jié)均可能存在延遲。各環(huán)節(jié)銜接過程、軟件的穩(wěn)定性、軟硬件運(yùn)行環(huán)境、網(wǎng)絡(luò)傳輸?shù)榷伎赡茉斐裳舆t。但對(duì)每個(gè)環(huán)節(jié)逐一檢測(cè)非常困難且沒有必要,為了盡可能簡(jiǎn)單明確、實(shí)時(shí)、持續(xù)地對(duì)數(shù)據(jù)進(jìn)行監(jiān)測(cè),以整個(gè)采集傳輸過程作為整體監(jiān)測(cè)指標(biāo),采用接收數(shù)據(jù)時(shí)間(即入庫時(shí)間)與實(shí)際采集時(shí)間(圖像抓拍時(shí)間)的延誤值作為監(jiān)測(cè)數(shù)據(jù)實(shí)時(shí)性的指標(biāo)。具體可以分為單樣本延遲時(shí)間和單設(shè)備平均延遲時(shí)間兩種。
(1)單樣本延遲時(shí)間。
Δt=tr-tc
(5)
式中:Δt為當(dāng)前記錄入庫時(shí)間與抓拍時(shí)間差,s;tr為當(dāng)前記錄的入庫時(shí)間;tc為當(dāng)前記錄中車輛通過路口時(shí)的圖像抓拍時(shí)間。
(2)單設(shè)備平均延遲時(shí)間。
對(duì)于大規(guī)模數(shù)據(jù),一條記錄的延誤值并不能很好地反映數(shù)據(jù)是否出現(xiàn)問題。一般地,會(huì)針對(duì)同一設(shè)備統(tǒng)計(jì)一定時(shí)間段內(nèi)的平均延誤時(shí)間,作為該設(shè)備是否存在延誤的標(biāo)準(zhǔn)。
(6)
式中:Tt為統(tǒng)計(jì)時(shí)間段內(nèi),該設(shè)備所有入庫記錄的平均延遲時(shí)間,s;Δt為單個(gè)樣本的入庫時(shí)間與抓怕時(shí)間差,s;n為統(tǒng)計(jì)時(shí)間段內(nèi)入庫記錄總數(shù),條。
在安徽省宣城市的交通大腦系統(tǒng)中,基于卡口數(shù)據(jù)進(jìn)行質(zhì)量監(jiān)測(cè)的環(huán)節(jié)本屬于其中一個(gè)應(yīng)用模塊,名稱為設(shè)備數(shù)據(jù)監(jiān)控模塊,主要是在后臺(tái)每五分鐘計(jì)算每個(gè)卡口設(shè)備的指標(biāo)數(shù)據(jù),并實(shí)時(shí)對(duì)比指標(biāo)的合理范圍閾值,如果不符合閾值范圍,則生成一條異常記錄,并將異常記錄推送展示在系統(tǒng)界面,從而及時(shí)提醒數(shù)據(jù)管理人員,及時(shí)排查問題。
閾值需要根據(jù)實(shí)際在后臺(tái)配置文件中設(shè)置,可根據(jù)不同地市不同的設(shè)備類型進(jìn)行實(shí)際分析后設(shè)置。一般地,默認(rèn)識(shí)別率閾值為80%,觸發(fā)不穩(wěn)定的流量比值為50%,觸發(fā)報(bào)警延誤嚴(yán)重的閾值為120 s。可靠閾值需要根據(jù)實(shí)際情況設(shè)置,并且與統(tǒng)計(jì)的流水范圍匹配。默認(rèn)情況下設(shè)置為50條。主要是為了減少因數(shù)據(jù)量偏小出現(xiàn)的計(jì)算誤差偏大的情況。表2為宣城大腦系統(tǒng)中部分設(shè)備的卡口監(jiān)測(cè)數(shù)據(jù)結(jié)果,后臺(tái)每五分鐘對(duì)相關(guān)指標(biāo)進(jìn)行統(tǒng)計(jì)并保存到數(shù)據(jù)庫中。
表2 部分卡口設(shè)備監(jiān)測(cè)數(shù)據(jù)
同時(shí),后臺(tái)將指標(biāo)數(shù)據(jù)與設(shè)定的閾值進(jìn)行比較,如果不滿足合理范圍,則被推送到系統(tǒng)界面,進(jìn)行實(shí)時(shí)預(yù)警。
系統(tǒng)用戶可以在系統(tǒng)上及時(shí)發(fā)現(xiàn)存在異常的設(shè)備,從而及時(shí)排查和修復(fù)設(shè)備。
基于車牌識(shí)別的卡口設(shè)備數(shù)據(jù)質(zhì)量監(jiān)測(cè)方法已經(jīng)在多個(gè)地市的基于卡口數(shù)據(jù)應(yīng)用的系統(tǒng)中得到使用,如上海、廣州等。項(xiàng)目前期,該方法可以利用歷史數(shù)據(jù)對(duì)項(xiàng)目使用的卡口設(shè)備進(jìn)行質(zhì)量分析,排查當(dāng)前階段卡口是否存在質(zhì)量問題,分析卡口數(shù)據(jù)應(yīng)用的可行性,同時(shí)反饋有問題的卡口設(shè)備以便及時(shí)維修。項(xiàng)目運(yùn)行中,可以實(shí)時(shí)監(jiān)測(cè)卡口數(shù)據(jù)是否異常,例如是否出現(xiàn)數(shù)據(jù)中斷、識(shí)別率過低、數(shù)據(jù)不穩(wěn)定、數(shù)據(jù)延誤等問題,采用實(shí)時(shí)報(bào)警的方式提醒廠家進(jìn)行修復(fù),縮短數(shù)據(jù)異常的時(shí)間,為后續(xù)系統(tǒng)的實(shí)時(shí)應(yīng)用以及數(shù)據(jù)分析提供更好的支持。