沈 兵,胡嘯峰,3,吳建松
(1.中國人民公安大學(xué) 信息網(wǎng)絡(luò)安全學(xué)院,北京 100076; 2.安全防范技術(shù)與風(fēng)險評估公安部重點(diǎn)實(shí)驗(yàn)室,北京 100076; 3.中國人民公安大學(xué) 公共安全行為科學(xué)實(shí)驗(yàn)室,北京 100038; 4.中國礦業(yè)大學(xué)(北京) 應(yīng)急管理與安全工程學(xué)院,北京 100083)
社區(qū)指街道辦事處轄區(qū),經(jīng)社區(qū)體制改革演變成居民委員會轄區(qū)或城市規(guī)劃中有一定數(shù)量居民聚居的區(qū)域。以北京市典型城市社區(qū)—“勁松北社區(qū)”為例,根據(jù)北京市朝陽區(qū)信息化工作辦公室公布數(shù)據(jù)(更新至2019年),該社區(qū)占地面積0.26 km2,轄區(qū)內(nèi)有居民1萬余人,各類建筑樓房47棟,社會單位70余家。社區(qū)是基層社會治理和公共安全治理基本單元,社區(qū)安全引起國家高度重視,中共中央辦公廳、國務(wù)院辦公廳印發(fā)的《關(guān)于推進(jìn)城市安全發(fā)展的意見》指出“應(yīng)當(dāng)加強(qiáng)安全社區(qū)建設(shè)、完善城市社區(qū)安全網(wǎng)格化工作體系”。
社區(qū)治安高危人員(以下簡稱“高危人員”)指活動在社區(qū)范圍內(nèi),對國家安全、社會治安、公民人身財產(chǎn)安全具有較高威脅的人員,包括但不限于“犯罪前科人員”、“涉毒人員”、“在逃人員”和“肇事肇禍精神病人”,該群體違法犯罪可能性較高,對社會潛在危害較大[1-2]。根據(jù)中國疾病預(yù)防控制中心精神衛(wèi)生中心公布數(shù)據(jù),截止2017年底,我國嚴(yán)重精神障礙患者人數(shù)超過1 600萬,其中肇事肇禍人數(shù)占10%。根據(jù)公安部發(fā)布的《2018年中國毒品形勢報告》,截至2018年底,全國現(xiàn)有吸毒人員240.4萬名(不含戒斷3 a未發(fā)現(xiàn)復(fù)吸人數(shù)、死亡人數(shù)和離境人數(shù))[3]。毒品濫用給吸毒者本人及家庭帶來嚴(yán)重危害,同時誘發(fā)暴力傷害、“毒駕”、“以盜養(yǎng)吸毒”等違法犯罪活動。因此,對高危人員進(jìn)行有效管控,可有效預(yù)防打擊違法犯罪活動及維護(hù)社會治安穩(wěn)定。
隨著社區(qū)基礎(chǔ)信息化建設(shè)不斷加強(qiáng),大量社區(qū)部署人臉識別點(diǎn)位、車輛卡口及WIFI電子圍欄等物聯(lián)網(wǎng)感知終端,用于識別人員身份,獲取人員軌跡,為高危人員異常軌跡識別與預(yù)警提供數(shù)據(jù)支撐。國內(nèi)外利用時空連續(xù)軌跡數(shù)據(jù)可識別“伴隨”、“聚集”、“頻繁”等常見軌跡模式,以及“離群”、“晝伏夜出”等特殊軌跡模式[4-10],通過將人員、車輛軌跡與路網(wǎng)信息、興趣點(diǎn)(Point of Interest,POI)等數(shù)據(jù)結(jié)合,識別環(huán)境因素約束下人員及車輛軌跡模式[11-14],為高危人員異常軌跡識別提供技術(shù)支持。
利用人臉識別、WIFI電子圍欄等終端設(shè)備采集多源數(shù)據(jù),識別高危人員異?;顒榆壽E并及時預(yù)警,是社區(qū)警務(wù)重要任務(wù)。但傳統(tǒng)高危人員異常軌跡預(yù)警模型存在“誤報率”高或“漏報率”高等缺點(diǎn)。根據(jù)調(diào)研發(fā)現(xiàn),高誤報率主要原因是當(dāng)前算法僅能識別規(guī)則簡單、特征維度較少的異常軌跡模式[15-16],例如“絆線預(yù)警”、“越界預(yù)警”等,缺乏科學(xué)預(yù)警機(jī)制,對多維度異常軌跡風(fēng)險等級判別比較困難。
為解決異常軌跡識別精準(zhǔn)度低、預(yù)警誤報率高等問題,提出新的社區(qū)治安高危人員異常軌跡識別與預(yù)警方法,該方法基于物聯(lián)網(wǎng)傳感器獲取高危人員軌跡數(shù)據(jù),計算高危人員在不同場所異常軌跡風(fēng)險值,實(shí)現(xiàn)運(yùn)動軌跡精確識別,并按照軌跡風(fēng)險等級進(jìn)行合理預(yù)警,并采用Geolife動態(tài)軌跡數(shù)據(jù)集進(jìn)行驗(yàn)證。
基于軌跡數(shù)據(jù),采用ST-DBSCAN算法與重點(diǎn)部位觀測點(diǎn)法標(biāo)定軌跡數(shù)據(jù),并進(jìn)行動態(tài)軌跡序列化建模,構(gòu)建高危人員動態(tài)行為鏈。選擇高危人員身份屬性、入訪場所類型、空間所屬關(guān)系、入訪時間、入訪頻率、高危人員年齡與性別7種特征屬性,建立異常軌跡分析模型;高危人員異常軌跡風(fēng)險值作歸一化處理,劃分異常軌跡風(fēng)險等級。技術(shù)路線如圖1 所示。
圖1 技術(shù)路線Fig.1 Technical roadmap
針對多源動態(tài)軌跡數(shù)據(jù),需要進(jìn)行統(tǒng)一標(biāo)定。動態(tài)軌跡數(shù)據(jù)獲取方式包括主動式與被動式2種:主動式指高危人員佩戴定位裝置,并主動上傳定位信息(例如GPS定位新數(shù)據(jù)),該方式僅適用于少數(shù)高危人員,例如社區(qū)矯正人員;被動式軌跡獲取指利用人臉識別、監(jiān)控點(diǎn)位、交通卡口、WIFI電子圍欄等物聯(lián)網(wǎng)設(shè)備終端,對高危人員進(jìn)行身份識別,并記錄其軌跡數(shù)據(jù),該方式適用于無法強(qiáng)制其攜帶定位裝置的人員。
1)高危人員主動上傳軌跡場景下的軌跡標(biāo)定。
GPS定位數(shù)據(jù)相鄰駐留點(diǎn)時間間隔較短,空間位置信息相似,故采用軌跡時空聚類法對其降維,提取高危人員駐留點(diǎn)。經(jīng)傳統(tǒng)DBSCAN算法改進(jìn)后的ST-DBSCAN算法[17],以“空間鄰域”和“時間鄰域”作為參數(shù),以駐留點(diǎn)時空密度作為聚類依據(jù),原理是設(shè)存在數(shù)據(jù)總量為N的駐留點(diǎn)集{X1,X2,…,XN},預(yù)設(shè)空間鄰域半徑為S-EPS,時間鄰域半徑為T-EPS,每個聚類簇內(nèi)包含點(diǎn)數(shù)最少為Min-PTS,算法計算過程見表1。
表1 ST-DBSCAN算法計算過程Table 1 Calculation process of ST-DBSCAN algorithm
2)高危人員被動式軌跡獲取場景下軌跡標(biāo)定。在社區(qū)重點(diǎn)區(qū)域和場所,利用人臉識別點(diǎn)位、車輛卡口、WIFI電子圍欄等物聯(lián)網(wǎng)傳感器,對高危人員進(jìn)行身份識別,并將觀測點(diǎn)位置近似作為高危人員駐留點(diǎn)。
觀測點(diǎn)類型包括區(qū)域型觀測點(diǎn)和交通路口觀測點(diǎn)。區(qū)域型觀測點(diǎn)指具有特定功能的面,其邊界可通過若干經(jīng)緯度點(diǎn)確定,或通過觀測點(diǎn)中心和觀測覆蓋半徑確定。當(dāng)高危人員進(jìn)入被觀測區(qū)域時,形成軌跡記錄;當(dāng)高危人員在不同場所間移動時,均沿路網(wǎng)運(yùn)動,通過在重要交通路口設(shè)置觀測點(diǎn),可捕捉高危人員動態(tài)軌跡。
由于軌跡數(shù)據(jù)格式和包含信息存在差異,需要對多源軌跡數(shù)據(jù)進(jìn)行融合,形成統(tǒng)一、序列化的行為鏈。根據(jù)動態(tài)軌跡標(biāo)定結(jié)果,將高危人員1個周期軌跡劃分為若干個子行為,將每個子行為按時間串聯(lián),形成動態(tài)行為鏈,動態(tài)行為鏈屬性見表2。其中,場所類型包括居民區(qū)、學(xué)校、經(jīng)營場所等9種。動態(tài)行為鏈如式(1)~(2)所示:
(1)
(2)
式中:behaviori表示高危人員子行為;behavior_chain表示高危人員行為鏈。
表2 動態(tài)行為鏈屬性Table 2 Attributes list of dynamic behavior chain
1.3.1 特征變量選擇
結(jié)合高危人員動態(tài)行為鏈及身份屬性信息,建立異常軌跡識別模型。首先,選取“身份屬性”、“年齡”、“性別”3種靜態(tài)屬性信息數(shù)據(jù),以及“場所類型”、“空間所屬關(guān)系”、“入訪時間”、“訪問頻率”4種動態(tài)軌跡信息數(shù)據(jù)作為異常軌跡分析特征變量。異常軌跡分析模型特征屬性見表3。
1)身份屬性(identity)由高危人員類型決定。高危人員類型包括但不限于“犯罪前科人員”、“涉毒人員”、“在逃人員”。身份屬性數(shù)據(jù)結(jié)構(gòu)為1*n維矩陣,n為高危人員類型總數(shù),1個人可能同時具有多種身份屬性特征。
2)場所類型(place_type)指高危人員入訪場所類型,場所類型有9種屬性,具體屬性見表2。為方便計算,利用獨(dú)熱編碼算法將特征轉(zhuǎn)換為1*9維特征向量。
3)高危人員與空間所屬關(guān)系(insider)指高危人員及其入訪空間之間是否有居住、工作及訪客等關(guān)系。該特征擁有2種特征屬性,用獨(dú)熱編碼轉(zhuǎn)換為1*2維特征向量,當(dāng)高危人員與入訪場所間有所屬關(guān)系(工作或居住),特征向量為[1,0]T;非所屬關(guān)系時(訪客),特征向量為[0,1]T。
4)高危人員年齡特征(age)擁用4種屬性,用1*4維獨(dú)熱編碼表示。
5)性別特征(gender)擁有2種屬性,用1*2維獨(dú)熱編碼表示。
表3 異常軌跡分析模型特征屬性表Table 3 Characteristic attributes in analysis model of abnormal trajectory
6)入訪時間特征(time)由高危人員進(jìn)入某場所起始時間與離開時間共同確定。把1 d劃分為48時段,每個時段時間跨度為0.5 h,將高危人員活動時間映射到48個時段,其中,停留在場所內(nèi)時段對應(yīng)屬性值為“1”,未在場所內(nèi)時段為“0”,最終形成1*48維入訪時間特征向量。
7)訪問頻率特征(frequency)指高危人員訪問某場所歷史頻率,通過專家系統(tǒng)將訪問頻率劃分為4個等級,見表4。采用獨(dú)熱編碼將訪問頻率轉(zhuǎn)換為1*4維特征向量。
表4 異常軌跡風(fēng)險分級表Table 4 Classification of abnormal trajectory risk
1.3.2 特征變量風(fēng)險權(quán)重設(shè)置
1)入訪場所對高危人員吸引力權(quán)重
利用專家系統(tǒng)和模糊綜合評價法確定不同類型場所對高危人員的吸引力,見表5。其中,場所類型包括居民小區(qū)、學(xué)校、經(jīng)營場所等9種,高危人員類型包括前科人員、涉毒人員、在逃人員等n種類型,可生成形成9*n維矩陣,矩陣中“1”代表場所對該類人員具有吸引力,“0”代表沒有吸引力。
表5 不同類型場所對高危人員的吸引力Table 5 Attractions of spaces with different types to high-risk personnel
2)入訪時間的風(fēng)險權(quán)重
我國北方某大型城市2006—2016年共發(fā)生44 831起入室盜竊案,歸一化后得到每個時間段案發(fā)頻率,并將其作為入訪時間風(fēng)險權(quán)重。
3)其他變量風(fēng)險權(quán)重
通過分析入室盜竊案件數(shù)據(jù)發(fā)現(xiàn),作案人員中男性占76.67%,女性占23.33%;年齡分布情況為:17~30歲,31~50歲,≤16歲和>50歲年齡段人員分別占41%,47%,2%和10%。通過分析作案地點(diǎn)與居住或工作地點(diǎn)間關(guān)系發(fā)現(xiàn),僅有20%入室盜竊案件選擇在居住或工作地點(diǎn)附近作案,而80%入室盜竊案件傾向于遠(yuǎn)離居住或工作地點(diǎn)作案。因此,根據(jù)盜竊案件中作案人員年齡、性別和案發(fā)地點(diǎn)數(shù)據(jù),設(shè)置模型中特征變量的權(quán)重,見表6。
1.3.3 建立異常軌跡分析模型
對異常軌跡分析模型特征變量標(biāo)準(zhǔn)化,根據(jù)各影響因素權(quán)重,建立異常軌跡分析模型,如式(3)~(4)所示:
attraction=w1×(place_typeT·identity)
(3)
(4)
式中:“·”代表矩陣乘法;Y表示軌跡風(fēng)險值;attraction表示場所對高危人員的吸引力;place_type,identity,time,frequency,age,gender,insider分別代表場所類型、身份屬性、入訪時間、訪問頻率、年齡、性別、空間所屬關(guān)系;w1,w2,…,w5,w6分別為入訪場所對高危人員吸引力權(quán)重、入訪時間風(fēng)險權(quán)重、入訪頻率風(fēng)險權(quán)重、年齡風(fēng)險權(quán)重、性別風(fēng)險權(quán)重和空間所屬關(guān)系風(fēng)險權(quán)重;ξ代表殘差項(xiàng)。將Y歸一化后如式(5)所示:
表6 異常軌跡分析模型特征權(quán)重Table 6 Weights of characteristics in analysis model of abnormal trajectory
(5)
式中:Y′是歸一化異常性得分;Y是原始異常性得分;Ymax和Ymin分別是異常性得分最大值和最小值。
本文參考城市公共安全風(fēng)險評估中事件發(fā)生可能性分級標(biāo)準(zhǔn)[18-19],結(jié)合實(shí)際需求,提出異常軌跡風(fēng)險分級標(biāo)準(zhǔn),見表6。由表6可知,異常風(fēng)險可劃分為4個等級,相鄰等級風(fēng)險值采用“等距”方法進(jìn)行劃分。
本文數(shù)據(jù)來源于Geolife動態(tài)軌跡數(shù)據(jù)集[20-21]中部分人員GPS軌跡數(shù)據(jù)。Geolife軌跡數(shù)據(jù)集是微軟亞洲研究院開源項(xiàng)目,包含182名志愿者2008年4月至2012年8月的GPS動態(tài)軌跡數(shù)據(jù),Geolife數(shù)據(jù)屬性見表7。隨機(jī)選取3名人員軌跡數(shù)據(jù)進(jìn)行試驗(yàn),3名人員在原數(shù)據(jù)集中編號分別為36、96、101,分別代表人員a,b,c,其動態(tài)軌跡空間分布如圖2所示。假設(shè)3名人員為社區(qū)治安高危人員類型中“盜竊前科人員”,日?;顒訁^(qū)域均在某社區(qū)內(nèi),同時存在部分異常動態(tài)軌跡,滿足研究需求,模型預(yù)警閾值為0.5。
表7 Geolife數(shù)據(jù)集屬性Table 7 Attributes of Geolife dataset
采用基于聚類算法和基于觀測點(diǎn)法對3名高危人員動態(tài)軌跡進(jìn)行標(biāo)定。其中,基于聚類算法標(biāo)定結(jié)果如圖2所示,每個子圖中x,y軸分別為經(jīng)度和緯度,z軸為時間,每個點(diǎn)代表聚類所得駐留點(diǎn)。
圖2 基于聚類算法的動態(tài)軌跡標(biāo)定Fig.2 Calibration results of dynamic trajectories based on clustering algorithm
結(jié)合高危人員動態(tài)軌跡信息和靜態(tài)屬性信息,建立異常軌跡分析模型,并對3名人員動態(tài)軌跡進(jìn)行異常分析。以高危人員b為例,其入訪QH異常軌跡分析過程如圖3所示。圖3(a)~(e)分別代表每次入訪該場所時5種特征信息風(fēng)險值(入訪場所對高危人員吸引力、空間所屬關(guān)系風(fēng)險值、高危人員性別風(fēng)險值、入訪時間風(fēng)險值、入訪頻次風(fēng)險值),圖3(f)代表高危人員每次入訪QH軌跡風(fēng)險值。
空間所屬關(guān)系、入訪場所對高危人員吸引力由高危人員身份屬性與入訪地點(diǎn)類型共同決定。若高危人員與入訪地點(diǎn)存在居住或工作關(guān)系,空間所屬關(guān)系風(fēng)險值較小;若兩者屬訪客關(guān)系,則空間關(guān)系風(fēng)險值較大。人員b身份屬性特征為“盜竊前科人員”,入訪場所QH,對社區(qū)治安高危人員存在吸引力,即人員b入訪QH行為軌跡存在盜竊風(fēng)險,風(fēng)險值為“1”。
圖3 高危人員b入訪QH異常軌跡分析Fig.3 Analysis process of abnormal trajectory when high-risk person b visiting QH
入訪時間風(fēng)險值與入訪頻率風(fēng)險值動態(tài)變化如圖3(d)~(e)所示,不同時間入訪同一地點(diǎn)風(fēng)險值不同,在入訪次數(shù)為20,50,70,85附近均出現(xiàn)“波峰”;行為異常性風(fēng)險值僅在n為15,50附近出現(xiàn)“波峰”,如圖3(f)所示。前者風(fēng)險值高于后者,原因是隨入訪頻次的增高,入訪行為頻次風(fēng)險值先增高后衰減,當(dāng)入訪頻次增高到一定程度,軌跡總體風(fēng)險值仍較低。
本文利用異常軌跡分析模型,對高危人員b入訪其他地點(diǎn)的軌跡進(jìn)行分析,結(jié)果如圖4所示。圖4(a)~(d)分別代表人員b入訪QH(作為對照)、BD、BT和BH。由圖4可知,第12~14次入訪BD、第12次入訪BT以及第6次入訪BH時,異常軌跡風(fēng)險值均超過預(yù)警閾值,屬于“極高風(fēng)險”軌跡,應(yīng)對人員行為進(jìn)行干預(yù)。
圖4 高危人員b入訪QH、BD、BT和BH的異常軌跡風(fēng)險值Fig.4 Analysis results of abnormal trajectories when high-risk person b visiting QH、BD、BT and BH
異常軌跡分析模型識別3名人員異常軌跡結(jié)果見表8。3名人員異常軌跡(高風(fēng)險以上)總數(shù)分別為11,10,12次,平均占比2.93%。
表8 異常軌跡分析模型預(yù)警效果Table 8 Early-warning effect of abnormal trajectoriesby analysis model of abnormal trajectory
1)動態(tài)軌跡標(biāo)定與序列化建模,可以從GPS軌跡數(shù)據(jù)中提取人員駐留點(diǎn),構(gòu)建動態(tài)行為鏈。
2)通過建立異常軌跡分析模型,計算人員軌跡異常風(fēng)險值,并對高風(fēng)險及以上軌跡進(jìn)行預(yù)警。模型對3名人員異常軌跡平均預(yù)警次數(shù)為11次,占軌跡總數(shù)2.93%,可用于高危人員管控,預(yù)期可為社區(qū)治安防控工作提供技術(shù)支持。
中國安全生產(chǎn)科學(xué)技術(shù)2021年4期