国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

犯罪與網(wǎng)絡行為特征的映射研究

2022-07-21 06:31陸育卉
關(guān)鍵詞:時空社團節(jié)點

陸育卉, 趙 海, 劉 曉, 施 瀚

(1. 東北大學 計算機科學與工程學院, 遼寧 沈陽 110169; 2. 遼寧省葫蘆島市人民檢察院, 遼寧 葫蘆島 125000; 3. 北京百分點科技集團股份有限公司, 北京 100089)

復雜網(wǎng)絡理論研究體系是理解復雜系統(tǒng)和探究事件發(fā)展規(guī)律的一種動態(tài)方法.犯罪數(shù)據(jù)關(guān)系網(wǎng)絡,簡稱為“犯罪網(wǎng)絡”(criminal network),作為復雜網(wǎng)絡的特例,對其開展的研究起源于美國的911恐怖襲擊事件.為了預防犯罪再次發(fā)生,學者們開始更多地運用科技手段對犯罪數(shù)據(jù)進行分析.相關(guān)部門開始投入更多資源收集整理各種犯罪數(shù)據(jù)以作研究支撐,一些學者開始用網(wǎng)絡分析方法對各種犯罪組織的結(jié)構(gòu)進行構(gòu)建.比如在911恐怖事件發(fā)生后,美國學者就利用社會網(wǎng)絡分析方法來甄別該犯罪組織的核心成員[1];Jonathan基于前者收集的數(shù)據(jù),通過對比刪除成員前后對犯罪組織結(jié)構(gòu)造成的影響,開展一系列動力學研究;黃慧霞[2]分析了我國近年來邊境販毒組織網(wǎng)絡結(jié)構(gòu)的集權(quán)程度、角色位置、網(wǎng)絡彈性等特點.

通過學者們對各類型犯罪的大量研究,時空聚集特性十分顯著[3].從空間角度統(tǒng)計,犯罪活動通常發(fā)生在一個可識別的范圍里;從時間意義上,犯罪發(fā)生存在高發(fā)的時間點或時間段.在傳統(tǒng)的犯罪網(wǎng)絡研究中,時間和空間往往作為兩個無關(guān)聯(lián)的維度被單獨分析,從而忽視了時空相互作用影響可能增加的犯罪風險問題.近年來,立足于時間和空間存在相互影響的角度,人們開始在分析和挖掘犯罪活動的組織模式中得出一些新的結(jié)論[4-5].Contreras等[6]提出了時空立方體的概念,將時間軸與水平地圖垂直構(gòu)建三維空間,該構(gòu)造方法能更直觀地觀測到測試案例在時空上的集合特點和變遷規(guī)律.日本學者利用時空立方體概念定位了京都2003—2004年的盜竊案件,可以證實該方法能更好地幫助研究者識別出犯罪熱點區(qū)域,清晰地解讀了其隨時間的變化而發(fā)生轉(zhuǎn)移的情況[7].

在我國也有諸多研究團隊開始從犯罪地理、犯罪時空的角度進行相關(guān)研究.以中國人民公安大學為代表,在對犯罪熱點判定、成因剖析、熱點轉(zhuǎn)移、預測等方面有了諸多研究成果.在一線部門,各地公安機關(guān)相繼開展了以“智慧警務”為引領(lǐng)的信息項目,收集利用海量警務數(shù)據(jù),通過挖掘、處理,優(yōu)化警力布置,懲治預防犯罪[8].

本文根據(jù)犯罪的時空聚集特性,定義了時空影響域概念,提出了一種新的犯罪網(wǎng)絡構(gòu)造方法,利用復雜網(wǎng)絡手段,對犯罪網(wǎng)絡建模與拓撲特征分析方面做一些深入探討,為犯罪大數(shù)據(jù)的科學分析提供更多參考.

1 犯罪網(wǎng)絡的構(gòu)造

1.1 網(wǎng)絡的時空特征

根據(jù)犯罪行為學和環(huán)境犯罪學等理論已經(jīng)發(fā)現(xiàn),一旦一個地點成為犯罪的目標,附近的地點面臨著在短時間內(nèi)經(jīng)歷同樣事件的高風險.犯罪學有限空間理論表明,犯罪事件對周邊產(chǎn)生的時空影響是在極值范圍內(nèi)的.那么,本文將該時空影響范圍定義為時空影響域[9-10].某區(qū)域發(fā)生一起犯罪案件,該案件的時空影響域指的就是其造成持續(xù)影響的時間窗口及其對周邊地理空間的影響范圍.

文獻[11]借用流行病學的統(tǒng)計方法,假設犯罪熱點在短期內(nèi)不發(fā)生變化,將犯罪行為建模為一系列的隨機事件,分析該事件影響研究目標受侵犯的風險概率.

以盜竊案舉例,對于i地點的盜竊事件,最簡單的假設是它們是隨機發(fā)生的,定義一個隨機過程,其中每起盜竊事件都是獨立于所有其他事件的.顯然,同一地點兩起盜竊案件不能同時發(fā)生,因為它們會被簡單地認為是一起事件.從數(shù)學上看,這種現(xiàn)象可以建模為泊松過程,在t到t+δt時間間隔內(nèi)發(fā)生一次盜竊的概率:

P1(δt)=e-λδtλδt.

(1)

由一般泊松分布得出發(fā)生k次盜竊的概率:

(2)

那么在一個時間區(qū)間δt內(nèi)沒有犯罪發(fā)生的概率:

P0(δt)=e-λδt.

(3)

現(xiàn)在考慮i地點在T時刻發(fā)生第一次犯罪事件,從參考點t=0時開始計算,在0到τ時間內(nèi)無犯罪事件發(fā)生,那么T>τ,因此,

P(T>τ)=P0(τ)=e-λτ.

(4)

擴展可以得出τ到τ+δt時間發(fā)生犯罪的概率:

P(ττ)-P(T<τ+δt)=

e-λτ(1-e-λδt).

(5)

如果把式(5)除以δt,然后取極值δt→0,可以得出時間間隔為τ的標準泊松過程概率密度函數(shù):

P(τ)=λe-λτ.

(6)

空間影響域的概率推導方式也如此.

用(Si,ti)表示犯罪事件發(fā)生的時間和地點,令Tn={t1,t2,…,tn},Dn={S1,S2,…,Sn},量化犯罪重復發(fā)生的典型時間尺度和空間影響范圍.時空影響域的模型表達式如式(7)所示:

ψn(Sn+1,tn+1|Dn,Tn,χn)=

(7)

其中:tn+1和Sn+1為下一次即將發(fā)生的犯罪事件的發(fā)生時間和空間位置;v(dSn+1)表示區(qū)域dSn+1取極限;N(dSn+1,dtn+1)表示空間面增加dSn+1、時間增加dtn+1時該區(qū)域發(fā)生的犯罪數(shù)量.

該模型將犯罪事件的時間屬性和空間屬性抽象出來,通過對二者采用數(shù)學方法進行建模計算,以準確評估犯罪事件預期發(fā)生概率.不同的犯罪類型,其時空影響域的極值不同,相比于個案發(fā)生,團伙犯罪向周圍空間擴散的能力更強,則在空間上產(chǎn)生的影響范圍更大,而連續(xù)犯罪持續(xù)的時間影響更長[12].而對于相等的未來受侵犯風險,不同的犯罪類型也表現(xiàn)出不同的時空影響域值,犯罪時空密度大的犯罪類型時空影響域值偏小[13].

1.2 犯罪網(wǎng)絡模型

每次犯罪事件的發(fā)生都會對周圍的時空造成影響,犯罪事件發(fā)生后該區(qū)域會形成以該事件為中心、空間影響域為半徑的圓形影響區(qū)域S,T為該事件造成持續(xù)影響時間影響窗口.每次犯罪事件發(fā)生產(chǎn)生的時空影響域U(T,S),未來在該區(qū)域內(nèi)發(fā)生的同類型犯罪均可看作受本次事件所影響,而本次犯罪事件與該影響區(qū)域外發(fā)生的犯罪則沒有直接關(guān)系.對于任意兩節(jié)點i∈V和j∈V,設Ui(Ti,Si)為節(jié)點i的時空影響域,那么當j∈Ui(Ti,Si),即j既在i的時間窗口中,又在其空間影響范圍內(nèi),則存在一條由i到j的邊(i,j).

圖1為構(gòu)建犯罪網(wǎng)絡過程的示例,根據(jù)式(7)的統(tǒng)計結(jié)果,圖1a中的圓形區(qū)域為犯罪事件發(fā)生后形成的空間影響域,圖1b中犯罪案件發(fā)生時間順序為A到I,假設該類犯罪案件時間窗口為3個單位.2時刻B處發(fā)生的犯罪案件雖然在空間影響域上覆蓋至D,但時間上未影響到時刻5發(fā)生的事件D,因此無連邊;F在E的空間影響域內(nèi),且發(fā)生在E產(chǎn)生的時間窗口內(nèi),因此產(chǎn)生一條由E指向F的邊,其他節(jié)點的連邊關(guān)系以此類推.那么示例網(wǎng)絡拓撲如圖1c所示.

圖1 網(wǎng)絡構(gòu)建示意圖

定義犯罪網(wǎng)絡拓撲如下:

定義1設圖G=(V,E)是由|V|=n個節(jié)點和|E|=e條邊組成的一個有向圖,對于任意2個節(jié)點i和j,若j∈U(Ti,Si),則存在一條邊(i,j)使i指向j,其中U(Ti,Si)為節(jié)點i的時空影響域.

2 數(shù)據(jù)結(jié)構(gòu)設計

芝加哥位于美國伊利諾伊州東北部的庫克縣境內(nèi),密歇根湖西岸,地勢平緩,是美國第三大城市,也是世界的國際金融中心之一.城市東西寬約24公里、南北長約40公里,面積約為600平方公里,市區(qū)東部由北到南為湖畔區(qū),居民人數(shù)占全市人口的三分之一.南區(qū)是芝加哥大學、芝加哥港所在地,西區(qū)以眾多的景區(qū)和文化、宗教圣地著稱.

本文運用芝加哥市警察局公民執(zhí)法分析和報告系統(tǒng)公開發(fā)表的犯罪數(shù)據(jù)[14]進行分析.該數(shù)據(jù)集包括了2012—2017年警察局接報的所有犯罪事件,總量為783萬余條,數(shù)據(jù)結(jié)構(gòu)包括案發(fā)日期、案由、案情描述、經(jīng)緯度坐標等22個字段.其中案由字段包括盜竊、毆打、刑事毀壞、非法侵入、阻礙執(zhí)法等共35種罪名.

本文選取案發(fā)頻繁常見的,案由為“Theft,Robbery,Narcotics”的三種罪名分別組成盜竊、搶劫、毒品犯罪類型的網(wǎng)絡,并剔除了經(jīng)緯度和時間為空或異常等無效數(shù)據(jù).Theft即一般盜竊,總量為1 543 062條.在CLEAR系統(tǒng)中,一般盜竊犯罪指的是不包括入室盜竊犯罪和機動車盜竊犯罪的其他一切盜竊行為.搶劫罪(Robbery)總量為292 536條,毒品犯罪(Narcotics)總量為849 081條.通過Gephi工具,對每條數(shù)據(jù)通過經(jīng)緯度實現(xiàn)自動定位落點.

3 “芝加哥”網(wǎng)絡實例

根據(jù)式(7)模型,分別提取盜竊、搶劫、毒品犯罪事件時間屬性(日期)和空間屬性(經(jīng)緯度),進行建網(wǎng)分析.本文設置未來受侵犯危險概率為0.6(根據(jù)式(6)),分別計算三種犯罪類型的時空影響域值.

因空間影響范圍接近泊松分布,空間影響域取值為其峰值且近似取整.時間窗口為達到未來受侵犯危險概率值時向上取整.不同犯罪類型的空間影響域值及時間窗口如表1所示.

本文利用2017年數(shù)據(jù)將三種類型犯罪分別組網(wǎng),其犯罪網(wǎng)絡拓撲的節(jié)點位置是基于真實地理坐標確定并標注的,明確的位置信息會給研究帶來幫助,如圖2所示.直觀上來看,三種拓撲均存在明顯的熱點聚集現(xiàn)象,在熱點內(nèi)部連接緊密,相較外部區(qū)域連接則較為稀疏.這說明犯罪網(wǎng)絡中存在著那些彼此之間影響非常大的節(jié)點,同時也暗示了這些熱點區(qū)域可能存在活躍的犯罪活動.在某些區(qū)域上節(jié)點高度聚集,具體的網(wǎng)絡拓撲特征分析如下文.

表1 不同犯罪類型的時空影響域值

圖2 地理坐標下基于時空影響域的多類型犯罪網(wǎng)絡

3.1 犯罪對環(huán)境影響度與無標度特征映射關(guān)系

網(wǎng)絡的度分布符合冪律分布即為無標度網(wǎng)絡,即大多數(shù)節(jié)點的度值很低,只有少數(shù)節(jié)點擁有高度值.隨機網(wǎng)絡相對于規(guī)則網(wǎng)絡最重要的區(qū)別就在于沒有該特征[15].由于本文提出了一種新的犯罪網(wǎng)絡構(gòu)造方法,因此有必要驗證使用本文方法得到的犯罪網(wǎng)絡是否具有無標度特征.

定義2對于冪律分布有p(k)~k-α,其中p(k)是度值為k的節(jié)點出現(xiàn)的概率,α為冪指數(shù).度分布的冪律現(xiàn)象愈明顯,網(wǎng)絡愈呈現(xiàn)無標度特性,網(wǎng)絡的魯棒性就愈強[16].雙對數(shù)坐標下不同犯罪類型節(jié)點度分布頻度如圖3所示.圖中直線為冪律的擬合結(jié)果,具體數(shù)值參見表2.

在犯罪網(wǎng)絡拓撲中,一個節(jié)點的入度值大小代表著周圍區(qū)域發(fā)生的犯罪對本節(jié)點產(chǎn)生的外部環(huán)境壓力大小,入度值越大,則該節(jié)點面臨的安全環(huán)境壓力越大;而出度值大小代表著該節(jié)點對周邊環(huán)境產(chǎn)生的壓力大小,出度值越大說明犯罪發(fā)生對周圍安全環(huán)境的壓力越大.

表2 2017年不同犯罪類型網(wǎng)絡信息

實驗表明,該網(wǎng)絡在不同犯罪類型、不同網(wǎng)絡規(guī)模均表現(xiàn)出穩(wěn)定的無標度特征,即大部分犯罪事件的產(chǎn)生對周邊環(huán)境的影響較小,而少部分犯罪事件卻產(chǎn)生了巨大的影響.該特性的映射關(guān)系可以作為用復雜網(wǎng)絡的理論和方法研究犯罪關(guān)系網(wǎng)絡的依據(jù).

圖3 雙對數(shù)坐標下節(jié)點的概率度分布

3.2 犯罪聚集特性與網(wǎng)絡聚集特征映射關(guān)系

定義3節(jié)點i的聚集系數(shù)Ci為該節(jié)點與其所有鄰居之間的連接數(shù)與網(wǎng)絡中最大連接數(shù)的比值:

(8)

其中:Ei是節(jié)點i與其鄰居節(jié)點之間的連接邊數(shù);ki是節(jié)點i鄰居節(jié)點的數(shù)量.聚集系數(shù)是用來描述一個圖中節(jié)點之間集結(jié)成團的程度系數(shù).網(wǎng)絡的平均聚集系數(shù)為所有節(jié)點聚集系數(shù)的平均值:

(9)

設兩個節(jié)點的最短路徑上的邊數(shù)為di,j,網(wǎng)絡的平均路徑長度D定義為

(10)

D即為任意2個節(jié)點最短路徑長度的平均值.它是評價網(wǎng)絡轉(zhuǎn)發(fā)通信能力的重要參數(shù),較短的平均路徑長度使網(wǎng)絡具備更快的傳輸速度.

表3為2017年不同犯罪類型網(wǎng)絡的參數(shù).通過表3可以看出,無論何種犯罪類型的網(wǎng)絡,其平均聚集系數(shù)都遠大于同等規(guī)模下隨機網(wǎng)絡的平均聚集系數(shù),表現(xiàn)出顯著的聚集性.另一方面,三種犯罪網(wǎng)絡的平均路徑長度相比其網(wǎng)絡規(guī)模小得多,同該網(wǎng)絡規(guī)模的對數(shù)相接近.可見三種類型的犯罪網(wǎng)絡均具有明顯的小世界特征.這一結(jié)果說明同類犯罪事件間存在著緊密聯(lián)系,具有非獨立性,該結(jié)論為預測節(jié)點間關(guān)系提供了基礎.

表3 2017年不同犯罪類型網(wǎng)絡的參數(shù)

如圖2所示,不同類型的犯罪網(wǎng)絡形成的聚集區(qū)域各有不同.盜竊案高發(fā)區(qū)域集中在芝加哥市的東部,處于城市核心區(qū),擁有眾多景點,聚集著最著名的高層購物中心、百貨商場、高級餐廳.每天如織的人潮和貨物的進出,繁榮了經(jīng)濟的同時也帶來了大量的竊案.搶劫犯罪多集中在西部和南部,而毒品犯罪非常明顯地集中在城市西部.

根據(jù)對本文數(shù)據(jù)集中社區(qū)信息的統(tǒng)計,西北部白人為主的社區(qū)犯罪率最低,城南、城西黑人居民超過90%的社區(qū)的犯罪率最高.結(jié)合芝加哥市非裔美國人人口分布圖(圖4),該圖與圖2中搶劫犯罪網(wǎng)絡和毒品犯罪網(wǎng)絡的熱點區(qū)域高度重合,可見這兩種犯罪與種族密切相關(guān).盡管目前芝加哥白人、拉丁裔和黑人所占人口比例基本相同,但85%的搶劫、毒品案卻都發(fā)生在黑人貧困區(qū).可見人口結(jié)構(gòu)、社會聯(lián)系、集體效能等社會經(jīng)濟要素對犯罪現(xiàn)象及其空間格局具有直接影響.

3.3 犯罪社團屬性與社團特征分析

為準確評估犯罪網(wǎng)絡社團劃分情況,將模塊度作為一項重要衡量指標,通過將社團劃分結(jié)果與對應零模型橫向?qū)Ρ?進而度量和評價劃分質(zhì)量.假設對于某個特定的真實網(wǎng)絡,存在一種劃分社團方式,則劃分后全部社團內(nèi)的邊數(shù)總和可用式(11)計算:

(11)

其中:A=(aij)指的是網(wǎng)絡的鄰接矩陣;Ci為節(jié)點i在網(wǎng)絡中所屬的社團;Cj為節(jié)點j所在的社團.當δ取值為1說明這兩個節(jié)點同屬一個社團,否則δ為0.

對于一個相同規(guī)模大小的零模型,如果用相同的社團劃分,那么所有社團內(nèi)部的邊數(shù)總和的期望值為

(12)

其中,pij是零模型中節(jié)點i與節(jié)點j之間的連邊數(shù)的期望值.

一個網(wǎng)絡的模塊度就定義為該網(wǎng)絡的社團內(nèi)部邊數(shù)與相應的零模型的社團內(nèi)部邊數(shù)之差占整個網(wǎng)絡邊數(shù)M的比例,即

(13)

模塊度作為網(wǎng)絡社團劃分的定量分析方式,可以直觀反映劃分質(zhì)量,其取值主要由網(wǎng)絡中眾多節(jié)點的社區(qū)分配情況決定,網(wǎng)絡劃分的質(zhì)量越高,強度越強,該值越趨近于1.

圖4 芝加哥市非裔美國人人口分布

本文在模塊度概念的基礎上,結(jié)合文獻[17]中社團發(fā)現(xiàn)算法,對三種犯罪網(wǎng)絡的社團分布進行了劃分,并在此基礎上進一步計算了模塊化程度.圖5給出了各類犯罪網(wǎng)絡的社團劃分情況,以及其最大連通子圖,其中的不同灰度代表了不同的社團劃分.

圖5 三種犯罪網(wǎng)絡社團劃分可視化圖

在比對圖中不同犯罪網(wǎng)絡的模塊劃分和模塊度之后(表4)發(fā)現(xiàn),網(wǎng)絡之間社團化的程度有著顯著的區(qū)別,其中模塊度最高的是一般盜竊,其次為搶劫,最低的為毒品犯罪.鑒于犯罪情況在城市不同功能區(qū)域存在地理差異性,網(wǎng)絡中社團程度高度相關(guān)于其所在地理位置.對同一個社團中的不同節(jié)點來說,或者其空間距離相對接近,或者它們處于相同的城市區(qū)域;同樣,如果網(wǎng)絡中存在規(guī)模較大的社團,也意味著該社團對應的地區(qū)有著較高的犯罪率.

表4 三種犯罪網(wǎng)絡社團劃分結(jié)果

5 結(jié) 論

1) 根據(jù)犯罪的時空聚集特性和有限空間理論提出了犯罪網(wǎng)絡的空間影響域模型,并由該模型構(gòu)建了芝加哥盜竊網(wǎng)絡、搶劫網(wǎng)絡和毒品交易網(wǎng)絡,進而分析其網(wǎng)絡特性與網(wǎng)絡行為特征的相關(guān)關(guān)系.

2) 三種犯罪網(wǎng)絡的度分布均服從冪律特性,其冪律值為1~2;節(jié)點的出度與入度呈現(xiàn)正相關(guān)性.其入度值越大表明該事件周邊面臨的安全環(huán)境壓力越大.出度值越大說明該犯罪發(fā)生對周圍安全環(huán)境造成的壓力越大;

3) 三種犯罪網(wǎng)絡均具有局部高聚集性.大部分為低犯罪率區(qū),部分為高犯罪率區(qū),盜竊行為多發(fā)在中部商業(yè)發(fā)達的地區(qū);搶劫行為多發(fā)在西部和南部;毒品犯罪主要發(fā)生在西部地區(qū).

4) 不同的犯罪類型體現(xiàn)了不同的聚集特點.人口結(jié)構(gòu)、社會聯(lián)系、集體效能等社會經(jīng)濟要素對犯罪現(xiàn)象及其空間格局具有直接作用.

5) 三種犯罪網(wǎng)絡社團化的程度均很明顯,其中盜竊的模塊度最高,犯罪網(wǎng)絡中的社團程度很大程度上與地理位置相關(guān),網(wǎng)絡中較大規(guī)模的社團對應著實際犯罪活動較為頻繁的地區(qū).

猜你喜歡
時空社團節(jié)點
基于RSSI測距的最大似然估計的節(jié)點定位算法
跨越時空的相遇
分區(qū)域的樹型多鏈的無線傳感器網(wǎng)絡路由算法
基于圖連通支配集的子圖匹配優(yōu)化算法
基于點權(quán)的混合K-shell關(guān)鍵節(jié)點識別方法
玩一次時空大“穿越”
“多彩”書法社團展示
繽紛社團,綻放精彩
時空守護者之宇宙空間站
時空之門