唐德權(quán),史偉奇,凌志剛(.湖南警察學(xué)院 信息技術(shù)(網(wǎng)監(jiān))系,湖南 長(zhǎng)沙 4038;.湖南大學(xué) 電氣與信息工程學(xué)院,湖南 長(zhǎng)沙 4008)
基于共犯網(wǎng)絡(luò)結(jié)構(gòu)的有組織犯罪集團(tuán)挖掘方法*
唐德權(quán)1,史偉奇1,凌志剛2
(1.湖南警察學(xué)院信息技術(shù)(網(wǎng)監(jiān))系,湖南長(zhǎng)沙410138;2.湖南大學(xué)電氣與信息工程學(xué)院,湖南長(zhǎng)沙410082)
有組織犯罪集團(tuán)挖掘是目前數(shù)據(jù)挖掘技術(shù)研究的熱點(diǎn),利用共犯網(wǎng)絡(luò)結(jié)構(gòu)提出一種新的有組織犯罪集團(tuán)挖掘的方法。該方法能從大型真實(shí)犯罪數(shù)據(jù)集獲取有組織犯罪集團(tuán)信息,提高了有組織犯罪集團(tuán)檢測(cè)效率。實(shí)驗(yàn)結(jié)果表明,該方法能分析出有組織犯罪集團(tuán)特征演變軌跡,對(duì)挖掘有組織犯罪集團(tuán)證據(jù)可行、有效。
數(shù)據(jù)挖掘;共犯網(wǎng)絡(luò);有組織犯罪集團(tuán);檢測(cè)效率
共犯網(wǎng)絡(luò)結(jié)構(gòu)分析是理解有組織犯罪成因和干預(yù)策略影響的關(guān)鍵,即如何在共犯網(wǎng)絡(luò)結(jié)構(gòu)基礎(chǔ)上對(duì)有組織犯罪集團(tuán)證據(jù)進(jìn)行挖掘[1]。本文抓住有組織犯罪集團(tuán)檢測(cè)計(jì)算方法的關(guān)鍵——共犯網(wǎng)絡(luò),利用小團(tuán)體的擴(kuò)展?jié)B透法匹配犯罪集團(tuán)中的某個(gè)單元,提出了共犯網(wǎng)絡(luò)分析視角(Co-offending NetworksAnalysisPerspective,CNAP)算法,并在大型真實(shí)犯罪數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,在共犯網(wǎng)絡(luò)結(jié)構(gòu)分析上,該方法極大地提高了有組織犯罪分析計(jì)算速度,而且保持了較高的有效性。
定義1罪犯組
定義2有組織犯罪集團(tuán)
2.1罪犯組檢測(cè)
該方法的第一步是建立K-結(jié)點(diǎn)的罪犯組網(wǎng)絡(luò),彼此共享至少k-1結(jié)點(diǎn)的相鄰K-結(jié)點(diǎn)網(wǎng)絡(luò)[3]。假設(shè)k=3,因?yàn)橛薪M織犯罪集團(tuán)至少有3個(gè)成員,每個(gè)組可能屬于不同的獨(dú)立社區(qū)但有共同交叉結(jié)點(diǎn),因此該罪犯組既有重疊的成員還有普通成員。將這些成員分配到每個(gè)罪犯組形成內(nèi)核 K(Ci),內(nèi)核是一個(gè)犯罪集團(tuán)主要的成員,是完全參與該犯罪組活動(dòng)。第二步,將鄰居結(jié)點(diǎn)直接連接到內(nèi)核添加到罪犯組,這些結(jié)點(diǎn)被稱為外圍,用P(Ci)表示。
2.2有組織犯罪集團(tuán)檢測(cè)
犯罪活動(dòng)和犯罪行為是理解犯罪集團(tuán)組織結(jié)構(gòu)兩個(gè)關(guān)鍵特征[4]。下面提出兩個(gè)操作算子對(duì)犯罪活動(dòng)和行為進(jìn)行計(jì)算。
犯罪集團(tuán)Ci在時(shí)間t犯罪行為表示為Φ(Ci),定義為:
其中,φik表示某個(gè)罪犯ik的嚴(yán)重程度,即犯罪集團(tuán)Ci成員在t時(shí)刻的犯罪行為。
設(shè) i1,i2,…,in是 Ci在時(shí)間 t的犯罪成員,犯罪集團(tuán)C在時(shí)間t1到時(shí)間 t2的活動(dòng)記為θt1 ,t2(Ci),計(jì)算公式如下:
其中,|Rt1(Ci)|和|Rt2(Ci)|分別表示犯罪集團(tuán)Ci在時(shí)刻t1和時(shí)刻t2共犯次數(shù)。
為了確定發(fā)現(xiàn)罪犯組是否被認(rèn)為是有組織犯罪集團(tuán),必須同時(shí)考慮犯罪活動(dòng)和犯罪行為,定義兩個(gè)閾值:α表示犯罪活動(dòng)和β表示犯罪行為。如果θ(Ci)>α,那么給定的犯罪集團(tuán)C就是活動(dòng)的犯罪集團(tuán)A;如果φ(Ci)>β,那么C就是一個(gè)嚴(yán)重犯罪集團(tuán)。
2.3有組織犯罪集團(tuán)演化模型
這個(gè)模型需要確定原來的某個(gè)犯罪集團(tuán)已經(jīng)演變當(dāng)前的某個(gè)犯罪集團(tuán)。一個(gè)犯罪集團(tuán)的一個(gè)周期會(huì)出現(xiàn)5個(gè)階段:產(chǎn)生、分裂、合并、出現(xiàn)和終止[5]。為此,引入一個(gè)匹配的函數(shù)F:其中,γ表示一個(gè)犯罪組織集合,2γ表示γ的冪集。給定一個(gè)有組織犯罪集團(tuán)Oit和有組織犯罪集團(tuán)集合γt+1,如果F(Oit,g)得出集團(tuán)Oit+1與Oit有最大的交集超過給定的閾值λ,形式定義如下:
這里兩個(gè)有組織犯罪集團(tuán) O,O′∈γ,P(O,O′)定義如下:
算法1有組織犯罪集團(tuán)檢測(cè)
輸入:
(1)犯罪事件數(shù)據(jù)集;
(2)Crime seriousness index(犯罪程度索引);
(3)犯罪活動(dòng)和犯罪行為的閾值:α,β。
(1)/*數(shù)據(jù)準(zhǔn)備*/;
(2)掃描在[t1,t2]時(shí)間之間每個(gè)犯罪事件集;
(3)抽取共犯網(wǎng)絡(luò);
(6)計(jì)算組織犯罪活動(dòng)閾值θt1,t2i;
(7)計(jì)算組織犯罪行為閾值Φit;
(8)對(duì)滿足閾值的犯罪組織標(biāo)識(shí)為有可能組織犯罪集團(tuán);
(9)對(duì)每個(gè)犯罪組織候選集Oit,進(jìn)行第(10)步;
(10)評(píng)估出犯罪組織物質(zhì)利益;
3.1犯罪數(shù)據(jù)集
為了驗(yàn)證方法的有效性,實(shí)驗(yàn)數(shù)據(jù)采用加拿大不列顛哥倫比亞省arrest-data犯罪數(shù)據(jù)集[6],該數(shù)據(jù)集記錄了從2001-8-1至2006-7-31共5年的犯罪數(shù)據(jù)。
圖1顯示了活躍罪犯組的數(shù)量隨著第1、2、3、4這4段時(shí)間觀察到的區(qū)別。值得注意的是,隨著時(shí)間的推移,活躍犯罪組的數(shù)量急劇下降。在a值較高時(shí)從一個(gè)時(shí)間段到下一個(gè)時(shí)間段連續(xù)活動(dòng)明顯可見,這一發(fā)現(xiàn)印證了犯罪組織的短期合作的理論[7]。
圖1 4個(gè)時(shí)間段連續(xù)活躍罪犯組數(shù)量
3.2罪犯組演變
因?yàn)椴恢赖谝徊揭郧暗臍v史時(shí)間和最后一次未來時(shí)間,在有限的可觀測(cè)時(shí)間跨度里對(duì)罪犯組的整個(gè)生命周期進(jìn)行量化工作非常困難[8]。
在5個(gè)不同時(shí)間段各罪犯組的演化軌跡統(tǒng)計(jì)如圖2所示。匹配函數(shù)的閾值0.3適用于考慮幸存一組,值大于0.2和小于0.3分別適用于分裂和合并,組匹配閾值小于0.2被認(rèn)為是終止罪犯組??傮w而言(平均而言),所有罪犯群體大約14%幸存,但分裂和合并事件很少發(fā)生,不到犯罪組的1%。大約88%的罪犯組被認(rèn)為是終止了,因?yàn)樵诮酉聛淼臅r(shí)間并沒有觀察到他們的活動(dòng),所有組織中90%是新出現(xiàn)的犯罪組。
圖2 罪犯組演變軌跡
為提高有組織犯罪集團(tuán)證據(jù)計(jì)算效率,本文提出基于共犯網(wǎng)絡(luò)結(jié)構(gòu)分析技術(shù)。實(shí)驗(yàn)結(jié)果表明,雖然罪犯在犯罪集團(tuán)中的合作是連續(xù)的,但大多數(shù)犯罪組織的活動(dòng)不會(huì)持續(xù)很長(zhǎng)時(shí)間。另外,活躍的犯罪組織通常有更多的外圍,相比之下嚴(yán)重的犯罪組織外圍成員偏少,這一發(fā)現(xiàn)表明,嚴(yán)重犯罪組織的運(yùn)作主要來自他們的內(nèi)核成員。在未來的工作中將探索有組織犯罪的組織結(jié)構(gòu),區(qū)分層次組織和分散組織,并分析這些結(jié)構(gòu)演變軌跡。
[1]MCGLOIN J M,NGUYEN H.The importance of studying co-offending networks for criminological theory and policy[C]. Proceedings of Third Annual Illicit Networks Workshop,Montréal,Québec,October 2011.
[2]KIM M S,HAN J W.A particle-and-density based evolutionary clustering method for dynamic networks[J].Proceedings of Very Large Data Base Endowment,2009,2(1):622-633.
[8]KIM K,MCKAY R,MOON B R.Multiobjective evolutionary algorithms fordynamic socialnetwork clustering[C]. Proceedings ofthe 12th Conf.Genetic and Evolutionary Computation,2010:1179-1186.
[3]SATULURI V,PARTHASARATHY S.Scalable graph clustering using stochastic flows:applications to community discovery[C].KDD,Paris,F(xiàn)rance,2009:737-746.
[4]INOKUCHI A,WASHIO T.Mining frequent graph sequence patterns induced by vertices[C].Proceedings of the SIAM Int′1 Conference on Data Mining,2010:466-477.
[5]MICHELLE G,NEWMAN M E J.Community structure in social and biological networks[J].PNAS,2002,99(12):7821-7826.
[6]TAYEBI M A,GL?SSER U.Organized crime structures in co-offending networks[C].Proceedings of International Conference on Social Computing and its Applications,Sydney,Australia,Dec.2011.
[7]NGUYEN N P,DINH T N,Ying Xuan,et al.Adaptive algorithms for detecting community structure in dynamic social networks[C].Shanghai:Proceedings of IEEE Infocom′11,2011:2282-2290.
[8]BACKSTROM L,HUTTENLOCHER D,KLEINBERG J,et al.Group formation in large social networks:membership,growth and evolution[C].Proceedings of the KDD,2006:44-54.
瞄準(zhǔn)移動(dòng)計(jì)算和嵌入式應(yīng)用閃迪推出Z400s SSD
Z400s SSD以更實(shí)惠的價(jià)格替代筆記本電腦、數(shù)字標(biāo)牌、POS機(jī)和監(jiān)控系統(tǒng)中的硬盤
2015年5月28日,中國(guó)上海-全球領(lǐng)先的閃存存儲(chǔ)解決方案供應(yīng)商閃迪公司(納斯達(dá)克股票代碼:SNDK)今日宣布推出全新Z400s SSD,這款高性價(jià)比固態(tài)硬盤(SSD)旨在替代計(jì)算平臺(tái)和嵌入式應(yīng)用中的傳統(tǒng)硬盤(HDD)。為了滿足業(yè)務(wù)需求,PC和嵌入式系統(tǒng)需要穩(wěn)定、可靠地訪問存儲(chǔ)器。Z400s性能是HDD的20倍,可靠性是其5倍,平均功耗僅為其1/20,而同等容量下價(jià)格卻不相上下。Z400s SSD作為閃迪現(xiàn)有閃存解決方案產(chǎn)品組合中的新成員,旨在提供愉悅的用戶體驗(yàn)、可靠性和合理的價(jià)格。
閃迪客戶平臺(tái)解決方案部門產(chǎn)品營(yíng)銷總監(jiān)Rizwan Ahmed表示:“Z400s的工程設(shè)計(jì)兼顧了兩種不同的市場(chǎng)需求,即PCOEM制造商和嵌入式應(yīng)用設(shè)計(jì)人員。閃迪能夠通過單一架構(gòu)為OEM提供經(jīng)濟(jì)實(shí)惠的解決方案,用于替換當(dāng)前尖端消費(fèi)電子設(shè)備中的HDD,并且?guī)椭度胧綉?yīng)用設(shè)計(jì)人員避免多余空間的浪費(fèi),同時(shí)提供只有SSD才具有的峰值性能和高可靠性。”(閃迪公司供稿)
Ming method of organized crime based on co-offending networks
Tang Dequan1,Shi Weiqi1,Ling Zhigang2
(1.Department of Information Technology,Hunan Police Academy,Changsha 410138,China;2.College of Electrical and Information Engineering,Hunan University,Changsha 410082,China)
Organized crime group mining is a hot spot in the current data mining technology,so this paper proposed a new method of organized crime group mining using co-offending networks analysis methods.The method can improve the efficiency of the organized crime detection for extracting information from large real-life crime datasets.Experiments show that this method can analyze the evolution characteristics of organized crime group,effectively excavate organized crime evidence.
data mining;co-offending networks;organized crime groups;detection efficiency
TP311.2
A
1674-7720(2015)12-0017-03
2015-01-28)
唐德權(quán)(1979-),通信作者,男,碩士,講師,主要研究方向:信息安全、數(shù)據(jù)挖掘。E-mail:tdq525@126.com。
史偉奇(1967-),男,碩士,教授,主要研究方向:信息安全,計(jì)算機(jī)取證。
凌志剛(1976-),男,博士后,副教授,主要研究方向:圖像處理、計(jì)算機(jī)視覺與模式識(shí)別。
國(guó)家高新技術(shù)研究發(fā)展計(jì)劃(863 計(jì)劃)(2012AA112312 ) ;教育部高等學(xué)校博士學(xué)科點(diǎn)專項(xiàng)科研基金( 20110161120006 ) ; 湖南省教育規(guī)劃課題階段性成果( 警察信息素質(zhì)教育理念及實(shí)戰(zhàn)能力培養(yǎng)研究XJK013CXX012 ) ;湖南省公安廳科研基金(湘公科信明電( 2013 ) 56 號(hào))