王海燕++陳紅偉
摘要:近年來青少年違法犯罪問題已經(jīng)越來越成為亟待解決的社會問題,如何提出科學的有堅實理論依據(jù)的建議一直是研究的關鍵。本文將數(shù)據(jù)挖掘技術(shù)應用到青少年違法犯罪研究中,利用關聯(lián)規(guī)則尋找青少年違法犯罪中隱藏的不直觀的規(guī)律,比如多種罪行之間的關聯(lián)以及外部環(huán)境對青少年犯罪的影響等。同時對相關實例數(shù)據(jù)進行關聯(lián)規(guī)則分析來實現(xiàn)這個理論,最后得到了令人信服的結(jié)果,并根據(jù)這些結(jié)論提出了具有針對性的建議。
關鍵詞:青少年;違法犯罪;預防;數(shù)據(jù)挖掘;關聯(lián)規(guī)則
中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2015)23-0003-02
The Application Research of Association Rules in Adolescent Illegal Crime Prevention
WANG Hai-yan,CHEN Hong-wei
(Computation Center of Laboratory Management Apartment,Zhengzhou Institute of Aeronautical Industry Management,Zhengzhou 450046,China)
Abstract: Adolescent illegal crime in recent years has become a pressing social problem to be solved and the research key of it is how to put forward the advice with a solid theoretical foundation. In this paper data mining is applied to the adolescent illegal crime prevention and using association rules to find the rule of not intuitive, for example, the link between various crimes and the external environments influence on juvenile crime. To achieve this theory, analyze the relevant instantiate data with association rules and get the convincing results. At last the pertinent advices are put forward according to the conclusion.
Key words: adolescent; illegal criminal activity; prevention; data mining; association rules
如今青少年違法犯罪事件層出不窮,更有犯罪人數(shù)不斷增多,犯罪年齡不斷下降,犯罪越來越類型復雜等趨勢。因此找出青少年的犯罪規(guī)律,有效預測,對有犯罪傾向的青少年多多加以疏導和關注,及時有效的阻止犯罪行為的發(fā)生迫在眉睫。
文獻已有研究青少年違法犯罪預防的,比如文獻“犯罪少年心理特征調(diào)查與教育建議”[1],是通過直觀問卷調(diào)查的方式進行總結(jié)給出建議;文獻“預防青少年犯罪研究”[2]是根據(jù)多年青少年管理工作經(jīng)驗研究提出青少年犯罪的預防和矯正對策。二者皆是根據(jù)社會經(jīng)驗來判斷分析,缺乏有力的數(shù)據(jù)依據(jù)。所以本文嘗試將數(shù)據(jù)挖掘中的關聯(lián)規(guī)則分析應用到青少年違法犯罪預防的研究中來,找出隱含的不直觀的犯罪規(guī)律,為預防工作提供強有力的數(shù)據(jù)支持和指導意見。
1 相關概念介紹
1.1 數(shù)據(jù)挖掘
數(shù)據(jù)挖掘,顧名思義是從大量數(shù)據(jù)中挖掘有趣模式和知識的過程[3],它融合了統(tǒng)計學、可視化、數(shù)據(jù)庫技術(shù)、算法分析與設計、機器學習等不同學科和領域的知識。數(shù)據(jù)挖掘可發(fā)現(xiàn)多種類型的知識,主要是廣義知識、關聯(lián)知識、分類知識、聚類知識和偏差知識。
對所有知識類型的挖掘流程主要分三大步驟:數(shù)據(jù)準備,數(shù)據(jù)挖掘,模式評估。其中數(shù)據(jù)準備又包含數(shù)據(jù)選擇、數(shù)據(jù)預處理和數(shù)據(jù)轉(zhuǎn)換等階段。整體流程如圖1所示[4]。
圖1 數(shù)據(jù)挖掘過程
1.2 關聯(lián)規(guī)則
關聯(lián)規(guī)則反映一個事物與其他事物之間的相互依存性和關聯(lián)性。如果兩個或者多個事物之間存在一定的關聯(lián)關系,那么,其中一個事物就能夠通過其他事物預測到。主要應用在購物籃分析、交叉銷售、產(chǎn)品目錄設計等方面,此外對分類、聚類和其他挖掘任務也有幫助。
進行關聯(lián)規(guī)則挖掘的過程中為了尋找有趣的規(guī)則,需要兩個關鍵性的度量,支持度與置信度。支持度s是指D中包含A和B的事務數(shù)與總的事務數(shù)的比值,如公式1所示;置信度c是指D中同時包含A和B的事務數(shù)與只包含A的事務數(shù)的比值,如公式2所示。
s ( A?B ) = P ( A∪B ) (1)
c ( A?B ) = P ( B∣A ) (2)
2挖掘過程
下面依次經(jīng)過案例搜集、數(shù)據(jù)實例化、算法分析、結(jié)果解釋和提出針對性意見等步驟來實現(xiàn)將數(shù)據(jù)挖掘應用到青少年違法犯罪預防中的理論。
2.1 數(shù)據(jù)預處理
本文所用數(shù)據(jù)為網(wǎng)絡公示案例,第一步搜集真實可靠的案例,第二步實例化數(shù)據(jù),第三步將數(shù)據(jù)保存到關系數(shù)據(jù)庫中,第四步總結(jié)數(shù)據(jù)取值的值域,對數(shù)據(jù)進行離散化規(guī)范化等處理,具體處理標準如表1所示。
2.2 算法描述
Aprirori算法為關聯(lián)規(guī)則技術(shù)分析中應用廣泛且成熟的經(jīng)典算法,因此本文也選用此算法建模對數(shù)據(jù)進行關聯(lián)分析。Apriori具體步驟如下:
本算法大致分兩步進行,第一步是找出所有大于等于最小支持度閾值min_support的頻繁項集,第二步是找出頻繁項集之間的強關聯(lián)規(guī)則,即大于等于最小置信度閾值min_conf。
2.3 結(jié)果分析
通過將整理后的數(shù)據(jù)利用Apriori算法進行關聯(lián)規(guī)則分析,滿足最小支持度及最小置信度等條件,其中最小支持度定義為30%,最小置信度定義為20%,最后所得規(guī)則集如表3所示:
表3為滿足最小支持度及最小置信度的規(guī)則,第一列為規(guī)則集,第二列為該規(guī)則集對應的置信度,如第一條規(guī)則“{13-14,男,暴力,網(wǎng)癮}斗毆”,置信度為“50%”,解釋為年齡為13-14歲,家庭有家暴行為且自身有網(wǎng)癮的男性少年在所有的犯罪類型中,“斗毆”所占比例高到50%??梢娖涑砷L背景對孩子的性格養(yǎng)成影響有多大。其他規(guī)則可依此進行解釋。
規(guī)則集中絕大多數(shù)理解起來都很直觀,但是規(guī)則“{男,城市,小康,放任不管,煙酒}盜竊搶劫”卻有些費解,為什么小康家庭的孩子還會有盜竊搶劫的行為呢,一般這種家庭的孩子很少出現(xiàn)零花錢不夠的情況,在結(jié)合了相應案例之后發(fā)現(xiàn),同學之間的攀比是直接誘因,為了滿足虛榮心,滿足“別人有的我要有,別人沒有的我也要有”的欲望,繼而走上了犯罪的道路。由此可見數(shù)據(jù)挖掘在發(fā)現(xiàn)不直觀的知識方面很有優(yōu)勢。
通過規(guī)則集的解釋和總結(jié)不難發(fā)現(xiàn), “網(wǎng)癮”和“放任不管”出現(xiàn)的頻率很高,其次是 “單親”、“輟學”、“煙酒”出現(xiàn)頻率也較高,“留守”、“溺愛”和“吸毒”等因素也對青少年犯罪起到了推動作用。其他可以發(fā)現(xiàn)青少年犯罪以男生居多,年齡也多集中在“15-17”歲。
2.4 對策制定
由以上規(guī)則集及總結(jié)可以很明顯地發(fā)現(xiàn)社會、學校和家庭對青少年引發(fā)犯罪行為的重要影響。由于青少年正處于生理和心理發(fā)育的關鍵階段,還未樹立正確的人生觀、世界觀和價值觀,并且對世界有強烈的求知欲望,因此需要從社會、學校和家庭三個方面共同努力來預防青少年走上違法犯罪的道路。
社會方面,加強對網(wǎng)吧酒吧的監(jiān)管,嚴格禁止未成年人進入,加大相關處罰力度;相關部門及時整頓游戲廳錄像廳網(wǎng)吧等場所,對青少年有危害的要堅決打擊;凈化社會風氣,整頓文化市場,堅決查處傳播暴力、淫穢及偽科學等不健康的出版物,嚴格審查面向未成年人的游戲軟件。努力為青少年營造積極向上的健康的社會成長環(huán)境。
家庭方面,眾所周知父母的言行對子女的成長影響最大。因此父母應該為青少年營造良好和睦的家庭環(huán)境氣氛,對青春期的孩子多多關注,與學校多溝通,及時了解其心理歷程,防止青少年沾染不良嗜好,如果青少年染上了“網(wǎng)癮”、“煙酒”甚至是“吸毒”等行為,要及時同老師或心理醫(yī)生一起與青少年多溝通,幫助其矯正戒除惡習,重新樹立對生活的熱愛和信心。
學校方面在注重成績的同時要加強法律基礎教育,同時營造良好的校風及學風,遏制攀比虛榮等不良風氣;豐富校園文化,使學生熱愛校園生活,消除社會負面影響;加強管理機制,嚴肅校紀校規(guī),正確規(guī)范和約束學生的行為;與家長多溝通,對問題學生要多多關注,及時引導。幫助引導青少年走健康向上積極進取的道路。
3 總結(jié)
本文將關聯(lián)規(guī)則應用到青少年違法犯罪的預防工作中,相比傳統(tǒng)的統(tǒng)計總結(jié)方法而言,不僅可以發(fā)現(xiàn)不直觀不易發(fā)覺的規(guī)律,而且每條規(guī)則還有準確的數(shù)據(jù)支持,對后續(xù)方案策略的制定有了更詳細更明確的指導作用。
下一步嘗試將聚類分析、分類分析也應用到此工作的研究中,利用聚類將具有相似特征的青少年聚成一簇,使教育工作更有效,利用分類根據(jù)青少年特征預測其可能的犯罪行為,重點關注,多做工作,避免問題少年走上犯罪道路。
參考文獻:
[1] 馮春.犯罪少年心理特征調(diào)查與教育建議[J].云南大學學報法學版,2008,21(4):84-89.
[2] 周倫文,郭勁.預防青少年犯罪研究[J].天府新論,2004(Z2):146-147.
[3] Jiawei Han, Micheline Kamber. Data Mining Concepts and Techniques[M]. 范明,孟小峰.譯.3版.北京:機械工業(yè)出版社,2004:4-17.
[4] Fayyad U, Piatetsky S G, Smith P. The KDD process for extracting useful knowledge from volumes of data[J]. Communications of the ACM,1996,39(11):27-34.