段開(kāi)宇 徐漫琳
摘 要:BP神經(jīng)網(wǎng)絡(luò)是重要的分類預(yù)測(cè)方法之一,該文一方面在考察與分析單一因素預(yù)測(cè)警情的基礎(chǔ)上,探討了一種由多個(gè)因素作為神經(jīng)網(wǎng)絡(luò)的輸入層的預(yù)測(cè)模型,另一方面,通過(guò)合理部署警力、強(qiáng)化重點(diǎn)區(qū)域管控等相關(guān)防控措施,重新進(jìn)行引導(dǎo)預(yù)測(cè),為維護(hù)社會(huì)治安提供動(dòng)態(tài)監(jiān)控和科學(xué)決策。
關(guān)鍵詞:人工神經(jīng)網(wǎng)絡(luò) 警情預(yù)測(cè) 決策支持
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2015)06(c)-0230-02
對(duì)于公安來(lái)說(shuō),要保證社會(huì)治安穩(wěn)定良好,就必須在接處警工作中降低轄區(qū)內(nèi)警情,從而針對(duì)性的按照案件發(fā)生轄區(qū)對(duì)所有案件發(fā)生數(shù)量進(jìn)行預(yù)測(cè),根據(jù)預(yù)測(cè)結(jié)果分析出哪些轄區(qū)的警情會(huì)增加,從而可以適當(dāng)增強(qiáng)這些轄區(qū)的警力配置。而警情的產(chǎn)生是一個(gè)復(fù)雜的非線性動(dòng)態(tài)系統(tǒng),利用傳統(tǒng)的時(shí)間序列預(yù)測(cè)技術(shù)很難揭示其內(nèi)在的規(guī)律。該文在利用神經(jīng)網(wǎng)絡(luò)技術(shù)的基礎(chǔ)上,探討了一種面向公安警情分析、預(yù)測(cè)和決策的的預(yù)測(cè)模型。
1 BP神經(jīng)網(wǎng)絡(luò)的理論研究
1.1 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)及處理單元模型
BP 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖1,由輸入層、隱含層、輸出層共三層網(wǎng)絡(luò)組建而成,為了不失一般性,選取BP神經(jīng)網(wǎng)絡(luò)任意兩層介紹其處理單元的數(shù)學(xué)模型。BP神經(jīng)網(wǎng)絡(luò)處理單元的結(jié)構(gòu),如圖1-1右上所示,其中L1層的n個(gè)處理單元與L2層的p個(gè)處理單元全連接,連接權(quán)向量;L1層的n個(gè)處理單元的輸出構(gòu)成了L2層各個(gè)處理單元的輸入列變量,L2層各個(gè)處理單元的閾值為,因此,L2層各個(gè)處理單元接收的輸入加權(quán)和為[1]:
(1.1)
L2層各個(gè)處理單元的輸出由轉(zhuǎn)移函數(shù)決定。BP神經(jīng)網(wǎng)絡(luò)通常采用Sigmoid函數(shù)作為轉(zhuǎn)移函數(shù)(在實(shí)際應(yīng)用中,也可以采用雙曲正切函數(shù)作為轉(zhuǎn)移函數(shù))。
BP神經(jīng)網(wǎng)絡(luò)選取Sigmoid函數(shù)作為轉(zhuǎn)移函數(shù)是因?yàn)镾igmoid函數(shù)的輸出接近生物神經(jīng)元的信號(hào)輸出形式,能夠模擬生物神經(jīng)元的非線性特征。同時(shí),Sigmoid函數(shù)具有的非線性特征也能夠增強(qiáng)神經(jīng)網(wǎng)絡(luò)的非線性映射能力。
1.2 誤差反向傳播學(xué)習(xí)算法
BP神經(jīng)網(wǎng)絡(luò)采用BP算法進(jìn)行學(xué)習(xí),其學(xué)習(xí)過(guò)程分為四個(gè)階段[2]:
(1)學(xué)習(xí)模式是由輸入層(不做處理)經(jīng)過(guò)隱含層然后,向輸出層逐層傳播的“順傳播”過(guò)程;(2)網(wǎng)絡(luò)的輸出層得期望輸出與實(shí)際學(xué)習(xí)模式的輸出之差,即誤差信號(hào),是由輸出層經(jīng)隱含層向輸入層逐層修正連接權(quán)值的“誤差逆?zhèn)鞑ァ边^(guò)程;(3)由“模式順傳播”過(guò)程和“誤差逆?zhèn)鞑ァ边^(guò)程反復(fù)交替進(jìn)行的網(wǎng)絡(luò)“記憶訓(xùn)練”過(guò)程;(4)網(wǎng)絡(luò)趨向收斂,即網(wǎng)絡(luò)的全局誤差趨向極小值的“學(xué)習(xí)收斂”過(guò)程[2]。
前人已經(jīng)對(duì)這方面內(nèi)容有了深入的研究,這里就不在詳述。
2 基于BP神經(jīng)網(wǎng)絡(luò)的警情預(yù)測(cè)模型分析
2.1 單因素預(yù)測(cè)建模過(guò)程
在傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)警情短期預(yù)測(cè)中,大部分采用的是滑動(dòng)窗口時(shí)間段內(nèi)的警情數(shù)量,作為神經(jīng)網(wǎng)絡(luò)的輸入,即網(wǎng)絡(luò)的輸入層,選取的是一段連續(xù)時(shí)間內(nèi)連續(xù)的警情數(shù),未來(lái)的預(yù)測(cè)值作為輸出,然后通過(guò)樣本訓(xùn)練進(jìn)行權(quán)值的學(xué)習(xí)。在現(xiàn)實(shí)生活中,警情的發(fā)生因素很多,這種預(yù)測(cè)方法中對(duì)預(yù)測(cè)因素的分析是明顯不足的。上述這種預(yù)測(cè)方法叫做現(xiàn)狀外推預(yù)測(cè),即通過(guò)對(duì)歷史警情數(shù)的提取,在當(dāng)前客觀狀態(tài)下,對(duì)未來(lái)警情數(shù)的預(yù)測(cè);在實(shí)際生活中,警情的發(fā)生有很多因素,諸如由于警力部署、季節(jié)性流動(dòng)人口的不同,會(huì)導(dǎo)致轄區(qū)某地區(qū)發(fā)生的警情數(shù)也不同。另外,警情數(shù)預(yù)測(cè)的目的是通過(guò)調(diào)整警力或者有針對(duì)的預(yù)防措施減少轄區(qū)某區(qū)域的發(fā)案數(shù)。
2.2 改進(jìn)的警情預(yù)測(cè)建模過(guò)程
介于上節(jié)所述原因,我們嘗試在使用神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)過(guò)程中,加入了環(huán)比警情數(shù)、部署警力數(shù)、該地區(qū)常住人口數(shù)、暫住人口數(shù)及重點(diǎn)防控區(qū)域數(shù)燈相關(guān)參數(shù),使用神經(jīng)網(wǎng)絡(luò)做預(yù)測(cè)分類是,首先要確定網(wǎng)絡(luò)輸入層、隱含層和輸出層神經(jīng)元節(jié)點(diǎn)的數(shù)量,輸入層,節(jié)點(diǎn)主要選取影響預(yù)測(cè)目標(biāo)的各個(gè)因素,即上述包含的相關(guān)參數(shù)。輸出層節(jié)點(diǎn),主要選取要預(yù)測(cè)的未來(lái)警情數(shù)。所以,在實(shí)際仿真中選擇三層前饋式的神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò),包含了7個(gè)輸入節(jié)點(diǎn)和1個(gè)輸出節(jié)點(diǎn),具體如圖2所示。
從圖中我們可以看出該文所使用的模型相比單因素的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型具有較大的改進(jìn),由于加入了幾個(gè)影響警情發(fā)生的要素,我們可以在外推預(yù)測(cè)階段結(jié)束后,根據(jù)實(shí)際情況作出調(diào)整,諸如由于放假造成的流動(dòng)人口增多或減少。根據(jù)防控要求作出的警力調(diào)整等各方面條件之后,再次進(jìn)行預(yù)測(cè),形成了有目的的預(yù)測(cè)。
3 樣本訓(xùn)練及預(yù)測(cè)結(jié)果分析
建立預(yù)測(cè)模型,至少需要2組數(shù)據(jù)樣本,前一組數(shù)據(jù)用來(lái)構(gòu)成訓(xùn)練樣本,對(duì)神經(jīng)網(wǎng)絡(luò)單元的權(quán)重、閾值進(jìn)行訓(xùn)練,后一組數(shù)據(jù)作為檢驗(yàn)樣本對(duì)預(yù)測(cè)結(jié)果進(jìn)行檢驗(yàn)。該例子中選擇了某派出所2014年4月到2015年4月的實(shí)際數(shù)據(jù)作為樣本。對(duì)樣本進(jìn)行歸一化處理,勢(shì)必導(dǎo)致數(shù)值大的分量絕對(duì)誤差變大,一般而言,樣本的輸入和輸出值都限定在0.1至0.9之間。在訓(xùn)練ANN時(shí),應(yīng)根據(jù)情況確定輸入輸出層的各神經(jīng)元所代表實(shí)際量的最小、最大值Xmin,Xmax,通過(guò)代入逆變換公式換算出的真實(shí)量。
故,對(duì)原始數(shù)據(jù)按照BP人工神經(jīng)網(wǎng)絡(luò)的具體算法的第一步,歸一化處理原始數(shù)據(jù),可將原始數(shù)據(jù)轉(zhuǎn)化為[0.1,0.9]上的無(wú)量綱指標(biāo)屬性值,如表2所示。
利用訓(xùn)練完成后神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和權(quán)值參數(shù),我們首先將剩余的其他沒(méi)有參與訓(xùn)練的測(cè)試數(shù)據(jù),作為神經(jīng)網(wǎng)絡(luò)的輸入,進(jìn)行警情數(shù)的預(yù)測(cè),然后通過(guò)網(wǎng)絡(luò)的輸出值與實(shí)際值比較,以此來(lái)驗(yàn)證預(yù)測(cè)模型的準(zhǔn)確度和泛化能力。
4 結(jié)語(yǔ)
該文從預(yù)測(cè)結(jié)果比較所示可以得到的結(jié)論有:(1)預(yù)測(cè)數(shù)據(jù)與真實(shí)數(shù)據(jù)在數(shù)值上盡管存在一些差距,但是在升降的趨勢(shì)方向上是較為準(zhǔn)確的。(2)改進(jìn)的多因素BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型采用了8個(gè)影響警情發(fā)生因素指標(biāo)作為神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中的輸入,利用神經(jīng)網(wǎng)絡(luò)的自適應(yīng)、自學(xué)習(xí)能力對(duì)歷史樣本數(shù)據(jù)進(jìn)行訓(xùn)練,通過(guò)網(wǎng)絡(luò)的輸出獲得了與真實(shí)數(shù)據(jù)趨勢(shì)一致的預(yù)測(cè)值。根據(jù)預(yù)測(cè)的趨勢(shì)情況,可通過(guò)強(qiáng)化巡邏、不同區(qū)域配置不停警力等方式進(jìn)行引導(dǎo)預(yù)測(cè),這樣可以如實(shí)的反應(yīng)出變更防控措施后的優(yōu)勢(shì)與不足。
參考文獻(xiàn)
[1] 劉莉,徐玉生,馬志新.數(shù)據(jù)挖掘中數(shù)據(jù)預(yù)處理技術(shù)綜述[J].甘肅科學(xué)學(xué)報(bào), 2003,15(1):117-119.
[2] 馬銳,人工神經(jīng)網(wǎng)絡(luò)原理[D].北京:機(jī)械工業(yè)出版社,2010.
[3] 焦李成.神經(jīng)網(wǎng)絡(luò)系統(tǒng)理論[M].西安:西安電子科技大學(xué)出版社,1996.