薛亞龍,劉梓濘
(寧夏警官職業(yè)學(xué)院,寧夏 銀川 750021)
隨著各種多源異構(gòu)數(shù)據(jù)呈指數(shù)級(jí)的迅猛增長(zhǎng),數(shù)據(jù)情報(bào)偵查預(yù)測(cè)中存在挖掘過擬合現(xiàn)象嚴(yán)重、因果關(guān)聯(lián)效應(yīng)偏差高、數(shù)據(jù)犯罪模式更迭快等突出問題,給算法時(shí)代的數(shù)據(jù)情報(bào)偵查預(yù)測(cè)帶來了巨大困境?;诖耍牖跈C(jī)器學(xué)習(xí)的數(shù)據(jù)情報(bào)偵查預(yù)測(cè)研究范式,不僅能夠提升打擊數(shù)據(jù)犯罪情勢(shì)生存與態(tài)勢(shì)發(fā)展的偵查效果,而且還能夠增強(qiáng)擠壓數(shù)據(jù)犯罪情勢(shì)滋生的“土壤”空間,轉(zhuǎn)型和創(chuàng)新打擊數(shù)據(jù)犯罪情勢(shì)的新型數(shù)據(jù)情報(bào)偵查途徑,從而實(shí)現(xiàn)機(jī)器學(xué)習(xí)循證數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的價(jià)值效果。
機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)主要是通過采取支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)算法①參見范昊、李珊珊、熱孜亞·艾海提:《機(jī)器學(xué)習(xí)算法在我國(guó)情報(bào)學(xué)研究中的應(yīng)用與影響——基于CSSCI 期刊論文的視角》,載《圖書情報(bào)知識(shí)》2022 年第5 期,第96-108 頁(yè)。,深度挖掘多源異構(gòu)數(shù)據(jù)與數(shù)據(jù)犯罪情勢(shì)之間潛在的關(guān)聯(lián)規(guī)則,幫助解決多源異構(gòu)數(shù)據(jù)與數(shù)據(jù)犯罪小概率事件、數(shù)據(jù)犯罪情勢(shì)因果解釋與情報(bào)偵查預(yù)測(cè)、數(shù)據(jù)運(yùn)算挖掘精度擴(kuò)張與情報(bào)偵查預(yù)測(cè)級(jí)聯(lián)需求等突出問題。誠(chéng)然,與傳統(tǒng)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)相比較而言,機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)為算法時(shí)代的現(xiàn)代數(shù)據(jù)情報(bào)偵查提供了新的轉(zhuǎn)型價(jià)值。
傳統(tǒng)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)往往始于偵查假設(shè),主要是在偵查因果解釋理論的指導(dǎo)下先提出偵查假設(shè),然后采取隨機(jī)抽樣措施獲取所需數(shù)據(jù)并進(jìn)行偵查假設(shè)的驗(yàn)證等②參見薛亞龍、羅珂巖、馬麒:《數(shù)據(jù)情報(bào)偵查的循證決策方法》,載《中國(guó)刑警學(xué)院學(xué)報(bào)》2022 年第3 期,第24-34 頁(yè)。??梢?,傳統(tǒng)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)是一種自上而下的邏輯論證過程。偵查假設(shè)驗(yàn)證主要適用于特定時(shí)空的數(shù)據(jù)犯罪情勢(shì),往往難以被應(yīng)用于數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的全過程。然而,機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)是以客觀數(shù)據(jù)為開始,不再側(cè)重于追求獲取各種模糊或不確定的因果關(guān)系和反復(fù)論證的偵查假設(shè),而是主要利用機(jī)器學(xué)習(xí)算法對(duì)多源異構(gòu)數(shù)據(jù)直接進(jìn)行聚類挖掘、模式識(shí)別等。這不僅能夠幫助偵查人員發(fā)現(xiàn)和掌握數(shù)據(jù)犯罪情勢(shì)的生存態(tài)勢(shì)規(guī)律,而且還能夠幫助其預(yù)測(cè)不同偵查中主體的發(fā)展需求。顯然,機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)是一種以,“匯集數(shù)據(jù)—挖掘數(shù)據(jù)—構(gòu)建模型—結(jié)果預(yù)測(cè)”為模式的挖掘流程。誠(chéng)然,機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的路徑轉(zhuǎn)型從根本上改變了傳統(tǒng)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)所追求的偵查因果解釋。這不僅有利于能夠獲得更多不同數(shù)據(jù)犯罪情勢(shì)之間的關(guān)聯(lián)規(guī)則和強(qiáng)化對(duì)多源異構(gòu)數(shù)據(jù)運(yùn)算挖掘的可控性,而且還有利于最大限度地避免和降低偵查人員主觀方面因素的影響。
傳統(tǒng)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的主要困境在于匯集數(shù)據(jù)時(shí)存在不透明、不完備、不公開等現(xiàn)象,部分還存在清洗集成難、規(guī)約融合復(fù)雜等突出問題。然而,機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)確有望能夠避免和減少這些困境難題。首先,多源異構(gòu)數(shù)據(jù)是“客觀數(shù)據(jù)”而非“被主觀設(shè)計(jì)的數(shù)據(jù)”。傳統(tǒng)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)在數(shù)據(jù)匯集方式上屬于典型的主觀設(shè)計(jì),尤其在偵查因果解釋理論指導(dǎo)下促使偵查人員所匯集的數(shù)據(jù)具有一定的選擇性、目的性、裁剪性,造成這種“被主觀設(shè)計(jì)的數(shù)據(jù)”嚴(yán)重影響了應(yīng)用效果的客觀性和真實(shí)性。而機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)所使用的多源異構(gòu)數(shù)據(jù)主要是在不介入、不干預(yù)的前提下對(duì)各種數(shù)據(jù)犯罪情勢(shì)生存態(tài)勢(shì)的客觀記錄和匯集,從根本上保障了多源異構(gòu)數(shù)據(jù)被匯集的客觀真實(shí)。其次,多源異構(gòu)數(shù)據(jù)是“全量數(shù)據(jù)”而非“抽樣數(shù)據(jù)”。多源異構(gòu)數(shù)據(jù)主要是接近各種不同數(shù)據(jù)犯罪情勢(shì)的全量數(shù)據(jù),與傳統(tǒng)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的抽樣數(shù)據(jù)相比較而言,“全量數(shù)據(jù)”能夠消除或降低因傳統(tǒng)抽樣數(shù)據(jù)而引起的統(tǒng)計(jì)誤差、結(jié)果失真等異?,F(xiàn)象。再次,多源異構(gòu)數(shù)據(jù)是“厚數(shù)據(jù)”而非“淺數(shù)據(jù)”。多源異構(gòu)數(shù)據(jù)不僅包括結(jié)構(gòu)型數(shù)據(jù)、非結(jié)構(gòu)型數(shù)據(jù)、異構(gòu)型數(shù)據(jù)等傳統(tǒng)型數(shù)據(jù),而且還包括定類型數(shù)據(jù)、定序型數(shù)據(jù)、定比型數(shù)據(jù)等新型數(shù)據(jù)。顯然,多源異構(gòu)數(shù)據(jù)屬于內(nèi)涵豐富的“厚數(shù)據(jù)”。最后,多源異構(gòu)數(shù)據(jù)是“開放數(shù)據(jù)”而非“孤島數(shù)據(jù)”。從來源渠道和類別形態(tài)而言,多源異構(gòu)數(shù)據(jù)具有很強(qiáng)的共享性、開放性、融合性。這不僅有利于偵查人員實(shí)現(xiàn)后續(xù)運(yùn)算挖掘的過程重現(xiàn)和結(jié)果引用,而且還有利于其對(duì)多源異構(gòu)數(shù)據(jù)進(jìn)行運(yùn)算平臺(tái)設(shè)計(jì)、挖掘流程構(gòu)建等,從而提升機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的優(yōu)質(zhì)性。
傳統(tǒng)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)主要是將數(shù)據(jù)犯罪情勢(shì)中的因變量和自變量通過降維進(jìn)行回歸簡(jiǎn)化挖掘,往往存在不同偵查中主體被過度降維簡(jiǎn)化的現(xiàn)象,造成所獲取的數(shù)據(jù)情報(bào)偵查預(yù)測(cè)存在效果偏差或結(jié)果失真等現(xiàn)象。然而,機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)能夠充分發(fā)揮機(jī)器學(xué)習(xí)算法的價(jià)值優(yōu)勢(shì),通過模擬偵查人員的數(shù)據(jù)情報(bào)偵查思維和認(rèn)知策略,實(shí)現(xiàn)對(duì)多源異構(gòu)數(shù)據(jù)運(yùn)算挖掘的自我“訓(xùn)練”和“學(xué)習(xí)”,極大提升了機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的精準(zhǔn)性。同時(shí),機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)還有利于偵查人員實(shí)現(xiàn)對(duì)數(shù)據(jù)犯罪情勢(shì)中“犯罪因果推斷”的預(yù)測(cè)?!胺词聦?shí)因果”是推斷挖掘數(shù)據(jù)犯罪情勢(shì)中各變量之間關(guān)聯(lián)規(guī)則的重要依據(jù),如果在數(shù)據(jù)情報(bào)偵查預(yù)測(cè)中“反事實(shí)”與“事實(shí)”兩者存在明顯的差異性,那么就說明數(shù)據(jù)犯罪情勢(shì)中結(jié)果變量與條件變量之間存在關(guān)聯(lián)規(guī)則。因此,機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)就能夠通過機(jī)器學(xué)習(xí)算法對(duì)“全量數(shù)據(jù)”進(jìn)行挖掘和構(gòu)建“反事實(shí)因果”推斷的關(guān)聯(lián)平臺(tái),從而提升對(duì)數(shù)據(jù)犯罪情勢(shì)中因變量與自變量因果關(guān)聯(lián)預(yù)測(cè)的客觀性。
首先,機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)能夠?qū)鹘y(tǒng)的統(tǒng)計(jì)分析與支持向量機(jī)等機(jī)器學(xué)習(xí)算法進(jìn)行融合。傳統(tǒng)的統(tǒng)計(jì)分析預(yù)測(cè)模式有利于偵查人員采取線性的統(tǒng)計(jì)挖掘模型對(duì)偵查假設(shè)展開驗(yàn)證,而機(jī)器學(xué)習(xí)算法則有利于偵查人員對(duì)數(shù)據(jù)犯罪情勢(shì)中具有相關(guān)性、描述性等非線性關(guān)聯(lián)規(guī)則進(jìn)行運(yùn)算挖掘,有助于互補(bǔ)實(shí)現(xiàn)對(duì)數(shù)據(jù)犯罪情勢(shì)發(fā)展規(guī)律的整體預(yù)測(cè)。其次,將大數(shù)據(jù)與小數(shù)據(jù)有機(jī)融合。偵查人員通過利用海量大數(shù)據(jù)的系列性特征來實(shí)現(xiàn)對(duì)數(shù)據(jù)犯罪情勢(shì)的關(guān)聯(lián)規(guī)則構(gòu)建,更加側(cè)重于從整體性、全局性、宏觀性的預(yù)測(cè)研判。最后,將犯罪因果推斷與數(shù)據(jù)關(guān)聯(lián)挖掘融合。犯罪因果推斷與數(shù)據(jù)關(guān)聯(lián)挖掘是開展機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的基礎(chǔ),傳統(tǒng)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)側(cè)重于對(duì)犯罪因果推斷的分析③參見王夢(mèng)瑤、陳剛:《大數(shù)據(jù)時(shí)代犯罪與偵查動(dòng)態(tài)發(fā)展研究》,載《山東警察學(xué)院學(xué)報(bào)》2017 年第2 期,第74-80 頁(yè)。,而機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)不僅側(cè)重于對(duì)數(shù)據(jù)犯罪情勢(shì)的數(shù)據(jù)關(guān)聯(lián)挖掘,而且還兼顧對(duì)犯罪因果推斷的分析研判。
為增強(qiáng)實(shí)現(xiàn)機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的轉(zhuǎn)型價(jià)值,依據(jù)機(jī)器學(xué)習(xí)的運(yùn)算優(yōu)勢(shì)和數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的特殊價(jià)值需求,提出機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的框架與模式。這不僅能夠提升對(duì)多源異構(gòu)數(shù)據(jù)情報(bào)運(yùn)算挖掘的客觀性和精準(zhǔn)性,而且還能夠消除和減少數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的偏差率。
機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的框架不僅能滿足機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)轉(zhuǎn)型價(jià)值的整體、全局性要求,而且還是構(gòu)建機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)模式的支撐和保障。基于此,可將機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的框架自下而上具體分為預(yù)處理和融合、流程模型構(gòu)建等三個(gè)模塊(見圖1)。
圖1 機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的框架圖
1.預(yù)處理和融合。預(yù)處理和融合主要包括兩個(gè)方面:一方面,多源異構(gòu)數(shù)據(jù)的預(yù)處理。多源異構(gòu)數(shù)據(jù)的預(yù)處理主要是指對(duì)多源異構(gòu)數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)變換以及數(shù)據(jù)規(guī)約等處理,其中數(shù)據(jù)清洗主要是對(duì)多源異構(gòu)數(shù)據(jù)中的異常數(shù)據(jù)和缺失數(shù)據(jù)進(jìn)行處理,數(shù)據(jù)集成主要用于過濾識(shí)別多源異構(gòu)數(shù)據(jù)中的冗余數(shù)據(jù)、重復(fù)數(shù)據(jù)等,數(shù)據(jù)變換主要是對(duì)各多源異構(gòu)數(shù)據(jù)進(jìn)行數(shù)據(jù)管理的規(guī)范化處理,而數(shù)據(jù)規(guī)約則是指對(duì)多源異構(gòu)數(shù)據(jù)所進(jìn)行的數(shù)據(jù)屬性約減。另一方面,多源異構(gòu)數(shù)據(jù)的融合。多源異構(gòu)數(shù)據(jù)的融合主要是指采取數(shù)據(jù)聚類、數(shù)據(jù)關(guān)聯(lián)、數(shù)據(jù)回歸等機(jī)器學(xué)習(xí)算法對(duì)經(jīng)過預(yù)處理后的多源異構(gòu)數(shù)據(jù)進(jìn)行數(shù)據(jù)頻繁項(xiàng)目集合構(gòu)建④參見張明寶、秦琪:《大數(shù)據(jù)環(huán)境下基于分工協(xié)作的情報(bào)系統(tǒng)構(gòu)建方法研究》,載《情報(bào)雜志》2022 年第2 期,第29-34 頁(yè)。。
2.流程模型構(gòu)建。為了提升挖掘多源異構(gòu)數(shù)據(jù)與數(shù)據(jù)犯罪情勢(shì)之間潛在關(guān)聯(lián)規(guī)則的精確性,可將機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的流程模型構(gòu)建為數(shù)據(jù)情報(bào)偵查預(yù)測(cè)偏好選擇流程模型和數(shù)據(jù)犯罪情勢(shì)生存與態(tài)勢(shì)發(fā)展預(yù)測(cè)流程模型兩部分。
一方面,數(shù)據(jù)情報(bào)偵查預(yù)測(cè)偏好選擇流程模型。偵查人員借助于監(jiān)督學(xué)習(xí)的機(jī)器學(xué)習(xí)算法從異構(gòu)多源數(shù)據(jù)的結(jié)構(gòu)屬性、犯罪嫌疑人的數(shù)據(jù)心理畫像、數(shù)據(jù)犯罪情勢(shì)的歷史規(guī)律等方面提取具有典型的規(guī)律特征,再利用數(shù)據(jù)倉(cāng)庫(kù)中的多源異構(gòu)數(shù)據(jù)與其進(jìn)行融合映射,以此來構(gòu)建數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的偏好選擇流程模型。同時(shí),根據(jù)案情需要更新的預(yù)置數(shù)據(jù)情報(bào)偵查預(yù)測(cè)價(jià)值需求,偵查人員可將其及時(shí)融入數(shù)據(jù)情報(bào)偵查預(yù)測(cè)偏好選擇流程模型中,進(jìn)而幫助其改善數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的預(yù)置價(jià)值需求與數(shù)據(jù)犯罪情勢(shì)發(fā)展之間的結(jié)構(gòu)失衡性。
另一方面,數(shù)據(jù)犯罪情勢(shì)生存與態(tài)勢(shì)發(fā)展預(yù)測(cè)流程模型。偵查人員可利用機(jī)器學(xué)習(xí)算法對(duì)多源異構(gòu)數(shù)據(jù)中各數(shù)據(jù)路徑、數(shù)據(jù)連邊、數(shù)據(jù)加權(quán)權(quán)重等進(jìn)行深度挖掘,幫助其及時(shí)掌握多源異構(gòu)數(shù)據(jù)的不同結(jié)構(gòu)特征。將多源異構(gòu)數(shù)據(jù)中不同結(jié)構(gòu)特征提取出來形成機(jī)器學(xué)習(xí)運(yùn)算挖掘的關(guān)鍵性序列特征,從而揭示不同數(shù)據(jù)犯罪情勢(shì)生存與態(tài)勢(shì)發(fā)展的趨勢(shì)規(guī)律。同時(shí),為增強(qiáng)構(gòu)建數(shù)據(jù)犯罪情勢(shì)生存與態(tài)勢(shì)發(fā)展預(yù)測(cè)流程模型的客觀性,偵查人員還可將多源異構(gòu)數(shù)據(jù)的生命周期、數(shù)據(jù)犯罪情勢(shì)的耗散、運(yùn)算挖掘的加權(quán)權(quán)重等相關(guān)因素加入其中,幫助其構(gòu)建更加具有正向同配屬性關(guān)系的預(yù)測(cè)流程模型。
3.流程模型評(píng)估體系。流程模型評(píng)估體系主要是指?jìng)刹槿藛T利用機(jī)器學(xué)習(xí)算法來評(píng)估數(shù)據(jù)情報(bào)偵查預(yù)測(cè)在實(shí)踐中的運(yùn)行效果,也是對(duì)機(jī)器學(xué)習(xí)算法優(yōu)勢(shì)與數(shù)據(jù)情報(bào)偵查預(yù)測(cè)價(jià)值需求互相融合的必要反饋。只有經(jīng)過評(píng)估之后,才能夠準(zhǔn)確判斷流程模型構(gòu)建、機(jī)器學(xué)習(xí)算法選擇、數(shù)據(jù)犯罪情勢(shì)的關(guān)聯(lián)規(guī)則構(gòu)建等是否符合機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的價(jià)值需求。誠(chéng)然,流程模型評(píng)估體系的核心是利用機(jī)器學(xué)習(xí)算法在數(shù)據(jù)運(yùn)算挖掘、數(shù)據(jù)模型構(gòu)建等方面的運(yùn)算優(yōu)勢(shì),檢驗(yàn)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)偏好選擇流程模型和數(shù)據(jù)犯罪情勢(shì)生存與態(tài)勢(shì)發(fā)展預(yù)測(cè)流程模型構(gòu)建等的準(zhǔn)確性,再利用監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)等機(jī)器學(xué)習(xí)算法檢驗(yàn)評(píng)估數(shù)據(jù)情報(bào)偵查預(yù)置價(jià)值需求的合理性等。
為緩解數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的決策僵局和提高數(shù)據(jù)情報(bào)挖掘的差分隱私,可將機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的模式自上而下構(gòu)建為數(shù)據(jù)情報(bào)偵查預(yù)測(cè)偏好選擇模式、數(shù)據(jù)犯罪情勢(shì)生存與態(tài)勢(shì)發(fā)展規(guī)律模式、數(shù)據(jù)運(yùn)算挖掘選擇模式三個(gè)部分(見圖2)。
第一,數(shù)據(jù)情報(bào)偵查預(yù)測(cè)偏好選擇模式。數(shù)據(jù)情報(bào)偵查預(yù)測(cè)偏好選擇模式主要是以數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的預(yù)置價(jià)值需求為切入點(diǎn),依據(jù)不同數(shù)據(jù)犯罪情勢(shì)之間的關(guān)聯(lián)規(guī)則,識(shí)別和提取不同數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的預(yù)置價(jià)值需求、時(shí)空序列矩陣、函數(shù)權(quán)重系數(shù)以及因果關(guān)聯(lián)概率等數(shù)據(jù)序列特征。同時(shí),偵查人員還可及時(shí)挖掘獲取不同數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的益損決策矩陣、損失規(guī)避與偏好反轉(zhuǎn)、多屬性權(quán)重概率等深層次的隱性目標(biāo),進(jìn)而幫助其實(shí)現(xiàn)預(yù)測(cè)價(jià)值需求觸發(fā)概率、數(shù)據(jù)情報(bào)偵查情勢(shì)發(fā)展態(tài)勢(shì)、情報(bào)關(guān)聯(lián)規(guī)則模型構(gòu)建等偏好選擇的應(yīng)用效果⑤參見薛亞龍、劉梓濘:《基于前景理論的數(shù)據(jù)情報(bào)偵查決策研究》,載《中國(guó)人民警察大學(xué)學(xué)報(bào)》2022 年第10 期,第5-11+18 頁(yè)。。顯然,數(shù)據(jù)情報(bào)偵查預(yù)測(cè)偏好選擇模式重點(diǎn)是關(guān)注如何運(yùn)算挖掘數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的各種顯性或潛在的預(yù)置價(jià)值需求,然后利用不同機(jī)器學(xué)習(xí)算法構(gòu)建科學(xué)準(zhǔn)確的偏好選擇模式。
第二,數(shù)據(jù)犯罪情勢(shì)生存與態(tài)勢(shì)發(fā)展規(guī)律模式。數(shù)據(jù)犯罪情勢(shì)生存與態(tài)勢(shì)發(fā)展規(guī)律模式主要是以數(shù)據(jù)犯罪情勢(shì)為邏輯起點(diǎn),以結(jié)構(gòu)型數(shù)據(jù)、非結(jié)構(gòu)型數(shù)據(jù)、異構(gòu)型數(shù)據(jù)等傳統(tǒng)型數(shù)據(jù)和定類型數(shù)據(jù)、定序型數(shù)據(jù)、定比型數(shù)據(jù)等新型類數(shù)據(jù)的多源異構(gòu)數(shù)據(jù)為基礎(chǔ),運(yùn)算挖掘數(shù)據(jù)犯罪主體、數(shù)據(jù)犯罪時(shí)空、數(shù)據(jù)犯罪熱點(diǎn)矩陣以及數(shù)據(jù)犯罪關(guān)聯(lián)聚類規(guī)則和數(shù)據(jù)犯罪因果映射等數(shù)據(jù)犯罪情勢(shì)的生存與態(tài)勢(shì)發(fā)展規(guī)律。偵查人員借助不同機(jī)器學(xué)習(xí)算法的運(yùn)算優(yōu)勢(shì),深入挖掘多源異構(gòu)數(shù)據(jù)與數(shù)據(jù)犯罪情勢(shì)之間潛在的各種關(guān)聯(lián)規(guī)則,再利用機(jī)器學(xué)習(xí)算法構(gòu)建數(shù)據(jù)犯罪情勢(shì)生存與態(tài)勢(shì)發(fā)展的預(yù)測(cè)流程模型,從而幫助其挖掘數(shù)據(jù)犯罪情勢(shì)的觸發(fā)概率、數(shù)據(jù)犯罪情勢(shì)的輻射蔓延以及數(shù)據(jù)犯罪情勢(shì)發(fā)展的不平衡結(jié)構(gòu)等發(fā)展規(guī)律。
第三,數(shù)據(jù)運(yùn)算挖掘選擇模式。數(shù)據(jù)運(yùn)算挖掘選擇模式主要是針對(duì)不同數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的預(yù)置價(jià)值需求,抽象出需要運(yùn)用不同機(jī)器學(xué)習(xí)算法進(jìn)行解決的運(yùn)算問題,進(jìn)而幫助偵查人員選擇和確定最佳的機(jī)器學(xué)習(xí)運(yùn)算挖掘算法。首先,按照流程模型構(gòu)建的框架要求選擇相適應(yīng)的機(jī)器學(xué)習(xí)算法。其中,無監(jiān)督學(xué)習(xí)的機(jī)器學(xué)習(xí)算法包括分層聚類算法、K 均值算法、離群異值分解算法等,而監(jiān)督學(xué)習(xí)的機(jī)器學(xué)習(xí)算法則主要有人工神經(jīng)網(wǎng)絡(luò)、決策樹算法、貝葉斯分類算法等⑥參見商城、康沛林、劉智攀:《基于機(jī)器學(xué)習(xí)勢(shì)函數(shù)的原子模擬軟件的開發(fā)及應(yīng)用》,載《硅酸鹽學(xué)報(bào)》2023 年第2 期,第476-487 頁(yè)。。其次,根據(jù)選擇的機(jī)器學(xué)習(xí)算法對(duì)多源異構(gòu)數(shù)據(jù)展開運(yùn)算挖掘,重點(diǎn)挖掘數(shù)據(jù)距離、數(shù)據(jù)連邊、數(shù)據(jù)路徑以及數(shù)據(jù)加權(quán)權(quán)重等數(shù)據(jù)序列特征,并形成數(shù)據(jù)運(yùn)算挖掘所需的數(shù)據(jù)訓(xùn)練集。再次,利用機(jī)器學(xué)習(xí)算法分別對(duì)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)偏好選擇流程、數(shù)據(jù)犯罪情勢(shì)生存與態(tài)勢(shì)發(fā)展預(yù)測(cè)流程以及流程模型評(píng)估等進(jìn)行運(yùn)算訓(xùn)練,直到所有運(yùn)算訓(xùn)練全部符合機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的評(píng)價(jià)指標(biāo)參數(shù)為止。最后,依據(jù)機(jī)器學(xué)習(xí)對(duì)數(shù)據(jù)訓(xùn)練集的運(yùn)算結(jié)果,構(gòu)建機(jī)器學(xué)習(xí)算法的數(shù)據(jù)測(cè)試集,并將其運(yùn)算結(jié)果應(yīng)用于數(shù)據(jù)情報(bào)偵查預(yù)測(cè)即可。
由于易受到多源異構(gòu)數(shù)據(jù)的類別形態(tài)、機(jī)器學(xué)習(xí)算法的選取優(yōu)勢(shì)、數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的預(yù)置價(jià)值需求等主客觀條件的影響,為增強(qiáng)機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的客觀性和精確性,迫切需要構(gòu)建機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的評(píng)價(jià)指標(biāo)。這不僅對(duì)構(gòu)建機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的框架與模式具有修正的檢驗(yàn)作用,而且還對(duì)探討機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的應(yīng)用方法具有驗(yàn)證的反饋價(jià)值。
敏感度分析評(píng)價(jià)指標(biāo)主要應(yīng)用于對(duì)機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的結(jié)果解釋,是被建立在機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)框架與模式的局部變量測(cè)量或局部梯度評(píng)估之中。如果偵查人員挖掘獲取數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的梯度值越接近關(guān)聯(lián)規(guī)則的指標(biāo)系數(shù),那么所獲得結(jié)果就越符合數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的價(jià)值需求,并且還能解釋機(jī)器學(xué)習(xí)算法中梯度函數(shù)、變量函數(shù)以及解釋函數(shù)等之間的敏感度。同時(shí),偵查人員還可引入基于貝葉斯分類器的敏感度分析評(píng)價(jià)指標(biāo)。在貝葉斯分類器的敏感度分析評(píng)價(jià)指標(biāo)中,解釋函數(shù)與解釋向量的運(yùn)算維度都是相同的,且數(shù)據(jù)分類器還將多源異構(gòu)數(shù)據(jù)劃分為不同的挖掘變量。其中,解釋向量在每個(gè)多源異構(gòu)數(shù)據(jù)上都被預(yù)定義為獨(dú)立的向量場(chǎng),該向量場(chǎng)代表數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的不同預(yù)置價(jià)值需求,從而幫助偵查人員解釋機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的運(yùn)行結(jié)果。
模型評(píng)價(jià)指標(biāo)主要包括數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的查準(zhǔn)率、查全率、靈敏率以及特效率和整體準(zhǔn)確率所構(gòu)成的混淆評(píng)價(jià)矩陣⑦參見衛(wèi)安妮、趙寧、張志堅(jiān):《基于機(jī)器學(xué)習(xí)對(duì)串聯(lián)排隊(duì)系統(tǒng)等待時(shí)間的預(yù)測(cè)》,載《西南師范大學(xué)學(xué)報(bào)(自然科學(xué)版)》2022 年第12 期,第11-21 頁(yè)。。在模型評(píng)價(jià)指標(biāo)中,機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的查準(zhǔn)率與查全率、靈敏率與特效率均屬于反向異配屬性關(guān)系。為提高模型評(píng)價(jià)指標(biāo)的精準(zhǔn)性,偵查人員可將機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的查全率和查準(zhǔn)率分別設(shè)為橫軸、縱軸,然后結(jié)合數(shù)據(jù)犯罪情勢(shì)生存與態(tài)勢(shì)發(fā)展預(yù)測(cè)流程模型的查準(zhǔn)率與查全率、靈敏率與特效率所占比,運(yùn)算機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的查準(zhǔn)率與查全率曲線,即P-R 曲線。然而,在實(shí)際的模型評(píng)價(jià)過程中,機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的應(yīng)變量評(píng)價(jià)指標(biāo)會(huì)產(chǎn)生一個(gè)預(yù)測(cè)概率系數(shù),需將其與提前預(yù)置的分類閾值進(jìn)行比較。如果預(yù)測(cè)概率系數(shù)大于預(yù)置的分類閾值,那么說明所獲數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的結(jié)果為正例現(xiàn)象;反之,則屬于反例現(xiàn)象。
為實(shí)現(xiàn)機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的定性與定量評(píng)價(jià)分析,偵查人員可將風(fēng)險(xiǎn)預(yù)測(cè)指數(shù)評(píng)價(jià)指標(biāo)表示為,其中Wb表示機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的穩(wěn)定基準(zhǔn)值,t表示采取機(jī)器學(xué)習(xí)算法挖掘數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的收斂耗時(shí),Wtotal表示機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的輸出指數(shù),M 表示機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的預(yù)置價(jià)值需求。同時(shí),為強(qiáng)化風(fēng)險(xiǎn)預(yù)測(cè)指數(shù)評(píng)價(jià)指標(biāo)的精確性,偵查人員還可利用機(jī)器學(xué)習(xí)算法對(duì)風(fēng)險(xiǎn)預(yù)測(cè)指數(shù)評(píng)價(jià)指標(biāo)的獲取過程進(jìn)行迭代運(yùn)算,從而獲得風(fēng)險(xiǎn)預(yù)測(cè)指數(shù)評(píng)價(jià)指標(biāo)的加權(quán)權(quán)重系數(shù)。顯然,偵查人員可根據(jù)機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)中存在的不同風(fēng)險(xiǎn)預(yù)測(cè)類別,通過運(yùn)算風(fēng)險(xiǎn)預(yù)測(cè)指數(shù)評(píng)價(jià)指標(biāo)的加權(quán)權(quán)重系數(shù),便可獲得具有精確性的風(fēng)險(xiǎn)預(yù)測(cè)指數(shù)評(píng)價(jià)指標(biāo)。
其一,將機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的閾值分為預(yù)測(cè)值和真實(shí)值兩部分,并利用不同機(jī)器學(xué)習(xí)算法對(duì)選擇決定系數(shù)、平均絕對(duì)誤差、開方均方誤差等評(píng)價(jià)系數(shù)進(jìn)行運(yùn)算挖掘。其二,預(yù)置性能評(píng)價(jià)指標(biāo)系數(shù)。將選擇決定系數(shù)的最大閾值設(shè)為1,越接近1 就說明機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的質(zhì)量和可信度越優(yōu)。例如,支持向量回歸和人工神經(jīng)網(wǎng)絡(luò)算法的選擇決定系數(shù)均在0.9 以上,就說明二者的性能可信度高,且二者的MAE 值、RMSE 值等評(píng)價(jià)指標(biāo)也很優(yōu)越。如果在回歸模型性能評(píng)價(jià)指標(biāo)中MAE 值、RMSE 值的閾值偏差越小,那么就說明機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的運(yùn)行結(jié)果越接近于應(yīng)然價(jià)值。顯然,回歸模型性能評(píng)價(jià)指標(biāo)具有很強(qiáng)的擬合性。這不僅有利于增強(qiáng)機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的精確度,而且還有利于提升其算法預(yù)測(cè)的高可信度。
機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的實(shí)質(zhì)是通過機(jī)器學(xué)習(xí)算法挖掘多源異構(gòu)數(shù)據(jù)與數(shù)據(jù)犯罪情勢(shì)之間潛在的各種關(guān)聯(lián)規(guī)則,幫助偵查人員精準(zhǔn)掌握數(shù)據(jù)犯罪情勢(shì)生存與態(tài)勢(shì)發(fā)展的趨勢(shì)規(guī)律,從而實(shí)現(xiàn)機(jī)器學(xué)習(xí)算法引導(dǎo)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的一種新型數(shù)據(jù)情報(bào)偵查方法。這不僅能夠幫助偵查人員降低對(duì)多源異構(gòu)數(shù)據(jù)情報(bào)挖掘研判的過擬合現(xiàn)象,增強(qiáng)挖掘數(shù)據(jù)犯罪情勢(shì)關(guān)聯(lián)數(shù)理關(guān)系的精確性,而且還能夠幫助其降低數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的偏差率和提升機(jī)器學(xué)習(xí)循證數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的魯棒性,創(chuàng)新和拓展打擊數(shù)據(jù)犯罪情勢(shì)的全鏈條偵查模式。
深度神經(jīng)網(wǎng)絡(luò)算法主要是依據(jù)不同數(shù)據(jù)的層次序列特征,運(yùn)算挖掘各數(shù)據(jù)個(gè)體所對(duì)應(yīng)神經(jīng)網(wǎng)絡(luò)模型的加權(quán)權(quán)重和閾值指標(biāo),從而獲得兩者之間親和濃度的一種機(jī)器學(xué)習(xí)算法⑧參見劉繼承、吳昊、王文偉,等:《結(jié)合深度神經(jīng)網(wǎng)絡(luò)的特征選擇算法研究》,載《武漢理工大學(xué)學(xué)報(bào)(信息與管理工程版)》2023 年第1 期,第49-53+60 頁(yè)。。
首先,獲取數(shù)據(jù)慣性權(quán)值和形成預(yù)測(cè)抗體群。偵查人員需利用粒子群的更新運(yùn)算方式預(yù)置多源異構(gòu)數(shù)據(jù)的數(shù)據(jù)慣性權(quán)值和數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的粒子維度,形成數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的抗體群。其次,計(jì)算預(yù)測(cè)親和濃度。采取預(yù)測(cè)刪除和預(yù)測(cè)增值的方式對(duì)預(yù)測(cè)抗體群進(jìn)行迭代處理,再利用粒子群優(yōu)化算法挖掘獲取不同數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的親和濃度。再次,高變異克隆處理。偵查人員可采用抗體復(fù)制和高親和力的方法對(duì)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的粒子個(gè)體進(jìn)行高維變異處理,再利用人工免疫算法對(duì)其變異程度的系數(shù)進(jìn)行運(yùn)算挖掘,進(jìn)而獲取不同數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的正負(fù)高斯函數(shù)。最后,獲取最佳預(yù)測(cè)效益值。對(duì)不同數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的正負(fù)高斯函數(shù)進(jìn)行全局性的搜索和降維排序,如果輸出的結(jié)果為全局性最佳數(shù)據(jù)情報(bào)偵查預(yù)測(cè),那么結(jié)束運(yùn)算;反之,則需要從重新計(jì)算預(yù)測(cè)親和濃度,直至所有多源異構(gòu)數(shù)據(jù)被迭代運(yùn)算結(jié)束為止。顯然,深度神經(jīng)網(wǎng)絡(luò)算法不僅能夠幫助偵查人員充分挖掘不同多源異構(gòu)數(shù)據(jù)的數(shù)據(jù)慣性權(quán)值,而且還能夠幫助其快速獲取不同數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的前景效益值,從而提升機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的收斂速度。
融合蟻群算法主要是通過選取確定需要進(jìn)行挖掘的目標(biāo)數(shù)據(jù),利用數(shù)據(jù)主成分算法對(duì)目標(biāo)數(shù)據(jù)進(jìn)行數(shù)據(jù)區(qū)域?qū)傩缘年P(guān)聯(lián)聚類,進(jìn)而挖掘獲取不同目標(biāo)數(shù)據(jù)之間關(guān)聯(lián)規(guī)則的一種分布式機(jī)器學(xué)習(xí)算法。
第一,構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)。先對(duì)各種多源異構(gòu)數(shù)據(jù)采取數(shù)據(jù)集成和數(shù)據(jù)規(guī)約等預(yù)處理,根據(jù)數(shù)據(jù)頻繁項(xiàng)目的聚類屬性將其存儲(chǔ)到數(shù)據(jù)倉(cāng)庫(kù)中。第二,數(shù)據(jù)主成分運(yùn)算。偵查人員可利用SPSS 軟件對(duì)數(shù)據(jù)倉(cāng)庫(kù)中不同目標(biāo)數(shù)據(jù)進(jìn)行數(shù)據(jù)主成分挖掘分析,重點(diǎn)關(guān)注重復(fù)數(shù)據(jù)、冗余數(shù)據(jù)、離群數(shù)據(jù)等異常數(shù)據(jù)的成分構(gòu)成⑨參見張怡平、金文玲、董晨昱,等:《用于高維時(shí)序數(shù)據(jù)預(yù)測(cè)的非同步尺度主成分分析》,載《山西大學(xué)學(xué)報(bào)(自然科學(xué)版)》2023 年第2 期,第321-325 頁(yè)。。鑒于不同多源數(shù)據(jù)在類別形態(tài)等方面的差異性,偵查人員需將其進(jìn)行融合轉(zhuǎn)換,使其形成統(tǒng)一標(biāo)準(zhǔn)的數(shù)據(jù)規(guī)約格式,然后再采取數(shù)據(jù)主成分的運(yùn)算挖掘。第三,測(cè)算關(guān)聯(lián)目標(biāo)路徑閾值。偵查人員需先構(gòu)建一個(gè)多源異構(gòu)數(shù)據(jù)與數(shù)據(jù)犯罪情勢(shì)之間的關(guān)聯(lián)規(guī)則庫(kù),以其坐標(biāo)中心為數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的關(guān)聯(lián)目標(biāo),挖掘不同多源異構(gòu)數(shù)據(jù)與關(guān)聯(lián)目標(biāo)之間的路徑閾值。第四,預(yù)設(shè)數(shù)據(jù)蟻群系數(shù)閾值。為提升融合蟻群算法挖掘數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的精確性,需將數(shù)據(jù)蟻群系數(shù)a 和b 的閾值區(qū)間設(shè)定為[0,1]。第五,獲取預(yù)測(cè)選擇概率。偵查人員需將多源異構(gòu)數(shù)據(jù)的親和濃度設(shè)為1,利用蟻群算法中螞蟻覓食的原理挖掘最佳數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的選擇概率⑩參見圣文順、徐愛萍、徐劉晶:《基于蟻群算法與遺傳算法的TSP 路徑規(guī)劃仿真》,載《計(jì)算機(jī)仿真》2022 年第12期,第398-402+412 頁(yè)。,增強(qiáng)機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)運(yùn)行效果的正向同配屬性。第六,預(yù)測(cè)評(píng)估與修正。偵查人員可利用XpertRule Miner 軟件對(duì)獲取的數(shù)據(jù)情報(bào)偵查預(yù)測(cè)結(jié)果進(jìn)行評(píng)估與修正,如果結(jié)果為正向同配屬性關(guān)系,那么就說明符合機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的價(jià)值需求;反之,則需返回至第二步重新運(yùn)算挖掘,直至所有多源異構(gòu)數(shù)據(jù)被迭代運(yùn)算結(jié)束為止。
AHP 權(quán)重決策樹算法主要是依據(jù)不同數(shù)據(jù)迭代運(yùn)算關(guān)聯(lián)的決策樹結(jié)構(gòu)性規(guī)則,通過運(yùn)算分析不同數(shù)據(jù)之間的關(guān)聯(lián)挖掘矩陣,從而獲取全局最佳數(shù)據(jù)決策優(yōu)解的一種權(quán)向量機(jī)器學(xué)習(xí)算法?參見高虹雷、門昌騫、王文劍:《多核貝葉斯優(yōu)化的模型決策樹算法》,載《國(guó)防科技大學(xué)學(xué)報(bào)》2022 年第3 期,第67-76 頁(yè)。。
第一,預(yù)置預(yù)測(cè)層次目標(biāo)。偵查人員需將機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的預(yù)置價(jià)值需求進(jìn)行目標(biāo)分解,使其形成數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的層次目標(biāo)。第二,構(gòu)建預(yù)測(cè)層級(jí)體系。為使運(yùn)算挖掘結(jié)果與預(yù)測(cè)的層次目標(biāo)具有正向同配的屬性關(guān)系,依據(jù)多源異構(gòu)數(shù)據(jù)與數(shù)據(jù)犯罪情勢(shì)之間的關(guān)聯(lián)規(guī)則,需將預(yù)測(cè)的層次目標(biāo)再分解為不同的層級(jí)體系。第三,構(gòu)建預(yù)測(cè)的挖掘矩陣。依據(jù)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)層次目標(biāo)和層級(jí)體系的不同價(jià)值作用,偵查人員需將兩者進(jìn)行分別評(píng)價(jià)賦分,并構(gòu)建以多源異構(gòu)數(shù)據(jù)為核心的數(shù)據(jù)情報(bào)偵查預(yù)測(cè)挖掘矩陣。第四,優(yōu)化AHP 權(quán)重參數(shù)。在對(duì)多源異構(gòu)數(shù)據(jù)進(jìn)行決策樹生成和決策樹修剪過程中?參見于安池、儲(chǔ)茂祥、楊永輝,等:《具有強(qiáng)化學(xué)習(xí)策略的決策樹算法》,載《合肥工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版)》2021 年第5 期,第616-620 頁(yè)。,往往會(huì)出現(xiàn)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的局部最優(yōu)解現(xiàn)象。第五,獲取預(yù)測(cè)的判斷矩陣。依據(jù)優(yōu)化后的AHP 權(quán)重參數(shù),偵查人員可利用函數(shù)公式對(duì)不同多源異構(gòu)數(shù)據(jù)進(jìn)行聚類挖掘,進(jìn)而獲取不同數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的判斷矩陣。第六,檢驗(yàn)和優(yōu)化預(yù)測(cè)結(jié)果。一方面,檢驗(yàn)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)結(jié)果與其預(yù)置價(jià)值需求之間的關(guān)系,重點(diǎn)檢驗(yàn)兩者是否存在正向同配屬性關(guān)系;另一方面,將數(shù)據(jù)情報(bào)偵查預(yù)測(cè)結(jié)果與數(shù)據(jù)犯罪情勢(shì)關(guān)聯(lián)規(guī)則、數(shù)據(jù)情報(bào)偵查預(yù)測(cè)判斷矩陣等進(jìn)行比較,如果存在局部偏差或全局差異,那么就需要及時(shí)進(jìn)行修正和優(yōu)化。
圖卷積網(wǎng)絡(luò)多源算法主要是通過對(duì)多源異構(gòu)數(shù)據(jù)中不同數(shù)據(jù)節(jié)點(diǎn)相似度進(jìn)行卷積運(yùn)算挖掘的一種網(wǎng)絡(luò)機(jī)器學(xué)習(xí)算法,具有運(yùn)算魯棒性強(qiáng)、挖掘收斂速度快等價(jià)值優(yōu)勢(shì)。
第一,數(shù)據(jù)預(yù)處理。偵查人員需先對(duì)多源異構(gòu)數(shù)據(jù)采取數(shù)據(jù)集成和數(shù)據(jù)規(guī)約等預(yù)處理,使其形成數(shù)據(jù)頻繁項(xiàng)目集合的標(biāo)準(zhǔn)RDF 格式。第二,構(gòu)建數(shù)據(jù)運(yùn)算挖掘拓?fù)鋱D。以數(shù)據(jù)頻繁項(xiàng)目集合的標(biāo)準(zhǔn)RDF 格式為基礎(chǔ),偵查人員可利用多源稀疏數(shù)據(jù)矩陣來挖掘多源異構(gòu)數(shù)據(jù)中不同數(shù)據(jù)節(jié)點(diǎn)之間的加權(quán)權(quán)重系數(shù),進(jìn)而構(gòu)建具有正向型屬性的數(shù)據(jù)運(yùn)算挖掘拓?fù)鋱D。第三,計(jì)算數(shù)據(jù)實(shí)例化張量。對(duì)已構(gòu)建的多源異構(gòu)數(shù)據(jù)運(yùn)算挖掘拓?fù)鋱D采取實(shí)例化張量計(jì)算,計(jì)算重點(diǎn)包括數(shù)據(jù)節(jié)點(diǎn)相似度、數(shù)據(jù)節(jié)點(diǎn)矩陣、數(shù)據(jù)節(jié)點(diǎn)標(biāo)簽等。第四,構(gòu)建圖卷積網(wǎng)絡(luò)多源算法模型。為避免出現(xiàn)局部最優(yōu)解、數(shù)據(jù)過擬合等異?,F(xiàn)象,偵查人員選取LeakyRelu 算法對(duì)多源異構(gòu)數(shù)據(jù)進(jìn)行非線性運(yùn)算挖掘,再利用Softmax 函數(shù)公式對(duì)其進(jìn)行圖卷積網(wǎng)絡(luò)多源算法模型構(gòu)建,進(jìn)而提升圖卷積網(wǎng)絡(luò)多源算法挖掘的客觀性。第五,構(gòu)建數(shù)據(jù)訓(xùn)練集。依據(jù)多源異構(gòu)數(shù)據(jù)實(shí)例化張量的計(jì)算結(jié)果,將其輸入到已構(gòu)建的圖卷積網(wǎng)絡(luò)多源算法模型中,并以其相鄰矩陣和特征矩陣為主要依據(jù)構(gòu)建數(shù)據(jù)頻繁項(xiàng)目聚類集,所獲結(jié)果即為所需的數(shù)據(jù)訓(xùn)練集。第六,運(yùn)算數(shù)據(jù)測(cè)試集。依據(jù)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的相鄰矩陣和特征矩陣結(jié)果,偵查人員需要將各種多源異構(gòu)數(shù)據(jù)分別代入數(shù)據(jù)測(cè)試集進(jìn)行運(yùn)算挖掘,重點(diǎn)挖掘不同多源異構(gòu)數(shù)據(jù)與數(shù)據(jù)犯罪情勢(shì)之間潛在的關(guān)聯(lián)規(guī)則,輸出結(jié)果即為數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的挖掘結(jié)果。
量子機(jī)器進(jìn)化算法主要是利用量子比特算法挖掘分析不同多源異構(gòu)數(shù)據(jù)之間的概率幅閾值,使其相互之間能夠被快速地疊加融合,從而解決關(guān)聯(lián)規(guī)則構(gòu)建復(fù)雜、模糊優(yōu)勢(shì)關(guān)系差值少等的一種綜合性機(jī)器學(xué)習(xí)算法。
異構(gòu)傳感融合目標(biāo)算法主要是通過提取數(shù)據(jù)空間特征、數(shù)據(jù)閾值變換特征等多源異構(gòu)數(shù)據(jù)的目標(biāo)序列特征,從而挖掘和揭示不同多源異構(gòu)數(shù)據(jù)目標(biāo)特征本質(zhì)屬性的一種融合性機(jī)器學(xué)習(xí)算法。
首先,多源異構(gòu)數(shù)據(jù)融合。多源異構(gòu)數(shù)據(jù)融合包括多源異構(gòu)數(shù)據(jù)的目標(biāo)特性融合和目標(biāo)狀態(tài)融合兩部分?參見趙春霞、趙營(yíng)穎、宋學(xué)坤:《基于頻繁項(xiàng)集的多源異構(gòu)數(shù)據(jù)并行聚類算法》,載《濟(jì)南大學(xué)學(xué)報(bào)(自然科學(xué)版)》2022 年第4 期,第440-443+451 頁(yè)。,偵查人員需先采取數(shù)據(jù)集成和數(shù)據(jù)規(guī)約等數(shù)據(jù)預(yù)處理技術(shù)對(duì)多源異構(gòu)數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,再利用數(shù)據(jù)傳感跟蹤技術(shù)挖掘不同多源異構(gòu)數(shù)據(jù)之間的目標(biāo)特性和目標(biāo)狀態(tài),并將兩者按照數(shù)據(jù)傳感跟蹤關(guān)聯(lián)規(guī)則進(jìn)行交互融合?參見劉運(yùn):《基于循環(huán)神經(jīng)網(wǎng)絡(luò)的多源異構(gòu)大數(shù)據(jù)融合模型構(gòu)建》,載《內(nèi)蒙古民族大學(xué)學(xué)報(bào)(自然科學(xué)版)》2021 年第3 期,第204-210 頁(yè)。。其次,提取數(shù)據(jù)目標(biāo)序列特征。偵查人員可采取直方圖頻譜、傅里葉頻譜、圖像灰度頻譜等數(shù)據(jù)目標(biāo)特征技術(shù),運(yùn)算挖掘不同多源異構(gòu)數(shù)據(jù)之間的數(shù)據(jù)識(shí)別目標(biāo)特征和數(shù)據(jù)閾值變換特征等數(shù)據(jù)目標(biāo)序列特征?參見隗寒冰、白林:《基于多源異構(gòu)信息融合的智能汽車目標(biāo)檢測(cè)算法》,載《重慶交通大學(xué)學(xué)報(bào)(自然科學(xué)版)》2021 年第8 期,第140-149 頁(yè)。,促使每一個(gè)不同數(shù)據(jù)目標(biāo)序列特征都至少包含一個(gè)與其他數(shù)據(jù)目標(biāo)序列特征存在本質(zhì)差異的描述屬性。再次,計(jì)算數(shù)據(jù)情報(bào)偵查預(yù)測(cè)權(quán)重概率。偵查人員可采取目標(biāo)沖突閾值來對(duì)不同數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的權(quán)重概率進(jìn)行檢驗(yàn)評(píng)估,如果二者之間的權(quán)重概率目標(biāo)沖突閾值差異較大,那么差異較大的一方為最佳數(shù)據(jù)情報(bào)偵查預(yù)測(cè);如果二者之間權(quán)重概率的目標(biāo)沖突閾值相同或接近,那么則需采取關(guān)聯(lián)聚類的權(quán)重沖突融合處理即可。最后,數(shù)據(jù)情報(bào)偵查預(yù)測(cè)修正。為確保數(shù)據(jù)情報(bào)偵查預(yù)測(cè)結(jié)果的精確性,必然需要對(duì)其進(jìn)行反復(fù)的檢驗(yàn)和修正。偵查人員對(duì)利用異構(gòu)傳感融合目標(biāo)算法挖掘獲取的不同數(shù)據(jù)情報(bào)偵查預(yù)測(cè)經(jīng)過運(yùn)行檢驗(yàn),重點(diǎn)對(duì)多源異構(gòu)數(shù)據(jù)融合、數(shù)據(jù)目標(biāo)序列特征挖掘、數(shù)據(jù)情報(bào)偵查預(yù)測(cè)權(quán)重概率等進(jìn)行檢驗(yàn)和修正,進(jìn)而確保機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的客觀性和準(zhǔn)確性。因此,異構(gòu)傳感融合目標(biāo)算法不僅能夠幫助偵查人員縮短機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)預(yù)置價(jià)值與運(yùn)行效果之間的差異性,而且還能夠全面提升機(jī)器學(xué)習(xí)數(shù)據(jù)情報(bào)偵查預(yù)測(cè)的精確性和魯棒性。