熊建英
(江西警察學(xué)院安全管理系,南昌 330003)
大數(shù)據(jù)時(shí)代,不僅具備海量數(shù)據(jù)的融合基礎(chǔ),也擁有超強(qiáng)的大數(shù)據(jù)處理能力,人們利用從巨量數(shù)據(jù)中挖掘出相關(guān)關(guān)系快速解決了很多問題,取得了前所未有的成果,這使得學(xué)術(shù)界提出了在大數(shù)據(jù)時(shí)代要用相關(guān)性代替因果性的思維變革。例如有學(xué)者提出“大數(shù)據(jù)時(shí)代,必須拋棄對(duì)因果關(guān)系的執(zhí)著,轉(zhuǎn)而關(guān)注簡(jiǎn)單的相關(guān)性”[1]、“大數(shù)據(jù)時(shí)代,不用清楚知道為什么,只需要知道是什么”、“現(xiàn)象背后的原因不重要,讓數(shù)據(jù)自己發(fā)聲”“讓數(shù)據(jù)說話、只需要利用相關(guān)性知道數(shù)據(jù)闡述的高概率結(jié)果是什么”等。[2][3]但在人們一般思維中,如果只是清楚“是什么”,而不過問“為什么”,這又似乎推翻了自古以來的思維慣例,也給我們做決策和理解現(xiàn)實(shí)的基本思維模式帶來了挑戰(zhàn)。同樣在大數(shù)據(jù)發(fā)展迅速的今天,警務(wù)工作中如何正確看待大數(shù)據(jù)的相關(guān)思維,是否要考慮因果規(guī)律,筆者希望從兩種思維的本質(zhì)與差異展開探討,聯(lián)系公安實(shí)戰(zhàn)工作,可以給警務(wù)工作人員一些啟示。
人們習(xí)慣的思路是“做出假設(shè)、建構(gòu)模型、數(shù)據(jù)證實(shí)、優(yōu)化模型、預(yù)測(cè)未來”,而這種通過“大膽假設(shè)、小心求證”的思維也被稱為機(jī)械思維。利用這種思維方式我們也取得了很多成果,例如,牛頓就用力學(xué)三定律和萬有引力定律幾個(gè)簡(jiǎn)單明了的公式說明了大千世界宇宙萬物的運(yùn)動(dòng)規(guī)律。機(jī)械思維最重要的幾點(diǎn)是:公式確定、簡(jiǎn)明、普適,這也就是說觀察的問題中,有確定的自變量、且因變量和自變量之間有明確的作用關(guān)系、作用關(guān)系也存在普遍性。所以傳統(tǒng)的機(jī)械思維的核心思想是確定性和因果關(guān)系,即事情一旦發(fā)生,必然會(huì)產(chǎn)生相應(yīng)結(jié)果,也一定有確定的模型解釋發(fā)生的原因。[4]
而到了數(shù)據(jù)時(shí)代,可用的數(shù)據(jù)量劇增,數(shù)據(jù)驅(qū)動(dòng)方法的優(yōu)勢(shì)越來越明顯。由于各個(gè)領(lǐng)域數(shù)據(jù)不斷向外擴(kuò)展,使得數(shù)據(jù)開始出現(xiàn)交叉,各個(gè)維度的數(shù)據(jù)從點(diǎn)和線漸漸連成了網(wǎng),數(shù)據(jù)之間關(guān)聯(lián)性增強(qiáng),也就形成了大數(shù)據(jù)。面對(duì)日益復(fù)雜的社會(huì),時(shí)刻存在不確定性,而數(shù)據(jù)中包含的信息以及數(shù)據(jù)之間的關(guān)聯(lián)性可以幫助人們消除不確定性。我們很難從海量、多維、千絲萬縷的數(shù)據(jù)中抽取出確定的決定因素、也無法給出精確的模型去匹配,所以也逐漸產(chǎn)生使用數(shù)據(jù)強(qiáng)關(guān)聯(lián)性代替過去用因果關(guān)系去解決問題的傾向。[4]
大數(shù)據(jù)具有特有的4V特征如圖1所示,即數(shù)量(Volume)大,網(wǎng)絡(luò)時(shí)代的產(chǎn)生的數(shù)據(jù)總量和增量巨大;種類(Variety)雜,數(shù)據(jù)來源可以是互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、智能設(shè)備等多源信息,且數(shù)據(jù)類型可以是非結(jié)構(gòu)化、半結(jié)構(gòu)化、結(jié)構(gòu)化形式的數(shù)據(jù);速度(Velocity)快,數(shù)據(jù)增長(zhǎng)速度快、對(duì)數(shù)據(jù)處理的響應(yīng)時(shí)間也要求高;價(jià)值(Value)密度低,有價(jià)值的數(shù)據(jù)通常被隱藏在海量的數(shù)據(jù)之中,需要對(duì)數(shù)據(jù)進(jìn)行整理、分析、挖掘才能找到有價(jià)值的信息。[5]
圖1 大數(shù)據(jù)4V特征
人們總說“思維決定命運(yùn)”,所以在大數(shù)據(jù)產(chǎn)業(yè)發(fā)展過程中,無論是政府部門的決策者、企業(yè)組織的管理者,還是普通人員都需要具備一定的大數(shù)據(jù)思維。而大數(shù)據(jù)思維則是大數(shù)據(jù)時(shí)代的產(chǎn)物,即具有數(shù)據(jù)思維的一般共性,也由于其自身的4v特征,使得在思維方式上也呈現(xiàn)出其獨(dú)有的特征。由于數(shù)量大、更新快,且多維度信息也可以相互消除一定不確定,使得大數(shù)據(jù)可以更全面反映真實(shí)世界,更容易通過挖掘出數(shù)據(jù)之間相關(guān)性用來觀察現(xiàn)實(shí)社會(huì)的規(guī)律。正如舍恩伯格在 《大數(shù)據(jù)時(shí)代》將大數(shù)據(jù)思維方式歸結(jié)三個(gè)方面:可以利用更全面的數(shù)據(jù)替代隨機(jī)樣本,允許數(shù)據(jù)的混雜性,而不追求精確性,分析事物看重事物的相關(guān)關(guān)系,而不是持續(xù)追求難以捉摸的因果關(guān)系。[1]
相關(guān)關(guān)系:也稱聯(lián)想關(guān)系、類緣關(guān)系、非等級(jí)關(guān)系。是指研究對(duì)象中的某個(gè)數(shù)據(jù)發(fā)生變化時(shí),其他數(shù)據(jù)會(huì)隨著發(fā)生變化。這種關(guān)系的核心是經(jīng)驗(yàn)的歸納,是表示客觀現(xiàn)象之間確實(shí)存在某個(gè)現(xiàn)象的數(shù)據(jù)存在另一現(xiàn)象的數(shù)據(jù)與之對(duì)應(yīng),但數(shù)據(jù)不一定有嚴(yán)格的對(duì)應(yīng)依存關(guān)系。[6][7]相關(guān)關(guān)系可以根據(jù)人的歷史行為數(shù)據(jù)來預(yù)測(cè)人的未來行為數(shù)據(jù),至于行為人為什么會(huì)做出這些行為,相關(guān)關(guān)系則不能進(jìn)行解釋,也不關(guān)心這種行為背后的機(jī)制。
因果關(guān)系: 是揭示客觀世界中事件之間的作用關(guān)系,其中先發(fā)生的事件被認(rèn)為是后發(fā)生事件的原因,后發(fā)生事件是先發(fā)生事件的結(jié)果。這種關(guān)系的核心是理性演繹,是反映事物之間前后相繼的制約關(guān)系。[6][7]“事出必有因”是人們探索世界的一種本性,人們也習(xí)慣從“為什么”開始解決問題,所以因果關(guān)系也成為人類理解世界、改變世界的基礎(chǔ)。
隨著大數(shù)據(jù)技術(shù)的深入應(yīng)用,哲學(xué)家也開始關(guān)注大數(shù)據(jù)問題,從本體論、認(rèn)識(shí)論和價(jià)值論多方面對(duì)大數(shù)據(jù)進(jìn)行研究,并形成了大數(shù)據(jù)哲學(xué)的研究方向。而在哲學(xué)界,很多學(xué)者對(duì)因果關(guān)系與相關(guān)關(guān)系都提出不同的觀點(diǎn),兩者之間差別也一直是一個(gè)有爭(zhēng)議的話題。典型的觀點(diǎn)可以歸納為以下三種:[8][9][10]
1.相關(guān)關(guān)系不是因果關(guān)系,持有這種觀點(diǎn)的代表性學(xué)者如大數(shù)據(jù)之父維克托·邁爾·舍恩伯格提出“大數(shù)據(jù)不是因果關(guān)系,而是相關(guān)關(guān)系”;認(rèn)為從數(shù)據(jù)中找到相關(guān)與從相關(guān)關(guān)系再找到因果關(guān)系不是一回事,即“相關(guān)關(guān)系并不意味著因果關(guān)系”。
2.因果關(guān)系是特殊的相關(guān)關(guān)系,學(xué)者提出“因果關(guān)系不是特殊的關(guān)系,而只是一類相關(guān)關(guān)系”;“不存在沒有因果關(guān)系的相關(guān)關(guān)系”,而學(xué)者指出“大數(shù)據(jù)不僅不是對(duì)因果關(guān)系的否定,反而是可以重新刻畫描述因果關(guān)系的手段”。
3.區(qū)分因果關(guān)系與相關(guān)關(guān)系是個(gè)偽命題。持有這種觀點(diǎn)的學(xué)者認(rèn)為,大數(shù)據(jù)時(shí)代我們需要做的事情不是探究?jī)烧卟顒e,而是“如何從大數(shù)據(jù)的相關(guān)關(guān)系中推斷出因果關(guān)系”。
1.兩者分析路徑不一樣
相關(guān)關(guān)系是通過經(jīng)驗(yàn)歸納或大量數(shù)據(jù)統(tǒng)計(jì)來識(shí)別有用的關(guān)聯(lián)特征對(duì)某一現(xiàn)象進(jìn)行解釋,如事件A與事件B經(jīng)常同時(shí)發(fā)生,我們一旦看到事件B發(fā)生后,可以預(yù)測(cè)事件A會(huì)比較大概率發(fā)生,那么可以推斷A和B之間存在相關(guān)關(guān)系。A和B之間是否存在因果關(guān)系,則是要通過人的理性邏輯分析,需要分析事件發(fā)生的作用關(guān)系。如A引起B(yǎng)發(fā)生,則A是因,B則為果。這里“引起”可以解釋為A是B的充要條件、一種因果傳遞、一定概率導(dǎo)致。如果只是強(qiáng)調(diào)A與B發(fā)生現(xiàn)象存在相關(guān)性,直接通過對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析就可以得出結(jié)論,但如果要證明二者之間是不是有因果關(guān)系,則需要找到彼此之間的條件依賴性,啟動(dòng)人們的思維推理機(jī)制,描述之間的作用關(guān)系,一般要通過科學(xué)實(shí)驗(yàn)與演繹論證才能進(jìn)行證明。[11]例如我們常說的吸煙有害健康,如果我們從對(duì)大量吸煙人群進(jìn)行統(tǒng)計(jì),找到吸煙的人容易發(fā)生肺癌,那表明吸煙與肺癌存在相關(guān)性;但如果要推導(dǎo)兩者的因果性,則需要通過證明煙草中某個(gè)成分引發(fā)肺癌的發(fā)生,這就可以通過實(shí)驗(yàn)進(jìn)行證明。
2.兩者不等同,因果存在相關(guān),但相關(guān)未必是因果
從生活經(jīng)驗(yàn)來看,事件之間如果有因果關(guān)系,一般都會(huì)有相關(guān)關(guān)系,但事件之間即使沒有因果關(guān)系,也可能會(huì)有相關(guān)關(guān)系。所以相關(guān)關(guān)系比因果關(guān)系更為廣泛普遍,兩者不能等同。[12]因果關(guān)系只存在于兩個(gè)事件之間,假如A是原因,另一方B則是結(jié)果(AB)。而存在相關(guān)關(guān)系的事件之間作用原理可能是相互的(AB),A可能是因,B是果,也可能B是因,A是果,或者是關(guān)聯(lián)了其他事件C(ACB),而A和B本身沒有任何因果關(guān)系。
例如,光照時(shí)間和水果含糖量之間存在因果關(guān)系,因果鏈可以表述為:光照時(shí)間越長(zhǎng),光合作用產(chǎn)生更多的糖,水果也就越甜。光照時(shí)間與太陽能發(fā)電之間也存在因果性,光照時(shí)間越長(zhǎng),太陽能發(fā)電量也越多。從數(shù)據(jù)看上,光照與水果糖分、與太陽能發(fā)電的相關(guān)系數(shù)也比較高,太陽能發(fā)電與水果糖分相關(guān)性也很高,但不能得出結(jié)論水果糖分與太陽能發(fā)電存在因果性。進(jìn)一步說,想要水果更甜,可以通過增加光照時(shí)間,但不能說可以通過增強(qiáng)太陽能發(fā)電量,如果錯(cuò)把太陽能發(fā)電與水果甜度有因果關(guān)系,那么除了光照,通過改變發(fā)電設(shè)備工藝增強(qiáng)太陽能發(fā)電,而這時(shí)發(fā)電量的增加與水果甜不甜沒有任何關(guān)系。
相關(guān)性屬于粗略性分析,不需要獲取精確的分析結(jié)論,而因果關(guān)系則是要得出精準(zhǔn)的結(jié)論。所以相關(guān)未必有因果,相關(guān)是一種取像,只是這個(gè)世界變得越來越復(fù)雜、數(shù)據(jù)量越來越大,如果再?gòu)姆彪s海量的數(shù)據(jù)中找出因果要素非常困難,雖然不能直接證明因果關(guān)系,但是可以揭示出各種可能性,可以為推測(cè)因果關(guān)系提供思考方向,所以利用大數(shù)據(jù)統(tǒng)計(jì)出的強(qiáng)相關(guān)性則成為當(dāng)前快速有效的分析方式。
信息技術(shù)發(fā)展促進(jìn)社會(huì)發(fā)展進(jìn)步,公安部門正面臨人—事—環(huán)境等各類監(jiān)管數(shù)據(jù)的幾何增長(zhǎng)和高頻流動(dòng),也使得警務(wù)工作變得艱巨繁重。例如互聯(lián)網(wǎng)輿情所引發(fā)的“黑天鵝”“灰犀?!笔录墙o監(jiān)管部門帶來極大的挑戰(zhàn),公安所面臨的警情數(shù)據(jù)也不僅僅是主動(dòng)報(bào)警或請(qǐng)求,還有很多來源于網(wǎng)絡(luò)監(jiān)測(cè)、數(shù)據(jù)比對(duì)預(yù)警等。推進(jìn)“警務(wù)大數(shù)據(jù)”深度應(yīng)用關(guān)鍵需要具有公安視角的 “大數(shù)據(jù)”思維,貫穿于案件偵查、社會(huì)治理等警務(wù)工作。
從公安行業(yè)視角來看,大數(shù)據(jù)思維則可定位為一種通過數(shù)據(jù)化的整體性思維對(duì)數(shù)據(jù)資源、警務(wù)模式、犯罪治理、管理決策進(jìn)行重新審視;以構(gòu)建多源異構(gòu)的混雜大數(shù)據(jù)管理為基礎(chǔ),梳理一整套數(shù)據(jù)采集、整理、分析方案,從海量數(shù)據(jù)相關(guān)性中快速洞見情報(bào)信息,從多維信息中消除不確定性支撐管理決策,從而形成數(shù)據(jù)驅(qū)動(dòng)警務(wù)運(yùn)作的思維方式。[13]
大數(shù)據(jù)時(shí)代,現(xiàn)實(shí)復(fù)雜的場(chǎng)景會(huì)產(chǎn)生大量、多樣的數(shù)據(jù),如果在工作中從有無因果關(guān)系,以及原因與結(jié)果產(chǎn)生的機(jī)理分析就成為非常耗費(fèi)精力與時(shí)間的事情,有時(shí)思考方向出現(xiàn)偏差,甚至一無所獲。公安大數(shù)據(jù)的融合創(chuàng)新,需要將民警的工作經(jīng)驗(yàn)與大數(shù)據(jù)技術(shù)進(jìn)行融合建模,能否找到技術(shù)與業(yè)務(wù)的契合點(diǎn),則很大程度需要警員具有相應(yīng)的思維能力。而目前很多民警的數(shù)據(jù)深度應(yīng)用能力偏低,往往依靠傳統(tǒng)經(jīng)驗(yàn)開展個(gè)案的因果分析,不能應(yīng)對(duì)新情況,而大數(shù)據(jù)時(shí)代,則需要我們更關(guān)注總體、從執(zhí)著個(gè)案因果轉(zhuǎn)向關(guān)注總體的相關(guān)性。所以在公安行業(yè)中,相關(guān)性分析也成為大數(shù)據(jù)思維中至關(guān)重要的要素,在案件偵查、社會(huì)治理、情報(bào)研判中都起著非常重要的作用,下面將具體進(jìn)行分析。
基于相關(guān)關(guān)系的偵查思維,是一種從相關(guān)關(guān)系數(shù)據(jù)中尋找案件線索、找到偵破切入點(diǎn)或突破口的新的偵查思路和方法。具體來說可以是通過偵查人員以“與案件相關(guān)的人、事、物”之間的聯(lián)系、關(guān)聯(lián)程度進(jìn)行分析評(píng)價(jià);也可以在不同案件之間的關(guān)聯(lián)中找出一些可能性、相似性等聯(lián)系,對(duì)相關(guān)數(shù)據(jù)進(jìn)行綜合分析研判,對(duì)案件進(jìn)行串并案、犯罪產(chǎn)業(yè)鏈進(jìn)行全方位打擊。[14]例如對(duì)于逃犯的追蹤,偵查人員可以借助相關(guān)數(shù)據(jù)進(jìn)行分析,包括交通、住宿、手機(jī)、車輛、通信、社交、支付等數(shù)據(jù),如圖2所示,迅速找到案件的偵破口。
圖2 關(guān)聯(lián)數(shù)據(jù)偵查
從這些關(guān)聯(lián)數(shù)據(jù)很可能找出的線索,從而判斷嫌疑人潛逃目的地,再落地抓捕。而同樣這種情況下,去通過傳統(tǒng)從因到果的思維方法,則需要再現(xiàn)實(shí)中先判斷嫌疑人的行為,再去調(diào)查證據(jù),那將面對(duì)非常多的不確定性,無疑是大海撈針。所以依靠大量相關(guān)的數(shù)據(jù)發(fā)現(xiàn)線索,由數(shù)據(jù)到人的方法則越來越普及,它不僅可以快速提供有價(jià)值的線索,還可以為證據(jù)提供更多的數(shù)據(jù)支撐。
高效的社會(huì)治理是全面提高國(guó)家安全和社會(huì)穩(wěn)定,提升人民群眾安全感的關(guān)鍵。預(yù)測(cè)警務(wù)則是應(yīng)用分析技術(shù),特別是定量的數(shù)據(jù)分析技術(shù),通過對(duì)大數(shù)據(jù)進(jìn)行分析可以感知風(fēng)險(xiǎn)隱患,主動(dòng)實(shí)現(xiàn)風(fēng)險(xiǎn)預(yù)測(cè)、犯罪防范預(yù)防。如圖3所示,首先通過大數(shù)據(jù)收集,不僅包括各類犯罪數(shù)據(jù),還需要融合商業(yè)、環(huán)境、人口等數(shù)據(jù)。緊接著是對(duì)數(shù)據(jù)進(jìn)行融合,對(duì)犯罪數(shù)據(jù)產(chǎn)生相應(yīng)的預(yù)測(cè)。[16]包括預(yù)測(cè)犯罪風(fēng)險(xiǎn)較高的地點(diǎn)、時(shí)間,犯罪風(fēng)險(xiǎn)較高的人群、嫌疑程度最高的人、容易成為受害者的人群等等。最后是輔助警方制定干預(yù)措施,例如警力資源分配、向風(fēng)險(xiǎn)更高的地點(diǎn)投放更多的警力等。
圖3 預(yù)防犯罪數(shù)據(jù)研判過程
例如在社區(qū)犯罪預(yù)防方面,可以結(jié)合常駐人口、和流動(dòng)人口、物聯(lián)網(wǎng)監(jiān)控?cái)?shù)據(jù)、發(fā)案時(shí)間與地點(diǎn)、作案特征等信息,如圖4所示,對(duì)社區(qū)治安案件數(shù)據(jù)統(tǒng)計(jì)分析,得到一些案件于數(shù)據(jù)之間的關(guān)聯(lián)特征,如盜竊案件與某個(gè)時(shí)間段相關(guān)性高、與某些小區(qū)相關(guān)性高、與小區(qū)流動(dòng)人口比例相關(guān)度高、與小區(qū)安防設(shè)施部署相關(guān)性等等特征,可以采取優(yōu)化小區(qū)安防,加強(qiáng)巡邏、加大安全宣傳等措施,達(dá)到預(yù)防犯罪行為。這些與案件相關(guān)性的特征,未必是我們憑經(jīng)驗(yàn)可以一步考慮周全的,也無法得到一個(gè)量化的分析比對(duì)。而通過案件與其他數(shù)據(jù)之間關(guān)聯(lián)度的分析,可以過濾出高關(guān)聯(lián)的因素,再結(jié)合已有經(jīng)驗(yàn)進(jìn)行邏輯判斷,則可以快速找出預(yù)防犯罪的重要元素。
圖4 治理性分析示例
在警務(wù)工作中,圍繞某個(gè)對(duì)象搜集相關(guān)大數(shù)據(jù),綜合大量數(shù)據(jù)出挖掘出重要線索是情報(bào)研判的重要工作。[17]但大量數(shù)據(jù)中找出支撐結(jié)果的一個(gè)或幾個(gè)線索,是很難憑直接經(jīng)驗(yàn)發(fā)現(xiàn)的。大數(shù)據(jù)時(shí)代,則可能完全是先對(duì)數(shù)據(jù)挖掘,找出關(guān)聯(lián)度高的因素之后作為結(jié)論,再逆向重新構(gòu)建因果邏輯。例如:英國(guó)通過大數(shù)據(jù)縮小恐怖分子排查范圍。在國(guó)際上恐怖分子破壞極大,也難以監(jiān)控。很多學(xué)者都希望可以提前把他們篩選出來,但是無論從情報(bào)、通信監(jiān)控、資金往來監(jiān)控方面都難以找到有效的篩選方法。而英國(guó)經(jīng)濟(jì)學(xué)家霍斯利通過大數(shù)據(jù)發(fā)現(xiàn)是恐怖人員的身份與保險(xiǎn)購(gòu)買具有很強(qiáng)的關(guān)聯(lián)性,恐怖分子不購(gòu)買保險(xiǎn),他在傳統(tǒng)的行為監(jiān)測(cè)中添加了這個(gè)條件把懷疑范圍大大縮小,警方也根據(jù)這一線索果然抓到了恐怖分子。不能說不買保險(xiǎn)的人就是恐怖分子,但大數(shù)據(jù)表明恐怖分子與購(gòu)買保險(xiǎn)具有強(qiáng)相關(guān)性。從這一相關(guān)性出發(fā),可以很快找到篩選的方法。
但人們更習(xí)慣形成認(rèn)知閉環(huán),如果不搞清具體影響過程,就覺得這個(gè)結(jié)論不可靠。大數(shù)據(jù)的相關(guān)性分析可以更快速找到解決問題方案,我們可以先知道結(jié)果,然后再倒推原因。如果進(jìn)一步尋求其原因,則可以逆向推理建立邏輯關(guān)系因果鏈條,是因?yàn)樵谟?guó)這種高福利國(guó)家,保險(xiǎn)是發(fā)放福利的一個(gè)重要途徑,只要一份很便宜的保險(xiǎn),就能保障基本醫(yī)療。而穆斯林普遍結(jié)婚早,一個(gè)20多歲的英國(guó)公民或長(zhǎng)期居住者,都會(huì)購(gòu)買保險(xiǎn)。但恐怖分子卻為什么不買? 因?yàn)楸kU(xiǎn)行業(yè)規(guī)定,保險(xiǎn)兌付時(shí)有一個(gè)前提條件就是投保人不能是恐怖分子。所以很多恐怖分子就會(huì)因?yàn)槌杀臼找婧怂阌绊?,最后被大?shù)據(jù)識(shí)別出來。
大數(shù)據(jù)時(shí)期,情報(bào)處理的計(jì)算模式也在改變,從以往的“流程”核心轉(zhuǎn)變?yōu)椤皵?shù)據(jù)”核心,如圖5。大數(shù)據(jù)思維顯著特點(diǎn)是全數(shù)據(jù)樣本思維、相關(guān)思維。而海量的數(shù)據(jù)也超出了人工對(duì)信息處理的極限,需要借助現(xiàn)代化信息手段。大數(shù)據(jù)思維可以促進(jìn)人的靈感性、形象性、發(fā)散性和邏輯性,幫助分析人員產(chǎn)生創(chuàng)新思維。[18]“發(fā)散性”思維的最大特點(diǎn)是思維的跳躍性,其能夠把兩個(gè)看似沒有聯(lián)系的“信息”溝通聯(lián)想起來,對(duì)已有的線索從不同角度,用不同方法進(jìn)行分析,產(chǎn)生新的思維結(jié)果。所以在思維模式上,人的思維將與機(jī)器思維相結(jié)合,交互,得到對(duì)于事物不同可能性的元認(rèn)知,再進(jìn)行收斂歸納,進(jìn)一步推導(dǎo)因果邏輯。
圖5 大數(shù)據(jù)情報(bào)分析思維模型
在這個(gè)復(fù)雜的社會(huì)背景中,存在很多不確定性、也產(chǎn)生海量的數(shù)據(jù),如果凡事都要等我們理清楚準(zhǔn)確的因果關(guān)系,再去解決問題,那么很多時(shí)候事情都已經(jīng)被耽誤了,最后也不值得辦理了。從統(tǒng)計(jì)學(xué)角度來說,“數(shù)據(jù)思維”就是回歸分析,即確定兩種或兩種以上變量間相互依賴的定量關(guān)系的一種統(tǒng)計(jì)分析方法。[19]即定量分析事件發(fā)生之間的相關(guān)性、關(guān)聯(lián)度。把從復(fù)雜現(xiàn)實(shí)信息中,抽取因果邏輯轉(zhuǎn)換為利用計(jì)算機(jī)算法從大量數(shù)據(jù)做統(tǒng)計(jì)分析,找出數(shù)據(jù)之間相關(guān)性,再映射為現(xiàn)實(shí)事件的相關(guān)性,從數(shù)據(jù)相關(guān)性出發(fā)找到解決方案,而不需要找到非常緊密和明確的因果關(guān)系。
古人云:以道馭術(shù),以術(shù)驅(qū)道。在“道”的層面上,相關(guān)分析是一種思維方式,在它的指導(dǎo)下,我們可以把“業(yè)務(wù)問題”定義成“數(shù)據(jù)可分析問題”。而在“術(shù)”的層面,相關(guān)分析又是一種可以運(yùn)用的數(shù)據(jù)分析工具。需要找出業(yè)務(wù)的核心訴求Y,及影響結(jié)果自變量X,找出X與Y變化關(guān)聯(lián)程度,而X的收集、也就是大數(shù)據(jù)的收集則也來源于我們對(duì)業(yè)務(wù)的洞見。
“菩薩畏因,眾生畏果”,說的是智慧的人敬畏原因,普通人敬畏結(jié)果。所以利用大數(shù)據(jù)相關(guān)性快速解決問題時(shí),為了減少?zèng)Q策錯(cuò)誤,也要盡量做到始于相關(guān)、終于因果原理。例如深圳警方接受采訪時(shí)說:天秤座、處女座、天蝎座的人更喜歡違章。因?yàn)槿N星座的違章比例為10.5%、9.63%和9.0%,確實(shí)占據(jù)前三。但更深入分析,另一個(gè)關(guān)于全世界人口出生時(shí)間的大數(shù)據(jù)統(tǒng)計(jì)結(jié)果表明亞洲東部地區(qū)9到11月份的相對(duì)偏多,這又在一定程度說明了本身這幾個(gè)星座人口就偏多,所以這種星座與交通違章的相關(guān)性則可能是偽相關(guān)、沒有因果邏輯。進(jìn)一步說,如果我們從相關(guān)性出發(fā),再深入分析原因,則也可能在因果鏈上發(fā)現(xiàn)更多解決思路。例如地區(qū)A與交通事故發(fā)生關(guān)聯(lián)度高,那么為什么A地容易發(fā)生交通事故,進(jìn)一步分析原因可能有A地靠近學(xué)校等人流密集地、A地車道較少、A地拐彎路口設(shè)置不合理等等,那么從因果鏈上看,對(duì)于預(yù)防A地的交通事故可采取的措施就有很多種。
大數(shù)據(jù)是基于數(shù)據(jù)之間存在的關(guān)系來發(fā)現(xiàn)存在的規(guī)律,從而進(jìn)行判定、預(yù)測(cè)、決策等,大數(shù)據(jù)技術(shù)發(fā)展也對(duì)思維方式產(chǎn)生了巨大變革、全樣本、混雜性、相關(guān)性成為大數(shù)據(jù)思維重要元素。很多學(xué)者持有的觀點(diǎn)認(rèn)為在說大數(shù)據(jù)是一種只追問 “是什么”,而不問“為什么”的思維方式。筆者認(rèn)為大數(shù)據(jù)思維并不是否定事物規(guī)律,世界上很多事物存在很大的不確定性,各個(gè)維度的數(shù)據(jù)連成了強(qiáng)關(guān)聯(lián)的網(wǎng)絡(luò),出現(xiàn)利用大數(shù)據(jù)的強(qiáng)關(guān)聯(lián)性替代因果性趨勢(shì)。大數(shù)據(jù)的相關(guān)分析思維方式也廣泛適用于警務(wù)工作中,在情報(bào)研判中可以通過相關(guān)思維進(jìn)行發(fā)散,挖掘更多情報(bào)價(jià)值,也可以利用相關(guān)性去快速洞察、找到解決問題方案,但因果關(guān)系作為人類理性活動(dòng)所追求的目標(biāo),仍然不能被忽視和否定。