国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)技術(shù)的相關(guān)性與因果性分析*

2020-12-29 02:57:14李君亮
關(guān)鍵詞:因果性海量因果關(guān)系

陳 艷 李君亮

(1.廣西民族師范學(xué)院數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院 廣西崇左 532200;2.海南大學(xué)馬克思主義學(xué)院 海南???570228 )

大數(shù)據(jù)技術(shù)詮釋使人獲得的是海量數(shù)據(jù)給定的諸事實(shí)間的關(guān)系性理解,大數(shù)據(jù)技術(shù)知識發(fā)現(xiàn)顯像出的仍然是海量數(shù)據(jù)給定的諸事實(shí)間的相關(guān)關(guān)系[1]。海量數(shù)據(jù)給定的諸事實(shí)間的相關(guān)關(guān)系背后實(shí)際上蘊(yùn)涵了因果關(guān)系,這是一種什么樣的因果關(guān)系?本文將對大數(shù)據(jù)技術(shù)的相關(guān)性及因果性以及二者之間的辯證關(guān)系做一探討。

一、大數(shù)據(jù)技術(shù)的相關(guān)關(guān)系分析

大數(shù)據(jù)技術(shù)已經(jīng)廣泛應(yīng)用于我們的生產(chǎn)生活之中,其廣泛應(yīng)用在給我們的生產(chǎn)生活帶來天翻地覆的變化的同時,也對人的思維方式帶來了巨大的沖擊和改變,進(jìn)而從根本上改變著我們的行為方式。大數(shù)據(jù)技術(shù)已經(jīng)變得如此重要,并且與我們的生產(chǎn)生活須臾不離分,那么我們就必須對其進(jìn)行深入的剖析與反思:即大數(shù)據(jù)技術(shù)的本質(zhì)究竟是什么,它為什么會在今天的生產(chǎn)生活中產(chǎn)生如此重要的影響?

傳統(tǒng)認(rèn)知模式總是要求人們透過現(xiàn)象去認(rèn)識事物的本質(zhì)從而獲得關(guān)于事物的知識,于是我們總會問:事物的本質(zhì)是什么?就是因果性,即我們秉持著這樣一種信念:凡事莫不有因,任何一種現(xiàn)象總是由別種現(xiàn)象引起的。獲得對于事物的本質(zhì)性認(rèn)識,即認(rèn)識隱藏在某種現(xiàn)象背后的現(xiàn)象,尋找這現(xiàn)象產(chǎn)生的原因,這就是傳統(tǒng)認(rèn)識的根本任務(wù),在獲得了關(guān)于現(xiàn)象產(chǎn)生和形成的原因后,我們就獲得了知識,并且唯有這樣的認(rèn)識才形成科學(xué)知識。

大數(shù)據(jù)給我們的思維帶來的最大變革與沖擊之一就是如舍恩伯格所言,我們不再窮究因果性,我們轉(zhuǎn)而關(guān)注相關(guān)性,知道數(shù)據(jù)表征的現(xiàn)象或事物(事件)的相關(guān)關(guān)系,這就足夠了。事件的因果性深深隱藏在現(xiàn)象之后,而在大數(shù)據(jù)時代,由于人們每時每刻都生產(chǎn)出紛繁復(fù)雜和多源異構(gòu)的數(shù)據(jù),為了實(shí)現(xiàn)更快更好的生活,我們完全可以不必過分深究大數(shù)據(jù)后隱藏著的因果關(guān)系,而只需要充分揭示出海量數(shù)據(jù)間的相關(guān)關(guān)系就足夠了。并且在日常生產(chǎn)生活中,我們在工業(yè)、商業(yè)、政務(wù)、行為、心理等領(lǐng)域的活動本身看上去就似乎毫不相干,各種活動彼此分離,雜亂無章,但實(shí)際上這些被看做分離的個體的客體具有內(nèi)在的關(guān)系,“即這些關(guān)系并非伴隨著這些分開的個體的非關(guān)系性質(zhì)而產(chǎn)生。”[2]運(yùn)用先進(jìn)的數(shù)據(jù)處理設(shè)備,對這些看似由彼此孤立的個體活動造成的海量事實(shí)展開數(shù)據(jù)挖掘,就能揭示出它們之間的相關(guān)關(guān)系。因此,大數(shù)據(jù)技術(shù)通過海量數(shù)據(jù)表征著數(shù)據(jù)給定的諸事實(shí)之間的相關(guān)關(guān)系,而大數(shù)據(jù)技術(shù)作為技術(shù)則通過知識發(fā)現(xiàn)揭示出數(shù)據(jù)給定的諸事實(shí)之間的相關(guān)關(guān)系[3]。

首先,就大數(shù)據(jù)本身而言,每一條數(shù)據(jù)都對應(yīng)著數(shù)據(jù)背后的一個事件行為或現(xiàn)象,海量數(shù)據(jù)對應(yīng)著海量的事件行為或現(xiàn)象。那么,這些海量數(shù)據(jù)表征的諸事件或現(xiàn)象之間是否存在著某種關(guān)系?按哈貝馬斯的交往行為理論,我們每個人實(shí)際上都處在某種行動網(wǎng)格聯(lián)系起來的整體之中,在這整體的行動網(wǎng)格中,交往理性將人們的行為從個體到國家再到社會都連為一體。[4]這樣看來,人們在生產(chǎn)生活中制造的不同的事件行為或現(xiàn)象就會產(chǎn)生某種相關(guān)性,首先至少是在這網(wǎng)格整體中的網(wǎng)格相關(guān)。當(dāng)然,在實(shí)際生活中,海量數(shù)據(jù)表征的諸事實(shí)間的相關(guān)關(guān)系可能更為具體并更容易通過大數(shù)據(jù)挖掘而顯現(xiàn)出來。例如,在舍恩伯格例舉的大數(shù)據(jù)經(jīng)典案例即“谷歌流感趨勢(GFT)”分析中,海量用戶在谷歌搜索引擎上檢索“哪些是治療咳嗽和發(fā)熱的藥物”之后就會產(chǎn)生關(guān)于此信息的海量數(shù)據(jù),如果加上環(huán)境因素,比如特定的區(qū)域和特定的時間段,那么這些海量的數(shù)據(jù)就會和流感爆發(fā)發(fā)生相關(guān)關(guān)系。

用戶利用谷歌搜索引擎檢索后生成海量檢索數(shù)據(jù),對這些數(shù)據(jù)進(jìn)行解析,分揀出檢索內(nèi)容為“哪些是治療咳嗽和發(fā)熱的藥物”的所有數(shù)據(jù)。通常說來,因?yàn)橛腥嘶剂肆鞲胁艜ニ阉鳌澳男┦侵委熆人院桶l(fā)熱的藥物”,以便購買相應(yīng)的藥物。那么,在考慮特定區(qū)域和特定時期這樣的環(huán)境因素下,再對搜索記錄產(chǎn)生的海量數(shù)據(jù)進(jìn)行挖掘,就可以作出某地區(qū)會在某個時期爆發(fā)流感的概率性趨勢預(yù)測。

用Py表示流感爆發(fā)的概率,y表示流感爆發(fā),xn表示某用戶在谷歌搜索引擎檢索“哪些是治療咳嗽和發(fā)熱的藥物”,x表示流感,e表示環(huán)境(時間、地點(diǎn)等),N表示檢索記錄趨于無窮大(即有海量數(shù)據(jù)),于是我們就可以將海量數(shù)據(jù)表征的流行性感冒的事實(shí)之間的相關(guān)關(guān)系及其可能形成的發(fā)展趨勢用概率函數(shù)表示為Py=P{f(xn,x,e,N)},這表明,海量數(shù)據(jù)背后隱藏著的諸事實(shí)間的相關(guān)關(guān)系是一種非線性概率相關(guān)關(guān)系[3]。

大數(shù)據(jù)表征的數(shù)據(jù)背后的諸事實(shí)間的相關(guān)關(guān)系正是通過大數(shù)據(jù)的技術(shù)化應(yīng)用揭示出來的,這就表明,大數(shù)據(jù)技術(shù)本身就是作為一種關(guān)系實(shí)在存在。正如肖峰教授指出的那樣,就大數(shù)據(jù)技術(shù)來說,它不僅僅是一種以服務(wù)器、處理器、網(wǎng)絡(luò)、智能終端設(shè)備等實(shí)體性技術(shù)存在的實(shí)體實(shí)在;它還是一種對海量數(shù)據(jù)展開數(shù)據(jù)采集、存儲、提取、分析、處理、應(yīng)用的數(shù)據(jù)挖掘和數(shù)據(jù)分析活動與過程,因此,大數(shù)據(jù)技術(shù)復(fù)是一種活動與過程實(shí)在。此外,通過對大數(shù)據(jù)進(jìn)行分析,析解出的實(shí)際上卻是大數(shù)據(jù)表征的諸事實(shí)之間的相關(guān)關(guān)系。因此,大數(shù)據(jù)技術(shù)從根本上來說還是一種關(guān)系實(shí)在[5]。這樣看來,一方面,大數(shù)據(jù)技術(shù)的本質(zhì)實(shí)際上包含著三個層次:第一層次是作為實(shí)體性的技術(shù)人工物的實(shí)體實(shí)在,即以電腦、攝像頭、網(wǎng)絡(luò)、智能手機(jī)、存儲器以及其它智能終端設(shè)備等技術(shù)人工物為要素而構(gòu)成的大數(shù)據(jù)技術(shù)實(shí)體;第二層次是運(yùn)用大數(shù)據(jù)算法對海量數(shù)據(jù)展開數(shù)據(jù)挖掘的數(shù)據(jù)分析活動與過程,這便是大數(shù)據(jù)技術(shù)的技藝;第三層次便是通過數(shù)據(jù)挖掘和數(shù)據(jù)分析揭示出的海量數(shù)據(jù)蘊(yùn)含的諸事實(shí)間的相關(guān)關(guān)系,基于這種相關(guān)關(guān)系,然后對事件或現(xiàn)象或行為等做出概率性的預(yù)測與推斷,這就是大數(shù)據(jù)技術(shù)的功能。因此,另一方面,大數(shù)據(jù)技術(shù)又在其實(shí)現(xiàn)過程中表現(xiàn)出實(shí)體—技藝—功能的邏輯鏈關(guān)系,并且正是在這種從實(shí)體到技藝再到功能的邏輯鏈條中,大數(shù)據(jù)技術(shù)的實(shí)際應(yīng)用真正展開,在大數(shù)據(jù)技術(shù)應(yīng)用中展開的實(shí)體—技藝—功能關(guān)系通過人與自然或世界的交往活動得到檢驗(yàn)、證實(shí)和確認(rèn)。

大數(shù)據(jù)綻放為技術(shù),人們必然通過對大數(shù)據(jù)的技術(shù)化應(yīng)用揭示出隱含在海量數(shù)據(jù)內(nèi)的諸事實(shí)間的相關(guān)關(guān)系。進(jìn)入數(shù)據(jù)化的新時代,人們在工業(yè)、商業(yè)、政務(wù)、休閑等生產(chǎn)生活領(lǐng)域不停歇地制造出各種各樣的海量數(shù)據(jù),這些海量數(shù)據(jù)正如舍恩伯格所言是一座“神奇的鉆石礦”[6]大數(shù)據(jù)技術(shù)的發(fā)展與廣泛運(yùn)用就是要挖掘出隱藏在這座“神奇的鉆石礦”中的諸事實(shí)間的相關(guān)關(guān)系,從而為我們的生產(chǎn)和生活服務(wù)。正基于此,舍恩伯格提出,在我們進(jìn)入到大數(shù)據(jù)時代后,我們不再窮究事件或現(xiàn)象間的因果關(guān)系,在大數(shù)據(jù)時代,我們將聚焦于隱藏在海量數(shù)據(jù)背后的諸事實(shí)間的相關(guān)關(guān)系。

二、大數(shù)據(jù)技術(shù)的因果關(guān)系分析

海量數(shù)據(jù)給定的是諸事實(shí)間的相關(guān)關(guān)系,而相關(guān)關(guān)系背后實(shí)際上隱藏著的確實(shí)又是因果關(guān)系。要梳理大數(shù)據(jù)技術(shù)顯像的相關(guān)關(guān)系背后隱藏的因果關(guān)系,我們先要對因果性問題有一個基本的了解。

(一)因果性問題分析

人們總是相信:我們觀察到的某種現(xiàn)象(某類現(xiàn)象)Ⅰ總是規(guī)則地由某種現(xiàn)象(某類現(xiàn)象)Ⅱ引起的,現(xiàn)象Ⅱ被稱之為原因,現(xiàn)象Ⅰ被稱之為結(jié)果,我們把現(xiàn)象Ⅱ和現(xiàn)象Ⅰ之間的這種聯(lián)系稱作因果性聯(lián)系或因果關(guān)系。

自古希臘以來,人們就秉持這樣一種信念,即通過因果性我們才能形成對于世界確定的和普遍必然性認(rèn)識,基于此,亞里士多德提出了著名的“第一動因”問題,由此可見人類對因果性的信仰與執(zhí)著。通過對于事物(現(xiàn)象)間因果性聯(lián)結(jié)的求索,人類的知識進(jìn)化之樹日益枝繁葉茂。就在人類科學(xué)知識迅速進(jìn)化并開始大放異彩之時,休謨提出了令人尷尬的驚人一問:原因和結(jié)果之間存在著的聯(lián)結(jié)或關(guān)系有證據(jù)嗎?即因果性知識具有普遍必然性嗎?休謨的這一問衍生出了近代人類科學(xué)認(rèn)識史上著名的因果性問題。

休謨是這樣提出他的疑問的,他寫道,“如果有人問:我們對于事實(shí)所作的一切推論的本性是什么?適當(dāng)?shù)拇饛?fù)似乎是:這些推論是建立在因果關(guān)系上。如果再問:我們關(guān)于因果關(guān)系的一切理論和結(jié)論的基礎(chǔ)是什么?就可以用一句話來回答:‘經(jīng)驗(yàn)’??墒?,如果我們再進(jìn)一步追根到底地問:由經(jīng)驗(yàn)得來的一切結(jié)論的基礎(chǔ)是什么?這就包含了一個新問題,這個問題更難以解決和解釋?!盵7]需要指出的是,在這里,休謨并沒有否定因果性,也沒有否定因果關(guān)系在人類認(rèn)識發(fā)展過程中的重要意義和作用。這樣的論述只是表明,休謨對因果關(guān)系知識的根據(jù)發(fā)出疑問,在他看來,因果關(guān)系不屬于證明知識,不能以概念分析為根據(jù);因果關(guān)系也不屬于關(guān)于事實(shí)的知識,不能以經(jīng)驗(yàn)推理為根據(jù)。讓我們看個例子:“海水潮漲潮落是因?yàn)樵虑蛞Φ淖饔??!标愂龅恼莾蓚€事物(現(xiàn)象)之間存在著的因果關(guān)系,我們現(xiàn)在也都知道,潮漲潮落和月球引力之間確實(shí)有因果性聯(lián)結(jié)。但是,在這個例子中,從“潮漲潮落”這一概念無論如何分析不出“月球引力”這一概念;另一方面,我們無論如何也無法從“潮漲潮落”的經(jīng)驗(yàn)中推理出“月球引力”。因果關(guān)系無法得到概念分析的證明,也不能得到經(jīng)驗(yàn)綜合的證明,這就是休謨提出的因果必然性問題。

由因果必然性問題延伸開來,休謨又說,“在我所遇到的每一個道德學(xué)體系中,我一向注意到,作者在一個時期是照平常的推理方式進(jìn)行的,確定了上帝的存在,或是對人事作了一番議論;可是突然之間,我卻大吃一驚地發(fā)現(xiàn),我所遇到的不再是命題中通常的‘是’與‘不是’等聯(lián)系詞,而是沒有一個命題不是由一個‘應(yīng)該’或一個‘不應(yīng)該’聯(lián)系起來的。這個變化雖然是不知不覺的,卻是有極其重大關(guān)系的。因?yàn)檫@個應(yīng)該或不應(yīng)該既然表示一種新的關(guān)系或肯定,所以就必須加以論述和說明;同時對于這種似乎完全不可思議的事情,即這個新關(guān)系如何能由完全不同的另外一些關(guān)系推出來,也應(yīng)該舉出理由加以說明?!盵8]我們從“是”如何過渡到“應(yīng)”?從“實(shí)然”如何過渡到“應(yīng)然”?這種過渡必須給出說明與根據(jù)。從已然存在的事物(現(xiàn)象)如何能夠追索其應(yīng)該具有的相聯(lián)結(jié)的事物(現(xiàn)象),這之間需要給出根據(jù)與說明。

我們把上面闡述的從“是”到“應(yīng)”、從“實(shí)然”到“應(yīng)然”、從結(jié)果到原因的過渡的根據(jù)與說明問題統(tǒng)稱為因果性問題。

(二)大數(shù)據(jù)技術(shù)的弱因果性分析

有學(xué)者提出,大數(shù)據(jù)技術(shù)的相關(guān)關(guān)系根植于因果關(guān)系,[9]我們認(rèn)為對大數(shù)據(jù)技術(shù)相關(guān)關(guān)系的這樣一種評判是公允的。但是為了確保對大數(shù)據(jù)技術(shù)相關(guān)關(guān)系的真正公平起見,我們有必要對大數(shù)據(jù)技術(shù)的因果關(guān)系有清醒的認(rèn)識和深入的分析。

既然我們相信萬物莫不有因,由是,則對于事物(現(xiàn)象)形成產(chǎn)生和變化發(fā)展的原因的探求,是自古希臘以來人類對于自然宇宙不斷執(zhí)著探究的一個重要原因。古希臘先賢對于萬物本原的沉思,亞里士多德對于事物組成的“四因說”和事物發(fā)展變化第一推動因的假設(shè),處處體現(xiàn)著人們心中執(zhí)著的萬物皆有因的信念。因此,建立起事物之間的因果聯(lián)系,獲得事物之間的因果性知識,這是自古以來人類獲得對于世界的確定性的一種努力,也是人類面對自然世界和宇宙萬物的一種信心,即是說,事物(現(xiàn)象)之間的因果必然性聯(lián)系,使得人類在面向復(fù)雜開放的世界時獲得了一種確定性和信心。建立在這樣一種信念和信心之上,我們確立起來的事物之間的因果聯(lián)系是一種強(qiáng)因果關(guān)系。

什么是強(qiáng)因果關(guān)系呢?即事物(現(xiàn)象)之間的一種正向線性相關(guān)的因果聯(lián)系。讓我們以萬有引力定律為例來對事物(現(xiàn)象)之間的強(qiáng)因果性進(jìn)行說明和解釋。

在大數(shù)據(jù)技術(shù)中,數(shù)據(jù)給定的諸事實(shí)間呈現(xiàn)出來的首先是一種相關(guān)關(guān)系。如在GFT案例中,用戶通過Google搜索引擎檢索“哪些是治療咳嗽和發(fā)熱的藥物”后生成的瀏覽足跡形成的海量數(shù)據(jù)與流行性感冒爆發(fā)之間呈現(xiàn)出一種相關(guān)關(guān)系。然而在這種相關(guān)關(guān)系中卻隱含著具有某種必然性的因果關(guān)系,即因?yàn)榛忌狭烁忻?,所以想要知道“哪些是治療咳嗽和發(fā)熱的藥物”以便去藥店購買;由于在某一時間某一地區(qū)有海量用戶通過Google搜索引擎檢索“哪些是治療咳嗽和發(fā)熱的藥物”,這就說明在這個時期這個地區(qū)有許多人患上了感冒;同一段時間內(nèi)在同一地區(qū)有許多人同時患上感冒,這是流感爆發(fā)的征兆,所以說,這個地區(qū)在這段時期內(nèi)有流感爆發(fā)的趨勢。

通過對GFT案例進(jìn)行這樣的分析后我們可以發(fā)現(xiàn),大數(shù)據(jù)技術(shù)相關(guān)關(guān)系是一種概率型關(guān)系,因此,隱含在相關(guān)關(guān)系中的因果關(guān)系也就具有一種或然性。也就是說,在大數(shù)據(jù)技術(shù)中的因果關(guān)系具有一種非充分的必然性。此外,由于大數(shù)據(jù)的多源異構(gòu)和自治的特性,數(shù)據(jù)給定的諸事實(shí)和鏡像世界顯像出的事實(shí)間也不是一種簡單的正向線性相關(guān)關(guān)系。這樣,大數(shù)據(jù)技術(shù)中的因果關(guān)系就是一種非簡單正向線性相關(guān)的、非充分必然的相關(guān)關(guān)系,我們把具有這樣一種非簡單正向線性相關(guān)、非充分必然的因果關(guān)系稱之為弱因果關(guān)系。

所以說,海量數(shù)據(jù)給定的事實(shí)表征著事實(shí)間的因果關(guān)系,但是,大數(shù)據(jù)技術(shù)中的因果關(guān)系是一種弱因果關(guān)系。

三、大數(shù)據(jù)技術(shù)的相關(guān)性與因果性的辯證關(guān)系分析

大數(shù)據(jù)技術(shù)綻放出的海量數(shù)據(jù)給定的諸事實(shí)間的相關(guān)關(guān)系與大數(shù)據(jù)技術(shù)中的弱因果關(guān)系之間又存在著什么樣的關(guān)系?在討論大數(shù)據(jù)技術(shù)的相關(guān)性與因果性之間的辯證關(guān)系之前不妨讓我們先來看一下如下這個例子:“我們經(jīng)常會看到這樣的天氣現(xiàn)象,尤其是在夏天,先是天雷滾滾,然后就下起了瓢潑大雨。那么,打雷和下雨之間有什么關(guān)系?”我們都知道,打雷和下雨之間是一種相關(guān)關(guān)系,通常打雷都會下雨,下雨時也常伴隨著雷聲,但是打雷和下雨之間沒有什么必然性關(guān)系,打雷既不是下雨的充分條件也不是下雨的必要條件,反之也是如此。也就是說,打雷和下雨之間不存在因果關(guān)系,打雷不是下雨的原因,下雨也不是打雷的原因。為什么會打雷和下雨?原因都在打雷和下雨之外。

在對上述打雷與下雨的例子有所了解后我們再回過頭來看一下大數(shù)據(jù)技術(shù)的經(jīng)典案例GFT。在GFT案例中,海量用戶在Google搜索引擎上檢索“哪些是治療咳嗽和發(fā)熱的藥物”生成的大數(shù)據(jù)與流感爆發(fā)之間是一種概率性相關(guān)關(guān)系,但這兩者之間卻不是因果關(guān)系,即:不是因?yàn)榱鞲斜l(fā),所以用戶在Google搜索引擎上檢索“哪些是治療咳嗽和發(fā)熱的藥物”;也不是因?yàn)橛泻A坑脩粼贕oogle搜索引擎上檢索“哪些是治療咳嗽和發(fā)熱的藥物”,所以流感爆發(fā)。用戶在Google搜索引擎上檢索“哪些是治療咳嗽和發(fā)熱的藥物”的原因或者流感爆發(fā)的原因都外在于這二者。

再讓我們來看看日本先進(jìn)工業(yè)技術(shù)研究所的坐姿研究與汽車防盜系統(tǒng)(JAIOIT)這個案例。[10]人坐著的時候的身形、姿勢和重量分布與個人身份、安全駕駛、汽車防盜、盜車案偵破之間是一種相關(guān)關(guān)系,但卻不具有線性相關(guān)的因果必然性關(guān)系。人坐著的時候的身形、姿勢和重量分布等之所以與個人身份、安全駕駛、汽車防盜、盜車案偵破之間具有一種相關(guān)關(guān)系,其原因在個人身份、安全駕駛、汽車防盜、盜車案偵破等之外。

前文已述,大數(shù)據(jù)技術(shù)的相關(guān)關(guān)系是一種非線性的概率相關(guān)關(guān)系,大數(shù)據(jù)技術(shù)的因果關(guān)系則是一種弱因果關(guān)系,通過上述例子我們可以發(fā)現(xiàn),大數(shù)據(jù)技術(shù)的非線性概率相關(guān)關(guān)系與弱因果關(guān)系二者之間存在如下辯證關(guān)系:

大數(shù)據(jù)技術(shù)的因果性指示出的是海量數(shù)據(jù)給定諸事實(shí)與其指向的概率性事實(shí)之間的其他事實(shí),我們可以把這一(些)事實(shí)稱之為原因事實(shí),記為Fr。如,GFT案例中大數(shù)據(jù)技術(shù)的因果性指示出的是海量用戶在Google搜索引擎上檢索“哪些是治療咳嗽和發(fā)熱的藥物”諸事實(shí)與流感爆發(fā)這一概率性事實(shí)之間的事實(shí);JAIOIT案例中大數(shù)據(jù)技術(shù)的因果性指示出的是人坐著的時候的身形、姿勢和重量分布諸事實(shí)與個人身份、安全駕駛、汽車防盜、盜車案偵破諸事實(shí)之間的事實(shí)。

在Db,F(xiàn)p,F(xiàn)r這三者之間存在如下關(guān)系:

其中,符號→為邏輯蘊(yùn)涵的意思。

在這里需要指出的是,概率性事實(shí)和原因事實(shí)既可能是同一事實(shí),也可能是一事實(shí)集或一事實(shí)序列。海量數(shù)據(jù)越是多源異構(gòu)和自治,則概率性事實(shí)越不確定,原因事實(shí)也會更加復(fù)雜多變。

第二,大數(shù)據(jù)技術(shù)的因果性源于外在于海量數(shù)據(jù)給定的諸事實(shí),但也正由于這種外在于海量數(shù)據(jù)給定的諸事實(shí)的因果性的存在,海量數(shù)據(jù)給定的諸事實(shí)才能與概率性事實(shí)之間建立起相關(guān)關(guān)系,或許正是因此之故,才會有學(xué)者認(rèn)為大數(shù)據(jù)技術(shù)中的相關(guān)關(guān)系根植于因果關(guān)系。

第三,大數(shù)據(jù)技術(shù)的復(fù)雜非線性概率相關(guān)關(guān)系源于大數(shù)據(jù)技術(shù)的弱因果關(guān)系,這也就是說,大數(shù)據(jù)技術(shù)相關(guān)關(guān)系的復(fù)雜性、非線性、概率性特征的根源在于大數(shù)據(jù)技術(shù)因果關(guān)系復(fù)雜性、非正向線性、非充分必然性的特征。

第四,大數(shù)據(jù)技術(shù)相關(guān)關(guān)系的復(fù)雜性、非線性、概率性特征與大數(shù)據(jù)技術(shù)因果關(guān)系的復(fù)雜性、非正向線性、非充分必然性的特征統(tǒng)一于大數(shù)據(jù)大多源性、異構(gòu)性和自治性特征。大數(shù)據(jù)既可能來源于用戶瀏覽網(wǎng)頁留下的數(shù)據(jù)足跡,也可能來源于圖像、視頻、音頻、微博等智能多媒體終端,海量數(shù)據(jù)的多源性使得大數(shù)據(jù)具有了異構(gòu)性特征,即當(dāng)大數(shù)據(jù)投入到實(shí)際應(yīng)用之中,各個數(shù)據(jù)源在產(chǎn)生收集數(shù)據(jù)的時候相互獨(dú)立,如同互聯(lián)網(wǎng)中的自治系統(tǒng),能夠自主地決定本網(wǎng)絡(luò)中使用何種路由協(xié)議一樣,這樣的數(shù)據(jù)特征顯示出大數(shù)據(jù)的另一個本質(zhì)特征:分布式和分散式控制的自治數(shù)據(jù)源,這些自治的數(shù)據(jù)源沒有集中式控制,能夠自主地決定產(chǎn)生和收集的數(shù)據(jù)存儲和表示的形式[11]。大數(shù)據(jù)的這些特性勢必導(dǎo)致大數(shù)據(jù)技術(shù)的非線性概率相關(guān)性和大數(shù)據(jù)技術(shù)因果關(guān)系的非充分必然性特征。

因此,大數(shù)據(jù)技術(shù)的相關(guān)關(guān)系與因果關(guān)系之間呈現(xiàn)出一種復(fù)雜的、非線性的,既有聯(lián)系也有區(qū)別的辯證關(guān)系。

結(jié)論

大數(shù)據(jù)技術(shù)相關(guān)關(guān)系是一種復(fù)雜的非線性概率相關(guān)關(guān)系,其中,海量數(shù)據(jù)表征了大數(shù)據(jù)技術(shù)的復(fù)雜非線性概率相關(guān)關(guān)系,技術(shù)則揭示出了海量數(shù)據(jù)給定的諸事實(shí)間的復(fù)雜非線性概率相關(guān)關(guān)系。大數(shù)據(jù)技術(shù)因果關(guān)系是一種復(fù)雜非正向線性非充分必然的弱因果關(guān)系。

大數(shù)據(jù)技術(shù)的相關(guān)性與因果性都指向數(shù)據(jù)給定的諸事實(shí)之外的其他事實(shí),大數(shù)據(jù)技術(shù)相關(guān)關(guān)系指向的是概率性事實(shí),大數(shù)據(jù)技術(shù)因果關(guān)系則指向原因事實(shí)。概率性事實(shí)和原因事實(shí)既可能是同一事實(shí),也可能是一事實(shí)集或一事實(shí)序列。大數(shù)據(jù)技術(shù)相關(guān)關(guān)系根源于其弱因果關(guān)系,大數(shù)據(jù)技術(shù)相關(guān)關(guān)系的復(fù)雜性、非線性、概率性特征也根源于大數(shù)據(jù)技術(shù)因果關(guān)系復(fù)雜性、非正向線性、非充分必然性的特征。

猜你喜歡
因果性海量因果關(guān)系
一種傅里葉域海量數(shù)據(jù)高速譜聚類方法
阿爾茨海默癥三網(wǎng)動力學(xué)因果性分析
玩忽職守型瀆職罪中嚴(yán)重不負(fù)責(zé)任與重大損害后果的因果關(guān)系
海量快遞垃圾正在“圍城”——“綠色快遞”勢在必行
做完形填空題,需考慮的邏輯關(guān)系
論培根對古代哲學(xué)中目的因的批判和改造
論培根對古代哲學(xué)中目的因的批判和改造
一個圖形所蘊(yùn)含的“海量”巧題
幫助犯因果關(guān)系芻議
介入因素對因果關(guān)系認(rèn)定的影響
遵义县| 定安县| 海淀区| 囊谦县| 蒲城县| 信宜市| 徐水县| 东阿县| 元朗区| 谢通门县| 偃师市| 弥渡县| 东乡族自治县| 玉林市| 安平县| 南城县| 桐梓县| 达州市| 昌都县| 庄浪县| 雷山县| 罗平县| 和平县| 连云港市| 邯郸县| 白银市| 吉木萨尔县| 眉山市| 龙海市| 察哈| 全南县| 达日县| 永清县| 赤壁市| 克拉玛依市| 临颍县| 会东县| 荥经县| 平远县| 扶绥县| 涪陵区|