摘要:數(shù)據(jù)采集方式從抽樣到自然生成,使從小數(shù)據(jù)到大數(shù)據(jù)的發(fā)展具有了數(shù)據(jù)的“自然化”性質(zhì)。數(shù)據(jù)的自然化具有重要存在論意蘊(yùn)。大數(shù)據(jù)的“大”關(guān)鍵不在數(shù)據(jù)量大,而在數(shù)據(jù)的完備性。正是數(shù)據(jù)的完備性,使大數(shù)據(jù)具有規(guī)模整全性。大數(shù)據(jù)的規(guī)模整全性,在直覺的整體性和概念的整體性之外,為人類認(rèn)識(shí)提供了新的量化的整體性。直覺的整體性基于經(jīng)驗(yàn),概念的整體性基于邏輯,而大數(shù)據(jù)量化的整體性則基于數(shù)據(jù)。三種整體性意味著三種整體觀照。作為整體觀照的第三種形式,大數(shù)據(jù)的規(guī)模整全性具有重要的量化整體觀照價(jià)值。哲學(xué)的最重要功能之一,就是為具體的認(rèn)識(shí)和實(shí)踐提供最高層次的整體觀照,因此大數(shù)據(jù)所提供的量化整體觀照具有重要哲學(xué)意蘊(yùn)。三種整體觀照的整合,將催生更高層級(jí)的整體觀照,為人和世界關(guān)系的理解提供從過去到未來的認(rèn)識(shí)和實(shí)踐一體化整體把握。
關(guān)鍵詞:大數(shù)據(jù);規(guī)模整全性;量化整體觀照;哲學(xué)意蘊(yùn)
基金項(xiàng)目:國家社會(huì)科學(xué)基金重點(diǎn)項(xiàng)目“大數(shù)據(jù)相關(guān)關(guān)系和因果關(guān)系研究”(17AZX003)
中圖分類號(hào):B023.3;C39 ? ?文獻(xiàn)標(biāo)識(shí)碼:A ? ?文章編號(hào):1003-854X(2022)04-0078-08
大數(shù)據(jù)不僅意味著量化把握,而且由于其發(fā)展為隨時(shí)間流動(dòng)而實(shí)時(shí)自然生長的全數(shù)據(jù),更意味著包含未來維度的整體把握。大數(shù)據(jù)不同于小數(shù)據(jù)的根本之處,在于數(shù)據(jù)規(guī)模趨向整全。大數(shù)據(jù)的規(guī)模大遠(yuǎn)不只是量的描述,而是意味著大數(shù)據(jù)是具有規(guī)模整全性的全數(shù)據(jù)存在。從技術(shù)層面看,大數(shù)據(jù)是不能用傳統(tǒng)數(shù)據(jù)庫技術(shù)處理的數(shù)據(jù)集合;而從哲學(xué)層次看,大數(shù)據(jù)則是傳統(tǒng)的關(guān)系型數(shù)據(jù)庫所不能處理的整全數(shù)據(jù)。從數(shù)據(jù)整全度這樣定性的規(guī)定層次理解大數(shù)據(jù),不僅可以深化大數(shù)據(jù)的哲學(xué)理解,而且可以看到大數(shù)據(jù)規(guī)模整全性的重要哲學(xué)意蘊(yùn)。
一、從小數(shù)據(jù)到大數(shù)據(jù):數(shù)據(jù)的“自然化”
在大數(shù)據(jù)研究的深化過程中,越來越廣泛的做法是以“v”打頭的英文字母表征大數(shù)據(jù)的特征。無論在哪種表述中,大數(shù)據(jù)的第一個(gè)“v”特征都是“volume”。關(guān)于大數(shù)據(jù)的這一特征,一般理解為“大量”。大數(shù)據(jù)一定意味著數(shù)據(jù)達(dá)到一定規(guī)模,盡管這個(gè)規(guī)模的具體規(guī)定會(huì)隨著信息科技的發(fā)展而變化。相對于信息科技的發(fā)展水平而言,大數(shù)據(jù)意味著數(shù)據(jù)量巨大。從技術(shù)上說,數(shù)據(jù)量之所以能那么巨大,就因?yàn)橐郧岸际侨斯げ杉瘮?shù)據(jù),而現(xiàn)在數(shù)據(jù)由機(jī)器、網(wǎng)絡(luò)和人類相互作用相對自然地生成。這不僅涉及數(shù)據(jù)采集的效率,而且涉及日益多樣化的數(shù)據(jù)采集的可能性,特別是數(shù)據(jù)采集的“自然化”。數(shù)據(jù)的“自然化”,正是從小數(shù)據(jù)到大數(shù)據(jù)發(fā)展的根本變化。
大數(shù)據(jù)相對于小數(shù)據(jù)而言,而小數(shù)據(jù)的實(shí)質(zhì)則是樣本數(shù)據(jù)(sampling data)。大數(shù)據(jù)和樣本數(shù)據(jù)的原則區(qū)別,就在于樣本數(shù)據(jù)是根據(jù)既定的具體目的抽樣采集形成的,小數(shù)據(jù)通常設(shè)計(jì)用于回答特定問題或服務(wù)于特定目標(biāo)。而與此完全不同,大數(shù)據(jù)是在沒有像樣本數(shù)據(jù)取樣般的具體目的的情況下自然采集生成的。由于出自具體的目標(biāo),樣本數(shù)據(jù)在取樣時(shí)有具體的在先預(yù)設(shè);而由于不是抽樣的產(chǎn)物,大數(shù)據(jù)采集沒有樣本數(shù)據(jù)取樣那樣的具體預(yù)設(shè),從具體大數(shù)據(jù)構(gòu)成的數(shù)據(jù)集合看,其在先預(yù)設(shè)甚至只是存在論層次的。從抽樣采集形成到自然采集生成,絕不僅僅是技術(shù)或方法上的發(fā)展,而是具有存在論意義的根本轉(zhuǎn)換,其所涉哲學(xué)層次的根本不同,正在于自然采集生成的大數(shù)據(jù)具有最基本因而最少的在先預(yù)設(shè)。
作為在先規(guī)定,預(yù)設(shè)是人類思維活動(dòng)的前提。大自然本身不存在預(yù)設(shè),而人類觀念都有在先預(yù)設(shè),正是由此構(gòu)成了二者間存在論層次的區(qū)別。就數(shù)據(jù)采集而言,預(yù)設(shè)層次上的區(qū)別決定數(shù)據(jù)性質(zhì)的不同。預(yù)設(shè)越是具體,數(shù)據(jù)采集目的也相應(yīng)越具體,所采集的數(shù)據(jù)越具有人為性質(zhì);預(yù)設(shè)越是處于基本層次,數(shù)據(jù)采集目的越不具體,所采集的數(shù)據(jù)就越具有自然的性質(zhì)。大數(shù)據(jù)的特殊性,就在于只有基本的存在論層次的預(yù)設(shè),而沒有樣本數(shù)據(jù)取樣那樣的具體目的。因此大數(shù)據(jù)具有了數(shù)據(jù)自然生成的性質(zhì),也即大數(shù)據(jù)意味著數(shù)據(jù)的“自然化”。
作為數(shù)據(jù)的“自然化”產(chǎn)物,大數(shù)據(jù)超越了樣本的有限而趨向整全。大數(shù)據(jù)和樣本數(shù)據(jù)的根本區(qū)別,可以從Lytro相機(jī)和普通相機(jī)的不同得到形象說明。
2015年,美國Lytro相機(jī)公司發(fā)明了一種名為“光場相機(jī)”(light field camera)的浸入式360度相機(jī)設(shè)備。Lytro相機(jī)能在多個(gè)深度捕捉到圖像,在拍攝結(jié)束后可以重新聚焦圖像,改變焦距進(jìn)行再對焦,不僅獲得更完美的照片效果,而且在拍攝之后可以觀看在3D空間中移動(dòng)的體積視頻,用3D顯示器展示照片,戴上眼鏡可以清楚地看到3D效果。這項(xiàng)拍照技術(shù)革命性地超越了普通相機(jī)的性質(zhì),很像大數(shù)據(jù)改變了小數(shù)據(jù)的數(shù)據(jù)性質(zhì)和使用方式。使用Lytro相機(jī)拍攝,就像大數(shù)據(jù)采集全部數(shù)據(jù),可以真正捕捉拍攝那一瞬間的全部影像,或者說捕捉到可以代表拍攝那一刻的所有光線。普通相機(jī)的拍攝角度和焦距等都是預(yù)先設(shè)定好的,只能對攝影場景做單一把握,不僅取景角度、聚焦和景深等都是凝固的,而且只是場景的二維影像。而Lytro相機(jī)拍攝時(shí)把焦距范圍內(nèi)所有的光學(xué)信息都記錄在內(nèi),因此無論抓拍的照片是不是模糊,只要在相機(jī)的焦距范圍內(nèi),都可以在拍完結(jié)束后再隨意選擇焦點(diǎn)、移動(dòng)視角。普通相機(jī)拍攝一次只能捕捉到一片光線,獲得一張信息“凝固”的照片,而Lytro相機(jī)拍攝一次卻可以捕捉到一副圖片的整個(gè)光場,拍攝后可以通過調(diào)整獲得不同效果甚至內(nèi)容的照片,而且可以循環(huán)利用。
Lytro相機(jī)和普通相機(jī)的不同,形象地表明了大數(shù)據(jù)和樣本數(shù)據(jù)在基本層次上的重要區(qū)別。數(shù)據(jù)的“自然化”,無論是從大數(shù)據(jù)采集或生成過程的性質(zhì)上,還是從其驅(qū)動(dòng)和使用關(guān)系上都有集中表現(xiàn)。數(shù)據(jù)采集的自然化,使人們甚至把大數(shù)據(jù)看作是被動(dòng)采集數(shù)據(jù)的泛濫:大數(shù)據(jù)所采集的“很大一部分是數(shù)據(jù)廢氣,即從與數(shù)字產(chǎn)品或服務(wù)(包括手機(jī)、信用卡和社交媒體)的日?;?dòng)中被動(dòng)收集的數(shù)據(jù)。這種數(shù)字?jǐn)?shù)據(jù)的泛濫被稱為大數(shù)據(jù)”①。從大數(shù)據(jù)的驅(qū)動(dòng)特點(diǎn),也可以窺見其“自然化”傾向?!巴ǔ?,大數(shù)據(jù)的推動(dòng)力完全是臨時(shí)的?!雹?而樣本數(shù)據(jù)的抽樣表明,小數(shù)據(jù)的推動(dòng)力具有貫穿數(shù)據(jù)取樣全過程的恒定性。大數(shù)據(jù)采集不是出于具體的目的,還可以從小數(shù)據(jù)和大數(shù)據(jù)的采集和使用關(guān)系進(jìn)一步看到。小數(shù)據(jù)時(shí)代,“在許多情況下,數(shù)據(jù)用戶為自己的目的準(zhǔn)備自己的數(shù)據(jù)”。而在大數(shù)據(jù)時(shí)代,“數(shù)據(jù)來自許多不同來源,由許多人準(zhǔn)備。使用數(shù)據(jù)的人很少是準(zhǔn)備好數(shù)據(jù)的人”。③ 大數(shù)據(jù)創(chuàng)建和使用的分離,意味著目的越具體越不可行;數(shù)據(jù)采集越不是出自具體目的,大數(shù)據(jù)越具有自然的性質(zhì)。所以,盡管是基本層次的不同,卻已經(jīng)決定了大數(shù)據(jù)和樣本數(shù)據(jù)在人類認(rèn)識(shí)和實(shí)踐意義上的根本區(qū)別?!皳碛姓ɑ蚪跽┑臄?shù)據(jù)集可以提供更多探索自由度,以便從不同角度探究數(shù)據(jù)或更仔細(xì)地探究其特定方面?!?yàn)榇髷?shù)據(jù)依靠所有信息,或者至少是依靠盡可能多的信息,讓我們能夠看到細(xì)節(jié)或探索新的分析,而不會(huì)冒模糊的風(fēng)險(xiǎn)。我們可以在許多不同層次測試新假設(shè)。正是大數(shù)據(jù)的這種特質(zhì),讓我們的工作達(dá)到驚人的清晰水平?!雹?大數(shù)據(jù)和小數(shù)據(jù)在存在論意義上的區(qū)別,無疑具有顛覆性。這種顛覆性,隨著大數(shù)據(jù)的自然化程度提升而越來越明顯地表現(xiàn)出來。這與大數(shù)據(jù)的整合化發(fā)展密切相關(guān),具體大數(shù)據(jù)的融匯將是大數(shù)據(jù)發(fā)展的更高層次,這又涉及具體大數(shù)據(jù)和總體大數(shù)據(jù)之間的關(guān)系。
大數(shù)據(jù)生成沒有數(shù)據(jù)抽樣那樣的具體目的,但并不意味著設(shè)計(jì)和創(chuàng)建具體的大數(shù)據(jù)沒有具體目標(biāo)。所有人類活動(dòng)都具有特定目的,設(shè)計(jì)具體的大數(shù)據(jù)也是如此。只是與樣本數(shù)據(jù)抽樣完全不同,大數(shù)據(jù)“通常在設(shè)計(jì)時(shí)考慮到了目標(biāo),但目標(biāo)是靈活的,提出的問題也是千變?nèi)f化的?!_實(shí)沒有辦法完全指定大數(shù)據(jù)資源將包含什么,資源中保存的各種類型的數(shù)據(jù)將如何組織、連接到其他數(shù)據(jù)資源或進(jìn)行有用的分析。沒有人可以有任何信心指定一個(gè)大數(shù)據(jù)項(xiàng)目的最終命運(yùn);它通常都出乎意料”。⑤這意味著,就數(shù)據(jù)生成而言,大數(shù)據(jù)類似大自然的生成,即并不是根據(jù)具體的目的選擇具體數(shù)據(jù)形成的。而且,具體的大數(shù)據(jù)具有整合為更高層次大數(shù)據(jù)的無限空間,具體數(shù)據(jù)整合的規(guī)模越大,大數(shù)據(jù)的層次越高;大數(shù)據(jù)的整合層次越高,具體大數(shù)據(jù)設(shè)計(jì)時(shí)的具體目標(biāo)就越是在整合中徹底消弭,也就是說,大數(shù)據(jù)與大自然的存在論對等性就越明顯。
大數(shù)據(jù)的自然生成性質(zhì),意味著其更具客觀真實(shí)性。正因?yàn)槿绱?,“IBM等富有遠(yuǎn)見的企業(yè)后來擴(kuò)展了這一定義,將真實(shí)性作為大數(shù)據(jù)的一個(gè)重要方面?!雹?彭迪亞拉(Vishnu Pendyala)還以《大數(shù)據(jù)的真實(shí)性》(Veracity of Big Data)為題出版了一本專著。不少文獻(xiàn)將“veracity”列為描述大數(shù)據(jù)特性的重要特征,主要是強(qiáng)調(diào)大數(shù)據(jù)為樣本數(shù)據(jù)所不能比擬的真實(shí)性特點(diǎn)。
“Veracity”表征數(shù)據(jù)的真實(shí)性,即準(zhǔn)確反映對象量化關(guān)系的程度。因?yàn)閿?shù)據(jù)可能不完整,不具有代表性,并且包含錯(cuò)誤。⑦ 因此,“大數(shù)據(jù)的真實(shí)性可定義為所考慮數(shù)據(jù)的基本真實(shí)性或真實(shí)性缺失,特別是影響從中獲得可操作見解和價(jià)值的能力”。⑧ 作為大數(shù)據(jù)形成方式的結(jié)果,數(shù)據(jù)的客觀真實(shí)性也源于大數(shù)據(jù)的生成沒有樣本數(shù)據(jù)采集那樣具體的目的和預(yù)設(shè)。大數(shù)據(jù)采集的目的性與大數(shù)據(jù)的真實(shí)性密切相關(guān),目的性越具體,預(yù)設(shè)也越具體,結(jié)果是大數(shù)據(jù)越失真,反之則越真實(shí)。真實(shí)性越強(qiáng),大數(shù)據(jù)越自然。正是數(shù)據(jù)的自然化程度,決定了大數(shù)據(jù)中人為因素的多少。
由于總是有具體預(yù)設(shè),樣本數(shù)據(jù)不可避免地滲透了程度不等的主觀因素,預(yù)設(shè)越是具體,主觀因素的滲透也相應(yīng)越明顯。樣本數(shù)據(jù)的這種性質(zhì),與大數(shù)據(jù)構(gòu)成了具有根本性的明顯反差。大數(shù)據(jù)沒有樣本數(shù)據(jù)采集時(shí)的具體方法設(shè)置和認(rèn)識(shí)論預(yù)設(shè),而只有存在論意義上的預(yù)設(shè),因而相對于具體認(rèn)識(shí)而言,可以看作趨向無預(yù)設(shè),就像相對于人類的認(rèn)識(shí)而言,自然世界的生成是沒有預(yù)設(shè)的一樣。在這個(gè)意義上,大數(shù)據(jù)的客觀真實(shí)性,完全可以歸入規(guī)模整全。規(guī)模整全包含兩層涵義:一是數(shù)據(jù)規(guī)模大到趨近整全;二是因?yàn)樵谙阮A(yù)設(shè)最少而數(shù)據(jù)采集面更廣,角度更全,維度更多。由于數(shù)據(jù)采集廣而全,大數(shù)據(jù)更具“完備性”。大數(shù)據(jù)的威力,在根本上就來自其完備性。這涉及數(shù)據(jù)“自然化”的更深層次。作為樣本數(shù)據(jù),小數(shù)據(jù)是干枯的標(biāo)本,就像制作好的生物標(biāo)本已經(jīng)“失活”;而大數(shù)據(jù)則可以是實(shí)時(shí)數(shù)據(jù),那是相對具有活性從而具有時(shí)態(tài)的數(shù)據(jù)。由此呈現(xiàn)的數(shù)據(jù)的自然性,同樣與數(shù)據(jù)采集的前提性預(yù)設(shè)密切相關(guān)。數(shù)據(jù)采集的前提性預(yù)設(shè)越基本,由以生成的數(shù)據(jù)越“自然”。正是大數(shù)據(jù)幾近無預(yù)設(shè)給我們帶來更大可能性空間,其中最重要的就是數(shù)據(jù)的“自然化”使大數(shù)據(jù)規(guī)模趨向全數(shù)據(jù),從而走向新的整體把握方式。
二、大數(shù)據(jù)的規(guī)模整全性
從數(shù)據(jù)的發(fā)展看,大數(shù)據(jù)的關(guān)鍵特征就是從有限的樣本數(shù)據(jù)或部分?jǐn)?shù)據(jù)發(fā)展到全部數(shù)據(jù)。樣本數(shù)據(jù)構(gòu)成的是部分?jǐn)?shù)據(jù);全部數(shù)據(jù)形成的是整全數(shù)據(jù)。作為抽樣得到的部分?jǐn)?shù)據(jù),不管采樣對象的規(guī)模、抽樣范圍和收集的數(shù)據(jù)有多大,都是樣本數(shù)據(jù)。這一點(diǎn)正像概念,不管概念的涵蓋面有多廣,都是抽象的產(chǎn)物。作為抽取樣本得到的數(shù)據(jù),樣本數(shù)據(jù)類似概括得到的概念,具有從所有具體事物抽取樣本的具體條件抽離性質(zhì),相應(yīng)具有抽離具體條件和過程的凝固性。而作為全部數(shù)據(jù)的大數(shù)據(jù)是實(shí)時(shí)采集的,因此是實(shí)時(shí)反映對象的具體數(shù)據(jù),具有具體個(gè)別事物的生動(dòng)性。大數(shù)據(jù)是就一定對象生成的全數(shù)據(jù),不僅包括空間范圍,而且包括時(shí)間過程。不管數(shù)據(jù)采集對象規(guī)模、采集范圍、采集的數(shù)據(jù)量如何小,只要是關(guān)于一個(gè)對象的全體數(shù)據(jù),都是全數(shù)據(jù),就像收集一個(gè)對象構(gòu)成的所有部分或具體個(gè)體,所得到的都是具體對象的全部存在一樣。
關(guān)于大數(shù)據(jù)的全數(shù)據(jù)性質(zhì),《大數(shù)據(jù)時(shí)代》一書從大數(shù)據(jù)和樣本數(shù)據(jù)的關(guān)系出發(fā)做了一個(gè)重要的概括性表述:“從一些到全部”(From some to all)⑨,并使用了一個(gè)耐人尋味的公式:“N=all”。⑩這一表述非常簡潔地表明了一個(gè)重要問題:從小數(shù)據(jù)到大數(shù)據(jù)的發(fā)展在根本上意味著什么。作者反復(fù)強(qiáng)調(diào),使用所有的數(shù)據(jù)讓我們看到了細(xì)節(jié),當(dāng)我們被限制在少量數(shù)據(jù)時(shí),這些細(xì)節(jié)永遠(yuǎn)無法看到。使用所有的數(shù)據(jù),可以發(fā)現(xiàn)隱藏在浩瀚信息中的聯(lián)系和細(xì)節(jié)。{11} 中譯本將此理解為“全數(shù)據(jù)”{12} 是有道理的,正符合大數(shù)據(jù)發(fā)展的實(shí)際?!霸谠S多領(lǐng)域,一種轉(zhuǎn)變正在發(fā)生,即從采集部分?jǐn)?shù)據(jù)到采集盡可能多的數(shù)據(jù),而且如果可行,采集所有數(shù)據(jù):‘樣本數(shù)=全部’(N=all)。”{13} 這一等式的涵義是:大數(shù)據(jù)等于取樣趨向無限的集合,而不是大量樣本數(shù)據(jù)的加合?!按髷?shù)據(jù)不是已經(jīng)膨脹到無法再放入電子表格的小數(shù)據(jù),也不是碰巧非常大的數(shù)據(jù)庫?!眥14} 在這個(gè)意義上,即便將大數(shù)據(jù)理解為樣本數(shù)等于全部也不完全確切。
原則上說,再多的樣本數(shù)據(jù)也不能構(gòu)成大數(shù)據(jù)。確切的理解是:樣本數(shù)趨向無限,因而使數(shù)據(jù)不再具有樣本數(shù)據(jù)的性質(zhì)。不是取樣而是采集全部數(shù)據(jù),意味著不是抽取樣本,而是全數(shù)納入;而“從一些到全部”,則意味著從部分到整體。當(dāng)然,無論全部還是整體,都是相對的。對全球人口抽樣調(diào)查得到的數(shù)據(jù)是小數(shù)據(jù),而一個(gè)人的基因全數(shù)據(jù)則是大數(shù)據(jù)。人口抽樣普查得到的數(shù)據(jù)規(guī)??梢苑浅4?,但只要是抽樣產(chǎn)生的,就不是全數(shù)據(jù);而就所有特斯拉汽車或波音飛機(jī)發(fā)動(dòng)機(jī)的運(yùn)行收集的數(shù)據(jù),即使在一定發(fā)展階段數(shù)據(jù)規(guī)模不大,也是具有完備性的大數(shù)據(jù)。大數(shù)據(jù)之所以為大數(shù)據(jù),不在于數(shù)據(jù)采集對象的規(guī)模,也不完全在于數(shù)據(jù)本身的規(guī)模,只要具有全數(shù)據(jù)的性質(zhì),就是大數(shù)據(jù)。對于人類認(rèn)識(shí)目的和實(shí)踐需要來說,只要具有相對于對象而言的完備性,大數(shù)據(jù)完全可以作為真正意義上的全部數(shù)據(jù)和整體數(shù)據(jù)使用。
在日本相撲的最高級(jí)別比賽中,很難由小數(shù)據(jù)辨識(shí)腐敗行為,必須有大數(shù)據(jù)的整體把握。馬克·達(dá)根(Mark Duggan)和史蒂文·萊維特(Steven D. Levitt)通過歷年大數(shù)據(jù),發(fā)現(xiàn)了比賽中的交易行為。{15} 正是基于這一案例分析,舍恩伯格等認(rèn)為,就大數(shù)據(jù)而言,“數(shù)據(jù)量無需超越TB量級(jí)。在相撲的案例中,整個(gè)數(shù)據(jù)集包含的比特?cái)?shù)比如今一張典型的數(shù)碼照片都要少。但作為大數(shù)據(jù)分析,它考慮的不僅僅是一個(gè)典型隨機(jī)樣本。當(dāng)我們談?wù)摯髷?shù)據(jù)時(shí),我們指的‘大’不是絕對意義上的,而是相對意義上的:相對于綜合數(shù)據(jù)集合”。{16}而且,數(shù)據(jù)規(guī)模和數(shù)據(jù)化對象的規(guī)模是完全不同的概念,無論數(shù)據(jù)化對象的規(guī)模如何,原則上都可以以其為數(shù)據(jù)生成對象,建立起具有整全性的大數(shù)據(jù)。正是在這個(gè)意義上,表示大數(shù)據(jù)基本特征的“Volume”不只是規(guī)模大,其根本內(nèi)涵是“規(guī)模整全性”。
由此可見,大數(shù)據(jù)的“大”不是純粹的量的概念,“大”的關(guān)鍵是“全”。“Big data”中的“big”這一單詞,本身就有“l(fā)arge”所不具有的整體性涵義,它意味著“大數(shù)據(jù)”不能等同于“大量數(shù)據(jù)”。正是這種整體性,構(gòu)成了大數(shù)據(jù)的“整全”;正是“整全”才類似大自然的存在。當(dāng)我們說某領(lǐng)域數(shù)據(jù)是整全的,就意味著其構(gòu)成的維度多,甚至趨向相對意義上的全維度。在經(jīng)驗(yàn)意義上,作為實(shí)時(shí)數(shù)據(jù),大數(shù)據(jù)的全數(shù)據(jù)性質(zhì)則意味著空間和時(shí)間上的全維度,意味著一種更高維的整體性。關(guān)于大數(shù)據(jù)的全維度性質(zhì),也可以從Lytro相機(jī)與普通相機(jī)的區(qū)別得到簡潔的理解。從數(shù)據(jù)發(fā)展看,大數(shù)據(jù)越來越趨向于全數(shù)據(jù),因而具有越來越強(qiáng)的整體性。正因?yàn)槿绱?,人們認(rèn)為“也許我們不應(yīng)該專注于‘大數(shù)據(jù)革命’,而應(yīng)該專注于‘全數(shù)據(jù)革命’(all data revolution)”。{17}
事實(shí)上,只要數(shù)據(jù)具有完備性,數(shù)據(jù)采集對象規(guī)模越小,或者采集的數(shù)據(jù)量越小,越是以對比反差極大的方式凸顯大數(shù)據(jù)的規(guī)模整全性特征。類似特斯拉汽車行駛的數(shù)據(jù)都是具體的大數(shù)據(jù),而“萬物數(shù)據(jù)化”(The datafication of everything){18} 則在更高層次涉及大數(shù)據(jù)的規(guī)模整全性或全數(shù)據(jù)性質(zhì)。大數(shù)據(jù)的規(guī)模整全性,既是指具體的大數(shù)據(jù),更是在大數(shù)據(jù)的融匯發(fā)展意義上說的。大數(shù)據(jù)的發(fā)展,必定會(huì)經(jīng)歷一個(gè)“數(shù)據(jù)割據(jù)”的發(fā)展階段,但統(tǒng)一發(fā)展也必定是發(fā)展的總體方向。大數(shù)據(jù)越是統(tǒng)一發(fā)展,其規(guī)模整全性越典型。正是量化世界的發(fā)展趨勢,在根本上體現(xiàn)了大數(shù)據(jù)的整全性特征。
總之,數(shù)據(jù)量大是大數(shù)據(jù)的基本特征,但這個(gè)特征所表達(dá)的是大數(shù)據(jù)的規(guī)模趨向整全。就是說,大數(shù)據(jù)的“大”是一個(gè)質(zhì)的概念,大數(shù)據(jù)的“大量”是指質(zhì)上的整全。因此,“將‘大數(shù)據(jù)’與‘大量數(shù)據(jù)’或‘海量數(shù)據(jù)’區(qū)分開來很重要”。{19}
實(shí)際上,關(guān)于大數(shù)據(jù)的這一特征,認(rèn)識(shí)也經(jīng)歷了一個(gè)由量到質(zhì)的過程,而且認(rèn)識(shí)深化的過程還在繼續(xù)。幾年前人們就意識(shí)到,大數(shù)據(jù)并不一定在絕對意義上大,盡管它通常如此。這一理解,已經(jīng)涉及大數(shù)據(jù)的規(guī)模整全性,只是還處于朦朧意識(shí)階段,更談不上完全到位。其中的重要原因,就在于主要還是在方法論甚至具體方法意義上理解大數(shù)據(jù)的“大”。在關(guān)于大數(shù)據(jù)的理解中,《大數(shù)據(jù)時(shí)代》一書已經(jīng)達(dá)到很高層次。作者已經(jīng)明確意識(shí)到,“數(shù)據(jù)點(diǎn)的絕對數(shù)量和數(shù)據(jù)集的大小本身并不是構(gòu)成這些大數(shù)據(jù)示例的原因。之所以將其歸類為大數(shù)據(jù),是因?yàn)槎急M可能多地使用了全體數(shù)據(jù),而不是走隨機(jī)取樣的捷徑,就像谷歌流感趨勢和史蒂夫·喬布斯(Steve Jobs)的醫(yī)生一樣”。{20} 在這里,大數(shù)據(jù)的全數(shù)據(jù)理解已經(jīng)十分明確,但也明顯還沒有從規(guī)模整全意義上理解大數(shù)據(jù)之“大”。而大數(shù)據(jù)的全數(shù)據(jù)理解和規(guī)模整全性理解,具有存在論意蘊(yùn)上的區(qū)別。顯然,大數(shù)據(jù)涉及一種不同于抽象普遍性概念體系意義上的整體性。大數(shù)據(jù)的整體性是量化意義上的整體性,或量化的整體性;與此相應(yīng),抽象普遍性概念體系所構(gòu)成的,則是質(zhì)性意義上的整體性。大數(shù)據(jù)規(guī)模整全性的存在論理解,意味著大數(shù)據(jù)哲學(xué)理解的更深層次,這也正是大數(shù)據(jù)規(guī)模整全性的關(guān)鍵哲學(xué)意蘊(yùn)所在。
三、大數(shù)據(jù)規(guī)模整全性的量化整體觀照意義
作為信息數(shù)字編碼發(fā)展的產(chǎn)物,作為“量化世界”的片段結(jié)果,大數(shù)據(jù)構(gòu)成的是一個(gè)量化的整體,一個(gè)具有存在論意義的整體。在存在論層次,規(guī)模整全意味著數(shù)據(jù)大不僅是整體大,而且更關(guān)鍵的是可能構(gòu)成關(guān)于存在的更高整體層次理解和把握。規(guī)模趨向整全,從而在由抽象普遍性構(gòu)成的質(zhì)性整體之外,形成了新的量化整體。量化整體所構(gòu)成的量化整體觀照,在人類認(rèn)識(shí)中具有特殊意義,尤其是在提供最高層次整體觀照的哲學(xué)領(lǐng)域。
由于總是可以趨向更整全,大數(shù)據(jù)具有全域化性質(zhì)。大數(shù)據(jù)的全域化意味著具有豐富的可擴(kuò)展性,意味著一個(gè)數(shù)據(jù)集合在更大范圍、更高層次的整體觀照下,其功能和意義會(huì)得到相應(yīng)擴(kuò)展。大數(shù)據(jù)提高一個(gè)整體層次,意味著提供了一種完全不同的整體觀照,其意義是量的累加所完全不能比擬的。由此可見,規(guī)模整全性的“全”不是一個(gè)量的概念,其所意味著的規(guī)模整全性具有存在論意義。
毫無疑問,大數(shù)據(jù)的規(guī)模整全性,可以從“全數(shù)據(jù)”得到具體而形象的理解,但由此得到的理解還不足以達(dá)到存在論層次。事實(shí)上,作為具有存在論意義的量化存在,大數(shù)據(jù)量化的整體性又是具體的整體性。就大數(shù)據(jù)而言,與其說“生活中真正有趣的東西通常是在樣本無法完全捕捉到的地方發(fā)現(xiàn)的”{21},不如說樣本數(shù)據(jù)不可能反映只有作為一個(gè)具體的整體才可能表現(xiàn)出來的局部信息。大數(shù)據(jù)所呈現(xiàn)的量化具體整體,特別是基于網(wǎng)絡(luò)的發(fā)展及隨之而來的信息本性的開顯,使其在這方面的優(yōu)勢不斷展開。由于不同于抽象普遍性意義上的整體性,大數(shù)據(jù)構(gòu)成的量化整體性具有質(zhì)性整體性所沒有的重要特點(diǎn)。
大數(shù)據(jù)的規(guī)模整全性,具有量化整體觀照的重要意義。作為量化的整體,“獲取更全數(shù)據(jù)”至關(guān)重要,有些問題只能通過規(guī)模整全性解決。由于作為量化的存在,大數(shù)據(jù)本身是具體的,因此大數(shù)據(jù)規(guī)模整全性的哲學(xué)意蘊(yùn)甚至可以在大數(shù)據(jù)的具體應(yīng)用中感受到。利用所有的數(shù)據(jù),可以發(fā)現(xiàn)隱藏在浩瀚信息中的聯(lián)系和細(xì)節(jié)。例如,檢測信用卡欺詐的工作原理是尋找異常,而找到異常的最佳方法是處理所有數(shù)據(jù)而不是樣本。異常值是最有意義的信息,而要識(shí)別它們,只能通過與大量正常交易進(jìn)行比較。這是一個(gè)典型的大數(shù)據(jù)問題。只有在整體觀照中才能更到位地理解局部,這一原理運(yùn)用于大數(shù)據(jù),就可以得到更具體的表述:一些類似“異常情況”的重要局部現(xiàn)象,只有在大數(shù)據(jù)的整體觀照中才能看到。典型的比如Xoom與跨境匯款異常交易報(bào)警?!癤oom是一家專門從事國際匯款業(yè)務(wù)的公司,由大數(shù)據(jù)領(lǐng)域的知名企業(yè)提供支持。它分析與其處理的事務(wù)相關(guān)聯(lián)的所有數(shù)據(jù)。2011年,該系統(tǒng)注意到來自美國新澤西州的Discover卡交易數(shù)量略高于平均水平,因而拉響了警報(bào)。Xoom的首席執(zhí)行官John Kunze作了這樣的解釋:“它發(fā)現(xiàn)了一個(gè)本不應(yīng)該存在的模式?!眥22} 作為一個(gè)量化的自然整體,大數(shù)據(jù)就像人體,二者都有其正常狀態(tài),一旦出現(xiàn)不正常情況,對人體來說可能是疾病信號(hào),而對大數(shù)據(jù)和人的關(guān)系來說,則可能意味著潛在價(jià)值無限的信息空間,可以凸顯樣本數(shù)據(jù)不可能反映的重要信息。而且,規(guī)模整全性的“全”是相對而言的,正是相對而言的“全”,恰恰意味著空間的開放性。而全數(shù)據(jù)空間的開放性,則意味著反映更深層次問題的無限可能性。
由大數(shù)據(jù)的規(guī)模整全性,可以對大數(shù)據(jù)“全”的相對性有更深入的理解。相對于經(jīng)驗(yàn)世界的存在,數(shù)據(jù)存在是無窮無盡的。在現(xiàn)實(shí)中,規(guī)模整全性是相對于認(rèn)識(shí)需要和實(shí)踐目的而言的。以象棋殘局為例可以做出典型說明。在象棋殘局中,當(dāng)只剩下六個(gè)以下棋子時(shí),人類棋手仍很難把握殘局涉及的所有數(shù)據(jù),而電腦下棋程序則可以把握“全數(shù)據(jù)”。因此,“當(dāng)棋盤上剩下六枚或更少棋子時(shí),對殘局已經(jīng)進(jìn)行完全分析,所有可能的走法(樣本數(shù)=全部)都已經(jīng)列入一個(gè)很大的表格,在沒有壓縮時(shí),這個(gè)表格可填滿超過1TB的數(shù)據(jù)。這使得國際象棋計(jì)算機(jī)能夠完勝殘局,沒有人能夠戰(zhàn)勝這個(gè)系統(tǒng)”。{23} 而大數(shù)據(jù)的發(fā)展,正使這一“全數(shù)據(jù)”把握范圍不斷擴(kuò)大。這個(gè)“全數(shù)據(jù)”理解的簡單案例,不僅與人工智能理解的語境機(jī)制密切相關(guān),而且更具體地揭示了大數(shù)據(jù)規(guī)模整全性的整體觀照機(jī)制。大數(shù)據(jù)的規(guī)模整全性帶來了大數(shù)據(jù)的完備性,從而可以通過整體觀照實(shí)現(xiàn)整體控制。
作為現(xiàn)實(shí)世界的量化反映,大數(shù)據(jù)為我們提供了量的整體把握方式。由于可以用量化的方式把握,大數(shù)據(jù)不需要用抽象的理想化方法對數(shù)據(jù)進(jìn)行處理,這使得大數(shù)據(jù)可以作為量化整體把握手段,達(dá)到對具體事物的相對直接把握,而不是通過抽離具體條件進(jìn)行定性歸納,概括地達(dá)到抽象的整體把握。最終人類認(rèn)識(shí)得以通過量化整體把握和質(zhì)性整體把握,以互補(bǔ)的方式更全面有效地把握世界、人自身以及二者之間的關(guān)系。而且,大數(shù)據(jù)通過日益發(fā)展的整全性,達(dá)到不僅規(guī)模越來越大,而且層次越來越高的量化整體性。由此我們可以感受到大數(shù)據(jù)量化整體性與“量化世界”的內(nèi)在關(guān)系,從而認(rèn)識(shí)到“量化世界”不能被視為僅僅是走向極端的空洞口號(hào)。
從大數(shù)據(jù)的爆發(fā)性增長趨勢可以看到,大數(shù)據(jù)的發(fā)展所遵循的,應(yīng)當(dāng)是人類還沒有經(jīng)歷過的方式。在大概十年前,最流行的術(shù)語就是大數(shù)據(jù)。根據(jù)IBM的估計(jì),當(dāng)時(shí)“每天生成2.5萬億字節(jié)的數(shù)據(jù),其中超過90%是在過去兩年中生成的”。{24} 自此以后,大數(shù)據(jù)呈現(xiàn)由倍增到指數(shù)增長的趨勢,大數(shù)據(jù)的這種爆炸性發(fā)展,作為信息現(xiàn)象甚至讓人不禁與作為物能現(xiàn)象的宇宙大爆炸產(chǎn)生聯(lián)想。正是大數(shù)據(jù)規(guī)模整全性的高速發(fā)展,在實(shí)踐中構(gòu)成了一種具有存在論意義的“數(shù)據(jù)驅(qū)動(dòng)”,催生了“計(jì)算社會(huì)科學(xué)”的發(fā)展。
作為量化的整體性存在,大數(shù)據(jù)蘊(yùn)含著豐富的量化相關(guān)關(guān)系。在社會(huì)學(xué)中,“探求變量間的關(guān)系是社會(huì)研究的一個(gè)重要目標(biāo),也是社會(huì)研究的基礎(chǔ)工作”。{25} 隨著數(shù)字化的發(fā)展,這些都為計(jì)算社會(huì)科學(xué)的提出和發(fā)展奠定了基礎(chǔ)。正是以大數(shù)據(jù)通過量化方式所反映的社會(huì)關(guān)系為研究對象,誕生了“計(jì)算社會(huì)科學(xué)”這一新的研究領(lǐng)域。2009年2月,美國哈佛大學(xué)的戴維·萊茲(David Laze)等15位學(xué)者在《科學(xué)》上聯(lián)合發(fā)表題為《計(jì)算社會(huì)科學(xué)》(Computational Social Science)的論文,宣告了以數(shù)據(jù)驅(qū)動(dòng)為基本特征的計(jì)算社會(huì)科學(xué)的誕生。“一門計(jì)算社會(huì)科學(xué)正在興起,它以前所未有的廣度、深度和規(guī)模利用收集和分析數(shù)據(jù)的能力。……揭示個(gè)人和群體行為的模式。”{26} 正是計(jì)算社會(huì)科學(xué)凸顯的“數(shù)據(jù)驅(qū)動(dòng)”,帶來了大數(shù)據(jù)基礎(chǔ)上理論和實(shí)踐的全新方式。由于基于數(shù)據(jù)驅(qū)動(dòng),計(jì)算社會(huì)科學(xué)使得社會(huì)科學(xué)研究有了新的把握手段,它會(huì)隨著大數(shù)據(jù)的整全化發(fā)展而不斷強(qiáng)化。而從哲學(xué)層次看,具有更重要意蘊(yùn)的不是大數(shù)據(jù)的爆炸式發(fā)展速度,而是其趨向規(guī)模整全的發(fā)展。這對于人類以量化方式把握和創(chuàng)構(gòu)世界,意義非同尋常。
四、大數(shù)據(jù)量化整體觀照的哲學(xué)意蘊(yùn)
哲學(xué)總是以提供最高層次整體把握為己任,大數(shù)據(jù)所意味著的量化整體把握,關(guān)系到哲學(xué)最獨(dú)特的性質(zhì)和功能:為具體認(rèn)識(shí)和實(shí)踐提供最高層次的量化整體觀照。
在大自然基礎(chǔ)上,我們必須通過理性認(rèn)識(shí),才能建立起具體事物認(rèn)識(shí)的抽象普遍性整體觀照,也就是說,我們不能把大自然本身作為具體事物認(rèn)識(shí)的整體觀照;而在大數(shù)據(jù)基礎(chǔ)上,具體事物認(rèn)識(shí)的整體觀照卻可以由具有規(guī)模整全性的大數(shù)據(jù)本身提供。而且大數(shù)據(jù)所提供的,還是不同于抽象普遍性的量化整體觀照。因此基于大數(shù)據(jù),整體觀照不僅運(yùn)用于具體的認(rèn)識(shí),而且直接運(yùn)用于具體的實(shí)踐——這意味著大數(shù)據(jù)的量化整體觀照,將促進(jìn)認(rèn)識(shí)和實(shí)踐整體觀照的一體化。正因?yàn)槿绱耍诖髷?shù)據(jù)的實(shí)際應(yīng)用中,大數(shù)據(jù)的量化整體觀照機(jī)制越來越普遍。關(guān)于大數(shù)據(jù)量化整體觀照的理論研究,成了當(dāng)代哲學(xué)研究的重要任務(wù)。
大數(shù)據(jù)所提供的量化整體觀照意義重大,它不僅補(bǔ)充了質(zhì)性整體觀照,而且凸顯了整體觀照的本性。越是將研究落實(shí)到大數(shù)據(jù)本性的基礎(chǔ)之上,甚至落實(shí)到作為大數(shù)據(jù)存在基礎(chǔ)的信息之上,就越能不斷深化理解關(guān)于大數(shù)據(jù)“點(diǎn)數(shù)成金”等比喻性說法的實(shí)質(zhì)意義。這里的“點(diǎn)數(shù)成金”比擬的并不是“金手指”,而是大數(shù)據(jù)整體觀照構(gòu)成的量化整體把握。以抽象普遍性把握對象,自然而然會(huì)認(rèn)為所把握的是對象的整體性。而大數(shù)據(jù)所提供的量化整體把握,所把握的則明顯不是大數(shù)據(jù)本身的整體性,它所提供的不是一種對既存對象的整體揭示,而是對對象認(rèn)識(shí)的整體觀照。而且就整體觀照而言,大數(shù)據(jù)反而具有更客觀的性質(zhì)。
隨著大數(shù)據(jù)本身的發(fā)展及其研究的不斷深化,我們可以看到越來越廣闊的前景。在人類發(fā)展過程中,對于歷史記憶,主要依靠人際經(jīng)驗(yàn)傳承,文字記載和小數(shù)據(jù)等方式保存,而這些都或者具有主觀性,或者具有抽象性,或者具有樣本性等局限。大數(shù)據(jù)提供了更客觀詳盡的數(shù)據(jù)采集和儲(chǔ)存方式,從而在一定程度上有了相對客觀的人類歷史積淀,而且是經(jīng)驗(yàn)累積和理性概括相結(jié)合的,從而使歷史數(shù)據(jù)作為不斷擴(kuò)展的量化整體,為當(dāng)下理解和未來預(yù)測提供整體層次越來越高的整體觀照。由此可見,大數(shù)據(jù)所帶來的絕不僅僅是越來越多的數(shù)據(jù),更是直接建立在具體事物之上的整體性,可稱之為“具體的整體性”。這種具體的整體性與抽象的整體性完全不同,其區(qū)別比思維抽象和思維具體的區(qū)別更重要,因?yàn)樗季S具體仍然建立在思維抽象之上,而直接建立在具體事物之上的大數(shù)據(jù)整體性,則實(shí)現(xiàn)了思維與具體事物的直接關(guān)聯(lián)。其表現(xiàn)主要集中在兩個(gè)方面,一方面是具體的量化,另一方面是具體的語境化。正是具體的量化帶來了可計(jì)算;正是具體的語境化給新一代人工智能帶來了人類語境。人工智能意味著新的哲學(xué)問題,甚至新的哲學(xué)研究領(lǐng)域。從人類思維把握對象,到越來越具有哲學(xué)內(nèi)涵的人工智能通用化發(fā)展,大數(shù)據(jù)的量化整體把握都具有重要哲學(xué)和科學(xué)一體化意蘊(yùn)。
與整體把握相聯(lián)系,大數(shù)據(jù)的最大優(yōu)勢就是基于量化,可以通過計(jì)算得到量化的具體整體性。大數(shù)據(jù)的量化整體性,不僅在積淀中不斷擴(kuò)大規(guī)模,而且通過計(jì)算的整體性不斷提升整體層次。由此帶來的全新發(fā)展形勢,特別是數(shù)據(jù)驅(qū)動(dòng),具有非常特殊的重要哲學(xué)意蘊(yùn)。在大數(shù)據(jù)出現(xiàn)之前,人類主要是依靠經(jīng)驗(yàn)直覺、概念推理和符號(hào)演算把握對象和制定決策,而大數(shù)據(jù)構(gòu)成的數(shù)據(jù)驅(qū)動(dòng)將改變?nèi)祟惏盐諏ο蠛妥龀鰶Q策的方式,而且取得以往不可能取得的效果,以致人們認(rèn)為,“大數(shù)據(jù)的最大影響將是數(shù)據(jù)驅(qū)動(dòng)的決策將增強(qiáng)或推翻人類的判斷”。{27} 數(shù)據(jù)驅(qū)動(dòng)既不是單純的研究方法,也不只是意味著新的認(rèn)識(shí)論范式,而是意味著方法論、認(rèn)識(shí)論和存在論的一體化。
大數(shù)據(jù)的規(guī)模整全化,使計(jì)算的整體性把握具有通過量的計(jì)算進(jìn)行動(dòng)態(tài)整體把握的特點(diǎn),因而不僅可以把握既定存在的整體性,而且還適用于對未來進(jìn)程的整體把握。由此可見理查德·哈明(Richard Hamming)觀點(diǎn)的根據(jù):“計(jì)算的目的是洞察,而不是數(shù)字?!眥28} 其所意味著的計(jì)算的整體性,集中體現(xiàn)了計(jì)算的優(yōu)勢。Alpha Zero就是基于計(jì)算優(yōu)勢,達(dá)到對未來棋局走向的更長程動(dòng)態(tài)把握,贏得人類棋手的。在特質(zhì)上,計(jì)算的整體性把握完全不同于通過從概念到概念的思辨整體性和依靠經(jīng)驗(yàn)累積的直覺整體性。由于計(jì)算整體性的出現(xiàn),在人們的整體把握方式中,就有了直覺的整體性、概念的整體性和計(jì)算的整體性三種基本方式。直覺的整體性基于經(jīng)驗(yàn),概念的整體性基于邏輯,計(jì)算的整體性基于大數(shù)據(jù)。三種整體性具有不同的機(jī)制,也具有不同的功能。概念的整體性把握更適合于以既定存在為對象的認(rèn)識(shí)活動(dòng);計(jì)算的整體性把握更適合于以未來創(chuàng)構(gòu)為對象的活動(dòng);而作為最基本的整體把握方式,直覺的整體性把握則具有兩方面的性質(zhì),一方面可用于從過去到未來全程對象的認(rèn)識(shí)活動(dòng),另一方面又在以既定存在為對象的認(rèn)識(shí)活動(dòng)中遠(yuǎn)不如概念的整體性,在以未來創(chuàng)構(gòu)為對象的活動(dòng)中遠(yuǎn)不如計(jì)算的整體性。作為直覺整體性和概念整體性基礎(chǔ)上新產(chǎn)生的整體性,計(jì)算的整體性就是量化的整體性。當(dāng)前,三種整體把握特別是質(zhì)性整體把握和量化整體把握之間的關(guān)系,已經(jīng)成為一個(gè)新的研究課題。特別是在質(zhì)性整體觀照和量化整體觀照之間,存在值得深入研究的空間。
在關(guān)于大數(shù)據(jù)的理解中,規(guī)模整全性的意義主要就在于整體觀照提供的理解機(jī)制。由于其整全性,大數(shù)據(jù)對于理解具有特殊意義。沒有整全性,整體觀照的意義主要是凸顯局部的整體地位,而一旦數(shù)據(jù)具有整全性,那就不僅可以進(jìn)行一般意義上的整體觀照,而且可以糾正局部的具體細(xì)節(jié)錯(cuò)誤?!凹词箶?shù)據(jù)相當(dāng)不可靠,在許多情況下也可以通過添加更多數(shù)據(jù)來消除任何錯(cuò)誤,從而將可靠性提高到必要的水平。”{29} 大數(shù)據(jù)的全數(shù)據(jù)發(fā)展趨勢,可以越來越深入地消除局部的數(shù)據(jù)錯(cuò)誤。由此構(gòu)成的整體觀照功能,恰恰是建立在抽象普遍性基礎(chǔ)上的質(zhì)性整體觀照所不具備的。
由于量化和概括的不同性質(zhì),大數(shù)據(jù)所提供的量化整體觀照和抽象普遍性理論所提供的質(zhì)性整體觀照具有不同的性質(zhì)和特點(diǎn)。質(zhì)性整體觀照基于抽象概括,量化整體觀照基于數(shù)據(jù)整全。從形成的機(jī)制看,由抽象普遍性理論提供的整體觀照只是認(rèn)識(shí)論意義上的,而由大數(shù)據(jù)提供的量化整體觀照則可以是存在論意義上的。建立在認(rèn)識(shí)論基礎(chǔ)上的抽象普遍性整體觀照,不僅在認(rèn)識(shí)環(huán)節(jié)會(huì)滲入更多的價(jià)值觀等觀念性的因素,而且必須有更具體的前提性預(yù)設(shè)。而建立在大數(shù)據(jù)基礎(chǔ)上的量化具體整體觀照,則不僅只有最基本的前提性預(yù)設(shè),而且整個(gè)形成過程很少有人的有意識(shí)直接介入。正是在這個(gè)意義上,“與統(tǒng)計(jì)學(xué)家和數(shù)據(jù)分析師相比,學(xué)科領(lǐng)域的專家、實(shí)務(wù)專家將失去一些光彩,因?yàn)榻y(tǒng)計(jì)學(xué)家和數(shù)據(jù)分析師不受舊行為方式的束縛,而是讓數(shù)據(jù)說話。他們依靠相關(guān)關(guān)系,沒有成見和偏見”。{30} 大數(shù)據(jù)的量化整體觀照不僅更少偏見,而且能構(gòu)成更完備的整體把握?!按髷?shù)據(jù)讓我們能夠測量我們以前無法測量的東西。”{31} 這意味著兩個(gè)不同層次的整體觀照具有不同程度的客觀性,而這種客觀性上的差別,對于整體觀照效果的影響則可以是根本的。
作為兩種不同的整體觀照方式,它們的不同可以在更基本的層次看得更清楚。在日常生活中,甚至新聞的受歡迎程度,都受著質(zhì)性和量化兩種不同方式的影響。用數(shù)據(jù)的量化方式說話,越來越比用抽象概括的觀念描述更受讀者歡迎。典型的例子之一就是:“與經(jīng)驗(yàn)豐富的記者的直覺相比,數(shù)據(jù)更能發(fā)現(xiàn)人們想要閱讀的內(nèi)容?!眥32} 而亞馬遜圖書銷售的大數(shù)據(jù)運(yùn)用表明,根據(jù)大數(shù)據(jù)的圖書推薦,比通過圖書評論員更有效。這些日常性的例子,與其說說明了孰優(yōu)孰劣,不如說表明了量化整體觀照與質(zhì)性整體觀照相結(jié)合,對于人類認(rèn)識(shí)和實(shí)踐中的整體把握將會(huì)有一個(gè)什么樣的推進(jìn)。
由于提供了量化整體觀照,大數(shù)據(jù)有助于我們在定性和定量相結(jié)合的更完備的整體觀照中理解世界?!叭珨?shù)據(jù)革命”意味著,“我們認(rèn)識(shí)到世界的關(guān)鍵變化是創(chuàng)新分析,使用來自所有傳統(tǒng)和新來源的數(shù)據(jù),并提供對我們世界更深入、更清晰的理解”。{33} 大數(shù)據(jù)的人類使用,為深化理解世界提供了無限空間。“收集和分析大量數(shù)據(jù)的新技術(shù),將以我們剛剛開始欣賞的方式幫助我們理解我們的世界?!嬲母锩辉谟谟?jì)算數(shù)據(jù)的機(jī)器,而在于數(shù)據(jù)本身以及我們?nèi)绾问褂盟??!眥34} 更為重要的是,“大數(shù)據(jù)讓我們能夠以前所未有的方式識(shí)別因果關(guān)系”。{35} 由此可見,基于已有質(zhì)性整體把握的大數(shù)據(jù)量化整體把握,遠(yuǎn)不是與質(zhì)性整體把握的“1+1=2”的加合,而是具有價(jià)值不可估量的互補(bǔ)整合效應(yīng),二者構(gòu)成了一種更高層次的整體觀照機(jī)制。哲學(xué)的根本意義就在于為具體的認(rèn)識(shí)和實(shí)踐提供最高層次的整體觀照,而基于抽象的質(zhì)性整體觀照,大數(shù)據(jù)的量化整體觀照所具有的重要哲學(xué)意蘊(yùn)顯而易見。
大數(shù)據(jù)之所以具有完全不同于小數(shù)據(jù)的作用和效果,正是由于其具有雙向循環(huán)性質(zhì)的兩方面機(jī)制。一方面,大數(shù)據(jù)可以通過量化整體觀照,帶來其他方式不可能帶來的整體信息,其典型的例子之一正是莫里的航海圖{36};另一方面,大數(shù)據(jù)還可以通過局部信息的完整采集,投射到一個(gè)特定整體情境,得到關(guān)于更大整體的信息,其典型的例子之一則是特斯拉汽車或波音飛機(jī)發(fā)動(dòng)機(jī)運(yùn)行的大數(shù)據(jù)。這兩類大數(shù)據(jù)堪稱大數(shù)據(jù)發(fā)展的具有標(biāo)志性意義的案例。由它們可以典型地看到,正是這兩種不同類型的大數(shù)據(jù)相關(guān)關(guān)系的挖掘和開發(fā)利用,可以構(gòu)成一種雙向循環(huán)過程和機(jī)制。這已經(jīng)不是通常意義上的過程和機(jī)制,它不僅具有存在論意蘊(yùn),而且具有現(xiàn)實(shí)的數(shù)據(jù)挖掘價(jià)值。正是由此,大數(shù)據(jù)的量化整體觀照不僅涉及其在哲學(xué)層次的理論意義,而且意味著理論和實(shí)踐的一體化。
注釋:
① Angioletta Voghera & Luigi La Riccia, Spatial Planning in the Big Data Revolution, Hershey: IGI Global, 2019, p.xxi.
②③⑤{14} Jules J. Berman, Principles and Practice of Big Data, Preparing, Sharing, and Analyzing Complex Information, Second Edition, London: Elsevier, 2018, p.5, p.4, p.3, p.3.
④⑨⑩{11}{13}{16}{18}{20}{21}{22}{23}{27}{30}{32}{34} Viktor Mayer-Sch?觟nberger & Kenneth Cukier, Big Data: A Revolution that Will Transform How We Live, Work and Think, New York: Houghton Mifflin Harcourt, 2013, pp.29-30, p.26, p.26, p.27, p.26, pp.28-29, p.94, p.28, p.27, pp.27-28, p.36, p.141, p.141, p.141, p.7.
⑥⑧ Vishnu Pendyala, Veracity of Big Data, Machine Learning and Other Approaches to Verifying Truthfulness, San Jose: Apress, 2018, p.6, p.10.
⑦ Dirk Helbing, Thinking Ahead-Essays on Big Data, Digital Revolution, and Participatory Market Society, Springer International Publishing Switzerland, 2015, p.77.
{12} 維克托·邁爾—舍恩伯格、肯尼思·庫克耶:《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》,盛楊燕、周濤譯,浙江人民出版社2012年版,第37頁。
{15} Mark Duggan & Steven D.Levitt, Winning Isn’t Everything: Corruption in Sumo Wrestling, The American Economic Review, 2002, 92(5), pp.1594-1605.
{17}{33} David Lazer, Ryan Kennedy, Gary King, Alessandro Vespignani, Big Data: The Parable of Google Flu: Traps in Big Data Analysis, Science, New York, N.Y., 2014, 343(6176), pp.1203-1205.
{19}{28} Jules J. Berman, Principles of Big Data: Preparing, Sharing, and Analyzing Complex Information, Elsevier Inc., 2013, p.xx, p.157.
{24} Nate Silver, The Signal and the Noise: Why Most Predictions Fail but Some Don’t, New York: The Penguin Press, 2012, p.15.
{25} 張小天:《因果關(guān)系與相關(guān)關(guān)系:它們的關(guān)系及它們的差異》,《社會(huì)學(xué)研究》1992年第3期。
{26} D. Lazer, A. Pentland, L. Adamic, S. Aral, A.-L. Barabási, D. Brewer, N. Christakis, N. Contractor, J. Fowler, M. Gutmann, T. Jebara, G. King, M. Macy, D. Roy and M. Van Alstyne, Computational Social Science, Science, 2009, 323(5915), pp.721-723.
{29} Sander Klous & Nart Wielaard, We Are Big Data: The Future of the Information Society, Amstelveen: Atlantis Press, 2016, p.6.
{31}{35} Eli Berman, Joseph H. Felter, Jacob N. Shapiro, Small Wars, Big Data: The Information Revolution in Modern Conflict, Princeton: Princeton University Press, 2018, p.13, p.15.
{36} 馬修·方丹·莫里(Matthew Fontaine Maury)是美國海軍軍官,由于車禍?zhǔn)軅诤\妶D表和儀器廠工作,當(dāng)時(shí)海洋航行使用船用舊圖表,這些圖表主要憑經(jīng)驗(yàn)規(guī)制,不僅繞彎多,而且錯(cuò)誤不少。他決心改變這種狀況,利用已有地圖、儀器和被視為垃圾的航海日志,利用其中特定日期和地點(diǎn)的風(fēng)、水和天氣紀(jì)錄數(shù)據(jù),再以標(biāo)準(zhǔn)表格讓所有海軍艦只補(bǔ)充數(shù)據(jù),整合成了一張全新的航海圖,為船只航行大幅減少了航程。
作者簡介:王天恩,上海大學(xué)哲學(xué)系教授、博士生導(dǎo)師,上海,200444。
(責(zé)任編輯 ?胡 ?靜)