国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

規(guī)律與因果:大數(shù)據(jù)對(duì)社會(huì)科學(xué)研究沖擊之反思

2016-05-14 13:57劉林平蔣和超李瀟曉
社會(huì)科學(xué) 2016年9期
關(guān)鍵詞:因果關(guān)系沖擊反思

劉林平 蔣和超 李瀟曉

摘要:在社會(huì)科學(xué)中,大數(shù)據(jù)研究還剛剛起步,但也取得了一定成果。大數(shù)據(jù)為社會(huì)學(xué)和社會(huì)科學(xué)重新發(fā)現(xiàn)社會(huì)歷史發(fā)展規(guī)律提供了可能性:它提供了認(rèn)知宏觀社會(huì)、檢驗(yàn)社會(huì)現(xiàn)象的“異質(zhì)性假設(shè)”和“結(jié)果穩(wěn)定假設(shè)”的數(shù)據(jù)基礎(chǔ);它以實(shí)時(shí)記錄的特點(diǎn)較大程度上排除了獲取數(shù)據(jù)時(shí)的人為干擾;它將抽樣數(shù)據(jù)中被排斥的極端值重新納入統(tǒng)計(jì)分析。在因果關(guān)系上,大數(shù)據(jù)有助于從根本上克服由于抽樣偏頗所引起的樣本選擇性偏誤;匹配數(shù)據(jù)可以克服或緩解變量遺漏問(wèn)題;作為面板數(shù)據(jù)和分層數(shù)據(jù),大數(shù)據(jù)對(duì)確定因果效應(yīng)、檢驗(yàn)因果關(guān)系比抽樣數(shù)據(jù)更為有利、穩(wěn)健和可靠。大數(shù)據(jù)也許可以重構(gòu)社會(huì)學(xué)和社會(huì)科學(xué)的研究目標(biāo)。

關(guān)鍵詞:大數(shù)據(jù);規(guī)律;因果關(guān)系;沖擊;反思

中圖分類(lèi)號(hào):C91-03

文獻(xiàn)標(biāo)識(shí)碼:A

文章編號(hào):0257-5833(2016)0943067-14

作者簡(jiǎn)介:劉林平,南京大學(xué)社會(huì)學(xué)院教授、博士生導(dǎo)師;蔣和超,南京大學(xué)社會(huì)學(xué)院博士研究生;李瀟曉,南京大學(xué)社會(huì)學(xué)院博士研究生

(江蘇

南京210023)

一、大數(shù)據(jù)特征與社會(huì)學(xué)相關(guān)研究

“數(shù)據(jù)”是系統(tǒng)收集到的關(guān)于世界的信息要素。“大數(shù)據(jù)(Big data或Megadata),或稱(chēng)巨量數(shù)據(jù)、海量數(shù)據(jù)、大資料,指的是所涉及的數(shù)據(jù)量規(guī)模巨大到無(wú)法通過(guò)人工,在合理時(shí)間內(nèi)達(dá)到截取、管理、處理、并整理成為人類(lèi)所能解讀的形式的信息?!庇捎诨ヂ?lián)網(wǎng)的普及和相關(guān)設(shè)備的廣泛使用,人類(lèi)活動(dòng)的痕跡幾乎都可以轉(zhuǎn)化為可以?xún)?chǔ)存的數(shù)據(jù),如日常起居、運(yùn)動(dòng)、購(gòu)物、旅行、休閑、人際交往、寫(xiě)作(發(fā)表意見(jiàn)、評(píng)論和文章等)等等莫不如此。在社會(huì)和國(guó)家的層面,經(jīng)濟(jì)、政治、軍事、科學(xué)、教育、社會(huì)和文化活動(dòng),及人類(lèi)對(duì)自然界的影響,都會(huì)留下可儲(chǔ)存的海量數(shù)據(jù)。這些數(shù)據(jù)可以用來(lái)分析人類(lèi)活動(dòng)的特點(diǎn)和規(guī)律。因而,大數(shù)據(jù)必然會(huì)對(duì)傳統(tǒng)社會(huì)科學(xué)的研究方式產(chǎn)生巨大沖擊、挑戰(zhàn)并提供新的機(jī)遇。本文從社會(huì)學(xué)和社會(huì)科學(xué)研究的基本目標(biāo)人手來(lái)進(jìn)行反思。

大數(shù)據(jù)不同于傳統(tǒng)數(shù)據(jù)之處在于:它不是通過(guò)抽樣調(diào)查所獲取的樣本數(shù)據(jù),而是人類(lèi)活動(dòng)的實(shí)時(shí)記錄,并大都可以通過(guò)互聯(lián)網(wǎng)存儲(chǔ)、獲取、交換和分析。大數(shù)據(jù)是“由科學(xué)儀器、傳感設(shè)備、互聯(lián)網(wǎng)交易、電子郵件、音視頻軟件、網(wǎng)絡(luò)點(diǎn)擊流等多種數(shù)據(jù)源生成的大規(guī)模、多元化、復(fù)雜、長(zhǎng)期的分布式數(shù)據(jù)集”。大數(shù)據(jù)有多方面的來(lái)源,一般而言可以分作五類(lèi):企業(yè)公司數(shù)據(jù),指來(lái)自公司企業(yè)的銷(xiāo)售、交易等數(shù)據(jù),比如阿里巴巴的銷(xiāo)售數(shù)據(jù)、證券公司的交易數(shù)據(jù)等;網(wǎng)絡(luò)數(shù)據(jù),主要是指來(lái)自互聯(lián)網(wǎng)、社交媒介的數(shù)據(jù),比如Facebook、Twitter、新浪微博等;期刊圖書(shū)數(shù)據(jù)庫(kù),是指取自某一個(gè)具體的數(shù)據(jù)庫(kù)的數(shù)據(jù),比如CNKI期刊數(shù)據(jù)庫(kù)、Web of Science、Google圖書(shū)等;政府?dāng)?shù)據(jù),是指源自政府的總體數(shù)據(jù),比如人口普查數(shù)據(jù)、全國(guó)用水用電數(shù)據(jù)等;其他,是指除上述四類(lèi)數(shù)據(jù)之外的其他數(shù)據(jù),但不包含抽樣調(diào)查數(shù)據(jù)。有關(guān)大數(shù)據(jù)的基本特征,我們可以在與傳統(tǒng)數(shù)據(jù)的比較中進(jìn)行描述和分析。

1.樣本與總體

和以往抽樣調(diào)查獲得的數(shù)據(jù)不同,大數(shù)據(jù)不是抽樣數(shù)據(jù)而是一個(gè)總體數(shù)據(jù)。但是,這個(gè)總體是一定范圍里的總體,而不是絕對(duì)總體。比如,人們通過(guò)京東商城購(gòu)物,所有的購(gòu)物過(guò)程都可以轉(zhuǎn)化為數(shù)據(jù),所得到的總體就是在京東商城發(fā)生購(gòu)物行為的總體。這個(gè)總體不是所有網(wǎng)上購(gòu)物者的總體,更不是包括線下購(gòu)物者的全部購(gòu)物者的總體。不過(guò),有一些數(shù)據(jù)的總體,就是一個(gè)完整的總體。比如,美國(guó)國(guó)防氣象衛(wèi)星計(jì)劃(Defense Meteorological Satellite Program)的夜間燈光圖像數(shù)據(jù),就是每天對(duì)地球進(jìn)行掃描的數(shù)據(jù),其平均燈光強(qiáng)度可以作為代表區(qū)域社會(huì)經(jīng)濟(jì)發(fā)展的指標(biāo),現(xiàn)有研究表明這一指標(biāo)與GDP的相關(guān)度非常高。這個(gè)數(shù)據(jù)的總體,就是整個(gè)地球。因而,我們不能籠統(tǒng)地說(shuō)總體,而要具體看該數(shù)據(jù)所代表的總體是什么樣的總體。這樣所得結(jié)論的界限就比較明確。

作為總體的大數(shù)據(jù),在統(tǒng)計(jì)上至少有兩個(gè)意義:其一,它可以給抽樣數(shù)據(jù)提供參照,糾正其偏差。抽樣調(diào)查采用抽樣數(shù)據(jù)推斷總體,實(shí)際上,很大程度上對(duì)總體認(rèn)識(shí)不清,并不知道推論的實(shí)際效果,只是根據(jù)統(tǒng)計(jì)的顯著性來(lái)進(jìn)行檢驗(yàn)。大數(shù)據(jù)的出現(xiàn)為抽樣數(shù)據(jù)提供了總體的基本特征,抽樣數(shù)據(jù)可以與大數(shù)據(jù)進(jìn)行比較,看到底有沒(méi)有偏差,偏差有多大。所以,大數(shù)據(jù)給小數(shù)據(jù)(抽樣數(shù)據(jù))提供了一個(gè)標(biāo)桿和判斷的標(biāo)準(zhǔn)。其二,運(yùn)用大數(shù)據(jù)進(jìn)行統(tǒng)計(jì)時(shí),顯著性檢驗(yàn)可能就是不必要的了,實(shí)際數(shù)據(jù)差異是多少就是多少,因?yàn)樗褪强傮w。

2.結(jié)構(gòu)化與非結(jié)構(gòu)化

與人們的一般想象不同,大數(shù)據(jù)其實(shí)主要不是結(jié)構(gòu)化的數(shù)據(jù),而是非結(jié)構(gòu)化(含半結(jié)構(gòu)化)的數(shù)據(jù)?!皳?jù)統(tǒng)計(jì),只有5%的數(shù)據(jù)是結(jié)構(gòu)化的且能適用于傳統(tǒng)數(shù)據(jù)庫(kù)?!狈墙Y(jié)構(gòu)化的數(shù)據(jù)對(duì)社會(huì)科學(xué)研究提出了如下問(wèn)題:其一,它對(duì)數(shù)據(jù)的分類(lèi)、整理提出超越以往任何時(shí)候的技術(shù)要求和理念更新。其二,精確性與模糊性并存?!按髷?shù)據(jù)要求我們有所改變,我們必須能夠接受混亂和不確定性?!贝髷?shù)據(jù)是精確性與模糊性并存的數(shù)據(jù),可能精確的更精確,而模糊也是能夠接受的。

3.單一與匹配

一般說(shuō)來(lái),大數(shù)據(jù)的數(shù)據(jù)比較單一,它僅包含有限的變量。比如家庭和企業(yè)的用電、用水記錄,通訊公司的手機(jī)消費(fèi)記錄,等等。但是,這些數(shù)據(jù)是可以匹配起來(lái)的。比如,通過(guò)通訊公司的手機(jī)(或座機(jī))記錄、網(wǎng)上購(gòu)物記錄和快遞公司的送貨記錄,我們可以分析手機(jī)用戶(hù)的網(wǎng)絡(luò)消費(fèi)情況,進(jìn)一步也可以將其人際交往情況匹配起來(lái),等等。如果匹配是可能的,那么將有可能改變大數(shù)據(jù)目前變量較少的狀況。這種匹配,在技術(shù)上是可行的。問(wèn)題在于不同數(shù)據(jù)的產(chǎn)權(quán)可能歸屬于不同的公司或部門(mén),怎么解決數(shù)據(jù)交換的問(wèn)題,就是一個(gè)市場(chǎng)交易的問(wèn)題,是一個(gè)經(jīng)濟(jì)學(xué)和法學(xué)的問(wèn)題。

在個(gè)體的層次上,將數(shù)據(jù)匹配起來(lái),牽涉到個(gè)體的權(quán)利、隱私等問(wèn)題。在組織(如企業(yè)、公司、學(xué)校、科研機(jī)構(gòu)、政府組織和非政府組織等等)層次上、地區(qū)(如社區(qū)、城市、行政區(qū)劃等)層次上,也同樣存在上述問(wèn)題。不過(guò),非個(gè)體層次對(duì)隱私的要求沒(méi)有那么嚴(yán)格,在現(xiàn)有條件下,數(shù)據(jù)的獲得、使用主要受限于信息的不公開(kāi)。

4.容量、記錄與面板

數(shù)據(jù)容量巨大也是大數(shù)據(jù)的基本特征。當(dāng)前,大數(shù)據(jù)是指容量超過(guò)1TB或1PB的數(shù)據(jù)集,容量的界定是相對(duì)的,它會(huì)隨著時(shí)間和數(shù)據(jù)類(lèi)型有所不同,隨著存儲(chǔ)能力的提高,大數(shù)據(jù)容量的閾值也會(huì)提高,對(duì)大數(shù)據(jù)容量給出一個(gè)確切的閾值是不切實(shí)際的。

大數(shù)據(jù)是人類(lèi)活動(dòng)的實(shí)時(shí)記錄,與抽樣數(shù)據(jù)如問(wèn)卷調(diào)查數(shù)據(jù)相比較,它往往不是回顧性的,基本不受到人的記憶的干擾,所以,在這個(gè)意義上,它比問(wèn)卷調(diào)查數(shù)據(jù)更準(zhǔn)確。由于大數(shù)據(jù)是實(shí)時(shí)記錄,所以它又具有時(shí)效性。由于大數(shù)據(jù)源源不斷地產(chǎn)生,它又是面板數(shù)據(jù),而且是間隔時(shí)間非常短暫的面板數(shù)據(jù),這是抽樣調(diào)查數(shù)據(jù),哪怕是其中的面板數(shù)據(jù)所難以比擬的。

總而言之,作為人類(lèi)活動(dòng)實(shí)時(shí)記錄的大數(shù)據(jù)是一個(gè)總體數(shù)據(jù),它包含結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),一般容量較大,現(xiàn)實(shí)中單一的數(shù)據(jù)變量較少但可以進(jìn)行匹配,許多大數(shù)據(jù)是源源不斷涌現(xiàn)的面板數(shù)據(jù)。這些特征使得它區(qū)別于傳統(tǒng)數(shù)據(jù),并對(duì)人類(lèi)活動(dòng)和科學(xué)研究產(chǎn)生了難以估量的影響。2008年,在《自然》雜志出版的專(zhuān)刊“大數(shù)據(jù)(Big Data)”中,費(fèi)利斯·弗蘭克爾(Felice Frankel)和羅莎琳德·里德(Rosalind Reid)指出,巨大的數(shù)據(jù)流埋藏著對(duì)新科學(xué)的啟示,但是,我們需要發(fā)現(xiàn)的工具,比如透鏡。當(dāng)然,大數(shù)據(jù)對(duì)科學(xué)的啟示或沖擊是從自然科學(xué)領(lǐng)域里開(kāi)始的,但這種影響必然延伸到社會(huì)科學(xué)。

我們?cè)谑珍浟薙SCI期刊的WOS(Web of Science)數(shù)據(jù)庫(kù)中,對(duì)社科類(lèi)文獻(xiàn)中涉及大數(shù)據(jù)的社會(huì)科學(xué)(包含社會(huì)學(xué))文章進(jìn)行檢索,結(jié)果發(fā)現(xiàn):在社會(huì)科學(xué)研究中,涉及大數(shù)據(jù)的研究還很少,2010年至2015年12月以標(biāo)題檢索的總計(jì)僅為249篇,采用大數(shù)據(jù)進(jìn)行實(shí)證研究的則更少,僅為43篇。這說(shuō)明大數(shù)據(jù)研究剛剛起步,涉及大數(shù)據(jù)的文章80%以上還在討論概念、特征和研究框架等初步問(wèn)題。

在社會(huì)學(xué)學(xué)科中,共有30篇有關(guān)大數(shù)據(jù)的論文發(fā)表,其中2011年到2014年有9篇,2015年則有2l篇。其中實(shí)證研究?jī)H有2篇,所用數(shù)據(jù)來(lái)自網(wǎng)絡(luò)中的Twitter,研究方法采用時(shí)間序列分析,所用軟件為R。這說(shuō)明,在英文文獻(xiàn)中,社會(huì)學(xué)的大數(shù)據(jù)研究也是剛剛起步。盡管大數(shù)據(jù)的研究并不多,但還是取得了一定的成果。根據(jù)斯科特·戈?duì)柕拢⊿coR A.Golder)和邁克爾·梅西(Michael w.Macy)的歸納,西方學(xué)界對(duì)大數(shù)據(jù)中的網(wǎng)絡(luò)數(shù)據(jù)的研究(主要涉及傳播學(xué)、心理學(xué)、社會(huì)學(xué)和政治學(xué)等學(xué)科)在三個(gè)方面有所進(jìn)展。

一是社會(huì)網(wǎng)絡(luò)與傳播研究。借助Facebook、Twitter、郵件、電話通訊等數(shù)據(jù)提供的豐富的人口學(xué)特征和社會(huì)網(wǎng),學(xué)者們驗(yàn)證了格蘭諾維特(Mark Granovetter)“弱關(guān)系假設(shè)”和博特(Ronald Butt)“結(jié)構(gòu)洞”理論。伊格爾(Eagle N.)等對(duì)6500萬(wàn)電話用戶(hù)的通訊記錄的研究表明,社區(qū)成員社交網(wǎng)絡(luò)的多樣性與其經(jīng)濟(jì)發(fā)展呈正相關(guān),證實(shí)了社會(huì)網(wǎng)絡(luò)理論。烏干達(dá)(Ugander J.)等使用Facebook的社交網(wǎng)絡(luò)數(shù)據(jù)發(fā)現(xiàn),隨著用戶(hù)社交網(wǎng)絡(luò)規(guī)模的不斷擴(kuò)大,用戶(hù)之間的分割由2008年的5.3步下降到了2011年的4.7步,驗(yàn)證了“六度分隔理論”。巴克什(Bakshy E.)等對(duì)2.5億Facebook回帖數(shù)據(jù)的研究表明,新信息的傳播主要通過(guò)弱關(guān)系。相反,奧涅拉(Onnela J-P)等對(duì)460萬(wàn)手機(jī)用戶(hù)的通訊記錄的研究發(fā)現(xiàn),盡管弱關(guān)系使社交網(wǎng)絡(luò)聯(lián)系了起來(lái),但是大多數(shù)信息的傳播都是通過(guò)中等強(qiáng)度的聯(lián)結(jié)實(shí)現(xiàn)。

二是社會(huì)交換、合作與信任的研究。巴克斯卓(Backstrom L.)和克萊因伯格(KleinbergJ.)隨機(jī)抽取了130萬(wàn)成年Facebook用戶(hù)來(lái)測(cè)試戀愛(ài)關(guān)系建立和維持過(guò)程中社交網(wǎng)絡(luò)的“嵌入效應(yīng)”。令人驚奇的是,他們發(fā)現(xiàn)“離散”(較少的重疊)而不是“嵌入”更容易產(chǎn)生戀愛(ài)關(guān)系,這與“嵌入關(guān)系理論”相悖,但卻與博特的“結(jié)構(gòu)洞”理論相一致,即那些能夠填補(bǔ)結(jié)構(gòu)洞的人更能吸引同伴。

三是集體行動(dòng)與社會(huì)運(yùn)動(dòng)研究。用戶(hù)的網(wǎng)絡(luò)互動(dòng)數(shù)據(jù)為研究者檢驗(yàn)集體行動(dòng)理論、公共物品和博弈論的相關(guān)假設(shè)提供了良好的機(jī)會(huì),并受到政府機(jī)構(gòu)的極大重視。比如,岡薩雷斯(Gonzalez-Bailon S.)等使用Twitter和Facebook提供的數(shù)碼痕跡來(lái)追蹤“阿拉伯之春”中的抗議信息和公眾輿論,因?yàn)橥ㄟ^(guò)追蹤用戶(hù)發(fā)布內(nèi)容的轉(zhuǎn)變可以用來(lái)衡量抗議動(dòng)員的速度和程度。迪格瑞齊亞(Digrazia J.)等關(guān)于地方選舉的研究表明,當(dāng)?shù)毓埠忘h的選票與Twitter用戶(hù)消息中出現(xiàn)“共和黨”名稱(chēng)的次數(shù)呈正相關(guān)關(guān)系,社交網(wǎng)絡(luò)數(shù)據(jù)為傳統(tǒng)輿論調(diào)查提供了一個(gè)重要的補(bǔ)充。

在國(guó)內(nèi)的研究中,大數(shù)據(jù)研究相關(guān)文獻(xiàn)并不太多。我們采用同樣標(biāo)準(zhǔn)對(duì)CNKI數(shù)據(jù)庫(kù)中收錄在CSSCI中的文獻(xiàn)進(jìn)行搜索,結(jié)果發(fā)現(xiàn):中文文獻(xiàn)中大數(shù)據(jù)(共1359篇)相關(guān)的文章遠(yuǎn)遠(yuǎn)超出英文文獻(xiàn),但實(shí)證研究?jī)H為30篇,少于英文文獻(xiàn)。這說(shuō)明,中文文獻(xiàn)更是處于介紹、討論基本概念、特征等初步階段上。在中文文獻(xiàn)中,社會(huì)學(xué)有54篇,但實(shí)證研究?jī)H有4篇。王程轔使用CNKI數(shù)據(jù)庫(kù)搜索“大數(shù)據(jù)”關(guān)鍵詞,進(jìn)行反事實(shí)分析,認(rèn)為暫不能判斷“大數(shù)據(jù)”是否能引領(lǐng)新科學(xué)范式的“大趨勢(shì)”。陳云松等人使用谷歌圖書(shū)和社交媒體Twitter的數(shù)據(jù),研究了中國(guó)城市的知名度和社會(huì)學(xué)百年來(lái)的發(fā)展情況。這些研究具有一定的價(jià)值,但研究方法還比較簡(jiǎn)單。

總體來(lái)說(shuō),在中英文文獻(xiàn)中,大數(shù)據(jù)的研究剛剛起步,多數(shù)文章還在描述大數(shù)據(jù)的特征,確定研究大數(shù)據(jù)的基本框架。實(shí)證研究非常少,也比較簡(jiǎn)單,不過(guò)也取得一定的成果。

當(dāng)然,大數(shù)據(jù)對(duì)社會(huì)科學(xué)及其社會(huì)學(xué)的影響并不是表現(xiàn)為剛剛開(kāi)始發(fā)表的少量論文,更為根本之處在于:它沖擊或挑戰(zhàn)了社會(huì)學(xué)和社會(huì)科學(xué)的基本理念、研究邏輯、研究方法與技術(shù),或者說(shuō),大數(shù)據(jù)對(duì)以往社會(huì)學(xué)及社會(huì)科學(xué)的研究范式形成很大挑戰(zhàn)。

二、找回規(guī)律:古典社會(huì)學(xué)是否可以重生?

自17世紀(jì)牛頓力學(xué)和19世紀(jì)達(dá)爾文進(jìn)化論以來(lái),近代和現(xiàn)代自然科學(xué)逐漸成型并給社會(huì)科學(xué)帶來(lái)深刻影響。如同自然科學(xué)家發(fā)現(xiàn)自然界的規(guī)律一樣,社會(huì)科學(xué)家也力圖發(fā)現(xiàn)人類(lèi)社會(huì)歷史發(fā)展規(guī)律。恩格斯在《在馬克思墓前的講話》一文中宣稱(chēng):“正象達(dá)爾文發(fā)現(xiàn)了有機(jī)界的發(fā)展規(guī)律一樣,馬克思發(fā)現(xiàn)了人類(lèi)歷史的發(fā)展規(guī)律?!R克思還發(fā)現(xiàn)了現(xiàn)代資本主義生產(chǎn)方式和它所產(chǎn)生的資產(chǎn)階級(jí)社會(huì)的特殊的運(yùn)動(dòng)規(guī)律?!?/p>

經(jīng)濟(jì)學(xué)家亞當(dāng)·斯密、大衛(wèi)·李嘉圖和哲學(xué)家康德、黑格爾等人都在某種程度上認(rèn)為經(jīng)濟(jì)學(xué)和哲學(xué)的基本目標(biāo)或使命就是發(fā)現(xiàn)人類(lèi)社會(huì)歷史發(fā)展規(guī)律。亞當(dāng)·斯密將功利主義視為“永劫不移的……原理”。李嘉圖“相信經(jīng)濟(jì)學(xué)的某些結(jié)論與‘萬(wàn)有引力原理同樣確定”??档孪嘈?,“大自然即使在混沌中也只能有規(guī)則有秩序地進(jìn)行活動(dòng)”。而心中的道德律使他認(rèn)識(shí)到“處于普遍必然的聯(lián)結(jié)中”。黑格爾認(rèn)為,“‘理性是世界的主宰,世界歷史因此是一種合理的過(guò)程”?!啊跋笕f(wàn)千,事態(tài)紛紜的世界歷史,是‘精神的發(fā)展和實(shí)現(xiàn)的過(guò)程。”

社會(huì)學(xué)家也是規(guī)律的探尋者??椎抡J(rèn)為:“作為我們智慧成熟標(biāo)志的根本革命,主要在于處處以單純的規(guī)律探求(即研究被觀察現(xiàn)象之間存在的恒定關(guān)系)來(lái)代替無(wú)法認(rèn)識(shí)的本義的起因?!钡蠣杽P姆認(rèn)為:“社會(huì)學(xué)研究方法的最基本規(guī)則是,要將社會(huì)現(xiàn)象當(dāng)做客觀事物來(lái)看待。”社會(huì)現(xiàn)象又可以分為“規(guī)則現(xiàn)象”和“不規(guī)則或病態(tài)現(xiàn)象”,其中內(nèi)涵著規(guī)律。馬克斯·韋伯的看法有所不同,他認(rèn)為,“社會(huì)學(xué)……應(yīng)該被稱(chēng)之為一門(mén)想解釋性地理解社會(huì)行為、并且通過(guò)這種辦法在社會(huì)行為的過(guò)程和影響上說(shuō)明其原因的科學(xué)”。但韋伯并不否認(rèn)規(guī)律,他認(rèn)為,如果統(tǒng)計(jì)結(jié)論能證明,那么“將來(lái)的科學(xué)研究也能……發(fā)現(xiàn)……規(guī)律性”。

這種尋求社會(huì)歷史發(fā)展規(guī)律的努力后來(lái)遭到許多學(xué)者的質(zhì)疑,其主要理由在于質(zhì)疑者提出,社會(huì)現(xiàn)象具有與自然現(xiàn)象不同的特征。

其一,整體性。波普爾認(rèn)為,社會(huì)科學(xué)尋求宏觀社會(huì)歷史發(fā)展規(guī)律的企圖,受到社會(huì)整體的困擾,“‘整體絕不能成為科學(xué)研究的對(duì)象”?!叭绻覀円芯恳粋€(gè)事物。我們就不得不選擇它的某些方面。我們不可能觀察或描述整個(gè)世界?!闭w的理論或假設(shè)沒(méi)有辦法進(jìn)行檢驗(yàn),“如果沒(méi)有檢驗(yàn)的可能性,那么,聲稱(chēng)采取了任何一種科學(xué)方法,都是白說(shuō)的。整體主義方法與真正的科學(xué)態(tài)度是不相容的”。社會(huì)科學(xué)只能通過(guò)局部去研究整體,通過(guò)對(duì)個(gè)人的了解去研究社會(huì)。與整體主義方法論相反,波普爾認(rèn)為,“社會(huì)理論的任務(wù)是要……依據(jù)每個(gè)人以及他們的態(tài)度、期望、關(guān)系等情況來(lái)建立和分析我們的社會(huì)學(xué)模式——這個(gè)設(shè)定可以稱(chēng)為‘方法論個(gè)人主義”。

其二,異質(zhì)性。歐內(nèi)斯特·內(nèi)格爾(Emest Nagel)指出,社會(huì)文化是相對(duì)的。社會(huì)現(xiàn)象具有“‘受歷史約束的或‘文化上決定的特征”。受此影響,社會(huì)科學(xué)理論具有嚴(yán)格有限的應(yīng)用范圍,對(duì)一個(gè)社會(huì)的樣本資料研究所得出的結(jié)論可能不適合另一個(gè)社會(huì)?!叭祟?lèi)社會(huì)的差異性與特質(zhì)性造成了社會(huì)科學(xué)具有情境性(contextual)和相對(duì)性的特征?!薄扒榫巢町惡蜕鐣?huì)變遷在所有社會(huì)科學(xué)學(xué)科中都是兩個(gè)重要的參量。這兩個(gè)參量都反對(duì)雄心勃勃的范式性的概化?!?/p>

其三,能動(dòng)性或意向性。社會(huì)生活中的人不是物體,他具有主體性或能動(dòng)性,并具有特定的階級(jí)立場(chǎng)和利益。波普爾認(rèn)為,社會(huì)科學(xué)的客觀性受到人的因素的干擾?!吧鐣?huì)科學(xué)涉及社會(huì)偏見(jiàn)、階級(jí)偏見(jiàn)和個(gè)人利益,所以在社會(huì)科學(xué)里,缺乏科學(xué)的客觀性就至關(guān)重大了?!薄霸诮^大多數(shù)的,或者在全部的建構(gòu)社會(huì)理論中,人的因素將仍然是一個(gè)非理性的成分?!眱?nèi)格爾認(rèn)為,“人類(lèi)由于獲得了對(duì)他們所參與的事件,或?qū)λ麄冏鳛槠涑蓡T的社會(huì)的新知識(shí),因而經(jīng)常更改他們習(xí)慣的社會(huì)行為方式”。由于人的能動(dòng)性,社會(huì)科學(xué)的預(yù)言可能改變?nèi)说男袨椋夯蛘吲c之作對(duì),或者有所加強(qiáng);由于人的能動(dòng)性,在進(jìn)行實(shí)驗(yàn)、回答問(wèn)題時(shí),可能依情境而發(fā)生變化,這會(huì)影響到社會(huì)科學(xué)“應(yīng)用數(shù)量方法的特殊困難,尤其是測(cè)量方法”??藙谒埂み~因策爾(KlausMainzer)指出:“在社會(huì)科學(xué)中,人們通常在生物學(xué)進(jìn)化和人類(lèi)社會(huì)歷史之間作出嚴(yán)格的區(qū)分。原因在于,國(guó)家的、市場(chǎng)的和文化的發(fā)展被假定是由人的意向性行為所指引的,即人的決策是以意向性和價(jià)值為基礎(chǔ)的?!?/p>

因而,以波普爾為代表的一些學(xué)者,將馬克思等人尋找社會(huì)歷史規(guī)律的追求稱(chēng)之為“歷史決定論”:這“是探討社會(huì)科學(xué)的一種方法,它假定歷史預(yù)測(cè)是社會(huì)科學(xué)的主要目的,并且假定可以通過(guò)發(fā)現(xiàn)隱藏在歷史演變下面的‘節(jié)律或‘模式、‘規(guī)律或‘傾向來(lái)達(dá)到這個(gè)目的”。波普爾認(rèn)為,歷史決定論根本行不通。他的觀點(diǎn)產(chǎn)生了廣泛而深遠(yuǎn)的影響。

在社會(huì)科學(xué)中重要的一門(mén)分支學(xué)科——社會(huì)學(xué)中,一些學(xué)者認(rèn)為應(yīng)該拋棄發(fā)現(xiàn)普遍規(guī)律的企圖,尤其是與包羅萬(wàn)象的“帕森斯主義”決裂,回到墨頓的“中層理論”,關(guān)注具體的“因果機(jī)制”。就如埃爾斯特(Jon Elster)所說(shuō),“社會(huì)科學(xué)的重點(diǎn)將會(huì)有一個(gè)從理論推定到機(jī)制的重要轉(zhuǎn)變……對(duì)所發(fā)生事情的描述會(huì)進(jìn)人中觀或微觀層次。”機(jī)制性解釋的核心理念是,“不通過(guò)提出放之四海而皆準(zhǔn)的社會(huì)規(guī)律或者尋求統(tǒng)計(jì)相關(guān)的因素來(lái)解釋社會(huì)現(xiàn)象,而是通過(guò)探求那些可以展示出社會(huì)現(xiàn)象如何產(chǎn)生的機(jī)制來(lái)進(jìn)行解釋”。

那么,大數(shù)據(jù)對(duì)社會(huì)學(xué)及社會(huì)科學(xué)尋求規(guī)律的研究宗旨或目標(biāo)會(huì)帶來(lái)什么樣的影響呢?我們認(rèn)為,波普爾對(duì)社會(huì)科學(xué)中的整體主義方法論的批評(píng)是有問(wèn)題的:姑且不論是否存在整體主義方法論(他在這里可能對(duì)馬克思主義存在誤解),以人們只能認(rèn)知局部而不能認(rèn)知整體來(lái)推論不能得到關(guān)于社會(huì)歷史規(guī)律的邏輯是錯(cuò)誤的,因?yàn)樽匀豢茖W(xué)也存在同樣的問(wèn)題,人類(lèi)社會(huì)是一個(gè)整體,但作為自然界的地球、太陽(yáng)系乃至宇宙也是一個(gè)整體,自然科學(xué)能,為什么社會(huì)科學(xué)就不能?

千百年來(lái),尤其是近現(xiàn)代社會(huì)科學(xué)發(fā)展成型以來(lái),人類(lèi)對(duì)于社會(huì)的認(rèn)知,從經(jīng)驗(yàn)事實(shí)的角度來(lái)說(shuō),首先來(lái)自于個(gè)體生活經(jīng)驗(yàn),其次來(lái)源于有限個(gè)案(質(zhì)性研究),第三來(lái)源于抽樣調(diào)查,第四來(lái)源于普查(例如人口普查)。但在互聯(lián)網(wǎng)及相關(guān)設(shè)備發(fā)展普及之前,關(guān)于社會(huì)總體的數(shù)據(jù)少之又少。巧婦難為無(wú)米之炊,要從有限的經(jīng)驗(yàn)事實(shí)或數(shù)據(jù)中得到關(guān)于宏觀社會(huì)的總體認(rèn)識(shí),的確是盲人摸象,難之又難。以抽樣數(shù)據(jù)推斷總體的做法,總是難以避免偏差。因此而放棄對(duì)社會(huì)歷史發(fā)展規(guī)律的探求而關(guān)注較為微觀和具體的因果機(jī)制,也是可以理解的?;ヂ?lián)網(wǎng)及相關(guān)設(shè)備(如傳感器和微處理器等)的發(fā)展,對(duì)人類(lèi)活動(dòng)進(jìn)行實(shí)時(shí)記錄并儲(chǔ)存起來(lái),形成大數(shù)據(jù),提供了認(rèn)知總體社會(huì)的數(shù)據(jù)基礎(chǔ)。在波普爾時(shí)代,從總體上來(lái)認(rèn)知社會(huì)的確不可能,但現(xiàn)在具有了可能性,這是因?yàn)槲覀冇辛丝傮w的大數(shù)據(jù)——“樣本”=“總體”。

以社會(huì)現(xiàn)象異質(zhì)性較強(qiáng)而自然現(xiàn)象同質(zhì)性較強(qiáng)來(lái)否定對(duì)社會(huì)歷史發(fā)展規(guī)律的追求,也是建立在有限經(jīng)驗(yàn)事實(shí)基礎(chǔ)上的。自然界豐富多彩,人類(lèi)社會(huì)也具有同質(zhì)性?!皬?fù)雜性和非線性是物質(zhì)、生命和人類(lèi)社會(huì)進(jìn)化中的顯著特征。”異質(zhì)性和同質(zhì)性都是較為抽象的概念,籠統(tǒng)地說(shuō)異質(zhì)性(如文化異質(zhì)性)并沒(méi)有扎實(shí)的基礎(chǔ)。應(yīng)該將社會(huì)現(xiàn)象的異質(zhì)性作為一個(gè)假設(shè)而不是一個(gè)前提,并通過(guò)對(duì)人類(lèi)社會(huì)生活、歷史發(fā)展和文化異同的大量經(jīng)驗(yàn)事實(shí)的分析來(lái)檢驗(yàn)這一假設(shè)。社會(huì)現(xiàn)象的異質(zhì)性或同質(zhì)性,絕對(duì)不是有限個(gè)案可以確證的。而大數(shù)據(jù)提供了檢驗(yàn)這一假設(shè)的可能性。

人的確具有能動(dòng)性、意向性、情境性和逆反心理,這是產(chǎn)生質(zhì)性研究、抽樣調(diào)查以及人口普查所得數(shù)據(jù)之誤差的重要來(lái)源之一。但大數(shù)據(jù)恰好在這方面具有一定的優(yōu)勢(shì)或長(zhǎng)處?!半S著大數(shù)據(jù)分析取代了樣本分析……當(dāng)記錄下來(lái)的是人們的平常狀態(tài),也就不用擔(dān)心在做研究和調(diào)查問(wèn)卷時(shí)存在的偏見(jiàn)了?!贝髷?shù)據(jù)是人類(lèi)活動(dòng)的實(shí)時(shí)記錄,和通過(guò)訪談等方式得到的數(shù)據(jù)不同,它更能排除獲取數(shù)據(jù)時(shí)人的不誠(chéng)實(shí)、記憶誤差及環(huán)境干擾等因素導(dǎo)致的誤差。

關(guān)于人的能動(dòng)性和意向性對(duì)社會(huì)歷史規(guī)律的影響,恩格斯早有論述。他認(rèn)為,在社會(huì)歷史領(lǐng)域內(nèi)進(jìn)行活動(dòng)的人具有意識(shí)、激情,經(jīng)過(guò)思慮、追求目的。但是,歷史進(jìn)程受內(nèi)在規(guī)律支配?!盁o(wú)數(shù)的個(gè)別愿望和個(gè)別行動(dòng)的沖突,在歷史領(lǐng)域內(nèi)造成了一種同沒(méi)有意識(shí)的自然界中占統(tǒng)治地位的狀況完全相似的狀況。行動(dòng)的目的是預(yù)期的,但是行動(dòng)實(shí)際產(chǎn)生的結(jié)果并不是預(yù)期的,或者這種結(jié)果起初似乎還和預(yù)期的目的相符合,而到了最后卻完全不是預(yù)期的結(jié)果。這樣,歷史事件似乎總的說(shuō)來(lái)同樣是由偶然性支配著的。但是……這種偶然性始終是受內(nèi)部隱藏著的規(guī)律支配的,而問(wèn)題只是在于發(fā)現(xiàn)這些規(guī)律?!?/p>

恩格斯的論述可以概括為“結(jié)果穩(wěn)定假設(shè)”。如前所述,迪爾凱姆也十分強(qiáng)調(diào)社會(huì)現(xiàn)象外在于個(gè)人的客觀性?,F(xiàn)代社會(huì)學(xué)和社會(huì)科學(xué)的眾多研究證明,個(gè)人的意向性只是增強(qiáng)了社會(huì)現(xiàn)象的隨機(jī)性、偶然性,而并不是沒(méi)有規(guī)律可循。比如,人的遷移行為(國(guó)際移民,如中國(guó)人移民美國(guó)建立唐人街;國(guó)內(nèi)移民,如農(nóng)民外出打工)是有意向性的,單個(gè)人的遷移也可能是偶然的,但大規(guī)模的遷移行為則是有規(guī)律的?!皣?guó)家的和國(guó)際的遷移效應(yīng)不可能用單個(gè)人的自由意志來(lái)解釋?!碑?dāng)然,恩格斯的“結(jié)果穩(wěn)定假設(shè)”還需要證明或證偽。如果有足夠的經(jīng)驗(yàn)材料,比如大數(shù)據(jù),這個(gè)假設(shè)就會(huì)得到進(jìn)一步的檢驗(yàn)。

大數(shù)據(jù)對(duì)于探討人類(lèi)行為和社會(huì)歷史規(guī)律并且更為準(zhǔn)確地進(jìn)行預(yù)測(cè)還有一個(gè)非常有利的方面,那就是:在抽樣數(shù)據(jù)中往往被刪節(jié)的少量極端值在大數(shù)據(jù)中成為可以分析的個(gè)案或變量。帕特里克·塔克爾(Patrick Tucker)指出,“大數(shù)據(jù)可以幫你實(shí)現(xiàn)的,是找到擁有特定的行為模式和性格的人,而在小樣本中你很難遇到——或許永遠(yuǎn)不會(huì)遇到,因?yàn)橹車(chē)胍籼嗔恕?。“?dāng)你的數(shù)據(jù)中有了足夠的點(diǎn),即便異常事件也可能顯示出某種特征?!痹谛》秶锏男「怕适录?,在一個(gè)大范圍里可能就不是小概率事件,或者至少有較多的個(gè)案可以進(jìn)行統(tǒng)計(jì)分析。這樣,大數(shù)據(jù)就超越了小數(shù)據(jù),將在小數(shù)據(jù)里被排斥的個(gè)案重新納人分析框架之中。

總而言之,作為總體、實(shí)時(shí)記錄和面板的大數(shù)據(jù)為重新發(fā)現(xiàn)宏觀社會(huì)歷史發(fā)展規(guī)律提供了以往所不具備的數(shù)據(jù)基礎(chǔ)和可能性,在這個(gè)意義上,大數(shù)據(jù)可以重構(gòu)社會(huì)學(xué)和社會(huì)科學(xué)的研究目標(biāo):它使得社會(huì)學(xué)、經(jīng)濟(jì)學(xué)和其他社會(huì)科學(xué)研究者至少可以發(fā)現(xiàn)或?qū)ふ胰祟?lèi)活動(dòng)的行為規(guī)律,并在此基礎(chǔ)上發(fā)現(xiàn)社會(huì)歷史的發(fā)展規(guī)律。

需要進(jìn)一步澄清的是,承認(rèn)社會(huì)歷史發(fā)展具有規(guī)律并以此作為社會(huì)學(xué)或社會(huì)科學(xué)的研究目標(biāo),并不必然導(dǎo)致決定論。波普爾等人對(duì)古典社會(huì)科學(xué)的決定論性質(zhì)的批評(píng)并非毫無(wú)道理。受限于當(dāng)時(shí)的科學(xué)理念與發(fā)展水平,大多數(shù)古典哲學(xué)家、經(jīng)濟(jì)學(xué)家、社會(huì)學(xué)家及其他社會(huì)科學(xué)家將人類(lèi)活動(dòng)與社會(huì)歷史規(guī)律看作是必然的,這當(dāng)然具有決定論的特征。區(qū)別決定論或非決定論,關(guān)鍵在于將規(guī)律理解為是必然的還是概率性的,而不是是否具有規(guī)律。人類(lèi)行為、社會(huì)現(xiàn)象、歷史進(jìn)程的變化是有規(guī)律的,但不是決定論意義上的必然性,而是概率論意義上的可能性。

在大數(shù)據(jù)的研究中,一些學(xué)者指出了人類(lèi)行為的可預(yù)測(cè)性、規(guī)律性。帕特里克·塔克爾指出:“人類(lèi)行為的可預(yù)測(cè)性比任何人想象中的都要強(qiáng)?!卑匾焕孤濉ぐ屠臀鳎ˋlbert-Laszle Barab6si)同樣認(rèn)為:“人類(lèi)行為遵循著一套簡(jiǎn)單并可重復(fù)的模型,而這些模型則受制于更加廣泛的規(guī)律?!?/p>

三、大數(shù)據(jù)要放棄對(duì)因果關(guān)系的追求嗎?

任何科學(xué)都要追求因果關(guān)系解釋?zhuān)狈σ蚬P(guān)系解釋就沒(méi)有規(guī)律。反過(guò)來(lái),追求發(fā)現(xiàn)規(guī)律就必然要追求因果關(guān)系。休謨認(rèn)為,因果關(guān)系“是我們從經(jīng)驗(yàn)中得來(lái)的關(guān)系”。發(fā)現(xiàn)因果關(guān)系的必要條件是:第一,“凡被認(rèn)為原因或結(jié)果的那些對(duì)象總是接近的”;第二,“在時(shí)間上因先于果”;第三,原因和結(jié)果之間的“恒常結(jié)合”之“必然聯(lián)系”。休謨奠定了科學(xué)對(duì)于因果關(guān)系的基本理解。休謨所謂的“恒常結(jié)合”就是事物之間統(tǒng)計(jì)上的強(qiáng)相關(guān)關(guān)系。此后,經(jīng)過(guò)密爾等人的發(fā)展,關(guān)于確立事物之間因果關(guān)系的標(biāo)準(zhǔn)就基本穩(wěn)定了:“兩個(gè)變量間存在因果關(guān)系,即一個(gè)變量導(dǎo)致另一個(gè)變量,如果(1)在時(shí)序上,因先于果。(2)兩者間有實(shí)證的相關(guān)性,而且(3)因果關(guān)系不是第三個(gè)變量的結(jié)果。完全符合上述三個(gè)條件的關(guān)系,就是因果關(guān)系?!?/p>

上述標(biāo)準(zhǔn)中的第3條,實(shí)際上就是要排除其他因素的干擾,確認(rèn)就是原因?qū)Y(jié)果的影響而不是其他因素的影響?!把芯刻囟ㄔ虻睦硐霠顟B(tài)是什么?那就是所有其他的‘干擾,因素都消失的狀態(tài)?!?dāng)所有的其他的干擾都不復(fù)存在的時(shí)候,原因就在它的行為中清楚地展示它的力量?!睂?duì)于第3條的理解,也可以從反事實(shí)的角度進(jìn)行:當(dāng)有原因A時(shí),會(huì)導(dǎo)致結(jié)果B;當(dāng)沒(méi)有原因A時(shí),則不會(huì)導(dǎo)致結(jié)果B。因而,“因果關(guān)系問(wèn)題實(shí)際上是一個(gè)反事實(shí)問(wèn)題一。

當(dāng)然,社會(huì)科學(xué)通常是在概率的意義上來(lái)理解因果關(guān)系的?!敖y(tǒng)計(jì)學(xué)對(duì)因果關(guān)系表述為:在相等條件下,如果A發(fā)生,則B發(fā)生的概率提高,或者x變化導(dǎo)致Y平均值的變化。因果關(guān)系的必然性不表述為個(gè)體事件,而表述為群體概率或平均值和隨機(jī)組試驗(yàn)的可重復(fù)性?!?/p>

基于第3條標(biāo)準(zhǔn),實(shí)驗(yàn)法成為確立因果關(guān)系最成熟的方法和手段。因?yàn)閷?shí)驗(yàn)可以將實(shí)驗(yàn)對(duì)象隨機(jī)分配到控制組和實(shí)驗(yàn)組,并排除外界其他因素的干擾。可是,社會(huì)科學(xué)的研究對(duì)象是人,造成了“進(jìn)行實(shí)驗(yàn)的特殊困難”?!霸谏鐣?huì)研究題材上進(jìn)行受控實(shí)驗(yàn)的可能性極為狹小。”因而,社會(huì)科學(xué)主要采用統(tǒng)計(jì)方法并結(jié)合其他手段來(lái)探尋因果關(guān)系。

從統(tǒng)計(jì)的意義上來(lái)探討因果關(guān)系,就不是兩個(gè)變量(一個(gè)因變量,一個(gè)自變量)之間的關(guān)系那么簡(jiǎn)單的事情,因?yàn)樯鐣?huì)生活中幾乎不存在單因單果的現(xiàn)象。統(tǒng)計(jì)控制就是要將可能對(duì)因變量(被解釋變量)和自變量(關(guān)鍵解釋變量)有影響的變量納入模型。從統(tǒng)計(jì)的角度來(lái)說(shuō),因果關(guān)系的問(wèn)題就轉(zhuǎn)變成了因果效應(yīng)?!爱?dāng)解釋變量被賦予兩個(gè)不同的值時(shí),因果效應(yīng)就是這些值對(duì)應(yīng)的觀察值中系統(tǒng)部分間的差異?!痹诮y(tǒng)計(jì)模型中準(zhǔn)確估計(jì)因果效應(yīng)主要受制于三個(gè)因素:

其一,樣本選擇性偏誤。樣本選擇性偏誤是由于缺乏科學(xué)的研究設(shè)計(jì)、非隨機(jī)抽樣、客觀條件限制等因素引起的。這既可能是由于研究者的主觀選擇所導(dǎo)致(比如力圖證明某一假設(shè)而只選取有利證據(jù)),也可能是由于客觀條件限制(如沒(méi)有好的抽樣框?qū)е氯狈﹄S機(jī)抽樣的基本條件),還可能是盡管有一個(gè)好的研究設(shè)計(jì),但由于操作過(guò)程中的失誤所致。樣本選擇性偏誤有兩種基本的形式:其一,缺乏參照組或?qū)φ战M,不能進(jìn)行反事實(shí)分析。其二,只看到有限樣本,而且是一個(gè)非隨機(jī)樣本⑨。就缺乏參照組來(lái)說(shuō),當(dāng)下的許多大數(shù)據(jù)也是如此。比如,由京東商城購(gòu)物者行為所形成的大數(shù)據(jù),就是一個(gè)線上購(gòu)物者的數(shù)據(jù),且不說(shuō)還有其他的線上購(gòu)物(如亞馬遜),如果要完整研究消費(fèi)者的購(gòu)物行為,那就缺少線下購(gòu)物者這一參照組,即使只研究線上購(gòu)物,也可能由于缺乏線下購(gòu)物的對(duì)比而導(dǎo)致認(rèn)識(shí)偏差。顯然,大數(shù)據(jù)只對(duì)由于抽樣引起的有限樣本的選擇性偏誤具有一定的糾正作用。因?yàn)榇髷?shù)據(jù)就是一定范圍里的總體,在理論上可以“收集所有的數(shù)據(jù),即‘樣本=‘總體”。因此,它也糾正了對(duì)于這一總體抽樣所導(dǎo)致的偏差。

統(tǒng)計(jì)學(xué)家們想出種種方法來(lái)解決樣本選擇性偏誤,但最根本的解決方案之一是不需要抽樣,換句話說(shuō),就是具有一個(gè)總體樣本。而這恰好是大數(shù)據(jù)的優(yōu)勢(shì)所在。大數(shù)據(jù)如果是總體或全部樣本的數(shù)據(jù),那就從根本上解決了由于抽樣偏頗所引起的樣本選擇性偏誤。

其二,變量遺漏?,F(xiàn)實(shí)生活中的大數(shù)據(jù)往往只有幾個(gè)簡(jiǎn)單的變量,其中一些數(shù)據(jù)只有客觀變量(缺乏態(tài)度或評(píng)價(jià)性的主觀變量),如果采用單一數(shù)據(jù),變量遺漏問(wèn)題會(huì)非常嚴(yán)重,甚至遠(yuǎn)遠(yuǎn)不如精心設(shè)計(jì)的抽樣數(shù)據(jù)。不過(guò),如果將不同的數(shù)據(jù)匹配起來(lái),那么這一問(wèn)題將在一定程度上得到緩解。匹配大數(shù)據(jù)在技術(shù)上是可以解決的,現(xiàn)實(shí)的問(wèn)題主要在于數(shù)據(jù)的產(chǎn)權(quán)交換和數(shù)據(jù)使用的倫理,經(jīng)過(guò)充分的討論,這些問(wèn)題是可以解決的。某一大數(shù)據(jù)變量簡(jiǎn)單或較少的問(wèn)題,是測(cè)量標(biāo)準(zhǔn)、技術(shù)和設(shè)計(jì)的問(wèn)題,這些問(wèn)題是可以逐步改進(jìn)的。現(xiàn)有測(cè)量,社會(huì)科學(xué)很少介入,在一定程度上導(dǎo)致社會(huì)關(guān)系指標(biāo)或變量較少。假以時(shí)日,由于社會(huì)科學(xué)的進(jìn)步和公眾對(duì)此的認(rèn)可,一些社會(huì)性的變量被列人、重視和普及,也是很有可能的。

其三,內(nèi)生性問(wèn)題。內(nèi)生性問(wèn)題涉及對(duì)于因果關(guān)系的基本理解。所謂內(nèi)生性問(wèn)題,是指“在一些情況下出現(xiàn)反向因果問(wèn)題:解釋變量受到被解釋變量影響,而不是我們假設(shè)的影響被解釋變量”。我們認(rèn)為,在簡(jiǎn)單、封閉、穩(wěn)定和局部的系統(tǒng),因果關(guān)系較易確定;在復(fù)雜、開(kāi)放、動(dòng)態(tài)和龐大的系統(tǒng)中,因果關(guān)系難以確定。因果關(guān)系之所以難以確定,主要是互為因果或因果關(guān)系相互糾纏的問(wèn)題,也就是“內(nèi)生性”問(wèn)題?!霸S多社會(huì)變量具有相互作用的效果,因而因果關(guān)系通常是不能簡(jiǎn)單累加的?!薄邦A(yù)期的作用會(huì)導(dǎo)致因果關(guān)系難以在許多人類(lèi)互動(dòng)中定位?!捎谌藗儠?huì)根據(jù)對(duì)他者如何行動(dòng)的預(yù)期以及對(duì)自己行動(dòng)結(jié)果的信念來(lái)調(diào)整自己的行為,因此經(jīng)驗(yàn)性調(diào)查乃至因果概念的界定都變得非常困難?!?/p>

所以,在復(fù)雜、開(kāi)放、動(dòng)態(tài)和龐大的系統(tǒng)中,因果關(guān)系的內(nèi)生性問(wèn)題較難解決,而在簡(jiǎn)單、封閉、穩(wěn)定和局部的系統(tǒng)中,在統(tǒng)計(jì)模型中可以盡量避免內(nèi)生性問(wèn)題。過(guò)去和現(xiàn)在的社會(huì)科學(xué)研究模型,就是將納入模型的有限變量視為與其環(huán)境相對(duì)隔離或獨(dú)立的因素。由這樣的模型所得出的因果關(guān)系,如果將其放入或回歸社會(huì)環(huán)境中,很有可能發(fā)生變化。這也是社會(huì)科學(xué)研究預(yù)測(cè)難以準(zhǔn)確的基本道理。進(jìn)一步說(shuō):由有限數(shù)據(jù)得出的因果關(guān)系要接受大數(shù)據(jù)的檢驗(yàn)。以往的研究缺乏大數(shù)據(jù),所以檢驗(yàn)就要多次重復(fù)地進(jìn)行。

盡管在復(fù)雜、開(kāi)放、動(dòng)態(tài)和龐大的系統(tǒng)中,因果關(guān)系的內(nèi)生性問(wèn)題較難解決,但并不是說(shuō)就一定不能解決,復(fù)雜與簡(jiǎn)單、開(kāi)放與封閉、動(dòng)態(tài)與靜態(tài)、龐大與狹小、全局與局部,都是相對(duì)而言的。避免在抽樣數(shù)據(jù)中所設(shè)置模型的內(nèi)生性問(wèn)題的原則與技術(shù),也可能在大數(shù)據(jù)中能夠得到應(yīng)用,或者有所改進(jìn)。而在大數(shù)據(jù)中能確立的因果關(guān)系,其穩(wěn)定性應(yīng)該遠(yuǎn)超于抽樣數(shù)據(jù)的結(jié)果。

大數(shù)據(jù)對(duì)確定因果效應(yīng)的有利之處還在于:大數(shù)據(jù)中的多數(shù)數(shù)據(jù)是面板數(shù)據(jù),并且具有層次性,可以進(jìn)行分層處理。

基于上述分析,我們不能同意所謂大數(shù)據(jù)不需探求因果關(guān)系而只是追求相關(guān)關(guān)系的說(shuō)法。如維克托·邁爾-舍恩伯格(Viktor Mayer-Schonberger)和肯尼斯·庫(kù)克耶(Kenneth Cukier)認(rèn)為的,不是因果關(guān)系,而是相關(guān)關(guān)系。

我們認(rèn)為,相關(guān)關(guān)系和因果關(guān)系不是對(duì)立的,相關(guān)關(guān)系是因果關(guān)系的必要條件,因果關(guān)系是表明事物間作用之方向性的一種特殊的相關(guān)關(guān)系。事物間具有較強(qiáng)的相關(guān)關(guān)系,其中必然蘊(yùn)含著因果關(guān)系,只是誰(shuí)是因、誰(shuí)是果,需要甄別,并要弄清楚因果關(guān)系的作用機(jī)制。當(dāng)然,我們同意“相關(guān)關(guān)系分析本身意義重大,同時(shí)它也為研究因果關(guān)系奠定了基礎(chǔ)”。

實(shí)際上,使用大數(shù)據(jù)是可以探討因果關(guān)系的。約翰·格林(John Gerring)等人曾收集了一個(gè)覆蓋國(guó)家、地域和區(qū)縣的多層次的選舉檔案(the Multi-Level Election Archive,MLEA)來(lái)研究政體大小與民主的因果關(guān)系。該文檔記錄了從18世紀(jì)到2013年間,88個(gè)國(guó)家、2344次選舉、79658個(gè)選區(qū)、超過(guò)400000場(chǎng)競(jìng)選活動(dòng)的數(shù)據(jù),是典型的大數(shù)據(jù)。通過(guò)普通最小二乘法(OLS)對(duì)樣本總體進(jìn)行的一系列檢驗(yàn)表明,在多黨競(jìng)選的地區(qū),較大的選區(qū)能在更大程度上鼓勵(lì)民主選舉,選民規(guī)模對(duì)各政黨的競(jìng)選力有正向的顯著影響。這一發(fā)現(xiàn)與傳統(tǒng)觀點(diǎn)——政體大小與民主呈負(fù)相關(guān)關(guān)系相矛盾,為了證明作者的研究結(jié)論,文章對(duì)可能影響選舉競(jìng)爭(zhēng)力的其他因素,比如選民對(duì)反對(duì)黨的偏好、競(jìng)選者的供給、選區(qū)的文化多樣性以及候選人與選民的關(guān)系等因素進(jìn)行了干預(yù),在排除干預(yù)效應(yīng)的模型里,選民規(guī)模仍然對(duì)政黨的競(jìng)選力有正向的顯著影響。隨后,作者又用部分國(guó)家的議會(huì)選舉數(shù)據(jù)和投票權(quán)改革數(shù)據(jù)驗(yàn)證了這一結(jié)論。網(wǎng)絡(luò)數(shù)據(jù)同樣可以用來(lái)探求因果關(guān)系,拉塞爾紐曼(w.Russell Neuman)等人在2014年曾根據(jù)美國(guó)國(guó)家選舉研究網(wǎng)站中涉及的29個(gè)議題,從傳統(tǒng)媒體與社交媒介中獲取了美國(guó)2012年全年各個(gè)議題的數(shù)據(jù)資料,這29個(gè)議題包含經(jīng)濟(jì)、外交事務(wù)、政治、公共秩序、社會(huì)問(wèn)題和環(huán)境六大方面,其中,平均每天有13362條社交媒介的評(píng)論數(shù)據(jù)和4573條傳統(tǒng)媒體的新聞報(bào)道。作者運(yùn)用格蘭杰因果關(guān)系檢驗(yàn)了傳統(tǒng)媒體、社交媒介與公共議題之間的因果關(guān)系,研究發(fā)現(xiàn),社交媒介是社會(huì)問(wèn)題和公共秩序議題的動(dòng)力,而在經(jīng)濟(jì)、外交事務(wù)、政治和環(huán)境議題方面沒(méi)有一種媒體主導(dǎo)這些公共議題,社交媒介和傳統(tǒng)媒體呈現(xiàn)出復(fù)雜的、動(dòng)態(tài)的領(lǐng)先與滯后模式。此外,約翰尼斯.本德勒(JohannesBendler)等人對(duì)Twitter用戶(hù)數(shù)據(jù)的研究發(fā)現(xiàn),某一興趣點(diǎn)(Point of Interest,POI)(比如餐廳、酒吧、銀行、博物館等)與用戶(hù)在該興趣點(diǎn)發(fā)布的Twitter消息之間存在著因果關(guān)系。

四、結(jié)論與討論

基于上述描述和分析,我們可以得出如下結(jié)論:

(1)和以往抽樣調(diào)查所得到的數(shù)據(jù)不同,作為人類(lèi)活動(dòng)實(shí)時(shí)記錄的大數(shù)據(jù)基本不受人類(lèi)記憶、偏好和情感干擾;大數(shù)據(jù)是一個(gè)總體數(shù)據(jù),但大部分?jǐn)?shù)據(jù)不是全球或全國(guó)范圍里的完整總體,而是一定范圍里的總體;大數(shù)據(jù)包含結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù);現(xiàn)實(shí)中單一的大數(shù)據(jù)變量較少但可以與其他數(shù)據(jù)進(jìn)行匹配,匹配的困難主要不在于技術(shù),而是產(chǎn)權(quán)和倫理問(wèn)題;大數(shù)據(jù)具有時(shí)效性,大數(shù)據(jù)大多是面板數(shù)據(jù)。

(2)中英文文獻(xiàn)檢索結(jié)果表明,大數(shù)據(jù)的研究并不多,但還是取得了一定的成果。比如,西方學(xué)界對(duì)大數(shù)據(jù)中的網(wǎng)絡(luò)數(shù)據(jù)的研究就有所進(jìn)展。有的研究驗(yàn)證并支持了社會(huì)網(wǎng)絡(luò)理論中格蘭諾維特的“弱關(guān)系假設(shè)”和博特的“結(jié)構(gòu)洞假設(shè)”,有的研究驗(yàn)證了“六度分隔理論”,有的研究則提出了新的理論假設(shè)。

(3)古典社會(huì)學(xué)和社會(huì)科學(xué)理論力圖發(fā)現(xiàn)人類(lèi)社會(huì)歷史規(guī)律。后來(lái)的學(xué)者基于人類(lèi)社會(huì)活動(dòng)的整體性、異質(zhì)性、能動(dòng)性或意向性對(duì)此提出質(zhì)疑。在社會(huì)學(xué)領(lǐng)域,主流觀點(diǎn)認(rèn)為應(yīng)該拋棄發(fā)現(xiàn)普遍規(guī)律的企圖,回到中層理論,關(guān)注具體的“因果機(jī)制”。

大數(shù)據(jù)為社會(huì)學(xué)和社會(huì)科學(xué)重新發(fā)現(xiàn)宏觀社會(huì)歷史發(fā)展規(guī)律提供了可能性:它以“總體”數(shù)據(jù)提供了認(rèn)知宏觀社會(huì)的數(shù)據(jù)基礎(chǔ);它為社會(huì)現(xiàn)象的“異質(zhì)性假設(shè)”檢驗(yàn)提供了較為全面的數(shù)據(jù);它以實(shí)時(shí)記錄的特點(diǎn)排除了獲取數(shù)據(jù)時(shí)的人為干擾;它也為恩格斯的“結(jié)果穩(wěn)定假設(shè)”提供了檢驗(yàn)所用的充分的經(jīng)驗(yàn)材料;它超越抽樣調(diào)查的小數(shù)據(jù),將小數(shù)據(jù)中被視為極端值并且往往被刪節(jié)的個(gè)案或變量重新納入統(tǒng)計(jì)分析。

作為總體、實(shí)時(shí)記錄和面板的大數(shù)據(jù)也許可以重構(gòu)社會(huì)學(xué)和社會(huì)科學(xué)的研究目標(biāo):它使得社會(huì)學(xué)、經(jīng)濟(jì)學(xué)和其他社會(huì)科學(xué)研究者至少可以發(fā)現(xiàn)或?qū)ふ胰祟?lèi)活動(dòng)的行為規(guī)律,并在此基礎(chǔ)上進(jìn)而發(fā)現(xiàn)社會(huì)歷史的發(fā)展規(guī)律。但這種重構(gòu)不是回到歷史決定論,不是對(duì)規(guī)律作決定論的理解,而是概率論的理解。

(4)追求因果關(guān)系解釋是科學(xué)包括社會(huì)科學(xué)的必然目標(biāo)。由于作為社會(huì)科學(xué)研究對(duì)象的人的特殊性,社會(huì)學(xué)和社會(huì)科學(xué)很少采用實(shí)驗(yàn)法而主要采用統(tǒng)計(jì)方法并結(jié)合其他手段來(lái)探尋社會(huì)現(xiàn)象之間的因果關(guān)系。在統(tǒng)計(jì)模型中準(zhǔn)確估計(jì)因果效應(yīng)主要受制于三個(gè)因素:樣本選擇性偏誤、變量遺漏和內(nèi)生性問(wèn)題。

大數(shù)據(jù)作為總體或全部樣本的數(shù)據(jù),有助于從根本上克服由于抽樣偏頗所引起的樣本選擇性偏誤。單一大數(shù)據(jù)變量較少,如采用單一數(shù)據(jù),變量遺漏問(wèn)題會(huì)非常嚴(yán)重;如果將不同的數(shù)據(jù)匹配起來(lái),可以克服或緩解變量遺漏問(wèn)題;盡管在復(fù)雜、開(kāi)放、動(dòng)態(tài)和龐大的系統(tǒng)中,因果關(guān)系的內(nèi)生性問(wèn)題較難解決,但大數(shù)據(jù)對(duì)因果關(guān)系的檢驗(yàn)比有限樣本的抽樣數(shù)據(jù)更為穩(wěn)健和可靠,避免在抽樣數(shù)據(jù)中設(shè)置模型的內(nèi)生性問(wèn)題的原則與技術(shù),在大數(shù)據(jù)中也能應(yīng)用,甚至有所改進(jìn);大數(shù)據(jù)作為面板數(shù)據(jù)和分層數(shù)據(jù),對(duì)于確定因果效應(yīng)極為有利。因而,我們不能同意大數(shù)據(jù)不需探求因果關(guān)系而只是追求相關(guān)關(guān)系的說(shuō)法。大數(shù)據(jù)對(duì)于社會(huì)學(xué)和社會(huì)科學(xué)追求因果關(guān)系的努力比抽樣數(shù)據(jù)更為有利。

總體來(lái)說(shuō),我們認(rèn)為,大數(shù)據(jù)是可以用來(lái)重構(gòu)社會(huì)學(xué)和社會(huì)科學(xué)的研究宗旨和目標(biāo)的。不僅如此,大數(shù)據(jù)對(duì)社會(huì)學(xué)和社會(huì)科學(xué)的研究邏輯、方法和技術(shù)、研究的組織方式及人員素質(zhì)等都會(huì)產(chǎn)生深遠(yuǎn)影響。對(duì)此,我們略加討論。

其一,研究邏輯。一般說(shuō)來(lái),傳統(tǒng)社會(huì)學(xué)和社會(huì)科學(xué)定量研究的基本套路是假設(shè)檢驗(yàn),即提出假設(shè),然后用數(shù)據(jù)去檢驗(yàn),這種邏輯被視為演繹邏輯。從抽樣數(shù)據(jù)推論總體的角度看,也有人認(rèn)為是歸納邏輯。在邏輯實(shí)證主義看來(lái),真正使用演繹邏輯的是數(shù)學(xué)和邏輯學(xué)本身,得出的是先驗(yàn)知識(shí);其他從經(jīng)驗(yàn)事實(shí)中得出結(jié)論的都是歸納邏輯,科學(xué)就是這樣,得出的是經(jīng)驗(yàn)知識(shí)。

我們認(rèn)為,關(guān)于歸納還是演繹的爭(zhēng)論并不是特別有意義,對(duì)于大數(shù)據(jù)來(lái)說(shuō),事先不提假設(shè),直接從數(shù)據(jù)得出結(jié)論,是完全可以的;提出假設(shè),比如從抽樣調(diào)查的數(shù)據(jù)或理論演繹提出假設(shè),再用大數(shù)據(jù)去檢驗(yàn),也是可以的,前文所述用大數(shù)據(jù)驗(yàn)證了“六度分隔理論”就是一例。

不管是歸納還是演繹,只要遵循科學(xué)的推理過(guò)程,都是可以的,在大數(shù)據(jù)研究中都可以使用。當(dāng)單一大數(shù)據(jù)的變量較少,主要使用描述統(tǒng)計(jì)時(shí),就主要是歸納邏輯;當(dāng)某一大數(shù)據(jù)可以使用模型進(jìn)行統(tǒng)計(jì)分析時(shí),演繹邏輯可能就更為重要。

從演繹邏輯出發(fā),使用大數(shù)據(jù)進(jìn)行檢驗(yàn),可以稱(chēng)之為“理論驅(qū)動(dòng)”;從歸納邏輯出發(fā),使用大數(shù)據(jù)進(jìn)行描述和分析,可以稱(chēng)之為“數(shù)據(jù)驅(qū)動(dòng)”。兩種邏輯并存,理論驅(qū)動(dòng)和數(shù)據(jù)驅(qū)動(dòng)并存,可能是使用大數(shù)據(jù)進(jìn)行研究的一個(gè)特點(diǎn)。以往的抽樣數(shù)據(jù)研究,主要是理論驅(qū)動(dòng)和演繹邏輯;而質(zhì)性研究,主要是數(shù)據(jù)驅(qū)動(dòng)和歸納邏輯。大數(shù)據(jù)將兩種邏輯結(jié)合起來(lái),可能是其優(yōu)勢(shì)所在。

其二,研究方法和技術(shù)。大數(shù)據(jù)對(duì)定量研究方法的挑戰(zhàn)目前可能主要是對(duì)當(dāng)下定量研究所使用的工具(比如軟件)形成沖擊。主要用于抽樣數(shù)據(jù)的傳統(tǒng)軟件不足以容納這么大的數(shù)據(jù)量,難以進(jìn)行計(jì)算,更難直接獲取或抓取數(shù)據(jù)。所以,大數(shù)據(jù)對(duì)統(tǒng)計(jì)分析技術(shù)會(huì)有很大的沖擊和促進(jìn),對(duì)計(jì)算機(jī)及其軟件的發(fā)展有要求。

社會(huì)科學(xué)發(fā)展一個(gè)重要的推動(dòng)力就是技術(shù)手段的進(jìn)步。從技術(shù)的角度,對(duì)大數(shù)據(jù)的獲取、存儲(chǔ)、交換、匹配、分析、建模,大數(shù)據(jù)分析對(duì)統(tǒng)計(jì)理念、技術(shù)和軟件的要求,都會(huì)形成沖擊。

需要指出的是,大數(shù)據(jù)對(duì)質(zhì)性研究方法挑戰(zhàn)可能更為尖銳:一是,大數(shù)據(jù)給質(zhì)性研究提供了源源不竭的數(shù)據(jù),對(duì)以往質(zhì)性研究限于有限個(gè)案的做法影響極大,至少不比對(duì)定量研究的影響小,只不過(guò)質(zhì)性研究者對(duì)此往往認(rèn)識(shí)不足。二是,傳統(tǒng)的質(zhì)性研究之所以有一席之地,原因之一是可以研究統(tǒng)計(jì)中的極端值。在抽樣數(shù)據(jù)中,極端值個(gè)案數(shù)太少,難以單獨(dú)進(jìn)行統(tǒng)計(jì)分析,給質(zhì)性研究留下空間。大數(shù)據(jù)可以提供大量極端值的個(gè)案數(shù),因而可以進(jìn)行統(tǒng)計(jì)分析。在這個(gè)意義上,大數(shù)據(jù)又可能壓縮了質(zhì)性研究的空間。三是,大數(shù)據(jù)中絕大部分是非結(jié)構(gòu)性數(shù)據(jù),也就是質(zhì)性研究的基本材料,怎么對(duì)這些數(shù)據(jù)進(jìn)行分類(lèi)、處理,既是定量研究的難題,也可求助于質(zhì)性研究深入、細(xì)致的分析;四是,大數(shù)據(jù)提供了總體的基本特征,對(duì)于質(zhì)性研究將個(gè)案類(lèi)型化、進(jìn)而選擇個(gè)案(抽樣)提供了很大的幫助;五是,大數(shù)據(jù)的非結(jié)構(gòu)化特征迫使人們從簡(jiǎn)單的二值邏輯走向多值邏輯,走向人工智能,大數(shù)據(jù)為人工智能的訓(xùn)練提供了數(shù)據(jù)基礎(chǔ)。

其三,社會(huì)條件。當(dāng)人類(lèi)進(jìn)入大數(shù)據(jù)時(shí)代,使用大數(shù)據(jù)進(jìn)行社會(huì)科學(xué)研究時(shí),也對(duì)其組織方式、管理方式、文化條件提出了新的要求。

我們不想抽象地談?wù)撨@些問(wèn)題,而是結(jié)合中國(guó)國(guó)情進(jìn)行討論。我們認(rèn)為,在大數(shù)據(jù)時(shí)代,中國(guó)具有一些有利條件,有助于使用大數(shù)據(jù)進(jìn)行社會(huì)科學(xué)研究。這些條件是:(1)中國(guó)歷史悠久,留下了豐富的史籍和其他文獻(xiàn)。(2)中國(guó)是一個(gè)人口大國(guó),互聯(lián)網(wǎng)發(fā)展較快,網(wǎng)民眾多,網(wǎng)絡(luò)數(shù)據(jù)異常豐富。(3)中國(guó)社會(huì)變遷劇烈,人口流動(dòng)迅速,變遷軌跡會(huì)產(chǎn)生很多新的數(shù)據(jù)。比如一個(gè)農(nóng)民一輩子待在家里,就缺乏移動(dòng)的軌跡,但是一旦外出務(wù)工,就會(huì)流動(dòng),并產(chǎn)生數(shù)據(jù)。(4)中國(guó)的市場(chǎng)經(jīng)濟(jì)已經(jīng)激活了一批民營(yíng)企業(yè),他們對(duì)數(shù)據(jù)比較敏感,對(duì)于數(shù)據(jù)的獲取、儲(chǔ)存、分析產(chǎn)生了巨大的市場(chǎng)需求。但是,中國(guó)也有一些不利于使用大數(shù)據(jù)進(jìn)行社會(huì)科學(xué)研究的條件。這些條件是:(1)中國(guó)傳統(tǒng)哲學(xué)和文化觀念不重視數(shù)據(jù),坐而論道,以圣人之言為評(píng)判言論對(duì)錯(cuò)的標(biāo)準(zhǔn),往往進(jìn)行注釋式的討論,不重視實(shí)證研究。(2)中國(guó)從普通人群到專(zhuān)業(yè)人員大多以個(gè)人經(jīng)驗(yàn)去做判斷,從數(shù)據(jù)視角觀察、分析和處理問(wèn)題的人還比較少。(3)中國(guó)的社會(huì)科學(xué)更強(qiáng)調(diào)與自然科學(xué)的區(qū)別,較少?gòu)?qiáng)調(diào)要向自然科學(xué)學(xué)習(xí),對(duì)科學(xué)理念、研究方法和技術(shù)的學(xué)習(xí)都不夠。在社會(huì)科學(xué)領(lǐng)域沒(méi)有形成定量研究傳統(tǒng)。(4)中國(guó)的大學(xué)、科研機(jī)構(gòu)的層級(jí)組織機(jī)構(gòu)。不利于建立扁平、橫向、跨學(xué)科的大數(shù)據(jù)研究組織形式。因而,大數(shù)據(jù)時(shí)代對(duì)中國(guó)的科研體制、人的素質(zhì)和文化觀念都提出了新的要求并產(chǎn)生巨大沖擊。

當(dāng)下,大數(shù)據(jù)在商業(yè)、社會(huì)管理和科學(xué)研究等眾多領(lǐng)域里蓬勃發(fā)展、方興未艾,深刻地改變了我們的時(shí)代。這種發(fā)展還是初步的,卻在科學(xué)研究領(lǐng)域構(gòu)造了近乎無(wú)限的想象空間:它可能根本上顛覆千百年來(lái)人類(lèi)從個(gè)體經(jīng)驗(yàn)逐漸歸納進(jìn)而認(rèn)知宏觀社會(huì)和自然界的思維邏輯,而以總體特征作為我們認(rèn)知和思維的出發(fā)點(diǎn);它以源源不斷的實(shí)時(shí)記錄給我們留下了人類(lèi)活動(dòng)的巨量數(shù)據(jù),這些數(shù)據(jù)具有類(lèi)似于實(shí)驗(yàn)數(shù)據(jù)的特征;它滲透到社會(huì)生活的各個(gè)領(lǐng)域,從而使得人們不能視而不見(jiàn),聽(tīng)而不聞,而對(duì)經(jīng)院哲學(xué)的純思辨模式提出根本性質(zhì)疑;它對(duì)傳統(tǒng)的學(xué)科分類(lèi)、學(xué)科版圖形成巨大沖擊,并要求科學(xué)研究,尤其是社會(huì)科學(xué)研究必須與數(shù)據(jù)科學(xué)相結(jié)合,并創(chuàng)造新的研究和學(xué)習(xí)的組織形式;它對(duì)科學(xué)研究的定量化和工具化提出了不斷發(fā)展的客觀需求,并強(qiáng)力推動(dòng)研究人員重新學(xué)習(xí)、終身學(xué)習(xí);它將過(guò)去一切似乎是定論的東西重新變成假設(shè),并且要接受其檢驗(yàn),由此可能顛覆以往的真理或常識(shí),并生產(chǎn)出新的知識(shí)。

如果中國(guó)的社會(huì)科學(xué)還亦步亦趨跟隨西方社會(huì)科學(xué)走的話,那就難以發(fā)展。直接進(jìn)入大數(shù)據(jù)時(shí)代,是中國(guó)社會(huì)科學(xué)跳躍式發(fā)展的機(jī)遇。在大數(shù)據(jù)時(shí)代,中國(guó)社會(huì)科學(xué)和西方社會(huì)科學(xué)幾乎在同一起點(diǎn)上起步,關(guān)鍵在于,更新理念、努力學(xué)習(xí)、改造和革新社會(huì)科學(xué)研究的組織方式。

猜你喜歡
因果關(guān)系沖擊反思
外出就餐對(duì)英國(guó)餐飲業(yè)的沖擊
原因的原因的原因不是原因
色彩沖擊
閱讀理解
做完形填空題,需考慮的邏輯關(guān)系
探究刑法的因果關(guān)系
記初中英語(yǔ)詞匯教學(xué)的一次歸類(lèi)、整合改革及反思
中學(xué)生早戀案例分析及反思
新時(shí)期中學(xué)美術(shù)課教學(xué)方法的思考
從哲學(xué)中的因果關(guān)系到刑法學(xué)中的因果關(guān)系
榆树市| 辽阳县| 沁阳市| 界首市| 滨海县| 阿克苏市| 会东县| 嘉定区| 商河县| 许昌市| 定州市| 宁海县| 津市市| 通城县| 浏阳市| 内黄县| 克拉玛依市| 嘉祥县| 河南省| 洪湖市| 通山县| 扎鲁特旗| 岫岩| 洱源县| 威海市| 阿合奇县| 丹棱县| 南京市| 甘洛县| 牡丹江市| 临洮县| 兴隆县| 黎川县| 安岳县| 巫山县| 托里县| 莒南县| 新宁县| 大田县| 五大连池市| 栖霞市|