馬 磊,林森苗,包 瑩
(1.3.上海大學(xué) 社會(huì)學(xué)院,上海 200444;2.復(fù)旦大學(xué) 社會(huì)發(fā)展與公共政策學(xué)院,上海 200433)
隨著互聯(lián)網(wǎng)與信息技術(shù)的迅猛發(fā)展,數(shù)字化信息日益呈現(xiàn)出爆炸增長(zhǎng)態(tài)勢(shì)。今天的人們已完全沉浸在一個(gè)充斥著海量數(shù)據(jù)的“大數(shù)據(jù)”(The Big Data)時(shí)代。大數(shù)據(jù)已成為社會(huì)各界的時(shí)髦話題之一,不少國(guó)家都加入了這波洶涌澎湃的大數(shù)據(jù)浪潮中,國(guó)務(wù)院也在2015年9月印發(fā)了《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》,這是我國(guó)在國(guó)家層面第一份促進(jìn)大數(shù)據(jù)長(zhǎng)遠(yuǎn)發(fā)展的政策性和綱領(lǐng)性文件。習(xí)近平總書記在一次中央政治局集體學(xué)習(xí)時(shí)明確指出:“要運(yùn)用大數(shù)據(jù)提升國(guó)家治理現(xiàn)代化水平。要建立健全大數(shù)據(jù)輔助科學(xué)決策和社會(huì)治理的機(jī)制,推進(jìn)政府管理和社會(huì)治理模式創(chuàng)新,實(shí)現(xiàn)政府決策科學(xué)化、社會(huì)治理精準(zhǔn)化、公共服務(wù)高效化?!盵1]
究竟何謂大數(shù)據(jù)?目前,社會(huì)各界并未形成一致共識(shí)??傮w而言,它有四類區(qū)別于傳統(tǒng)數(shù)據(jù)的特征:一是規(guī)模大,含有大量信息和上億個(gè)觀測(cè)對(duì)象,通常以千萬(wàn)億字節(jié)(Petabyte)來(lái)度量;二是速度快,包括了高頻數(shù)據(jù)及其快速處理方法;三是來(lái)源多樣,傳統(tǒng)上不相干的信息被匯總合并在一起,共同構(gòu)成了大數(shù)據(jù);四是數(shù)字化,各種信息被大規(guī)模地進(jìn)行數(shù)字化處理,這既有助于跨部門的信息分享、合作、存儲(chǔ)、處理,也有利于信息的快速分析和遠(yuǎn)程搜索[2]。
社會(huì)科學(xué)家和各國(guó)的社會(huì)政策制定者正在熱情擁抱大數(shù)據(jù)。就像生物學(xué)家借助顯微鏡觀察細(xì)胞層面的生物現(xiàn)象一樣,大數(shù)據(jù)正是社會(huì)科學(xué)家手中的“顯微鏡”[3]。社會(huì)科學(xué)家使用大數(shù)據(jù)能夠以更大規(guī)模、更快速度,在更細(xì)微的層面觀測(cè)與研究人類行為,或檢驗(yàn)以往的社會(huì)科學(xué)理論命題,或拓展新的研究議題,或?qū)崿F(xiàn)與傳統(tǒng)研究方法的融合創(chuàng)新。社會(huì)政策制定者借助社會(huì)科學(xué)家對(duì)大數(shù)據(jù)的研究成果,能夠真正實(shí)現(xiàn)科學(xué)決策,切實(shí)提高國(guó)家治理現(xiàn)代化水平,實(shí)現(xiàn)社會(huì)治理的有序良性循環(huán)。
本文從大數(shù)據(jù)的主要應(yīng)用、大數(shù)據(jù)的社會(huì)影響與自身脆弱性、大數(shù)據(jù)應(yīng)用到社會(huì)治理領(lǐng)域未來(lái)的六大研究方向等三個(gè)方面,全面回顧了國(guó)內(nèi)外的代表性研究,系統(tǒng)探討了大數(shù)據(jù)與社會(huì)科學(xué)研究相結(jié)合,推動(dòng)社會(huì)治理進(jìn)步的優(yōu)缺點(diǎn)。大數(shù)據(jù)不是靈丹妙藥、不能包治百病,但它確實(shí)為傳統(tǒng)社會(huì)科學(xué)研究和“善治”開(kāi)辟了一片新天地,值得社會(huì)科學(xué)研究者和社會(huì)政策制定者認(rèn)真思考與對(duì)待。
1.社會(huì)參與
一般認(rèn)為,新媒體的出現(xiàn)廣泛提升了大眾參與公共事務(wù)的積極性,即所謂“e-democracy”,但該觀點(diǎn)一直沒(méi)有得到很好的驗(yàn)證。Larsson和Moe(2012)使用推特(twitter)的搜索功能,收集了2010年瑞典大選期間所有與選舉相關(guān)的推文共計(jì)99832條?;谶@些推文,他們分析了用戶的選舉參與狀況和選舉話題的傳播趨勢(shì)[4]。結(jié)果表明,推特在此次大選期間確實(shí)發(fā)揮了重要作用,它拓寬了人們的參與渠道,也為政治家宣傳政見(jiàn)提供了高效便捷的方式。
Bond等人(2012)所做的互聯(lián)網(wǎng)實(shí)驗(yàn),則進(jìn)一步闡明了社交網(wǎng)絡(luò)發(fā)揮功能的前提條件。在2010年美國(guó)國(guó)會(huì)議員選舉期間,他們隨機(jī)給6100萬(wàn)臉書(facebook)用戶發(fā)送了不同類型的投票宣傳信息。其中,參照組只收到“出去投票”的信息;實(shí)驗(yàn)組成員除收到這條信息外,還能看到已參與投票的好友頭像。結(jié)果發(fā)現(xiàn),收到投票宣傳信息后,實(shí)驗(yàn)組用戶參與投票的概率顯著高于參照組[5]。這說(shuō)明投票動(dòng)員信息不僅影響了臉書用戶的投票行為,還影響到了他們的朋友,以及他們朋友的朋友的投票行為,并且?guī)缀跛行畔鞑ザ及l(fā)生在現(xiàn)實(shí)中本來(lái)就親密的朋友中?,F(xiàn)實(shí)中的人際社會(huì)關(guān)系強(qiáng)化了社交網(wǎng)絡(luò)的作用,進(jìn)而影響了人們的行為選擇。
社交網(wǎng)絡(luò)除了能提升居民參與公共事務(wù)的積極性外,是否也能在更局部的范圍內(nèi),起到加強(qiáng)鄰里互動(dòng)的作用呢?答案是否定的。Bingham-Hall和Law(2015)分析了倫敦東南部的一些推特用戶數(shù)據(jù)后發(fā)現(xiàn),當(dāng)?shù)鼐用裨谕铺厣隙缄P(guān)注了一個(gè)核心網(wǎng)絡(luò)小圈子,這個(gè)圈子主要是由當(dāng)?shù)氐囊恍┦聞?wù)部門構(gòu)成的,而居民之間彼此并沒(méi)有太多的關(guān)注[6]。這說(shuō)明推特并未強(qiáng)化居民之間的聯(lián)系,居民們更多依賴的仍是鄰里間的口耳相傳。
2.人口流動(dòng)
大數(shù)據(jù)能幫助人們準(zhǔn)確識(shí)別出龐大流動(dòng)人群的遷移模式。Jurdak(2015)及其同事利用推特文本上附帶的地理標(biāo)簽信息,研究了澳大利亞的人口遷移模式。對(duì)600萬(wàn)條地理標(biāo)簽的分析表明,人們的短距離和長(zhǎng)距離流動(dòng)基本都是在特大城市完成的[7]。國(guó)內(nèi)學(xué)者龍瀛等(2012)使用2008年北京市連續(xù)一周的公交卡刷卡數(shù)據(jù),結(jié)合居民出行調(diào)查數(shù)據(jù)和北京市的土地利用情況,識(shí)別出了公交持卡人的居住地、就業(yè)地和通勤軌跡,對(duì)居民出行模式與通勤形態(tài)的分析表明,全市大量居民存在著職住分離的狀況[8]。
因就業(yè)、職業(yè)變動(dòng)、婚姻等原因而發(fā)生的流動(dòng),流動(dòng)人口往往面臨著適應(yīng)或融入本地生活的問(wèn)題。大數(shù)據(jù)在這一方面也產(chǎn)生了一些研究成果。國(guó)內(nèi)有學(xué)者分析了新生代農(nóng)民工在北京建立的同鄉(xiāng)QQ群,描繪了這個(gè)群體所具有的情感特征,展示了群組成員的行為邏輯及背后蘊(yùn)含的社會(huì)文化意義,揭示出了QQ群對(duì)新生代農(nóng)民工的社會(huì)支持功能[9]。不過(guò),因這一虛擬社交群體是以利益為導(dǎo)向而建立的,往往是松散而不穩(wěn)定的,所以很難給流動(dòng)中的青年農(nóng)民工提供真正的歸屬感。
3.經(jīng)濟(jì)社會(huì)發(fā)展
大數(shù)據(jù)能幫助社會(huì)科學(xué)工作者深入探討宏觀層面的經(jīng)濟(jì)社會(huì)發(fā)展?fàn)顩r。Goldberg(2015)及其同事從美國(guó)一家高科技公司收集了600多名員工歷時(shí)5年的商務(wù)往來(lái)電子郵件共計(jì)1024萬(wàn)封。他們根據(jù)郵件文本內(nèi)容以及往來(lái)郵件所展示出的私人網(wǎng)絡(luò)關(guān)系,分析了員工在公司中的兩種嵌入性機(jī)制對(duì)他們工作績(jī)效產(chǎn)生的影響。結(jié)果發(fā)現(xiàn),員工的私人網(wǎng)絡(luò)關(guān)系和所處的公司文化氛圍對(duì)其工作績(jī)效均有影響,并且兩者的作用存在著此消彼長(zhǎng)的平衡。員工在私人關(guān)系網(wǎng)絡(luò)中嵌入程度越低,越能從高度的公司文化嵌入性中獲益;相反,對(duì)公司文化認(rèn)同較低的員工往往更能從密集的私人網(wǎng)絡(luò)關(guān)系中獲益[10]。
有研究者通過(guò)匯總個(gè)體層面的社交網(wǎng)絡(luò)數(shù)據(jù),計(jì)算出了一個(gè)地區(qū)的社會(huì)資本存量,并分析了社會(huì)資本對(duì)區(qū)域經(jīng)濟(jì)發(fā)展的作用效果。荷蘭烏特勒支大學(xué)的兩位社會(huì)學(xué)家Norbutas和Corten(2018)收集了荷蘭438個(gè)城市1000多萬(wàn)社交網(wǎng)絡(luò)用戶的信息,檢驗(yàn)了這些城市的社會(huì)網(wǎng)絡(luò)結(jié)構(gòu)與經(jīng)濟(jì)發(fā)展的關(guān)系。研究表明,一個(gè)地區(qū)的社交網(wǎng)絡(luò)結(jié)構(gòu)形態(tài)越多樣,內(nèi)部平均空間連接距離越長(zhǎng),異質(zhì)性信息越豐富,該地區(qū)的經(jīng)濟(jì)發(fā)展就越繁榮;相反,一個(gè)地區(qū)的社交網(wǎng)絡(luò)越封閉、密度越高、內(nèi)部平均空間連接距離越短,經(jīng)濟(jì)發(fā)展往往就比較滯后[11]。豐富密集的社會(huì)網(wǎng)絡(luò)促進(jìn)了地區(qū)內(nèi)部信息的流動(dòng),強(qiáng)化了居民的信任與互動(dòng),因此有益于區(qū)域經(jīng)濟(jì)發(fā)展。
還有研究者從互聯(lián)網(wǎng)的頁(yè)面上實(shí)時(shí)抓取價(jià)格信息,利用這一大數(shù)據(jù)來(lái)計(jì)算價(jià)格指數(shù),幫助政策制定者科學(xué)認(rèn)識(shí)經(jīng)濟(jì)社會(huì)發(fā)展的態(tài)勢(shì),從而合理制定經(jīng)濟(jì)政策。麻省理工學(xué)院斯隆商學(xué)院的兩位教授Cavallo和Rigobon(2016)使用網(wǎng)頁(yè)自動(dòng)抓取技術(shù),從20個(gè)國(guó)家900多個(gè)在線零售商網(wǎng)站中,實(shí)時(shí)抓取了1500多萬(wàn)個(gè)商品的價(jià)格,這些實(shí)時(shí)價(jià)格被用來(lái)構(gòu)造該國(guó)的消費(fèi)者價(jià)格指數(shù)(CPI)或通貨膨脹指數(shù)[12]。他們的這項(xiàng)工作為人工收集商品勞務(wù)的價(jià)格信息提供了有益補(bǔ)充,對(duì)學(xué)術(shù)研究與經(jīng)濟(jì)政策制定勢(shì)必都會(huì)產(chǎn)生深遠(yuǎn)影響。
4.老齡健康與長(zhǎng)壽
我國(guó)正在迅速邁入深度老齡化社會(huì),如何把類型多樣的大數(shù)據(jù)資料與老齡化研究相結(jié)合,為中國(guó)老齡化公共服務(wù)實(shí)踐和政策制定開(kāi)辟出一條新路,是擺在社會(huì)科學(xué)工作者面前的一項(xiàng)重大課題。物聯(lián)網(wǎng)的快速發(fā)展催生出大量可穿戴設(shè)備和智能家居設(shè)備,這些設(shè)備使用新型傳感技術(shù),實(shí)時(shí)采集人類生理活動(dòng)和社會(huì)活動(dòng)信息,并同步上傳至設(shè)備終端或云端。這些數(shù)據(jù)既能幫助醫(yī)生準(zhǔn)確診斷疾病,為老年人提供更合適的治療方案,也能幫助老年人更長(zhǎng)久地維持獨(dú)立自主的生活,節(jié)約護(hù)理成本、提高生活質(zhì)量、維護(hù)生命尊嚴(yán)。此外,老年人身體內(nèi)部基因特征與各種生物醫(yī)學(xué)指標(biāo)所生成的大數(shù)據(jù),同樣也為老齡學(xué)研究者提供了豐富的衰老與病變信息,有助于研究者破譯人類長(zhǎng)壽的自然奧秘。
Kestens等人(2016)為了研究城市居住環(huán)境對(duì)老年人健康的影響,使用多種方法收集老年人與環(huán)境互動(dòng)的信息。他們使用多傳感器可穿戴設(shè)備收集了老人的日?;顒?dòng)與地理位置信息,使用交互式地圖問(wèn)卷收集了老人的活動(dòng)終點(diǎn)與社會(huì)交往信息,還使用傳統(tǒng)的問(wèn)卷調(diào)查法收集了老人對(duì)具體地理位置的主觀感受信息[13]。這些豐富的信息為定量、定性評(píng)估老齡健康與環(huán)境關(guān)系提供了便利。
基因組數(shù)據(jù)也是名副其實(shí)的大數(shù)據(jù)。人類基因組計(jì)劃的研究目標(biāo)就是對(duì)30多億個(gè)堿基對(duì)進(jìn)行精確測(cè)序,破譯人類的全部遺傳密碼,其工作量之大令人咋舌?!盎蚣徔椆ぁ?GeneWeaver)的出現(xiàn)極大提高了研究者的工作效率,它是一個(gè)基因大數(shù)據(jù)分析系統(tǒng),能有效存儲(chǔ)、搜索和分析來(lái)自實(shí)驗(yàn)室、已發(fā)表成果和其他數(shù)據(jù)庫(kù)的海量基因大數(shù)據(jù)[14]。它的目標(biāo)是充分整合多種類型的基因組數(shù)據(jù),以此探究人類衰老和長(zhǎng)壽的秘密。這個(gè)分析系統(tǒng)中的一些工具能把人類衰老過(guò)程中的基因、正常生物過(guò)程和疾病等因素廣泛關(guān)聯(lián)起來(lái),有利于研究者做出新發(fā)現(xiàn)。
“基因紡織工”的第一個(gè)用途是在細(xì)胞衰老和認(rèn)知下降過(guò)程中,探索哪些分子和細(xì)胞因素起了決定性作用;其次是探索兩種最常見(jiàn)的疾病狀態(tài)(肥胖和老年癡呆),是否有共同的基因決定因素;再次是識(shí)別多重抗衰老干預(yù)過(guò)程中共同的分子作用機(jī)制,例如節(jié)制飲食延長(zhǎng)壽命的分子生物學(xué)機(jī)制;最后一個(gè)用途是探討衰老過(guò)程中基因功能的穩(wěn)定性[14]。
根據(jù)人口學(xué)規(guī)律,年齡每增加8歲,人類的死亡率就會(huì)翻倍。特別是在40歲之后,諸如癌癥、中風(fēng)的發(fā)病率都會(huì)加速?;诖?,人們通常認(rèn)為人類機(jī)能退化、走向衰老的過(guò)程必然是加速的。俄羅斯莫斯科物理和技術(shù)學(xué)院(Moscow Institute of Physics and Technology)的物理學(xué)家Fedichev(2018)并不同意這一看法。他認(rèn)為,雖然人類的衰老是不可對(duì)抗的自然規(guī)律,但老化的過(guò)程卻并非一定是加速呈指數(shù)型變化的。即使物種學(xué)意義上很接近的兩類哺乳動(dòng)物,也可能表現(xiàn)出差別極大的衰老過(guò)程。他進(jìn)一步指出,把生物醫(yī)學(xué)大數(shù)據(jù)和復(fù)雜動(dòng)態(tài)系統(tǒng)物理學(xué)的分析方法相結(jié)合,可以建立若干人體衰老預(yù)測(cè)模型,以便系統(tǒng)地發(fā)現(xiàn)人類衰老的生物標(biāo)記,最終確定未來(lái)抗衰老干預(yù)措施的新治療靶點(diǎn)[15]。
尋找具有生理學(xué)意義的準(zhǔn)確生物標(biāo)記,是評(píng)估各種抗衰老療法的關(guān)鍵。不同人種在飲食、生活方式、環(huán)境暴露甚至平均衰老速率方面往往存在不小的差異,因此有理由相信,經(jīng)由特定族群收集數(shù)據(jù)而訓(xùn)練出的老化時(shí)鐘(aging clocks),更有可能解釋上述潛在混雜因素對(duì)人體老化的影響,從而提高預(yù)測(cè)實(shí)足年齡(chronological age)和生物年齡(biological age)的能力。以丹麥哥本哈根大學(xué)Mamoshina(2018)教授為首的研究團(tuán)隊(duì),通過(guò)采集加拿大、韓國(guó)和東歐人口血液樣本大數(shù)據(jù),提出了一個(gè)基于深度學(xué)習(xí)的血液老化時(shí)鐘模型。與傳統(tǒng)的基于特定人口的血液老化時(shí)鐘模型相比,該模型顯示出了更高的個(gè)體人群預(yù)測(cè)精度。通過(guò)使用美國(guó)人口樣本對(duì)該模型進(jìn)行校驗(yàn),證實(shí)了該模型具有優(yōu)良特性。研究結(jié)果表明,特定人群的老化模式和血液老化時(shí)鐘是全因死亡率的主要影響因素[16]。
大數(shù)據(jù)廣泛應(yīng)用于社會(huì)科學(xué)各領(lǐng)域,有效提升了社會(huì)政策制定者的科學(xué)決策水平。不過(guò),任何事物都有兩面性,在鼓勵(lì)社會(huì)科學(xué)家和社會(huì)政策制定者熱情擁抱大數(shù)據(jù)的同時(shí),我們亦要提防大數(shù)據(jù)自身的一些缺陷,以及它在人類社會(huì)生活中扮演的負(fù)面角色。下面,筆者將從批判性視角詳細(xì)闡釋大數(shù)據(jù)在社會(huì)治理領(lǐng)域應(yīng)用中很少被提及的另一層面相。
1.大數(shù)據(jù)與社會(huì)安全正義
大數(shù)據(jù)應(yīng)用于社會(huì)治理的一個(gè)重要方面是對(duì)違法越軌行為的監(jiān)督與監(jiān)控。相比傳統(tǒng)的犯罪調(diào)查方式,利用閉路電視、攝像頭、衛(wèi)星等技術(shù)手段實(shí)施精準(zhǔn)監(jiān)控的優(yōu)點(diǎn)不言而喻,例如數(shù)據(jù)全天候?qū)崟r(shí)傳播、360度無(wú)死角覆蓋、可以進(jìn)行長(zhǎng)時(shí)段的回溯與追蹤,從而提升了社會(huì)的整體治安水平和人民群眾的安全感和滿意度。美國(guó)社會(huì)學(xué)家Brayne對(duì)洛杉磯警察局的田野觀察和訪談表明,公共安全部門利用大數(shù)據(jù)對(duì)目標(biāo)人群實(shí)施監(jiān)控已變得相當(dāng)普遍,這種監(jiān)控?zé)o論在深度還是廣度上都遠(yuǎn)超傳統(tǒng)的監(jiān)控方式[2]。
在這一背景下,社會(huì)研究者通常關(guān)心的是,新的監(jiān)控方式究竟是否強(qiáng)化了原來(lái)的社會(huì)不平等?一種觀點(diǎn)認(rèn)為,大數(shù)據(jù)監(jiān)控能有效改善原來(lái)的社會(huì)不平等狀況,原因是:第一,它提供了精準(zhǔn)而完整的數(shù)據(jù)信息,可以糾正警察對(duì)弱勢(shì)群體的刻板印象與偏見(jiàn),減少對(duì)社區(qū)信任的破壞,維護(hù)司法公正,促進(jìn)社會(huì)進(jìn)步;第二,它提供了系統(tǒng)化的數(shù)據(jù)信息,可以用來(lái)監(jiān)督警察的違法行為,從而降低警察隨意執(zhí)法、選擇性執(zhí)法的機(jī)會(huì),保證執(zhí)法的透明性與可信性。
但亦有觀點(diǎn)認(rèn)為,某些時(shí)候大數(shù)據(jù)監(jiān)控反而會(huì)再造不平等。首先,大數(shù)據(jù)監(jiān)控通常是以數(shù)字來(lái)測(cè)量每個(gè)人的犯罪風(fēng)險(xiǎn),這樣的做法表面看起來(lái)非??陀^、公正,但實(shí)際上背后卻隱藏了人類的主觀偏好與判斷。一個(gè)人的犯罪風(fēng)險(xiǎn)得分越高,越可能隨時(shí)被警察盤問(wèn),而有被盤問(wèn)記錄又會(huì)進(jìn)一步增加他的犯罪風(fēng)險(xiǎn)得分,從而形成大數(shù)據(jù)預(yù)測(cè)犯罪概率的自我循環(huán),加重了犯罪嫌疑人被定罪的可能性。
其次,由多部門、多類型數(shù)據(jù)整合而成的大數(shù)據(jù)監(jiān)控模式,往往會(huì)產(chǎn)生巨大的威懾力,那些更看重個(gè)人隱私或謹(jǐn)防污名化的公民將對(duì)此類監(jiān)控機(jī)構(gòu)避而遠(yuǎn)之,以免留下記錄自己行為動(dòng)向的數(shù)字痕跡(digital trace)。例如,有過(guò)牢獄經(jīng)歷的人對(duì)此類監(jiān)控模式就異常敏感,他們?cè)诰歪t(yī)、從事金融活動(dòng)、接受教育、就業(yè)等方面往往如履薄冰,盡量避免自己的信息被收集和記錄到這一系統(tǒng)中,這在一定程度上惡化了此類群體與優(yōu)勢(shì)人群的不平等狀況。
客觀地說(shuō),大數(shù)據(jù)監(jiān)控中產(chǎn)生的社會(huì)不平等,主要源于人們對(duì)數(shù)字客觀性的盲目崇拜,以及大數(shù)據(jù)收集與分析過(guò)程中的歧視和偏見(jiàn)。大數(shù)據(jù)崇拜癥認(rèn)為凡是數(shù)據(jù)都是客觀的、無(wú)偏的,而實(shí)際上,數(shù)據(jù)的產(chǎn)生與分析過(guò)程往往是由人介入的,是主觀的。只有充分理解大數(shù)據(jù)收集與分析的每個(gè)環(huán)節(jié),才有可能認(rèn)清數(shù)字背后隱藏的偏誤及其來(lái)源,也才有可能更好地讓大數(shù)據(jù)服務(wù)于社會(huì)安全治理,實(shí)現(xiàn)社會(huì)安全正義。
2.大數(shù)據(jù)的脆弱性
大數(shù)據(jù)除了在社會(huì)安全治理方面的應(yīng)用存在一定的爭(zhēng)議之外,它自身也充滿了脆弱性和道德倫理風(fēng)險(xiǎn)[17]。首先,大數(shù)據(jù)并非全樣本,社會(huì)統(tǒng)計(jì)調(diào)查中所面臨的代表性問(wèn)題和概化問(wèn)題,大數(shù)據(jù)同樣不可避免。數(shù)據(jù)的量大并不能解決所有問(wèn)題。雖然大數(shù)據(jù)是對(duì)特定人群及其行為信息的普查式記錄,但這種記錄和人口普查還是有很大差別的。由于大數(shù)據(jù)缺乏明確的抽樣框,分析大數(shù)據(jù)時(shí)是無(wú)法計(jì)算出抽樣權(quán)重的,因此也就不能估計(jì)出統(tǒng)計(jì)推斷誤差的范圍,更不用說(shuō)有效甄別出哪些樣本或案例是代表性不足或是過(guò)度代表的。
大數(shù)據(jù)面臨的概化或一般化問(wèn)題主要表現(xiàn)在數(shù)據(jù)平臺(tái)的多樣性上。例如,不同社交平臺(tái)的運(yùn)行規(guī)則往往存在差異,用戶在不同平臺(tái)上如何互相關(guān)注、如何發(fā)布信息、如何評(píng)論與轉(zhuǎn)發(fā)等等,也會(huì)有所區(qū)別,甚至用戶群體自身的背景特征也會(huì)存在很大不同。依靠單一平臺(tái)產(chǎn)生的數(shù)據(jù)信息來(lái)研究社會(huì)問(wèn)題,其結(jié)論能否有效推廣到其他平臺(tái),這一點(diǎn)是存在質(zhì)疑的。
此外,人們往往同時(shí)使用若干平臺(tái),僅僅依賴單一平臺(tái)產(chǎn)生的數(shù)據(jù)信息能否完整捕捉人類行為特征模式,也是要打一個(gè)問(wèn)號(hào)的。例如,僅使用手機(jī)通訊數(shù)據(jù),如何能準(zhǔn)確觀測(cè)并展示用戶的情感特征呢?解決這一問(wèn)題的根本出路在于使用多平臺(tái)數(shù)據(jù)信息,進(jìn)行交叉驗(yàn)證與推斷,這也是未來(lái)大數(shù)據(jù)社會(huì)科學(xué)研究的一個(gè)重點(diǎn)。
其次,大數(shù)據(jù)的脆弱性還表現(xiàn)在數(shù)據(jù)產(chǎn)出過(guò)程的變動(dòng)不居上。產(chǎn)生大數(shù)據(jù)的平臺(tái)自身也會(huì)出錯(cuò),而這些錯(cuò)誤或偏差有時(shí)會(huì)被研究者誤認(rèn)為是用戶行為特征的變化,從而得出錯(cuò)誤的結(jié)論。此外,平臺(tái)自身的運(yùn)行規(guī)則也并非一成不變,而平臺(tái)用戶的行為總是會(huì)隨著平臺(tái)規(guī)則的改變而變化,反過(guò)來(lái),平臺(tái)用戶的一些偏好或習(xí)慣也會(huì)影響平臺(tái)規(guī)則的制定與修訂,平臺(tái)規(guī)則與用戶行為的這種交互影響進(jìn)一步增加了大數(shù)據(jù)的復(fù)雜性。社會(huì)研究者需要清晰把握大數(shù)據(jù)產(chǎn)出平臺(tái)的歷史演變與運(yùn)營(yíng)機(jī)制,才有可能準(zhǔn)確揭示出人類行為特征模式的細(xì)微變化。
最后,大數(shù)據(jù)的脆弱性還表現(xiàn)在對(duì)平臺(tái)用戶不切實(shí)際的理想假定上。大數(shù)據(jù)崇拜者通常認(rèn)為一個(gè)用戶對(duì)應(yīng)一個(gè)賬號(hào),用戶的行為能準(zhǔn)確完整地反映在各類大數(shù)據(jù)信息當(dāng)中,但實(shí)際情況往往是,很多平臺(tái)賬號(hào)背后并非全都是人類,有很多賬號(hào)其實(shí)是由機(jī)器人操控的,而它們很難被偵測(cè)到;有很多用戶往往注冊(cè)了不止一個(gè)賬號(hào),以此來(lái)掩飾自己的真實(shí)身份;更何況,不同用戶使用平臺(tái)的目的是不同的,有很多組織機(jī)構(gòu)的公眾賬號(hào)在平臺(tái)上的行為都包含了隱藏的目的。總之,單一的、一以貫之說(shuō)真話的理想型個(gè)人用戶是不存在的。
社會(huì)科學(xué)領(lǐng)域的大數(shù)據(jù)指的是那些對(duì)人類社會(huì)生活進(jìn)行了全面數(shù)字化記錄的信息資料。大數(shù)據(jù)的出現(xiàn)極大拓展了社會(huì)科學(xué)家觀察、理解、分析和預(yù)測(cè)人類行為的廣度與深度,從而提升了大數(shù)據(jù)分析成果應(yīng)用于社會(huì)政策領(lǐng)域的精準(zhǔn)性、科學(xué)性和有效性。
目前,在社會(huì)治理領(lǐng)域,大數(shù)據(jù)已被廣泛應(yīng)用于社會(huì)事務(wù)參與、人口遷移流動(dòng)、經(jīng)濟(jì)社會(huì)發(fā)展、老齡化與健康長(zhǎng)壽等議題,產(chǎn)生了一批高質(zhì)量的學(xué)術(shù)成果,并迅速轉(zhuǎn)化為各國(guó)科學(xué)制定社會(huì)政策的堅(jiān)實(shí)基礎(chǔ)。在這些成果中,有的是使用大數(shù)據(jù)檢驗(yàn)了一些過(guò)去難以檢驗(yàn)的理論觀點(diǎn),有的是通過(guò)分析大數(shù)據(jù)發(fā)現(xiàn)了一些新的社會(huì)規(guī)律,還有的則是直接使用多種類型的大數(shù)據(jù)指導(dǎo)經(jīng)濟(jì)社會(huì)發(fā)展、提升社會(huì)治理的現(xiàn)代化水平。
本文也提醒社會(huì)政策制定者一定要謹(jǐn)慎對(duì)待大數(shù)據(jù),包括數(shù)據(jù)的收集、存儲(chǔ)、分析、應(yīng)用等各個(gè)方面。首先,要防止大數(shù)據(jù)被濫用和誤用。公共安全部門利用大數(shù)據(jù)推動(dòng)司法正義和社會(huì)進(jìn)步是好事。但研究表明,使用大數(shù)據(jù)監(jiān)控人類社會(huì)也會(huì)塑造出新的不平等,原因是大數(shù)據(jù)背后隱藏了人類的主觀偏好,它并非像人們想象的那樣客觀公正無(wú)偏。其次,大數(shù)據(jù)自身也存在著脆弱性問(wèn)題,包括研究對(duì)象的過(guò)度代表或代表性不足,缺乏多平臺(tái)大數(shù)據(jù)的交叉檢驗(yàn),數(shù)據(jù)平臺(tái)自身的不穩(wěn)定性引致的數(shù)據(jù)變動(dòng),以及對(duì)平臺(tái)用戶過(guò)度理想化的假定等。大數(shù)據(jù)是發(fā)揮正面還是負(fù)面作用,完全取決于人類如何認(rèn)識(shí)并使用它。筆者建議未來(lái)社會(huì)治理領(lǐng)域的大數(shù)據(jù)研究應(yīng)該從以下六個(gè)方面進(jìn)行拓展與創(chuàng)新:
第一,把大數(shù)據(jù)和傳統(tǒng)調(diào)查數(shù)據(jù)有機(jī)結(jié)合起來(lái),以提升大數(shù)據(jù)應(yīng)用于社會(huì)治理領(lǐng)域的全面性和準(zhǔn)確性。大數(shù)據(jù)并非傳統(tǒng)社會(huì)調(diào)查數(shù)據(jù)的替代品,而應(yīng)與傳統(tǒng)數(shù)據(jù)資料相互補(bǔ)充、相互參證,共同推動(dòng)社會(huì)科學(xué)研究在理論框架、研究?jī)?nèi)容、研究方法、研究資料的整合與分析方面取得進(jìn)步,從而有利于科學(xué)精準(zhǔn)地制定相關(guān)社會(huì)政策。大數(shù)據(jù)的優(yōu)勢(shì)在于數(shù)據(jù)的豐富性和規(guī)模,而傳統(tǒng)調(diào)查數(shù)據(jù)的優(yōu)勢(shì)則是它的樣本代表性和測(cè)量相對(duì)準(zhǔn)確,當(dāng)使用各類數(shù)據(jù)來(lái)分析經(jīng)濟(jì)社會(huì)發(fā)展問(wèn)題、提供政策建議時(shí),如何能確立一些基本的原則,做到對(duì)兩種數(shù)據(jù)揚(yáng)長(zhǎng)避短、各取所長(zhǎng),是未來(lái)大數(shù)據(jù)社會(huì)治理研究急需解決的基礎(chǔ)性問(wèn)題。
第二,變革大數(shù)據(jù)收集的理念與方法,踐行以參與者為中心的社會(huì)治理理念。傳統(tǒng)數(shù)據(jù)(無(wú)論是調(diào)查數(shù)據(jù)還是訪談資料)的收集是以研究者為中心的(researcher-centered),大數(shù)據(jù)的收集則是以參與者為中心(participant-centered)。社會(huì)科學(xué)研究者需要轉(zhuǎn)變數(shù)據(jù)收集的理念,設(shè)計(jì)出更具吸引力的數(shù)據(jù)收集方法,因?yàn)檠芯繉?duì)象不再是近在咫尺的被訪者,數(shù)據(jù)的收集過(guò)程也并非是你問(wèn)我答、有來(lái)有往,大數(shù)據(jù)時(shí)代的社會(huì)科學(xué)研究對(duì)象已變成成千上萬(wàn)的互聯(lián)網(wǎng)用戶,他們隱藏在電子屏幕背后,只要他們輕輕觸動(dòng)一下指尖,研究者立刻就能獲得數(shù)以萬(wàn)計(jì)的信息資料。信息時(shí)代每個(gè)人的時(shí)間和注意力都是寶貴的,如何以參與者為中心,充分調(diào)動(dòng)他們參與項(xiàng)目研究的積極性,在整個(gè)數(shù)據(jù)收集過(guò)程中給普通用戶提供良好的體驗(yàn),是大數(shù)據(jù)時(shí)代需要反復(fù)揣摩的課題。
第三,創(chuàng)新大數(shù)據(jù)的類型化分析方法,從方法層面提升大數(shù)據(jù)應(yīng)用于社會(huì)治理領(lǐng)域的精準(zhǔn)度。大數(shù)據(jù)的規(guī)模通常極其龐大,如果不進(jìn)行恰當(dāng)?shù)臍w并與分類,很難從中發(fā)現(xiàn)具有一般科學(xué)理論意義的規(guī)律模式。例如,在互聯(lián)網(wǎng)公共事務(wù)參與研究中,面對(duì)幾百萬(wàn)微博用戶,研究者需要識(shí)別出哪些是信息發(fā)送方,哪些是接收方;哪些是意見(jiàn)領(lǐng)袖,他們發(fā)送或轉(zhuǎn)推信息的行為是否更具自主性和獨(dú)立性;哪些僅是邊緣跟隨者,他們的行為是否更具盲從性和隨意性;哪些是信息傳播的中介與橋梁,他們是否控制、篩選了新信息的流動(dòng)方向,等等。合理分類是進(jìn)行理論解釋與科學(xué)預(yù)測(cè)的基礎(chǔ),大數(shù)據(jù)分析必須高度重視信息分類問(wèn)題。
第四,關(guān)注不同來(lái)源大數(shù)據(jù)的比較分析問(wèn)題。以社交網(wǎng)絡(luò)大數(shù)據(jù)為例,不同文化背景下的社交網(wǎng)絡(luò)行為是否有差異?不同社交網(wǎng)絡(luò)平臺(tái)反映出的用戶行為是否有差異?在倫敦社區(qū)研究中,推特?cái)?shù)據(jù)顯示社交網(wǎng)絡(luò)并未加強(qiáng)本地居民的聯(lián)系,他們更多的是關(guān)注了一個(gè)公共部門小團(tuán)體,該結(jié)論是否適用于當(dāng)前我國(guó)居民的社交網(wǎng)絡(luò)行為?微信上建立的社區(qū)群是否強(qiáng)化了居民間的日常聯(lián)絡(luò)?這都需要研究者通過(guò)跨文化、跨平臺(tái)的比較才能得出可信的結(jié)論。
第五,關(guān)注大數(shù)據(jù)共享與分析的多學(xué)科合作問(wèn)題,以學(xué)科間合作促進(jìn)社會(huì)治理現(xiàn)代化水平的提升。以老齡學(xué)研究為例,無(wú)論是使用老年人的行為數(shù)據(jù),還是生理與醫(yī)學(xué)數(shù)據(jù),都需要社會(huì)科學(xué)家、生物科學(xué)家、醫(yī)藥專家等進(jìn)行跨學(xué)科的合作研究。不然,純粹分析基因大數(shù)據(jù)、生物醫(yī)學(xué)大數(shù)據(jù)是無(wú)法解釋外在社會(huì)環(huán)境因素對(duì)老化過(guò)程影響的,純粹分析社會(huì)環(huán)境因素對(duì)健康長(zhǎng)壽的影響也是有失偏頗的,重要的是建立社會(huì)科學(xué)與其他學(xué)科的長(zhǎng)效對(duì)話協(xié)作機(jī)制,從而推動(dòng)我國(guó)老齡化大數(shù)據(jù)研究的實(shí)質(zhì)進(jìn)步。
第六,要把道德倫理問(wèn)題置于大數(shù)據(jù)社會(huì)科學(xué)研究的中心,這是尤其需要提醒社會(huì)政策制定者注意的地方。傳統(tǒng)社會(huì)科學(xué)研究者對(duì)研究倫理問(wèn)題要么避而不談,要么輕描淡寫,大家形成的共識(shí)似乎是我們不否認(rèn)研究倫理的重要性,但實(shí)踐中卻認(rèn)為只要了解一下就好,沒(méi)必要過(guò)度深究。大數(shù)據(jù)時(shí)代,許多數(shù)據(jù)變得廉價(jià)甚至唾手可得,但這同時(shí)也意味著數(shù)據(jù)的大規(guī)模泄露、個(gè)人隱私的被侵犯變得易如反掌,其負(fù)面社會(huì)影響力不可小覷,直接影響現(xiàn)代社會(huì)治理的廣泛民意基礎(chǔ)。把研究倫理置于大數(shù)據(jù)社會(huì)治理研究的中心,既可以設(shè)計(jì)出一些限制研究者接觸個(gè)體數(shù)據(jù)、而只能使用匯總數(shù)據(jù)的規(guī)則,也可以建立大數(shù)據(jù)學(xué)術(shù)成果審查機(jī)構(gòu),該機(jī)構(gòu)的審核結(jié)論將成為相關(guān)成果是否公開(kāi)發(fā)表和應(yīng)用于社會(huì)治理實(shí)踐領(lǐng)域的重要依據(jù)。