国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)基礎(chǔ)上的社會(huì)認(rèn)知

2013-01-28 05:02:18
關(guān)鍵詞:個(gè)體信息研究

徐 磊

(北京理工大學(xué) 軟件學(xué)院,北京 100081)

0 引 言

分析過社會(huì)科學(xué)研究方法的人都能夠理解,對人的社會(huì)行為特征及其交互關(guān)系的研究,始終被雙重似乎無解的關(guān)系所困擾:(1)具有自主意識(shí)的人,其行為與意識(shí)之間究竟如何關(guān)聯(lián)?對此問題進(jìn)行細(xì)分,會(huì)引申出一系列更加復(fù)雜的問題,例如:人的意識(shí)取決于哪些因素?人的特性與其意識(shí)特征之間是什么關(guān)系?人際之間的互動(dòng)又如何影響和改變?nèi)说囊庾R(shí)取向等等?截至目前,對上述關(guān)系的認(rèn)知,基本上是一些含糊其詞的假設(shè)。(2)同樣,有差異的個(gè)體組成了錯(cuò)綜復(fù)雜的社會(huì),不同的個(gè)體在社會(huì)結(jié)構(gòu)和社會(huì)運(yùn)行中又發(fā)揮著不同的作用,那么如何描述這些關(guān)系呢?細(xì)分之下,這也是一個(gè)問題系列:個(gè)體關(guān)系及其作用權(quán)重如何分布?宏觀的資源配置條件和各種顯性及隱性的制度和規(guī)則又如何作用于不同的社會(huì)個(gè)體?社會(huì)的整體特征與個(gè)體的行為和關(guān)系之間究竟怎樣關(guān)聯(lián),這種關(guān)聯(lián)如何變化等等?這幾乎是天書一樣的謎語。

因此,從100 多年前孔德構(gòu)造社會(huì)物理學(xué)開始,學(xué)者們一直試圖尋求社會(huì)科學(xué)研究方法的突破,以便破解上述謎語。

然而,無論是社會(huì)物理學(xué),還是此后統(tǒng)計(jì)理論、系統(tǒng)理論、復(fù)雜性科學(xué)的進(jìn)展,除了使社會(huì)科學(xué)的概念元素更為豐富以外,落實(shí)到具體問題的研究過程中,人們所得到的依然是平均的、模糊的答案。究其原因,人們也是心知肚明,在借用自然科學(xué)方法解讀社會(huì)問題時(shí),不得不基于簡單假設(shè),界定意識(shí)對行為的作用,不得不將社會(huì)對象同質(zhì)化,不得不將復(fù)雜的非線性的社會(huì)關(guān)系簡化為線性穩(wěn)定的關(guān)系。之所以如此,是因?yàn)槿藗儫o從獲取刻畫上述關(guān)系的巨量數(shù)據(jù),即使獲取數(shù)據(jù),人們也無從處理,解讀并從中挖掘可信的結(jié)構(gòu)關(guān)系。

進(jìn)入21 世紀(jì),傳感器網(wǎng)絡(luò)、物聯(lián)網(wǎng)和社交媒體的推進(jìn),極大地豐富了有關(guān)社會(huì)形態(tài)的數(shù)據(jù)來源;Hadoop 等大數(shù)據(jù)計(jì)算軟件逐步成熟和應(yīng)用,標(biāo)志著人類獲取,處理并應(yīng)用數(shù)據(jù)的能力得到了實(shí)質(zhì)性的提升,許多在小數(shù)據(jù)背景下無從理解的社會(huì)問題,在大數(shù)據(jù)條件下變得似乎有解。于是,有人驚呼:大數(shù)據(jù)時(shí)代來臨了[1]。海量、異構(gòu)和分散的大數(shù)據(jù)正在顯現(xiàn)其價(jià)值,社會(huì)科學(xué)能夠?qū)Υ思挠杵谕麊?

1 社會(huì)科學(xué)的問題是大數(shù)據(jù)的問題

目前,人們公認(rèn)大數(shù)據(jù)研究的進(jìn)展,至少與三個(gè)科學(xué)領(lǐng)域的發(fā)展密切相關(guān):①天文觀測,目前獲取信息量的速率至少在1015bit/周的數(shù)量級;②粒子物理,高能粒子加速器具有109張圖片/秒的信息量;③社交媒體,僅僅短信的數(shù)量,也在108~109條/天的數(shù)量級。此外,分子生物學(xué)不但試圖破解大分子的原子構(gòu)成,而且期望刻畫分子長鏈上原子分布的拓?fù)浣Y(jié)構(gòu)及其功能,這同樣需要大數(shù)據(jù)的支持。

由此而言,大數(shù)據(jù)的問題和相應(yīng)數(shù)據(jù)獲取、集成、計(jì)算和存儲(chǔ)的技術(shù)進(jìn)展,已經(jīng)不是今天才有的事情,正是上述研究領(lǐng)域的積累,展現(xiàn)了大數(shù)據(jù)條件下科學(xué)研究的一些新特征:(1)當(dāng)數(shù)據(jù)的規(guī)模達(dá)到一定閾值之后,數(shù)據(jù)自會(huì)發(fā)聲,并且涌現(xiàn)出在小數(shù)據(jù)條件下無從顯現(xiàn)的性質(zhì);(2)因果關(guān)系的偏好,可能是小數(shù)據(jù)條件下人們認(rèn)知世界不得不選擇的一種簡化思維的研究模式,大數(shù)據(jù)時(shí)代,與空間分布和時(shí)間延續(xù)結(jié)合的關(guān)聯(lián)關(guān)系,可能比傳統(tǒng)的因果關(guān)系,更精準(zhǔn)地解讀世界;(3)對數(shù)據(jù)問題而言,傳統(tǒng)的自然科學(xué)與社會(huì)科學(xué)的劃界,可能不再具有實(shí)質(zhì)的意義,只要從復(fù)雜的關(guān)系或復(fù)雜的網(wǎng)絡(luò)中能夠獲取數(shù)據(jù),技術(shù)上的處理不再需要更多關(guān)于對象特性的假設(shè)前提。

僅僅憑借大數(shù)據(jù)研究的上述特征,人們就有足夠的理由期待,大數(shù)據(jù)的研究范式,可以給社會(huì)認(rèn)知帶來根本性的變化。

引言提到社會(huì)科學(xué)研究的兩大疑惑,一是自主意識(shí)的問題,在大數(shù)據(jù)的視野下,意識(shí)的問題不再無從解析,腦科學(xué)的研究表明,人類的意識(shí)活動(dòng)與大腦皮層1011數(shù)量級的神經(jīng)元及其1015數(shù)量級的神經(jīng)元鏈接密切相關(guān),神經(jīng)元經(jīng)濟(jì)學(xué)就是由此角度剖析人類行為特征的范例。關(guān)鍵在于,人們能否或如何有效獲取與此相關(guān)的大數(shù)據(jù)。目前,腦神經(jīng)元分布及其功能特征的認(rèn)知科學(xué)研究,正在通過fMRI、PE 等探測技術(shù),試圖獲取神經(jīng)元網(wǎng)絡(luò)的大數(shù)據(jù)[2]。二是個(gè)體之間的復(fù)雜關(guān)系及宏觀參量對個(gè)體行為的動(dòng)態(tài)影響,同樣呈現(xiàn)動(dòng)態(tài)復(fù)雜網(wǎng)絡(luò)的特征,如果能夠獲取社會(huì)網(wǎng)絡(luò)節(jié)點(diǎn)之間的關(guān)聯(lián)關(guān)系、作用權(quán)重、影響傳播和網(wǎng)絡(luò)進(jìn)化的相關(guān)數(shù)據(jù),解讀這類問題也不是無從期待[3]。

關(guān)鍵是,傳統(tǒng)的技術(shù)條件只能使人們獲得小樣本、靜態(tài)的個(gè)體或社會(huì)關(guān)系的數(shù)據(jù),不得不簡化社會(huì)研究對象的特征,人們更多地依賴假設(shè)、直覺和經(jīng)驗(yàn)解釋社會(huì)問題,其準(zhǔn)確性和可信度自然大打折扣。

因此,有人認(rèn)為基于大數(shù)據(jù)的社會(huì)研究,是一種新的研究范式,它代表著全新的研究視野和理論基礎(chǔ),依據(jù)截然不同的操作方法,它將重組探索世界的學(xué)科分布,從而成為人類繼定性研究、定量研究和計(jì)算機(jī)仿真研究之后的第四種探索世界的研究范式[4]。

2 解讀社會(huì)問題的大數(shù)據(jù)類型

既然解讀社會(huì)問題需要規(guī)模、差異性、產(chǎn)生速率和內(nèi)涵價(jià)值全然不同的大數(shù)據(jù),那么人為操作的有限樣本選取的小數(shù)據(jù)獲取模式,顯然不足為據(jù)。剖析社會(huì)問題的大數(shù)據(jù)可能的來源在哪里呢?

如果暫時(shí)擱置關(guān)于數(shù)據(jù)保護(hù)和系統(tǒng)分界的各種制度限制條件,如隱私保護(hù),商業(yè)數(shù)據(jù)保密等,目前或不太遠(yuǎn)的將來,僅僅討論在技術(shù)上可行的大數(shù)據(jù)來源有以下幾種:

(1)交互數(shù)據(jù)。基于網(wǎng)絡(luò)的社交媒體和基于電子信息的各類交易平臺(tái),顯然能夠產(chǎn)生反映社會(huì)個(gè)體交往和交易的實(shí)時(shí)數(shù)據(jù),目前,網(wǎng)民互動(dòng)、網(wǎng)購及其金融業(yè)務(wù)的數(shù)據(jù)信息量應(yīng)當(dāng)不少于1012bit/天的規(guī)模,解析這些數(shù)據(jù),不但能夠反映個(gè)體之間的關(guān)系及其關(guān)系權(quán)重和發(fā)生頻度,還能夠反映個(gè)體間資產(chǎn)的分布及其流動(dòng)信息,此類信息,顯然能夠直接集成社會(huì)經(jīng)濟(jì)、政治和文化等宏觀屬性的信息。數(shù)據(jù)發(fā)聲不是虛言。

(2)內(nèi)容數(shù)據(jù)。其實(shí)在網(wǎng)絡(luò)數(shù)據(jù)中心,網(wǎng)民瀏覽網(wǎng)頁的信息:如網(wǎng)頁內(nèi)容,訪問頻度、時(shí)長及其時(shí)間分布等,通過語義分析或時(shí)頻結(jié)構(gòu)分析,顯然可以獲取其IP 地址擁有者知識(shí)偏好、起居特征、閱讀習(xí)慣、文化品位等信息。如果僅從技術(shù)角度講,通話內(nèi)容,以及QQ、郵件和通話的內(nèi)容數(shù)據(jù),反映個(gè)性特征當(dāng)然更為直接,只是其法律障礙更大。隨著歷史的推進(jìn),人類隱私的界定和公開信息的邊界也在不斷變化。大數(shù)據(jù)時(shí)代,不管人們愿意不愿意,個(gè)體的信息狀態(tài)實(shí)際上更為透明,為了更為便捷和精準(zhǔn)的互動(dòng),個(gè)體實(shí)際上需要在虛擬或真實(shí)空間中,有效標(biāo)識(shí)其性格特征、消費(fèi)偏好、價(jià)值取向、文化品位等信息,個(gè)體信息未必都會(huì)劃入隱私范疇,其中一部分信息恰恰是需要彰顯的個(gè)性。因此,內(nèi)容數(shù)據(jù)在何種條件下能夠轉(zhuǎn)化為識(shí)別個(gè)體的信息,以及其相應(yīng)的應(yīng)用方式,本身也會(huì)成為有意思的探討話題。

(3)時(shí)空數(shù)據(jù)。手機(jī)作為移動(dòng)信息網(wǎng)絡(luò)的終端,不僅提供了隨時(shí)、隨地、隨身交互信息和推送信息服務(wù)的界面,它還能夠在時(shí)間軸線上標(biāo)識(shí)手機(jī)擁有者空間位移的變化軌跡。實(shí)際上,分布各處的傳感器同樣可以記錄時(shí)空數(shù)據(jù)。如果這類數(shù)據(jù)與前述的交互數(shù)據(jù)和內(nèi)容數(shù)據(jù)連用,人們可以挖掘出個(gè)體和群體特性極為精致的信息和知識(shí)。試想,如果今后人們可以向網(wǎng)絡(luò)數(shù)據(jù)中心,定制自己在一個(gè)時(shí)間周期中(月度、季度或年度)的信息報(bào)告,其中詳盡統(tǒng)計(jì)和分析了個(gè)體社會(huì)交往的結(jié)構(gòu)、對象特征、時(shí)間頻度,以及空間軌跡等信息,它就有可能比個(gè)體自我分析更精確地反映其行為特點(diǎn),誰能擔(dān)保未來人類在自我認(rèn)知的過程中沒有這類信息服務(wù)的需求呢?關(guān)鍵是,在大數(shù)據(jù)時(shí)代,能夠并行地為億萬個(gè)體和群體提供這種信息服務(wù),其模式和結(jié)果現(xiàn)階段實(shí)在難以想象和估量。當(dāng)然,不可忽視的是,如果這類信息只為少數(shù)社會(huì)機(jī)構(gòu)或個(gè)人所掌握,那一定是可怕的老大哥統(tǒng)治世界的模式;相反,數(shù)據(jù)公開、信息透明、相互確認(rèn)和選擇,個(gè)體或群體之間就能夠衍生出更為有效、豐富的盈利或公益性的交往模式,人類的才智和財(cái)富就能夠形成更多樣化的組合結(jié)構(gòu)和進(jìn)化路徑[5]。

(4)分層互動(dòng)數(shù)據(jù)。其實(shí),人類社會(huì)的變化及特性,是其個(gè)體、群體、社會(huì)及其環(huán)境等不同系統(tǒng)層面之間復(fù)雜互動(dòng)的涌現(xiàn)性質(zhì),理解其性質(zhì)需要不同層面大數(shù)據(jù)的支持。第一個(gè)層面的大數(shù)據(jù),是個(gè)體的微觀信息,這種信息與個(gè)體心理和生理稟賦及其神經(jīng)元網(wǎng)絡(luò)的信息流動(dòng)和功能分布有關(guān),還與DNA基因網(wǎng)絡(luò)和蛋白質(zhì)分子結(jié)構(gòu)相關(guān),人類今天或不太遠(yuǎn)的未來,一定可以獲取和分析這類大數(shù)據(jù)。第二個(gè)層面的大數(shù)據(jù),是前面已經(jīng)分析過的三種數(shù)據(jù),它可以呈現(xiàn)個(gè)體、群體及人類社會(huì)的特征及變化方式。第三個(gè)層面的大數(shù)據(jù),來自自然和工程系統(tǒng)以及它們與社會(huì)系統(tǒng)的關(guān)聯(lián),它包括但不限于物質(zhì)環(huán)境系統(tǒng)、生態(tài)系統(tǒng)、物流系統(tǒng)等,環(huán)境監(jiān)測網(wǎng)絡(luò)、物聯(lián)網(wǎng)實(shí)際上就是獲取、處理和應(yīng)用相關(guān)大數(shù)據(jù)的平臺(tái)。在今天,不同層面的大數(shù)據(jù),尚需要不同專業(yè)的分析架構(gòu),不同層面數(shù)據(jù)的關(guān)聯(lián)目前尚不清晰。但是,也許人們不僅可以處理同一層面的數(shù)據(jù),也能夠處理分層間交互的數(shù)據(jù),從而揭示分層交互的機(jī)制和原理。至此,社會(huì)科學(xué)有可能與自然科學(xué)、工程科學(xué)真正地融為一體。這是后話。

(5)進(jìn)化數(shù)據(jù)。上述各類數(shù)據(jù)按時(shí)間序列聚類、存儲(chǔ)和分析,將得到社會(huì)進(jìn)化演變的動(dòng)態(tài)信息,人們對歷史的呈述,將不再是直覺假設(shè)或邏輯推理,而是數(shù)據(jù)呈現(xiàn)的歷史進(jìn)程,這也是呈現(xiàn)歷史最為直接的方式。實(shí)際上,基于上述大數(shù)據(jù),人們還能夠?qū)ι鐣?huì)個(gè)體、群體乃至社會(huì)整體進(jìn)行復(fù)雜程度不同的建模,模型是粒度不同的自適應(yīng)主體的集合,彼此間受制于博弈的或合作的規(guī)則,受制于制度環(huán)境和自然環(huán)境的約束條件,他們根據(jù)博弈策略或價(jià)值偏好,選擇交互作用的方式,這種模型同樣可以自演繹,它可能成為真實(shí)社會(huì)系統(tǒng)的虛擬的平行系統(tǒng),如果人們不斷用實(shí)際系統(tǒng)的數(shù)據(jù)校正虛擬系統(tǒng)的行為規(guī)則和特性假設(shè),平行系統(tǒng)之間就能夠形成協(xié)同進(jìn)化的關(guān)系,虛擬系統(tǒng)的可信度和仿真性就能夠不斷升級,以致能夠在一定周期內(nèi)展現(xiàn)未來變化的特性或趨勢,至少它可以提前展示未來變化的可能空間[6]。在大數(shù)據(jù)時(shí)代,向未來學(xué)習(xí)的可能機(jī)會(huì)是開放的。

總之,人們在技術(shù)上可以預(yù)期的大數(shù)據(jù),將根本改變?nèi)祟惿鐣?huì)認(rèn)知的研究范式。

3 大數(shù)據(jù)及其社會(huì)認(rèn)知的展望

如前所述,無論從技術(shù)角度還是制度安排的角度講,基于大數(shù)據(jù)獲取可靠社會(huì)認(rèn)知的努力都還處于嘗試性階段,目前人們用于解析社會(huì)的數(shù)據(jù)規(guī)模和處理速率,獲取和應(yīng)用大數(shù)據(jù)的制度安排和文化認(rèn)同程度,數(shù)據(jù)層面和樣本范圍等,都還有極大的拓展空間。

目前,人類單位時(shí)間信息處理速率在Pb(1015bit/s)的數(shù)量級,按照摩爾定律2020 年會(huì)升級到Zb(1021bit/s)數(shù)量級,相對不遠(yuǎn)的未來,今天所謂的大數(shù)據(jù)也就是過渡中的小數(shù)據(jù)。人們?nèi)绻粦岩蓴?shù)據(jù)規(guī)模的躍遷會(huì)帶來社會(huì)解析意義的質(zhì)變,可以預(yù)期未來的大數(shù)據(jù)將展現(xiàn)更豐富的社會(huì)認(rèn)知。

在實(shí)際操作中,由于制度的安排和文化認(rèn)知方式的限制,今天的大數(shù)據(jù)分割在不同系統(tǒng)之中,應(yīng)用數(shù)據(jù)附加了許多限制條件,數(shù)據(jù)公開、流動(dòng)和分享,還必須跨越很多障礙。有些擔(dān)憂是可以理解的,比如通過控制數(shù)據(jù)進(jìn)而控制他人,進(jìn)而形成新的社會(huì)專權(quán)模式或損人利己的欺詐模式。數(shù)據(jù)公開,平等分享,契約規(guī)制能否解決問題,尚需認(rèn)真研究。

由于技術(shù)性或制度性的限制,目前人們獲取社會(huì)認(rèn)知的大數(shù)據(jù)還僅僅限于傳感器、通訊、網(wǎng)絡(luò)和交易等有限的窗口,對個(gè)體心理、生理和神經(jīng)系統(tǒng)的探索,還在實(shí)驗(yàn)室階段,數(shù)據(jù)獲取受到諸多限制。進(jìn)化積累的數(shù)據(jù)更是剛剛起步,在時(shí)間軸線上,還顯示不出跌宕起伏的社會(huì)歷史變化形態(tài)。

4 結(jié) 語

可以預(yù)期,由于處理異構(gòu)大數(shù)據(jù)的技術(shù)手段的通用性,未來社會(huì)科學(xué)、自然科學(xué)的界線將會(huì)淡化,并統(tǒng)一表現(xiàn)為復(fù)雜巨系統(tǒng)的認(rèn)知問題。對此,即使回到社會(huì)物理學(xué)最初構(gòu)想的軌跡中,人們也會(huì)發(fā)現(xiàn),基于網(wǎng)絡(luò)科學(xué)和大數(shù)據(jù)應(yīng)用,社會(huì)認(rèn)知的基礎(chǔ)已經(jīng)全然不同,巴拉巴西關(guān)于無標(biāo)度網(wǎng)絡(luò)的冪律分布[7]和歷史變化的爆發(fā)模式[8],給出了認(rèn)知社會(huì)全然不同的時(shí)空架構(gòu)。在這個(gè)架構(gòu)中,社會(huì)行為及其社會(huì)關(guān)系變化的大數(shù)據(jù)以及據(jù)此展現(xiàn)的進(jìn)化過程,就是復(fù)雜巨系統(tǒng)的的典型問題。屆時(shí),糾結(jié)了100 多年的社會(huì)科學(xué)研究方法的問題,將徹底歸并到更大的復(fù)雜系統(tǒng)認(rèn)知的問題集合中,這種學(xué)科交融會(huì)產(chǎn)生什么結(jié)果,人們只能拭目以待。

[1]V M 舍恩伯格.大數(shù)據(jù)時(shí)代[M].杭州:浙江人民出版社,2012.

[2]R M 哈尼什.心智、大腦和計(jì)算機(jī):認(rèn)知科學(xué)創(chuàng)歷史導(dǎo)論[M].杭州:浙江人民出版社,2010.

[3]TED G LEWIS.網(wǎng)絡(luò)科學(xué)原理與應(yīng)用[M].北京:機(jī)械工業(yè)出版社,2011.

[4] TONY HEY,STEWART TANSLEY,KRISTIN TOLLE.THE Fourth Paradigm:Data-Intensive Scientific Discovery[M]. REDMOND Washington,2009.

[5]涂子沛.大數(shù)據(jù):正在到來的數(shù)據(jù)革命[M]. 南寧:廣西師范大學(xué)出版社,2012.

[6]李國杰.大數(shù)據(jù)研究的科學(xué)價(jià)值[J].中國計(jì)算機(jī)學(xué)會(huì)通訊,2012,9(8):8-15.

[7]艾伯特-拉斯洛 巴拉巴西. 鏈接:網(wǎng)絡(luò)新科學(xué)[M].長沙:湖南科技出版社,2007.

[8]艾伯特-拉斯洛 巴拉巴西.爆發(fā)[M].北京:中國人民大學(xué)出版社,2012.

猜你喜歡
個(gè)體信息研究
FMS與YBT相關(guān)性的實(shí)證研究
遼代千人邑研究述論
視錯(cuò)覺在平面設(shè)計(jì)中的應(yīng)用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
關(guān)注個(gè)體防護(hù)裝備
EMA伺服控制系統(tǒng)研究
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
個(gè)體反思機(jī)制的缺失與救贖
How Cats See the World
展會(huì)信息
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
怀仁县| 澳门| 广东省| 富源县| 衡阳县| 兴隆县| 凤翔县| 额尔古纳市| 姜堰市| 吉安市| 得荣县| 芒康县| 鹿泉市| 广宗县| 延庆县| 积石山| 秦皇岛市| 林西县| 邢台市| 吉木萨尔县| 秀山| 毕节市| 鹤山市| 沾化县| 北辰区| 渝中区| 蓬莱市| 鄱阳县| 军事| 吉水县| 五家渠市| 青阳县| 广宁县| 米脂县| 西城区| 翼城县| 张家口市| 永春县| 永安市| 桃园市| 南乐县|