韓俊俊
【 人物簡介 】
姜奇平,現(xiàn)任中國社會科學(xué)院信息化研究中心秘書長,《互聯(lián)網(wǎng)周刊》主編,同時擔(dān)任國務(wù)院國有資產(chǎn)監(jiān)督管理委員會第一屆國資監(jiān)管信息化專家組專家,中國信息經(jīng)濟(jì)學(xué)會常務(wù)理事,中國電子商務(wù)協(xié)會常務(wù)理事,數(shù)字論壇成員。
“大數(shù)據(jù)時代”是全球知名咨詢公司麥肯錫首先提出,進(jìn)入2012年后,“大數(shù)據(jù)”一詞被越來越多地提及。大家都在談?wù)摗按髷?shù)據(jù)”,對它的定義也越來越多,但對很多人來說,大數(shù)據(jù)并不是一個非常清晰的概念。為明晰大數(shù)據(jù)的內(nèi)涵,本刊有幸邀請到中國社會科學(xué)院信息化研究中心秘書長姜奇平教授,他為我們帶來關(guān)于大數(shù)據(jù)方面的最新見解,以及對大數(shù)據(jù)是什么、大數(shù)據(jù)時代給我們生活帶來哪些改變的探索。
不可思議的大數(shù)據(jù)時代
英國維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數(shù)據(jù)時代》是國外大數(shù)據(jù)系統(tǒng)研究的先河之作,書中提出大數(shù)據(jù)指不用隨機(jī)分析法(抽樣調(diào)查)這樣的捷徑,而采用所有數(shù)據(jù)進(jìn)行分析處理。但作為特指的大數(shù)據(jù),按EMC的界定,其中的“大”是指大型數(shù)據(jù)集,一般在10TB規(guī)模左右;多用戶把多個數(shù)據(jù)集放在一起,形成PB級的數(shù)據(jù)量;同時這些數(shù)據(jù)來自多種數(shù)據(jù)源,以實(shí)時、迭代的方式來實(shí)現(xiàn)。IBM把大數(shù)據(jù)概括成了三個V,即大量化(Volume)、多樣化(Variety)和快速化(Velocity)。大數(shù)據(jù)通常與Hadoop、NoSQL、數(shù)據(jù)分析與挖掘、數(shù)據(jù)倉庫、商業(yè)智能以及開源云計(jì)算架構(gòu)等諸多熱點(diǎn)話題聯(lián)系在一起。作為泛指的大數(shù)據(jù),則指向了定制化、差異化、個性化方向的競爭力。
姜奇平認(rèn)為,通俗地講,大數(shù)據(jù)就是對網(wǎng)上海量的文本、圖像、音頻和視頻數(shù)據(jù)進(jìn)行采集、分析、加工和利用。在這之前,有數(shù)據(jù)但達(dá)不到海量的規(guī)模,數(shù)據(jù)可以分析但主要是針對文本。他認(rèn)為,大數(shù)據(jù)并不像某些人說的,是云計(jì)算之后的又一浪,而就是云計(jì)算本身。因?yàn)樗鼈兌际菙?shù)據(jù)的大規(guī)模集聚與定制化分布的結(jié)合。他認(rèn)為這是一個人類新的分水嶺,由此要把農(nóng)業(yè)文明的分散化,與工業(yè)文明的集中化,在大數(shù)據(jù)中融為一體,集天地之精華,釋放出無窮的能量,達(dá)到信息時代的“光明頂”。
其實(shí)真正的數(shù)據(jù)時代是從2012年開始的,標(biāo)志性的區(qū)別就在于,以往的數(shù)據(jù)只是結(jié)構(gòu)化的數(shù)據(jù),是非個性化的數(shù)據(jù);而進(jìn)入2012年,非結(jié)構(gòu)化數(shù)據(jù)占有比例將達(dá)到互聯(lián)網(wǎng)整個數(shù)據(jù)量的75%以上,這意味著個性化數(shù)據(jù)時代的到來。
什么是大數(shù)據(jù)時代?為此,姜奇平形象的描述了未來大數(shù)據(jù)時代的一個場景,當(dāng)你走進(jìn)一家陌生的小咖啡館時,耳邊響起了只有你才熟悉的音樂旋律。技術(shù)實(shí)現(xiàn)并不難,咖啡館只要讀出你手機(jī)音樂下載記錄,通過數(shù)據(jù)分析,就可以定制播放。這就是大數(shù)據(jù)時代。
在真正的數(shù)據(jù)時代,網(wǎng)商將不再奔向數(shù)據(jù)趨同的淘寶商城,而將涌向提供個性化競爭力的AaaS(分析即服務(wù),analytics-as-a-service),撲向3V的懷抱。
淘寶目前每天活躍數(shù)據(jù)量已經(jīng)超過50TB,共有4億條產(chǎn)品訊息和2億多名注冊用戶在上面活動,每天超過4000萬人次訪問?!按髷?shù)據(jù)”的作用,就是把這些數(shù)據(jù)采集進(jìn)數(shù)據(jù)倉庫中,然后用分布式的技術(shù)框架(Hadoop),對非關(guān)系型數(shù)據(jù)進(jìn)行異質(zhì)性處理(NoSQL),通過數(shù)據(jù)分析與挖掘,發(fā)展一對一的商業(yè)智能,從中產(chǎn)生讓網(wǎng)商因小而美、不再打價格戰(zhàn)的企業(yè)和個人競爭力;讓中國產(chǎn)生不再依靠“中國制造”,而轉(zhuǎn)向“中國創(chuàng)造”的國家競爭力。
大數(shù)據(jù)的時代特征
姜奇平認(rèn)為當(dāng)前人們談?wù)摯髷?shù)據(jù),多是從技術(shù)角度觀察。從這個角度觀察大數(shù)據(jù),對技術(shù)人員來說是大數(shù)據(jù)的全部;但如果工商管理人員僅從技術(shù)角度看大數(shù)據(jù),就會把大數(shù)據(jù)看低,看成是工具性的東西。我們需要先從技術(shù)經(jīng)濟(jì)學(xué)角度,把大數(shù)據(jù)先從技術(shù)現(xiàn)象,轉(zhuǎn)化為經(jīng)濟(jì)現(xiàn)象,再理解它的經(jīng)濟(jì)社會意義。作為技術(shù)的大數(shù)據(jù),主要指對海量復(fù)雜數(shù)據(jù)進(jìn)行采集、加工和利用的技術(shù)。而作為生產(chǎn)力的大數(shù)據(jù),主要指智力工作者運(yùn)用數(shù)據(jù)技術(shù)處理數(shù)據(jù)以獲得智慧的能力,是一種高級信息生產(chǎn)力。為此,姜奇平從生產(chǎn)力、生產(chǎn)關(guān)系和生產(chǎn)方式的角度分析大數(shù)據(jù)的時代特征。
首先,大數(shù)據(jù)的時代特征表現(xiàn)在它的生產(chǎn)力特征上。而生產(chǎn)力包括勞動者、勞動對象、勞動資源和勞動目的四個要素。其中,掌握大數(shù)據(jù)的勞動者是智力工作者,他集勞動與資本于一身,是資本家;勞動對象是數(shù)據(jù),這些數(shù)據(jù)不僅是資源,而且是財(cái)富;勞動資源包括語義網(wǎng)等公共基礎(chǔ)設(shè)施上分享的開源軟件、Hadoop、NoSQL、數(shù)據(jù)分析與挖掘、數(shù)據(jù)倉庫、商業(yè)智能(BI)等技術(shù)條件;最后,從勞動目的看,從事大數(shù)據(jù)是為了“從中獲得知識和洞見以提升能力”,進(jìn)一步說,要洞見的是意義,要獲得的能力是智慧,有意義的數(shù)據(jù)是智慧,沒有意義的數(shù)據(jù)是垃圾。大數(shù)據(jù)要完成從客體的數(shù)據(jù)向主體的智慧的轉(zhuǎn)換。忘記這一點(diǎn)就會陷入為數(shù)據(jù)而數(shù)據(jù)。
其次,大數(shù)據(jù)的時代特征體現(xiàn)在它的生產(chǎn)關(guān)系特征上,表現(xiàn)在生產(chǎn)、交換、分配和消費(fèi)四個環(huán)節(jié)上。在生產(chǎn)上,分布式計(jì)算的大數(shù)據(jù),推動生產(chǎn)組織向去中心、扁平化轉(zhuǎn)變,向自組織、自協(xié)調(diào)方向演化,智能化的大數(shù)據(jù)將促進(jìn)勞動與資本的一體化,推動決策前移,并且可以提供平臺支持創(chuàng)造性的自主勞動(如DIY+3D打印的“創(chuàng)客”);在交換中,具有語義功能的智能網(wǎng)絡(luò)成為與現(xiàn)有市場互補(bǔ)的新組織形式,商品交換與包括情感在內(nèi)的信息交流在新的市場結(jié)構(gòu)中相互融合,用戶體驗(yàn)和意義滿足成為定價的重要因素,情境定價成為可能,依托數(shù)據(jù)分析可以實(shí)現(xiàn)一對一精準(zhǔn)營銷和“人單合一”;在分配上,在數(shù)據(jù)財(cái)富歸屬與利用的平衡中,形成以“使用所有權(quán)”(access over ownership)為特征的分享型經(jīng)濟(jì)(Sharing Economy),在物質(zhì)財(cái)富極大豐富基礎(chǔ)上,逐步實(shí)現(xiàn)以自由看待發(fā)展;在消費(fèi)上,在大數(shù)據(jù)引導(dǎo)下,出現(xiàn)產(chǎn)消逆轉(zhuǎn)(C2B)和產(chǎn)消合一趨勢,人們在滿足生存發(fā)展需求基礎(chǔ)上,日益產(chǎn)生通過自主勞動滿足的自我實(shí)現(xiàn)需求。
最后,大數(shù)據(jù)的時代特征特別體現(xiàn)在它的生產(chǎn)方式特征上。不同時代,人相對于勞動對象的作用方式不同,生產(chǎn)的社會目的也不同,形成農(nóng)業(yè)生產(chǎn)方式、工業(yè)生產(chǎn)方式與信息生產(chǎn)方式。大數(shù)據(jù)推動著信息生產(chǎn)方式的形成。endprint
簡言之,農(nóng)業(yè)時代的生產(chǎn)力以土地為中介,分散地從對象中解析出有助于滿足人的溫飽需求的功能;工業(yè)時代的生產(chǎn)力以貨幣為中介,集中地從對象中解析出有助于滿足人的社會發(fā)展需求的價值;信息時代的生產(chǎn)力以數(shù)據(jù)為中介,集中與分散結(jié)合地從對象中解析出有助于實(shí)現(xiàn)生產(chǎn)目的的意義。功能、價值與意義的關(guān)系,在于前者為后者的基礎(chǔ),后者有條件地決定前者。
姜奇平認(rèn)為,對人均收入5000美元以上的社會來說,大數(shù)據(jù)有助于在全社會水平專業(yè)化地提高以意義滿足(所謂“滿意”)為核心的智慧水平,推動發(fā)展方式轉(zhuǎn)變,實(shí)現(xiàn)經(jīng)濟(jì)和社會轉(zhuǎn)型,在提高GDP水平(功能與價值水平)的同時,提高社會幸福水平(意義水平)。
發(fā)展大數(shù)據(jù)的戰(zhàn)略意義
姜奇平認(rèn)為,大數(shù)據(jù)的發(fā)展會深刻改變我國社會生產(chǎn)力狀況,在此基礎(chǔ)上對社會生產(chǎn)關(guān)系及其相聯(lián)系的經(jīng)濟(jì)運(yùn)行機(jī)制產(chǎn)生影響,對推進(jìn)中國新四化建設(shè),提高國家競爭力具有戰(zhàn)略意義。
托夫勒在1980年《第三次浪潮》中的一個斷言,準(zhǔn)確刻畫到大數(shù)據(jù)的時代特征:“如果說IBM的主機(jī)拉開了信息化革命的大幕,那么‘大數(shù)據(jù)則是第三次浪潮的華彩樂章”??梢哉J(rèn)為,大數(shù)據(jù)是信息時代發(fā)展到“華彩樂章”階段上的先進(jìn)生產(chǎn)力和先進(jìn)生產(chǎn)方式的代表。
我們需要從社會生產(chǎn)力引起生產(chǎn)方式變革高度,充分認(rèn)識大數(shù)據(jù)對提高國家競爭力的戰(zhàn)略價值。實(shí)物的積累、貨幣的積累,曾經(jīng)成為過去時代國力的標(biāo)志。在信息時代,數(shù)據(jù)的積累、加工和利用能力將成為國力的新標(biāo)志。對于一個國家來說,發(fā)展方式轉(zhuǎn)變只有跟上生產(chǎn)方式轉(zhuǎn)變的時代步伐,才能保證在更高水平的現(xiàn)代化競爭中不落伍、不挨打。而對于處在第二次浪潮與第三次浪潮之間的中國來說,大數(shù)據(jù)發(fā)展具有戰(zhàn)略緊迫性。
從國際上看,發(fā)達(dá)國家已進(jìn)入信息時代,大數(shù)據(jù)的發(fā)展意味著社會生產(chǎn)力水平質(zhì)的提升。按照信息時代的現(xiàn)代化標(biāo)準(zhǔn),中國在社會生產(chǎn)力上存在與美國等發(fā)達(dá)國家拉大距離,陷入數(shù)據(jù)鴻溝的現(xiàn)實(shí)危險。雖然中國的GDP將再次回到世界第一,但應(yīng)清醒認(rèn)識到,GDP與社會生產(chǎn)力水平不可混為一談。清朝一直到1820年,GDP仍是世界第一,但社會生產(chǎn)力水平卻與英國相差一代,主要就差在生產(chǎn)方式的時代落差上。如果中國不能在大數(shù)據(jù)時代拉近與各國社會生產(chǎn)力發(fā)展水平的距離,仍然有可能落后挨打。
從國內(nèi)看,中國新四化建設(shè)正處在從“工業(yè)化不斷加快”到“工業(yè)化基本實(shí)現(xiàn)”的轉(zhuǎn)變中,同時要完成全面提高信息化水平的歷史任務(wù)。與發(fā)達(dá)國家不同,中國存在要同時發(fā)展工業(yè)時代的生產(chǎn)力與信息時代生產(chǎn)力的雙重任務(wù)。上個世紀(jì)50年代,中國曾面對同樣的形勢,要同時發(fā)展農(nóng)業(yè)時代和工業(yè)時代兩種生產(chǎn)力,那時提出“工業(yè)為主導(dǎo)、農(nóng)業(yè)為基礎(chǔ)”的正確方針,促進(jìn)了社會生產(chǎn)力的跨越式發(fā)展。歷史經(jīng)驗(yàn)具有啟示借鑒意義。中國的和平發(fā)展不可能建立在低水平社會生產(chǎn)力體系之上,要認(rèn)清發(fā)展以大數(shù)據(jù)為代表的信息生產(chǎn)力的緊迫形勢,從頂層建立大數(shù)據(jù)的國家戰(zhàn)略,使我國社會生產(chǎn)力狀況適應(yīng)世界民族叢林競爭所要求的新的現(xiàn)代化水平,在此基礎(chǔ)上對社會生產(chǎn)關(guān)系及其相聯(lián)系的經(jīng)濟(jì)運(yùn)行機(jī)制進(jìn)行改革。堅(jiān)持信息化帶動工業(yè)化,工業(yè)化促進(jìn)信息化,實(shí)現(xiàn)高水平現(xiàn)代化,才能充分保證中國的國際競爭力。
大數(shù)據(jù)給中國發(fā)展帶來新的機(jī)遇。抓住生產(chǎn)方式轉(zhuǎn)變這一關(guān)鍵,才能解決發(fā)展方式轉(zhuǎn)變的深層次矛盾。面向未來,大數(shù)據(jù)將激發(fā)巨大的內(nèi)需增量,建設(shè)比城市現(xiàn)代化水平更高的智慧城鄉(xiāng),密切政府和民眾的聯(lián)系,促進(jìn)民主與社會進(jìn)步。大數(shù)據(jù)產(chǎn)業(yè)將形成新的增長點(diǎn),數(shù)據(jù)業(yè)務(wù)主營化帶來各行各業(yè)轉(zhuǎn)型升級。我們相信,借大數(shù)據(jù)的東風(fēng),用信息生產(chǎn)力與先進(jìn)生產(chǎn)方式帶動發(fā)展方式和經(jīng)濟(jì)運(yùn)行機(jī)制的轉(zhuǎn)變,可以為中國帶來數(shù)字紅利,提高新四化建設(shè)的現(xiàn)代化水平。
姜奇平堅(jiān)信,大數(shù)據(jù)是未來引領(lǐng)性的先進(jìn)技術(shù),它在信息技術(shù)中的地位,好比兩彈一星在各種技術(shù)中的地位,是高科技的制高點(diǎn),關(guān)系到信息強(qiáng)國的位勢,值得國家下大力氣推動。在大數(shù)據(jù)上弱,制腦權(quán)就會全面受制于人,國將不國。斯諾登事件暴露出各國在信息安全上面臨的嚴(yán)峻形勢,信息的全面收集、整理、分析和深度利用將成為未來國際競爭的制高點(diǎn),關(guān)系到網(wǎng)絡(luò)安全和信息化的全局,關(guān)系綜合國力。沒有大數(shù)據(jù)就沒有信息化,沒有信息化就沒有現(xiàn)代化。萬萬不可掉以輕心,落后就會再次挨打。endprint