李飛云
中國(guó)科學(xué)院院士、上海交大副校長(zhǎng)梅宏月前在杭州西博會(huì)分論壇上表示,大數(shù)據(jù)對(duì)時(shí)代擁有重大的意義和價(jià)值,大數(shù)據(jù)產(chǎn)業(yè)能帶動(dòng)GDP增長(zhǎng)2-4%,然而現(xiàn)階段,大數(shù)據(jù)持續(xù)升溫,已經(jīng)出現(xiàn)過熱現(xiàn)象。
大數(shù)據(jù)引發(fā)建設(shè)熱潮
馬云的一句“無法計(jì)算的價(jià)值”,再次將大數(shù)據(jù)推上“云端”,受眾人敬仰。
有人說,給一張照片,就可以通過大數(shù)據(jù)分析還原當(dāng)時(shí)拍攝的時(shí)間、空間、緯度等要素,大數(shù)據(jù)的神奇,在諸多成功案列之后,正在被捧上神壇的途中。
當(dāng)然,大數(shù)據(jù)確實(shí)有它獨(dú)到之處,如無人駕駛就是大數(shù)據(jù)應(yīng)用的一個(gè)好例子。無人駕駛,需要對(duì)各種數(shù)據(jù)進(jìn)行綜合分析,若在行駛中要穿越某個(gè)路口時(shí)看到小球通過,可能就要啟動(dòng)預(yù)測(cè),小球后邊會(huì)不會(huì)有一個(gè)小孩跟著,他正在追著球跑,這時(shí)車子就要作出相應(yīng)的判斷,啟動(dòng)大數(shù)據(jù)分析,它除了對(duì)環(huán)境感應(yīng)的數(shù)據(jù),地圖的數(shù)據(jù)還有其他的領(lǐng)域。
對(duì)此,梅宏院士表示,這樣的大數(shù)據(jù)應(yīng)用,現(xiàn)在還不是那么普遍,但相信未來應(yīng)該會(huì)越來越有用,從大數(shù)據(jù)發(fā)展到現(xiàn)在,很多數(shù)據(jù)應(yīng)用的成功案例都曾證明過,“但是,在這熱潮中,需冷靜,需反思,一是大數(shù)據(jù)的概念持續(xù)升溫,毫無疑問已經(jīng)處于過熱的狀態(tài),二是大數(shù)據(jù)不可能是解決一切問題的靈丹妙藥,有時(shí)候也不需要全用(大數(shù)據(jù))。”
梅宏院士通過一組數(shù)據(jù)來反映大數(shù)據(jù)過熱現(xiàn)象:2011年至2013年上半年,全國(guó)共規(guī)劃建設(shè)數(shù)據(jù)中心255個(gè),已投入使用173個(gè),總用地約713萬平方米,總機(jī)房面積約400萬平方米。其中,超大型數(shù)據(jù)中心(規(guī)模在1萬個(gè)標(biāo)準(zhǔn)機(jī)架以上,功率2.5千瓦為1個(gè)標(biāo)準(zhǔn)機(jī)架)有23個(gè),中小型數(shù)據(jù)中心(規(guī)模在3千到1萬個(gè)標(biāo)準(zhǔn)機(jī)架之間)有42個(gè),中小型數(shù)據(jù)中心(規(guī)模在3千個(gè)標(biāo)準(zhǔn)機(jī)架以下)有190個(gè)。
而255個(gè)數(shù)據(jù)中心的總設(shè)計(jì)服務(wù)器規(guī)模約728萬臺(tái),實(shí)際投產(chǎn)服務(wù)器數(shù)約57萬臺(tái),占設(shè)計(jì)規(guī)模的7.8%,超大型、大型、中小型數(shù)據(jù)中心的投產(chǎn)率分別為1.8%、21.5%和40%。
這255個(gè)數(shù)據(jù)中心分布在26個(gè)省、自治區(qū)、直轄市,從中可以看到數(shù)據(jù)中心的建設(shè)熱潮正在全國(guó)涌動(dòng)。
大數(shù)據(jù)在中國(guó)正引發(fā)新一輪的信息化建設(shè),在這過程中更需要頂層規(guī)劃和示范引導(dǎo),積極謀劃,審慎推進(jìn),避免一哄而上造成超前投資和重復(fù)投資。
信息步入3.0智慧化
信息化在技術(shù)平臺(tái)、管理資源和應(yīng)用模式方面逐漸演化,呈現(xiàn)出明顯的階段性特征,梅宏院士將此劃為三個(gè)階段,在互聯(lián)網(wǎng)應(yīng)用開始的前一天(中國(guó)接入為1995年),歸之為1.0階段,此時(shí)很重要的特征是以單機(jī)應(yīng)用為特征的數(shù)字化階段。
從90年代中期開始(1995年)至2015年美國(guó)提出“信息高速公路”建設(shè)計(jì)劃,互聯(lián)網(wǎng)得到廣泛的應(yīng)用,這時(shí)所有的信息化應(yīng)用進(jìn)入了以互聯(lián)網(wǎng)應(yīng)用為特征的網(wǎng)絡(luò)化階段,打破部門或組織固有的邊界,強(qiáng)調(diào)信息共享與系統(tǒng)協(xié)同的網(wǎng)絡(luò)化應(yīng)用,這是2.0階段。跟以往不同,現(xiàn)在海量的數(shù)據(jù)信息,已經(jīng)從主動(dòng)化為被動(dòng)產(chǎn)生,數(shù)據(jù)的采集源自系統(tǒng)的自然產(chǎn)生。
經(jīng)過20年的發(fā)展,信息化在社會(huì)各方面所形成的深入影響,正開啟一個(gè)新的階段,這就是3.0階段,該階段呈現(xiàn)出以數(shù)據(jù)的深度挖掘與融合應(yīng)用為特征的智慧化,它是信息技術(shù)的不斷廉價(jià)化,以及互聯(lián)網(wǎng)及其延伸應(yīng)用所帶來的無處不在的信息技術(shù)運(yùn)用,形成了規(guī)模巨大的數(shù)據(jù)資源,且仍將加速增長(zhǎng)。
在摩爾定理(只是捆綁)、技術(shù)驅(qū)動(dòng)的萬物數(shù)字化、寬帶移動(dòng)互聯(lián)驅(qū)動(dòng)人機(jī)物的廣泛連接和云計(jì)算模式等四大驅(qū)動(dòng)力驅(qū)動(dòng)下,數(shù)據(jù)表現(xiàn)出大規(guī)模匯集和集中。
此外,大數(shù)據(jù)應(yīng)用的成功案例,如智能交通、Google的自動(dòng)駕駛的交通導(dǎo)向,還有中外語言處理,Google百度完整的翻譯系統(tǒng)、自動(dòng)問答系統(tǒng)等,其中IBM中Watson系統(tǒng)有名的沃森醫(yī)生,就是通過自動(dòng)識(shí)別并對(duì)比成千上萬張非結(jié)構(gòu)數(shù)據(jù)圖片,進(jìn)而診斷疾病,由這些案例可看到數(shù)據(jù)驅(qū)動(dòng)的智能時(shí)代正在來臨,激發(fā)了基于數(shù)據(jù)的巨大需求。
根據(jù)IDC(全球數(shù)據(jù)總量統(tǒng)計(jì))顯示,2003年全球產(chǎn)生數(shù)據(jù)僅500萬TB,到2012年全產(chǎn)生球數(shù)約27億TB(1TB=1024GB ,1PB=1024TB),“在人類所獲得數(shù)據(jù)中,90%的數(shù)據(jù)為過去兩年內(nèi)所產(chǎn)生的,數(shù)據(jù)形式開始呈多樣性,從文本數(shù)據(jù)到視頻、圖片等非結(jié)構(gòu)化數(shù)據(jù),”梅宏院士由此預(yù)測(cè),按統(tǒng)計(jì)大概在2020年前,全球數(shù)據(jù)量大約2年翻1倍,他舉例解釋說,“如果用當(dāng)前世界上最快的商用計(jì)算機(jī),要把1PB數(shù)據(jù)讀入內(nèi)存就要約6天時(shí)間,如果用4000臺(tái)計(jì)算機(jī)對(duì)1PB的數(shù)據(jù)做簡(jiǎn)單的排序需要約6個(gè)小時(shí)?!?/p>
在信息爆炸時(shí)代,充斥著大量偽數(shù)據(jù)、無效數(shù)據(jù)、過時(shí)數(shù)據(jù)等,大數(shù)據(jù)價(jià)值密度低。對(duì)此,梅宏院士認(rèn)為,真正的大數(shù)據(jù)應(yīng)用應(yīng)該取決于數(shù)據(jù)挖掘的深度和多元跨界數(shù)據(jù)融合的廣度,而不僅僅是數(shù)據(jù)的含量;現(xiàn)在很多的應(yīng)用,只不過是過去的數(shù)據(jù)量的增加而已。
大數(shù)據(jù)產(chǎn)業(yè)帶動(dòng)GDP增長(zhǎng)2-4%
大數(shù)據(jù)對(duì)當(dāng)今時(shí)代擁有重大的意義和價(jià)值,一方面它提供了人類認(rèn)識(shí)復(fù)雜系統(tǒng)的一種新思維和新手段。理論上,人類能夠把大千世界全部數(shù)字化,構(gòu)建一個(gè)虛擬的世界。
梅宏院士認(rèn)為,“大數(shù)據(jù)也成為促進(jìn)經(jīng)濟(jì)轉(zhuǎn)型增長(zhǎng)的新引擎,大數(shù)據(jù)產(chǎn)業(yè)的形成對(duì)整個(gè)GDP的帶動(dòng),大約是在2-4%?!边@也因此受到政府部門重視,認(rèn)識(shí)到它在促進(jìn)產(chǎn)業(yè)轉(zhuǎn)型升級(jí),激發(fā)商業(yè)模式的創(chuàng)新,改善民生方面具有很重要的作用。
梅院士還認(rèn)為,大數(shù)據(jù)正在成為國(guó)家綜合能力和保障國(guó)家安全的一種新的利器。美國(guó)棱鏡計(jì)劃就是通過截獲電郵、即時(shí)消息、視頻、照片、語音、文件傳輸、視頻會(huì)議、社交網(wǎng)絡(luò)等數(shù)據(jù)的收集與綜合分析。如何從繁雜的數(shù)據(jù)里面得到國(guó)家所需要的治理能力,這已成為各國(guó)重點(diǎn)關(guān)注。
目前,大數(shù)據(jù)產(chǎn)業(yè)生態(tài)鏈已現(xiàn)雛形,從基礎(chǔ)設(shè)施到分析方法,到應(yīng)用領(lǐng)域,產(chǎn)業(yè)生態(tài)框架基本形成,大數(shù)據(jù)生產(chǎn)流程也有了既定的模式:從獲取存儲(chǔ)、清晰標(biāo)記、到集成聚合、分析建模,最后推薦展現(xiàn)。
大數(shù)據(jù)應(yīng)用呈發(fā)展初級(jí)階段特征,無論從深度和廣度看,均難有真正意義的“全體數(shù)據(jù)”,就顯示世界的復(fù)雜性而言,均是“抽樣數(shù)據(jù)”。
大數(shù)據(jù)的巨大潛力已被廣泛認(rèn)知,隨著大數(shù)據(jù)的普遍應(yīng)用,將可能帶來數(shù)據(jù)所有權(quán)、隱私保護(hù)、信息安全等一系列新的問題,而當(dāng)前,相應(yīng)的道德、法律建設(shè),以及技術(shù)手段仍處于滯后狀態(tài)。