何菲
《超驗駭客》這部科幻電影正在上映,如果你對電腦深度學(xué)習(xí)系統(tǒng)和人工智能感興趣,不妨去看看,一個高智商技術(shù)宅男如何差一點就接管了世界。這部電影試圖回答一個疑問:當(dāng)具有高度學(xué)習(xí)能力的電腦全面接管人們的基本生活,對后者可能帶來哪些改變?《超驗駭客》所描繪的場景依然很遙遠(yuǎn),百度大數(shù)據(jù)卻近在眼前?!鞍俣却竽X智商相當(dāng)于兩三歲小孩,可能很快超越成年人?!崩顝┖暝诎俣鹊谒膶眉夹g(shù)開放日上扔下一枚重磅炸彈。
這位 “小孩”的智力還在不斷增長?!案鶕?jù)摩爾定律,每隔18個月計算機計算能力會增加一倍,成本會下降到原來一半?!崩顝┖暾f,“這是一種量變,摩爾定律繼續(xù)做十年二十年,質(zhì)變就會發(fā)生,這樣的一個大腦很有可能比人腦還要聰明?!卑俣仍噲D通過包括“百度大腦”在內(nèi)的大數(shù)據(jù)技術(shù)開放平臺敲開各個重點行業(yè)甚至政府機構(gòu)的大門。為此,百度已做了不少鋪墊。
今年春節(jié)期間,中央電視臺《晚間新聞》與百度合作,首次啟用百度地圖定位可視化大數(shù)據(jù)播報了國內(nèi)春節(jié)人口遷徙情況。這個報道建立在百度推出的人口遷徙大數(shù)據(jù)項目上?!鞍俣鹊貓D春節(jié)人口遷徙大數(shù)據(jù)”(簡稱“百度遷徙”)。利用百度后臺每天數(shù)十億次LBS(基于地理位置的服務(wù))定位數(shù)據(jù)進(jìn)行計算分析,展現(xiàn)了春節(jié)前后人口大遷徙的軌跡與特征。
海量的語音數(shù)據(jù)可以幫助年輕的父母們聽懂孩子的哭聲。百度大數(shù)據(jù)技術(shù)可以把中文語音轉(zhuǎn)換成中文的文字。在把海量的嬰兒聲紋上傳到大數(shù)據(jù)中心提取特征之后,年輕父母在錄下嬰兒哭聲上網(wǎng)比對,就可以知道孩子因為什么哭:是餓了,還是只想撒撒嬌。
在吊足了業(yè)界胃口之后,百度依然面臨一個問題:在各家都在兜售自己的云和大數(shù)據(jù)的時候,百度應(yīng)該怎樣使自己脫穎而出?接管行業(yè)甚至政府?dāng)?shù)據(jù),是百度大數(shù)據(jù)戰(zhàn)略的下一步。針對這一方向,百度的策略是:軟硬兼施。
最近,百度宣布正式發(fā)布大數(shù)據(jù)引擎,將包括開放云、數(shù)據(jù)工廠、百度大腦三大組件在內(nèi)的核心大數(shù)據(jù)能力開放,通過大數(shù)據(jù)引擎向外界提供大數(shù)據(jù)存儲、分析及挖掘的技術(shù)能力,這也是全球首個開放大數(shù)據(jù)引擎。
“百度開放云”是大數(shù)據(jù)引擎運行的基礎(chǔ)構(gòu)件,通過分布各地的百度新一代高效能數(shù)據(jù)中心為傳統(tǒng)行業(yè)提供超大規(guī)模的數(shù)據(jù)存儲和分布式計算。在此基礎(chǔ)上,“數(shù)據(jù)工廠”對行業(yè)數(shù)據(jù)進(jìn)行一系列規(guī)范化處理,提供強大的數(shù)據(jù)管理和分析能力。更上一層,則是百度人工智能的精華——“百度大腦(Baidu Brain)”,基于百度深度學(xué)習(xí)研究院的領(lǐng)先成果,
按照百度的說法,百度大腦融合了全球領(lǐng)先的深度學(xué)習(xí)算法、數(shù)據(jù)建模、大規(guī)模GPU并行化平臺等技術(shù),實現(xiàn)了無時無刻都在學(xué)習(xí)與成長,它擁有200億個參數(shù),構(gòu)造起世界上最大的深度神經(jīng)網(wǎng)絡(luò)。
因為數(shù)據(jù)無法互聯(lián)互通,不少機構(gòu)、傳統(tǒng)企業(yè)甚至政府部門正在成為一個個數(shù)據(jù)孤島,其數(shù)據(jù)存儲與管理的規(guī)模、數(shù)據(jù)分析挖掘以及智能化能力也處在從數(shù)據(jù)累積的量變過程轉(zhuǎn)化為“數(shù)據(jù)智能”質(zhì)變過程的臨界點上。
百度也需要前者的數(shù)據(jù)。這家公司需要把各個行業(yè)存在本地的所謂小數(shù)據(jù)通過百度云和數(shù)據(jù)工廠處理變成大數(shù)據(jù),以豐富自己的數(shù)據(jù)庫資源,通過機器學(xué)習(xí),使自身的數(shù)據(jù)庫更為智能和精準(zhǔn)。
從可行性上看,制造業(yè)、交通管理部門甚至餐館服務(wù)業(yè),都因攝像頭設(shè)備而產(chǎn)生各種各樣的視頻。但這些行業(yè)和部門沒有更多的技術(shù)對這些視頻進(jìn)行解構(gòu)和識別,以便于檢索和分析。比如在交通行業(yè),各個監(jiān)控路口的攝像頭24小時監(jiān)控著各個路段的交通流量。通過百度地圖大數(shù)據(jù)和搜索大數(shù)據(jù)的建模分析,百度大數(shù)據(jù)引擎可以提供出行趨勢預(yù)測。此外,移動互聯(lián)網(wǎng)時代,手機(尤其是定位器和照相機功能)、移動傳感器、可穿戴設(shè)備等各種移動設(shè)備也產(chǎn)生了豐富而多樣的數(shù)據(jù)。
但是百度需要強化自己對硬件的控制力。今年3月,“百度智能硬件品牌日”正式上線京東商城。此次上線的百度旗下智能硬件產(chǎn)品,涉及家庭娛樂、運動健康、視頻安防、車載導(dǎo)航等多個領(lǐng)域。
上述傳統(tǒng)行業(yè)是百度必須拿下的市場,不少行業(yè)的單行業(yè)產(chǎn)值都在萬億級以上。目前的消息是,百度大數(shù)據(jù)引擎將逐步開放,當(dāng)下先采取邀請制和免費模式,在政府、NGO、制造、醫(yī)療、金融、零售、娛樂、教育等傳統(tǒng)領(lǐng)域率先開展項目合作。
哪些行業(yè)會接受百度拋來的橄欖枝呢?
一個可以確定的消息是,北京交通運輸管理部門的部分應(yīng)用正計劃遷移至百度開放云平臺,利用大數(shù)據(jù)引擎對行業(yè)監(jiān)測數(shù)據(jù)進(jìn)行挖掘分析。