盧華磊
極客創(chuàng)造并掀起新的商業(yè)浪潮。但AI極客敲出的每一行代碼,“喚醒”的每一臺機(jī)器卻有可能改變?nèi)祟愇磥淼穆窂健?/p>
AlphaGo的出現(xiàn)加速了人們對人工智能(Artificial Intelligence以下簡稱AI)的理解,但AI極客們的野心遠(yuǎn)非19行的棋盤可以局囿,他們擁有酷炫的技術(shù)和非凡自信,并想以此來改變世界。
美國暢銷書作者、發(fā)明家雷.庫茲韋爾(Ray.Kurzweil)在《奇點(diǎn)臨近》一書中為人工智能的出現(xiàn)設(shè)定了三個(gè)條件:強(qiáng)大的計(jì)算能力、海量的知識儲備,最后還需要教會計(jì)算機(jī)擁有認(rèn)知能力,通過機(jī)器學(xué)習(xí)技術(shù)讓計(jì)算機(jī)不斷的自行進(jìn)化。
前兩者已經(jīng)實(shí)現(xiàn)。第三點(diǎn),如何讓機(jī)器擁有認(rèn)知能力是AI極客們關(guān)注的重點(diǎn)。
機(jī)器學(xué)習(xí)是人工智能的核心。機(jī)器學(xué)習(xí)將教會計(jì)算機(jī)認(rèn)識現(xiàn)實(shí)世界,知道自然界的日升日落、陰晴圓缺,并能理解人類的行為和語言。機(jī)器學(xué)習(xí)的常用領(lǐng)域包括數(shù)據(jù)挖掘、視覺理解、語音識別和自然語言處理等方面。我們采訪了數(shù)位科技公司高層、新銳創(chuàng)業(yè)者,他們有一個(gè)共同的身份—國內(nèi)從事機(jī)器學(xué)習(xí)的應(yīng)用和研發(fā)的專家。他們講述了中國人工智能發(fā)展的現(xiàn)狀,而一旦科技出現(xiàn)新突破,也預(yù)示著新一輪的商業(yè)變革。
坐在記者對面,臉龐消瘦的陳運(yùn)文笑得有些靦腆,言語卻充滿自信,“很多事情都是可以預(yù)測的”。
陳運(yùn)文是國內(nèi)大數(shù)據(jù)方面的專家,曾任百度核心技術(shù)研發(fā)工程師和盛大文學(xué)首席數(shù)據(jù)官?,F(xiàn)在他是個(gè)創(chuàng)業(yè)者,達(dá)觀數(shù)據(jù)創(chuàng)始人兼CEO。他為公司新入職的同事下發(fā)了一套題——如何預(yù)測泰坦尼克號上的幸存者。整套題通過獲取泰坦尼克號上所有乘客的真實(shí)信息,包括性別、年齡、職業(yè)、票價(jià)、艙位等,然后編寫程序來預(yù)測這2000余名乘員中哪些人最終得以生還。
在陳運(yùn)文眼里,將所有信息加以綜合挖掘,就能夠推演出最終的答案—“705名生還者都可以準(zhǔn)確預(yù)測。”
預(yù)測這樣的事件只是數(shù)據(jù)挖掘的一個(gè)案例,對于極客而言,只要給他們足夠的信息,這個(gè)世界就沒有意外和偶然。
現(xiàn)在,陳運(yùn)文用自己的技術(shù)幫助企業(yè)進(jìn)行商業(yè)決策。雖然只成立不到半年,但這個(gè)隱藏在張江天之驕子公寓里的創(chuàng)業(yè)公司已經(jīng)獲得真格基金和盛大網(wǎng)絡(luò)創(chuàng)始人陳大年的投資。
陳運(yùn)文將第一批客戶瞄準(zhǔn)為自媒體人,通過數(shù)據(jù)分析,為自媒體提供可以引發(fā)熱議的話題,并告訴這些作者,什么人喜愛看他們的文章、會關(guān)注什么話題。
讓機(jī)器自己學(xué)會分析信息早就在商業(yè)行為中廣泛存在。在百度工作期間,陳運(yùn)文負(fù)責(zé)搜索引擎的核心算法研究,主要“為用戶提供最有價(jià)值的信息”。 工作的難點(diǎn)不在于搜索信息,而在于讓機(jī)器認(rèn)知用戶的搜索意圖。
用戶經(jīng)常會在搜索框中輸入“口語詞匯或者模糊的語句”,服務(wù)器要從人們的搜索語句中判斷真正的需求。陳運(yùn)文就需要設(shè)計(jì)算法讓搜索引擎理解用戶的語義,從數(shù)百億的網(wǎng)頁中迅速找到對用戶最有價(jià)值的結(jié)果。這種“算法”就屬于人工智能。百度每天的搜索有數(shù)十億次,每當(dāng)陳運(yùn)文改進(jìn)了算法都能看到用戶點(diǎn)擊的滿意度在上升。
今天這種依靠數(shù)據(jù)挖掘技術(shù)來提高企業(yè)運(yùn)作效率的方法變得更常見,業(yè)內(nèi)將其稱為“商業(yè)智能”(Business Intelligence)技術(shù)。陳運(yùn)文計(jì)劃將這種技術(shù)在云端運(yùn)用,另一些同類公司則將這種技術(shù)直接運(yùn)用在軟件上。2010年在美國納斯達(dá)克上市的Qlik公司就是商業(yè)智能軟件的代表企業(yè)。他們的QlikView軟件為用戶提供“可視化”的大數(shù)據(jù)服務(wù)。
“我們的軟件可以理解數(shù)據(jù),挖掘數(shù)據(jù)并將其用更直觀的方式展現(xiàn)給客戶,以幫助管理層做出決策。” Qlik亞太區(qū)制造業(yè)和高科技市場開發(fā)總監(jiān)Jeremy Sim對《財(cái)經(jīng)天下》周刊表述。
這些帶有“預(yù)測”功能的軟件已經(jīng)在服務(wù)并改變?nèi)藗兊纳睿热绺鶕?jù)顧客的購買信息QlikView會提示便利店店長,售貨架上的麥片不應(yīng)該和面包擺在一起,雖然它們都是早餐食品,但如果將麥片和酸奶擺在一起,銷售數(shù)字會更好看。此類預(yù)測還進(jìn)一步提醒物流部門,盡量地在頭天晚上補(bǔ)足麥片和酸奶貨源。這類商業(yè)智能的應(yīng)用滲入所有人的生活,以這家公司為例,他們已經(jīng)在全球100多個(gè)國家招徠了3.8萬企業(yè)客戶,間接服務(wù)人群上千萬。
未來這些帶有“智力”的系統(tǒng)將會更多的出現(xiàn)在電商、醫(yī)療、教育、金融等領(lǐng)域。“比如隨著智能手環(huán)的增加,會有更多的健康數(shù)據(jù)被采集,那么我們會提供健康預(yù)警、治療方案推薦等服務(wù)?!标愡\(yùn)文說?,F(xiàn)在只是大數(shù)據(jù)挖掘的初級階段,人工智能時(shí)代也才剛剛開啟。
2014年6月,比爾·蓋茨訪華,除了見政商要員外,他還專門造訪了一家剛成立一年的創(chuàng)業(yè)公司—格靈深瞳。對于這家初創(chuàng)公司,比爾蓋茨留下了兩句后來被廣泛引用的評語“This is very cool”和“IT界的下一個(gè)大事件是計(jì)算機(jī)視覺(computer vision)與深度學(xué)習(xí)(deep learning) 的結(jié)合”。
格靈深瞳就是這樣一個(gè)結(jié)合了計(jì)算機(jī)視覺和深度學(xué)習(xí)為一身的酷公司。創(chuàng)始人趙勇是致力于視覺理解的知名極客,雖然他本人并不喜歡這個(gè)稱謂。
“極客(Geek)在英文里形容書呆子,只會做技術(shù)不通世事,但我覺得我是一個(gè)懂技術(shù)的正常人?!彼麑Α敦?cái)經(jīng)天下》周刊說。
趙勇專攻計(jì)算機(jī)視覺和運(yùn)算影像學(xué),2009年入職谷歌總部研究院任資深研究員,是谷歌眼鏡項(xiàng)目的骨干?!拔覀儓F(tuán)隊(duì)負(fù)責(zé)谷歌眼鏡的場景識別技術(shù),利用谷歌街景來判斷使用者所處的位置?!焙唵蔚卣f就是將谷歌眼鏡捕獲的圖像和谷歌街景做比對,然后快速地定位用戶所處位置和周邊信息。谷歌眼鏡可以在500毫米之內(nèi)將用戶的位置精確到米級別。趙勇說谷歌眼鏡并不是“進(jìn)化的產(chǎn)品,而是從無到有的突破”。
2013年初,趙勇回國創(chuàng)業(yè)成立格靈深瞳,并在三個(gè)月后拿到真格基金和聯(lián)創(chuàng)策源的聯(lián)合天使投資,同年6月格靈深瞳又拿到紅杉資本 A 輪高達(dá)數(shù)千萬美元的投資。
業(yè)內(nèi)傳播著投資人爭論其未來估值的段子,據(jù)說某次飯局上真格基金的徐小平、紅杉資本的沈南鵬和聯(lián)創(chuàng)策源的馮波討論格靈深瞳的未來估值,徐小平認(rèn)為起碼5000億美元,而沈南鵬認(rèn)為1000億美元,最后馮波折中地認(rèn)為3000億美元。而現(xiàn)在中國電商巨頭阿里巴巴的市值還不到1900億美元。
受到比爾·蓋茨和投資人如此追捧的原因在于趙勇的研究方向—計(jì)算機(jī)視覺,這是機(jī)器學(xué)習(xí)中極為復(fù)雜的領(lǐng)域。
將趙勇和陳運(yùn)文做一個(gè)對比就可以看出他們研究方向的不同。趙勇認(rèn)為數(shù)據(jù)挖掘是讓計(jì)算機(jī)理解“結(jié)構(gòu)化信息”,結(jié)構(gòu)化指那些人工制作的成型的信息數(shù)據(jù),例如一句話一段文字或者一份表格。但計(jì)算機(jī)視覺需要讓機(jī)器理解飄過鏡頭的一片樹葉,或者悄悄走過的一只貓。
陳運(yùn)文對此也做了比較,他認(rèn)為數(shù)據(jù)挖掘更多的是處理文本信息,而文字是具象的表達(dá),機(jī)器看到漢字“貓”或者英文“cat”就可以理解這是一種動物,但圖片是抽象信息,給計(jì)算機(jī)看一張貓的圖片,讓它去理解貓的概念非常困難。
所以當(dāng)2012年6月谷歌X實(shí)驗(yàn)室宣布他們研發(fā)的“谷歌大腦”通過百萬張圖片的學(xué)習(xí)后可以識別“貓”的時(shí)候,全世界都為之震驚。這意味著谷歌培養(yǎng)的這個(gè)“孩子”具備視覺理解的能力可以“看圖說話”了。而參與“谷歌大腦”研發(fā)的吳恩達(dá)博士(Andrew Ng)也因?yàn)檫@個(gè)項(xiàng)目被譽(yù)為“谷歌大腦之父”,成為機(jī)器學(xué)習(xí)領(lǐng)域最權(quán)威的學(xué)者。
為了建造“谷歌大腦”,吳恩達(dá)使用了神經(jīng)網(wǎng)絡(luò)系統(tǒng),他們連接了1.6萬片處理器創(chuàng)造了一個(gè)擁有10億多條連接的神經(jīng)網(wǎng)絡(luò),并逐步地培訓(xùn)這個(gè)系統(tǒng),直到它擁有識圖的能力。
現(xiàn)在,趙勇做的事情與此類似。
他通過影像設(shè)備捕捉實(shí)時(shí)畫面,讓計(jì)算機(jī)識別這個(gè)真實(shí)世界,更為直接的說法或許是—趙勇正在研制“機(jī)器人之眼”。
像谷歌一樣,想讓計(jì)算機(jī)能識別圖像,趙勇也需要制作一個(gè)“深度神經(jīng)網(wǎng)絡(luò)”系統(tǒng)。
在人腦中有大約1000億個(gè)神經(jīng)元,神經(jīng)元通過神經(jīng)突出連接在一起就變成了一個(gè)神經(jīng)網(wǎng)絡(luò),人們思考問題的時(shí)候這些神經(jīng)網(wǎng)絡(luò)相互激發(fā),最終產(chǎn)生決策。現(xiàn)在極客們用計(jì)算機(jī)來模擬這個(gè)過程,用計(jì)算程序建立起龐大的計(jì)算元素,這些程序運(yùn)算的結(jié)果通過網(wǎng)絡(luò)互為交換互相影響,最終產(chǎn)生結(jié)果,這就是初級的人工神經(jīng)網(wǎng)絡(luò)。人工神經(jīng)網(wǎng)絡(luò)層級越多規(guī)模越大,其“聰明程度”就越高,學(xué)習(xí)的能力就越強(qiáng)。
要培養(yǎng)這樣一個(gè)會“識圖的孩子”,趙勇除了要建立這樣一套龐大的神經(jīng)網(wǎng)絡(luò)之外,還需要不停訓(xùn)練這個(gè)網(wǎng)絡(luò)。
“可以將神經(jīng)網(wǎng)絡(luò)當(dāng)成一個(gè)黑盒子,我在里面設(shè)定了一些基本參數(shù),隨后不停的往里面輸入數(shù)據(jù)、圖片來訓(xùn)練它,通過這種大量的訓(xùn)練,黑盒子里面參數(shù)的連接會越來越緊密,整個(gè)網(wǎng)絡(luò)也會越來越聰明,最終變成一個(gè)可以識別圖片的智能系統(tǒng)?!?/p>
嚴(yán)格地說,人工智能不是人類設(shè)計(jì)出來的,而是人類訓(xùn)練出來的。即便是趙勇這樣的創(chuàng)建者也無法知道這些神經(jīng)網(wǎng)絡(luò)到底如何相互作用相互影響,并最終形成自己的智能系統(tǒng)。他能做的只是“選擇輸入數(shù)據(jù),控制訓(xùn)練方向”。
依舊以老師教育孩子做比喻,雖然趙勇這個(gè)老師不知道孩子是怎么理解圖片,識別這個(gè)世界的,但他可以控制教學(xué)的內(nèi)容,讓這個(gè)孩子朝某個(gè)方面學(xué)習(xí)。
趙勇花費(fèi)了兩年時(shí)間才為格靈深瞳培養(yǎng)出自己的“孩子”,并將這些有“識圖能力”的人工智能設(shè)備應(yīng)用到安防監(jiān)控和汽車識別方面。
去年格靈深瞳推出了名為“晧目”的行為分析儀,這是一個(gè)包含軟硬件于一體的智能監(jiān)控產(chǎn)品?!皶壞俊睍?shí)時(shí)監(jiān)控場景內(nèi)的情況,發(fā)覺異常就立刻報(bào)警或者提醒工作人員注意。而在另一個(gè)名為“威目”的產(chǎn)品中,格靈深瞳做到了車輛識別,他們訓(xùn)練系統(tǒng)辨識超過5000種車輛,這幾乎涵蓋了地球上所有的汽車類型。這種能力為警方辦案提供了幫助,警方可以用“以圖搜圖”的方式讓“威目”提供他們需要的視頻資料?!熬教峁┮粡埰囌掌?,威目在識別照片之后可以從交通錄像中找出該車的行動軌跡?!背酥?,該系統(tǒng)還可以搜索“結(jié)構(gòu)化信息”,例如在系統(tǒng)中輸入2004年生產(chǎn)車牌中含有5這個(gè)數(shù)字的紅色奧迪A4汽車,“威目”就會在資料中截取相關(guān)的圖像或者視頻,而此前這些工作都需要人工完成。
如果計(jì)算機(jī)視覺技術(shù)以這樣的速度繼續(xù),或許用不了幾年,當(dāng)我們站在攝像頭前時(shí),計(jì)算機(jī)會在屏幕上敲出那句讓人激動的言語—“I see you .”
“谷歌大腦之父”吳恩達(dá)在完成了“認(rèn)貓”創(chuàng)舉兩年后離開了谷歌,加盟了百度,任職百度首席科學(xué)家并負(fù)責(zé)“百度大腦”的研發(fā)。
說服吳恩達(dá)做此決定的是他的好友,現(xiàn)任地平線機(jī)器人技術(shù)CEO的余凱。
余凱是國際知名的機(jī)器學(xué)習(xí)專家,他牽頭成立的百度深度學(xué)習(xí)研究院是國內(nèi)第一個(gè)研究深度神經(jīng)網(wǎng)絡(luò)的研究機(jī)構(gòu),加盟百度時(shí)被李彥宏稱為“鎮(zhèn)院之寶”。
“深度網(wǎng)絡(luò)學(xué)習(xí)大概起始于2006年,當(dāng)時(shí)主要有5個(gè)機(jī)構(gòu)從事這方面的研究,分別是多倫多大學(xué)、紐約大學(xué)、美國的NEC實(shí)驗(yàn)室、斯坦福大學(xué)和蒙特利爾大學(xué),而我當(dāng)時(shí)在NEC實(shí)驗(yàn)室工作?!庇鄤P說。有段時(shí)間他還在斯坦福大學(xué)執(zhí)教《人工智能概論》。他領(lǐng)導(dǎo)的團(tuán)隊(duì)在深度學(xué)習(xí)、圖像識別、文本挖掘、多媒體檢索、視頻監(jiān)控,人機(jī)交互等機(jī)器學(xué)習(xí)領(lǐng)域都有建樹。
去年余凱離開百度,在中關(guān)村的創(chuàng)富大廈租賃辦公室成立地平線機(jī)器人技術(shù)。成立僅4個(gè)月,這家公司就迎來了首輪投資,投資方包括晨興資本、高瓴資本、紅杉資本、金沙江創(chuàng)投等多家機(jī)構(gòu)。
比起商業(yè)上的追求,余凱更想用技術(shù)改變世界—為萬物裝上人工智能的大腦,讓它們變成擁有智能思維的機(jī)器人。
在余凱看來,他在百度的工作主要是在“云端”搭建人工智能深度神經(jīng)網(wǎng)絡(luò),其服務(wù)主要體現(xiàn)在“為用戶提供更智能的互聯(lián)網(wǎng)服務(wù)”,他希望通過人工智能技術(shù)應(yīng)用到物理世界中,讓人們的生活變得更方便和簡單。“現(xiàn)在很多電器都采用軟件結(jié)合互聯(lián)網(wǎng)操控,我希望未來都可以實(shí)現(xiàn)本地人工智能操控?!?/p>
他準(zhǔn)備讓汽車、空調(diào)、冰箱、微波爐等上千種產(chǎn)品或設(shè)備都具有從感知到?jīng)Q策的能力。比如用戶進(jìn)入房間時(shí)空調(diào)就可以感知人的位置和體溫自動開機(jī)送風(fēng),并追隨人的移動而改變送風(fēng)方向;冰箱則會讀取存儲食物的信息,及時(shí)提醒用戶食用或補(bǔ)充。
余凱利用深度神經(jīng)網(wǎng)絡(luò)算法來搭建他的人工智能框架。他將這種人工智能系統(tǒng)描述成“類似于安卓的智能硬件的大腦平臺”,這個(gè)系統(tǒng)可以安裝在不同的產(chǎn)品中。
他“改造萬物”的計(jì)劃先從家居產(chǎn)品和汽車兩個(gè)方面著手。地平線機(jī)器人技術(shù)研發(fā)了針對這兩個(gè)行業(yè)的人工智能操作系統(tǒng)。家居方面的基于深度神經(jīng)網(wǎng)絡(luò)的操作系統(tǒng)名為“安徒生”,汽車的則稱為“雨果”。
現(xiàn)在 “安徒生”已經(jīng)入駐家電產(chǎn)品,在剛剛過去的上海家博會展上,地平線機(jī)器人和某國內(nèi)知名家電廠商合作的兩款智能產(chǎn)品面世參展?!艾F(xiàn)在業(yè)界最大的智能家居廠商都是我們的客戶,我們向他們提供算法操作系統(tǒng),并告訴他們?nèi)绾闻渲糜布O(shè)備,就像安卓向手機(jī)廠商提供參考設(shè)計(jì)一樣?!?/p>
下一步余凱準(zhǔn)備讓“雨果”進(jìn)入汽車自動駕駛領(lǐng)域,在安裝了傳感器、處理器和雨果大腦平臺后,汽車可以成為提供無人駕駛或智能駕駛的新型交通工具。
“定義萬物智能的大腦,這還要花很長時(shí)間,但是我覺得一步一步往那邊靠近?!?余凱知道地平線機(jī)器人的征程漫漫,但對于AlphaGo對戰(zhàn)李世石這樣的人機(jī)大戰(zhàn)新聞他卻無比篤定?!百惽皫缀跛袑<叶颊f這次機(jī)器贏不了,但我在接受網(wǎng)易采訪的時(shí)候就公開預(yù)測機(jī)器會贏,因?yàn)槲伊私釧lphaGo的算法?!?/p>
陳運(yùn)文也表達(dá)了相同的猜測。3月9日下午,陳運(yùn)文就興奮地預(yù)測AlphaGo能夠獲勝,那時(shí)首爾的李世石剛在棋盤上落下自己的第一枚黑子。
3個(gè)小時(shí)后,對弈到186手時(shí)李世石投子推枰宣告認(rèn)輸。
“機(jī)器贏了”,記者給陳運(yùn)文發(fā)了一條微信。
“未來已來”,他這樣回復(fù)。