姚芳沁
當AlphaGo最終以4比1的驚人優(yōu)勢戰(zhàn)勝圍棋世界冠軍李世石之后,AlphaGo超越了科學(xué)界,一下子成為了令所有人興奮的話題。DeepMind,也就是AlphaGo的開發(fā)者,也受到了前所未有的關(guān)注。
這家人工智能創(chuàng)業(yè)公司在2014年被Google以6.25億美元收購,這也是Google在歐洲完成的最大金額的投資。如今它的研究成果已經(jīng)顯現(xiàn),在Google最新召開的 I/O大會上,人工智能是絕對的主角。
人工智能已經(jīng)在我們的身邊無處不在了,不論是我們調(diào)戲Siri或是從智能設(shè)備上獲得一個推薦。不過,個性化的搜索、推薦,語音和面部識別的技術(shù)并不是DeepMind所感興趣的人工智能方向?!八鼈冎皇擒浖?,不是嗎?”Demis Hassabis總是這么說,這位DeepMind的創(chuàng)始人把他所做的研究稱為“21世紀的阿波羅項目”—其意義要遠遠超越帶感情的機器人或是更智能的手機。
“目前大多數(shù)的人工智能系統(tǒng)仍是比較狹隘的,它們通過訓(xùn)練預(yù)先程序化的機器去完成特定的任務(wù),除此之外它們什么也干不了?!盌eepMind的高級研究員Martin Szummer對《第一財經(jīng)周刊》說。所以IBM的深藍盡管能打敗國際象棋世界冠軍,但在井字游戲上卻連個3歲小孩都贏不了。
擁有劍橋大學(xué)計算機科學(xué)本科學(xué)位,以及倫敦大學(xué)學(xué)院認知神經(jīng)科學(xué)博士學(xué)位的Hassabis,則從人腦的運作原理上獲得啟發(fā),試圖開發(fā)出第一個“通用學(xué)習(xí)機器”—一套能像生物系統(tǒng)一樣自主學(xué)習(xí)的算法,靈活并且具有很強的適應(yīng)性,它們可以從零開始迅速熟練操作任意工作。機器學(xué)習(xí)以及系統(tǒng)神經(jīng)科學(xué)能教會系統(tǒng)在任何情況下自主做決定,就像人類一樣。這樣的好處是人們不需要對一切都去編程,機器學(xué)習(xí)的算法可以自己編程。
今天,人們已經(jīng)能夠設(shè)計出相當不錯的定制程序來完成特定任務(wù),比如下棋,或是開一輛車。DeepMind的系統(tǒng)可以自己學(xué)會如何下國際象棋,但它的水平未必有深藍那么高。深藍的智慧都在程序里,并不是深藍聰明,而是編寫深藍程序的人聰明,深藍本身什么也學(xué)不 會。
通用機器學(xué)習(xí)的關(guān)鍵在于它的通用性?!鞍┌Y、氣候變化、能源、基因組學(xué)、宏觀經(jīng)濟、金融體系、物理學(xué)等這些我們?nèi)祟愊M莆盏南到y(tǒng)知識正變得越來越復(fù)雜。這是一個信息爆炸的時代,即便是最聰明的大腦在其有生之年也很難掌握全部。”Hassabis說。而通用學(xué)習(xí)機器,能自動將散亂的信息轉(zhuǎn)換成可執(zhí)行可操作的知 識。
2015年2月,《自然》雜志將像素游戲Space Invaders作為封面,介紹的正是DeepMind當時剛發(fā)表不久的論文,展示他們成功開發(fā)出的第一個“端到端”的通用學(xué)習(xí)系統(tǒng),這個針對圖像處理單元的Deep-Q的算法,能夠?qū)W習(xí)如何處理屏幕上的輸入,明白其代表的意思,并做出決策。在給出的案例中,系統(tǒng)成為2600個經(jīng)典雅達利游戲的超級玩家,其中包括Space Invaders、拳擊和打磚塊?!蹲匀弧冯s志給出了“自主學(xué)習(xí)軟件在玩游戲上達到了人類的水平”這一評論。
DeepMind把新老人工智能技術(shù)相結(jié)合。在Deep-Q中,他們把深度神經(jīng)網(wǎng)絡(luò)和“強化學(xué)習(xí)”結(jié)合起來,通過大腦多巴胺驅(qū)動獎勵機制是所有動物學(xué)習(xí)的方式。強化學(xué)習(xí)和深度學(xué)習(xí)一樣重要,人類在做決定時最初也是通過反復(fù)試錯來完成的。在AlphaGo中,深度的強化學(xué)習(xí)用來制定長遠戰(zhàn)術(shù)規(guī)劃。接下來,他們還會整合記憶功能等。
DeepMind成員還掃描大腦,研究人類在想象時大腦的哪些區(qū)域產(chǎn)生活動,并建立模型。他們發(fā)現(xiàn),大腦運作的很多程序是可以被理解的,其中也包括想象。用人工智能創(chuàng)作一部小說或電影或許還很遙遠,但在音樂這個領(lǐng)域已經(jīng)出現(xiàn)一些可能。
在DeepMind的官方網(wǎng)站上寫著,公司的使命是“解開智能的奧秘,并用其來解開其他一切問題”。Hassabis為DeepMind設(shè)定了一個20年的長遠目標,他很清楚在這個過程中有多少功能需要實現(xiàn),把不同領(lǐng)域結(jié)合起來是很關(guān)鍵的,因為他們在開發(fā)的算法需要通過其在一個領(lǐng)域內(nèi)學(xué)到的東西同時能應(yīng)用在另一個領(lǐng) 域。
這聽起來跟Hassabis本人十分相似。乍一看他的履歷,其興趣包括棋牌游戲、電動游戲、電腦編程、認知神經(jīng)學(xué)……8歲時他就寫出了自己的電腦游戲,13歲獲得國際象棋大師的地位,17歲開發(fā)了第一款包含人工智能的視頻游戲Theme Park,20歲以兩科優(yōu)等成績獲得劍橋大學(xué)計算機科學(xué)學(xué)位,不久之后成立了視頻游戲公司Elixir,并在2011年成立了DeepMind。
“我很容易就會無聊,而世界又是那么有趣,有很多很酷的事情可以做。如果我是體育運動員,一定會是個十項全能選手?!盚assabis曾對媒體這么說。
每天,Hassabis會花上兩到三個小時的時間作為自己的“思考時間”。他會從當日看到的一則新聞中思考新的研發(fā)方向,公司的下一個挑戰(zhàn),或是自己編個程。在員工的眼中他絕對是個超人。盡管DeepMind至今還沒有發(fā)布任何產(chǎn)品,也沒有任何盈利,但這里卻聚集著全球頂尖的計算機神經(jīng)科學(xué)家、機器學(xué)習(xí)專家以及大量的工程師資源。
DeepMind已經(jīng)從Google收購時的50人團隊,拓展到今天的200多人,他們來自全球45個不同的國家,而從DeepMind成立至今,還沒有一個員工離開過。員工雖然大多還是男性,但身材好,打扮時髦,看起來完全不像一般的技術(shù)宅男。DeepMind在倫敦Kings Cross擁有一間6層樓的辦公室,每一個房間都以一個偉大的學(xué)者命名:特斯拉、拉馬努金、柏拉圖、費曼、亞里士多德、瑪麗·雪萊……每到周末,員工們會聚集到屋頂暢飲,這是他們“在high中結(jié)束一周”的傳統(tǒng)。
Hassabis認為DeepMind是結(jié)合了“最好的學(xué)術(shù)研究和最激動人心的創(chuàng)業(yè),讓公司充滿活力,推動創(chuàng)造力與進步”。他常常提“創(chuàng)造力”,并且承認自己天生就富有創(chuàng)造力且直覺敏銳,并不是一個“標準的科學(xué)家”。DeepMind組織架構(gòu)中極為重要的是他稱之為“黏合思維”的東西,各個科學(xué)領(lǐng)域的專家能以別出心裁的方式快速找出有前景的跨學(xué)科交叉點,這些黏合者以小組的形式每幾周就碰一次面,快速、靈活地將各種資源和工程師匹配到需要的地方。
由一個天才研究者主導(dǎo),3到4名其他領(lǐng)域的研究者接過同一任務(wù),并基于自己的專業(yè)做補充,這樣能很快產(chǎn)生一些驚人的結(jié)果。AlphaGo項目就是在這一理念的推動下誕生的。
Facebook成立時最早的投資者彼得·蒂爾、伊隆·馬斯克,Skype的聯(lián)合創(chuàng)始人Jaan Tallinn都在DeepMind的早期投資者之列。正是馬斯克第一次把DeepMind推薦給Google當時的CEO拉里·佩奇,經(jīng)過一年時間的談判,最終促成了Google的收購。事實上,F(xiàn)acebook也曾積極收購DeepMind,但Hassabis最終選擇了Google。兩家公司相近的文化以及佩奇?zhèn)€人對人工智能的極大熱情打動了Hassabis。
創(chuàng)立DeepMind三年之后,Hassabis把太多的時間花在籌資上,而留給研發(fā)的時間則只有10%,既要建立一個像Google一樣偉大的公司,又要解決人工智能的問題,Hassabis意識到自己沒有那么多時間同時做這兩件事,而他毫不猶豫選擇了后者。盡管常有人勸說Hassabis把公司搬到硅谷去,但他卻堅持留在倫敦。他認為已經(jīng)泡沫化的硅谷對于立足長遠目標的DeepMind來說并不是一個好的選擇,“那里的人每5分鐘就想創(chuàng)立下一個Snapchat,太過喧鬧了?!?/p>
從短期來看,Google的產(chǎn)品力的確能從DeepMind的研究中迅速增強。DeepMind有5個團隊在協(xié)助Google的YouTube、搜索、醫(yī)療、自然語言認知以及一些Google X的項目,但在幫助Google提升廣告收益方面沒有任何的指標壓力。
將DeepMind的技術(shù)用于圖像識別領(lǐng)域,把圖像識別錯誤率由原先的16%降低到目前的5.5%,這已經(jīng)和人類的識別水平非常接近了。現(xiàn)在這項技術(shù)用于Google+的圖片搜索中,在搜索框內(nèi)輸入關(guān)鍵字,它能夠回憶出你手動標簽過的照片。它還可以用來識別文字,比如商店櫥窗上的文字,可以提醒人們某家店正在打折。同樣的核心系統(tǒng)還可以用于語音識別,相比過去的技術(shù),錯誤率降低了30%,這是20年來語音識別領(lǐng)域最大的突 破。
在自然語言認知的項目上,DeepMind還收購了從牛津大學(xué)孵化出的兩個創(chuàng)業(yè)公司Dark Blue Labs和Vision Factory,試圖使用神經(jīng)的手段創(chuàng)造一個巨型的機器讀取系統(tǒng),而不需要人工編程。在Google內(nèi)部,人工智能工具或是深度學(xué)習(xí)網(wǎng)絡(luò)廣泛應(yīng)用于詐騙探測、垃圾探測、手寫識別、圖像搜索、語音識別、街景探測、翻譯等領(lǐng)域。60個人設(shè)計的系統(tǒng)現(xiàn)在被以深度學(xué)習(xí)為基礎(chǔ)的網(wǎng)絡(luò)所取代。
技術(shù)本身是中立的,但作為一個會學(xué)習(xí)的機器,不可避免地會帶有設(shè)計者價值體系的印記。包括霍金、比爾·蓋茨、伊隆·馬斯克等在內(nèi)也紛紛公開表達了對人工智能威脅的擔(dān)憂。馬斯克甚至警告稱“人工智能要比原子彈更危險,這是人類在召喚魔鬼的行為”,而他投資DeepMind的唯一目的就是為了盯著它,以防它的任何越軌行為。
DeepMind也意識到人工智能有作惡的可能,因而采取了一系列預(yù)防機制。DeepMind盡可能公開自己的代碼,出售給Google的條件之一就是禁止將其技術(shù)用于軍事或情報,以及成立一個倫理董事會監(jiān)管內(nèi)部的人工智能開發(fā)。
“之前從未有人走到過這一步,所以在接受大眾監(jiān)督之前,我們必須做一些探索性工作?!盚assabis說。這個董事會至今仍然是個極為神秘的機構(gòu),據(jù)說董事會的成員是各個領(lǐng)域最頂級的人物,對于DeepMind來說,既需要他們的專業(yè)知識,也要讓他們更好地了解人工智能正在發(fā)生什么。
Hassabis今年年初在劍橋與霍金有一次私人會面。在那次會面之后,霍金就不在媒體面前提及任何人工智能煽動性的言論了。甚至他之后在BBC的一次講座中推斷的人類威脅清單上,并不包括人工智能?;蛟SHassabis真的說服了霍金。在他與霍金會面結(jié)束時,霍金打出了“祝你好運”(good luck)之后又補充道,“但不要太好運”(not too much)。