楊揚
在贏得“事關(guān)人類命運”的一戰(zhàn)后,哈薩比斯說:“我們只爬上了人工智能梯子的第一級”
2016年3月,哈薩比斯說在韓國
3月15日,在全世界媒體的聚光燈下,機器人阿爾法狗(即AlphaGo)的創(chuàng)造者戴密斯?哈薩比斯,與韓國圍棋九段李世石微笑握手,留下人類歷史上頗具意義的一個瞬間。
過去20年間,計算機已戰(zhàn)勝過中國象棋和國際象棋的頂尖高手,圍棋被視為人類最后的智力自留地。從計算量上來說,圍棋的難度平均是國際象棋的1億倍。
當阿爾法狗以4:1贏得這場“事關(guān)人類命運”的一戰(zhàn),全世界的情緒都被攪動了起來:有人為人工智能的飛速進步歡欣鼓舞,也有人擔(dān)憂未來地球?qū)⒈粰C器人控制。而這一切背后的那個人——哈薩比斯,仍然低調(diào)地沉溺于他自己的世界。他說: “看到人工智能這個深奧難懂的事情成為人人都關(guān)注的話題,這很有趣?!?h3>阿爾法狗如何做到像人一樣“聰明”
對這場比賽,哈薩比斯超級期待,他甚至在正式比賽開始前,和谷歌前CEO埃里克?施密特分別坐在阿爾法狗和李世石的座位上下了一局。
3月9日,在首爾四季酒店,大戰(zhàn)終于開幕。第一局中,阿爾法狗一度不斷吃虧,直到150手深入李世石的領(lǐng)地,宣告了棋局的勝利。對此,李世石十分意外。哈薩比斯也為阿爾法狗的侵略性和大膽感到意外?!袄钍朗院脩?zhàn)聞名,比賽一開始,他就在整個棋盤上求戰(zhàn),但是沒有一處是真的;而阿爾法狗也戲耍了李世石。傳統(tǒng)的圍棋程序在局域計算中并不差,但是在需要通盤視野的時候會很無力?!?/p>
每天賽況一出,哈薩比斯都會在推特上發(fā)表感想。他一邊為自己的團隊感到驕傲,一邊為頑強的李世石喝彩。當李世石在第四局中贏了阿爾法狗之后,他發(fā)文說:“祝賀!今天他的表現(xiàn)太精彩了,把阿爾法狗逼入死地?!碑?shù)谖寰纸Y(jié)束之后,哈薩比斯評論說:“世界上最不可置信的游戲結(jié)束了,這必將進入歷史!”
阿爾法狗是如何做到像人一樣“聰明”的?首先,它的核心系統(tǒng)是,機器學(xué)習(xí)與神經(jīng)系統(tǒng)科學(xué)這兩個領(lǐng)域結(jié)合起來開發(fā)的學(xué)習(xí)算法;其次,它在谷歌強大的云計算系統(tǒng)中,通過大量數(shù)據(jù)分析學(xué)習(xí)了3000多萬步的職業(yè)棋手棋譜,再通過增強學(xué)習(xí)的方法自我博弈,尋找比基礎(chǔ)棋譜更好的棋路。這讓它有了類似人腦的功能:龐大數(shù)據(jù)庫;自我學(xué)習(xí),找到更好的解決方法;局面判斷準確率接近80%。
走出聚光燈的哈薩比斯,是個再普通不過的上班族。每晚他從倫敦國王十字車站搭地鐵回家,那是位于海格特、背靠山頂公園的一處房子。小小的玻璃門廊、粗糙質(zhì)感的白墻,門前的街道很幽靜。無論多忙,他都會與家人共進晚餐,他的妻子是一名來自意大利的分子生物學(xué)家,兩個兒子一個7歲,一個9歲。晚飯后,他陪著兒子玩耍、讀書,哄他們上床睡覺。
這里離哈薩比斯兒時的住處也不遠,在那里有很多美好的回憶。他從小就天賦異稟:4歲迷上國際象棋,兩周后就贏了爸爸;6歲獲得倫敦8歲以下錦標賽冠軍;9歲成為英國11歲以下國家象棋隊隊長;13歲取得了“國際象棋大師”頭銜。
1984年,8歲的哈薩比斯用自己贏得的獎金買了臺計算機,“這種機器是我們腦力的延伸。通過它們,我可以創(chuàng)造出比按部就班的日常生活更令人興奮的東西?!惫_比斯開始自學(xué)編程,因為沒什么零用錢,有一個夏天,他一直流連在報刊亭,翻閱買不起的計算機類雜志。
哈薩比斯的父親是希臘裔塞浦路斯人,母親則是華裔新加坡人,兩人都是教師,而且都是“現(xiàn)代技術(shù)恐懼者”。但對于這個整日沉迷于游戲的孩子,他們一點也不擔(dān)心,還興致勃勃地聽他分享心得。
高中畢業(yè)后,哈薩比斯就被視頻游戲公司“牛蛙”的老板看中,去做游戲開發(fā)。1994年,他開發(fā)的《主題公園》——最早包含人工智能元素的游戲之一,一發(fā)布就銷售了數(shù)百萬份。但到了1997年,他開發(fā)的《共和:革命》《邪惡天才》市場表現(xiàn)卻很一般。這讓哈薩比斯開始反思,“90年代,游戲很有趣,也有創(chuàng)新性。但到了新世紀,游戲注重圖像和內(nèi)容,想通過游戲這扇‘后門去展開人工智能研究已經(jīng)非常困難,這違背了我做游戲的初衷?!?/p>
從此,哈薩比斯這個資深游戲迷遠離了游戲,甚至對現(xiàn)在大型多人游戲感覺失望?!拔覐膩矶紵o法真正融入游戲,因為虛擬人物看起來傻傻的。他們沒有記憶,不會改變,也與環(huán)境無關(guān)。如果有學(xué)習(xí)型人工智能,游戲質(zhì)量就能提升到新水平?!?h3>21世紀的“阿波羅工程”
雄心勃勃的哈薩比斯想創(chuàng)造一個通用人工智能系統(tǒng)。在他看來,從智能語音助手Siri到人臉識別系統(tǒng),這些預(yù)設(shè)好程序的軟件只能掌握某項特定技能,屬于弱人工智能。而通用人工智能系統(tǒng)與以往技術(shù)最大區(qū)別在于自學(xué)能力,它可以從零學(xué)起,掌握任何技能,“就好像和人類做得一樣”,他稱之為21世紀的“阿波羅工程”。
2005年,哈薩比斯重返校園,到倫敦大學(xué)攻讀認知神經(jīng)科學(xué)博士學(xué)位?!霸谟螒蛐袠I(yè),我做了能做的所有一切,在成立‘深度思維之前我需要收集好必要的信息,這就是神經(jīng)科學(xué)——我希望從大腦解決問題的方式中獲得靈感。”他選擇研究海馬體,海馬體是人腦中主要負責(zé)記憶和學(xué)習(xí)的部位,短期記憶都儲存其中。
2016年3月,阿爾法狗與李世石對弈
哈薩比斯說,當時自己“對大腦的唯一了解就是它是個殼”。僅僅兩年后,他就開創(chuàng)性地發(fā)現(xiàn)海馬體和情景記憶間的聯(lián)系。他證明了因為海馬體受傷而患上健忘癥的人,在暢想未來的時候也有障礙,因此提出:大腦中與過去的記憶有關(guān)的部分,在規(guī)劃未來的時候也同樣至關(guān)重要。這項研究結(jié)果被《科學(xué)》雜志列入“年度十大突破”。
2010年,哈薩比斯與發(fā)小穆斯塔法?蘇萊曼、人工智能專家謝恩?萊格一起創(chuàng)辦了“深度思維”公司。公司一創(chuàng)立就引起了許多大佬注意,包括特斯拉創(chuàng)始人伊隆?馬斯克,2012年他投資了650萬美元。除了通用人工智能這個大方向,“深度思維”到底在干什么,大家都不清楚。
2013年12月,“深度思維”的第一次公開亮相震驚了眾人。在美國加州和內(nèi)華達州交界的太浩湖畔,“深度思維”向公眾展示了一款軟件。這款軟件并沒有被編入“如何玩游戲”的指令,但通過控制鍵盤,觀察顯示器分數(shù),經(jīng)過反復(fù)試錯之后,成為了一個專業(yè)級游戲高手。這證明軟件可以通過神經(jīng)模擬網(wǎng)絡(luò)處理數(shù)據(jù),像人腦一樣“本能地”學(xué)習(xí)。加州大學(xué)伯克利分校人工智能專家斯圖爾特?羅素感嘆道:“人們根本沒有想到當今的技術(shù)能達到這種水平?!?谷歌CEO拉里?佩奇也不吝贊美,這是“我多年以來見過的最驚人技術(shù)之一”。
一向?qū)τ谌斯ぶ悄苄嵊X靈敏的谷歌,看到“深度思維”這匹黑馬如何能不動心?2014年1月,谷歌完成了在歐洲最大的一筆收購,以4億英鎊(1英鎊約合9.3元人民幣)將“深度思維”納入麾下,盡管當時后者尚未實現(xiàn)商業(yè)盈利。之后,谷歌應(yīng)哈薩比斯的要求設(shè)立了道德監(jiān)察委員會,制定一系列限制條款,以確保人工智能技術(shù)不會被濫用。被收購后,哈薩比斯說:“這是20年精心計劃的結(jié)果。我教育經(jīng)歷中的每一步,我為團隊雇傭的每一個人,都是為了這一天的到來?!边@聽起來有點像一場漫長對弈中走出的一招妙棋。
在哈薩比斯的堅持下,“深度思維”依舊留在了倫敦,而不是搬到加州山景城的谷歌總部或者其他地方?!拔以诒眰惗爻錾㈤L大,我非常喜歡這座城市。” 他依舊是個超級工作狂。每天,他都要工作到夜里11點多;當午夜時分到來時,他開始了所謂的“第二天”,與美國的同事進行電話會議,一直到1點多;這之后才是他自己的思考時間,通常會持續(xù)到凌晨三四點。
“深度思維”原來有50名員工,現(xiàn)在有來自全球45個國家的近200人,占據(jù)了倫敦國王十字車站附近一棟6層大樓。每間辦公室都以天才來命名:特斯拉、拉馬努詹、柏拉圖、費曼、亞里士多德、居里夫人。一樓有咖啡廳和會客室,桌上足球游戲機、懶人沙發(fā)等更是一應(yīng)俱全。樓頂還有露臺,可以觀賞倫敦風(fēng)景,每周五晚的樓頂聚會已成慣例。公司還有跑步協(xié)會、足球隊、棋類協(xié)會。雖然互聯(lián)網(wǎng)行業(yè)人員流動很大,對手公司也試圖來挖墻腳,但“深度思維”從創(chuàng)建起離職率一直為零??磥?,哈薩比斯把自己對人腦的理解,不但用到了開發(fā)人工智能上,也完美地用到了企業(yè)管理上。
繼人工智能開發(fā)、企業(yè)發(fā)展之后,哈薩比斯還要回答第三個問題:人工智能的安全性。在阿爾法狗戰(zhàn)勝李世石后,人們尤為關(guān)注這個問題。“人工智能距離人腦的水平仍有幾十年的差距,我們才爬上了梯子的第一級。技術(shù)本身是中立的,但會受到設(shè)計者價值觀的影響,因此我們要非常謹慎地思考價值觀問題。”在哈薩比斯看來,說到底,這還是人類自身的問題。