肖文杰+沈從樂(lè)+徐濤+李蓉慧+葉雨晨
上帝死了。他又活了。
這樣描述胡盼盼那幾天的心情不算夸張。準(zhǔn)確地說(shuō),那幾天指的是3月9日至3月15日。這7天,舉行的可能是人類(lèi)歷史上迄今為止最重要的5盤(pán)圍棋比賽。對(duì)弈雙方是世界冠軍李世石和Alphabet旗下子公司DeepMind研發(fā)的人工智能(Artificial Intelligence,AI)系統(tǒng)AlphaGo。Go是圍棋的英譯名。這幾天在中文社交網(wǎng)絡(luò)上,AlphaGo被稱(chēng)為“阿 狗”。
李世石輸?shù)舻谝槐P(pán)后,胡盼盼晚上沒(méi)睡著覺(jué),她有些不甘心,認(rèn)為李世石輸在失誤上。胡盼盼曾休學(xué)4年在北京的道場(chǎng)學(xué)棋,參加過(guò)職業(yè)沖段賽,現(xiàn)在是一名圍棋教師。但接下來(lái),李世石連輸兩盤(pán),胡盼盼覺(jué)得自己對(duì)圍棋的信仰崩塌了:“原本我為圍棋里的虛的東西而著迷,認(rèn)為這是無(wú)法言明的,但現(xiàn)在看來(lái)不是。
圍棋一直被認(rèn)為是最復(fù)雜的策略性游戲,也是人工智能難以攻破的終極智力活動(dòng)。即使1997年,IBM的電腦“深藍(lán)”(Deep Blue)戰(zhàn)勝了當(dāng)時(shí)的國(guó)際象棋世界冠軍卡斯帕羅夫,大多數(shù)人仍然這么認(rèn)為。
深藍(lán)的原理很簡(jiǎn)單:依靠摩爾定律背書(shū)的超強(qiáng)計(jì)算能力窮盡每一步棋的可能性,選擇最優(yōu)解。國(guó)際象棋的棋局可能性約有10的47次方,而圍棋大約有10的170次方,比全宇宙已知的粒子總數(shù)多100個(gè)數(shù)量級(jí)。這意味著,摩爾定律無(wú)法戰(zhàn)勝?lài)濉?/p>
在此之前,最強(qiáng)的圍棋軟件僅能達(dá)到業(yè)余棋手的水平,它們能在局部圍出領(lǐng)地,但當(dāng)人類(lèi)突然轉(zhuǎn)移戰(zhàn)場(chǎng),或是擺出飄逸的布局時(shí),軟件很容易出現(xiàn)奇怪的錯(cuò)手,這就是所謂的“電腦棋”。
直覺(jué)、棋感、勢(shì),包括胡盼盼在內(nèi)的所有棋手將這些視為圍棋最與眾不同之處。
也許正是因?yàn)檫@些經(jīng)驗(yàn),在DeepMind發(fā)出挑戰(zhàn)書(shū)后,李世石只花了幾分鐘就答應(yīng)了。他認(rèn)為自己“必須以5:0或者4:1贏下”,如果輸?shù)脑?huà),“豈不是顯得人類(lèi)太綿軟無(wú)力了”。即使他知道,在去年10月,AlphaGo已經(jīng)首次戰(zhàn)勝了歐洲圍棋冠軍樊麾二段。
如果李世石知道得更多,他或許會(huì)謹(jǐn)慎一些。在樊麾輸給AlphaGo前兩個(gè)月,圍棋對(duì)弈平臺(tái)弈城圍棋網(wǎng)上,一個(gè)ID叫“deepmind”的棋手剛剛升入9D(準(zhǔn)職業(yè)水準(zhǔn))。要知道,2014年年初,剛注冊(cè)時(shí),deepmind還是5D(業(yè)余初段水準(zhǔn))。比飛速進(jìn)步更不尋常的是,它的進(jìn)步不是漸進(jìn)式的,而是在一個(gè)等級(jí)上停留一陣后,突然躍升一個(gè)檔次。
與樊麾的對(duì)戰(zhàn)棋譜公布后,AlphaGo的開(kāi)發(fā)者之一黃士杰(Aja Huang)承認(rèn)是他注冊(cè)了deepmind這一賬號(hào),但否認(rèn)賬號(hào)背后是AlphaGo在下棋。2月底,9D“棋手”deepmind開(kāi)始在弈城圍棋網(wǎng)上與真正的職業(yè)選手對(duì)戰(zhàn),互有勝負(fù)。
柯潔九段不久前剛剛戰(zhàn)勝李世石獲得世界冠軍,看到AlphaGo和樊麾的對(duì)戰(zhàn)棋譜他很吃驚,因?yàn)檫@個(gè)AI沒(méi)有下“電腦棋”。
不懂電腦的他開(kāi)始搜索蒙特卡洛算法、深度學(xué)習(xí)等信息,并在接受采訪(fǎng)時(shí)向科技記者打聽(tīng)原理。他大概理解了AI能不斷進(jìn)步,但即便如此,他也不相信AlphaGo能在5個(gè)月內(nèi)從準(zhǔn)職業(yè)“選手”變成頂尖高手。
幾乎所有的職業(yè)棋手都不看好AlphaGo,他們等著李世石在3月9日捍衛(wèi)尊嚴(yán)。而DeepMind的CEO哈薩比斯只是平淡地說(shuō):“我們測(cè)試的結(jié)果不太一樣?!?/p>
誰(shuí)也沒(méi)想到李世石會(huì)連輸3盤(pán)。
第二盤(pán)對(duì)柯潔的沖擊尤其大。李世石在沒(méi)有巨大失誤的情況下完敗。胡盼盼則被AlphaGo的第37手徹底震撼,這步棋初看損失巨大,“如果職業(yè)選手這么下會(huì)被罵死”,但隨著棋局深入,胡盼盼越發(fā)懷疑自己的判斷,她覺(jué)得37手有可能是步極有遠(yuǎn)見(jiàn)的好棋。
柯潔在李世石輸?shù)舻谝槐P(pán)后發(fā)布并置頂了一條微博:“就算阿法狗戰(zhàn)勝了李世石,但它贏不了我。”而在李世石輸?shù)舻谌P(pán)后,這條微博被撤下了置頂。
樊麾則以日本名譽(yù)棋圣藤澤秀行的話(huà)做了評(píng)價(jià):“棋道一百,我只知七?!?/p>
這時(shí),AI專(zhuān)家以外的人才意識(shí)到,AlphaGo與之前所有的圍棋電腦都不一樣。它像人一樣懂得布局、判斷大勢(shì),它計(jì)算精準(zhǔn)、棋風(fēng)穩(wěn)健,胡盼盼評(píng)價(jià)它下棋像李昌鎬。在李世石之前,李昌鎬曾稱(chēng)霸世界棋壇十幾年,因?yàn)閮?nèi)心強(qiáng)大,被稱(chēng)為“石佛”。
柯潔的焦慮很直接?!爱?dāng)時(shí)就覺(jué)得下棋沒(méi)意思了。以后職業(yè)棋手可能不再是圍棋的權(quán)威。一個(gè)入門(mén)級(jí)別的觀(guān)眾在看直播時(shí)都可以通過(guò)AI來(lái)點(diǎn)評(píng)這步棋。作為競(jìng)技的樂(lè)趣大打折扣?!彼麑?duì)《第一財(cái)經(jīng)周刊》說(shuō)。
如今,即使是對(duì)圍棋和人工智能都不了解的人,都能簡(jiǎn)述AlphaGo兩個(gè)網(wǎng)絡(luò)的決策模式:“策略網(wǎng)絡(luò)”(policy network)推薦幾種下法,“價(jià)值網(wǎng)絡(luò)”(value network)評(píng)估這幾步棋的優(yōu)劣,選擇勝率最大的一手。這種模式與人類(lèi)落子的決策類(lèi)似,通過(guò)對(duì)3000多萬(wàn)盤(pán)棋的深度學(xué)習(xí)(deep learning),它成了頂尖高手。
某種程度上,人工智能把圍棋“祛魅”了。
人們的心態(tài)在變化。一些職業(yè)棋手開(kāi)始下賭注,不服氣的就賭李世石贏,另一些從理性出發(fā)賭阿狗贏,但內(nèi)心希望自己賭輸。
焦慮不僅僅屬于不安的棋手和圍棋愛(ài)好者。Google的一份內(nèi)部報(bào)告顯示,全球約6000萬(wàn)人觀(guān)看了首場(chǎng)比賽。1997年,深藍(lán)的國(guó)際象棋比賽以流媒體方式在網(wǎng)上直播,觀(guān)眾數(shù)量以百萬(wàn)計(jì)。
一個(gè)普遍的疑問(wèn)是,如果代表最出色的智力和策略決策的圍棋冠軍也能被打敗,那么人類(lèi)會(huì)不會(huì)被機(jī)器打???
和李世石一樣,大多數(shù)人沒(méi)意識(shí)到現(xiàn)在人工智能已經(jīng)能做哪些事情。
在這場(chǎng)比賽之前,人工智能技術(shù)已應(yīng)用到了Google的30多款產(chǎn)品中,用來(lái)改善搜索效果,例如如果搜索一部電影,它很可能會(huì)把周邊電影院的排片表也順便告訴了你,而如果你用Google Now,它會(huì)根據(jù)你的路程和路況告訴你應(yīng)該提前多久啟程。
事實(shí)上,人工智能不單單是邏輯推理和決策,如果將人工智能視為對(duì)人類(lèi)能力的模擬,那科學(xué)家在視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)、精細(xì)動(dòng)作等方面的模擬都有了許多突破。
在摩爾定律的影響下,傳感器越來(lái)越便宜并能捕捉更多的環(huán)境數(shù)據(jù),而算法上的突破能讓人工智能利用這些環(huán)境數(shù)據(jù)不斷做出反饋。“相比深藍(lán),AlphaGo有一定自主的學(xué)習(xí)能力和判斷能力,并在算法上有根本的提升?!逼テ澅ご髮W(xué)進(jìn)化智能實(shí)驗(yàn)室主任陳怡然對(duì)《第一財(cái)經(jīng)周刊》說(shuō)。
“人們?cè)J(rèn)為計(jì)算機(jī)不擅長(zhǎng)解決那些由于答案主觀(guān)而難以衡量的問(wèn)題,但如果有一些數(shù)據(jù)和結(jié)果相關(guān)聯(lián),并且你可以試著建模,那么那些曾被認(rèn)為需要由人類(lèi)主觀(guān)判斷的問(wèn)題,完全可以用一種我們此前不曾想到的方式來(lái)解決?!盨hawndra Hill說(shuō),她是沃頓商學(xué)院運(yùn)營(yíng)、信息管理與決策專(zhuān)業(yè)的兼任教授。
即使沒(méi)有意識(shí)到,很多普通人都已經(jīng)在使用人工智能技術(shù)—如果你曾調(diào)戲過(guò)iPhone中的Siri,或微軟的Cortana,它們被賦予“聽(tīng)覺(jué)”,能識(shí)別不同人的話(huà)語(yǔ),并給出回答。
在模擬人類(lèi)精細(xì)動(dòng)作方面,和DeepMind同屬一個(gè)母公司的波士頓動(dòng)力(Boston Dynamics)發(fā)布了新一代人型機(jī)器人Atlas。即使在雪地里,它也能像人一樣走路,被實(shí)驗(yàn)人員踹倒后也能自己爬起來(lái)。如果你看過(guò)那個(gè)用“DARPA(美國(guó)國(guó)防部國(guó)防高等研究計(jì)劃署)機(jī)器人大賽”剪輯成的搞笑視頻,你會(huì)知道直到一兩年前,大多數(shù)人型機(jī)器人還沒(méi)法正常走路、開(kāi)門(mén)或撿東西。
但如今,像職業(yè)棋手那樣工作的人工智能,已滲透到不同的角落。在勝任重復(fù)性的精確工作并代替了流水線(xiàn)上的工人后,人工智能也在星巴克這樣的連鎖零售公司中承擔(dān)排班工作,或化身無(wú)人機(jī)對(duì)照?qǐng)D紙監(jiān)督建筑工地進(jìn)度。(詳見(jiàn)《第一財(cái)經(jīng)周刊》第383期大公司特寫(xiě)《我的上司是機(jī)器人》)
2011年,IBM的人工智能Watson還只是以稱(chēng)霸智力競(jìng)猜電視節(jié)目《危險(xiǎn)邊緣》(Jepardy)聞名。但現(xiàn)在,它已經(jīng)與北美十幾家癌癥治療機(jī)構(gòu)合作。
2013年,牛津大學(xué)發(fā)布了一份叫做《就業(yè)的未來(lái)》的報(bào)告。它警告說(shuō),未來(lái),美國(guó)47%的職位將被機(jī)器代替,包括管理、金融銷(xiāo)售、藝術(shù)家。美國(guó)萊斯大學(xué)(Rice University)的科學(xué)家Moshe Vardi甚至為這個(gè)預(yù)言加了一個(gè)時(shí)限—2045年。
面對(duì)悲觀(guān)的論調(diào),棋手們的心情卻發(fā)生了逆轉(zhuǎn)。在3場(chǎng)全敗之后,柯潔說(shuō),如果AlphaGo能像App那樣方便,那“我肯定可以用它來(lái)精進(jìn)棋藝”。一個(gè)事實(shí)是,柯潔早就在用不那么聰明的AI來(lái)提高棋藝。網(wǎng)絡(luò)對(duì)弈是新一代棋手主要的訓(xùn)練方式,這使得他們的訓(xùn)練量比上一代棋手更大?!吧钏{(lán)”戰(zhàn)勝卡斯帕羅夫19年以來(lái),國(guó)際象棋的棋手們也像這樣改變了傳統(tǒng)的訓(xùn)練方式。
柯潔每年下上千盤(pán)網(wǎng)棋,在圍棋網(wǎng)站上,他的ID是“潛伏”。
在經(jīng)歷了4個(gè)不眠之夜后,胡盼盼也逐漸接受了事實(shí),她和同為業(yè)余圍棋高手的丈夫不再視AI為可怕的敵人,而是完美的老師,他們想盡快跟AlphaGo學(xué)棋。
那些更早接觸AI,并思考AI和人類(lèi)未來(lái)的人,看起來(lái)都有類(lèi)似觀(guān)點(diǎn)。
普利策獎(jiǎng)得主、《紐約時(shí)報(bào)》駐硅谷記者約翰·馬爾科夫(John Markoff)就將自己的新書(shū)命名為《與機(jī)器人共舞》,他認(rèn)為未來(lái)人工智能能幫助人類(lèi)提升效率,人類(lèi)不擅長(zhǎng)的地方,機(jī)器人可能很擅長(zhǎng),比如計(jì)算、重復(fù)勞動(dòng)和邏輯推斷;但人類(lèi)習(xí)以為常的小事,機(jī)器卻難以達(dá)到,比如察言觀(guān)色、安慰小孩,甚至倒一杯咖啡。這類(lèi)人工智能的準(zhǔn)確稱(chēng)呼應(yīng)該是智能增強(qiáng)(Intelligence Augmentation)。
對(duì)于亟需勞動(dòng)力的市場(chǎng)來(lái)說(shuō),人工智能的廣泛民用將會(huì)帶來(lái)變化。事實(shí)上,除了非洲,全球絕大多數(shù)地區(qū)都面臨老齡化和勞動(dòng)力短缺的威脅。工業(yè)革命時(shí)期,機(jī)器的普及讓英國(guó)的農(nóng)業(yè)人口比例從30%下降到5%,同時(shí)催生出更多工作種類(lèi)。
但技術(shù)帶來(lái)的變化是未知的,這或許是恐慌的根源。不過(guò)這也迫使人思考,什么是機(jī)器擅長(zhǎng)的,而什么不是—更重要的可能是思考人之所以為人的那些特質(zhì):情感,毅力,反思,溝通,不按常理出牌,以及想辦法克服逆境。
為了更了解自身,人們需要更了解機(jī)器。
馬爾科夫描述了AI和IA這兩大陣營(yíng)的關(guān)系。在汽車(chē)問(wèn)題上,Google選擇了無(wú)人車(chē),豐田、通用、特斯拉等公司則選擇用技術(shù)輔助駕駛員減少事故。另外,你可以把正在艱難學(xué)習(xí)人類(lèi)幽默感的Siri看做AI,而把純粹的工作助手Google Now看做IA。
盡管所秉承的技術(shù)方向相反,但目前兩者的差別沒(méi)有那么大,所采用的技術(shù)(比如名聲大噪的深度學(xué)習(xí))也類(lèi)似。兩種思路會(huì)并存于一個(gè)公司內(nèi),專(zhuān)家們也在兩個(gè)陣營(yíng)間轉(zhuǎn)換。
最近的技術(shù)進(jìn)步已經(jīng)顯示,下一個(gè)像iPhone一樣改變一切的產(chǎn)品將誕生在人工智能領(lǐng)域。它可能是醫(yī)療機(jī)器人、無(wú)人車(chē)或是一個(gè)現(xiàn)實(shí)版的大白?!叭斯ぶ悄軐?duì)人類(lèi)社會(huì)的影響將遠(yuǎn)超互聯(lián)網(wǎng)和計(jì)算機(jī)在過(guò)去30年所做的?!奔s翰·馬爾科夫(John Markoff)對(duì)《第一財(cái)經(jīng)周刊》說(shuō)。
真正需要為AlphaGo擔(dān)心的,可能是來(lái)自Facebook的對(duì)手。與硅谷其他創(chuàng)新不同,人工智能的主要競(jìng)爭(zhēng)發(fā)生在巨頭之間,獨(dú)立的創(chuàng)業(yè)公司很難擠進(jìn)戰(zhàn)場(chǎng)。Facebook也有一個(gè)圍棋AI項(xiàng)目,并被認(rèn)為處于領(lǐng)先地位,戰(zhàn)勝過(guò)AlphaGo以外的所有AI,但還沒(méi)贏過(guò)職業(yè)選手。
“對(duì)數(shù)據(jù)的巨大需求,這種研究的投入不是創(chuàng)業(yè)公司能承擔(dān)的。投資者也未必能準(zhǔn)確判斷。推動(dòng)這個(gè)領(lǐng)域的是大公司和政府?!绷闶蹤C(jī)器人助理公司Fellow Robots的方正欽(James Fahn)對(duì)《第一財(cái)經(jīng)周刊》說(shuō)。
大公司的責(zé)任會(huì)變得空前地大。人工智能與先前的技術(shù)的不同之處在于,它的發(fā)展很大程度上由看得見(jiàn)、摸得著的少數(shù)科學(xué)精英決定。硅谷元老杰里·卡普蘭(Jerry Kaplan),曾警告他在斯坦福大學(xué)人工智能實(shí)驗(yàn)室的后輩:“你們今天寫(xiě)入系統(tǒng)的內(nèi)容,日后可能決定整個(gè)社會(huì)處理問(wèn)題的方式。”
這也是為什么人們對(duì)此總是特別小心。對(duì)“終結(jié)者”的恐懼當(dāng)然不會(huì)完全消失。這也是為什么伊隆·馬斯克要建立非盈利組織OpenAI,并呼吁法律束縛住人工智能研究的手腳。
馬爾科夫在新書(shū)的前言中引用了“控制論之父”諾伯特·維納的一句話(huà):“我們可以謙遜地在機(jī)器的幫助下過(guò)上好日子,也可以傲慢地死去。”
就在逐漸承認(rèn)AI對(duì)圍棋的統(tǒng)治后,胡盼盼又一次被沖擊了—3月13日,李世石贏了第四盤(pán)。
他設(shè)計(jì)了一個(gè)龐大的誘導(dǎo)戰(zhàn)術(shù),讓AlphaGo誤以為處于優(yōu)勢(shì),然后突然在78手使出從未有過(guò)的招數(shù),打破了對(duì)手看似牢固的優(yōu)勢(shì),之后AlphaGo連下兩著錯(cuò)棋。
DeepMind又一次對(duì)李世石表示贊揚(yáng)—這次可能更真心一些—這次比賽的重要目的之一就是讓頂尖選手來(lái)測(cè)試AlphaGo的漏洞。
在告訴記者“下棋沒(méi)意思”之后5分鐘,柯潔就坐到了電腦前,登錄弈城圍棋網(wǎng),以“潛伏”之名繼續(xù)一場(chǎng)網(wǎng)絡(luò)十番棋,對(duì)手是韓國(guó)頂級(jí)棋手樸廷桓。柯潔贏了。
胡盼盼為學(xué)生準(zhǔn)備好的關(guān)于人機(jī)比賽的發(fā)言沒(méi)有用上。不到10歲的棋童們似乎對(duì)這場(chǎng)金字塔尖的風(fēng)暴所知甚少。在李世石扳回一盤(pán)后,胡盼盼和丈夫出去吃了頓飯慶祝。他們沒(méi)像之前那樣對(duì)最后一盤(pán)下注,只想看場(chǎng)好棋。
就勝敗而言,人類(lèi)輸了。但圍棋還是那個(gè)古老而誘人的游戲。
柯潔在13日當(dāng)晚發(fā)布了一張照片,看上去是一場(chǎng)職業(yè)棋手的聚會(huì),柯潔似乎睡著了,桌上是空了的啤酒瓶,一旁的古力看上去心情不錯(cuò)。那條被轉(zhuǎn)發(fā)3萬(wàn)多次,先前撤銷(xiāo)置頂?shù)奈⒉衷俅伪恢庙斄恕?p>