朱信明
Master“審視”著棋盤的361個(gè)交叉點(diǎn),迅速計(jì)算其中的可能性,試圖在變化萬(wàn)千的對(duì)弈中,尋找最佳落點(diǎn)。
與此同時(shí),還在度假的黃士杰博士坐在臺(tái)灣的家里,按照Master計(jì)算出的結(jié)果,移動(dòng)鼠標(biāo),將棋子落入棋局。在網(wǎng)絡(luò)的另一端,面對(duì)電腦屏幕的中日韓三國(guó)棋手們,一次又一次陷入困局。
作為替AlphaGo落子的“人肉臂”,黃士杰見(jiàn)證了人類太多的失?。鹤畛?,愛(ài)好圍棋的同事們被擊潰;歐洲冠軍樊麾在內(nèi)部測(cè)試中認(rèn)輸;在2016年3月的人機(jī)大戰(zhàn)中,世界冠軍李世石落敗。而現(xiàn)在,他要做的是挑戰(zhàn)一群頂尖棋手,與他搭檔的則是再次進(jìn)化了的AlphaGo。
穿“馬甲”的AlphaGo
2016年12月29日,大二學(xué)生喬智健白天一直忙于應(yīng)付期末考試,直到晚上才有空上網(wǎng)看會(huì)兒棋。
夜里11點(diǎn),上海外國(guó)語(yǔ)大學(xué)的宿舍樓熄燈了。喬智健打開(kāi)折疊臺(tái)燈,白光灑在課桌和他的身前,將自己和漆黑的寢室分隔開(kāi)來(lái)。筆記本電腦的屏幕上突然跳出對(duì)弈邀請(qǐng),身份信息顯示為韓國(guó)職業(yè)選手Magister。一天后它又改名為Master。上線后,它一直在尋找職業(yè)棋手對(duì)弈。
這個(gè)陌生賬號(hào)已經(jīng)拿到六連勝,作為職業(yè)四段棋手,喬智健覺(jué)得對(duì)方還有點(diǎn)水平,他接受了對(duì)弈邀請(qǐng)。雖然從沒(méi)有看過(guò)這家伙下過(guò)的棋,但他感覺(jué)贏這個(gè)新面孔的機(jī)會(huì)很大,于是把自己賬號(hào)里的4億多虛擬幣都押出來(lái),賭自己勝。
這一局喬智健下得很平穩(wěn),起初雙方形勢(shì)還算接近,可沒(méi)過(guò)多久執(zhí)白棋的他明顯感覺(jué)到形勢(shì)不妙。左側(cè)白棋的生存空間被黑棋壓縮到極小范圍,下快棋讓他沒(méi)有太多思考時(shí)間,一手緊接著一手落子,他漸漸意識(shí)到自己已經(jīng)輸了太多,沒(méi)機(jī)會(huì)了。
輸了棋,喬智健趕緊翻出對(duì)手前幾局的棋譜,“基本就是人工智能,”他解釋說(shuō),“我們一般對(duì)頂尖棋手都比較了解,突然出現(xiàn)一個(gè)特別厲害的,又不知道是誰(shuí),看他的棋譜基本就能猜出來(lái)?!?/p>
事實(shí)上,AlphaGo披著“小號(hào)”上線的第一天,職業(yè)棋手盡數(shù)落敗的消息就在圍棋圈內(nèi)傳開(kāi)了。人們猜測(cè)著這個(gè)賬號(hào)的身份,是人還是機(jī)器?圍棋對(duì)戰(zhàn)平臺(tái)弈城網(wǎng)編輯曲江在聊天室里看到,網(wǎng)友已經(jīng)開(kāi)始說(shuō)那就是AlphaGo了。因?yàn)椴恢准?xì),29日當(dāng)天,有些接到邀請(qǐng)的棋手拒絕了對(duì)弈機(jī)會(huì)。喬智健就認(rèn)識(shí)其中的兩位,得知真相時(shí),他倆“感覺(jué)損失了幾個(gè)億”。
后知后覺(jué)的喬智健完成了他職業(yè)生涯里首次和人工智能的對(duì)弈?!拔野涯苎旱亩佳荷狭?,完全就是在送。”雖然輸光了全部“財(cái)產(chǎn)”,但之后知道Master就是AlphaGo時(shí),他覺(jué)得“學(xué)費(fèi)”交得值。
與多數(shù)人一樣,喬智健也是在人機(jī)大戰(zhàn)時(shí)才開(kāi)始了解人工智能的。比賽的那幾天,他一邊上課一邊偷偷地在手機(jī)上看直播。當(dāng)時(shí)他覺(jué)得AlphaGo下得不好,結(jié)果4比1獲勝;在自己輸?shù)舻倪@局中,他也覺(jué)得AlphaGo并不是每手棋都下在完美的位置,但就是能贏。“我只分析出一部分的原因,想要全部理解還需要花很多時(shí)間?!?/p>
其實(shí),和AlphaGo下棋的機(jī)會(huì)早就有,只是當(dāng)時(shí)很少有人注意到這個(gè)無(wú)名小卒。從2014年上半年開(kāi)始,AlphaGo就已經(jīng)在圍棋對(duì)戰(zhàn)平臺(tái)弈城網(wǎng)上下棋了。
曲江向記者介紹,當(dāng)時(shí)它化名“Deepmind”,大部分時(shí)間都在和業(yè)余棋手對(duì)弈,互有輸贏地下了一年多,從注冊(cè)時(shí)填寫的業(yè)余5段棋力升到業(yè)余9段,并且在2015年年底第一次擊敗網(wǎng)站上的職業(yè)棋手。直到2016年3月的人機(jī)大戰(zhàn)結(jié)束后,Deepmind公司創(chuàng)始人戴密斯·哈薩比斯才承認(rèn)這是AlphaGo的小號(hào)。這時(shí),他已經(jīng)在弈城網(wǎng)下了近500局棋。
2016年12月16日晚8點(diǎn),弈城網(wǎng)的合作方韓國(guó)Tygem公司收到黃士杰的電子郵件,“我們計(jì)劃讓AlphaGo在Tygem進(jìn)行測(cè)試,希望能夠?yàn)锳lphaGo設(shè)立一個(gè)國(guó)籍為韓國(guó)的ID——Master?!?/p>
“那肯定受傷”
第一批職業(yè)棋手在1月2日這天戰(zhàn)敗后,有人坐不住了。韓國(guó)等級(jí)分排名第一的樸廷桓、中國(guó)名人戰(zhàn)冠軍連笑、世界等級(jí)分第一的柯潔等國(guó)內(nèi)外頂尖棋手都主動(dòng)應(yīng)戰(zhàn),在之后的兩天各路棋手連戰(zhàn)連敗,三天輸了30局。
不再只是圍棋界,整個(gè)人類世界都一下子打起精神來(lái)。分析這個(gè)賬號(hào)棋路的帖子、網(wǎng)友猜測(cè)賬號(hào)身份的段子彌漫整個(gè)網(wǎng)絡(luò),對(duì)于職業(yè)棋手們來(lái)說(shuō),感情則復(fù)雜了許多。
圍棋是一項(xiàng)爭(zhēng)勝負(fù)的游戲,棋手們被稱作“勝負(fù)師”。但對(duì)于人工智能而言,它根本就無(wú)所謂尊嚴(yán)。一場(chǎng)圍棋對(duì)弈里的選擇沒(méi)有“最佳、次佳和欠妥”的區(qū)別,它的選擇只有一個(gè)——基于當(dāng)前狀況下計(jì)算得出的最優(yōu)解。
圍棋是單純的計(jì)算游戲,與情感無(wú)關(guān)。
敗于AlphaGo的樊麾這樣形容對(duì)手:“……就是一個(gè)虛無(wú),但卻完全能把握住你的性格?!?/p>
在和電腦爭(zhēng)勝負(fù)的過(guò)程中,人類棋手們?cè)純?yōu)勢(shì)。雖然十多年前的圍棋軟件還算不上人工智能,但當(dāng)喬智健還是個(gè)6歲棋童時(shí),就已經(jīng)在虐電腦了。臺(tái)灣首位世界冠軍周俊勛從2008年開(kāi)始參加一些對(duì)戰(zhàn)人工智能的測(cè)試,起初可以讓電腦7個(gè)子,隔年再參加測(cè)試時(shí),讓子就會(huì)輸棋。電腦棋力飛漲,棋手開(kāi)始反過(guò)來(lái)被虐。對(duì)于“勝負(fù)師”們來(lái)說(shuō),這是個(gè)嚴(yán)重的問(wèn)題。
喬智健來(lái)杭州參加比賽,住在天元大廈的棋手們只要碰到一起,基本上都要聊這個(gè)在弈城網(wǎng)連贏30局,又跑到野狐網(wǎng)繼續(xù)贏棋的人工智能。
這家伙除了元旦當(dāng)日休息,6天里平均每天贏10局,節(jié)奏穩(wěn)得很,棋力也強(qiáng)太多。曲江發(fā)現(xiàn),棋手們都興奮起來(lái)了。“他們從小學(xué)棋,對(duì)棋的探索是一種本能,或者說(shuō)是人生目標(biāo)?!辈簧偃硕继岢鲆蚆aster過(guò)招,但等候的隊(duì)伍在網(wǎng)上排得老長(zhǎng)。圍棋國(guó)手古力一直在網(wǎng)上盯著看,國(guó)家隊(duì)的群里,對(duì)棋局的感想隨時(shí)都在更新著。
60局棋看下來(lái),棋手們覺(jué)得有點(diǎn)蒙,如果說(shuō)人機(jī)大戰(zhàn),李世石用一場(chǎng)勝利為人類保留了希望,那這次的連續(xù)失敗算是徹底讓棋手們放棄了在快棋上戰(zhàn)勝AlphaGo的念頭。
在圍棋界,棋手根據(jù)棋盤上黑白雙方的對(duì)抗情況,對(duì)比賽結(jié)果做出預(yù)判,如果一方在比賽中局提前放棄,對(duì)手即取得“中盤勝”,意思就是棋局進(jìn)行不下去了,提前認(rèn)輸。這意味著對(duì)弈雙方的實(shí)力差距較大,Master的“戰(zhàn)績(jī)”里,大多以中盤勝作為結(jié)局。
世界排名第一的職業(yè)九段棋手柯潔發(fā)微博說(shuō):“多么希望網(wǎng)上的快棋人類能贏一盤。”情況就好像AlphaGo挑戰(zhàn)李世石的翻版,盼望能有一勝成為大家僅存的愿望。
已經(jīng)拿下8個(gè)世界冠軍的古力在接受采訪時(shí)感慨:想要理解AlphaGo還比較難,可能剛理解了一招,它就換了一招,結(jié)果又看不懂了,短時(shí)間內(nèi)似乎難以跟上它的步伐?!八南敕ê臀覀兒孟癫辉谝粋€(gè)維度上?!惫帕€在網(wǎng)上懸賞10萬(wàn)元獎(jiǎng)勵(lì)贏棋的人類棋手,但這筆錢根本就沒(méi)機(jī)會(huì)送出去。
“感覺(jué)職業(yè)尊嚴(yán)有點(diǎn)受傷嗎?”
古力回答:“那肯定受傷?!?/p>
1月3日晚的最后一役,Master對(duì)陣柯潔,古力稱之為 “最后防線”。此時(shí),距離柯潔放出“就算AlphaGo戰(zhàn)勝李世石,但他贏不了我”的狠話,已經(jīng)過(guò)去近10個(gè)月的時(shí)間。
但他還是輸了。
攪 局
2016年12月29日到2017年1月4日,整個(gè)圍棋界好像經(jīng)歷了一場(chǎng)大地震?,F(xiàn)在看來(lái),這是遲早會(huì)發(fā)生的事情。
圍棋對(duì)弈網(wǎng)站野狐網(wǎng)總經(jīng)理耿進(jìn)告訴記者:人機(jī)大戰(zhàn)后,野狐網(wǎng)根據(jù)谷歌的要求,提供了數(shù)千萬(wàn)張棋譜,職業(yè)九段棋手的棋譜只是其中的一部分。
2016年11月18日,黃士杰在臉書上說(shuō):“最近我的一個(gè)心得是,人的進(jìn)步最多是用跑的,電腦的進(jìn)步卻是用飛的。”有網(wǎng)友留言詢問(wèn),是不是已經(jīng)準(zhǔn)備好和世界第一的柯潔正式比賽了?最終呈現(xiàn)給人們的就是這場(chǎng)“地震”——這只是AlphaGo開(kāi)小號(hào)上網(wǎng)測(cè)試棋力,而非正式比賽。但對(duì)手可不止柯潔這么一個(gè)世界冠軍。
離開(kāi)弈城網(wǎng)后,AlphaGo轉(zhuǎn)戰(zhàn)至與騰訊合作的野狐網(wǎng)。黃士杰、古力和耿進(jìn)建了一個(gè)微信群,三個(gè)人在里面商量對(duì)弈人選,然后由古力和耿進(jìn)負(fù)責(zé)出面邀請(qǐng)。主要的范圍圈定在等級(jí)分排在前面的棋手,這些人不是世界冠軍就是國(guó)家冠軍。安排好比賽順序后,棋手們上線等待黃士杰發(fā)送對(duì)弈邀請(qǐng),只能下快棋,30秒一手。
之前耿進(jìn)曾向黃士杰建議,給他一個(gè)自動(dòng)下棋的協(xié)議,好減輕他的工作量。因?yàn)閾?dān)心安全問(wèn)題,黃士杰堅(jiān)持手動(dòng)操作,替AlphaGo一步步地落子。臺(tái)灣和內(nèi)地之間的網(wǎng)絡(luò),在晚上7點(diǎn)半到9點(diǎn)半這一時(shí)間段非常擁堵,為了保證網(wǎng)絡(luò)順暢,野狐還找騰訊云派了將近30個(gè)人提供技術(shù)保障。
一切準(zhǔn)備妥當(dāng),AlphaGo繼續(xù)在野狐網(wǎng)上進(jìn)行剩下的三十場(chǎng)棋。
在人類棋手面前,AlphaGo好像擁有某種神秘力量一般,幾乎都是下著下著,棋手的棋就沒(méi)希望了?!盁o(wú)論柯潔還是韓國(guó)的樸廷桓,好像都是下一會(huì)兒就不太行了。”古力說(shuō)。他發(fā)現(xiàn)現(xiàn)在的AlphaGo布局新穎,而且中盤以后的招法,很多都跟人類棋手的價(jià)值判斷不太一樣。
聶衛(wèi)平聽(tīng)說(shuō)網(wǎng)上有這么一個(gè)“興風(fēng)作浪”的人工智能后,特意讓人把棋譜調(diào)出來(lái)分析,發(fā)現(xiàn)這家伙完全不按套路來(lái)。和樸廷桓對(duì)弈時(shí),AlphaGo執(zhí)黑棋在棋局初始階段就沿著邊路連下數(shù)子,都說(shuō)“七子沿邊活亦輸”,因?yàn)檎疾坏教嗟乇P,這樣的下法聶衛(wèi)平實(shí)在難以認(rèn)同??扇思揖瓦@么下了,也這么贏了。和羋昱廷對(duì)弈,AlphaGo“下錯(cuò)”了大雪崩定式,這個(gè)圍棋定式除了50多年前,由吳清源將外拐改成內(nèi)拐,就幾乎再?zèng)]變化。聶衛(wèi)平說(shuō):“就像一位不懂復(fù)雜定式的業(yè)余棋手一樣,這個(gè)時(shí)候竟然選擇扳了一手!將定式也改變了。”
人們?cè)俅蜗肫鹑毡局麌迤迨刻贊尚阈械哪蔷湓挘骸捌宓酪话?,我只知七。”AlphaGo的再次出山,攪動(dòng)了整個(gè)圍棋界。
“Now,I am the master.”
持續(xù)7天的對(duì)弈徹底火了,外國(guó)媒體Science New在臉書發(fā)布新聞時(shí),寫下了“AlphaGo:“Now,I am the master.”。
這句話出自科幻電影《星球大戰(zhàn)》。達(dá)斯·維達(dá)認(rèn)為自己的能力已經(jīng)超過(guò)師父歐比旺,他說(shuō):“我離開(kāi)你時(shí)還只是個(gè)學(xué)徒,現(xiàn)在,我是大師了?!?/p>
具備自我學(xué)習(xí)能力的AlphaGo確實(shí)已經(jīng)是實(shí)至名歸的大師了。當(dāng)完成50局對(duì)弈后,能請(qǐng)到的高手已經(jīng)差不多都下過(guò)了,有的甚至下過(guò)好幾局。
耿進(jìn)問(wèn)黃士杰:“可不可以請(qǐng)聶老下一盤?”
“這是我們的榮幸!”黃士杰回答。
通過(guò)聶衛(wèi)平的兒子,耿進(jìn)聯(lián)系到這位中國(guó)棋圣。此時(shí),眼看著高手紛紛落敗,連世界第一的柯潔都力不能勝,網(wǎng)友們開(kāi)始呼喚“棋圣”出山。
聶衛(wèi)平幾乎不下網(wǎng)棋,但他痛快地答應(yīng)接受對(duì)弈邀請(qǐng)。為了保證對(duì)局順利進(jìn)行,他被接到野狐網(wǎng)的辦公室。
“您坐哪兒?”
聶衛(wèi)平指了指辦公室角落里的一張大辦公桌,“我坐這兒”。那是耿進(jìn)的位置。他給聶衛(wèi)平遞上水點(diǎn)上煙,連接好筆記本電腦,把其他人都關(guān)在辦公室外面。就他和聶衛(wèi)平兩個(gè)人待在屋子里,等著AlphaGo的邀請(qǐng)。
之前耿進(jìn)和黃士杰商量,30秒一手太快了,聶衛(wèi)平年齡在這兒,“可不可以調(diào)長(zhǎng)一點(diǎn),調(diào)到40秒”。
黃博士回答:“應(yīng)該的?!比缓髮r(shí)限調(diào)成60秒一手。
聶衛(wèi)平執(zhí)白棋。他左臂支在桌面,右手移動(dòng)鼠標(biāo),還是保持著老習(xí)慣,在下棋的過(guò)程中,嘟囔幾句日語(yǔ)。他布局不錯(cuò),將局面打散,降低黑棋的效率。然而在第58手,他下錯(cuò)了棋。如果這枚白子落在旁邊的交叉點(diǎn)上,僅僅這么一步之遙的距離,就可以讓棋盤右上角的白棋都活下來(lái),相對(duì)的,在外圍的黑棋卻尚未形成優(yōu)勢(shì)。
AlphaGo抓住這個(gè)機(jī)會(huì),第59手,黑子落在聶衛(wèi)平本打算落子的位置。右上角的白棋“怎么下都做不活了”。這一處失誤,讓聶衛(wèi)平失去二十幾目的地盤。之后,AlphaGo再?zèng)]給“棋圣”一點(diǎn)機(jī)會(huì)。
2017年1月4日的下午,一代“棋圣”聶衛(wèi)平結(jié)束與目前最強(qiáng)的人工智能的戰(zhàn)斗。黃士杰用繁體字打出“謝謝聶老師”。人們都知道,這不只是一個(gè)人類在向棋圣致敬。
爆破天堂之門
在影片《星球大戰(zhàn)》中,當(dāng)達(dá)斯·維達(dá)說(shuō)出自己已經(jīng)是大師時(shí),他的師父回答:“只是個(gè)邪惡大師?!?/p>
人工智能對(duì)未來(lái)人類的影響,現(xiàn)在誰(shuí)都看不清。去年古力在參加AlphaGo的自我對(duì)弈測(cè)試后,說(shuō):“我一直擔(dān)憂,當(dāng)它們有足夠的自我意識(shí)時(shí),人類會(huì)被統(tǒng)治、滅亡。愿一切都是杞人憂天,珍惜當(dāng)下?!?/p>
2017年1月5日,AlphaGo帶著60連勝下線了。“大師走了”,古力感覺(jué),野狐網(wǎng)上的高手們好像有點(diǎn)厭戰(zhàn),不太想下棋。
悲觀的情緒確實(shí)有一些,比如以后應(yīng)該怎么教孩子們下棋?臺(tái)灣棋王周俊勛的童年,是從翻閱一本本棋譜開(kāi)始的。要去死記硬背前人總結(jié)的經(jīng)驗(yàn),反復(fù)打譜,訓(xùn)練固定招式。他和父親下棋,每輸一局都要罰跑步。棋手們大多是在類似的氛圍中逐漸磨練棋藝,勝負(fù)幾乎是最重要的事情。周俊勛覺(jué)得“輸棋就好像死掉一樣”。
周俊勛在臺(tái)灣的海豐道場(chǎng)教小棋手們下棋,小朋友們倒是沒(méi)有太多負(fù)擔(dān),一副看熱鬧不嫌事大的樣子。“從AlphaGo贏棋的那一刻起,小朋友就一直崇拜它。這次更強(qiáng)大了,在30秒的時(shí)間內(nèi),接近圍棋之神的狀況了?!?/p>
高曉松在微博發(fā)表評(píng)論說(shuō):“為所有的大國(guó)手傷心,路已經(jīng)走完了。多少代大師上下求索,求道求術(shù),全被破解。未來(lái)一個(gè)8歲少年只要一部手機(jī)就可以戰(zhàn)勝九段,榮譽(yù)信仰灰飛煙滅?!?/p>
60連勝后,耿進(jìn)和黃士杰私下聊過(guò)一次?!癆lphaGo是不是有點(diǎn)接近圍棋之神了?”
黃士杰回答:越研究越發(fā)現(xiàn),我們對(duì)圍棋的理解,包括對(duì)圍棋的認(rèn)知,能優(yōu)化改進(jìn)的地方還非常多,“圍棋太神秘了”。
人類制造了AlphaGo,它將這個(gè)千年歷史的游戲又推到新的高度,用科技的力量,破開(kāi)天堂之門。
“我們發(fā)現(xiàn)天堂里面空無(wú)一人,這是一件很誘人、很讓人興奮的事情。”耿進(jìn)說(shuō)。
柯潔輸給AlphaGo以后,其實(shí)還安排了再戰(zhàn)一局。因?yàn)橥话l(fā)疾病,他住進(jìn)了醫(yī)院。柯潔說(shuō)他還有一個(gè)準(zhǔn)備了一個(gè)星期的招式?jīng)]用上,希望以后有機(jī)會(huì)。2016年1月6日晚,他在野狐網(wǎng)和一個(gè)名叫“絕藝”的人工智能下了一局。
雖然這款人工智能棋力不如AlphaGo,但從和柯潔的對(duì)弈歷史看,雙方互有勝負(fù)。
那一局,柯潔贏了。
〔本刊責(zé)任編輯 吳 俊〕
〔原載《看天下》2017年第2期〕