也許你很好奇,為什么“阿爾法狗”和李世石的對(duì)戰(zhàn),能夠引起那么大的輿論關(guān)注。畢竟這并不是人工智能第一次站在人類的對(duì)手席上,也不是人類第一次敗給自己的杰作。
意料之外的智能
我們從圍棋這項(xiàng)運(yùn)動(dòng)說起,星盤上共有361個(gè)落點(diǎn),每步落子都會(huì)對(duì)棋局走勢(shì)產(chǎn)生不同影響。普林斯頓大學(xué)的研究人員計(jì)算過不重復(fù)的棋局?jǐn)?shù),最終結(jié)果是一個(gè)171位的數(shù)字。
這意味著這項(xiàng)棋類運(yùn)動(dòng)不存在套路,究竟棋子落在哪里能讓自己勝率最大,只能憑借棋手的直覺、經(jīng)驗(yàn)和運(yùn)氣。巧的是,這三樣都是人工智能所不擅長(zhǎng)的。在AlphaGo出現(xiàn)之前,它們連戰(zhàn)勝業(yè)余選手都很艱難。所以當(dāng)這條“狗”五場(chǎng)零封歐洲圍棋冠軍樊麾、4:1力克李世石之后,有些人開始慌了。
人工智能的進(jìn)步,已經(jīng)完全超出了人類的預(yù)期,AlphaGo的研發(fā)者——DeepMind公司的反應(yīng)也非常微妙。直到這場(chǎng)人機(jī)大戰(zhàn)戰(zhàn)局塵埃落定,該公司的首席執(zhí)行官Demis Hassabis才收起了“這只能證明AI在運(yùn)算速度和判斷精度方面潛能無(wú)限”的客套說辭,表示已經(jīng)被自己的作品給震驚到了。
只會(huì)算算算?
如果從最簡(jiǎn)單的層面來分析AlphaGo,它不過是利用了兩套智能分析系統(tǒng),來決定自己的下法。第一個(gè)用來評(píng)估棋局,會(huì)判斷雙方的優(yōu)劣勢(shì),以及棋盤每個(gè)部分的走勢(shì),盡可能去讀取棋盤上的全部信息,以及對(duì)手的動(dòng)向和意圖。另一個(gè)則是落子選擇器,會(huì)通過掃描棋盤,找到數(shù)個(gè)合理的落子點(diǎn),最終判斷出最佳的一個(gè)。
但如果僅僅是運(yùn)算,那“阿爾法狗”和其他人工智能比起來,不會(huì)有質(zhì)的改變。畢竟處理速度、程序和代碼這種東西,都無(wú)法拉開決定性的差距。可實(shí)際上,在和其他的人工智能對(duì)弈時(shí),AlphaGo在500盤中贏了495盤,勝率高達(dá)恐怖的99.8%。它的背后藏著什么秘密?只有谷歌能給一個(gè)解釋。硅谷人曾說過,這臺(tái)機(jī)器人的核心精髓是“深度自學(xué)習(xí)”,也就是在對(duì)戰(zhàn)博弈中積累經(jīng)驗(yàn)。李世石輸了之后,韓國(guó)棋社跳出來指責(zé)AI對(duì)手是在赤裸裸地抄襲,可實(shí)際上,任何棋手都會(huì)去研究對(duì)手的下法,AlphaGo只不過是效率更高一些。
在擊敗李世石的前三盤中,AlphaGo是越戰(zhàn)越勇,第二盤甚至頻出怪招。研究人員相信,這是它讀取了李世石棋譜后,在嘗試全新下法的表現(xiàn)。如果這一假設(shè)成真,那即便AI現(xiàn)在的學(xué)習(xí)還停留在“有樣學(xué)樣”的層面上,人類想戰(zhàn)勝它們也會(huì)變得難上加難。比如你從五步之前就開始設(shè)局,如果AI見識(shí)過這一招,它當(dāng)即就能看穿你的心思。
不只是虛擬棋王
AlphaGo的最初設(shè)定,并非棋類高手。谷歌在2014年豪擲4億美元收購(gòu)了初創(chuàng)公司DeepMind,目的也不是在兩年后把100萬(wàn)美元的獎(jiǎng)金攬入囊中——這筆錢本來就是谷歌出的。這些硅谷大神立志于將學(xué)習(xí)類機(jī)器人和通用學(xué)習(xí)算法相結(jié)合,構(gòu)造出能對(duì)人類生活產(chǎn)生極大影響的新行業(yè)。而擊敗頂級(jí)棋手,不過是這條路上出現(xiàn)的小插曲。
在天才少年柯潔的挑釁下,DeepMind方面的反應(yīng)非常平淡,他們覺得AlphaGo沒有必要再在圍棋領(lǐng)域待著了。不久前,公司CEO表示會(huì)將AlphaGo整合到醫(yī)療、機(jī)器人領(lǐng)域。局外人并不知道,這些領(lǐng)域才是它的本職工作。此外,暴雪游戲公司方面還確定了一個(gè)消息:AlphaGo會(huì)以選手的身份挑戰(zhàn)《星際爭(zhēng)霸2》。此訊一出,有“星際第一人”之稱的韓國(guó)選手Flash主動(dòng)請(qǐng)纓,似是要替同胞復(fù)仇??伤苍S不知道,在和AlphaGo交鋒之前,李世石對(duì)它的點(diǎn)評(píng)是“只有三段棋手的水平”,并認(rèn)為自己頂多輸一場(chǎng)。結(jié)果我們都看到了。
AlphaGo還有很多路要走,但有些事需要其研發(fā)者多多注意。它的智商是否有超過人類的可能?又或者說,人類在發(fā)掘AI上限的時(shí)候,能否在它們脫離自己控制之前及時(shí)收手?不要等AI已經(jīng)可以俯視人類時(shí),我們才終于回想起被AI支配的恐怖,雖然那只是在電影里。