王煜
在圍棋這類規(guī)則特別明確的事情上,我們?nèi)祟愝斀o擁有強(qiáng)大計(jì)算和記憶能力的計(jì)算機(jī)程序是早晚的事。人類日常生活中司空見慣的事,只要邊界不清晰、定義不精確,目前的AI是完全應(yīng)付不了的。
4比1。當(dāng)比分最終定格時(shí),李世石終于可以解脫了。這名33歲的韓國(guó)圍棋選手在過去的將近一周時(shí)間里,成為面對(duì)AI(人工智能)的“人類智慧”化身,與谷歌的電腦程序AlphaGo展開了五回合的大戰(zhàn)。人機(jī)大戰(zhàn)不僅成為全球網(wǎng)友津津樂道的話題,也激起了圍棋和AI兩個(gè)領(lǐng)域業(yè)內(nèi)人士的熱烈思考與爭(zhēng)論。圍棋這門數(shù)千年的技藝將走向何方?AI又是否從此在趕超人類智能的道路上邁進(jìn)了一大步?
勝負(fù):誰的意料之外?
本來是生硬冰冷的人工智能科技研究,套上“人機(jī)大戰(zhàn)”的外殼,拋出“人類智慧最后的堡壘是否即將崩塌”這樣的“天問”,瞬間就吸引了全世界的目光。不得不說,谷歌的強(qiáng)大并不僅僅是因?yàn)樗35跪v出黑科技,還有它的公關(guān)能力。不過,和人類在棋盤大戰(zhàn)這一招并非谷歌的發(fā)明,將近20年前,IBM就擺下擂臺(tái),用計(jì)算機(jī)“深藍(lán)”擊敗了人類的國(guó)際象棋冠軍卡斯帕羅夫。
當(dāng)然,那場(chǎng)比試的熱度遠(yuǎn)遠(yuǎn)比不上這次的人機(jī)大戰(zhàn)。首先當(dāng)然是因?yàn)閲?guó)際象棋的規(guī)則、變化對(duì)電腦的計(jì)算能力而言,都是可以用窮舉法攻破的,電腦硬件夠好,攻破難關(guān)只是時(shí)間問題;而圍棋的變化數(shù)量已經(jīng)超過了宇宙所有原子數(shù)量之和,在可以預(yù)見的未來里,電腦靠“傻算”,走一步的計(jì)算時(shí)間將是天文數(shù)字,必須運(yùn)用新的解決手段才能讓程序?qū)嵱谩?/p>
其次,今天我們有了社交網(wǎng)絡(luò)。觀眾是否懂AI、會(huì)不會(huì)下圍棋不重要,關(guān)鍵的是“人機(jī)大戰(zhàn)”變成了一件有趣的事,所以大家都來圍觀,連谷歌的AlphaGo,也被迅速被國(guó)內(nèi)網(wǎng)友按發(fā)音取了中文昵稱“阿法狗”,聽上去萌萌噠;盡管那個(gè)“Go”其實(shí)是日語“碁”(即“圍棋”之意)的羅馬音標(biāo)注,發(fā)音其實(shí)不是這么回事兒。
于是,這場(chǎng)人“狗”大戰(zhàn)還沒開始就變得充滿戲劇化。好賭是人類的天性,人們紛紛預(yù)測(cè)比賽結(jié)果。認(rèn)為AlphaGo會(huì)勝利的主要是IT界人士,而圍棋界人士幾乎無一例外地覺得李世石將“虐狗”。
例如,開賽前,中國(guó)的圍棋高手古力接受采訪時(shí)曾表示:他認(rèn)為幾個(gè)月前AlphaGo戰(zhàn)勝歐洲冠軍樊麾(職業(yè)二段)時(shí),展現(xiàn)出來的只是一個(gè)職業(yè)初段的水平,而李世石可是職業(yè)九段頂級(jí)高手。幾個(gè)月內(nèi),從初段提升到九段水平,古力認(rèn)為完全不可能。
包括李世石本人,賽前也信心爆棚地認(rèn)為自己會(huì)5:0完勝,但在當(dāng)面聽了谷歌工程師團(tuán)隊(duì)對(duì)AlphaGo學(xué)習(xí)能力的介紹后,他也在言語中開始露出一絲憂慮。BBC記者甚至說看到了李世石顫抖的手指。
3月9日下午,韓國(guó)首爾,大戰(zhàn)開始。也許是明白自己過去的套路都已經(jīng)被AlphaGo研究清楚,李世石開場(chǎng)就采取了非常規(guī)的下法,主動(dòng)出擊,試圖把雙方都拉入一個(gè)陌生的領(lǐng)域作戰(zhàn)。但他恰恰想錯(cuò)了,要論“不按常理玩”,谷歌的這只“狗”才是個(gè)中高手。李世石首輪投子落敗,有人大驚失色,有人覺得理所當(dāng)然。
次日的第二輪,李世石沒有再出怪招,但AlphaGo反倒拉起李世石進(jìn)行了“陌生領(lǐng)域”的纏斗。結(jié)果,人類再敗。李世石在發(fā)布會(huì)上承認(rèn)自己“完敗”、“輸?shù)谜f不出話來”。
有記者當(dāng)場(chǎng)就毫不客氣地質(zhì)問:前兩場(chǎng)都沒有看到李世石和AlphaGo“打劫”,是不是李和谷歌簽了不能打劫的保密協(xié)議?李世石沒有正面回答這個(gè)問題,而谷歌研究團(tuán)隊(duì)成員之一的黃士杰之后對(duì)媒體明確表示:“這次比賽并沒有所謂的不能打劫的保密協(xié)議。第一、第二盤棋復(fù)盤時(shí)李世石九段都有擺出打劫的變化,只是實(shí)戰(zhàn)中他沒有下出來。
小李連輸兩場(chǎng),韓國(guó)業(yè)內(nèi)人士開始不服。據(jù)韓國(guó)媒體報(bào)道,韓國(guó)信息通信專業(yè)律師田石鎮(zhèn)批評(píng)稱,谷歌需要對(duì)李世石和整個(gè)圍棋界道歉,因?yàn)榇舜稳藱C(jī)博弈本身就不公平。早在2016年2月9日,田石鎮(zhèn)就在自己的社交網(wǎng)站上發(fā)文稱,谷歌策劃的這場(chǎng)博弈系騙局。他認(rèn)為,AlphaGo通過網(wǎng)絡(luò)可隨時(shí)無限收集和利用相關(guān)信息,這意味著它擁有無數(shù)的“指教者”。
3月12日,李世石迎來了“背水一戰(zhàn)”,而這一天同時(shí)是他的結(jié)婚十周年紀(jì)念日,意義非凡。李世石在輸了前兩盤后曾表示,希望從妻子和孩子身上獲取力量。當(dāng)然他同樣在技術(shù)方面做了縝密準(zhǔn)備,第二盤結(jié)束后的當(dāng)晚,他請(qǐng)來了洪旻杓九段、樸正祥九段等三四個(gè)圍棋界的好友通宵復(fù)盤研究,最后決定用“打劫”來爭(zhēng)勝最有效。
于是,人們看到看到了李世石與AlphaGo之間的“劫殺”。這雖然用實(shí)際行動(dòng)回應(yīng)了質(zhì)疑,但并沒給他帶來勝果。0:3,至此,李世石完敗給了電腦。
賽后,李世石向全球媒體坦陳:“我的棋力雖還無法下出完美的圍棋,但AlphaGo也還未達(dá)到神的水平……雖然AlphaGo打敗我李世石,但并不能說明就是打敗了整個(gè)人類棋手!”他還說:“我從未承受過如此大的壓力?!?/p>
隨著比賽的進(jìn)行,圍棋界人士對(duì)AlphaGo棋力的看法也不斷改變。當(dāng)今世界排名第一、18歲的中國(guó)小將柯潔看了第一場(chǎng)后評(píng)論說:“阿法狗贏不了我。”第二場(chǎng)后他改口:“我對(duì)阿法狗有六成勝率?!钡谌龍?chǎng)開始前他說:“如果阿法狗挑戰(zhàn)我,我要組團(tuán)應(yīng)戰(zhàn)”;看完第三場(chǎng)后則表示“同樣條件我上我也得輸”。
按照賽制,雖然勝負(fù)已定,但后兩盤比賽還要進(jìn)行。放下勝負(fù)的第四盤,和前幾局對(duì)決相比,李世石更多次陷入長(zhǎng)時(shí)間的思考,耗時(shí)太多,在比賽進(jìn)行到2個(gè)半小時(shí)后,李世石僅剩下17分鐘,比AlphaGo剩余時(shí)間足足少了1個(gè)小時(shí)。
就當(dāng)人們認(rèn)為小李難獲一勝時(shí),他下出了“神之一手”,成為本場(chǎng)比賽的轉(zhuǎn)折點(diǎn)。對(duì)手發(fā)了大招,AlphaGo卻不但沒能好好應(yīng)對(duì),還在這之后下出一步常理上的廢棋,“自毀長(zhǎng)城”。之后,李世石勝利的大局已定。收官階段,AlphaGo又出現(xiàn)了“bug”。
最終,李世石斬“狗”成功,贏得榮譽(yù)一戰(zhàn)。當(dāng)然,隨之而來的還是有“谷歌是不是調(diào)低了AlphaGo水平”的“放水論”,以及“AI會(huì)隱藏實(shí)力了”的“陰謀論”。
有意思的是,雖然AlphaGo輸給了李世石,但卻有了意外收獲,可以參與GoRatings世界職業(yè)圍棋選手的排名了。因?yàn)楦鶕?jù)這個(gè)網(wǎng)站的規(guī)則,如果一名選手從未遭受失敗,就不會(huì)進(jìn)入排名統(tǒng)計(jì)。第四盤戰(zhàn)敗后,AlphaGo排名世界第四,領(lǐng)先于排名第五的李世石。排名第一的,是中國(guó)的柯潔。
“阿法狗”:
成功,你才剛上路
人機(jī)圍棋大戰(zhàn),AlphaGo勝出。那么,人類的智力堡壘真的崩塌了嗎?我們先看看AlphaGo勝利的秘訣“深度學(xué)習(xí)”是怎么一回事。
深度學(xué)習(xí)模擬人類大腦神經(jīng)網(wǎng)絡(luò)的工作原理,將輸出的信號(hào)通過多層處理,將底層特征抽象為高層類別,它的目標(biāo)是更有效率、更精確地處理信息。深度學(xué)習(xí)自2006年由Geoffrey Hinton教授和他的兩個(gè)學(xué)生提出后,使得機(jī)器學(xué)習(xí)有了突破性的進(jìn)展,極大地推動(dòng)了人工智能水平的提升。2013 年,《麻省理工技術(shù)評(píng)論》把它列入年度十大技術(shù)突破之一。
人腦具有一個(gè)深度結(jié)構(gòu),認(rèn)知過程是逐步進(jìn)行,逐層抽象的,能夠?qū)哟位亟M織思想和概念。深度學(xué)習(xí)之所以有效,正是因?yàn)樗^好地模擬了人腦這種“分層”和“抽象”的認(rèn)知和思考方式。它的實(shí)質(zhì),是通過構(gòu)建具有多層的機(jī)器學(xué)習(xí)模型和海量的訓(xùn)練數(shù)據(jù),來學(xué)習(xí)更有用的特征,最終提升分類或預(yù)測(cè)的準(zhǔn)確性。
不過,人工智能與認(rèn)知科學(xué)專家、復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院教授危輝分析說,AlphaGo采用的“深度學(xué)習(xí)”方法,在計(jì)算機(jī)領(lǐng)域并不是什么“高大上”的獨(dú)門秘笈,它的算法也并不復(fù)雜。其創(chuàng)新點(diǎn)在于:用計(jì)算機(jī)語言判定并表征各種棋局的價(jià)值。
危輝說,根據(jù)谷歌團(tuán)隊(duì)已公開發(fā)表的論文,AlphaGo深度學(xué)習(xí)的“竅門”是記住一類布局與一類策略的映射關(guān)系。仰仗于事先的海量“打譜”,它給各種棋譜分類,并給每個(gè)分類找到一種對(duì)應(yīng)的策略——而對(duì)應(yīng)策略也都是人類棋手已使出的招式,最后拿出計(jì)算機(jī)的看家本領(lǐng)——記憶?!癆lphaGo其實(shí)并沒有真正理解圍棋的基本原則,它只是記下了海量的‘布局vs布局映射關(guān)系。其所謂的類推能力,來自海量樣本間的相似性,其實(shí)根本沒有創(chuàng)新!”
在他看來,AlphaGo對(duì)圍棋是“知其然,而不知其所以然”,它不用問為什么這么下,記住就好。
與危輝的觀點(diǎn)類似,英國(guó)《新科學(xué)家》周刊認(rèn)為:“實(shí)現(xiàn)先進(jìn)的人類水平的人工智能要克服三大挑戰(zhàn):它如何計(jì)劃一系列行動(dòng)以實(shí)現(xiàn)目標(biāo);它如何模擬它的環(huán)境;它反思它的處境與行為的能力。人類還在建造有能力模擬環(huán)境的系統(tǒng)方面取得進(jìn)展。但實(shí)現(xiàn)人類水平的人工智能需要建立自然界的豐富表征,這就是一個(gè)大問題了。盡管圍棋很復(fù)雜,在棋盤上識(shí)別有利的落子位置也很難,但同精確表征自然界相比,這些依然過于簡(jiǎn)單。兩者之間的差距還要幾十年時(shí)間才能跨越?!?/p>
顯然,從結(jié)果而論,在下棋的勝負(fù)上,AI已經(jīng)超越了人類。這是因?yàn)槟壳斑m合人工智能來解決的任務(wù),要滿足規(guī)則能被精確定義、且范圍受限這兩個(gè)條件。而被人類認(rèn)為考驗(yàn)智力的下棋,恰恰屬于此列。
如同韓國(guó)那位通信專業(yè)律師所言,危輝還指出,AlphaGo和李世石的對(duì)弈,看似“一對(duì)一”,實(shí)際上卻并不平等?!捌鋵?shí),在這場(chǎng)‘人機(jī)大戰(zhàn)中值得‘同情的是李世石,李世石是在‘以一當(dāng)十甚至‘以一敵百?!盇lphaGo的背后,還有眾多并行計(jì)算機(jī)設(shè)計(jì)者、眾多人工智能程序設(shè)計(jì)者和大量非常有經(jīng)驗(yàn)的棋手、棋譜。這么多人的智慧,綜合在一個(gè)人工智能程序上,因此,單槍匹馬的李世石即使輸了,也沒什么?!霸趪暹@類規(guī)則特別明確的事情上,我們?nèi)祟愝斀o擁有強(qiáng)大計(jì)算和記憶能力的計(jì)算機(jī)程序是早晚的事。”
“另一個(gè)易被忽略的不公平之處在于,AlphaGo的落子是由人代為完成的;李世石的落子,它也不是直接看明白的,而是由人輸入到電腦里?!笨梢?,每方限時(shí)2小時(shí)的人機(jī)對(duì)弈中,AlphaGo不會(huì)像李世石那樣耗費(fèi)體能,也更容易集中“精力”,還省了兩個(gè)耗時(shí)的環(huán)節(jié)。危輝表示,對(duì)人工智能而言,完成這兩個(gè)環(huán)節(jié),涉及到圖像理解能力,涉及到機(jī)械臂的精細(xì)操作能力,要求“手”“眼”協(xié)調(diào),這些一點(diǎn)兒也不比下棋容易!
人類日常生活中司空見慣的事,只要邊界不清晰、定義不精確,目前的AI是完全應(yīng)付不了的。危輝舉例說,有兩個(gè)問題:1.一個(gè)土壤樣本里,易溶性無機(jī)鹽含量較低,請(qǐng)問其中三氧化鋁、二氧化硅的含量比例是多少?2.我中午在食堂吃飯,排在前面的人指著打菜的師傅說,這碗粥是昨天的,給我兩個(gè)包子。那么,請(qǐng)問我究竟該如何買午飯?
很顯然,對(duì)人而言,第一個(gè)問題是只有專業(yè)領(lǐng)域的科學(xué)家才能解答的事情,第二個(gè)問題則是尋常百姓都知道的事情,可以收集到各式各樣的答案,有人可能會(huì)建議我不要管前面人的決定,堅(jiān)持買一碗粥,有人會(huì)建議我也跟風(fēng)買兩個(gè)包子,也有人會(huì)建議我買別的食物。
可是,對(duì)人工智能而言,第一個(gè)問題即使是很傻很傻的計(jì)算機(jī)也能回答,它只需要會(huì)搜索就能搞定了;但是對(duì)于第二個(gè)問題,它卻沒法給出一個(gè)答案。
“人類日常運(yùn)用智能時(shí),往往察覺不到它的存在。只有當(dāng)我們這些搞計(jì)算機(jī)的想要把這些智能編程時(shí),才意識(shí)到人類的智能其實(shí)有多復(fù)雜?!蔽]x感慨。
“比如,翻譯。因?yàn)檎Z言無法完全用文法來定義,其靈活性無法用計(jì)算機(jī)邏輯學(xué)來表征,于是,我們看到現(xiàn)在的機(jī)器翻譯有多糟糕。又比如,機(jī)器無法理解笑話。再比如,一個(gè)能在智力競(jìng)賽中完勝人類的電腦,卻無法擁有‘曹沖稱象、‘司馬光砸缸、‘烏鴉喝水的智慧。”
危輝表示:“人工智能的核心科學(xué)難題,從1956年這一學(xué)科提出至今,一項(xiàng)都沒有解決!”他認(rèn)為,人工智能發(fā)展的現(xiàn)狀有點(diǎn)像盲人摸象——每個(gè)人都看到了某個(gè)局部,又都以為那便是方向?!拔覀冸x真正的人工智能,還非常遠(yuǎn)!”
人類輸棋,不少網(wǎng)友引用科幻小說里機(jī)器人統(tǒng)治甚至滅絕人類的橋段來表示擔(dān)憂。著名科幻小說《三體》的作者劉慈欣表示:此次“人機(jī)大戰(zhàn)”遠(yuǎn)遠(yuǎn)不夠科幻小說水平,下圍棋雖然也算人工智能,但科幻小說里的人工智能都是有自我存在意識(shí)的,能夠和人類交流;而AlphaGo只是純粹的學(xué)習(xí)型數(shù)據(jù)庫(kù)?!瓣P(guān)于想象AlphaGo的內(nèi)心世界,我沒想過這個(gè)事。”
有一點(diǎn)是明確的。IBM“深藍(lán)”研發(fā)團(tuán)隊(duì)成員默里·坎貝爾稱:“棋盤游戲長(zhǎng)期以來一直是衡量人工智能發(fā)展的標(biāo)準(zhǔn),但這一時(shí)代已經(jīng)結(jié)束。”
大戰(zhàn)之后,余波未了
“人機(jī)大戰(zhàn)”已塵埃落定。圍棋作為這次比賽的載體,本來相對(duì)小眾,也收獲得了極大的關(guān)注度。據(jù)報(bào)道,比賽期間,韓國(guó)圍棋培訓(xùn)班的報(bào)名人數(shù)激增。
當(dāng)然,“大戰(zhàn)”不光是為圍棋賺了眼球,也對(duì)業(yè)界產(chǎn)生了實(shí)質(zhì)影響。AlphaGo在幾盤對(duì)弈中下了一些人類選手通常認(rèn)為的“俗手”、“惡手”,也用了一些人類選手通常不會(huì)采用的路數(shù),被認(rèn)為有自己一套獨(dú)立的“棋風(fēng)”。
中國(guó)業(yè)余圍棋第一人胡煜清說:“圍棋不僅僅是計(jì)算,還有一些厚薄等虛路判斷,還有大局觀等可意會(huì)不可言傳的感覺?!瑼lphaGo除了高超的計(jì)算力和直線作戰(zhàn)能力,甚至也表現(xiàn)出了形勢(shì)判斷的勝負(fù)感。比如形勢(shì)吃緊時(shí),AlphaGo豁出去拼了,敢于冒險(xiǎn);取得優(yōu)勢(shì)時(shí),它又不跟你鬧了,棋風(fēng)保守?!?/p>
職業(yè)棋手也對(duì)AlphaGo的“創(chuàng)新手法”表示贊同。聶衛(wèi)平稱:電腦突破了人類的一般思維,下出了讓我感慨要“脫帽致敬”的手段。
江鑄久表示,AlphaGo有一手下法,“讓我想到了吳清源老師提出過的‘21世紀(jì)下法,當(dāng)時(shí)他的理論比較超前,很多職業(yè)棋手覺得不實(shí)用,現(xiàn)在看到計(jì)算機(jī)下的這個(gè)我很高興?!?/p>
常昊認(rèn)為,人類輸給了機(jī)器,就圍棋本身而言,會(huì)有危機(jī)感,但并不全然,競(jìng)技勝負(fù)只是圍棋的一個(gè)層面。圍棋流傳了幾千年而不衰,它的背后是中國(guó)的傳統(tǒng)文化和精神層面的很多東西,包括我們尚覺得深?yuàn)W的吳清源老師“21世紀(jì)下法”、“六合圍棋”理論,敗給計(jì)算機(jī)也可以促使職業(yè)棋手多往文化的方面去挖掘、去努力。
胡煜清說:其實(shí),即便是頂尖棋手,對(duì)圍棋的理解可能也只有6%-7%,人工智能或許能幫助人類打開理解圍棋的另一扇門?!氨热?,在第二局中,AlphaGo常常往中間走,而我們都知道圍棋有句俗話叫‘金角銀邊草肚皮。但是,誰能肯定誰的理解才是正確的呢?”
那么,AI又從這次比賽里得到了什么?北京師范大學(xué)教授、科幻作家吳巖一語道破:人機(jī)大戰(zhàn)只是一次炒作,想要人工智能超過人的都不是真正做人工智能的研究人員。這次的背景是研發(fā)公司要產(chǎn)業(yè)轉(zhuǎn)型、做投資。
不僅是谷歌和IBM,微軟、Facebook等大佬也早已專注于AI研發(fā),硅谷已有超過1700家創(chuàng)業(yè)公司加入人工智能浪潮。而國(guó)內(nèi)的BAT三巨頭也都在布局自己的AI陣營(yíng),創(chuàng)業(yè)公司紛紛尋找自己的切入機(jī)會(huì)。
例如:美國(guó)勞工統(tǒng)計(jì)局的月度就業(yè)報(bào)告預(yù)測(cè)、過去十年中國(guó)春節(jié)期間市場(chǎng)最佳交易行情、中國(guó)十年國(guó)債回報(bào)率快速下跌時(shí)最應(yīng)該避免的證券交易,想知道這些問題的答案?過去的華爾街,要回答這樣的問題,需要平均年薪幾十萬美元的分析師組成十人團(tuán)隊(duì),不眠不休花上好幾天甚至好幾周時(shí)間計(jì)算,才可能做出相關(guān)的趨勢(shì)和概率預(yù)測(cè),并且他們還要能先找到這些數(shù)據(jù)。但是,靠已有的人工智能程序,幾秒鐘內(nèi),報(bào)告就可以握在決策者手中。
做AI,當(dāng)然不是為了下圍棋。