樂佳
近日,搜狗CEO王小川在發(fā)表公開演講時,動情地回憶起了2016年他在新浪直播全程見證了李世石被機器打敗,并坦言當(dāng)時對他沖擊很大,他認為那是人類歷史上堪比文藝復(fù)興的一場啟蒙運動。今天我們再來深入地解讀一下,阿爾法狗——人工智能邁出一大步背后的秘密。
2016年3月,由谷歌旗下公司DeepMind開發(fā)的人工智能程序阿爾法狗(AlphaGo)以總比分4:1戰(zhàn)勝韓國天王級職業(yè)圍棋選手李世石九段。此役使得AlphaGo聲名鵲起,也使得人工智能、深度學(xué)習(xí)成為了世人關(guān)注的熱點。僅僅過了幾個月,同年的12月29日,一個神秘賬號“Master”出現(xiàn)在了中文網(wǎng)絡(luò)圍棋平臺弈城網(wǎng)上,并在短短幾日之內(nèi)以60勝0負1和的傲人戰(zhàn)績戰(zhàn)勝了包括世界排名第一的柯潔九段、“棋圣”聶衛(wèi)平在內(nèi)的多個職業(yè)圍棋領(lǐng)域的大師級人物。當(dāng)人們還在震驚中猜測Master到底是何方神圣時,Google對外宣布Master的真實身份就是AlphaGo。AlphaGo是人工智能領(lǐng)域的一個里程碑,它的出現(xiàn)昭示著人工智能領(lǐng)域的研究又向前邁進了一大步。那么,AlphaGo到底有何過人之處,其在圍棋領(lǐng)域取得的成績?yōu)楹螘a(chǎn)生如此之大的反響?
其實,人工智能在棋類運動中戰(zhàn)勝人類早已有先例,早在1997年5月IBM的“深藍計算機”在國際象棋比賽中就戰(zhàn)勝了當(dāng)時的世界衛(wèi)冕冠軍卡斯帕羅夫。相較于國際象棋,圍棋具有更復(fù)雜的規(guī)則和更多的棋盤狀態(tài),所以在“深藍”戰(zhàn)勝了世界冠軍后的很長一段時間內(nèi)很多人都認為計算機在圍棋上是無法戰(zhàn)勝人類的,甚至有人把圍棋稱為“人類最后的堡壘”。而如今,“人類最后的堡壘”也已經(jīng)被攻破,勢必會引起人們的強烈反應(yīng)。
AlphaGo的成功一方面得益于硬件設(shè)備計算能力的極大提升,相較于20年前,如今計算設(shè)備的計算能力有了質(zhì)的飛躍;另一方面,則得益于采用了深度學(xué)習(xí)算法。同“深藍”采用的暴力解題的方式不同,AlphaGo通過使用深度學(xué)習(xí)來獲得更加抽象的概念。AlphaGo的核心組成是兩個卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN):策略網(wǎng)絡(luò)(Policy Network)和價值網(wǎng)絡(luò)(Value Network)。簡單來說,策略網(wǎng)絡(luò)用于針對當(dāng)前棋盤,輸出在當(dāng)前棋盤各個空白處落子的概率;價值網(wǎng)絡(luò)則會給出在各個位置落子后的勝率;最后,AlphaGo使用一種蒙特卡羅樹搜索(Monte Carlo Tree Search, MCTS)算法結(jié)合前面的兩個網(wǎng)絡(luò)輸出最佳的落子策略。因此,AlphaGo厲害之處就在于當(dāng)它的對手可能還在思考下在哪里的時候,它已經(jīng)猜出了對手可能下子的位置,并利用對手思考的時間,繼續(xù)計算后面的棋路。此外,AlphaGo還使用了強化學(xué)習(xí)算法(Reinforcement Learning, RL):通過讓策略網(wǎng)絡(luò)不斷地自我對弈,來不斷提升策略網(wǎng)絡(luò)預(yù)測落子概率的準(zhǔn)確性。當(dāng)然,AlphaGo的實際計算過程比這要復(fù)雜得多,此處主要是為了方便理解而對其對弈的計算過程做了大量的簡化。
人工智能一般可以分為弱人工智能和強人工智能,兩者最大的區(qū)別在于制造出來的智能機器是否具有自我意識。強人工智具有理解問題、思考問題、計劃并解決問題的能力,甚至擁有自我意識和知覺。而弱人工智能雖然能解決一些人類才能解決的問題,但實際上它并不真正具備理解問題、思考問題的能力,也沒有自我意識。自從AlphaGo擊敗眾多圍棋高手以來,不少人都覺得人類離人工智能統(tǒng)治人類的那一天又更近了一步。其實,盡管AlphaGo的確是人工智能領(lǐng)域的一個里程碑,但本質(zhì)上AlphaGo仍然是一個計算機程序,它沒有自我意識,也沒有真正理解圍棋,它只是算出了幾個可以構(gòu)建最佳落子策略的函數(shù)而已,它仍然屬于弱人工智能。