Q AlphaGo是什么?
AlphaGo是DeepMind于2010年開(kāi)始研發(fā)的圍棋人工智能,與之前棋類游戲人工智能主要依靠強(qiáng)大的計(jì)算能力來(lái)暴力破解不同,AlphaGo采用了更類似于人的算法,以應(yīng)對(duì)圍棋這個(gè)具有超高復(fù)雜度的游戲。運(yùn)用了全新的機(jī)器學(xué)習(xí)技術(shù),在走每一步棋時(shí),先通過(guò)策略網(wǎng)絡(luò)(policy network)將棋盤(pán)上的局勢(shì)作為信息輸入,對(duì)所有可行的落子位置生成概率分布—這就像是圍棋高手先對(duì)局勢(shì)作出判斷,進(jìn)而發(fā)現(xiàn)可以進(jìn)攻的薄弱地帶。接下來(lái)它再通過(guò)價(jià)值網(wǎng)絡(luò)(value network)分析每一個(gè)落子位置影響勝負(fù)的概率—這相當(dāng)于棋手面對(duì)具體問(wèn)題時(shí),高手會(huì)選擇沖、擋、扳、接等各種下法。AlphaGo通過(guò)強(qiáng)化學(xué)習(xí)不斷訓(xùn)練這兩種神經(jīng)網(wǎng)絡(luò),最終實(shí)現(xiàn)了人工智能可以實(shí)時(shí)有效解決圍棋棋局問(wèn)題的目標(biāo)。
隨著AlphaGo能力的不斷增強(qiáng),圍棋圈對(duì)它的稱呼也從開(kāi)始的“阿爾法狗”到“阿爾法圍棋”,進(jìn)而到現(xiàn)在的“阿爾法師”。
QDeepMind為什么會(huì)選擇圍棋?
自從人工智能誕生的那一天起,游戲就是它最好的伴侶。人工智能的目標(biāo)在于分析真實(shí)世界,而游戲的本質(zhì)是人類對(duì)于世界的模擬,想像一下象棋里的將、士、車(chē)、馬、炮,以及楚河、漢界等元素就能明白這一點(diǎn)。此外,由于這些游戲有著廣泛的受眾,對(duì)于提高和測(cè)試人工智能的水平來(lái)說(shuō),都是再適合不過(guò)的對(duì)象。
在所有游戲中,棋牌類游戲又因?yàn)橐?guī)則簡(jiǎn)潔明了,輸贏都在盤(pán)面,而備受科學(xué)家青睞。從簡(jiǎn)單的跳棋、五子棋,到更加復(fù)雜的中國(guó)象棋、國(guó)際象棋,以及高難度的圍棋和德州撲克,它們成為一步步檢驗(yàn)人工智能新算法水平最好的標(biāo)桿。
QAlphaGo還能做什么?
AlphaGo雖然是圍棋人工智能,但它解決圍棋時(shí)所使用的機(jī)器學(xué)習(xí)方法卻能夠廣泛應(yīng)用到其他領(lǐng)域。例如DeepMind團(tuán)隊(duì)曾在TensorFlow上開(kāi)源了一個(gè)高級(jí)框架Sonnet,以幫助科學(xué)家快速創(chuàng)建神經(jīng)網(wǎng)絡(luò)模塊;此外他們還與Google應(yīng)用商店P(guān)lay Store一起嘗試將機(jī)器學(xué)習(xí)應(yīng)用到廣告推薦系統(tǒng)中,以及與Android團(tuán)隊(duì)合作,試圖提高系統(tǒng)的效能。
其中最令人驚喜的是,他們嘗試?yán)萌斯ぶ悄軄?lái)優(yōu)化Google數(shù)據(jù)中心的冷卻系統(tǒng),數(shù)據(jù)顯示,優(yōu)化過(guò)的系統(tǒng)可以降低40%的能耗,對(duì)于有著成千上萬(wàn)臺(tái)服務(wù)器的Google來(lái)說(shuō),這意味著每年能節(jié)約上億美元的開(kāi)銷。
Q從棋手角度看,AlphaGo給圍棋帶來(lái)的沖擊有哪些?
首先,AlphaGo沖擊了很多圍棋選手固有的理念。
過(guò)去,人類棋手的下法都是對(duì)過(guò)往經(jīng)驗(yàn)的研究和總結(jié),但即使是職業(yè)棋手,一輩子可以下的圍棋盤(pán)數(shù)只有幾千量級(jí),而其中真正有參考價(jià)值、能夠推動(dòng)這門(mén)技術(shù)前進(jìn)的僅在百盤(pán)左右。然而,AlphaGo最新版本開(kāi)始自我對(duì)弈之后,每天下棋的盤(pán)數(shù)從幾千到一萬(wàn)不等,甚至更多,這迅速將圍棋理念推向極致。
其次,未來(lái)頂尖棋手的收入可能會(huì)逐漸下降,但是隨著參與圍棋的門(mén)檻降低,普及率上升,整體市場(chǎng)將有可能擴(kuò)大。
圍棋未來(lái)的路徑多少可以參考曾經(jīng)的國(guó)際象棋,1997年,IBM研發(fā)的人工智能Deep Blue在第二次挑戰(zhàn)國(guó)際象棋世界冠軍卡斯帕羅夫中以3.5:2.5贏得勝利,在整個(gè)人類世界引起軒然大波,這場(chǎng)精彩的營(yíng)銷使得IBM的股價(jià)一度上漲30%左右。據(jù)統(tǒng)計(jì),在Deep Blue戰(zhàn)勝人類后,很多國(guó)家象棋的贊助商吝于投資冠名,頂級(jí)棋手收入略有下降,次一級(jí)的棋手收入相比與1970年巔峰時(shí)期則下降很多。因?yàn)槿祟愔g比賽的關(guān)注度遠(yuǎn)遠(yuǎn)低于人機(jī)大戰(zhàn)。
但與此同時(shí),國(guó)際象棋通過(guò)人機(jī)大戰(zhàn)在全球普及開(kāi)來(lái)。原先國(guó)際象棋的影響力主要集中在蘇聯(lián),以及德國(guó)、西班牙、古巴等幾個(gè)國(guó)家,在非洲和亞洲幾乎沒(méi)有影響力。但現(xiàn)在完全不同,例如在中國(guó),這幾年國(guó)際象棋的發(fā)展速度就非常顯著。