肖文杰 沈從樂
1:4,輕視,恐慌,好奇,自我懷疑——以人類之名,李世石與人工智能正面交鋒的7天,結(jié)束了。就勝敗而言,人類輸了。但圍棋還是那個古老而誘人的游戲
上帝死了。他又活了。這樣描述胡盼盼那幾天的心情不算夸張。準確地說,那幾天指的是3月9日至3月15日。這7天,舉行的可能是人類歷史上迄今為止最重要的5盤圍棋比賽。對弈雙方是世界冠軍李世石和Alphabet旗下子公司DeepMind研發(fā)的人工智能(ArtificialIntelligence,AI)系統(tǒng)Alpha60。G0是圍棋的英譯名。這幾天在中文社交網(wǎng)絡(luò)上,AlphaGo被稱為“阿法狗”。
連輸三盤
李世石輸?shù)舻谝槐P后,胡盼盼晚上沒睡著覺,她有些不甘心,認為李世石輸在失誤上。胡盼盼曾休學4年在北京的道場學棋,參加過職業(yè)沖段賽,現(xiàn)在是一名圍棋教師。但接下來,李世石連輸兩盤,胡盼盼覺得自己對圍棋的信仰崩塌了:“原本我為圍棋里的虛的東西而著迷,認為這是無法言明的,但現(xiàn)在看來不是?!?/p>
圍棋一直被認為是最復雜的策略性游戲,也是人工智能難以攻破的終極智力活動。即使1997年,IBM的電腦“深藍”(Deep Blue)戰(zhàn)勝了當時的國際象棋世界冠軍卡斯帕羅夫,大多數(shù)人仍是這么認為。
深藍的原理很簡單:依靠摩爾定律背書的超強計算能力窮盡每一步棋的可能性,選擇最優(yōu)解。國際象棋的棋局可能性約有10的47次方,而圍棋大約有l(wèi)O的170次方,比全宇宙已知的粒子總數(shù)多100個數(shù)量級。這意味著,摩爾定律無法戰(zhàn)勝圍棋。
在此之前,最強的圍棋軟件僅能達到業(yè)余棋手的水平,它們能在局部圍出領(lǐng)地,但當人類突然轉(zhuǎn)移戰(zhàn)場,或是擺出飄逸的布局時,軟件很容易出現(xiàn)奇怪的錯手,這就是所謂的“電腦棋”。
直覺、棋感、勢,包括胡盼盼在內(nèi)的所有棋手將這些視為圍棋最與眾不同之處。
也許正是因為這些經(jīng)驗,當DeepMind發(fā)出挑戰(zhàn)書后,李世石立即就答應(yīng)了。他認為自己“必須以5:0或者4:1贏下”,如果輸?shù)脑挘柏M不是顯得人類太綿軟無力了”。即使他知道,在去年10月,AlphaGo已經(jīng)首次戰(zhàn)勝了歐洲冠軍樊麾二段。
如果李世石知道得更多,他或許會謹慎一些。在樊麾輸給AlphaGo前兩個月,圍棋對弈平臺弈城圍棋網(wǎng)上,一個ID叫“deepmind”的棋手剛剛升入9D(準職業(yè)水準)。要知道,2014年年初,剛注冊時,deepmind還是5D(業(yè)余初段水準)。比飛速進步更不尋常的是,它的進步不是漸進式的,而是在一個等級上停留一陣后,突然躍升一個檔次。
與樊麾的對戰(zhàn)棋譜公布后,AlphaGo的開發(fā)者之一黃士杰(AjaHuang)承認是他注冊了deepmind這一賬號,但否認賬號背后是AlphaGo在下棋。2月底,9D“棋手”deepmind開始在弈城網(wǎng)上與真正的職業(yè)選手對戰(zhàn),互有勝負。
柯潔九段不久前剛剛戰(zhàn)勝李世石獲得世界冠軍,看到AlphaGo和樊麾的對戰(zhàn)棋譜他很吃驚,因為這個AI沒有下“電腦棋”。
不懂電腦的他開始搜索蒙特卡洛算法、深度學習等信息,并在接受采訪時向記者打聽原理。他大概理解了這個AI能不斷進步,但即便如此,他也不相信AlphaGo能在5個月內(nèi)從準職業(yè)“選手”變成頂尖高手。
幾乎所有的職業(yè)棋手都不看好AlphaGo,他們等著李世石在3月9日捍衛(wèi)尊嚴。而DeepMind的CEO哈薩比斯只是平淡地說:“我們測試的結(jié)果不太一樣?!闭l也沒想到李世石會連輸3盤。
第二盤對柯潔的沖擊尤其大。李世石在沒有巨大失誤的情況下完敗。胡盼盼則被AlphaGo的第37手徹底震撼,這步棋初看損失巨大,“如果職業(yè)選手這么下會被罵死”,但隨著棋局深入,胡盼盼越發(fā)懷疑自己的判斷,她覺得37手有可能是步極有遠見的好棋。
柯潔在李世石輸?shù)舻谝槐P后發(fā)布并置頂了一條微博:“就算阿法狗戰(zhàn)勝了李世石,但它贏不了我?!倍诶钍朗?shù)舻谌P后,這條微博被撤下了置頂。樊麾則以日本名譽棋圣藤澤秀行的話做了評價:“棋道一百,我只知七?!?/p>
這時,AI專家以外的人才意識到,AlphaGo與之前所有的圍棋電腦都不一樣。它像人一樣懂得布局、判斷大勢,它計算精準、棋風穩(wěn)健,胡盼盼評價它下棋像李昌鎬。在李世石之前,李昌鎬曾稱霸世界棋壇十幾年,因為內(nèi)心強大,被稱為“石佛”。
柯潔的焦慮很直接?!爱敃r就覺得下棋沒意思了。以后職業(yè)棋手可能不再是圍棋的權(quán)威。一個入門級別的觀眾在看直播時都可以通過AT來點評這步棋。作為競技的樂趣大大折扣?!彼麑τ浾哒f。
如今,即使是對圍棋和人工智能都不了解的人,都能簡述AlphaGo兩個網(wǎng)絡(luò)的決策模式:“策略網(wǎng)絡(luò)”推薦幾種下法,“價值網(wǎng)絡(luò)”評估這幾步棋的優(yōu)劣,選擇勝率最大的一手。這種模式與人類落子的決策類似,通過對3000多萬盤棋的深度學習,它成了頂尖高手。
人工智能在做什么
人工智能把圍棋“祛魅”了。
人們的心態(tài)在變化。一些職業(yè)棋手開始下賭注,不服氣的就賭李世石贏,另一些從理性出發(fā)賭阿狗贏,但內(nèi)心希望自己賭輸。
焦慮不僅僅屬于不安的棋手和圍棋愛好者。Google的一份內(nèi)部報告顯示,全球約6000萬人觀看了首場比賽。1997年,深藍的國際象棋比賽以流媒體方式在網(wǎng)上直播,觀眾數(shù)量以百萬計。
一個普遍的疑問是,如果代表最出色的智力和策略決策的圍棋冠軍也能被打敗,那么人類會不會被機器打???
和李世石一樣,大多數(shù)人沒意識到現(xiàn)在人工智能已經(jīng)能做哪些事情。
在這場比賽之前,人工智能技術(shù)已被應(yīng)用于Google的30多個產(chǎn)品中,用來改善搜索效果,例如如果搜索一部電影,它很可能會把周邊電影院的排片表也順便告訴了你,而如果你用Google Now,它會根據(jù)你的路程和路況告訴你應(yīng)該提前多久啟程。
事實上,人工智能不單單是邏輯推理和決策,如果將人工智能視為對人類能力的模擬,那科學家在視覺、聽覺、觸覺、精細動作等方面的模擬都有了許多突破。
在摩爾定律的影響下,傳感器越來越便宜并能捕捉更多的環(huán)境數(shù)據(jù),而算法上的突破能讓人工智能利用這些環(huán)境數(shù)據(jù)不斷做出反饋。“相比深藍,AlphaGo有一定的學習能力和判斷能力,并在算法上有根本的提升?!逼テ澅ご髮W進化智能實驗室主任陳怡然對記者說。
“人們曾認為計算機不擅長那些由于答案主觀而難以衡量的問題,但如果有一些數(shù)據(jù)和結(jié)果相關(guān)聯(lián),并且你可以試著建模,那么那些曾被認為需要由人類主觀判斷的問題,完全可以用一種我們此前不曾想到的方式來解決?!盨hawndra Hill說,她是沃頓商學院運營、信息管理與決策專業(yè)的兼任教授。
即使沒有意識到,很多普通人都已經(jīng)在使用人工智能技術(shù)——如果你曾調(diào)戲過iPhone中的Siri,或微軟的Cortana,它們被賦予“聽覺”,能識別不同人的話語,并給出回答。
在模擬人類精細動作方面,和DeepMind同屬一個母公司的波士頓動力發(fā)布了新一代人型機器人Atlas。即使在雪地里,它也能像人一樣走路,被實驗人員踹倒后也能自己爬起來。如果你看過那個用“DARPA(美國國防部國防高等研究計劃署)機器人大賽”剪輯成的搞笑視頻,你會知道直到一兩年前,大多數(shù)人型機器人還沒法正常走路、開門或撿東西。
能像一個職業(yè)棋手那樣工作的人工智能,已滲透到不同的角落。在勝任重復性的精確工作并代替了流水線上的工人后,人工智能也在星巴克這樣的連鎖零售公司中承擔排班工作,或化身無人機對照圖紙監(jiān)督建筑工地的工作。
2011年,IBM的人工智能還只是以稱霸智力競猜電視節(jié)目《危險邊緣》(Jepardy)聞名。但現(xiàn)在,它已經(jīng)與北美十幾家癌癥治療機構(gòu)合作。
2013年,牛津大學發(fā)布了一份叫做《就業(yè)的未來》的報告。它警告說,未來,美國47%的職位將被機器代替,包括管理、金融銷售、藝術(shù)家。美國萊斯大學(RiceUniversity)的科學家Moshe Vardi甚至為這個預言加了一個時限——2045年。
跟AlphaGo學棋
面對悲觀的論調(diào),棋手們的心情卻發(fā)生了逆轉(zhuǎn)。
在3場全敗之后,柯潔說,如果AlphaGo能像APP那樣方便,那“我肯定可以用它來進步棋藝”。一個事實是,柯潔早就在用不那么聰明的AI來提高棋藝。網(wǎng)絡(luò)對弈是新一代棋手主要的訓練方式,這使得他們的訓練量比上一代棋手更大。深藍戰(zhàn)勝卡斯帕羅夫19年以來,國際象棋的棋手們也像這樣改變了傳統(tǒng)的訓練方式。
柯潔每年下上千盤網(wǎng)棋,在圍棋網(wǎng)站上,他的ID是“潛伏”。
在經(jīng)歷了4個不眠之夜后,胡盼盼也逐漸接受了事實,她和同為業(yè)余圍棋高手的丈夫不再視AI為可怕的敵人,而是完美的老師,他們想盡快跟AlphaGo學棋。那些更早接觸AI,并思考AT和人類未來的人,看起來都有類似觀點。
普利策獎得主、《紐約時報》駐硅谷記者約翰·馬爾科夫就將自己的新書命名為《與機器人共舞》,他認為未來人工智能能幫助人類提升效率,人類不擅長的地方,機器人可能很擅長,比如計算、重復勞動和邏輯推斷;但人類習以為常的小事,機器卻難以達到,比如察言觀色、安慰小孩,甚至倒一杯咖啡。這類人工智能的準確稱呼應(yīng)該是智能增強。
對于亟需勞動力的市場來說,人工智能的廣泛民用將會帶來變化。事實上,除了非洲,全球絕大多數(shù)地區(qū)都面臨老齡化和勞動力短缺的威脅。工業(yè)革命時期,機器的普及讓英國的農(nóng)業(yè)人口比例從30%下降到5%,同時催生出更多工作種類。
未知的變化
但技術(shù)帶來的變化是未知的,這或許是恐慌的根源。
不過這也迫使人思考,什么是機器擅長的,而什么不是——更重要的可能是思考人之所以為人的那些特質(zhì):情感、毅力、反思、溝通、不按常理出牌,以及想辦法克服逆境。
為了更了解自身,人們需要更了解機器。馬爾科夫描述了AI和IA這兩大陣營的關(guān)系。在汽車問題上,Google選擇了無人車,豐田、通用、特斯拉等公司則選擇用技術(shù)輔助駕駛員減少事故。另外,你可以把正在艱難學習人類幽默感的Siri看做AI,而把純粹的工作助手Google Now看做IA。
盡管所秉承的技術(shù)方向相反,但目前兩者的差別沒有那么大,所采用的技術(shù)(比如名聲大噪的深度學習)也類似。兩種思路會并存于一個公司內(nèi),專家們也在兩個陣營間轉(zhuǎn)換。
最近的技術(shù)進步已經(jīng)顯示,下一個像iPhone一樣改變一切的產(chǎn)品將誕生在人工智能領(lǐng)域。它可能是醫(yī)療機器人、無人車或是一個現(xiàn)實版的大白?!叭斯ぶ悄軐θ祟惿鐣挠绊憣⑦h超互聯(lián)網(wǎng)和計算機在過去30年所做的?!奔s翰·馬爾科夫?qū)τ浾哒f。
真正需要為AlphaGo擔心的,可能是來自Facebook的對手。與硅谷其他創(chuàng)新不同,人工智能的主要競爭發(fā)生在巨頭之間,獨立的創(chuàng)業(yè)公司很難擠進戰(zhàn)場。Facebook也有一個圍棋AI項目,并被認為處于領(lǐng)先地位,戰(zhàn)勝過AlphaGo以外的所有AI,但還沒贏過職業(yè)選手。
“對數(shù)據(jù)的巨大需求,這種研究的投入不是創(chuàng)業(yè)公司能承擔的。投資者也未必能準確判斷。推動這個領(lǐng)域的是大公司和政府。”零售機器人助理公司Fellow Robots的方正欽稱。
大公司的責任會變得空前的大。人工智能與先前的技術(shù)的不同之處在于,它的發(fā)展很大程度上由看得見、摸得著的少數(shù)科學精英決定。硅谷元老杰里·卡普蘭,曾警告他在斯坦福大學人工智能實驗室的后輩:“你們今天寫入系統(tǒng)的內(nèi)容,日后可能決定整個社會處理問題的方式?!?/p>
這也是為什么人們對此總是特別小心。對“終結(jié)者”的恐懼當然不會完全消失。這也是為什么伊隆·馬斯克要建立非盈利組織OpenAI,并呼吁法律束縛住人工智能研究的手腳。
馬爾科夫在新書的前言中引用了“控制論之父”諾伯特·維納的一句話:“我們可以謙遜地在機器的幫助下過上好日子,也可以傲慢地死去?!?/p>
就在逐漸承認AI對圍棋的統(tǒng)治后,胡盼盼又一次被沖擊了——3月13日,李世石贏了第四盤。
他設(shè)計了一個龐大的誘導戰(zhàn)術(shù),讓AlphaGo誤以為處于優(yōu)勢,然后突然在78手使出從未有過的招數(shù),打破了對手看似牢固的優(yōu)勢,之后AlphaGo連下兩著錯棋。DeepMind又一次對李世石表示贊揚一這次可能更真心一些——這次比賽的重要目的之一就是讓項尖選手來測試AlphaGo的漏洞。
在告訴記者“下棋沒意思”之后5分鐘,柯潔就坐到了電腦前,登錄弈城網(wǎng),以“潛伏”之名繼續(xù)一場網(wǎng)絡(luò)十番棋,對手是韓國頂級棋手樸廷桓??聺嵹A了。
胡盼盼為學生準備好的關(guān)于人機比賽的發(fā)言沒有用上。不到10歲的棋童們似乎對這場金字塔尖的風暴所知甚少。在李世石扳回一盤后,胡盼盼和丈夫出去吃了頓飯慶祝。他們沒像之前那樣對最后一盤下注,只想看場好棋。
李世石和其他棋手在第四場比賽后進行復盤。
就勝敗而言,人類輸了。但圍棋還是那個古老而誘人的游戲。
柯潔在13日當晚發(fā)布了一張照片,看上去是一場職業(yè)棋手的聚會,柯潔似乎睡著了,桌上是空了的啤酒瓶,一旁的古力看上去心情不錯。那條被轉(zhuǎn)發(fā)3萬多次,先前撤銷置頂?shù)奈⒉?,則又再次被置頂了。(資料來源:《第一財經(jīng)周刊》)