2016年3月9至15日,舉世矚目的圍棋“人機(jī)大戰(zhàn)”在韓國(guó)九段棋手李世石與谷歌“阿爾法狗”(AlphaGo)之間展開,最終,阿爾法狗以總比分4:1碾壓李世石,獲封“名譽(yù)九段”。
人類頂尖圍棋選手竟然輸給了計(jì)算機(jī),一時(shí)之間,引發(fā)輿論熱議,關(guān)于人工智能的討論不斷引爆人們的眼球。
實(shí)際上,這并非歷史上第一次人機(jī)大戰(zhàn)。自從1956年“人工智能”這一概念被提出來后,人和計(jì)算機(jī)之間就有過數(shù)次博弈,每一次博弈,都見證了人工智能的跨越發(fā)展。
“硬算高手”深藍(lán)
1996年,卡斯帕羅夫與IBM超級(jí)國(guó)際象棋計(jì)算機(jī)RS/6000 SP(即“深藍(lán)”)展開對(duì)決。經(jīng)過一個(gè)多星期的PK,卡斯帕羅夫最終贏得比賽,但深藍(lán)也在比賽中取勝一局,這是電腦首次在世界錦標(biāo)賽中單局戰(zhàn)勝世界冠軍。
此前,卡斯帕羅夫是國(guó)際象棋英杰榜上的NO.1,自1985年成為世界冠軍后,11年間,他一直打遍天下無敵手。
賽后,卡斯帕羅夫說:“我能感覺,甚至能‘聞到’桌子對(duì)面是一位高智慧的選手?!钡J(rèn)為,深藍(lán)所擁有的只是一種“畸形的智能”,效率低且缺少韌性。他甚至預(yù)言:計(jì)算機(jī)如果要打敗人類棋手,至少要等到2010年!
言猶在耳,然而僅僅一年后,他便以2負(fù)1勝3平被深藍(lán)升級(jí)版打敗。
“這是人工智能發(fā)展史上的一個(gè)里程碑?!辟惡?,德國(guó)人工智能研究中心負(fù)責(zé)人登格爾如是評(píng)價(jià)。
創(chuàng)造這個(gè)“里程碑”記錄的深藍(lán)升級(jí)版,重1270公斤,有32個(gè)“大腦”(微處理器),其計(jì)算能力當(dāng)時(shí)在全球超級(jí)計(jì)算機(jī)中排名第259。比賽前,IBM研發(fā)小組向深藍(lán)輸入了100年來所有國(guó)際特級(jí)大師開局和殘局的200多萬局下法。
深藍(lán)取勝的法寶,是依靠強(qiáng)大的計(jì)算能力窮舉所有路數(shù),并選擇最佳策略——深藍(lán)每秒可運(yùn)算2億步,靠硬算可預(yù)判12步,卡斯帕羅夫只能預(yù)判10步——所謂兵貴神速,深藍(lán)的獲勝也就不那么讓人意外了。
當(dāng)然,深藍(lán)取勝還有另一個(gè)秘訣——每場(chǎng)對(duì)局結(jié)束后,IBM研發(fā)小組都會(huì)根據(jù)卡斯帕羅夫的下棋情況相應(yīng)地修改深藍(lán)的參數(shù),深藍(lán)雖然不會(huì)思考,但這實(shí)際上起到了“強(qiáng)迫”它學(xué)習(xí)的作用。這種“被動(dòng)學(xué)習(xí)”的方式,讓深藍(lán)不斷強(qiáng)化了對(duì)對(duì)手的了解并最終獲勝。
在深藍(lán)問世之前,“人工智能之父”圖靈在1950年曾提出衡量計(jì)算機(jī)智能水平的“圖靈測(cè)試”——如果一個(gè)具有正常思維的人C使用正常人能理解的語言,去詢問一面墻后的兩個(gè)看不見的對(duì)象A和B任意問題,對(duì)象中A是機(jī)器、B是人,如果經(jīng)過若干詢問以后,C不能在實(shí)質(zhì)上區(qū)別A與B的不同,便意味著機(jī)器A通過了圖靈測(cè)試。
雖然,深藍(lán)并沒有進(jìn)行圖靈測(cè)試,但它在人機(jī)大戰(zhàn)中的勝利,至少意味著計(jì)算機(jī)已經(jīng)向著智能化發(fā)展邁出了重要一步。
“百曉生”沃森
2011年2月14至16日,深藍(lán)獲勝4年后,又一次人機(jī)大戰(zhàn)在其同門師弟“沃森”與人類冠軍之間展開。當(dāng)時(shí),沃森參加美國(guó)老牌智力問答節(jié)目《危險(xiǎn)邊緣》,并與該節(jié)目最高獎(jiǎng)金得主布拉德·魯特爾和連勝紀(jì)錄保持者肯·詹寧斯展開了一場(chǎng)萬眾矚目的人機(jī)智力大賽。
《危險(xiǎn)邊緣》采取三人競(jìng)答方式進(jìn)行,通常以答案形式提供各種線索,參賽者必須以問題的形式做出簡(jiǎn)短正確的回答。因而參賽者需具備歷史、文學(xué)、藝術(shù)、科技、體育、地理、政治及流行文化等知識(shí),還得會(huì)解析隱晦含義、反諷與謎語等,而普通電腦并不擅長(zhǎng)進(jìn)行這類“深度問答”。
在比賽中,沃森表現(xiàn)極為突出,盡管在“回答”問題時(shí),它的互聯(lián)網(wǎng)功能被中斷,只能“自己想”——從內(nèi)存的資料中尋找并組合答案,它卻總是能在3秒內(nèi)迅速作答,還能分析出題目線索中的微妙含義、諷刺口吻及謎語等。此外,它還能根據(jù)比賽獎(jiǎng)金的數(shù)額、自己的比分與對(duì)手的差距、自己擅長(zhǎng)的題目領(lǐng)域來“自主決定”是否要搶答某一題。最終,沃森以77147分的總成績(jī)輕松獲勝。
那么,沃森為什么這么聰明?
首先,沃森“肚里有貨”——它內(nèi)存了2億頁數(shù)據(jù),各種百科全書、詞典、新聞、維基百科的全部?jī)?nèi)容以及其他可以建立知識(shí)庫的參考材料都被它“收入囊中”,堪稱是計(jì)算機(jī)領(lǐng)域的“百曉生”。
其次,它能“秒讀萬冊(cè)”——它由90臺(tái)IBM服務(wù)器(相當(dāng)于90個(gè)“大腦”)、360個(gè)芯片驅(qū)動(dòng)組成,每秒能處理500GB的數(shù)據(jù),相當(dāng)于1秒閱讀100萬本書。
最重要的是,沃森還會(huì)“深度問答”——這一法寶是IBM研發(fā)團(tuán)隊(duì)為它量身定制的,該技術(shù)賦予了它較高的自然語言理解能力。在拿到一個(gè)問題后,依靠?jī)?nèi)置的100多種算法,沃森會(huì)在3秒內(nèi)解析問題并檢索數(shù)百萬條信息,包括語法語義分析、對(duì)各個(gè)知識(shí)庫進(jìn)行搜索、提取備選答案、對(duì)備選答案證據(jù)的搜尋、對(duì)證據(jù)強(qiáng)度的計(jì)算和綜合等。
比如,當(dāng)被問及“哥倫比亞廣播公司《60分鐘》節(jié)目首次播出時(shí),當(dāng)時(shí)的美國(guó)總統(tǒng)是誰”,“沃森”首先會(huì)對(duì)“首次播出”進(jìn)行語言理解,然后檢索出《60分鐘》節(jié)目首次播出的日期,之后再成功搜索出當(dāng)時(shí)的美國(guó)總統(tǒng)。
在取得這場(chǎng)眾所矚目的勝利后,沃森開始向醫(yī)療衛(wèi)生業(yè)進(jìn)軍。在美國(guó),機(jī)器人醫(yī)生沃森從2011年就開始坐診,通過詢問病人的病征、病史,對(duì)患者的個(gè)性化數(shù)據(jù)、大量病例和醫(yī)療文獻(xiàn)進(jìn)行“學(xué)習(xí)”,它能迅速提出最佳診療方案,診斷準(zhǔn)確率甚至高達(dá)73%。
從深藍(lán)到沃森,從硬算能力到自然語言理解能力,從“被動(dòng)學(xué)習(xí)”到“深度問答”, 計(jì)算機(jī)的“智能”向前邁進(jìn)了一大步。
自學(xué)成才的“學(xué)霸”阿爾法狗
圍棋一直被看作是人類最后的智力競(jìng)技高地,據(jù)估算,圍棋的可能下法數(shù)量多達(dá)10的171次方。這個(gè)數(shù)字,甚至遠(yuǎn)遠(yuǎn)高于可觀測(cè)宇宙中的原子總數(shù)(該總數(shù)為10的80次方)。
因此,人們普遍認(rèn)為計(jì)算機(jī)無法在類似圍棋這樣高度復(fù)雜的項(xiàng)目比賽中戰(zhàn)勝人類,但2016年阿爾法狗與李世石的人機(jī)大戰(zhàn),顛覆了這一認(rèn)知。
阿爾法狗之所以能取勝,法寶就在于它的核心系統(tǒng)屬于“深度學(xué)習(xí)”。
“深度學(xué)習(xí)”是時(shí)下最火的一種基于神經(jīng)網(wǎng)絡(luò)的模擬人腦的神經(jīng)網(wǎng)絡(luò),它通過模仿人腦的機(jī)制來解釋數(shù)據(jù),例如圖像、聲音和文本等。
為了讓計(jì)算機(jī)學(xué)會(huì)像人一樣“思考”,一個(gè)重要的條件是:它必須擁有計(jì)算速度可媲美人腦的高性能計(jì)算集群,來快速完成海量數(shù)據(jù)的“學(xué)習(xí)”。而在這方面,阿爾法狗不聯(lián)網(wǎng)時(shí)的“單機(jī)版”性能至少是當(dāng)年“深藍(lán)”的1000倍。
為了使阿爾法狗變得更“聰明”,谷歌還專門為其設(shè)計(jì)了兩個(gè)神經(jīng)網(wǎng)絡(luò),其中,“策略網(wǎng)絡(luò)”會(huì)根據(jù)棋局選擇下一步走法;“價(jià)值網(wǎng)絡(luò)”會(huì)在下子后分析對(duì)手會(huì)怎么走,并預(yù)測(cè)進(jìn)行數(shù)值性的估計(jì)。
比賽前,阿爾法狗“深度學(xué)習(xí)”用了人類圍棋高手對(duì)弈的3000萬局圍棋走法進(jìn)行“自我對(duì)弈”訓(xùn)練,并進(jìn)行大規(guī)模的數(shù)據(jù)運(yùn)算,這些運(yùn)算用了兩三千個(gè)CPU。對(duì)人來說,如此大規(guī)模的運(yùn)算訓(xùn)練,即使每局只要15分鐘,可能也要800多年才能下完,阿爾法狗的運(yùn)算能力之強(qiáng)由此可見一斑。
此外,阿爾法狗還能自行研究新戰(zhàn)略,在它的神經(jīng)網(wǎng)絡(luò)之間運(yùn)行數(shù)千局圍棋,利用反復(fù)試驗(yàn)調(diào)整連接點(diǎn),這個(gè)流程也稱為“鞏固學(xué)習(xí)”。因此,阿爾法狗的“逆天”棋藝并不是開發(fā)者教給他的,而是“自學(xué)成才”。從這個(gè)意義上來說,阿爾法狗堪稱是計(jì)算機(jī)中的“學(xué)霸”。
人工智能,還有多遠(yuǎn)?
阿爾法狗的勝利,很大程度上體現(xiàn)了近年來人工智能領(lǐng)域“深度學(xué)習(xí)”技術(shù)的快速提升。特別是隨著GPU圖形處理器、超級(jí)計(jì)算機(jī)、云計(jì)算和大數(shù)據(jù)的迅猛發(fā)展,“深度學(xué)習(xí)”如同火箭升空般飛速發(fā)展。早在2011年,谷歌用1000臺(tái)機(jī)器、16000個(gè)CPU處理的“深度學(xué)習(xí)”模型就已經(jīng)有了10億個(gè)神經(jīng)元——當(dāng)然,這仍遠(yuǎn)遠(yuǎn)低于人腦100億~10000億個(gè)的神經(jīng)元總數(shù)。
現(xiàn)在,“深度學(xué)習(xí)”技術(shù)在語音識(shí)別、計(jì)算機(jī)視覺、語言翻譯等領(lǐng)域,都戰(zhàn)勝了傳統(tǒng)的機(jī)器學(xué)習(xí)方法,甚至在人臉驗(yàn)證、圖像分類上還超過了人類的識(shí)別能力。專家預(yù)計(jì),在不久的將來,我們甚至可以在手機(jī)上運(yùn)行像人腦一樣復(fù)雜的“深度學(xué)習(xí)”神經(jīng)網(wǎng)絡(luò)。
那么,這是否意味著計(jì)算機(jī)已經(jīng)和人一樣“聰明”了?
答案是否定的!
因?yàn)樵诟鼜?fù)雜的認(rèn)知層面,例如對(duì)于語言和圖像的深度理解、邏輯推演、情感選擇等方面,計(jì)算機(jī)距離人類還有很大差距。
比如說,對(duì)普通人而言,分辨貓和狗,從閱讀或娛樂中獲取快樂,分辨愛或恨、激動(dòng)或憤怒,都是很尋常的事情,但對(duì)計(jì)算機(jī)而言,這些問題會(huì)讓它分分鐘死機(jī)。
舉個(gè)例子,當(dāng)你和朋友一起外出就餐時(shí),兩人都搶著買單。對(duì)于這種推搡的過程,計(jì)算機(jī)很難準(zhǔn)確判斷出這是為了買單的友善行為,還是惡意的爭(zhēng)執(zhí)。更進(jìn)一步來說,計(jì)算機(jī)也許可以根據(jù)人的面部表情和肢體動(dòng)作,在一定程度上辨別出人的喜怒哀樂等情緒,但對(duì)于人類的那種“只可意會(huì),不可言傳”的情感,在進(jìn)行辨識(shí)時(shí),它就只能交“白卷”了。
正如經(jīng)典科幻大片《人工智能》展現(xiàn)的那樣,當(dāng)女機(jī)器人席拉被問及“什么是愛”時(shí),她回答:“愛就是微張我的眼睛,呼吸急促,體溫開始上升……”對(duì)計(jì)算機(jī)來說,“愛”只能是一種可以被特征化、符號(hào)化的程序,但計(jì)算機(jī)卻無法理解人類這種非理性的情感,更不可能像人一樣愛得死去活來、魂縈夢(mèng)牽。
可見,邏輯推演和情感選擇,是人工智能尚難以逾越的障礙。所以,有人工智能專家開玩笑說:“我們努力想讓機(jī)器變得稍微聰明一點(diǎn),但它們還是有點(diǎn)笨。”因此,要想讓“機(jī)器”真正變成人,科學(xué)家也許還有很長(zhǎng)遠(yuǎn)的路要走。(編輯/余風(fēng))