吳飛
【摘要】 從人的心智發(fā)展機(jī)理、云端大數(shù)據(jù)以及智能算法等不同的維度來看,智能機(jī)器識(shí)別人心是可能實(shí)現(xiàn)的。雖然這條路可能還相當(dāng)遠(yuǎn),但官方制度性的認(rèn)可、商業(yè)營利的動(dòng)機(jī)刺激以及人類探索的好奇心的召喚,正吸引著越來越多的人投身于此。不過,與其他技術(shù)一樣,“識(shí)別人心”的效用也是兩面的:一方面可以用于治療和治理,另一方面也需要防止對(duì)人類本身的侵犯。它可能成為影響、操縱、控制他人心理和觀點(diǎn)的工具,對(duì)這種意識(shí)的入侵要保持高度的警覺。
【關(guān)鍵詞】人工智能 ?識(shí)別人心 ?心智
【中圖分類號(hào)】 TP18 ? ? ? ? ? ? ? ? ? ? ? 【文獻(xiàn)標(biāo)識(shí)碼】A
【DOI】10.16619/j.cnki.rmltxsqy.2020.01.002
2016年,幾家初創(chuàng)公司開始銷售智能聊天機(jī)器人。其中有一款機(jī)器人名叫埃米·英格拉姆(Amy Ingram),你只需要把電子郵件抄送給埃米,她就會(huì)開始為你做助理工作。埃米有酷似人類的語調(diào),能說會(huì)道且談吐不凡。一名用戶說她比人類更能勝任這項(xiàng)工作,有些男人甚至想和她約會(huì)。智能機(jī)器人時(shí)代正在向我們走來。
“萬物皆數(shù)”是包括圖靈在內(nèi)的許多學(xué)者的觀點(diǎn),他們思考的是,如果人的五官能夠感受到的世間萬物都可以用機(jī)器轉(zhuǎn)換成數(shù)字來表示,那么人的思考過程自然也可以用機(jī)器轉(zhuǎn)換成數(shù)字來表示。香農(nóng)和奈奎斯特等人的杰出工作,讓人們真正將物理世界的信號(hào)編碼成數(shù)字,數(shù)字技術(shù)因之拉開了歷史的序幕。
從大型計(jì)算機(jī),到PC機(jī),到移動(dòng)互聯(lián)網(wǎng),到今天的云計(jì)算。六七十余年來,科學(xué)家和工程師們編寫出各種各樣的程序,建立了各種不同的人工智能或機(jī)器學(xué)習(xí)的數(shù)學(xué)模型,推進(jìn)了虛擬現(xiàn)實(shí)、無人駕駛、人臉識(shí)別、語音助理等技術(shù)的發(fā)展。換言之,機(jī)器今天已經(jīng)擁有了識(shí)別語音、圖像和活動(dòng)場景的能力,它甚至可以與人對(duì)話。那么,人心可以識(shí)別么?讓機(jī)器看著人的臉,讀懂人的心,正激勵(lì)著無數(shù)科學(xué)家的探索。因?yàn)檫@種探索必然會(huì)獲得官方制度性的認(rèn)可和商業(yè)營利的動(dòng)機(jī),而人類探索自身的好奇心也是一種重要的誘導(dǎo)性力量。
本文將從心智的機(jī)理、算法與智能的發(fā)展脈絡(luò)等兩個(gè)不同的維度切入,揭示了機(jī)器識(shí)別人心的可能性。正如希爾伯特所言:我們必須知道;我們必將知道。
心智的產(chǎn)生及其機(jī)理
1979年,美國考古學(xué)家托馬斯·維恩撰文稱:“現(xiàn)代心智起源于30萬年前。”[1]智人(Homosapiens)的本意是“會(huì)思考的人”。[2]瓦爾特將智能分為三個(gè)層次:最低層面是“順化智能”,其滿足的標(biāo)準(zhǔn)是心智中的所有的內(nèi)容都來源于感知傳遞;第二層次是“正常智能”,即可以通過自己的力量在自身內(nèi)部產(chǎn)生出知識(shí)所依賴的原則;第三個(gè)層次是“瘋狂的混合體”,即通過這種智能,一些人可以在缺乏藝術(shù)訓(xùn)練和學(xué)習(xí)的情況下,說出巧妙而讓人嘆服的言語。雖然這些話是真實(shí)的,但是別人都沒有看到過、聽到過也沒有被人記錄在案,甚至別人想都沒有想到過,這種智能屬于真正的創(chuàng)造性的能力。[3]
現(xiàn)代人的記憶、推理、判斷、反省、理性,以及使用語言溝通的頭腦才是人目前為止超越其他物種的關(guān)鍵。正所謂人是符號(hào)的動(dòng)物,人是文化之網(wǎng)上的動(dòng)物所指的就是人類的理性思考(rational thought)的能力。[4]笛卡爾就認(rèn)為語言是人類這個(gè)種屬所獨(dú)有的能力。也就是說,人的心智的出現(xiàn),使得人擁有了無與倫比的創(chuàng)造性和適應(yīng)性,從而超越了地球上的其他生命形態(tài)。這雖然被一些學(xué)者批評(píng)為人類中心主義,但人類的想象力、創(chuàng)造力,尤其豐富語言表達(dá)和虛構(gòu)故事的能力,尚無出其右者。
但人心是什么?人心可以計(jì)算么?如果可以計(jì)算和測量,那么它能夠被認(rèn)別么?作為碳基的信息處理機(jī)制的人類大腦與作為硅基的計(jì)算機(jī)設(shè)備之間真的可以對(duì)話甚至相互理解么?要想回答清楚這一系列問題,我們首先要弄清楚何謂人心。
我們這里將人心界定為人的心智活動(dòng)的總稱。所謂的心智是指“產(chǎn)生和控制知覺、注意、記憶、情緒、語言、決策、思維、推理等心理機(jī)能的成分”,“是形成客觀世界表征的系統(tǒng),促使人們采取行動(dòng)以實(shí)現(xiàn)目標(biāo)”。[5]可見,心智既包括人的認(rèn)識(shí)、判斷、思維等的意識(shí)活動(dòng),也包括人的情感與情緒活動(dòng)。21世紀(jì)被稱為“腦的世紀(jì)”或“心智的世紀(jì)”。歐盟發(fā)起的“人類大腦計(jì)劃”(Human Brain Project, HBP)集結(jié)了歐洲乃至世界上的一批科學(xué)精英,研究如何在超級(jí)計(jì)算機(jī)中精確地模擬大腦。對(duì)人的認(rèn)知和腦的研究,已經(jīng)有了巨大的發(fā)現(xiàn),基于現(xiàn)有的研究成果,對(duì)于人的心智問題,我們有如下判斷。
其一,人的心智是自然進(jìn)化的結(jié)果。如果說,柏拉圖在《理想國》已經(jīng)發(fā)現(xiàn)了一些遺傳的奧秘,那么亞里士多德則更進(jìn)了一步,他發(fā)現(xiàn)傳遞信息是遺傳物質(zhì)的核心功能。其后,達(dá)爾文發(fā)現(xiàn)了生物進(jìn)化的規(guī)律,而孟德爾則在修道院花園里進(jìn)行的碗豆雜交實(shí)驗(yàn)中找到了生命進(jìn)化的密碼——基因。盡管在1866到1900年間,孟德爾的文章僅被引用4次,[6]但這一具有劃時(shí)代意義的科學(xué)發(fā)現(xiàn),為后續(xù)的研究指明了方向。爾后,??烁ダ锔鶕?jù)基因的化學(xué)形態(tài),確認(rèn)DNA就是遺傳信息的載體。而沃森、克里克、威爾金斯和富蘭克林最終解開了基因的分子結(jié)構(gòu)之謎?,F(xiàn)代DNA測序技術(shù)表明人類與黑猩猩有著非常近的親緣關(guān)系。事實(shí)上,研究還發(fā)現(xiàn),人類的基因與海葵也有驚人的相似性。生命科學(xué)從基因編碼的角度分析指出,今天的人類就是猿的一個(gè)分支而已。但研究表明,人類的前額葉-頂葉網(wǎng)絡(luò)的體積要遠(yuǎn)遠(yuǎn)大于與人類血緣最近的其他靈長類動(dòng)物,這使得人類處理與組合信息的能力遠(yuǎn)超其他物種。不過,人類大腦所積累起來的一系列功能也只是滿足了最原始的進(jìn)化需求——生存與繁衍。理查德·道金斯提出了著名的“自私的基因”學(xué)說就認(rèn)為,基因是進(jìn)化的核心,宿主通過復(fù)制將基因傳給下一代。
其二,心智是一種信息方式。史蒂芬·平克就認(rèn)為,心智是一個(gè)由若干計(jì)算器官所組成的系統(tǒng),它是我們祖先在解決生存問題的進(jìn)程中“自然選擇”出來的。心智不是大腦,而是大腦所做的事情。人是心智進(jìn)化產(chǎn)物,而不是剃光了毛的“裸猿”。心智進(jìn)化的最終的目的是為了復(fù)制最大數(shù)量的基因,而正式基因創(chuàng)造了心智。他寫道:“所有的人類心理都可以被一個(gè)唯一、萬能的理由所解釋:大腦、文化、語言、社會(huì)化、學(xué)習(xí)、復(fù)雜性、自組織和神經(jīng)網(wǎng)絡(luò)動(dòng)力學(xué)”。[7]他認(rèn)為,“視覺、行動(dòng)、常識(shí)、暴力、道德還有愛,無一例外,都是可以厘清的智能的核心組成部分,他們是信息處理的過程”。[8]20世紀(jì)50年代,沃倫·麥卡洛克(Warren McCulloch)等人提出了“心智的計(jì)算理論”(Computational Theory of Mind,CTM),該理論的核心觀點(diǎn)是,大腦即是一種計(jì)算的機(jī)制,其能力(包括其心理能力)能夠通過計(jì)算得以說明。[9]也便是將認(rèn)知過程看作是一種基于規(guī)則的符號(hào)操作過程,而心智或大腦則是一種物理符號(hào)的系統(tǒng),大腦被看作是生物的硬件,而心智是運(yùn)行于其上的軟件。[10]
其三,人類一直在探索破解自身的密碼,并且確實(shí)找到了越來越科學(xué)的方法和測量工具來測量心智??茖W(xué)家認(rèn)為,大腦實(shí)質(zhì)上純粹是起到一個(gè)信息的、計(jì)算的和控制的功能。因此“其精確的功能組織可以通過語言對(duì)其信息功能進(jìn)行準(zhǔn)確的描述,即通過認(rèn)知而非細(xì)胞解剖或者化學(xué)的形式來予以描述”。[11]心理學(xué)家通過核磁共振等神經(jīng)影像技術(shù)比較識(shí)字者與文盲的大腦時(shí)發(fā)現(xiàn),兩者的大腦活動(dòng)方式有諸多不同。在測量他們的腦波,用一連串認(rèn)知能力測驗(yàn)對(duì)他們進(jìn)行測試之后,心理學(xué)家得出結(jié)論:閱讀和書寫技能的獲得改變了腦組織結(jié)構(gòu)……不僅在語言上,在視覺感知、邏輯推理、記憶策略和條理性運(yùn)籌思維上都是如此。[12]
其四,人的意識(shí)活動(dòng)并非純粹的精神活動(dòng)。笛卡爾相信“機(jī)器中的幽靈”這一教條,他認(rèn)為,一個(gè)人的思想是某個(gè)“神秘的幽靈”,生存在人這一生物機(jī)器的大腦里面。幾個(gè)世紀(jì)以來這種身心二元論一直被很多人認(rèn)可,他們相信意識(shí)是人的決定性要素,身體不過是意識(shí)和精神活動(dòng)的障礙物,沉重的肉身牢籠似地困住了精神的超脫,因此在各種宗教教義和傳統(tǒng)的哲學(xué)中,那些力圖摒棄易朽的肉體的實(shí)踐成為永恒的贊頌者。但是從19世紀(jì)中期開始,醫(yī)學(xué)和新興的神經(jīng)科學(xué)領(lǐng)域內(nèi)越來越多的證據(jù)表明笛卡爾的二元論站不住腳。自尼采以降,肉身的意義被新發(fā)現(xiàn)和贊美。在尼采那里,“酒神的魔力,使人和人、人和自然、人和神的界限和藩籬消失了。一切都得以解放,一切都達(dá)成了和解,一切都在一個(gè)興奮的大海中融為一體,相互吞食、轉(zhuǎn)換、變換”。[13]在尼采看來,感覺、思考和激情都是意志的構(gòu)成部分。他寫道:“身體乃是比陳舊的靈魂更令人驚異的思想?!盵14]如今越來越多的人相信,身(肉)體活動(dòng)體現(xiàn)了一種推動(dòng)認(rèn)知發(fā)展的所謂“生存意向性”。[15]英國哲學(xué)家吉爾伯特·賴爾(Gilbert Ryle)在1949年出版的著作《心的概念》中指出,笛卡兒的身心二元論犯了一種“范疇錯(cuò)誤”。他認(rèn)為人的身體和心靈、精神和行為是一回事。
智能、算法與全息連接
“當(dāng)人類走出了‘自我中心之后,又遭遇了機(jī)器智能的挑戰(zhàn)。這一次,是人-機(jī)交流——即人與物之間的互動(dòng)——建構(gòu)了存在于人與物之間的公共心智?!盵16]圖靈1948年在英國國家物理實(shí)驗(yàn)室(NPL)的一個(gè)題為“智能機(jī)器”內(nèi)部報(bào)告中提到了“肉體智能”(embodied intelligence)和“無肉體智能”(disembodied intelligence)區(qū)分問題,正式開始對(duì)智能的思考。在1950年的Mind雜志上,圖靈發(fā)表文章提出“機(jī)器能夠思考嗎?”。在圖靈測試中,被測試者(人)在一個(gè)黑暗的屋子里面與一臺(tái)機(jī)器或一個(gè)人進(jìn)行對(duì)話(當(dāng)時(shí)采用的是文本方式,現(xiàn)在可以采用語音方式),若被測試者無法區(qū)分對(duì)話的是人還是機(jī)器,則可以稱機(jī)器通過了圖靈測試?!皥D靈堅(jiān)信,人工智能一定能以某種方式實(shí)現(xiàn)?!盵17]
1952年,發(fā)現(xiàn)了神經(jīng)學(xué)的功能的離子學(xué)說和突觸電位的諾貝爾醫(yī)學(xué)獎(jiǎng)得主,艾倫·勞埃德·霍奇金爵士提出了脈沖神經(jīng)網(wǎng)絡(luò)這種神經(jīng)行為學(xué)模型(SNN)。SNN的價(jià)值在于,它描述了神經(jīng)元之間的電位是如何產(chǎn)生和流動(dòng)的,它認(rèn)為神經(jīng)元之間的交換主要靠“神經(jīng)遞質(zhì)”來產(chǎn)生化學(xué)放電,從而在神經(jīng)網(wǎng)絡(luò)中實(shí)現(xiàn)復(fù)雜和可變的神經(jīng)系統(tǒng)交互。2011年,IBM發(fā)布了True North芯片,這也是人類用電路模擬神經(jīng)行為學(xué)的開端。2017年,英特爾發(fā)布了類腦芯片Loihi,其擁有13萬個(gè)人造突觸。不過,到目前為止,類腦芯片的任務(wù)性處理能力比較差、算力水平也相當(dāng)?shù)汀18]1956年夏天,在新罕布什爾州達(dá)特茅斯學(xué)院的一次小型會(huì)議上,赫伯特·西蒙、約翰·麥卡錫、克勞德·香農(nóng)等AI界的開山鼻祖?zhèn)儯吞岢隽恕爸悄艿娜魏翁卣?,原則上都可以精確描述,因此我們可以制造機(jī)器來對(duì)它進(jìn)行模擬”。在這次會(huì)議上,專家們首次用到“人工智能”這一術(shù)語。這次會(huì)議后來被稱之為標(biāo)志性事件——標(biāo)志著人類開始用一種全新的方式來研究心智問題。2013年,由歐盟組織的26個(gè)國家135個(gè)合作機(jī)構(gòu)參與的“人類腦計(jì)劃”(Human Brain Project,簡稱HBP)將重點(diǎn)放在了如何通過超級(jí)計(jì)算機(jī)技術(shù)來模擬人腦功能,以期實(shí)現(xiàn)人工智能。瑞士洛桑聯(lián)邦理工學(xué)院(EPFL)建立了腦與心智研究所(Brain Mind Institute),其科研團(tuán)隊(duì)包含了基礎(chǔ)神經(jīng)科學(xué)、計(jì)算神經(jīng)科學(xué)、人工智能、機(jī)器人相關(guān)的科研人員,共同從事瑞士藍(lán)腦計(jì)劃、歐盟腦計(jì)劃相關(guān)的研究。斯坦福大學(xué)成立了心智、腦與計(jì)算研究中心(Stanford Center for Mind, Brain and Computation),由認(rèn)知心理學(xué)家、人工神經(jīng)網(wǎng)絡(luò)專家McClelland領(lǐng)導(dǎo)。該中心集成理論、計(jì)算和實(shí)驗(yàn)研究的方法,致力于研究感知、理解、思維、感受、決策的腦神經(jīng)信息處理機(jī)制。[19]
在這股探索風(fēng)潮中,逐漸形成了符號(hào)主義、聯(lián)結(jié)主義以及行為主義等多種不同的學(xué)派。 “深度學(xué)習(xí)”表現(xiàn)相對(duì)突出,尤其“阿爾法狗”(AlphaGo)戰(zhàn)勝全球的圍棋高手后,引起了公眾的廣泛關(guān)注。
不過,紐約大學(xué)教授加里·馬庫斯(Gary Marcus)認(rèn)為,從技術(shù)角度看,深度學(xué)習(xí)可能擅長模仿人類大腦的感知任務(wù),比如圖像或語音識(shí)別,但它在理解對(duì)話或因果關(guān)系等其他任務(wù)上仍有很大不足?,敻覃愄亍げ┑牵∕argaret Boden)指出,人工智能一直專注于智力的理性,卻忽略社會(huì)/情緒智能,更別提智慧了。她認(rèn)為,人類的心智太豐富,我們還缺乏(能全面說明)心智工作方式的好的心理/計(jì)算理論,是以她的結(jié)論是:人類水平的通用人工智能的前景看起來非常渺茫。約翰·塞爾(John Searle)曾經(jīng)通過著名的“中文屋論證”(Chinese Room argument)闡述了人類的“心智”與機(jī)器的計(jì)算之間的區(qū)別。塞爾假想有一個(gè)不懂中文的人被關(guān)在一間小屋子里,只能通過字條與外面的人進(jìn)行中文符號(hào)的交流。房間內(nèi)有一本完美的說明書,看了這本書就可以用中文回答外面的問題。這樣一來,就算只懂英語,房間里的人也可以通過說明書,用中文回答問題了。塞爾假設(shè),只要這個(gè)人擁有的規(guī)則足夠完備,那么屋子外面的人就不會(huì)懷疑屋子里面的人是懂中文的。塞爾希望通過這個(gè)論證表明,通過圖靈測試的計(jì)算機(jī)以及會(huì)下圍棋的程序,它們和中文屋里面不懂中文的人一樣,只是對(duì)符號(hào)進(jìn)行規(guī)則化加工而不論符號(hào)的意義,而人能夠?qū)Α耙饬x”作出應(yīng)答。[20]然而,實(shí)際上塞爾的論證僅僅表明“通過圖靈測試的計(jì)算機(jī)可以沒有智能”,卻沒有提供足夠的證據(jù)表明“計(jì)算機(jī)事實(shí)上沒有智能”。[21]
不過,人工智能雖然還不足夠智能,但技術(shù)進(jìn)步的結(jié)果往往令人意想不到。牛津大學(xué)計(jì)算機(jī)科學(xué)系主任邁克爾·伍爾德里奇(Michael Wooldridge)曾在其著作《多Agent系統(tǒng)引論》中寫道:區(qū)別于地球上的其他生物,不只是因?yàn)槿祟愑形阌怪靡傻膶W(xué)習(xí)和解決問題的能力,更是因?yàn)槿祟惥哂信c伙伴通信、合作、達(dá)成一致的能力。這些我們每天都使用的社會(huì)能力,是與規(guī)劃和學(xué)習(xí)等智能同等重要的智能行為。他認(rèn)為雖然目前的AI還不能做到“復(fù)雜推理”、“處理定義不清的問題”、“對(duì)事物作出判斷”以及“對(duì)外界環(huán)境的感知”,他還是相信機(jī)器、設(shè)備同樣具備智能。[22]韓國科學(xué)技術(shù)院生物和大腦工程系的李相完教授在《科學(xué)》雜志上發(fā)表的一篇文章中,提出了一種新的理論——“前頭葉控制”理論。他認(rèn)識(shí)到人腦可以自行評(píng)價(jià)對(duì)外部環(huán)境的認(rèn)知度,通過外部信號(hào)來處理信息。因此,他認(rèn)為將該原理應(yīng)用于AI算法和機(jī)器人等領(lǐng)域,便可以設(shè)計(jì)出能夠根據(jù)外部情況變化,在性能、效率、速度等各個(gè)方面自動(dòng)平衡到最佳狀態(tài)的智能系統(tǒng)。以色列巴伊蘭大學(xué)的科學(xué)家坎特(Ido Kanter)教授和他的合作者最近在《科學(xué)報(bào)告》(Scientific Reports)雜志發(fā)表的文章表明,在連接神經(jīng)元的網(wǎng)絡(luò)中,突觸模型中每個(gè)神經(jīng)元的學(xué)習(xí)參數(shù)數(shù)量要比樹狀模型中的數(shù)量“明顯更大”。[23]對(duì)人工智能充滿樂觀的人不少,如2015年《紐約時(shí)報(bào)》(New York Times)科技版記者約翰·馬爾科夫(John Markoff)的報(bào)道《人工智能的學(xué)習(xí)能力匹敵人類》,就代表了這種典型的觀點(diǎn)。深度學(xué)習(xí)似乎真的已經(jīng)解決了“感知”問題:它具有照片自動(dòng)分類(圖像識(shí)別+分類)、圖像描述生成(圖像識(shí)別+理解)等能力。計(jì)算機(jī)現(xiàn)在可以比人類更好地識(shí)別字符、圖像、物體、聲音、語言,甚至是視頻畫面中的物體。[24]百度用了11940個(gè)小時(shí)的英語口語來訓(xùn)練他們的語音網(wǎng)絡(luò),現(xiàn)在百度的網(wǎng)絡(luò)轉(zhuǎn)錄語音的能力可以媲美人類?;谒惴?,機(jī)器也可以創(chuàng)造聽起來很自然的短語字幕,以此描述圖像內(nèi)容。2011年1月的一天,美國著名的智力問答競賽節(jié)目《危險(xiǎn)邊緣》歷史上最成功的兩位人類選手肯·詹寧斯和布拉德·魯特在節(jié)目中與IBM的一組研究人員開發(fā)的計(jì)算機(jī)程序“沃森”比賽(比賽時(shí),它被切斷了互聯(lián)網(wǎng))。為期兩天的挑戰(zhàn)賽結(jié)束時(shí),詹寧斯贏得了24000美元,魯特贏得了21600美元,而“沃森”卻贏得了77147美元,遙遙領(lǐng)先于兩位人類對(duì)手。盡管不能說“沃森”有智能,但他這種能讀懂語言,還能夠從自己的記憶庫中找到答案的這種探索、匹配關(guān)系并能識(shí)別的能力卻是強(qiáng)大的。
與智能同步推進(jìn)的是基于物聯(lián)網(wǎng)、大數(shù)據(jù)的存貯與數(shù)據(jù)挖掘技術(shù)的進(jìn)步。如果說5G時(shí)就能夠通過云網(wǎng)融合、邊緣計(jì)算、終端多樣化相結(jié)合,可以獲得有關(guān)每一個(gè)聯(lián)網(wǎng)個(gè)體的全息數(shù)據(jù),進(jìn)而達(dá)到“信息隨心至,萬物觸手及”的話。那么6G技術(shù)的發(fā)展,則可以達(dá)到“智慧連接”“深度連接”“全息連接”“泛在連接”,使得“一念天地,萬物隨心”成為可能?!耙荒钐斓亍敝械摹耙荒睢币辉~強(qiáng)調(diào)實(shí)時(shí)性,指無處不在的低時(shí)延、大帶寬的連接,“念”還體現(xiàn)了思維與思維通信的“深度連接”,“天地”對(duì)應(yīng)空天地海無處不在的“泛在連接”;“萬物隨心”所指的萬物為智能對(duì)象,能夠“隨心”所想而智能響應(yīng),即“智慧連接”;呈現(xiàn)方式也將支持“隨心”無處不在的沉浸式全息交互體驗(yàn),即“全息連接”。[25]隨著車聯(lián)網(wǎng)、物聯(lián)網(wǎng)、工業(yè)互聯(lián)網(wǎng)、遠(yuǎn)程醫(yī)療、智能家居、4K/8K、AR/VR、空間網(wǎng)絡(luò)等新業(yè)務(wù)類型和需求的出現(xiàn),未來的網(wǎng)絡(luò)正呈現(xiàn)出一種泛在化的趨勢。劉韻潔院士等預(yù)測說:“在未來,網(wǎng)絡(luò)人工智能將在網(wǎng)絡(luò)的自配置/自管理、網(wǎng)絡(luò)流量自學(xué)習(xí)/自優(yōu)化、網(wǎng)絡(luò)威脅自識(shí)別/自防護(hù)和網(wǎng)絡(luò)故障自診斷/自恢復(fù)等方面起到重要作用,在復(fù)雜的網(wǎng)絡(luò)環(huán)境下實(shí)現(xiàn)自動(dòng)化、智能化的網(wǎng)絡(luò)管控。”[26]1983年,羅素(Peter Russell)提出了“全球腦”(global brain)的概念。他認(rèn)為,通過電話、傳真等電信傳播工具,人類將會(huì)形成連接緊密的全球網(wǎng)絡(luò)。羅素認(rèn)為,全球人口有可能達(dá)到100億,如果100億人通過通訊設(shè)施連接,“全球腦”即可形成。這個(gè)類似于人的大腦的“全球腦”會(huì)形成一個(gè)具有獨(dú)立運(yùn)作能力的有機(jī)體,具有記憶、思考、反饋等諸多功能。[27]社會(huì)的網(wǎng)絡(luò)化以及技術(shù)推進(jìn)的網(wǎng)絡(luò)性聯(lián)結(jié),使得人與人、人與物的信息都流動(dòng)的云的數(shù)據(jù)化存在著。這種數(shù)據(jù)化、信息化的方式,成為人和人工智能共同的社會(huì)環(huán)境和文化環(huán)境,是取之不盡、用之不竭的生產(chǎn)資源。我們在利用機(jī)器進(jìn)行思維時(shí),機(jī)器也在把我們變成它的“齒輪”和“螺絲釘”。[28]網(wǎng)絡(luò)社會(huì)不斷進(jìn)化與擴(kuò)張,至腦的最后界限被突破,有學(xué)者稱之為一統(tǒng)(unification)階段。這樣的網(wǎng)絡(luò)是一種“知化網(wǎng)絡(luò)”,它從冰冷的物理連接逐步進(jìn)化為主動(dòng)感知各類連接設(shè)備……進(jìn)而知曉如何適應(yīng)外界的變化,最終使得整個(gè)網(wǎng)絡(luò)具備智能思考的能力,形成自有的知識(shí)體系。[29]智能與聯(lián)網(wǎng),提供了大量的數(shù)據(jù),這些數(shù)據(jù)包括了Who(誰)、What(什么)、Where(在哪兒)、When(什么時(shí)間)以及Why(為什么)。這5個(gè)“W”為機(jī)器識(shí)別提供了豐富而相對(duì)精確的個(gè)人信息。
可識(shí)別的“人心”
盡管人們常說“人心難測”,但至少到目前為止,我們使用的是一個(gè)“難”字,并沒有表明這是不可能之事。我們看一物,便能知其形、觀其色、辯其質(zhì)。這一看似簡單的意識(shí)知覺的背后乃是數(shù)十億大腦神經(jīng)元的精致而復(fù)雜的關(guān)聯(lián)性活動(dòng)的結(jié)果。“意識(shí)是全腦皮層內(nèi)部的信息傳遞,即意識(shí)從神經(jīng)網(wǎng)絡(luò)中產(chǎn)生,而神經(jīng)網(wǎng)絡(luò)存在的原因就是腦中有大量分享相關(guān)信息的活動(dòng)”。[30]雖然人類大腦與計(jì)算機(jī)有諸多不同點(diǎn),但本質(zhì)上都是信息處理機(jī)器。在神經(jīng)科學(xué)領(lǐng)域已經(jīng)出現(xiàn)一些杰出的計(jì)算機(jī)模型,其特性與人類大腦神經(jīng)元的生物特性非常接近(最近的一項(xiàng)研究結(jié)果產(chǎn)生的模型具有100萬個(gè)神經(jīng)元,5億個(gè)聯(lián)結(jié))。這些計(jì)算機(jī)模型表明人造神經(jīng)元群體出現(xiàn)了很有意思的新趨勢,如組織集群與活動(dòng)波。[31]類腦信息處理的研究目標(biāo)就是構(gòu)建高度協(xié)同視覺、聽覺、觸覺、語言處理、知識(shí)推理等認(rèn)知能力的多模態(tài)認(rèn)知機(jī)。目前這一方面都取得了不少的進(jìn)展。機(jī)器識(shí)別人心初步取得的成就和未來努力的方向主要包括幾方面。
識(shí)圖看臉?!把劬κ切撵`的窗口”,讀心先讀臉,讀形識(shí)臉是識(shí)別人心的第一步。人臉識(shí)別(Face Recognition)是“一種依據(jù)人的面部特征(如統(tǒng)計(jì)或幾何特征等),自動(dòng)進(jìn)行身份鑒別的一種技術(shù),它綜合運(yùn)用了數(shù)字圖像、視頻處理、模式識(shí)別等多種技術(shù)”。[32]研究發(fā)現(xiàn),對(duì)一個(gè)人臉部的整體記憶,是由幾千個(gè)神經(jīng)元互相作用,綜合產(chǎn)生一種突發(fā)特性才完成的。機(jī)器學(xué)習(xí)和深度算法,已經(jīng)注意到了這種特征,開發(fā)出了越來越復(fù)雜的機(jī)器網(wǎng)絡(luò),以模仿神經(jīng)元的功能。2006年,Hinton教授提出深度信念網(wǎng)絡(luò),這標(biāo)志著深度學(xué)習(xí)理論的誕生,圖形識(shí)別技術(shù)得以快速發(fā)展。如今,人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network, ANN)被廣泛應(yīng)用,使得自動(dòng)人臉識(shí)別成為現(xiàn)實(shí)。美國斯坦福大學(xué)李飛飛教授牽頭創(chuàng)立了一個(gè)龐大的圖片數(shù)據(jù)庫Image Net,該數(shù)據(jù)庫目前擁有超過1400萬張高分辨率的圖片,標(biāo)注的類別超過2.2萬個(gè)。[33]從2010年起,每年舉辦一次大規(guī)模視覺識(shí)別挑戰(zhàn)賽(ILSVRC),借此推進(jìn)圖形識(shí)別技術(shù)的發(fā)展。2012年參賽的AlexNet深度神經(jīng)網(wǎng)絡(luò)一舉將識(shí)別錯(cuò)誤率下降至15.3%,完勝第2名26.2%的識(shí)別錯(cuò)誤率。2018年,多倫多大學(xué)的研究人員創(chuàng)建了一個(gè)神經(jīng)網(wǎng)絡(luò),“讓計(jì)算機(jī)擁有了一種神奇的能力來感知照片中的物體”。[34]多倫多大學(xué)的一組研究人員在他們最近關(guān)于這一主題的論文《視頻人臉聚類的面部表征的自我監(jiān)督學(xué)習(xí)》中指出,基于故事情節(jié),更深入地理解視頻,能夠預(yù)測哪些角色何時(shí)何地出現(xiàn)。為此,這些研究人員開發(fā)了一種無監(jiān)督模型,能夠根據(jù)現(xiàn)有的數(shù)據(jù)集(如Youtube Faces等面部數(shù)據(jù)庫)和有限的訓(xùn)練來創(chuàng)建高度準(zhǔn)確的面部識(shí)別模型。這些模型可以利用基于有序面部距離,動(dòng)態(tài)生成正/負(fù)約束,并不必僅依賴于目前常用的軌道(track)信息。[35]國內(nèi)也有學(xué)者使用MTCNN算法進(jìn)行人臉檢測,在多姿態(tài)人臉數(shù)據(jù)集上準(zhǔn)確率為96.25%,相較于單一姿態(tài)的人臉數(shù)據(jù)集,準(zhǔn)確率提升了2.67%。[36]
辨音釋義。語言是最好的識(shí)別人心的路徑,喬姆斯基認(rèn)為人的心智與語言是同步發(fā)展的。我們可以通過探索和挖掘一個(gè)人寫了什么,說了什么而大體判斷出一個(gè)人的精神形態(tài)、態(tài)度和立場,這也是當(dāng)下許多人工識(shí)別技術(shù)的算法邏輯。語言是人類獨(dú)有的符號(hào)系統(tǒng),是表情達(dá)意的中介,如果不能理解人類的語言,識(shí)讀人心自然也是空話。理解語言,不但要理解各種書面語言的意義(篇章結(jié)構(gòu)、上下文、句子和語詞的含義等),還包括語音理解、非語言性表達(dá)(如人的肢體語言)。喬姆斯基認(rèn)為:“人類語言可以用來告知信息,也可以造成誤導(dǎo),可以用于澄清個(gè)人思想,也可以用來表示個(gè)人的聰明才智,或者就是為了娛樂?!盵37]人類可能用同樣的語詞來表示不同的事物,人們還喜歡借用語言的多義性來實(shí)現(xiàn)委婉表達(dá),而且表達(dá)的情境和上下文理解也極為重要,所以計(jì)算機(jī)要想真正掌握人類的語言并不容易。“理解不是一件簡單的事情。部分的原因在于語音,語義和拼寫之間的關(guān)系,大部分都帶有主觀任意性……造成語言表征的不同水平之間聯(lián)系困難的另外一個(gè)原因是歧義(ambiguity)。在語言領(lǐng)域,歧義是指人們可以對(duì)一個(gè)發(fā)音、單詞、短語或者句子做出不止一種解釋的現(xiàn)象。”[38]露斯·米利肯(Ruth Milikan)甚至認(rèn)為“思想和語言是生物現(xiàn)象,他們的意義取決于我們的進(jìn)化史”,[39]如果這種觀點(diǎn)是正確的,那么不能進(jìn)化的強(qiáng)人工智能當(dāng)然就不具備真正的理解力。不過雷·庫茲韋爾卻相信“結(jié)合大量并行神經(jīng)網(wǎng)絡(luò)和其他計(jì)算模式對(duì)系統(tǒng)進(jìn)行訓(xùn)練和演化,使其能理解語言和模型,包括閱讀理解文字文件的能力”。[40]自然語言處理技術(shù)(NPL)就是朝這個(gè)方向努力的。目前科學(xué)家運(yùn)用編譯原理相關(guān)的技術(shù),例如詞法分析、語法分析、語義理解,通過機(jī)器學(xué)習(xí)獲得了很大的突破。被稱為形態(tài)解析(morphological analysis)的算法就是試圖解決語言理解問題的。2016年,微軟的一個(gè)團(tuán)隊(duì)宣布,他們開發(fā)的一個(gè)擁有120層的深度學(xué)習(xí)網(wǎng)絡(luò)已經(jīng)在多人語音識(shí)別基準(zhǔn)測試中達(dá)到了與人類相當(dāng)?shù)乃健?0世紀(jì)50年代的一位研究肢體語言的先鋒人物阿爾伯特·麥拉賓(Albert Mehrabian)的研究發(fā)現(xiàn),一條信息所產(chǎn)生的全部影響力中7%來自于語言(僅指文字),38%來自于聲音(其中包括語音、音調(diào)以及其他聲音),剩下的55%則全部來自于無聲的肢體語言。那么,對(duì)那些非語言性的表達(dá)的分析也是一項(xiàng)同樣重要的工作。據(jù)報(bào)道,卡內(nèi)基梅隆大學(xué)機(jī)器人學(xué)院(CMU RI)的科學(xué)家研發(fā)了一種能解讀人類肢體語言的計(jì)算機(jī)系統(tǒng)——Open Pose。該系統(tǒng)使用計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)技術(shù)來處理視頻幀,甚至可以實(shí)時(shí)跟蹤多個(gè)人的肢體運(yùn)動(dòng),包括手和臉部。研究人員亞瑟·謝赫(Yaser Sheikh)表示,這一方法為人們和機(jī)器之間的相互作用開辟了新的方式,人們使用機(jī)器更好地了解周圍的世界。[41]另悉,語言技術(shù)研究所的路易斯-菲利普·莫朗西(Louis-Philipe Morency)使用多模式機(jī)器學(xué)習(xí)來評(píng)估病人的非語言行為來幫助醫(yī)生更好地評(píng)估抑郁癥和焦慮。[42]賓夕法尼亞州立大學(xué)的一個(gè)研究小組也在探索這一領(lǐng)域。該小組處理了大量的電影剪輯,并建立了超過13,000個(gè)人物角色的數(shù)據(jù)集,近10,000個(gè)身體動(dòng)作。研究人員利用眾包的人類注釋器來審查電影剪輯,并確定26個(gè)分類情緒中的每個(gè)人的情感。研究表明,在識(shí)別人類情感時(shí),人體可能比面部更具診斷性。[43]
通心會(huì)意。20世紀(jì)最著名的實(shí)驗(yàn)心理學(xué)家喬治·米勒(George Miller)在1962年建議應(yīng)當(dāng)在一二十年內(nèi)禁止使用意識(shí)這個(gè)詞。2019年3月20日,美國哥倫比亞大學(xué)創(chuàng)意機(jī)器實(shí)驗(yàn)室總監(jiān)、工程學(xué)教授霍德·利普森(Hod Lipson)一直在探索打造具有自我意識(shí)的機(jī)器。他解釋說:“在機(jī)器人和人工智能領(lǐng)域,我們曾經(jīng)視意識(shí)為禁忌,我們不允許觸及這個(gè)話題。但在我看來,意識(shí)可以說是一個(gè)懸而未決的大問題,與生命起源和宇宙起源一樣。什么是感知,什么是創(chuàng)造力?什么是情感?我們想知道人之所以為人的意義,我們也想知道如何人為地創(chuàng)造出這些東西。是時(shí)候直面這些問題了?!备鶕?jù)霍德·利普森的觀點(diǎn),感知或自我意識(shí)的基本構(gòu)建塊之一是“自我模擬”(self-simulation):建立一個(gè)人的身體及其在物理空間中如何運(yùn)動(dòng)的內(nèi)在表征,然后使用該模型來指導(dǎo)行為。2019年,他率領(lǐng)的研究團(tuán)隊(duì)發(fā)明的新興粒子機(jī)器人登上了《自然》雜志封面。他們的創(chuàng)新包括兩個(gè)方面:一是這些由“粒子”(即圓盤狀單元)組成的機(jī)械系統(tǒng),不需要人類的強(qiáng)集中控制,也能依靠自主性伸縮和隨機(jī)運(yùn)動(dòng)完成復(fù)雜的任務(wù);二是這種系統(tǒng)很可能產(chǎn)生覺知,通過思考“我為什么在這里”進(jìn)而做出自我模擬、自我復(fù)制,從而可以在設(shè)備故障、特殊作業(yè)環(huán)境中順利完成任務(wù)。[44]對(duì)于機(jī)器人是否會(huì)擁有自主意識(shí)問題,霍德·利普森給出了肯定的回答:“這件事情將在10年之后發(fā)生,還是100年之后發(fā)生,我也不知道。但是,我比較確信的是我們的孫輩所生活的世界里,機(jī)器將會(huì)有自我意識(shí)?!盵45]不過,他強(qiáng)調(diào),這個(gè)自由意志是可以被人類操控的。人類將和人工智能一起學(xué)習(xí)、一起進(jìn)步。心理學(xué)家就通過詞匯學(xué)假設(shè)(lexical hypothesis)來測量人格。這一假設(shè)首先由英國學(xué)者高爾頓于1884年提出。1936年美國心理學(xué)家G.W.奧爾波特和奧德伯特在英語詞典中找到了17953個(gè)描述人格心理特質(zhì)的詞匯,又從中寫出4500個(gè)作為歸類分析,歷經(jīng)幾十年、數(shù)代學(xué)人對(duì)這些詞匯進(jìn)行篩選和分析,五大人格在不同的實(shí)證研究中不斷地被重復(fù)發(fā)現(xiàn),最后被心理學(xué)家公認(rèn)為五大人格特質(zhì)模型。有研究顯示,只要有足夠的社交數(shù)據(jù),不用任何人為的建議,計(jì)算機(jī)和算法就可以自動(dòng)判別一個(gè)人的心理特質(zhì),甚至僅僅憑借“點(diǎn)贊”的數(shù)據(jù)就可以完成。如果掌握一個(gè)人在Facebook上10個(gè)點(diǎn)贊,對(duì)他的了解就可能超過他的一般同事;掌握70個(gè)就可能超過他的朋友;掌握150個(gè)就可能超過其家庭成員;掌握300個(gè)就可能超過其最親密的妻子或丈夫了。[46]2008年,劍橋大學(xué)的年輕研究人員邁克爾·科辛斯基(Michal Kosinski)開發(fā)了一項(xiàng)可以在Facebook上進(jìn)行的OCEAN測試。到2012年,根據(jù)Motherboard網(wǎng)站上的一篇文章所述,科辛斯基證明:“平均來說,根據(jù)一名用戶在Facebook上的68個(gè)‘愛好就可以推測其膚色(95%的準(zhǔn)確率)、性取向(88%的準(zhǔn)確率)、親民主黨還是共和黨(85%的準(zhǔn)確率)?!盵47]
情緒感知。計(jì)算機(jī)對(duì)人的心智的理解的另外一個(gè)更大的挑戰(zhàn),是對(duì)人的感受和情緒的把握。情緒指的是存在于腦和身體之內(nèi)、通常由某個(gè)特定的心智內(nèi)容所激發(fā)的一系列機(jī)體變化。感受是對(duì)這些機(jī)體變化的知覺。安東尼奧·R.達(dá)馬西奧認(rèn)為:“在意識(shí)形成之前,以及在意識(shí)作為一種我們常常沒有有意識(shí)地認(rèn)識(shí)到的誘導(dǎo)物而在我們每個(gè)人身上表現(xiàn)出來之前,情緒很可能就已經(jīng)產(chǎn)生并發(fā)展起來了……感受在意識(shí)心靈的劇院里發(fā)揮著最根本的、更為持久的作用?!盵48]人工智能系統(tǒng)已經(jīng)能夠用多種方式識(shí)別人類的部分情感。有些是生理的,如監(jiān)測人的呼吸頻率、心電和腦電反應(yīng);有些是口頭的,如注意說話的語氣、語調(diào)、語速以及用詞習(xí)慣;有些是視覺的,如分析眼動(dòng)規(guī)律與人的面部表情;有些是運(yùn)動(dòng)感知,如身體的移動(dòng)、手指的運(yùn)作,等等。[49]美國心理學(xué)家??寺≒aul Ekman)在十九世紀(jì)六十年代提出并在后來發(fā)展起“情緒指紋”理論。他發(fā)現(xiàn)不同民族的語言雖然不同,但對(duì)應(yīng)相同基本情緒的面部表情(臉部肌肉運(yùn)作方式)卻是接近的、普遍的。他還為人類的3000多種有意義的表情總結(jié)了清晰的編碼和規(guī)則。以??寺难芯繛榛A(chǔ),全世界已開發(fā)出多個(gè)表情分析系統(tǒng)。比如加州大學(xué)圣地亞哥分校研發(fā)的CERT(表情識(shí)別工具箱)可以自動(dòng)檢測視頻流中的人臉,實(shí)時(shí)識(shí)別“面部表情編碼系統(tǒng)”的30個(gè)動(dòng)作單元組合,包括憤怒、厭惡、恐懼、喜悅、悲傷、驚奇和輕蔑等表情。經(jīng)卡內(nèi)基-梅隆大學(xué)和麻省理工學(xué)院聯(lián)合檢測,CERT的表情識(shí)別準(zhǔn)確率達(dá)到80.6%。[50]目前,微軟、IBM 、亞馬遜、京東等公司已經(jīng)開始出售“情緒識(shí)別”算法——基于人臉的分析來推測人類的心情。迪士尼公司就開發(fā)了一個(gè)觀眾表情分析系統(tǒng)(FVAEs)。在實(shí)驗(yàn)中,研究小組在一個(gè)能容納400人的電影院里設(shè)置了4個(gè)紅外攝像機(jī),并把FVAEs應(yīng)用到了150部熱播的電影中。在漆黑一片的影廳中,這個(gè)系統(tǒng)能夠捕捉觀眾們的哄堂大笑、微微一笑或者悲傷流淚等反應(yīng)。從3179名觀眾中,研究小組最終獲得了1600萬個(gè)面部特征的數(shù)據(jù)集合。通過分析這些表情,迪斯尼公司得以知道觀眾是否喜歡這部電影,哪些情節(jié)最能打動(dòng)人,他們由此可以用量化的方法對(duì)電影的情節(jié)設(shè)計(jì)進(jìn)行評(píng)價(jià)。
2014年年底,日本著名的投資公司軟銀在新聞發(fā)布會(huì)上展示了一個(gè)名叫“胡椒”(Pepper)的智能機(jī)器人,它通過“情緒引擎”和云計(jì)算來辨識(shí)分析人類的表情、肢體動(dòng)作、語調(diào)和情緒。據(jù)稱,“Pepper”還能提供保姆、護(hù)理、急救等服務(wù),而且具備學(xué)習(xí)和情感表達(dá)等能力。軟銀CEO孫正義稱:“人們常把一些沒有感情、沒有心的人稱為‘機(jī)器人,我們在人類歷史上第一次給了機(jī)器人感情和心。”[51]當(dāng)然,真正確認(rèn)并理解人的情感,不是一件很容易的事,因?yàn)榫退闶侨伺c人之間的情感把握也是難題,比如我們經(jīng)常忽視遺漏與我們交流的對(duì)象的細(xì)微情緒波動(dòng),也常常曲解對(duì)方的情感反應(yīng)。有學(xué)者撰文指出,“情緒指紋”理論在方法論上存在缺陷。有學(xué)者通過對(duì)數(shù)百個(gè)實(shí)驗(yàn)的分析得出結(jié)論是:在自主神經(jīng)系統(tǒng)中,不同的情緒并沒有一致的特定指紋。一種精神活動(dòng)(如恐懼)竟然不是由一組神經(jīng)元?jiǎng)?chuàng)造的。相反,只有不同的神經(jīng)元組合起來才能產(chǎn)生恐懼。在美國心理科學(xué)協(xié)會(huì)的委托下,五位科學(xué)家展開了數(shù)據(jù)收集和科學(xué)證明。他們的研究成果顯示,情緒的表達(dá)方式多種多樣,很難從一組簡單的面部運(yùn)動(dòng)中可靠地推斷出一個(gè)人的感受,表情與心情之間沒有堅(jiān)實(shí)的科學(xué)依據(jù)證明有直接關(guān)聯(lián)。該論文的作者之一,馬薩諸塞州的東北大學(xué)心理學(xué)教授莉莎·費(fèi)德曼·巴瑞特(Lisa Feldman Barrett)在接受媒體采訪時(shí)表示,數(shù)據(jù)顯示,人們在生氣時(shí),平均只有不到30%的時(shí)間會(huì)皺眉。所以愁眉苦臉不是憤怒的表現(xiàn),而只是眾多憤怒表達(dá)之一。這意味著超過70%的情況下,人們在生氣的時(shí)候不會(huì)皺眉。最重要的是,他們在不生氣的時(shí)候經(jīng)常會(huì)皺眉。Barrett說,雖然“能檢測到一張憤怒的臉,但這與察覺到憤怒的情緒是兩碼事。”[52]當(dāng)然,這些批評(píng)都無法斷言情緒識(shí)別是不可能的。事實(shí)可能是目前做不到精確的識(shí)別,只是因?yàn)檫€有沒有找到更科學(xué)的方法。紐約大學(xué)教授加里·馬庫斯(Gary Marcus)就指出,目前普遍使用的深度學(xué)習(xí)技術(shù)可能擅長模仿人類大腦的感知任務(wù),比如圖像或語音識(shí)別。但它在理解對(duì)話或因果關(guān)系等其他任務(wù)上仍有很大不足。是以斯坦福大學(xué)教授李飛飛所言,(深度學(xué)習(xí))無論在智力、人力或機(jī)器設(shè)備方面,都還有很長的路要走。為了創(chuàng)造能力更強(qiáng)、智能范圍更廣的機(jī)器,也就是俗稱的通用人工智能,深度學(xué)習(xí)必須與其他方法相結(jié)合。馬庫斯和歐內(nèi)斯特·戴維斯(Ernest Davis)在他們的新書《重啟人工智能》(Rebooting AI)中主張開辟一條新的前進(jìn)道路,他們認(rèn)為其中一些可能來自我們?nèi)绾螛?gòu)建算法的規(guī)則。未來,AI可以通過語音識(shí)別、視覺識(shí)別、文字識(shí)別、表情識(shí)別等數(shù)據(jù),結(jié)合深度學(xué)習(xí),再加上人工的標(biāo)記,從而具備識(shí)別情緒的能力。
總之,智能技術(shù)目前看起來還相當(dāng)不成熟,但至少它們已經(jīng)可以在一定程度上認(rèn)識(shí)人心了。
總結(jié)
人類與猿類有什么區(qū)別?歷史學(xué)家尤瓦爾·赫拉利(Yuval Harari)在《人類簡史》(Sapiens: A Brief History of Humankind)一書中認(rèn)為,人類與其他生物的不同點(diǎn)之一是我們會(huì)集體說謊。無論任何,人都是這個(gè)世界上最復(fù)雜、最智能的生物。人類的大腦包含了無數(shù)的智能組合和聯(lián)結(jié)(要特別注意這種聯(lián)結(jié)的意義,因?yàn)椤八伎?、感受和行?dòng)都是依靠許多神經(jīng)元的綜合活動(dòng),而不是單一細(xì)胞的產(chǎn)物”[53])。
我們與生俱來就有腦中樞,它們控制著各種感覺和肌肉群的移動(dòng)(如眼睛和四肢的活動(dòng)),讓我們能夠區(qū)分聲音和語言,區(qū)分面孔的特征,區(qū)分各種不同的觸感、味道和氣味;我們天生就帶有原型專家,他們參與到我們的饑餓、歡笑、恐懼、憤怒、睡眠和性生活中??隙ㄟ€有其他許多尚未被發(fā)現(xiàn)的功能,每個(gè)功能都依托于某種不同的結(jié)構(gòu)和操作模式?!俺汕先f的基因參與安排了這些智能組合以及它們之間的神經(jīng)束”。[54]人類的大腦有著超長的短時(shí)間記憶的能力,且能夠基于情境需要而隨時(shí)調(diào)動(dòng)這些記憶單元,并加以重新組合,以應(yīng)對(duì)隨時(shí)面臨著的復(fù)雜的外部環(huán)境的變化。所以,機(jī)器要想完整讀懂人心自然不是件簡單之事。至少到目前為止,還沒有發(fā)現(xiàn)人工智能可以達(dá)到共情式理解的能力,也可能還做不到自主編造謊言,所以機(jī)器要真正讀懂人心還早得很。但正如前文所述,人工智能已經(jīng)在一定程度上可以讀懂人類創(chuàng)造的多種符號(hào)甚至是進(jìn)行創(chuàng)作,如機(jī)器人寫作已經(jīng)被廣泛運(yùn)用于新聞報(bào)道[55]、繪畫、創(chuàng)作音樂和詩歌。[56]
[3][37]參見[美]諾姆·喬姆斯基:《語言與心智》,熊仲儒、張孝榮譯,北京:中國人民大學(xué)出版社,2015年,第9~10、76頁。
[4]顏君蓉、王仟雅、楊忠憲:《Cyborg與信息社會(huì)的未來》,《網(wǎng)絡(luò)社會(huì)學(xué)通訊期刊》(臺(tái)灣嘉義),2005年(總)第49期,http://mail.nhu.edu.tw/~society/e-j/49/49-06.htm。
[5][美]E. Bruce Goldstein:《認(rèn)知心理學(xué):心智、研究與你的生活》,北京:中國輕工業(yè)出版社,2018年,第4頁。
[6][美]悉達(dá)多·穆克吉:《基因傳:眾生之源》,馬向濤譯,北京:中信出版社,2018年,第46頁。
[7][8][美]史蒂芬·平克:《心智探奇:人類心智的起源與進(jìn)化》,郝耀偉譯,杭州:浙江人民出版社,2016年,第5、20頁。
[9][加]薩伽德:《認(rèn)知科學(xué)導(dǎo)論》,朱菁、陳夢雅譯,上海辭書出版社,2012年,第11頁。
[10][美]R.M.哈尼什:《心智大腦與計(jì)算機(jī):認(rèn)知科學(xué)創(chuàng)立史導(dǎo)論》,王淼、李鵬鑫譯,杭州:浙江大學(xué)出版社,2012年,第11頁。
[11][美]Michael S·Gazzaniga、Richard B·Ivry、George R·Mangun:《認(rèn)知神經(jīng)科學(xué)》,北京:中國輕工業(yè)出版社,2017年,第554頁。
[12][美]凱文·凱利:《技術(shù)元素》,張行舟、余倩、周峰等譯,北京:電子工業(yè)出版社,2012年,第16頁。
[13]汪民安:《尼采與身體》,北京大學(xué)出版社,2008年,第2頁。
[14][德]尼采:《權(quán)力的意志》,陳念東、凌素心譯,北京:中央編譯出版社,2000年,第22頁。
[15]李恒威、盛曉明:《認(rèn)知的具身化》,《科學(xué)學(xué)研究》,2006年第2期,第184頁。
[16]蔣柯:《“圖靈測試”、“反轉(zhuǎn)圖靈測試”與心智的意義》,《南京師大學(xué)報(bào)(社會(huì)科學(xué)版)》,2018年4期,第76~82頁。
[17][39][49][英]瑪格麗特·博登(Margaret A. Boden):《AI:人工智能的本質(zhì)與未來》,孫詩惠譯,北京:中國人民大學(xué)出版社,2017年,第11、159、86頁。
[18]《類腦芯片簡史:它會(huì)是AI的終極答案嗎?》,https://www.tmtpost.com/4182412.html。
[19]曾毅、劉成林、譚鐵牛:《類腦智能研究的回顧與展望》,《計(jì)算機(jī)學(xué)報(bào)》, 2016年第39卷第397期 ,第214~224頁。
[20][美]塞爾:《心、腦與科學(xué)》,楊音萊譯,上海譯文出版社,2006年。轉(zhuǎn)引自王佳、朱敏:《對(duì)強(qiáng)人工智能及其理論預(yù)設(shè)的考察——基于中文屋論證的批判視角》,《心智與計(jì)算》,2010年第1期。
[21]楊曉愛、魏屹東:《中文屋論證究竟證明了什么?——由“中文屋論證”引發(fā)的計(jì)算機(jī)思維問題探析》,《山西大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版)》,2013年第2期。
[22][英]伍德里奇(Michael Wooldridge):《多Agent系統(tǒng)引論》,石純一譯,北京:電子工業(yè)出版社,2003年。轉(zhuǎn)引自:https://mp.weixin.qq.com/s/5aEx8iwuMFFemuwW6-_UFw。
[23]Herut Uzan; Shira Sardi; Amir Goldental; Roni Vardi and Ido Kanter, "Biological learning curves outperform existing ones in artificial intelligence algorithms", Scientific Reports, 2019, 9 (1).
[24][美]阿米爾·侯賽因(Amir Husain):《終極智能:感知機(jī)器與人工智能的未來》,賽迪研究院專家組譯,北京:中信出版集團(tuán),2018年,第26頁。
[25]趙亞軍、郁光輝、徐漢青:《6G移動(dòng)通信網(wǎng)絡(luò):愿景、挑戰(zhàn)與關(guān)鍵技術(shù)》,《中國科學(xué):信息科學(xué)》,2019年第8期。
[26]黃韜、 霍如、劉江等:《未來網(wǎng)絡(luò)發(fā)展趨勢與展望》,《中國科學(xué):信息科學(xué)》, 2019年第8期。
[27]蘇健華:《Cyborg與全球腦對(duì)人類與社會(huì)的沖擊》,臺(tái)灣:《網(wǎng)絡(luò)社會(huì)學(xué)通訊期刊》,2001年第17期。
[28]趙濤:《超文本·全球腦·內(nèi)爆——網(wǎng)絡(luò)世代思想生產(chǎn)的社會(huì)學(xué)考察》,《社會(huì)科學(xué)戰(zhàn)線》,2006年第6期,第38~42頁。
[29]魏慧:《數(shù)據(jù)決定智能,運(yùn)營商預(yù)研“知化網(wǎng)絡(luò)”》,《通信世界》, 2016年第12期,第19頁。
[30][法]斯坦尼斯拉斯·迪昂:《腦與意識(shí):破解人類思維之迷》,章熠譯,杭州:浙江教育出版社·湛廬文化,2018年,第30頁。
[31][英]丹尼爾·博爾(Daniel Bor):《貪婪的大腦:為何人類會(huì)無止境地尋求意義》,林旭文譯,北京:機(jī)械工業(yè)出版社,2013年,第22頁。
[32]王心醉、郭立紅、肖永鵬等:《基于BDPCA和KNN的人臉識(shí)別算法》,《武漢理工大學(xué)學(xué)報(bào)》,2009年第19期,第136~139頁。
[33]Russakovsky et al.,"ImageNet Large Scale Visual Recognition Challenge"; Alex Krizhevsky; Ilya Sutskever and Geoffrey E.Hinton, "ImageNet Classification with Deep Convolutional Neural Networks", Proceedings of the 25th International Conference on Neural Information Processing Systems, Lake Tahoe, NV, December3–6, 2012, pp. 1097–1105.
[34][美]肖恩·格里什:《智能機(jī)器如何思考:深度神經(jīng)網(wǎng)絡(luò)的秘密》,張羿譯,北京:中信出版社,2019年,第144頁。
[35]"The Best Machine Learning Research of 2019 So Far", https://medium.com/@ODSC/the-best-machine-learning-research-of-2019-so-far-954120947794,本文引用轉(zhuǎn)自云水木石的博客文章,《2019年機(jī)器學(xué)習(xí)方面的最新研究》,https://blog.csdn.net/mogoweb/article/details/95136285。
[36]龔銳、丁勝、章超華等:《基于深度學(xué)習(xí)的輕量級(jí)和多姿態(tài)人臉識(shí)別方法》,《計(jì)算機(jī)應(yīng)用》,2019年10月。
[38]Edward E. Smith / Stephen M. Kosslyn:《認(rèn)知心理學(xué):心智與腦》,乃弋、羅躍嘉譯,北京:教育科學(xué)出版社,2017年,第539頁。
[40][美]雷·庫茲韋爾:《機(jī)器之心》,胡曉姣、吳純潔、張溫、卓瑪譯,北京:中信出版社,2016年,第7頁。
[41]Carnegie Mellon University, "Computer that reads body language: Real-time detector sees hand poses and tracks multiple people", Science Daily, 6 July 2017, www.sciencedaily.com/releases/2017/07/170706143158.htm.
[42]Andrew Moore:《為什么2016年是機(jī)器人情緒識(shí)別的分水嶺?》,網(wǎng)易科技,2016年1月18日,http://tech.163.com/16/0118/10/BDJUIQ4400094P0U.html。
[43]《計(jì)算機(jī)是否可以訓(xùn)練以理解肢體語言》,風(fēng)尚網(wǎng),2019年9月6日,http://www.gjfs.com.cn/keji/201909/090621002.html。
[44]《粒子機(jī)器人,能否敲開機(jī)器意識(shí)覺醒之門?》,鈦媒體,2019年11月6日,https://www.tmtpost.com/4185426.html。
[45]《美國權(quán)威機(jī)器人專家Hod Lipson:機(jī)器人終將擁有自主意識(shí)!》,機(jī)器人,2019年11月4日,https://www.roboticschina.com/news/2904.html。
[46] Wu Youyou; Michal Kosinski and David Stillwell, "Computer-based personality judgments are more accurate than those made by humans", Proceedings of the National Academy of Sciences of the United States of America, 2015(4), pp. 1036-1040.
[47]Hannes Grassegger and Mikael Krogerus, "The Data That Turned the World Upside Down", Motherboard, January 28, 2017, last accessed on August 2, 2017, https:// motherboard.vice.com/en_us/article/mg9vvn/how-our-likes-helped-trump-win.
[48] [美]安東尼奧·R.達(dá)馬西奧:《感受發(fā)生的一切:意識(shí)產(chǎn)生中的身體和情緒》,楊韶剛譯,北京:教育科學(xué)出版社,2007年,第31頁。
[50]涂子沛:《數(shù)文明:大數(shù)據(jù)如何重塑人類文明、商業(yè)形態(tài)和個(gè)人世界》,北京:中信出版集團(tuán),2018年,第307頁。
[51]《關(guān)于日本推出的情感機(jī)器人“佩珀”的性能分析和應(yīng)用》,http://m.elecfans.com/article/1032879.html。不過,也有人指出 “Pepper并非基于機(jī)器學(xué)習(xí)和人工智能,而是由工程師編寫程序以聯(lián)接傳感器的輸入和相應(yīng)的情感效果”。國內(nèi)評(píng)測人王自如則表示,Pepper可能遠(yuǎn)談不上可以辨識(shí)人類的情緒,甚至連正常的交流都做得不是那么好。https://www.sogaa.net/portal/news/detail?id=132d7f5e-b7cb-4f9c-8d6f-2aa801ed2e2e
[52]《用AI讀懂人心?情感科學(xué)專家:靠表情識(shí)別情緒不靠譜》,騰訊新聞,2019年7月29日,https://new.qq.com/omn/20190729/20190729A0CZ7Z00.html
[53][美]布魯斯·E. 韋克斯勒( Bruce E. Wexler):《大腦與文化》,羅俊、汪思綺、姚桂桂譯,杭州:浙江大學(xué)出版社·啟真館,2016年,第2頁。
[54][美]馬文·明斯基(Marvin Minsky):《心智社會(huì):從細(xì)胞到人工智能,人類思維的優(yōu)雅解讀》,任楠譯,北京:機(jī)械工業(yè)出版社,2016年,第405頁。
[55]騰訊早在2015年就啟用了名為“Dreamwriter”的智能新聞寫作機(jī)器人。這款智能機(jī)器人可以依靠算法實(shí)時(shí)組建稿件,并能瞬間解讀出各種分析和判斷,一分鐘內(nèi)就可以完成重要的短訊。
[56]從2015年6月10日始,谷歌的工程師發(fā)表了許多由人工神經(jīng)網(wǎng)絡(luò) “深夢”(Deep Dream)生成的照片。其中一張照片充滿了狗臉、眼睛、詭異的螺旋圖案,有種異樣的魔性。難道機(jī)器真的有思考藝術(shù)的思維嗎?
[57]蔡曙山、薛小迪:《人工智能與人類智能——從認(rèn)知科學(xué)五個(gè)層級(jí)的理論看人機(jī)大戰(zhàn)》,《北京大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版)》,2016年第53卷第4期,第145~154頁。
[58]黃欣榮:《人工智能對(duì)人類勞動(dòng)的挑戰(zhàn)及其應(yīng)對(duì)》,《理論探索》,2018年第5期,第15~21頁。
[59]涂子沛:《數(shù)文明:大數(shù)據(jù)如何重塑人類文明、商業(yè)形態(tài)和個(gè)人世界》,北京:中信出版集團(tuán),2018年,第309~310頁。
[60][英]史蒂芬·霍金:《十問:霍金沉思錄》,吳忠超譯,長沙:湖南科學(xué)技術(shù)出版社,2019年,第109頁。
[61][美]雷·庫茲韋爾:《機(jī)器之心》,胡曉姣、吳純潔、張溫、卓瑪譯,北京:中信出版社,2016年,第174頁。
[62]徐英瑾:《歐陸現(xiàn)象學(xué)對(duì)人工情緒研究的挑戰(zhàn)》,《探索與爭鳴》,2019年第10期,第137~147頁。
[63]影視劇中機(jī)器人大多是具有意識(shí)和感情的。如在《未來世界》中,機(jī)器有愛恨情仇。在《人工智能》中,機(jī)器人小戴維在人類組織的一次次機(jī)器人解體秀中,目睹了其他機(jī)器人被摧毀的慘狀,并產(chǎn)生了對(duì)自身生存之有限性的意識(shí)。
[64]張曉林:《類腦智能引導(dǎo)AI未來》,《自然雜志》,2018年第40卷第5期,第35~40頁。
[65][美]R·P·費(fèi)曼:《費(fèi)曼講演錄:一個(gè)平民科學(xué)家的思想》,王文浩譯,長沙:湖南科學(xué)技術(shù)出版社,2012年,第5頁。
責(zé) 編/馬冰瑩