陳 霖
中國(guó)科學(xué)院生物物理研究所 北京 100101
我們必須開(kāi)展什么樣的新一代人工智能的基礎(chǔ)研究,才能使我國(guó)成為人工智能領(lǐng)域真正意義上的科學(xué)大國(guó)?像圖靈的計(jì)算模型,回答了 “什么是計(jì)算”的問(wèn)題,奠定了整個(gè)計(jì)算機(jī)科學(xué)的基礎(chǔ);像香農(nóng)的通信數(shù)學(xué)原理,回答了“什么是信息”的問(wèn)題,奠定了現(xiàn)代信息論的基礎(chǔ)。對(duì)于我們而言,關(guān)鍵是能否提出 “什么是新一代人工智能”的核心基礎(chǔ)科學(xué)問(wèn)題,以及我們究竟有什么能力和基礎(chǔ)來(lái)建立回答這樣問(wèn)題的原創(chuàng)系統(tǒng)理論。
總結(jié)近 40 年從事認(rèn)知科學(xué)研究的經(jīng)驗(yàn),我們認(rèn)為,發(fā)展新一代人工智能的核心基礎(chǔ)科學(xué)問(wèn)題是:“認(rèn)知和計(jì)算的關(guān)系”。例如,要回答“人工智能會(huì)不會(huì)取代人類(lèi)智力”這個(gè)廣泛關(guān)注的問(wèn)題,凝煉成科學(xué)問(wèn)題,本質(zhì)上是要回答“認(rèn)知和計(jì)算的關(guān)系”(或者“認(rèn)知和計(jì)算的差別”)問(wèn)題。
認(rèn)知和計(jì)算的關(guān)系問(wèn)題可以進(jìn)一步細(xì)化為 4 個(gè)方面的關(guān)系:① 認(rèn)知的基本單元和計(jì)算的基本單元的關(guān)系;② 認(rèn)知神經(jīng)表達(dá)的解剖結(jié)構(gòu)和人工智能計(jì)算的體系結(jié)構(gòu)的關(guān)系;③ 認(rèn)知涌現(xiàn)的特有精神活動(dòng)現(xiàn)象和計(jì)算涌現(xiàn)的特有信息處理現(xiàn)象的關(guān)系;④ 認(rèn)知的數(shù)學(xué)基礎(chǔ)和計(jì)算的數(shù)學(xué)基礎(chǔ)的關(guān)系。
研究任何一種過(guò)程,建立任何一種過(guò)程的科學(xué)理論,必須首先回答一個(gè)基本問(wèn)題:這種過(guò)程操作的基本單元是什么?每門(mén)成熟的基礎(chǔ)科學(xué)都有其特定的基本單元, 如高能物理學(xué)的基本粒子、遺傳學(xué)的基因、計(jì)算理論的符號(hào)以及信息論的比特等。對(duì)于認(rèn)知科學(xué)而言,必須回答:什么是認(rèn)知過(guò)程操作的基本單元?
認(rèn)知科學(xué)的大量實(shí)驗(yàn)事實(shí)表明,認(rèn)知的基本單元不是計(jì)算的符號(hào),不是信息的比特。例如,根據(jù)記憶的實(shí)驗(yàn),Miller 提出計(jì)量工作記憶大小的單元不是計(jì)算機(jī)計(jì)量記憶大小的比特,而是一種整體性的“組塊”(chunk)。人類(lèi)的工作記憶可以記住 4 個(gè)組塊。一個(gè)組塊可以是一個(gè)字母、可以是多個(gè)字母組成的詞,甚至可以是多個(gè)詞組成的短語(yǔ),它們顯然具有非常不同的信息量比特。再如,Kahneman 提出注意選擇的基本單元是整體性的“知覺(jué)物體”。還有,Poepple 提出時(shí)間組織的基本單元是整體性的“時(shí)間格式塔”?!敖M塊”“知覺(jué)物體”“時(shí)間格式塔”,這些關(guān)于認(rèn)知基本單元的概念的重要性在于,它們不是借用于計(jì)算理論或信息科學(xué),而是原創(chuàng)于認(rèn)知科學(xué)的實(shí)驗(yàn)發(fā)現(xiàn)。
目前的關(guān)鍵問(wèn)題是,如何超越直覺(jué)的理解,科學(xué)準(zhǔn)確地定義這些認(rèn)知基本變量,從而建立這些基本變量的統(tǒng)一的認(rèn)知基本單元模型。這對(duì)于理解“認(rèn)知和計(jì)算的關(guān)系”,把新一代人工智能建立成一門(mén)成熟的基礎(chǔ)科學(xué)(Poggio 認(rèn)為的“從煉金術(shù)轉(zhuǎn)化成化學(xué)”),具有重要的基本意義。
腦成像(brain mapping)不是指成像技術(shù),而是指大腦功能解剖結(jié)構(gòu)的一種學(xué)說(shuō),即智力的模塊性:大腦是由專(zhuān)司某種認(rèn)知功能、結(jié)構(gòu)和功能相對(duì)獨(dú)立和分離的多個(gè)腦區(qū)組成的。這樣的模塊性結(jié)構(gòu),跟通用計(jì)算機(jī)的中心處理器和統(tǒng)一記憶存儲(chǔ)器的計(jì)算體系結(jié)構(gòu)是不相同的。
我們進(jìn)一步提出認(rèn)知神經(jīng)表達(dá)的解剖結(jié)構(gòu)的概念,這是因?yàn)榻鼇?lái)我們發(fā)現(xiàn),敲除了視桿、視錐細(xì)胞只保留內(nèi)生感光神經(jīng)節(jié)細(xì)胞(ipRGCs)的盲鼠,能夠檢測(cè)拓?fù)湫再|(zhì)。而且 ipRGCs 對(duì)一致地識(shí)別拓?fù)湫再|(zhì)既是充分的,又是必要的。ipRGCs 只是視網(wǎng)膜的一種神經(jīng)節(jié)細(xì)胞,又分成 5 個(gè)子類(lèi),而且這 5 個(gè)子類(lèi)中只有 2—3 類(lèi)涉及識(shí)別拓?fù)湫再|(zhì)。這樣的神經(jīng)表達(dá)實(shí)驗(yàn)表明,大范圍首先的拓?fù)湫再|(zhì)知覺(jué)起源和根源于一種形態(tài)、投射關(guān)系、分子特性特定的細(xì)胞。然而,人工神經(jīng)網(wǎng)絡(luò)的每個(gè)“細(xì)胞”是相同的,只是連接不同。
如果說(shuō),深度學(xué)習(xí)是來(lái)自神經(jīng)系統(tǒng)層次結(jié)構(gòu)的啟發(fā),那么起源于特定神經(jīng)細(xì)胞的、超越腦區(qū)成像的全腦成像,必將為發(fā)展新一代人工智能的計(jì)算體系結(jié)構(gòu),提供深刻得多和豐富得多的啟發(fā)。
基礎(chǔ)科學(xué)面臨四大問(wèn)題:物質(zhì)的本質(zhì)、宇宙的起源、生命的本質(zhì)和智力的產(chǎn)生。這四大問(wèn)題的前 3 個(gè)基本上是關(guān)于物質(zhì)世界的研究;而智力的產(chǎn)生是對(duì)精神世界的研究。認(rèn)知科學(xué)研究智力的產(chǎn)生,就是要揭示人類(lèi)認(rèn)知精神世界涌現(xiàn)的特有的現(xiàn)象。正如 McClleland 認(rèn)為的“人類(lèi)認(rèn)知最偉大的主要成就是認(rèn)知涌現(xiàn)的現(xiàn)象”,理解認(rèn)知的涌現(xiàn)是對(duì)符號(hào)處理的認(rèn)知計(jì)算理論的深遠(yuǎn)的挑戰(zhàn)。
意識(shí)正是認(rèn)知涌現(xiàn)的特有精神活動(dòng)現(xiàn)象的一個(gè)典型。意識(shí)研究的困難在于,如何把人工智能是否會(huì)產(chǎn)生意識(shí)之類(lèi)的直覺(jué)思辨的討論,變成科學(xué)實(shí)驗(yàn)的研究。
在意識(shí)的科學(xué)研究中,我們提議如下 4 個(gè)方面來(lái)比較研究和分析“認(rèn)知和計(jì)算的關(guān)系”:① 意識(shí)的認(rèn)知機(jī)制——什么是意識(shí)?② 意識(shí)的神經(jīng)表達(dá)——意識(shí)是如何在大腦中產(chǎn)生的?③ 意識(shí)的進(jìn)化——意識(shí)是如何起源于進(jìn)化的?④ 意識(shí)異?!窦膊〉谋驹词鞘裁矗?/p>
無(wú)論是經(jīng)典的計(jì)算理論還是目前流行的貝葉斯計(jì)算理論,都認(rèn)為認(rèn)知過(guò)程是圖靈意義的離散符號(hào)的計(jì)算。也就是說(shuō),計(jì)算的數(shù)學(xué)基礎(chǔ)是圖靈機(jī)。
跟傳統(tǒng)的、目前仍然占統(tǒng)治地位的認(rèn)知計(jì)算理論不同,我們提出,體現(xiàn)在不同認(rèn)知層次的認(rèn)知基本單元(如組塊、知覺(jué)物體、時(shí)間格式塔等)的共同本質(zhì)——同一不變性和整體性——可以定義為容限空間上的大范圍拓?fù)洳蛔冃再|(zhì)。各個(gè)認(rèn)知層次(包括知覺(jué)、注意、學(xué)習(xí)、記憶、數(shù)的認(rèn)知、發(fā)展和進(jìn)化、情緒、意識(shí))的實(shí)驗(yàn),一致支持了這個(gè) Wolfe 稱(chēng)為“大范圍首先”的認(rèn)知基本單元的拓?fù)鋵W(xué)定義。“大范圍首先”的容限空間的拓?fù)鋵W(xué),不像是圖靈機(jī)。
目前流行的基于計(jì)算概念的理論數(shù)學(xué),不能滿(mǎn)意地解釋我們發(fā)現(xiàn)的諸多亟待解釋的基本認(rèn)知現(xiàn)象,如“大范圍首先”、不變性的直接知覺(jué)、認(rèn)知偏向、意識(shí)涌現(xiàn),以及起源于 ipRGCs 的拓?fù)湫再|(zhì)分辨等。我們正在提出和發(fā)展適合描述認(rèn)知的新的數(shù)學(xué)框架,包括“大范圍首先”的數(shù)學(xué)基礎(chǔ):用 Minsky 的 Perceptron 平行計(jì)算模型奠定分析高復(fù)雜性拓?fù)湫再|(zhì)計(jì)算和“大范圍首先”拓?fù)湫再|(zhì)知覺(jué)關(guān)系的數(shù)學(xué)基礎(chǔ),用 Zeeman 的容限空間代數(shù)拓?fù)鋵W(xué)(同調(diào)論)奠定“大范圍首先”的知覺(jué)組織的數(shù)學(xué)基礎(chǔ),用 Klein 的 Erlangen 綱領(lǐng)奠定“大范圍首先”的不變性直接知覺(jué)的數(shù)學(xué)基礎(chǔ);包括認(rèn)知基本單元(概念格的“知覺(jué)物體”刻畫(huà))、認(rèn)知基本關(guān)系(半序的“容限”表征)、認(rèn)知基本操作(泛拓?fù)涞恼J(rèn)知過(guò)程描述)的數(shù)學(xué)。近來(lái)我們尋找在大腦中實(shí)現(xiàn)“大范圍首先”的量子模型,通過(guò)張量代數(shù)可以獲得一些量子理論的構(gòu)成要素。認(rèn)知和計(jì)算的關(guān)系的研究使得數(shù)學(xué)與認(rèn)知在各自最本源地方相匯,這正是把煉金術(shù)轉(zhuǎn)化為化學(xué),對(duì)新一代人工智能的數(shù)學(xué)基礎(chǔ)的探索。
認(rèn)知和計(jì)算關(guān)系的問(wèn)題需要長(zhǎng)期探索,應(yīng)當(dāng)?shù)玫匠掷m(xù)的支持。就認(rèn)知科學(xué)的學(xué)科特點(diǎn),建議注意 3 個(gè)方面的布局。
(1)重視認(rèn)知層次的新變量、新概念和新原則的研究。目前腦科學(xué)發(fā)展的一個(gè)趨勢(shì)是,一方面腦和神經(jīng)系統(tǒng)的生物學(xué)的數(shù)據(jù)前所未有地大量涌現(xiàn),另一方面計(jì)算的、物理學(xué)的概念越來(lái)越普遍借用到認(rèn)知過(guò)程的分析。但是一個(gè)相對(duì)被忽視的問(wèn)題是,如何在認(rèn)知心理的層次來(lái)理解這些空前豐富的生物學(xué)層次的數(shù)據(jù)?這樣的問(wèn)題超越了生物學(xué)和信息科學(xué)的層次,必須要有認(rèn)知科學(xué)層次的、適合描述認(rèn)知的新概念和新原則來(lái)回答。
(2)人類(lèi)為主,動(dòng)物為輔;宏觀(guān)為主,結(jié)合微觀(guān)。人工智能的基礎(chǔ)研究應(yīng)當(dāng)強(qiáng)調(diào)系統(tǒng)和行為層次。
(3)以實(shí)驗(yàn)為基礎(chǔ)的學(xué)科交叉。我們的一個(gè)基本出發(fā)點(diǎn)是,物理、計(jì)算的基本并不一定意味著認(rèn)知的基本,適合描述物理世界的變量并不一定適合描述認(rèn)知世界。認(rèn)知和計(jì)算的關(guān)系的問(wèn)題,如“什么是認(rèn)知基本單元”的問(wèn)題,不能單靠物理的推理或計(jì)算的分析來(lái)解決,根本上只有通過(guò)實(shí)驗(yàn)來(lái)回答。在這個(gè)意義上,認(rèn)知科學(xué)本質(zhì)上是實(shí)驗(yàn)的。因此,人工智能的基礎(chǔ)研究要特別注重認(rèn)知科學(xué)的實(shí)驗(yàn)研究,要注重實(shí)驗(yàn)為基礎(chǔ)的空前多學(xué)科的交叉。