国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

如何讓通用人工智能系統(tǒng)能夠“識(shí)數(shù)”

2021-10-19 05:34徐英瑾
關(guān)鍵詞:數(shù)感

徐英瑾

摘 ? 要: “識(shí)數(shù)”的字面意思就是說(shuō),數(shù)字表達(dá)式的使用者需要知道這些表達(dá)式日常實(shí)踐中的具體意義,如知道“十公里”算不算“路遠(yuǎn)”,“十萬(wàn)元”算不算“昂貴”。主流人工智能系統(tǒng)雖然都是數(shù)碼化的,但卻未必真正“識(shí)數(shù)”,因?yàn)樗鼈兌紵o(wú)法以一種靈活的方式來(lái)理解數(shù)字表達(dá)式在特定的日常語(yǔ)境中究竟意味著什么,并在這種理解的基礎(chǔ)上進(jìn)行復(fù)雜的語(yǔ)用推理。為了使得人工智能系統(tǒng)能夠“識(shí)數(shù)”,工作思路應(yīng)是在非公理化推時(shí)系統(tǒng)的平臺(tái)上來(lái)構(gòu)建數(shù)字表征。訓(xùn)練非公理化推理系統(tǒng)使之“識(shí)數(shù)”的指導(dǎo)原則,就是先教會(huì)它表征那些最不抽象的數(shù)學(xué)概念,再一步步進(jìn)展到更抽象的概念。而這一教學(xué)步驟的安排,與我們教導(dǎo)兒童識(shí)數(shù)的路線圖是有點(diǎn)相似的。在這個(gè)面向機(jī)器的數(shù)字教學(xué)法中,我們將以對(duì)“邏輯專名”的教學(xué)作為對(duì)數(shù)字表征教學(xué)的重要前導(dǎo)。

關(guān)鍵詞: 數(shù)感;知覺(jué);通用人工智能;非公理化推理系統(tǒng);邏輯專名

中圖分類號(hào):TP18 ?文獻(xiàn)標(biāo)識(shí)碼:A ?文章編號(hào):1004-8634(2021)05-0024-(13)

DOI:10.13852/J.CNKI.JSHNU.2021.05.003

一、導(dǎo)言:什么叫“識(shí)數(shù)”

在人類的知識(shí)中,大量的內(nèi)容都包含了數(shù)字表征。例如,在經(jīng)典的蓋梯爾問(wèn)題中,對(duì)于“史密斯知道得到工作的那個(gè)人口袋里有十枚硬幣”這樣的命題,1 就包含了“十枚硬幣”這樣包含數(shù)字的表征。然而,這樣的命題所涉及的數(shù)字表征(如“十……”)是如何與那些非數(shù)字表征(如“……枚硬幣”)結(jié)合在一起的呢?對(duì)于這個(gè)問(wèn)題,西方主流知識(shí)論學(xué)界并沒(méi)有投入大量的資源來(lái)加以研究。在本文中,筆者將試圖從人工智能哲學(xué)的角度,闡明通用人工智能系統(tǒng)獲得與日常生活相關(guān)的數(shù)學(xué)知識(shí)的原理,從而為我們進(jìn)一步理解數(shù)字表征在日常知識(shí)中的地位提供一個(gè)新的視角。

初看起來(lái),由于我們已經(jīng)假定了所有的人工智能系統(tǒng)都是數(shù)碼化的,所以,“人工智能究竟該如何表征數(shù)字”這個(gè)問(wèn)題似乎就根本沒(méi)有被加以單獨(dú)討論的必要了。但是,我們這里說(shuō)的“數(shù)字表征”的真正含義卻是“識(shí)數(shù)”,也就是把握一個(gè)帶有特定單位的數(shù)字表征的具體實(shí)踐意義,比如,知道“十公里”算不算“路遠(yuǎn)”,“十萬(wàn)元”算不算“昂貴”。這種意義上的“識(shí)數(shù)”,也可以被理解為對(duì)于“數(shù)感”(number sense)的把握。 “數(shù)感”一詞由心理學(xué)家丹齊格(Tobias Danzig)首創(chuàng),2其字面意思就是:數(shù)字的使用者在他們的日常實(shí)踐中對(duì)數(shù)字的實(shí)踐意義的領(lǐng)會(huì)。根據(jù)戴夫林(Keith Devlin)的理論,1數(shù)感的獲取有賴于兩種能力的預(yù)先獲得:第一,估數(shù)(subitizing),亦即比較那些通常在視覺(jué)中同時(shí)呈現(xiàn)的兩批事物的數(shù)量的能力;第二,計(jì)數(shù) (counting),即通過(guò)數(shù)數(shù)來(lái)回憶在時(shí)間中相繼呈現(xiàn)的對(duì)象的數(shù)量的能力。而現(xiàn)有的人工智能系統(tǒng),是否能夠在上述意義上“識(shí)數(shù)”,則頗為成疑。

數(shù)感和符號(hào)運(yùn)算之間的關(guān)系很復(fù)雜。一方面,基于如下兩個(gè)理由,兩者的確彼此不同:第一,數(shù)感只能保證主體具有估算數(shù)值的能力,而不是處理復(fù)雜與精密的符號(hào)運(yùn)算的能力。第二,通常認(rèn)為,數(shù)感的出現(xiàn)有賴于自然演化的歷程,因?yàn)槿祟惖臄?shù)感和其他物種如鳥類、2鼠、3獅子4和黑猩猩5的數(shù)感具有相同的特征。與之相對(duì)比,進(jìn)行符號(hào)運(yùn)算的能力則毫無(wú)疑問(wèn)與文化有關(guān),因?yàn)樵趧?dòng)物界中只有人類具有文化,并且只有人類會(huì)進(jìn)行復(fù)雜的符號(hào)運(yùn)算。

不過(guò),另一方面,我們也有理由宣稱數(shù)感和符號(hào)運(yùn)算彼此是有緊密聯(lián)系的。具體而言,符號(hào)運(yùn)算的能力雖必然由特定文化所滋養(yǎng),但同時(shí)也被人類的基因稟賦所限制,而這些限制的存在,則可以通過(guò)下面的例子來(lái)加以說(shuō)明:在不同的文化中,人類均對(duì)十進(jìn)制系統(tǒng)具有特殊的偏愛(ài),而這一點(diǎn),恰恰與“凡人均有十根手指”這一生物學(xué)事實(shí)頗有關(guān)聯(lián)。6從這個(gè)角度看,與人類的生物稟賦更有關(guān)聯(lián)的數(shù)感,其實(shí)是為各種文化中的各類數(shù)學(xué)構(gòu)造提供了“原材料”——從這個(gè)角度看,沒(méi)有哪類需要計(jì)算活動(dòng)的人類文化的形成是離得開(kāi)數(shù)感的。

上述這些描述必然是基于心理學(xué)或者生物學(xué)材料的。然而,為何人工智能需要關(guān)注這些材料呢?換言之,為什么人工智能系統(tǒng)需要數(shù)感?此外,在人工智能系統(tǒng)中實(shí)現(xiàn)對(duì)于數(shù)感的把握機(jī)制到底難不難?若是困難,其難點(diǎn)又何在呢?

二、為什么通用人工智能系統(tǒng)需要“識(shí)數(shù)”

首先,讓我們不妨將在人工智能中與人類數(shù)感所對(duì)應(yīng)的東西稱作“人工數(shù)感”。它將從以下兩個(gè)方面對(duì)人工智能提供重大貢獻(xiàn):

其一,“人工數(shù)感”會(huì)讓人工智能體有能力在日常對(duì)話中進(jìn)行適當(dāng)?shù)臄?shù)量推理。例如,聊天機(jī)器人很有可能與人類一起討論商品價(jià)格等物的數(shù)量。若要?jiǎng)偃未祟愓勗挘斯ぶ悄荏w就應(yīng)能將數(shù)字與非數(shù)字表征的評(píng)價(jià)詞匯(“很多”“很少”“幾乎足夠”“太多”“太貴”等)聯(lián)系起來(lái),如整合為如下判斷:“這幢別墅作價(jià)五百萬(wàn)美元,這實(shí)在太貴了”“讓他捐三十元,對(duì)他而言已經(jīng)算很多了”等。顯然,判斷者要做出這種判斷,就必須依據(jù)不同的語(yǔ)境給出不同的“數(shù)詞—評(píng)價(jià)詞”配對(duì)模式。由此看來(lái),人工智能體若無(wú)恰當(dāng)?shù)臄?shù)感(不知道數(shù)字在日常實(shí)踐活動(dòng)中的意義),就根本無(wú)從打通數(shù)字、評(píng)價(jià)詞、語(yǔ)境之間的推理通路。

其二,“人工數(shù)感”會(huì)提升人工智能系統(tǒng)做出數(shù)學(xué)創(chuàng)新的潛力。筆者所說(shuō)的“數(shù)學(xué)創(chuàng)新”是指發(fā)現(xiàn)全新的數(shù)學(xué)知識(shí),而不是再次“發(fā)現(xiàn)”已經(jīng)發(fā)現(xiàn)過(guò)的東西。從康德7 到布勞威爾,8 在關(guān)于數(shù)學(xué)知識(shí)獲取方式的認(rèn)識(shí)論研究傳統(tǒng)中,一直有學(xué)者認(rèn)為數(shù)學(xué)創(chuàng)新和數(shù)學(xué)直覺(jué)有關(guān)。換言之,在數(shù)學(xué)中新構(gòu)造出來(lái)的對(duì)象,必須能在某些可被直觀的心理圖像中獲取其意義。這種主張也被稱為“數(shù)學(xué)直覺(jué)主義”。雖然作為一種關(guān)于數(shù)學(xué)知識(shí)合法性的證成性理論(亦即關(guān)于數(shù)學(xué)創(chuàng)新應(yīng)當(dāng)是怎樣的理論),數(shù)學(xué)直覺(jué)主義的合理性還未得到普遍贊同,但若我們僅僅將其視為一個(gè)心理學(xué)理論(亦即關(guān)于數(shù)學(xué)創(chuàng)新實(shí)際上是怎樣的理論),該學(xué)說(shuō)的學(xué)術(shù)價(jià)值則較少有爭(zhēng)議。實(shí)際上,戴夫林1提到的兩種與“數(shù)感”相關(guān)的能力——估數(shù)和計(jì)數(shù)——也是與數(shù)學(xué)直覺(jué)相關(guān)的,因此,此二者分別依賴于空間性的直覺(jué)和時(shí)間性的直覺(jué)。

不過(guò),“直覺(jué)”這個(gè)術(shù)語(yǔ)依然帶有人類中心主義的傾向。現(xiàn)在筆者就將它外推到人工智能體上。如何進(jìn)行這種外推呢?筆者建議把“直覺(jué)”變?yōu)橐粋€(gè)副詞,即“在直覺(jué)上”。對(duì)于任何智能體而言,凡是能夠與其可提取的記憶模式(不只是數(shù)學(xué)模式)構(gòu)成類比的事項(xiàng),都可以被說(shuō)成是“在直覺(jué)上”存在的事項(xiàng)。照此,當(dāng)我們說(shuō)“A在直覺(jué)上是B”的時(shí)候,就相當(dāng)于說(shuō)“A是B”這一判斷成立的情形,與系統(tǒng)的可提取記憶中的某個(gè)例子構(gòu)成了類比關(guān)系。至于為何這種意義上的對(duì)于“在直覺(jué)上”的定義既適用于人類也適用于機(jī)器,乃是因?yàn)椋哼@個(gè)定義中的關(guān)鍵短語(yǔ)(如“類比”“模式”“可提取的記憶”)無(wú)論對(duì)人類還是人工智能體都是適用的。依此思路,如果人工智能體要通過(guò)它所具備的數(shù)感或直覺(jué)來(lái)進(jìn)行數(shù)學(xué)創(chuàng)新,它就應(yīng)該把新的構(gòu)造視為其經(jīng)驗(yàn)中可提取模式的類比物,從而保證這些數(shù)學(xué)構(gòu)造是富有意義的。

有人或許會(huì)問(wèn):人工智能體為何一定需要恰當(dāng)?shù)臄?shù)學(xué)直覺(jué)來(lái)輔助數(shù)學(xué)創(chuàng)新呢?這是因?yàn)?,倘若沒(méi)有數(shù)學(xué)直覺(jué)的輔助,數(shù)學(xué)探索的效率將會(huì)降低。因?yàn)檎_的數(shù)學(xué)直覺(jué)可以大幅度縮小數(shù)學(xué)探索的范圍。換句話說(shuō),如果被構(gòu)造的數(shù)學(xué)對(duì)象E與經(jīng)驗(yàn)中常見(jiàn)的某種成熟的模式構(gòu)成類比關(guān)系,那么,E看起來(lái)會(huì)比其他備選的有待構(gòu)造的對(duì)象更有希望被構(gòu)造成功。

不過(guò),目前為止我們僅僅初步勾勒了一些大框架,來(lái)討論如何在通用人工智能系統(tǒng)中實(shí)現(xiàn)自主的數(shù)學(xué)創(chuàng)新,關(guān)于這個(gè)話題,尚有更多細(xì)節(jié)方面的空白有待未來(lái)的研究加以充實(shí)。但是值得注意的是,在通用人工智能系統(tǒng)中實(shí)現(xiàn)數(shù)學(xué)創(chuàng)新,畢竟是一項(xiàng)困難的挑戰(zhàn)。與之相比,在通用人工智能系統(tǒng)中實(shí)現(xiàn)對(duì)于日常對(duì)話與數(shù)字表征的整合,看上去要容易一些。按照“先易后難”的原則,我們必須將對(duì)于后者的實(shí)現(xiàn)視為日程表上的首選任務(wù)。有鑒于此,在下面的討論中,筆者會(huì)將注意力更多地集中于這項(xiàng)比較容易完成的任務(wù)上。

在展開(kāi)正面的闡述之前,筆者還需要對(duì)“目前主流人工智能系統(tǒng)是否能夠應(yīng)對(duì)上述兩項(xiàng)挑戰(zhàn)”這一問(wèn)題給出評(píng)估意見(jiàn)。而筆者的相關(guān)評(píng)估意見(jiàn)乃是消極的。在筆者看來(lái),為滿足特定需要而產(chǎn)生的主流人工智能系統(tǒng),既不能有效地評(píng)估特定數(shù)學(xué)表達(dá)式的實(shí)踐價(jià)值(這屬于前文所說(shuō)的“較為容易的任務(wù)”),遑論進(jìn)行數(shù)學(xué)創(chuàng)新(這屬于前文所說(shuō)的“較為困難的任務(wù)”)。

不過(guò),或許有人會(huì)舉出例證,反對(duì)筆者的上述評(píng)斷。例如,有人可能會(huì)認(rèn)為“自動(dòng)數(shù)學(xué)家系統(tǒng)”(Automated Mathematician,縮寫AM)2 構(gòu)成了筆者論斷的一個(gè)反例,因?yàn)閾?jù)稱該系統(tǒng)可以自動(dòng)地發(fā)現(xiàn)哥德巴赫猜想的內(nèi)容和一些基本的算數(shù)定理。然而,正如勒納特(Douglass Lenat)與布朗(John Brown)3 所指出的,這個(gè)系統(tǒng)之所以能夠發(fā)現(xiàn)那些數(shù)學(xué)對(duì)象,乃是因?yàn)橄到y(tǒng)中存在著特定的LISP語(yǔ)言短程序;而只要沒(méi)有系統(tǒng)外的人類研究員用復(fù)雜的數(shù)學(xué)概念來(lái)解釋這些程序的運(yùn)行,那么,該系統(tǒng)的上述數(shù)學(xué)發(fā)現(xiàn)就會(huì)泡湯。因此,從認(rèn)識(shí)論角度看,AM自身并不真正理解它的“發(fā)現(xiàn)”,因?yàn)橹挥挟?dāng)某主體能夠運(yùn)用其自身的內(nèi)部認(rèn)知架構(gòu)來(lái)解釋某事時(shí),該主體才算得上真正“理解”了這件事。從這個(gè)角度看,AM肯定是缺乏數(shù)感的,因?yàn)閿?shù)感的存在本身就預(yù)設(shè)了一種解釋數(shù)字表達(dá)式的能力。無(wú)獨(dú)有偶,在業(yè)界頗有名氣的“培根系統(tǒng)”(BACON)4 也有同樣的毛病。該系統(tǒng)據(jù)稱能重新發(fā)現(xiàn)一些重要的物理學(xué)定律(如理想氣體定律、開(kāi)普勒第三定律、庫(kù)侖定律、歐姆定律、伽利略單擺定律和恒定加速度定律等)。從認(rèn)識(shí)論角度看,培根系統(tǒng)其實(shí)也無(wú)法真正理解其發(fā)現(xiàn),因?yàn)樵谠撓到y(tǒng)中出現(xiàn)的數(shù)學(xué)變量的物理意義恰恰是由人類設(shè)計(jì)師預(yù)先賦予的——至于該系統(tǒng)自身,則不能對(duì)這類變量給出任何一種元描述。也因?yàn)檫@一點(diǎn),培根系統(tǒng)不可能獲得數(shù)感,因?yàn)閿?shù)感的存在本身就預(yù)設(shè)了對(duì)于數(shù)學(xué)變量的意義加以解釋的能力。

然而,上述對(duì)于主流人工智能系統(tǒng)的批評(píng)性斷言是否犯下了“以偏概全”的謬誤呢?在自動(dòng)數(shù)學(xué)家系統(tǒng)與培根系統(tǒng)之外,是否還可能存在著別的能夠擁有數(shù)感的主流人工智能系統(tǒng)呢?而筆者接下來(lái)要論證的就是:只要一個(gè)人工智能系統(tǒng)不是通用人工智能系統(tǒng),它在原則上就是“不識(shí)數(shù)”的。

三、為何主流人工智能系統(tǒng)均是天生“不識(shí)數(shù)”的

一般而言,主流的商用計(jì)算機(jī)均是“數(shù)碼化”的,因?yàn)樗鼈兊膬?nèi)部語(yǔ)言通常是基于八進(jìn)制或十六進(jìn)制的編碼來(lái)運(yùn)行的(順便說(shuō)一句,八進(jìn)制或十六進(jìn)制乃是二進(jìn)制的某種變種)。對(duì)于LISP這樣的高級(jí)編程語(yǔ)言來(lái)說(shuō),它們的運(yùn)行也是基于上述編碼的。但是主流計(jì)算機(jī)的這種“數(shù)碼化”,是不足以使其產(chǎn)生“數(shù)感”的。為何這么說(shuō)呢?這是因?yàn)?,一個(gè)主體若要有健全的數(shù)感,就需要知道在特定語(yǔ)境中一個(gè)數(shù)字到底算不算“大”,而要做出這種判斷,該主體就需要在不同語(yǔ)境中選擇不同的“參照物”來(lái)決定對(duì)象到底算不算“大”。這里的參照物其實(shí)并非一個(gè)靜態(tài)的對(duì)象,而是對(duì)于多項(xiàng)要素綜合評(píng)估后產(chǎn)生的結(jié)果。而這些要素包含了系統(tǒng)的任務(wù)截止時(shí)間點(diǎn)、剩余時(shí)間、剩余電量、知識(shí)庫(kù)內(nèi)容、硬件條件等異常豐富的內(nèi)容。我們將這些要素統(tǒng)稱為“運(yùn)行資源”。譬如,對(duì)于一個(gè)運(yùn)行資源相對(duì)豐富的系統(tǒng)來(lái)說(shuō),10分鐘的任務(wù)解決時(shí)間限制就會(huì)顯得很“寬松”,而對(duì)于一個(gè)運(yùn)行資源逼仄的系統(tǒng)來(lái)說(shuō),同樣的時(shí)間量則會(huì)顯得“不夠用”。很顯然,要對(duì)系統(tǒng)的運(yùn)作資源進(jìn)行整體概觀,系統(tǒng)自身就要對(duì)其內(nèi)部運(yùn)行條件與其周圍環(huán)境之間的動(dòng)態(tài)關(guān)系進(jìn)行把握。由于這種動(dòng)態(tài)關(guān)系是依據(jù)語(yǔ)境變化而變化的,所以,相關(guān)的把握結(jié)果就不能在任何公理化的系統(tǒng)中被預(yù)先編碼,因?yàn)槿魏我环N公理化的知識(shí)庫(kù)整合方式都是缺乏足夠的語(yǔ)境靈活性的。

以上述結(jié)論為出發(fā)點(diǎn),我們也可以重新理解上一部分對(duì)于自動(dòng)數(shù)學(xué)家系統(tǒng)與培根系統(tǒng)的評(píng)論。這兩個(gè)系統(tǒng)都是公理化的,因?yàn)樵谶@兩個(gè)系統(tǒng)中,程序員必須預(yù)先固定好一些特定數(shù)量的結(jié)構(gòu)性要素。而既然這些要素已經(jīng)被固化,此類設(shè)計(jì)思路便會(huì)使得相關(guān)的系統(tǒng)無(wú)法靈活應(yīng)對(duì)各種應(yīng)用語(yǔ)境的變化。例如,自動(dòng)數(shù)學(xué)家系統(tǒng)就包括了上百個(gè)被稱為“概念”的數(shù)據(jù)結(jié)構(gòu)、上百個(gè)“啟發(fā)式規(guī)則”以及一個(gè)簡(jiǎn)單的控制流。然而,若沒(méi)有人類的干預(yù)和解釋,該系統(tǒng)是無(wú)法自主調(diào)整這些要素的。與之類似,就培根系統(tǒng)而言,雖然貌似能夠處理大量與特定物理學(xué)法則相關(guān)的數(shù)據(jù),但是關(guān)于“哪些數(shù)據(jù)值得成為備選的物理法則的奠基性證據(jù)”這個(gè)問(wèn)題,卻是無(wú)法進(jìn)行自主思考的。毋寧說(shuō),程序員會(huì)預(yù)先告訴系統(tǒng)哪些數(shù)據(jù)是具有“物理學(xué)價(jià)值”的。但這就等于將科學(xué)發(fā)現(xiàn)的最重要步驟“分包”給人類完成了。從這個(gè)角度看,培根系統(tǒng)只不過(guò)就是人類智能的副產(chǎn)品罷了。

那么,公理化進(jìn)路的人工智能系統(tǒng)就沒(méi)有別的辦法來(lái)應(yīng)對(duì)語(yǔ)境靈活性了嗎?譬如,設(shè)計(jì)者能夠在系統(tǒng)中設(shè)定某些“元公理”,以便預(yù)先規(guī)定好某些特定的知識(shí)模塊和某些特定種類的語(yǔ)境之間的聯(lián)系,這樣的系統(tǒng)難道就不能讓自己的行為具有語(yǔ)境靈活性了嗎?很可惜,對(duì)于上述問(wèn)題的回答乃是否定的,因?yàn)樵俣嗟摹霸怼币膊豢赡芨F盡所有的知識(shí)模塊與語(yǔ)境之間的聯(lián)系。以古哈(Guha)1的“微理論”為例(微理論乃是為“Cyc系統(tǒng)”而設(shè)計(jì)的一個(gè)輔助性的概念工具):他以微理論為基礎(chǔ),對(duì)Cyc系統(tǒng)的知識(shí)庫(kù)加以重新組織和分類,使之成為一些更易處理的知識(shí)模塊,而每一個(gè)微理論則包括幾條可以被進(jìn)一步測(cè)試或打磨的公理或規(guī)則。那么,此類設(shè)計(jì)是如何使恰當(dāng)?shù)闹R(shí)模塊能夠在恰當(dāng)?shù)恼Z(yǔ)境中得到恰當(dāng)?shù)恼{(diào)用呢?其訣竅便是在諸微理論之上再去設(shè)定作為其元公理的“表述規(guī)則”,以便預(yù)先規(guī)定在哪些語(yǔ)境中一個(gè)微理論有權(quán)調(diào)用另一個(gè)微理論所導(dǎo)出的結(jié)果。不過(guò),即便整個(gè)設(shè)計(jì)方案已然假定了設(shè)計(jì)者能夠預(yù)知在每一個(gè)工作情境該用何種微理論,但是誰(shuí)又能有這種神一般的預(yù)知力呢?

有人或許會(huì)問(wèn):上述的診斷意見(jiàn)都是針對(duì)“符號(hào)主義進(jìn)路的人工智能系統(tǒng)”的,那么,該診斷是否也適用于聯(lián)結(jié)主義或深度學(xué)習(xí)進(jìn)路的人工智能系統(tǒng)呢(順便說(shuō)一句,由于深度學(xué)習(xí)技術(shù)只是傳統(tǒng)聯(lián)結(jié)主義技術(shù)的升級(jí)版,下面我們將僅僅提及聯(lián)結(jié)主義進(jìn)路的人工智能系統(tǒng))?

筆者認(rèn)為,對(duì)于上述問(wèn)題的回答乃是肯定的,盡管從表面上看,對(duì)于聯(lián)結(jié)主義進(jìn)路的人工智能系統(tǒng)的構(gòu)建思路,的確不同于符號(hào)主義的人工智能系統(tǒng)。概而言之,構(gòu)造一個(gè)聯(lián)結(jié)主義網(wǎng)絡(luò)的基本思路便是去構(gòu)造一個(gè)高度簡(jiǎn)化的神經(jīng)網(wǎng)絡(luò)模型。這樣的模型通常包括一個(gè)輸入層、幾個(gè)隱藏層以及一個(gè)輸出層,而其中每一層都包含大量的人工神經(jīng)元節(jié)點(diǎn)。在“有監(jiān)督學(xué)習(xí)”模式的人工聯(lián)結(jié)主義模型中(這是一種最典型的聯(lián)結(jié)主義構(gòu)造模式),對(duì)于系統(tǒng)的訓(xùn)練是離不開(kāi)大量學(xué)習(xí)樣本的“喂入”的。 而一個(gè)相關(guān)的訓(xùn)練樣本在被系統(tǒng)處理之后,系統(tǒng)會(huì)立即判定實(shí)際的處理輸出與目標(biāo)輸出之間的差值——如果此差值過(guò)大,以至于實(shí)際輸出必須被視為“誤差”,那么,該系統(tǒng)會(huì)依據(jù)特定的學(xué)習(xí)規(guī)則來(lái)調(diào)整節(jié)點(diǎn)間的聯(lián)結(jié)權(quán)重。經(jīng)過(guò)一系列的此番調(diào)整,神經(jīng)網(wǎng)絡(luò)所產(chǎn)生的輸出就會(huì)越來(lái)越接近目標(biāo)輸出,直至訓(xùn)練達(dá)標(biāo)。

然而,上述技術(shù)路徑依然不足以讓相關(guān)的系統(tǒng)產(chǎn)生那種足以靈活地適應(yīng)多樣性語(yǔ)境的“數(shù)感”。其原因是:一個(gè)系統(tǒng)要有健全的數(shù)感,就必須把握評(píng)價(jià)性詞匯(如“大的”“足夠的”等)、數(shù)字表達(dá)式與語(yǔ)境要素三者間的關(guān)系,故而,訓(xùn)練一個(gè)聯(lián)結(jié)主義網(wǎng)絡(luò)所用的訓(xùn)練樣本,也必須包含所有這三類要素。但這一點(diǎn)是不可能實(shí)現(xiàn)的,因?yàn)槲覀兏静豢赡茉谟?xùn)練樣本中包含語(yǔ)境要素。這又是為何呢?這是因?yàn)椋赫Z(yǔ)境要素本身就是一個(gè)囊括很多下級(jí)要素的高階概念,而聯(lián)結(jié)主義網(wǎng)絡(luò)的輸入單元層一般只對(duì)訓(xùn)練樣本的低階特征敏感。因此,從原則上說(shuō),除非我們讓語(yǔ)境概念的含義縮水,否則,就無(wú)法通過(guò)訓(xùn)練一個(gè)聯(lián)結(jié)主義網(wǎng)絡(luò)來(lái)讓其獲得真正的語(yǔ)境靈活性(順便說(shuō)一句,某些深度學(xué)習(xí)系統(tǒng)貌似能夠處理一些“語(yǔ)境”,但這種“語(yǔ)境”僅僅指文本的前后文關(guān)聯(lián),而無(wú)法囊括更多的要素,因此,非上文所討論的“語(yǔ)境”)。

對(duì)于主流人工智能系統(tǒng)的批評(píng),就到此為止了。下面,我們將轉(zhuǎn)入對(duì)機(jī)器“數(shù)感”的實(shí)現(xiàn)方案的嘗試性討論。

四、如何在納思中表征數(shù)量

在下文中,筆者將依據(jù)非公理化推理系統(tǒng)(Non-Axiomatic Reasoning System,縮寫NARS,漢譯為“納思”)所提供的技術(shù)刻畫手段1來(lái)討論“如何實(shí)現(xiàn)機(jī)器數(shù)感”這個(gè)問(wèn)題。納思是一個(gè)通用推理系統(tǒng),而非針對(duì)特定知識(shí)領(lǐng)域的專用推理系統(tǒng)。除了通用性之外,它與傳統(tǒng)推理系統(tǒng)的不同處還在于:即使沒(méi)有得到用以完美解決問(wèn)題所需要的充分知識(shí)與充足時(shí)間,該系統(tǒng)也有能力從自身的有限經(jīng)驗(yàn)出發(fā)進(jìn)行學(xué)習(xí),并對(duì)給定的問(wèn)題提供某種尚可被接受的解法。研究納思的目標(biāo)有兩方面:首先,此類研究有助于理解一切智能系統(tǒng)的規(guī)范性特點(diǎn);其次,此類模型能夠提供一個(gè)計(jì)算模型來(lái)描述“會(huì)思考”的機(jī)器,以直接助力通用人工智能系統(tǒng)的研究。目前,納思研究計(jì)劃也被視為方興未艾的 “通用人工智能運(yùn)動(dòng)”的一個(gè)代表性技術(shù)流派。2

那么,我們究竟該如何在一個(gè)納思中實(shí)現(xiàn)機(jī)器數(shù)感呢?在這方面,發(fā)展心理學(xué)關(guān)于孩童如何學(xué)習(xí)數(shù)學(xué)過(guò)程的研究成果,或許頗有參考價(jià)值。3 也就是說(shuō),我們要將納思也視為某種意義上的孩童,就像教育孩童那樣去教育這樣的人工智能系統(tǒng)。比如,我們首先要教會(huì)納思那些最具體、最基本的數(shù)學(xué)概念,然后一步步地將我們的教學(xué)目標(biāo)過(guò)渡到那些更抽象的概念。那么,什么才是最具體、最基本的數(shù)學(xué)概念呢?或許不是自然數(shù),而是那些自然語(yǔ)言中的量詞(如“有一些”等)。譬如,對(duì)于孩童而言,在把握“一”或“二”這些概念之前,或許得先學(xué)會(huì)說(shuō)“有一些糖果是紅的,而有一些則不是”,這就預(yù)設(shè)了他們已學(xué)會(huì)諸如“一些”“大多數(shù)”之類的量詞。

對(duì)于數(shù)學(xué)哲學(xué)中的邏輯主義流派4 較為熟悉的人可能會(huì)說(shuō),筆者提出的思路無(wú)非就是弗雷格或羅素式的邏輯主義思路的翻版,即以量詞為基礎(chǔ),將數(shù)學(xué)還原為邏輯。但上述印象乃是錯(cuò)誤的。在弗雷格或羅素式的一階謂詞邏輯中,所謂的“量詞”便只有“存在量詞”和“全稱量詞”兩種而已,難以有效地涵蓋自然語(yǔ)言中那些表述不同程度的量詞,如“很少”“一點(diǎn)點(diǎn)”“一些”“大多數(shù)”“幾乎全部”等。與之相較,筆者提出的納思式進(jìn)路,正是要顧及在日常語(yǔ)言中的這些常見(jiàn)量詞。

那么,我們?cè)撊绾螌?duì)這些量詞進(jìn)行技術(shù)刻畫呢?

在納思中,概念節(jié)點(diǎn)A與B之間的連接強(qiáng)度,可以被理解為主項(xiàng)的成員從屬于謂項(xiàng)的成員的程度,而這樣的強(qiáng)度或者程度可以被進(jìn)一步地表現(xiàn)為A與B之間連線的“寬度”或者“權(quán)重”。這一點(diǎn)或許會(huì)讓人聯(lián)想起貝葉斯網(wǎng)絡(luò)(見(jiàn)圖1),因?yàn)檫B接貝葉斯中諸節(jié)點(diǎn)的那些通路的權(quán)重,也能對(duì)一個(gè)事件引發(fā)另一個(gè)事件的概率值進(jìn)行編碼。

然而,納思網(wǎng)絡(luò)與貝葉斯網(wǎng)絡(luò)尚有兩點(diǎn)重要差異。

差別之一:在納思最為基礎(chǔ)的表征層次上,諸納思節(jié)點(diǎn)所編碼的,基本上是像“蘋果”或“紅”這樣的概念,而不是代表事件的命題(如圖1所展現(xiàn)的那些事件: “天在下雨”“灑水器開(kāi)著”“草坪濕了”等)。因此,在圖2中,兩個(gè)納思節(jié)點(diǎn)之間雖然有一個(gè)箭頭將其聯(lián)系到了一起,但這并不代表一個(gè)事件相對(duì)于另一個(gè)已被給定的事件的后驗(yàn)概率,而僅僅代表某個(gè)主謂判斷——如“渡鴉是黑色的”——的強(qiáng)度(不過(guò),更為復(fù)雜的納思構(gòu)造物,還是可以通過(guò)某些納思節(jié)點(diǎn)來(lái)編碼復(fù)合詞項(xiàng)和命題的,但不在本文的討論范圍之內(nèi))。

差別之二:在貝葉斯網(wǎng)絡(luò)中,數(shù)據(jù)的更新規(guī)則必須能用標(biāo)準(zhǔn)的概率論規(guī)則來(lái)解釋,而納思的數(shù)據(jù)更新規(guī)則和標(biāo)準(zhǔn)的概率論規(guī)則卻有很大不同。依據(jù)標(biāo)準(zhǔn)的概率論,證據(jù)池中的證據(jù)被獲取的時(shí)間先后關(guān)系,與基于此池中證據(jù)的相關(guān)假設(shè)的成真概率并沒(méi)有本質(zhì)性聯(lián)系,因此,一個(gè)嚴(yán)格基于標(biāo)準(zhǔn)概率論運(yùn)作的智能系統(tǒng)是不可能產(chǎn)生“錨定效應(yīng)”的(即一種特定的心理學(xué)效應(yīng),以使那些先被獲取的證據(jù),比那些后獲取的證據(jù),更能影響主體對(duì)于相關(guān)假設(shè)成真概率的判斷)。然而,納思卻可以模擬“錨定效應(yīng)”的產(chǎn)生,1 以便應(yīng)對(duì)某些需要系統(tǒng)急速做出判斷的問(wèn)題處理情景。

下面我們就通過(guò)具體的例子,來(lái)說(shuō)明納思是如何處理數(shù)量關(guān)系的。

假定該系統(tǒng)觀察到了10只渡鴉,其中有9只是黑的,由此形成了一個(gè)基本的納思式判斷“渡鴉→黑色的”(意思即“渡鴉是黑的”)。有兩個(gè)參數(shù)可以用以刻畫這樣一個(gè)判斷的真值,一個(gè)是頻率因子(f值),另一個(gè)是置信因子(c值)。對(duì)于f值而言,其計(jì)算公式是:

公式1: f = w + /w

在此,“w”代表系統(tǒng)所獲取的用以支持或者反對(duì)某假設(shè)的證據(jù)總數(shù)(在上述案例中,該值乃是10,因?yàn)橄到y(tǒng)的確觀察到了10只渡鴉),而“w + ”代表其中正面證據(jù)的總數(shù)(在上述案例中,該值乃是9,因?yàn)榈拇_有9只黑渡鴉被觀察到了,以便從正面支持“渡鴉是黑色的”這個(gè)假設(shè))。但需注意的是,這里的f值并不能通過(guò)對(duì)于概率的 “頻率主義解釋”1 來(lái)解讀,因?yàn)楦鶕?jù)“頻率主義”的假定,一個(gè)系統(tǒng)是應(yīng)當(dāng)有無(wú)窮的時(shí)間來(lái)收集證據(jù)的,而納思則完全沒(méi)有采用這個(gè)假定。毋寧說(shuō),即使納思搜集證據(jù)的時(shí)間非常有限——這往往體現(xiàn)為一個(gè)很小的w值——該系統(tǒng)也能給出一個(gè)f值。

然而,僅僅依賴f值,納思對(duì)于判斷的真值的刻畫還是很不完整的。這種不完整性,可以通過(guò)對(duì)下述問(wèn)題的考慮而得到揭示:現(xiàn)在假定系統(tǒng)已經(jīng)觀察到了100只渡鴉,其中有90只是黑色。根據(jù)公式1,現(xiàn)在f值還是0.9。然而,我們的直覺(jué)似乎是:該數(shù)據(jù)要比舊的數(shù)據(jù)更為可靠,因?yàn)樗谝粋€(gè)更大的證據(jù)池。如何在納思中刻畫這一區(qū)別呢?光有f值恐怕不行,我們還得引入c值:

公式2: c=w/(w + k)

依據(jù)公式2,基于100份關(guān)于渡鴉的證據(jù)的f值(例如0.9),會(huì)被賦予一個(gè)更高的c值,而基于10份關(guān)于渡鴉的證據(jù)的f值雖然也可能是0.9,但卻會(huì)被賦予更低的c值。由此,就形成了兩個(gè)不同的數(shù)對(duì),用以刻畫兩個(gè)不同的納思判斷的真值。很明顯,即使f值相同,兩個(gè)具有不同c值的納思判斷,其各自所導(dǎo)致的推論的強(qiáng)度也會(huì)不同:c值越高,從中導(dǎo)出的結(jié)論的強(qiáng)度也越高,反之亦然。

對(duì)于公式2的觀察還能告訴我們:當(dāng)k取某常數(shù)時(shí),w值越大,c值越接近1。不難想見(jiàn),當(dāng)w值已經(jīng)變得很大時(shí),它若變得更大,這一點(diǎn)并不會(huì)導(dǎo)致c值被明顯地提高。這樣一來(lái),對(duì)于納思而言,系統(tǒng)所先得到的證據(jù),在權(quán)重方面也會(huì)高于其后所得到的證據(jù)。這便等于是在納思中模擬了“錨定效應(yīng)”。這就使得系統(tǒng)不會(huì)陷入不斷搜集新證據(jù)的怪圈,而在基本證據(jù)量大致足夠的情況下就產(chǎn)生出足夠高的c值。

不同的f值和c值所構(gòu)成的數(shù)對(duì),可以被映射到諸如“很少”“一點(diǎn)點(diǎn)”“一些”“大多數(shù)”“幾乎全部”等自然語(yǔ)言中的量詞上(見(jiàn)圖3)。但需要注意的是,當(dāng)這些量詞在自然語(yǔ)言中被表征出來(lái)的時(shí)候,其背后的f值、c值、w值與 w +值均不會(huì)直接出現(xiàn),而只會(huì)在系統(tǒng)的后臺(tái)運(yùn)作中出現(xiàn)。這就好比說(shuō):當(dāng)一個(gè)兒童覺(jué)得他所見(jiàn)過(guò)的大部分渡鴉都是黑的時(shí),他或許已經(jīng)遺忘了其所觀察過(guò)的渡鴉的精確數(shù)量。

有了上面的討論做基礎(chǔ),我們似乎就可以討論如何在納思中表征自然數(shù)了。但在切入此話題前,我們還有一項(xiàng)預(yù)備工作要做。

五、如何讓納思學(xué)會(huì)“the”(“這個(gè)”或“那個(gè)”)

很多人或許會(huì)想當(dāng)然地認(rèn)為,如果我們要讓通用人工智能系統(tǒng)學(xué)會(huì)自然數(shù),那么相關(guān)的教學(xué)起點(diǎn)就應(yīng)當(dāng)是所有的自然數(shù)中最小的“一”。然而,這可能不是一個(gè)好主意,因?yàn)椤耙弧笨赡苓€是一個(gè)過(guò)于抽象的概念。筆者的建議是:從定冠詞“the”開(kāi)始教。

為何要這么做呢?因?yàn)橛谩皌he”這個(gè)英語(yǔ)中的常見(jiàn)定冠詞時(shí),說(shuō)話人一般都會(huì)借此表示其背后所跟的對(duì)象在談話語(yǔ)境中的唯一性。比如,說(shuō)“the old man”(那個(gè)老人)時(shí),說(shuō)話人一般就會(huì)預(yù)設(shè)在談話語(yǔ)境中僅有一個(gè)老人。上述分析其實(shí)也適用于漢語(yǔ)。雖然在漢語(yǔ)中沒(méi)有與“the”嚴(yán)格對(duì)應(yīng)的單個(gè)的詞,但類似的現(xiàn)象也是有的。“the”一般在漢語(yǔ)中被翻譯為“這個(gè)”或“那個(gè)”,而當(dāng)我們說(shuō)“那個(gè)老人”的時(shí)候,我們往往也預(yù)設(shè)了語(yǔ)境中被涉及的老人只有一個(gè)。當(dāng)然,筆者也注意到,西方語(yǔ)言哲學(xué)界近來(lái)有一種研究趨勢(shì),即否認(rèn)“the”之后所跟的對(duì)象在語(yǔ)境中是唯一的,1 但為了討論的簡(jiǎn)潔計(jì),筆者在此尚且不想處理這一新的學(xué)術(shù)見(jiàn)解。

那么,為何要讓納思先學(xué)會(huì)說(shuō)諸如“The raven is black”(這個(gè)渡鴉是黑色的)這樣的句子,而不是先讓其學(xué)會(huì)“一”呢?這樣做的理由,乃是基于如下的三步論證:

第一步:一個(gè)智能系統(tǒng)要具有計(jì)數(shù)能力,首先就得具備辨別物理對(duì)象數(shù)量的能力。

第二步:僅僅讓系統(tǒng)知道“一”的意義,并不能使相關(guān)的智能系統(tǒng)具有上述的識(shí)別能力,因?yàn)槌橄蟮摹耙弧弊陨聿⒉缓臀锢韺?duì)象相關(guān)聯(lián)。

第三步:與之相較,讓系統(tǒng)首先領(lǐng)會(huì)“the”的意義,則可能讓系統(tǒng)更快地掌握識(shí)別物理對(duì)象數(shù)量的能力,因?yàn)楦鶕?jù)“the”的基本用法,它是必須引導(dǎo)其后面所跟的那些要被計(jì)數(shù)的物理對(duì)象的名稱的。

那么,我們究竟該如何在納思中刻畫“the”呢?一些人可能不禁想引用羅素對(duì)“the”的處理方案。2 依據(jù)該方案,“The raven is black”這句話必須被重述為:

?x[(Rx & ?y(Ry → y=x)) & Bx]

其自然語(yǔ)言翻譯是:存在至少一個(gè)對(duì)象,該對(duì)象是渡鴉;如果存在另一個(gè)事物也是渡鴉,那么這第二個(gè)事物無(wú)非就是第一個(gè),而且它是黑色的。

然而,筆者不會(huì)采用羅素的上述處理方案。很明顯,他的處理方案預(yù)設(shè)了存在量詞和全稱量詞的基礎(chǔ)地位。但正如前文所述,這種預(yù)設(shè)使我們無(wú)法自然地處理自然語(yǔ)言中表示數(shù)量多寡不同程度的諸種量詞。所以,納思對(duì)于“the”的處理基本上會(huì)另辟蹊徑。

不過(guò),羅素對(duì)“the”的處理也有一個(gè)值得贊許的地方,就是他區(qū)分了“摹狀詞”(如“the present French king”,即“當(dāng)今法王”)和“邏輯專名”(如“this”,即“這個(gè)”)。依據(jù)羅素的觀點(diǎn),雖然由“the”開(kāi)頭的摹狀詞與邏輯專名都表明了它們所指的事物的唯一性,然而,二者依然有所分別。具體而言,邏輯專名與其外在對(duì)象之間的聯(lián)系更為直接,因?yàn)檫壿媽C擞兄干婀δ芡?,其本身不具有任何意義,而摹狀詞依然具有意義。

從納思的角度看,羅素的上述說(shuō)法至少包含了一半的真理,盡管它也包含了一半的謬誤。此說(shuō)的錯(cuò)誤之處在于:即使如“這個(gè)”(this)這樣的邏輯專名,其實(shí)也不是完全沒(méi)有意義的,因?yàn)橹辽偎磉_(dá)了說(shuō)話者和對(duì)象之間的距離。而此說(shuō)所包含的真理性則在于:邏輯專名“這個(gè)”(this)的意義畢竟是非常稀薄的,以至于它大致能被視作為別的意義提供支點(diǎn)的一個(gè)“光裸”的載體。也正因?yàn)檫壿媽C斑@個(gè)”(this)的意義是貧乏的,它就特別適合成為教授自然數(shù)時(shí)所用的“教具”,因?yàn)樵谟?jì)數(shù)活動(dòng)中人們的意向活動(dòng)真正瞄向的并不是物理對(duì)象的數(shù)量,而是物理性質(zhì)附著于其上的那些載體的數(shù)量。

那么,我們又該如何在納思中表征邏輯專名呢?從句法上說(shuō),邏輯專名跟其他納思詞項(xiàng)(或者節(jié)點(diǎn))之間的區(qū)別主要在于:邏輯專名的外延里只有一個(gè)實(shí)例,而后者則有一個(gè)以上的實(shí)例。什么叫“外延”呢?在納思中,一個(gè)詞項(xiàng)的外延,就是作為該詞項(xiàng)的主詞出現(xiàn)的那些節(jié)點(diǎn)。那么,什么叫“主詞”呢?在納思中,對(duì)兩個(gè)變?cè)獂和y而言,x是y的主詞,當(dāng)且僅當(dāng)“x→y”的句法結(jié)構(gòu)出現(xiàn)。有了上面的定義后,邏輯專名本身就可以通過(guò)對(duì)納思網(wǎng)絡(luò)的局部拓?fù)鋵W(xué)結(jié)構(gòu)的識(shí)別而得到計(jì)算機(jī)的自動(dòng)定位。

另外,從語(yǔ)義學(xué)角度看,納思中所有包含邏輯專名作為其主詞的基本斷言,其實(shí)都表示了一個(gè)單稱命題。這些命題的f值和c值都必須被設(shè)定得較高,以便彰顯下述唯名論立場(chǎng):無(wú)論從本體論立場(chǎng)看,還是從認(rèn)識(shí)論角度看,那些關(guān)于個(gè)別事物的斷言都要比關(guān)于個(gè)別事物之集合或類型的斷言來(lái)得更為可靠。

基于上述分析,從納思的觀點(diǎn)看,當(dāng)一個(gè)人說(shuō)“那只渡鴉是黑色的”時(shí),他其實(shí)是對(duì)如下兩個(gè)命題有所斷言:(1)這是一只渡鴉(該斷言與一對(duì)較高的f值和c值相結(jié)合)。(2)這是黑色(該斷言也與一對(duì)較高的f值和c值結(jié)合)。若用“a“”代表“這個(gè)”,則表征(1)和(2)的納思網(wǎng)絡(luò)的拓?fù)鋵W(xué)結(jié)構(gòu)便如圖4所示:

人們或許會(huì)認(rèn)為,教會(huì)納思“識(shí)數(shù)”的下一個(gè)步驟就該是教會(huì)其掌握“一”的概念了。但是筆者接下來(lái)就要論證:在教會(huì)納思“一”之前,我們首先要教會(huì)它“二”。

六、如何教會(huì)納思“二”與“一”

為什么在教納思學(xué)會(huì)“一”之前,要先教會(huì)其掌握“二”呢?這是因?yàn)椋绻粋€(gè)集合只有一個(gè)下屬成員的話,那么該集合在成員數(shù)量方面的特征會(huì)變得過(guò)于稀松平常,以至于難以成為吸引注意力的顯豁特征。舉個(gè)例子:如果一名教師向?qū)W生展示一個(gè)橙子、一個(gè)蘋果和一把刀的話,學(xué)生如何能很快地意識(shí)到這三個(gè)集合的共性就是它們都只有一個(gè)下屬成員呢?要讓學(xué)生盡快注意到一個(gè)集合只有一個(gè)成員,唯一的辦法就是將該集合與擁有更多成員的集合相互比較。比如,將其與一個(gè)擁有兩個(gè)成員的集合相互比較。但這一點(diǎn)就預(yù)設(shè)了納思必須先掌握“二”這個(gè)概念。

在納思里引入“二”的步驟如下:

第一步:我們要教會(huì)納思兩個(gè)句子,即“這只渡鴉是黑色的”和“那只渡鴉是黑色的”。這兩個(gè)句子中的“這只”與“那只”實(shí)際上指稱了兩個(gè)不同的對(duì)象,因此我們就必須給它們指派兩個(gè)不同的邏輯專名,如“a”和“b”(見(jiàn)圖5)。

第二步:為了教學(xué)目的,假設(shè)a和b的指稱都很相似,那么,兩者之間有著很明顯的類比關(guān)系(見(jiàn)圖6)。

圖6 ? 納思網(wǎng)絡(luò)中兩個(gè)同類型的單稱判斷在主項(xiàng)方面的相互類比關(guān)系

第三步:基于上述步驟,納思會(huì)忽略a和b在其他方面的區(qū)別,由此將b視為a的另一個(gè)例。對(duì)于算術(shù)的教學(xué)而言,這一步是很重要的,因?yàn)橐粋€(gè)系統(tǒng)要從事計(jì)數(shù)活動(dòng),就必須先忽略被計(jì)數(shù)的對(duì)象之間在物理性質(zhì)方面的種種區(qū)別(見(jiàn)圖7)。

圖7 ?對(duì)于兩個(gè)邏輯專名的等同化處理

第四步:現(xiàn)在納思就得到了一個(gè)類似矩陣的網(wǎng)絡(luò):它包含兩個(gè)a,從而每個(gè)a就像一個(gè)占位符,可以被任意其他符號(hào)替換,例如可以被替換成兩個(gè)點(diǎn)。由此,此類節(jié)點(diǎn)的語(yǔ)義內(nèi)容就被降到了最低,而其在相關(guān)推理結(jié)構(gòu)中的拓?fù)鋵W(xué)地位則得到了凸顯。由此,我們就不妨引入一個(gè)新詞來(lái)指稱這個(gè)拓?fù)鋵W(xué)結(jié)構(gòu)。這個(gè)新詞就是“二”,也就是我們?cè)诩{思里引入的第一個(gè)數(shù)詞。一個(gè)知道了“二”的用法的納思,實(shí)際上也就知道了:只要在系統(tǒng)的推理路徑中觀察到類似于圖8中上半部分的拓?fù)鋵W(xué)結(jié)構(gòu),就可以用“二”來(lái)替換這個(gè)結(jié)構(gòu);或反過(guò)來(lái)說(shuō),對(duì)于出現(xiàn)“二”的判斷句,系統(tǒng)也可以進(jìn)行反向處理,以復(fù)原出一個(gè)更為復(fù)雜的推理路徑圖。

圖8 ?在納思中引入“二”

現(xiàn)在總算到了教會(huì)納思掌握“一”的時(shí)候了。但是如何從針對(duì)“二”的教學(xué)過(guò)渡到針對(duì)“一”的教學(xué)?

我們不能通過(guò)引入“減法”來(lái)從“二”得到“一”,因?yàn)椤岸p一等于一”這個(gè)陳述預(yù)設(shè)了“一”的概念。與之相較,從“二除以二等于一”出發(fā)來(lái)定義“一”貌似更為可行,因?yàn)椤岸碑吘故羌{思已經(jīng)學(xué)會(huì)的一個(gè)概念。但是這個(gè)做法也預(yù)設(shè)了納思已經(jīng)理解了“除以”的意義。不過(guò),這一預(yù)設(shè)還是會(huì)帶來(lái)一些麻煩,因?yàn)槌橄笠饬x上的“除以”是很難被立即學(xué)會(huì)的。更可行的辦法是用“取半法”(也就是分母為“2”的特殊除法)的概念來(lái)替代抽象意義上的除法。對(duì)于“取半法”這一概念的引入,可以通過(guò)下述操作來(lái)實(shí)現(xiàn):對(duì)于任意集合,求它的兩個(gè)等式的子集的分布方式。更具體而言,當(dāng)我們讓納思求概念X之實(shí)例的半數(shù)時(shí),納思就會(huì)嘗試著對(duì)原集合的成員進(jìn)行隨機(jī)二分,由此得到兩個(gè)子集,然后一一比較這些子集的大小,直到找到兩個(gè)等式的子集為止。計(jì)算機(jī)很容易通過(guò)對(duì)網(wǎng)絡(luò)的局部拓?fù)鋵W(xué)結(jié)構(gòu)的檢索來(lái)完成上述任務(wù),所以,我們沒(méi)有理由認(rèn)為納思無(wú)法執(zhí)行這個(gè)“取半任務(wù)”。故而,只要納思能對(duì)“二”的概念進(jìn)行“取半”操作,它立刻就能得到“一”的概念。

現(xiàn)在,納思已經(jīng)學(xué)會(huì)了“二”與“一”這兩個(gè)概念,由此也就有希望學(xué)會(huì)所有奇數(shù)和偶數(shù)。限于篇幅,在此不能詳述納思如何習(xí)得更復(fù)雜的算術(shù)概念。

需要注意的是,由于現(xiàn)代數(shù)學(xué)的高度復(fù)雜性,筆者認(rèn)為不需要都依賴如此曲折的方式來(lái)教會(huì)納思數(shù)學(xué)概念。如果我們僅僅要設(shè)計(jì)一個(gè)具有低級(jí)數(shù)學(xué)智能的系統(tǒng)的話,那么,我們可以僅僅在納思中置入一些負(fù)責(zé)特定類型計(jì)算(如針對(duì)“對(duì)數(shù)”或“三角函數(shù)”計(jì)算)的專用計(jì)算模塊。對(duì)于納思的其他部分而言,這些模塊的內(nèi)部運(yùn)行就是一些“黑箱事件”。也就是說(shuō),這個(gè)系統(tǒng)的其余部分僅僅需要知道:自己應(yīng)該在什么時(shí)候啟動(dòng)這些模塊,以及如何理解它們的輸出。這就很像一個(gè)算術(shù)能力有限的人適應(yīng)社會(huì)的方式——只要他知道怎么用便攜式計(jì)算器,并讀懂上面的數(shù)字,他就能適應(yīng)。

從上面的分析來(lái)看,即便一個(gè)數(shù)學(xué)智能很低的納思,也可以在日常對(duì)話中很靈活地處理數(shù)字表達(dá)式。下面就是對(duì)于這一點(diǎn)的更為詳細(xì)的說(shuō)明。

七、深入討論(代總結(jié)):納思如何在日常對(duì)話中做到“識(shí)數(shù)”

在本文第三部分,我們已經(jīng)看到:傳統(tǒng)符號(hào)人工智能系統(tǒng)無(wú)法依據(jù)語(yǔ)境的變化而將正確的評(píng)價(jià)標(biāo)簽(如“大的”“足夠多的”“太多的”等)與正確的數(shù)字表征相對(duì)應(yīng)。而這些系統(tǒng)之所以做不到這一點(diǎn),乃是因?yàn)檫@些系統(tǒng)是公理化的。因此,除非程序員提前用某些元公理來(lái)鎖定評(píng)價(jià)標(biāo)簽、數(shù)字和語(yǔ)境三者的關(guān)系,否則,這些系統(tǒng)是無(wú)法在不同語(yǔ)境中將同一個(gè)評(píng)價(jià)標(biāo)簽靈活地指派給不同的數(shù)字表征的。然而,人類的生活瞬息萬(wàn)變,除非該系統(tǒng)的設(shè)計(jì)者對(duì)人類生活的各個(gè)方面能夠做到無(wú)所不知,否則,就根本不可能在系統(tǒng)中預(yù)裝針對(duì)所有可能語(yǔ)境的知識(shí)調(diào)用元公理。此外,即便是聯(lián)結(jié)主義或深度學(xué)習(xí)的系統(tǒng),也無(wú)法解決這個(gè)問(wèn)題。這是因?yàn)?,要使這些系統(tǒng)學(xué)會(huì)將特定的評(píng)價(jià)詞與特定的數(shù)量表征相互聯(lián)系,就得預(yù)先喂給系統(tǒng)一些特定的“評(píng)價(jià)詞—數(shù)量”匹配樣本,作為訓(xùn)練的起點(diǎn)。但是,這些匹配樣本又從何而來(lái)呢?在日常生活中,相同的數(shù)量詞會(huì)在不同的語(yǔ)境中獲得不同的評(píng)價(jià)詞(在兩個(gè)彼此不同的特定語(yǔ)境下,100000元和2元都有可能是“足夠”的),這一點(diǎn)就會(huì)使深度學(xué)習(xí)所需要的樣本特征變得非常不穩(wěn)定,最終使此類機(jī)器學(xué)習(xí)根本無(wú)法進(jìn)行。

而與上述傳統(tǒng)路徑相比較,納思則可以輕易解決這一難題,因?yàn)樵谝粋€(gè)統(tǒng)一的納思推理網(wǎng)絡(luò)中,數(shù)字表達(dá)式本來(lái)就已經(jīng)與表示物理對(duì)象的詞項(xiàng)相互結(jié)合在一起了。因此,納思始終知道:“純粹的”數(shù)字只不過(guò)是從實(shí)際事態(tài)中抽象出來(lái)的量化刻畫,而這些刻畫隨時(shí)可以被復(fù)原為與實(shí)際物理對(duì)象相互關(guān)聯(lián)的原始狀態(tài)。此外,既然在納思中代表各類物理對(duì)象的節(jié)點(diǎn)的推理功能可以隨著系統(tǒng)的學(xué)習(xí)過(guò)程做調(diào)整,那么,包括數(shù)字節(jié)點(diǎn)和非數(shù)字節(jié)點(diǎn)在內(nèi)的復(fù)合節(jié)點(diǎn)的推理功能自然也可以隨之調(diào)整。如果我們以建立諸如“足夠”和“不足”之類的評(píng)價(jià)詞與特定數(shù)量詞之間的推理關(guān)系為目標(biāo)的話,以下便是旨在做出這類調(diào)整的一個(gè)極簡(jiǎn)方案:

1.表征出系統(tǒng)所要達(dá)成的目標(biāo);

2.估算達(dá)成該目標(biāo)所需的資源數(shù)量,并將其縮寫為RR;

3.估算目前可用的資源數(shù)量,并將其縮寫為RA(這里需要注意的是,有待評(píng)價(jià)的數(shù)字表達(dá)式,通常會(huì)采用RA的形式);

4.估算RA和RR的差值,如果由此算出“系統(tǒng)的剩余資源在達(dá)成當(dāng)前目標(biāo)之后,亦足以用來(lái)執(zhí)行其他任務(wù)”,則將“足夠”這一標(biāo)簽指派給RA,否則,將“不足”這一標(biāo)簽指派給RA。

顯然,要將上述步驟一步步走完,系統(tǒng)就不得不與大量的語(yǔ)境因素打交道,如給定任務(wù)的內(nèi)容、RA的值、RR的值等。因此,只要納思的運(yùn)作能隨著這些語(yǔ)境因素的變化而變化,那么,納思就能夠以一種富有語(yǔ)境敏感性的方式做到“識(shí)數(shù)”。

當(dāng)然,要在工程學(xué)的層面上實(shí)現(xiàn)上述目標(biāo),我們還需要付出很多具體的努力。但本文的概要性論述,已經(jīng)為在通用人工智能系統(tǒng)中如何實(shí)現(xiàn)“人工數(shù)感”,勾勒出了一幅大致的路線圖。

How Can an Artificial General Intelligence System

Acquire “Number Sense”?

XU Yingjin

Abstract: Number sense literally means some form of awareness of what numbers mean to the users of these numbers in their practical lives. Mainstream AI systems(symbolic AI and connectionism included), being digitalized notwithstanding, do lack number sense in the sense that they all lack the capacities of building pragmatic inferential pathways connecting numerical expressions with non-numerical ones in a context-sensitive manner. The tentative realization of a machine-based number sense will appeal to the Non-Axiomatic Reasoning System(or “NARS”, the adjective form of which is “Narsian”), and it is different from mainstream. AI systems in the sense that it has capacities for learning from its experience, and for delivering its solutions to the given problems even when it is working with insufficient knowledge and limited time budget. The guiding principle for training NARS to acquire number sense is to teach it the least abstract mathematical notions first, then move to more abstract ones step by step, just like how we teach children mathematics. The Narsian representation of the “l(fā)ogical proper names” plays a pivotal role in this machine-oriented pedagogy.

Key words: number sense; intuition; Artificial General Intelligence(AGI); Non-Axiomatic Reasoning System(NARS); logical proper names

(責(zé)任編輯:蘇建軍)

猜你喜歡
數(shù)感
小學(xué)數(shù)學(xué)學(xué)習(xí)數(shù)感培養(yǎng)策略研究
淺談構(gòu)建數(shù)學(xué)模型,建立千以內(nèi)數(shù)的數(shù)感
小學(xué)數(shù)學(xué)教學(xué)如何培養(yǎng)學(xué)生數(shù)感
培養(yǎng)數(shù)感,使學(xué)生感受數(shù)學(xué)的力量
情境中建立應(yīng)用中發(fā)展
探究初中生數(shù)感的培養(yǎng)
巧估算 妙解題
培養(yǎng)低年級(jí)學(xué)生“數(shù)感”的探索
武宣县| 桃江县| 五台县| 鸡西市| 道真| 石泉县| 会东县| 霍邱县| 米易县| 赞皇县| 汝南县| 重庆市| 托克托县| 长沙县| 四川省| 视频| 射阳县| 莒南县| 浦县| 丘北县| 平南县| 湘潭市| 淮安市| 出国| 化州市| 无锡市| 白银市| 仁寿县| 岳西县| 湟源县| 普宁市| 寿阳县| 嘉义市| 九寨沟县| 广东省| 涞源县| 平邑县| 淳化县| 车致| 察雅县| 平罗县|