魏屹東
(山西大學(xué) 哲學(xué)學(xué)院,山西 太原 030006)
語境(context),也稱脈絡(luò)、背景、環(huán)境、上下文,幾乎影響著動物、人類和計算機系統(tǒng)行為的方方面面。它不僅影響我們?nèi)绾卫斫馐澜纭⑷绾闻c他人交流、如何計劃和執(zhí)行我們的行動,也影響著計算機、人工智能以及認知科學(xué)的研究策略,特別是計算機和人工智能能夠針對其所處情境和用戶采取適當(dāng)?shù)男袆臃绞?。在科學(xué)哲學(xué)領(lǐng)域,20世紀80年代開始的“語境化運動”,不僅給出了現(xiàn)象域和世界之間的指稱關(guān)聯(lián),而且給出了語言中內(nèi)在關(guān)聯(lián)的意義,從而超越了符號和指稱物之間的關(guān)聯(lián),走向了對符號使用者內(nèi)在心理意向狀態(tài)的分析[1]。這種從外在到內(nèi)在的“語境化運動”使語境在語形、語義、語用和認知上得到了統(tǒng)一,闡明了語境是有界的、相對的并決定研究對象的意義。
然而,在人工智能、機器人學(xué)和工程學(xué)領(lǐng)域,語境似乎是一個可有可無的概念,使用語境建模和推理要晚得多,比如“建模與使用語境”國際會議從1997年到2019年已召開11屆[2],但近幾年似乎銷聲匿跡了。通過研讀“建模和使用語境”歷屆國際會議文集和相關(guān)文獻,可以發(fā)現(xiàn),這些領(lǐng)域并沒有關(guān)注哲學(xué)中作為世界觀或世界假設(shè)的“語境論”,也很少注意到科學(xué)哲學(xué)中的“科學(xué)語境論”。這是一個很大的遺憾。它表明哲學(xué)與科學(xué)技術(shù)學(xué)科之間仍存在壁壘,需要強化交叉和溝通。筆者一直主張,人的世界是語境化的世界,居于其中的任何人,以及由人類創(chuàng)造的一切知識體系,無論是人文的、社會的、數(shù)學(xué)的、邏輯的,還是科學(xué)的、技術(shù)的、工程的,甚至是人工智能和機器人學(xué),都離不開語境。我們對世界、人類社會和文化的理解、解釋和說明,均是基于語境的。人工智能要得到很好的解釋和通用,即建構(gòu)通用人工智能(Artificial General Intelligence,AGI),語境是不可或缺的,需要對人工智能進行語境建模。不過,本文的重點不是建構(gòu)一個人工智能的語境模型,而是要闡明人工智能中語境的意義,語境中的人工智能如何工作,以及多智能體系統(tǒng)中的語境建模及其語境變換問題。
在哲學(xué)和語言學(xué)中,語境是人們非常熟悉的一個概念。在邏輯學(xué)中,弗雷格的語境原則也被廣泛地運用。人的世界,是語境化的世界。人工智能世界是人創(chuàng)造的世界,因而也一定是語境化的世界?;谶@種認識,人工智能的自主學(xué)習(xí)在增強智能的方法上,都在自覺或不自覺地運用語境,比如語境建模和語境推理[3]。事實上,人工智能中常用的“if-then-else”算法規(guī)則,其中的“if”就是語境條件。還有基于案例的推理、基于知識的推理、基于樣本和經(jīng)驗的機器學(xué)習(xí)、貝葉斯網(wǎng)和語義網(wǎng)絡(luò)的知識表征等,無不凸顯了語境條件——案例、知識、樣本和經(jīng)驗、范疇結(jié)構(gòu)等。這里的語境既有靜態(tài)方面(已有知識、常識經(jīng)驗),也有動態(tài)方面(當(dāng)前情境中的感知、決策和行動),比如語境-覺知、樹型搜索??傊?推理過程中的前提條件、臨時預(yù)設(shè)以及經(jīng)驗啟示,均是語境因素。自然語言處理方面遇到的“常識問題”,實質(zhì)上是“語境問題”,因為人有常識(成長中習(xí)得的),而機器沒有(缺乏成長過程)。
然而問題在于,人的語境化能力能夠嵌入人工智能嗎?即便可以,計算機科學(xué)和人工智能中的“語境”究竟指的是什么?語境的多義性使人們普遍擔(dān)心,相對模糊的語境概念恐怕很難運用于人工智能領(lǐng)域,正如鮑曼(R.Bauman)和布里格斯(C.L.Briggs)指出的,“所有關(guān)于語境的定義都具有明顯的包容性,我們無法知道語境因素的范圍何時被充分涵蓋。因此,描述一個性能>語境<這一看似簡單的任務(wù)可能會成為無限的倒退”[4]。這就是語境的模糊性和相對性問題。這種擔(dān)憂其實沒有必要,因為關(guān)于語境是什么的問題在哲學(xué)上完全可以澄清。
在計算范式下,關(guān)于語境的一個普遍認可的定義是:“語境是可用于描述實體情況的任何信息。實體被認為是與用戶和應(yīng)用程序之間的交互相關(guān)的人、地點或?qū)ο?包括用戶和應(yīng)用程序本身?!盵5]而按照巴齊爾(M.Bazire)和布雷齊隆(P.Brézillon)的說法,“語境可用于表征和解釋用戶在特定時間與應(yīng)用交互情境的任何信息”[6]。這是將語境視為信息,即任何與所描述的實體相關(guān)的信息都是語境因素。然而,信息本身是缺乏語義的,語義需要語境來限定,而“語境是一個限制解決問題的步驟而又不明確干預(yù)它的東西”[7],類似于化學(xué)反應(yīng)中的催化劑(加速反應(yīng)而又不參與其中)。這意味著,語境的作用類似于一組先定約束,它們對嵌入在給定任務(wù)中的系統(tǒng)(用戶、計算機或機器人)的行為產(chǎn)生影響。形式地看,一個語境信息系統(tǒng)可描述為:Γ=(U,A,V,C)[8],其中U是一組對象的集合,A是一組屬性的集合,V是一組屬性值的集合,C是一組語境的集合。每個屬性a∈A被定義為從U×C到V的映射,可形式化表達為:a(u,c)=v,表示與對象u關(guān)聯(lián)的屬性a在語境c中具有v值?;蛘哒f,對象u在語境c∈C中由信息Inf(u,c)表示的信息集可用Inf(u,c)={[a,a(u,c)]|a∈A}來定義,語境c中對象u的信息集是u的所有屬性以及它們在語境c中獲取的值的集合。
這里是用數(shù)學(xué)工具“集合”來刻畫語境的結(jié)構(gòu)。筆者也曾將語境分為文本語境、實踐語境和認知語境三類,認為語境不是定性的、模糊的,而是可表征計算的、結(jié)構(gòu)清晰的,具有可表征性、可計算性和可變換性:“可表征性是指語境的構(gòu)成要素是有限的,可通過某種形式表達出來??捎嬎阈允侵刚Z境的這些要素可通過算法(或步驟)獲得數(shù)值或非數(shù)值的結(jié)果??勺儞Q性是指語境是發(fā)展變化的,語境的變換導(dǎo)致意義的變化?!盵9]認知語境的表征與計算模型可用集合表示為:Ce=(A,O,I,M),其中A表示認知者,O表示認知對象,I表示儀器,M表示方法。就認知活動本身而言,它由認知者和認知對象構(gòu)成,儀器和方法是中介。其含義是,認知者A使用方法M,并利用儀器I探測對象O,產(chǎn)生了知識K,表示為映射:F:(O)→K。在人工智能中,認知者A指非人的智能體(agent),O是其要實現(xiàn)的目標,I是其算法或程序,M是其實現(xiàn)的路徑、策略或框架。這樣一來,這個定義也可用于人工智能中的語境刻畫或表征(這是另一個問題,這里不展開)。
巴齊爾和布雷齊隆試圖通過回答以下問題來指定給定情境的語境:誰?什么?在哪里?何時?為什么?如何?其中“誰”代表主體,即行動者;“什么”代表對象,即動作的作用對象;“在哪里”和“何時”提供所關(guān)涉動作的時空位置信息;“為什么”給出了主體的意圖、目標(甚至情感);“如何”明確了實現(xiàn)動作所需的程序。這是一個六元素語境集:C={Who,What,Where,When,Why,How}(5W+H)。也就是說,語境可以用來描述實體情況的任何信息。更一般地說,用于描述這種語境信息的要素可歸結(jié)為五類:個體性、活動、位置、時間和關(guān)系,其中個體性即實體(主體),活動決定了語境元素在特定情況下的相關(guān)性,而位置和時間則主要驅(qū)動實體間關(guān)系的建立,并使實體間的語境信息得以交換[10]。
可以看出,語境作為一個抽象概念或一個不變量,與背景、環(huán)境、情境密切相關(guān),也與物理學(xué)中的“場”(field)、人工智能中的“域”(domain)等概念相關(guān)。詹金斯(R.Jenkins)認為,“場是一個重要的中介環(huán)境,在這里,外部因素——不斷變化的環(huán)境——對個人實踐和機構(gòu)產(chǎn)生影響。場的邏輯、政治和結(jié)構(gòu)塑造并引導(dǎo)著‘外部決定’影響場內(nèi)事情的發(fā)生方式,使它們成為場本身正在進行的歷史和運作的一部分”[11]。比如多智能體系統(tǒng),它是語境敏感的。語境通常與“域”概念互用,而“域”代表一個可能世界,其中包括各種研究、開發(fā)過程和分析??赡苁澜缇褪翘摂M現(xiàn)實世界。語境的關(guān)鍵是要決定語義或內(nèi)容,也就是要讓人工智能的字符串產(chǎn)生意義。這個過程必然涉及客體(實體)、問題及其語義。正是在這個意義上,語境概念顯得更為適用和準確。
總之,語境是多因素組成的系統(tǒng)或集合,一般包括物理(環(huán)境)、認知(知識)、語言(內(nèi)容)、社會(實體交互關(guān)系)、文化(共有信念)和情感(內(nèi)在心理狀態(tài))維度[12]。梅納(T.B.Mena)等人提出了一個概括性的三元組語境模型:語境{領(lǐng)域,實體,問題},試圖來囊括這些因素。但顯然這還不夠。如果將語境所涉及的元素組成一個集合,那應(yīng)該是:語境{情境,客體,問題,語義},其含義是:一個當(dāng)前情境(或領(lǐng)域)中的客體和問題的解決或解釋(意義)發(fā)生在特定語境中?;蛘哒f,語境是為了解決問題而存在的,而問題往往是一個命題或陳述的疑問句,比如“人工智能有智能嗎?”(“人工智能有智能”的疑問句)。在復(fù)雜系統(tǒng)中,語境有多個,構(gòu)成一個語境子集,而其中的各個元素也是一個子集。這種復(fù)雜系統(tǒng)的語境建模,通常使用集合及其映射來表征。
相較于人工智能,認知科學(xué)對語境更為重視。在認知科學(xué)中,語境一般被理解并定義為在特定場合影響人類(或認知系統(tǒng))行為的所有實體的集合。這種語境模型假設(shè)了當(dāng)前語境中涉及的心理表征,認為語境至少是由感知、記憶和推理三個過程之間的相互作用形成的[13]——構(gòu)建當(dāng)前環(huán)境新表征的感知、重新激活或構(gòu)建以往經(jīng)驗表征的記憶,以及構(gòu)建生成目標、推斷事實、誘導(dǎo)規(guī)則等的表征的推理;而且假設(shè)了語境反過來會影響感知、記憶和推理過程。這種語境動態(tài)理論的主要原則是:語境是一種心理狀態(tài),沒有明確的界限,由所有關(guān)聯(lián)的相關(guān)元素組成,并且是動態(tài)的。這種語境觀并不新鮮,它源于社會科學(xué)。在社會科學(xué)中,語境通常被視為相互作用的實體(人、代理和人工制品)的網(wǎng)絡(luò),比如知識社會學(xué)中的行動者網(wǎng)絡(luò)理論(1)科學(xué)社會學(xué)中的“科學(xué)共同體”,科學(xué)知識社會學(xué)中的“行動者網(wǎng)絡(luò)”,都將某個松散的、無形的“社會團體或組織”視為行動者(主體)的背景或環(huán)境,這些背景或環(huán)境就是“語境”,所以,“語境”在哲學(xué)上得到了認識論的提升和方法論的擴張。參見:魏屹東.科學(xué)社會學(xué)新論[M].北京:科學(xué)出版社,2009:7-10.。這種方法側(cè)重于實體之間反復(fù)相互作用所產(chǎn)生的語境的結(jié)構(gòu)屬性,包括網(wǎng)絡(luò)元素和涌現(xiàn)屬性。事實上,人工智能中的范疇網(wǎng)、貝葉斯網(wǎng)、多智能體系統(tǒng)都將語境視為網(wǎng)絡(luò)結(jié)構(gòu)。
在記憶模型中,傳統(tǒng)認知主義假設(shè)記憶作為語境,是存儲的記號、圖像或信號。而根據(jù)哲學(xué)和認知科學(xué)中的后認知主義理論(具身認知科學(xué)),記憶作為語境不能被視為有意義的圖形、噪聲或信號,因為在記憶科學(xué)中該假設(shè)作為框架將人類認知系統(tǒng)描述為一個無維的執(zhí)行控制單元,接收和轉(zhuǎn)換來自環(huán)境輸入的信號[14]。因此,傳統(tǒng)認知主義的記憶存儲假設(shè)遭到了尖銳的批評。這意味著,語境在當(dāng)代記憶模型中所扮演的角色充滿了內(nèi)部和外部的不一致。所以,將內(nèi)存的“語境”視為可通過類似計算過程的轉(zhuǎn)換、存儲的離散項是行不通的?;蛘哒f,將記憶的語境視為不影響記憶過程的存儲刺激,并沒有獲得更好的效果。盡管記憶模型的許多元素都表現(xiàn)出經(jīng)驗傾向,且這些傾向只是不完全適合這些模型的編碼-存儲-檢索框架,但語境的確是一個不可忽視的重要問題。所以,具身認知科學(xué)的一個標志是拒絕計算啟發(fā)的建模方法,而建模方法似乎正是這個問題的框架。在大多數(shù)情況下,記憶科學(xué)家需要根據(jù)從大量記憶案例中提取的數(shù)據(jù)來構(gòu)建動態(tài)模型。在這樣的動態(tài)模型中,語境既不是刺激,也不是識別刺激的不起眼的背景,而是一種軟組裝框架,即數(shù)據(jù)集合包。
在當(dāng)代學(xué)習(xí)理論中,語境通常被理解為實驗設(shè)備所提供的背景刺激,比如心理學(xué)實驗的斯金納箱(Skinner box)。這種理解或定義類似于關(guān)于人類記憶的研究文獻中使用的定義,其中語境被定義為由實驗線索提供的刺激,如斯金納箱提供的食物線索。這意味著在任何情況下,語境都是一個相對持續(xù)的刺激,它圍繞或嵌入了要學(xué)習(xí)或記住的目標刺激,無論它們是條件刺激還是判別性刺激,抑或是列表中的項[15]。這種探索允許被試存儲語境的整合表征,一旦形成整合表征,探索過程就會減少。這種情境表征對于情境恐懼條件反射也是必要的,因此在電擊傳遞之前,必須給被試(動物)足夠的時間來探索其所處空間的情形[16]。
在兒童發(fā)育方面,語境實際上指的是兒童環(huán)境中相應(yīng)的長期變化[17]。這些變化主要是指隨時間推移的相關(guān)性模式,即一個人的生活軌跡(歷史記憶),而不是可識別的實體。也就是說,發(fā)育是指貫穿整個生命周期的人際環(huán)境組裝。在這里,語境不再被視為可使人處于愉悅狀態(tài)的自變量或環(huán)境,而是指兒童成長過程的歷史或教育背景。
然而問題在于,我們需要說明一個實體(人或智能體)如何工作才能完成其任務(wù)。這就要回答以下問題[18]:哪些角色扮演實體X?X如何執(zhí)行活動Y?在何種語境中X如何與Y交互?哪些事件觸發(fā)X的功能?X如何協(xié)調(diào)活動或管理資源?X如何協(xié)調(diào)自身?在特定時間間隔內(nèi),X扮演什么角色?執(zhí)行哪些活動?使用哪些資源?與哪些實體交互?哪些承諾正在處理?這一系列問題是人際交往和多智能體交互過程中必然會遇到的。
回答這些問題勢必需要一個多實體交互的整合架構(gòu)。在認知建模中,架構(gòu)被用來解決多主體的復(fù)雜性問題。斯洛曼(A.Sloman)認為,認知架構(gòu)有三個基本部分[19]:感知(智能體)框、行動(智能)框和連接這兩個框的內(nèi)部層(中間層)。內(nèi)部層又包括反應(yīng)層(通過感應(yīng)器)、協(xié)商層(多智能體交互)和反映層(反饋循環(huán))。內(nèi)部層的反應(yīng)機制定義了智能體的前限定行為;協(xié)商機制與計劃相對應(yīng),調(diào)節(jié)和決策相對應(yīng);反映機制顯示了主體變化前幾層行為的能力。行動層、決策層和反映層之間存在復(fù)雜的相互作用,它們本質(zhì)上是心理模型的物理實現(xiàn),因為“心理模型是人類能夠生成系統(tǒng)目的和形式描述、系統(tǒng)功能和觀察到的系統(tǒng)狀態(tài)解釋以及未來系統(tǒng)狀態(tài)預(yù)測的機制”[20]。
那么,認知或智能的實現(xiàn)為什么要使用語境呢?原因在于,人類記憶系統(tǒng)的排列方式便于使用語境來增強編碼和檢索。瓦格納(A.D.Wagner)等人使用fMRI掃描證明,在神經(jīng)學(xué)水平上記憶存在語境依賴性,因為大腦不同區(qū)域是否被激活,具體取決于被試是否熟悉語境[21]。換句話說,被試的大腦區(qū)域能否被激活,依賴于被試早先是否有某方面的經(jīng)歷或知識。比如問被試是否知道“地球是圓的”,若被試沒有這方面的知識,相關(guān)腦區(qū)就不會激活,因為被試對此問題沒有任何記憶反應(yīng)。這表明基于語境的編碼和檢索過程極大地影響了人類的認知行為,包括感知、傾向、學(xué)習(xí)和認知。我們使用語境形成的關(guān)聯(lián)指導(dǎo)我們?nèi)绾斡涀⌒畔⒁约笆裁辞闆r會觸發(fā)其檢索。這基于語境的推理,人類的記憶和推理均是與語境相關(guān)的。[22]所以,學(xué)習(xí)(人或機器)本質(zhì)上是一個語境化(解決問題、決策和評估)、去語境化(總結(jié)經(jīng)驗、績效評估)和再語境化(利用經(jīng)驗教訓(xùn))的過程。
概言之,語境作為要探索的實體或問題的基底,具有整合性。因此,語境是一組聯(lián)結(jié),聯(lián)結(jié)具有狀態(tài),其相關(guān)性由知識引導(dǎo),而且語境是有界的和有影響的,不能無限倒退。如果語境與用戶或設(shè)備的歷史無關(guān),只與特定情況(如位置)相關(guān)(如辦公室的電腦),那么它就是一種絕對語境。如果語境與用戶或設(shè)備的歷史記錄數(shù)據(jù)相關(guān)(如電腦的出廠參數(shù)),而與其所處位置無關(guān),那么它就是一種相對語境。因此,語境也具有絕對性和相對性。
人造的智能應(yīng)該是特定語境中的。人工智能、機器人學(xué)、虛擬實現(xiàn)技術(shù)都是計算機語境中的領(lǐng)域或系統(tǒng)。語境的作用在這些領(lǐng)域中是不言而喻的。比如,一種基于語境的操作決策支持方法[23]側(cè)重于建模和解決動態(tài)環(huán)境變化的問題。問題由抽象和操作語境建模,語境整合了信息源和領(lǐng)域知識提供的信息。這種方法涉及用于知識集成的范疇管理操作、信息組織的語境管理技術(shù),以及問題定義和面向?qū)ο蟮募s束網(wǎng)絡(luò)機制,其具體應(yīng)用是針對即時便攜式醫(yī)院配置的自適應(yīng)服務(wù)。
在經(jīng)典計算機科學(xué)中,語境一般被視為一種狀態(tài),它操作系統(tǒng)維護表(table)的實現(xiàn)目標,這些表具有所有進程的條目。條目包含相關(guān)進程狀態(tài)(正在運行、阻塞或等待)、程序計數(shù)器、堆棧指針、內(nèi)存分配、打開文件的狀態(tài),以及當(dāng)進程從運行狀態(tài)切換回就緒或阻塞狀態(tài)時,必須保存的所有內(nèi)容信息,以便之后重新啟用此條目。
在人工智能中,語境通常被視為與某些特定情況(環(huán)境、領(lǐng)域、任務(wù)、智能體、交互、對話等)相關(guān)的事物(句子、命題、假設(shè)、屬性、程序、規(guī)則、事實、概念、約束、句子等)的集合,即概念的范疇。這就是語境的“盒子隱喻”[24]——語境被視為一個容器或框架,其內(nèi)容取決于一組情境參數(shù)或維度。根據(jù)“盒子隱喻”,語境建模在人工智能中的使用主要體現(xiàn)在三方面:
第一,目標導(dǎo)向的表征和自然語言處理。這方面的一個突出例子是環(huán)境智能系統(tǒng)(Ambient Intelligent Systems),該系統(tǒng)是通過感知和推理其環(huán)境來感知語境的,它們感知用戶的需求并通過語境敏感來主動響應(yīng)這些需求[25]。語境感知是指智能體嘗試檢測系統(tǒng)處于哪種情境,語境敏感是說智能體根據(jù)系統(tǒng)認為它所處的情境而采取行動。這是一種語境依賴(2)表征(尤其是語言表征)是一種語境依賴的推理過程,這種語境依賴表征一般是在三個基本維度——部分性、近似性和透視性——上運行的。部分性是說,當(dāng)一個表征僅描述更全面的事態(tài)的子集時,表征是部分的,無論在形而上學(xué)上還是在認知上;近似性是說,當(dāng)一個表征提煉出給定事態(tài)的某些方面時,它是近似的,可用二進制謂詞(x,y)近似表征,這是最小表征。透視性是說,當(dāng)一個表征對事態(tài)進行時空、邏輯或認知觀編碼時,表征是透視的。參見:BENERECETTI M,BOUQUET P,GHIDINI C.On the dimensions of context dependence:partiality, approximation, and perspective[A]∥AKMAN V,BOUQUET P,THOMASON R H,YOUNG R A. Context 2001[C].Berlin Heidelberg:Spring-Verlag,2001:59-72.的適應(yīng),即僅在滿足相關(guān)語境條件時才適應(yīng)軟件系統(tǒng)子部分的行為。因此,語境建模的過程就是適應(yīng)性表征過程。也就是說,行為細化的一些基本行為,僅在特定語境條件下適用,比如軟件系統(tǒng)本身根據(jù)語境條件、多重性和解決策略,對基本行為和語境適應(yīng)的組成部分做出自主決策。還有,語境導(dǎo)向的域分析(Context-Oriented Domain Analysis,簡稱CODA)也是典型的語境依賴和語境適應(yīng)的[26],旨在弄清域的潛在相關(guān)因素。
第二,語義網(wǎng)絡(luò)系統(tǒng)。語義網(wǎng)絡(luò)作為一種圖結(jié)構(gòu),以互連節(jié)點和弧模式表征知識[27],它是一種將語言處理的表征系統(tǒng)概念化的簡潔而優(yōu)雅的方式。語義網(wǎng)絡(luò)強調(diào)語言處理中語境關(guān)聯(lián)的有效性,這顯然是一種語境依賴的系統(tǒng),非常適合轉(zhuǎn)化為人工智能系統(tǒng)。實際上,人工智能本身就是一個更大的語義網(wǎng)絡(luò)。這種結(jié)構(gòu)以圖形法表征知識,與認知語義網(wǎng)絡(luò)的概念結(jié)構(gòu)非常相似。這種方法連接知識中的相關(guān)概念,不僅可用于表征概念和知識本身,還可用作其他知識表征系統(tǒng)的支持功能。而且,語義網(wǎng)絡(luò)有不同的子類型,適合不同的概念關(guān)系如定義性、斷言性和暗示性的分析。這些結(jié)構(gòu)分別用于評估超型-亞型的關(guān)系,斷言概念關(guān)系的命題,以及表征因果關(guān)系或推理的模式。這種多樣性在語境依賴的語言處理中非常有用,因為語義網(wǎng)絡(luò)可以有效地與其他語言系統(tǒng)協(xié)同工作,以評估語言輸入的語境連接性。
第三,隱馬爾可夫模型。人類的情境推理是一個語境建模過程,即個人使用語言語境來突顯相關(guān)信息,以便從人們聽到的無數(shù)短語中盡可能捕捉意義,這突出了大腦對語境系統(tǒng)的需求。例如,人工智能中的隱馬爾可夫模型使用語境來幫助語音識別,以縮小語句的可能選項數(shù)量[28]。但隱馬爾可夫系統(tǒng)必須首先通過給出正確、理性的句子來訓(xùn)練,以便構(gòu)建一個能夠運行的概率模型;然后它可以在某種情況下使用此模型來預(yù)測序列中的下一個單詞。這對于自然語言處理非常有利,因為它依據(jù)之前遇到的情況使用其概率模型,從整個詞匯表來解析詞語系列中下一個可能的單詞。ChatGPT的運作機制就是這樣,只是后者增加了自注意力機制,語境推理能力更強了。
不過,需要注意的是,在語境感知系統(tǒng)和軟件工程中,人們所考慮的語境往往是隱藏的,有些將語境集成到需求分析層次,有些則集成到概念層次,如范疇系統(tǒng)。這種語境工程是人工智能軟件工程的一個分支,它處理對語境敏感的系統(tǒng)的設(shè)計、開發(fā)和制造,同時處理硬件和軟件。也就是說,語境工程允許構(gòu)建基于內(nèi)容的系統(tǒng),該系統(tǒng)具有動態(tài)推理和知識表征的功能。筆者設(shè)想,如果將文化作為語境來建模,就可將文化因素嵌入人工智能這種物理系統(tǒng),從而實現(xiàn)人工“認知智能”(即通用人工智能)的理念。
人工智能中的多智能體系統(tǒng)(Multi-Agent System,簡稱MAS)是一組交互的智能代理,旨在執(zhí)行一組目標。費伯(J.Ferber)給出了智能體的經(jīng)典定義:“智能體可以是物理或虛擬實體,可以采取行動,(部分地)感知其環(huán)境并與他人交流,是自主的,并且具有實現(xiàn)其目標和趨勢的技能?!盵29]筆者認為此定義突顯了智能體的四個基本屬性:
(1)自主性,即智能體是唯一控制自己行為的實體。這意味著行動與否的選擇僅由它自己的行為驅(qū)動。
(2)感知性,即智能體能夠局部感知信息并在局部采取行動的環(huán)境(實際的或虛擬的)中進化,此環(huán)境是智能體外部的所有目標或內(nèi)容,充當(dāng)交互媒介,可由智能體感知。
(3)交互性,即智能體能夠直接或通過環(huán)境與其他智能體進行交互或通信,其他智能體是人工環(huán)境的一部分。
(4)認知性,即智能體對其環(huán)境有部分了解,并擁有自己的資源和技能。
根據(jù)此定義,智能體就是一個“感知-決策-行動”系統(tǒng)。感知是從環(huán)境獲得信息,決策是選擇行動,行動是選擇結(jié)果的運用。這種MAS通常在適應(yīng)性方面具有特別的功能,即智能體可以改變自己的行為以及與其他智能體及其環(huán)境的關(guān)系,而且整個MAS可以刪除或添加新的智能體。
顯然,MAS的這種靈活性使其能夠高效地應(yīng)對不確定環(huán)境。MAS之所以具有這種類人的能力,是因為MAS中針對問題做決策的智能體通常需要一個語境來進行推理和決策,進而產(chǎn)生我們可以理解的行動(意義)。這意味著,在表征的層次上,任何問題的命題或陳述都是有其語境的,由于人工智能本質(zhì)上是解決問題的,因而是語境敏感和語境依賴的。因此,語境建模對于人工智能是必要的,比如一個自適應(yīng)語境學(xué)習(xí)模式由一個開發(fā)機制和一個適應(yīng)機制構(gòu)成,二者都與環(huán)境相互作用,通過感知與行動構(gòu)成一個反饋循環(huán)[30]。這種語境學(xué)習(xí)的多智能體AMASCL(Adaptive Multi-Agent Systems for Context Learning)通過使用智能體的合作自組織實現(xiàn)了這種適應(yīng)性。研究表明,通過最大限度地減少對所研究系統(tǒng)的假設(shè),該方法可用于各種復(fù)雜的現(xiàn)實世界問題,如復(fù)雜系統(tǒng)控制、機器人或環(huán)境系統(tǒng)。通過使用此方法,用戶在設(shè)備上執(zhí)行的每個操作都被視為反饋,用戶不僅反饋了當(dāng)前的設(shè)備行為能否滿足需求,而且還提供了足夠的動作來執(zhí)行。比如適應(yīng)性多智能體系統(tǒng)(Adaptive Multi-Agent System,簡稱AMAS),通過實驗實現(xiàn)的適應(yīng)性學(xué)習(xí)器(Adaptive Learner by Experiments,簡稱ALEX),就運用基于演示學(xué)習(xí)(Learning from Demonstration)的方法來應(yīng)對這一挑戰(zhàn)[31]。基于演示的學(xué)習(xí)方法可將演示期間觀察到的內(nèi)容推廣到類似人類的情況,使其與系統(tǒng)的交互盡可能自然。也就是說,AMAS通過ALEX能夠動態(tài)學(xué)習(xí)和重用指導(dǎo)者執(zhí)行的語境,而且每個ALEX創(chuàng)建并自組織其語境智能體,以共同產(chǎn)生用戶滿意的行為。實驗表明,兩個ALEX實例可以在沒有直接交互的情況下進行協(xié)作。這樣的過程可通過添加與每個信號相關(guān)的感知智能體來完成,這些智能體將負責(zé)了解它們對語境智能體的效用并與之合作。
當(dāng)然,就像人有自己的目標或需求一樣,單個智能體也可能是“自私的”,有自己的目標或需求。這種“自私”需求可能與某些全局目標一致,也可能不一致。而MAS必須奉行合作原則,在這種合作系統(tǒng)中,每個智能體努力實現(xiàn)共同目標,以克服單個智能體的“自私性”。因此,多智能體系統(tǒng)是一種“集體合作”行為體,其中適合語境行為對于MAS中的智能體格外重要,即MAS作為一個整體行為必須適合其語境。這意味著MAS的適合語境行為比單個智能體行為適合其語境更加困難。單個智能體的語境總是包括其他智能體,而其他智能體在某種程度上可能是不確定和不可預(yù)測的,并且它們本身的行為方式也受其自身語境的影響。所以,單個智能體也有機會從其他智能體那里獲得信息,以更好地了解它們的語境,但代價是增加了復(fù)雜性、工作量和時間。
合作性要求MAS必須是開放的。這就是開放式多智能體系統(tǒng)(Open Multi-Agent System,簡稱OMAS),其中智能體是自由移動的,并且可能不受同一實體的控制。然而,OMAS的信任決策可能由于一些因素而變得困難。比如“自私的”智能體(邪惡的智能體)通常具有隱藏的或其他不可預(yù)測的效用函數(shù),因此OMAS需要觀察它們的行為,以檢測其模式可信度。又如,一種基于語境智能體的信任系統(tǒng)使用了明確表征的語境知識來幫助智能體識別和應(yīng)對“自私的”智能體[32]。其具體做法是:智能體使用被稱為語境圖示的已知語境或情境,包括環(huán)境特征、當(dāng)前目標和可能的跡象或線索,選擇一個或多個匹配的語境圖示,實質(zhì)性地標出當(dāng)前語境,然后語境圖示會針對這種情況給出適當(dāng)?shù)牟呗?。這種信任系統(tǒng)中的語境圖示與適用于所表征語境實例的所有情況的策略相關(guān)聯(lián),其中的語境是根據(jù)策略的變化來界定的。這就是MAS的語境化表征或語境建模。比如,語境建模的樹表征可作為MAS——樹作為根隱喻,決策者需要一種可視化表征,將開發(fā)實際所需的所有語境信息聚集在一起,并允許其方便識別每個實際輸出的表征[33]。
為了說明MAS系統(tǒng)如何工作,惠特塞爾(L.Whitsel)和特納(R.M.Turner)提出了一個思想實驗:兩個智能體Z和X組成的OMAS系統(tǒng),其中Z是長期使用的成員。人們對X的行動進行長期觀察,形成了它的歷史語境。將X標記為值得信賴的,從而在處理X時使用了合作策略。在觀察系統(tǒng)中的活動時,人們注意到X受到Z的良好對待,但X對Z進行了不準確的負面聲譽報告,即誹謗Z。該系統(tǒng)中的智能體會對這種情況產(chǎn)生許多假設(shè),諸如“X試圖破壞Z”“Z的聲譽低于應(yīng)有的水平”“X并不像我們想象的那么值得信賴”等。這些假設(shè)一起或單獨使用,能通過語境化識別一個新的語境,并推薦OMAS應(yīng)該使用的新策略。作為語境識別的結(jié)果,OMAS應(yīng)該修改它所持有的信念,以反映關(guān)于X行為影響的新假設(shè)和信念。具體做法是:首先,OMAS可能會添加關(guān)于X和Z關(guān)系的新假設(shè),這將需要提出一個新的持久假設(shè)。其次,OMAS應(yīng)該降低對Z聲譽的信心,因為它懷疑X的誹謗損害了Z的聲譽。由于信念是在每個決策周期開始時重新生成的,因此僅僅更新當(dāng)前周期的事實是不夠的。相反,OMAS的語境化需要修改跟蹤和分析工作知識,以便OMAS做出正確的決策。最后,OMAS應(yīng)該放棄其舊的固有假設(shè),即X是值得信賴的,并通過修改分析做出決策的知識來防止它再次出現(xiàn),如斷言X傾向于誹謗Z。
總之,MAS由自主實體組成,通常被設(shè)計為自治的,其趨勢是減少人為干預(yù),以便在環(huán)境發(fā)生變化時維護系統(tǒng)的某些屬性或活動。這種系統(tǒng)被稱為“自維護”“自修復(fù)”或“自組織”系統(tǒng),當(dāng)然也是一種適應(yīng)性表征系統(tǒng)。這種屬性使得MAS能夠有效地處理非線性、開放性和不確定性的動態(tài)系統(tǒng),如城市交通系統(tǒng)。
鑒于語境概念使用的廣泛性,其語境性(contextuality)必然是一種跨學(xué)科現(xiàn)象[34],即在各個科學(xué)中都可觀察到并使用,特別是在物理學(xué)、語言學(xué)、人工智能和認知科學(xué)領(lǐng)域。
根據(jù)日本學(xué)者丸山(Y.Maruyama)的研究,語境在哲學(xué)上具有本體論、認識論和方法論上的語境性。本體論的語境性是指,主體存在于語境中,其中的實體與環(huán)境密不可分。這種本體論的語境性源于海德格爾的哲學(xué),與情境人工智能、嵌入式-具身人工智能和海德格爾式人工智能有關(guān)。認識論中關(guān)于真理的語境性是說,真理是語境的函數(shù),一個命題在一種情況下可能為真,在另一種情況下可能為假,也就是在不同語境中,命題可能有不同的真值。這種認識論的語境論源于維特根斯坦后期哲學(xué)。方法論的語境性是關(guān)于語言中意義的語境性,即單詞在語境中獲得意義,它們的含義在不同語境中可能不同,語境在意義確定過程中的不可或缺性導(dǎo)致了某種弱奎因式語義整體論(沒有更廣語境就沒有意義)。這實際上是弗雷格“語境原則”(詞的意義由其語境決定)的擴展版。
認知的這種語境性在量子力學(xué)中特別明顯。這就是量子力學(xué)中關(guān)于測量實在的語境性,即量子的測量值及其統(tǒng)計數(shù)據(jù)存在于測量語境中,可能不存在測量值和概率的全局分配。量子力學(xué)中的這種語境性源于貝爾和科亨-施佩克爾的No-Go定理(Bell’s and Kochen-Specker’s No-Go)對經(jīng)典(非局部)實在論的反駁。這就是著名的量子非局域性。這種非局域的語境性意味著在所涉及的不同語境中,所有變量的值或概率分布沒有一致的分配。換句話說,測量值或測量統(tǒng)計數(shù)據(jù)基本上取決于特定的測量語境。我們可以在每個語境中測量每個變量,但當(dāng)組合在一起時,由此獲得的結(jié)果作為一個整體并不一致。因此,量子力學(xué)中的真值是語境依賴的,即物理命題的真值只存在于特定的測量語境中。
量子測量的語境性可能導(dǎo)致認知在量子力學(xué)中的體現(xiàn),即導(dǎo)致量子認知科學(xué)的產(chǎn)生(3)量子認知科學(xué)的出現(xiàn)意味著:如果物理學(xué)和認知科學(xué)都存在共同的結(jié)構(gòu)機制,它將為克服物質(zhì)和心智的笛卡爾二元論鋪平道路,就像查爾默斯的屬性二元論或信息的雙面理論旨在闡明控制物質(zhì)和認知的實在規(guī)律信息的高級結(jié)構(gòu)定律一樣。它最終可能導(dǎo)致查爾默斯屬性二元論或信息雙面理論的科學(xué)合理化。適應(yīng)性表征作為一個概念框架,試圖將物理科學(xué)和認知科學(xué)統(tǒng)一起來,量子認知科學(xué)若成立,也一定是適應(yīng)性表征系統(tǒng)。。我們知道,在認知科學(xué)中,語境性在理性上非常突出,即認知行為是語境的函數(shù)(與語境共變)。因此,一個問題在不同語境中可能有不同的答案,現(xiàn)實世界中共存的信息和環(huán)境噪音等情境效應(yīng)可能會影響或改變認知決策的結(jié)果。這意味著,認知和智能不是存在于真空中的,它們是嵌入的、具身的和情境化的。如果說認知的語境性是由行動者集體狀態(tài)動態(tài)的統(tǒng)計性和實驗設(shè)置的特殊結(jié)構(gòu)引起的,那么量子的語境性就是由其單態(tài)動力學(xué)的統(tǒng)計性和特殊狀態(tài)或操作的存在引起的。語境性可能是溝通物理系統(tǒng)和認知系統(tǒng)的橋梁,因為語境性具有強烈的適應(yīng)性表征特征,或者說,適應(yīng)性表征本身就是基于語境的。
然而,有一個問題需要澄清,那就是組合性和語境性之間的區(qū)別[35]。在哲學(xué)和社會科學(xué)中,實體的語境性較為突出,而在認知科學(xué)和人工智能中,組合性較為突出,尤其是人工智能的知識表征,其表現(xiàn)出的智能更多是行為的組合(模塊化、積木組合)。丸山將實體在不同領(lǐng)域或?qū)W科表現(xiàn)出的這兩種特征概括為組合性原則和語境性原則。
組合性原則:整體(表達)的意義是其各部分的含義(以及它們組合在一起的語法方式)的功能,并完全由其決定。這基本上是原子論觀念。原子表達式的含義遞歸生成更復(fù)雜的表達式的含義。在人工智能中,組合性被認為是語言生產(chǎn)力、系統(tǒng)性和學(xué)習(xí)性的來源,如明斯基(M.Minsky)的《心智社會》所描述的那樣。由于組合性,我們可以系統(tǒng)地創(chuàng)建新的表達方式,因此我們可以說,人工智能的知識表征主要是基于組合性的。
語境性原則:單詞(或更復(fù)雜的表達)的含義是語境的函數(shù),并且只能在語境中確定;部分的意義取決于圍繞它們的更大整體。這基本上是關(guān)于意義的整體論??虻恼w論可被認為是一種強語境論形式。在原子論中,部分先于整體,整體是次要的;而在整體論中,部分只作為整體的一部分存在。
可以看出,組合性原則給出了形式語言學(xué)、符號邏輯和編程語言理論中占主導(dǎo)地位的語義學(xué)范式。相比而言,語境性原則似乎顯得微不足道。二者之間貌似存在著不可調(diào)和的矛盾。在我看來,二者的矛盾可通過適應(yīng)性表征來消除。因為認知的組合性和語境性都具有目標導(dǎo)向的適應(yīng)性和表征性,它們是適應(yīng)性表征這枚“硬幣”的兩面?;蛘哒f,實體的組合需要語境作為介導(dǎo),因為實體的范疇是語境化的。簡言之,凡是需要使用語言描述的對象或目標,不管它們是組合性的還是語境性的,都離不開語境。因此,系統(tǒng)或?qū)嶓w的語境性蘊含了其組合性。
機器人的語境感知建模就是一個典型例子[36]。在這個例子中,情境化的語義智能體在計算機系統(tǒng)中體現(xiàn)了上述兩個原則的統(tǒng)一。這可通過沃森(P.Vossen)等人設(shè)想的一個社交機器人L的行為來說明。假設(shè)L具有認知能力和溝通技巧,以支持其社交行為。打開電源后,L會掃描環(huán)境中的對象和人員,并將它們與新的實例化語境相關(guān)聯(lián)。接下來,L嘗試通過推理以前的語境或詢問可用的來源來確定其位置。在遇到人時,L嘗試辨別是第一次見到此人,還是過去已經(jīng)認識。在這種情況下,一個認識序列就被初始化了。隨后,L通過提問或陳述來等待與此人發(fā)起對話。這個過程意味著讓機器人處于某個語境中,就像人的語境化一樣。沃森等人還定義了機器人L的四個層次:傳感器處理層、響應(yīng)傳感器輸入或內(nèi)部驅(qū)動器的通信層、處理問題和陳述的語言處理層,以及查詢或存儲通信結(jié)果或訪問Web的知識層。他們在傳感器處理層中利用了幾個現(xiàn)成的模塊——用于語音檢測的WebRTC,用于對象識別的初始神經(jīng)網(wǎng)絡(luò),用于人臉識別的OpenFace和用于語音識別的Google Cloud Speech-to-Text(簡稱API)。這些現(xiàn)成的模塊可被視為不同的已知語境,它們的組合與合作可被視為不同語境的組合和變換。
綜上所述,人的行為是語境介導(dǎo)的行為(context-mediated behavior),人工系統(tǒng)和機器人的行為若要有(類人)智能,也應(yīng)該是這樣。這就是系統(tǒng)或?qū)嶓w的語境化或語境建模。未來的通用人工智能也一定是語境化的,是作為適應(yīng)性表征系統(tǒng)實現(xiàn)的。因此,對于人工智能來說,適合語境的行為與人類一樣是十分重要的。畢竟,無法針對其將要實施的語境做出適當(dāng)行為的機器人,即不能很好適應(yīng)其語境的機器人,原則上是無用的。尤其是用于模擬人類行為的智能體“虛擬人”(virtual human)[37]更需要語境作為介導(dǎo),因為盡管這種虛擬人目前只存在于計算機這種特殊語境中,但有著極其廣泛的應(yīng)用,從軍事和社會模擬到商用視頻游戲無處不在??梢灶A(yù)計,使用語境為人工智能建模是未來人工智能發(fā)展的一個主要方向,一種實現(xiàn)通用人工智能的有效方法論。