国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

伽達(dá)默爾的“成見”觀、捷思法與人工智能

2017-11-30 02:14徐英瑾
江西社會(huì)科學(xué) 2017年10期
關(guān)鍵詞:伽達(dá)默爾錨定人工智能

■徐英瑾

人工智能專題【三篇】

【編者按】國務(wù)院不久前印發(fā)的《新一代人工智能發(fā)展規(guī)劃》,從戰(zhàn)略態(tài)勢、總體要求、重點(diǎn)任務(wù)、資源配置、保障措施和組織實(shí)施共六個(gè)方面,為我國人工智能的發(fā)展指出明確的方向并做出科學(xué)的規(guī)劃,在社會(huì)各界引起巨大反響和熱烈討論。為此,我刊組織三篇以人工智能為主題的文章,從不同角度闡發(fā)人工智能的發(fā)展已經(jīng)或可能出現(xiàn)的問題。徐英瑾指出當(dāng)代人工智能主流算法存在的缺陷,應(yīng)該從伽達(dá)默爾對(duì)“成見”的理解中汲取思想資源,并主動(dòng)吸納心理學(xué)關(guān)于捷思法的研究成果,這對(duì)具體的科學(xué)問題提供的哲學(xué)參考;蔡恒進(jìn)長期從事軟件教學(xué)與研究,不僅指出人工智能發(fā)展的關(guān)鍵是找到“認(rèn)知坎陷”,還對(duì)其必需的人文環(huán)境和教育模式給出了實(shí)質(zhì)性建議;高奇琦、張結(jié)斌則從政治學(xué)視角對(duì)人工智能可能帶來的失業(yè)問題提出前瞻性意見。三篇文章從微觀到宏觀,既有對(duì)現(xiàn)有科學(xué)問題的考察,又有對(duì)未來社會(huì)問題的關(guān)切,充分體現(xiàn)了人工智能的發(fā)展是一項(xiàng)復(fù)雜的系統(tǒng)工程,需要我們高度重視,并充分思考其對(duì)方方面面的深度影響。

伽達(dá)默爾的“成見”觀、捷思法與人工智能

■徐英瑾

伽達(dá)默爾;成見;捷思法;人工智能

按照通常人的理解,人類設(shè)計(jì)人工智能系統(tǒng)的初衷之一,就是利用這些系統(tǒng)運(yùn)作的 “客觀性”,來消除人類決策過程中難以避免的種種偏見或者成見。譬如,根據(jù)大多數(shù)人的期望,人工智能系統(tǒng)應(yīng)當(dāng)能夠幫助人類法官在審理案件的過程中更好地檢查證據(jù)鏈的融貫性,或者量刑的合適性,以免人類的主觀偏見使得判案出現(xiàn)偏差,等等。但是,從哲學(xué)角度看,這樣的俗常見解預(yù)先已在所謂“主觀成見”與所謂“客觀見解”之間劃下了楚河漢界,并在此基礎(chǔ)上賦予了前者以負(fù)面價(jià)值。然而,這樣的預(yù)設(shè)是否經(jīng)得起哲學(xué)的仔細(xì)推敲,則依然值得深入探討。

一、對(duì)伽達(dá)默爾“成見”的“正名”

德國哲學(xué)家伽達(dá)默爾(Hans-Georg Gadamer)在其名著《真理與方法》中便明確地挑戰(zhàn)了上述預(yù)設(shè):

在理性的絕對(duì)自我構(gòu)造的觀念下,被表現(xiàn)為“有限制的前見”的東西,其實(shí)屬于歷史實(shí)在本身。如果我們想要正確地對(duì)待人類的有限的歷史的存在方式,那么我們就必須為“前見”概念根本恢復(fù)榮譽(yù),并承認(rèn)合理的前見的存在。[1](P355)

這里需要指出的是,伽達(dá)默爾在此所說的“前見”,就是平時(shí)我們所說的“成見”或者“偏見”。但為了肅清觀察賦予“成見”一詞的種種負(fù)面情緒,他寧可使用平時(shí)人們較少使用的“前見”一詞,其德文為“Vorurteil”,其中“vor”這個(gè)前綴表示“前”,而“Urteil”這個(gè)詞干表示“判斷”。不過,由于“Vorurteil”的拉丁文形式為“prae-judicium”,而后者的在英文中的對(duì)應(yīng)詞正好是“prejudice”(即漢語中所說的“成見”直接對(duì)應(yīng)的英文詞),因此,在下文的正面敘述中,筆者將不再區(qū)分“前見”與“成見”這兩個(gè)提法。

有的讀者或許會(huì)說,僅僅用不那么帶有貶義的“前見”來替換帶有更多貶義的“成見”,就想徹底“洗白”我們對(duì)于“成見”的種種負(fù)面看法,這樣的論證恐怕很難服人。然而,更為認(rèn)真地閱讀《真理與方法》的文本,卻可以使我們確信,在伽達(dá)默爾的上述引文背后,其實(shí)至少有兩個(gè)論證來支持他的觀點(diǎn)。下面便是筆者根據(jù)自己的理解,對(duì)伽達(dá)默爾相關(guān)思想的重構(gòu)。

論證一:1.任何詮釋活動(dòng)都必須依賴于一些自身不需要被反復(fù)檢驗(yàn)的前提,否則相關(guān)的詮釋活動(dòng)都無法避免“元語言層面上解釋資源不足”的困境;2.如果我們按照啟蒙主義者的要求,對(duì)所有詮釋活動(dòng)的前提都按照理性的最高標(biāo)準(zhǔn)加以檢驗(yàn)的話,那么我們就不得不陷入“元語言層面上解釋資源不足”的困境;3.所以,為了避免陷入上述困境,我們就不能認(rèn)為所有的前見都是有問題的;4.但我們也必須承認(rèn):某些詮釋活動(dòng)的結(jié)果的確是錯(cuò)誤的,而其之所以錯(cuò)誤,就是因?yàn)樗蕾嚨那疤崾清e(cuò)誤的;5.所以,出于立論穩(wěn)妥性的考慮,我們就必須承認(rèn):至少有一部分所謂“成見”是豁免于理性檢驗(yàn)程序的審查的。

論證二:1.個(gè)體理性是有局限性的(譬如,在知識(shí)范圍、推理能力與決策時(shí)間方面的種種局限);2.所以,“訴諸集體智慧”就是在個(gè)體理性遭遇“決策信息資源不足”問題時(shí)不可避免地采用的一種策略;3.集體智慧本身就往往是“歷史權(quán)威”的代名詞;4.因此,個(gè)體的社會(huì)人對(duì)于權(quán)威的接受本身,就是某種“認(rèn)可集體智慧”的社會(huì)心理機(jī)制作用的結(jié)果,并且是為了應(yīng)對(duì)個(gè)體決策資源不足而不得不采取的措施——而并不像偏狹的啟蒙主義者認(rèn)為的那樣,意味著對(duì)于理性的全面拋棄;5.這種對(duì)于權(quán)威的接受活動(dòng)本身就意味著“前見—成見”的最根本來源;6.所以,對(duì)于“前見—成見”的采取,乃是個(gè)體為了應(yīng)對(duì)資源不足問題而不得不采取的措施。

在筆者看來,伽達(dá)默爾的上述觀點(diǎn)(嚴(yán)格來說,是筆者所重構(gòu)的伽氏觀點(diǎn))雖然沒有直接涉及今日如火如荼的人工智能研究,卻在客觀上觸及了任何人工智能系統(tǒng)的設(shè)計(jì)都難以回避的兩個(gè)問題。

第一,系統(tǒng)運(yùn)行的原始數(shù)據(jù)的來源問題。我們知道,任何計(jì)算系統(tǒng)的運(yùn)作都需要人類社會(huì)“喂入”初始數(shù)據(jù),而這些數(shù)據(jù)很難不體現(xiàn)特定工作領(lǐng)域人類的“權(quán)威”或者“成見”。換言之,如果任何個(gè)體人類的詮釋活動(dòng)都無法脫離“成見”而存在(這是前述“論證一”所指出的),那么,對(duì)于以任何一種技術(shù)路徑為依托的人工智能系統(tǒng)而言,其運(yùn)作也無法脫離人類成見的預(yù)先介入,故而,從某種意義上說,人工智能系統(tǒng)只是人類成見的“自動(dòng)加工器”而已。由此看來,向機(jī)器“喂入”怎樣的成見以使得其后續(xù)運(yùn)作的產(chǎn)出能夠符合人類用戶的需求,也便成為所有的人工智能系統(tǒng)設(shè)計(jì)者都必須面對(duì)的一個(gè)重要課題。

第二,系統(tǒng)自身的運(yùn)行資源有限性問題。具體而言,無論是運(yùn)算能力如何強(qiáng)大的人工智能系統(tǒng),它依賴的信息資源與計(jì)算資源都是有限的,因此,一個(gè)足夠智慧的系統(tǒng)就應(yīng)當(dāng)能夠根據(jù)某種既定的“捷思法”,以便從既有的歷史資源——即伽達(dá)默爾所說的“權(quán)威”——中獲得啟發(fā),以最終減少系統(tǒng)的計(jì)算負(fù)擔(dān)(關(guān)于“捷思法”的討論詳后)。從這個(gè)角度看,前述“論證二”對(duì)于人類個(gè)體之理性有限性的提示,就具有了一種兼及人造機(jī)器的普遍性意義。

不過,盡管伽達(dá)默爾對(duì)于“成見”重要性的辯護(hù)具有向人工智能系統(tǒng)設(shè)計(jì)的領(lǐng)域延伸的潛在價(jià)值,對(duì)于大多數(shù)的人工智能工作者來說,伽達(dá)默爾的詮釋學(xué)依然是一種相對(duì)陌生的思想資源。同時(shí),由于伽達(dá)默爾本人的文本寫作方式過于依賴純粹人文領(lǐng)域內(nèi)的學(xué)術(shù)經(jīng)典,他對(duì)二戰(zhàn)后認(rèn)知心理學(xué)對(duì)于其立論的某種潛在的“補(bǔ)充說明”作用,也缺乏相應(yīng)的自覺。而依據(jù)筆者淺見,伽達(dá)默爾立論中最為粗疏之處,便是忽略了:(甲)決策資源相對(duì)匱乏的社會(huì)個(gè)體在訴諸“集智”時(shí),其實(shí)并不總是按照某種單一的路徑來紓解信息匱乏的問題的——相反,可能會(huì)導(dǎo)致具有不同算法特征的不同“捷思法”在不同語境中被激活;(乙)某種更為廣泛的“集智”也將包含單個(gè)的信息處理系統(tǒng)自身的微觀運(yùn)行歷史,而伽達(dá)默爾的立論則過分強(qiáng)調(diào)來自社會(huì)共同體的集體權(quán)威與社會(huì)共同體的宏觀運(yùn)作歷史。從這個(gè)角度看,要將伽達(dá)默爾的哲學(xué)洞見與人工智能研究的工程學(xué)實(shí)踐相互打通,我們還需要一個(gè)中介理論層面的介入,這就是認(rèn)知心理學(xué)對(duì)于所謂“捷思法”的研究。這也就構(gòu)成了本文討論的基本路線圖:先通過深挖心理學(xué)界對(duì)于“捷思法”的研究的哲學(xué)意義來夯實(shí)伽達(dá)默爾的“成見”觀的經(jīng)驗(yàn)內(nèi)容,再反過來“拷問”人工智能的現(xiàn)有研究路徑。

二、心理學(xué)家眼中的“捷思法”以及其哲學(xué)意蘊(yùn)

在專業(yè)的理論心理學(xué)研究中,“成見”并不是一個(gè)被廣泛使用的術(shù)語。一個(gè)與之密切相關(guān)的術(shù)語是“捷思法”,英文為“heuristic”,有“發(fā)現(xiàn)”、“找到”的意思。需要指出的是,盡管這個(gè)詞在中國現(xiàn)行的大多數(shù)心理學(xué)與人工智能文獻(xiàn)中都被譯為“啟發(fā)式算法”,但依據(jù)筆者淺見,這個(gè)譯法不如“捷思法”更能抓住英文原詞的真正含義。非常粗略地說,“捷思法”就是某些特定的推理竅門,以便幫助信息處理系統(tǒng)能夠在資源相對(duì)匱乏的情況下也可以給出問題的答案。雖然這些竅門一方面既不能保證其運(yùn)作符合邏輯與概率論的要求,另一方面也并不保證輸出的解是“最優(yōu)解”,但在吉仁澤(Gerd Gigerenzer)等心理學(xué)家看來,“捷思法”的存在能夠使相關(guān)的信息處理系統(tǒng)以最節(jié)儉的方式輸出適應(yīng)性的行為,因此其存在是符合自然選擇的原理的(我們知道,自然選擇并不關(guān)心生物體的信念是否是精確的,而只關(guān)心其信念是否能夠滿足其生存的需要)。①

而“捷思法”之所以與我們前面討論的“前見—成見”相關(guān),也恰恰是因?yàn)樗c“前見—成見”一樣,均由于強(qiáng)調(diào)“節(jié)儉性”而或多或少地違背了啟蒙主義者對(duì)理性思維的種種規(guī)范性要求(因?yàn)閷?duì)于這些規(guī)范的全面落實(shí),往往會(huì)逼迫智能體以更不“節(jié)儉”的方式付出更大的計(jì)算資源)。此外,種種“捷思法”的存在本身,也為個(gè)體在決策匱乏的情況下汲取“集智”或“社會(huì)權(quán)威見解”提供了具體的心理操作路徑。

為了更直觀地說明“捷思法”的特點(diǎn),筆者將詳細(xì)討論三種經(jīng)常在心理學(xué)文獻(xiàn)里提到的“捷思法”,并分別提示它們各自與規(guī)范理性要求之間的張力。

(一)錨定捷思法(anchoring heuristics)

錨定捷思法大體是指這樣一種心理現(xiàn)象:人們往往依賴對(duì)事物的第一印象來作出決策,卻對(duì)有關(guān)該事物的后續(xù)情報(bào)表示相對(duì)的麻木,或即使作出了某些偏離于被錨定印象的策略調(diào)整,調(diào)整的幅度也要小于正確決策所需要的幅度。站在啟蒙主義者的立場上看,“錨定效應(yīng)”顯然是種種不合理偏見的一個(gè)重要源泉,因?yàn)樵撔?yīng)無法使決策者根據(jù)環(huán)境的變化迅速調(diào)整決策的方向,并由此陷入各種推理陷阱。比如,商家先將某種汽車的初始定價(jià)定得很高,以便為消費(fèi)者設(shè)定某種“錨定效應(yīng)”,爾后再削價(jià)讓消費(fèi)者更容易接受新價(jià)格——盡管新價(jià)格可能依然是超出了商品自身的價(jià)值。很顯然,正是因?yàn)殄^定效應(yīng)的存在,才使得消費(fèi)者更容易注意到離原價(jià)格較近的新標(biāo)價(jià),而不是離原價(jià)更遠(yuǎn)的商品實(shí)際價(jià)格。更有甚者,心理學(xué)家特沃斯基(Amos Tversky)與卡內(nèi)門(Daniel Kahneman)還根據(jù)心理學(xué)測試的結(jié)果指出:“錨定效應(yīng)”使得被試者在計(jì)算長數(shù)列的乘積時(shí),更容易注意到數(shù)列中的前幾個(gè)數(shù)字而忽略數(shù)列中的后幾個(gè)數(shù),并由此在估算乘積總數(shù)的測驗(yàn)中獲得低分。[2]②

然而,只要我們調(diào)整一下自身的評(píng)價(jià)坐標(biāo)系,啟蒙主義者對(duì)錨定效應(yīng)的這種批評(píng)意見就未必站得住腳了。我們不妨將問題反過來想:如果一個(gè)智能體不使用錨定捷思法,那么其信息處理進(jìn)程又當(dāng)是如何的呢?答案就只有一個(gè)了:在得到汽車的任何一次報(bào)價(jià)后,始終期待著下一次報(bào)價(jià),并忽略每次報(bào)價(jià)之間的先后關(guān)系。但在筆者看來,在決策的時(shí)間資源不足的情況下,這樣的決策方式并不能帶來決策系統(tǒng)對(duì)于環(huán)境的“適應(yīng)性”。我們不妨再來假設(shè)這樣一種情況:汽車經(jīng)銷商的每次報(bào)價(jià)之間的時(shí)間間隔是1分鐘,而且總的報(bào)價(jià)次數(shù)是10次。這樣的話,一種不受錨定效應(yīng)影響的信息處理系統(tǒng),必須花費(fèi)至少10分鐘才能夠完成關(guān)于“是否接受出價(jià)”的決策。但如果系統(tǒng)得到的決策時(shí)間只有5分鐘的話,這樣的系統(tǒng)顯然沒有辦法完成相關(guān)的決策任務(wù)。與之相對(duì)比,基于錨定捷思法而運(yùn)作的決策系統(tǒng),卻完全可能在如此巨大的時(shí)間壓力下完成類似的任務(wù),盡管其輸出的解未必是最優(yōu)解,但這總比沒有任何輸出要好。

啟蒙主義者可能會(huì)辯駁說,對(duì)于錨定效應(yīng)的依賴,分明已經(jīng)讓不少人在市場上受到了奸商的誆騙,或在計(jì)算數(shù)列時(shí)給出了錯(cuò)誤得離譜的答案。難道一種得到啟蒙精神滋養(yǎng)的成熟心靈,就應(yīng)當(dāng)甘于受到種種基于錨定效應(yīng)的社會(huì)愚弄機(jī)制的操控嗎?

對(duì)此,筆者的意見是,在市場上受到虛假報(bào)價(jià)的愚弄當(dāng)然不是什么好事,但考慮到如下兩個(gè)理由,筆者并不認(rèn)為,對(duì)于這些愚弄的擺脫,需要我們付出拋棄以錨定效應(yīng)為代表的種種認(rèn)知成見的代價(jià)。理由(甲):利用錨定效應(yīng)而去誤導(dǎo)受眾認(rèn)知的社會(huì)機(jī)制,是在人類特定歷史發(fā)展階段而出現(xiàn)的新事物,而在此之前,在漫長的人類演化史中,錨定效應(yīng)已經(jīng)幫助人類解決了與生存有關(guān)的各種決策問題。因此,僅僅因?yàn)槟撤N心理學(xué)效應(yīng)可能產(chǎn)生的負(fù)面效果而否認(rèn)其產(chǎn)生的整體利益,乃是不明智的。理由(乙):在實(shí)際生活中,對(duì)于汽車實(shí)際價(jià)格的了解,其實(shí)并不是來自于啟蒙主義者看重的某種毫無成見滲入的客觀計(jì)算,而是依然來自于特定專業(yè)領(lǐng)域內(nèi)的“權(quán)威見解”。而對(duì)于這種權(quán)威見解的消化過程,很可能也帶有某種更深層次的錨定效應(yīng)。比如,某位汽車界業(yè)內(nèi)人士的對(duì)于某款汽車的內(nèi)部報(bào)價(jià),也會(huì)在聽者那里產(chǎn)生錨定效應(yīng),并由此使得其從經(jīng)銷商那里聽到的報(bào)價(jià)造成的心理效應(yīng)被大大沖淡了。由此看來,那些在市場上能夠作出更多正確決策的成功人士之所以成功,很可能也并不是因?yàn)樗麄兊臎Q策過程并沒有受到錨定效應(yīng)的影響,而是因?yàn)椋捎诩兇獾呐既辉?,第一次進(jìn)入他們心智的情報(bào)的確具有較高的情報(bào)價(jià)值。

(二)關(guān)于“可獲取性”的捷思法(availability heuristic)

大致而言,在這種捷思法的幫助下,如果心理主體被要求對(duì)兩個(gè)事件的發(fā)生概率進(jìn)行評(píng)估的話,那個(gè)相關(guān)示例更容易在記憶中被喚起的事件,往往更容易受到心理主體的偏好。譬如前面所提到的特沃斯基與卡內(nèi)門,提出的另一個(gè)在認(rèn)知心理學(xué)文獻(xiàn)中廣為引用的案例。如果懂英文的人被問及這樣一個(gè)問題:“在英文單詞中,以字母‘k’開頭的單詞多,還是以字母‘k’為第三個(gè)字母的單詞多?”大多數(shù)被試者都會(huì)認(rèn)定“以字母‘k’開頭的單詞多”,盡管實(shí)際答案是“以字母‘k’為第三個(gè)字母的單詞多”。而大多數(shù)被試者之所以那么想,顯然是因?yàn)椤耙宰帜浮甼’為第一個(gè)字母的單詞”更容易在記憶中被喚起。[3]而在新聞媒體的運(yùn)作中,不少從業(yè)人員也利用這種捷思法設(shè)置思維陷阱,誘使公眾認(rèn)為那些更具“新聞價(jià)值”的事件要比其實(shí)際上更具普遍性。

對(duì)于該捷思法的產(chǎn)生機(jī)制,不同的學(xué)者有不同的看法。譬如,特沃斯基與卡內(nèi)門就在前面引用的關(guān)于單詞數(shù)量估計(jì)的實(shí)驗(yàn)報(bào)告中認(rèn)為,“以字母‘k’開頭的單詞”的數(shù)量之所以被大多數(shù)被試者高估,就是因?yàn)樵跉v史上,他們實(shí)際調(diào)用此類單詞的頻率的確比較高。而施瓦茨(Robert Schwarz)等人則給出了不同的診斷意見。在他們看來,對(duì)于相關(guān)事項(xiàng)的信息提取的難易度才是使得“以字母‘k’開頭的單詞”勝出的關(guān)鍵因素:因?yàn)樗鼈冿@然要比“以字母‘k’為自身第三個(gè)字母的單詞”更容易被提取到工作記憶之中。[4]

不過,無論對(duì)這種捷思法的哪一種解釋是正確的,啟蒙主義者肯定不會(huì)在健全的理性思維方式中為基于“可獲取性”的心智算法預(yù)留空間。其理由也是非常明顯的:在他們看來,這樣的算法會(huì)引導(dǎo)我們對(duì)于事件發(fā)生的概率作出錯(cuò)誤的估計(jì),并由此配置錯(cuò)資源。比如,醫(yī)療部門就可能由于受到此種捷思法的影響,低估某些不那么容易想到的疾病風(fēng)險(xiǎn),并由此作出對(duì)公眾整體健康前景不利的決策。啟蒙主義者或許還會(huì)補(bǔ)充說:哪些事項(xiàng)更容易在記憶中被喚起,乃是一個(gè)非常偶然的心理學(xué)現(xiàn)象,僅僅從這種偶然的線索出發(fā)就作出對(duì)于世界的實(shí)際狀態(tài)的評(píng)估,實(shí)在是太不負(fù)責(zé)了。

對(duì)于啟蒙主義者的這種見解,筆者的回應(yīng)是:“偶然性”并不是心智構(gòu)架中可以被完全排除的因素。具體而言,如果一個(gè)心智系統(tǒng)的長期記憶地址儲(chǔ)藏的信息數(shù)量已經(jīng)遠(yuǎn)遠(yuǎn)超出其工作記憶的最大容量,那么,這樣的智能系統(tǒng)就必須具有某種特定的算法,以便只把長期記憶庫中與當(dāng)下任務(wù)有“相關(guān)性”的信息引入其工作記憶池。很顯然,在特定的時(shí)間壓力下,為了判斷長期記憶庫中的哪些信息與當(dāng)下任務(wù)“相關(guān)”、哪些又“不相關(guān)”,系統(tǒng)就只能按照系統(tǒng)運(yùn)作的內(nèi)部特征來確立相關(guān)的篩選標(biāo)準(zhǔn)。譬如,根據(jù)相關(guān)事項(xiàng)在歷史上被調(diào)用的頻率,或根據(jù)調(diào)用這些事項(xiàng)的簡易程度。但顯而易見的是,系統(tǒng)內(nèi)部的運(yùn)作邏輯與外部世界的運(yùn)作邏輯之間存在天然的差異,對(duì)于外部世界而言,這些經(jīng)由系統(tǒng)內(nèi)部運(yùn)行歷史而形成的內(nèi)部參數(shù)的配置顯然帶有某種“偶然性”。但反過來看,若沒有任何一種武斷的、偶然的內(nèi)部信息篩選標(biāo)準(zhǔn),系統(tǒng)也就無法在浩瀚的信息海洋中找到方向,進(jìn)而也就無法對(duì)外界作出任何回應(yīng)。由此我們甚至可以設(shè)想:倘若我們?yōu)榱硕沤^各種偶然因素的“干擾”,而強(qiáng)制一個(gè)信息處理系統(tǒng)在不依賴“可獲取性”的捷思法的前提下去進(jìn)行推理活動(dòng),那么,這個(gè)信息系統(tǒng)的工作進(jìn)程又將如何呢?很顯然,在面對(duì)“在英文單詞中,以字母‘k’開頭的單詞多,還是以字母‘k’為第三個(gè)字母的單詞多”這樣的問題時(shí),啟蒙主義者偏好的那類信息處理系統(tǒng),只能傻乎乎地將兩類字母從頭到尾都數(shù)一遍,此類工作需要的時(shí)間資源與信息資源,顯然都是驚人的。

當(dāng)然,面對(duì)筆者的這種批評(píng),啟蒙主義者或許會(huì)這樣繼續(xù)為自己辯白說:“這樣的信息處理過程固然耗時(shí),但總比倉促地得出一個(gè)明顯的錯(cuò)誤結(jié)論來得好?!钡@里必須要提出的一個(gè)更深的問題是:對(duì)于面臨巨大生存壓力的先民而言,知道“以字母‘k’為第三個(gè)字母的單詞”的數(shù)量,的確多于“以字母‘k’為首的單詞”,到底有什么價(jià)值呢?從概率論角度看,這樣的問題顯然都涉及對(duì)于兩類對(duì)象的“基礎(chǔ)比率”的比對(duì)問題(所謂基礎(chǔ)比率,就是指一類對(duì)象在所有統(tǒng)計(jì)學(xué)對(duì)象中占據(jù)的百分比),因此它涉及的只是某種非常抽象的知識(shí)罷了。但生存斗爭首先是關(guān)于個(gè)體及其行動(dòng)的,而上述這類抽象知識(shí)除非通過某些“中項(xiàng)”的過渡機(jī)制而進(jìn)入實(shí)踐推理,否則就難以兌現(xiàn)為個(gè)體的實(shí)際行動(dòng),并由此增強(qiáng)其適應(yīng)性。

為了理解這一點(diǎn),我們不妨再來思考一個(gè)與“估字母數(shù)”的案例平行,但更具演化論氣息的新案例:對(duì)于一個(gè)原始人的生存而言,他更需要獲知的是“被蚊子叮咬而死的原始人是否多于被劍齒虎攻擊的原始人”這一問題的答案,還是“到底是被劍齒虎攻擊更容易死,還是被蚊子叮咬更容易死”這一問題的答案呢?很明顯,前一問題采用了基本比率的格式后,后一問題則采用了后驗(yàn)概率的格式,一個(gè)理智正常的原始人顯然應(yīng)該對(duì)后一個(gè)問題的答案更感興趣,因?yàn)閷?duì)于前一個(gè)問題的知識(shí),其實(shí)是無法指導(dǎo)原始人在面對(duì)真實(shí)的劍齒虎時(shí)該怎么做的(這又是因?yàn)椋骸皠X虎所吃掉的人占據(jù)的基本比率”的高低,在數(shù)值上無涉于“在遇到劍齒虎攻擊后原始人的生存率”的高低)。從這個(gè)角度看,基于“可獲取性的”心智算法之所以會(huì)在面對(duì)“估單詞數(shù)量”這樣的任務(wù)時(shí)“出丑”,恐怕也是因?yàn)檫@樣的任務(wù)已經(jīng)脫離了自然選擇面對(duì)的原始環(huán)境,而不具有與人類生存的直接關(guān)聯(lián)性了。

(三)關(guān)于“辨識(shí)”的捷思法(recognition heuristic)

根據(jù)該心智算法,如果兩個(gè)對(duì)象對(duì)主體而言,一個(gè)是比較熟悉,而另一個(gè)則難以辨識(shí),那么,更容易被辨識(shí)者就會(huì)被估測為具有更高的價(jià)值。下面的心理學(xué)測驗(yàn),則為這種捷思法的運(yùn)作提供了具體的案例。假設(shè)有這樣一張考卷,考卷上有一列由美國城市名字構(gòu)成的對(duì)子,如“史普林菲爾德—舊金山”、“芝加哥—小石城”,等等??忌娜蝿?wù),便是從每個(gè)對(duì)子里找出城市居民比較多的那個(gè)城市(在此期間任何考生不允許參考任何書籍以及網(wǎng)絡(luò)上的相關(guān)信息),考官則根據(jù)考生的答對(duì)率進(jìn)行判分。現(xiàn)在我們將考生的考卷分為兩組:中國學(xué)生的答卷與美國學(xué)生的答卷。你猜哪一組的平均分會(huì)更高一點(diǎn)呢?

很多人都會(huì)認(rèn)為美國的學(xué)生考分會(huì)高一點(diǎn),因?yàn)樵谒麄兛磥?,美國學(xué)生總要比中國學(xué)生更熟悉美國城市的情況。然而,這個(gè)看法其實(shí)是有失偏頗的。作為一個(gè)大國,美國的行政區(qū)劃以及相關(guān)的人口情況異常復(fù)雜,即使是一般的美國人,也僅僅是“聽說過”不少城市的名字而已,并不太清楚所有城市的人口規(guī)模。而作為中國學(xué)生,事情就要相對(duì)簡單一點(diǎn)。他們做題的時(shí)候遵循的是一條非常簡單的“捷思法”:凡是中國人容易辨識(shí)出的美國城市,一般都是大城市,而大城市一般人口就多??傊鎸?duì)兩個(gè)城市的名字“二選一”的時(shí)候,選那個(gè)看起來眼熟的地名就是了。而或許讓人感到驚訝的是,這種看似“簡單粗暴”的解題思路,成功率卻相當(dāng)了得。譬如,德國心理學(xué)家吉仁澤與其合作伙伴真做了這個(gè)實(shí)驗(yàn),由于他是德國人,他當(dāng)然是以德國大學(xué)生——而不是中國大學(xué)生——作為美國大學(xué)生的對(duì)照組,結(jié)果發(fā)現(xiàn),德國學(xué)生的平均成績明顯要比美國學(xué)生好;而當(dāng)別的研究者以“兩個(gè)英國足球隊(duì)中的哪一個(gè)會(huì)在聯(lián)賽中獲得更好的成績”為問題,分別測試土耳其的學(xué)生和英國本土的學(xué)生后,他們同樣驚訝地發(fā)現(xiàn):答案正確率高的,再一次是相對(duì)不熟悉英國本土情況的土耳其人。[5](P43-44)簡言之,將正面的屬性(如人口多、體育強(qiáng)等)指派給你相對(duì)熟悉的地名,便是在上面的實(shí)驗(yàn)中德國學(xué)生與土耳其學(xué)生得以打敗其美英本土競爭者的“制勝捷思法”。

關(guān)于辨識(shí)的捷思法的存在,無疑對(duì)啟蒙主義者的理性觀提出了更大的挑戰(zhàn),因?yàn)榕c前幾種捷思法不同,人類對(duì)此類捷思法的運(yùn)用,并沒有導(dǎo)致明顯的錯(cuò)誤輸出。更值得玩味的是,對(duì)于此類捷思法的使用體現(xiàn)出某種“多即少”(more is less)的效應(yīng),即“知道的多,反而猜對(duì)的少”。啟蒙主義者的理性觀顯然是難以解釋這種“多即少”效應(yīng),因?yàn)樵趩⒚芍髁x者看來,“多獲取各方面的情報(bào)”恰恰就是避免主觀偏見的有效途徑。而依據(jù)基于個(gè)體信息處理資源之有限性的考量,這種“多即少”效應(yīng)卻很容易得到解釋:當(dāng)一個(gè)人對(duì)某個(gè)對(duì)象O有比較豐富(但卻遠(yuǎn)遠(yuǎn)談不上完整的)知識(shí)的時(shí)候,“可辨識(shí)度”這一指標(biāo)就會(huì)被淹沒在大量的其他指標(biāo)中,而失去了“第一向?qū)А钡淖饔?。在這種情況下,被試者就不得不對(duì)大量指標(biāo)與目標(biāo)屬性之間的關(guān)聯(lián)進(jìn)行逐一排查,由此即降低了信息處理的效率(這是由考慮的參數(shù)增多引起的),又降低了信息處理結(jié)果的品質(zhì)(這是由于考慮的參數(shù)彼此之間的沖突引起的)。

由于篇幅的限制,在本節(jié)中正面涉及的“捷思法”便主要是以上這些。③現(xiàn)在,我們有必要從一個(gè)更抽象的角度來評(píng)估這三種“捷思法”的共性,這就是:三者都是對(duì)系統(tǒng)內(nèi)部運(yùn)行的歷史都有一種間接表征,并由此在一定程度上體現(xiàn)了系統(tǒng)的運(yùn)行過程中的“歷史智慧”。具體而言,在錨定捷思法中,第一印象的時(shí)間優(yōu)先性本身就意味著某種微觀意義上的歷史權(quán)威;而在關(guān)于“可獲取性”的捷思法中,某種通過調(diào)用數(shù)據(jù)的既有習(xí)慣構(gòu)成的歷史路徑,則成為指導(dǎo)心理主體調(diào)取當(dāng)下數(shù)據(jù)的隱蔽歷史權(quán)威;與之類似,在關(guān)于“辨識(shí)”的思捷法之中,心理主體對(duì)于被辨識(shí)對(duì)象的辨識(shí)歷史,則構(gòu)成了其猜測相關(guān)對(duì)象之內(nèi)在價(jià)值的主要依據(jù)。換言之,上述捷思法在人類思維中的廣泛運(yùn)用,恰恰證明,人類是一種依據(jù)從歷史累積而成的思維習(xí)慣,從而與“未來之不確定性”進(jìn)行戰(zhàn)斗的智慧存在者。

從一個(gè)更宏觀的角度來看,心理學(xué)界對(duì)上述這些捷思法的研究成果,既印證了前節(jié)提及的伽達(dá)默爾的“成見”觀,又對(duì)其作出了有力的補(bǔ)充,相互印證之處體現(xiàn)在,二者都對(duì)人類個(gè)體的理性有限性以及其對(duì)于歷史權(quán)威的依賴性,作出了重要的提示;而捷思法研究對(duì)于伽氏之論的補(bǔ)充價(jià)值,則又體現(xiàn)于此類研究揭示的一個(gè)要點(diǎn):在人類共同體的集體智慧與個(gè)體的實(shí)時(shí)決策活動(dòng)之間,決策個(gè)體的自身的心理史必然會(huì)起到某種重要的中介作用。譬如,在錨定捷思法中,來自社會(huì)群體一端的某種權(quán)威信息,很可能就是以“錨定印象”的方式進(jìn)入個(gè)體的心理運(yùn)作歷史,并對(duì)后繼的相關(guān)決策活動(dòng)產(chǎn)生影響。從這個(gè)角度看,在伽氏的論述框架中初步呈現(xiàn)出來的“社會(huì)—個(gè)體”二元關(guān)系,還需要通過認(rèn)知心理學(xué)話語框架的重述機(jī)制,而進(jìn)一步細(xì)化為某種自上而下的四層結(jié)構(gòu):社會(huì)權(quán)威(群體歷史)、心理架構(gòu)對(duì)于社會(huì)信息的提取裝置、個(gè)體心理習(xí)慣(個(gè)體歷史)、當(dāng)下決策活動(dòng)。很明顯,在這種四層次結(jié)構(gòu)中,本節(jié)提到的種種“捷思法”,便為個(gè)體與集體智慧意義上的歷史權(quán)威之間的聯(lián)系管道提供了大量的實(shí)現(xiàn)手段,同時(shí)也為種種“成見”的產(chǎn)生,提供了一種具有初步技術(shù)細(xì)節(jié)的說明。

通過上面的分析,讀者很容易產(chǎn)生這樣一種期望:通過“對(duì)于捷思法的算法化”這一重要的環(huán)節(jié),我們就可以很容易地將伽氏的哲學(xué)洞見引入人工智能的工程設(shè)計(jì)。然而,真實(shí)的情況卻并沒有這么簡單。正如下節(jié)要揭示的那樣,目下人工智能發(fā)展的令人遺憾的現(xiàn)實(shí)便是,人工智能界的主流,并沒有主動(dòng)地吸納心理學(xué)界關(guān)于捷思法的研究成果。

三、捷思法與人工智能

對(duì)于筆者在上節(jié)末尾給出的這番評(píng)論,熟悉人工智能發(fā)展情況的讀者或許會(huì)感到驚訝:難道“捷思法”(heuristic)不也正是在人工智能領(lǐng)域廣泛使用的一個(gè)術(shù)語嗎?憑什么說心理學(xué)家對(duì)于捷思法的研究成果,尚且沒有被人工智能學(xué)界所廣泛吸納呢?筆者的應(yīng)答是:人工智能領(lǐng)域內(nèi)的捷思法,雖然和心理學(xué)意義上的捷思法一樣,均具有“減少信息處理系統(tǒng)計(jì)算負(fù)擔(dān)”的功能,卻并沒有真正體現(xiàn)信息系統(tǒng)處理的個(gè)體運(yùn)行歷史,并在這種意義上體現(xiàn)出足夠的“心理學(xué)”意味(遑論在此基礎(chǔ)上成為引續(xù)共同體之集體智慧的“引水渠”)。下面,筆者便將通過對(duì)于相關(guān)技術(shù)案例的詳細(xì)解釋,來闡明這一論點(diǎn)。

在計(jì)算機(jī)科學(xué)文獻(xiàn)里經(jīng)常提到的一個(gè)運(yùn)用捷思法的案例,乃是所謂“行銷商旅行路徑擇優(yōu)問題”(travelling salesman problem),簡稱為“TSP問題”。④這個(gè)問題是說,如果我們已知地圖上有若干個(gè)城市,以及城市兩兩之間的距離,我們又如何能夠?yàn)橐粋€(gè)行銷商找到最短的一條路徑,使他能以某個(gè)特定城市為出發(fā)點(diǎn)兼回歸點(diǎn),并能夠經(jīng)過所有城市呢?從數(shù)學(xué)角度看,這樣的問題帶來的計(jì)算負(fù)擔(dān)是非常大的,而為了減少此類負(fù)擔(dān),人工智能專家就會(huì)采用一種叫 “貪婪算法”(greedy algorithm)的捷思法。[6](P414-450)“貪婪算法”的基本技術(shù)思想是,首先不去尋找問題的全局最優(yōu)解(因?yàn)檫@帶來海量的計(jì)算負(fù)擔(dān)),而僅僅滿足于尋找局部最優(yōu)解,并期望局部最優(yōu)解的積累可以使系統(tǒng)慢慢接近全局最優(yōu)解。將這個(gè)思路運(yùn)用到TSP問題上去,由此產(chǎn)生的問題解決思路就是:從當(dāng)下的城市坐標(biāo)出發(fā),訪問與之最接近的一個(gè)城市坐標(biāo),即至少保證在局域環(huán)境中旅行者的行程是最短的。然后通過迭代,使得由此產(chǎn)生的旅行距離可以被延伸到更遠(yuǎn)的城市坐標(biāo)去,最終完成全局路程規(guī)劃。

雖然有研究指出貪婪算法并不能導(dǎo)致系統(tǒng)得到全局最優(yōu)解[7],但筆者批評(píng)此類捷思法的著眼點(diǎn)并不在此。這里更需要提醒讀者注意的,乃是此類捷思法與心理學(xué)捷思法之間的重要差異。很明顯,執(zhí)行貪婪算法的系統(tǒng)是沒有長期記憶的,它只能關(guān)注到目下的坐標(biāo)周圍的那些城市坐標(biāo),并基于這種觀察機(jī)械地丈量這些坐標(biāo)之間的距離,由此再機(jī)械地移動(dòng)到下一個(gè)觀察點(diǎn)上去。因此,貪婪算法的運(yùn)作并不包含著對(duì)系統(tǒng)既有運(yùn)作歷史的一種哪怕最弱意義上的表征(譬如,當(dāng)系統(tǒng)像蠕蟲一樣爬到第八個(gè)城市時(shí),它已經(jīng)不記得它在第一個(gè)城市時(shí)選擇的下一個(gè)城市了)。與之相對(duì)比,一個(gè)完整意義的人類心理主體,恐怕并不是按照這種愚蠢的捷思法來運(yùn)作的。人類主體在面對(duì)此類問題時(shí)更可能采取的辦法,是回憶他上次進(jìn)行此類路程規(guī)劃時(shí)給出的方案(此即“錨定捷思法”),或是去更偏好那些在視覺上更為直觀的路徑規(guī)劃(此即關(guān)于“可獲取性”的捷思法),或是去偏好那些首先經(jīng)過那些更有名的城市的路徑規(guī)劃(此即關(guān)于“辨識(shí)”的捷思法)。不難看出,人類主體對(duì)于上述這些捷思法的運(yùn)用,顯然已經(jīng)預(yù)設(shè)了人類的認(rèn)知架構(gòu)是能夠調(diào)取長期記憶中的信息,并能夠賦予每一個(gè)城市以相關(guān)的語義的。但這樣的能力顯然是“貪婪算法”所不具備的。

那么,為何預(yù)設(shè)了人類語義與記憶機(jī)制的人類捷思法,要比“貪婪算法”更優(yōu)異呢?道理很簡單:僅僅只能反映局域坐標(biāo)點(diǎn)之間關(guān)系的“貪婪算法”,由于一開始就放棄了對(duì)于全局情況的把握,因此最終接近全局最優(yōu)解的機(jī)會(huì)本來也就不會(huì)太大。與之相比較,“錨定捷思法”、關(guān)于“可獲取性”的捷思法與關(guān)于“辨識(shí)”的捷思法都能夠幫助心理主體提取路徑規(guī)劃的整體特征,由此“自上而下”地進(jìn)行路徑優(yōu)化選擇。不難想見,如果心理主體事先就獲得的關(guān)于路徑規(guī)劃的歷史信息的確比較有價(jià)值,那么,這種“自上而下”的規(guī)劃路徑顯然就更有希望幫助主體找到全局最優(yōu)解,或至少更接近之。

那么,為何現(xiàn)有的人工智能系統(tǒng)的設(shè)計(jì)者沒有首先去將人類心理的捷思法“算法化”,而是要另起爐灶,去構(gòu)建專為機(jī)器所用的捷思法呢?其道理其實(shí)也不難想見。很多從事人工智能研究的從業(yè)者都是數(shù)學(xué)專業(yè)(而不是心理學(xué)或語言學(xué))出身,因而習(xí)慣于將各種人工智能問題視為數(shù)學(xué)問題的變種。從純數(shù)學(xué)角度上看,在平面上擺放的各個(gè)城市的確就是一個(gè)個(gè)抽象的點(diǎn),它們也的確并不承載任何文化或歷史的意義。因此,在他們看來,人類捷思法預(yù)設(shè)的意義、記憶、文化與權(quán)威,既然在數(shù)學(xué)上無法處理,故而一種“干凈”的人工智能之解法就應(yīng)該將它們“約分”掉。但從心理學(xué)哲學(xué)的角度看,這樣的處理卻恰恰丟失了捷思法存在的最基本意義,即在個(gè)體富有意義的當(dāng)下的決策行為與同樣富有意義的歷史信息庫之間建立溝通管道。打個(gè)比方來說,抽離了意義的捷思法,就像切斷了與自來水廠聯(lián)系的水龍頭一樣,只能成為純粹的擺設(shè)。

熟悉人工智能發(fā)展歷史的讀者或許還會(huì)辯白說,在人工智能元老司馬賀(Herbert Simon)、肖(John Shaw)和紐艾爾(Allen Newell)對(duì)于“通用問題求解器”(General Problem Solver,簡稱GPS)的設(shè)想之中[8](P256-264),研究者們既設(shè)計(jì)了“長期記憶庫”,又在記憶庫中預(yù)存了大量的“捷思法”。同時(shí),司馬賀與紐艾爾設(shè)計(jì)GPS的初衷,便是希望系統(tǒng)自身能夠在資源有限的前提下,通過更為經(jīng)濟(jì)的方式來獲得自己的推理目標(biāo)。由此看來,通過GPS規(guī)劃,心理學(xué)家對(duì)于捷思法的種種設(shè)想,已經(jīng)得到了算法化的處理。

但在筆者看來,這樣的判斷依然是粗疏的。為了說明這一點(diǎn),我們不妨先來查看一下,在GPS架構(gòu)通常具有的“手段—目標(biāo)”進(jìn)路(means-end-analysis approach)中,捷思法究竟扮演了怎樣的角色。筆者對(duì)“手段—目標(biāo)”進(jìn)路的流程概述如下:

(1)先確定系統(tǒng)希望達(dá)到的理想狀態(tài)B,然后再觀察系統(tǒng)目前所面對(duì)的現(xiàn)狀A(yù)。由此,系統(tǒng)就得到了對(duì)于當(dāng)下目標(biāo)的刻畫:把A轉(zhuǎn)變?yōu)锽。

(2)找出A和B之間的差距D,若D目前無法克服,便確立子目標(biāo):縮小差距D。

(3)在方法庫(method store)中,搜索可以滿足子目標(biāo)的捷思法Q,具體手段是:找到一個(gè)備選的捷思法,若它能通過初步的可行性測試,就將它應(yīng)用于最初的狀態(tài)A,由此給出結(jié)果A*。若它無法通過最初的可行性測試,則系統(tǒng)開始尋找下一個(gè)備選的捷思法,直到找到為止(“可行性檢測”是指,面對(duì)表征這些備選操作手段的表達(dá)式,系統(tǒng)一一加以檢測,以判斷其中哪些可滿足一個(gè)合格的操作手段所應(yīng)滿足的語義限制)。

(4)找出A*與B之間的差距D*,爾后確立新的子目標(biāo):找到差距D*。若找不到D*,任務(wù)結(jié)束。

(5)在任務(wù)沒有結(jié)束的前提下,系統(tǒng)會(huì)搜索可以滿足新的子目標(biāo)的操作手段Q*,具體手段是:找到一個(gè)備選的捷思法,若它能通過初步的可行性測試,就將其應(yīng)用于狀態(tài)A*,由此給出結(jié)果A**。若它無法通過最初的可行性測試,則系統(tǒng)開始尋找下一個(gè)備選的操作手段,直到找到為止。

(6)比照A**和B,若二者無差距,任務(wù)結(jié)束。若存在差距D**,則重復(fù)上述操作,直到系統(tǒng)找到一個(gè)操作手段,直至產(chǎn)生一個(gè)與B重合的結(jié)果。

在這里特別需要關(guān)注的乃是步驟(3)。不難看出,在這個(gè)步驟中,GPS設(shè)計(jì)者提到的那些捷思法,是作為一種僵死的對(duì)象現(xiàn)成地?cái)[放在方法庫里,而系統(tǒng)對(duì)它們的提取過程本身則完全是隨機(jī)的。與之相比較,以“辨識(shí)捷思法”為代表的人類捷思法,則首先是用以提取長期記憶中相關(guān)信息的捷思法,也就是某種用以克服上述這種“純粹的隨機(jī)性”的信息流動(dòng)捷徑。順便說一句,在人類的心智架構(gòu)中,這些捷徑的形成固然受到某些偶然性因素的影響,但這種偶然性畢竟是具有歷史維度的,因而并不能被消解為純粹的隨機(jī)性。從這個(gè)意義上說,在GPS中缺乏的,實(shí)際上就是某種用以調(diào)取既有捷思法的高階捷思法,而能夠與人類捷思法對(duì)應(yīng),并由此能夠與人類的集體智慧相聯(lián)系的,恰恰就是這種高階捷思法。此外,在我們?cè)u(píng)價(jià)GPS時(shí)還需要考慮的一個(gè)因素是,上文給出的“手段—目標(biāo)”進(jìn)路的五個(gè)計(jì)算步驟,每完成一次運(yùn)行,整個(gè)系統(tǒng)就會(huì)歸零,這也就是說,在第一個(gè)輪回中,即使系統(tǒng)發(fā)現(xiàn)方法庫中的捷思法H對(duì)于解決問題P是非常有價(jià)值的,它也不會(huì)在未來解決一個(gè)與P非常類似的新問題時(shí)去優(yōu)先考慮H,因?yàn)镚PS既缺乏對(duì)于問題之間的類似性關(guān)系的高階表征能力,也不包括對(duì)于自身運(yùn)行歷史的“自傳式記憶”的表征能力。

有的讀者或許還會(huì)辯白說,人工智能界完全可以不顧心理學(xué)界對(duì)于捷思法的既有研究成果,而通過某種更為簡單、粗暴的方式,以使得人類的集體智慧與人工智能系統(tǒng)相互接駁。譬如,我們可以通過“人工神經(jīng)元網(wǎng)絡(luò)”(artificial neural network,深度學(xué)習(xí)技術(shù)的基本母型)或“聯(lián)接主義”(connectionism)的計(jì)算框架,把人類的權(quán)威見解順利地復(fù)制到計(jì)算系統(tǒng)中去。

那么,人類成見究竟是如何在人工神經(jīng)元網(wǎng)絡(luò)的框架中得到體現(xiàn)的呢?要說明這一點(diǎn),我們還需要對(duì)人工神經(jīng)元網(wǎng)絡(luò)的運(yùn)行有一番基本的了解。非常粗略地說,神經(jīng)元網(wǎng)絡(luò)技術(shù)的實(shí)質(zhì),就是利用統(tǒng)計(jì)學(xué)的方法,在某個(gè)層面模擬人腦神經(jīng)元網(wǎng)絡(luò)的工作方式,設(shè)置多層彼此勾聯(lián)成網(wǎng)絡(luò)的計(jì)算單位(如輸入層—隱藏單元層—輸出層等)。由此,全網(wǎng)便可以通過某種類似于“自然神經(jīng)元間的電脈沖傳遞,導(dǎo)致后續(xù)神經(jīng)元觸發(fā)”的方式,逐層對(duì)輸入材料進(jìn)行信息加工,最終輸出某種帶有更高層面的語義屬性的計(jì)算結(jié)果。至于這樣的計(jì)算結(jié)果是否符合人類用戶的需要,則取決于人類編程員如何用訓(xùn)練樣本,去調(diào)整既有網(wǎng)絡(luò)各個(gè)計(jì)算單位之間的權(quán)重(參見圖1)。⑤

圖1 高度簡化的人工神經(jīng)元網(wǎng)絡(luò)結(jié)構(gòu)模型

大致而言,在人工神經(jīng)元網(wǎng)絡(luò)的上述運(yùn)作流程中,人類成見主要有三個(gè)機(jī)會(huì)介入系統(tǒng)的運(yùn)作:(甲)通過精心設(shè)計(jì)系統(tǒng)的訓(xùn)練樣本(尤其是通過對(duì)輸入添加大量標(biāo)簽)來向系統(tǒng)“喂入”某些對(duì)于問題求解來說非常重要的先驗(yàn)知識(shí);(乙)通過預(yù)先給出的理想解規(guī)定系統(tǒng)的學(xué)習(xí)目標(biāo);(丙)通過預(yù)先給出的反饋算法來規(guī)定系統(tǒng)的權(quán)重調(diào)整方式。但是,雖然通過這些手段,人類設(shè)計(jì)者姑且能夠粗略地調(diào)整系統(tǒng)的性能,但人類設(shè)計(jì)者往往并不是特別清楚為何特定的系統(tǒng)參數(shù)變化能夠?qū)е孪到y(tǒng)運(yùn)作性能的變化——這一點(diǎn)在人工神經(jīng)元網(wǎng)絡(luò)的內(nèi)部架構(gòu)已經(jīng)空前復(fù)雜的今天,則顯得尤其凸出,這也是人工神經(jīng)元網(wǎng)絡(luò)算法時(shí)常被稱為“黑箱算法”的原因。從這個(gè)角度看,一個(gè)得到充分訓(xùn)練的人工神經(jīng)元網(wǎng)絡(luò)固然在某種意義上可以說是“復(fù)制了人類的成見”,但富有諷刺意味的是,人類設(shè)計(jì)者自身也說不清它們是如何完成這種復(fù)制的。更重要的是,對(duì)人工元神經(jīng)網(wǎng)絡(luò)的初始輸入進(jìn)行人工標(biāo)注,往往會(huì)消耗人類程序大量的精力,同時(shí),在隱藏計(jì)算層的數(shù)量激增的情況下,系統(tǒng)自身消耗的運(yùn)算資源也是驚人的。換言之,與心理學(xué)意義的捷思法對(duì)于人類智能“節(jié)儉性”的彰顯構(gòu)成鮮明對(duì)比的是,目下的神經(jīng)元網(wǎng)絡(luò)—深度學(xué)習(xí)技術(shù)對(duì)于人類成見的復(fù)制機(jī)制,恰恰是建立在海量的數(shù)據(jù)輸入、強(qiáng)大的硬件配置與海量的計(jì)算量之上的。⑥因此,這種意義上的人類成見復(fù)制機(jī)制,在工作原理與工作目的上均與人類自身的心智架構(gòu)相去甚遠(yuǎn),或者說,比起前面提到的GPS對(duì)于捷思法的粗糙刻畫來說,這樣的人工智能設(shè)計(jì)思路其實(shí)顯得更不具有智慧性(如果我們將“智慧”或“智能”理解為在“系統(tǒng)相對(duì)匱乏的環(huán)境資源下對(duì)于環(huán)境的適應(yīng)能力”的話)。

綜合本節(jié)的討論,我們可以得出:目前的主流人工智能研究——無論是符號(hào)主義進(jìn)路的還是聯(lián)接主義進(jìn)路的——都沒有真正消化心理學(xué)界對(duì)于捷思法的研究成果,遑論在這種情況下落實(shí)伽達(dá)默爾關(guān)于“成見”的種種洞見。那么,路在何方呢?

四、總結(jié):走出對(duì)主流人工智能的迷信

通過上節(jié)的分析我們不難發(fā)現(xiàn),就目下的人工智能研究來說,將心理學(xué)研究的捷思法加以算法化的最大障礙,便是對(duì)于語義表征的算法化。而這一問題之所以成為問題,則又是因?yàn)椋阂环矫?,研究捷思法的心理學(xué)家總是預(yù)設(shè)人類心智是具有語義表征能力,而另一方面,人工智能專家又總是傾向于通過剝離語義的方式而將日常生活中的種種具體問題“純化”為形式問題(無論這種形式是數(shù)學(xué)的、邏輯學(xué)的還是統(tǒng)計(jì)學(xué)的)。兩類學(xué)者之間工作理念的這種反差,自然就為人工智能界汲取心理學(xué)界的思想營養(yǎng)制造了觀念上的障礙。不過,我們也應(yīng)當(dāng)看到,在主流的人工智能研究路徑之外,將語義予以算法化的努力其實(shí)早就已經(jīng)出現(xiàn)了。譬如,在美國天普大學(xué)(Temple University)的計(jì)算機(jī)科學(xué)家王培發(fā)明的“納思系統(tǒng)”中,在長期記憶庫中出現(xiàn)的任何一個(gè)詞項(xiàng)的語義都可以通過某種可計(jì)算化的方式得到定義。⑦而且納思系統(tǒng)本身的運(yùn)作也在相當(dāng)程度上基于其自身的系統(tǒng)運(yùn)作歷史,并因?yàn)檫@種依賴性而能夠模擬諸如“錨定捷思法”這樣的人類捷思法。不過,由于篇幅的限制,筆者在此無法充分解釋相關(guān)的技術(shù)細(xì)節(jié)。但不幸的是,盡管筆者在不少場合都提到納思系統(tǒng)的巨大潛力⑧,但它依然沒有得到主流人工智能界的足夠重視。而更令人擔(dān)憂的是,在當(dāng)下的各種媒體平臺(tái)上,對(duì)于主流人工智能技術(shù)路徑(特別是深度學(xué)習(xí)路徑)的吹捧始終不絕于耳,同時(shí),卻很少有人談及,主流人工智能進(jìn)路搭建的計(jì)算框架,實(shí)際上只在一種很微弱的意義上關(guān)涉心理學(xué)家發(fā)現(xiàn)的人類智能架構(gòu)。簡言之,現(xiàn)有的人工智能系統(tǒng)其實(shí)還非?!安幌袢恕薄?/p>

面對(duì)這樣的批評(píng),主流人工智能的辯護(hù)士或許會(huì)說:我們根本不用關(guān)心人工智能的架構(gòu)是否真像人,我們只關(guān)心它的輸出是否能夠滿足人類用戶的需要。但這里的問題便是,如果機(jī)器的“輸入端”與“輸出端”之間的“黑箱”即使在某種非常抽象的層面上都非常不類似于人類自身的心智架構(gòu),我們又可以在多大程度上擔(dān)保其“輸入—輸出”關(guān)系能夠與人類的“輸入—輸出”關(guān)系相互吻合呢?就拿前面討論的神經(jīng)元網(wǎng)絡(luò)系統(tǒng)來說,為何這種系統(tǒng)的良好運(yùn)作,往往要以輸入數(shù)據(jù)的人工標(biāo)注為先驗(yàn)前提,而人類的心智架構(gòu)卻可以容忍那些缺乏人為標(biāo)注的“粗糙輸入”呢?很顯然,除非人工智能專家低下頭來,認(rèn)真向心理學(xué)家學(xué)習(xí),否則“人工智能”作為“人力智能”之裝飾品的本質(zhì)就不會(huì)改變。

主流人工智能的辯護(hù)士或許還會(huì)說,人工智能專家已經(jīng)向各行各業(yè)的人類專家虛心學(xué)習(xí)了——譬如“專家系統(tǒng)”對(duì)各種人類既有專業(yè)知識(shí)的學(xué)習(xí)——為何對(duì)心理學(xué)的學(xué)習(xí)就顯得格外重要呢?在筆者看來,在回答這個(gè)問題之前,復(fù)習(xí)伽達(dá)默爾的詮釋學(xué)資源便非常必要。從伽達(dá)默爾哲學(xué)的立場看,人類的集體智慧是通過某種隱蔽的說服機(jī)制而成為個(gè)體的“前見—成見”的,而個(gè)體與其歷史傳統(tǒng)的不同互動(dòng)方式,也會(huì)為不同意義上的“成見—前見”結(jié)構(gòu)的形成預(yù)備了機(jī)緣。而在目下主流的符號(hào)人工研究智能中,特定專業(yè)學(xué)科領(lǐng)域內(nèi)的人類集體智慧,并不是通過對(duì)于個(gè)體操作系統(tǒng)的“說服”而進(jìn)入長期記憶地址的,而是通過某種極為粗暴的“代碼寫入”方式而成為其先驗(yàn)知識(shí)。同時(shí),對(duì)于同一個(gè)型號(hào)的人工智能系統(tǒng)而言,批量產(chǎn)生的系統(tǒng)之間也分享完全相同的先驗(yàn)知識(shí),故而,在任何一個(gè)這樣的個(gè)體系統(tǒng)與人類的既有智慧之間,就不存在著進(jìn)行任何一種意義上的互動(dòng)的可能性,遑論在這類多重互動(dòng)可能性的基礎(chǔ)上形成不同的“成見—前見”。這也就是說,個(gè)體與歷史之間相互影響而又相互創(chuàng)造的微妙關(guān)系,在現(xiàn)有的主流人工智能系統(tǒng)之中是無法被復(fù)制出來的,除非主流的人工智能專家能夠改弦易轍,轉(zhuǎn)而去嚴(yán)肅對(duì)待個(gè)體心理結(jié)構(gòu)用以獲取“集智”的、作為信息快捷道的種種“捷思法”。

主流人工智能進(jìn)路的辯護(hù)者或許還會(huì)說,我們?yōu)楹我獜?fù)制出所謂的“個(gè)體與歷史之間相互影響而又相互創(chuàng)造的微妙關(guān)系”呢?為何不能始終讓人類開創(chuàng)知識(shí)前進(jìn)的歷史,而始終讓機(jī)器去復(fù)制人類前進(jìn)的腳步呢?對(duì)此,筆者的回答是:從定義上看,這種只能拓印人類前進(jìn)腳步的“人工智能”系統(tǒng)是沒有資格去盜用“智能”的名義的,因?yàn)檎嬲摹爸悄艿摹毙畔⑻幚硐到y(tǒng)的“成見—前見”結(jié)構(gòu)應(yīng)當(dāng)是具有自己的個(gè)性的(如果我們將“個(gè)性”視為“智能”或者“創(chuàng)造性”的題中應(yīng)有之義的話),而人類歷史自身,也恰恰是借由這些個(gè)性化的“成見—前見”結(jié)構(gòu)之間的彼此沖撞,才得以開創(chuàng)出種種新的局面。但在主流的人工智能的成見復(fù)制機(jī)制中,我們卻看不到任何得以創(chuàng)生出真正的新事物的機(jī)緣。而這又是因?yàn)?,在主流的人工智能研究那里,前面提到的“歷史權(quán)威—捷思法—個(gè)體心理史—當(dāng)下決策”的四層架構(gòu)關(guān)系的中間兩層已被抽空,并由此使整個(gè)結(jié)構(gòu)的動(dòng)力學(xué)機(jī)制崩塌。可以毫不夸張地說,未來對(duì)于任何一種真正意義上的人工智能系統(tǒng)的嚴(yán)肅研究,都必須以修復(fù)這個(gè)坍塌的層次結(jié)構(gòu)為前提。

注釋:

①吉仁澤表達(dá)類似觀點(diǎn)的文獻(xiàn)很多,較新的文獻(xiàn)為Gerd Gigerenzer:Simply Rational:Decision Making in the Real World.Oxford:Oxford University Press,2015.

②譬如,當(dāng)被試者要求在5秒內(nèi)計(jì)算8個(gè)數(shù)字的乘積的時(shí)候,這些數(shù)字進(jìn)入被試者視野的次序,就會(huì)對(duì)其估測結(jié)果產(chǎn)生致命影響。當(dāng)數(shù)列是以“1×2×3×4×5×6×7×8”的形式出現(xiàn)的時(shí)候,被試者會(huì)傾向于大大低估算式的值(因?yàn)槭紫瘸霈F(xiàn)的都是小數(shù)),而當(dāng)數(shù)列是以“8×7×6×5×4×3×2×1”的形式出現(xiàn)的時(shí)候,被試者則依然會(huì)傾向于低估算式的值,盡管低估的程度稍有緩解(順便說一句,這個(gè)式子的值為40,320,而被試者第一次估算的平均值是520,第二次估算的平均值是2,250)。

③關(guān)于捷思法問題更全面的心理學(xué)哲學(xué)討論,參見拙著《認(rèn)知成見》,復(fù)旦大學(xué)出版社2015年版。

④對(duì)于該問題的討論文獻(xiàn)很多,綜合性的討論文獻(xiàn)參見David L.Applegateamp;Robert Bixby:The Traveling Salesman Problem:A Computational Study.Princeton:Princeton University Press,2007.

⑤對(duì)于神經(jīng)元網(wǎng)絡(luò)技術(shù)的更詳細(xì)介紹,請(qǐng)參看拙著《心智、語言和機(jī)器——維特根斯坦哲學(xué)和人工智能科學(xué)的對(duì)話》,人民出版社2013年版,第43—53頁。

⑥生物統(tǒng)計(jì)學(xué)家里克(Jeff Leek)最近撰文指出,除非具有海量的訓(xùn)練用數(shù)據(jù),否則深度學(xué)習(xí)技術(shù)就會(huì)成為 “屠龍之術(shù)”,參見Jeff Leek:Don't use deep learning,your data isn't that big,https://simplystatistics.org/2017/05/31/deeplearning-vs-leekasso/。

⑦“納思系統(tǒng)”的英文全稱為“Non-Axiomatic Reasoning System”(非公理推理系統(tǒng)),“NARS”為其縮寫,“納思”為該縮寫的漢語音譯。關(guān)于納思系統(tǒng)的文獻(xiàn)很多,其中最重要的是Pei Wang.Rigid Flexibility:The Logic of Intelligence.Netherlands:Springer,2006。

⑧相關(guān)成果主要集中于拙著 《心智、語言和機(jī)器——維特根斯坦哲學(xué)和人工智能科學(xué)的對(duì)話》,人民出版社2013年版。

[1](德)漢斯·伽達(dá)默爾.真理與方法——哲學(xué)詮釋學(xué)的基本特征(上卷)[M].洪漢鼎,譯.上海:上海譯文出版社,1999.

[2]Amos Tversky,Daniel Kahneman.Judgment under Uncertainty:Heuristics and Biases.Science,1974,(185).

[3]Amos Tversky,Daniel Kahneman.A v ailability:A heuristic for judging frequency and probability.Cognitive Psychology,1973,(2).

[4]Norbert Schwarz et al.Ease of retrieval as information:Another look at the availability heuristic.Journal of Personality and Social Psychology,1991,(2).

[5]Gerd Gigerenzer et al.Simple Heuristics that Make Us Smart.Oxford:Oxford University Press.

[6]Thomas Cormen et al.Introduction to Algorithms(the Third Edition).Cambridge,MA:The MIT Press,2009.

[7]G.Gutin,A.Yeo,A.Zverovich.Traveling Salesman should not be Greedy:Domination Analysis of Greedy-type Heuristics for the TSP.Discrete Applied Mathematics,2002,(117).

[8]A.Newell,J.C.Shaw,H.A.Simon.Report on a General Problem-Solving Program.Proceedings of the International Conference on Information Processing,1959.

【責(zé)任編輯:趙 偉】

根據(jù)伽達(dá)默爾的哲學(xué)詮釋學(xué)思想,“成見”是人類個(gè)體借以獲取集體智慧之結(jié)晶,以便彌補(bǔ)個(gè)體理性之不足的重要途徑,因此,俗常人們賦予“成見”的種種負(fù)面印象,在相當(dāng)程度上是有所偏頗的。而當(dāng)代心理學(xué)對(duì)于“捷思法”的研究,則可以被視為對(duì)于伽達(dá)默爾的“成見”觀的有益補(bǔ)充,因?yàn)樗^“捷思法”,在本質(zhì)上就可以被視為心理主體調(diào)取歷史信息資源的某些心理捷徑。然而,盡管人造的信息處理系統(tǒng)像人類心理結(jié)構(gòu)一樣,肯定也會(huì)遭遇到“決策資源不足”問題的困擾,伽達(dá)默爾的“成見”論與心理學(xué)界對(duì)于“捷思法”的研究成果的精髓,卻一直沒有被主流人工智能界所吸取。毋寧說,目前主流人工智能所運(yùn)用的“捷思法”在運(yùn)作機(jī)制上是與人類“捷思法”相去甚遠(yuǎn)的,因?yàn)榍罢呒炔荒芟袢祟悺敖菟挤ā蹦菢颖碚髡Z義,也不能像人類“捷思法”那樣體現(xiàn)心理系統(tǒng)自身的運(yùn)行歷史。從這個(gè)角度看,目前的主流人工智能系統(tǒng)缺乏“在決策資源匱乏的情況下靈活應(yīng)對(duì)環(huán)境壓力”的能力。

B017

A

1004-518X(2017)10-0005-13

國家社科基金項(xiàng)目“自然語言的智能化處理與語言分析哲學(xué)研究”(13BZ X023)、國家社科基金重大項(xiàng)目“基于信息技術(shù)哲學(xué)的當(dāng)代認(rèn)識(shí)論研究”(15ZDB020)

徐英瑾,復(fù)旦大學(xué)哲學(xué)學(xué)院教授、博士生導(dǎo)師。(上海 200433)

猜你喜歡
伽達(dá)默爾錨定人工智能
錨定三個(gè)聚焦 深化專項(xiàng)整治
一種門座起重機(jī)回轉(zhuǎn)自動(dòng)錨定裝置
錨定轉(zhuǎn)型目標(biāo) 奮力爭先進(jìn)位——“兩會(huì)”上的農(nóng)谷聲音
岸邊集裝箱起重機(jī)錨定裝置研究
2019:人工智能
人工智能與就業(yè)
數(shù)讀人工智能
下一幕,人工智能!
伽達(dá)默爾解釋學(xué)中的內(nèi)在話語
論伽達(dá)默爾的經(jīng)典觀