鐘永梅
摘 要:本文通過(guò)介紹貝葉斯統(tǒng)計(jì)推斷,并對(duì)貝葉斯方法在認(rèn)知領(lǐng)域的應(yīng)用進(jìn)行綜述,從因果推理、類別推斷、語(yǔ)言學(xué)習(xí)、動(dòng)作控制等方面,介紹其理論意義和對(duì)認(rèn)知領(lǐng)域研究的推動(dòng)作用,并對(duì)今后的研究方向進(jìn)行展望。
關(guān)鍵詞:貝葉斯方法;認(rèn)知領(lǐng)域;綜述
貝葉斯統(tǒng)計(jì)推斷在統(tǒng)計(jì)學(xué)中的影響雖遠(yuǎn)不能與經(jīng)典推斷統(tǒng)計(jì)相抗衡,但因其深厚的數(shù)學(xué)基礎(chǔ)和注重先驗(yàn)知識(shí)在推斷中的作用等特點(diǎn),一直被統(tǒng)計(jì)學(xué)家所推崇。近二十年來(lái),隨著計(jì)算資源、理論工具和學(xué)科間聯(lián)系的日益緊密和完善,貝葉斯推斷統(tǒng)計(jì)的研究和應(yīng)用都得到長(zhǎng)足的發(fā)展。
一、貝葉斯方法簡(jiǎn)介
貝葉斯推斷統(tǒng)計(jì)建立在貝葉斯定理的基礎(chǔ)上。貝葉斯定理是關(guān)于條件概率的逆概率規(guī)則,解釋如何從給定b時(shí)a的條件概率得到給定a時(shí)b的條件概率。貝葉斯定理可以簡(jiǎn)單表述為后驗(yàn)概率與先驗(yàn)概率和可能性的乘積成比例。貝葉斯統(tǒng)計(jì)推斷就是使用先驗(yàn)概率和樣本得出后驗(yàn)概率,在后驗(yàn)概率的基礎(chǔ)上進(jìn)行推斷統(tǒng)計(jì)的方法。陳希孺(1999)認(rèn)為:“貝葉斯方法的基本思想是,不論你做出何種推斷,都只能基于后驗(yàn)分布,即由后驗(yàn)分布所決定”。
二、貝葉斯方法在認(rèn)知科學(xué)中的應(yīng)用
1.因果推理
在因果推理方面的研究可能是貝葉斯推斷統(tǒng)計(jì)在認(rèn)知領(lǐng)域最引人矚目的貢獻(xiàn)。Cheng(1997)的因果能量(power)模型將人們關(guān)于因果關(guān)系的判斷解釋為在一個(gè)簡(jiǎn)單的貝葉斯網(wǎng)絡(luò)中的參數(shù)估計(jì)過(guò)程。Griffiths&Tenenbaum(2005)則在區(qū)分了因果結(jié)構(gòu)和因果關(guān)系強(qiáng)度的基礎(chǔ)上得出了因果支持模型,更精確地解釋了以往因果推理研究所得的數(shù)據(jù),還可以解釋以往的理論所不能解釋的諸如背景原因?qū)е碌姆菃握{(diào)效應(yīng),數(shù)據(jù)不完整時(shí)被試的因果推理表現(xiàn)等。
2.類別特征推斷
Kemp,Perfors,&Tenenbaum(2007)關(guān)于特征推斷過(guò)程的研究假定自然界里的物種按照樹(shù)形結(jié)構(gòu)來(lái)分類,物種間的不同特征在樹(shù)形結(jié)構(gòu)中以漸變方式產(chǎn)生,這個(gè)漸變過(guò)程為特征(在不同物種之間)的不同拓展方式提供了先驗(yàn)分布。他們認(rèn)為特征的拓展采取一種平滑的方式來(lái)進(jìn)行:在樹(shù)形結(jié)構(gòu)中相鄰近的物種更容易有相同的特征。如果大猩猩所具有的某個(gè)特征,那么猴子就比鯊魚(yú)更可能具有這個(gè)特征。特征的拓展方式可能有樹(shù)形、簇形、線形等不同的先驗(yàn)分布形式,使用不同的先驗(yàn)分布可以解釋特征推斷研究中的不同概括方式。
3.語(yǔ)言學(xué)習(xí)
Xu,Tenenbaum(2007)關(guān)于單詞學(xué)習(xí)方面的研究主要著眼于低層次的P(數(shù)據(jù)/結(jié)構(gòu))階段。將單詞學(xué)習(xí)看作一個(gè)理性地抽取假設(shè)并進(jìn)行推理的貝葉斯推斷過(guò)程。他們發(fā)現(xiàn)在給定樣例的基礎(chǔ)上要求被試概括出新單詞的情景中,4歲兒童和成人都表現(xiàn)出一種“一對(duì)三矛盾”:被試在面對(duì)相對(duì)少(一個(gè))樣例時(shí)比在面對(duì)相對(duì)多(三個(gè))樣例時(shí)更傾向于得到更高程度的概括。Chater N, Manning CD(2006)使用貝葉斯方法描述了產(chǎn)生不同的語(yǔ)法結(jié)構(gòu)及其概率的過(guò)程以及語(yǔ)法與單詞串之間的聯(lián)系,這些信息反過(guò)來(lái)可用于從一串單詞中推斷出語(yǔ)法結(jié)構(gòu)。他們認(rèn)為:“從貝葉斯的角度看,每個(gè)候選的語(yǔ)法都有一個(gè)先驗(yàn)概率,這些先驗(yàn)概率經(jīng)由新的經(jīng)驗(yàn)而調(diào)整(得到后驗(yàn)概率)……學(xué)習(xí)者應(yīng)該會(huì)選擇一個(gè)有更高,可能是最高,后驗(yàn)概率的語(yǔ)法?!?/p>
4.動(dòng)作控制
在控制我們的動(dòng)作時(shí),Ko¨rding&Wolpert(2004)認(rèn)為人們?yōu)榱俗龀鲎罴逊磻?yīng)必須將關(guān)于任務(wù)的先驗(yàn)知識(shí)和感覺(jué)輸入中得到的可能性結(jié)合起來(lái),得到網(wǎng)球最有可能的落地和反彈方式。他們用實(shí)驗(yàn)說(shuō)明被試表現(xiàn)出與貝葉斯方法所作出的預(yù)測(cè)相似的動(dòng)作方式。
5.視自覺(jué)
Yuille&Kersten(2006)認(rèn)為面對(duì)復(fù)雜而模糊的自然圖像,視知覺(jué)過(guò)程可以看作是一個(gè)反向推理過(guò)程:從圖像出發(fā)估計(jì)產(chǎn)生圖像的要素。理解這一過(guò)程的理論原則就是建立在貝葉斯推斷(定義了各個(gè)結(jié)構(gòu)化表征的概率分布)基礎(chǔ)上的綜合分析方法。綜合分析包含了關(guān)于目標(biāo)和背景的結(jié)構(gòu)化的高水平的假設(shè),這些假設(shè)經(jīng)由一個(gè)自上而下的與自然圖像直接比較的過(guò)程而被接納或拒絕。這些假設(shè)在產(chǎn)生時(shí)就帶有一個(gè)概率(代表其信號(hào)強(qiáng)度),如果某個(gè)假設(shè)的信號(hào)強(qiáng)度足夠大,那它就可能在低水平上被接受而不需要任何高水平的確認(rèn)。
三、尚待開(kāi)發(fā)的領(lǐng)域
從宏觀角度來(lái)看,貝葉斯方法在計(jì)算水平方面取得了可喜的成績(jī),但在算法水平和執(zhí)行水平方面就不如某些聯(lián)結(jié)主義模型有優(yōu)勢(shì)。貝葉斯模型需要進(jìn)一步解決如何表征復(fù)雜的問(wèn)題情境,如何解釋和模擬問(wèn)題解決過(guò)程中大腦神經(jīng)細(xì)胞的活動(dòng)等問(wèn)題。
從微觀角度來(lái)看,研究主題包括觀念學(xué)習(xí)和單詞獲得的貝葉斯模型是否可與獲得語(yǔ)法的貝葉斯模型融合來(lái)為語(yǔ)言發(fā)展提供一個(gè)統(tǒng)一的研究方法,人類大腦為何經(jīng)常可以從很有限的數(shù)據(jù)出發(fā)做出正確的預(yù)測(cè)和概括,如何簡(jiǎn)化復(fù)雜模型中的計(jì)算量等問(wèn)題需要進(jìn)一步的研究來(lái)解答。