評杰弗里決策邏輯對紐科姆難題的解決

2015-08-20 03:38:44李莉

湖北大學(xué)學(xué)報（哲學(xué)社會科學(xué)版） 2015年4期

李莉

（湖北大學(xué)哲學(xué)學(xué)院，湖北武漢430062）

一、紐科姆難題對決策理論的挑戰(zhàn)

紐科姆難題是一個與合理行動相關(guān)的決策困境問題。處于紐科姆難題決策情形中的決策者，根據(jù)決策理論中的兩個基本原則——最大化效用原則和占優(yōu)策略原則，得出了完全相反的兩個答案，使得決策者無法確定什么才是合理的行動。

物理學(xué)家威廉·紐科姆（W．Newcomb）在考慮囚徒困境問題的過程中，首先構(gòu)造出紐科姆難題。羅伯特·諾齊克（R．Nozick）了解到這個難題后，于1969年撰寫了一篇著名的論文《紐科姆難題和決策的兩個原則》[1]65～72，標(biāo)志著紐科姆難題的正式提出。

紐科姆難題體現(xiàn)了作為決策論中最重要且最基本的兩個原則，也就是最大化效用原則與占優(yōu)策略原則之間的沖突。諾齊克在《理性的性質(zhì)》一書中談到紐科姆疑難研究之意義時寫道：

經(jīng)濟(jì)學(xué)家和統(tǒng)計學(xué)家已經(jīng)發(fā)展出一種有關(guān)合理決策的精心制作的理論，并將其廣泛運用到理論與政策研究之中。這是一種具有數(shù)學(xué)嚴(yán)格性的，既強(qiáng)有力而又容易掌握的理論。雖然它作為實際行為的描述之充分性已受到廣泛質(zhì)疑，它仍然是有關(guān)合理決策所應(yīng)滿足條件之研究中居于支配地位的標(biāo)準(zhǔn)理論。我認(rèn)為，這種標(biāo)準(zhǔn)決策理論需擴(kuò)充到與行為的符號意義及其他有關(guān)因素的明晰思考相結(jié)合，而關(guān)于當(dāng)前標(biāo)準(zhǔn)理論之不充分性認(rèn)識的一個有益入口，是由紐科姆問題提供的。[2]222

在學(xué)界，紐科姆難題因此引起了廣泛的關(guān)注。

紐科姆難題有很多版本，以下采自諾齊克最原始的表述：

假定一個擁有超能力的生物，他能夠預(yù)測你的選擇（或者你也可以把它想象成一個科幻故事中外星來的生物，擁有先進(jìn)的科學(xué)技術(shù)，同時也是非常友好的等等）。你知道這個生物過去常常能正確地預(yù)測出你的選擇（至少到目前為止，對你的選擇沒有做過錯誤的預(yù)測）。此外，你還知道這個生物經(jīng)常正確地預(yù)測到其他人的選擇，而且其中很多人都處于與你類似的情形中。現(xiàn)在有兩個盒子：盒子B1和盒子B2。B1是透明的，里面有1000美元。B2是不透明的，里面有100萬美元，或者什么也沒有。B2里面是否有錢取決于接下來發(fā)生的事情。首先，超級生物做出預(yù)測。他知道你面臨兩個選擇，或者拿走兩個盒子，或者只拿走盒子B2。接下來，（1）如果生物預(yù)測到你會拿走兩個盒子，他就不把100萬美金放在B2里。（2）如果生物預(yù)測到你只拿走B2，他就會放100萬美元在里面。于是首先由超級生物作出預(yù)測，然后把錢放進(jìn)B2，或者沒有放，取決于他是怎么預(yù)測的?，F(xiàn)在輪到你來做決策，你知道超級生物知道的信息。你會怎么做？

在紐科姆難題的決策情形中，決策者必須在兩個可能的行動中作出決定，這意味著有兩種可能的世界狀態(tài)。據(jù)此，諾齊克給出了兩個相反的但是同樣合理的論證。根據(jù)最大化效用原則建議，應(yīng)該是只拿走一只盒子，也就是盒子B2。根據(jù)占優(yōu)策略原則的建議，應(yīng)該是拿走兩只盒子。

以下是諾齊克的“一盒論”論證：（T表示時間，數(shù)字越大，表示時間越晚；數(shù)字相同，表示時間一樣。）

前提1：如果我在T3拿走兩只盒子，預(yù)言家將會在T1以很高的概率預(yù)測到這些，并且在T2不往B2里面放錢，所以我?guī)缀跄艽_定地拿到1000美元。

前提2：如果我在T3拿走B2，預(yù)言家會在T1以很高的概率預(yù)測到這些，并在T2放100萬美元在B2里，所以我?guī)缀跄艽_定地拿到100萬美元。

結(jié)論：因此我應(yīng)當(dāng)拿走B2。

論證過程：令C表示置信度，a1表示拿走兩只盒子，a2表示拿走盒子B2，s1表示盒子里面有100萬美元，s2表示盒子里面沒有錢，此時決策者的置信度為：

并且假定決策者可能收益的效用是和可能結(jié)果成線性增長，那么可能行動a1和a2的條件效用是這樣計算的，其中CU表示期望效用，a1表示拿走兩只盒子，a2表示拿走盒子B2：

因為CU（a2）比CU（a1）高，最大化條件效用原則推薦拿走盒子B2。

以下是諾齊克的“2盒論”論證：

前提1：預(yù)言者已經(jīng)在T1做出了他的預(yù)言，把100萬美元在T2放入了B2中，或者沒放。

前提2：假定預(yù)言者T2時在B2中已經(jīng)放入100萬美元，如果你在T3時拿走兩個盒子，你將得到1，001，000美元，如果你在T3時拿走B2，你將得到100萬美元。

前提3：假定預(yù)言者T2時在B2中不放錢，如果你在T3時拿走兩只盒子，那你得到1000美元，如果我在T3時拿走一只盒子，那你得不到錢。

前提4：如果你拿走兩只盒子而不是一只，那么任何情況下，你都能多得1000美元。

結(jié)論：因此你應(yīng)當(dāng)拿走兩只盒子。

假定對決策者而言，1000美元的效用比0美元的效用高，1，001，000的效用比1，000，000的效用高。拿走兩只盒子的行動明顯優(yōu)于拿走一只盒子，所以占優(yōu)策略原則推薦拿走兩只盒子。

這兩個論證，在同一決策情形中，給出了完全相反的建議。諾齊克認(rèn)為這體現(xiàn)了合理決策行動中兩個決策原則之間的沖突，也就是期望效用最大化原則和占優(yōu)原則之間的沖突。

二、杰弗里系列解決方案之考量

紐科姆難題提出以后，很多學(xué)者都用大量的精力和時間來提出解決方案。這些解決方案主要分為三個途徑：其一，以杰弗里、艾爾斯方案為代表的證據(jù)決策方向；其二，以吉伯德和哈珀方案為代表的因果決策方向；第三，以諾齊克方案為代表的折衷調(diào)和方向。

紐科姆難題是于1969年提出的，而杰弗里的決策邏輯是1965年提出的，嚴(yán)格地說，它應(yīng)該不算是紐科姆難題的解決方案。然而，根據(jù)杰弗里的決策邏輯，可以在紐科姆難題中得到只拿走一只盒子的解決方案，因此，從這個意義上，也可以把它算作一種方案。

杰弗里后來（1983、1988、1996）的方案則更為清楚地處理了紐科姆難題。他把紐科姆難題看做是自己提出的決策邏輯的反例，從而在1983年提出了可能行動效用的新定義，以及一個不同的最大化原則，與他原來的決策邏輯背道而馳。然而他的新理論，也遇到和紐科姆難題不同的反例。于是1988年，杰弗里又回歸到他的決策邏輯立場，宣稱他的邏輯足夠給紐科姆難題以解決方案，但有一個前提，就是紐科姆難題要在兩個層面上進(jìn)行概率化：第一個層面是決策者拿走盒子B2或者拿走兩只盒子的未知概率，而另一個層面是決策者的可信度，決策者的可信度有助于了解這個未知的概率是多少。1996年杰弗里通過對決策者的置信度添加限制條件來改進(jìn)了他的決策邏輯，并提出了對紐科姆難題的解決方案。

1.杰弗里1965年的解決方案[3]

杰弗里1965年的解決方案是基于他的決策邏輯而提出的。他指出，決策者的置信度和效用應(yīng)當(dāng)服從克格莫洛夫的三條公理和他本人提出的效用公理。這四條公理一起推出的結(jié)果與杰弗里計算可能行動的條件效用結(jié)果是一致的，決策者應(yīng)當(dāng)使用下面的方式來計算可能行動的條件效用：

如果C（ai）>0，那么

此外，決策者應(yīng)當(dāng)使用最大化條件效用原則。在紐科姆難題中，分別計算拿兩只盒子的條件效用，和拿走B2的效用相比，B2的條件效用更高，因此，決策者應(yīng)當(dāng)拿走B2。

然而，杰弗里的決策邏輯提供的解決方案在紐科姆難題上連杰弗里本人都不滿意。這個方案是不準(zhǔn)確的，因為它給出了錯誤的建議，也就是只拿走盒子B2。這個錯誤根源于杰弗里決策邏輯自身所具有的兩個缺點：第一，在他的理論中并沒有考慮因果關(guān)系；第二，根據(jù)他的理論，每個可能的世界狀態(tài)的分區(qū)都是允許的。不克服這兩個缺點，是很難得出正確答案的。

實際上，杰弗里此時的決策邏輯具有如下特點：

（1）理論是非因果的。杰弗里之所有沒有使用因果關(guān)系，是因為他認(rèn)為只有在賭博中才使用因果關(guān)系，因果關(guān)系取決于打賭雙方對彼此的信任以及雙方是否能夠兌現(xiàn)諾言的能力。比如，我出1美元跟你打賭，如果C出現(xiàn)，給你1美元；如果C不出現(xiàn)，你給我1美元。你接受了這個賭局。A這個命題就是：當(dāng)知道C的真假之后，你給我1美元；B這個命題就是：當(dāng)知道C的真假之后，我給你1美元。這樣我們就在CAB之間建立了一個因果關(guān)系。杰弗里指出這種因果關(guān)系和命題（如果油箱沒油，那么汽車無法啟動）之間所具有的因果關(guān)系是一樣的。因此，杰弗里認(rèn)為，如果在決策中使用因果關(guān)系，就很難對命題的偏好進(jìn)行排序。這有一個例子說明這一點。假定有三個命題：A.下個星期有核戰(zhàn)；B.下個星期天氣晴朗；C.硬幣朝上。然后有一個打賭，如果C，那么B；如果不是C，那么A。杰弗里認(rèn)為在這個賭局中，決策者就沒辦法對他的偏好進(jìn)行排序。

（2）決策者可以任意區(qū)分可能的世界狀態(tài)。在杰弗里的偏好理論中，決策者對可能世界狀態(tài)可以進(jìn)行任意的分區(qū)。其原因在于無論用何種方式區(qū)分，決策者對可能行動效用的計算都會導(dǎo)出同樣的結(jié)果。

（3）決策者對他的可能行動可以指派置信度。因為用命題來表示可能行動，從而決策者可以給可能行動指派置信度。如果決策者相信，他可以實現(xiàn)一個可能行動，那么他指派的置信度為1。在杰弗里的公式中，置信度是大于0的。如果決策者不能確定一個可能行動是否為真，就要給這個可能行動賦予很低的概率，而不能為0。

（4）根據(jù)理論，可以在信息來源中建立偏好。主體采取某種行動不能簡單地描述為使命題B為真，而應(yīng)當(dāng)描述為改變兩個或更多的命題概率，從prob B1，prob B2，…，prob Bn成為PROB B1，PROB B2，…，PROB Bn。因此在行動中，決策者相信如果他想要的話，就能使得一個可能行動為真。在概率行動的情況中，決策者相信他無法控制使得一個可能的行動為真，只能試圖使它為真。可能行動A1的效用比可能行動A2的高，就是指在決策者的偏好排序中，可能行動A1高于A2。也就是說，這意味著決策者更歡迎A1所帶來的信息。據(jù)此，杰弗里建立了信息間的偏好。此外，這種理解也解釋了矛盾的命題不可能在命題的偏好排序中出現(xiàn)。同時也解釋了為什么必要的命題不傳遞任何信息。因為這肯定是真的。A在必要的命題中排序最低，意味著A是不好的信息；對決策者而言，相對于A是真的消息，其他的消息都是好消息。A的排序最高，意味著與A是真的這個好消息相比，其他的消息都不是壞消息。A的排序是必要的，意味著決策者對A是否為真無動于衷。

（5）理論中有一個表征性定理。這構(gòu)成杰弗里決策邏輯的核心。

（6）指出決策者應(yīng)當(dāng)服從最大化條件效用原則。

2.杰弗里1983年的解決方案

1983年，杰弗里對他的決策邏輯進(jìn)行了反思，認(rèn)為紐科姆難題是他的理論的一個反例，原因有兩個：（1）他認(rèn)為他的最大化條件效用原則在紐科姆問題上給出了錯誤的答案，也就是選擇拿走一只盒子；（2）杰弗里指出，如果決策被看做是可能世界狀態(tài)的證據(jù)，在這些世界中可能的行動不會發(fā)生，也不能被阻止，那么此時他的決策邏輯就是錯誤的。

據(jù)此，他提出了可接受主義理論?？山邮苤髁x的核心是什么呢？杰弗里說：“一個理性的決策就是這樣一個決策，當(dāng)主體最終決定如果實施這個行動，根據(jù)他所認(rèn)為的概率矩陣，能夠使預(yù)估的目標(biāo)最大化，那么理性的決策就是實施這個行動。”[4]25

可接受主義指出決策者的最終決策是可能世界狀態(tài)的證據(jù)，或者是其他決策者的可能行動的證據(jù)。因此，基于這個假定，一個可能行動的效用就可以用下面的方式來計算：（此處sj指稱可能世界狀態(tài)，或者任何與不同決策問題相關(guān)的決策者的可能行動，dai指稱這樣一個命題，就是決策者最終決定采取的決策[4]16。）

如果c（dai）>0，那么

在紐科姆難題中，如果我們用行動A1表示在T3時刻拿走兩只盒子，A2表示在T3拿走B2，S1表示預(yù)言者在T1預(yù)言我拿走兩只盒子，在T2不往盒子里放東西，S2表示預(yù)言者在T1預(yù)計到我會拿走B2里的東西，從而在T2時往B2中放入100萬美元，那么，根據(jù)可接受主義原則的計算，拿走兩只盒子的決策效用大于拿走一只盒子的效用，從而拿走兩只盒子的決策是理性的。

可接受主義理論也并非完美，杰弗里自己指出他的可接受主義理論有以下幾個缺點：第一，有些決策問題中，沒有可接受的決策。第二，有些決策問題中，所有的決策都是可接受的?！耙粋€主體可能會發(fā)現(xiàn)所有的行動都是理性的，因為對任何行動的選擇都能使他預(yù)估的愿望最大化——不是通過改變條件概率，而是通過增加支付矩陣中的意向”[4]190。在這種情況下，理性決策的數(shù)值不一定就是1，決策者應(yīng)當(dāng)在做決策前，重新評估他的信念和愿望。第三，范·弗拉森（van Fraassen）認(rèn)為，在一些決策問題中，有些值得選擇的可能行動并非是可接受的。作為可能世界狀態(tài)的證據(jù)，或者是其他決策者的可能行動的證據(jù)，有些可能行動比最終決策好。

除此以外，由于引進(jìn)了最終決策這個術(shù)語，使得杰弗里的可接受主義和因果決策理論一樣復(fù)雜。

總而言之，在紐科姆問題中，杰弗里的可接受主義理論提出了正確的解決方案，但是對決策者而言，他要求了太多的自我知識。此外，這個理論的應(yīng)用有限制，不是一個在所有場合都能使用的合理決策理論。最后，這不是一個經(jīng)濟(jì)的合理決策理論。由于引進(jìn)了最終決策這一概念，可接受主義理論和因果決策理論一樣不經(jīng)濟(jì)。

3.杰弗里1988年的概率主義解決方案

鑒于可接受主義的缺點，杰弗里又回到他1965年的立場，采用了概率主義。他寫道：“一旦我們發(fā)現(xiàn)這里實際上是最終偏好起作用，那么如果紐科姆難題能夠在兩個層面上概率化，第一版（1965）決策邏輯中所提出的證據(jù)決策理論似乎是令人滿意的。”[5]241

杰弗里認(rèn)為他的概率主義既有可接受主義的優(yōu)點，又避免了范·弗拉森的反例。杰弗里的論證過程比較復(fù)雜，因為篇幅所限，這里只給出杰弗里計算最終條件效用的公式：

如果cn（ai）>0，那么

此時決策者應(yīng)當(dāng)采用最大化最終條件效用原則：在給定的決策情形D中，決策者X1應(yīng)當(dāng)采用能夠使最終條件效用最大化的可能行動。

在紐科姆問題上，杰弗里的概率主義給出了正確的解決方案。然而杰弗里計算最終條件效用的公式是不對的，因為它使用了最終置信度來評價可能行動。

4.杰弗里1996年的線性動態(tài)決策理論[6]3～19

1996年，杰弗里提出了第四個方案即線性動態(tài)決策理論來解決紐科姆難題。根據(jù)線性動態(tài)理論，杰弗里認(rèn)為紐科姆難題根本就不是一個決策問題。

對此觀點，詹姆士·M．喬伊斯[7]指出，杰弗里之所以認(rèn)為紐科姆難題不是決策問題，因為處于紐科姆難題中的主體，擁有的關(guān)于他們的行動和世界關(guān)系之間關(guān)系的證據(jù)是如此之多，使得他們不能把選擇當(dāng)做是收益的原因，在這個意義上他們本身是沒有自由選擇的。然而杰弗里的推理是錯誤的，因為他沒有認(rèn)識到主體關(guān)于他的可供選擇的信念，是與這些行動的原因密切相連的，以至于他可以制造證據(jù)，來權(quán)衡行動和世界狀態(tài)之間的關(guān)系。

當(dāng)然杰弗里不是唯一一個認(rèn)為紐科姆難題不是決策問題的人。卡基爾[8]、伽登納[9]、麥基[10]和施耐辛格[11]也得出了同樣的結(jié)論。

麥基認(rèn)為紐科姆問題不是一個決策問題的理由是：要求參與人在一次博弈中有一個真正的開放的選擇，其中既沒有作弊，也沒有逆向因果，從而使得預(yù)言者成功的預(yù)言是順理成章的這樣的要求實際上根本無法得到滿足。

施耐辛格的理由是沒有人能夠預(yù)測出自由決策。因為即使決策者非常傾向于拿走B2，即使預(yù)測者知道這些，決策者依然可以使用他意志的力量來抵制這種傾向，從而拿走兩只盒子。

三、結(jié)語

杰弗里從1965年至1996年間，在紐科姆問題上的觀點發(fā)生了很多轉(zhuǎn)變，這種對自己理論進(jìn)行反思的精神是非常值得敬佩的。對他的觀點以及解決方案雖然可以有不同的立場，然而他的努力推動了決策邏輯的發(fā)展，這是不容忽視的事實。

［致謝］本文還得到了湖北大學(xué)高校文化資源服務(wù)社會專項研究課題（課題號：0b075060）資助，特此致謝！

[1]Nozick，R．Newcomb’s Problem and Two Principles of Choice[M]//N．Rescher，D．Davidson，C．G．Hempel．Essays in Honor of Carl G．Hempel．Dordrecht：Reidel，1969．

[2]張建軍．邏輯悖論研究引論[M]．南京：南京大學(xué)出版社，2002．

[3]Jeffrey，R．C．The Logic of Decision[M]．New York：McGraw-Hill，1965．

[4]Jeffrey．R．C．The Logic of Decision（second edition）[M]．Chicago and London：The University of Chicago Press，1983．

[5]Jeffrey，R．C．How to Probabilize a Newcomb Problem[M]//J．H．Fetzer．Probability and Causality．Dordrecht：Reidel，1988．

[6]Jeffrey．R．C．Decision Kinematics[M]．K．J．Arrow，E．Colombatto，M．Perlman，C．Schmidt．The Rational Foundations of Economic Behaviour．Basingstoke：Macmillan，1996．

[7]James M．Joyce．Are newcomb problems really decisions?[J]．Synthes，2007，（156）．

[8]Cargile．J．Newcomb’s Paradox[J]．British Journal for the Philosophy of Science，1975，（26）．

[9]Gardner．M．Free Will Revisited，with a Mind-Bending Prediction Paradox by William Newcomb[J]．Scientific American，1973，（229）．

[10]Mackie．J．L．Newcomb’s Paradox and the Direction of Causation[J]．Canadian Journal of Philosophy，1977，（7）．

[11]Schlesinger．G．The Unpredictability of Free Choices[J]．British Journal forthe Philosophy of Science，1974，（25）．

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡