許萬承
摘 要:蒙提霍爾悖論自被提出至今已有近五十年的歷史,由于其簡(jiǎn)單易懂卻又違反日常直覺的特性,長(zhǎng)期受到學(xué)界內(nèi)外廣泛討論。然而學(xué)者們普遍關(guān)注該悖論的形成機(jī)制以及解悖方案,而對(duì)該悖論所顯露的信息不對(duì)稱問題有所忽視。故本文將對(duì)蒙提霍爾悖論予以介紹,揭露該悖論中存在的信息不對(duì)稱在問題,并借此對(duì)經(jīng)濟(jì)學(xué)中的理性人假設(shè)做出要批判。
關(guān)鍵詞:蒙提霍爾悖論 理性人假設(shè) 信息不對(duì)稱
一、蒙提霍爾悖論的來源
蒙提霍爾悖論又稱三門悖論,最初來源于美國(guó)一個(gè)廣受歡迎的電視節(jié)目“讓我們來做交易”。該節(jié)目要求參與者從三扇關(guān)閉的門中做出選擇,三扇門中有兩扇后面藏著山羊,一扇則藏著汽車。如果參與者選中了藏著汽車的那扇門,那么他將會(huì)獲得獎(jiǎng)品,沒有選中就會(huì)被宣告失敗。為了使節(jié)目更一波三折,在參與者選定一扇門之后,主持人蒙提·霍爾并不急于宣布結(jié)果,而是會(huì)打開沒有被選擇的兩扇門中的一扇,由于主持人知道每扇門后面的情況,所以可以保證打開的門后面藏著的是山羊。然后再詢問參與者,是否要變更自己的選擇:堅(jiān)持原來選定的門,還是改換成剩下那個(gè)沒被選擇的門。
原本這個(gè)節(jié)目雖受歡迎,卻并沒有形成對(duì)參與者是否應(yīng)該換門這一行為策略的嚴(yán)肅思考,直到有好事者給號(hào)稱“最聰明的女人”的專欄作家瑪麗蓮?fù)陡?,詢問參與者的最佳決策?,旣惿徎貜?fù)的是應(yīng)該選擇換門,這樣獲勝的概率將會(huì)是不換門的兩倍,也就是說換門的取勝概率為2/3,不換門則為1/3。該回復(fù)引發(fā)了軒然大波,瑪麗蓮收到了大量的讀者來信,批評(píng)她的回復(fù)是錯(cuò)誤的,其中還有聲稱自己是已獲得數(shù)學(xué)或者統(tǒng)計(jì)學(xué)博士學(xué)位的專家學(xué)者。顯然大部分的批評(píng)者都有這樣的直覺,無論換不換門,獲勝的概率都應(yīng)當(dāng)是均等的1/2,然而事實(shí)證明瑪麗蓮是對(duì)的。經(jīng)過對(duì)該節(jié)目的大量統(tǒng)計(jì)分析,結(jié)果發(fā)現(xiàn)選擇換門的獲勝概率確實(shí)近似是不換門的兩倍。
二、基于概率表的解答方案
蒙提霍爾悖論形式結(jié)構(gòu)的簡(jiǎn)單性和其違反直覺的深刻性形成了鮮明的比照。疑問也隨之而來,既然瑪麗蓮的答案是正確的,那么為什么大多數(shù)人卻會(huì)弄錯(cuò)呢?對(duì)于大多數(shù)人而言,換不換門獲勝概率都應(yīng)該是1/2,這才符合大眾的日常直覺。
大多數(shù)認(rèn)為概率是1/2的人實(shí)際上是將節(jié)目的競(jìng)猜模式混淆為這樣一個(gè)情況:參與者在選擇之前,主持人直接為參與者排除了一個(gè)錯(cuò)誤選項(xiàng),參與者在剩下的兩個(gè)門做出選擇。在這種情況下,主持人排除某一錯(cuò)誤選項(xiàng)的行為是先于參與者的選擇行為的。參與者也就從三選一轉(zhuǎn)變?yōu)槎x一,獲勝概率自然就是1/2。
然而實(shí)際上節(jié)目的運(yùn)作模式是參與者選定了一扇門之后,主持人再排除另外一扇沒有獎(jiǎng)品的門,這時(shí)候概率就大不相同了。為了便于理解,可以畫出以下的獲勝概率表格。該表假定參與者選定的就是門1,各行表示獎(jiǎng)品實(shí)際分布的三種可能情況,而這三種情況出現(xiàn)的概率是均等的,都是1/3。
有必要對(duì)該表格給出說明,首先表格雖然假定參與者選定門1,但是無論參與者選擇哪個(gè)門,實(shí)際的獎(jiǎng)品分布也僅是表格中顯示的三種可能的情況,獲勝概率自然也是相同的;其次在表格里,并沒有表明主持人打開的是哪扇門,因?yàn)檫@是沒有必要的,我們可以推知在不同情況下,主持人開的是哪扇門:第一種情況中,參與者已經(jīng)選對(duì)了,主持人開門2或者門3都沒有區(qū)別,所以他會(huì)隨機(jī)開門2或者門3。而在第二種情況和第三種情況中,參與者一開始就選擇了一個(gè)錯(cuò)誤的門,主持人為了避免打開有獎(jiǎng)品的門,只能打開另外一扇沒有獎(jiǎng)品的門?,F(xiàn)在可以從表格看出來,換門的獲勝概率是2/3,不換門則為1/3。瑪麗蓮也正是憑此方法得到了正確的答案。
該表格雖然給出了一定的解釋,然而依舊不足以打消大多數(shù)人的疑惑。雖然獲勝概率在表格中清晰地體現(xiàn)出來,但是日常的直覺總還是會(huì)告訴我們,主持人打開一扇沒有獎(jiǎng)品的門之后,獎(jiǎng)品要么在參與者選定的門里,要么在剩下的沒選的門里,所以概率好像應(yīng)該是均等的。由此可見該方案雖然有效,但是解釋力終歸是有限的。
三、蒙提霍爾悖論中的信息不對(duì)稱
蒙提霍爾悖論的關(guān)鍵之處在于主持人是在參與者選定之后再進(jìn)行對(duì)游戲的干預(yù),而干預(yù)行動(dòng)的前提就是主持人掌握了完全的信息,這里就牽扯到信息不對(duì)稱問題了。
在這場(chǎng)競(jìng)猜游戲中,主持人和參與者所獲得的信息當(dāng)然是不對(duì)稱的,主持人知道所有門后獎(jiǎng)品的分布,而參與者對(duì)此一無所知。主持人在選擇開門的時(shí)候,是有所限制的,他既不能打開參與者選定的門,也不能打開其后有獎(jiǎng)品的門,這就使得參與者換不換門的概率必然不可能相等。簡(jiǎn)單來講,如果把三門推廣到千門,即假設(shè)一千扇門里僅有一扇門后有獎(jiǎng)品,參與者從一千扇門里頭隨機(jī)選一個(gè),主持人再打開998沒有獎(jiǎng)品的門,此時(shí)再問參與者是否換門,那么參與者必然會(huì)換門了。因?yàn)樗拈T是隨機(jī)選的,獲勝概率只有1/1000,而主持人知道哪扇門有獎(jiǎng)品,所以排除了998扇沒有獎(jiǎng)品的門,那么此時(shí)換門的獲勝概率則有999/1000。這里可以看出來,從三門到千門,參與者隨機(jī)選中有獎(jiǎng)品門的概率其實(shí)不會(huì)隨主持人之后的行動(dòng)有所改變,然而大部分人并沒有意識(shí)到這個(gè)事實(shí),而是不自覺地將三門競(jìng)猜中堅(jiān)持自己所選門的獲勝概率1/3錯(cuò)誤地轉(zhuǎn)換為1/2了。
蒙提霍爾悖論體現(xiàn)的信息不對(duì)稱問題,并不僅僅是參與者和主持人對(duì)于該競(jìng)猜節(jié)目信息完全度的差異,如果僅是這種層面的信息不對(duì)稱現(xiàn)象,顯然并不值得討論。比如說主持人在參與者選門之前就排除了一個(gè)錯(cuò)誤選項(xiàng),那么盡管雙方信息不對(duì)稱,但是公布的規(guī)則是顯明的。這種情況下,盡管參與者并不是信息完全的,但是可以正確估計(jì)自己的取勝概率,自然就能正確計(jì)算出收益的數(shù)學(xué)期望。
而蒙提霍爾悖論之所以和上述情形不同,是因?yàn)閰⑴c者對(duì)自己獲勝的概率實(shí)際上出現(xiàn)了認(rèn)知錯(cuò)誤。而這種認(rèn)知錯(cuò)誤的產(chǎn)生,恰恰又是主持人代表的主辦方在參與者選擇行為之后,借助信息完全的優(yōu)勢(shì),采取后續(xù)行動(dòng)刻意制造出來的。參與者在不知道自己的概率估計(jì)是錯(cuò)誤的做出了選擇。例如假若他堅(jiān)持不換門,他以為取勝概率1/2,實(shí)際上卻僅是1/3。這個(gè)兩個(gè)概率值雖然相差不多,但是卻給了信息優(yōu)勢(shì)者借之牟利的機(jī)會(huì)。
這里所要關(guān)注的并不是信息不對(duì)稱現(xiàn)象的普遍性,而要關(guān)注信息優(yōu)勢(shì)者利用這種不對(duì)稱是否能夠獲利,以及此種利益是否可以通過經(jīng)濟(jì)活動(dòng)中的長(zhǎng)期或者重復(fù)博弈予以減少和消除。對(duì)于這個(gè)問題,蒙提霍爾悖論一定程度上給出了消極的回答,以此換門競(jìng)猜的游戲?yàn)槔?,該?jié)目舉辦十多年之久,然而參與者大多都沒有意識(shí)到換門和不換門兩者的概率是不均等的。
四、信息不對(duì)稱與理性人假設(shè)
在經(jīng)濟(jì)學(xué)學(xué)界,信息不對(duì)稱理論雖對(duì)理性人假設(shè)予以批駁,卻并沒有動(dòng)搖該假設(shè)作為經(jīng)濟(jì)學(xué)理論基礎(chǔ)的重要地位。理性人假設(shè)的核心在于“最大化原則”,亦即作為經(jīng)濟(jì)活動(dòng)的理性個(gè)體都會(huì)謀求自身利益最大化,而對(duì)自己所處經(jīng)濟(jì)環(huán)境的信息完備性或者說豐富性只是為了達(dá)成利益最大化理想的附帶要求。也就是說,即便經(jīng)濟(jì)活動(dòng)的參與者是信息不完備的,但是并不妨礙參與者通過有限的信息去盡量為自己牟取利益。只要經(jīng)濟(jì)活動(dòng)的參與者意識(shí)到自身信息的匱乏,就自然會(huì)調(diào)高風(fēng)險(xiǎn)預(yù)期,并相應(yīng)地使自己投資等經(jīng)濟(jì)行為偏向保守。所以盡管現(xiàn)實(shí)的經(jīng)濟(jì)環(huán)境并非如經(jīng)濟(jì)學(xué)理論所設(shè)定的那么理想,但是經(jīng)濟(jì)活動(dòng)主體似乎天然具有很強(qiáng)的適應(yīng)性,能夠依據(jù)不同的外部條件調(diào)節(jié)自己的經(jīng)濟(jì)行為。所以無論是道德風(fēng)險(xiǎn)還是逆向選擇問題,并沒有在根本上反對(duì)理性人假設(shè),而僅僅是一種修正和補(bǔ)充。
例如諾貝爾獎(jiǎng)得主阿克洛夫所討論的“次品車問題”就揭露了信息不對(duì)稱導(dǎo)致的逆向選擇現(xiàn)象,并指出逆向選擇會(huì)影響市場(chǎng)資源配置的有效性?!按纹奋噯栴}”講的是:在二手車市場(chǎng)中,通常有一個(gè)二手車的平均價(jià)格,并且賣方比買方更清楚自己汽車的狀況,這就導(dǎo)致如果賣方知道自己的車是次品,更樂意以平均價(jià)格出售自己的車;而如果自己的車保養(yǎng)的很好,就會(huì)覺得平均價(jià)格太低,不愿意在二手車市場(chǎng)出售。結(jié)果就使得二手車市場(chǎng)出售的車大多價(jià)高質(zhì)次,買方自然不會(huì)太樂意在二手車市場(chǎng)上購(gòu)車。但是考察二手車市場(chǎng)的交易雙方的行為,卻可以發(fā)現(xiàn),他們并非沒有在謀求自身利益最大化。盡管總體而言整個(gè)市場(chǎng)資源配置是低效的,但是就每個(gè)經(jīng)濟(jì)活動(dòng)的個(gè)體,依然是在做出對(duì)自己最有利的行為決策,最終形成了某種總體并非最優(yōu)的均衡。
蒙提霍爾悖論對(duì)于理性人假設(shè)則是予以直接質(zhì)疑的:大眾容易被自己的日常直覺所干擾,使得經(jīng)濟(jì)參與者在計(jì)算期望收益時(shí)產(chǎn)生極大的偏差。而這種認(rèn)知偏差,即便是長(zhǎng)期或者重復(fù)博弈都很難消除。并且陷入這種認(rèn)知偏差的也不僅僅是一般大眾,高等教育的接受者也不能完全豁免。蒙提霍爾悖論所展現(xiàn)的不過是這種不理性的極端情況,在現(xiàn)實(shí)生活中,經(jīng)濟(jì)活動(dòng)參與者所表現(xiàn)出來的這種不理性是處處可見的,例如博彩等高風(fēng)險(xiǎn)經(jīng)濟(jì)活動(dòng)屢禁不絕,這些經(jīng)濟(jì)活動(dòng)的參與者很容易受到信息干擾而高估了自己獲得收益的概率。
雖然大多數(shù)的經(jīng)濟(jì)參與者不具有理想化的經(jīng)濟(jì)理性,但是也不必太過悲觀,畢竟即便如蒙提霍爾悖論經(jīng)過系統(tǒng)性的研究和闡釋,最終還是能夠被大多數(shù)人所理解。所以想要在現(xiàn)實(shí)層面解決經(jīng)濟(jì)參與者的非理性問題,必須需要將各類認(rèn)知謬誤多加普及,使之作為背景常識(shí)被公眾接受,才能糾正公眾日常直覺導(dǎo)致的認(rèn)知錯(cuò)謬,使得經(jīng)濟(jì)運(yùn)行更為高效和順暢。
參考文獻(xiàn):
[1]博弈論與信息經(jīng)濟(jì)學(xué)[M]. 上海人民出版社 , 張維迎著, 2004
[2]信息非對(duì)稱條件下資本市場(chǎng)[M]. 中國(guó)社會(huì)科學(xué)出版社 , 孫強(qiáng),郭樹華著, 2002
[3]博弈論[M]. 中國(guó)人民大學(xué)出版社 , (美)朱·弗登博格,(法)讓?梯若爾著, 2002
[4]經(jīng)濟(jì)學(xué)[M]. 商務(wù)印書館 , (美)薩繆爾森, 2012
[5]就業(yè)、利息和貨幣通論[M]. 商務(wù)印書館, (英) 凱恩斯,2006