王菱紅
國總統(tǒng)大選,全美大部刮起一陣農(nóng)村包圍城市的強(qiáng)勁旋風(fēng),將此前不被看好的特朗普送進(jìn)白宮。這個(gè)結(jié)局出乎之前大多數(shù)人的預(yù)料。對大選結(jié)果,人們給出各式各樣的解讀。每個(gè)人的解讀,都帶著自己的認(rèn)知模式,好比透過一個(gè)獨(dú)特的棱鏡看世界。
眾說紛紜中,有一種說法各方似乎都同意,即民調(diào)預(yù)測大失準(zhǔn)星,沒能準(zhǔn)確反映選情民意。更有人指責(zé)主流媒體偏袒希拉里一方,操縱民調(diào)數(shù)據(jù),故意誤導(dǎo)民意。一時(shí)間,民調(diào)機(jī)構(gòu)和預(yù)測專家們灰頭土臉,前幾天他們好像還捧著能看透未來的水晶球,現(xiàn)在卻仿佛變成了一群數(shù)據(jù)傻瓜,蹲在角落里反省。普林斯頓大學(xué)的華裔學(xué)者Sam Wang,選前通過數(shù)學(xué)模型,預(yù)計(jì)希拉里獲勝幾率高達(dá)99%,因?yàn)榘言捳f得太滿,不得不兌現(xiàn)諾言,在CNN當(dāng)眾吃了“蟲子”——雖然是富于營養(yǎng)的罐頭蟋蟀,但是那鏡頭,還是令吾心生戚戚。
評論看得多了,發(fā)現(xiàn)很多人似懂非懂,其實(shí)并不真正明白民調(diào)到底是怎么一回事,也沒有搞清楚民調(diào)機(jī)構(gòu)(pollsters)、預(yù)測模型(forecasters)、媒體(media)與政治評論家(pundits)的角色與概念。
打個(gè)比方說吧,民調(diào)機(jī)構(gòu)好比是采礦的,對民意采樣收集并做必要的數(shù)據(jù)處理;模型預(yù)測機(jī)構(gòu)好比是做深加工的,把民調(diào)數(shù)據(jù)放入統(tǒng)計(jì)模型中進(jìn)行分析,推算出讓人一目了然的大選獲勝幾率;媒體和政治觀察家們則好比包裝與分銷商,把民調(diào)支持率和獲勝幾率預(yù)測等拿去報(bào)道評論,為自己的判斷提供佐證;媒體受眾則是這些信息的消費(fèi)者。在這次美國大選中,主流媒體確實(shí)表現(xiàn)出一邊倒的傾向性,民眾憑直覺就可以感受到偏頗,我覺得問題主要出在大眾傳播層面,并不意味著民調(diào)被有意操縱,預(yù)測是故意誤導(dǎo)。
美國有數(shù)百個(gè)大大小小的民調(diào)機(jī)構(gòu)參與了從個(gè)別州到全國的民意調(diào)查,這些機(jī)構(gòu)有些隸屬于各大媒體,有些由兩黨資助,也有很多是獨(dú)立研究機(jī)構(gòu),比如隸屬于大學(xué)的,或者從事市場調(diào)研的專業(yè)公司。做統(tǒng)計(jì)預(yù)測模型的機(jī)構(gòu)專業(yè)性更強(qiáng),數(shù)量也要少很多,有跟媒體掛鉤的,如《紐約時(shí)報(bào)》的UPSHOT、《赫廷頓郵報(bào)》的模型,也有獨(dú)立機(jī)構(gòu),如著名的538和前面提到的普林斯頓模型。認(rèn)為他們都背棄了專業(yè)精神,故意誤導(dǎo)民眾,于情理于邏輯都難以說通。
在許許多多的反思中,我最關(guān)注的是538網(wǎng)站(http://fivethirtyeight.com/)的解釋,因?yàn)樵谶@次美國總統(tǒng)大選期間,我一直跟蹤538的數(shù)據(jù)分析,對他們的預(yù)測模型更加熟悉一些。
538的創(chuàng)始人兼總編Nate Silver運(yùn)用概率學(xué)中的貝葉斯決策理論(Bayesian Theorem),用數(shù)學(xué)方法對未知事件進(jìn)行概率分析。和絕大部分政治、新聞專業(yè)出身的預(yù)測者不同,Silver預(yù)測選舉結(jié)果的基礎(chǔ)并不是傳統(tǒng)意義上的經(jīng)驗(yàn)與直覺,而是通過搜集整理大范圍的數(shù)據(jù)和各種層面的民意調(diào)查,通過數(shù)學(xué)算法得出直觀的大選勝率。在2008年美國總統(tǒng)大選中,Silver正確預(yù)測了49個(gè)州的結(jié)果;在2012年,他對美國50個(gè)州的預(yù)測又全部正確,因此聲譽(yù)鵲起,成為預(yù)測模型界首屈一指的“大咖”兼“網(wǎng)紅”。
這次美國總統(tǒng)大選,538在選舉日早晨給出的最后勝率預(yù)測是希拉里71.4%(vs.特朗普28.6%)。這個(gè)預(yù)測遠(yuǎn)低于普林斯頓的99%,《赫廷頓郵報(bào)》的98%,羅斯柴爾德的89%,《紐約時(shí)報(bào)》的85%,或可稍微為538和Nate Silver挽回一點(diǎn)顏面,但他們畢竟還是站在了錯(cuò)誤的一邊,只能算一份不及格的答卷。
坦率地說,我對Silver迄今為止給出的分析并不十分滿意。他提出了很多精當(dāng)?shù)囊娊?,但更多的是在?qiáng)調(diào)民調(diào)的問題和客觀不確定性,尚沒有深入反思自己的預(yù)測模型有什么大的漏洞,似乎還在努力維護(hù)自己的面子。
我認(rèn)為至少有一點(diǎn)是值得挖掘的,即傳統(tǒng)的隨機(jī)抽樣民意調(diào)查方式在今天已經(jīng)越來越困難(回答率低,隨機(jī)性差,代表性存疑),難以反映出人們未定的/變化的/隱藏的想法,建立在民調(diào)數(shù)據(jù)基礎(chǔ)上的預(yù)測模型也難免無用輸入無用輸出(garbage in, garbage out,計(jì)算機(jī)用語)。相反,很多真實(shí)的情緒想法卻彌漫在Twitter、Facebook、微信這樣的社交媒體中,那是真正的數(shù)據(jù)金礦,實(shí)在不能視而不見。對紛雜的社交媒體數(shù)據(jù)進(jìn)行分析,如何識別信號與噪聲是更大的挑戰(zhàn),還期待Silver和Sam Wang這樣的數(shù)據(jù)科學(xué)家能在這方面更有作為。
人們把民調(diào)數(shù)據(jù)或預(yù)測模型當(dāng)成窺探未來的水晶球,實(shí)在是個(gè)不小的誤會。可有什么辦法呢?人們總希望能提前預(yù)知未來,消除身在未知中的迷茫和困頓。
要真說起來呢,“預(yù)測帝”也不是沒有。先說遠(yuǎn)的——早在1987年,普利策獎得主Garry Trudeau就在他的漫畫系列《Doonesbury》中,描繪特朗普要競選總統(tǒng),可能那時(shí)候連特朗普本人都還沒生出過這個(gè)念頭吧。
再說近的——美國總統(tǒng)大選前的2016年11月3日,中國湖南長沙石燕湖,紅布鋪起一個(gè)總統(tǒng)預(yù)測臺,特朗普和希拉里的硬紙板畫像分列左右,兩人畫像前面都放著香蕉。一只名叫“哥大”的5歲猴子身穿印有“預(yù)測帝”字樣的黃馬褂,走上前去,經(jīng)過深思熟慮,不但吃掉了特朗普身邊的香蕉,而且給了他一個(gè)熱烈的吻。
哈哈,玩笑歸玩笑,我給大家介紹一位真正的預(yù)測帝吧——Scott Adams,著名漫畫系列《Dilbert》的作者(奇怪,怎么又是個(gè)漫畫家)。我跟蹤Adams關(guān)于美國總統(tǒng)大選的博客近一年,他從2015年8月起,就預(yù)言特朗普將拿下共和黨內(nèi)提名,并將一路贏得最后總統(tǒng)大選,而那時(shí)候剛剛宣布參選的特朗普還是很多人眼中的笑料。2016年3月,Adams又預(yù)言特朗普將會在總統(tǒng)選舉中大勝,而那時(shí)候特朗普還沒有拿到共和黨候選人提名。怎么樣,夠厲害吧!
更有意思的是,Adams聲稱自己對政治、經(jīng)濟(jì)、移民等方針政策與影響之類的東西并不在行。
Adams對特朗普的預(yù)測乃是基于一條非常獨(dú)特的判斷,即特朗普是一個(gè)天才的說服大師,其異常出眾的說服力對其目標(biāo)聽眾具有催眠般的控制和影響力。
Adams的說服力預(yù)測模型,好比他看待事物的獨(dú)特棱鏡。對這個(gè)棱鏡,我一直將信將疑,但他有幾個(gè)重要觀點(diǎn)還是令我印象深刻:
——聰明而充分了解各種信息的人們,幾乎在所有重大問題上都意見相左。可見,你再聰明,擁有的信息再多,都不能讓你如希望的那樣準(zhǔn)確把握現(xiàn)實(shí)。
——在真實(shí)的世界中,唯有情感才是重要的,因?yàn)榍楦序?qū)動人們的行為。
——事實(shí)如何,并不影響人們的決策。人們首先形成決定,然后再挑選數(shù)據(jù),為他們的非理性選擇尋找理由。如果你發(fā)現(xiàn)人們總是對你睿智的觀點(diǎn)不以為然,記住,那是因?yàn)樗麄円苍谀闵砩峡吹搅送瑯拥姆抢硇浴?/p>
這些觀點(diǎn),也許值得Nate Silver和Sam Wang等數(shù)據(jù)英雄們體會、借鑒。