曾經(jīng),謊話要用甜言蜜語(yǔ)做包裝,加上小恩小惠的糖衣,添一點(diǎn)楚楚可憐的好味道,就能讓人神魂顛倒. 后來(lái),我們這些生存競(jìng)爭(zhēng)之下的幸存者多少喪失了天真,再也不會(huì)被單純的漂亮話所迷惑. 不過(guò),先不要得意,現(xiàn)在,似是而非的“科學(xué)結(jié)論”、復(fù)雜的統(tǒng)計(jì)數(shù)據(jù),開(kāi)始出現(xiàn)在從特效療法到金融產(chǎn)品上,沒(méi)有一點(diǎn)兒專業(yè)知識(shí),我們似乎又要被忽悠了. 別急,學(xué)一點(diǎn)科學(xué)方法,可以幫我們查明真相.
實(shí)驗(yàn),厘清混淆的變量
一位保健品推銷員正在這么向你介紹他的產(chǎn)品:“這補(bǔ)腦劑效果可好了,我兒子吃了一個(gè)月,學(xué)習(xí)成績(jī)明顯提高了. ”好吧,作為一個(gè)久經(jīng)沙場(chǎng)的消費(fèi)者,你根本不信. 推銷員可能會(huì)有一個(gè)兒子,可學(xué)習(xí)成績(jī)有沒(méi)有提高就不一定了,更有可能的是,他兒子根本不吃這種東西. 你心里暗想,在拿自家人舉例方面,推銷員和相聲演員有一拼啊. 可現(xiàn)在,推銷員改變了戰(zhàn)術(shù):“我們的研究表明,在吃了我們的保健品半年后,學(xué)生的記憶力顯著提高. ”那么,信,還是不信呢?
我們首先假設(shè),推銷員不會(huì)偽造數(shù)據(jù),說(shuō)的都是有據(jù)可查. 這樣能否證明他的保健品就真的有效呢?如果問(wèn)一個(gè)受過(guò)科學(xué)訓(xùn)練的人,他會(huì)告訴你,不一定. 在這個(gè)例子里,學(xué)生的記憶力可能受很多因素的影響. 比如,兒童的記憶力在小學(xué)階段是逐步提高的,即使什么都不做,三年級(jí)學(xué)生的記性也比一年級(jí)好;在這半年里,老師的教育也在幫助學(xué)生學(xué)習(xí)識(shí)記;當(dāng)然,保健品也許真的有效.
一個(gè)科學(xué)家要想檢驗(yàn)這個(gè)假設(shè)——“服用該保健品一段時(shí)間可以提高學(xué)生記憶力”,該如何做呢?答案是:控制變量.
我們關(guān)心的數(shù)據(jù)可能受許多因素的影響,所謂控制變量,指的就是把額外的因素控制住,使它們盡量少地影響數(shù)據(jù),從而讓我們能集中觀察需要研究的因素產(chǎn)生了什么影響. 比如,針對(duì)這種保健品,科學(xué)家不會(huì)簡(jiǎn)單說(shuō)有效還是無(wú)效,而是要進(jìn)行實(shí)驗(yàn),把年齡、教學(xué)方法之類額外的因素影響去除,單獨(dú)針對(duì)保健品來(lái)檢驗(yàn). 他會(huì)選取一個(gè)班級(jí),先測(cè)試一下孩子的記憶力,然后把孩子隨機(jī)分成兩半,一半服用保健品,一半服用相同量的面粉壓成的藥片,即安慰劑. 三個(gè)月或半年以后回來(lái)再次測(cè)試,看看兩組的成績(jī)有沒(méi)有差異.
為什么要搞得這么麻煩?讓我來(lái)解釋一下. 把學(xué)生分成兩組,一組實(shí)驗(yàn)組,一組對(duì)比組,為的是保證除了服用保健品之外,兩組的其他情況盡可能一樣. 同一個(gè)班級(jí),避免了因?yàn)槟挲g差異、教學(xué)方法不同等因素造成的學(xué)生記憶力的差別;隨機(jī)分配,使兩組間的記憶力平均成績(jī)?cè)跊](méi)有服藥前基本一致. 最后,他還會(huì)給沒(méi)有服藥的孩子開(kāi)安慰劑. 這些面粉片里根本不含任何影響記憶力的成分,卻會(huì)導(dǎo)致人們心理狀態(tài)的變化. 我們也不知道服藥后感覺(jué)記憶力提高是不是只是一種心理作用,因此只有使用安慰劑來(lái)平衡兩組在這方面受到的影響. 如果實(shí)驗(yàn)結(jié)束后,學(xué)生們的記憶力確實(shí)比半年前有所提高,可兩組之間沒(méi)有差異,我們就知道,這提高并非來(lái)自保健品的功效了.
把準(zhǔn)實(shí)驗(yàn)偽裝成實(shí)驗(yàn),已經(jīng)足夠令人困擾了,而另一個(gè)煙幕彈則是統(tǒng)計(jì)數(shù)據(jù). 還是說(shuō)說(shuō)上面的例子,記憶力“顯著提高”是什么意思呢?是以前每天能背十個(gè)單詞,現(xiàn)在提高到了二十個(gè)了呢?還是從一百個(gè)提高到了一百一十個(gè)?這兩者都是每天提高十個(gè),但難度卻不可同日而語(yǔ). 在表述上,前者可以說(shuō)成記憶力提高百分之百,而后者卻只是提高百分之十.
抽樣,你的數(shù)據(jù)代表誰(shuí)?
最常見(jiàn)的統(tǒng)計(jì)數(shù)字誤導(dǎo)恐怕就是來(lái)自抽樣的問(wèn)題了. 試想這么一個(gè)問(wèn)題:中國(guó)成年男性的平均身高是多少?按照平均數(shù)的計(jì)算方法,我們應(yīng)該測(cè)量所有成年男性,然后將身高加在一起再除以人數(shù),這顯然是不可能的. 可是,我們?cè)O(shè)計(jì)家居時(shí),人類工效學(xué)的工程師卻告訴你,這個(gè)數(shù)字是170厘米. 這是怎么得出來(lái)的呢?
要計(jì)算這個(gè)數(shù)字就需要進(jìn)行抽樣. 從所有成年男性中抽出一個(gè)樣本,計(jì)算樣本的平均身高,以這個(gè)數(shù)值作為中國(guó)所有男性平均身高的估計(jì). 只要樣本選取得當(dāng),這個(gè)估計(jì)值就非??尚?
如何才能算作得當(dāng)?首先是需要樣本足夠大,盡可能減少隨機(jī)誤差帶來(lái)的干擾. 這個(gè)“大”在不同的情況下是很不一樣的. 如果我們研究的是一所學(xué)校,可能選取一到兩個(gè)班就可以了. 可如果涉及的問(wèn)題是全國(guó)性質(zhì)的,可能人數(shù)就要達(dá)到數(shù)千、數(shù)萬(wàn),甚至更大. 樣本容量有保證是一方面,另一方面是樣本選取不能有偏,就是樣本能很好地代表總體.
我們知道,中國(guó)各地的人身材是有一定差異的,如果僅僅選取某些地區(qū)進(jìn)行測(cè)量,就可能得出一個(gè)和真實(shí)情況差別很大的結(jié)果. 最后,還有一點(diǎn),很多調(diào)查受到社會(huì)贊許傾向的影響,例如,恐怕很少有人愿意填寫(xiě)問(wèn)卷承認(rèn)自己歧視農(nóng)民工,但實(shí)際言行顯然是另一回事.
看到這里,讀者可能已經(jīng)想到了網(wǎng)上常見(jiàn)的所謂民意調(diào)查. 且不論是否可能造假制造所謂“民意”,這些結(jié)果是否能夠采信都值得存疑,其原因就在于樣本構(gòu)成大有問(wèn)題.
某網(wǎng)站將調(diào)查放出,最可能看到這個(gè)調(diào)查的是這個(gè)網(wǎng)站的???,而他們參加調(diào)查的動(dòng)機(jī)各有不同. 某些話題更能引發(fā)人的興趣,有些則只是很少人關(guān)心. 這都會(huì)導(dǎo)致最終參加調(diào)查的人是一個(gè)有偏的樣本. 結(jié)論可能代表了這些人群,卻不能推廣到全體. 不妨試試,在高檔消費(fèi)網(wǎng)站投放一個(gè)增加稅收以補(bǔ)助農(nóng)村醫(yī)療的調(diào)查,看一看能回收哪些意見(jiàn).
如果我們現(xiàn)在做一個(gè)調(diào)查,看一看最初恢復(fù)高考的三年中幾所名牌大學(xué)入學(xué)學(xué)生如今的年收入,你一定會(huì)得到一個(gè)高得嚇人的數(shù)字. 我敢如此肯定并不是我熟悉他們的社會(huì)成就,而是因?yàn)槲伊私庹{(diào)查的缺陷. 可以想見(jiàn),當(dāng)年的那些大學(xué)生雖然有案可查,但能夠準(zhǔn)確聯(lián)系調(diào)查的卻只有一部分較為成功的人了. 其中有一些人雖然聯(lián)系上了,卻不一定愿意接受調(diào)查. 最后,還不能排除一些人受贊許傾向的影響,有意無(wú)意地提高報(bào)告自己的收入水平. 最終,調(diào)查員只回收了那些成功人士的數(shù)據(jù),而沉默的大多數(shù)卻被“統(tǒng)計(jì)式”地忽視了.
還不得不考慮,平均數(shù)也有一個(gè)小小的麻煩,它特別容易受極端數(shù)據(jù)的影響. 比如一個(gè)月收入五萬(wàn)的老板和五名月收入兩千元的員工享受著一萬(wàn)元的月平均工資,而這個(gè)平均數(shù)居然是一個(gè)員工月收入的五倍之多!
科學(xué)方法,現(xiàn)代公民的必修課
保健品公司宣稱,在所有考試成績(jī)優(yōu)異的學(xué)生中,有68%服用了他們的產(chǎn)品. 我們就要問(wèn)問(wèn),這些接受調(diào)查的學(xué)生是怎樣選取的呢?為什么不調(diào)查在所有服用產(chǎn)品的學(xué)生中,有多少感到成績(jī)提高?而公司又可以宣稱,他們發(fā)現(xiàn),保健品使用量與學(xué)生的英語(yǔ)成績(jī)正相關(guān). 好吧,他們沒(méi)告訴你的是,他們調(diào)查了30個(gè)學(xué)生,其中只有5個(gè)人吃了保健品,從將及格到中等成績(jī),確實(shí)是吃得多成績(jī)好一點(diǎn). 更不用提當(dāng)這些結(jié)果登載在報(bào)上時(shí),精明的廣告人設(shè)計(jì)的圖案了——形成鮮明反差的柱狀圖將服用者的優(yōu)勢(shì)凸顯出來(lái). 其實(shí)這只是增大了圖像的對(duì)比,并沒(méi)有真正顯著的差異,卻給我們強(qiáng)烈的印象——買(mǎi)一瓶吧!
凡此種種,不一而足. 看來(lái),我們的確有必要學(xué)習(xí)一點(diǎn)簡(jiǎn)單的統(tǒng)計(jì)學(xué),雖然這并不能讓你成為精算師,但卻能使你少落入大眾傳媒的陷阱.