張曉暉
問:你只有10平方米的房屋,鄰居從90平方米換到190平方米,你的居住面積有沒有增加?
答:沒有。
錯(cuò),你在平均住房面積里增加了50平方米。
這雖然是有關(guān)平均數(shù)的一則笑話,卻能夠說明我們常常會被各種統(tǒng)計(jì)數(shù)字所欺騙和愚弄,忘記了這些數(shù)字也許是被精心挑選出來的,也許是有水分的。
統(tǒng)計(jì)的陷阱在哪里呢?首先是統(tǒng)計(jì)本身的不真實(shí)性。比如統(tǒng)計(jì)樣本的選擇偏差,或是樣本空間過小,導(dǎo)致代表性差。
統(tǒng)計(jì)樣本的選擇偏差是比較常見的,由于調(diào)查者的主觀意向或者客觀失誤的影響,統(tǒng)計(jì)樣本的選擇偏差會直接影響到統(tǒng)計(jì)的結(jié)果。
比如,你有一桶豆子,有紅色的,有白色的,那么紅色的豆子有多少呢?如果按照統(tǒng)計(jì)學(xué)的辦法,就是抓一把豆子(抽樣),然后算一下紅白豆子的比例就能夠得到近似的結(jié)果。但這個(gè)前提是,紅白豆子在體積、形狀、重量上的無差異化。如果是大豆子和小豆子呢?按照物理學(xué)原理,小豆子會在桶的下面,而大豆子在上面,如果你在上面抓一把樣本,就是大豆子多;在桶底抓一把樣本,就是小豆子多。
另一個(gè)陷阱在于統(tǒng)計(jì)之后的分析過程。在分析中,統(tǒng)計(jì)者是否遺漏了什么,或者忽視了統(tǒng)計(jì)所依賴的條件。
真正地了解統(tǒng)計(jì)數(shù)字,破除它身上的神秘感,你才會理智地站在各種各樣的數(shù)字面前,坦然地做出正確的判斷與選擇。