国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

由真實(shí)數(shù)據(jù)制造的假象

2009-11-19 09:16張曉輝
晚報(bào)文萃·開(kāi)心版 2009年18期
關(guān)鍵詞:萊爾遺漏假象

張曉輝

生活的經(jīng)歷告訴我們做事情一定要“心中有數(shù)”,但心中有數(shù)首先要眼里有數(shù),所以我們習(xí)慣于“實(shí)證方法”,通過(guò)調(diào)查得出統(tǒng)計(jì)數(shù)據(jù),再做成表格、數(shù)字,生產(chǎn)車間里有箭頭圖,研究報(bào)告里有柱狀圖、折線圖、曲線圖、模擬曲線、回歸曲線,好了,這下,我們踏實(shí)了。

可是,由于商業(yè)利益的存在,統(tǒng)計(jì)數(shù)據(jù)也會(huì)表現(xiàn)出傾向性,或者預(yù)先設(shè)定了傾向性。所以,讓我們感到踏實(shí)的數(shù)字未必反映真實(shí)狀況,我們依賴的“實(shí)證方法”未必就“實(shí)”,其過(guò)程可能是把一種傾向研究成“事實(shí)”或證明成“事實(shí)”,與其說(shuō)是“實(shí)證”,還不如說(shuō)是“證實(shí)”。

美國(guó)著名統(tǒng)計(jì)學(xué)家達(dá)萊爾·哈夫的名著《統(tǒng)計(jì)數(shù)字會(huì)撒謊》或許能讓我們對(duì)于統(tǒng)計(jì)中的陷阱有入木三分的認(rèn)識(shí)。達(dá)萊爾舉出許多活生生的案例,向我們一一解讀了統(tǒng)計(jì)中的陷阱,讀起來(lái)很有味道。

達(dá)萊爾提出,當(dāng)你面對(duì)統(tǒng)計(jì)數(shù)據(jù)時(shí),先要問(wèn)自己5個(gè)問(wèn)題:誰(shuí)說(shuō)的?他是如何知道的?遺漏了什么?是否有人偷換了概念?這個(gè)資料有意義么?

筆者很注意電視、報(bào)紙上賣(mài)藥的廣告,“中國(guó)有百分之××”的人“缺鈣…‘前列腺…‘性機(jī)能”……

這個(gè)“百分之××”是多少呢?一般是70%~90%。很奇怪,過(guò)去憑票過(guò)日子的時(shí)候,中國(guó)人啥成分不缺,現(xiàn)在怎么什么都缺?如果把廣告所警告的疾病、營(yíng)養(yǎng)不良的百分比都攏一下,這個(gè)結(jié)果夠嚇人的。

問(wèn)題的根本在于,這個(gè)危言聳聽(tīng)的統(tǒng)計(jì)是誰(shuí)做的?當(dāng)然是廠商做的,那么出現(xiàn)如此荒誕不經(jīng)的統(tǒng)計(jì)也就不足為怪了。

統(tǒng)計(jì)的陷阱在哪里呢?首先是統(tǒng)計(jì)本身的不真實(shí)性,比如統(tǒng)計(jì)樣本的選擇偏差,或是樣本空間過(guò)小,導(dǎo)致代表性差。統(tǒng)計(jì)樣本的選擇偏差是比較常見(jiàn)的,由于調(diào)查者的主觀意向或者客觀失誤的影響,統(tǒng)計(jì)樣本的選擇偏差直接影響到統(tǒng)計(jì)的結(jié)果。

比如,你有一桶豆子,有紅色、有白色,那么紅色的豆子有多少呢?如果按照統(tǒng)計(jì)學(xué)的辦法,就是抓一把豆子(抽樣),然后算一下紅白豆子的比例就能夠得到近似的結(jié)果。但這個(gè)前提是,紅白豆子在體積形狀重量上的無(wú)差異化。如果是大豆子和小豆子呢?按照物理學(xué)原理,小豆子會(huì)在桶的下面,而大豆子在上面,如果你在上面抓一把樣本,就是大豆子多;在桶底抓一把樣本,就是小豆子多。

如果抽取開(kāi)發(fā)商作為樣本調(diào)查房?jī)r(jià)是不是高?抽取醫(yī)藥人員作為樣本調(diào)研醫(yī)療費(fèi)高不高?說(shuō)得再搞笑一些,抽取交通違章者作為樣本去調(diào)查交通警的形象。那么,看似科學(xué)的統(tǒng)計(jì)會(huì)得出相當(dāng)滑稽的結(jié)果。

樣本的空間要足夠大,才能保證統(tǒng)計(jì)的穩(wěn)定性和可信度。比如說(shuō),抽取10個(gè)樣本和抽取1000個(gè)樣本,顯然是不一樣的。當(dāng)初美國(guó)某大學(xué)有一個(gè)驚人的統(tǒng)計(jì)數(shù)字,該校物理系有50%的女生和男教師同居,校方大為震驚,仔細(xì)調(diào)查,確實(shí)如此,該系有兩名女生,其中一人與男教師墜入愛(ài)河……

如果統(tǒng)計(jì)者在統(tǒng)計(jì)樣本的選擇上有意無(wú)意地做出一些“貓膩”來(lái),就能夠得到預(yù)期的統(tǒng)計(jì)結(jié)果。

統(tǒng)計(jì)的另一個(gè)陷阱在于統(tǒng)計(jì)之后的分析過(guò)程,在分析中,統(tǒng)計(jì)者是否遺漏了什么?或者忽視了統(tǒng)計(jì)所依賴的條件?

達(dá)萊爾舉了個(gè)例子:“某年公布的數(shù)據(jù)顯示,該年4月的零售額高于去年同期,于是證明經(jīng)濟(jì)開(kāi)始進(jìn)入復(fù)蘇階段,但遺漏的內(nèi)容是前一年的復(fù)活節(jié)在3月,而該年的復(fù)活節(jié)在4月,所以復(fù)活節(jié)帶來(lái)的消費(fèi)高峰在4月”。暫時(shí)的消費(fèi)高峰顯然不能代表經(jīng)濟(jì)的轉(zhuǎn)向。

我們經(jīng)常看到這樣的分析報(bào)告,某產(chǎn)品價(jià)格1000元,目前消費(fèi)群體是10萬(wàn),年收入1億元,如果全國(guó)有百分之一的人消費(fèi)該產(chǎn)品,就會(huì)有1300萬(wàn)消費(fèi)群體,年收入將高達(dá)130億元,帶來(lái)××億元的稅后利潤(rùn)。類似的分析過(guò)程我們并不陌生,但統(tǒng)計(jì)者忽略了一個(gè)事實(shí),那就是從10萬(wàn)消費(fèi)群體增加到1300萬(wàn)的前提是價(jià)格的大幅降低,而價(jià)格大幅降低之后,收入就不會(huì)那么多了,利潤(rùn)更會(huì)有很大的變化。試想,如果現(xiàn)在的手機(jī)還是當(dāng)年大哥大的價(jià)格,能做到如此普及么?

以突發(fā)事件代替常態(tài),以小樣本推廣到大樣本,如果忽視了一些重要的因素,分析過(guò)程就會(huì)產(chǎn)生缺陷。即使是正確的統(tǒng)計(jì)數(shù)字也未必能得到正確的結(jié)論。

桑普拉斯說(shuō),統(tǒng)計(jì)分析讓一切假象原形畢露。但遺憾的是,統(tǒng)計(jì)未必能夠揭示真實(shí),有時(shí)候還可能制造假象。當(dāng)我們面對(duì)生活中形形色色的統(tǒng)計(jì)數(shù)據(jù)的時(shí)候,千萬(wàn)多保持一些理智和清醒。

猜你喜歡
萊爾遺漏假象
東周列國(guó)志(5) 介子推功成身隱
掃街人
來(lái)自V星球的使者
假象
為什么美國(guó)媒體會(huì)“遺漏”重要新聞?
你會(huì)收集數(shù)據(jù)嗎
“遺漏”的意義
該死的花花公子
臨終的演算
博客| 华容县| 武冈市| 冕宁县| 积石山| 宝丰县| 东港市| 达孜县| 安平县| 金阳县| 桦南县| 通海县| 新邵县| 从江县| 手游| 理塘县| 南江县| 民权县| 崇仁县| 丹棱县| 当阳市| 贞丰县| 保山市| 民权县| 巴彦淖尔市| 法库县| 华亭县| 西华县| 曲松县| 滦南县| 苍山县| 峨边| 湖州市| 建水县| 高密市| 巧家县| 和田市| 板桥市| 土默特右旗| 闻喜县| 秦安县|