统计数字会撒谎-第2部分
按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
Chapter 5令人惊奇的图形
一张图告诉你朴实的10%的增长,而另一张却看起来是让人振奋的100%的增长,别怀疑你的眼睛,截然不同的两幅图说的可是同一回事!
Chapter 6一维图形的滥用
数字是2∶1,但视觉效果却是8∶1。嘴上说的是15倍,看起来却是3倍……或许你正在被这些图形所振奋着。
Chapter 7不完全匹配的资料
一篇来自著名实验室的报告:在11秒钟内仅仅半盎司该药的剂量就杀死了试管中31108个病菌。
随处可见某种榨汁机的广告:“经过实验室的证明”该榨汁机的“榨汁功能增强了26%。”……
听起来真不错,这是货真价实的“挂羊头卖狗肉”。
Chapter 8相关关系的误解
抽烟与大学成绩;独身与上大学;身上的跳蚤与健康;房屋顶上白鹤鸟巢的个数与荷兰某个家庭中已出生孩子的人数;马萨诸塞州长老教会会长的收入与哈瓦那朗姆酒的价格……
是风牛马不相及?还是亦步亦趋、息息相关?真实的结果一定让你大跌眼镜。
Chapter 9如何进行统计操纵
怎样在一年内获得22500美元的总收入?你只需1个妻子(或丈夫)和13个孩子。
“现在就购买圣诞礼物,你将节省100%。”精明的商家居然成了圣诞老人,开始免费馈赠了。
有些人很害怕你知晓其中的“技巧”。
Chapter 10如何反驳统计资料
谁说的?他是如何知道的?遗漏了什么?是否有人偷换了概念?这个资料有意义吗?
提这5个问题,凭双眼就识破并揭穿虚假的统计资料;更为重要的是在具有欺骗性的数据海洋中找出可靠有用的资料,不再让你的关键决策南辕北辙。
致谢语:
在多方的帮助下,经过广泛的收集,我得到了散见在本书各章当中的关于狡辩和欺诈的小例子。在我通过美国统计学会发出呼吁后,许多专业统计学家——请相信我,他们和其他人一样痛恨统计资料的滥用——从他们自身收集的资料中为我提供了大量的实例。这些人,我猜想,将乐意成为无名英雄。同样,我在许多书籍中发现了有价值的案例,仅列出其中主要的书籍:Martin A。 Brumbaugh 和Lester S。 Kellogg所著的《商业统计学》;Hadley Cantril的《公共观点的测定》;Willard Cope Brinton的《图表表示法》;Frederick E。 Croxton 和Dudley J。 Cowden的《实用商业统计学》;George Simpson 和Fritz Kafka的《基础统计学》以及Helen M。 Walker 的《基础统计方法》。
Darrell HuffⅠ
序言:
我的岳父从爱荷华州到加利福尼亚州不久便对我说:“你们这儿治安不好。”在他所阅读的关于加州的报道的确如此。但是,这些报道通常来自一份爱荷华州的报纸。这份报纸不会轻易忽略掉加州发生的任何犯罪行为,虽然它也报道本州的谋杀案,但看起来它更乐意大肆渲染加州出现的同类情况,而且还因此而闻名。
我岳父得出的这个结论是建立在明显有偏样本基础之上的,是一个随意的统计结论。类似于其他更为精致的统计结论,也存在着证据与结果不匹配的问题,因为这些结论都在假定:报纸专栏中对犯罪行为的报道是测量犯罪率的工具。
几年前,十来个调查人员独立地发表了关于抗组织胺药的试验数据。所有的数据都证明,在经过抗组织胺药物治疗后,相当高比例的感冒能够治愈。这一结论引起了传媒的大肆宣传报道,抗组织胺药的广告铺天盖地,医药界也掀起了此类药物的生产热潮。人们对健康永恒不变的追求造就了这种热潮,但奇怪的是,人们拒绝越过统计资料去注意一下早就了解的事实。正如一位幽默的非医学权威人士,亨利?G?菲尔森(Henry G.Felsen)不久前所指出的——正确的治疗的确能在7天内治愈感冒,但是即使不进行任何治疗,感冒也能在一个星期内痊愈。
事实往往在所见所闻之外。平均数、作用关系、趋势和图表总是与看上去的不一致。虽然经验告诉我们“眼见为实”,但眼睛告诉我们的“真相”或许隐瞒了部分事实,或许夸大了事实。
统计这种神秘的语言,在一个靠事实说话的社会里是如此地吸引眼球,但有时它却被人利用,并成为恶意夸大或简化事实、迷惑他人的工具。在报告社会经济趋势、商业状况、民意调查和普查的大量数据时,统计方法或者统计术语是必不可少的。但如果作者不能正确理解并恰当地使用这些统计语言,而读者又并不能真正了解这些术语的含义,那么,统计结果只能是废话一堆。
在科能技主题的文章中,经常充斥着滥用统计资料的现象,每一个数据都很有力地打消你的疑虑,都张着嘴告诉你这是对的,但是人们很难联想到这样一种场景:灯光如豆的实验室中,“白衣英雄们”仍在不计报酬、不辞辛劳地包装这些数据。统计,就像最神奇的化妆术,只要略施粉黛,东施尤胜西施。巧妙伪装的统计资料胜过希特勒的弥天大谎,虽然它也会引起人们的误解,但制造它的人却能巧妙脱身。
这本书是一本如何利用统计瞒天过海的入门读物。看上去,它很像骗子的行骗宝典。但或许我可以模仿一个已退休的窃贼——如何神不知、鬼不觉地撬开一把锁,他的###达到了研究生课程的水平——替这本书说句公道话:毕竟,骗子对于行骗的技巧早已胸有成竹,而诚实的人出于自卫也应该掌握它。
书包 网 。 想看书来
内在有偏的样本(1)
第一章 内在有偏的样本
有一个装着红、白两色豆子的桶,如果你想要准确知道这个桶中两种豆子的数量,你惟一能做的只有一颗一颗地数豆子。
用一种更简单的方法也可以揣测红豆的数量:抓一把豆子,假定手中红豆的比例与桶中红豆的比例相同,只要数一数手中的豆子即可。如果你的样本足够大,并且选择方法正确,在大多数情况下它能够很好地代表整体。但是,如果以上两个条件不满足,这样的样本比一个臆想好不到哪儿去,除了能够营造科学精确的假象之外,其他则根本不值一提。不幸的是,我们所看到的,或者我们自以为了解的许多事物,往往都是根据类似样本所得出的结论,这种样本可能变得有偏,由于选择方式的不合理或者容量过小,抑或两种情况同时存在。
通过一个极端的例子可以马上看到如何形成有偏的样本。假设你向同胞发放问卷,问卷中包含这样一个问题:“你乐意回答调查问卷吗?”整理所有的答案,你很有可能得到下面的结论:“一个选自总体、典型的横截面”中,压倒多数的人选择了“乐意”。为了具有说服力,你还可以详细列出这个比例,直至最后一位小数。事实上,大多数持否定意见的人,已经随手将你的问卷丢进最近的纸篓中,从样本中自动除名了。哪怕最初的样本中,10个里面有9个会当这种“投手”,在宣布你的结果时,你仍然会遵从惯例,忽略他们。
现实生活中,样本会按照上述方式变得有偏吗?相信我,一定会。
不久前,报纸和新闻杂志上报道:近10年来美国大约有400万名天主教徒变成了基督教徒。资料来源于由丹尼尔?A。 波林(Daniel A。 Poling)牧师主导的调查,丹尼尔?A?波林是教派组织《基督教先驱报》(Christian Herald)的编辑。《时代》(Time)杂志描述了整个故事的梗概:
“通过对全美基督教牧师的横截面展开调查,《先驱报》得到了调查结果。调查共发出25000份问卷,其中2219名牧师反馈回了问卷,回收的问卷显示:在过去10年里共有51361名原罗马天主教徒变成了基督教徒。根据样本推算,波林得到了全国范围的估计:近10年来全美共有4144366名天主教徒改变信仰,变成了基督教徒。主教威尔?奥斯勒(Will Oursler)写道:‘即便考虑到误差,全美范围内这一数据也不可能少于200万或者300万,而且很有可能接近500万。’”
虽然《时代》没能指出真相的关键之处,但是它却使我们了解到被调查的牧师中超过90%的人没有回答,这已经值得我们向它鞠躬表示敬意了。为了彻底破坏调查结果的可信度,我们只需要指出:这个“500万”是不可靠的,因为调查中有高达90%的牧师没有发表看法,或许他们中大多数都早已将调查问卷投进了纸篓。
根据以上判断,我们利用管辖范围内所有牧师人数,即181000人——该数据就是波林博士计算时所采用的数据——进行自己的推算。由于从181000名牧师中抽取了25000人接受调查,得到了改变信仰的教徒为51361人,如果调查全部牧师,转变信仰的总人数应该约为370000人。
我们这种粗糙的方法产生了一个十分可疑的数据,但是它至少与那个在全国范围发布的数据一样“可靠”,而后者却是前者的11倍,是的,300万看上去更加令人欢欣鼓舞些。
内在有偏的样本(2)
至于奥斯勒先生充满自信的那句话“考虑到误差”,好吧,如果他发现了一种方法足以弥补未知量所带来的误差,那么整个统计界都将会为之感激涕零。
在上述背景下,让我们来研究一则以前的新闻报道:“1924级的耶鲁毕业生平均年收入为25111美元”,要知道几年前的钱是更值钱的。
好家伙,他们干得真不赖!
可是,等一等,这个令人印象深刻的数字到底意味着什么?是否像表面看到的那样,足以证明如果你把你的男孩送进耶鲁大学,或者牛津大学,那么在年老时,你就不需要辛苦地上班,甚至他将来年老时也不用上班?
在充满怀疑的惊鸿一瞥后,关于该数字的两个疑点凸现出来:它惊人的精确;它大得令人难以置信。
对一群相隔千山万水的人,了解他们的平均收入,而且竟然精确到以元为单位,这几乎不太可能。就算是自己去年的收入,除非全部来自薪水,否则也很难知道得如此准确。但是对于年收入25000美元的阶层来说,投资渠道更广,因此他们的收入不可能完全来自于薪水。
而且毫无疑问,这个可爱的平均数出自耶鲁人之口。即使1924年他们在纽海文译者注:纽海文是美国东北部康涅狄格州的一个城市,耶鲁大学就坐落在这个城市。接受过优良的教育,也很难保证四分之一个世纪后,他们还能坚持说真话。当问及收入时,有些人出于虚荣或者天生乐观而夸大数据;有些人却故意缩小数字,特别当涉及征所得税问题时,往往会犹豫不决,生怕与其他文件填报的数据不符,谁知道税务员又看到了什么?这两种趋势——夸大与缩小,也许将相互抵消,但这种可能性很小。一般而言,一种趋势总会强于另一种,但我们很难猜测哪种趋势将胜出。
我们试着来解释这个数字,单凭常识就知道这个数字与现实出入很大。现在,让我们找找最大误差的可能来源。是什么使那些实际上收入也许只有25111美元一半的人们最终会拥有如此丰厚的平均收入?让我们来揭开这神秘的面纱。
可以肯定的是:耶鲁毕业生的报道基于对某个样本的分析,因为常识告诉我们,