统计数字会撒谎-第2部分

小说：统计数字会撒谎字数：每页4000字

按键盘上方向键 ← 或 → 可快速上下翻页，按键盘上的 Enter 键可回到本书目录页，按键盘上方向键 ↑ 可回到本页顶部！
————未阅读完？加入书签已便下次继续阅读！

　　Chapter　5令人惊奇的图形
　　一张图告诉你朴实的10％的增长，而另一张却看起来是让人振奋的100％的增长，别怀疑你的眼睛，截然不同的两幅图说的可是同一回事！
　　Chapter　6一维图形的滥用
　　数字是2∶1，但视觉效果却是8∶1。嘴上说的是15倍，看起来却是3倍……或许你正在被这些图形所振奋着。
　　Chapter　7不完全匹配的资料
　　一篇来自著名实验室的报告：在11秒钟内仅仅半盎司该药的剂量就杀死了试管中31108个病菌。
　　随处可见某种榨汁机的广告：“经过实验室的证明”该榨汁机的“榨汁功能增强了26％。”……
　　听起来真不错，这是货真价实的“挂羊头卖狗肉”。
　　Chapter　8相关关系的误解
　　抽烟与大学成绩；独身与上大学；身上的跳蚤与健康；房屋顶上白鹤鸟巢的个数与荷兰某个家庭中已出生孩子的人数；马萨诸塞州长老教会会长的收入与哈瓦那朗姆酒的价格……
　　是风牛马不相及？还是亦步亦趋、息息相关？真实的结果一定让你大跌眼镜。
　　Chapter　9如何进行统计操纵
　　怎样在一年内获得22500美元的总收入？你只需1个妻子（或丈夫）和13个孩子。
　　“现在就购买圣诞礼物，你将节省100％。”精明的商家居然成了圣诞老人，开始免费馈赠了。
　　有些人很害怕你知晓其中的“技巧”。
　　Chapter　10如何反驳统计资料
　　谁说的？他是如何知道的？遗漏了什么？是否有人偷换了概念？这个资料有意义吗？
　　提这5个问题，凭双眼就识破并揭穿虚假的统计资料；更为重要的是在具有欺骗性的数据海洋中找出可靠有用的资料，不再让你的关键决策南辕北辙。
　　致谢语：
　　在多方的帮助下，经过广泛的收集，我得到了散见在本书各章当中的关于狡辩和欺诈的小例子。在我通过美国统计学会发出呼吁后，许多专业统计学家——请相信我，他们和其他人一样痛恨统计资料的滥用——从他们自身收集的资料中为我提供了大量的实例。这些人，我猜想，将乐意成为无名英雄。同样，我在许多书籍中发现了有价值的案例，仅列出其中主要的书籍：Martin　A。　Brumbaugh　和Lester　S。　Kellogg所著的《商业统计学》；Hadley　Cantril的《公共观点的测定》；Willard　Cope　Brinton的《图表表示法》；Frederick　E。　Croxton　和Dudley　J。　Cowden的《实用商业统计学》；George　Simpson　和Fritz　Kafka的《基础统计学》以及Helen　M。　Walker　的《基础统计方法》。
　　Darrell　HuffⅠ
　　

序言：
我的岳父从爱荷华州到加利福尼亚州不久便对我说：“你们这儿治安不好。”在他所阅读的关于加州的报道的确如此。但是，这些报道通常来自一份爱荷华州的报纸。这份报纸不会轻易忽略掉加州发生的任何犯罪行为，虽然它也报道本州的谋杀案，但看起来它更乐意大肆渲染加州出现的同类情况，而且还因此而闻名。
　　我岳父得出的这个结论是建立在明显有偏样本基础之上的，是一个随意的统计结论。类似于其他更为精致的统计结论，也存在着证据与结果不匹配的问题，因为这些结论都在假定：报纸专栏中对犯罪行为的报道是测量犯罪率的工具。
　　几年前，十来个调查人员独立地发表了关于抗组织胺药的试验数据。所有的数据都证明，在经过抗组织胺药物治疗后，相当高比例的感冒能够治愈。这一结论引起了传媒的大肆宣传报道，抗组织胺药的广告铺天盖地，医药界也掀起了此类药物的生产热潮。人们对健康永恒不变的追求造就了这种热潮，但奇怪的是，人们拒绝越过统计资料去注意一下早就了解的事实。正如一位幽默的非医学权威人士，亨利？G？菲尔森（Henry　G．Felsen）不久前所指出的——正确的治疗的确能在7天内治愈感冒，但是即使不进行任何治疗，感冒也能在一个星期内痊愈。
　　事实往往在所见所闻之外。平均数、作用关系、趋势和图表总是与看上去的不一致。虽然经验告诉我们“眼见为实”，但眼睛告诉我们的“真相”或许隐瞒了部分事实，或许夸大了事实。
　　统计这种神秘的语言，在一个靠事实说话的社会里是如此地吸引眼球，但有时它却被人利用，并成为恶意夸大或简化事实、迷惑他人的工具。在报告社会经济趋势、商业状况、民意调查和普查的大量数据时，统计方法或者统计术语是必不可少的。但如果作者不能正确理解并恰当地使用这些统计语言，而读者又并不能真正了解这些术语的含义，那么，统计结果只能是废话一堆。
　　在科能技主题的文章中，经常充斥着滥用统计资料的现象，每一个数据都很有力地打消你的疑虑，都张着嘴告诉你这是对的，但是人们很难联想到这样一种场景：灯光如豆的实验室中，“白衣英雄们”仍在不计报酬、不辞辛劳地包装这些数据。统计，就像最神奇的化妆术，只要略施粉黛，东施尤胜西施。巧妙伪装的统计资料胜过希特勒的弥天大谎，虽然它也会引起人们的误解，但制造它的人却能巧妙脱身。
　　这本书是一本如何利用统计瞒天过海的入门读物。看上去，它很像骗子的行骗宝典。但或许我可以模仿一个已退休的窃贼——如何神不知、鬼不觉地撬开一把锁，他的###达到了研究生课程的水平——替这本书说句公道话：毕竟，骗子对于行骗的技巧早已胸有成竹，而诚实的人出于自卫也应该掌握它。
　　书包　网　。　想看书来

内在有偏的样本（1）
第一章内在有偏的样本
　　有一个装着红、白两色豆子的桶，如果你想要准确知道这个桶中两种豆子的数量，你惟一能做的只有一颗一颗地数豆子。
　　用一种更简单的方法也可以揣测红豆的数量：抓一把豆子，假定手中红豆的比例与桶中红豆的比例相同，只要数一数手中的豆子即可。如果你的样本足够大，并且选择方法正确，在大多数情况下它能够很好地代表整体。但是，如果以上两个条件不满足，这样的样本比一个臆想好不到哪儿去，除了能够营造科学精确的假象之外，其他则根本不值一提。不幸的是，我们所看到的，或者我们自以为了解的许多事物，往往都是根据类似样本所得出的结论，这种样本可能变得有偏，由于选择方式的不合理或者容量过小，抑或两种情况同时存在。
　　通过一个极端的例子可以马上看到如何形成有偏的样本。假设你向同胞发放问卷，问卷中包含这样一个问题：“你乐意回答调查问卷吗？”整理所有的答案，你很有可能得到下面的结论：“一个选自总体、典型的横截面”中，压倒多数的人选择了“乐意”。为了具有说服力，你还可以详细列出这个比例，直至最后一位小数。事实上，大多数持否定意见的人，已经随手将你的问卷丢进最近的纸篓中，从样本中自动除名了。哪怕最初的样本中，10个里面有9个会当这种“投手”，在宣布你的结果时，你仍然会遵从惯例，忽略他们。
　　现实生活中，样本会按照上述方式变得有偏吗？相信我，一定会。
　　不久前，报纸和新闻杂志上报道：近10年来美国大约有400万名天主教徒变成了基督教徒。资料来源于由丹尼尔？A。　波林（Daniel　A。　Poling）牧师主导的调查，丹尼尔？A？波林是教派组织《基督教先驱报》（Christian　Herald）的编辑。《时代》（Time）杂志描述了整个故事的梗概：
　　“通过对全美基督教牧师的横截面展开调查，《先驱报》得到了调查结果。调查共发出25000份问卷，其中2219名牧师反馈回了问卷，回收的问卷显示：在过去10年里共有51361名原罗马天主教徒变成了基督教徒。根据样本推算，波林得到了全国范围的估计：近10年来全美共有4144366名天主教徒改变信仰，变成了基督教徒。主教威尔？奥斯勒（Will　Oursler）写道：‘即便考虑到误差，全美范围内这一数据也不可能少于200万或者300万，而且很有可能接近500万。’”
　　虽然《时代》没能指出真相的关键之处，但是它却使我们了解到被调查的牧师中超过90％的人没有回答，这已经值得我们向它鞠躬表示敬意了。为了彻底破坏调查结果的可信度，我们只需要指出：这个“500万”是不可靠的，因为调查中有高达90％的牧师没有发表看法，或许他们中大多数都早已将调查问卷投进了纸篓。
　　根据以上判断，我们利用管辖范围内所有牧师人数，即181000人——该数据就是波林博士计算时所采用的数据——进行自己的推算。由于从181000名牧师中抽取了25000人接受调查，得到了改变信仰的教徒为51361人，如果调查全部牧师，转变信仰的总人数应该约为370000人。
　　我们这种粗糙的方法产生了一个十分可疑的数据，但是它至少与那个在全国范围发布的数据一样“可靠”，而后者却是前者的11倍，是的，300万看上去更加令人欢欣鼓舞些。

内在有偏的样本（2）
至于奥斯勒先生充满自信的那句话“考虑到误差”，好吧，如果他发现了一种方法足以弥补未知量所带来的误差，那么整个统计界都将会为之感激涕零。
　　在上述背景下，让我们来研究一则以前的新闻报道：“1924级的耶鲁毕业生平均年收入为25111美元”，要知道几年前的钱是更值钱的。
　　好家伙，他们干得真不赖！
　　可是，等一等，这个令人印象深刻的数字到底意味着什么？是否像表面看到的那样，足以证明如果你把你的男孩送进耶鲁大学，或者牛津大学，那么在年老时，你就不需要辛苦地上班，甚至他将来年老时也不用上班？
　　在充满怀疑的惊鸿一瞥后，关于该数字的两个疑点凸现出来：它惊人的精确；它大得令人难以置信。
　　对一群相隔千山万水的人，了解他们的平均收入，而且竟然精确到以元为单位，这几乎不太可能。就算是自己去年的收入，除非全部来自薪水，否则也很难知道得如此准确。但是对于年收入25000美元的阶层来说，投资渠道更广，因此他们的收入不可能完全来自于薪水。
　　而且毫无疑问，这个可爱的平均数出自耶鲁人之口。即使1924年他们在纽海文译者注：纽海文是美国东北部康涅狄格州的一个城市，耶鲁大学就坐落在这个城市。接受过优良的教育，也很难保证四分之一个世纪后，他们还能坚持说真话。当问及收入时，有些人出于虚荣或者天生乐观而夸大数据；有些人却故意缩小数字，特别当涉及征所得税问题时，往往会犹豫不决，生怕与其他文件填报的数据不符，谁知道税务员又看到了什么？这两种趋势——夸大与缩小，也许将相互抵消，但这种可能性很小。一般而言，一种趋势总会强于另一种，但我们很难猜测哪种趋势将胜出。
　　我们试着来解释这个数字，单凭常识就知道这个数字与现实出入很大。现在，让我们找找最大误差的可能来源。是什么使那些实际上收入也许只有25111美元一半的人们最终会拥有如此丰厚的平均收入？让我们来揭开这神秘的面纱。
　　可以肯定的是：耶鲁毕业生的报道基于对某个样本的分析，因为常识告诉我们，

返回目录上一页下一页回到顶部赞（0）踩（0）

第2部分

统计数字会撒谎-第2部分

你可能喜欢的