五千年(敝帚自珍)

主题:【整理】《批判性思维指南》书摘 -- 游识猷

共:💬30 🌺73
全看分页树展 · 主题 跟帖
家园 9.统计数据是否具有欺骗性?

【9.统计数据是否具有欺骗性?】

统计数据是一种以数字形式表现出来的证据。

因为数字使证据看起来非常科学、精确,让人感觉似乎这就代表着“事实”。然而,统计数据可以并且经常欺骗大家!表面上它们很有说服力,事实上却不一定。

◇不可知的、有偏见的统计数据

找出具有欺骗性的统计数据,首要策略是尽可能多地了解人们如何获得这些统计数据。

因为在获得准确的统计数据的过程中,由于某些特定原因,将出现各种各样的干扰,比如,不愿提供真实信息、没能记录下事件过程、观察事件时出现仪器故障或随机误差。因此,统计数据常被看作是“经过训练的推测"。那些推测很可能相当有用,也可能相当具有欺骗性。你需要时常提醒自己:

“作者是如何得出这些估计的呢?"

◇以“平均”这个词为例。 定义一个平均数有三种不同的方法,而且在大多数情况下不同的定义会得到不同的平均数值。

第一种方法是将所有的数据相加,再用所得的和除以数据的个数,得到的结果就叫做算术平均数。

第二种方法是按从大到小的顺序列出所有数据,找出位于中间的那个数。这个数叫做中数。一组数值中有一半数据大干中数,一半数据小干中数。

第三种方法是列出所有数据,然后将不同的数值排列归类。在一组数据中出现次数最多的那个数值叫做众数。

作者讨论的是算术平均数、中数还是众数,会产生很大的差异。

当你看见表示“平均”的数值时,都应该想想:“采用算术平均数、中数或众数是否有差别?”

◇通常,不只是决定采用哪一种平均数才重要,决定最小值和最大值之间的间距(即数据的范围)、每个数据出现的频率(即数据的分布)也同样重要。

当你看到平均数时,问问自己:“我是否需要了解数据的范围和分布情况?"

◇结论与证据不相符合

有些人在表达他们的观点时所宣称的已经被证明的问题与他们使用的统计数据所证明的问题大相径庭。看起来这些统计数据似乎能证明作者的观点,实际上却不能!这里是两种判断这种欺骗的策略。

一种策略是,不去看作者的统计数据,并问自己:“哪种统计数据有助于证明作者的结论?”然后,将所需要的统计数据与作者给出的统计数据进行比较。如果这两种数据不匹配,你就可能找出了一个统计数据上的谎言。

我们要仔细地注意统计数据的措辞和结论的措辞,看两者说明的是不是同一件事。如果两者不一致,那么作者就可能在运用统计数据说谎。

另一种更为有效的策略:不要看作者提出的结论,而是仔细审查作者所使用的统计数据,然后问问自己:“由这些统计数据得出什么结论是恰当的呢?”接下来,把你得出的结论与作者的结论进行比较。

借助遗漏的信息撒谎

在你判断出统计数据的影响之前,一定要想想:“有没有什么相关信息被忽略了?”

尤其是遇到比较类的统计数据时。使用相对值类数据来描述风险减少可能具有欺骗性。当你遇到使用这些统计数据的论证时,一定要想一想,如果使用绝对值会出现什么不同,数据给人的印象是否也不及先前那样深刻。

◇评估统计数据的线索

1.尽可能地找出你所知道的这些统计数据是如何得出来的。问问自己:“作者是怎么知道的呢?”

2.注意作者所使用的平均数的类型。

3.小心证据和结论不相符合。

4.不看作者的统计数据。将你认为所需要的统计数据与作者实际给出的数据进行比较。

5.根据作者给出的统计数据,得出你自己的结论。如果与作者的结论不匹配,说明可能有什么地方出错了。

6.看看哪些信息被遗漏了。特别要小心那些易使人误解的数字、百分比以及类比。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河