- 近期网站停站换新具体说明
- 按以上说明时间,延期一周至网站时间26-27左右。具体实施前两天会在此提前通知具体实施时间
主题:【原创】因果关系(科学中的因果关系) -- earthcolor
前面一直在犹豫:要不要写这个帖子?一个原因是这个话题本身有很大的争议,很难有一个大家都接受的结论。另一个原因是自己对这方面研究不深,有些内容写出来不一定正确。另外,如果作为专业研究讨论这个话题,可能感兴趣的人不一定很多。不过,看到《经济管理》版中,很多人都以专业的知识,讨论专业的内容。因为大家都对经济有感觉,所以大家可以讨论到一起。虽然大家的看法各有不同,但专业的和业余的人士还是可以交流的(虽然专业人士经常感觉非专业人士的说法不准确,非专业人士感觉专业人士的说法是不知所云)。其实,有时候专业人员和业余人员的分界线不是那么明显的。业余人员在某一方面花时间多了,也就成立专业人员。每个行业的第一专业人员,肯定是从业余人员来的(总不会天上掉下来吧)。记得有这样一个故事。文革前的一个学物理的大学生,被下放到一个单位的食堂,主要工作是买菜。买菜,这事可大可小。这位先生,将食堂所需的菜规划分类,将城市的菜市场规划分类,考虑城市的交通和红绿灯情况,系统考虑问题,通过优化,买菜价格合理、花费时间少。文革后,这位先生成了国家有名的系统论专家。看来,只要有心去了解一个东西,专业并不只是指学校学习的东西,也包括业务中用到的东西和自己花时间去了解的东西。
相对于经济、股市、时事等在西西河的热门话题,因果关系也是一个大家都可以参与讨论的话题,因为我们的生活中充满着因果关系,我们无时无刻不在和因果关系打交道,只是很多时候我们都没有意识到我们在应用因果关系。简单地说一个现象:你按开关,灯会亮;再按开关,灯会灭。这里面就包含着因果关系。当然,每种因果关系的讨论,都包括很多条件,比如,电源是好的,电路是好的。不过,在日常生活中,我们可能省略了(或默认了)各种条件。只将注意力放在主要的因素上:在上面的现象中,“灯会不会亮”是我们主要关心的。如果无论我们如何按开关,灯都不亮,我们将会检查电源。如果电源是好的,我们会检查灯泡。如果灯泡是好的,我们会检查电路,等等。可以看出,在不同条件下,我们注意的主要因素会变化。
我个人对因果关系的一些研究文章,有一点了解。不过,自己对这个领域了解不深,可能对个别问题有自己的看法,但是从总体上来说,没有自己的系统。现在讲出来,和大家交流,共同学习。如果有不对的地方,敬请指出。
因果关系是一个有争议的话题。自从有了人类(或者更广泛一点,生物),大家就开始了对因果关系的观察、讨论和应用。比如用火可以加热东西,按季节种植可以收获庄稼。在古希腊,亚里士多德讨论过因果关系。在文艺复兴时期,开始了大量的自然探索,更是离不开对因果关系的探讨。在现代科学中,更是默认有因果关系存在:吃了这种药,可以治疗某种疾病。可以说,因果关系已经深入我们的生活,一两岁的小孩,也可以明显地判断因果关系:很烫的东西可以烫痛手的,小孩摸过一次烫的东西后,一定会吸取教训,不再去摸烫的东西。(让他们有一点点经验也是可以。不过,大人要保护小宝宝,不要让他们烫伤了。)
在河里,有不少人从自己的专业或爱好出发,比如在经济中,或者在宗教中,提到了因果关系。现在在各个学校里,好像没有专门的因果关系专业吧。不过,不管你是默认也罢,还是反对也罢,每个学科都和因果关系有联系。在这里,我主要读了以下几本书和一些相关的文章(插一句话:书是读过,理解多少是另外一回事)。如果有人对这方面感兴趣,想深入了解,可以自己找书来读。
C. Glymour, G.F. Cooper (Eds.), Computation, Causation, and Discovery, MIT Press, Cambridge, MA, USA, 1999
J. Pearl, Causality: models, reasoning, and inference, Cambridge University Press, New York, 2000.
P. Spirtes, C. Glymour, R. Scheines, Causation, Prediction, and Search (Second Edition), MIT Press, Cambridge, MA, USA, 2000.
J. Woodward, Making things happen: a theory of causal explanation, Oxford University Press, 2003
前三本书偏重于统计、计算机专业,理论性较强。在这些书中,我认为Judea Pearl的书影响最大,因为他定义了三条重要的规则。根据这三条规则,在一定条件和因果关系结构给定的情况下,可以将将观察数据中得来的相关关系(correlation)的度量(或者说概率),转换成因果关系(causality)中的度量。这三条规则,势必对其他领域的因果关系研究有直接的影响,尤其是在无法进行可控制可重复的实验的领域。比如,在经济领域里,我们可以根据经验,得出变量之间的因果关系结构。也许我们知道改变一个经济参数时,其他参数可能的变化方向。但是,我们只有观察数据,没有实验数据,无法推断我们在改变一个经济参数(比如利率)时,其他参数具体变化的程度。Judea Pearl的研究结果,为我们提供了相应的指导:在一定条件下,如果我们人为地改变一些系统的参数(比如利率),我们可以根据已有的观察数据,推断系统中其他参数变化程度。(当然,如何选取观察数据,是另外一个问题。这里先不讲,以后再说。不过先提一下,农业的数据比较好观察,因为庄稼有明显的种植和收获时间,而整体经济运行是连续的,数据的采样、时间间隔选取都是问题。)
Spirtes和他的合作者的书,主要讲述了如何根据已有的观察数据,搜索、发现可能的因果关系结构。也就是说,哪一个因果关系结构,能更好地解释已有观察数据。和Judea Pearl一样,在他们的书里,作者主要是应用了概率里的条件独立关系,来推断变量之间的互相依赖关系。在两个假设(因果关系的马尔科夫假设和忠实性假设, causal Markov assumption and faithfulness assumption)给定的条件下,很多因果关系可以根据条件独立关系,从观察数据中推断出来。
Glymour和Cooper的书是一个论文集,收集了很多在因果关系研究领域有影响的研究人员的作品。不同的文章作者讨论他们对因果关系的理解、因果关系的发现和应用。这本书可以作为Judea Pearl和Spirtes et al 书的补充。(我只挑选了一些文章来读。)
第四本书偏重于哲学,相对来说没有太多数学,理论上容易理解一些。这本书讲到了其他多种的因果关系理论,有兴趣的爱好者可以自己去看一看(我基本没有读过)。这本书里的因果关系的结构描述,更多采用Judea Pearl 的表示方法。不过,这本书的英语到了哲学写作的程度,英语语言本身绕来绕去的,不像理科文章的语言那么直接。这本书看得我头晕,现在还没有读完。
我前面看的大多数是英文资料。如果有人可以提供相关的中文资料,将非常感谢。
我想写的内容,一部分其实主要是翻译,另外一部分是自己的一些随想(也可以说是读书笔记吧)。先列出来一些问题,欢迎大家讨论。
本帖一共被 1 帖 引用 (帖内工具实现)
这些故事是很常见的。相信很多人都听过。
1) 公鸡叫和太阳升起的关系
古代和现在的有些乡村(城市里很难看到了),人们通过公鸡叫,来确定天快亮了(太阳要出来了)。请问,公鸡叫,是太阳出来的原因吗?
2) 吸烟和肺癌的关系
很多文章都在讲,吸烟有害健康,尤其是可能导致肺癌。可是我们也看到很多烟民的健康并不差,甚至我们还看到有的烟民很高寿。请问,你相信吸烟会导致肺癌吗?
4) 气压、风暴和气压计读数
气压计读数的降低,往往伴随着风暴的来临。请问,气压计读数的降低,是风暴的来临的原因吗?
5) 假如避孕药可以直接导致血栓症的发病率升高,同时又可以直接降低怀孕的几率,而怀孕可以直接导致血栓症的发病率升高。请问,避孕药对血栓症有什么影响?Hesslow(1976)
一些故事:经济中的因果关系
1)有人说,在经济中,增加货币投入,可以刺激经济,提高国民生产总值。你相信吗?
2)利率下调会导致股市上涨吗?利率下调是股市的利好消息吗?
一些故事:法律中的因果关系
因果关系在法律中有很多的作用。要确定一个犯罪事实成立,我们必须了解其中的原因和结果。一些细节的差异,决定了不同的犯罪程度,决定了不同的量刑。给出一些假设的案例,共大家参考。
第一组案例
1) A给饮料中下毒(绝对可以置人于死的毒药,十分钟内发作),X喝饮料,仅把饮料含在了口中。这时,B开枪打中X的头部,X死亡。请问,对于X的死亡,在法律上如何给A和B定罪?
2) A给饮料中下毒(绝对可以置人于死的毒药,十分钟内发作)。X刚喝完饮料,B开枪打中X的头部,X死亡。请问,对于X的死亡,在法律上如何给A和B定罪?
3) A给饮料中下毒(绝对可以置人于死的毒药,十分钟内发作)。X喝完饮料十二分钟后,B开枪打中X的头部,X死亡。请问,对于X的死亡,在法律上如何给A和B定罪?
第二组案例
1) 一次车祸中,A违章驾驶将B撞成重伤。受伤后,B难以忍受肉体上的疼痛和精神上的痛苦而自杀了。请问,A要对B的死亡负多大的责任?
2) 一次车祸中,A违章驾驶将B撞死。在尸体解剖中,发现B患有癌症晚期。请问,A要对B的死亡负多大的责任?
3) 一次车祸中,A违章驾驶将B撞成重伤。由于受伤,B原有疾病发作,在短时期内死亡。请问,A要对B的死亡负多大的责任?
网上有一个实际的案例,大家可以参考:外链出处
【题外话】吸烟的好处
有人说:吸烟有三大好处。
第一,吸烟可以增加收入。不信?你看,吸烟的人大多低着头,容易看到别人掉的钱。捡起来,不就增加收入了?
第二,吸烟可以增加安全。为什么?你看,吸烟的人大多咳嗽。晚上一咳嗽,小偷想:啊呀,这家人还没有睡着,别在这家偷了,换一家吧。
第三,吸烟让人永远年轻。真的吗?这么好?真的,真的!不骗你!你看,吸烟的人容易得病,没有等年纪大就死了。如果再托生回来,不就更年轻,而且永远不会年老,永远年轻。对不对?!
(送花三朵捡宝一枚赚了)
1)
增加货币投入=〉货币贬值=〉增加出口=〉拉动经济=〉提高国民生产总值
增加货币投入=〉货币贬值=〉提高名义利率=〉降低经济活力=〉减小国民生产总值
如果政策得当,理论上都可行。实际数据是否支持不知道
2)
利率下调=〉资金寻求更高投资回报=〉取出银行投资股市=〉股市上涨
这个反方向比较难说通,虽然因果链较长,但数据似乎强烈支持负相关。
经济学的好处就是正反都好说,因此给了民科很大的自由发挥空间,但是说到底拿得出拿不出数据是关键问题。我对民科的定义是:
不理解现有理论(主要是不想花时间学习)
不遵守奥卡姆剃刀(若选择不遵守此原则,则该民科理论及其一亿种复杂变体同样正确)
没有试验数据支持(没有预测能力)
说实话民科河里挺多的,当然民科哪里都不少。有空写一篇得罪人玩玩。
问题:古代和现在的有些乡村(城市里很难看到了),人们通过公鸡叫,来确定天快亮了(太阳要出来了)。请问,公鸡叫,是太阳出来的原因吗?
当然不是了,公鸡叫不是太阳升的原因,但是公鸡叫和太阳升有很大的相关关系(以后会再讲到)。
如果只讲这个事实,那么大家都知道。问题是这个简单事实背后,有很多值得我们挖掘的东西。举个例子来说,1+1=2。简单吧,大家都知道吧。如果要考虑其中涉及的数学,可能就有很多方面可以讨论,比如:
1)有了数字的概念;
这一点非常重要。重要到什么程度?想想股市,那概念股炒的,一只股票和一个新概念沾上了边,可能在短时间内上涨一倍甚至几倍!同样,在科学里,概念的重要程度,是别的技术、技巧所无法比拟的。想想氧气在燃烧中的概念(在这之前,燃素说流行多年),想想分子、原子的概念,想想大陆漂移的概念,想想相对论的概念,这些都是影响一个或多个学科的重要概念。而数字,是一起数学表示、计算和分析的基础。
2)有了数字的表达形式(阿拉伯数字)。在人类历史上,曾经出现过很多不同类型的数字表达形式。著名的有中文数字、罗马数字等等。但阿拉伯数字的相对简单,使得它得到了普及和广泛应用。
3)有了数字的表示范围(或集合)(自然数,十进位;二进制的话,这个式子是不可能的,因为二进制的数字中没有2)。
4)有了操作符(+,=)。
5)有了操作符的使用规则。
因果关系,是和数字一样在我们生活中经常用到的,大家都有因果关系的概念。但是,直到目前为止,我们还没有有效的表达因果关系的数学形式。
在人们的常识中,包含了很多我们默认的、没有明确表达的、但其实非常重要的因果关系知识。掌握了这些因果关系知识,可以帮助我们更好地去运用他们、规范他们。相比较前面对1+1=2中包含内容的讨论,我们可以看出在因果关系方面,
1) 我们已经有了因果关系的概念
对于公鸡叫和太阳升的问题,无论你回答“是”还是“不是”,都表示你对里面的原因关系有概念。虽然在这种情况下,我们还不能明确地定义因果关系。
2) 因果关系的表达形式
这是目前的研究内容之一,包括因果关系中的基本元素和元素之间的相互关系。通常,逻辑可以用来表示确定型因果关系,但是逻辑所表达的,不都是因果关系。概率是另一种表达形式,但是还有很多不能表达的。概率图形模型,是现在一个比较热门的表达形式,很多人在研究。从这里看出,我们在因果关系的研究上还处在非常初级的阶段。因为还没有合适的表达形式,后面的表示范围、操作符和操作符的使用规则都无从谈起。
好了,再回到我们的问题。如果公鸡叫不是太阳升的原因,我们会如何反驳?这里可以有不同的方法。
方法一:我们可以观察公鸡在其他时间叫的时候,太阳会不会升起。比如在傍晚,我们看到公鸡叫了,我们会观察太阳会不会重新从东方升起。事实上,当公鸡在其他时间叫的时候,太阳是不会从东方升起的。
方法二:我们可以学周扒皮,半夜学鸡叫,引起真正的鸡叫,然后看看太阳会不会升起?如果公鸡叫了而太阳没有升起,说明公鸡叫不是太阳升的原因。注意,这里有一个重要的概念:公鸡叫,是人为引起的。这涉及到因果关系里的可操作性(manipulability)。一个变量值的改变,来自于系统外的因素。
在因果关系分析中,以上两种方法是经常会被用到的。所以说,在一个简单的事实,可能包含了很多重要的内容。我们要注意去观察和学习。
持续关注。
因为在任何时候,地球的某一处太阳正在升起。
看来在原说法上要加一些限制条件:比如当公鸡在其他时间叫的时候,太阳是不会从当前这个公鸡对应的东方升起的。