主题:【原创】因果关系(科学中的因果关系) -- earthcolor

共:💬42 🌺61 新:
全看分页树展 · 主题 跟帖
家园 【因果关系-原版翻译】原因与结果的艺术和科学(一)2

The following is the Chinese translation of Professor Judea Pearl’s lecture transcript at the eighty-first lecture in the UCLA Faculty Research Lectureship Program. The original version is at the web page http://singapore.cs.ucla.edu/LECTURE/lecture_sec1.htm. This translated version may differ from the original version. If you find any confusion or errors in this translated version, please refer to the original version for more information, and please leave your message in this forum. I'd like to thank Professor Judea Pearl for granting permission to translate and to publish his lecture on the web.

下面是朱迪亚.明珠教授 教授在1996年获得加州大学洛杉矶分校研究讲座演讲的中文译稿。原稿的网址是http://singapore.cs.ucla.edu/LECTURE/lecture_sec1.htm。 这个中文译稿有可能和原稿不一致。如果你在中文译稿中发现有语言不妥或错误的地方,请参照原文以获取更多的信息,并请在这个论坛上留言。我非常感谢朱迪亚•明珠教授同意翻译他的演讲稿,并发表在网络上。

朱迪亚.明珠

被授予第八十一届研究讲座**

原因与结果的艺术和科学*

于1996年10月29日星期四的演讲稿,作为加州大学洛杉矶分校第八十一届研究讲座系列的一部分

*本演讲现作为(我的专著)《因果关系:模型,推理与推论》的后记。本书即将由剑桥大学出版社于2000年1月出版(已经出版 – 译者注)。

** (此乃该校最高的学术荣誉 – 译者注)

可以点击略图来查看全尺寸的幻灯片

另外,您也可以打开一个新的网页浏览器,同时查看文本和幻灯片

提醒 – 这个演讲的页面包含很多图片,可能要花一段时间才能下载。

如果需要硬拷贝的话,请联络[email protected]

阅读这个翻译,请配合原幻灯片看,因为有一部分内容在幻灯片里。

The lecture "The Art and Science of Cause and Effect" was delivered by Judea Pearl in 1996, and also appears as Epilogue in his book "Causality" by Cambridge University Press.

原文链接

http://singapore.cs.ucla.edu/LECTURE/lecture_sec1b.htm

幻灯片22 :休谟––《人性论》扉页

休谟令人信服地指出,“为什么”不只是排在“如何做”之后,而且“为什么”是完全不必要的,因为“为什么”完全由“如何做”所包含。

幻灯片23 :《人性论》第156页

在休谟《人性论》的第156页 ,我们发现该段文字把因果关系打乱的如此彻底,以至于到今天它也没有恢复(到以前的)。我每读到这段文字都能从其中得到乐趣:

“因此,我们记得我们曾看到那种我们称为*火焰*的东西 ,并有那种我们称为*热*的感觉。同样地我们回想起在以往事件中他们总是同时发生。自然地,我们称一个为*原因*,称另一个为*结果*,并从一个的存在推断出另一个的存在。”

因此,根据休谟的说法,因果关系是观察的结果。因果关系是头脑中一个可学习的习惯,几乎和视觉错觉一样虚幻,和帕夫洛夫的条件反射一样短暂。很难相信,休谟没有意识到他所提出的方法中的固有难题。

他相当清楚地知道,公鸡叫和日出有着不变的同时发生的关系,但是公鸡叫并不会导致日出。他知道气压计的读数和下雨有着不变的同时发生的关系,但是气压计的读数并不会导致下雨。

今天这些关系都可称为“虚假相关”,即“相关性并不意味着因果关系” 。

现在,根据休谟的名言,所有的知识来自经验(经验是以相关性来在头脑中表达的),以及我们的观察(相关并不意味着因果关系),我们遇到了第一个因果关系之谜:人们一直以来是如何获取因果关系知识的?

幻灯片24 :第一个因果关系之谜

在公鸡的例子中我们看到,只有连续的规则性是不够的:那么什么是(因果关系的)充分条件呢?什么模式的经验将证明一个联系是“因果关系”呢?此外,什么模式的经验可以说服人们,一个联系是“因果关系的”呢?

幻灯片25日:第二个因果关系之谜

如果第一谜关注的是因果关系的学习问题,第二谜关注的是因果关系的应用问题:如果我告诉你在某方面是或不是的因果关系,这会导致什么差别呢?

继续我们的例子:如果我告诉你,公鸡会导致日出,这会有什么分别?这个问题听起来可能微不足道。明显的答案是,知道“什么会导致什么”会在我们的行动上造成很大的差异。如果公鸡叫是日出的原因,我们可以通过提前唤醒我们的公鸡,并让它们叫(给它们讲最新的公鸡笑话)而缩短黑夜。

但这个谜不像它看上去这么简单。如果在连续的规则性之外,因果信息具有实证的意义,那么,这种信息应该在物理定律显示出来。但是它没有!哲学家罗素在1913年提出的这个论点:

幻灯片26 :从物理中证明因果关系?

“所有的哲学家”,罗素说:“假定因果关系是科学的基本公理之一。但也奇怪,(实际上并非如此),在现代科学中,‘原因’这个字从来没有出现... 我相信,这是因为讨论因果关系的就像君主立宪制一样,是过去岁月尚存的遗迹,只是因为错误的假定这样做没有坏处而已… … ”

在另一方面,帕特里克撒普斯,认为因果性极其重要: “只有在极少的*物理评论*期刊中,不包含至少一个文章在其标题中使用“原因”或“因果关系”。

从这种交流中,我们的结论是,物理学家讨论、写文章和思考是一种方式,而用公式表达物理学是另一种方式。如果因果关系仅仅是作为一种方便的交流工具 –– 一种表达物理关系的复杂模式的方便形式,不然就需要很多方程来表达,那么这样的话这样的双语表达将是情有可原的。毕竟科学是充满着缩写:我们使用“ 将X乘以 5 ” ,而不是说“将X连加5次” ;我们说 “密度” ,而不是“重量和体积的比率” 。为什么会选择(使用)因果关系?

“因为因果关系是不同的”,罗素勋爵会说, “这不可能是缩写,因为物理定律都是对称的,具有双向性,而因果关系是单向的,是从原因到结果的”。以牛顿定律f=ma为例。代数规则允许我们以任意句法形式表达这个定律,并意味着同样的事情 – 也就是说,如果我们知道三个数量中的任何两个,第三个变量就可以被计算出来。然而,在一般的谈话中,我们说力量导致了加速度 –– 而不是加速度导致了力,并且我们对这种区别有很强烈的感觉。同样,我们说f/a的比值帮助我们确定质量,而不是产生质量。这种区分是不由物理方程支持的,这使得我们要问,是否整个因果关系的词汇纯粹是形而上学的,就像“存在着,像君主立宪制一样,...” 。

所幸的是,极少有物理学家注意罗素的谜。他们继续在办公室写方程和在自助餐厅讨论原因和结果,并取得了惊人的成功:他们粉碎了原子,发明了晶体管和激光。这同样适用于工程。但在另一个领域,局势的紧张不能被忽视,因为在这个领域里,对区分因果关系和其他关系的需求是很明确的。这个领域就是统计。 故事从约一百年前的相关性发现开始。

幻灯片27 :弗朗西斯高尔顿(人像)

弗朗西斯高尔顿 ,作为指纹的发现者、和查尔斯达尔文的的堂弟,相当有创造性地开始证明天才和美德与家庭有关。

幻灯片28 :《自然遗传》 扉页

这些探索驱使高尔顿考虑各种不同方法来测量一类个人或对象的特性如何与另一类人或对象的特性有关系。

幻灯片29:高尔顿相关数据的示意图( 1888 )

在1888年,他测量了人的前臂长度和头部大小,并探寻在何种程度上这些数量中的一个可以预测另一个数量。他偶然有了下列发现:如果你画一个数量相对于另一个数量的示意图,并将两个坐标轴的比例调整的合适的话,那么最佳拟合直线的斜率有一些很好的数学属性:只有当一个数量可以完全预测另一个数量时,直线的斜率为1;当预测的结果和随机猜测差不多时,斜率是零。并且最值得注意的是,不管如果您画X对Y的示意图还是Y对X的示意图,斜率都是一样的。“这是很容易看到的”,高尔顿说: “ 即相关性必定是有共同原因的两个器官的变化的结果” 。

幻灯片30 :皮尔逊(人像, 1890 )

高尔顿的发现迷住了他的一个学生,卡尔皮尔逊,也就是现在被认为是现代统计学奠基者。皮尔逊那时30岁,是一个有成就的物理学家和哲学家,当时正打算转行做律师。下面是他在45年后所说的他对高尔顿发现的最初反应。

幻灯片31 :皮尔逊( 1934 )

“我感觉像《德雷克的天》里的冒险家,我把高尔顿的那句话理解为,在因果关系之外,有一个更广阔的称为相关性的领域,因果关系只是一种极限情况,并且这个相关性的新概念可以把大部分的心理学、人类学、医学和社会学进行数学处理。” 现在,皮尔逊已被描述为一个具有“像汉尼拔超过阿尔卑斯山和马可波罗到中国一样的动力和决心”的人 。当皮尔逊感觉像一个冒险家时,你可以肯定他得到了他的回报。

幻灯片32 :列联表( 1911 )

1911年,皮尔逊出版了他的著作“科学的语法”的第三版。这本书包含了新的一章,名为“可能性及相关性 –– 因果关系的不充分性”。下面是皮尔逊在这一章所讲的: “在被放弃的基本要素比如物质和力量之外,在现代科学不可思议的秘密中,还有一个重大秘密,那就是属于原因与结果的那一类。”

幻灯片33 :皮尔逊( 1934 )

然后,皮尔逊断然否认在相关性之外,需要一个独立的因果关系概念。他在他的一生中坚持这个观点,因此,在他的任何技术文件中都没有提及因果关系。他对万物有灵论的概念,比如意志和力量,的坚决反对是如此的强烈,对宿命论的拒绝是如此的绝对,以至于因果关系有机会在统计学中生根之前就被灭绝了。

幻灯片34 :罗纳德费舍尔爵士

经过了25年,另一个意志坚定的人 ––罗纳德费舍尔爵士,为统计人员制订了随机实验,这是唯一经科学证明的从数据中测试因果关系的方法,这也是一个和唯一一个被主流统计学所接受的因果关系的概念。

到目前为止,事情的情况基本就是这样的。如果我们算上博士论文,研究论文,或教科书那些撰写因果关系的数量,我们得到的印象是,皮尔逊的观点仍然统治着统计学。“统计科学百科全书”用12页的篇幅讲相关性,但只有2页讲因果关系,并且1页是讲 “相关性并不意味着因果关系” 。让我们听听现代统计学家们是怎样说因果关系的。

幻灯片35 :现代统计和因果关系

由皮尔逊创立的杂志Biometrika目前的编辑菲利普达维德承认:“因果推断是统计学的所有问题中最重要,最微妙,最被忽视的问题之一。”

生物统计协会的前任主席泰德斯皮德,你可能记得他是OJ辛普森谋杀案的专家证人,声明:“对因果关系的思考应该被认为它们已经在统计学中被研究了:更合适地说是根本没有(但是如果需要的话,那么可以被非常仔细的研究)”。

在几个月前刚刚出版的书中,大卫考克斯爵士和南妮沃尔姆斯这样致歉说:“我们在这本书没有用‘因果’或‘因果关系’这些词。。。我们谨慎的理由是,只有极少的情况下我们可以从研究中得到确切的因果关系结论。”

这一谨慎和逃避的态度已经麻痹了很多指望统计学指导的领域,特别是经济学和社会科学。一个著名的社会科学家在1987年说:“如果更多的研究人员放弃思考和使用原因和结果这些词,这将会是非常有益的!”

这样的事情状态是仅仅一个人的工作嘛?甚至像皮尔逊一样的冒险家?我对此表示怀疑。

但是我们可以如何解释,为什么统计这个给了我们假设检验和实验设计等有力概念的领域,会这么早地放弃了因果关系呢?

当然,其中一个明显的解释是,因果关系比相关性更难以测量。相关性可以直接从一个单一不受控的研究中估计,而因果关系的结论,需要受控的实验。

不过,这样说是过于简单化了;统计人员不会这么容易地因困难而望而却步,而小孩子可以在没有受控实验的情况成功地学习因果关系。我相信这里有更深层次的答案,这个答案和统计学的正式语言相关,就是和概率相关。对你们有些人来说,这可能很奇怪,因为“原因”这个词不在概率论的词汇中。我们不能用概率论的语言表达下面的句子“泥不会引起下雨” ––所有我们可以说的是,两者是相互关联,或相互依赖的––这意味着,如果我们发现一个,我们可以预期看到另一个。当然,如果我们缺乏一种语言来明确地表达某一个概念,我们不能期望围绕这个概念开展科学活动。科学的发展要求知识可以可靠地从一个研究转移到另一个研究,就像伽利略 350年前做的那样,这种转移要求一个正式的语言所具有的精度和计算的便利。

我会尽快回来讨论语言和符号的重要性,但是首先,我想用另一个处理因果关系有难度的领域的一个故事为这个历史综述做一个总结。这次是计算机科学,研究符号的科学。这个领域相对较新,但它特别强调语言和符号,因此可能为这个问题提供了一个有用的视角。

当研究人员开始使用电脑为因果关系进行编码时,这两个因果关系之谜被新的活力激活了。

幻灯片36 :机器人在实验室

想像一下把你放在一个机器人的位置,这个机器人正想弄明白厨房或实验室发生了什么。从概念上来说,机器人的问题和经济学家所面临为国债建模的问题是一样的,和流行病学家试图了解疾病传染的建模是一样的。我们的机器人,经济学家和流行病学家都需要利用有限的行动和有噪音的观察数据,从环境中追踪因果关系。这使得他们要面对休谟的第一个因果关系之谜:如何做这些事情?

幻灯片37 :有导师的机器人

在机器人的世界中,第二个因果关系之谜也在起作用。假设我们希望采取一种捷径,并将这个会场上我们所有人所知道的因果关系教给我们的机器人。机器人应如何组织和利用这一信息?因此,这两个哲学意义上的因果关系之谜现正转化为具体和实际的问题:

幻灯片38 :着新装的旧谜

机器人应如何通过和它的环境进行交互来获取因果关系的信息?机器人应该如何处理从它的创造者––程序员那里得来的因果关系信息?还有,因果关系的第二个谜不像它看起来那样没有价值。罗素勋爵关于因果关系和物理方程是格格不入的警告,现在由逻辑上的一个明显缺陷表现了出来。

幻灯片39 :因果关系:一个程序员的梦魇

举例来说,当给出如下信息, “如果草是湿的,那么一定下过雨”和“如果我们打破这个瓶子,草将会变湿” ,计算机将会得出以下结论, “如果我们打破这个瓶子,那么一定下过雨” 。这种编程缺陷出现的快捷性和特异性使得人工智能项目成为一个理想的研究因果关系的实验室。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河