五千年(敝帚自珍)

主题:【整理】马兜铃酸强致癌性再次拷问中药安全性及当局中医药政 -- 南云北望

共:💬259 🌺963 🌵108
全看分页树展 · 主题 跟帖
家园 因为大多数情况下关联性无法推导出因果关系

统计关联的东西太多了,其中绝大多数是没有任何价值的

统计学工具的核心是大数定律与中心极限定理,它们都是建立在随机变量不相关的的假设之上的

只要你想严谨的使用统计学工具,那么统计学工具就不可能无所不能

从统计学的角度来讲样本的随机性比样本量更加重要的

在番茄红素的例子里,70年代随机抽样,在当时的眼光看来样本已经足够独立了,但是今天却有人质疑,质疑什么?那些在统计上西红柿吃的较多的人群,往往也具有别的一堆别的什么健康的生活习惯,也就是说那些表面看上去好像足够随机的样本,其实并不足够随机,换种说法,计算因果效应的潜在结果的变量有可能处理了比是否大量吃西红柿更多的随机变量

这样的情况下,统计学上西红柿与某些疾病发病率减少之间的关联与因果是不等价的

于是,对于从七十年代开始的一系列研究中的发病率降低现象,这到底是不是西红柿造成的,现在也有人开始怀疑了

上面是宏观的例子,从微观角度来看呢,这里先假设西红柿是有效的,它里面有几百种成分,这些成分以网络的形式互相关联着参与到人体这样的系统中,西红柿作用的动力学机制是不可积系统

按照不可积系统的定义,系统中的作用变量的耦合是无法依靠技巧解藕的,作用变量本身随着时间的变化而变化着则意味着所谓的真值可能不是常数,无论把这种机制以任何一种形式理论化都不能改变他的这种性质

如此以来,统计学工具中用来计算平均因果效应的潜在结果变量永远也无法只处理一个独立的变量,单纯的统计学工具对与这样复杂的关联性到因果关系的推导是无能为力的

理想中的情况是什么样的?机制可以被转化成一系列稳定的,独立的变量的不相关叠加,就是所谓的研究对象被随机分配的情形,于是就可以用所谓的隐含的处理变量处理它们,然后借助与大数定律来进行一致性估计,这就是单纯统计学推导因果的极限了

既然统计学不能,那么该怎么办呢?接下来就是所谓的研究人员的科学直觉出马的时候了

实验设计是一门艺术,于是单个的研究报告的可靠性就会遭到广泛的质疑

实际实践中只有反复地由不同地研究小组进行重复实验,在每次实验中都尽量的控制所谓的混淆变量,并且都得到相近的结果的时候,才会被同行们认为这种关联性是等价与因果关系的

某种意义上算是由个体的主观发展到集体的主观的过程吧?而且这些集体本身也并非是由独立的,不相关的个体组成的,比如说那些被大公司赞助过得研究组织,这里面的花样就多了,明明是重复的很好的实验依然无法得到同行共识,这样的情形也有很多

最糟糕的是,即便如此,大多数情况下,这些研究的结果还是迥异的,有时再准确的控制混淆也往往不能使得结果互相接近,比如蛋白质摄入的例子

在动力学角度,这样的现象并不难以理解,这是由复杂的动力学现象本身的特性所决定的,是不可能被统计学工具所逾越的困难

通宝推:回旋镖,花大熊,
全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河