五千年(敝帚自珍)

主题:【原创】似虎非虎 -- 淮夷

共:💬27 🌺308
全看树展主题 · 分页首页 上页
/ 2
下页 末页
家园 医疗统计数据之错

此书颇有详述,若有兴趣深究可找来一阅。

家园 呵呵 先生是有心人

一个一个格子的数过去,这份认真是我非常特别欣赏的。

很喜欢您的技术分析,受教了。若拿书中的例子而论,技术分析也许不太符合作者举例米粒实验的本意。

楼下庄汀先生回答甚好:每一次散点图都可找到“远山近景各自不同”的规律,但是每次米粒实验的共性在于随机集群,这也是作者用之解释癌症病例分布的原因。

家园 谢谢,也是我要说的意思
家园 coo兄的见解总是很新颖
家园 Karolinska做过第二轮的样本分析

第二轮采取的样本量大于第一轮,这一次并未发现手机使用和脑瘤发病率直接的显著关系。

两次的样本量书中未提及。

很同意您说的样本量起落造成结果悬殊的观点。

另外多谢指出比例错误。

家园 谢谢先生的补充
家园 诚然
家园 前一点不可能大于

因为大量的死亡没有搞清楚原因

后一个问题和前一个并不是一回事情。

前一个是描述一段时间的现状,后一个是给定时间、空间、人间后的因果推断。

由于事件可能是多病因导致,所以归因分数不能简单相加。

基本理论参见Keneth Rothman的sufficient causal model,这是目前医学统计广泛采用的基本模型。哲学层面上说这个模型必然有大量问题,但是迄今也没有比之更好一点的。

家园 继续异议

这位经济学家有一定的统计学基础,可是有点托大了。

虽然在数学上目前流行病学、生物统计学使用的方法与计量经济没什么太大的区别,但是在实际应用上显然没有这么简单,否则就没有必要有着两个学科了。

简言之,癌症的聚集效应是三间的,即时间、空间、人间。与之相关的分析中需要考虑的因素相当复杂,不是简单地说表象类似于米粒实验的随机群集就可以直接推论的,这在逻辑上就错了。

家园 继续异议原作者

从文中的例子可以看出,原作者有一定的因果推断理念,但是对目前医学科学中使用的统计概念的解释没有很清楚的了解,有些例子属于自己树个靶子自己打。

以胖瘦的那个例子为例。如果说很多年前的cross-sectional study存在作者所述的问题的话,那么现今的医学界还没有蠢到不懂reverse causality存在的地步。这里的问题不是因果性与相关性混淆的问题,而是时序性的问题。

而另一方面现在的相关研究都要在研究设计,而非统计分析中扣除了充分的induction period之后再探索相关性。并且这个相关性据我所知并没有被解释成为因果性,是作者把它升级到了因果的层面。相关性研究的意义在于在没有足够知识进行因果模型推断时不断积累间接的信息和线索。

Kaloliska那个报告的例子,是记者的误读而已,和研究没什么关系。因果联系本身就不能被解释成疾病负担,率差和率比本身就有不同的解释,作为必修课,在医学领域发表论文时并不会特别解释。

虽然最后总结的结论我是认同的,但是具体问题还是要具体分析。有关医学的这两个例子举得并不合适。

家园 这个事情和统计无关,只不过是采集自己需要的条件而已。
家园 举一反三地学习你的方法,再联想一番,真是受益匪浅,花谢。

举一反三地学习你的方法,再联想一番,真是受益匪浅,花谢。

全看树展主题 · 分页首页 上页
/ 2
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河