主题:【原创】Simpson悖论 -- frnkl
共:💬23 🌺100
出错的原因是试图将Mill第二法用于校级数据,但前提条件不满足。其实在混合数据条件下,用一般简单的估算方法得不出有意义的结果。在本例中,比较 p*R1 + (1-p)*R2 和 q*S1 + (1-q)*S2 毫无意义,即使 p=q 意义也不大。深究一点,只有在 R1=R2 和 S1=S2 的前提下,即二者都是homogeneous population 而不是 mixed population的前提下,直接用样本proportion比较才有意义。
如果确定两个样本皆为混合总体(mixed population),可以考虑使用Mill第四法(Residue法)比较。统计学里一个可以使用的方法是广义线性模型(generalized linear models)。
这篇有点太技术化了,如果难以理解可以忽略。
- 相关回复 上下关系8
🙂这是诡辩的技巧 代码ABC 字18 2011-06-09 11:44:10
🙂谬误之源——1.问题的范畴 4 中阳 字127 2011-06-06 20:07:54
🙂谬误之源——2.罗生门 3 中阳 字816 2011-06-06 22:27:00
🙂思考题答案
🙂我的一些见解与楼主不同 类反词典 字112 2011-06-10 18:48:24
🙂何必那么复杂 1 类反词典 字422 2011-06-06 20:45:52
🙂最后一段略有不同见解 2 xtqntd 字100 2011-06-06 23:39:23
🙂用系统本身的数据如何估计系统本身的偏差? 类反词典 字569 2011-06-07 01:37:02