五千年(敝帚自珍)

主题:【原创】Simpson悖论 -- frnkl

共:💬23 🌺100
全看分页树展 · 主题 跟帖
家园 思考题答案

出错的原因是试图将Mill第二法用于校级数据,但前提条件不满足。其实在混合数据条件下,用一般简单的估算方法得不出有意义的结果。在本例中,比较 p*R1 + (1-p)*R2 和 q*S1 + (1-q)*S2 毫无意义,即使 p=q 意义也不大。深究一点,只有在 R1=R2 和 S1=S2 的前提下,即二者都是homogeneous population 而不是 mixed population的前提下,直接用样本proportion比较才有意义。

如果确定两个样本皆为混合总体(mixed population),可以考虑使用Mill第四法(Residue法)比较。统计学里一个可以使用的方法是广义线性模型(generalized linear models)。

这篇有点太技术化了,如果难以理解可以忽略。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河