主题:【原创】Simpson悖论 -- frnkl
矫正方法自然会有不同
Simpson Paradox并非源于选择偏倚或者测量误差,所以和尺子之类没什么太大的关系。
而全国学校的平均值也不过是假定公平情况下该校的counterfactual结果近似值而已,而这个插入的值是根据所需要的结论由命题定义范围所决定的,是可变的,是需要根据不同情况标准化的。而其中有多种方法,即可以不需要外部信息,固有所谓并非一定需要。
你后面的论证实际是扩大了原来的命题吧。
问题出在AB两系招生人数不一样,难度也不一样。
这个例子,高考报志愿时很有用。我们老师分析过。
想象A系是个一般院校,招人多,门槛低, 很一般。
B系是精英院校,招人少,门槛高。
在此例中, 男生们只要上了大学就行,报大路货的多,大部分也就上了。
女生们爱学习,非Ivy League(藤校)不上,结果在龙门前互相撞死的鲤鱼们,雌鱼居多。
所以,把AB混起来,得到自己想要得到的答案,就可以混淆视听。
这也是西方媒体经常采用的攻击中国的方法之一,可惜ZXB的同学们不爱学习,反击大都无力。
请你写出数学的定义,再看看你的数据是否可以支持你的结论?或者,看看你的数学的定义是否符合我们通常对“性别歧视”的理解?
不是我扩展了你的原命题的定义,而是你用自然语言的混淆性重新定义了你的原命题。“性别歧视”这样一个命题,如果你要考虑系统本身对性别的偏差,那我是想不出如何不依赖系统外的数据来定义之。如果你不考虑系统本身的偏差,那么直接1:1,没有别的选择。
本帖一共被 1 帖 引用 (帖内工具实现)
性别歧视的定义恐怕是是否录取与性别之间相互独立。
对于同一个学校而言,只需要验证校内各系别的招生中是否分别独立就可以了,假定不存在其他选择偏倚和测量误差,比如是否录取测量错了,或者男女性别测量错了。
你的1:1是不是太不严谨了呢。到底是谁在用自然语言呢?
本帖一共被 1 帖 引用 (帖内工具实现)
含糊其词和偷换概念
希望楼主也参与讨论:
对上面的一些问题进行了更深入的讨论。