主题:【原创】Simpson悖论 -- frnkl
Simpson悖论
有1000个男生,1000个女生同时申请某学校,结果该校录取了男生420人,女生285人,请问该校的录取工作中是否有性别歧视?
你或许会说,这不很明显吗?当然有!
且慢表态,还有下文。
这个学校只有两个系A和B。A系有800个男生申请,录取400人;有女生300人申请,录取180人。B系有200名男生申请,录取20人;有700名女生申请,录取105人。A系男生录取率是50%,女生录取率是60%;B系男生录取率是10%,女生录取率是15%。
现在你的看法如何呢?
这就是有名的Simpson悖论。
从逻辑学角度说,如果你想看一个因素(这里是性别)是否影响了结果(这里是录取率),你必须在其他条件相同(这里是男生女生申请各系的比例相同)的前提下比较。而在我们的例子里,恰恰是违反了这条规则,使得直接使用全校的数据而不考虑系里更细节的数据进行比较得出一个荒谬的结论。Simpson悖论正是这条规则使用的一个例子。
附:约翰·斯图亚特·密尔(John Stuart Mill)的求因果五法
Mill's five methods in searching of causal connections
1: AGREEMENT: If several instances of a phenomenon all have only one circumstance in common, then that one circumstance is the cause (or effect) of the phenomenon.
2: DIFFERENCE: If a phenomenon occurs in some circumstances but not in others, that which is common to the occasions when it does happen (but not the ones where it doesn't) is the cause.
3: DIFFERENCE AND AGREEMENT: Both the above.
4:RESIDUE: Where a range of factors are believed to cause a range of phenomenons, then take away what is know to cause what and the remaining phenomenon can be attributed to the remaining factor.
...and one more..
5 CONCOMITANT VARIATIONS. Where something varies as another thing varies, so one causes the other (though this one can be tricky).
(中文译文见http://www.chinabaike.com/article/baike/wli/2008/200801221139457.html)。
思考题:我们的例子可以用密尔五法的哪一法解释?
本帖一共被 2 帖 引用 (帖内工具实现)
问题四。
http://www.ccthere.com/article/1372905
谢谢马丁教授。
不过温故知新也不错!
我们日常的印象和常识往往是经不起推敲的
就是男女生的录取率是否有性别差异。
当然,这里至少可以找到一个校方涉嫌存在性别歧视的地方,不知你是否看出来了?
出错的原因是试图将Mill第二法用于校级数据,但前提条件不满足。其实在混合数据条件下,用一般简单的估算方法得不出有意义的结果。在本例中,比较 p*R1 + (1-p)*R2 和 q*S1 + (1-q)*S2 毫无意义,即使 p=q 意义也不大。深究一点,只有在 R1=R2 和 S1=S2 的前提下,即二者都是homogeneous population 而不是 mixed population的前提下,直接用样本proportion比较才有意义。
如果确定两个样本皆为混合总体(mixed population),可以考虑使用Mill第四法(Residue法)比较。统计学里一个可以使用的方法是广义线性模型(generalized linear models)。
这篇有点太技术化了,如果难以理解可以忽略。
有意给女生报名较多的系较低的录取率?或者对女生的录取率与其它系的录取率比小于女生的报名比率
如果以白人黑人来比方的话,假如一千个黑人七百个报了体育系,一千个白人一百个报了体育系,但校方故意减少体育系的招生人数,比如只招八十个人,虽然其中七十个黑人,十个白人,黑人的录取率高于白人,但其它系黑人的录取率是25%,也就是75个黑人,白人的录取率是20%,也就是180,最后白人的人数高于黑人,也就是白人的录取率高于黑人。
所以,还是歧视的定义是什么,如果是总录取率的话,可以说存在歧视,如果按每个系辩称他们不存在歧视的话,按照数据来看,最后的效果是70%的黑人报了体育系,但被录取的黑人中体育系只占48%,那么,体育系的黑人录取率低于其它系的黑人录取率,也是一个可以讨论的地方。
这个,不是一个小学数学级别的问题么,当然,归根结底只是想讨论概率的本质是什么
绝大多数情况下,我们解决问题的时候,对什么是问题本身根本就不清楚,急急忙忙的结果可想而知。
人类难以获得智慧,这是根本原因之一。
咔咔
女权主义者可以争辩为什么女生感兴趣的系录取的总名额远远少于男生更感兴趣的系;这是资源配置问题,不是录取率的问题,校方可以辩解这是市场需要,例如500名工程师只需要配20名行政助理,这个不是学校的问题。
而且你上面的计算也不能导出究竟是否有歧视。
如果认为性别分专业录取率存在系统偏差,正确的做法是统计全社会性别分专业录取率并与该校的数据进行比较。单纯用该校性别分专业录取率并不能得出想要的结论。
这里涉及的问题其实是一个有偏系统的估计问题,即我们如何把系统本身的偏置扣除以进行比较。我认为你上面的方法用在想要的结论上是错误的,系统偏置的扣除必须以系统外的数据为基准,或者以系统过去的数据为基准,而不能以系统本身的数据为基准。
有无数可能的细节,比如学校在恶意诱导女生报考某些系,还有歧视的指控究竟在指控什么,当然我的回答十有八九不符合你看到的架构。可以辩称的东西当然可以进一步找反例。
比如女权主义者可以宣称,为了达到彻底的平等,首先必须使两性在报考人数上达到平衡,如果做不到这一点,就有义务在女性感兴趣的系上更剧烈地倾向女生,否则就是歧视。
屁股决定脑袋,文化决定命运
转一位河友的
其实她不觉得自己在撒谎 26
关于你的感想,这个太正常了。我朋友曾经因为一个什么事儿去采访过一群小学生,结果同样的事情在孩子们的嘴里有着若干完全不同的版本——全都特诚恳的说是自己亲历的,整个一罗生门。不说远的,就说我父亲,有时候给他打电话,说起家乡的某些人某些事,如果仅仅从字面上理解,我应该非常生气才对,可是出于对老家那些人说话方式的理解,我只会不急不慢的一点点问他:你说的这个几十平米到底是几十啊?是不是十几平米啊?他们到底说过这个话没有?原话是什么?什么时候什么环境下说的……
我觉得有时候人们并不觉得自己在撒谎——他们认为“稍稍的”夸大或扭曲完全不等同于说假话。胡编乱造是假话,但只要与事实沾了一点儿边的都不算。在那个大姐眼里,几个人没有拿到大棚 = 所有人都没有。想要靠近事实,只有通过尽量多的独立的信息来源。而且,千万不要认为他们在撒谎——他们会生气的,这和是否淳朴无关。
对于混杂的处理,并不一定必须系统以外的数据或者过去的数据。关键还是是联合分布是否能够无偏地估计出来。
我的尺子有系统偏差,但它测出来的数值仍然非常符合测量数据应用的分布。通过这些数据本身,如果不与其它尺子比较,无论如何不可能知道它是否有系统偏差。
以你的例子来说,就以你的分系的录取数据,你说这个学校究竟有没有性别歧视?
也许你会说,女生录取率都比男生高,因此没有歧视。但是,如果全国平均(最好的比较,应当是同等条件学校平均),A系男生录取率是30%,女生录取率是70%,那么请问在知道这个信息情况下,该校A系是否有性别歧视?
所有这些数据,必须放在全局的一个背景下考察,才有具体的意义。