五千年(敝帚自珍)

主题:【原创】Simpson悖论 -- frnkl

共:💬23 🌺100
全看分页树展 · 主题
家园 【原创】Simpson悖论

Simpson悖论

有1000个男生,1000个女生同时申请某学校,结果该校录取了男生420人,女生285人,请问该校的录取工作中是否有性别歧视?

你或许会说,这不很明显吗?当然有!

且慢表态,还有下文。

这个学校只有两个系A和B。A系有800个男生申请,录取400人;有女生300人申请,录取180人。B系有200名男生申请,录取20人;有700名女生申请,录取105人。A系男生录取率是50%,女生录取率是60%;B系男生录取率是10%,女生录取率是15%。

现在你的看法如何呢?

这就是有名的Simpson悖论。

从逻辑学角度说,如果你想看一个因素(这里是性别)是否影响了结果(这里是录取率),你必须在其他条件相同(这里是男生女生申请各系的比例相同)的前提下比较。而在我们的例子里,恰恰是违反了这条规则,使得直接使用全校的数据而不考虑系里更细节的数据进行比较得出一个荒谬的结论。Simpson悖论正是这条规则使用的一个例子。

附:约翰·斯图亚特·密尔(John Stuart Mill)的求因果五法

Mill's five methods in searching of causal connections

There are four experimental principles, or canons, on which causation may be established or partly proven:

1: AGREEMENT: If several instances of a phenomenon all have only one circumstance in common, then that one circumstance is the cause (or effect) of the phenomenon.

2: DIFFERENCE: If a phenomenon occurs in some circumstances but not in others, that which is common to the occasions when it does happen (but not the ones where it doesn't) is the cause.

3: DIFFERENCE AND AGREEMENT: Both the above.

4:RESIDUE: Where a range of factors are believed to cause a range of phenomenons, then take away what is know to cause what and the remaining phenomenon can be attributed to the remaining factor.

...and one more..

5 CONCOMITANT VARIATIONS. Where something varies as another thing varies, so one causes the other (though this one can be tricky).

(中文译文见http://www.chinabaike.com/article/baike/wli/2008/200801221139457.html)。

思考题:我们的例子可以用密尔五法的哪一法解释?

通宝推:唵啊吽,上古神兵,胡一刀,

本帖一共被 2 帖 引用 (帖内工具实现)
全看分页树展 · 主题


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河