五千年(敝帚自珍)

主题:【原创】冤假错案的数学原理 -- 同人于野

共:💬64 🌺284
全看树展主题 · 分页首页 上页
/ 5
下页 末页
家园 请教,这是为什么呢?
家园 重复检验主要是降低了将健康的人误诊为艾滋病的概率

两个地方都将健康的人诊断为艾滋病患者的概率是0.01%*0.01%。

两个地方同时将艾滋病患者诊断出来的的概率是99.9%*99.9%。

代入公式里一算就知道了。

家园 这个有意思,送花!
家园 其实不是那么浅显的.
家园 冤案就冤案吧tg不在意

tg的地下党满天飞,像电视剧里暗算那样白日党还要审啊,查啊效果多低啊。直接延安整风,AB团,逼供信,宁可错杀不能放过,效果就是tg内部你特务根本混不进去,人家根红苗正老八路都被干掉了何况你假冒的?

家园 这两者之间完全没有可比性

你要比,那也不能用一次检查的结果来比。案件是可以上诉的,按土国现在的程序,初中高三级相当于艾滋病的检查做了三次。您能不能给算算如果一人,连续三次都给检查出艾滋病来了,他没病的可能性有多大?

家园 AIDS如果三次独立地检查,结果都一样,会增加可靠性

但是上诉这个恐怕不是独立的,高一级知道前一级的结果,而且其他方面恐怕也做不到完全独立

家园 学模式识别的飘过

我这个学模式识别的看见讨论贝叶斯公式真亲切啊。这个话题我喜欢,谈谈我的一点看法吧。

关于抓特务冤假错案,关键看代价函数是什么。很多情况下,宁可忍受冤假错案的数量(代价是人人自危、以后平反),也要降低真特务漏网的损失(核心机密泄露)。所以 对某嫌疑人x A:确实是特务 判断:B: 打成特务,那么,代价函数L(x) = alpha1*P(B|A)P(A) + alpha2*P

(A|B)(1-P(A))。其实就是对“拒真、受假”两类错误的加权。如果权值是0 1 就是最简单的,如果不为0 1 就很微妙了。改变两个参数,就会得到一条接收机特性曲线(ROC)。所以衡量一个检测方法好坏的标准不是在某个特定点上的分类效果好(比如文章中的99.9% 之类),而要求ROC曲线面积要大,这样才能把AAR(受真)FAR(受假)率都做得高。

文章里说让医生来做,还有40%的人错,这个不太相信啊,因为医生用药、治疗也要评估这两类风险的。医学里还特意为FAR AAR起了两个名词“敏感性”和“特异性”。

回到抓特务的问题上,我们看到,TG在战争年代,比如在苏区杀AB团、肃托,在延安康生的抢救运动,明显是更在意“真特务”造成的损失。而事实上,虽然有冤假错案存在,但是国民党也确实没能打入哪怕是基层的组织。而冤假错案并没有对整个组织的运作、吸收新人产生特别大的负面影响,也就是说,还是合算的。

反过来,花生米27年的“清党”才更杯具些。TG至多5w,清党前夕,国民党员总数号称100万,清党后,据1929年10月统计,减至65万。 减少的30多万党员中,最有可能是两部分人:一部分是思想急进的城市青年学生党员;一部分是基层农工党员。前者有可能被清洗,后者有可能因恐慌而自动脱党。实际上,被清除和自动脱党者可能还不止30万。因为在大批农工党员脱党和左派青年被清洗的同时,又有数以万计的“投机分子”涌入国民党内。

这样一杀了之的结果,就是彻底摧毁了自己的基层组织和与工农的联系。所以后面的失败腐朽,也就顺理成章了。

家园 剩下是50%的机会啊,改不改选有意义吗? 不好意思挖坟

另外一个:有人喜欢研究彩票走势,其实很奇怪,上次出什么,对这次有什么影响吗?

家园 不对,改选是2/3,不改选是1/3

这和彩票不一样,彩票是孤立事件,这个不是孤立事件。最重要的一点是主持人打开没有礼物的门不是随机打开的,而是打开了一个他知道没有礼物的门。您可以这么理解,如果您选了门A,主持人说,你可以选择换到另外两个门B或C(B和C任何一个有礼物都算你赢),您换不换?显然要换,另外两个门的概率是2/3,主持人这时候打开一个门并不改变概率,是迷惑你的。

家园 我这两天有个模拟识别的问题

Fisher discriminate 的sensitive analysis 的文章有没有给推荐的。谢过了!

家园 还是有点不同意见。

其实我们可以这样理解,其实是两次机会,

第一次:主持人说,现在有三个门,只有其中一个有礼物,我们现在选任何一个的就是1/3的机会。

第二次:主持人说,现在有二个门,只有其中一个有礼物,我们现在选任何一个的就是1/2的机会。

其实,就是两个分开的问题,第二次,你换不换都是1/2的机会,反正就是在两个门里随选一个的问题,(如你所说换是2/3的机会,3的基础都没有了,怎么还会是2/3的机会呢,现在是余下的两个之间的问题了)

你应该想复杂了。

家园 还没明白吗

这两个问题并不是孤立存在的,这不是古典概率问题,这是条件概率问题

ps:这是个经典问题,您可以在网上搜一下答案

家园 终于想清楚了,我不知道如何用公式计算,但用列举法得出了.

将过程列下,是否还有其它朋友像我一样不明白。

过程如下,假设在A\B\C三门都有可能,侧会有如下9种可能

1、车在A门,

选手选择 主持人选择 是否换选 能否得到车

1)A B或C 是 不能

2)B C 是 能

3)C B 是 能

2、车在B门

1)A C 是 能

2)B A或C 是 不能

3)C A 是 能

3、车在C门

1)A B 是 能

2)B A 是 能

3)C A或B 是 不能

所以可以等出:虽然我们第一次选择正确的机会是1/3,但如果改选的话,就能变在2/3的可能。再次感谢您的引导。花谢

家园 惭愧啊……

现在只有点当时学Duda的Pattern Classification时候的印象了。后来就去学其他玩意了,没特别研究过这个了。

全看树展主题 · 分页首页 上页
/ 5
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河