五千年(敝帚自珍)

主题:【原创】冤假错案的数学原理 -- 同人于野

共:💬64 🌺284
分页树展主题 · 全看首页 上页
/ 5
下页 末页
    • 家园 作为一个准精算师....回复一下你的话....

      你的formula 还差一个关键的资料,所以无法计算出来,

      那个0.5是不正确的哟~~

      想算这个概率,有两种方法,一个比较理论(也就是同人于野兄的方法)

      还有一个直白一点,列表

      设 I 为 indicate

      Ic 为 not indicate

      H 为 有 HIV

      Hc 为 没有 HIV

      -----------------------------

      I Ic

      H

      Hc

      -----------------------------

      已知 H 为 0.01%, 所以:

      -----------------------------

      I Ic Sub total

      H 0.01%

      Hc 99.99%

      Sub totoal

      -----------------------------

      又, 现代技术检测 HIV 病毒的准确度已经到了惊人的程度。如果一个人真是 HIV 阳性,血液检测的手段有 99.9% 的准确率

      换成统计符号,就是 Pr(I|H) = 99.9%, 换句话说, Pr(Ic|H)=0.1%

      而我们知道 Pr(A|B)=Pr(A & B)/Pr(B)

      所以 Pr(I&H)=99.9%*0.01%=0.00999%

      同理, Pr(Ic & H) = 0.00001%

      见下表:

      -----------------------------

      I Ic Sub total

      H 0.0000999% 0.0000001% 0.01%

      Hc 99.99%

      Sub totoal

      -----------------------------

      用同样道理 Pr(I|Hc)

      -----------------------------

      I Ic Sub total

      H 0.00999% 0.00001 0.01%

      Hc 0.009999% 99.99%

      Sub totoal 0.02% 99.98%

      -------------------------------

      0.00999%/0.02%=0.4995=50%

        • -- 系统屏蔽 --。
    • 家园 欣赏这样的文章

      有趣味,涨知识,能启迪。

      这样的文章才是西西河的特色所在。

    • 家园 这是sensitivity和specificity的问题

      "宁可错杀一千"是追求高sensitivity。

      无罪推定是追求高specificity。

    • 家园 错误很大

      开始看前两个例子还是蛮有趣的,最后那个抓特务的例子怎么看怎么觉得不对劲,完全是用统计学去生搬硬套的解释社会问题。

      前两个例子能用贝叶斯定理是有条件的:已知 P(A) 和 P(B|A)。抓特务的例子,难道你知道社会中特务的比例和鉴别特务的准确率?

      你的意思是鉴别特务的准确率很低,不管社会中特务的比例多大(当然不可能很大),抓特务必然是一大堆冤假错案。

      “最好的办法是冒出来一个抓一个”,呵呵,等特务冒出来,损失就大了,补救都来不及。

      社会问题还是用社会学的理论去解释吧。


      本帖一共被 1 帖 引用 (帖内工具实现)
        • -- 系统屏蔽 --。
        • 家园 恕我愚钝,可否明示

          自感语文还算过关,史记也读过几遍,对此文的理解应该不会有太大出入。有何高见请明示。

      • 家园 楼主算法是只要特务比例低

        鉴别特务准确率再高也会是冤枉多的

    • 家园 原理介绍得很好,不过数据编得离谱

      如果你真懂概率,你会想到要使用贝叶斯定理,然后你会发现这道题还缺少一个关键信息:那就是一般人感染 HIV 的概率。现在已知一般人感染 HIV 的概率是 0.01%,也就是说一万个人中才有一个人感染这种病毒。根据以上信息,这位不幸被检测为 HIV 感染者的朋友真有 HIV 的可能性是多少呢?

      万分之一的感染率太离谱了吧。地球上60亿人只有60万HIV感染者?

      似乎已经超过三千万了。

      点看全图

      外链图片需谨慎,可能会被源头改

      http://www.cdc.gov/hiv/topics/surveillance/resources/slides/2007report_tables/slides/HASR_19.pdf

    • 家园 送花。同仁于野的帖子总是观点独到而又很有深度。

      让我想起了以前学概率的时候老师给出的很多有趣的例子。其中有一个例子很有意思,也在电影《21点》中出现过。就是一个电视节目上,选手面对A,B,C三个门,其中有一个门后有奖品,选手可以选择A,B,C中一个门。在选手选择A后,主持人打开了B,B后没有奖品,然后问选手是否愿意改选C。电影里MIT的教授的答案是要改选,而我的教授的答案是不改选。

      • 家园 这个显然要改选啊

        改选2/3,不改选1/3

        • 家园 剩下是50%的机会啊,改不改选有意义吗? 不好意思挖坟

          另外一个:有人喜欢研究彩票走势,其实很奇怪,上次出什么,对这次有什么影响吗?

          • 家园 不对,改选是2/3,不改选是1/3

            这和彩票不一样,彩票是孤立事件,这个不是孤立事件。最重要的一点是主持人打开没有礼物的门不是随机打开的,而是打开了一个他知道没有礼物的门。您可以这么理解,如果您选了门A,主持人说,你可以选择换到另外两个门B或C(B和C任何一个有礼物都算你赢),您换不换?显然要换,另外两个门的概率是2/3,主持人这时候打开一个门并不改变概率,是迷惑你的。

分页树展主题 · 全看首页 上页
/ 5
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河