主题：说一下贝叶斯公式 -- 天空不空

共:💬27 🌺148

老大河待整

分页树展主题 · 全看首页上页下页末页

家园 说一下贝叶斯公式
看了一下高中三年的那个帖子，https://www.talkcc.net/article/4518147，顺便说两句
我知道河里有很多专业人士，但我还是想说一下贝叶斯公式，尤其是跟新冠的统计疫情有关的
众所周知，感染新冠并不必然检测出阳性，检测出阳性也不必然代表感染新冠，都是一个概率的问题，简单的说，就是，用A表明检测阳性事件，用B表示感染新冠事件，P(B|A)表示在检测阳性时感染新冠的概率，P(B)表示感染新冠的概率，P(A|B)表示在感染新冠的情况下检测出阳性的概率，P(A）表示总体样本中检测出阳性的概率，那么根据贝叶斯公式，举例说明，假设新冠的发病率为6%，P(B)=0.06,新冠病人检测出阳性的概率为99%，P(A|B)=0.99,如果检测一万个非新冠病人，有200个阳性，那么非新冠患者检测出阳性的概率为0.02，P(A|非B）=0.02那么总体阳性的概率P（A）=P(B)*P(A|B)+P(非B）*P(A|非B)=0.06*0.99+0.94*0.02=0.0782，在检测出阳性的情况下可以确诊为新冠的概率为
P(B|A)=P(B)P(A|B)/P（A）=0.06*0.99/0.0782=0.76，也就是检测出阳性时有四分之三的概率为新冠患者，但如果检测一万个非新冠病人里，有500个阳性患者，那么这个数值就变成
总体阳性的概率P（A）=P(B)*P(A|B)+P(非B）*P(A|非B)=0.06*0.99+0.94*0.05=0.1064，那么
P(B|A)=P(B)P(A|B)/P（A）=0.06*0.99/0.1064=0.56，也就是说此时检测养性是时感染新冠概率就只有二分之一左右，简单的说，感染新冠的概率既跟新冠患者中，检测出阳性的概率有关，也和非新冠患者中检测出阳性的概率有关，所以单纯看新观患者中检测出阳性的概率，是没办法得到检测出阳性时，感染新冠的概率，这段说的有点绕口，大家可以仔细体会一下。
通宝推：桥上,铁手,菜根谭,
- 复说一下贝叶斯公式
  家园 这是和发病率与疾病的危害性有关系的
  发病率高的病，和发病率低的病，对于sensitivity和specificity的精度要求差很多。比如艾滋病发病率很低，所以需要假阴性足够低，假阳性多一点没关系。
  新冠的发病率也算不上高，再加上传染性强后果恶劣，真正需要保证的是假阴性足够少，假阳性的问题可以用多次检测解决。说实话，假阴性只要能降低到0.001%，假阳性就算是40%也比两个都是1%的检测方法好的多。
  通宝推：桥上,
  - 复这是和发病率与疾病的危害性有关系的
    家园 你说的是对的
    假阳性有其他渠道解决，让假阴性散落在社会上，才是最大的隐患
- 复说一下贝叶斯公式
  家园 我活学活用，顺便验算一下
  按照你的例子，我加多一个人口的数字，整个过程就很容易理解了
  如果我算错了，也请指出。
- 复说一下贝叶斯公式
  家园 前几个月看书，有个容易让非统计专业人士理解的例子
  是我见过，最容易理解贝叶斯公式的例子了，不敢私藏，给大家看看
  通宝推：陈王奋起,
  - 复前几个月看书，有个容易让非统计专业人士理解的例子
    家园 这么说吧，理论上病毒A可以让检测试剂呈阳性
    这么说吧，理论上病毒A可以让检测试剂呈阳性，虽然100个病人当中都带有病毒A，但在实际检测中由于种种原因，只有99个病人的检测结果呈阳性，但除了病毒A，细菌B也可让试剂呈阳性，如果健康人携带细菌B的概率为50%，那么健康人中检测阳性率就是49%，这样病人阳性率＋健康人阳性率就是148%，这个例子举得极端了一点，最理想的试剂当然是只对病毒A起反应，对其他生命体都没反应，但实际上这种情况很难，人体太复杂了
  - 复前几个月看书，有个容易让非统计专业人士理解的例子
    家园 你的理解稍微有一点误区
    问题还是出在试剂的准确率那里，同样的试剂，一百个病人里检测出99个阳性，并不代表在一百个健康人里一定就检测出一个阳性，也可能能检测出三个阳性，五个阳性，这句话的意思就是（假设S=健康人阳性率+病人阳性率，则S并不必然为1，也可以为1.02,1.04或者其他值）
    - 复你的理解稍微有一点误区
      家园 谢谢指点，再请教一下
      我第一个例子确实隐含了一个假设，即对健康人口，与患病人口的检测准确率是一致的，都是99%。
      而您的例子中，估计在实践操作中也是，这两个准确率是不一样的。
      实际上，在试剂上市前，肯定也要测，测试的结果有几种可能性：
      1. 已知是病人，检测有真阳性
      2. 已知是病人，检测有假阴性
      3. 已知是健康人，检测有真健康
      4. 已知是健康人，检测有假健康
      出现假阴性，与假健康，两者概率是可以不一样的。
      我这个理解，应该没错吧？
      - 复谢谢指点，再请教一下
        家园 正好定义了sensitivity和specificity -- 有补充
        Good goo study
        Day day up
        作者对本帖的补充(1)
        家园 加个图补充下 -- 补充帖
      - 见前补充 4518630
      - 复谢谢指点，再请教一下
        家园 是的，这一次理解的是没问题的
- 复说一下贝叶斯公式
  家园 被点名，补充一下
  白宫那专家只是举例，检测手段“准确度”是本人的措词，记得专家原话是“99％ specific”，不晓得专业上是什么定义。
  反正是举例，瞎假设一个，阳性结果=感染病毒，阴性结果=没感染，“准确度99％”的检测盒，100个阳性，1个错检测出阴性结果，100个阴性，1个错检测出阳性结果。100万检测者，1％的感染率，实际含有1万个感染者，99万没感染。用这个99％的检测盒检测这100万个人，结果将检测出来9千9百个真病人，9千9百个假病人，真假一半一半，而另有100个真病人漏网。如果人群感染率不是1％而是0.1％，那检测结果更离谱。
  专家的话只说一小半，更核心的意思是，不能无把关地大面积检测，尤其是初期人群中的感染率很低的时候，必须由医生决定谁该不该检测。
  - 复被点名，补充一下
    家园 你说的没错，这个specific其实是很关键的指标。
    如果是accuracy。假设新冠的发病率是1%，那检测100个人，假设有一种试剂对每个样本都检测为阴性，那样的话它的准确度（accuracy）也有99%。可实际上这个试剂是完全没有指导意义的。
    你假设的“‘准确度99％’的检测盒，100个阳性，1个错检测出阴性结果，100个阴性，1个错检测出阳性结果。”实际上是不成立的，我估计也没有这么高效的试剂。
    我猜测可能会和F1 score有关系。
  - 复被点名，补充一下
    家园 specificity就是特异性，不同方法交叉检测可确诊
    主贴的贝叶斯公式解释的很清楚了
    但是，这种问题存在于只存在单一检测方式的时候
    一旦发现假阳性，结合上病史流调/CT/抗体检测，几样一结合，就可以测的非常准
    只用抗体检测发抗体护照对于单次检查的个人是不靠谱的
    但是核酸检查普查是很靠谱的，因为核酸PCR的特异性极高，接近100%，PCR检查几乎不存在假阳性，PCR的问题是敏感度低，假阴性不低，所以会漏掉不少无症状的人。但是挑出一个是一个，并且新冠病毒一旦传染，经常是聚集性传染，一发现基本是一个小集群，1。这种普查对武汉人的信心有意思，2。这种普查具有很大的科学意义。
    这是湖北那边物资充足/检测能力充足的自然选择。海外连实际被感染的人都检测不过来，那是做不了普查。冰岛好像搞过一次类似的，冰岛总人口也才30万。
    - 复 specificity就是特异性，不同方法交叉检测可确诊
      家园 明白。即是需要辅助手段或说综合手段

分页树展主题 · 全看首页上页下页末页

有趣有益，互惠互利；开阔视野，博采众长。
虚拟的网络，真实的人。天南地北客，相逢皆朋友

版面群落趣味社区帮助常见问题网站简介基本河规隐私条款使用条款广告说明