五千年(敝帚自珍)

主题:【讨论】趣味数学题 -- 任爱杰

共:💬155 🌺244 🌵1
分页树展主题 · 全看首页 上页
/ 11
下页 末页
    • 家园 如果另一个孩子还没出生(也没做B超),性别自然是独立事件

      问题是现在孩子都已经生完了,那么这个两娃家庭,有两个男孩的概率应该是1/4

    • 家园 每次看到这类问题

      首先想到的是自己智力是不是不如小学生。

      其次是增加信息,比如出生率和男女比率。

      然后陷入深深思考,为什么连这都不知道。

    • 家园 其实这类问题都可以归结为样本过少

      不具备统计学意义的问题

    • 家园 我觉得这更象是先验概率和后验概率的区别

      只知道一个孩子性别的情况下,另一个孩子的性别不论男女其实仍然是二分之一

      这个是先验概率,也就是已知只有两个基本事件,而没有其他条件的时候,每个事件发生的概率可以“规定”为各50%。这个可以用最大似然估计来算,但本质上应该是“最大熵原理”,更基本的则是数学里的“对称性”。然而实际上是不是真的50%并不一定。比如假设一天里有“白天”和“黑夜”两种状态,但在某一天某个时间点属于“白天”或“黑夜"的概率并不是50%(除春分/秋分)。实际上人类生男孩和女孩的概率其实并不是严格的50%而只是接近于50%。

      引文里推导的过程实际上描述的是一种后验过程,即并不预先假定人类生男孩和女孩的概率是,而是根据一系列的条件来推导出”邻居家的另一个孩子是男孩“的概率。

      • 家园 这个问题是已知先验概率,求后验概率

        事实上我们已经默认了生男生女是各50%,既先验概率已知,以此为前提,加上碰到一个是男孩的条件,求另外一个的男女概率。并不是用最大似然估计求先验概率。

        完整的问题其实是:

        已知1,生男生女各50%的概率

        已知2,两个孩子中有一个男孩

        问:另外一个男孩的概率是多少?

        如果生男生女不是50%,则答案也不是三分之一了。

        • 家园 两个条件并不是相关的

          如果”已知1,生男生女各50%的概率“成立,则不论其中一个是不是男孩,另外一个是男孩的概率都是50%,也就是说已知2是不需要的。根本不需要推导。

          反过来如果只有已知2,也可以推出已知1:

          如果不考虑次序,则事件空间是由如下事件组成的:

          1. 一男一女

          2. 两男

          3. 两女

          所以已知其中一个是男孩的话另一个是女孩的概率是50%。这个实际上是条件概率。

          如果考虑到次序,则需要按照原帖类似的方法去推导。

          通宝推:任爱杰,
          • 家园 上述三个事件不是等概率的

            一男一女的概率是其他事件的两倍。

            • 家园 所以我这里加了“不考虑次序”

              或者说“次序不可辨识”。虽然有点违反常识,但并不是完全没有道理。比如在玻色-爱因斯坦统计里,位处同一态的玻色子就是没有分别的。当然这个也只是类比。

        • 家园 感觉任爱杰的理解是正确的

          这个问题和三门问题不同。生男生女各50%概率这个假设是一个先验的知识,不能事后反推。局部孤立事件不会影响这个先验知识,所以第二个孩子是男孩的概率仍为50%。

          和三门问题相比,第一个是男孩不是主持人刻意开门,因此不会影响后续动作的概率。

          • 家园 确实有点烧脑 -- 有补充

            我想说的是在已有一个男孩的情况下,生第二个孩子仍为男孩的概率为50%。现在的问题是已知有两个孩子,见到第一个孩子是男孩,问第二个孩子仍是男孩的概率为多少?这个已知有两个孩子的条件很重要。如果假设有无穷多孩子,那么见到第一个孩子是男孩,对第二个孩子是否为男孩的概率没有影响,问题回归到我开头说的情况。现在已知有且只有两个孩子,那么样本空间收缩到4种可能:男男,男女,女男,女女。假设这四种是等可能情况,假设见到第一个是男孩(这里不是说老大是男孩),那么见到的第二个孩子仍是男孩的概率为三分之一。如果说见到的老大是男孩,那么见到老二仍是男孩的概率为二分之一。二者的差别就在于是否限定见到的第一个孩子为老大。

            作者 对本帖的 补充(1)
            家园 在限定孩子有且只有两个 -- 补充帖

            见到第一个孩子是男孩,问第二个男孩的概率。我觉得diamond的答案是正确的,三分之一。

          • 见前补充 4616723
    • 家园 继续讨论

      在使用条件概率时,一定要注意样本空间的基本事件是不是有重复的,要做到不重复才行。

      比如你这里选择第一个孩子是男孩,而另一个孩子也是男孩,和选择第二个孩子是男孩,而另一个孩子也是男孩,这两个事件实际上是同一个基本事件,即 男男 这个基本事件。

      这是类似问题的关键,很多利用条件概率公式又”符合直观“的错误结论都是都是这么来的

      • 家园 问题是,选择权不在你的手里啊

        比如你这里选择第一个孩子是男孩,而另一个孩子也是男孩,和选择第二个孩子是男孩,而另一个孩子也是男孩,这两个事件实际上是同一个基本事件,即 男男 这个基本事件

        你这里暗含的前提是第二个孩子的性别选择固定的,不会变化的。那么按照这个理论,第一个孩子是男的,第二个孩子是男的几率就下跌到三分之一,以此类推,岂不是男孩生得越多,下一胎男孩几率越小?同样的,你掷硬币九次,每次都是面朝上,难道第十次字朝上的几率就上升了?再例如,有人五十年如一日买六合彩,每次都输了,难道下一次他中大奖的机会就上升了(按你的算法,输了五十年六合彩,下一次中大奖的几率几乎是铁定了)?

        表面上看,你这个问题类似楼下的“三门问题”。“三门问题”说A、B、C 三扇门。两扇门后有山羊,一扇门后有车。主持人必须打开一扇有山羊的门,然后让玩家选择是否换门。这里玩家在得到信息后,的确得奖几率上升。但要注意的是,“三门问题”中不会出现这样的情况,当玩家选择剩下的两扇门之一后,门后的物体会随机变换。

        而不论是生孩子、掷硬币还是开六合彩,下一次出来的结果都是随机的,是观测者无法控制的。

        所以我在正文中才说解题用什么公式,前提是最重要的。如果把上一次结果和下一次结果搞成“强相关”,那么自然可以用你的算法。但如果不是事实上的“强相关”,硬套这种公式的话,就会出现只要你买六合彩够久就能发大财的问题了。

        通宝推:孟词宗,
        • 家园 这个我可以尝试解释一下

          同样的,你掷硬币九次,每次都是面朝上,难道第十次字朝上的几率就上升了?

          扔10次硬币的组合,共有2^10那么多种组合,这些组合里面,前9次都是面朝上的,只有两个,即前9面朝上,第10面朝上,与前9面朝上,第10面朝下。

          所以第10次面朝上的机会仍然是1/2

分页树展主题 · 全看首页 上页
/ 11
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河