五千年(敝帚自珍)

主题:【讨论】趣味数学题 -- 任爱杰

共:💬155 🌺244 🌵1
分页树展主题 · 全看首页 上页
/ 11
下页 末页
      • 家园 老兄你的问题出在

        男男,男女,女男,女女 这四种组合出现的概率都是1/4。但是看到一个男孩的条件下,这四种组合的条件概率分别是0,1/4,1/4, 1/2,而不是你认为的0,1/3,1/3,1/3。其实两个孩子就是独立事件,第二个孩子是男骇得概率就是1/2。其它路径只有中间不出错,算到最后都是1/2。

        • 家园 有至少一个男孩的两孩家庭中,两个都是男孩的比例是多少

          假想你是人口统计员,不考虑性别选择和出生差异和存活率等等,是不是会发现“至少有一个男孩”的比例是全部75%,双男孩占全部的25%,25%/75%=1/3

          不妨这么想,恰恰因为我们预设了男女比例是50%vs50%,所以在确认至少有一个男孩的情况下,另外一个是女孩的比例应该变大,最后才能把总性别比例平衡回来。

          反过来想,假设你推论的1/4、1/4、1/2正确,试试计算最后的性别比例还是1:1吗。

          • 家园 不要讨论了

            你觉得是独立的事件,他认为是相关,当然永远得不到共同的意见。小群体内部事件自然是强相关,而群体很大的情况下两内部事件之间就可以基本视为独立了。

          • 家园 你这个题目和原题不同

            原题是

            有一天我出门正看见新邻居带着一个6,7岁的小男孩回家.我们一打招呼,邻居介绍说,这孩子是他的儿子.

            我心里默默推算,嗯,邻居家另一个孩子也是男孩的概率为三分之一(对,这不是笔误,三分之一,不是二分之一).

            这里,出现了顺序。即你接触到的样本第一个必然是男孩。由于共有两个小孩,所以排列只可能是:

            你见到 你没见到
            男孩 男孩
            男孩 女孩

            不存在你看到的孩子是女孩的情况。所以排除 女男和女女的组合。这样上表中的没见到的男孩几率就是二分之一啊。或者说都是男孩的几率是二分之一。

            而你说的这个题目其实就是我另一个帖子里说的“老王共有两个孩子,其中一个是男孩,都是男孩的概率是多少?”这里你其实没有看到孩子的顺序问题。所以排列组合可以是 男男,男女,女男,没有女女。所以男男的概率是三分之一。

          • 家园 好问题

            至少有一个男孩的2孩家庭,两个都是男孩的几率是1/3。

            数值看到邻居带男孩子出门,这类家庭属于“至少有一个男孩的2孩家庭“,但只是“至少有一个男孩的2孩家庭“的子集。邻居带一个女生出门,也有50%的概率家里有一个男生。带男孩出门有50%的几率还有一个男孩(男男,男女),带女生出门的家庭有50%的几率家里有一个男孩(女男,女女),这样刚好对上“至少有一个男孩的2孩家庭,两个都是男孩的几率是1/3。

      • 家园 原题为了趣味搞得不严谨了 -- 有补充

        原题

        比如新来了一家邻居,我知道该邻居家有两个孩子,但不知道任何关于这两个孩子的其他情况.

        有一天我出门正看见新邻居带着一个6,7岁的小男孩回家.我们一打招呼,邻居介绍说,这孩子是他的儿子.

        我心里默默推算,嗯,邻居家另一个孩子也是男孩的概率为三分之一(对,这不是笔误,三分之一,不是二分之一)

        这里的话术是让你认为邻居只选同一个孩子出行。但如果邻居有两个男孩,可以随意选择任何一个同行呢?那么排列组合就成了

        同行 留家
        大哥(B1) 二哥(B2)
        二哥(B2) 大哥(B1)
        大哥(B1) 二姐(G2)
        大姐(G1) 二哥(B2)

        于是另一个孩子是男孩的概率是二分之一。

        如果要严格表达,下面的形式是无争议的:

        老王共有两个孩子,都是男孩的概率是多少?答案是四分之一。

        老王共有两个孩子,其中一个是男孩,都是男孩的概率是多少?答案是三分之一。

        原题的问法其实是故意误导读者。计算结果就取决于读者对题目的解读了。

        作者 对本帖的 补充(1)
        家园 上面的表最后一行打错了,修改一下 -- 补充帖

        同行 留家
        大哥(B1) 二哥(B2)
        二哥(B2) 大哥(B1)
        大哥(B1) 二姐(G2)
        二哥(B2) 大姐(G1)

        • 家园 你的第二个问法不对

          概率是对未知随机事件可能性的描述。老王有一个男孩是已知的事实,不能问一个已知的事实的概率。

          已知老王有一个男孩,另一个是男孩的可能性是1/2,全部是男孩的可能性是1*1/2=1/2。

          • 家园 详细解说一下

            原题的话术在于

            邻居家另一个孩子也是男孩的概率为三分之一

            这里的“另一个”绝大多数母语是汉语的人都会理解为另一个孩子性别的单独概率。但原作者其实问的是“有两个孩子,已知一个孩子的性别,两个孩子同性别的概率是多少?”

            这里“另一个”的意思模棱两可。原作者实际上设了个语言陷阱,混淆了单独概率和合成概率。可惜他设的不好,即使是用了有歧义的表述方式,如我前面演示的,两个孩子都是男孩的可能性仍可能是二分之一。

            至于俺的说法应当是没有歧义的。问的就是“有两个孩子,已知一个孩子的性别,两个孩子同性别的概率是多少?”

            在这里,样本空间比“有两个孩子,两个孩子同性别的概率是多少?”要小。这是因为已经把两个孩子都是另一种性别的可能性在设定中取消了。

            当然,如果硬要说样本空间不应变小也没问题。这可以参考那个“三门问题”。三门问题中说如果在开了一扇没有奖励的门后换门,则得奖概率上升到三分之二。这里的计算是以没开门之前的样本空间来计算的。也就是三个门后只有一个有奖,得奖率三分之一。如果去掉一个没奖的门,不换门则得奖率仍是三分之一,换门则得奖率变成三分之二。但如果遵循原题改变样本空间的逻辑,则我们也可以把“去掉一个没奖的门”作为缩小样本空间的理由。于是“三门问题”中“去掉一个没奖的门”后,只剩两扇门,要么有奖,要么没奖。这时候,让玩家再选一次的话,则中奖率是二分之一。

            这里要注意的是“换门中奖”的意义不等同于“再选一次”的意义。“换门中奖”规定玩家只能换门。“再选一次”则玩家可以仍然选择原来的门。

            所以这是一个逻辑佯谬。

            如果将这个佯谬的前半部分,即开门不改变样本空间,运用到“有两个孩子,已知一个孩子的性别,两个孩子同性别的概率是多少?”中,则可把“已知一个孩子的性别”视为开门。同理,“两个孩子都是另一种性别的可能性“不从样本中抽出,那么两个孩子是同一性别的可能性还是四分之一,而不是三分之一。

            所以,统计中如何采样,如何建立各种关系会直接影响到统计结果。

          • 家园 你的说法不对

            你质疑的应该是这句话吧?

            老王共有两个孩子,都是男孩的概率是多少?答案是四分之一。

            这句话隐含的前提条件是尚未见过老王的孩子,仅知道有两个。

            而你的这句话

            已知老王有一个男孩,另一个是男孩的可能性是1/2,全部是男孩的可能性是1*1/2=1/2。

            漏了一个重要的已知条件,正确的说法应该是:已知老王有两个孩子,且其中一个是男孩。

            如果加上了这个已知条件“有两个孩子”,如果不加这个条件,只问哭声那个孩子的男女概率,则你的说法是对的

            • 家园 样本空间会随着已知信息的出现而变小

              从而导致概率的变化,或者不变。

              三门问题里面,主持人打开了一个没有羊,车或者美女的门,本身,这个“没有”的信息注入改变了状态空间,因此概率改变。

              而在二孩问题中,第一个是男孩的信息注入对第二个孩子的性别状态空间没有任何影响,因此概率还是1/2。 我昨天用excel做了一个概率模拟,证明就是1/2。

              • 家园 有影响的

                ,第一个是男孩的信息注入对第二个孩子的性别状态空间没有任何影响

                对第二个孩子的性别确实是没有影响,但是对枚举有影响,把长女次女这种情况排除掉了。因此,分母变了,概率也就不同了。

        • 家园 这就是为什么说古典概型有缺陷的原因

          古典概型基于“不充分理由原则”,它规定一个事件发生的概率等于此事件的结果数除以所有的结果总数。这个明显是有问题的,比如投两个骰子的总点数有11个能性,2,3,...,12。按上面的定义每个结果的概率都是1/11,这个明显是错误的。所以后来又加了结果必须是“等可能”的这个条件。在这个问题里,你这里定义的事件才更符合“等可能”的这个条件。

          然而这个改进依然是有问题的。“等可能”其实是“等概率”,“等或然”的同义语,所以这里更像是把结果写到原因里了。逻辑上说不通。比如这个例子,其实我们要证明的“另一个孩子是男孩的概率等于50%”这个结论,由于“等可能”的限制,其实已经包含在你和其他人构造的事件空间里了。这个也是引起混乱的原因之一。

          其次“等可能”这个条件仍然只适用于很少的情况下,比如只适合均匀的骰子。不均匀的话就不行了。还有一个著名的例子就是Bertrand's Paradox

          • 家园 看错了,不说了
          • 家园 看了你的链接

            那个悖论是由于概率分布,然后抽样所选的区域不同导致的吧?

            同样的两个骰子的总点数的问题,也有一个点数概率分布的问题,某些总点数的概率就是比其他总点数要大,这个是可以从枚举组合里确认的。

            关于这句话:

            比如投两个骰子的总点数有11个能性,2,3,...,12。按上面的定义每个结果的概率都是1/11,这个明显是错误的

            等可能的定义应该是掷骰子时,骰子每一个面的向上的概率相同,不是指总点数相同吧?

分页树展主题 · 全看首页 上页
/ 11
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河