五千年(敝帚自珍)

主题:【讨论】趣味数学题 -- 任爱杰

共:💬155 🌺244 🌵1 新:
全看树展主题 · 分页
/ 11
下页 末页
家园 【讨论】趣味数学题 -- 有补充

在另一个网站上看到这么一个帖子

今天听到一个例子,很适合说明怎么叫概率推断,或者概率推断会有多反直观.

比如新来了一家邻居,我知道该邻居家有两个孩子,但不知道任何关于这两个孩子的其他情况.

有一天我出门正看见新邻居带着一个6,7岁的小男孩回家.我们一打招呼,邻居介绍说,这孩子是他的儿子.

我心里默默推算,嗯,邻居家另一个孩子也是男孩的概率为三分之一(对,这不是笔误,三分之一,不是二分之一).

我又仔细端详了一下这个孩子,嗯,是个双眼皮小男孩,很可爱.我心里默默更新了我的估计,邻居家另一个孩子也是男孩的概率为七分之三.

这时屋里传出一声婴儿啼哭,邻居赶忙说,不聊了,我另一个孩子哭了,我得赶紧进屋了.和邻居告别后,我再次更新我的分析,邻居家另一个孩子也是男孩的概率为二分之一.

您能想明白这里面的道理么?

这位老兄说的神秘,其实第一个例子就算错了。邻居家有两个孩子,只知道一个孩子性别的情况下,另一个孩子的性别不论男女其实仍然是二分之一,不是文中所说的三分之一(当然,作者到最后终于纠正过来了。)

这里,作者有意无意得把第二个孩子的性别搞成了和第一个孩子性别的强相关。也就是说,第一个孩子的性别会影响到第二个孩子。其实呢,这和掷硬币的概率是一样的。每次投掷硬币都是独立的。不论哪一面朝上都是二分之一的几率,并不受其他投掷的影响(这里不考虑硬币立在平面上的情况)。一对夫妻,第一胎是男的,第二胎生女儿的机率不会上升到三分之二,仍然是二分之一。

这种貌似有理的“统计学”,也经常会在各种正式研究文章中看到。尤其是在经济学论文里看到。归根到底的原因就是怎样才算“强相关”,各派有不同的看法。根子上有分歧,自然计算大为不同。

欢迎各位作题家指正。

通宝推:假设,普鲁托,自由呼吸F0,孟词宗,纳米小洞儿,陈王奋起,

本帖一共被 1 帖 引用 (帖内工具实现)
作者 对本帖的 补充(1)
家园 【原创】说一下等效命题

发了这个帖子后,原帖作者来了,还引来不少做题家朋友一起烧脑,真是太爽了。

鉴于不少人的回帖中各类错误概念甚多,故不一一作答,这里只补充几个等效的命题供做题家们思考。

1. 一对夫妻生了一个孩子,老婆怀着第二个。两人讨论第二个孩子的性别。老公认为第一个是男孩,所以第二个是女孩的几率上升到三分之二?请问对吗?以此类推,老婆怀了第十胎,前面九个都是男孩,那么第十个生女儿的几率多大?

2.投掷硬币,已知共要投掷两次。已知投掷一次是面朝上,问另一次投掷面朝上的几率是多少?是三分之一吗?同理,共要投掷十次,已投九次都是面朝上,问第十次投掷时面朝上的几率是多少?

3. 买六合彩,共买了一万期,每期买一张彩票,9999期都输了,问第一万期的中奖几率是否上升到铁定中奖?

原作者和其他几位理解错误的地方是把一系列的独立事件当作一个整体来处理。自然就会得出荒谬的结论。上面三个例子中,每一个事件(event)都是独立的,是不受同一系列中其他事件影响的。

系列可以是一个整体,也可以是独立事件组成的集合。独立事件的集合可以在整体上对外表现出统计上的概率。例如投掷一百万次硬币,面和字朝上的分布约为各百分之五十。但是具体到每一个独立事件,就不能根据集合中其他独立事件来推定该独立事件的实际效果。

用一个不太恰当的比喻,宏观状态下的物体运动有规律是可测的,但组成物体的微观粒子的个体运动状态是测不准的。而连接这两者的桥梁是统计。

通宝推:孟词宗,陈王奋起,审度,
家园 诶 这不是我的帖子么

诶 这不是我的帖子么?

家园 失物招领,物归原主 -- 有补充

不知道这是你的原作。失敬。

作者 对本帖的 补充(1)
家园 不过你的原作是错的 -- 补充帖

你原作里第二个孩子的男女性别应是独立事件,所以永远是二分之一。

见前补充 4616230
家园 呃,前几天刚好看了一个一篇讲"三门问题"的科普文

虽然自己水平低,但看懂了觉得挺有意思的,唯一的疑问就是为什么那文章说"三门问题"起初在高学历理工群体也有争议,但我为什么觉得自己明明辣么普通却辣么自信,这有什么好争议的。

引发争议的点是不是"独立事件"的划分。

家园 三门问题不是独立事件

三门问题中,当主持人打开有山羊的门后就改变了几率。

三门问题的促辖之处是让游戏参加者决定是不是换门。这里的几率必须考虑到游戏参加者的初始选择。当三扇门都是关闭的时候,游戏参加者参加者选中山羊的几率是三分之二。不论一扇门打开后后面出现什么,这个几率是不变的。当打开一扇有山羊的门后,如果游戏参加者不换门,那么选中山羊的概率仍然是三分之二。反之,如果换门,则选中车的概率上升为三分之二(1-1/3=2/3)。

家园 继续讨论

在使用条件概率时,一定要注意样本空间的基本事件是不是有重复的,要做到不重复才行。

比如你这里选择第一个孩子是男孩,而另一个孩子也是男孩,和选择第二个孩子是男孩,而另一个孩子也是男孩,这两个事件实际上是同一个基本事件,即 男男 这个基本事件。

这是类似问题的关键,很多利用条件概率公式又”符合直观“的错误结论都是都是这么来的

家园 不是独立的

如果能分辨两个孩子,知道是哪个,那当然是独立事件。

如果不能分辨,这不是,详细原因见我上边的回复,简单的说在这种情况下强行运用条件概率会造成基本事件重复。

家园 还是有疑问

一个个问题问吧

有一天我出门正看见新邻居带着一个6,7岁的小男孩回家.我们一打招呼,邻居介绍说,这孩子是他的儿子.

我心里默默推算,嗯,邻居家另一个孩子也是男孩的概率为三分之一(对,这不是笔误,三分之一,不是二分之一).

由于不知道两个孩子的所有情况,我先把全部组合罗列出来:

长男次男

长男次女

长女次男

长女次女

由于见到一个男孩,长女次女的情况就可以排除掉,因此只剩下其余三个组合,所以,长男次男的可能性只占了三分一。

以上我理解,但是下面这个实在不理解:

我又仔细端详了一下这个孩子,嗯,是个双眼皮小男孩,很可爱.我心里默默更新了我的估计,邻居家另一个孩子也是男孩的概率为七分之三.

双眼皮是如何影响概率的?如何得出7这个数字?

家园 老兄是在哪个论坛上看到的?

如果是我原来发贴的那个论坛,是有作者id的啊,在那我也叫数值分析。难道有人已经搬运过一次了?

家园 这个容易啊

按老兄的方法列联列表:

长男双次男双

长男双次男单

。。。。。。

一共16个可能,有至少一个男双的有7种,其中有两男的有3种,3/7啊

家园 那是我想歪了

我想到是不是什么遗传的可能性上面去了

家园 这个是对概率的误解

概率是对未知事物出现可能性的描述,在你的列表中长男是已知事件,不应该出现在对未知事物的可能性列举中。

因此另一个是男孩还是女孩,概率还是接近50%。

通宝推:孟词宗,
家园 不是误解

有一个已知条件:两个小孩。这个已知条件就把组合的各种可能性给限死了。

假如没有这个已知条件,仅仅是听到第二个孩子哭声时,才去推断第二个孩子的性别,那么就应该是1/2的概率。

家园 我觉得这更象是先验概率和后验概率的区别

只知道一个孩子性别的情况下,另一个孩子的性别不论男女其实仍然是二分之一

这个是先验概率,也就是已知只有两个基本事件,而没有其他条件的时候,每个事件发生的概率可以“规定”为各50%。这个可以用最大似然估计来算,但本质上应该是“最大熵原理”,更基本的则是数学里的“对称性”。然而实际上是不是真的50%并不一定。比如假设一天里有“白天”和“黑夜”两种状态,但在某一天某个时间点属于“白天”或“黑夜"的概率并不是50%(除春分/秋分)。实际上人类生男孩和女孩的概率其实并不是严格的50%而只是接近于50%。

引文里推导的过程实际上描述的是一种后验过程,即并不预先假定人类生男孩和女孩的概率是,而是根据一系列的条件来推导出”邻居家的另一个孩子是男孩“的概率。

全看树展主题 · 分页
/ 11
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河