主题:【原创】老马丁胡侃统计之二: 生活中的几个概率统计问题 -- 老马丁
这个解释太好了~
1000个门的这个解释最容易让人理解了~!
我说的A指的是你所选择的那个,不管里面有没有宝。
因为A是从1000个里面里选出来的,有宝的概率是0.1%,而无论你选择1000个中的任何一个,主持人之后都会打开998个空箱子(主持人知道哪个有宝),所以他打开箱子不会影响A有宝的概率,只影响最终剩下的那个箱子的概率。或者换句话说,每打开一个空箱子,这个空箱子的概率就会“分给”剩下的箱子,因为A是最早被挑出的,所以不会分配到A的头上,所以A自始至终的概率都是0.1%。
俺是这么理解的~
也可以认为自己同时选择了A和打开的那个,概率同样是2/3,有什么区别?
60%和50%很不同啊。如果是60%和40%结论就是正相反了,,因为50%是期望。单考虑每天出生偶数个的情况,如果出生数越多,男女相同的概率反而是越小的。如两个时是1/2,四个是3/8。那么男婴超过半数的概率反而越大,这是与大数定理相反的。因为大数定理说的是“平均值”,所以样本越多方差越小。而这里是直接求和,样本越多方差越大。
关键在于两个过程不是独立的。换一个问法,你知道一个箱子里肯定没有,然后主持人从剩下的箱子里取出一个箱子让你选,你是不是肯定就换主持人哪个了呢?
现在这个问题就是把“肯定没有”改成“1/3概率有”或者“1/100概率有”罢了。
如果主持人知道,他总有办法开出那么多的空箱子出来,这不是个随机的过程。并且他要开的箱子和你选的是有关系的。
而如果主持人不知道,那么开空箱子出来本身是个随机过程。这样的话的确是1/2,换不换一样。
今天下午陪闺女在院子里玩。不知怎么一下就想明白了。
原来的思路真是钻了牛角尖,怎么也不明白。
就那么一刹那,悟了
其实问题完全可以说成:
你是选这个呢,还是选另外2个?选另外2个的话,主持人把空的那个打开。呵呵。
第二题已经有很多人讨论过。各人理解不同,思路也不同。在这里,我谈一谈另一个思路,供大家参考。这个帖子的内容,不是讨论第二题的解法,而是第二题里的一些条件。如果大家有不同意见,欢迎讨论。
首先,我们要澄清一些观点,讨论一下这里的概率概念。更多关于概率的讨论,参见earthcolor:【原创】概率论的哲学解释。
第一, 在这个题中,我们讨论的概率不是在一个特定单次游戏中猜对有钻石箱子的概率(单次事件的概率),而是多次重复玩这个游戏猜对有钻石箱子的概率(重复事件的概率)。
第二, 在这个题中,我们讨论的概率不随某个人的信心程度而改变。
第三, 在这个题中,不是某一个箱子的特性。任意换一个箱子,我们讨论的概率不会改变。离开了这个题中的其他条件,谈某个箱子的概率没有意义。(如果抛一个均匀的硬币,出现1/2正面是这个硬币本身的特性。)
好了,现在说这个题中的条件:
第一, 有只有三个箱子。(有人会说,废话。可是,在有些问题中,没有这么简单。参见earthcolor:【原创】概率论中几个著名的悖论的悖论三)
第二, 在三个箱子中,肯定有一个有钻石,而且钻石在任何一个箱子中的概率是一样的。(不能只简单的讲是随机的。很多时候,随机的是指平均概率分布。准确地讲,随机的可以指符合任何概率分布)
第三, 参赛者先选了一个箱子
第四, 在参赛者选了箱子之后,主持人在另外两个箱子中打开一个肯定没有钻石的箱子,不是主持人任意打开一个箱子后发现里面没有钻石。
以上的这几个条件,是可以重复的。在大家以前的讨论,强调最多的是第四个条件。如果我们有做模拟实验,任何一个条件都不能忽略。如果任何一个条件改变,这个题里的结果就会改变。如果做计算机模拟实验,会发现结果是:在换箱子后,选中有钻石的箱子的概率是2/3。
在我们知道了这个题目中的各个条件以后,我们可以改变相关的条件,得到新的问题。如果我们用概率图形模型来表达,我们可以得到更一般的问题表达。
第一次做这道题的时候,用了比较笨的方法:先列出三个箱子中各有钻石的可能,再列出参赛者的三种选择,最后列出主持人的选择。27种情况,可以看到最后的结果。当时做完,也没有多想。感觉结果就该那样。
后来,我想用贝叶斯网络、决策树、Influence diagram来表达这个问题,首先遇到了变量选择的问题。开始时,考虑了5个变量:1)三个箱子中有钻石的概率;2)参赛者的初次选择;3)主持人的选择;4)参赛者换不换的选择;5)最后的结果。后来发现,在Influence diagram中,用三个变量是一个经典的表达:1)参赛者第一次选中钻石概率;2)参赛者换不换的决定;3)结果。在这个过程中,我发现,变量的选择对建模很重要。这个发现以前也发现过,不过这次的感觉不一样。
这个时候,在和一个朋友讨论中,朋友提出问题:为什么概率不是1/2?为什么概率会改变?这个朋友先读过概率哲学讨论的书,对哲学思考方面更感兴趣。朋友认为,在主持人打开一个箱子后,在其他箱子之间并没有物质转移,这里的概率应该是人的信心程度。我的看法和他不同,认为是可重复条件下的倾向(propensity)论。符合earthcolor:【原创】概率论的哲学解释中倾向(propensity)论的条件。
当冷眼旁观的帖子:冷眼旁观:沮丧的很里,提到了概率为什么会改变的问题。我想,如果按概率为什么会改变的思路考虑,会和我和我的朋友一样,讨论题目中的条件。这样,我们会考虑概率是什么。不知道,大家如何看待这个问题,至少对于,一点点的讨论,可以让我发现更多的以前没有考虑过的问题。
这是我的大概思路。欢迎大家讨论。
补充:刚才考古,发现这个问题以前有人贴过。
其中下面两个帖子的内容很有意思:
这应该是这道题最简单明了的解释了。
花您
您这里给出的是男孩数超过女孩数的概率,那么,男孩数等於女孩数,和女孩数超过男孩数的概率,与每天孩子总出生数量的关系又是怎样的呢?
不知各位有没有注意过六合彩的中奖几率? 按照小概率理论,这是不应该发生的事情,可是每周都有人中,这是为何?请教一下。
不换的话是你原来挑对的1/3可能性.换的话是你原来没挑对的2/3可能性.
计算一下。
按照南非的计算吧,南非是49选6,这样,可能的排列组合的数量,是49*48*47*46*45*44/1/2/3/4/5/6=13,983,816。
中奖的概率也就是一千四百万分之一。
也就是说如果这一期六合彩只卖出了一张,那么出现大奖的可能性就是一千四百万分之一。很小了吧?
问题是有很多人买,事情就变化了。
只有一个人买,这个人不中大奖的概率是13983815/13983816=99.99999285%。
要是有两个人买呢,那么两个人都不中大奖的概率就是上面这个数字的平方,多少呢?99.99998570%。成了大约七百万分之一。还是很小?
要是有十个人买了呢,是个人都不中奖的概率就是上面那个数字的十次方,多少呢?99.99993%,大约是140万分之一。
1000个人买呢?这一千个人都不中奖的概率就是99.993%,成了一万四千分之一。这个数字就不是特别的小了吧?
一万个人买呢,都不中奖的概率就是99.929%,一千四百分之一。
实际上南非的彩票现在大约每期卖出一千万张,这样,这一期没有人中奖的概率就只有48.9%。看看,一半!也就是说每一期有一半的概率可以开出大奖。
如果南非将近五千万人口每个人都买一张,那么没有人中大奖的概率仅仅有2.8%!这个时候,没有人中奖就成了新鲜事了。
再小概率的事件,当样本大到一定程度的时候,在某一个样本上发生的概率也会很大。
村长好,多谢村长!
从大学时就对概率统计学迷糊,现在还是。
多谢村长兄的解释,但还有些迷糊:
可不可以这么认为--每期中奖的概率很大,但落在我个人头上的几率还是1/13983816?