五千年(敝帚自珍)

主题:【原创】老马丁胡侃统计之二: 生活中的几个概率统计问题 -- 老马丁

共:💬163 🌺186
全看树展主题 · 分页首页 上页
/ 11
下页 末页
家园 那你得先赌主持人知不知道

如果主持人随机打开一个箱子而没有支票,换不换无所谓。这也是为啥这道题争议如此之大的地方。

家园 兄弟的解释远为专业、科学

俺的理解和解释,其实是基于一种朴素和粗浅的统计学认识,拿不出多少理论依据,这是因为俺没受过系统严格的统计学训练。

以后如果有机会深入学习研究统计学,会回来重新拜读兄弟这贴

家园 男性出生率确实微微高于女性,但这应该不会影响第一题的结论
家园 参考答案

这里。

稍稍提一下第一题。第一题有个不正规的名字,叫小数定理,意思是特值极值在小样本中出现的机会大。

感谢老酒每次都辛辛苦苦保质保量的给咱把参考答案做好。

家园 即使如此,也还是应选换

在我们不知道主持人是否预先知道哪个盒子里有宝的情况下,合理的做法就是假定他预先知道的概率是50%,不知道的概率也是50%。这样计算下来,仍然是换盒子带给你宝物的概率高于不换盒子,只不过两者的概率差缩小了而已。

不过,主持人预先不知、完全随机抽取这种情况,从前俺没有考虑过...

如果我们被明确告知 主持人心里也没数儿、也是胡乱抽取,那么理论上应该是换与不换赢宝概率相同。但如果在现实里 我处在那个位置,我仍然会要求换盒子,因为我对别人告知的“主持人也不知道”这一情况无法100%相信。只要不是100%相信,那就应该换

家园 这是我的意思。

我的意思是比如说叫了个不知情的观众上台,乱打开一个箱子。这就是完全随机抽取,换不换一样。

总体说,不管谁打开的,不管他知不知道,换不会吃亏。

家园 正是如此!
家园 我也不是做统计的

辛普森悖论还是听老马丁说的,他总是能够鼓捣一些好玩

的东西出来。:)

家园 泊松分布, 没有小孩接生的几率是

2.72^(-1.64) 约 0.2

家园 谢谢。记错常数了

老以为是2.16.呵呵

家园 大数定理它弟?

不知道小数定理是不是说样本越小,统计涨落效应越大?

归结到第1题,一个定性的定理似乎是不足以做结论,

最明显的例子是如果这个县医院一年只接生10个小孩。。。:)

我在之前估算的时候忘记奇数这个问题。我也没有想出

一个简单的办法,MC方法倒是可以,不过没有讨论的

乐趣。:)

老马应该还有第3讲吧,讲怎么应用这些例子。:)

家园 其实是这样的

敲第一题的时候出了个小错,我的本意是出生男婴数超过当天出生婴儿总数的60%以上,后来敲成了50%,然后修润色文字时没注意,改成了现在这个结果。如果是60%结果更显著。

第一题的答案比的是概率,不是说小样本绝对赢。概率上来说,小样本更有可能出现这种偏离期望的情况。

家园 第四个故事是那个典型笑话的实例

世界上最可恶的东西有三个:

谎言,该死的谎言,统计数字

呵呵

好文章,花等铁牛

关键词(Tags): #乐在其中
家园 一个灌了二两黄汤的农民对第一题的理解~~

说实话,看完第一题,俺首先想到的就是小样本更容易出妖蛾子。但仔细一看老马丁的行文 --- “请问,哪家医院的这个记录大一些?” 这个提问,带有某种必然性的色彩,这迫使俺撇开最初的思路 而另求解释。

如果原题的提问是 --- “请问,哪家医院的记录更有可能大一些?”,那么俺大概就不会想那么多了,而只用样本大小来解释了。

下面说一哈俺的第二个思路 --- “偶数孩子的天数”思路。

为解释和理解方便,我们先假定男女孩子出生率完全相同;再假定中心医院每年接生15000个孩子,县医院每年接生620个;一年有365天或366天(无论365还是366,都不影响最后结果)。

这样,中心医院平均每天接生41个孩子,县医院日均1.7个。

由于县医院日均不到两个,所以我猜测,在这一年里,县医院接生偶数个孩子(2个孩子、4个、6个..) 的天数要少于中心医院。

由于男女出生率相同,所以接生偶数个孩子的天数中,男女相同的比例在两个医院可能差不多,这部分 --- 男女相同的天数 --- 双方抵销掉了(这里没有使用小样本更易出妖蛾子的判断)。但由于县医院接生奇数孩子 (1个、3个、5个.. 孩子) 的天数要多于中心医院,因此,男多于女 和 女多于男的天数,县医院都要大于中心医院。

原题问的是男多于女的天数,哪个医院更多,答案自然是县医院。

对这个“偶数孩子”思路的统计学解释,各位请参考闻砾兄弟的这一贴。闻砾:老酒厉害

俺上面的解释是农民的解释 (好听点儿就是 朴素的统计学认识,厚厚)。

俺后来才知道,“小样本更易出妖蛾子”思路,才是老马丁期待的解读。主要是原题的提问方式,吓得俺放弃了这个思路 而另寻他途。不过俺也想看看,有没有人认为俺这个“偶数孩子的天数”的思路,是错的。

下面有兄弟提到自然界男孩出生率本来就比女孩高一点。这一点是事实。但俺认为,无论是男高还是女高 还是男女相同,对于这个题目来说 (关键是15000 和 620 这两个数字),结果不会受到影响。具体解释就不说啦~~

家园 这个有意思

我原来没说清楚,不过引入大家更深层次的思考,变成了一道考概率计算的智力题了。

[IMGA]在这一年里,县医院接生偶数个孩子(2个孩子、4个、6个..) 的天数要少于中心医院。[/IMGA]

把这个问题简单点。某医院2天出生了6个孩子,那么每天出生孩子都为奇数的概率为多少?如果改成2天出生5个呢?

这题得要一个基本假设,就是每天生的孩子数/性别数服从啥分布,比如说泊松,这样就复杂了,估计手算不出来。

全看树展主题 · 分页首页 上页
/ 11
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河