主题:【原创】老马丁胡侃统计之二: 生活中的几个概率统计问题 -- 老马丁
如果主持人随机打开一个箱子而没有支票,换不换无所谓。这也是为啥这道题争议如此之大的地方。
俺的理解和解释,其实是基于一种朴素和粗浅的统计学认识,拿不出多少理论依据,这是因为俺没受过系统严格的统计学训练。
以后如果有机会深入学习研究统计学,会回来重新拜读兄弟这贴
稍稍提一下第一题。第一题有个不正规的名字,叫小数定理,意思是特值极值在小样本中出现的机会大。
感谢老酒每次都辛辛苦苦保质保量的给咱把参考答案做好。
在我们不知道主持人是否预先知道哪个盒子里有宝的情况下,合理的做法就是假定他预先知道的概率是50%,不知道的概率也是50%。这样计算下来,仍然是换盒子带给你宝物的概率高于不换盒子,只不过两者的概率差缩小了而已。
不过,主持人预先不知、完全随机抽取这种情况,从前俺没有考虑过...
如果我们被明确告知 主持人心里也没数儿、也是胡乱抽取,那么理论上应该是换与不换赢宝概率相同。但如果在现实里 我处在那个位置,我仍然会要求换盒子,因为我对别人告知的“主持人也不知道”这一情况无法100%相信。只要不是100%相信,那就应该换
我的意思是比如说叫了个不知情的观众上台,乱打开一个箱子。这就是完全随机抽取,换不换一样。
总体说,不管谁打开的,不管他知不知道,换不会吃亏。
辛普森悖论还是听老马丁说的,他总是能够鼓捣一些好玩
的东西出来。:)
2.72^(-1.64) 约 0.2
老以为是2.16.呵呵
不知道小数定理是不是说样本越小,统计涨落效应越大?
归结到第1题,一个定性的定理似乎是不足以做结论,
最明显的例子是如果这个县医院一年只接生10个小孩。。。:)
我在之前估算的时候忘记奇数这个问题。我也没有想出
一个简单的办法,MC方法倒是可以,不过没有讨论的
乐趣。:)
老马应该还有第3讲吧,讲怎么应用这些例子。:)
敲第一题的时候出了个小错,我的本意是出生男婴数超过当天出生婴儿总数的60%以上,后来敲成了50%,然后修润色文字时没注意,改成了现在这个结果。如果是60%结果更显著。
第一题的答案比的是概率,不是说小样本绝对赢。概率上来说,小样本更有可能出现这种偏离期望的情况。
世界上最可恶的东西有三个:
谎言,该死的谎言,统计数字
呵呵
好文章,花等铁牛
说实话,看完第一题,俺首先想到的就是小样本更容易出妖蛾子。但仔细一看老马丁的行文 --- “请问,哪家医院的这个记录大一些?” 这个提问,带有某种必然性的色彩,这迫使俺撇开最初的思路 而另求解释。
如果原题的提问是 --- “请问,哪家医院的记录更有可能大一些?”,那么俺大概就不会想那么多了,而只用样本大小来解释了。
下面说一哈俺的第二个思路 --- “偶数孩子的天数”思路。
为解释和理解方便,我们先假定男女孩子出生率完全相同;再假定中心医院每年接生15000个孩子,县医院每年接生620个;一年有365天或366天(无论365还是366,都不影响最后结果)。
这样,中心医院平均每天接生41个孩子,县医院日均1.7个。
由于县医院日均不到两个,所以我猜测,在这一年里,县医院接生偶数个孩子(2个孩子、4个、6个..) 的天数要少于中心医院。
由于男女出生率相同,所以接生偶数个孩子的天数中,男女相同的比例在两个医院可能差不多,这部分 --- 男女相同的天数 --- 双方抵销掉了(这里没有使用小样本更易出妖蛾子的判断)。但由于县医院接生奇数孩子 (1个、3个、5个.. 孩子) 的天数要多于中心医院,因此,男多于女 和 女多于男的天数,县医院都要大于中心医院。
原题问的是男多于女的天数,哪个医院更多,答案自然是县医院。
对这个“偶数孩子”思路的统计学解释,各位请参考闻砾兄弟的这一贴。闻砾:老酒厉害
俺上面的解释是农民的解释 (好听点儿就是 朴素的统计学认识,厚厚)。
俺后来才知道,“小样本更易出妖蛾子”思路,才是老马丁期待的解读。主要是原题的提问方式,吓得俺放弃了这个思路 而另寻他途。不过俺也想看看,有没有人认为俺这个“偶数孩子的天数”的思路,是错的。
下面有兄弟提到自然界男孩出生率本来就比女孩高一点。这一点是事实。但俺认为,无论是男高还是女高 还是男女相同,对于这个题目来说 (关键是15000 和 620 这两个数字),结果不会受到影响。具体解释就不说啦~~
我原来没说清楚,不过引入大家更深层次的思考,变成了一道考概率计算的智力题了。
[IMGA]在这一年里,县医院接生偶数个孩子(2个孩子、4个、6个..) 的天数要少于中心医院。[/IMGA]
把这个问题简单点。某医院2天出生了6个孩子,那么每天出生孩子都为奇数的概率为多少?如果改成2天出生5个呢?
这题得要一个基本假设,就是每天生的孩子数/性别数服从啥分布,比如说泊松,这样就复杂了,估计手算不出来。