五千年(敝帚自珍)

主题:【原创】老马丁胡侃统计之二: 生活中的几个概率统计问题 -- 老马丁

共:💬163 🌺186
分页树展主题 · 全看首页 上页
/ 11
下页 末页
    • 家园 【求助】老马丁大大,请问如何计算三参数Weibull分布的位置参

      数呀!小弟是一家制作印刷电路板的小公司里的QC小组组长,现在受用户和领导的要求要绘制Weibull累积失效概率纸,并通过Weibull累积失效概率纸估计出Weibull分布的三个参数。小弟通过查资料,仅得到了两参数Weibull分布的参数计算方法,而没有三参数的Weibull分布的参数计算方法。所以特别向老马丁大大和煮酒大大指教,看看有没有这方面的资料。顿首感谢!

    • 家园 【讨论】第四个问题的实际例子

      故事发生在二十世纪七十年代,当时美国女权运动正胜,有人就盯上了几个知名学府。案例发生在Berkeley.就像老马的帖子里讲的,总的来看,女生的入学率低,歧视女性嘛!女权人士不干了:Berkeley,你要给个解释!

      后来,有人看了各系的入学率,说明显女生的入学率高嘛!

      结果又发现一个辛普森悖论的实例:引入了一个新的变量,原来的结论反过来。问题是,在什么情况下,可以引入一个新的变量?在这个例子中,你接受哪一个结论?欢迎讨论!

    • 家园 一个灌了二两黄汤的农民对第一题的理解~~

      说实话,看完第一题,俺首先想到的就是小样本更容易出妖蛾子。但仔细一看老马丁的行文 --- “请问,哪家医院的这个记录大一些?” 这个提问,带有某种必然性的色彩,这迫使俺撇开最初的思路 而另求解释。

      如果原题的提问是 --- “请问,哪家医院的记录更有可能大一些?”,那么俺大概就不会想那么多了,而只用样本大小来解释了。

      下面说一哈俺的第二个思路 --- “偶数孩子的天数”思路。

      为解释和理解方便,我们先假定男女孩子出生率完全相同;再假定中心医院每年接生15000个孩子,县医院每年接生620个;一年有365天或366天(无论365还是366,都不影响最后结果)。

      这样,中心医院平均每天接生41个孩子,县医院日均1.7个。

      由于县医院日均不到两个,所以我猜测,在这一年里,县医院接生偶数个孩子(2个孩子、4个、6个..) 的天数要少于中心医院。

      由于男女出生率相同,所以接生偶数个孩子的天数中,男女相同的比例在两个医院可能差不多,这部分 --- 男女相同的天数 --- 双方抵销掉了(这里没有使用小样本更易出妖蛾子的判断)。但由于县医院接生奇数孩子 (1个、3个、5个.. 孩子) 的天数要多于中心医院,因此,男多于女 和 女多于男的天数,县医院都要大于中心医院。

      原题问的是男多于女的天数,哪个医院更多,答案自然是县医院。

      对这个“偶数孩子”思路的统计学解释,各位请参考闻砾兄弟的这一贴。闻砾:老酒厉害

      俺上面的解释是农民的解释 (好听点儿就是 朴素的统计学认识,厚厚)。

      俺后来才知道,“小样本更易出妖蛾子”思路,才是老马丁期待的解读。主要是原题的提问方式,吓得俺放弃了这个思路 而另寻他途。不过俺也想看看,有没有人认为俺这个“偶数孩子的天数”的思路,是错的。

      下面有兄弟提到自然界男孩出生率本来就比女孩高一点。这一点是事实。但俺认为,无论是男高还是女高 还是男女相同,对于这个题目来说 (关键是15000 和 620 这两个数字),结果不会受到影响。具体解释就不说啦~~

      • 家园 有喜

        惊喜:所有在本帖先送花者得【通宝】一枚

        恭喜:你意外获得【西西河通宝】一枚

        谢谢:作者意外获得【西西河通宝】一枚

        鲜花已经成功送出。

        此次送花为【有效送花赞扬,涨乐善、声望】

      • 家园 这个有意思

        我原来没说清楚,不过引入大家更深层次的思考,变成了一道考概率计算的智力题了。

        [IMGA]在这一年里,县医院接生偶数个孩子(2个孩子、4个、6个..) 的天数要少于中心医院。[/IMGA]

        把这个问题简单点。某医院2天出生了6个孩子,那么每天出生孩子都为奇数的概率为多少?如果改成2天出生5个呢?

        这题得要一个基本假设,就是每天生的孩子数/性别数服从啥分布,比如说泊松,这样就复杂了,估计手算不出来。

        • 家园 量化计算需要统计学硕士以上学历

          但 qualitative 的猜测是 --- 日均达到几十的,偶数孩子的发生概率要高于 日均不到两个的..

    • 家园 第四个故事是那个典型笑话的实例

      世界上最可恶的东西有三个:

      谎言,该死的谎言,统计数字

      呵呵

      好文章,花等铁牛

      关键词(Tags): #乐在其中
    • 家园 参考答案

      这里。

      稍稍提一下第一题。第一题有个不正规的名字,叫小数定理,意思是特值极值在小样本中出现的机会大。

      感谢老酒每次都辛辛苦苦保质保量的给咱把参考答案做好。

      • 家园 大数定理它弟?

        不知道小数定理是不是说样本越小,统计涨落效应越大?

        归结到第1题,一个定性的定理似乎是不足以做结论,

        最明显的例子是如果这个县医院一年只接生10个小孩。。。:)

        我在之前估算的时候忘记奇数这个问题。我也没有想出

        一个简单的办法,MC方法倒是可以,不过没有讨论的

        乐趣。:)

        老马应该还有第3讲吧,讲怎么应用这些例子。:)

        • 家园 其实是这样的

          敲第一题的时候出了个小错,我的本意是出生男婴数超过当天出生婴儿总数的60%以上,后来敲成了50%,然后修润色文字时没注意,改成了现在这个结果。如果是60%结果更显著。

          第一题的答案比的是概率,不是说小样本绝对赢。概率上来说,小样本更有可能出现这种偏离期望的情况。

          • 家园 呵呵,有点不同意见

            60%和50%很不同啊。如果是60%和40%结论就是正相反了,,因为50%是期望。单考虑每天出生偶数个的情况,如果出生数越多,男女相同的概率反而是越小的。如两个时是1/2,四个是3/8。那么男婴超过半数的概率反而越大,这是与大数定理相反的。因为大数定理说的是“平均值”,所以样本越多方差越小。而这里是直接求和,样本越多方差越大。

    • 家园 好像出生时男孩的比例比一半略微高一点

      所以如果每天出生的人数多,男的比较多的概率就很大,几乎为一

分页树展主题 · 全看首页 上页
/ 11
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河