五千年(敝帚自珍)

主题投票【原创】辛普森悖论 -- earthcolor

共:💬52 🌺28
  • 投票信息

    单选,参与 19 / 9

    0
    4/2
    0
    11/5
    0
    4/2
    0
    0/0
全看分页树展 · 主题 跟帖
家园 没有经验,胡乱说几句

这个问题比较大,我没有经验。考虑了一会,感觉还是只能胡乱说几句。

先解释一下,在老马丁的例子中,有一个隐含的下一步选择:要不要改变招生政策?如果数据分析显示有性别歧视,就要改变招生政策了。很多数据分析,无论原数据中有无可控变量,都是为下一步选择做准备的。

再说几句体外话:在很多的统计的实验设计中,主要考虑所得到的数据是否能更好地验证给出的假设,实验设计是为假设验证服务的。在假设验证之后(无论接受与否),可以根据假设验证的结果,采取相应的选择或决策。

我自己对假设生成更感兴趣。有了好的假设,才可能在假设验证中发现有数据支持的结论。当然,这不是说假设生成比假设验证更重要。而是想强调,假设生成和假设验证是统一的一个整体中。统计课本中,更强调假设验证。这个现象的原因可能是假设验证已经比较系统化,而假设生成还比较初级。

好了,回到主题。下面完全是个人的理解,没有理论或技术支持。我随便说说,你随便看看。

如果一个公司要有一个全套的D marketing 策略,那么公司一定要建立自己的客户模型:哪一类客户对哪一类广告感兴趣,并会有购买的行为?我想,可能需要多次收集数据,才可能达到这个目标。

如果一次只想验证一个假设,比如一段时间的广告,对产品的销售额有多大的提高?这样的假设验证容易操作一些。但结果不一定可靠,因为可能还有很多因素在起作用。举个例子,如果一个公司在11月做了广告。过了元旦,发现产品的销量比前几个月、比往年都增加了很多。这会不会是广告的效果呢?我认为还更具体的分析:要过圣诞了、过元旦了,所有同类的消费都增加了;可能当年的经济好,所有同类的消费都增加了。

我的建议是:1)尽量建立一个整体模型,根据整体模型,选择每次要进行的假设检验。

2)如果能有同类公司的同时期的数据,可能比较更有效果

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河