主题：投票【原创】辛普森悖论 -- earthcolor

共:💬52 🌺28

老大河待整

投票信息
单选，参与 19 / 9
0
4/2
0
11/5
0
4/2
0
0/0

全看分页树展 · 主题跟帖

复这下明白啦

家园

没有经验，胡乱说几句

这个问题比较大，我没有经验。考虑了一会，感觉还是只能胡乱说几句。

先解释一下，在老马丁的例子中，有一个隐含的下一步选择：要不要改变招生政策？如果数据分析显示有性别歧视，就要改变招生政策了。很多数据分析，无论原数据中有无可控变量，都是为下一步选择做准备的。

再说几句体外话：在很多的统计的实验设计中，主要考虑所得到的数据是否能更好地验证给出的假设，实验设计是为假设验证服务的。在假设验证之后（无论接受与否），可以根据假设验证的结果，采取相应的选择或决策。

我自己对假设生成更感兴趣。有了好的假设，才可能在假设验证中发现有数据支持的结论。当然，这不是说假设生成比假设验证更重要。而是想强调，假设生成和假设验证是统一的一个整体中。统计课本中，更强调假设验证。这个现象的原因可能是假设验证已经比较系统化，而假设生成还比较初级。

好了，回到主题。下面完全是个人的理解，没有理论或技术支持。我随便说说，你随便看看。

如果一个公司要有一个全套的D marketing 策略，那么公司一定要建立自己的客户模型：哪一类客户对哪一类广告感兴趣，并会有购买的行为？我想，可能需要多次收集数据，才可能达到这个目标。

如果一次只想验证一个假设，比如一段时间的广告，对产品的销售额有多大的提高？这样的假设验证容易操作一些。但结果不一定可靠，因为可能还有很多因素在起作用。举个例子，如果一个公司在11月做了广告。过了元旦，发现产品的销量比前几个月、比往年都增加了很多。这会不会是广告的效果呢?我认为还更具体的分析：要过圣诞了、过元旦了，所有同类的消费都增加了；可能当年的经济好，所有同类的消费都增加了。

我的建议是：1）尽量建立一个整体模型，根据整体模型，选择每次要进行的假设检验。

2）如果能有同类公司的同时期的数据，可能比较更有效果

全看分页树展 · 主题跟帖

相关回复上下关系8
- - 🙂怎么想都觉得不对头 --- 兄弟能否拿出具体数字来说明一下呀？煮酒正熟字611 2008-01-31 18:22:46
    🙂讨论一下 2 earthcolor 字605 2008-01-31 19:40:32
    🙂这下明白啦煮酒正熟字248 2008-01-31 20:19:59
    🙂没有经验，胡乱说几句
    🙂我的理解，一是建模，二是利用已有统计结果作判断铁手字124 2008-02-05 01:20:52
    🙂不对啊，老酒。 4 东方射日字1421 2008-01-31 19:17:41
    🙂这些明白了。花谢兄弟敲字解释煮酒正熟字173 2008-01-31 20:04:24
    🙂送花！你的例子很不错！ earthcolor 字22 2008-01-31 19:29:13

有趣有益，互惠互利；开阔视野，博采众长。
虚拟的网络，真实的人。天南地北客，相逢皆朋友

版面群落趣味社区帮助常见问题网站简介基本河规隐私条款使用条款广告说明

主题：投票【原创】辛普森悖论 -- earthcolor

单选，参与 19 / 9