近期网站停站换新具体说明
按以上说明时间，延期一周至网站时间26-27左右。具体实施前两天会在此提前通知具体实施时间

主题：【原创】牛与熊，从科研角度看股市（一）---从一篇小论文谈起 -- 千里烟波

共:💬219 🌺470

老大河待整

全看树展主题 · 分页首页上页下页末页

复【原创】牛与熊，从科研角度看股市（一）---从一篇小论文谈起

家园

一没注意都写到4了

逐篇送花。

复【原创】牛与熊，从科研角度看股市（一）---从一篇小论文谈起

家园

受教了，献花收藏慢慢学习！

复【原创】牛与熊，从科研角度看股市（一）---从一篇小论文谈起

家园

【原创，短】借欧洲杯大眼说的话讲选择性偏差

首先声明，捷克，葡萄牙，朕皆爱之如一。

48年魔咒证明葡萄牙或将夺冠

凡在欧洲杯战胜过捷克队的，必有一支最终夺冠——1960，前苏联半决赛3-0击败捷克杀入决赛，最后夺冠；1980年，德国击败捷克杀入决赛，最终夺冠；1996年欧洲杯，德国在决赛中2-1击败捷克，又夺冠；2000年欧洲杯，法国在小组赛3-1击败捷克，荷兰1-0击败捷克，由于法国多赢捷克一个球，最终夺冠；2004年，希腊在半决赛1-0击败捷克，然后在决赛中……本届欧洲杯也许还有能战胜捷克的，但好像没人能进捷克三球唯葡萄牙了。

如果说大眼在陈述事实，那我无话可说。怕的就是他下的结论，这也是为什么有些经济学家遭人痛恨的原因。

在（三）里面非常粗略地谈了谈预测和解释的区别，但没说样本数据的问题。

因为凡是拿冠军的只要在淘汰赛碰到捷克，必须赢，不赢还怎么拿冠军？？？？淘汰赛输给捷克的怎么拿冠军啊?而冠军即使在小组赛里面也肯定要有优势得多，就好比说世界杯冠军队里面最有可能出最佳射手一样。统计学里面叫做Selection Bias（选择性偏差）。你选了盖茨家的朋友做美国家庭收入调查那还能坏得了？

但是这种诚实的废话是没用di...该调查研究的是未知领域，所选取的数据应该有代表性。如果做美国经济调查，那就应该各个州随机取一些。如果预测欧洲杯，就应该从各个队员以往表现来预测，不能说冠军队得了冠军，没意义。

复【原创，短】借欧洲杯大眼说的话讲选择性偏差

家园

来给MM捧个场。

不错的系列文章啊，虽然俺还不算很懂。

关于风险，年初厚坤兄两个系列俺看得很来劲　（闲话风险之风险的古典定义，闲话风险之乌龟（上）），可惜他只在河里玩了一个月，就不见了。

另，河里也有个大眼（链接出处），是位好同学。俺一开始以为老乡你在说他呢。

上了几朵花，没有宝，腹诽老铁一把。

祝贺MM嘉宾上任。

复来给MM捧个场。

家园

我也看过他的帖子，很弓虽，多谢提醒，加了链接。

复【原创】牛与熊，从科研角度看股市（一）---从一篇小论文谈起

家园

【原创】牛与熊，从科研角度看股市（五）--模型的预测能力

经济学论文中的模型可以大体分为两类，第一类是真正意义上的经济学模型，有参与者的行为集合，效用函数，外生环境，然后求出假设条件下最优解。特别猛的人就全用数学语言，弄个拓扑空间，搞个随机过程，解出来的也是数学，这样的好处是一般性（general），很多类似的论题可以套用。大部分的人的模型看上去就很具体了，比如说假设某人的效用函数就是X平方，然后再接一系列的具体的方程，这个叫做应用理论（Applied Theory），好处是容易理解，也容易和实践相结合来应用数据。和它最直接相联系的就是校准（calibration），通过具体模型推导出显示数据和假设参数之间的关系，然后倒推出参数应该是什么样的。

例子：根据理论，假设个人的相对风险厌恶参数是A，那么如果给定100元，此人会把100乘以（1-A）元去买彩票。那么通过调查，甲愿意用十块钱去买彩票，那么它的风险厌恶参数就是0.9

以上的模型又被统称为结构模型（Structural Form），就是有经济理论支持的模型。与它对应的就是简化（？）模型(Reduced Form)，基本上就是靠数据说话，偏重统计方面

例子：y = b * x + e

用最小二乘法算出x对y的影响（b值），暂不考虑它们的意义。

鉴于经济学不是科学，而是艺术，structural和reduced form两者并不矛盾，而是术业有专攻。Structural模型更多地能够帮助人们透过现象看本质，研究是什么造成了我们所观察到的现象，我们称为“解释”。Reduced模型除此之外还能帮助我们来判断未来究竟会怎样，称为“预测”。二者并非没有交集，只不过现实的研究更倾向于Reduced模型善于预测，而Structural模型作解释更加让人信服。

宏观经济预测在70年代和80年代遇到了很多问题和责难。滞胀+石油危机使得预测失灵。也由此带出来“卢卡斯批评（Lucas Critiques）”，大意应该是模型不是一成不变，随着社会经济发展，各种变量之间的关系在不断改变着，所以使用模型需要考虑参数的不确定性。以前数据估计出来的参数现在未必好用。在时间序列里面称作结构破裂（？）“Structure Break”。大家都知道菲利普斯曲线（失业率和通胀率之间的权衡），但是80年代菲利普斯曲线整体移动了，原来的参数假设就不灵了...

而且这些宏观预测模型大多是非常复杂的结构模型，一个简单的RWI-商业周期模型就需要41个随机方程和86个定义方程，这还叫作中等规模模型！计量经济学里有一个重要的准则就是Parsimony,意思是简化。因为虽然多参数模型可以更好的拟和数据，但是预测能力会大打折扣。而且我们对宏观经济的把握往往是偏颇的，这么多方程如果有一个变量出问题或者有些东西忘掉了，连锁反应会把整个模型毁掉。客观地说，经济管理版里面安德森也好，虎哥也好，子玉也罢，对宏观经济的把握往往来源于模糊的人类逻辑，他们是写不出来整个经济系统方程的。但正是由于有模糊逻辑，所以才会看到大方向上的问题而不拘泥于小数点后几位的数据。

综上，我们说，好的预测模型一要有稳健性，不会因为些微的参数变化而产生蝴蝶效应；二要有学习性，要回通过新数据的加入而能来逐渐修正自己。

稳健性的问题暂时用时间序列来解决，而学习性我们用贝叶斯的方法来实现。

元宝推荐：老马丁,

复【原创，短】借欧洲杯大眼说的话讲选择性偏差

家园

花

复【原创】牛与熊，从科研角度看股市（五）--模型的预测能力

家园

赞地痞流氓

正如千里烟波mm的公告所言：

金融计量+地痞流氓

搞学术和讲义气不冲突！