五千年(敝帚自珍)

主题:【原创】牛与熊,从科研角度看股市(一)---从一篇小论文谈起 -- 千里烟波

共:💬219 🌺470
全看树展主题 · 分页首页 上页
/ 15
下页 末页
家园 一没注意都写到4了

逐篇送花。

家园 受教了,献花收藏慢慢学习!
家园 【原创,短】借欧洲杯大眼说的话讲选择性偏差

首先声明,捷克,葡萄牙,朕皆爱之如一。

48年魔咒证明葡萄牙或将夺冠

凡在欧洲杯战胜过捷克队的,必有一支最终夺冠——1960,前苏联半决赛3-0击败捷克杀入决赛,最后夺冠;1980年,德国击败捷克杀入决赛,最终夺冠;1996年欧洲杯,德国在决赛中2-1击败捷克,又夺冠;2000年欧洲杯,法国在小组赛3-1击败捷克,荷兰1-0击败捷克,由于法国多赢捷克一个球,最终夺冠;2004年,希腊在半决赛1-0击败捷克,然后在决赛中……本届欧洲杯也许还有能战胜捷克的,但好像没人能进捷克三球唯葡萄牙了。

如果说大眼在陈述事实,那我无话可说。怕的就是他下的结论,这也是为什么有些经济学家遭人痛恨的原因。

(三)里面非常粗略地谈了谈预测和解释的区别,但没说样本数据的问题。

因为凡是拿冠军的只要在淘汰赛碰到捷克,必须赢,不赢还怎么拿冠军????淘汰赛输给捷克的怎么拿冠军啊?而冠军即使在小组赛里面也肯定要有优势得多,就好比说世界杯冠军队里面最有可能出最佳射手一样。统计学里面叫做Selection Bias(选择性偏差)。你选了盖茨家的朋友做美国家庭收入调查那还能坏得了?

但是这种诚实的废话是没用di...该调查研究的是未知领域,所选取的数据应该有代表性。如果做美国经济调查,那就应该各个州随机取一些。如果预测欧洲杯,就应该从各个队员以往表现来预测,不能说冠军队得了冠军,没意义。

家园 来给MM捧个场。

不错的系列文章啊,虽然俺还不算很懂。

关于风险,年初厚坤兄两个系列俺看得很来劲 (闲话风险之风险的古典定义闲话风险之乌龟(上)),可惜他只在河里玩了一个月,就不见了。

另,河里也有个大眼(链接出处),是位好同学。俺一开始以为老乡你在说他呢。

上了几朵花,没有宝,腹诽老铁一把。

祝贺MM嘉宾上任。

家园 我也看过他的帖子,很弓虽,多谢提醒,加了链接。
家园 【原创】牛与熊,从科研角度看股市(五)--模型的预测能力

经济学论文中的模型可以大体分为两类,第一类是真正意义上的经济学模型,有参与者的行为集合,效用函数,外生环境,然后求出假设条件下最优解。特别猛的人就全用数学语言,弄个拓扑空间,搞个随机过程,解出来的也是数学,这样的好处是一般性(general),很多类似的论题可以套用。大部分的人的模型看上去就很具体了,比如说假设某人的效用函数就是X平方,然后再接一系列的具体的方程,这个叫做应用理论(Applied Theory),好处是容易理解,也容易和实践相结合来应用数据。和它最直接相联系的就是校准(calibration),通过具体模型推导出显示数据和假设参数之间的关系,然后倒推出参数应该是什么样的。

例子:根据理论,假设个人的相对风险厌恶参数是A,那么如果给定100元,此人会把100乘以(1-A)元去买彩票。那么通过调查,甲愿意用十块钱去买彩票,那么它的风险厌恶参数就是0.9

以上的模型又被统称为结构模型(Structural Form),就是有经济理论支持的模型。与它对应的就是简化(?)模型(Reduced Form),基本上就是靠数据说话,偏重统计方面

例子:y = b * x + e

用最小二乘法算出x对y的影响(b值),暂不考虑它们的意义。

鉴于经济学不是科学,而是艺术,structural和reduced form两者并不矛盾,而是术业有专攻。Structural模型更多地能够帮助人们透过现象看本质,研究是什么造成了我们所观察到的现象,我们称为“解释”。Reduced模型除此之外还能帮助我们来判断未来究竟会怎样,称为“预测”。二者并非没有交集,只不过现实的研究更倾向于Reduced模型善于预测,而Structural模型作解释更加让人信服。

宏观经济预测在70年代和80年代遇到了很多问题和责难。滞胀+石油危机使得预测失灵。也由此带出来“卢卡斯批评(Lucas Critiques)”,大意应该是模型不是一成不变,随着社会经济发展,各种变量之间的关系在不断改变着,所以使用模型需要考虑参数的不确定性。以前数据估计出来的参数现在未必好用。在时间序列里面称作结构破裂(?)“Structure Break”。大家都知道菲利普斯曲线(失业率和通胀率之间的权衡),但是80年代菲利普斯曲线整体移动了,原来的参数假设就不灵了...

而且这些宏观预测模型大多是非常复杂的结构模型,一个简单的RWI-商业周期模型就需要41个随机方程和86个定义方程,这还叫作中等规模模型!计量经济学里有一个重要的准则就是Parsimony,意思是简化。因为虽然多参数模型可以更好的拟和数据,但是预测能力会大打折扣。而且我们对宏观经济的把握往往是偏颇的,这么多方程如果有一个变量出问题或者有些东西忘掉了,连锁反应会把整个模型毁掉。客观地说,经济管理版里面安德森也好,虎哥也好,子玉也罢,对宏观经济的把握往往来源于模糊的人类逻辑,他们是写不出来整个经济系统方程的。但正是由于有模糊逻辑,所以才会看到大方向上的问题而不拘泥于小数点后几位的数据。

综上,我们说,好的预测模型一要有稳健性,不会因为些微的参数变化而产生蝴蝶效应;二要有学习性,要回通过新数据的加入而能来逐渐修正自己。

稳健性的问题暂时用时间序列来解决,而学习性我们用贝叶斯的方法来实现。

元宝推荐:老马丁,
家园
家园 赞地痞流氓

正如千里烟波mm的公告所言:

金融计量+地痞流氓

搞学术和讲义气不冲突!

稳健性的问题暂时用时间序列来解决,而学习性我们用贝叶斯的方法来实现。

时间序列是什么意思?如何解决稳健性的问题?愿闻其详。具体一点,千里烟波同学能否“稳健”地解释菲利普斯曲线和奥肯定律?

家园 看在你是大佬的份上,下一贴专门回答你的问题
家园 真是讲义气

我不是大佬,用米高扬同志的话说,我只是带着耳朵来的……

家园 no flower no human sex~

先花后看:P

家园 说得没错,

个人的能力是不可能完全考虑到完整的经济系统方程的,能有个一般均衡的模型就不错了。大多数经济学家也就只是考虑局部均衡。请继续,花。

家园 现在看来,他们有可能是对的。
家园 运气好不如RP好!

恭喜:你意外获得【西西河通宝】一枚

鲜花已经成功送出。

此次送花为【有效送花赞扬,涨乐善、声望】

家园 这里的意思是说curve fitting吗?

因为虽然多参数模型可以更好的拟和数据,但是预测能力会大打折扣

稳健性是不是就是robustness?学习型是adaptive还是self-learning?

全看树展主题 · 分页首页 上页
/ 15
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河