五千年(敝帚自珍)

主题:【原创】牛与熊,从科研角度看股市(一)---从一篇小论文谈起 -- 千里烟波

共:💬219 🌺470
全看分页树展 · 主题 跟帖
家园 牛与熊,从科研角度看股市(七)---我爱贝叶斯

贝叶斯(Bayesian)是一种方法,应该起源于英国数学家Thomas Bayes。和它对应的方法叫做Frequencist,不知道该怎么翻译。它们的区别在于,对于一个模型, Frequencist 认为模型参数是固定的,我们该做的是用合理有效的方法来估计参数;而Bayes则认为不同的人对参数的认识是不一样的,对我们来说参数本身就是随机的,通过本身的认识加上数据事实来得到更深一步的认识。

绚烂多彩的经典计量经济学基于固定参数假设产生了很多聪明绝顶的研究者和丰富的方法技巧,各种估计方法大家可能都听说过一些,最简单的有最小二乘法(LS),最大似然法(MLE),稍微陌生一点的有矩估计(MM),一般矩估计(GMM),更专业一点的可能听说过假最大似然法(Psuedo-MLE),模拟矩估计(SMM),模拟似然法(SML)。而在有趣的实践工作里面,经济学家们发现了很多克服具体问题的具体方法,比如说大名鼎鼎的变量测度问题measurement error是说如果解释变量不准确(比如说人口收入调查,受调查者经常四舍五入)会造成估计偏差,而这个计量问题的发现和解决者是货币主义者,诺奖得主弗里德曼。

由于经典计量方法认为正确的参数是唯一固定的,所以在不同的假设下需要各种检验方法(Test)来看一下原假设是否合理。经典的t检验,F检验,Wald检验,最大似然检验,score检验层出不穷,如果再加上五花八门的非参数估计和非参数检验,那么就更加五彩缤纷。成百上千的聪明人聚集在计量经济学周围添砖加瓦,开会的时候看过Hansen几个人在主席台上一坐,几个秃头闪亮夺目,竟相辉映。

贝叶斯呢?以前好像异端邪说一样被攻击。我觉得类比的是愤怒的手艺人对珍妮纺织机的狂暴。贝叶斯方法就是两个字----简单。稍微具体一点,假设你觉得天鹅一半是黑的,一半是白的(这叫做先验分布 Prior)。然后抬头观看,一共经过了10只黑天鹅,5只白天鹅(这是我们说的数据),你可能会觉得三分之一是白天鹅,三分之二是黑天鹅(后验分布 Posterior)。经典计量frequencist只利用数据(你所看到的天鹅),但是贝叶斯则会充分利用你的认知,如果你是动物学家,做过天鹅调查,特别确定天鹅就是一半一半,那么不论你看到的是什么你都会说一半一半。(我是专家,不用调查)所以说:Bayes method is the official way to add beliefs

很多人会问,为什么要用人的主观假设?我们不是说实事求是么?

我的回答是,人的主观认识从哪里来?还不是从历史事实和实践经验得来?一切皆有缘由,我朋友的老板说过:“there should be reason”。而且,一无所知也是一种主观认识,这种主观认识和数据的结合的结果是和经典理论一致的。

贝叶斯最大的好处是可以去掉参数的不确定性。经典理论中我们假设参数固定,那么估计出来的参数永远不可能是真的,总要有或多或少的误差,用估计出来的参数搞预测多少会有偏差。这就叫做参数估计的不确定性(estimation uncertainty)。

相反的,贝叶斯方法得到的是一个完整的后验分布,我们已经假设参数是随机的,所以你会得到一个具体的,精确的参数分布,不论想算什么,理论上都应该可以算出来。所以理论上没有预测不确定性。

再举一个例子,时间序列里面有一个很重要的部分是单位根检验。大意说就是在研究时间数据之前需要看一看这些数据是否平稳(stationary)。因为平稳与否会大大地影响分析。但是从贝叶斯角度来看,无所谓!!!

贝叶斯的基本工具就是一个贝叶斯公式。但是魔鬼在细节里面,贝叶斯最困难的是后验分布(也可以叫做条件分布)的计算,所以也七扭八歪地产生了蒙特卡罗Monte Carlo,吉本斯Gibbs,Metropolis-Hastings等等数值计算方法。

开始的经济学贝叶斯方法集大成者应该是Zellner。后来有Koop, Kim, Nelson等等。我最喜欢的是Geweke,人家那科研做得又巧妙,又直接,还不失技术性,而且文笔还特别好,看他的书和论文让人不觉得拍案叫绝。

总结一下:

1、贝叶斯方法比经典方法理论上简单,特别易于理解。所有贝叶斯模型的理解方式都是一样!!

2、贝叶斯模型需要主观想法;

3、贝叶斯的任何结果都是精确的,没有估计误差;

4、贝叶斯方法的难点是算法

元宝推荐:老马丁,
全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河