主题:【原创】牛与熊,从科研角度看股市(一)---从一篇小论文谈起 -- 千里烟波
对于异方差、Multicollinearity的解决方法能否指点一二?
呵呵,谢谢先
关于第三点,使用dummy的话,只是把模型给分离成两个小模型,一个包含哪些泡沫破裂点,一个不包括
我个人觉得这样好像好分析些
另外说到这个泡沫破裂点,我想到另一个因素,就是那个News Impact Curve是否应该考虑进去?
嗯,那个return是我的错,呵呵
花一个,楼主很耐心,呵呵
异方差用各种GARCH
共线性不怕,因为如果为了预测的话可以包含(只要别太厉害,否则影响估计的过程)。最直接的技术方法是principle component,即找出共线的变量的最佳现行组合做成新变量.
我个人觉得这样好像好分析些
结果可能会更fit curve,不过是不是研究一下这种情况发生的原因会更有趣呢?所以我说对之建模会更有意思。
共线性这个我要仔细看看
这个的解决方法我一直没有搞明白
谢谢
我能看到的资料也只是把消息的影响分为好坏两类
很期待,楼主到时候在河里讲自己正建立的宏观因素模型
楼主在八里台那年毕业的? 一个不好 有认识的可能性
呵呵
给师姐问好
嘿嘿,跳水前的临门一脚我先预订个位置
贝叶斯(Bayesian)是一种方法,应该起源于英国数学家Thomas Bayes。和它对应的方法叫做Frequencist,不知道该怎么翻译。它们的区别在于,对于一个模型, Frequencist 认为模型参数是固定的,我们该做的是用合理有效的方法来估计参数;而Bayes则认为不同的人对参数的认识是不一样的,对我们来说参数本身就是随机的,通过本身的认识加上数据事实来得到更深一步的认识。
绚烂多彩的经典计量经济学基于固定参数假设产生了很多聪明绝顶的研究者和丰富的方法技巧,各种估计方法大家可能都听说过一些,最简单的有最小二乘法(LS),最大似然法(MLE),稍微陌生一点的有矩估计(MM),一般矩估计(GMM),更专业一点的可能听说过假最大似然法(Psuedo-MLE),模拟矩估计(SMM),模拟似然法(SML)。而在有趣的实践工作里面,经济学家们发现了很多克服具体问题的具体方法,比如说大名鼎鼎的变量测度问题measurement error是说如果解释变量不准确(比如说人口收入调查,受调查者经常四舍五入)会造成估计偏差,而这个计量问题的发现和解决者是货币主义者,诺奖得主弗里德曼。
由于经典计量方法认为正确的参数是唯一固定的,所以在不同的假设下需要各种检验方法(Test)来看一下原假设是否合理。经典的t检验,F检验,Wald检验,最大似然检验,score检验层出不穷,如果再加上五花八门的非参数估计和非参数检验,那么就更加五彩缤纷。成百上千的聪明人聚集在计量经济学周围添砖加瓦,开会的时候看过Hansen几个人在主席台上一坐,几个秃头闪亮夺目,竟相辉映。
贝叶斯呢?以前好像异端邪说一样被攻击。我觉得类比的是愤怒的手艺人对珍妮纺织机的狂暴。贝叶斯方法就是两个字----简单。稍微具体一点,假设你觉得天鹅一半是黑的,一半是白的(这叫做先验分布 Prior)。然后抬头观看,一共经过了10只黑天鹅,5只白天鹅(这是我们说的数据),你可能会觉得三分之一是白天鹅,三分之二是黑天鹅(后验分布 Posterior)。经典计量frequencist只利用数据(你所看到的天鹅),但是贝叶斯则会充分利用你的认知,如果你是动物学家,做过天鹅调查,特别确定天鹅就是一半一半,那么不论你看到的是什么你都会说一半一半。(我是专家,不用调查)所以说:Bayes method is the official way to add beliefs
很多人会问,为什么要用人的主观假设?我们不是说实事求是么?
我的回答是,人的主观认识从哪里来?还不是从历史事实和实践经验得来?一切皆有缘由,我朋友的老板说过:“there should be reason”。而且,一无所知也是一种主观认识,这种主观认识和数据的结合的结果是和经典理论一致的。
贝叶斯最大的好处是可以去掉参数的不确定性。经典理论中我们假设参数固定,那么估计出来的参数永远不可能是真的,总要有或多或少的误差,用估计出来的参数搞预测多少会有偏差。这就叫做参数估计的不确定性(estimation uncertainty)。
相反的,贝叶斯方法得到的是一个完整的后验分布,我们已经假设参数是随机的,所以你会得到一个具体的,精确的参数分布,不论想算什么,理论上都应该可以算出来。所以理论上没有预测不确定性。
再举一个例子,时间序列里面有一个很重要的部分是单位根检验。大意说就是在研究时间数据之前需要看一看这些数据是否平稳(stationary)。因为平稳与否会大大地影响分析。但是从贝叶斯角度来看,无所谓!!!
贝叶斯的基本工具就是一个贝叶斯公式。但是魔鬼在细节里面,贝叶斯最困难的是后验分布(也可以叫做条件分布)的计算,所以也七扭八歪地产生了蒙特卡罗Monte Carlo,吉本斯Gibbs,Metropolis-Hastings等等数值计算方法。
开始的经济学贝叶斯方法集大成者应该是Zellner。后来有Koop, Kim, Nelson等等。我最喜欢的是Geweke,人家那科研做得又巧妙,又直接,还不失技术性,而且文笔还特别好,看他的书和论文让人不觉得拍案叫绝。
总结一下:
1、贝叶斯方法比经典方法理论上简单,特别易于理解。所有贝叶斯模型的理解方式都是一样!!
2、贝叶斯模型需要主观想法;
3、贝叶斯的任何结果都是精确的,没有估计误差;
4、贝叶斯方法的难点是算法。
或者说,没有test。
俺们行业的第三大牛曾经说过,数据够好,理论够对,线性回归就出结果。
和frequencist的教科书?比较好奇。