五千年(敝帚自珍)

主题:【原创】小虎纵横谈(10)虚实(下) -- 万里风中虎

共:💬192 🌺600
分页树展主题 · 全看首页 上页
/ 13
下页 末页
            • 家园 这鸟理论

              物理是拿数学和公式说话的

              那个原理后面不是能反复验证的

              股市他行么?

              照他这么搞

              这世界是多神的

              央行,证监会,社保基金

              分别是上帝,释迦摩尼和真主

              都可以翻云覆雨

              • 家园 这个世界只要有人的因素,什么理论都会有问题。

                人是会反馈思考的,所以以前的经验会对以后的发生的事情有影响。

                但,人的活动也有统计规律,比如波浪理论等。但一旦理论被人用了之后,可能就会出现偏差。

      • 家园 社保在hk减持银行
        • 家园 是啊

          要不是看到老虎明确指示,咱早就清仓了,现在只有盼解放军了。

          下面这个估计是拾人牙慧的,到天涯去吧。

          喜欢看 2010-12-07 04:57:27

          12-7大盘继续震荡,煤炭,有色蠢蠢 ( ↑12 ↓0

          只有散户彻底失望和绝望的时候才是大行情开始的时候。估计1~2周后行情就来了。

          喜欢看 2010-12-27 20:45

          割在地板上,实在没什么好害怕的,俺也实在不想说什么了,形势好得不能再好。。。

    • 家园 虎大模型计算推演

      看了虎大的贴《虚实(下)》,很有启发。决定自己推演一下虎大模型的计算。经过折腾,有了点眉目,贴出来供河友自行演算。

      1)数据。

      首先你得有数据。饿没有Thomson One Banker的帐号,数据得自己想办法。其实很简单,任何看盘软件都有数据导出功能。你只要选好范围,导出数据就可以了。

      我用的是通达信,然后导出了600519从09年12月24日到10年12月24日的日线数据,保存为Excel格式。

      2)加权均价

      虎大在帖子里提到成交量加权均价可以这样计算

      成交量加权均价=对于所选日期范围对(每日收盘价X每日交易量)求和 除以 所选日期范围的总成交量。

      这个在Excel里很容易作。 我算出的600519的成交量加权均价是162.1463869。这个结果和虎大的计算有一些误差。误差的来源还没有搞清楚,也许是复权数据来源的差异造成的。

      3)筹码分布估计

      虎大帖子中使用了一种用来估计随机变量概率密度函数的算法来估算筹码分布图。大家如果感兴趣,可以去Google"Kernel Density Estimate"。大致原理是对于某随机变量的每一个样本点用一个高斯分布(正太分布)(就是所谓的Kernel)来代替,然后把所有样本点的高斯分布进行叠加来作为该随机变量的概率密度估计。具体计算要用到专门的统计软件,但是也有替代方法。替代软件就是Gnuplot 4.4。Gnuplot从4.4版开始在数据平滑功能上引入了Kernel Density Estimate特性,也就是说Gnuplot也可以进行这个概率估算。

      那样就简单了,把导出的Excel文件里的数据整理成包含两列数据的文本文本。第一列是每日的收盘价,第二列是权重(weight)也就是每日交易量除以总交易量。把这个文件命名为600519.dat。

      然后在Gnuplot中一条命令就能产生KDE分布图

      plot '600519.dat' using 1:2 smooth kdensity

      然后生成如下图

      点看全图

      外链图片需谨慎,可能会被源头改

      怎么样?和虎大的图一样吧?:)

      关键词(Tags): #虎大模型计算推演(不大不小)
      • 家园 又翻了一遍以前的帖子,才发现虎大用的是stata。。。

        我现在也在学着用。

        用来做kdensity的分布图很强大,速度也很快。

        其他的一些统计工具我也用过一下。

        spss没有Kernel Density Estimate。。。

        SAS盗版太费劲,而且也不会用。。。

        Matlab中倒是有Kernel Density Estimate,可惜不能加权,只有一个参数。好吧,其实是我不会用。。。

        stata就才几十MB,我共享了一个外链出处

        数据我还是用的excel,毕竟简单方便。反正是计算一两年的数据,够用了。复权是自己算的,但是结果和虎大还是有差距,跟老兄倒是挺像的。

        把需要计算的数据直接粘贴到stata中的Data Editor中就行了。权重也不需要提前计算,只要有成交量数据就行了,kdesity中有权重的选项,一看便知。

        感谢兄弟!Gnuplot是个不错的咚咚,可惜每次导入导出的整理数据太累了。。。

        我没有数据源,每次都要从通达信导出,所以在纠结要不要全部下载之后批量导入mysql弄个金融数据库。。。

        虎大的宝贝很多,还有时间序列、相关系数之类的。

        一起努力山寨吧。

        • 家园 我用stata和gnuplot出来的图还是有点区别。

          把通达信出来的数据拷贝到data editor里面之后,用graphics里面的smooth and density中的KDE,那个kernal function 该用什么啊?用默认的?epanechnikov?

          还有那个halfwidth of kernal用多少呢?

        • 家园 偶有向前复权全日数据

          但是csv只会一支支导入,不会批量

          • 家园 批量没有必要

            自己订制一个数据库当然更加精确。但是消耗的时间负担不起。除非是计算全社会平均成本,否则用通达信的导出就可以了。这个分布主要是一段时间内的静态数据,所以还要再结合均线的形态。

        • 家园 stata 可以直接导入通达信数据

          把通达信导出的txt数据存入文件 (比如 E:\finance),然后用下列命令就行了

          cd E:\finance

          insheet using 股票代码.txt

          接下来就可以算kdensity了

          把命令保存在do文件里

          每次执行一次do文件,会更方便

          如果使用 三一, 兖煤,云南白药, 贵州茅台四个股票计算相关系数, 当相关系数变为负之后的三到四天,一般会有一次大跌,最近几次这个指标都很灵的

          与君共勉

          • 家园 感谢与商榷

            多谢。确实是很方便的办法。我关注的股票比较少,基本就是眉飞色舞,喝酒吃药八个大字。一直傻乎乎的自选导出。而且这个软件我也是刚开始用。目前还没有做过相关系数的分析,kde还没有明白呢。。。根据在山口山中得到的经验:在一个天赋没有升满的时候,不要去开新的天赋,以免延误学会大招的进度。说白了就是先学个一招鲜。。。

            其实大概十年前,指南针的陈浩就搞了成本分析,并且有同名的著作来讲解原理。只是具体的技术细节没有透露。指南针很贵,而且限制销售。但是据圈内人说,确实有效。据说也有免费体验版,但是我不敢用。。。

            现在已经具有了这样的技术条件,所以我打算DIY,用自己整理的数据和绘制的图像,很放心,很淡定,妥妥滴。

            需要商榷的也就是数据问题。我以前的数据都是手工在excel中复权的,以前制图用的gnuplot,结果图形接近。如今鸟枪换炮貌似图形基本一致了。对此我很欣慰。。。

            通达信导出数据时可以选择“精确复权”,确实还算精确,可惜仅仅限于k线所包含的4个价格。成交量与成交额仍然是没有复权的,而我计算的每日价格是:当日成交额/当日成交量(我可以很肯定地说虎大的数据就是这么算的,所以最高与最低价格与通达信的不同)。所以这个误差就很大了。。。因此,面对长期的数据或者最近拆股的(比如三姨),就必须要自己动手了。。。

            请问你是如何处理的呢?

            另外再说一下,虎大对002128的数据有一点点误差

            我们下载了从2009年12月24日到2010年12月24日以上4只个股242个交易日的股价进行计算。

            sum sz002128 [aw=v002128]

            Variable | Obs Weight Mean Std. Dev. Min Max

            -------------+-----------------------------------------------------------------

            sz002128 | 239 1404494.5 22.91174 2.654201 16.24 28.32

            kdensity sz002128 [aw =v002128], gaussian

            其实应该是240个交易日,但是这个问题不大,方法应该是一样的。自家山寨的数据,还是有一些差别,不过都在分这个级别可以忽略不计。

            • 家园 成交额

              复权前后的成交额不变,所以我用 成交量=成交额/复权后的价格 来做权重

              • 家园 个人认为

                个人认为。如果分红,成交额也要变。但是,一般变动比较小,可以忽略。所以要感谢A股分红少。。。

                只拆股不分红,最适合用你的这个公式。

                那么你的价格怎么来的呢?

                k线的那四个相加/4,求出来的平均?

                如果这样也挺好,简单方便。虽然是当天的算术均价而不是当天的真实均价,但是好在计算速度快。

                我这样手动复权太累了。。。虽然比较精确但是性价比不高。。。

                自己炒的那几个没问题,但是有人来问几个别的就手忙脚乱了。。。

                • 家园 就是复权之后的价格

                  我一般用当日收盘价,如果想更精确可以用分钟图或者15分钟图,成本分析只是给你一个大致的区间,用当日收盘价精度已经够了,多注意分时图形,结合着看估计效果更好一些

分页树展主题 · 全看首页 上页
/ 13
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河