五千年(敝帚自珍)

主题:【商榷】对被明月兮佩宝璐河友的评论有感 -- PBS

共:💬11 🌺10 🌵1
全看分页树展 · 主题
家园 【商榷】对被明月兮佩宝璐河友的评论有感

被明月兮佩宝璐河友对我的《人民日报》特约评论员有话说:救市无用一文的答复,我觉得很有意思:

被明月兮佩宝璐河友说“虽然我长线看空,但一般楼主出现的时候基本会有日线级别的反弹。你自己有没有意识到呢?”

结果是周一中国股市大掉8%以上,是9年来最大跌幅。

这样看来,我的出现并没有造成日线级别的反弹而是大跌嘛。所以PBS在西西河的发帖同中国股市的涨跌关系应该是不大的。

被明月兮佩宝璐河友提出的看法是一种归纳法,可惜的是其历史数据的范围太小,以至于其预测出现极大的偏差到了可笑的程度——如果河友以我的发帖作为股市变牛/变熊的指标,那么本周一就输得可以去见外婆的。

现在讲个寓言故事:

从前,有一头不在风口长大的猪。自打出生以来,就在猪圈这个世外桃源里美满地生活着。每天都有人时不时地扔进来一些好吃的东西,小猪觉得日子惬意极了!高兴任性时,可在猪圈泥堆里打滚耍泼。忧伤时,可趴在猪圈的护栏上,看夕阳西下,春去秋来,岁月不争。“猪”生如此,夫复何求?

根据过往数百天的大数据分析,小猪预测,未来的日子会一直这样“波澜不惊”地过下去,直到它从小猪长成肥猪……在春节前的一个下午,一次血腥的杀戮改变了猪的信念:尼玛大数据都是骗人的啊……惨叫嘎然而止。

我们知道,针对数据分析,无非有两个方面的作用:(1)面向过去,发现潜藏在数据表面之下的历史规律或模式,称之为描述性分析(Descriptive Analysis);(2)面向未来,对未来趋势进行预测,称之为预测性分析(Predictive Analysis)。把数据分析的范围从“已知”拓展到了“未知”,从“过去” 走向 “将来”,这是数据真正的生命力和“灵魂” 所在。

那头“悲催”的猪,之所以发出“大数据都是骗人的啊”呐喊,是因为它的得出了一个错误的“历史规律”:根据以往的数据预测未来,它每天都会过着“饭来张口”的猪一般的生活。但是没想到,会发生“黑天鹅事件”——春节的杀猪事件。

黑天鹅事件(Black Swan Event) 通常是指,难以预测的但影响甚大的事件,一旦发生,便会引起整个局面连锁负面反应甚至颠覆。

其实,我们不妨从另外一个角度来分析一下,这个搞笑的小寓言在“黑”大数据时,也有失败的地方。通过阅读知道,舍恩伯格教授在其著作《大数据时代》的第一个核心观点就是:大数据即全数据(即n=All,这里n为数据集的大小),其旨在收集和分析与某事物相关的“全部”数据,而非仅分析“部分”数据。

那头小猪,仅仅着眼于分析它“从小到肥”成长数据——局部小数据,而忽略了“从肥到没”的历史数据。数据不全,结论自然会偏,预测就会不准。

要不怎么会有这样的规律总结呢:“人怕出名,猪怕壮”。猪肥了,很容易先被抓来杀掉。这样的“猪”血泪史,天天都上演的还少吗?股民套进去了就是宰杀的时候了。上面的小寓言,其实是告诉我们:数据不全,不仅坑爹,还坑命啊!

PBS本人不参与证监会/央行的政策决定,只是阅读历次人日报有关股市的评论文章后做一些感想评论而已。但是被明月兮佩宝璐河友看到我的出现而作为炒股的数据分析/决策依据,则是太轻率了。

通宝推:草木友情,
全看分页树展 · 主题


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河