五千年(敝帚自珍)

主题:【原创】大数据与郑国渠 -- zw

共:💬44 🌺246
全看分页树展 · 主题
家园 【原创】大数据与郑国渠

大数据与郑国渠

这两年,国内大数据貌似太阳能、风电样被炒的很火

贵州还开办了大数据交易中心,也许是全球第一个

国内政府在经济乏力,科技相对落后的情况下,强行推进大数据 ,甚至提升到国家战略层面,却有可能陷入欧美国家的战略陷阱当中。

春秋战国的郑国渠,美帝的星球大战,都是成功的经典战略欺骗案例,还有所谓的千年虫、.com科技泡沫经济,都历历在目

一个国家的资源是有限的,战略重点也是有限的,不可能到处重金投入

国内前几年火爆的太阳能、风电新能源,目前都处于行业性崩溃,而且,在短期内,也许20-30年内,甚至50年,无法恢复元气

由此,耗费的资金、人才、资源,只能是全民买单。

日本九十年代强推第五代电脑:人工智能电脑,方向错误,越努力越失败,今天的结果是,整个日本国家的IT产业崩溃,

国内政府强推大数据,提升为国家战略的另外两个“潜在”考虑,可能是:

::基于大数据、信息科技的新型“计划经济”,个人对经济不熟悉,但直觉上觉得不靠谱,至少目前没看到有这方面的理论体系,而成熟的理论体系,是项目成功的基本要素。

有了成熟的理论体系,未必一定成功,没有,绝对是失败

::建立类似1984的社会管理体系,这个更加不靠谱,网络危机公关的经典手法就是,采用大量的关联信息,淹没负面新闻。

一组(10台)电脑,每天可以发布上亿条信息(包括填写验证码),可以模拟千万级的用户数据。

(顺便说一句,个人是国内首家4A级网络公关公司的联合创始人之一,服务过150+国际500强,包括微软、奔驰、西门子)

淘宝、微信、app市场的好评刷单,目前高达50-80%以上,这么多的垃圾信息,将真实数据完全淹没.

政府其实也知道这点,所以提出了网络、手机实名制,以及目前的一卡通,希望能够强行绑定信息发布主体。

可是,即使20-30年后,一卡通完全推行,还是无法解决这些问题,至少,已经运行了十年的支付宝,目前的假号,才几元一个,最严密的银行卡也不过200-300元一张。

更何况,数据并非越多越好,有时候数据越多,精度更低,这个数学上称为:龙格现象

:实战测试,数据越多,反而会影响精度。目前个人数据分析的一个重点,就是“小”数据。老子《道德经·第六十三章》有云:天下大事,必做于细。

我在一个blog上面也找到了数学支持,龙格现象,http://zh.wikipedia.org/wiki/龙格现象

大数据其实并非新科技和高技术,其核心与本质,不过是数据分析,尤其是聚类分析

这点,国内武汉华中科大邓聚龙教授,1982年提出灰色系统理论、灰色数学当中灰色聚类、数据归一化算法,目前依然是最好的分析模型之一。

大数据分析的核心,是统计分析、聚类分析,以及各种各样、五花八门的分析模型。

这些分析模型与算法,大多基于传统的人工智能研究,什么啄木鸟算法、萤火虫算法、蚁群算法,大部分都是经验性、实验模型,缺乏系统的理论支持。

这些模型,全部都是高次多元的,而三元以上的n次(n>3)模型,除了特殊的经验公式,在数学上是无解的,至少目前没有一个通用的求解算法。

对于大数据这种新产业而言,全世界都在摸索,政府做决策,必须进行调研和试点,而不是听过几个专家,尤其是某些协会的人员胡说几句,就作为国家战略操作。

大数据产业,从概念到目前,不超过五年,因此试点是不存在的,以大数据作为核心战略,不要说国家,就是大企业,在全世界至今都没有一个成功的案例。

至于中国协会专家的意见,大家完全可以忽视,我的首部书籍,第二作者,现在就是中大的副院长,博导,可水平,也就哈哈而已。

关于大数据、高频交易和人工智能,

个人的基本观点:凡是无法通过“足彩数据”进行实盘测试的方案、算法,都是在耍流氓。

大数据并非无用,可最多不过成立3-5家类似联想级别的公司即可,完全不是国家级项目,更别说国家战略级项目。

作为国家战略,不管成功失败,我更担心是郑国渠效果。

郑国渠并非没用,时至今日,依然在造福国民。

郑国渠,从战术讲是个成功的项目,耗费了秦国大量战略资源后,从战略讲,属于基础建设,反而增强了秦国的国力。

相比郑国渠,大数据的的核心硬件服务器、软件、数据库,都要进口,而硬件服务器的折旧比汽车还快,最前沿的硬件,基本3年就基本价值归零,就是一堆废铁

因此,目前各地政府的批量上马数据中心、计算中心,投资回报更加令人担心,一个3-5年,回报率无限归零的项目,而且投资总额分分钟过万亿。

也许,大家会认为,这么多资金,上万亿砸下去,至少在人才方面会有收获,会培养一支自己的团队。

这个,也许,不过意思不大。

日本全民动员的第五代电脑,目前也有些国际上知名的IT项目:比特币、ruby语言,可是对日本IT产业的整体盘,没有多少帮助。

希望,太阳能、风电等新能源方面的失败,能够让政府国家谨慎

sorry,

因为在几个大数据群里,发现政府居然成为大数据的主力,有感而做,初稿未对郑国渠细细考究

理科生的坏习惯,不过不影响大局,谢谢几位指出的网友,不过这个是细节

希望大家多从主题方面展开讨论

将大数据比做郑国渠,的确有些不恰当,至少郑国渠现在依然在造福国民,而大数据的投资,数年后,只是一堆废铁

至于其中的团队,政府公务员,能够有什么人才,最好也不过是一群技术官僚,可能连技术两个字都称不上。

大数据项目,其实更接近日本九十年代的第五代电脑:人工智能计划

至少,当年、和现在的富士,是极少数能够制造商业级小型机的企业,包括CPU这点,国内目前尚未这个级别的企业

天河系列,的确取得了不少成果,特别在巨型级的架构方面,不过,这个是不计成本的国家投入,商业化没有多少竞争力

mit的学生,当年用ps游戏机cell芯片,现在用gpu显卡,攒的计算集群,配合linux,对于企业而言,性价比可能更高

把大数据和日本的第五代电脑对比下,大家会感觉更加贴切,不过,现在,谁知道小日本的这个东东?

大数据的通道是互联网,数据、信息是一次性消费产品,可以零成本传播、复制,互联网的核心只有两个字:free(免费)+open(开放)

积累的数据,一个连pm2.5、耕地面积,都是国家机密的政府,再多的数据,缺乏流动与共享,也是死数据,有意义吗?

本文是以下blog的补充,

《大数据和高频量化交易》 http://blog.sina.com.cn/s/blog_7100d4220102vkai.html

《大数据观点补充》 http://blog.sina.com.cn/s/blog_7100d4220102vkdb.html

《大数据与郑国渠》 http://blog.sina.com.cn/s/blog_7100d4220102vkqd.html

《大数据与黑天鹅等》 http://blog.sina.com.cn/s/blog_7100d4220102vkxa.html

------

关于大数据和人工智能,我的基本观点是:

凡是无法通过“足彩数据”实盘测试的方案、算法,都是在耍流氓。

这就是大数据、人工智能的图灵测试!

为什么?

关于这个问题,就价值十个博士学位。

看不懂这句话的,还是少玩大数据、人工智能。

Talk is cheap,Show me the code!----Linus(linux 发明人)

足球比赛,从数学角度而言,是最简单三选一,胜、负、平

而真正的大数据分析,是在成千上万种可能中,选择最接近的进行匹配,

连最简单的三选一都搞不定,来谈难度、复杂度高数百倍、上千倍的n选一(n>1000),是不是有些不靠谱

2014世界杯 对于大数据 人工智能 是个分水岭 是元年

微软 谷歌 百度 都有相关的项目 胜率<50%

为什么?

这个也可以作为,这个观点的背景与补充。

----

::西西河网友回复

“个人的基本观点:凡是无法通过“足彩数据”进行实盘测试的方案、算法,都是在耍流氓。”

这个标准,是高到永远不可能实现的标准!

很简单,真做到了,你不只是发财了,而且是彻底推翻了从帕斯卡开始的无数超级头脑+严密逻辑得出的概率论这一门数学理论!推翻一门理论在科学上屡见不鲜,但在数学上还未发生过。

::zw

这个标准并非高不可攀

图灵测试,并非要求人工智能达到爱因斯坦的IQ才ok,目前,人工大脑,有小学生的水平就已经是最顶尖的了。

目前人工智能最多大约相当3-5岁的儿童,基于人工智能的BI商业智能,和建筑在此二者之上的大数据,也只有3-5岁的智能,所以说大数据只是概念产品阶段。

足彩是最简单的三选一模式,随机盲选的概率都超过30%,如果一个大数据分析模型,连随机概率都无法超过,只能说这个模型不靠谱,

当然,前提是必须稳定,百度的世界杯18连胜,只能是学术界的一个笑话,连百度自己现在都不好意思提

---

秦国是全民公敌 ,像现在的美帝

就事论事,叽叽哇哇就没意思了

Talk is cheap,Show me the code!

------------

通宝推:bluestarry,舞动人生,迷途笨狼,海峰,

本帖一共被 5 帖 引用 (帖内工具实现)
全看分页树展 · 主题


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河