五千年(敝帚自珍)

主题:关于大数据 -- jent

共:💬18 🌺118
全看分页树展 · 主题 跟帖
家园 这个话题很好,虽然不是内行,也来说几句

我的个人看法,乱哄哄大数据嘈杂声中间,有非常多的胡扯,但是也的确有实实在在的科学和工程的进步,也的确有若干商业价值。现在并没有人来做很好的梳理,恐怕现在也并不具备做很好梳理的条件,还是需要等待事情有所发展,有所沉淀后,才有可能看清楚什么是真的,好的,什么是胡扯,什么是骗子,等等。

不过,还是有若干可以现在看清楚的事情。我来列举一二。

1. 这段话值得再次引用:

2007年一月11日,Jim Gray,微软的资深科学家,在给美国国家研究委员会的报告中,提出了一种新的科学研究范式:密集数据里的科学发现。这是自观察,实验,计算机模拟后的又一种科学研究范式。

的确,很多人认为,新的科学认知范式正在形成,那就是基于大数据的认知范式。但是,仍然有可能这个所谓的新的认知范式,其实不过是旧的认知范式以新面孔出现而已。是否如此,需要很认真的讨论。究竟这个大数据范式仅是已经用了很多年的统计范式的一种扩大化,并没有实质性的新东西在里面,还是这个大数据范式的确是一种新的范式,和传统的统计范式很不同?至少对我而言,这个并不清楚。有待观察。

但是,不管怎样讲,无论是否为全新的范式,大数据的确提供了一个强有力的手段,可以在这个基础上展开科学活动。当然更多的是开展商业活动。这点是清楚的。

2. 还有一点比较清楚的,那就是,这个工具并不可能有真正的智力,如下面引言所预测的那样:

换句话说,人类有了一种新的知识获取的方式。而这个方式是自生产的:数据,数据中获得知识,知识本身就是数据,从数据中再获得知识,。。。以此递进,这是一种自生产,自组织的,自我成长的,知识体系。

3. 还是引用一段:

互联网上每秒钟都在产生海量的信息流动以满足各种应用的需求,而这些海量的信息流动就是知识的流动与生产,并进一步产生数据,知识,这已经就是一种新的智能的存在。

我们应该分清:信息,数据,知识,智能。我对你的这段描述持反对意见。信息不能自动产生知识,同样,知识不能自动产生智能。怎么从信息产生知识?这是非常困难的问题,没有谁有比较明确的解答。同样的,知识到智能也是如此。因此,可以看清楚的就是:必须要有合理的社会结构,才能做好处理信息,进而把信息转化成正确的知识,然后试图用更新更多的知识来提升整个社会的智能。不过,最后的这一点,最好持一些悲观态度。看看社会如何对待污染问题,就知道社会的智能和知识的积累有多遥远。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河