五千年(敝帚自珍)

主题:关于大数据 -- jent

共:💬18 🌺118
分页树展主题 · 全看首页 上页
/ 2
下页 末页
    • 家园 说到大数据,干脆来个网上的趣味问题,看看是否有新思路

      点看全图

      外链图片需谨慎,可能会被源头改

      这个图片表达的目前网上热烈讨论的趣味问题。当然,这个难度低,大家都会做。但是,计算机会做吗?显然,除非有一个比较高级的逻辑推理机,通常的计算机做不了这个题。这样的逻辑机,是有的,但是有多通用,就还是问题。我不知道现在已经很多的那些自动证明机能够做这个问题。我猜想,加以若干人工的初始化,应该是可以的,但是,完全不依赖人工,我估计,恐怕做不出来。

      那么,是否有统计的方式来做这个趣味题目?或者用大量数据的方法来做?我不知道,但是估计这样的路子是有的。

    • 家园 这个话题很好,虽然不是内行,也来说几句

      我的个人看法,乱哄哄大数据嘈杂声中间,有非常多的胡扯,但是也的确有实实在在的科学和工程的进步,也的确有若干商业价值。现在并没有人来做很好的梳理,恐怕现在也并不具备做很好梳理的条件,还是需要等待事情有所发展,有所沉淀后,才有可能看清楚什么是真的,好的,什么是胡扯,什么是骗子,等等。

      不过,还是有若干可以现在看清楚的事情。我来列举一二。

      1. 这段话值得再次引用:

      2007年一月11日,Jim Gray,微软的资深科学家,在给美国国家研究委员会的报告中,提出了一种新的科学研究范式:密集数据里的科学发现。这是自观察,实验,计算机模拟后的又一种科学研究范式。

      的确,很多人认为,新的科学认知范式正在形成,那就是基于大数据的认知范式。但是,仍然有可能这个所谓的新的认知范式,其实不过是旧的认知范式以新面孔出现而已。是否如此,需要很认真的讨论。究竟这个大数据范式仅是已经用了很多年的统计范式的一种扩大化,并没有实质性的新东西在里面,还是这个大数据范式的确是一种新的范式,和传统的统计范式很不同?至少对我而言,这个并不清楚。有待观察。

      但是,不管怎样讲,无论是否为全新的范式,大数据的确提供了一个强有力的手段,可以在这个基础上展开科学活动。当然更多的是开展商业活动。这点是清楚的。

      2. 还有一点比较清楚的,那就是,这个工具并不可能有真正的智力,如下面引言所预测的那样:

      换句话说,人类有了一种新的知识获取的方式。而这个方式是自生产的:数据,数据中获得知识,知识本身就是数据,从数据中再获得知识,。。。以此递进,这是一种自生产,自组织的,自我成长的,知识体系。

      3. 还是引用一段:

      互联网上每秒钟都在产生海量的信息流动以满足各种应用的需求,而这些海量的信息流动就是知识的流动与生产,并进一步产生数据,知识,这已经就是一种新的智能的存在。

      我们应该分清:信息,数据,知识,智能。我对你的这段描述持反对意见。信息不能自动产生知识,同样,知识不能自动产生智能。怎么从信息产生知识?这是非常困难的问题,没有谁有比较明确的解答。同样的,知识到智能也是如此。因此,可以看清楚的就是:必须要有合理的社会结构,才能做好处理信息,进而把信息转化成正确的知识,然后试图用更新更多的知识来提升整个社会的智能。不过,最后的这一点,最好持一些悲观态度。看看社会如何对待污染问题,就知道社会的智能和知识的积累有多遥远。

分页树展主题 · 全看首页 上页
/ 2
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河