五千年(敝帚自珍)

主题:关于大数据 -- jent

共:💬18 🌺118
全看分页树展 · 主题
家园 关于大数据

泼点冷水罢了。

---------------------

1,什么是大数据

大数据,是大数据文件,还是大量的数据文件?要多大,KB,MB,GB,TB,PB,EB?还是说是大范围的数据,包括文本,图像,视频。。。

至少到2014年,大数据还没有一个准确的范畴定义。这是IEEE关于大数据的特别报告集里的说法。这里的问题就在于,一个大字,每天都在变:更多的设备被应用到日常生活,每天都有超越以往所有的比特在网络产生,流动,湮灭,同样,每天都有更多的超越以往的对这些比特流的使用,应用在发生,而这样的使用,应用,又进一步产生更大量的数据流。。。

那么。就是大数据是什么?

2,大数据是各种 IT 技术发展的汇聚点

2.1,光纤通信,DSL接入,Wifi,LTE,等等等等的通信连接转换设备,越来越多的带宽,越来越低廉的价格,使得网络大数据传输成为可能。

2.2,光学技术与半导体集成电路技术使得大规模的数据存储成为可能。

2.3,各种 sensor 技术使得数据的日常获取越来越便捷。

2.4,数据库技术的长时间发展与广泛应用提供了足够的,初始的结构化数据的来源,并提供了新数据处理方式的原始脉络。

2.5,人工智能技术,包括图像视频文本的理解分析,原始数据的结构化挖掘,自然语言处理,机器学习等等等,使得从已有数据中获得新的惊喜知识成为每天都在发生的事情。

2.6,摩尔定律使得数据处理的成本越来越低廉,但是效率却越来越高。

2.7,移动通信技术使得每个人每个时刻在每个地方都在为数据的越来越大做出贡献。

2.8,网络信息检索技术,使得数据/知识的应用与分布越来越扁平化。

2.9,基于上述各项技术的发展,越来越多的应用领域得到了新的推动助力。。。

3,我们能够从大数据中得到什么?

2007年一月11日,Jim Gray,微软的资深科学家,在给美国国家研究委员会的报告中,提出了一种新的科学研究范式:密集数据里的科学发现。这是自观察,实验,计算机模拟后的又一种科学研究范式。

换句话说,人类有了一种新的知识获取的方式。而这个方式是自生产的:数据,数据中获得知识,知识本身就是数据,从数据中再获得知识,。。。以此递进,这是一种自生产,自组织的,自我成长的,知识体系。

3.1,举例而言,你问过自己下面三个问题吗?

你喜欢恐怖片么?你曾经独自去外国旅行过么?觉得去驾驶帆船好玩么?

好吧,告诉你为什么你可以问问自己这么三个问题。这是美国一个社交网站总结出来的,如果你想找能够相守一生的伴侣的话,这三个问题的答案可以作为参考。(我觉得在中国可能不靠谱)。

3.2,那么来一个靠谱一点的吧:你和女友/老婆经常吵架为了什么?钱么?缺钱么?。。。。

大数据分析结果是:不是因为缺钱,而是因为你们俩对如何花钱不一致(这不是废话么)。

4,大数据下的挑战

首先是数据安全。谁能使用,谁应该拥有,谁能够维护我们的数据,并保证这样的数据应用不会给我们带来安全上的问题?

然后是个人的隐私,你懂的

而且人工智能还不那么靠谱吧。。。连我的 l n 不分都分辨不出来

难道我们就能够依赖冷冰冰的机器,网络,和数据吗?还要人干吗?

5,毋庸置疑,大数据时代已经来到了。你我都在其中。

互联网上每秒钟都在不停地刷新上传下载流通各种数据。你知道你不是用并不意味着你不在其中。

互联网上每秒钟都在产生海量的信息流动以满足各种应用的需求,而这些海量的信息流动就是知识的流动与生产,并进一步产生数据,知识,这已经就是一种新的智能的存在。

大数据意味着统计,预测,结构化的信息随时随地都在发生,产生,应用,这是我们人类新的智能体系。

新的时代已经来了。

---------------------------

6,你我如何做?

---------------------------

投身于IT吗?去做大数据吗?

No。因为在挨踢的想挨踢得人太多了,不缺一个你,也不缺一个我。

干自己的活,让大数据为你我而服务,用大数据提升你我,用大数据改善自己的生活,推动自己的事业,仅此就足够你我忙不过来了。

一句话,认识到大数据时代的到来,站稳自己的领域,将两者结合起来,就是你我在大数据下的选择。

你我各有自己的专业骄傲的,不是么。

通宝推:空格,舞动人生,葡萄,啊凡,拿不准,鸿乾,海绵,
全看分页树展 · 主题


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河