五千年(敝帚自珍)

主题:【原创】人工智能的突破临界点 -- 达萨

共:💬239 🌺1128 🌵1
全看分页树展 · 主题 跟帖
家园 葡萄你说了这么多,实际是解决数据孤岛的问题。

数据孤岛问题在国内由来已久了,这个和大数据一点关系都没有。中国社会,自我分割和老实人吃亏的问题,让各个部门和衙门之间都是牢牢的把握自己那点数据。所以你想以人查房,或者凭借一个社会安全号走天下的美国式生活是做不到的。你需要面对各种证件,证明和介绍信,这些都是数据拥有部门的权利。

从你的分析来看,只是把这些数据整合了,然后可以互通(能做到这一步,中国社会就进了一大步了)。举个简单的例子:社保和医保就可以全国互通了,养老工资也可以全国统一兑付了,你以后结婚,迁户口报户口不用在拿一堆资料,北京上海落户的表格也不用填了。这些并不是大数据,这些只是把孤岛直接建立了桥梁,并联在一起,甚至有些就是把某些东西数字化了(我发现魔都某些地域的户籍信息还是登记造册的,并不能电子化查阅,这可是政府信息化比较高的魔都哦^_^)。

真正的大数据是建立在全维数据自动化采集(或者接近全维度)和完备的数据建模上并且要做到自动化在线分析,你采集到数据越完备,模型设计的越精巧,计算能力越强。这里有三个难点,大数据自动采集(量太大无法收工录入),模型的设计需要很多专业知识积累(有经验的老师傅和无敌的程序员),在线自动化计算(超级计算机和云计算集群)。

举个简单的例子,有一年参加美国大学生数学竞赛(暴露年龄了),有道题就是预测非洲一个区域大象的承载量然后决定大象的计划生育手段和数量。计算生育率,生育周期并考虑固定的死亡率,是有现成的数学模型的,可是这个做出来的东西准么?大家想想估计就一笑而过了,实际情况是做得最好的队伍,考虑到象群迁徙,天气,疾病,偷猎等多维度信息,建立了一个高维模型,其预测和过往数据非常吻和。那就这个例子来说这个模型的大数据版,就是建立在数十万平方公里的土地上的各种传感器数据采集:气象,摄像头(象群识别和人类识别),大象身上的信标,并且后台有一个阵列可以存储历史数据,并作实时的分析和展望,做出分析和决策建议。

通宝推:钩河木,xtqntd,jent,舞动人生,
全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河