五千年(敝帚自珍)

主题:茗谈(125)再说“航空军”:强-6丙 -- 本嘉明

共:💬102 🌺361 🌵2
全看分页树展 · 主题 跟帖
家园 这两者应该是相辅相成的关系

最典型的就是万有引力定律。第一步,观测者积累出行星运行数据;第二步,多普勒从大数据里边总结出三大定律;第三步,牛顿以多普勒定律为基础总结出万有引力定律。

大数据完成的就是前两步,而且绝对不是电脑能代替人干活。因为像“所有行星的运行周期的平方与轨道半长轴的立方之比是一个常量”这种复杂点的关系很可能是现有的大数据技术处理不了的,还需要人去试错。这还是自然科学领域。社会科学里边影响因素和干扰源要比这个多的多了。即使实用了也很可能是以前忙总做的那个课题的效果:费了半天劲做出来一个实际上大家早就知道的结论。

起码就目前看,大数据的故事大都属于自卖自夸。但是,让我比较差异的是微软预测赌球准确率奇高。我觉得即便是两个球队隔几天再次相遇也未必仍然是这个结果吧?技术水平差不多的google的预测就没那么准。我觉得这说明了两个问题:第一,真正起决定性作用的未必是技术因素,很可能是选用了什么变量才是两者差距所在,而这恰恰说明了逻辑的重要性;第二,也有可能就是平均60%的准确率加一点狗屎运。文科生也只能分析到这个程度了,还是期待理工科学生深入分析一下啊。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河