五千年(敝帚自珍)

主题:茗谈(125)再说“航空军”:强-6丙 -- 本嘉明

共:💬102 🌺361 🌵2
分页树展主题 · 全看首页 上页
/ 7
下页 末页
                    • 家园 就技术和算法本身来讲是一样的

                      只是社会领域的数据搜集会引发各方面的问题。不过我不觉得这个会有对普通人实际的威胁:大佬们不会因为机器算出来个相关性就真金白银往里砸钱的,也不会因为它偶尔准了那么一两次就投钱的。能混到决策层的人都没有这种傻瓜。而没有投入这些发现就永远停留在纸面上,并且从反面抑制了它的盲目扩张。至于那些被重点关照的人物嘛,反正也是虱子多了不痒了。

                • 家园 你儿子是对的

                  只有相关性,是没法知其所以然的。

                  即便两事物有100%的相关性也不意味两事物间存在因果关联。

                  而要确定事物间的因果关联需要加上除了相关性以外的大量实验验证。

                  如果最终不能获得大数据中的因果关联,而只是简单凭相关性分析,那一切基于此的结论都只是流于形式罢了。

                  • 家园 那您怎么看待大数据的未来

                    当一个问题涉及成千个含义不同的维度时,我们还会有因果关系吗?

                    这个因果关系是人类可能发现的吗?

                    今天的机器学习方法,比如同一个线性模型,万能的用于任何领域。虽然效果都不错,但物理意义淡薄。您怎么看待这种趋势?

                    • 家园 在面对多个自由参量的时候

                      要发现因果关系就要困难得多。这里有一篇science文章推荐你看一下。

                      Detecting Causality in Complex Ecosystems

                      George Sugihara et al.

                      Science 338, 496 (2012);

                      文章从混沌的数据中最终挖出了数据背后的困果关系,从而把原先那些从似是而非的相关性(甚至是100%相关性)出发得到一堆不能自洽的结论全和谐了。文章所想解释的自然现象其实是一个非线性过程。

                      尽管我不是做那一块的,但是我很喜欢这篇文章,给了我很多启迪。


                      本帖一共被 1 帖 引用 (帖内工具实现)
                    • 家园 我这样看“大数据”

                      首先,这是一个“数码雨人”,具备极高的数学禀赋,但本人是个白痴。用好了,有非常好的建设意义,用到坏的地方,则非常令人恐怖。

                      Goggle翻译,就是用“大数据”,效果很好。比如你用Google把任何中文页面翻译成英文,水准很高,我看人工翻译可以终结了。等哪天“Google 英翻中”也出来,那大家不用学英语了,英语翻译,变成画油画一样,成为少数人的文雅爱好了。

                      其次,在利用这个“数码雨人”时,不论是巨兽公司还是政府,都毫无顾忌地(或是不得不)跨过红线,利用它作恶------因为你不做,别人会做------所有领袖都是这个心态。

                      第三,即便Goggle,FB等等,坚持不做恶,只是无意识地收集了普通人生活中那么多的数据,不用的时候是垃圾数据,沉淀在数据库里,一旦政府需要,商业需要,这个人被盯上了,半小时内所有相关数据被调出汇集,这个人一下子就是全裸。这是一种惊人的“清教主义化”,迫使人随时伪装,永远伪装,道貌岸然,装到死。谁会没有一点小怪癖小错失小暗恋什么的?所有人的弱点都存在“大数据”里,供极少数精英随意拿来摧毁定向目标。那么,将来谁有资格获得这个密钥,掌握这些隐私,充当这个中纪委?

                      从“核能”,“克隆”到“大数据”,这些都不是纯粹的“邪科技”,但肯定是可正可邪的“灰色科技”。人类文明很可能因为“邪科技”而走向自我摧毁,“核能”用邪了会“核冬天”,“大数据”用邪了是什么?自相残杀?

                      这里抛砖引玉,请大家讨论。“大数据”已经扼杀不了了,它终将以雪崩之势,占领社会的全部角落。

                      • 家园 我不知道您所谓的“水准很高”是什么意思

                        我经常接触机器翻译,并且对其非常不满意。

                        简而言之,机器不知道自己在干什么。

                        而且还不仅是中英。年初的时候我接触了一下法语,即便是英法(或者说法英)翻译同样令人感到牙碜。

                        • 家园 这就是GOOGLE对您这个帖子的翻译

                          点看全图

                          外链图片需谨慎,可能会被源头改

                          请点击画面,放大了阅读。

                          画面右上角,红色箭头所指,就是翻译Icon,你点击一下,就会为你把当前页面翻译为英文,也就是一瞬间。目前还没有“英译中”功能,只能“中译英”,已经相当惊人,只要有一点点中文水准的美国“汉学砖家”,能找准页面,都很容易能知道我们老中在聊啥。当然,如果有了“英译中”功能,我们这些民科“研美派”,可省心多了。

                          这帖子短,你找个深奥点的试试。

                      • 家园 没那么简单

                        现在是数据的采集存储与处理因为计算能力的提高与普及,而达到大数据的水平,但是分析还远远不能胜任。

                        Google那个狗译惨不忍睹,而且走的路径是个取巧的办法,远远没有根据语言本身含义去翻译的能力。

                        现在人工智能与大数据,在语言处理这个方面是最大的瓶颈,比以前因为深度学习的算法进步与计算能力的提高,而有了长足的进步,甚至可以凑合用,比如Siri这样的,但是比人还有很大距离。

                  • 家园 希望大家能议一议“大数据”

                    不带成见,正反双方互相尊重。

                    最近有深度的主题帖还真是不多。

                    在科学研究的自由王国里,“相关性为王”,可能会终结人类文明。

                    目前GOGGLE在做的事,就是阿贵偷看吴妈洗澡,结果发现吴妈小叶增生。

                    吴妈洗澡,跟吴妈被确诊“小叶增生”,据有相关性,因为洗的次数多,被偷看的机率大,就容易被发现小叶增生。当然,“吴妈洗澡”跟“小叶增生”之间,没有因果关系。既然这个“相关性”被证明科学有效,我们就应该鼓励阿贵多多偷看,多多救人。

                    阿贵现在牛B得紧,因为他及时发现别人有病,抢救有功了。至于吴妈是不是宁可“小叶增生”死掉,而不愿意被人偷看洗澡,GOOGLE那两个宝货FOUNDER是不管的。我现在才觉得,科技是没有底线的。

                    • 家园 窃以为大数据是一个有力的工具,但结果如何要看怎么用

                      例如,其“相关性为王”,不一定与传统科研就是矛盾关系,大数据用得好同样也可以为科学研究服务,尤其是为某些复杂性研究服务。

                      无论正反方,估计都承认大数据是一个强有力的东西,关键恐怕在于是谁在用,怎么用。孤立的说大数据的好坏就好比去看单独一把枪是邪恶还是非邪恶的。而一个手无缚鸡之力的婴儿拿一把枪,却能杀死任何人。

                      它很容易为人所用以达到某些邪恶的目的,即使它表面看上去不那么邪恶,例如,利益团体(如大公司)对社会的“整体把握”。有人也许会说,我们要加强安全机制,加强权力平衡,但“大数据主宰”这个可怕前景的可能性本身的存在,就足以让人寒毛直竖了。

                      大数据系统的建立无疑需要大量的财力,人力和物力,在这个资本主导的世界,最终到底谁会控制它,并出于什么目的去使用它(既然它的建立会花掉建立者这么多资源的话,自然是需要回报的)呢?恐怕最后的答案并不容乐观。也许,其系统建立之初以及运行中的多样性有助于消减其潜在的危险?例如,通过多方协商,共同管理,之类之类。

                    • 家园 大数据的思路没有问题

                      类似于中医,不管原理,归纳效果,为此杜撰一套理论也不是不可。大数据可以看作概率论的延伸,是西方对待“科学”的一种扩展。

                      从社会学角度分析,这是对数字化全盘控制思维的一种折衷和修正,可以看作是西方在社会学领域碰壁碰多了以后的一种理性回归。无论最终结果如何,大数据实质上都是西方思维对社会学理解方面的一种补课,与东方是迟早殊途同归的,因此不用过分计较其善恶意味,这在文明融合方面应该是好事。

                      • 家园 中医和大数据不一样

                        中医无论用什么模型,最后还是要归结到直觉判断。如果只按教科书来而没有自己的思考和领悟,遇到具体的病例会完全无所适从的——解太多了。

                    • 家园 科技没有底线

                      科学家有. 我不觉得这两者有矛盾.

                      回到隐私信息的保护.我觉得这问题就没有最终解决方案.一种技术因为其争议性被搁置,很快就会有另外一种技术替代.比如盗娼,历来皆非法,现在根绝了吗? 这是人类,或者说所有生物固有的自私性决定的.作为社会的人,我们只能用主观意识去尽力克制....

分页树展主题 · 全看首页 上页
/ 7
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河