五千年(敝帚自珍)

主题:【原创】云里雾里的云计算 [1] -- 邓侃

共:💬620 🌺1262
分页树展主题 · 全看首页 上页
/ 42
下页 末页
      • 家园 云应用的普及必须考虑到这样一个因素

        抛开云应用的实用性问题不谈,“没落反动”势力的“阻挠”会严重阻碍云应用的普及。

        比如俺是个银行IT的负责人,现有的业务在目前的数据中心运行的很好,俺会考虑把数据中心迁移到某个云里面吗?

        1.技术的迁移意味着巨大的技术风险,万一搞砸了,作为技术负责人的俺首先要付责任。嘿嘿,无过是功。

        2.即使迁移成功,俺以前的技术就开始贬值了,俺的位置的重要性就降低了,更重要的是行长小舅子在这个云技术比俺更强,他对俺这个位置可是窥测久矣。

        怎么办?妖魔化云计算。你说,俺能和俺的饭碗过不去吗?!

        谁说搞技术的不要搞“政治”,特别是“办公室政治”。

        • 家园 被逼无奈

          通常情况下,大企业换软件系统,都是被逼无奈。

          譬如华尔街90年代,Sybase大行其道。后来发现Sybase内核有不可修复的缺陷,所以不得不改用Oracle。

          云计算面临的情况也一样,得游说大企业的CIO,说,你不要趁早换用云计算平台,等到你的数据膨胀到了一定规模以后,现有的系统讲不堪重负,而且即便加机器也加不了了。

          这时候,他才会痛下决心,改用云计算。

          • 家园 若干年前,俺们公司尝试攻下的一个客户

            大家伙 --- EPA。派人与之沟通,反馈回来的消息。EPA现在还用着IBM的“大机器”,据说有N多的大磁带(NN年的数据),没人愿意拍板将这些数据迁移到3层结构的体系中。若干个爷爷级的程序员还在维护这个系统。现在的情况如何就不得而知了。据法律(?),这些数据是不允许放在米国之外的服务器上。

          • 家园 劳驾给八卦下:

            Sybase内核有不可修复的缺陷

            • 家园 记忆中

              记得以前看过一篇文章中谈及此事。

              刚才放狗找了找,没找着。

              • 家园 我自己找到了。

                主要是sybase内核是单进程多线索管理。

                多谢费心。

        • 家园 技术对于政治是接近中立的

          不如你说的例子,“更重要的是行长小舅子在这个云技术比俺更强,他对俺这个位置可是窥测久矣。”

          那说不定这个行长的小舅子就是云计算的强力推动者。呵呵,想着上了云,俺就有机会把那个占着茅坑的家伙赶走了。

          • 家园 这句话是不是准确?

            对比一下传统的单机的操作系统,GFS可以理解为云计算版的文件系统,MapReduce是云计算版的进程管理,Chubby是云计算版的synchronization。

            这句话是不是准确?

          • 家园 有没有什么遗漏的papers?

            我列举了几篇论文,选择标准是少,精。

            但是是不是遗漏了什么?大家有没有补充?

            • 家园 不敢班门弄斧

              在下才疏学浅,对于GFS等深入的技术确实了解不多。邓兄的大作也只有拜读的份。

              倒是对于云的另一方面,比如信息构建、自然语言以及中文的分词等所有了解和实践。

              其实Google现在模式的检索已经到了一个瓶颈,很多信息无法通过短短的关键字和全文检索页面找到。

              最初我能在第一页找到我想要的,后面要翻前三页,但是现在很可能淹没在数十页之后了,怎么办?

              另外,一般网站的信息越来越多,如果构建,以方便用户理解和使用也是一个挑战。

              而且很奇怪的是现在做站内检索的公司越来越少了。

              百度把他们的企业检索部门撤销了,Google中国基本不涉足这个市场。

              就是剩下一个TRS还算勉强过得去,但是产品实在的烂。

              如果网站将是未来企业的一个核心,那么网站的构建也将有重要的价值,这不仅仅是搜索能实现的。

              用云也许是一个解决办法。Google了解你的任何事情,自然也可以给你针对性检索答案,这的确非常的有诱惑力,但是个人隐私方面的担忧却不得不让人犹豫再三。

              也许,Google提出云的本意不在于为企业提供更好的服务,而真正目的在于更好的收集信息,获得结构化信息,以及更多的了解个人用户习惯,以做到真正的“理解用户”,提供“终极搜索体验”呢?

              呵呵一点感想,抛砖引玉。

              • 家园 或者做企业级的用户终极搜索体验?

                hansens关于搜索的瓶颈确实让我耳目一新,细想想确实如此。信息越来越海量,光靠1,2个关键词google还真没法确定我到底想找什么,更别提分析有歧义的语义了。

                不过搜集个人数据,针对性给你答案有些打法律的擦边球,政策风险太大。国外对隐私的重视程度太高,一旦有人告你一票,高院一句话就把你打回原形了。那么换成搜集企业数据呢?

                通过搜集企业产品库,业界技术发展,市场需求分析,人才流动等等信息,google是不是可以给企业提供市场分析报告,包括目前市场动态,未来趋势等等。不过这属于咨询领域,没听过google有涉足这个的说法啊。疑惑ing...

                • 家园 几个方向,包括自然语言理解技术,结构化知识发现等也许

                  是解决办法。

                  其实用关键字在互联网信息量在一定限度之下时还是很有效的,但是信息量越来越大就有问题了。

                  不如,用“主板”做关键字Google就无法判断你到底是要找电脑的主板信息还是证券的主板信息。

                  现在用了多关键字,但是多关键字也会遇到信息越来越多,一些小众的信息会淹没在大众的信息之中的问题。

                  从这个方面考虑自然语言理解技术是改进方向之一,但是这条路困难重重,曙光还比较遥远。

                  另外一个方面就是结构化知识,就是发现信息之间的内在关联,可以更准确的处理、检索信息。但是这个方向对于前面说的知识爆炸问题还是无法解决。

                  最后一个办法就是,让Google知道你的偏好,比如你是个IT工程师,那么你检索“主板”八成是找电脑主板,另外如果你多次检索华硕的T2P4,那么以后你再检索T2P4的时候,Google可以针对性的把更新升级信息都推送出来。这个也许就是终极解决办法。

                  (纪念下我的第一块主板ASUS T2P4)

                  如果这个办法由于法律的原因无法实施,那么云计算在一定范围之内也许可以达到类似的效果,比如某企业的员工利用企业的云检索相关信息,那么显然Google对该用户可能的检索范围会有更多的理解。

                  另外以方面,企业用Google的云建立信息,也会有利于Google更好理解企业发布的信息,便于形成所谓的结构化知识。 这方面从Amazon的云和Google的云的区别上也许可以看出倪端。

                  Amazon的云就是一个纯的Linux虚拟机,你可以有Root权限,并且做任何你想要做的事情。

                  Google的应用引擎(App Engine)实际上是一个Linux运行环境,但是没有写文件的权限,如果你想保存数据,必须使用谷歌的数据库。而且实事上你必须用Python环境来实现Web应用,用Google的数据库做任何储存。这也许反应了Google对数据的野心。

              • 家园 关于中文的检索

                目前确实是个难题,到底有没有解现在都说不清楚,分词的流派也是过江之鲫,正着反着靠词库不靠字库自学习的都有,但是不管“XX更懂中文”,下面这个经典的句子估计都够这些算法喝一壶的

                乒乓球拍卖完了

                怎么分?

                乒乓球/拍卖/完了

                乒乓/球拍/卖完了

                都对?

                羽羊在做自己公司网站的时候费了牛劲折腾中文分词,后来还是放弃了,功力差太远,找了开源的方案了事。

                前段时间和一个哥们醉酒扯淡,聊到google和微软之争,此君语出惊人:微软的武器库多着呢,只不过还没找着用处,不信看看微软拼音和谷歌拼音,半吊子整句输入和近似完美的词库,高下立盼,google的卵蛋捏在别人手里呢。

                此话一出,羽羊醒酒大半,此君人事不省。。。

              • 家园 老弟不要谦虚。

                头脑风暴起来是没有班门不班门的,有时候“外行”更能接近问题的本质。如果都谦虚了,都沉默是金,估计邓侃早就颠了。

                没准大家就是那个小男孩 --- 看,皇上光着屁股。

                这里的皇上就是天边的哪朵云彩。

                • 家园 说得好极了

                  如果都谦虚了,都沉默是金,估计邓侃早就颠了。

                  说到俺心里去了。

                  没有愚蠢的讨论,但是不讨论肯定是愚蠢的。

分页树展主题 · 全看首页 上页
/ 42
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河