五千年(敝帚自珍)

主题:【原创】百度为什么不收购七把叉 -- 铁手

共:💬33 🌺46
全看分页树展 · 主题 跟帖
家园 我给百度出个countermeasurement idea:

以其人之道,还制其人。百度可以专门雇一帮人,用谷歌拼音给Google提供错误的“断词”信息:

xi xiheshi gehaodi fang, wotiantiandou yaoqudeng zhe kantieshoude wai boerdian lingwen zhang.

严肃地说,老铁的这个推断挺有道理。Google的那个巨大的数据库已经进入了正反馈循环,里面的信息会增长地越来越快。

再来看看GOOGLE的拼音输入法。拼音输入的时候,在大多数的情况下,我相信每个人都基本上以词为单位,几乎没有人是一个长句子的输入,也很少有人一个字一个字的输入。也就是说,你的每一次输入,都可以给GOOGLE提供一些断句的参考。成千上万的用户的输入,对这些资料的统计,会让“断词”的有效性显著增加。在不久的将来,我相信GOOGLE的中文搜索能力会有效提高,而在英文网络世界里行之有效的ADSENSE广告也会在中文网络世界里很快得以提高。

再回到调侃。从阴谋论的角度来看,Google正在从各个方面侵入到人们的私人生活中,后果可能是严重的。Google不停顿地推出的各种工具和服务具有一个共同点:都能收集和分析信息,绝大部分并能phone back the mother ship。Google的这些工具和服务只有一个目的:试图从各个角度,每时每刻地收集人类社会的信息。

各种各样看似无关的信息被放到一起,成为模式分析和匹配的样本。当样本的积累达到某些阀值,就可能发现以前由于样本数量不足够而无法感知的模式。而这种发现过程的速度和准确度会随着样本数量和已知模式数量的增加而加速上升。

做为个体,不必担心Google会知道你的“小秘密”,因为那对Google几乎没用。Google更感兴趣的是群体,比如,是不是还有其他人有同样的小秘密,这些人是不是都有某些相似之处。如果某个群体的社会习性被掌握了,那么,这个群体的弱点也就开始暴露出来了。

想象一下那种袒露于别人目光之下的感觉吧,虽然你只是那一群“被扒光的”中微不足道、无名无姓的一个。

调侃结束了。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河