五千年(敝帚自珍)

主题:【原创】Bing vs Google 对决,大戏正式上演 -- 邓侃

共:💬46 🌺104
分页树展主题 · 全看首页 上页
/ 4
下页 末页
  • 家园 【原创】Bing vs Google 对决,大戏正式上演

    期待已久的微软的搜索引擎,Bing,终于亮相了。本来着急着去访问Bing的网页,但是当我输入完http://www.bing.com,却没有立刻点击回车键。停顿一下,想一想,作为一个搜索引擎的用户,我们对于一个新的搜索引擎的期望是什么?理理思路,总结一下,期望无非是两条,最低要求是不能比Google 差,但是如果想战胜Google,需要强调的是差异化。

    【1】作为commodity的搜索引擎

    搜索的质量不能比Google差,否则用户就不会用新的搜索引擎。搜索引擎的基本技术已经成为大路货,只要网络爬虫到访过足够数量的网页,搜索质量一般不会很差。

    譬如我们不到10个人,自己动手做了一个POI搜索引擎,而且与Google,Baidu,Yahoo横向比较,不敢说比业界大佬强,但是无论是搜索的质量和速度,都没有明显的不足。而且我们只是用了一台server,没有用云计算server集群。

    点看全图

    外链图片需谨慎,可能会被源头改

    Figure 1. Vertical search comparison

    Courtesy http://farm4.static.flickr.com/3370/3591303476_cc2a174d0d_o.png

    比较有幽默感的是http://www.cuil.com/,它号称拥有124 billion以上网页的内容,但是搜索结果的质量却很差。粉墨登场初期热闹了一番,很快就冷淡下去了。毕竟,质量是生命线。

    所谓质量,首要的是准确率,尤其是第一页第二页里显示的搜索结果,尽可能符合用户的期待。其次才是覆盖率,譬如搜索一下“萨苏”,查看一下,是否所有有关信息,都能被搜索出来。不过,关注覆盖率的,大多数是发布信息的人,而不是普通用户。但是这里有个例外,在shopping search里,需要强调货比三家,如果覆盖率不够,搜索结果没有涵盖某个价廉物美的商店,用户就会抱怨。

    试试Bing,准确率相当不错,覆盖率也不错。和Google比较,搜索结果和排序有差异,但是看不出明显的质量的高下。

    没有明显区别,这正是问题所在。拉不开质量的差距,就不能形成有效的竞争。如果Bing企图与Google对决,必然寻求差异化,但是差异体现在哪里呢?

    【2】差异化的外围战

    打开http://www.bing.com美国首页,看到的不仅有搜索框,而且还有背景图片,背景图片有多张,可以左右切换。有意思的是,背景图片上暗含若干traps,把鼠标移动到某个trap上,首页上会浮现一个注释贴士,简短地介绍与该图片相关的信息。

    这个小功能目前看只是花絮,但是可以扩展的空间很大。譬如,背景图片可以换成若干新闻照片的拼板,用户点击某一张新闻照片,就可以看到相关新闻。进一步讲,这样的首页可以扩张成为个性化首页,不仅可以换皮肤,而且用户可以订阅相关的信息频道,包括新闻,包括通过RSS订阅的博客,还可以包括社交网上好友的最新动态,等等。

    与传统的个性化首页相比,这种新方式不仅容易用,而且更美观。

    点看全图

    外链图片需谨慎,可能会被源头改

    Figure 2. The homepage of Bing search engine.

    Courtesy http://farm4.static.flickr.com/3627/3590263277_56bdde3f48_o.png

    当用户输入完搜索关键词,搜索引擎返回搜索结果时,Google的页面分为左右两列。左边一列是搜索结果,右边是广告。Bing的页面安排有两大不同。第一,最左边是以往的搜索关键词的历史记录,中间列才是结果。第二,右边是动态的注释贴士。当用户在各个搜索结果条目之间移动鼠标的时候,右边的贴士自动浮现。贴士的内容与各个搜索结果下方的引文有一些重复,主要目的是用来解释,为什么这个搜索结果与用户的输入关键词相关。

    这个动态贴士很值得琢磨,贴士的占用的页面空间,比搜索结果下方的引文的空间大,这样就可以承载更多信息。如果用户不把鼠标移动到触发区域,这些动态贴士处于隐藏状态,不构成对用户的骚扰。动态贴士可以承载更多信息,但是这些信息并不限于更多引文,而是可以包含外部链接,广告等等内容。

    点看全图

    外链图片需谨慎,可能会被源头改

    Figure 3. Extended annotation of the search result.

    Courtesy http://farm4.static.flickr.com/3351/3590244497_0823f7e7df_o.png

    简而言之,Bing首页的traps,以及搜索结果的动态贴士,这些设计有助于在维护页面整洁的前提下,提供用户更多内容。而提供什么内容,主要取决于微软的商务决策。

    要说问题,可能也有一些。首页浏览需要安装SilverLight插件。RIA(Rich Internet Application, e.g. Flash & SilverLight)的好处是画面丰富,效果炫目,但是缺点是启动慢。首页的启动速度至关重要,如果启动慢了,很多用户可能不接受。

    同理,在Bing地图里,有3D视图,这个3D视图,类似于Google Earth。使用Bing 3D地图,首先需要下载并安装插件。我十分怀疑在浏览器里安装这些沉重而且运行效率低下的插件,是不是正确的方向。我令可相信,改造浏览器,使之能够高效而且低耗地支持RIA,或许是更值得期待的未来。

    【3】解构主义的搜索引擎

    虽然Bing在页面的设计方面,努力寻求与Google的差异化。但是这些差异,并不能构成对Google的致命威胁。

    用户使用搜索引擎的行为模式有两类,一个是定向式搜索,二是探索式搜索。定向式搜索相对比较容易解决,手段主要是词句的匹配。但是搜索的难题,并不在于词句的匹配,而是在于揣摸用户的心思。当然,如果连词句匹配也做不好,其余的就不用谈了。搜索技术不能单单借鉴语言学的研究成果,将来会越来越倚重心理学。

    1. 定向式搜索

    譬如用户大致知道某一篇论文的题目,或者论文的作者,他想找到这篇论文的全文。用户期望搜索引擎解决两个问题,a. 纠正输入错误。一个例子是用户输入“architecture of search engine”,实际上论文的题目是“The anatomy of a search engine”,用户输入作者“Surgey Bring”,实际上正确的拼写是“Sergey Brin”。b. 找到包含该论文全文的网址。

    2. 探索式搜索

    搜索引擎需要揣摸用户的心思,揣摸的困难在于,很多时候连用户自己也不知道自己想找什么。所以揣摸的着力点,不是急于寻找准确的搜索结果,而是在于引导用户明确他搜索的目标。问题明确了,结果就不难寻找了。

    搜索的技术诀窍在于构建索引。Google也好,Bing也好,内部索引主要是针对文字建立的。换句话说,现在的搜索引擎,善于搜索what。作为补充,Google和Bing另外设立了一些专向引擎(vertical search engine),譬如本地搜索,图片搜索等等。本地搜索的内部索引,包括两个维度,what-and-where。用户想知道清华大学附近有没有意大利餐厅,本地搜索在内容索引的what维度里找“意大利餐厅”,然后根据where维度确定北京各个意大利餐厅离开清华大学的距离。搜索结果的排序,不仅取决于what是否贴切,而且还要参照where的距离。

    搜索仅限于what是不够的,扩展到what-and-where也是不够的,将来势必扩展到多维,尤其是what-where-when-who-how。

    引导用户明确他搜索的目标,无非是在what-where-when-who-how这几个维度里,逐步缩小搜索范围。

    1. 搜索what的办法在于建立alphabetic索引。

    2. 搜索where的办法在于建立spatial索引。

    3. When的索引相对好做,可以转化为alphabetic索引。

    4. Who的索引可以借助于像LinkedIn,Facebook这样的社交网站。

    5. How的索引和what的索引相似,但是困难在于内容的收集。最理想情况是发展一个像Wikipedia那样的百科全书,或者借鉴digg.com的做法,发动群众建一个链接库,搜罗其它网站上的相关内容,并人工分类。

    一个新的搜索引擎,如果不能提供令人满意的定向式搜索结果,面临Google的竞争压力,它多半生存不了。如果生存问题解决了,它想进一步战胜Google,那么在探索式搜索方面努力,或许是一个出路。

    关键词(Tags): #搜索引擎#微软#Google#硅谷评论元宝推荐:晨枫,

    本帖一共被 2 帖 引用 (帖内工具实现)
分页树展主题 · 全看首页 上页
/ 4
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河