五千年(敝帚自珍)

主题:【原创】Bing vs Google 对决,大戏正式上演 -- 邓侃

共:💬46 🌺104
全看树展主题 · 分页首页 上页
/ 4
下页 末页
家园 【原创】Bing vs Google 对决,大戏正式上演

期待已久的微软的搜索引擎,Bing,终于亮相了。本来着急着去访问Bing的网页,但是当我输入完http://www.bing.com,却没有立刻点击回车键。停顿一下,想一想,作为一个搜索引擎的用户,我们对于一个新的搜索引擎的期望是什么?理理思路,总结一下,期望无非是两条,最低要求是不能比Google 差,但是如果想战胜Google,需要强调的是差异化。

【1】作为commodity的搜索引擎

搜索的质量不能比Google差,否则用户就不会用新的搜索引擎。搜索引擎的基本技术已经成为大路货,只要网络爬虫到访过足够数量的网页,搜索质量一般不会很差。

譬如我们不到10个人,自己动手做了一个POI搜索引擎,而且与Google,Baidu,Yahoo横向比较,不敢说比业界大佬强,但是无论是搜索的质量和速度,都没有明显的不足。而且我们只是用了一台server,没有用云计算server集群。

点看全图

外链图片需谨慎,可能会被源头改

Figure 1. Vertical search comparison

Courtesy http://farm4.static.flickr.com/3370/3591303476_cc2a174d0d_o.png

比较有幽默感的是http://www.cuil.com/,它号称拥有124 billion以上网页的内容,但是搜索结果的质量却很差。粉墨登场初期热闹了一番,很快就冷淡下去了。毕竟,质量是生命线。

所谓质量,首要的是准确率,尤其是第一页第二页里显示的搜索结果,尽可能符合用户的期待。其次才是覆盖率,譬如搜索一下“萨苏”,查看一下,是否所有有关信息,都能被搜索出来。不过,关注覆盖率的,大多数是发布信息的人,而不是普通用户。但是这里有个例外,在shopping search里,需要强调货比三家,如果覆盖率不够,搜索结果没有涵盖某个价廉物美的商店,用户就会抱怨。

试试Bing,准确率相当不错,覆盖率也不错。和Google比较,搜索结果和排序有差异,但是看不出明显的质量的高下。

没有明显区别,这正是问题所在。拉不开质量的差距,就不能形成有效的竞争。如果Bing企图与Google对决,必然寻求差异化,但是差异体现在哪里呢?

【2】差异化的外围战

打开http://www.bing.com美国首页,看到的不仅有搜索框,而且还有背景图片,背景图片有多张,可以左右切换。有意思的是,背景图片上暗含若干traps,把鼠标移动到某个trap上,首页上会浮现一个注释贴士,简短地介绍与该图片相关的信息。

这个小功能目前看只是花絮,但是可以扩展的空间很大。譬如,背景图片可以换成若干新闻照片的拼板,用户点击某一张新闻照片,就可以看到相关新闻。进一步讲,这样的首页可以扩张成为个性化首页,不仅可以换皮肤,而且用户可以订阅相关的信息频道,包括新闻,包括通过RSS订阅的博客,还可以包括社交网上好友的最新动态,等等。

与传统的个性化首页相比,这种新方式不仅容易用,而且更美观。

点看全图

外链图片需谨慎,可能会被源头改

Figure 2. The homepage of Bing search engine.

Courtesy http://farm4.static.flickr.com/3627/3590263277_56bdde3f48_o.png

当用户输入完搜索关键词,搜索引擎返回搜索结果时,Google的页面分为左右两列。左边一列是搜索结果,右边是广告。Bing的页面安排有两大不同。第一,最左边是以往的搜索关键词的历史记录,中间列才是结果。第二,右边是动态的注释贴士。当用户在各个搜索结果条目之间移动鼠标的时候,右边的贴士自动浮现。贴士的内容与各个搜索结果下方的引文有一些重复,主要目的是用来解释,为什么这个搜索结果与用户的输入关键词相关。

这个动态贴士很值得琢磨,贴士的占用的页面空间,比搜索结果下方的引文的空间大,这样就可以承载更多信息。如果用户不把鼠标移动到触发区域,这些动态贴士处于隐藏状态,不构成对用户的骚扰。动态贴士可以承载更多信息,但是这些信息并不限于更多引文,而是可以包含外部链接,广告等等内容。

点看全图

外链图片需谨慎,可能会被源头改

Figure 3. Extended annotation of the search result.

Courtesy http://farm4.static.flickr.com/3351/3590244497_0823f7e7df_o.png

简而言之,Bing首页的traps,以及搜索结果的动态贴士,这些设计有助于在维护页面整洁的前提下,提供用户更多内容。而提供什么内容,主要取决于微软的商务决策。

要说问题,可能也有一些。首页浏览需要安装SilverLight插件。RIA(Rich Internet Application, e.g. Flash & SilverLight)的好处是画面丰富,效果炫目,但是缺点是启动慢。首页的启动速度至关重要,如果启动慢了,很多用户可能不接受。

同理,在Bing地图里,有3D视图,这个3D视图,类似于Google Earth。使用Bing 3D地图,首先需要下载并安装插件。我十分怀疑在浏览器里安装这些沉重而且运行效率低下的插件,是不是正确的方向。我令可相信,改造浏览器,使之能够高效而且低耗地支持RIA,或许是更值得期待的未来。

【3】解构主义的搜索引擎

虽然Bing在页面的设计方面,努力寻求与Google的差异化。但是这些差异,并不能构成对Google的致命威胁。

用户使用搜索引擎的行为模式有两类,一个是定向式搜索,二是探索式搜索。定向式搜索相对比较容易解决,手段主要是词句的匹配。但是搜索的难题,并不在于词句的匹配,而是在于揣摸用户的心思。当然,如果连词句匹配也做不好,其余的就不用谈了。搜索技术不能单单借鉴语言学的研究成果,将来会越来越倚重心理学。

1. 定向式搜索

譬如用户大致知道某一篇论文的题目,或者论文的作者,他想找到这篇论文的全文。用户期望搜索引擎解决两个问题,a. 纠正输入错误。一个例子是用户输入“architecture of search engine”,实际上论文的题目是“The anatomy of a search engine”,用户输入作者“Surgey Bring”,实际上正确的拼写是“Sergey Brin”。b. 找到包含该论文全文的网址。

2. 探索式搜索

搜索引擎需要揣摸用户的心思,揣摸的困难在于,很多时候连用户自己也不知道自己想找什么。所以揣摸的着力点,不是急于寻找准确的搜索结果,而是在于引导用户明确他搜索的目标。问题明确了,结果就不难寻找了。

搜索的技术诀窍在于构建索引。Google也好,Bing也好,内部索引主要是针对文字建立的。换句话说,现在的搜索引擎,善于搜索what。作为补充,Google和Bing另外设立了一些专向引擎(vertical search engine),譬如本地搜索,图片搜索等等。本地搜索的内部索引,包括两个维度,what-and-where。用户想知道清华大学附近有没有意大利餐厅,本地搜索在内容索引的what维度里找“意大利餐厅”,然后根据where维度确定北京各个意大利餐厅离开清华大学的距离。搜索结果的排序,不仅取决于what是否贴切,而且还要参照where的距离。

搜索仅限于what是不够的,扩展到what-and-where也是不够的,将来势必扩展到多维,尤其是what-where-when-who-how。

引导用户明确他搜索的目标,无非是在what-where-when-who-how这几个维度里,逐步缩小搜索范围。

1. 搜索what的办法在于建立alphabetic索引。

2. 搜索where的办法在于建立spatial索引。

3. When的索引相对好做,可以转化为alphabetic索引。

4. Who的索引可以借助于像LinkedIn,Facebook这样的社交网站。

5. How的索引和what的索引相似,但是困难在于内容的收集。最理想情况是发展一个像Wikipedia那样的百科全书,或者借鉴digg.com的做法,发动群众建一个链接库,搜罗其它网站上的相关内容,并人工分类。

一个新的搜索引擎,如果不能提供令人满意的定向式搜索结果,面临Google的竞争压力,它多半生存不了。如果生存问题解决了,它想进一步战胜Google,那么在探索式搜索方面努力,或许是一个出路。

关键词(Tags): #搜索引擎#微软#Google#硅谷评论元宝推荐:晨枫,

本帖一共被 2 帖 引用 (帖内工具实现)
家园

顺便还做了广告

小团队未必不能战胜大巨人

家园 本想把公司logo去掉

但是难得烦了,就这么着了吧。

家园 越做越好了,呵呵

比两年前进步很多啊

家园 花,哈哈
家园 言语过于尖刻,只好拿自己开刀

不过,检查覆盖率的,大多数是发布信息的人,而不是普通用户

原话是,“不过,关注覆盖率的,大多数是顾影自怜的人,而不是普通用户”。觉得用词太刻薄,所以例子中用的关键词,只好拿自己开涮。

后来,还是把原话改了,但是例子就留下了。

家园 呵呵,cuil那个您是不是写过

可以加进来吧,哈哈,Wolfram您没写过,反正看谁是google killer!oh,yeah!

家园 偶是个好热闹的人

曾经对cuil期望很大,可惜这个不争气的。

家园 别打我,跑。。。。。
家园 昏倒,技术水平差老远呢,别乱按
家园 Bing还有一个问题~

某些特效需要slivelight支持,因此需要安装,这可能会是一个瓶颈阿~

家园 没有沙发了?搬块砖头坐上。

标题党,嘿嘿。

严格地将,俺对搜索是一知半解。

既然搜索的广度有了,搜索引擎结果的排列方式就决定了“深度”。是不是形式决定“内容”?

家园 中文版的bing试了一小下, 就被墙了

只能简单说说感觉.

首页的图片很不习惯, 看着不专业, 可能习惯google的简洁了.

搜索结果左面有一个导航栏, 里面有一些根据当前搜索词汇产生的提示, 问了一下微软的伙计说是用了一些文本聚类技术, 时间太短, 看不出好坏来, 也许这个对那些不知道精确关键词的用户很有帮助.

俺用ie8, 搜索结果项可以直接加到ie8的动态更新网页里, 这些配合的UI感觉不错.

初步印象, 还不错, 但google习惯了, 也似乎没有必要换一个. 可惜没用两下, 就被盾了, 只能浅尝而止了

家园 中文版的功能不如英文版的丰富

我文中提到的首页trap,以及搜索结果贴士,在中文版里都没有。

家园 搜索实际上是心理学

难点不是词句的匹配,而是猜用户的心思。

问题是,很多时候,用户自己也不知道自己想要什么。

全看树展主题 · 分页首页 上页
/ 4
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河