近期网站停站换新具体说明
按以上说明时间，延期一周至网站时间26-27左右。具体实施前两天会在此提前通知具体实施时间

主题：【原创】Bing vs Google 对决，大戏正式上演 -- 邓侃

共:💬46 🌺104

老大河待整

分页树展主题 · 全看首页上页下页末页

家园
【原创】Bing vs Google 对决，大戏正式上演
期待已久的微软的搜索引擎，Bing，终于亮相了。本来着急着去访问Bing的网页，但是当我输入完http://www.bing.com，却没有立刻点击回车键。停顿一下，想一想，作为一个搜索引擎的用户，我们对于一个新的搜索引擎的期望是什么？理理思路，总结一下，期望无非是两条，最低要求是不能比Google 差，但是如果想战胜Google，需要强调的是差异化。
【1】作为commodity的搜索引擎
搜索的质量不能比Google差，否则用户就不会用新的搜索引擎。搜索引擎的基本技术已经成为大路货，只要网络爬虫到访过足够数量的网页，搜索质量一般不会很差。
譬如我们不到10个人，自己动手做了一个POI搜索引擎，而且与Google，Baidu，Yahoo横向比较，不敢说比业界大佬强，但是无论是搜索的质量和速度，都没有明显的不足。而且我们只是用了一台server，没有用云计算server集群。
外链图片需谨慎，可能会被源头改
Figure 1. Vertical search comparison
Courtesy http://farm4.static.flickr.com/3370/3591303476_cc2a174d0d_o.png
比较有幽默感的是http://www.cuil.com/，它号称拥有124 billion以上网页的内容，但是搜索结果的质量却很差。粉墨登场初期热闹了一番，很快就冷淡下去了。毕竟，质量是生命线。
所谓质量，首要的是准确率，尤其是第一页第二页里显示的搜索结果，尽可能符合用户的期待。其次才是覆盖率，譬如搜索一下“萨苏”，查看一下，是否所有有关信息，都能被搜索出来。不过，关注覆盖率的，大多数是发布信息的人，而不是普通用户。但是这里有个例外，在shopping search里，需要强调货比三家，如果覆盖率不够，搜索结果没有涵盖某个价廉物美的商店，用户就会抱怨。
试试Bing，准确率相当不错，覆盖率也不错。和Google比较，搜索结果和排序有差异，但是看不出明显的质量的高下。
没有明显区别，这正是问题所在。拉不开质量的差距，就不能形成有效的竞争。如果Bing企图与Google对决，必然寻求差异化，但是差异体现在哪里呢？
【2】差异化的外围战
打开http://www.bing.com美国首页，看到的不仅有搜索框，而且还有背景图片，背景图片有多张，可以左右切换。有意思的是，背景图片上暗含若干traps，把鼠标移动到某个trap上，首页上会浮现一个注释贴士，简短地介绍与该图片相关的信息。
这个小功能目前看只是花絮，但是可以扩展的空间很大。譬如，背景图片可以换成若干新闻照片的拼板，用户点击某一张新闻照片，就可以看到相关新闻。进一步讲，这样的首页可以扩张成为个性化首页，不仅可以换皮肤，而且用户可以订阅相关的信息频道，包括新闻，包括通过RSS订阅的博客，还可以包括社交网上好友的最新动态，等等。
与传统的个性化首页相比，这种新方式不仅容易用，而且更美观。
外链图片需谨慎，可能会被源头改
Figure 2. The homepage of Bing search engine.
Courtesy http://farm4.static.flickr.com/3627/3590263277_56bdde3f48_o.png
当用户输入完搜索关键词，搜索引擎返回搜索结果时，Google的页面分为左右两列。左边一列是搜索结果，右边是广告。Bing的页面安排有两大不同。第一，最左边是以往的搜索关键词的历史记录，中间列才是结果。第二，右边是动态的注释贴士。当用户在各个搜索结果条目之间移动鼠标的时候，右边的贴士自动浮现。贴士的内容与各个搜索结果下方的引文有一些重复，主要目的是用来解释，为什么这个搜索结果与用户的输入关键词相关。
这个动态贴士很值得琢磨，贴士的占用的页面空间，比搜索结果下方的引文的空间大，这样就可以承载更多信息。如果用户不把鼠标移动到触发区域，这些动态贴士处于隐藏状态，不构成对用户的骚扰。动态贴士可以承载更多信息，但是这些信息并不限于更多引文，而是可以包含外部链接，广告等等内容。
外链图片需谨慎，可能会被源头改
Figure 3. Extended annotation of the search result.
Courtesy http://farm4.static.flickr.com/3351/3590244497_0823f7e7df_o.png
简而言之，Bing首页的traps，以及搜索结果的动态贴士，这些设计有助于在维护页面整洁的前提下，提供用户更多内容。而提供什么内容，主要取决于微软的商务决策。
要说问题，可能也有一些。首页浏览需要安装SilverLight插件。RIA（Rich Internet Application, e.g. Flash & SilverLight）的好处是画面丰富，效果炫目，但是缺点是启动慢。首页的启动速度至关重要，如果启动慢了，很多用户可能不接受。
同理，在Bing地图里，有3D视图，这个3D视图，类似于Google Earth。使用Bing 3D地图，首先需要下载并安装插件。我十分怀疑在浏览器里安装这些沉重而且运行效率低下的插件，是不是正确的方向。我令可相信，改造浏览器，使之能够高效而且低耗地支持RIA，或许是更值得期待的未来。
【3】解构主义的搜索引擎
虽然Bing在页面的设计方面，努力寻求与Google的差异化。但是这些差异，并不能构成对Google的致命威胁。
用户使用搜索引擎的行为模式有两类，一个是定向式搜索，二是探索式搜索。定向式搜索相对比较容易解决，手段主要是词句的匹配。但是搜索的难题，并不在于词句的匹配，而是在于揣摸用户的心思。当然，如果连词句匹配也做不好，其余的就不用谈了。搜索技术不能单单借鉴语言学的研究成果，将来会越来越倚重心理学。
1. 定向式搜索
譬如用户大致知道某一篇论文的题目，或者论文的作者，他想找到这篇论文的全文。用户期望搜索引擎解决两个问题，a. 纠正输入错误。一个例子是用户输入“architecture of search engine”，实际上论文的题目是“The anatomy of a search engine”，用户输入作者“Surgey Bring”，实际上正确的拼写是“Sergey Brin”。b. 找到包含该论文全文的网址。
2. 探索式搜索
搜索引擎需要揣摸用户的心思，揣摸的困难在于，很多时候连用户自己也不知道自己想找什么。所以揣摸的着力点，不是急于寻找准确的搜索结果，而是在于引导用户明确他搜索的目标。问题明确了，结果就不难寻找了。
搜索的技术诀窍在于构建索引。Google也好，Bing也好，内部索引主要是针对文字建立的。换句话说，现在的搜索引擎，善于搜索what。作为补充，Google和Bing另外设立了一些专向引擎（vertical search engine），譬如本地搜索，图片搜索等等。本地搜索的内部索引，包括两个维度，what-and-where。用户想知道清华大学附近有没有意大利餐厅，本地搜索在内容索引的what维度里找“意大利餐厅”，然后根据where维度确定北京各个意大利餐厅离开清华大学的距离。搜索结果的排序，不仅取决于what是否贴切，而且还要参照where的距离。
搜索仅限于what是不够的，扩展到what-and-where也是不够的，将来势必扩展到多维，尤其是what-where-when-who-how。
引导用户明确他搜索的目标，无非是在what-where-when-who-how这几个维度里，逐步缩小搜索范围。
1. 搜索what的办法在于建立alphabetic索引。
2. 搜索where的办法在于建立spatial索引。
3. When的索引相对好做，可以转化为alphabetic索引。
4. Who的索引可以借助于像LinkedIn，Facebook这样的社交网站。
5. How的索引和what的索引相似，但是困难在于内容的收集。最理想情况是发展一个像Wikipedia那样的百科全书，或者借鉴digg.com的做法，发动群众建一个链接库，搜罗其它网站上的相关内容，并人工分类。
一个新的搜索引擎，如果不能提供令人满意的定向式搜索结果，面临Google的竞争压力，它多半生存不了。如果生存问题解决了，它想进一步战胜Google，那么在探索式搜索方面努力，或许是一个出路。
关键词(Tags): #搜索引擎，#微软，#Google，#硅谷评论， 元宝推荐：晨枫,

本帖一共被 2 帖引用 (帖内工具实现)
- ※ 西河文萃第24期 2009年7月1日 ※ 上
- ※ 西河文萃第25期 2009年8月11日 ※中
- 复【原创】Bing vs Google 对决，大戏正式上演
  家园 【一句话新闻】传微软与雅虎达成搜索协议
  雅虎搜索引擎全面转用 Bing 作为后台，两个公司按流量比例分成广告收入。
  两者的广告销售技术平台也将择期合并，MSFT 的 AdCenter 会是目标平台，预计整合完成的期限在2011年以前。
  彭博社和 WSJ 的 Kara Swisher 都报道了该消息，预计明早将官方公布，当然这一交易还得过司法部的反垄断关， Google 的说客在行动。
  （太可惜了，MSFT即使把剩下的诸如 Ask 等搜索引擎都买光，Google 仍然比 Bing 大 —— 话虽如此， Barts大姐，我好晕啊，你基本上把雅虎搜索零首付卖了......）
  Kara Swisher's BoomTown Story
  Bloomberg's Report
- 复【原创】Bing vs Google 对决，大戏正式上演
  家园 Bing 的标志是对“设计”两个字的侮辱
  此举显然是跟 Google 的正面对抗!!!
  你能把首席设计师气跑，我就能设计出完全无视 Visual Design 123 的 Logo 来!!!
  外链图片需谨慎，可能会被源头改
  就是这样
  - 复 Bing 的标志是对“设计”两个字的侮辱
    家园 有点意思
    尤其是看到Google讨论问题的方式越来越Geeky。
    “让数据说话”，对于一般工程问题而言，或许是一个比较理性公正的讨论方式。但是设计是非常主观的范畴，量化两种设计方案的优劣比较的企图，可能进行不下去。
    - 复有点意思
      家园 正如那哥们所说的
      Google背负Billion Dollar投资重托，就像一艘航空母舰一样，必定要沿着VC们预设的航线继续航行下去...
      虽然期间能有一两个Marissa Mayer之类的养眼“美女”（如果抢光她的古狗股票不知还有几个人会倾倒于她的“姿色”？很一般般啊）出来稍作点缀，依然改变不了其corporate本性...
      “There are more exciting design problems in this world to tackle” -- but that's not what Google cares about, really...
- 复【原创】Bing vs Google 对决，大戏正式上演
  家园 希望它不像live搜索那样，那个live整个就是一垃圾！
  只要不是敏感词句，百度搜中文还是比google强，尤其是要搜一句话，Google会得到很诡异的结果，
- 复【原创】Bing vs Google 对决，大戏正式上演
  家园 中文名："必应"，南方人读成"避孕"～
  - 复中文名："必应"，南方人读成"避孕"～
    家园 它直接就是“病”的拼音，没发现吗？
  - 复中文名："必应"，南方人读成"避孕"～
    家园 你这个"南方"指的是哪儿?
    大大一滴汗!
    你这个"南方"指的是哪儿? 是江南? 岭南? 还是西南? 差别大了!
    最郁闷的就是这种一个"南方"把半个中国全都涵盖的. "北方"一词比较靠谱,是因为整个北方人这个群体对于彼此之间认同感比较大. 但是南方可就不一样了, 江南和岭南根本就是两个星球.
    注: 感慨而言,希望不要被当成地域贴.
    - 复你这个"南方"指的是哪儿?
      家园 我用普通话讲"必应"，因为发不出鼻音
      旁边一东北哥们儿听成“避孕”
- 复【原创】Bing vs Google 对决，大戏正式上演
  家园 中文名：“必应”，南方人读成“避孕”～
- 复【原创】Bing vs Google 对决，大戏正式上演
  家园 说对决还太早吧
  yahoo与微软加一块在搜索上也就赶上google个零头，条条大路通罗马是没错，但罗马也不是一夜建成的。要淡定。不过陆奇的这个新官上任三把火，想法是好的，动作是快的，干劲是足的，填补的是空白，对Google主力部队打打麻雀战还是可能的，在正面战场能不能存活，还很难说。不过听说“必赢”可以搜索廉价机票，这个不错...
  - 复说对决还太早吧
    家园 廉价机票用的是farecast的技术吧
- 复【原创】Bing vs Google 对决，大戏正式上演
  家园 国内无法打开bing
  - 复国内无法打开bing
    家园 加proxy
    上有政策，下有对策。

分页树展主题 · 全看首页上页下页末页

有趣有益，互惠互利；开阔视野，博采众长。
虚拟的网络，真实的人。天南地北客，相逢皆朋友

版面群落趣味社区帮助常见问题网站简介基本河规隐私条款使用条款广告说明