主题:Google与百度的语言处理技术比较 -- vanzolo
但是你说的比较搜索引擎的技术是从整体上来比较,而这个这里在讨论的主要是搜索引擎中用到的中文自然语言处理方面的技术。SIGHAN是针对这方面的讨论组。SIGHAN组织一些专门针对汉语分词的测试评比来比较各种相关的研究。
而PageRank的核心思想是跟自然语言处理没有关系的。自然语言处理针对的是单个内容(网页),是局部的;而PageRank针对的是网页直接的结构关系,是面向全局的。两者考量的级别是不同的。在实现中,自然语言处理的结果往往是PageRank算法中对网页打分的一个因子。所以拿PageRank和自然语言处理来比较有点关公战秦琼啦
其实Google是希望用户使用更长更多的关键词的,因为他们认为自己只有在更复杂的关键词上才能体现出比别人强的技术优势来。李开复曾经说过这么一个故事:Google为了让用户输入更长更多的关键词,在内部发动群众运动集思广益,最后是一个工程师想到了一个非常简单实用的主意:把首页中的搜索框拉长
- 相关回复 上下关系8
压缩 4 层
🙂百度现在 charlew 字117 2010-01-25 21:53:35
🙂简单的关键词体现不出功力来 vanzolo 字172 2010-01-22 09:18:08
🙂其实搜索引擎见功力的地方恰恰是短搜索 2 类反词典 字1111 2010-01-22 18:40:20
🙂你说的没错
🙂既然比较搜索引擎,就是比较搜索技术 类反词典 字694 2010-01-22 21:04:04
🙂呵呵,帖子的标题就是Google与百度的语言处理技术比较 vanzolo 字0 2010-01-22 21:13:04
🙂你用搜索来比较语言技术 类反词典 字104 2010-01-22 21:29:39
🙂搜索准确性是一个受多个因素影响的综合结果 vanzolo 字172 2010-01-22 21:44:11