五千年(敝帚自珍)

主题:Google与百度的语言处理技术比较 -- vanzolo

共:💬27 🌺40
全看分页树展 · 主题 跟帖
家园 就是黑盒测试,而且是专门针对语言处理方面的

从实验的方法应该很明显的看出来。可惜大家都把这个比较当成针对整个引擎的白盒测试啦

使用长搜索关键词就是为了减少排序过程中其他因素的干扰,突出语言处理部分,结果。。。

其实自然语言处理技术更关心的是短句,句子,段落这个级别,短语词汇这个级别更多的是作为语法、语义处理的基石。在现在的搜索引擎中,自然娱乐处理技术能够施展的地方很少。这也跟自然语言处理技术本身不成熟有很大关系。唯一的例外就是中文分词,也就是前面那个实验的重点。

语言处理不会关心到网页之间的关系,所以搜索结果所反映处理的网站指向正确性是由搜索算法的其他部分决定的,也就是PageRank这样的技术。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河